Carácterización antigénica de las proteínas MASPs …...ocular, de un edema palpebral unilateral...
Transcript of Carácterización antigénica de las proteínas MASPs …...ocular, de un edema palpebral unilateral...
1
UNIVERSIDAD NACIONAL DE
GENERAL SAN MARTÍN
Instituto de Investigaciones Biotecnológicas
―Dr. Rodolfo A. Ugalde‖
Caracterización antigénica de
las proteínas MASPs de
Trypanosoma cruzi
Autor: Pablo E. La Spina
Director: Carlos A. Buscaglia
Co-Director: Fernán Agüero
Febrero2017
2
3
Agradecimientos
Agradezco a mi nono por enseñarme que siempre se puede seguir y pasarme incluso sin querer sus
pasiones.
A mi nona por la confianza de siempre, enseñarme el valor de la familia y ser un faro en mi vida.
¡Llegué nona! ¡Más te vale venir temprano a la defensa porque no arranco si no estás vos!
A mis padres por todo el apoyo que me dieron para que hoy este acá, por su esfuerzo, ser un ejemplo
para mí y por muchas veces saber escuchar más que entender cuando lo necesite.
A Lau por acompañarme todos los días, embarcarse en este nuevo camino conmigo y no saber
guardarse nada en cuanto a cuidarme se trata.
A Greis, Ying y Boni por darme calor en noches de estudio y escribir parte de este trabajo, aunque
todo lo que hicieron tuvo que borrarse dado que no se encontró un buen traductor felino-español.
A los compañeros que los días, meses y años de estudio me dieron la oportunidad de conocer y de los
cuales espero haberme llevado al menos un poco.
A los profesores con y sin título que tuve durante estos años y me ayudaron a llegar acá, por los que
nunca mezquinaron su experiencia a la hora de apoyarme a mí y a la gente que me rodea.
A Fede que, aunque cada seis meses tenga que volver a explicarle que es la biotecnología y/o la
Enfermedad de Chagas, siempre sabe ser incondicional.
A la gente del laboratorio por nunca ningunear mis dudas y consultas y siempre estar dispuestos a dar
un poquito más de lo que pueden.
A mi hermano al cual sigo viendo crecer y siendo un poco mejor cada día.
A mis amigos por aguantarme años de no tener tiempo para ellos.
A mis tíos por siempre darme todo, su generosidad, orgullo y predisposición.
A Rosa por mostrarnos su amor por la biología y dejarme un poco de eso a mí también.
4
Abreviaturas Abs: Absorbancia.
ADN: Ácido desoxirribonucleico.
Amp: Ampicilina.
BLAST (Basic Local Alignment Search Tool): Herramienta de búsqueda de alineamientos
locales básica.
BSA: Albúmina sérica bovina.
C: Carboxilo.
DGF-1 (Dispersed gene family-1): Familia de genes dispersa-1.
DMSO: Dimetil sulfóxido.
DTUs: (Discrete Typing Units): clasificación de los distintos linajes de T. cruzi.
DTT: Ditiotreitol.
EDTA: Ácido etilendiamino tetra-acético.
ELISA: Ensayo por inmunoadsorción ligado a enzimas.
GP63: Glicoproteína de 63 kDa.
GPI: Glicosilfosfatidilinositol.
GST: Glutatión S-Transferasa.
HRP (horseradish peroxidase): Peroxidasa de rábano.
IFA: Ensayo indirecto de inmunofluorescencia.
IgG: Inmunoglobulina G.
IHA: Ensayo indirecto de hemoaglutinación.
IPTG: Isopropil-β-D-tiogalactopiranósido.
kDa: KiloDalton.
km: Kanamicina.
LB: Medio de cultivo Luria-Bertani.
MASPs (Mucin associated surface proteins): Proteínas de superficie asociadas a mucinas.
min.: Minutos.
N: Amino.
nm: Nanómetros.
PAGE (polyacrylamide gel electrophoresis): Electroforesis en gel de poliacrilamida.
PBS: Buffer fosfato salino.
PCR (Polymerase Chain Reaction): Reacción en cadena de la polimerasa.
ROC (Receiver Operating Characteristic): o Característica Operativa del Receptor.
SD: Desvío estándar.
SFB: Suero fetal bovino.
TM: Temperatura de melting; temperatura a la cual dos secuencias de oligonucleótidos
complementarios se encuentran desapareados en un 50% de los casos.
TMB: 3,3′,5,5′-Tetrametilbenzidina.
TSs: Trans-sialidasas.
TSSA (Trypomastigote Small Surface Antigen): Antígeno pequeño de la superficie del
tripomastigote.
UTR (Untranslated región): Región no traducida.
VPP: Valor predictivo positivo.
5
Glosario Set: Conjunto.
cut-off: Línea de corte.
Pool: Mezcla.
Primer: Oligonucleótido cebador.
Performance: Desempeño.
Test: prueba; ensayo.
Microarreglo peptídico: Colección de péptidos dispuestos en una superficie sólida.
Gaps: Espacios. Posiciones dentro de un alineamiento que no encuentran un correlato en todas las
secuencias alineadas.
fw (Forward): oligonucleótido con orientación directa.
rv (Reverse): oligonucleótido con orientación reversa.
Cinetoplástido: Organela citoplasmática, que contiene ADN extranuclear circular en un alto número
de copias.
6
ÍNDICE
INTRODUCCIÓN ......................................................................................................................... 8
Trypanosoma cruzi y Enfermedad de Chagas ..................................................................................... 8
Diagnóstico de la Enfermedad de Chagas ........................................................................................... 9
Las MASPs ........................................................................................................................................ 11
Microarreglos peptídicos de última generación y su aplicación en diagnóstico ............................... 12
OBJETIVOS ................................................................................................................................ 14
RESULTADOS ........................................................................................................................... 15
I. Identificación, priorización y caracterización de epitopes B lineales en las MASPs de T. cruzi ... 15
I.I. Análisis de los datos del microarreglo ................................................................................................ 15
I.II. Análisis de las MASPs presentes en el microarreglo. ....................................................................... 15
I.III. Agrupamiento de las secuencias de MASPs en estudio ................................................................... 17
I.IV. Mapeo preliminar de los motivos..................................................................................................... 21
I.IV. Prevalencia de los motivos en el genoma ........................................................................................ 21
I.V. Distribución y posición relativa de los motivos dentro de las MASPs. ............................................ 23
I.VI. Comparación entre las MASPs dentro de cada grupo ...................................................................... 25
II. Validación de los epitopes más promisorios ................................................................................. 30
II.I. Estrategia para la obtención de las secuencias .................................................................................. 30
II.II. Clonado, expresión y purificación ................................................................................................... 31
II.III Ensayos de ELISA ........................................................................................................................... 32
III. Estudio del impacto diagnóstico de las secuencias con reactividad contra sueros control según el
microarreglo ...................................................................................................................................... 42
DISCUSIÓN ................................................................................................................................ 44
Estudios antigénicos previos sobre las MASPs. ................................................................................ 44
Datos de expresión de MASPs en bibliografía .................................................................................. 45
Predicciones de las glicosilaciones en MASPs en el contexto del trabajo ........................................ 46
Análisis de secuencias similares a los motivos ................................................................................. 51
Secuencias con reactividad contra sueros control en el microarreglo ............................................... 52
Validación de los motivos ................................................................................................................. 52
Consideraciones posteriores al trabajo .............................................................................................. 52
CONCLUSIONES ....................................................................................................................... 54
PRÓXIMOS PASOS ................................................................................................................... 54
MATERIALES Y MÉTODOS.................................................................................................... 55
Herramientas bioinformáticas ........................................................................................................... 55
Generación de los motivos ................................................................................................................ 55
Diseño de primers y clonado. ............................................................................................................ 56
Oligonucleótidos ............................................................................................................................... 57
7
Péptidos .............................................................................................................................................. 59
Cepas y plásmidos utilizados/obtenidos ............................................................................................. 59
Preparación de células competentes ................................................................................................... 59
Generación del plásmido pGEXMP. .................................................................................................. 60
Esquema de clonado utilizado. ........................................................................................................... 60
Reacciones de PCR y annealing. ........................................................................................................ 61
Técnicas de biología molecular .......................................................................................................... 62
Condiciones de cultivo bacteriano ..................................................................................................... 62
Acoplamiento de péptidos a proteínas carrier .................................................................................... 62
ELISA ................................................................................................................................................ 62
ELISA de desplazamiento .................................................................................................................. 62
Expresión y purificación de proteínas recombinantes ........................................................................ 63
Detección colorimétrica ..................................................................................................................... 63
Análisis estadístico ............................................................................................................................. 63
Paneles de sueros usados .................................................................................................................... 63
INFORMACIÓN SUPLEMENTARIA ...................................................................................... 65
BIBLIOGRAFÍA ......................................................................................................................... 75
Notas ........................................................................................................................................... 80
8
INTRODUCCIÓN Trypanosoma cruzi y Enfermedad de Chagas
Trypanosoma cruzi es un parásito protozoario (Familia: Trypanosomatidae, Orden:
Trypanosomatida, Clase: Kinetoplastida, Filo: Euglenozoa) de gran relevancia sanitaria y socio-
económica. La propagación mayormente clonal y la amplia distribución geográfica y de rango de
hospedadores vertebrados e insectos de este parásito determina un altísimo grado de estructuración
poblacional. Distintas aproximaciones bioquímicas, biológicas y genéticas han mostrado la co-
existencia de múltiples cepas o aislamientos, las cuales presentan grandes divergencias geno- y
fenotípicas y que se han clasificado en 6 linajes o DTUs (del inglés Discrete Typing Units), llamados
TcI-TcVI1. T. cruzi comparte el orden Trypanosomatida con otros microorganismos parásitos que
presentan cinetoplástido y un único flagelo, destacándose Leishmania spp, agente etiológico de la
leishmaniasis, y Trypanosoma brucei spp, causantes de la enfermedad del sueño o Tripanosomiasis
Africana2.
Se cree que Leishmania major, T. brucei y T. cruzi divergieron hace ~200-500 millones de
años pese a lo cual sus genomas presentan una alta conservación y sintenia2. T. cruzi causa la
Enfermedad de Chagas o Tripanosomiasis Americana, la parasitosis humana de mayor prevalencia en
Argentina y Latinoamérica y para la cual no existen vacunas o drogas apropiadas3. Esta enfermedad se
encuentra incluida por la Organización Mundial de la Salud (OMS) como una de las 17 enfermedades
tropicales desatendidas, las cuales son muy prevalentes en condiciones tropicales o subtropicales en
149 países afectando a más de mil millones de personas, mayormente en situación de pobreza (OMS,
2016). La Enfermedad de Chagas afecta de 8 a 10 millones de personas alrededor del mundo, la gran
mayoría en Latinoamérica, aunque la misma se ha expandido a otros continentes en los últimos años
debido a movimientos migratorios poblacionales (OMS 20164). Además, los movimientos de población
desde zonas rurales a regiones urbanizadas y/o regiones no endémicas en conjunto con cambios en la
distribución eco-geográfica de las poblaciones de vectores (insectos hematófagos de la familia de los
Triatomínidos) han modificado la epidemiología de la Enfermedad de Chagas, la cual es hoy
considerada una amenaza emergente a la salud pública global5. Más allá de la transmisión vectorial, el
riesgo de adquirir esta enfermedad por transfusiones sanguíneas o trasplante de órganos se está
convirtiendo en un problema en zonas no endémicas, como el norte de Estados Unidos, Australia y
Europa6,7
. La ruta congénita de infección también es un punto importante a considerar, y representa el
22% de las nuevas infecciones anuales en zonas endémicas con políticas activas de control vectorial8.
El desarrollo e implementación de nuevas herramientas tendientes a optimizar el diagnóstico y
tratamiento de pacientes constituye uno de los pilares de las políticas para un efectivo control de la
transmisión de este parásito9.
Actualmente solo hay dos drogas antiparasitarias en existencia, benznidazol y nifurtimox.
Ambas drogas presentan toxicidad y una eficacia limitada, en especial cuando la enfermedad ya se
encuentra en su etapa crónica3,10–12
. A pesar de que se han realizado numerosos estudios en pos de la
producción de una vacuna contra la Enfermedad de Chagas, la misma ha sido impedida por dos
dificultades principales: encontrar antígenos protectivos y generar parásitos atenuados que no generen
patología en el largo plazo13,14
.
9
T. cruzi presenta un ciclo de vida complejo con distintos estadios morfológicos que alternan
entre el tracto digestivo un vector insecto hematófago y un hospedador vertebrado, incluyendo al
hombre15
. El parásito es depositado junto a las heces del Triatomínido durante la ingesta de sangre e
ingresa normalmente al hospedador vertebrado a través de lesiones de piel o mucosas. En la sangre del
vertebrado, el parásito se encuentra en un estadio denominado tripomastigote; el cual es capaz de
infectar distintos tipos celulares en los que se diferencia a un estadio replicativo llamado amastigote.
Diagnóstico de la Enfermedad de Chagas
Durante la fase aguda de la enfermedad los síntomas, incluso si ocurren, suelen ser moderados,
complicando su reconocimiento clínico3. En algunos casos, se verifica la aparición de un edema en el
sitio de infección denominado ‗Chagoma‘ o bien, cuando la entrada del parásito es por conjuntiva
ocular, de un edema palpebral unilateral característico denominado Signo de Romaña4,16
. Durante esta
etapa, usualmente asociada a alta parasitemia, la visualización de tripomastigotes en sangre periférica
por medio de métodos basados en microscopía (microhematocrito, gota gruesa, Strout) es aún la mejor
forma de diagnóstico17,18
. A pesar de esto existen limitaciones en la sensibilidad de estas técnicas (que
alcanza un ~80-90%) y suelen requerir personal entrenado. Sin tratamiento, entre el 5 y el 10% de los
pacientes sintomáticos mueren durante la fase aguda, debido a encefalomielitis o fallas cardiacas
severas, y raramente por muerte súbita19
.
El final de la fase aguda coincide con la aparición de una fuerte respuesta inmune adaptativa,
que conlleva una reducción significativa en los niveles de parasitemia y una seroconversión. Los
pacientes evolucionan entonces hacia una fase crónica, la cual en general presenta un periodo largo de
latencia (mayor a 10 años) antes de hacerse evidentes las manifestaciones clínicas (sólo en el 30% de
los casos). Se estima que 10 mil personas por año mueren de complicaciones asociadas a esta
enfermedad (OMS, 20164), usualmente miocardiopatías, megaesófago, megacolon, etc
19. Durante la
fase crónica, la replicación del parásito en tejidos se mantiene controlada mediante una fuerte
inmunidad especifica mediada por células B y T20
. La detección directa de T. cruzi en la fase crónica
requiere de métodos de amplificación biológica, como hemocultivo y xenodiagnóstico21
, los cuales
resultan dificultosos, caros y lentos, además de requerir laboratorios con condiciones de bioseguridad
aptas para este fin (Tabla 1I). Más importante es destacar que estos métodos solo proveen resultados
positivos en una proporción de los pacientes positivos por ensayos serológicos, lo cual limita su
utilidad en diagnóstico o monitoreo de la eficacia de tratamiento.
A finales de los 80´, los métodos moleculares basados en detección de ácidos nucleicos
emergieron como una alternativa atractiva, principalmente para superar la baja sensibilidad de los
diagnósticos parasitológicos22,23
. En particular, la introducción de la recientemente descripta técnica de
PCR prometía proporcionar una alta sensibilidad, especificidad, rapidez y capacidad de escalado a los
ensayos. En las últimas décadas, se han desarrollado muchas estrategias basadas en la amplificación de
distintos blancos de ADN del parásito (únicos o del tipo multiplex24,25
), PCR cuantitativa en tiempo
real (qRT-PCR) e incluso, más recientemente, aptámeros26,27
. Este tipo de ensayos, sin embargo, no son
de uso común en diagnóstico, debido a sus costos (reactivos, equipamiento, personal altamente
calificado) y al hecho de que la enfermedad en fase crónica presenta una muy baja e intermitente o nula
parasitemia (Tabla 1I).
En este contexto, los tests diagnósticos más utilizados en Enfermedad de Chagas siguen siendo
aquellos que se basan en la detección de anticuerpos anti-T. cruzi, tales como IHA (ensayo indirecto de
hemoaglutinación), IFA (ensayo indirecto de inmunofluorescencia) y ELISA (ensayo por
10
inmunoadsorción ligado a enzimas). Los test existentes, sin embargo, muestran variaciones en su
reproducibilidad y performance (sensibilidad, especificidad) que pueden ser atribuidos a la pobre
estandarización de los reactivos utilizados. De hecho, debido a la falta de un único test de referencia, la
OMS recomienda la utilización de 2 o 3 análisis alternativos para la elaboración de un diagnostico
'conclusivo'18
. Los primeros ensayos de ELISA para diagnóstico de la Enfermedad de Chagas fueron
desarrollados utilizando homogenatos totales del parásito, y luego, con fracciones antigénicas
bioquímicamente purificadas, como pueden ser los antígenos excretados/secretados de tripomastigote
(TESA) o una extracción orgánica de mucinas altamente O-glicosiladas de superficie del
tripomastigote llamada fracción F2/328,29
. La implementación de tecnologías de ADN recombinante en
los 80´ permitió la identificación, caracterización y producción a gran escala de una gran cantidad de
nuevos antígenos22,30–36
(Tabla 1I). Muchos de estos antígenos inmunodominantes resultaron ser
proteínas conteniendo dominios repetitivos, en general localizadas en la superficie del parásito. A
diferencia de las fracciones anteriormente utilizadas, los ensayos basados en proteínas recombinantes
y/o péptidos sintéticos derivados de ellas son más específicos. Como ha sido demostrado, uno de los
mayores inconvenientes del diagnóstico serológico de la Enfermedad de Chagas es el reconocimiento
cruzado de antígenos del parásito por anticuerpos de pacientes infectados con otros patógenos
relacionados y co-endémicos (como Leishmania) y/o afectados por ciertas patologías autoinmunes9.
Esto hizo que, a pesar de su reducida sensibilidad, los antígenos recombinantes fueran extensamente
utilizados en investigación y como test confirmatorios en clínica hasta el día de hoy (Tabla 1I).
Tabla 1I. Resumen de la performance de los distintos métodos de diagnóstico de Chagas. La performance se encuentra
indicada de manera arbitraria como apropiada (verde), no apropiada (rojo) o intermedia (amarilla) según datos disponibles.
N.A. y signos de interrogación (?) refieren a no aplicable y sin datos experimentales suficientes, respectivamente. Antigenos
obtenidos en los 80´ hace referencia a los siguientes antígenos: Ag1/JL7/FRA/H49; Ag2/B13/TCR39/PEP-2; Ag10;
Ag13/TcD; Ag19; Ag26; Ag30/CRA/JL8/TCR27; Ag36/JL9/MAP; Ag54; JL1; JL5; JL9; SAPA; B12; TcE; A13;
F29/FCaBP/Tc-24/Tc-28/1F8; Tc-40; HSP70; HSP78 y FL-160. Estos fueron utilizados en diagnostico en distintas
combinaciones usando una variedad de plataformas (ELISA, Western blot, dot blot), algunas de las cuales se encuentran
disponibles comercialmente. Adaptado de referencia37
11
En definitiva, aunque las pruebas serodiagnósticas actualmente son simples, baratas y
presentan buenos resultados en diagnóstico a gran escala, todas presentan ciertos problemas de
reproducibilidad, especificidad (en caso de utilizar homogenatos totales de parásito) y sensibilidad
(aquellas que utilizan fracciones o antígenos recombinantes). También presentan muy baja
performance en ciertas condiciones epidemiológicas (por ejemplo, para la detección de infecciones
agudas y/o congénitas o para la evaluación de la eficacia terapéutica). Estos aspectos dificultan,
encarecen y enlentecen el diagnóstico y, más importante, pueden retrasar el comienzo (y por tanto la
eficiencia) del tratamiento con las drogas tripanocidas disponibles3,10–12
. En este contexto, el desarrollo
de nuevas herramientas y/o estrategias para la optimización del diagnóstico serológico constituye una
prioridad en investigación en Enfermedad de Chagas.
Las MASPs
La primera aproximación al genoma completo de T. cruzi se realizó en 2005
38; y a partir de la
misma se estimó en 12000 la cantidad de genes por genoma haploide en la cepa CL BRENER. Se
destaca la gran expansión y diversificación de familias multigénicas codificando para proteínas de
superficie, lo que podría deberse a la gran complejidad de su ciclo de vida, en particular en
comparación con otros kinetoplastidos15
. En particular, a la necesidad de establecer contactos con muy
variados ambientes extra e intracelulares involucrados en la adaptación del parásito a las distintas
situaciones que atraviesa en su ciclo de vida39
. Estas familias multigénicas incluyen a las trans-
sialidasas (TSs), mucinas, DGF-1 y las MASPs (Mucin Associated Surface Proteins). Esta última
superfamilia se ‗descubrió‘ post-genómicamente, aunque existe un antecedente de una MASP
identificada y anotada como una proteína ―tipo-mucina‖40
. La superfamilia de las MASPs se encuentra
compuesta por 1377 miembros, 814 de secuencia completa, 124 genes parciales localizados en los
finales de los contigs generados en la secuenciación y 439 pseudogenes. Se la nombró proteínas de
superficie asociadas a mucinas debido a que en general los genes se encuentran río abajo de un gen de
una mucina (TcMUCII en particular, siendo similares en estructura a estas, pero no en secuencia) y que
poseen las señales para localización en la superficie del parásito. Todas las MASPs presentan una
estructura común: regiones N- y C-terminales conservadas, que codifican para señales secretorias
clivables, y una región central altamente variable y de ‗tipo mosaico‘, compuesta por motivos de
secuencia sin función asignada que se distribuyen diferencialmente entre los distintos parálogos (Figura
1I). Las regiones terminales conservadas en las MASPs incluyen un péptido señal N-terminal, el cual
dirige la proteína a retículo endoplásmico, y una señal posicionada en el C-terminal de anclaje a GPI.
Predicciones topológicas indican que, al igual que las mucinas y/o TSs de T. cruzi, las MASPs se
encontrarían ancladas a la capa externa de la membrana plasmática del parásito, protruyendo hacia el
medio extracelular. Estudios proteómicos y bioquímicos han mostrado la presencia de MASPs en
sobrenadante de tripomastigotes, sugiriendo que al menos algunas de ellas podría ser liberado al medio,
en general asociadas a vesículas41,42
.
La estructura 'quimérica' de la región central de las MASPs sugiere una alta tasa de
diversificación y recombinación entre los distintos miembros, apoyado por el enriquecimiento en
retroelementos y retrotransposones en las vecindades de sus regiones genómicas43,44
. Incluso se han
encontrado genes quiméricos entre MASPs y mucinas TcMUCII, lo cual apoyaría la hipótesis
recombinancional y podría ampliar aún más el repertorio de proteínas expuestas en la superficie del
parásito.
12
Figura 1I. Representación esquemática de la estructura y variabilidad de la superfamilia de proteínas MASPs de T. cruzi. Con
celdas de colores se representan motivos conservados presentes en las MASPs. En cada columna se encuentra una
combinación de motivos conservados existentes en esta familia. Por sobre cada columna se encuentra una barra indicando la
cantidad de MASPs en las que esta combinación de secuencias se encuentran. Los motivos se identificaron mediante
TheMEMEalgorithm versión 3.0. Adaptado de referencia.38
Distintos estudios revelaron la estructura genética detallada y el perfil de expresión de mRNA
de los distintos subgrupos estructurales que pueden definirse en las MASPs (ver Figura 1I)39,43
. De
manera interesante, los niveles de ARNm son variables, no solo entre las distintas MASPs, sino
también para un mismo gen a lo largo de una infección, sugiriendo la existencia de mecanismos que
regulan el perfil de transcripción de estas proteínas45
. Si bien el consenso indica que el control de la
expresión génica en T. cruzi se da predominantemente a nivel post-transcripcional mediado en general
por elementos en el 3´UTR de los transcriptos46
; resulta llamativa la alta conservación del 3´UTR de
toda la superfamilia MASP47
. Aproximaciones experimentales mostraron la expresión de las proteínas
MASP en distintos estadios del parásito y algunas características de su procesamiento post-traduccional
(N- y O-glicosilación)48,49
. Antes de esto, ya se habían predicho un gran número de modificaciones
post-traduccionales (N y O glicosilaciones en su mayoría, aunque también fosforilaciones) en esta
familia in sílico43
, aunque estas predicciones fueron realizadas con programas entrenados y
optimizados para células de mamífero y no para T. cruzi, el cual presenta algunas divergencias mayores
en ciertos procesos biosintéticos50
.
El uso de un anticuerpo específico contra un péptido exclusivo de esta superfamilia, el cual está
en 14 MASPs como secuencia exacta, y en alrededor de 50 MASPs si se permiten mínimas variaciones
mostró reactividad en solo un 5% de los tripomastigotes,43
, lo que podría indicar que existe variación
clonotípica en la expresión de estas proteínas. Las posibles variaciones en la expresión de MASPs de
célula a célula se han estudiado en más profundidad recientemente51
, encontrándose diferencias tanto a
nivel de ARNm como de proteína. Se especula con que este fenómeno, sumado a la presencia de
múltiples variantes antes mencionada, contribuiría a orquestar una estrategia para evadir la respuesta
inmune del hospedador vertebrado45
, clave para la capacidad adaptativa del parásito. Más
recientemente, se ha reportado que algunas de las MASPs podrían también participar en fenómenos de
adhesión e invasión de células de mamífero por parte de las formas infectivas de T. cruzi39
, e incluso
que podrían ser utilizadas como antígenos vacunales52
. A pesar de constituir una de las superfamilias
de moléculas más numerosa de la superficie del parásito, la potencialidad de las MASPs en
serodiagnóstico de la Enfermedad de Chagas ha sido muy poco explorada.
Microarreglos peptídicos de última generación y su aplicación en diagnóstico
Recientemente, en el marco de un proyecto tendiente identificar nuevos antígenos de T. cruzi,
sintetizamos un microarreglo de alta densidad conteniendo una colección de ~175000 péptidos
sintéticos de 15 aminoácidos cada uno (solapados de a 1 residuo) que, en conjunto, representan la
13
secuencia completa de 457 proteínas de T. cruzi53
(aproximadamente un ~10% del proteoma deducido
total). Las proteínas elegidas pueden dividirse en 5 grupos: proteínas tomadas al azar del proteoma de
T. cruzi, proteínas priorizadas mediantes métodos bioinformáticos por poseer características similares a
antígenos validados, proteínas con reactividad probada anteriormente, proteínas MASPs y por último
un grupo de neo-proteínas de secuencia al azar pero respetando la distribución de péptidos y di-
péptidos de T. cruzi. Las extensiones totales de estas proteínas se sintetizaron como péptidos solapados
de a 1 en el microarreglo, con un espaciador DAPAD C-terminal en todos los péptidos. Las MASPs
elegidas para este trabajo fueron en total 232, priorizadas de manera tal de poseer una buena cobertura
de su diversidad intrínseca (Fig. 1I). Para esto, se seleccionó al menos una MASP de cada uno de los
136 grupos de MEMEs definidos por Bartholomeu43
. Además, se incluyeron varias otras MASPs de las
que se disponía información bioquímica y/o de expresión y/o que habían resultado priorizadas en
búsquedas bioinformáticas previas (nuestras o ajenas) 43,54, 43, 43, 47, 48, 55
.
Para estos ensayos se utilizaron mezclas de IgGs purificadas de distintos sueros. Se generaron
4 mezclas (A, B, C y D) a partir de 9 sueros diagnosticados con Chagas crónico pero ausentes de
síntomas y otras 4 mezclas utilizando 10 sueros de personas sanas tomándolos de a 5 al azar (Aneg,
Bneg, Cneg y Dneg) como control. Las señales que se obtuviesen contra los pooles de sueros control se
tomaron como señales inespecíficas. Esta estrategia permite que si un péptido posee una prevalencia
poblacional mayor al 50%, tenga una probabilidad del 95% de ser reconocido por al menos una de las
mezclas. Las reactividades de los péptidos se midieron incubando los chips con las mezclas de IgGs
purificadas y luego con un anticuerpo secundario anti-IgG humano acoplado a un grupo fluorescente.
Esto se realizó en primer lugar con los sueros sanos y secuencialmente con los Chagásicos (se utilizó la
mezcla Aneg, junto con su par A para el ensayo A y así para todos los microarreglos). Por lo tanto, se
obtuvieron dos lecturas por microarreglo: la reactividad de los pooles negativos y la acumulada. En
total se realizaron 8 microarreglos, incluyendo replicados. Se estudiaron los resultados obtenidos,
intensidades entre los distintos microarreglos peptídicos, normalizándolos, primero dentro de cada uno,
para evitar efectos espaciales del mismo, estableciéndose valores base por sectores y luego se restó a
los valores medidos este valor base. Por último se dividió por el 90vo
percentil de la intensidad de los
péptidos del mismo ensayo, llevando a todas las señales a una misma escala y se obtuvo la reactividad
específica contra los sueros chagásicos por substracción (reactividad acumulada – reactividad contra
sueros control). Por último, el umbral para determinar señales ―positivas‖ y ―negativas‖ se calculó de
tal manera que maximizase la sensibilidad (verdaderos positivos/verdaderos positivos + falsos
negativos) y el valor predictivo positivo (VPP; verdaderos positivos/verdaderos positivos + falsos
positivos), utilizando las proteínas con epitopes ya estudiados y mapeados como proteínas control
positivas y las neo-proteínas como proteínas control negativas. Se estableció un umbral de 3 unidades
arbitrarias para el promedio de las secuencias, y de 7 para secuencias particulares. Estos valores fueron
determinados de tal manera que presenten un VPP del 100% en ambos casos. Para cada uno de los
pooles utilizados se realizaron réplicas, tomándose la reactividad promedio entre las mismas como
dato. La reactividad promedio máxima se definió como el máximo valor obtenido entre los promedios
de las réplicas de un mismo pool. Se llamó reactividad promedio, en cambio, al promedio entre las
reactividades de todos los pooles.
A partir de los datos obtenidos en el microarreglo, se decidió realizar un análisis de las
secuencias antigénicas de MASPs y validarlas por métodos convencionales de diagnóstico serológico.
Dicho estudio se detalla en la presente tesis.
14
OBJETIVOS
El objetivo general de la presente Tesis es estudiar y caracterizar antigénicamente a la familia
de las proteínas MASPs de T. cruzi y evaluar el potencial de esta familia para su inclusión en tests
serodiagnósticos para la Enfermedad de Chagas.
En este contexto, los objetivos específicos planteados son los siguientes:
I. Identificación, priorización y caracterización de epitopes B lineales en las MASPs de T. cruzi.
II. Validación de los epitopes más promisorios.
III. Evaluación del impacto de la posible inclusión en reactivos serodiagnósticos de secuencias de
las MASPs de T. cruzi con reactividad contra sueros control.
15
RESULTADOS
I. Identificación, priorización y caracterización de epitopes B lineales en las
MASPs de T. cruzi
I.I. Análisis de los datos del microarreglo
Se analizaron los datos del microarreglo a escala global, obteniéndose que un 1% del total de
los péptidos analizados resultaron positivos. Además se observó una gran variabilidad en el perfil de
péptidos reconocidos y en los valores de reactividad obtenidos para cada péptido en los distintos pooles
de sueros53
, sugiriendo que el ‗inmunoma B lineal‘ (perfil de reactividades de anticuerpos contra
epitopes peptídicos lineales) es distinto para los distintos pacientes. Luego se observó cada grupo de
proteínas por separado. El grupo de proteínas con antigenicidad ya estudiada (control positivo)
presentó un 2,62% de péptidos reactivos, seguido por el grupo de las MASPs con un 1,21%. Este valor
es superior incluso al obtenido para el grupo de proteínas priorizadas por métodos bioinformáticos, lo
que sugiere que las MASPs tendrían un gran potencial serodiagnóstico. El resto de los grupos
presentaron porcentajes menores al 1% (el control negativo de neo-proteínas presentó solo un 0,13%)
(Tabla 1R).
Set de
proteínas Descripción
N° de péptidos en el microarreglo
(N° de proteínas) Péptidos positivos
Grupo 1 Proteínas tomadas al azar del proteoma 38664 (50) 50 (0,13%)
Grupo 2 Proteínas priorizadas según métodos
bioinformáticos 37773 (99) 317 (0,84%)
Grupo 3 Proteínas de la familia de las MASPs 65808 (232) 797 (1,21%)
Grupo 4 Proteínas con evidencia previa de
seroreactividad 32372 (68) 848 (2,62%)
Grupo 5 Neo-proteínas generadas (control negativo) 24000 (54) 0(0%)
Total Total 198617 (503) 2012(1,01%)
Tabla 1R. Resumen de los resultados del microarreglo por grupo de proteínas.
I.II. Análisis de las MASPs presentes en el microarreglo.
Tomando al reconocimiento específico por al menos un pool de sueros de pacientes Chagásicos
como criterio de positividad53,56
, se encontraron 83 picos antigénicos distintos en el grupo de las
MASPs. Estos picos corresponden a péptidos consecutivos (aunque puede tratarse de un péptido
único), solapados respecto al anterior en 14 residuos, que presentan reactividad por encima del umbral.
Este umbral se definió en 7 como valor de reactividad promedio máxima como se explicó en la
introducción. En algunos casos, 2 o 3 picos antigénicos fueron mapeados a una misma proteína (ver
más adelante). Teóricamente, estos picos antigénicos contienen al menos 1 epitope B lineal reconocido
por sueros Chagásicos crónicos, aunque en algunos casos podrían contener más de 1, parcialmente
superpuestos en secuencia56
.
16
Las 83 secuencias antigénicas se encuentran repartidas en 69 proteínas de las 232 MASPs
analizadas (29,74%). Como se mencionó, las MASPs analizadas provinieron de distintas fuentes: al
menos una MASP de cada uno de los 132 grupos generados por Bartholomeu et al43 y distintas
MASPs asociadas en la literatura al estadio infectivo tripomastigote, ya sea por evidencias
genéticas o bioquímicas43,47,48,54,55
. Estos resultados y las proporciones de MASPs según el criterio
utilizado al incluirlas en el microarreglo se describen en la figura 1R.
0
20
40
60
Po
rce
nta
je
Subgrupo
69 (n)
MEME’s Groups (Bartholomeu 2009)et al.
Trypomastigote Vesicles (Bayer-Santos 2013)et al.
Trypomatigote cDNA library (Bartholomeu 2009)et al.
Trypomastigote peptide (Bartholomeu 2009) et al.
T. cruzi et al. proteome (Atwood 2005)
Trypomastigote glycoproteome (Atwood 2006)et al.
MASP 52 (De Pablos 2011)et al.
232 (n)
A
B
C
Figura 1R. A y B: Proporciones de las procedencias (subgrupos) de las MASPs incluidas en el microarreglo (A, n=232) y
reactivas (B, n=69). C: Análisis de enriquecimiento de subgrupos de MASPs. Para cada subgrupo, se muestra el porcentaje de
MASPs incluidas (barras de la izquierda) y reactivas (barras de la derecha).
Como una primera aproximación al estudio de la localización de los péptidos reactivos dentro
de las MASPs, se buscó predecir para cada una de ellas el péptido señal y el sitio de anclaje a GPI. Para
esto se utilizaron las herramientas SignalP 4.157
y PredGPI58
. En todos los casos las predicciones
fueron positivas para ambos tipos de señales secretorias, salvo una MASP para la cual no se pudo
predecir el GPI. Esta MASP (TcCLB.468217.14) corresponde a un extremo del contig generado al
realizar el ensamblaje del genoma del parásito, y está anotada parcialmente (falta su región C-
terminal). En la figura 2R se muestran logos realizados a partir de alineamientos de las regiones N- y
C-terminales de todas las MASPs del microarreglo, junto a un gráfico de superposición de
reactividades máximas obtenidas para estas regiones.
Grupos MEME43
Vesículas de tripomastigote54
ADNc de tripomastigote 43
Péptido de tripomastigote 43
Proteoma de T. cruzi 47
Glicoproteoma de tripomastigote48
MASP 52 55
17
Figura 2R. Secuence Logos de las regiones de péptido señal y señal de anclaje a GPI de las 232 MASPs en estudio. Debido a
la imposibilidad de establecer un tamaño común para estas regiones, el logo se generó a partir de un alineamiento entre las
secuencias. Por esto se encuentran posiciones que varían en ancho indicando que presentan gaps en el alineamiento (menor
ancho a mayor cantidad de gaps en la posición). Debajo de los logos de cada región se muestran los gráficos de superposición
de las reactividades máximas para todas las MASPs del microarreglo. En ningún caso, estas reactividades máximas superan el
umbral de positividad propuesto en el análisis del chip (7 unidades arbitrarias, indicado con una línea punteada).
Todas las secuencias que resultaron positivas se encuentran en la región central hipervariable,
correspondiente a la proteína madura de cada MASP59
, y no en las regiones C- y/o N-terminales
conservadas. Esto se condice con el hecho de que las secuencias de direccionamiento o tráfico
intracelular son clivadas durante el procesamiento de las MASPs en vía secretoria. Si bien
intuitivamente razonables, estos datos contradicen resultados recientes indicando reactividad en la
región C-terminal clivable60
.
I.III. Agrupamiento de las secuencias de MASPs en estudio
Las 83 secuencias de MASPs que resultaron antigénicas en el arreglo peptídico se agruparon a
partir de alineamientos en ClustalW, los que se usaron luego de entrada para generar un árbol
filogenético mediante la herramienta Phylogeny.fr 61,62
(Figura 3R). Para generar los grupos dentro del
árbol, se utilizó como criterio que todas las secuencias dentro de un mismo grupo tengan al menos un
50% de identidad entre ellas (y considerando que una secuencia solo puede estar en un grupo a la vez).
Se obtuvieron así 31 grupos, de los cuales se realizaron logos (sólo de aquellos compuestos por al
menos 3 secuencias (figura 3R)). Para esto se utilizó el generador Seq2logo que provee el Centro para
análisis de secuencias biológicas (CBS) (www.cbs.dtu.dk/biotools/Seq2Logo). Los logos obtenidos se
generaron sin utilizar pseudo-cuentas, es decir, que los mismos son una mera representación de la
proporción de cada aminoácido en cada posición.
18
Figura 3R. Árbol filogenético obtenido a partir de las secuencias positivas (tomadas como los péptidos de mayor reactividad
promedio dentro de las secuencias antigénicas). Se indican los grupos obtenidos que serán de interés a lo largo del trabajo, junto
con los Sequence Logos generados para los motivos I, II, III, IV, VIII, IX y XI, realizados con 22, 7, 9, 5, 3, 3 y 4 secuencias,
respectivamente. Para los casos en los que los péptidos con valores máximos dentro de cada secuencia antigénica no se
encontraran alineados con respecto al resto de los péptidos del grupo, se alinearon las secuencias antigénicas y se tomaron para
generar los logos aquellos grupos de péptidos alineados de mayor puntaje acumulativo entre todos los miembros del grupo.
19
Debido a la gran cantidad de grupos que se determinaron, se buscó priorizar los de mayor
relevancia antigénica para su posterior caracterización y validación. Para ello se ponderaron los
siguientes criterios:
Señal obtenida en el microarreglo para los pooles de sueros de paciente chagásicos.
Señal obtenida en el microarreglo para los pooles de sueros de pacientes control.
Cantidad de pooles en los cuales la secuencia haya resultado antigénica.
Cantidad de secuencias en el grupo (aumenta la robustez del análisis).
Prevalencia en el genoma: Cantidad de MASPs en el genoma de T. cruzi que poseen secuencias
idénticas y/o similares al motivo (ver debajo). Estos análisis se hicieron a partir de sucesivas
búsquedas BLAST en la base de datos de TriTrypDB (www.tritrypdb.org).
Se encontraron 2 grupos que sobresalen del resto según estos criterios, siendo altamente valorados
en cada punto, y otros 4 que sobresalen de los demás en puntos específicos (Tabla 2R). Estos 6 grupos
fueron priorizados, junto a un grupo llamado VII, que presentó como característica distintiva valores
similares de reactividad contra los pooles de sueros de pacientes Chagásicos y controles. Este grupo
VII se incluyó con la finalidad de ser usado como modelo para estudiar el objetivo específico III, es
decir, probar si el impacto serodiagnóstico de la reactividad contra sueros control en el microarreglo.
Cabe destacar que varios de los grupos no priorizados poseen mayor señal contra pooles de sueros
Chagásicos que algunos de los grupos priorizados, pero su valoración final resultó baja debido al resto
de los criterios, en particular su reactividad contra sueros de pacientes control (ver tabla 2R y figura
4R).
Tabla 2R. Datos de los grupos para cada uno de los criterios de priorización. Sólo los motivos I a VII terminaron resultando
priorizados Los análisis de BLAST fueron realizado tomando un e-valor de corte de 10.
Grupo Reactividad
media
Reactividad
media
máxima
Reactividad
contra pooles
control media
Reactividad
contra sueros
control media
máxima
Prevalencia en el
microarreglo
Secuencias
analizadas
en el
arreglo
Prevalencia en el genoma
I 37,20 74,83 0,09 0,28 1 22 52
II 29,00 32,27 0,00 0,04 0,75 7 15
III 6,68 10,96 0,44 1,18 0,75 9 108
IV 9,83 26,05 0,25 0,51 0,25 5 56
V 20,11 20,11 0,00 0,00 0,50 1 3
VI 4,65 5,36 1,25 1,54 0,50 2 7
VII 5,10 5,10 4,40 4,40 0,50 1 3
Resto
de los
motivos
6,07 17,67 4,50 18,51 0,37 39 -
20
A partir de las secuencias de los grupos priorizados, y a fines de simplificar algunos de los
análisis posteriores, se buscó consensuar una secuencia de aminoácidos mínima, que definiese un
‗motivo central‘ para cada grupo (ver materiales y métodos). Se obtuvieron como resultados patrones
más simples, en algunos casos de longitud menor a los 15 aminoácidos iniciales (Tabla 3R). Sobre
estos ‗motivos centrales‘, a su vez, se derivaron motivos menos restringentes, con la idea de incluir una
mayor cantidad de MASPs potencialmente antigénicas, pero con la menor cantidad de falsos positivos
(ver materiales y métodos). La definición de estos motivos menos restringentes y los resultados de su
utilización se encuentra en el apartado discusiones.
Grupo Motivo
I K[TNA][TG][AT][AT][AT]TG[DNE]*
II Q[QH]QSDE[TA]Q[VF]Q
III DPAAD[GAV]A[GE]T
IV V[AD]SRE[QK]DGE[DG][TA]TSE
V VPSLPADSENSKTGC (ND)
VI QSEADAD[DV]DD
VII EADDDDDDDDDDGET (ND)
Figura 4R. Reactividad mostrada para cada una de
las secuencias dentro de los grupos priorizados (I a
VII) y no priorizados (‗Resto‘). A: Reactividad
máxima para cada péptido de cada grupo.
B: Reactividad promedio para cada péptido de
cada grupo. Se marca en línea punteada el umbral
de reactividad máxima propuesto (7). C:
Reactividad máxima obtenida contra los sueros
control para cada péptido de cada grupo.
A B
C
Tabla 3R. ‘Motivos centrales‘ obtenidos para cada grupo priorizado.
ND: no se pudo generar un motivo consenso a partir de un único dato.
Los aminoácidos entre corchetes corresponden a todas las
posibilidades que pueden encontrarse para una dada posición. *A este
motivo para contener a todas las secuencias positivas se le debe
agregar la secuencia KNTTATGD, que es parte de las 22 secuencias
que componen el grupo, la cual presenta una deleción con respecto al
motivo en cuestión pero mantiene la reactividad en el microarreglo.
Los análisis posteriores se realizaron teniendo en cuenta esta
secuencia particular
21
I.IV. Mapeo preliminar de los motivos
Se buscó en el repertorio de péptidos negativos los ‗motivos centrales‘ definidos para cada
grupo, permitiendo una, dos y hasta tres variaciones simultáneas sobre los mismos (Figura 5R). Este
análisis, si bien limitado, permitió definir varias posiciones que contribuyen a la reactividad y unas
pocas posiciones prohibitivas cuya variación, aún por aminoácidos estructuralmente cercanos al
original, resultó en la perdida de la reactividad del péptido. Más allá del motivo I, estas variantes no
reactivas se encontraron por fuera del grupo de las MASPs, lo cual sugiere que estos motivos estarían
sujetos a presión de selección contra su diversificación. Para realizar un mapeo exhaustivo de los
motivos, se realizará en un futuro próximo un análisis experimental, utilizando microarreglos
peptídicos. En principio, estos incluirían el péptido de mayor antigenicidad de cada grupo y variantes
individuales en cada una de sus posiciones por cada uno de los aminoácidos (286 variantes para cada
motivo).
Fig. 5R. Sequence Logos generados para los grupos I, II, III y IV, con los aminoácidos prohibitivos encontrados. Código de
colores: En rojo se encuentran los aminoácidos que son prohibitivos en las posiciones indicadas, en amarillo y en verde en
cambio, se encuentran los aminoácidos que se encontraron al permitir variar los motivos en 2 o 3 posiciones al mismo tiempo,
respectivamente. Estos últimos datos no representan posiciones prohibitivas, sino que buscan representar la variabilidad en las
secuencias entre los negativos del microarreglo. En información suplementaria (Tabla S1) se encuentra una lista con todos los
péptidos similares a los motivos que no presentaron antigenicidad y el número de variaciones entre el motivo y cada péptido.
I.IV. Prevalencia de los motivos en el genoma
Utilizando los motivos obtenidos en la tabla 3R se buscó su distribución en MASP y proteínas
no MASP de los genomas secuenciados de T. cruzi (cepa CL Brener (DTU TcVI), cepa Dm28c (DTU
TcI) y cepa Sylvio X-10 (DTU TcI) en la base de datos de TritrypDB. Para esto se utilizó la
herramienta de búsqueda por motivos proteicos propia de TritypDB, la cual permite hacer búsquedas
de patrones proteicos degenerados. Se utilizó el motivo de tabla 3R como entrada de búsqueda para
cada uno de los grupos. En los casos de los motivos V y VII, de los cuales solo se posee una secuencia
22
antigénica, se utilizó la secuencia completa como entrada de búsqueda. Para tratar de minimizar falsos
positivos debidos a problemas de anotación, solo se tomaron como MASP bona fide las que no figuran
como pseudogenes (al día 14/10/2016); es decir, un total de 938 MASPs (TABLA 4R). La lista
completa de las proteínas de CL Brener que poseen los motivos se encuentran en la tabla 2S (material
suplementario).
Tabla 4R. Resumen de los resultados obtenidos al buscar los motivos para cada grupo.
Salvo raras excepciones (proteínas hipotéticas), estas búsquedas indicaron que los motivos antigénicos
de las MASP están restringidos a esta superfamilia multigénica. Las menores frecuencias e incluso
ausencias de algunos grupos en los genomas de las otras cepas de T. cruzi analizadas pueden deberse a
la menor profundidad y/o cobertura de estos genomas.
Más importante, se encontró cierta correlación entre la cantidad de secuencias con estos motivos en el
genoma de T. cruzi CL BRENER y la reactividad promedio obtenida en el microarreglo (Figura 6R).
0 5 0 1 0 0
0
2 0
4 0
6 0
R e p re s e n ta tiv id a d e n e l g e n o m a
(C a n tid a d d e M A S P s )
Re
ac
tiv
ida
d p
ro
me
dio
Como ya se mencionó, L. major, T. brucei y T. cruzi presentan una alta conservación genética.
T. cruzi comparte con T.brucei y L. major un 68 y 75% de su genoma, respectivamente.2,63
A pesar de
esto, existen regiones genómicas en las cuales se encuentran genes especie-específicos, islas no
sinténicas, de alrededor de 600kb, que son justamente donde se encuentran las MASPs, entre otras
grandes familias de T. cruzi como las TSs, mucinas, DGF-1 y peptidasas gp6359,63,64
. Si bien las
MASPs son una familia génica exclusiva de T. cruzi65
, quisimos indagar si los motivos antigénicos
identificados podían encontrarse en otros kinetoplástidos relacionados. Para dichas búsquedas se
incluyeron secuencias de Leishmania (todas sus especies con datos en TritrypDB), T. brucei, T.
congolense, T evansi, T. rangeli y T. vivax, no se encontró ninguno de los motivos en ninguno de estos
Grupo Motivo Proteínas que poseen el motivo (MASPs)
CL Brener Dm28c Sylvio X10/1
I K[TNA][TG][AT][AT][AT]TG[DNE]
* 108(108) 44(43) 42(41)
II Q[QH]QSDE[TA]Q[VF]Q 41(41) 1(1) 0
III DPAAD[GAV]A[GE]T 68(68) 31(31) 31(31)
IV V[AD]SRE[QK]DGE[DGV][TA]TSE 14(14) 0 0
V VPSLPADSENSKTGC (ND) 1(1) 0 0
VI QSEADAD[DV]DD 4(4) 0 0
VII EADDDDDDDDDDGET (ND) 1(1) 0 0
Figura 6R. Reactividad promedio
(promedio entre todos los pooles de
sueros) obtenida en el microarreglo para
cada secuencia perteneciente a los grupos
priorizados graficados en función de su
representatividad en el genoma. Se
realizó un análisis de correlación de
Pearson, encontrándose que existe
correlación entre los datos, con un P-valor
menor a 0,0001.
R= 0,53
23
organismos (datos no mostrados). Esto sugiere que así como las MASPs, los motivos antigénicos de
estas proteínas son específicos de T. cruzi, lo que apoya su utilidad como potenciales reactivos de
serodiagnóstico en Enfermedad de Chagas.
I.V. Distribución y posición relativa de los motivos dentro de las MASPs.
Se realizó un análisis de distribución de los 7 grupos priorizados dentro de las MASPs. Para
ello se incluyeron 108 MASPs que contienen el motivo I, 41 con el motivo II, 68 con el motivo III, 13
con el motivo IV, 1 con el motivo V, 4 con el motivo VI y 1 con el motivo VII; todas ellas de la cepa
CL Brener (Tabla 4R). Además, se encontró que en 46 casos los motivos I y III se encontraban en la
misma molécula (Tabla 5R). A este respecto, cabe mencionar que en una biblioteca genómica de
MASPs realizada en el laboratorio, se encontró el gen TcCLB.511173.64, el cual contiene 4 secuencias
antigénicas, incluyendo a los motivos I y III (datos no mostrados). Este dato constituye evidencia de
que al menos una de las 46 MASP conteniendo ambos motivos no son producto de errores de anotación
genómica.
En todos los casos se calculó la distancia desde el motivo hasta el extremo C-terminal de la
proteína madura. Esta distancia se definió desde el último residuo incluido en el motivo hasta la
posición omega, que constituye el sitio de corte y de empalme del grupo GPI66
, predicha por predGPI.
Se vio que los motivos I, II, III, IV y VI se encuentran cercanos al sitio omega de la MASP
correspondiente: 35 aminoácidos en el caso de los motivos II y III y 55 residuos en el caso de los
motivos IV y VI. El motivo I está invariablemente posicionado en forma inmediatamente anterior al
residuo omega. Se observó que para el grupo de MASPs que contienen el motivo IV, 3 de entre 13
proteínas poseen una inserción de 78 aminoácidos, de secuencia altamente conservada, previa al sitio
de anclaje a GPI, lo cual amplia la distancia entre el motivo y el sitio de corte (ver Tabla 5R). Los
motivos V y VII, por otro lado, tienen una posición más cercana al N-terminal, aunque solo se cuenta
con una secuencia. Estos datos se graficaron para el total de las proteínas en los grupos realizados
inicialmente y además para las proteínas obtenidas en la búsqueda de motivos (figura 7R). En conjunto,
estos datos indican una posición relativa fija para los distintos grupos antigénicos en las MASPs,
preferentemente el C-terminal. Esta localización conservada de regiones antigénicas hacia el C-
terminal de las variantes proteicas nos recuerda, en parte, al escenario descrito para otras familias de
antígenos de superficie de T. cruzi como las TSs y las mucinas67,68
.
24
G r u p o
Dis
tan
cia
al
GP
I (a
min
oá
cid
os
)
I I I I II
IV V VI
VII
0
2 0
4 0
6 0
1 2 5
1 5 0
1 7 5
G r u p o
I I I I II
IV V VI
VII
0
2 0
4 0
6 0
1 2 5
1 5 0
1 7 5
Fig. 7R. Distancia relativa de los motivos al anclaje a GPI. En el panel A se encuentran solo las proteínas ensayadas en el
microarreglo, mientras que en el panel B se encuentran todas aquellas encontradas durante la búsqueda de los motivos
estrictos. Las distancias se tomaron desde el final del motivo hasta el sitio omega predicho por PredGPI.
D is ta n c ia a l G P I (a m in o á c id o s )
Re
ac
tiv
ida
d p
ro
me
dio
0 5 0 1 0 0 1 5 0
0
2 0
4 0
6 0
8 0
D is ta n c ia a l G P I (a m in o á c id o s )
Re
ac
tiv
ida
d m
áx
ima
0 5 0 1 0 0 1 5 0
0
5 0
1 0 0
1 5 0
Siguiendo esta misma línea, se estudió la reactividad en el microarreglo frente a la distancia al
GPI calculada (figura 8R). En este caso, a diferencia de lo observado previamente para la prevalencia,
los datos indican que la reactividad de los motivos no parece depender directamente de la posición
relativa dentro de la MASP. Esto es debido a que la antigenicidad máxima es similar para grupo y
A
B
A B
Figura 8R. Reactividad de los
péptidos en el microarreglo,
en función de la distancia al
sitio de anclaje a GPI. A:
Reactividad promedio, se
calcula como el promedio de
las reactividades de todos los
pooles, en función de la
distancia al sitio omega
B: Reactividad máxima,
aquella del pool que resultó
más reactivo para dicho
péptido, en función de la
distancia al sitio omega. En
línea punteada se indica la
reactividad umbral del
microarreglo. El código de
colores por grupo se mantiene
desde las figuras anteriores.
25
distancia al GPI, pero cuando se utiliza el promedio de los 4 pooles de sueros como datos, si parece
encontrarse una tendencia a mayor reactividad para motivos posicionados cerca del C-terminal (figura
8R A).
Los resultados de este apartado se resumen en la Tabla 5R:
Motivo o
combinación Cantidad de MASPs con el motivo Localización Comentarios
I 108 C-terminal (maduro)
II 41 A 35 a.a. del C-terminal maduro
aprox.
III 68 A 35a.a. del C-terminal maduro
aprox.
IV 13 A 50 a.a. del C-terminal maduro
aprox.*
V 1 -
VI 4 A 50 a.a. del C-terminal maduro
aprox.
VII 1 -
I Y III 46 - La región central entre ambos es
altamente conservada.
Tabla 5R. Resumen de los resultados obtenidos al estudiar la distribución de los motivos en las MASPs. *En 10 /13
secuencias, en las otras 3 existe una inserción conservada entre el motivo y el sitio de clivado, aumentando la distancia en 78
aminoácidos.
I.VI. Comparación entre las MASPs dentro de cada grupo
Al encontrarnos con estas posiciones particulares de los motivos con respecto al anclaje a GPI,
nos propusimos estudiar la conservación de la secuencia total de las MASPs dentro de cada grupo,
haciendo foco además en las regiones donde se encuentran los motivos. Para esto se realizaron
alineamientos de todas las proteínas dentro de cada uno de los grupos y se determinó la conservación
de cada posición del alineamiento según Livingstone y colaboradores69
utilizando el programa
Jailview70
. Este método de puntuación mide la conservación de las propiedades físico-químicas para
cada posición.
Dado que nos interesa estudiar la conservación de regiones más que de posiciones puntuales,
los valores que se grafican son los promedios entre cada posición y las dos posiciones anteriores y
posteriores, todas con el mismo peso. Para visualizar mejor la región cercana al motivo, se agregaron
también alineamientos múltiples realizados con Clustal Omega, en el servidor de EMBL-EBI, de
algunas MASPs representativas de los grupos (Figuras 9R, 10R y 11R).
26
A
B
II
C
D
IV
27
Fig. 9R. Conservación dentro de los grupos II, IV y VI. En los alineamientos se encuentran marcadas en recuadro rojo la
posición inmediatamente posterior al residuo omega más probable según algoritmo. En los gráficos de conservación se
encuentran en amarillo los péptidos señales predichos, en rojo las regiones donde se encuentran los sitios de anclaje a GPI y
en gris la región que es clivada. Cabe recordar que las posiciones en estos gráficos no equivalen a posiciones de aminoácidos
dentro de las proteínas en cuestión, debido a los gaps generados durante el alineamiento. A: Comparación entre 5 proteínas
que presentan el motivo II (en recuadro marrón). Puede apreciarse que la región entre el residuo omega y el motivo se
encuentra conservada. B: Conservación entre 39 MASPs del grupo II, el cual se indica en marrón. 3 secuencias poseen una
inserción cuya conservación se evaluó por separado. Solo las posiciones del primer gráfico son iguales a aquellas del
alineamiento. C: Comparación entre 5 proteínas que poseen el motivo IV (recuadro azul). D: Conservación entre las 12
proteínas completas del grupo IV (en azul). E: Alineamiento de secuencias que poseen el motivo VI (en violeta). La secuencia
que presenta regiones delecionadas corresponde al extremo de un contig y no se tiene información completa de su C-terminal.
F: Conservación entre las 12 proteínas completas del grupo VI (en violeta).
Se encontraron regiones de muy baja conservación dentro de los grupos de MASPs, como es de
esperarse para familias donde hay una alta tasa de diversificación. Las regiones río abajo de los
motivos muestran una alta conservación, aunque en los casos de los grupos II y IV esta conservación es
comparable a otras zonas del alineamiento. Como se puede apreciar en los alineamientos
representativos, las regiones conservadas río abajo de los motivos II, IV y VI son diferentes entre sí y
propias de los motivos. La existencia de estas zonas conservadas luego de los motivos podría indicar
que estas regiones se trasladan junto al motivo como bloque entre las MASPs durante los eventos de
recombinación, los que luego estarían sometidos a presión de selección en contra de su diversificación.
De manera análoga, se vio que existen una gran cantidad de posiciones puntuales en las cuales
un porcentaje de MASPs poseen inserciones de varios aminoácidos (entre 11 y 80), siendo estas
inserciones muy similares entre sí. Conociendo esta característica buscamos la posibilidad de realizar
un alineamiento de orden parcial para mejorar la visualización de las regiones conservadas.
Desafortunadamente no hemos podido realizarlos por dificultades técnicas hasta el momento. Para los
grupos II y IV, se realizó una aproximación a este enfoque, tomando por separado secuencias de
inserciones. Si bien el que existan inserciones es también común en el resto de los grupos, en los otros
casos la gran cantidad de inserciones no posibilitó graficar cada una por separado sin la herramienta
correspondiente.
Para los grupos I y III, el análisis se realizó en conjunto, debido a que fueron los únicos
motivos encontrados juntos, comparándolos entre sí y se encuentra resumido en la figura 10R.
E
F
VI
28
A
B
C
D
E
F
G
H
J
I
29
Figura 10R. Análisis de conservación de los grupos I y III. El código de colores utilizado es el mismo que en la figura 9R,
además, en celeste se marca el motivo I y en verde el motivo III. A: Alineamiento múltiple de 5 proteínas que poseen tanto el
motivo I (en celeste) como el III (en verde). Obsérvese que la región entre ambos se encuentra conservada. B: MASPs que
solo poseen el motivo I. Se compara una proteína que posee tanto el motivo I como el III con 3 proteínas que solo poseen el
motivo I. En estos ejemplos el motivo III se encuentra modificado de tal manera que ya no es antigénico, y se marca en
amarillo. C: MASPs que solo poseen el motivo I. Se compara una MASP que posee tanto el motivo I como el III con 2
MASPs que solo poseen el motivo I. En estos ejemplos la región donde se encontraría el motivo III se encuentra
completamente modificada (en amarillo). D: MASPs que poseen el motivo III pero no el I. Se compara una proteína que posee
ambos motivos con proteínas que solo poseen el motivo III. En violeta se encuentran las regiones similares al motivo I, que no
presentarían antigenicidad según el análisis de los datos del CHIP. E: MASPs que poseen la región central entre los motivos I
y III, pero ninguno de los motivos. Comparación entre una proteína que posee ambos motivos con 7 proteínas que no poseen
ninguno (ni ninguno de los 7 en análisis). En amarillo y naranja dos versiones distintas de péptidos que ‗reemplazan‘ en estas
proteínas al motivo III. En violeta y fucsia dos versiones que ‗reemplazan‘ al motivo I, siendo la violeta similar al motivo I a
diferencia de la fucsia, las cuales tienen grandes diferencias con el mismo. F: Conservación entre 42 MASPs completas que
posen tanto el motivo I como el III G: Conservación entre 93 MASPs completas, 42 que también se encuentran incluidas en el
primer gráfico, que poseen el motivo I, H: Conservación entre las 63 MASPs completas, 42 que también se encuentran
incluidas en el primer gráfico, que poseen el motivo III. I: Conservación entre 51 proteínas que poseen únicamente el motivo
I. J: Conservación entre 21 MASPs que poseen únicamente el motivo III.
Se realizaron alineamientos representativos de las proteínas que comparten el motivo I y III
(Figura 10R. A). Por otro lado se encontraron 57 MASPs completas que solo poseen el motivo I.
Algunas de estas proteínas poseen motivos similares al III pero diversos cambios en su secuencia
determinan que no sean antigénicos (Figura 10R B). También se encontraron otras MASPs que poseían
el motivo I pero no el III o similar. (Figura 10R C). De manera análoga se analizaron las 22 MASP que
poseen el motivo III pero no el motivo I. En este grupo de proteínas los extremos C-terminales
muestran motivos similares al grupo I, algunos de los cuales están incluidos en el microarreglo y no
presentan antigenicidad (Figura 10R D). Por último se realizó una búsqueda a partir de las regiones
conservadas entre los motivos I y III para buscar MASPs que tuviesen esta región pero ninguno de los
motivos analizados. Para esto se compararon un número mayor de proteínas que el mostrado en este
apartado (datos no mostrados) determinándose la siguiente secuencia como entrada de búsqueda para
dicho fin, KET[PS][VIA]. Se encontraron a partir de esta búsqueda 183 proteínas, 154 de las cuales
son MASPs y 53 proteínas entre estas no poseen ningún motivo (Figura 10R E).
Al realizar este análisis nos encontramos con una amplia diversidad de secuencias entre
MASPs que poseen los mismos motivos, lo que determina valores muy bajos de conservación en
grandes zonas del gráfico. Gran parte de esta diversidad viene dada por regiones de
inserciones/deleciones que se encuentran en pequeños grupos de MASPs. Esto podría indicar eventos
de duplicación génica o que existan secuencias de inserción sitio especificas en T. cruzi para esas
posiciones. En este sentido, ya se encontraron en T. cruzi, evidencias de transposones de inserción sitio
específicas44,71
.
Además vimos como la región entre el motivo I y III, en caso que ambos se encuentren en la
misma proteína, se encuentra conservada. Esta conservación se pierde, en parte, al incluir el resto de las
proteínas de un grupo o el otro, entre los cuales existen varias secuencias que divergen de la región
conservada anteriormente vista. El motivo III además posee una región conservada posterior al motivo,
la cual está presente en todas estas proteínas y es distinta a las regiones conservadas de los otros
motivos.
Por último se tomaron todas las secuencias para realizar un último análisis de conservación
(figura 11R).
30
Figura 11R. Conservación entre 161 proteínas completas analizadas anteriormente. Los códigos de colores utilizados son los
mismos que en las figuras 9R y 10R. Las zonas conservadas corresponden a los motivos en estudio en los casos en los que se
encuentren marcados según el código de colores anteriormente utilizado.
Se encontró que estos motivos poseen localizaciones determinadas dentro de las MASPs, en
dos casos los grupos compartían localización con otro con respecto al anclaje a GPI. Además, las
regiones aledañas a los motivos, en especial aquellas posteriores a los mismos se encuentran
conservadas, y más aún, son distintas según el motivo en estudio. Partiendo de estos resultados se
amplío el análisis de estas regiones en el apartado discusión.
II. Validación de los epitopes más promisorios
II.I. Estrategia para la obtención de las secuencias
Con el objeto de validar estos resultados, se decidió clonar secuencias representativas de cada
grupo priorizado de MASPs para luego ser analizadas usando técnicas convencionales (expresión como
proteínas de fusión en sistemas bacterianos, purificación por cromatografía de afinidad y evaluación de
la reactividad por ELISA contra sueros individuales). En todos los casos, se buscó clonar una secuencia
mínima, que idealmente contuviese solamente al motivo en estudio y que, en caso de requerir de
secuencias adicionales por razones metodológicas, no contuviese ninguno de los otros epitopes
identificados. Además, en algunos casos selectos se decidió clonar el resto de la proteína por separado,
las cuales serán utilizadas para desarrollar el objetivo específico III. Debido a esto, se denominaron N y
C a los fragmentos a clonar por ser la región que se encuentra hacia el N o C de la proteína
respectivamente. Los motivos antigénicos, como se discutió anteriormente, suelen encontrarse entonces
en los fragmentos C.
Se tomó la decisión utilizar proteínas recombinantes derivadas de la amplificación de
secuencias genómicas en lugar de péptidos sintéticos por cuestiones técnicas (mayor sensibilidad) y
operativas (menor costo). Además, esta estrategia de clonado a partir de ADN genómico del parásito
nos permitió descartar el poco probable caso de que todas estas secuencias fuesen el resultado de
errores en la secuenciación y/o ensamblaje del genoma. Como vector de expresión se utilizó la línea
pGEX, ya que provee una fusión N-terminal a GST, facilitando la purificación a cuasi homogeneidad
de las proteínas recombinantes en un solo paso basado en cromatografía de afinidad a glutatión.
Desafortunadamente, las secuencias a amplificar poseían una gran variedad de sitios de corte internos,
por lo que se decidió modificar el sitio de múltiple clonado del plásmido pGEX1λT, para poder
sistematizar todos los clonados subsiguientes. A este vector modificado se lo llamó pGEXMP (Figura
1M; materiales y métodos). Un último aspecto metodológico a considerar es que debido a que nos
encontramos trabajando con una superfamilia de genes altamente similares, el clonado de una MASP
en particular por PCR presenta dificultades adicionales. La estrategia utilizada para el diseño de los
31
primers y el clonado se encuentra detallada en materiales y métodos (Figura 2M) y se terminará de
explicar en el apartado III.
II.II. Clonado, expresión y purificación
En general las amplificaciones fueron específicas, resultando en pocos casos donde se
obtuvieron dos o más bandas (datos no mostrados). Algunos de los amplicones obtenidos, no obstante,
no presentaron las secuencias esperadas. Se obtuvieron, en dos oportunidades, secuencias similares a
las MASPs deseadas que poseían algunas variaciones por fuera del motivo, casos donde la variación se
encontraba directamente sobre el motivo en estudio y se descartaron o modificaron para obtener las
secuencias de interés, y por último algunos casos donde se amplificaron aparentes pseudogenes (los
cuales presentan, respecto del gen anotado en general pequeñas INDELs en tractos de
homonucleótidos, resultando en codones de terminación prematuros). Estos últimos casos podrían
deberse a una mala anotación en el genoma de T. cruzi. Debido a que estas secuencias presentan
secuencias compartidas entre sí, es esperable que en algunos casos el ensamblaje del mismo en estas
zonas sea sub-óptimo. Las secuencias de las proteínas TcCLB.508165.50 y TcCLB.506965.70 son
ejemplos representativos de estos casos (Figura 12R).
Figura 12R. Alineamiento entre los amplicones de TcCLB.508165.50 y TcCLB.506965.70. En estos dos casos se obtuvieron
cambios en el marco abierto de lectura propuesto en el ensamblaje del genoma de T. cruzi, generándose codones STOP
prematuros. Los marcos de lectura de las secuencias amplificadas se marcan en rojo, encontrándose subrayado el codón
STOP, y en azul los que se encuentran en la base de datos de TritrypDB.
Los amplicones que se clonaron de manera exitosa fueron expresados y purificados según
materiales y métodos. Se corroboró que las proteínas resultantes se expresen de forma soluble y se
purifiquen satisfactoriamente. Las figuras 13R y 14R son ejemplos representativos.
32
Fig. 13R Inducción de proteínas recombinantes. El nombre (arriba) indica el grupo al que pertenece la proteína en cuestión,
seguido de un N o C, según corresponda a la parte N o C de dicha MASP (ver texto). Con flechas se indican las bandas de
interés. N: Proteína total, no inducido I: proteína total, inducido S: proteína soluble, inducido. M, marcador de peso molecular
Fig. 14R Geles de poliacrilamida 12,5%, con las fracciones de purificación de las proteínas recombinantes (ver figura 13R) I:
Muestra antes de la purificación, O: Percolado, P: proteína purificada.
II.III Ensayos de ELISA
II.III.I Validación antigénica
En resumen, se clonaron, expresaron y purificaron 6 de los 7 motivos en estudio (I, II, III, IV,
VI y VII) como proteínas de fusión a GST (Tabla 6R). Además se diseñaron péptidos del motivo I, II,
III, IV, VI y VII y del motivo X (según la numeración utilizada en figura 3R), un motivo que no se
encuentra en los 7 priorizados en el análisis, como control representativo de los grupos no priorizados.
33
Grupo Motivo Secuencia expresada completa Péptido
I K[TNA][TG][AT][AT][AT]T
G [DNE]S* GST-GSVDELALEMKTTTATTGDSDGSNQ LQVAGIKTTTATTGDS
II
Q[QH]QSDE[TA]Q[VF]Q
GST-
GSVDELALEGVGSAGGHDTGGVSSGSSVPAPGPPSPPAPPEGPSDPPAAPVV
DHSAGSSDGKAESSGSNPSNTTGDSSTGDQTSAAAAAHNSSPAEIPAGTTSG
TEHTRQEEEEEEEEEDHEKQQQSDEAQFQQHQQHEHPAENGEESAKDKNAI
RTNATANTGDSDGGREACRIHRD
EKQQQSDEAQVQQHQ
III
DPAAD[GAV]A[GE]T GST-GSVDELALENNDPAADGAETREEAAAKLAEFIVTD
QTTGDDDPAADGAGTA
EGKQC
IV
V[AD]SRE[QK]DGE[DG][T
A]TSE
GST-
GSVDELALEENTLPGEIAEGNLPSPPEEDVASREQDGEDTTSEGEKNVPPPET
AATPQSHRDKGSEGTGEDAKATTVTANTTDTKTKIADSDGGRKITSEFAAA
KLAEFIVTD
PEEDVASREQDGEDTTS
EGEC
VI
QSEADAD[DV]DD
GST-
GSVDELALEDAQGTQETEGTQGTAASPISTSGSSGAQSEADADDDDSQRPN
PEGPQNDGTEAGDTHGPSAVSDAAPQAAKAIAAQTNGTVTPGDSDGSGRE
ACRIHRD
AQSEADADDDDPQRPC
VIII
EADDDDDDDDDDGET
GST-
GSVDELGVCGGLADEETAGSGSGDELPPESQGVETSPQDPQGSQNRAPGGK
ENITPERIEEADDDDDDDDDDGETKAEEERSTERQSVQEGAAAPDPVSREEN
LSDSGQEKNQAILSAEDVSLSGSRESNANHTQTEFEEKKDSEKNPPAVEDAL
TTGNGGNLEAAAAKLAEFIVTD
Tabla 6R. Secuencias expresadas como proteínas recombinantes, se muestra en verde la secuencia aminoacídica
correspondiente a la proteína, en rojo la secuencia del motivo y en negro al esqueleto del plásmido. Además se incluyen los
péptidos de cada motivo.
A partir de estos reactivos se realizaron ensayos de ELISA indirecto utilizándose el péptido X
acoplado a BSA, y las proteínas recombinantes obtenidas para el resto de los motivos en estudio en
principio, con sueros de pacientes chagásicos y sueros control (ver materiales y métodos). En paralelo
se ensayó GST recombinante como control negativo para las proteínas recombinantes, obtenida de
igual manera que los motivos en estudio y un péptido de secuencia al azar de similar distribución de
aminoácidos que las MASPs acoplado a BSA como control negativo de los péptidos acoplados a BSA
(péptido Scrambled). Como control positivo se utilizó la región antigénica de la proteína TSSA
(―Trypomastigote small surface antigen‖), un antígeno inmunodominante de superficie de T.
cruzi72,56,73–75
fusionado a GST. Todos los ensayos se realizaron por triplicado. Para los grupos I y III
también se utilizaron péptidos para comparar los datos obtenidos con las proteínas recombinantes,
obteniéndose valores similares (datos no mostrados). Se utilizó un suero de un paciente como
referencia, el cual se incluyó en todos los ensayos. A partir de este valor se refirió la reactividad
obtenida con cada suero contra el mismo reactivo como un porcentaje de la reactividad obtenida contra
el suero referencia en ese ensayo particular. De esta manera se relativizaron los valores obtenidos en
distintos ensayos.
Se calcularon los valores de especificidad y sensibilidad utilizando como punto de corte la
media de los datos obtenidos para los sueros control contra cada uno de los motivos más tres desvíos
estándar. La proteína correspondiente al grupo IV (ver Tabla 6R) presentó alta reactividad contra
varios sueros control, y aún más la señal obtenida en algunos de los sueros resultó no ser especifica
contra el motivo (datos mostrados y discutidos más adelante). Debido a esto se decidió utilizar el
péptido que representa al motivo acoplado a BSA para estudiar el grupo. Los resultados obtenidos se
muestran en tabla 7R, incluidos los datos de la proteína del grupo IV fusionada a GST. También se
informan los resultados utilizando el mínimo punto de corte con 100% de especificidad. Los resultados
individuales contra cada suero se encuentran en la figura 15R.
34
Grupo I II III IV fusión
a GST*
IV
péptido
VI VII 5 GST Scrambled TSSA
Número de
sueros
analizados
(controles)
83(30) 83(30) 83(30) 79(29) 83(30) 67(24) 54(20) 83(30) 83(30) 83(30) 87(30)
A
Especificidad
(%)
100 100 100 83,33 100 100 100 100 100 100 100
Sensibilidad
(%)
69,81 52,83 28,30 48 7,55 34,88 26,47 15,09 0 3,77 87,72
B
Especificidad
(%)
100 100 100 100 100 100 100 100 100 100 100
Sensibilidad
(%)
75,47 60,38 37,34 10 16,98 44,19 29,41 20,75 0 9,43 89,47
Tabla 7R. Valores diagnósticos para cada uno de los reactivos ensayados. A: Datos utilizando el punto de corte calculado
como la media de los sueros control para cada péptido más tres desvíos estándar. B: datos utilizando el mínimo valor de corte
que presentó 100% de especificidad para el ensayo. *El cálculo del cut-off ―A‖ para este caso se realizó sin contar los sueros
control que fueron mayores al mismo en cada cálculo iterativo.
Figura 15R. Sueros de pacientes Chagásicos ensayados y sus resultados para cada uno de
los ensayos realizados. La cantidad de sueros ensayados para cada grupo es la resta entre
los sueros totales ensayados y los controles que se muestran en la tabla 7R.
Scrambled
Figura 16R. Datos obtenidos
en los ensayos de ELISA para
cada uno de los grupos en
estudio contra sueros de
pacientes (verde) y sueros
negativos o control (rojo).
A: Datos presentados como
veces el punto de corte
calculado para cada grupo
(promedio de los negativos + 3
desvíos estándar. B: Datos
presentados como reactividad
absoluta (Absorbancia a
450nm).
35
En la figura 15R se puede observar que varios sueros reaccionaron contra más de un motivo
antigénico. Esto sucede incluso con motivos que no se encuentran compartidos por ninguna MASP
(Sección I.V.), lo cual sugiere que varias MASPs son co-expresadas o expresadas secuencialmente por
la población de parásitos durante una infección. Más allá de esto, también hay que considerar que es
posible que existan co-infecciones con distintas variantes de T. cruzi o reacción cruzada con otros
antígenos (aunque dada la proporción de casos en los que esto ocurre estas dos posibilidades parecen
poco probables). Estos datos tampoco nos indican si la co-expresión existe temporalmente o si las
MASPs expresadas a nivel poblacional varían durante la infección pero no se comparten entre los
distintos grupos aquí analizados al mismo tiempo.
Además como se puede observarse en la figura 16R, los valores obtenidos para los grupos de
MASPs, aún los positivos, son bajos respecto de los reportados para TSSA.
Para cada grupo, se analizaron de manera individual los resultados obtenidos. Se graficaron y
mostraron los datos reactividad contra cada suero ensayado, como porcentaje de reactividad obtenida
contra el suero referencia (figura 17R).
Figura 17R. Diagrama de caja y
bigotes de los datos de ELISA de los
grupos estudiados y los controles
utilizados. Datos mostrados como
porcentaje del suero referencia. Se
muestran los valores mínimos y
máximos (bigotes) y los cuartiles
(caja), junto con los datos individuales.
Análisis estadístico: Mann-Whitney.
ns: no significativo, valores P
informados en gráfico.
Re
acti
vid
ad
Po
rce
nta
je d
el s
uer
o
refe
ren
cia
(%)
Re
acti
vid
ad
Po
rce
nta
je d
el s
ue
ro
refe
ren
cia
(%)
Re
acti
vid
ad
Po
rcen
taje
del
su
ero
refe
ren
cia
(%)
Re
acti
vid
ad
Po
rcen
taje
del
su
ero
refe
ren
cia
(%)
36
En la figura 17R se puede apreciar que existe en general, para los distintos motivos analizados, una
población de pacientes que presentan valores de reactividad ligeramente mayores a la población
control, en especial en los grupos I, II y III, y luego algunos pocos sueros que presentaron mayor
reactividad. Al comparar esta distribución con la de TSSA, vemos que nuestro control positivo presenta
una población de sueros positivos más heterogénea.
Para estudiar la performance diagnóstica de cada uno de los grupos estudiados en mayor
profundidad, se realizaron curvas ROC y se calculó el área bajo las mismas (figura 18R y 19R).
Figura 18R. Comparación entre las
curvas ROC de los distintos
motivos. Se indica qué grupo es el
ensayado en cada caso, además del
área bajo la curva obtenida (ABC)
y el intervalo de confianza de 95%
(IC)
37
Áre
a b
ajo
la
cu
rv
a R
OC
I I II II IV V
IV
II 5
TS
SA
GS
T
Scra
mb
led
0 .5
0 .6
0 .7
0 .8
0 .9
1 .0
Los dos grupos mejor calificados durante la priorización (Tabla 2R) presentaron mejor
performance que el resto. Estos grupos (en particular el grupo I) llegan a valores de área mayores a 0,8
los que, aunque lejos de indicar por sí mismos un gran potencial en diagnóstico, nos hablan de una
performance para nada despreciable, similar a la de algunos de los antígenos recombinantes evaluados
anteriormente76
. Los restantes grupos priorizados mostraron valores menores, en concordancia con lo
esperado. Estos grupos, presentaron áreas bajo la curva ROC entre 0,71 y 0,78, los cuales no solo son
considerablemente mayores a los de los controles GST y Scrambled, sino que también son mayores a
nuestro control representativo del resto de los grupos antigénicos encontrados en el microarreglo, lo
cual apoya nuestra estrategia de priorización. Se destaca en particular, el área bajo la curva obtenido
para el motivo VII, ya que el mismo presentaba reactividades mayores que el resto de los priorizados
contra los sueros negativos, y se esperaba que esto disminuyese su performance diagnóstica. Esta
discordancia puede atribuirse a que sólo 7 de los 10 sueros utilizados como control en el microarreglo
se encontraban a disposición al momento de realizar los ensayos, siendo posible que solo uno de los no
ensayados sea responsable de la reacción vista en el microarreglo. Es posible que también se deba la
importancia que se le atribuye en la priorización a la reacción contra sueros control, ya que en varios
casos fue razón para descartar grupos. Un análisis con mayor detenimiento de las secuencias que
presentaron reactividad frente a sueros control se detallará más adelante en el presente trabajo. Por
último, el motivo IV presentó valores por debajo de los controles, y por lo tanto, puede concluirse que
no es antigénico con la metodología utilizada.
Como una manera alternativa de mostrar los datos con el fin de interpretarlos se graficaron la
sensibilidad y especificidad en función del cut-off utilizado (figura 20R), se indican con flechas azules
los cut-offs propuestos (promedio de los negativos + 3 desvíos estándar).
Figura 19R. Comparación entre áreas
bajos las curvas ROC mostradas en la
figura 18R. Para cada grupo se
encuentra graficado tanto el área bajo
la curva (barra) como el intervalo de
confianza de 95% (barras de error).
38
De esta manera se puede observar como un cambio en el cut-off modifica en cada caso la performance
diagnóstica.
También se realizaron algunos de los análisis anteriores nuevamente, reemplazando los valores
obtenidos en el microarreglo por aquellos que se obtuvieron en los ensayos de ELISA. Como
parámetro a considerar en este sentido, se decidió utilizar los valores de área bajo la curva ROC por
considerarlo el menos sesgado y arbitrario de los resultados obtenidos. Se tomaron como distancias al
GPI los promedios de todas las distancias al GPI de las proteínas analizadas en el microarreglo,
excluyendo al grupo V por no haber sido analizado y el grupo IV por no mostrar antigenicidad en
ELISA. (Figuras 21R, 22R y 23R).
Figura 20R. Curvas de sensibilidad y
especificidad en función del cut-off
elegido para cada grupo. Se
encuentran marcados como líneas
verticales en el eje X los valores de
sensibilidad cuando la especificidad
alcanza el 100% y viceversa. En los
casos en los que no se encuentre
marcado la misma fue menor al
10%. Como línea horizontal se
encuentra el porcentaje de
especificidad y sensibilidad cuando
ambos son el mismo. La flecha azul
marca el cut-off propuesto
(promedio de los negativos más 3
desvíos estándar).
X
39
D is ta n c ia a l G P I (a m in o á c id o s )
Áre
a b
ajo
la
cu
rv
a R
OC
0 5 0 1 0 0 1 5 0
0 .6 5
0 .7 0
0 .7 5
0 .8 0
0 .8 5
0 .9 0
I
II
III
V I
V II
R e p r e s e n ta t iv id a d e n e l g e n o m a (C a n tid a d d e M A S P s )
Áre
a b
ajo
la
cu
rv
a R
OC
0 5 0 1 0 0
0 .6 5
0 .7 0
0 .7 5
0 .8 0
0 .8 5
0 .9 0
I
II
III
V I
V II
Reactividad promedio máxima
Áre
a b
ajo
la c
urv
a R
OC
0 20 40 600.65
0.70
0.75
0.80
0.85
0.90
I
II
III
VI
VII
No se encontraron correlaciones significativas en los datos analizados aunque debe tenerse en
cuenta que ahora la cantidad de datos que se maneja es baja. Más allá de esto, puede observarse en la
figura 22R cierta tendencia a una menor antigenicidad a medida que el motivo se aleja del sitio de
anclaje por GPI. Las figuras 22R y 23R también parecen mostrar una correlación positiva entre las
variables analizadas en cada una, pero nuevamente la misma no es significativa, presumiblemente por
el bajo número de datos que se poseen.
Figura 21R. Área bajo la
curva ROC en función de
la distancia al ancla de
GPI, en aminoácidos. Se
marcan con colores y
leyenda, los distintos
grupos. La distancia al
ancla utilizada para cada
grupo es promedio de las
distancias de todas las
proteínas del grupo
analizadas en el
microarreglo
Figura 22R. Área bajo la
curva ROC en función de
la representatividad en el
genoma. Se marcan con
colores y leyenda, los
distintos grupos.
Figura 23R. Área bajo la
curva ROC en función de
la antigenicidad promedio
máxima, es decir, la
antigenicidad promedio de
los 4 pooles de sueros
para el péptido con mayor
antigenicidad dentro del
grupo. Se marcan con
colores y leyenda, los
distintos grupos.
40
II.III.II. Especificidad de los motivos dentro de las proteínas recombinantes
Debido a que las secuencias MASPs dentro de las proteínas recombinantes exceden a la de los
motivos (Tabla 6R), era posible que hubiese regiones antigénicas dentro de estas secuencias que no se
pudieron analizar en el microarreglo, ya sea por no estar presentes, por ser estructuras mayores a 15
aminoácidos o por no ser epitopes lineares. Para evaluar la contribución de los motivos propiamente
dichos a la reactividad de las proteínas recombinantes, realizamos ensayos de desplazamiento de señal
con péptidos sintéticos de secuencia idéntica a los motivos (a excepción del motivo III, para el cual se
utilizó un péptido de secuencia similar, también representativo del grupo; ver tablas 3 M, materiales y
métodos). Los resultados se muestran en la figura 24R. TSSA se utilizó como control de
desplazamiento en estos ensayos, y se realizó contra 2 sueros distintos. Como se esperaba se obtuvo un
desplazamiento gradual a medida que se aumenta la concentración de péptido utilizada. Además en los
controles con desplazamiento con un péptido no relacionado no se vio una reducción en la señal. Para
el motivo IV no se observaron cambios en la señal obtenida al desplazar tanto con el péptido específico
o el no relacionado. Esto, sumado a la baja especificidad obtenida para esta proteína recombinante (ver
tabla 7R) nos hizo considerar utilizar el péptido, acoplándolo previamente a BSA, para estudiar la
antigenicidad del grupo. Al realizar esto se vio que el péptido no reaccionaba contra los sueros
identificados previamente como reactivos, y se concluyó que la reacción observada para la proteína
debía ser artefactual (reconocimiento de otros epitopes, posiblemente no lineales no estudiados en el
microarreglo o generados a partir de la unión del péptido con GST).
Los motivos I, II y III, en cambio, mostraron reacciones de desplazamiento específicas, aunque
las mismas no presentaron un descenso gradual al aumentar la cantidad de péptido utilizada para
desplazar. Esto se debe a que con la concentración más baja utilizada la reactividad obtenida fue de
valores similares a los que se observan con sueros negativos, mostrando que se desplaza prácticamente
la totalidad de la reacción obtenida. Debido a que las reacciones contra estos epitopes son menores que
contra TSSA, los valores de porcentaje de señal que corresponden al fondo en placa de ELISA son
mayores. El caso del motivo VI es similar, solo que en este caso los valores de los sueros utilizados en
el ensayo son aún más bajos. Esto hace que una señal del 80% del control sin desplazar sea equivalente
a los valores obtenidos contra sueros negativos, haciendo dificultosa para el lector la visualización del
ensayo de desplazamiento. Se utilizaron estos sueros ya que los dos sueros de mayor reacción que los
utilizados ya no se encontraban en existencia en el laboratorio al momento de realizar estos análisis.
Concluimos que esta reacción es específica, ya que la señal es efectivamente desplazada por el péptido
específico y no por el péptido no relacionado.
En resumen, quitando el motivo IV, en todas las proteínas recombinantes utilizadas la reacción
observada pudo ser desplazada con péptidos específicos, indicando que se debió a los motivos en
estudio.
41
Figura 24R. Ensayos de desplazamiento de la señal en placas de ELISA. Se indica en los casos en los cuales se utilizó un
péptido representativo del grupo en cuestión analizado o un péptido control. La reactividad se grafica como porcentaje de la
reactividad obtenida para el suero sin desplazar.
Re
acti
vid
ad
Po
rcen
taje
del
en
sayo
sin
des
pla
zam
ien
to (
%)
Re
acti
vid
ad
Po
rce
nta
je d
el e
nsa
yo s
in
de
spla
zam
ien
to (
%)
Re
acti
vid
ad
Po
rcen
taje
del
en
sayo
sin
des
pla
zam
ien
to (
%)
42
III. Estudio del impacto diagnóstico de las secuencias con reactividad contra
sueros control según el microarreglo
Además de las secuencias reactivas contra los sueros de pacientes Chagásicos, se encontraron
varios grupos de secuencias MASPs reactivas contra los sueros control analizados en el microarreglo.
Como se vio anteriormente, algunas de estas secuencias presentaron reactividad contra ambos pooles
de sueros (figura 4R), aunque en otros casos solo presentaron reactividad contra los sueros control.
Estos últimos, en ciertos casos, se encontraron en MASPs que también poseen alguno de los grupos
priorizados. Estos hallazgos motivaron el objetivo específico III. Para poder estudiar este aspecto de las
MASPs es que se decidió realizar la estrategia de clonado de las proteínas en partes propuesta (Figura
2M; Materiales y métodos). Esta estrategia fue necesaria también debido a que no es posible clonar
estas proteínas completas sin perder especificidad debido a las grandes similitudes entre los miembros
de esta superfamilia. Se buscaron MASPs particulares que presenten secuencias con reactividad contra
sueros control en una región y contra alguno de los grupos priorizados, en otra; y se clonaron por
separado sus partes ‗específicas‘ e ‗inespecíficas‘ de acuerdo a lo mencionado. Se amplificaron las
regiones con estas características de proteínas del grupo I, II y VI y luego se procedió a ligar ambos
fragmentos para obtener la proteína ‗completa‘. Al comparar la performance diagnóstica de la proteína
completa contra solo la región antigénica específica se buscará analizar el impacto de la inclusión de
secuencias con reactividad contra sueros control en reactivos serodiagnósticos.
Solo se pudieron obtener las proteínas completas de los grupos II y VI. Para el grupo I, en
cambio, se utilizó la secuencia antigénica inespecífica encontrada en la misma proteína que la utilizada
para representar al grupo I (IN), que por dificultades técnicas no pudo clonarse junto con la región
antigénica especifica (IC). Para este último se utilizó la siguiente estrategia para su análisis: se utilizó
como antígeno en los ensayos de ELISA una mezcla 1:1 de IN y IC y como control se utilizó una
mezcla 1:1 de IC y GST. Se comparó la reactividad de las versiones completas de las proteínas con la
de las versiones que solo poseen el motivo contra sueros de pacientes chagásicos y en particular contra
sueros control. Para esto se utilizó el mismo protocolo que para los ensayos de ELISA anteriores. Los
resultados se muestran en la figura 25R.
Se estudiaron tanto sueros de pacientes Chagásicos como sueros de pacientes control. En
ningún caso se observó un aumento significativo en la reactividad, salvo en un único suero con la
proteína del motivo II, para el cual, igualmente, la reacción observada fue leve. Para el motivo I, en el
cual la región no específica presentó los valores más altos dentro de este análisis contra los sueros
control (máximo valor obtenido en el microarreglo: 20,86) no se observó que el agregado de esta
modifique los valores obtenidos, particularmente al evaluar los sueros controles. Lo mismo se vio para
la versión completa de la proteína representante del motivo VI, cuya secuencia no específica presentó
valores de reactividad máxima de 6,12. La secuencia inespecífica que acompaña al motivo II, por
último, presentó una reactividad máxima de 6,82.
43
Si bien existen otras secuencias que presentaron mayores valores de reactividad contra sueros
control, las mismas no se encuentran en conjunto con los motivos analizados en una misma MASP, o
no pudieron ser clonadas por dificultades en el diseño de los primers. Estas secuencias, por lo tanto,
quedaron exentas de ser estudiadas en el contexto de este trabajo.
En cuanto a los sueros de pacientes chagásicos, se obtuvieron valores similares para ambas
estrategias, y aquellos casos donde no se presentó reactividad contra los motivos, tampoco presentaron
reactividad contra las proteínas completas en los casos I y II. Para el caso VI, se encontraron algunos
sueros que reaccionaron específicamente contra la proteína completa, sin mostrar reacción contra el
motivo en soledad. Esto indicaría que esta proteína completa presenta otros epitopes no estudiados
anteriormente, aunque debido a que desconocemos sus secuencias y posiciones, los mismos exceden el
análisis propuesto.
Concluimos que las secuencias, aunque reactivas contra sueros control, no presentan el impacto
negativo esperado en el diagnóstico con la metodología utilizada.
Figura 25R. Comparación entre los ensayos
realizados con la proteína recombinante que solo
posee el motivo antigénico en estudio y la versión
conteniendo además una secuencia que presentó
reactividad contra sueros control (Marcadas como
versiones ―T‖). Se encuentran conectados los
valores obtenidos con una versión de la proteína y
la otra contra el mismo suero.
44
DISCUSIÓN
Estudios antigénicos previos sobre las MASPs.
A la superfamilia de las MASPs, debido a ser proteínas expuestas a la superficie del parásito y
encontrarse en un gran número en el genoma con una gran diversidad de secuencias, se les ha
reconocido un gran potencial antigénico. Sin embargo, se han trabajado poco en este aspecto, siendo
contados los trabajos en los cuales se ha intentado predecir antigenicidad de secuencias de MASPs y
muchos menos en los cuales se ha buscado probar y validar experimentalmente epitopes. En este
trabajo se han reportado 31grupos de epitopes de MASPs, estudiado 7 de estos y validado 5 por
métodos de uso común en laboratorio con sueros humanos, encontrándose 2 con potencial de ser
considerados en tests diagnósticos. Estos resultados amplían en gran medida el estudio antigénico de
las MASPs.
Para poner en contexto la relevancia del avance presentado en el presente trabajo se recopilaron
los avances realizados por otros grupos hasta la actualidad con respecto a este tema, los cuales se
muestran a continuación. Para ello, se buscaron las predicciones de posibles epitopes en MASPs
realizadas en otros trabajos, se comparó estos potenciales epitopes con los grupos aquí analizados y con
los datos obtenidos para dichos epitopes en el microarreglo en caso de ser posible. A diferencia de lo
propuesto por De Pablos60
donde se predijo y reportó reactividad contra las regiones C- terminales
conservadas, nuestros datos indican que estas regiones no presentan antigenicidad. Secuencias
idénticas y/o altamente similares a las analizadas en dicho trabajo se encuentran repetidas veces en el
microarreglo, ya que constituyen una región altamente conservada de las MASPs, y en todos los casos
presentaron reactividades promedio cercanas a cero. Esta discrepancia podría atribuirse a los distintos
abordajes experimentales utilizados, aunque cabe destacar que nuestros resultados son más consistentes
con las evidencias biosintéticas de estas y otras moléculas de superficie de T. cruzi.
En otro trabajo, y usando predicciones de antigenicidad, conservación y especificidad de
secuencias de MASPs se postuló que la secuencia QHQQHEH[PS]AENGEESAKDK sería antigénica,
por encima de las secuencias en estudio en este trabajo43
. A pesar de esto, en el microarreglo la misma
no resulto antigénica. Cabe destacar que esta secuencia se encuentra cercana a una región antigénica
estudiada en el presente trabajo, el motivo II, y se encuentra altamente conservada hacia el C-terminal
del mismo (siendo la región conservada posterior al motivo nombrada en la sección I.VI.).
Serna y colaboradores52
, presentaron la posibilidad de utilizar un péptido de MASP para
generar una vacuna contra la Enfermedad de Chagas. Este péptido tuvo resultados alentadores en un
modelo murino, aumentando la supervivencia de los mismos y encontrándose anticuerpos específicos
contra este péptido en ratones inmunizados. Para esto realizaron predicciones de epitopes B, MHC-I y
MHC-II, priorizando un péptido en el cual estos se superponen (Figura 1D).
Figura 1D. Figura de Serna et al, 201452. En la
misma se encuentra el péptido priorizado en este
trabajo, y los datos de predicción tanto para
epitopes B, MHC-I y MHC-II obtenidos por este
grupo.
45
Dado que este trabajo es posterior al diseño del microarreglo, no se incluyó la secuencia de
esta proteína en el mismo. Se encontró además que esta no es una región conservada entre las MASPs,
encontrándose como tal en una única MASP (Tc00.1047053511603.380), y como similar en otras 4,
ninguna de las cuales fue analizada en el microarreglo. Se buscaron además las secuencias de los
epitopes B predichos en los datos del microarreglo, no encontrándose la secuencia del primer epitope B
(DAENPGGEV), y como secuencia de mayor similitud se encontró ASENPGGIP, la cual no presentó
reactividad. La segunda secuencia predicha (FNDNKKG) tampoco se encuentra analizada, y la
secuencia que más se le acerca es GNSNKSG y tampoco evidenció reactividad. Estas secuencias
igualmente presentan diferencias claras con respecto a las predichas y no pueden tomarse como
indicativos de la antigenicidad de estas últimas.
Dos Santos y colaboradores45
también realizaron una predicción in sílico de potenciales
epitopes B a partir de péptidos de MASP de 15 aminoácidos. Priorizando 110 péptidos los cuales
ensayaron por inmunoblotting con sueros de ratones infectados y control. Este trabajo también fue
publicado luego del diseño del microarreglo y estos péptidos priorizados solo fueron incluidos
parcialmente de forma no dirigida. Solo 15 péptidos de los 110 priorizados se encuentran con su
secuencia exacta representada en el microarreglo y ninguno de ellos presentó reactividad. También se
buscó para cada uno de los péptidos con antigenicidad predicha por este grupo, el péptido analizado en
el microarreglo que posea mayor identidad de secuencia. Aunque con varios cambios, se buscó la
reactividad de cada uno, encontrándose que todos resultaron negativos a excepción de un péptido que
corresponde al motivo V priorizado en este trabajo. Debido a que estos valores no corresponden a los
péptidos priorizados sino a los más cercanos que se encuentran analizados en el microarreglo, los
mismos no deben tomarse como representativos de los péptidos predichos. Este análisis se resume en la
tabla 5S. Este trabajo se realizó con ratones, siendo entonces otro modelo de estudio de la enfermedad
distinto al propuesto aquí, por lo tanto, los resultados del inmunoblotting no fueron comparados debido
a que consideramos que los resultados en modelos murinos pueden diferir a los que se obtienen en
humanos y por lo tanto sería aventurado hacer una comparación.
Haciendo el ejercicio inverso, ninguna de las secuencias obtenidas como positivas en nuestro
microarreglo fue priorizada en ninguna de las predicciones realizadas por estos grupos, y más aún, las
que fueron priorizadas y se encuentran en nuestro microarreglo no han presentado reactividad contra
los sueros de pacientes crónicos. Esto nos muestra que, al menos en el contexto estudiado, las
herramientas de predicción de epitopes aún requieren refinamiento y modificaciones para poder
predecir epitopes B lineales.
Datos de expresión de MASPs en bibliografía
Con el fin de encontrar si alguna MASP con los motivos en estudio posee evidencia de
expresarse efectivamente en el parásito se recopilaron los datos proteómicos existentes de T. cruzi. El
hecho de que se estén expresando en el parásito, y en especial en estadios infectivos, sería de gran
apoyo al estudio antigénico de los motivos con los que se trabajó en la presente Tesis. Se tomaron los
datos recopilados por tritrypDB al día 27/10/2016, los cuales incluyen información de varios
trabajos47,77–82
, encontrándose 20 secuencias de MASPs. A estos se les sumaron los datos de otros
trabajos no incluidos anteriormente en la recopilación de TritrypDB49,83–86
entre otros trabajos en los
cuales no se encontraron MASPs, posiblemente debido a las distintas estrategias de obtención de
proteínas que se utilizaron en cada uno. En total se contabilizaron 251 MASPs con péptidos
encontrados compatibles con las mismas. Este número creció considerablemente en los últimos 3 años,
46
habiendo sido alrededor de 80 MASPs con datos de espectrometría de masa para el año 2013 (El
número de péptidos de MASPs encontrados es menor, pero se encuentran en múltiples MASPs y se les
asignó a todas por igual.)
Se encontraron 21 MASPs con datos de espectrometría de masa que contienen el motivo I, 3
del motivo II, 18 con el motivo III, una con el V (la proteína ensayada en el microarreglo) y 3 con el
motivo VI. Para el motivo IV repitió la búsqueda, utilizando las MASPs obtenidas al relajar la
exigencia de la búsqueda del motivo, encontrándose 4 MASPs que expresan una secuencia similar al
motivo. Todas estas proteínas encontradas se encontraron siendo expresadas en estadios en mamífero,
más específicamente tripomastigotes.
Aunque estas proteínas no son exclusivas de estadios en mamífero, existe una gran diferencia
en la información de expresión de MASPs en estadios en insecto y en mamífero, habiéndose
encontrado solo 15 MASPs con expresión en insecto contra 239 en mamífero; algunas se encuentran
tanto en estadios en insecto como en mamífero. Esta diferencia podría estar asociada a una gran
diferencia en el perfil de expresión de estas proteínas in vivo, pero también puede estar asociada a un
sesgo en los trabajos realizados con cada estadio y las estrategias utilizadas para los mismos.
Todo esto indicaría que los epitopes en cuestión se expresarían y se presentarían al sistema
inmune, lo cual refuerza la idea de que estas proteínas son potenciales antígenos y acompaña el trabajo
realizado hasta el momento.
Predicciones de las glicosilaciones en MASPs en el contexto del trabajo
Debido a que encontramos regiones conservadas cercanas a los motivos, surgió la pregunta
sobre si esta asociación es meramente debida a la naturaleza recombinacional de las MASPs o si las
mismas presentan cierta relación con la antigenicidad de los motivos. Como primera aproximación a
responder esta pregunta, nos planteamos estudiar la glicosilación de estas regiones conservadas
cercanas a los epitopes in sílico. Esto lo realizamos ya que esperamos que zonas libres de
glicosilaciones sean de más fácil acceso para el sistema inmune. Con el fin de evitar sesgos debidos a
la elección de una única o algunas proteínas para generalizar al grupo completo, se generaron
secuencias consenso para cada grupo a partir de las MASPs que lo componen. Este análisis se
complementa con los perfiles de conservación de estos grupos (figuras 2D-7D).
No se poseen aún formas de predecir O-glicosilaciones de manera certera en T. cruzi50
, aunque
se conoce que las mismas pueden diferir de la de otros eucariotas. Teniendo esto en cuenta, se utilizó el
programa NetNGlyc para predecir N-glicosilaciones87
y NetOGlyc para O-glicosilaciones88
.
47
Figura 2D. Glicosilación predicha para la región antigénica de la secuencia consenso de MASPs que poseen tanto el motivo I
como el III. Marcado con flecha se encuentra el sitio de anclaje a GPI. Aquellos aminoácidos rio abajo, y por lo tanto no
presentes en la proteína madura, no se consideraron en el análisis. En barras azules se encuentran los posibles sitios de N-
glicosilación y en rojo los de O-glicosilación tomándose los valores umbrales por defecto de los predictores (0,5). Se marcan
sobre el eje X, las posiciones de los motivos, en verde el motivo III y en celeste el motivo I. Abajo del mismo se agrega el
gráfico de conservación de las posiciones, con el mismo código de colores.
Al realizar este análisis se encontró una gran cantidad de aminoácidos plausibles de O-
glicosilación (repartidos en la totalidad de la región hipervariable de las MASPs). Algunos de ellos
incluso dentro de los motivos en estudio, lo cual podría dificultar su asignación en bases proteómicas.
Por otro lado, si se pudo encontrar zonas alrededor del motivo III en las cuales no se encuentran
presentes ni serinas ni treoninas ni asparraginas, generando zonas no glicosiladas incluso en el contexto
de proteínas altamente glicosiladas como son las MAPS. Conociendo que estas zonas se encuentran
conservadas alrededor del motivo como se ve en la figura 2D, esto nos habla de que estas regiones no
glicosiladas son comunes en este grupo de MASPs.
Figura 3D. Glicosilación predicha para la región antigénica de la secuencia consenso de MASPs que poseen el motivo I.
Indicaciones idénticas a las de figura 2D.
Para las proteínas del grupo I, cuyo motivo contiene varias treoninas, se predice que este se
encontraría altamente O-glicosilado. Por lo tanto, el epitope peptídico lineal analizado en el
48
microarreglo no existiría como tal in vivo. Sin embargo, datos de nuestro laboratorio indican que
TSSA, que también se predice altamente glicosilada dentro de su región central, se expone en la
superficie del parásito en forma hipoglicosilada o no glicosilada en absoluto (datos no publicados).
Más aún, los epitopes B lineales más reactivos de TSSA han sido mapeados precisamente sobre estas
secuencias73,75,89
. Existe la posibilidad que la predicción generada no tenga un correlato con la proteína
in vivo tampoco en el caso de las MASps.
Figura 4D. Glicosilación predicha para la región antigénica de la secuencia consenso de MASPs que poseen el motivo III.
Indicaciones idénticas a las de figura 2D.
El grupo III presenta la curiosidad de que la secuencia del motivo se encuentra dentro de una
zona que en general se encuentra libre de serinas y treoninas, y por tanto libre de glicosilaciones
predichas, aunque dentro del motivo mismo, la treonina final se encontraría glicosilada, según la
predicción realizada por el programa.
Figura 5D. Glicosilación predicha para la región antigénica de la secuencia consenso de MASPs que poseen el motivo II.
Indicaciones idénticas a las de figura 2D, con el motivo II marcado en marrón.
49
El motivo II se encontraría en una zona conservada con nula presencia de Serina, Treonina y
Asparragina, más allá de las que presenta el motivo, lo cual se condice con nuestra idea principal al
realizar este análisis, estas zonas no glicosiladas que acompañan al motivo también se encuentran
altamente conservadas al igual que las del motivo III, pero son diferentes como se ve en las figuras 9R
y 10R.
Figura 6D. Glicosilación predicha para la región antigénica de la secuencia consenso de MASPs que poseen el motivo IV
Indicaciones idénticas a las de figura 2D, con el motivo IV marcado en azul.
Por último, el motivo IV se encontraría glicosilado en ambos extremos, además la región
conservada que lo acompaña presenta un menor grado de conservación que en los motivos II y III, y la
zona ausente de glicosilaciones posterior es menor en cantidad de aminoácidos. Dado que este motivo
no presentó reactividad en los ensayos de ELISA, no se consideró de gran importancia esta menor
cantidad de aminoácidos libres de glicosilaciones. La región anterior libre de glicosilaciones no se
tomó en cuenta ya que es una región variable no conservada.
Figura 7D. Glicosilación predicha para la región antigénica de la secuencia consenso de MASPs que poseen el motivo VI.
Indicaciones idénticas a las de figura 2D, con el motivo VI marcado en violeta.
50
Siguiendo la tendencia observada en el resto de los motivos en análisis, el motivo VI presenta
una región altamente conservada al motivo posterior al mismo, la cual es propia del motivo, es decir,
no se comparte con el resto de los motivos en estudio, y que no presenta aminoácidos glicosilables.
Además el motivo en si presenta aminoácidos que serían glicosilados in vivo según la predicción.
Por un lado se encontró que las regiones conservadas asociadas a los motivos en estudio serían
zonas libres de glicosilación, más allá de la capacidad del programa en uso, ya que las mismas no
poseen aminoácidos glicosilables. Por otro, se predijeron glicosilaciones dentro de los motivos. Dado
que los mismos fueron obtenidos a partir del estudio de péptidos sin modificaciones, los mismos
deberían encontrarse sin glicosilar in vivo para que se hayan generado anticuerpos contra estas
versiones de los motivos. Creemos que las glicosilaciones dentro de los motivos se podrían deber a que
la predicción no se encuentra optimizada para el organismo en cuestión. Las glicosilaciones in vivo,
entonces, podrían diferir de las encontradas aquí.
Con el fin de estudiar más a fondo si estos motivos se encuentran o no glicosilados in vivo, se
realizaron búsquedas en las bases de datos de proteómica y glicoproteómica anteriormente nombradas
buscando específicamente estos motivos o parte de los mismos, teniendo en cuenta los métodos
utilizados de digestión y purificación de proteínas en cada trabajo.
Al realizar este análisis se encontraron varios péptidos similares al motivo III en bases de datos
de glicoproteómica y los mismos no se encuentran glicosilados, además de péptidos exactos del motivo
propiamente dicho en datos de proteómica. También se encontraron péptidos similares al motivo II, los
cuales no se encuentran glicosilados en posiciones que existan en el motivo (Tabla1S, material
suplementario). No se encontraron secuencias de los motivos I, II, IV, V, VI ni VII en las bases de
datos de glicoproteómica y proteómica. En cuanto al motivo I, esto podría explicarse por las estrategias
utilizadas para digerir y purificar los péptidos, ya que su versión diferida se encuentra en un extremo
unido a GPI.
Se realizaron digestiones virtuales con tripsina sobre las secuencias de las MASPs que
contienen los motivos, encontrándose que las proteínas del motivo VI presentarían péptidos de
alrededor de 42 aminoácidos en todos los casos, mientras que el motivo V, alrededor de 95
aminoácidos. En particular, este último motivo sería difícil encontrarlo realizando digestión por tripsina
debido a que el alto peso molecular de un péptido de 95 aminoácidos no sería analizable mediante
espectrometría de masa. El resto de los motivos, si bien podrían haber sido encontrados, no lo fueron.
Esto no debe ser tomado como prueba de que los mismos se encuentren glicosilados, considerando la
reducida cantidad de péptidos de esta familia encontrados hasta la actualidad.
Encontrar que estos motivos poseen una localización C-terminal conservada y característica de
cada uno nos llamó la atención, porque a priori sería una región poco accesible para los anticuerpos
generados considerando la localización predicha para las mismas en el parásito. Esta característica
parece ser más una generalidad que una excepción en T. cruzi, ya que sucede lo mismo en varios
antígenos anclados a GPI67,68,73,90
. Esto podría indicar que la forma en la que estos antígenos son
reconocidos por los anticuerpos in vivo, podría diferir de la pensada. Se han reportado MASPs en el
sobrenadante de tripomastigotes43
, con lo cual es posible que estos epitopes sean reconocidos una vez
liberados de la membrana, ya sea por corte proteolítico, como sucede con algunas proteínas de anclaje
a GPI en T. cruzi41
o por falta de procesamiento y anclaje a GPI. En este caso, los epitopes aquí
estudiados, y en especial el motivo I, se encontrarían mucho más accesibles para el reconocimiento por
anticuerpos.
51
En resumen, se encontró que las regiones conservadas aledañas a los motivos coinciden con
regiones libres de glicosilaciones incluso en el contexto de proteínas altamente glicosiladas como las
MASPs en varios de los motivos en estudio. Por otro lado, este análisis también nos genera dudas sobre
si los motivos en cuestión se encuentran o no glicosilados en la proteína in vivo.
Análisis de secuencias similares a los motivos
Como se nombró en los resultados, además de los motivos para cada grupo se determinaron
motivos menos restringentes a los que llamamos ―secuencias similares a estos motivos‖. Las
secuencias similares a los motivos en cuestión y el número de genes y MASPs encontrados en el
genoma de T. cruzi se encuentran en la tabla 1D. Esta búsqueda se hizo de igual manera que la
realizada con los motivos en los resultados. Para los grupos que presentaron una única secuencia, se
realizo una búsqueda por BLAST sobre los mismos genomas con un e-valor menor a 10. Una lista
completa de estas proteínas se encuentra en la tabla 3S.
Grupo Secuencias similares al
motivo. No negativas
Proteínas que poseen un motivo similar
(MASPs)
I
[KR]XTT[AT]XTG
119(115) [KR]XXT[AT]TTG
[KR]XTX[AT]TTG
II
QXQ[TS]D[DE]
75(50) Q[TS]D[DE]XQ
[TS]D[DE]XQXQ
III [DE]PAXDXA
122(106) PXADXAXT
IV VXSREX[DE]
57(35) SREXDGEXXTSE
V - 3(3)*
VI S[DE]A[DE]A[DE]
23(7) [ED]A[DE]ADXD
VII - 1(1)*
Tabla 1D. Motivos obtenidos para cada grupo en análisis. X siendo cualquier aminoácido. Los aminoácidos entre corchetes
corresponden a varios aminoácidos que pueden encontrarse en esa misma posición. Junto con los resultados obtenidos al
buscar las secuencias similares a los motivos. *Estos datos se obtuvieron utilizando BLAST (e-valor<10). –: No se pudo
realizar el análisis por falta de datos.
Al relajar las condiciones de búsqueda y utilizar como entrada de la misma las secuencias
similares al motivo, se agregaron a los resultados en general proteínas hipotéticas, algunas pocas
proteínas ribosomales entre otras posiblemente debido a una búsqueda por demás laxa (por ejemplo el
motivo VI). Cabe destacar la presencia de mucinas TcMUC II entre las secuencias similares al motivo
II y III. Las TcMUC, además de similares en estructura a las MASPs, se han encontrado formando
proteínas hibridas con las MASPs43
.
Por último se analizó la distribución de las secuencias dentro de las MASPs, de manera análoga
a la realizada para los motivos. No se encontraron nuevas combinaciones de motivos dentro de las
MASPs diferencias entre los dos análisis realizados.
52
Secuencias con reactividad contra sueros control en el microarreglo
Con respecto al análisis realizado para probar la importancia de las secuencias que presentaron
reactividad contra los sueros control en el diagnóstico, y por consiguiente la importancia de realizar
controles de los microarreglos utilizando estos sueros, no se encontraron diferencias entre la utilización
de las proteínas completas y los motivos en soledad en las reactividades contra sueros controles. Esto
indica que la reactividad obtenida contra los sueros control en el microarreglo no tendría el peso que
esperábamos al comienzo de este trabajo. Desconocemos las razones por las cuales no se encuentra un
paralelismo similar al encontrado con las reactividades obtenidas en el microarreglo contra los pooles
de pacientes Chagásicos. Podría deberse a un error asociado a la técnica del microarreglo peptídico, en
particular a diferencias durante la toma de los datos, ya que las mediciones de la reactividad contra los
sueros control y los sueros de pacientes son independientes y realizadas en sucesión sobre el mismo
CHIP y no en paralelo.
Por último, estos datos junto con los resultados del motivo VII (recordemos que el mismo
presentaba reactividades similares contra los pooles de sueros chagásicos y los pooles de sueros control
en el microarreglo), muestran que el hecho de priorizar los epitopes que mostraron una baja reactividad
contra los pooles de sueros control, si bien parece lógico en un primer análisis, puede que haya sido
erróneo. Varios grupos de epitopes no fueron priorizados debido a poseer valores altos de reactividad
contra los sueros control, incluso cuando mostraban valores más altos de reactividad contra sueros
chagásicos que los grupos VI y VII. Estos grupos, entonces, podrían ser de mayor interés ahora que
contamos con estos datos.
Validación de los motivos
Si bien los valores obtenidos no presentan mejorías comparados con los de antígenos ya
estudiados y utilizados en el diagnóstico de Chagas en ninguno de los casos36,91
, los resultados
obtenidos muestran efectivamente que las secuencias en estudio son antigénicas e incluso en los casos I
y II se muestran con performance comparables y con potencial para ser evaluados para su inclusión en
tests diagnósticos. El resto de los casos también nos resultan de interés, ya que son reconocidos por una
población de pacientes. Sería importante estudiar estas secuencias utilizando paneles de sueros de
subpoblaciones definidas de pacientes Chagásicos (por ejemplo sintomáticos versus asintomáticos),
para evaluar si los mismos tienen potencial como biomarcadores o en aplicaciones diagnósticas
particulares37
.
Consideraciones posteriores al trabajo
Ahora que nos encontramos con los epitopes validados por técnicas serológicas
convencionales, hicimos una evaluación de los resultados obtenidos y las estrategias para llegar a ellos.
En primer lugar, los criterios utilizados en la priorización presentaron dos puntos que luego de
analizarse los resultados obtenidos se encuentran en revisión. En primer lugar, el utilizar como criterio
la conservación de la secuencia antigénica en el genoma del parásito no nos dio los resultados
esperados, como puede verse para el motivo IV. Este motivo presentó baja prevalencia en el
microarreglo (1/4 pooles) y una alta reactividad en el único pool contra el que reaccionó. A pesar de
esta baja prevalencia, su alta reactividad, baja reactividad contra sueros control y principalmente su
mayor presencia en el genoma que el resto de los motivos no priorizados lo llevaron a la cuarta
53
posición en nuestro análisis, aunque no cumplió con estas expectativas. Desafortunadamente uno de los
sueros en cuestión de la mezcla reactiva contra este motivo ya no se encontraba disponible al momento
de realizar los ensayos. Es probable que este suero sea el único de la mezcla que presentó reactividad,
ya que el resto de los mismos no lo hicieron. Este resultado nos dice que nuestros criterios de
priorización pueden mejorarse, en especial en el peso que se le da a cada uno. A pesar de esto,
considerando que no pudimos reproducir su antigenicidad en ELISA, este resultado no contradice a
priori la correlación entre representatividad y antigenicidad analizada en el aparto I de resultados, ya
que se considera entonces como una secuencia no antigénica y no entraría en el mismo.
Por otro lado no se pudo demostrar que la reactividad contra los sueros control sea relevante ni
en la priorización ni en el diagnóstico en sí. El motivo VII que poseía valores similares contra los
sueros chagásicos y los sueros control presentó una reacción específica contra los sueros de pacientes
chagásicos en los ensayos de ELISA, siendo el tercer mejor antígeno estudiado. Por otro lado, la
inclusión de secuencias con reactividad contra los pooles de sueros control pero no contra los de sueros
chagásicos en el microarreglo no presentó diferencias en la especificidad de los motivos en estudio.
Esto nos lleva a pensar que los criterios de priorización podrían mejorarse reduciendo la importancia de
la presencia/conservación de las secuencias en estudio en el genoma y el de la reactividad vista contra
los pooles de sueros control.
54
CONCLUSIONES • Se identificaron 69 MASPs reactivas, dentro de las cuales pudieron mapearse numerosos 'motivos'
conteniendo al menos 1 epitope B lineal.
• Estos motivos se encontraron exclusivamente en las secuencias maduras de las MASPs y no en las
regiones conservadas clivables, lo cual es coincidente con el procesamiento post-traduccional predicho
para estas proteínas en el parásito.
• Dentro de la secuencia madura (la expuesta en superficie), estos 'motivos' mostraron cierta tendencia
a ubicarse hacia la región C-terminal, más próxima a la membrana de acuerdo a reconstrucciones
topológicas putativas de estas moléculas.
• No se encontraron estos motivos antigénicos en otros kinetoplastidos relacionados.
• Análisis in sílico revelaron cierta correlación entre la representatividad de estos motivos en el genoma
de T. cruzi y su reactividad. Además, se vio que las regiones adyacentes a los motivos son altamente
conservadas y presentan en general pocos sitios consenso de glicosilación.
• Siete de estos 'motivos' fueron validados usando metodologías convencionales, encontrándose que
algunos de ellos, si bien poseen valores bajos de reactividad y prevalencia en comparación con otros
antígenos de T. cruzi, pueden ser considerados para el desarrollo de nuevos reactivos de
serodiagnóstico de la Enfermedad de Chagas.
• Además, a partir del análisis realizado se avanzó hacia un mayor entendimiento del análisis de datos
obtenidos mediante la metodología del microarreglo peptídico.
PRÓXIMOS PASOS
A partir del trabajo realizado planteamos a futuro realizar:
• Un mapeo fino de los motivos mediante su inclusión en un microarreglo peptídico nuevo.
• Una ampliación del panel de sueros utilizados, incluyendo sueros de poblaciones definidas de
pacientes.
• Un repositorio curado de todos los pseudogenes de MASPs, con el fin de estudiar la presión de las
regiones adyacentes que encontramos conservadas para cada motivo.
• Los análisis aquí propuestos utilizando los logos completos en lugar de los motivos centrales.
• Completar el análisis de las MASPs incluyendo al resto de las mismas en un microarreglo próximo.
55
MATERIALES Y MÉTODOS
Herramientas bioinformáticas
Las predicciones de péptido señal se realizaron en todos los casos con SignalP 4.157
. Las
predicciones de sitio de anclaje a GPI se realizaron en todos los casos con PredGPI58
. Para la
generación de logos se utilizó Seq2logo. www.cbs.dtu.dk/biotools/Seq2Logo. Para realizar
alineamientos múltiples se utilizó ClustalW. www.genome.jp/tools/clustalw/. Para la generación de la
matriz de identidad de secuencia se utilizó Clustal2.1. Para cada secuencia se generó una lista de las
secuencias que poseen, al menos, un 50% de identidad compartida. Luego se seleccionaron
arbitrariamente las secuencias que configuraban un mejor armado de los grupos y se las usó como
secuencias centrales para cada uno de ellos. Por último se verificó que cada secuencia se encuentre en
un único grupo. Los estudios de conservación de secuencia y las secuencias consenso generadas se
realizaron con las herramientas provistas por el programa Jailview70
. Para esto se realizaron
alineamientos de secuencia con Clustal y se utilizaron como entrada. Se calcularon los puntajes de
conservación mediante el método propuesto por Livingstone69
. Se utilizó el programa NetNGlyc para
predecir N-glicosilaciones87
y NetOGlyc para O-glicosilaciones88
. En ambos casos se utilizó como
secuencia de entrada la secuencia consenso generada anteriormente en Jailview. Estos análisis se
realizaron siempre considerando el perfil de conservación observado. Se utilizó para cada programa
su configuración por defecto (excepto indicación contraria indicada en resultados).
Generación de los motivos
Para generar los motivos para cada grupo se graficaron los perfiles de las secuencias
antigénicas y se analizaron los mismos. Este análisis se realizó en dos partes, primero se tomó entre el
60% y el 70% del valor máximo mostrado por el pico antigénico particular (se consideró el mismo
porcentaje para todas las secuencias de un mismo grupo) como un nuevo umbral, para así buscar
considerar solamente las secuencias en las cuales el motivo se encuentra completo. Cabe destacar que
no se encontraron más de un epitope B lineal en ninguno de los motivos priorizados y que este
procedimiento no sería correcto en caso de encontrarse epitopes B superpuestos. Luego se alinearon las
secuencias resultantes recuperándose las posiciones compartidas entre las mismas. Considerándose
solo estas posiciones se constituyó un patrón degenerado incluyendo todas las variaciones encontradas
en los péptidos antigénicos, vistas en los logos. Se verificó mediante una búsqueda en el repertorio de
péptidos negativos, que el patrón degenerado no se encuentre representado en este repertorio. Al tener
más de una secuencia antigénica por grupo, se realizó este análisis para cada uno y se decidió un
consenso en los casos en los cuales las distintas secuencias presentaran diferencias entre sí. Un ejemplo
del grupo I se muestra en la figura 1M. Para cada grupo en particular se determinó el porcentaje de
reactividad a utilizar como umbral. Para el caso del grupo I mostrado en la figura 1M, se utilizó un
70% de la reactividad máxima presentada por la secuencia antigénica en cuestión.
56
Figura 1 M. Ejemplo representativo de cómo se generaron los distintos motivos para cada grupo. En este caso se muestra la
proteína Tc00.1047053503645.40 del grupo I.
Para obtener los motivos menos restringentes para cada uno de los grupos, se constituyeron
secuencias simples a partir de las posiciones conservadas de los logos de los motivos. Se tomaron
secuencias más cortas que 15 aminoácidos como búsquedas, permitiendo ambigüedad en posiciones de
baja conservación y cambios entre aminoácidos similares en posiciones más conservadas (por ejemplo,
a una posición con glutámico conservada se le permitió variar entre glutámico y aspártico y una
posición con lisina entre lisina y arginina). Estas secuencias simples se buscaron dentro del repertorio
de péptidos negativos del microarreglo. Si estas secuencias simples se encontraban dentro del
repertorio de negativos, se agregaban restricciones y complejidad a estas secuencias, utilizando como
guía los logos obtenidos y se repetía la búsqueda, hasta que no se encontró entre los negativos. Las
secuencias mínimas que se obtuvieron con esta estrategia se las llamó secuencias similares a los
motivos. En varios casos se obtuvieron más de una secuencia por grupo debido a que se tomaron
distintos caminos a la hora de aumentar la complejidad.
Diseño de primers y clonado.
El diseño de primers y clonado de las secuencias de interés se realizó con el fin de amplificar
secuencias representativas de cada grupo de MASPs de tal manera que se encuentren en soledad y no
acompañadas de ninguno de los otros 30 grupos, y además poder clonar el resto de la proteína por
separado, en aquellos casos donde se encuentre una secuencia que haya presentado reactividad contra
pooles de sueros control dentro de la misma proteína. Para esto se diseñaron primers para clonarlas a
partir de ADN genómico de T. cruzi CL Brener. Debido a las características de las MASPs53
y su gran
representación en el genoma del parásito el diseño de primers específicos que amplifiquen las MASPs
de interés y no el resto de la familia multigénica no es trivial. Para cada una de los grupos entonces se
diseñaron primers sentido en la región anterior a las secuencias antigénicas, buscando que estos sean lo
más específicos posibles y antisentido en la región río abajo, la cual se encuentra altamente conservada
en las MASPs. Para las regiones no reactivas de estas MASPs la dificultad resulta similar, debido a que
las zonas río arriba de las mismas también se encuentran conservadas. En las regiones a clonar no se
57
incluyen las regiones N- y C-terminales clivables. Se utilizaron varias herramientas bioinformáticas
para el diseño de los primers, entre las que destaca Primer-blast de NCBI
(www.ncbi.nlm.nih.gov/tools/primer-blast/), el cual realiza un análisis de la secuencia y diseña los
primers para luego realizar una búsqueda por BLAST de los mismos en una base de datos de genoma y
estudiar si los mismos son específicos. Las mismas no tuvieron éxito, posiblemente a que las formas de
puntuar los cambios de bases nucleotídicas entre el primer y la secuencia del genoma por BLAST y la
manera a que el primer se ve afectado en su rol son distintas. Más allá de esto, la herramienta citada
posee una forma de restringir aún más la especificidad del primer, lo cual es útil pero no suficiente para
familias multigénicas del orden de las MASPs. Para esto entonces se realizaron búsquedas por BLAST
en tritrypDB de manera individual para los primers candidatos que se fueron obteniendo y se evaluaron
manualmente tanto su especificidad en conjunto con el primer con el que se utilizaran, como sus
propiedades, complementariedad de bases y tendencia a formar loops. Las propiedades de los primers
se estudiaron mediante Net Primer (www.premierbiosoft.com/netprimer). Para esto se dedicó especial
trabajo en la búsqueda de los primers, en varios casos recurriendo a alineamientos entre un gran
número de MASPs que comparten las regiones a amplificar y analizando las diferencias entre las
mismas. Varias de las secuencias del microarreglo en análisis fueron descartadas por imposibilidad de
generar primers específicos contra ellas que amplifiquen la región de interés sin secuencias de otros
grupos, porque aquellas secuencias que lo permitían eran tendientes a la formación de ciclos consigo
misma o con su par o simplemente no se pudieron generar por falta de especificidad. Por esto, algunos
de los grupos no se encuentran representados por la secuencia de mayor reactividad de dicho grupo.
Por último, no se pudo asegurar que los mismos sean específicos in vivo a pesar de serlos in sílico,
debido a que el genoma no se encuentra totalmente completo y estudiado al momento de realización de
estos primers (febrero/marzo 2014).
El diseño de los primers es tal que permite el clonado de ambos fragmentos siguiendo una
estrategia común y, posteriormente, la fusión de las regiones antigénicas con las no antigénicas de la
misma proteína para obtenerse la proteína completa. (Figura 2M). Para esto se agregaron a los
extremos 5´ de los oligos secuencias de corte para enzimas de restricción, SacI y XhoI para los primers
sentido y antisentido respectivamente para las regiones amino de las proteínas y XhoI y NotI para las
regiones carboxilo. Estas enzimas fueron elegidas de esta manera ya que ninguna produce cortes
internos en ninguna de las secuencias en estudio. Además se agregaron nucleótidos más allá de estos
sitios para darle el contexto nucleotídico recomendado para el óptimo funcionamiento de las enzimas
de restricción. Las secuencias de los oligos e información sobre ellos se encuentran en tabla 1M
(Materiales y métodos).
Oligonucleótidos
Grupos Gen al cual es dirigido Región Sentido Secuencia
I Tc00.1047053506245.200 N F GGGGAGCTCGGTGTTGGCGGTGGCGATGG
R TTGTCTCGAGGACGGGTGTTTCCTTCGGA
C F TTTTCTCGAGCCTCCGAAGGAAACACCCGTC
R TTGCGGCCGCTGCCGTCACTGTCGCCA
II Tc00.1047053508389.154 N F TGTGAGCTCATGGCGTCGGGAGTGTTG
R CCCCCTCGAGACCACCAGCAGAACCAACTC
C F GGGGCTCGAGGGAGTTGGTTCTGCTGGTGGT
R TTGCGGCCGCCGTCACTGTCGCCTGTATTT
III Tc00.1047053506965.70 N F TTTGAGCTCGGTGGTGGGAGCGGTTTA
58
R TTTTCTCGAGTACTTCCGTTTCGCCTGCAT
C F AAAACTCGAGGATGCAGGCGAAACGGAAGTA
R TTGCGGCCGCTGCTGCCGTCACTGTCACT
IV Tc00.1047053506769.80 N F TATGAGCTCGCTGGCGGTAGATGTGACGAG
R GGGGCTCGAGAACATCTTCTTCTGGAGGTGAT
C F CCCCCTCGAGGAGAACACACTGCCTGGGGAA
R TTGCGGCCGCCGTCACTGTCGGCAATCTTT
V Tc00.1047053506799.130 N F TGGGAGCTCGGCGGTGTTTATGCGAGGGA
R AAAACTCGAGACCAGTAGCAGCAGGAACA
C F TTTTCTCGAGGGTGTTCCTGCTGCTACTGGT
R TTGCGGCCGCTGCCGCTGTCGCCATCTTT
VI Tc00.1047053505297.60 N F AAAGAGCTCGACAACAAGGCACTGGGCGAT
R TGTCCTCGAGTTCTTGTGTTCCCTGTGCGT
C F AAAACTCGAGGACGCACAGGGAACACAAGAA
R AAGCGGCCGCTGCCGTCACTGTCGCCA
VII Tc00.1047053503761.40 N F TTTGAGCTCGGTGTCTGCGGTGGTCTT
R TTTTCTCGAGGTTCCCTCCGTTACCTGTTGT
C F AAAACTCGAGACAACAGGTAACGGAGGGAA
R TTGCGGCCGCTGCTGCTGTCGCTGTTCTG
Tabla 1M. Oligonucleótidos utilizados para la obtención de las secuencias representativas de los grupos. F: foward. R:
reverse.
Nombre Descripción Secuencia
MP1 Oligonucleótido utilizado para
modificar pGEX1λT CCGTCGACGAGCTCGCACTCGAGGCAGCGGCCGCGAAGCTTGCAG
MP2 Oligonucleótido utilizado para
modificar pGEX1λT AATTCTGCAAGCTTCGCGGCCGCTGCCTCGAGTGCGAGCTCGTCGACG
IIIC_fow Oligonucleótido diseñado para
generar el motivo III por annealing TCGAGAACAATGATCCAGCAGCTGATGGTGCAGAGACACGAGAAGAAGC
IIIC_rev Oligonucleótido diseñado para
generar el motivo III por annealing GGCCGCTTCTTCTCGTGTCTCTGCACCATCAGCTGCTGGATCATTGTTC
IN_fow
Oligonucleótido diseñado para
generar una secuencia antigénica
inespecífica asociada al motivo I
obtenido, a partir de annealing
CGGTCGCCGACGCTGGAGACGTCAGAGGATAGTGGTAGCCGCTGCAGCGGCTC
IN_rev
Oligonucleótido diseñado para
generar una secuencia antigénica
inespecífica asociada al motivo I
obtenido, a partir de annealing
TCGAGAGCCGCTGCAGCGGCTACCACTATCCTCTGACGTCTCCAGCGTCGGCGACCGAGCT
ICmod_fo
w
Oligonucleótido utilizado para
generar el motivo I AAAAACTCGAGATGAAAACCACAACGGCG
ICmod_rev Oligonucleótido utilizado para
generar el motivo I AAAAACTCGAGATGAAAACCACAACGGCGAC
Tabla 2M. Resto de los oligonucleótidos utilizados en la realización del trabajo
59
Péptidos Grupo Disponibilidad Secuencia
I Péptido solo y acoplado a BSA LQVAGIKTTTATTGDS
II Péptido solo y acoplado a BSA EKQQQSDEAQVQQHQ
III Péptido solo y acoplado a BSA QTTGDDDPAADGAGTAEGKQC
IV Péptido solo y acoplado a BSA PEEDVASREQDGEDTTSEGEC
X Péptido solo y acoplado a BSA SEREDDEENDEEEDG
Scrambled - CGPSMESTEKSPQSATATGPPT
33268 Péptido solo WMRRLRILRRLLRKYC
Tabla 3M. Péptidos utilizados/disponibles derivados de este trabajo.
Cepas y plásmidos utilizados/obtenidos
Cepas o plásmidos Características Referencia
Escherichia coli
DH5αF'IQ™
F-φ80lacZΔM15 Δ(lacZYA-argF) U169 recA1 endA1 hsdR17 (rk-,mk+) phoAsupE44 λ-
thi-1 gyrA96 relA1/F´ proAB+ lacIqZΔM15 zzf::Tn5 [Kmr]. Invitrogen
Escherichia coli BL21-
CodonPlus(DE3)-RP E. coli B F- ompT hsdS(rB mB ) dcm Tet gal l(DE3) endA Hte [argU proL Camr] Stratagene
pGEX1λT Vector de expresión, Ampr GE Healthcare
pGEX-MP Vector de expresión, Ampr; esqueleto de pGEX1λT, con su sitio de múltiple clonado
modificado Este trabajo
pGEX2T-TSSA VI Contiene la secuencia que codifica para el péptido TSSA VI
clonada en el vector pGEX2T Balouz et al, 201489
pGEXMP-IC Contiene la secuencia que codifica para la región C-terminal madura (antigénica) de una
proteína del grupo I clonado en el vector pGEXMP Este trabajo
pGEXMP-IN Contiene la secuencia que codifica para la región N-terminal madura (antigénica
inespecífica) de una proteína del grupo I clonado en el vector pGEXMP Este trabajo
pGEXMP-IIN Contiene la secuencia que codifica para la región N-terminal madura (no antigénica) de una
proteína del grupo II clonado en el vector pGEXMP Este trabajo
pGEXMP-IIC Contiene la secuencia que codifica para la región C-terminal madura (antigénica) de una
proteína del grupo II clonado en el vector pGEXMP Este trabajo
pGEXMP-IIT Contiene la secuencia que codifica para la región hipervariable madura (antigénica + no
antigénica) de una proteína del grupo II clonado en el vector pGEXMP Este trabajo
pGEXMP-IIIC Contiene la secuencia que codifica para la región C-terminal madura (antigénica) de una
proteína del grupo III clonado en el vector pGEXMP Este trabajo
pGEXMP-IVC Contiene la secuencia que codifica para la región C-terminal madura (antigénica) de una
proteína del grupo IV clonado en el vector pGEXMP Este trabajo
pGEXMP-VIN Contiene la secuencia que codifica para la región N-terminal madura (no antigénica) de una
proteína del grupo VI clonado en el vector pGEXMP Este trabajo
pGEXMP-VIC Contiene la secuencia que codifica para la región C-terminal madura (antigénica) de una
proteína del grupo VI clonado en el vector pGEXMP Este trabajo
pGEXMP-VIT Contiene la secuencia que codifica para la región Hipervariable (antigénica + no
antigénica) de una proteína del grupo VI clonado en el vector pGEXMP Este trabajo
pGEXMP-VIIN Contiene la secuencia que codifica para la región N-terminal madura (antigénica) de una
proteína del grupo VII clonado en el vector pGEXMP Este trabajo
Abreviaturas: Ampr, resistencia a ampicilina; Camr, resistencia a cloranfenicol; Kmr, resistencia a kanamicina.
Tabla 4M. Cepas utilizadas y plásmidos utilizados u obtenidos durante el trabajo.
Preparación de células competentes
Las células competentes de las cepas Escherichia coli DH5αF'IQ™ y Escherichia coli BL21-
CodonPlus(DE3)-RP fueron preparadas por el método de inoue92
.
60
Generación del plásmido pGEXMP.
El plásmido pGEXMP se generó a partir del plásmido pGEX 1λT según lo mostrado en la
figura 2M.
Fig. 2M. Estrategia y modificación del MCS de pGEX1λT para generar el vector pGEXMP.
Esquema de clonado utilizado. Los oligonucleótidos y el plásmido pGEXMP fueron generados de tal manera de permitir el
clonado de las regiones N y C-terminales maduras para recuperar la región de la proteína en cuestión.
El mismo se esquematiza en la figura 3M.
61
Fig. 3M. Esquema del clonado realizado para dos fragmentos de una misma MASP, y la unión de ambos para formar el gen
completo. El mismo puede o no requerir un paso de clonado en pGEM T-easy. S: Sitio de corte por SacI; X: Sitio de corte por
XhoI; N: Sitio de corte por NotI; A: Nucleótido A protruyente; T: Nucleótido T protruyente.
Reacciones de PCR y annealing.
PCR
La amplificación a partir de genómico se realizó en principio mediante el siguiente protocolo, y
solo fue modificado en aquellos casos donde el resultado no haya sido óptimo (Tabla 5M): Buffer de PCR (10x) 5 µl Ciclado
10nM dNTPs 1µl 94°C 5´
Primer sentido (10µM) 2,5µl Ciclar 94°C 30´´
Primer anti-sentido (10µM) 2,5µl 30 MIN( Tm ) - 5°C 30´´
MgCl2 (50mM) 1,5µl Veces 72°C 40´´ - 1´30´´ según reacción
Taq polimerasa 0,2µl 72°C 10´
Templado 1µl (~100ng)
H2O Hasta 50 µl
Tabla 5M. Protocolo de PCR general. MIN (Tm) hace referencia a la mínima Tm entre los oligonucleótidos utilizados
Annealing Para generar secuencias de interés capaces de ser clonadas en los vectores utilizados se utilizó,
para los oligonucleótidos indicados anteriormente, el siguiente protocolo de annealing. (Tabla 6M).
62
Tabla 6M. Ciclado utilizado para aparear oligonucleótidos complementarios. N hace referencia a la repetición actual de dicho
ciclo, a términos prácticos se baja la temperatura 1°C por minuto desde 94°C hasta 4°C.
Técnicas de biología molecular
Las técnicas de restricción, ligación, purificación de ADN plasmídico, PCR y transformación
de bacterias competentes son de uso corriente en el laboratorio. Se realizaron según se indica en
Sambrook et al 92
y según las indicaciones de los fabricantes de los diferentes kits y/o insumos
utilizados para cada caso.
Condiciones de cultivo bacteriano
Las cepas de Escherichia coli fueron cultivadas a 37ºC en agitador rotatorio (200 - 250 rpm) o
en placas de Petri con agar 1,5% en medio Luria-Bertani (LB)92
. Según la cepa, y las resistencias de la
misma y los plásmidos que contenga, el medio se suplementó con los siguientes antibióticos:
cloranfenicol 34 μg/ml y/o Ampicilina 100 μg/ml.
Acoplamiento de péptidos a proteínas carrier
Para el acoplamiento de los péptidos se utilizó la proteína BSA activada por maleimida
(Thermo Scientific). Se diluyeron 5 mg de la proteína comercial con 500 μl de agua, los cuales se
fraccionaron inmediatamente en 5 tubos (1 mg cada uno), a los cuales se agregó 1 mg de péptido
sintético liofilizado previamente resuspendido en buffer de conjugación (PBS 0,1M pH:7,2), siguiendo
con el protocolo que provee el fabricante.
ELISA
Se adsorbió el antígeno (0,2μg por pocillo) en placas de 96 pocillos en buffer bicarbonato
0,05M pH 9,6, 100μl por pocillo, a 4°C durante 16 horas. Se lavó con buffer PBS tween 0,05%
(solución de lavado) y a continuación se bloqueó con buffer PBS Tween 0,05% leche 4% (solución de
bloqueo), 200μl por pocillo, por una hora a 37°C. Luego se incubó con el anticuerpo primario (suero)
en solución de bloqueo (1:1000), 100μl por pocillo, una hora a 37 ºC. Pasado el tiempo de incubación,
se lavó con solución de lavado y se incubó una hora con el anticuerpo secundario (anti-IgG humana
conjugada a peroxidasa; 1:5000), 100μl por pocillo, también a 37 °C. Finalmente se lavó el anticuerpo
secundario con buffer de lavado y se procedió con el revelado (Buffer citrato 0,1M pH: 4,2 10ml; H2O2
(30 vol) 120ml; 1mg TMB en 333μl DMSO; por placa, 100μl por pocillo) y finalización de la reacción
(H2SO4 2M, 50μl por pocillo) para luego hacer la lectura de absorbancia a 450nm. En todos los casos
los sueros se analizaron por triplicado (excepto indicación contraria indicada en resultados).
ELISA de desplazamiento
El protocolo utilizado fue adaptado de Srinivasan, P. et al93. Estos ensayos consisten en
utilizar péptidos no acoplados de secuencia idéntica que el motivo que se encuentra en la proteína de
fusión utilizada en el ensayo. Se realiza una preincubación de media hora a temperatura ambiente con
el péptido y el suero (lo cual se utilizará como anticuerpo primario) en 10μl de volumen final en PBS.
Antes de su incubación en placa de ELISA, se lleva a volumen la mezcla de suero-péptido con solución
Repeticiones Temperatura Tiempo
1 94°C 5´
91 94°C – N 1´
1 4°C 5´
63
de bloqueo para obtener una dilución 1/1000 del suero. Para todos los casos se utilizaron 0,2µg de
proteína recombinante en placa (de igual manera que en los ensayos de ELISA) y 4 cantidades de
péptido para el desplazamiento (0, 0,1 ,1 y 10 µg). Además se incluyeron controles de desplazamiento
de TSSA con la misma estrategia, y controles desplazando la señal de un motivo con el péptido de otro
(control con péptido no relacionado) ambos utilizando las mismas cantidades de péptido antedichas.
Todos los ensayos de desplazamiento se realizaron por triplicado (excepto indicación contraria
indicada en resultados).
Expresión y purificación de proteínas recombinantes
Para la expresión de proteínas recombinantes se cultivaron células BL21-CodonPlus (DE3)-RP
previamente transformadas con el plásmido pGEXMP con la construcción deseada por 16 horas a 37°C
agitado a 200rpm en medio LB con cloranfenicol y ampicilina como se indica anteriormente. La cepa
usada posee genes extra que codifican para los ARN de transferencia menos representados en el
genoma bacteriano, permitiendo mayores niveles de expresión de proteínas codificadas por genes
heterólogos. Luego se diluyó el cultivo 1:200 en 50ml de LB ampicilina y se dejo crecer 3 horas en
iguales condiciones (O.D600nm ~ 0,6). Se indujo la expresión de proteína recombinante mediante la
adición de 1mM de IPTG, 16 horas a 18°C. La purificación se realizó a partir de la fracción soluble
obtenida, por cromatografía de afinidad hacia el dominio GST de fusión, utilizando resina de
Glutatión-Sefarosa, siguiendo las indicaciones del fabricante (Glutathione Sepharose 4 Fast Flow, GE
Healthcare). Se verificó la pureza e integridad de las proteínas obtenidas en geles de poliacrilamida
teñidos con Coomassie Blue. La cuantificación se realizó por el método de Bradford contra una curva
de concentración estándar de BSA.
Detección colorimétrica
La detección colorimétrica en los ensayos ELISA y Bradford se realizaron con el sistema
FilterMax F5 Multimode Microplate Reader (Molecular Devices).
Análisis estadístico
El análisis Mann-Whitney es un análisis de datos no apareados no paramétrico, elegido en este
trabajo para evitar que datos extremos condicionen el análisis. El mismos se realizaron con GraphPad
Prism, configuración: valor P unilateral; nivel de confianza: 95%. El análisis de correlación de Pearson
también fue realizado con GraphPad Prism, configuración: valor P bilateral; nivel de confianza: 95%.
Paneles de sueros usados
El panel de sueros de pacientes Chagásicos crónicos fue provisto por el Instituto Nacional de
Parasitología ―Dr. Mario Fatala Chabén‖ (con resultados positivos para las técnicas IFI, HAI y ELISA
comerciales) y el Hospital de Niños ―Dr. Ricardo Gutierrez‖ (con resultados positivos para las técnicas
ELISA y HAI comerciales) siendo crónicos asintomáticos. Los sueros negativos se obtuvieron de la
Fundación Hemocentro Buenos Aires y fueron provistos por Jorgelina Blejer.
64
65
INFORMACIÓN SUPLEMENTARIA
Péptidos
Cambios con
respecto a
péptidos
antigénicos
Motivo Péptidos
Cambios con
respecto a
péptidos
antigénicos
Motivo
KNTAAAGG 1 I KNTTTTTS 1 I
KTTTTTTT 1 I CATAAATG 1 I
NATTAATG 1 I KTTTPTTP 2 I
ATTNATTG 2 I KTATANTE 2 I
KNDNATTG 2 I KNTTNTTT 2 I
TTTTTTTT 2 I NTTTTTTT 2 I
KATTVTTN 2 I MTTTTTTT 2 I
PATNATTG 2 I PTTTTTTS 2 I
KNDTATSG 2 I DTTTTTTT 2 I
MNTTATTI 2 I TTTTTTTS 2 I
KGAAATTG 2 I PTTTTTTT 2 I
KATTATEA 2 I PNDTATTG 2 I
STTAATTN 2 I KATAVTTN 2 I
GGTTAATG 2 I KATAAKTA 2 I
KTTAAKTA 2 I FNPAAATG 2 I
PTTTTTNG 2 I KATAAKTP 2 I
FNPAAATG 2 I AETTATTV 3 I
KTFTAVIG 3 I GSTTATTT 3 I
KLTTPTFG 3 I STPTATQG 3 I
STTTASTI 3 I KGTTATLS 3 I
TTTTWITG 3 I ATTTITTN 3 I
STGTGTTG 3 I KPTTANTT 3 I
KTVTKYTG 3 I VTTTATAP 3 I
KETTSTTP 3 I ETLTAPTG 3 I
TTPTASTG 3 I PTTNAKTG 3 I
ATTTAPTN 3 I NTTNATTN 3 I
ATTTAQTN 3 I STPTATRG 3 I
PTTTITTK 3 I PETAATTQ 3 I
TQAAATTG 3 I KNPPATTR 3 I
KKAAATTE 3 I KNQSATGG 3 I
ANNSATTG 3 I ANTDATDG 3 I
SSGAATTG 3 I GNLAATTT 3 I
KTVTAQTK 4 I
QQQSGEAQVQ 1 II QQQQKDEIQDQ 3 II
QSQDHETPVQ 4 II QQQKDEIKDQ 4 II
QQQNRETTVT 4 II PQASDETQSG 4 II
66
QQQSYEKHIQ 4 II QQMVAETQRQ 4 II
VLQSDEAKNQ 4 II QQQSIMTQEG 4 II
DPTADGAGK 2 III DPAAEGAGK 2 III
DSPADGAGT 2 III DLAADGAVT 2 III
DSTADAAGT 2 III VPAADVAGG 2 III
DPTTDGAGT 2 III NPAADVAGL 2 III
DSTADAAGT 2 III APAAAAAPT 3 III
GIAADGAGG 3 III KAAAEAAET 3 III
AAAADGAGN 3 III DEAAKAAAT 3 III
FPATEGAGT 3 III DPHKDAAEK 3 III
DSAAGGAAT 3 III APAAAAAPT 3 III
GVAADGAGV 3 III KAAAEAAET 3 III
RPAGDGAVT 3 III DEAAKAAAT 3 III
DKAATGAGI 3 III DPHKDAAEK 3 III
APAAAPAEG 4 III VPAALAATA 4 III
VDSHEQDGEDATSE 1 IV VDSRKQDGEETTS 1+1inserción IV
VDSHEQSGEDTTSE 2 IV VDSRKQDGEETTSE 2 IV
VASRIGCGEATLE 4 IV VAGGRCDGEDTVL 5 IV
Tabla 1S. Datos de péptidos similares a los motivos que no poseen antigenicidad.
Proteína Motivo Proteína Motivo Proteína Motivo
TcCLB.424499.10 I TcCLB.508327.10 I TcCLB.510483.20 I
TcCLB.503533.40 I TcCLB.508427.20 I TcCLB.510489.20 I
TcCLB.503585.115 I TcCLB.508427.40 I TcCLB.510489.5 I
TcCLB.503645.10 I TcCLB.508433.30 I TcCLB.510539.10 I
TcCLB.503645.40 I TcCLB.508433.90 I TcCLB.510583.130 I
TcCLB.503849.40 I TcCLB.508539.110 I TcCLB.510693.130 I
TcCLB.503947.20 I TcCLB.508539.160 I TcCLB.510693.280 I
TcCLB.503973.150 I TcCLB.508539.60 I TcCLB.510697.130 I
TcCLB.504239.350 I TcCLB.508539.80 I TcCLB.510697.40 I
TcCLB.504249.111 I TcCLB.508541.110 I TcCLB.510697.60 I
TcCLB.506067.140 I TcCLB.508541.130 I TcCLB.510699.80 I
TcCLB.506067.290 I TcCLB.508541.20 I TcCLB.510701.10 I
TcCLB.506187.50 I TcCLB.509753.194 I TcCLB.510705.10 I
TcCLB.506245.200 I TcCLB.510205.50 I TcCLB.510713.110 I
TcCLB.506245.270 I TcCLB.510205.80 I TcCLB.510713.130 I
TcCLB.506267.90 I TcCLB.510213.70 I TcCLB.510713.170 I
TcCLB.506281.134 I TcCLB.510369.10 I TcCLB.510715.40 I
TcCLB.506309.140 I TcCLB.510371.120 I TcCLB.510833.20 I
TcCLB.506361.50 I TcCLB.510371.70 I TcCLB.511081.10 I
TcCLB.506501.380 I TcCLB.510377.390 I TcCLB.511081.60 I
TcCLB.506877.60 I TcCLB.506599.100 I TcCLB.511089.130 I
67
TcCLB.506955.150 I TcCLB.506599.210 I TcCLB.511089.140 I
TcCLB.506955.212 I TcCLB.506599.420 I TcCLB.511089.19 I
TcCLB.506955.244 I TcCLB.506703.110 I TcCLB.511089.30 I
TcCLB.506955.70 I TcCLB.506703.20 I TcCLB.511173.100 I
TcCLB.507069.10 I TcCLB.506741.120 I TcCLB.511173.360 I
TcCLB.507069.150 I TcCLB.506741.140 I TcCLB.511173.400 I
TcCLB.507071.100 I TcCLB.506741.60 I TcCLB.511173.64 I
TcCLB.507071.140 I TcCLB.506763.30 I TcCLB.511255.330 I
TcCLB.507071.20 I TcCLB.506769.120 I TcCLB.511255.50 I
TcCLB.507523.80 I TcCLB.506877.20 I TcCLB.511449.10 I
TcCLB.507833.10 I TcCLB.508013.110 I TcCLB.508305.20 I
TcCLB.507957.320 I TcCLB.508125.140 I TcCLB.508305.50 I
TcCLB.507957.334 I TcCLB.508221.970 I TcCLB.508309.10 I
TcCLB.506789.50 II TcCLB.510621.60 II TcCLB.507859.60 II
TcCLB.506789.11 II TcCLB.511787.10 II TcCLB.510715.64 II
TcCLB.508261.50 II TcCLB.511793.30 II TcCLB.506001.14 II
TcCLB.506785.14 II TcCLB.509195.30 II TcCLB.508221.150 II
TcCLB.506783.39 II TcCLB.511797.167 II TcCLB.508221.104 II
TcCLB.506781.39 II TcCLB.506971.60 II TcCLB.510361.260 II
TcCLB.510625.19 II TcCLB.506973.30 II TcCLB.506423.10 II
TcCLB.510625.54 II TcCLB.510627.150 II TcCLB.508289.9 II
TcCLB.510625.88 II TcCLB.510627.190 II TcCLB.508293.140 II
TcCLB.510625.150 II TcCLB.510629.150 II TcCLB.510463.90 II
TcCLB.510625.190 II TcCLB.510629.310 II TcCLB.510463.120 II
TcCLB.510627.80 II TcCLB.508389.50 II TcCLB.510465.74 II
TcCLB.510627.110 II TcCLB.508389.130 II TcCLB.511373.30 II
TcCLB.510627.128 II TcCLB.508389.154 II
TcCLB.509753.194 III TcCLB.506703.140 III TcCLB.511175.10 III
TcCLB.506267.90 III TcCLB.506741.60 III TcCLB.507937.50 III
TcCLB.506965.70 III TcCLB.506741.120 III TcCLB.511255.330 III
TcCLB.506281.134 III TcCLB.506741.140 III TcCLB.508221.960 III
TcCLB.503947.20 III TcCLB.508309.10 III TcCLB.508221.490 III
TcCLB.504249.111 III TcCLB.508759.60 III TcCLB.508221.170 III
TcCLB.506955.244 III TcCLB.510463.200 III TcCLB.504039.160 III
TcCLB.506955.212 III TcCLB.510583.130 III TcCLB.510371.120 III
TcCLB.506955.99 III TcCLB.511057.30 III TcCLB.424499.10 III
TcCLB.506955.70 III TcCLB.511077.60 III TcCLB.503533.40 III
TcCLB.503849.40 III TcCLB.511081.60 III TcCLB.503827.20 III
TcCLB.504493.10 III TcCLB.511173.270 III TcCLB.506309.70 III
TcCLB.503645.40 III TcCLB.508427.20 III TcCLB.508013.110 III
TcCLB.510713.110 III TcCLB.508427.40 III TcCLB.511089.19 III
TcCLB.510713.170 III TcCLB.510693.130 III TcCLB.511089.30 III
68
TcCLB.508305.50 III TcCLB.507069.220 III TcCLB.511089.140 III
TcCLB.510483.20 III TcCLB.507071.100 III TcCLB.506067.140 III
TcCLB.508539.110 III TcCLB.507071.120 III TcCLB.506131.84 III
TcCLB.508539.160 III TcCLB.507071.140 III TcCLB.506187.50 III
TcCLB.508541.110 III TcCLB.508433.30 III TcCLB.506245.270 III
TcCLB.508541.130 III TcCLB.508433.90 III TcCLB.506703.20 III
TcCLB.510205.50 III TcCLB.508433.220 III TcCLB.506703.110 III
TcCLB.511171.90 III TcCLB.511173.64 III
TcCLB.509755.40 IV TcCLB.506409.30 IV TcCLB.504261.40 IV
TcCLB.504155.293 IV TcCLB.509699.110 IV TcCLB.506769.80 IV
TcCLB.506667.80 IV TcCLB.509545.50 IV TcCLB.510377.200 IV
TcCLB.509525.240 IV TcCLB.506667.40 IV TcCLB.510371.50 IV
TcCLB.508365.160 IV
TcCLB.506799.130 V
TcCLB.505297.60 VI TcCLB.506951.60 VI TcCLB.468217.14 VI
TcCLB.509925.10 VI
TcCLB.503761.40 VII
Tabla 2S. Proteínas que poseen los motivos estrictos.
Proteína Motivo Proteína Motivo Proteína Motivo
TcCLB.424499.10 I TcCLB.510701.10 I TcCLB.508305.50 I
TcCLB.432443.10 I TcCLB.510705.10 I TcCLB.508309.10 I
TcCLB.503533.40 I TcCLB.510713.110 I TcCLB.508327.10 I
TcCLB.503585.10 I TcCLB.510713.130 I TcCLB.508427.20 I
TcCLB.503585.115 I TcCLB.510713.170 I TcCLB.508427.40 I
TcCLB.503645.10 I TcCLB.510715.40 I TcCLB.508433.30 I
TcCLB.503645.40 I TcCLB.510833.20 I TcCLB.508433.90 I
TcCLB.503827.20 I TcCLB.511057.30 I TcCLB.508539.110 I
TcCLB.503849.40 I TcCLB.511079.60 I TcCLB.508539.160 I
TcCLB.503947.20 I TcCLB.511081.10 I TcCLB.508539.60 I
TcCLB.503973.150 I TcCLB.511081.60 I TcCLB.508539.80 I
TcCLB.504239.350 I TcCLB.511089.130 I TcCLB.508541.110 I
TcCLB.504249.111 I TcCLB.511089.140 I TcCLB.508541.130 I
TcCLB.506067.140 I TcCLB.511089.19 I TcCLB.508541.20 I
TcCLB.506067.169 I TcCLB.511089.30 I TcCLB.508747.5 I
TcCLB.506067.290 I TcCLB.511173.100 I TcCLB.509753.194 I
TcCLB.506131.110 I TcCLB.511173.360 I TcCLB.510205.50 I
TcCLB.506187.50 I TcCLB.511173.400 I TcCLB.510205.80 I
TcCLB.506245.200 I TcCLB.511173.430 I TcCLB.510213.70 I
TcCLB.506245.270 I TcCLB.511173.64 I TcCLB.510369.10 I
69
TcCLB.506267.90 I TcCLB.511255.330 I TcCLB.510371.120 I
TcCLB.506281.134 I TcCLB.511255.50 I TcCLB.510371.70 I
TcCLB.506309.140 I TcCLB.511449.10 I TcCLB.510377.390 I
TcCLB.506361.50 I TcCLB.506877.60 I TcCLB.510483.20 I
TcCLB.506501.380 I TcCLB.506955.150 I TcCLB.510489.20 I
TcCLB.506599.100 I TcCLB.506955.212 I TcCLB.510489.5 I
TcCLB.506599.210 I TcCLB.506955.244 I TcCLB.510539.10 I
TcCLB.506599.420 I TcCLB.506955.70 I TcCLB.510583.130 I
TcCLB.506703.110 I TcCLB.507069.10 I TcCLB.510693.130 I
TcCLB.506703.20 I TcCLB.507069.150 I TcCLB.510693.280 I
TcCLB.506741.120 I TcCLB.507071.100 I TcCLB.510697.130 I
TcCLB.506741.140 I TcCLB.507833.10 I TcCLB.510697.40 I
TcCLB.506741.60 I TcCLB.507957.320 I TcCLB.510697.60 I
TcCLB.506759.20 I TcCLB.507957.334 I TcCLB.510699.80 I
TcCLB.506763.30 I TcCLB.508013.110 I TcCLB.508221.970 I
TcCLB.506769.120 I TcCLB.508081.70 I TcCLB.508305.20 I
TcCLB.506877.20 I TcCLB.508125.140 I TcCLB.508221.490 I
TcCLB.507071.140 I TcCLB.508221.170 I TcCLB.507523.80 I
TcCLB.507071.20 I
TcCLB.506789.50 II TcCLB.510621.60 II TcCLB.506423.10 II
TcCLB.506789.11 II TcCLB.511787.10 II TcCLB.508289.9 II
TcCLB.508261.130 II TcCLB.511793.30 II TcCLB.508293.80 II
TcCLB.508261.50 II TcCLB.509195.30 II TcCLB.508293.140 II
TcCLB.510387.40 II TcCLB.511797.167 II TcCLB.510463.90 II
TcCLB.506785.14 II TcCLB.506971.60 II TcCLB.510463.120 II
TcCLB.506783.39 II TcCLB.506973.30 II TcCLB.510463.150 II
TcCLB.506781.39 II TcCLB.507859.60 II TcCLB.510465.74 II
TcCLB.510625.19 II TcCLB.511259.180 II TcCLB.510469.10 II
TcCLB.510625.54 II TcCLB.510715.64 II TcCLB.511373.30 II
TcCLB.510625.88 II TcCLB.506001.14 II TcCLB.510361.260 II
TcCLB.510625.150 II TcCLB.508221.150 II TcCLB.511089.10 II
TcCLB.510625.190 II TcCLB.508221.104 II TcCLB.510629.150 II
TcCLB.510627.80 II TcCLB.508389.130 II TcCLB.510629.310 II
TcCLB.510627.110 II TcCLB.508389.154 II TcCLB.510629.350 II
TcCLB.510627.128 II TcCLB.510627.190 II TcCLB.508389.50 II
TcCLB.510627.150 II TcCLB.510629.30 II
TcCLB.424499.10 III TcCLB.508221.170 III TcCLB.510713.130 III
TcCLB.432443.10 III TcCLB.508221.490 III TcCLB.510713.170 III
TcCLB.503533.40 III TcCLB.508221.960 III TcCLB.510715.40 III
TcCLB.503645.10 III TcCLB.508305.50 III TcCLB.510833.20 III
TcCLB.503645.40 III TcCLB.508309.10 III TcCLB.510917.9 III
TcCLB.503827.20 III TcCLB.508427.20 III TcCLB.511057.30 III
70
TcCLB.503827.5 III TcCLB.508427.40 III TcCLB.511077.60 III
TcCLB.503849.40 III TcCLB.508433.220 III TcCLB.511081.10 III
TcCLB.503947.20 III TcCLB.508433.30 III TcCLB.511081.60 III
TcCLB.504039.160 III TcCLB.508433.90 III TcCLB.511089.140 III
TcCLB.504239.350 III TcCLB.508539.110 III TcCLB.511089.19 III
TcCLB.504249.111 III TcCLB.508539.160 III TcCLB.511089.30 III
TcCLB.504493.10 III TcCLB.508539.80 III TcCLB.511171.90 III
TcCLB.506067.140 III TcCLB.508541.110 III TcCLB.511173.270 III
TcCLB.506067.169 III TcCLB.508541.130 III TcCLB.511173.360 III
TcCLB.506067.290 III TcCLB.508541.20 III TcCLB.511173.400 III
TcCLB.506067.70 III TcCLB.508759.60 III TcCLB.511173.64 III
TcCLB.506131.84 III TcCLB.509753.194 III TcCLB.511175.10 III
TcCLB.506187.50 III TcCLB.510205.50 III TcCLB.511255.330 III
TcCLB.506245.270 III TcCLB.510363.320 III TcCLB.511255.690 III
TcCLB.506267.90 III TcCLB.510369.10 III TcCLB.511449.10 III
TcCLB.506281.134 III TcCLB.510371.120 III TcCLB.506965.70 III
TcCLB.506309.70 III TcCLB.510371.70 III TcCLB.507065.60 III
TcCLB.506501.380 III TcCLB.510377.390 III TcCLB.507069.220 III
TcCLB.506599.100 III TcCLB.510463.200 III TcCLB.507071.100 III
TcCLB.506599.210 III TcCLB.510483.20 III TcCLB.507071.120 III
TcCLB.506703.110 III TcCLB.510539.10 III TcCLB.507071.140 III
TcCLB.506703.140 III TcCLB.510583.130 III TcCLB.507833.10 III
TcCLB.506703.20 III TcCLB.510693.130 III TcCLB.507937.50 III
TcCLB.506741.120 III TcCLB.510697.60 III TcCLB.507957.320 III
TcCLB.506741.140 III TcCLB.510705.10 III TcCLB.507957.334 III
TcCLB.506741.60 III TcCLB.510713.110 III TcCLB.508013.110 III
TcCLB.506759.20 III TcCLB.506955.244 III TcCLB.508125.140 III
TcCLB.506759.80 III TcCLB.506955.70 III TcCLB.506955.150 III
TcCLB.506763.30 III TcCLB.506955.99 III TcCLB.506955.212 III
TcCLB.506769.120 III
TcCLB.509755.40 IV TcCLB.507747.170 IV TcCLB.507957.160 IV
TcCLB.507163.40 IV TcCLB.504261.40 IV TcCLB.510013.230 IV
TcCLB.508245.40 IV TcCLB.510483.220 IV TcCLB.506769.80 IV
TcCLB.504155.293 IV TcCLB.504081.40 IV TcCLB.506767.110 IV
TcCLB.509545.50 IV TcCLB.508221.894 IV TcCLB.510377.450 IV
TcCLB.511603.190 IV TcCLB.510021.20 IV TcCLB.510377.200 IV
TcCLB.511603.320 IV TcCLB.504031.30 IV TcCLB.510375.10 IV
TcCLB.507237.20 IV TcCLB.509525.240 IV TcCLB.510371.50 IV
TcCLB.507237.80 IV TcCLB.508365.160 IV TcCLB.504239.290 IV
TcCLB.507237.270 IV TcCLB.506409.30 IV TcCLB.508227.20 IV
TcCLB.511839.30 IV TcCLB.509699.110 IV TcCLB.506667.80 IV
TcCLB.506667.40 IV
71
TcCLB.506799.130 V TcCLB.506801.40 V TcCLB.457979.10 V
TcCLB.511625.90 VI TcCLB.506951.60 VI TcCLB.448197.10 VI
TcCLB.505297.60 VI TcCLB.508735.30 VI TcCLB.468217.14 VI
TcCLB.509925.10 VI
TcCLB.503761.40 VII
Tabla 3S. Proteínas que poseen secuencias similares a los motivos.
Péptido Grupo Referencia Detalle
K.SAASITANQHNEPPAGHAESRPLSPTANGDAANN[
+203.07937]ESEKSTEEGIPNNDSPADGAGTREEK.Q III Alves et al 49
Péptido similar al motivo III, entre corchetes luego de un a.a se
encuentra la masa de la glicosilación dada en antedicho a.a.
K.SNN[+203.07937]NSQTEGIAPIAANSQNEPSDGHAE
TKPPSPTENGNFASNEADKSTEDSTPKNDPAADGTG
TR.E
III Alves et al 49 Péptido similar al motivo III, entre corchetes luego de un a.a se
encuentra la masa de la glicosilación dada en antedicho a.a.
K.SNNNSQTEGIAPIAANS[+203.07937]QNEPSDGHAE
TKPPSPTENGNFASNEADKSTEDSTPKNDPAADGTG
TR.E
III Alves et al 49 Péptido similar al motivo III, entre corchetes luego de un a.a se
encuentra la masa de la glicosilación dada en antedicho a.a.
K.SNNNSQTEGIAPIAANSQNEPSDGHAETKPPSPTE
NGNFASNEADKST[+203.07937]EDSTPKNDPAADGT
GTR.E
III Alves et al 49 Péptido similar al motivo III, entre corchetes luego de un a.a se
encuentra la masa de la glicosilación dada en antedicho a.a.
K.SAASITANQHNEPPAGHAES[+203.07937]RPLSPTA
NGDAANNESEKSTEEGIPNNDSPADGAGTREEK.Q III Alves et al 49 Péptido similar al motivo III, entre corchetes luego de un a.a se
encuentra la masa de la glicosilación dada en antedicho a.a.
K.SAASITANQHNEPPAGHAESRPLSPT[+203.07937]A
NGDAANNESEKSTEEGIPNNDSPADGAGTREEK.Q III Alves et al 49 Péptido similar al motivo III, entre corchetes luego de un a.a se
encuentra la masa de la glicosilación dada en antedicho a.a.
GTQTPDDDDPAADGAGTR III Nakayasu et al, 85 Péptido del motivo III, encontrado sin modificaciones.
STQITDDDDPAADAAGTR III Nakayasu et al, 85 Péptido del motivo III, encontrado sin modificaciones.
R.EAQQEVLQSDEAKN[+1216.42286]QSR.Q II Alves et al 49
Péptido similar al motivo II, entre corchetes luego de un a.a se
encuentra la masa de la glicosilación dada en antedicho a.a. (en
el motivo II el aminoácido glicosilado no se encuentra). De
interés es que la serina no se encontró glicosilada.
Tabla 4S. Péptidos de los motivos encontrados mediante espectrometría de masa por otros grupos.
Péptido antigénico predicho
Máxima
antigenicidad vista
en microarreglo
Péptido analizado en el
microarreglo con mayor identidad
de secuencia con respecto al
péptido antigénico predicho
Máxima
antigenicidad vista en
microarreglo
RTAGQSGQGGTVAPD PIERQDGQGGTVAPG 0,01
MEDGETEEKEGKRTA KERSESEAKEGTFTS 0,43
SDNASSEEKPQSDKG SNEARAKELPSSDKD 0,14
PQATQPEGGEAPETV EQATQDLVMEGPENG 0,14
GRQAHGSEESGSGQS 0,01
SGTANATTEKEDKAD AGEAAVTKQKEGSGP 0,15
KNGEEAAPKGTASPA LEGSDAHPAPTASEA 0,11
NLDVDPPNPTTDQNK KNDSDDAQSTVDENN 1,03
GPGTGKGEKNSEELS GASNGPDKATEEEIS 0,34
QTSGGGPAGSEGQEP GAGRGTGLGSEQLQP 0,1
KGSVGKPGEVENTKN KINVLLPLEKKNETL 1,99
ERISERGQEEPISPS KRISEGGQEEPILSS 0,02
72
ETTPAASPGNTSDGN 0,15
SELPGTPPSPSLAPQ 0,11
RAEAPQAPSDTPPGN KGEARDAIPSPPAKN 1,04
PPAPKPEGEASETAS SPAPKSRGEALEKAG 0,49
GEGGTETTPATVTAA SEGTGEDTKATTVTA 0,32
KNGSDQSEGDAGPQA KPQSTQTTGDKDPAA 2,75
GGSDGNRDTTEDPTG GGSDGNRDTTEDPKG 0,33
PGLSKEPAPPATEAS PAPSKEPALPATEPS 0,23
LSETPASTGGGELAD 0,01
ATRGDSEKSPAITTR 0,2
PAAVTPKPGGSDTEE PEASPPKLKGLDTEG 1,5
VAGDEEQKDGNEADS GKQEELDKKGNEADD 1,89
VNVSAGVPDGGPGPD VNGENTVPAGVPGGN 0,2
ETSPTGSGSPEAAPG VTSPPGPGVSEANEG 0,01
SPAPKPGGEASDPTN SPAPLPTPKVSDQVE 0,23
NGANEEEETKKGEAV EDGTEEEETKKEEAG 0,62
GAAGGGQNGKPAQSQ GVGGGGPIGQQAASQ 0,37
KEEDDADATEVTSAG EEKVDDDALEGMPAG 2,33
ASPSPASQSEGGGAP ASGSPEVQASQSPAP 0,2
ETPASSVSKSGSGGT ETAVPSVSKIGSGGT 0,28
PPEPEVERDGDMDLA PPIDEADTQEPQDLG 0,4
SPQPEGGGTSETAST SQGTQSGGASETPST 0,14
SSENAVPSTHSKPSG SSREGQPPTAKTDSQ 0,17
QDLPEEVPPGKPEIL QDLPDEGPPGKPGIS 0,43
PAEGISSSNSQESNA PAGSISPSNSQESNA 0,01
SEETGEGTKATTVTA SEGTGEDTKATTVTA 0,32
ATPAPSDTTPDEESQ QTPGDSDGSPAAFHT 0,39
NNNQKGEKTEEKEDE ETIKKNEKTENGENE 0,31
SPGTEEKASPSPAKQ SSPTEPKNSQNPKKV 0,21
PTTPPKPEESGTKGQ QTTPPASEEEGTPPS 0,48
SEESSVSTKSTNDST 0,11
SKAESATPKPTVASN 0,57
RPLSDLPEKPTKVSP EPRIKKVSLPTEPSP 4,63
TNPTQPEDEGNKDTD ANPTQPEVEGTNTEE 0,2
AEHSSSPSPSKGTHE SSQESSPIAQGGSHK 0,1
DTKKENSGGGDSSLA SGSSENSIPGDSGLA 0,15
EAPAPPGSESQELSP ETTPPPLTSSDEESP 0,16
GPSQATQPGGGEASQ MESKATQPPSGDATQ 0,11
ESPAEATPAPQSGGG SPPVPAAPAPGPSGG 0,7
DSANTTTDSKDPNTQ DPANTTKDNKDQNKK 0,4
GEASDPASKTTDNND GEASDPANTTKDNKD 0,31
EASDPASKTTDNNDQ EASDPANTTKDNKDQ 0,33
73
NSEKSPVSTKSTNDS KSEESSVSTKSTNDS 0,07
TSSMTTSDDGESNTV TSSITPPDESGSNTV 0,15
GGDEDSESASGQTAS GTSEPSPPESSLPAA 0,85
TIEKNKKTENGGNGE TIKKNEKTENGENEE 0,31
AVETTETSAPGPDTS TQEEAETSVAGKDTT 0,15
SSIDESKVNQSPEKS ESDKESCLNHSQHKS 0,02
STRPTNGSREGDTDT TTRPTKDSTEGNTDT 0,5
KENPNTVEDEKTSET KENPNTVEVDKTRNN 0,14
TTPEPPTAPPSQERP 0,22
KEGKESAEDSGSESP 0,43
GGRAETPSSPSLETQ 0,11
APKEPTPKASELPEK 0,61
GGRAEPTQVPPGTKS GGRSEKPQVPPASSS 0,01
SDKNSKGAAGGGGRS NDNNSTGGAGGGRQS 0,14
DNTSDGNTQNEEGTV GNTSDGNTQNDSTGV 0,14
TTDNEDQNKEDKKNE EAAQEDGNKDDNKKE 0,45
QGGGAPGSGGNDVGV NGTGAPDSGGGSVSV 0,08
GREGNENKDVDSGIK GQKGIENKNVDPGRN 0,2
TDSQDKTNDQLSSSS TDSQDQNNDHLSSSS 0,03
PKPPLESVPGAVPDA PKPSVKPIPGEVPDG 1,39
DSETSNKGHEDEKER DSETSNKGHEEEKER 0,14
EGAGAEDEEEKPIGK DGEGDKEEKEGDEGG 0,65
TSPGSPGTPSGNNTP GSPGSSGTPPVNDND 0,26
GESGTPNAGMDNKGR GGKENPNTGKGDKKK 0,88
PSGPGLRAAGPDHVP ERGKAQGAALPGASP 0,21
VQSGTGSDQSEAGDS AQSGTGSDQSNADGS 0,14
GGDSGTKELKNSVGG 0,05
GSDQSNADGSSGGQG 0,06
NAISTQPEVEEKNET NANPSQPEVDEKKET 0,43
VPPASSTPTEEEDDV LSPASSTPTEEEDDD 1,12
LEPPPEKLDKAPGNG IPSPPAKNEKTEGGL 0,52
AQTPEQSETSNTNGN EQKEMQTSTSPTQVN 0,21
GGKETDKENQSQREG GGKETVKEHQSQGEE 0,1
NNLSKNNDSAKNQQT KNLSKNDDSAKNQQT 0,21
PSDTAAAPGVNSSAG GPSAASAPGVDSSAG 0,01
QEGRQTPQSQVNVPQ AEGPQPESAGRNTGQ 0,14
GAVETTDNSTSAPDS NAAPDSKESTKAPDS 0,44
QNGEKKAPKETSSPT DKAERPSPKETSNHT 0,31
TTDNTDQNTEDKKKE TKDNKDQNKKDKKEE 1,01
TTEEEETPKLTSSQE KTKEEETPKLTSPQV 0,43
KTPSEEQPSSTAPQA KKPSEEQPSSTAPQA 0,14
QPPPQSQLPAEEAPP PQPPQPPPPAESLQP 0,43
74
AAPIADGSSGGQEQT APPDGRGSEGGARQA 0,26
DNPPATDSSQKSSGD ENPPATDSSRTSSED 0,2
ATKTNDTAKPAESES ANKTNDTAKTAESDS 0,2
VGEDDQTGKPRVSET PGTGRQEGKSTVVNT 0,35
TMEQNKKKTNENDEE TIEKNKKMENGENEK 0,2
GDSTPAETNGHSKPE EDSTAAGTRNHSPPG 0,36
SSGVPDQPQDKSESS SSVVPSLPADSENSK 38,99
PAPPDSSGIPSENNT PGSPGSSGTPPVNDN 0,21
TTTSEPQKAPARPSP AKAPEPQKASARPSP 1,01
PAAASDETQPGGGTG PAAAAAPTLPTGGQD 0,14
SSRNGGETGRTGSTS SSSIGGETGPTISTS 0,32
SRDTAKDGESDGSTA ANDTTKPGDSDGSTA 0,31
GDGKPPAVDGSGSGG 0,32
RQVKVEEEDRDHSEE 2,6
Tabla 5S. Reactividad obtenida en el microarreglo por los péptidos priorizados por Dos Santos et al45, o aquellos de mayor
similitud presentes en el mismo.
75
BIBLIOGRAFÍA 1. Zingales, B. et al. A new consensus for Trypanosoma cruzi intraspecific nomenclature:
second revision meeting recommends TcI to TcVI. Mem. Inst. Oswaldo Cruz 104,
1051–4 (2009).
2. El-Sayed, N. M. et al. Comparative Genomics of Trypanosomatid Parasitic Protozoa.
Science (80-. ). 309, 404–409 (2005).
3. Rassi, A., Rassi, A. & Marin-Neto, J. A. Chagas disease. The Lancet 375, 1388–1402
(2010).
4. Teixeira, A. R. L., Nascimento, R. J. & Sturm, N. R. Evolution and pathology in chagas
disease--a review. Mem. Inst. Oswaldo Cruz 101, 463–91 (2006).
5. Eisenstein, M. Disease: Poverty and pathogens. Nature 531, S61-3 (2016).
6. Requena-Méndez, A. et al. Prevalence of Chagas disease in Latin-American migrants
living in Europe: a systematic review and meta-analysis. PLoS Negl. Trop. Dis. 9,
e0003540 (2015).
7. Schmunis, G. A. & Yadon, Z. E. Chagas disease: A Latin American health problem
becoming a world health problem. Acta Trop. 115, 14–21 (2010).
8. Carlier, Y. & Truyens, C. Congenital Chagas disease as an ecological model of
interactions between Trypanosoma cruzi parasites, pregnant women, placenta and
fetuses. Acta Trop. 151, 103–15 (2015).
9. Balouz, V., Agüero, F. & Buscaglia, C. A. Chagas Disease Diagnostic Applications:
Present Knowledge and Future Steps. Adv. Parasitol. (2016).
doi:10.1016/bs.apar.2016.10.001
10. Bern, C. et al. Evaluation and Treatment of Chagas Disease in the United States. JAMA
298, 2171 (2007).
11. Morillo, C. A. et al. Randomized Trial of Benznidazole for Chronic Chagas‘
Cardiomyopathy. N. Engl. J. Med. 373, 1295–1306 (2015).
12. Maguire, J. H. Treatment of Chagas‘ Disease — Time Is Running Out. N. Engl. J. Med.
373, 1369–1370 (2015).
13. Sánchez-Valdéz, F. J. et al. A Monoallelic Deletion of the TcCRT Gene Increases the
Attenuation of a Cultured Trypanosoma cruzi Strain, Protecting against an In Vivo
Virulent Challenge. PLoS Negl. Trop. Dis. 8, (2014).
14. Vázquez-Chagoyán, J. C., Gupta, S. & Garg, N. J. Vaccine Development Against
Trypanosoma cruzi and Chagas Disease. Adv. Parasitol. 75, 121–146 (2011).
15. Tyler, K. M. & Engman, D. M. The life cycle of Trypanosoma cruzi revisited. Int. J.
Parasitol. 31, 472–81 (2001).
16. Tanowitz, H. B. et al. Chagas‘ disease. Clin. Microbiol. Rev. 5, 400–19 (1992).
17. Freilij, H. & Altcheh, J. Congenital Chagas‘ disease: diagnostic and clinical aspects.
Clin. Infect. Dis. 21, 551–5 (1995).
18. Gomes, Y. M., Lorena, V. M. B. & Luquetti, A. O. Diagnosis of Chagas disease: what
has been achieved? What remains to be done with regard to diagnosis and follow up
studies? Mem. Inst. Oswaldo Cruz 115–21 (2009).
19. Prata, A. Clinical and epidemiological aspects of Chagas disease. Lancet. Infect. Dis. 1,
92–100 (2001).
20. Tarleton, R. L. CD8+ T cells in Trypanosoma cruzi infection. Semin. Immunopathol.
76
37, 233–238 (2015).
21. BRENER, Z. Therapeutic activity and criterion of cure on mice experimentally infected
with Trypanosoma cruzi. Rev. Inst. Med. Trop. Sao Paulo 4, 389–96
22. Hoft, D. F. et al. Trypanosoma cruzi expresses diverse repetitive protein antigens.
Infect. Immun. 57, 1959–67 (1989).
23. Sturm, N. R., Degrave, W., Morel, C. & Simpson, L. Sensitive detection and
schizodeme classification of Trypanosoma cruzi cells by amplification of kinetoplast
minicircle DNA sequences: use in diagnosis of Chagas‘ disease. Mol. Biochem.
Parasitol. 33, 205–14 (1989).
24. Simpson, L. Kinetoplast DNA in trypanosomid flagellates. Int. Rev. Cytol. 99, 119–79
(1986).
25. Schijman, A. G. et al. International study to evaluate PCR methods for detection of
Trypanosoma cruzi DNA in blood samples from Chagas disease patients. PLoS Negl.
Trop. Dis. 5, e931 (2011).
26. Nagarkatti, R. et al. Development of an aptamer-based concentration method for the
detection of Trypanosoma cruzi in blood. PLoS One 7, e43533 (2012).
27. Nagarkatti, R., de Araujo, F. F., Gupta, C. & Debrabant, A. Aptamer Based, Non-PCR,
Non-Serological Detection of Chagas Disease Biomarkers in Trypanosoma cruzi
Infected Mice. PLoS Negl. Trop. Dis. 8, e2650 (2014).
28. Almeida, I. C., Covas, D. T., Soussumi, L. M. & Travassos, L. R. A highly sensitive
and specific chemiluminescent enzyme-linked immunosorbent assay for diagnosis of
active Trypanosoma cruzi infection. Transfusion 37, 850–7 (1997).
29. Umezawa, E. S., Shikanai-Yasuda, M. A. & Stolf, A. M. Changes in isotype
composition and antigen recognition of anti-Trypanosoma cruzi antibodies from acute
to chronic Chagas disease. J. Clin. Lab. Anal. 10, 407–13 (1996).
30. Burns, J. M. et al. Identification and synthesis of a major conserved antigenic epitope of
Trypanosoma cruzi. Proc. Natl. Acad. Sci. U. S. A. 89, 1239–43 (1992).
31. Cotrim, P. C. et al. Expression in Escherichia coli of a dominant immunogen of
Trypanosoma cruzi recognized by human chagasic sera. J. Clin. Microbiol. 28, 519–24
(1990).
32. Houghton, R. L. et al. A multi-epitope synthetic peptide and recombinant protein for the
detection of antibodies to Trypanosoma cruzi in radioimmunoprecipitation-confirmed
and consensus-positive sera. J. Infect. Dis. 179, 1226–34 (1999).
33. Affranchino, J. L. et al. Identification of a Trypanosoma cruzi antigen that is shed
during the acute phase of Chagas‘ disease. Mol. Biochem. Parasitol. 34, 221–8 (1989).
34. Ibañez, C. F. et al. Multiple Trypanosoma cruzi antigens containing tandemly repeated
amino acid sequence motifs. Mol. Biochem. Parasitol. 30, 27–33 (1988).
35. Lafaille, J. J. et al. Structure and expression of two Trypanosoma cruzi genes encoding
antigenic proteins bearing repetitive epitopes. Mol. Biochem. Parasitol. 35, 127–36
(1989).
36. Levin, M. J. et al. Identification of major Trypanosoma cruzi antigenic determinants in
chronic Chagas‘ heart disease. Am. J. Trop. Med. Hyg. 41, 530–8 (1989).
37. Balouz, V., Buscaglia, C. A. & Agüero, F. Chagas disease diagnostic applications:
present knowledge and future steps. (En prensa). Adv. Parasitol.
38. El-Sayed, N. M. et al. The Genome Sequence of Trypanosoma cruzi, Etiologic Agent of
Chagas Disease. Science (80-. ). 309, 409–415 (2005).
39. De Pablos, L. M. & Osuna, A. Conserved Regions as Markers of Different Patterns of
Expression and Distribution of the Mucin-Associated Surface Proteins of Trypanosoma
cruzi. Infect. Immun. 80, 169–174 (2012).
40. Abate, T., Rincón, M., Díaz-Bello, Z., Spencer, L. & Rodríguez-Acosta, A. A mucin
like gene different from the previously reported members of the mucin like gene
families is transcribed in Trypanosoma cruzi but not in Trypanosoma rangeli. Mem.
77
Inst. Oswaldo Cruz 100, 391–5 (2005).
41. Watanabe Costa, R., da Silveira, J. F. & Bahia, D. Interactions between Trypanosoma
cruzi Secreted Proteins and Host Cell Signaling Pathways. Front. Microbiol. 7, 388
(2016).
42. Marcilla, A. et al. Extracellular vesicles in parasitic diseases. J. Extracell. vesicles 3,
25040 (2014).
43. Bartholomeu, D. C. et al. Genomic organization and expression profile of the mucin-
associated surface protein (masp) family of the human pathogen Trypanosoma cruzi.
Nucleic Acids Res. 37, 3407–3417 (2009).
44. Souza, R. T. et al. New Trypanosoma cruzi repeated element that shows site specificity
for insertion. Eukaryot. Cell 6, 1228–38 (2007).
45. dos Santos, S. et al. The MASP family of [i]Trypanosoma cruzi[/i]: changes in gene
expression and antigenic profile during the acute phase of experimental infection. PLoS
Negl Trop Dis 6, e1779 (2012).
46. De Gaudenzi, J. G., Noé, G., Campo, V. A., Frasch, A. C. & Cassola, A. Gene
expression regulation in trypanosomatids. Essays Biochem. 51, 31–46 (2011).
47. Atwood, J. A. et al. The Trypanosoma cruzi Proteome. Science (80-. ). 309, 473–476
(2005).
48. Atwood, J. A. et al. Glycoproteomics of Trypanosoma cruzi trypomastigotes using
subcellular fractionation, lectin affinity, and stable isotope labeling. J. Proteome Res. 5,
3376–84 (2006).
49. Alves, M. J. M. et al. Comprehensive glycoprofiling of the epimastigote and
trypomastigote stages of Trypanosoma cruzi. J. Proteomics 151, 182–192 (2017).
50. Buscaglia, C. A., Campo, V. A., Frasch, A. C. C. & Di Noia, J. M. Trypanosoma cruzi
surface mucins: host-dependent coat diversity. Nat. Rev. Microbiol. 4, 229–36 (2006).
51. Seco-Hidalgo, V., De Pablos, L. M. & Osuna, A. Transcriptional and phenotypical
heterogeneity of Trypanosoma cruzi cell populations. Open Biol. 5, 150190 (2015).
52. Serna, C. et al. A synthetic peptide from Trypanosoma cruzi mucin-like associated
surface protein as candidate for a vaccine against Chagas disease. Vaccine 32, 3525–
3532 (2014).
53. Carmona, S. J. et al. Towards High-throughput Immunomics for Infectious Diseases:
Use of Next-generation Peptide Microarrays for Rapid Discovery and Mapping of
Antigenic Determinants. Mol. Cell. Proteomics 14, 1871–1884 (2015).
54. Bayer-Santos, E. et al. Proteomic analysis of Trypanosoma cruzi secretome:
characterization of two populations of extracellular vesicles and soluble proteins. J.
Proteome Res. 12, 883–97 (2013).
55. De Pablos, L. M. & Osuna, A. Conserved regions as markers of different patterns of
expression and distribution of the mucin-associated surface proteins of Trypanosoma
cruzi. Infect. Immun. 80, 169–74 (2012).
56. Balouz, V. et al. Mapping Antigenic Motifs in the Trypomastigote Small Surface
Antigen from Trypanosoma cruzi. Clin. Vaccine Immunol. 22, 304–312 (2015).
57. Petersen, T. N., Brunak, S., von Heijne, G. & Nielsen, H. SignalP 4.0: discriminating
signal peptides from transmembrane regions. Nat. Methods 8, 785–786 (2011).
58. Pierleoni, A., Martelli, P. L. & Casadio, R. PredGPI: a GPI-anchor predictor. BMC
Bioinformatics 9, 392 (2008).
59. El-Sayed, N. M. et al. Comparative genomics of trypanosomatid parasitic protozoa.
Science 309, 404–9 (2005).
60. De Pablos, L. M. et al. The C-terminal region of Trypanosoma cruzi MASPs is
antigenic and secreted via exovesicles. Sci. Rep. 6, 27293 (2016).
61. Dereeper, a, Guignon, V. & Blanc, G. Phylogeny. fr: robust phylogenetic analysis for
the non-specialist. Nucleic acids … 36, W465--9 (2008).
62. Dereeper, A., Audic, S., Claverie, J.-M. & Blanc, G. BLAST-EXPLORER helps you
78
building datasets for phylogenetic analysis. BMC Evol. Biol. 10, 8 (2010).
63. Gibson, W. & Stevens, J. Genetic exchange in the trypanosomatidae. Adv. Parasitol.
43, 1–46 (1999).
64. Kissinger, J. C. A tale of three genomes: the kinetoplastids have arrived. Trends
Parasitol. 22, 240–3 (2006).
65. El-Sayed, N. M. et al. The Genome Sequence of Trypanosoma cruzi, Etiologic Agent of
Chagas Disease. Science (80-. ). 309, 409–415 (2005).
66. Ferguson, M. A. The structure, biosynthesis and functions of
glycosylphosphatidylinositol anchors, and the contributions of trypanosome research. J.
Cell Sci. 2799–809 (1999).
67. Nardy, A. F. F. R., Freire-de-Lima, C. G., Pérez, A. R. & Morrot, A. Role of
Trypanosoma cruzi Trans-sialidase on the Escape from Host Immune Surveillance.
Front. Microbiol. 7, 348 (2016).
68. Buscaglia, C. A. et al. The Surface Coat of the Mammal-dwelling Infective
Trypomastigote Stage of Trypanosoma cruzi Is Formed by Highly Diverse
Immunogenic Mucins. J. Biol. Chem. 279, 15860–15869 (2004).
69. Livingstone, C. D. & Barton, G. J. Protein sequence alignments: a strategy for the
hierarchical analysis of residue conservation. Comput. Appl. Biosci. 9, 745–56 (1993).
70. Waterhouse, A. M., Procter, J. B., Martin, D. M. A., Clamp, M. & Barton, G. J. Jalview
Version 2--a multiple sequence alignment editor and analysis workbench.
Bioinformatics 25, 1189–1191 (2009).
71. Bringaud, F. et al. The Trypanosoma cruzi L1Tc and NARTc non-LTR
retrotransposons show relative site specificity for insertion. Mol. Biol. Evol. 23, 411–20
(2006).
72. Granjon, E. et al. Development of a Novel Multiplex Immunoassay Multi-cruzi for the
Serological Confirmation of Chagas Disease. PLoS Negl. Trop. Dis. 10, e0004596
(2016).
73. Di Noia, J. M., Buscaglia, C. A., De Marchi, C. R., Almeida, I. C. & Frasch, A. C. C. A
Trypanosoma cruzi small surface molecule provides the first immunological evidence
that Chagas‘ disease is due to a single parasite lineage. J. Exp. Med. 195, 401–13
(2002).
74. De Marchi, C. R. et al. Evaluation of a Recombinant Trypanosoma cruzi Mucin-Like
Antigen for Serodiagnosis of Chagas‘ Disease. Clin. Vaccine Immunol. 18, 1850–1855
(2011).
75. Cánepa, G. E., Degese, M. S., Budu, A., Garcia, C. R. S. & Buscaglia, C. A.
Involvement of TSSA (trypomastigote small surface antigen) in Trypanosoma cruzi
invasion of mammalian cells. Biochem. J. 444, 211–218 (2012).
76. da Silveira, J. F., Umezawa, E. S. & Luquetti, A. O. Chagas disease: recombinant
Trypanosoma cruzi antigens for serological diagnosis. Trends Parasitol. 17, 286–91
(2001).
77. Ulrich, P. N. et al. Identification of Contractile Vacuole Proteins in Trypanosoma cruzi.
PLoS One 6, e18013 (2011).
78. Queiroz, R. M. L. et al. Comprehensive Proteomic Analysis of Trypanosoma cruzi
Epimastigote Cell Surface Proteins by Two Complementary Methods. J. Proteome Res.
12, 3255–3263 (2013).
79. Cordero, E. M. et al. Proteomic analysis of detergent-solubilized membrane proteins
from insect-developmental forms of Trypanosoma cruzi. J. Proteome Res. 8, 3642–52
(2009).
80. Marchini, F. K. et al. Profiling the Trypanosoma cruzi phosphoproteome. PLoS One 6,
e25381 (2011).
81. Sant‘Anna, C. et al. Subcellular proteomics of Trypanosoma cruzi reservosomes.
Proteomics 9, 1782–1794 (2009).
79
82. Bayona, J. C. et al. SUMOylation pathway in Trypanosoma cruzi: functional
characterization and proteomic analysis of target proteins. Mol. Cell. Proteomics 10,
M110.007369 (2011).
83. Ferella, M. et al. Proteomics in Trypanosoma cruzi--localization of novel proteins to
various organelles. Proteomics 8, 2735–49 (2008).
84. Queiroz, R. M. L. et al. Cell Surface Proteome Analysis of Human-Hosted
Trypanosoma cruzi Life Stages. J. Proteome Res. 13, 3530–3541 (2014).
85. Nakayasu, E. S. et al. Improved Proteomic Approach for the Discovery of Potential
Vaccine Targets in Trypanosoma cruzi. J. Proteome Res. 11, 237–246 (2012).
86. Brunoro, G. V. F. et al. Reevaluating the Trypanosoma cruzi proteomic map: The
shotgun description of bloodstream trypomastigotes. J. Proteomics 115, 58–65 (2015).
87. R. Gupta, E. J. & S. B. Prediction of N-glycosylation sites in human proteins. In
preparation (2004).
88. Steentoft, C. et al. Precision mapping of the human O-GalNAc glycoproteome through
SimpleCell technology. EMBO J. 32, 1478–1488 (2013).
89. Balouz, V. Caracterización antigénica y uncional de la proteína TSSA (Trypomastigote
Small Surface Antigen) de Trypanosoma cruzi. (UNIVERSIDAD NACIONAL DE
GENERAL SAN MARTÍN. Instituto de Investigaciones Biotecnológicas ‗Rodolfo A.
Ugalde‘, 2014).
90. Pollevick, G. D. et al. Trypanosoma cruzi surface mucins with exposed variant
epitopes. J. Biol. Chem. 275, 27671–80 (2000).
91. De Marchi, C. R. et al. Evaluation of a recombinant Trypanosoma cruzi mucin-like
antigen for serodiagnosis of Chagas‘ disease. Clin. Vaccine Immunol. 18, 1850–5
(2011).
92. Sambrook, J. & Russell, D. W. The Inoue Method for Preparation and Transformation
of Competent E. Coli : ‗Ultra-Competent‘ Cells. Cold Spring Harb. Protoc. 2006,
pdb.prot3944 (2006).
93. Srinivasan, P. et al. Immunization with a functional protein complex required for
erythrocyte invasion protects against lethal malaria. Proc. Natl. Acad. Sci. 111, 10311–
10316 (2014).
80
Notas
81
82