QSAR CINETICA QUIMICA
description
Transcript of QSAR CINETICA QUIMICA
Tabla de Contenidos
Pág.
1. Introducción 1
2. Definición 2
3. Antecedentes históricos 3
4. Tipos 4
5. Calidad de los modelos QSAR 6
6. Aplicaciones 7
7. Bibliografía 9
Lima-Perú2015-I
Introducción
El interés por las Relaciones Cuantitativas Estructura/Actividad-Estructura/Propiedad se ha originado en las últimas décadas, estimulado por el creciente desarrollo de las industrias farmacéuticas y agroquímicas, por la cantidad de productos químicos que ponen en riesgo la salud humana y al medio ambiente. Sin embargo, Overton y Meyer estudiaron el rol fundamental del coeficiente de reparto octanol/agua, hace más de cien años atrás, de suma importancia para los estudios QSAR ambiental y biológicos.
La teoría QSAR-QSPR se fundamenta en la hipótesis matemática de que la estructura de una molécula es responsable de sus propiedades químicas, fisicoquímicas, biológicas o farmacológicas, siendo aplicable siempre que la estructura molecular explique a la propiedad medida.
Para poder obtener dichas relaciones es necesario representar la estructura molecular a través de números denominados descriptores moleculares, cantidades teóricas o empíricamente definidas y que reflejan alguna característica global o subestructural de cada molécula. La función que vincula los descriptores moleculares con la propiedad estudiada puede establecerse a través de la técnica de Análisis de Regresión Lineal Multivariable (MLRA). Para poder describir de la mejor manera la estructura molecular existen en la literatura dos tipos de descriptores, rígidos y flexibles. Los descriptores rígidos sólo dependen de la estructura de cada molécula, mientras que los descriptores flexibles o ajustables, varían con la propiedad observada en un mismo conjunto molecular ensayado.
Se buscará diseñar modelos que posean utilidad práctica como herramienta para predecir las propiedades ensayadas. Para ello, es crucial que la etapa de validación del modelo determine si la relación estructura-propiedad hallada durante la calibración (conjunto de calibración) es cuantitativa, es decir, sea aplicable a estructuras químicas relacionadas (conjunto de validación) que no hayan sido empleadas durante el ajuste del modelo.
Página 1
Definición:
La relación cuantitativa estructura-actividad (en inglés, Quantitative structure-
activity relationship, QSAR, o bien, quantitative structure-property
relationship, QSPR) es el proceso por el cual la estructura
química se correlaciona cuantitativamente con un proceso bien definido, como
la actividad biológica (unión de un fármaco con un receptor) o la reactividad
química (afinidad de una sustancia por otra para que produzcan una reacción).
Por ejemplo, la actividad biológica se puede expresar cuantitativamente como la
concentración requerida de una substancia para dar una cierta respuesta biológica.
Además, cuando las propiedades fisicoquímicas o las estructuras se expresan
mediante números, podemos construir una relación matemática, o relación
cuantitativa estructura-actividad, entre las dos. La expresión matemática puede
entonces usarse para predecir la respuesta de otras estructuras químicas.
Este método asigna parámetros a cada grupo químico, de forma que al modificar la
estructura química puede valorarse la contribución de cada grupo funcional a la
actividad del fármaco o del tóxico en cuestión y a partir de ahí, cómo variará la
actividad de esa sustancia.
Página 2
Antecedentes históricos
Los primeros acercamientos a la correlación entre la estructura de las moléculas y sus propiedades o actividades podemos encontralos en:
Cros estudió en 1863 el aumento del punto de ebullición y del punto de fusión, en alcanos, al aumentar el número de átomos de carbono y la masa molecular. Asimismo observó una disminución de la solubilidad en agua, en alcoholes, al aumentar el número de átomos de Carbono y la masa molecular.
Hans Horst Meyer en 1899 y Charles Ernest Overton en 1901 observan un aumento en la toxicidad de los alcoholes al aumentar logP (coeficiente de partición aceite/agua),lo que resulta un caso típico de relación entre propiedades fisicoquímicas y actividad biológica.
Corwin Hansch y su equipo, en 1964, promovieron la hipótesis QSAR ("moléculas semejantes tendrán un comportamiento semejante"), que cuantificaron en forma de ecuación:
logP: coeficiente de reparto = término que cuantifica las mayores o menores cualidades hidrófobas.
E: término que cuantifica los aspectos electrónicos de la molécula.
S: término que cuantifica los aspectos estéricos y de forma.
El primero de esos términos señala la probabilidad o capacidad de alcanzar la molécula-diana. Los otros dos términos señalan la probabilidad de interaccionar de modo eficaz con esa diana.
Página 3
Tipos
Basada en el fragmento:
Se ha demostrado que logP de un compuesto se puede determinar por la suma de
los fragmentos que componen su molécula. Los valores de logP fragmentarios se
han determinado estadísticamente. Este método da resultados mixtos y
generalmente no se confía en que proporcione una precisión de ±0.1 unidades.
3D-QSAR:
Se refiere a la aplicación de cálculos del campo de fuerza que necesitan estructuras
tridimensionales, como la cristalografía de proteínas o la superposición de
moléculas. Emplea potenciales calculados, por ejemplo el potencial de Lennard-
Jones, antes que constantes experimentales y se interesa por la molécula completa
antes que por un simple sustituyente. Examina los campos estéricos y los campos
electrostáticos basados en la función de energía aplicada.
El espacio de datos creado habitualmente se reduce posteriormente siguiendo una
extracción de variables. El siguiente método de aprendizaje puede ser cualquiera
de los ya mencionados métodos de máquinas de aprendizaje, como las máquinas
de vectores de soporte.
La mayoría de los estudios indican que los químicos prefieren los métodos de
mínimos cuadrados parciales, ya que aplican extracción de variables y el la
inducción en un solo paso.
Minería de datos:
Para el proceso de codificación es necesario habitualmente calcular un gran
número de variables o descriptores moleculares, que pueden carecer de la
capacidad de interpretación estructural. En combinación con los últimos métodos
de aprendizaje aplicado o durante la etapa de pre procesamiento, se produce un
problema de selección de variables
Algunos ejemplos típicos de predicción basados en la minería de datos son:
las máquinas de vectores de soportes, los árboles de decisión y las redes
neurales para inducir un modelo predictivo de aprendizaje.
Página 4
Las propuestas de minería de moléculas, un caso especial de minería de datos
estructurados, aplican una matriz de similaridad, o bien, un esquema de
fragmentación automática en subestructutas moleculares. Existen además otras
propuestas que emplean el grafo molecular, una representación de los enlaces de
la molécula, que a su vez, puede ser subdividido en subgrafos que dependen del
número de ejes interconectados al vértice. Estos subgrafos se clasifican según su
orden y su tipo y se puede encontrar semejanza entre moléculas tras la búsqueda
del máximo subgrafo común o gráfico kernel.
Parámetros o descriptores moleculares:
La elección de variables que se realiza en un esquema 3D-QSAR conduce a un
conjunto de parámetros o descriptores moleculares, que se pueden calcular a
partir de datos experimentales o de modelos teóricos (Método de Hansch/Fujita,
Método de Nys y Rekker, Método F-SYBYL de Rekker, CLogP, MOLCAD, Chemical-Σ
2) .
Entre estos parámetros podemos encontrar:
Descriptores de propiedades fisicoquímicas:
Descriptores de efectos hidrófobos: Como el coeficiente de reparto o
de partición aceite/agua, una razón de las concentraciones de una
sustancia entre dos fases en equilibrio, o la constante hidrofóbica del
sustituyente, .π
Descriptores de efectos electrónicos: Estos efectos son el efecto
inductivo (F) y la resonancia (R) y son estudiados mediante la
ecuación de Hammett.
Descriptores de efectos estéricos: Se emplea el parámetro Es, factor
estérico de Tafts, con el coeficiente que representa la sensibilidadδ
de la reacción a los efectos estéricos, los parámetros de Verloop y
Tipker o la refractividad molar.
Descriptores de propiedades topológicas
índices de conectividad
Descriptores de propiedades estructurales
presencia de subestructuras o grupos funcionales (sustituyentes
en orto de un centro de reacción, sustituyentes contiguos o grupos
formadores de puentes de hidrógeno)
Página 5
frecuencia en presencia.
Página 6
Calidad de los modelos QSAR
La relaciones QSAR representan modelos estadísticos predictivos derivados de
la aplicación de herramientas estadísticas que correlacionan la actividad
biológica (incluyendo el efecto terapéutico deseable y los efectos secundarios
no deseables) de las sustancias químicas (drogas/tóxicos/contaminantes) con
descriptores representativos de la estructura molecular y/o propiedades
moleculares. QSAR se está aplicando en muchas disciplinas como evaluación de
riesgos, predicción de toxicidad, y decisiones regulatorias además
de descubrimiento de fármacos y optimización de productos. Obtener un
modelo QSAR de buena calidad depende de muchos factores,tales como la
calidad de los datos biológicos, la elección de descriptores y métodos
estadísticos. Cualquier modelización QSAR debería conducir en último término
a modelos estadísticamente robustos capaces de hacer predicciones precisas y
fiables de las actividades biológicas de los nuevos compuestos.
Para validar los modelos QSAR se adoptan habitualmente cuatro estrategias:
1. validación interna o validación cruzada (validación cruzada);
2. validación por división del conjunto de datos en compuestos (muestras)
de entrenamiento y de prueba;
3. validación externa verdadera por aplicación del modelo sobre datos
externos y
4. aleatorización de datos o Y-scrambling.
El éxito de cualquier modelo QSAR depende de la precisión de los datos
iniciales, selección de los descriptores apropiados y herramientas estadísticas,
y lo más importante, la validación del modelo desarrollado.
La validación es el proceso por el cual se establecen la fiabilidad y relevancia de
un procedimiento para un propósito es Dejar algo fuera de la validación
cruzada conduce generalmente a una sobrestimación de la capacidad predictiva
e, incluso con validación externa, no podemos asegurar si la selección de los
conjuntos de muestras de entrenamiento y de prueba fueron manipulados para
maximizar la capacidad predictiva del modelo publicado.
Página 7
Aplicaciones
Químicas:Una de las primeras aplicaciones históricas de las aplicaciones QSAR fue la
predicción de los puntos de ebullición.
Es bien conocido, por ejemplo, que dentro de una determinada familia de
compuestos químicos, especialmente de química orgánica, existe una
correlación fuerte entre la estructura y las propiedades observadas. Un ejemplo
sencillo es la relación entre el número de átomos de carbono en alcanos y
su punto de ebullición. Hay una tendencia clara en el aumento del punto de
ebullición con el incremento del número de átomos de carbono y esto sirve
como medio de predecir el punto de ebullición de los alcanos superiores.
Otras aplicaciones muy interesantes son los métodos de la ecuación de
Hammett, que se indica más abajo, la ecuación de Taft y la predicción de
la constante de disociación de los ácidos, Ka.
En la ecuación de Hammett anterior, se relacionan las constantes de disociación
de dos reacciones de ionización del ácido benzoico con el anillo benzoico sin
sustituir KH) y del ácido fenilacético con el anillo también sin sustituir, (K'H). El
valor puede tomar tres tipos de valores numéricos según el tipo deσ
sustituyente: =0 cuando el sustituyente es el hidrógeno, >0 cuando es unσ σ
aceptor de electrones y <0 cuando es unσ donador de electrones. El valor
de ρ (pendiente de la función de la ecuación) mide la sensibilidad de la
reacción: el valor puede ser positivo o negativo,; si ρ es grande, la reacción es
muy sensible; y el signo del valor refleja la presencia de cargas negativas o
positivas. No obstante, existen tres excepciones a la función lineal de la
ecuación de Hammett: p-CO2Et, p-SO2Me, p-NO2, debido a la resonancia. En estos
casos se introducen nuevos parámetros: (para sustituyentes aceptores de
electrones que interactúan por resonancia con un centro de reacción rico en
electrones) y (para un grupo donador que por resonancia interactúa con un
centro de reacción deficiente en electrones).
Página 8
Biológicas:La actividad biológica de las moléculas se mide habitualmente en ensayos para
establecer el nivel de inhibición de determinadas transducciones de señales
o rutas metabólicas. Las sustancias químicas pueden ser también
biológicamente activas si poseen toxicidad. El descubrimiento de fármacos, a
menudo, supone el uso de QSAR para identificar las estructuras químicas que
podrían tener buenos efectos inhibidores sobre una diana biológica específica y
tener baja toxicidad (actividad no-específica). La predicción del coeficiente de
partición, log P, es de especial interés. Es una medida importante en la
identificación de sustancias con potencial farmacológico de acuerdo con la regla
de cinco de Lewinsky.
Mientras que muchos análisis de las relaciones cuantitativas estructura-
actividad suponen la interacción de una familia de moléculas con un enzima o
con un sitio receptor de acoplamiento, QSAR puede usarse también para
estudiar las interacciones en el dominio estructural de las proteínas. Las
interacciones proteína-proteína pueden analizarse cuantitativamente mediante
las variaciones estructurales resultado de la mutagénesis sitio-dirigida.
Eso es parte del método del aprendizaje automático que reduce el riesgo de una
paradoja SAR (relación estructura-actividad), especialmente teniendo en
cuenta que sólo está disponible una cantidad finita de datos. (Véase también el
Estimador No-sesgado de mínima varianza, MVUE). En general todos los
problemas QSAR pueden dividirse en codificación y aprendizaje.
Página 9
Bibliografía:
1. Correlaciones estructura-actividad. Optimización de prototipos. María
Font. Dpto. Química Orgánica y Farmacéutica. Sección de Modelización
Molecular. Universidad de Navarra.
2. Patani GA, LaVoie EJ (December de 1996). «Bioisosterism: A Rational
Approach in Drug Design». Chemical Reviews 96 : 3147–
3176. doi:10.1021/cr950066q. PMID 11848856.
3. http://blog.alquimia.com/Default.aspx?tabid=289&EntryID=83 P.S.R.
Prevention Safety Regulatory.
4. Wildman SA, Crippen GM (1999), «Prediction of physicochemical
parameters by atomic contributions», J. Chem. Inf. Comput. Sci 39: 868–
873, doi:10.1021/ci990307l
5. Leach, Andrew R. (2001). Molecular modelling: principles and applications.
Englewood Cliffs, N.J: Prentice Hall. ISBN 0-582-38210-6.
6. Vert, Jean-Philippe; Sch kopf, Bernhard; Schölkopf, Bernhard; Tsuda, Koji l̲ �
(2004). Kernel methods in computational biology. Cambridge, Mass: MIT
Press. ISBN 0-262-19509-7.
7. Gusfield, Dan (1997). Algorithms on strings, trees, and sequences:
computer science and computational biology. Cambridge, UK: Cambridge
University Press. ISBN 0-521-58519-8.
Página 10