QSAR CINETICA QUIMICA

15
Tabla de Contenidos Pág. 1.Introducción 1 2.Definición 2 3. Antecedentes históricos 3 4.Tipos 4 5. Calidad de los modelos QSAR 6 6.Aplicaciones 7 Lima-Perú 2015-I

description

QSAR CINETICA QUIMICA TEORIA MARCO TEORICO INTRODUCCION CATEGORIA CIENCIAS MODELO DEFINICION ACTIVIDAD ESTRUCTURA QUANTITATIVE STRUCTURE ACTIVITY RELATIONSHIP TIPOS PARAMETROS DESCRIPTORES MOLECULARES CALIDAD DE LOS MODELOS APLICACIONES

Transcript of QSAR CINETICA QUIMICA

Page 1: QSAR CINETICA QUIMICA

Tabla de Contenidos

Pág.

1. Introducción 1

2. Definición 2

3. Antecedentes históricos 3

4. Tipos 4

5. Calidad de los modelos QSAR 6

6. Aplicaciones 7

7. Bibliografía 9

Lima-Perú2015-I

Page 2: QSAR CINETICA QUIMICA

Introducción

El interés por las Relaciones Cuantitativas Estructura/Actividad-Estructura/Propiedad se ha originado en las últimas décadas, estimulado por el creciente desarrollo de las industrias farmacéuticas y agroquímicas, por la cantidad de productos químicos que  ponen en riesgo la salud humana y al medio ambiente. Sin embargo, Overton y Meyer estudiaron el rol fundamental del coeficiente de reparto octanol/agua, hace más de cien años atrás, de suma importancia para los estudios QSAR ambiental y biológicos.

La teoría QSAR-QSPR se fundamenta en la hipótesis matemática de que la estructura de una molécula es responsable de sus propiedades químicas, fisicoquímicas, biológicas o farmacológicas, siendo aplicable siempre que la estructura molecular explique a la propiedad medida.

Para poder obtener dichas relaciones es necesario representar la estructura molecular a través de números denominados descriptores moleculares, cantidades teóricas o empíricamente definidas y que reflejan alguna característica global o subestructural de cada molécula. La función que vincula los descriptores moleculares con la propiedad estudiada puede establecerse a través de la técnica de Análisis de Regresión Lineal Multivariable (MLRA). Para poder describir de la mejor manera la estructura molecular existen en la literatura dos tipos de descriptores, rígidos y flexibles. Los descriptores rígidos sólo dependen de la estructura de cada molécula, mientras que los descriptores flexibles o ajustables, varían con la propiedad observada en un mismo conjunto molecular ensayado.

Se buscará diseñar modelos que posean utilidad práctica como herramienta para predecir las propiedades ensayadas. Para ello, es crucial que la etapa de validación del modelo determine si la relación estructura-propiedad hallada durante la calibración (conjunto de calibración) es cuantitativa, es decir, sea aplicable a estructuras químicas relacionadas (conjunto de validación) que no hayan sido empleadas durante el ajuste del modelo.

Página 1

Page 3: QSAR CINETICA QUIMICA

Definición:

La relación cuantitativa estructura-actividad (en inglés, Quantitative structure-

activity relationship, QSAR, o bien, quantitative structure-property

relationship, QSPR) es el proceso por el cual la estructura

química se correlaciona cuantitativamente con un proceso bien definido, como

la actividad biológica (unión de un fármaco con un receptor) o la reactividad

química (afinidad de una sustancia por otra para que produzcan una reacción).

Por ejemplo, la actividad biológica se puede expresar cuantitativamente como la

concentración requerida de una substancia para dar una cierta respuesta biológica.

Además, cuando las propiedades fisicoquímicas o las estructuras se expresan

mediante números, podemos construir una relación matemática, o relación

cuantitativa estructura-actividad, entre las dos. La expresión matemática puede

entonces usarse para predecir la respuesta de otras estructuras químicas.

Este método asigna parámetros a cada grupo químico, de forma que al modificar la

estructura química puede valorarse la contribución de cada grupo funcional a la

actividad del fármaco o del tóxico en cuestión y a partir de ahí, cómo variará la

actividad de esa sustancia.

Página 2

Page 4: QSAR CINETICA QUIMICA

Antecedentes históricos

Los primeros acercamientos a la correlación entre la estructura de las moléculas y sus propiedades o actividades podemos encontralos en:

Cros estudió en 1863 el aumento del punto de ebullición y del punto de fusión, en alcanos, al aumentar el número de átomos de carbono y la masa molecular. Asimismo observó una disminución de la solubilidad en agua, en alcoholes, al aumentar el número de átomos de Carbono y la masa molecular.

Hans Horst Meyer en 1899 y Charles Ernest Overton en 1901 observan un aumento en la toxicidad de los alcoholes al aumentar logP (coeficiente de partición aceite/agua),lo que resulta un caso típico de relación entre propiedades fisicoquímicas y actividad biológica.

Corwin Hansch y su equipo, en 1964, promovieron la hipótesis QSAR ("moléculas semejantes tendrán un comportamiento semejante"), que cuantificaron en forma de ecuación:

logP: coeficiente de reparto = término que cuantifica las mayores o menores cualidades hidrófobas.

E: término que cuantifica los aspectos electrónicos de la molécula.

S: término que cuantifica los aspectos estéricos y de forma.

El primero de esos términos señala la probabilidad o capacidad de alcanzar la molécula-diana. Los otros dos términos señalan la probabilidad de interaccionar de modo eficaz con esa diana.

Página 3

Page 5: QSAR CINETICA QUIMICA

Tipos

Basada en el fragmento:

Se ha demostrado que logP de un compuesto se puede determinar por la suma de

los fragmentos que componen su molécula. Los valores de logP fragmentarios se

han determinado estadísticamente. Este método da resultados mixtos y

generalmente no se confía en que proporcione una precisión de ±0.1 unidades.

3D-QSAR:

Se refiere a la aplicación de cálculos del campo de fuerza que necesitan estructuras

tridimensionales, como la cristalografía de proteínas o la superposición de

moléculas. Emplea potenciales calculados, por ejemplo el potencial de Lennard-

Jones, antes que constantes experimentales y se interesa por la molécula completa

antes que por un simple sustituyente. Examina los campos estéricos y los campos

electrostáticos basados en la función de energía aplicada.

El espacio de datos creado habitualmente se reduce posteriormente siguiendo una

extracción de variables. El siguiente método de aprendizaje puede ser cualquiera

de los ya mencionados métodos de máquinas de aprendizaje, como las máquinas

de vectores de soporte.

La mayoría de los estudios indican que los químicos prefieren los métodos de

mínimos cuadrados parciales, ya que aplican extracción de variables y el la

inducción en un solo paso.

Minería de datos:

Para el proceso de codificación es necesario habitualmente calcular un gran

número de variables o descriptores moleculares, que pueden carecer de la

capacidad de interpretación estructural. En combinación con los últimos métodos

de aprendizaje aplicado o durante la etapa de pre procesamiento, se produce un

problema de selección de variables

Algunos ejemplos típicos de predicción basados en la minería de datos son:

las máquinas de vectores de soportes, los árboles de decisión y las redes

neurales para inducir un modelo predictivo de aprendizaje.

Página 4

Page 6: QSAR CINETICA QUIMICA

Las propuestas de minería de moléculas, un caso especial de minería de datos

estructurados, aplican una matriz de similaridad, o bien, un esquema de

fragmentación automática en subestructutas moleculares. Existen además otras

propuestas que emplean el grafo molecular, una representación de los enlaces de

la molécula, que a su vez, puede ser subdividido en subgrafos que dependen del

número de ejes interconectados al vértice. Estos subgrafos se clasifican según su

orden y su tipo y se puede encontrar semejanza entre moléculas tras la búsqueda

del máximo subgrafo común o gráfico kernel.

Parámetros o descriptores moleculares:

La elección de variables que se realiza en un esquema 3D-QSAR conduce a un

conjunto de parámetros o descriptores moleculares, que se pueden calcular a

partir de datos experimentales o de modelos teóricos (Método de Hansch/Fujita,

Método de Nys y Rekker, Método F-SYBYL de Rekker, CLogP, MOLCAD, Chemical-Σ

2) .

Entre estos parámetros podemos encontrar:

Descriptores de propiedades fisicoquímicas:

Descriptores de efectos hidrófobos: Como el coeficiente de reparto o

de partición aceite/agua, una razón de las concentraciones de una

sustancia entre dos fases en equilibrio, o la constante hidrofóbica del

sustituyente, .π

Descriptores de efectos electrónicos: Estos efectos son el efecto

inductivo (F) y la resonancia (R) y son estudiados mediante la

ecuación de Hammett.

Descriptores de efectos estéricos: Se emplea el parámetro Es, factor

estérico de Tafts, con el coeficiente que representa la sensibilidadδ

de la reacción a los efectos estéricos, los parámetros de Verloop y

Tipker o la refractividad molar.

Descriptores de propiedades topológicas

índices de conectividad

Descriptores de propiedades estructurales

presencia de subestructuras o grupos funcionales (sustituyentes

en orto de un centro de reacción, sustituyentes contiguos o grupos

formadores de puentes de hidrógeno)

Página 5

Page 7: QSAR CINETICA QUIMICA

frecuencia en presencia.

Página 6

Page 8: QSAR CINETICA QUIMICA

Calidad de los modelos QSAR

La relaciones QSAR representan modelos estadísticos predictivos derivados de

la aplicación de herramientas estadísticas que correlacionan la actividad

biológica (incluyendo el efecto terapéutico deseable y los efectos secundarios

no deseables) de las sustancias químicas (drogas/tóxicos/contaminantes) con

descriptores representativos de la estructura molecular y/o propiedades

moleculares. QSAR se está aplicando en muchas disciplinas como evaluación de

riesgos, predicción de toxicidad, y decisiones regulatorias además

de descubrimiento de fármacos y optimización de productos. Obtener un

modelo QSAR de buena calidad depende de muchos factores,tales como la

calidad de los datos biológicos, la elección de descriptores y métodos

estadísticos. Cualquier modelización QSAR debería conducir en último término

a modelos estadísticamente robustos capaces de hacer predicciones precisas y

fiables de las actividades biológicas de los nuevos compuestos.

Para validar los modelos QSAR se adoptan habitualmente cuatro estrategias:

1. validación interna o validación cruzada (validación cruzada);

2. validación por división del conjunto de datos en compuestos (muestras)

de entrenamiento y de prueba;

3. validación externa verdadera por aplicación del modelo sobre datos

externos y

4. aleatorización de datos o Y-scrambling.

El éxito de cualquier modelo QSAR depende de la precisión de los datos

iniciales, selección de los descriptores apropiados y herramientas estadísticas,

y lo más importante, la validación del modelo desarrollado.

La validación es el proceso por el cual se establecen la fiabilidad y relevancia de

un procedimiento para un propósito es Dejar algo fuera de la validación

cruzada conduce generalmente a una sobrestimación de la capacidad predictiva

e, incluso con validación externa, no podemos asegurar si la selección de los

conjuntos de muestras de entrenamiento y de prueba fueron manipulados para

maximizar la capacidad predictiva del modelo publicado.

Página 7

Page 9: QSAR CINETICA QUIMICA

Aplicaciones

Químicas:Una de las primeras aplicaciones históricas de las aplicaciones QSAR fue la

predicción de los puntos de ebullición.

Es bien conocido, por ejemplo, que dentro de una determinada familia de

compuestos químicos, especialmente de química orgánica, existe una

correlación fuerte entre la estructura y las propiedades observadas. Un ejemplo

sencillo es la relación entre el número de átomos de carbono en alcanos y

su punto de ebullición. Hay una tendencia clara en el aumento del punto de

ebullición con el incremento del número de átomos de carbono y esto sirve

como medio de predecir el punto de ebullición de los alcanos superiores.

Otras aplicaciones muy interesantes son los métodos de la ecuación de

Hammett, que se indica más abajo, la ecuación de Taft y la predicción de

la constante de disociación de los ácidos, Ka.

En la ecuación de Hammett anterior, se relacionan las constantes de disociación

de dos reacciones de ionización del ácido benzoico con el anillo benzoico sin

sustituir KH) y del ácido fenilacético con el anillo también sin sustituir, (K'H). El

valor puede tomar tres tipos de valores numéricos según el tipo deσ

sustituyente: =0 cuando el sustituyente es el hidrógeno, >0 cuando es unσ σ

aceptor de electrones y <0 cuando es unσ  donador de electrones. El valor

de ρ (pendiente de la función de la ecuación) mide la sensibilidad de la

reacción: el valor puede ser positivo o negativo,; si ρ es grande, la reacción es

muy sensible; y el signo del valor refleja la presencia de cargas negativas o

positivas. No obstante, existen tres excepciones a la función lineal de la

ecuación de Hammett: p-CO2Et, p-SO2Me, p-NO2, debido a la resonancia. En estos

casos se introducen nuevos parámetros:   (para sustituyentes aceptores de

electrones que interactúan por resonancia con un centro de reacción rico en

electrones) y   (para un grupo donador que por resonancia interactúa con un

centro de reacción deficiente en electrones).

Página 8

Page 10: QSAR CINETICA QUIMICA

Biológicas:La actividad biológica de las moléculas se mide habitualmente en ensayos para

establecer el nivel de inhibición de determinadas transducciones de señales

o rutas metabólicas. Las sustancias químicas pueden ser también

biológicamente activas si poseen toxicidad. El descubrimiento de fármacos, a

menudo, supone el uso de QSAR para identificar las estructuras químicas que

podrían tener buenos efectos inhibidores sobre una diana biológica específica y

tener baja toxicidad (actividad no-específica). La predicción del coeficiente de

partición, log P, es de especial interés. Es una medida importante en la

identificación de sustancias con potencial farmacológico de acuerdo con la regla

de cinco de Lewinsky.

Mientras que muchos análisis de las relaciones cuantitativas estructura-

actividad suponen la interacción de una familia de moléculas con un enzima o

con un sitio receptor de acoplamiento, QSAR puede usarse también para

estudiar las interacciones en el dominio estructural de las proteínas. Las

interacciones proteína-proteína pueden analizarse cuantitativamente mediante

las variaciones estructurales resultado de la mutagénesis sitio-dirigida.

Eso es parte del método del aprendizaje automático que reduce el riesgo de una

paradoja SAR (relación estructura-actividad), especialmente teniendo en

cuenta que sólo está disponible una cantidad finita de datos. (Véase también el

Estimador No-sesgado de mínima varianza, MVUE). En general todos los

problemas QSAR pueden dividirse en codificación y aprendizaje.

Página 9

Page 11: QSAR CINETICA QUIMICA

Bibliografía:

1. Correlaciones estructura-actividad. Optimización de prototipos. María

Font. Dpto. Química Orgánica y Farmacéutica. Sección de Modelización

Molecular. Universidad de Navarra.

2. Patani GA, LaVoie EJ (December de 1996). «Bioisosterism: A Rational

Approach in Drug Design». Chemical Reviews 96 : 3147–

3176. doi:10.1021/cr950066q. PMID 11848856.

3. http://blog.alquimia.com/Default.aspx?tabid=289&EntryID=83 P.S.R.

Prevention Safety Regulatory.

4. Wildman SA, Crippen GM (1999), «Prediction of physicochemical

parameters by atomic contributions», J. Chem. Inf. Comput. Sci 39: 868–

873, doi:10.1021/ci990307l

5. Leach, Andrew R. (2001). Molecular modelling: principles and applications.

Englewood Cliffs, N.J: Prentice Hall. ISBN 0-582-38210-6.

6. Vert, Jean-Philippe; Sch kopf, Bernhard; Schölkopf, Bernhard; Tsuda, Koji l̲ �

(2004). Kernel methods in computational biology. Cambridge, Mass: MIT

Press. ISBN 0-262-19509-7.

7. Gusfield, Dan (1997). Algorithms on strings, trees, and sequences:

computer science and computational biology. Cambridge, UK: Cambridge

University Press. ISBN 0-521-58519-8.

Página 10