Modelos y modelación - Aula Virtual - FCAyF - UNLP

28
Modelos y modelación Todos los modelos están equivocados, pero algunos son útiles J, Tukey & G. Box Una teoría tiene solo la alternativa de estar errada o acertada. Un modelo tiene una tercera posibilidad: puede estar acertado pero ser irrelevante M. Elgen Nunca creas en un modelo hasta que haya estado validado con datos Anónimo Nunca creas en tus datos hasta que hayan sido validado por un modelo ?????

Transcript of Modelos y modelación - Aula Virtual - FCAyF - UNLP

Page 1: Modelos y modelación - Aula Virtual - FCAyF - UNLP

Modelos y modelación

Todos los modelos están equivocados, pero algunos son

útiles

J, Tukey & G. Box

Una teoría tiene solo la alternativa de estar errada o

acertada. Un modelo tiene una tercera posibilidad: puede

estar acertado pero ser irrelevante

M. Elgen

Nunca creas en un modelo hasta que haya estado

validado con datos

Anónimo

Nunca creas en tus datos hasta que hayan sido validado

por un modelo

?????

Page 2: Modelos y modelación - Aula Virtual - FCAyF - UNLP

Modelos estadísticos:

Z = b0 + b1X + ε, ε ~ NID(0,σ2)

E(Z) = b0 + b1X ^ ^ ^ Z = b0 + b1X

Page 3: Modelos y modelación - Aula Virtual - FCAyF - UNLP
Page 4: Modelos y modelación - Aula Virtual - FCAyF - UNLP
Page 5: Modelos y modelación - Aula Virtual - FCAyF - UNLP
Page 6: Modelos y modelación - Aula Virtual - FCAyF - UNLP
Page 7: Modelos y modelación - Aula Virtual - FCAyF - UNLP

Análisis de la regresión por mínimos

cuadrados ordinarios

• Los residuales son extremadamente importantes en el análisis y modelaje

– Estimación del error (variación no explicada)

– La suma de cuadrados de los residuales es la misma que la suma del cuadrado del error

– Usado intensivamente para la evaluación del modelo• Es el modelo razonable para ajustar el set de datos?

• Hay otros modelos más razonables?

• Se han cumplido los presupuestos estadísticos?

• Ver el gráfico de residuales versus X

Page 8: Modelos y modelación - Aula Virtual - FCAyF - UNLP

Modelos

• Correcciones a un pobre ajuste son sugeridos

por el gráfico de residuales

• Primero consideremos la

modelación/estrategias de análisis

– Descriptivos, correlativos o empíricos

– Teóricos, mecánicos, o explicativos

Page 9: Modelos y modelación - Aula Virtual - FCAyF - UNLP

Modelos empíricosDescriben datos basados en la aceptación de

principios estadísticos sin usar previamente el

desarrollo de teoría o conceptos para la relación

entre las variables respuesta y predictora

Secuencia

• Obtención de datos (medida de la intensidad de la

enfermedad y variables predictivas)

• Describir la relación usando modelos (simples)

• Evaluar el ajuste del modelo (residuales, estadísticos

(R2), etc.

• Usar otros modelos, si la elección del primero no es

razonable

• Si el modelo seleccionado es razonable usarlo para:

• Predecir, comparar, evaluar significancia, inferencia, y otros

Page 10: Modelos y modelación - Aula Virtual - FCAyF - UNLP

Modelos empíricos

Comenzar con un ajuste lineal

Ver residuales vs. X = ajusta, el modelo es razonable

= no ajusta

Aplicar una transformación ej. log(Z)

= ajusta, el modelo es razonable

Transformaciones usuales:

Para la variable respuesta: Z

RC(Z), ln(Z), 1/Z

Para la variable predictora: X

RC(X), ln(X), 1/X

Page 11: Modelos y modelación - Aula Virtual - FCAyF - UNLP

Modelos teóricosComienzan con un concepto o teoría de la realidad a

ser descripta, no con datos El modelo desarrollado

está basado en un concepto o teoría y luego se

recolectan los datos. La prueba del modelo se realiza

por su pertinencia de acuerdo a como ajusta el

modelo con los datos y usando análisis matemático y

estadístico de las propiedades del modelo

Existen interconexiones entre modelos empíricos y

teóricos

• La recolección de datos y el modelo empírico puede ser la

base para el desarrollo de nuevos conceptos/teoría

• Cuando un modelo teórico es desarrollado, se debe probar

con los datos usando los principios del modelaje empírico

para determinar si el modelo es apropiado

Page 12: Modelos y modelación - Aula Virtual - FCAyF - UNLP

Ultimamente, un modelo teórico es considerado

superior a un modelo empírico

• Los puntos de datos observados están fuera de los límites

para ser al menos algo como imprecisos, originando

resultados empíricos engañosos en un estudio único

• Si nosotros realmente entendemos un fenómeno, podemos

especificar el modelo (incluyendo los valores de los

parámetros) antes de colectar los datos

– Comparando a la física o química, la biología tiene pocos

modelos teóricos

Page 13: Modelos y modelación - Aula Virtual - FCAyF - UNLP

– En la práctica, muchos investigadores usan ambas

aproximaciones dependiendo del estudio en cuestión

– Esfuerzos en modelación intermedia, combinando el

mejor modelo empírico y el mejor modelo teórico,

son comunes en epidemiología y en dinámica y

ecología de las poblaciones

• Por ejemplo, la “familia” de modelos de las curvas de

progreso de enfermedades está basada en consideraciones

teóricas, pero el modelo específico usado y los parámetros

de los modelos pueden ser determinados a través de datos

observados

• Esta aproximación es la que se sigue en este curso

Page 14: Modelos y modelación - Aula Virtual - FCAyF - UNLP

Modeloso Basados en consideraciones conceptuales o teóricas

de los mecanismos del crecimiento de las enfermedades en poblaciones (dinámica de la enfermedad) casi siempre requieren de modelos no lineales

o Las relaciones observadas a menudo sugieren modelos no lieneales

o Un modelo linear no necesariamente significa una línea recta

o Pero una línea recta puede ser considerada la expresión gráfica de un modelos lineal

o Linealidad o no linealidad tiene que ver con la propiedad técnica de los modelo respecto a la forma en el cual los parámetros aparecen en él

o El concepto de modelo lineal o no lineal para los biólogos debe quedar bien claro

Page 15: Modelos y modelación - Aula Virtual - FCAyF - UNLP

Modelos: algunas relaciones

*Todas las curvas son no lineales

*Todas son intrínsecamente lineales

*Porciones de las curvas también pueden ser

lineales

Dosis de inóculo

Infe

ccio

nes

Edad de la lesión

Esp

ora

s (

tota

l)

Infe

ccio

nes

Temperatura

Page 16: Modelos y modelación - Aula Virtual - FCAyF - UNLP

Modelos lineales: Ejemplos

Z = α + βX

Z = α + βX

Z = α + β1X + β2X2

Z = α + βln(X)

o Concepto: A suma de términos

o “Variable” puede ser original o una variable transformada

Page 17: Modelos y modelación - Aula Virtual - FCAyF - UNLP

Modelos no lineales: Ejemplos

Z = α eβX

Z = α +Xβ

Z = α + β1X + β2X2

Z = 1/ (1+βe-γX)e: 2.718 (base del sistema de logaritmos naturales)

o Concepto: no pueden ser escritos como una suma de términos con cada término igual al parámetro por la variable

Definición técnica:

El modelo es lineal si la derivada parcial con respecto a cada parámetro involucra solo las variables que predicen

(Z = α + βX ; δZ/δβ = X)De otra manera, es no lineal

Page 18: Modelos y modelación - Aula Virtual - FCAyF - UNLP

Consideremos

Z = α/β X + γ X2

Esta función es no lineal en α y β

Pero consideremos que la relación de dos constantes es otra

constante

α/β = δ

Por lo tanto es lineal en término de δ y γ

Page 19: Modelos y modelación - Aula Virtual - FCAyF - UNLP

Modelo lineal vs. no lineal o Están involucrados muchos parámetros (ej. para

ajustar el modelo a datos)

o Ajustar modelos lineales a un set de datos es bastante directo

o Existe una solución unica para todos los conjuntos de datos

o Es relativamente difícil ajustar modelos no lineales a datos

o El ajuste es un proceso iterativo

o (ej. “encontrar” el parámetro que da la mínima suma de cuadrados del error)

o Las propiedades de los estimadores de los parámetros de modelos no lineales quedan menos definidas cuando se usa un set de datos pequeño

o Aún así, los procesos biológicos son de naturaleza no lineal

Page 20: Modelos y modelación - Aula Virtual - FCAyF - UNLP

Modelos no lineales

Muchos modelos no lineales pueden ser

transformados (usando álgebra) en modelos

lineales

Ejemplo

Z = α eβX

ln(Z) = ln(α eβX) = ln(α) + ln (eβX)

ln(Z) = ln(α) + βX

Z* = α* + βX*

Nueva variable respuesta

Nueva constante de intercepción

Nueva pendiente

Page 21: Modelos y modelación - Aula Virtual - FCAyF - UNLP

Más de una manera de ver un modelo

Z = b0 + b1X

Si tomamos la derivada de Z respecto

a: dZ/dX = b1

La fórmula de la derivada dice que un

cambio en Z cuando cambia X es una

Constante igual a b1 (que es la pendiente

de la línea Z:X)

Existen dos maneras equivalentes para

describir la misma relación

Page 22: Modelos y modelación - Aula Virtual - FCAyF - UNLP

Derivadas e integrales

dZ/dX es la tasa, el cambio en Z con un cambio en X. Si X es tiempo, luego se describe la tasa de cambio sobre el tiempo

Luego, la tasa es el cambio en Z cuando X cambia en una (1) unidad; con este ejemplo, es igual a la pendiente b1

Page 23: Modelos y modelación - Aula Virtual - FCAyF - UNLP

Algunas observaciones

o Hay diferencia entre parámetros estimados y los parámetros reales

o Cuando hay distinciones importantes, se usará anotaciones con el “hat”

o A partir de aquí, las relaciones epidemiológicas se especificarán con modelos, normalmente comenzando con ecuaciones diferenciales (dado que expresan dinámica)

Page 24: Modelos y modelación - Aula Virtual - FCAyF - UNLP

Ejemplo

“Phymatotrichum root rot” en

algodón

Capítulo 4

Modelo empírico

Ajustar lineal simple : Z=b0+b1X+e

Resultado Z=-0.11+0.0011X, R2=0.683

Page 25: Modelos y modelación - Aula Virtual - FCAyF - UNLP

Basado en los residuales, consideramos ln(X)

Z = b0 + b1ln(X) + e

Z = -2.42 + 0.73 ln(X) ; R2 = 0.744

Todavía Z puede ser más grande que 1 o más

chico que 0.01

Page 26: Modelos y modelación - Aula Virtual - FCAyF - UNLP

Ahora consideremos un modelo no lineal

Z = 1/1 + e(B ln (X/ γ ))

Si corremos este modelo con Proc nlin de SAS

empleando mínimos cuadrados

Z = 1/1 + e(-0.4 ln X/ 52.95 )

Z en este caso no puede ser > 1 o < 0

R2 se puede determinar de la siguiente manera:

R2= 1-SCE/SCT =0.77

Aunque el R2 no es mucho mejor que la transformación,

esto tiene más sentido

Page 27: Modelos y modelación - Aula Virtual - FCAyF - UNLP

Podemos escribir el modelo como:

ln (Z/(1-Z))= -β ln(X/γ ) = - β (ln(X) – ln(γ))

= β ln(γ)- β ln(X)

Z* = α* + β*X * modelo lineal

Si vemos, los parámetros derivados de este

modelo no son necesariamente iguales a los

estimados en el modelo no lineal

Z = -18.6 + 4.7 X en el no lineal, β=-0.4

-18.6= β ln(γ) = -18.6

-4.7ln(γ) = -18.6

ln(γ) = 3.96 γ=e3.96 = 52.5; valor cercano a

52.95 del modelo no lineal

Page 28: Modelos y modelación - Aula Virtual - FCAyF - UNLP

Este ejemplo es para mostrar la modelación

lineal y no lineal

Para el modelo no lineal elegido Z no puede ser

>1 ó < 0

En este ejemplo, γ es el valor de X que da un

Z=½=0.5; un aproximación al LD50