Análisis de sensibilidad global multivariado de los …¡lisis de sensibilidad global multivariado...

2
Análisis de sensibilidad global multivariado de los parámetros del modelo hidrológico distribuido TETIS, mediante un método bayesiano formal, con muestreo Monte Carlo guiado por una cadena de Markov. (Tema: Hidrología y gestión del agua) Mario R. Hernández (1) y Félix Francés (1) (1) Instituto de Ingeniería del Agua y Medio Ambiente (IIAMA), Universitat Politècnica de València Correo electrónico: ffrancé[email protected], [email protected] En Hidrología como en tantas otras disciplinas de las ciencias naturales, es prácticamente imposible medir todo lo que nos gustaría saber sobre el sistema analizado, bien por la heterogeneidad del medio, bien por las limitaciones técnicas de las mediciones. Como consecuencia, los modelos hidrológicos proporcionan extrapolaciones o predicciones, que no están carentes de incertidumbre, lo cual reduce la aplicabilidad y la confianza en sus resultados. Así, la evaluación de la incertidumbre en modelación hidrológica es importante, más aún cuando sus resultados se utilizan para apoyar las decisiones sobre la gestión del agua. En el presente trabajo se realiza la estimación de los parámetros del modelo hidrológico conceptual distribuido TETIS (Francés et al. 2007) mediante un método de optimización global de búsqueda aleatoria, que pertenece al grupo de los llamados algoritmos bayesianos computacionales. El algoritmo cuantifica la incertidumbre de los parámetros, mediante la obtención de su distribución de probabilidad posterior, condicionada a los datos (caudal) observados. Adicionalmente a la calibración automática con su correspondiente estimación de incertidumbre, los resultados de esos cálculos permiten la realización de un análisis de sensibilidad global (GSA), en el cual se tiene en cuenta el efecto global que cada parámetro ejerce sobre la respuesta del modelo, tanto de forma individual, como mediante su interacción (de cualquier orden) con todos los restantes parámetros (análisis multivariado). El resultado de este análisis permite obtener cuál es la importancia relativa de cada parámetro sobre la respuesta del modelo. El primer paso para la consecución de los objetivos es la implementación en TETIS de la información de la cuenca que se quiere analizar. La cuenca objeto de estudio desagua en el embalse de La Baells (Figura 1), y es una subcuenca situada en la cabecera del Llobregat (Barcelona). Con una extensión de 504 km 2 es una cuenca con clima de alta montaña – Mediterráneo cuya vegetación predominante es de Bosques de Pino. Al ser un modelo distribuido, se le debe suministrar la información relativa a la topografía, tipos de suelo, tipos de vegetación y usos del suelo en forma de mapas de celdas, que en este caso son de un tamaño de 200x200 m. Así mismo se debe proporcionar al modelo la distribución espacial de las series temporales de lluvia y temperatura. La modelación se ha realizado a escala diaria, para un periodo de 2 años, con un periodo de calentamiento previo de 1 año, suficiente en esta cuenca, para que los resultados no se vean afectados por las condiciones iniciales. La serie de caudales observados que permite la calibración de los parámetros del modelo, es la serie de caudales de entrada al citado embalse. Inicialmente, tras la implementación del modelo hidrológico, se realiza un análisis de sensibilidad global univariado (no se consideran interacciones entre los parámetros) mediante un muestreo Monte Carlo directo sobre el espacio de parámetros, dentro del rango razonable en el que a priori se supone que se van a mover sus valores. De esta manera el conjunto de parámetros potencialmente identificable se reduce de 13 a 10. El siguiente paso, es el acoplamiento del modelo hidrológico (determinista) con una herramienta que permite la simulación estocástica. La herramienta escogida es el paquete de R denominado FME (Soetaert 2012). Mediante dicho software se emplea una herramienta bayesiana basada en los métodos llamados Markov Chain Monte Carlo o MCMC (Haario et al. 2006), mediante los cuales se realiza un muestreo aleatorio de los parámetros del modelo, guiado por una cadena de Markov Ergódica, que ha alcanzado su régimen estacionario. Figura 1. Cuenca del Embalse de la La Baells.

Transcript of Análisis de sensibilidad global multivariado de los …¡lisis de sensibilidad global multivariado...

Page 1: Análisis de sensibilidad global multivariado de los …¡lisis de sensibilidad global multivariado de los parámetros del modelo hidrológico distribuido TETIS, mediante un método

Análisis de sensibilidad global multivariado de los parámetros del modelo hidrológico distribuido TETIS, mediante un método

bayesiano formal, con muestreo Monte Carlo guiado por una cadena de Markov.

(Tema: Hidrología y gestión del agua)

Mario R. Hernández (1) y Félix Francés (1) (1) Instituto de Ingeniería del Agua y Medio Ambiente (IIAMA), Universitat Politècnica de València

Correo electrónico: ffrancé[email protected], [email protected]

En Hidrología como en tantas otras disciplinas de las ciencias naturales, es prácticamente imposible medir todo lo que nos gustaría saber sobre el sistema analizado, bien por la heterogeneidad del medio, bien por las limitaciones técnicas de las mediciones. Como consecuencia, los modelos hidrológicos proporcionan extrapolaciones o predicciones, que no están carentes de incertidumbre, lo cual reduce la aplicabilidad y la confianza en sus resultados. Así, la evaluación de la incertidumbre en modelación hidrológica es importante, más aún cuando sus resultados se utilizan para apoyar las decisiones sobre la gestión del agua.

En el presente trabajo se realiza la estimación de los parámetros del modelo hidrológico conceptual distribuido TETIS (Francés et al. 2007) mediante un método de optimización global de búsqueda aleatoria, que pertenece al grupo de los llamados algoritmos bayesianos computacionales. El algoritmo cuantifica la incertidumbre de los parámetros, mediante la obtención de su distribución de probabilidad posterior, condicionada a los datos (caudal) observados. Adicionalmente a la calibración automática con su correspondiente estimación de incertidumbre, los resultados de esos cálculos permiten la realización de un análisis de sensibilidad global (GSA), en el cual se tiene en cuenta el efecto global que cada parámetro ejerce sobre la respuesta del modelo, tanto de forma individual, como mediante su interacción (de cualquier orden) con todos los restantes parámetros (análisis multivariado). El resultado de este análisis permite obtener cuál es la importancia relativa de cada parámetro sobre la respuesta del modelo.

El primer paso para la consecución de los objetivos es la implementación en TETIS de la información de la cuenca que se quiere analizar. La cuenca objeto de estudio desagua en el embalse de La Baells (Figura 1), y es una subcuenca situada en la cabecera del Llobregat (Barcelona). Con una extensión de 504 km2 es una cuenca con clima de alta montaña – Mediterráneo cuya vegetación predominante es de Bosques de Pino. Al ser un modelo distribuido, se le debe suministrar la información relativa a la topografía, tipos de suelo, tipos de vegetación y usos del suelo en forma de mapas de celdas, que en este caso son de un tamaño de 200x200 m. Así mismo se debe proporcionar al modelo la distribución espacial de las series temporales de lluvia y temperatura. La modelación se ha realizado a escala diaria, para un periodo de 2 años, con un periodo de calentamiento previo de 1 año, suficiente en esta cuenca, para que los resultados no se vean afectados por las

condiciones iniciales. La serie de caudales observados que permite la calibración de los parámetros del modelo, es la serie de caudales de entrada al citado embalse.

Inicialmente, tras la implementación del modelo hidrológico, se realiza un análisis de sensibilidad global univariado (no se consideran interacciones entre los parámetros) mediante un muestreo Monte Carlo directo sobre el espacio de parámetros, dentro del rango razonable en el que a priori se supone que se van a mover sus valores. De esta manera el conjunto de parámetros potencialmente identificable se reduce de 13 a 10.

El siguiente paso, es el acoplamiento del modelo hidrológico (determinista) con una herramienta que permite la simulación estocástica. La herramienta escogida es el paquete de R denominado FME (Soetaert 2012). Mediante dicho software se emplea una herramienta bayesiana basada en los métodos llamados Markov Chain Monte Carlo o MCMC (Haario et al. 2006), mediante los cuales se realiza un muestreo aleatorio de los parámetros del modelo, guiado por una cadena de Markov Ergódica, que ha alcanzado su régimen estacionario.

Figura 1. Cuenca del Embalse de la La Baells.

Page 2: Análisis de sensibilidad global multivariado de los …¡lisis de sensibilidad global multivariado de los parámetros del modelo hidrológico distribuido TETIS, mediante un método

Este tipo de muestreo mejora notablemente la eficiencia respecto al muestreo Monte Carlo directo, consiguiendo explorar en mucho menor tiempo todo el espacio de parámetros. De esta manera, la muestra obtenida se puede considerar que pertenece a la distribución Posterior conjunta n-dimensional (con “n” el número de parámetros) de los parámetros. Así mismo, el estimador bayesiano puntual que resume la distribución Posterior, vendrá generalmente dado por la Media de dicha distribución.

Se debe tener en consideración que la Posterior de los parámetros obtenida, y por tanto su estimación puntual “óptima”, dependerá del modelo de error asumido a priori, así como de la información a priori que se tenga sobre los parámetros. El modelo de error, el cual debe explicar las características estadísticas de los residuos del modelo, interviene en el muestreo de los parámetros mediante la función de Verosimilitud de dichos parámetros, condicionada a las observaciones y a los híper-parámetros del modelo de error (parámetros Nuisance). Por su parte, el conocimiento previo sobre los parámetros interviene en el muestreo mediante la distribución Prior de los mismos.

En este trabajo se ha asumido no tener más conocimiento previo sobre los parámetros, que su rango de valores (Prior no informativa). Respecto al modelo de error, se ha asumido a priori que los residuos son independientes, homocedásticos y distribuidos Normalmente. Bajo esas hipótesis la estimación del conjunto “óptimo” de parámetros coincidirá con aquella que minimiza la suma cuadrática de los residuos. En modelación hidrológica es poco habitual que se cumplan las mencionadas hipótesis, y las comprobaciones realizadas en este trabajo así lo confirman. La consecuencia de elegir un modelo de error no adecuado al modelo hidrológico, es la obtención de distribuciones Posterior cuya dispersión resulta infra-estimada y sus estimadores de tendencia central sesgados. Como apunte, cabe poner un punto de atención en que muchos de los procesos de calibración empleados habitualmente, persiguen minimizar una función objetivo derivada de la teoría de mínimos cuadrados, función bajo la que también subyace la hipótesis de residuos independientes, homocedásticos y Normales.

Seguidamente se evalúa la incertidumbre de la predicción del modelo que es debida exclusivamente a la incertidumbre de los parámetros, mediante el muestreo de la Posterior de los mismos a través del modelo hidrológico. Con ello se obtienen las bandas de incertidumbre (90%) sobre la respuesta del modelo. Dichas bandas resultan ser muy estrechas. Esta circunstancia es consecuencia directa de la mencionada infra-valoración de la incertidumbre de los parámetros. Finalmente se acomete la tarea de averiguar en qué medida es responsable cada parámetro, de la incertidumbre de la predicción. Dicho de otra forma, se analiza la sensibilidad del modelo a los parámetros, cuando estos varían dentro de sus rangos probables. Se realiza un análisis de sensibilidad global (GSA) multivariado, mediante la comparación de las bandas de incertidumbre ya generadas en el anterior paso, con las que se generan de forma secuencial, dejando fijos cada uno de los parámetros y muestreando el resto. De dicha comparación se obtienen los efectos relativos totales que ejercen los parámetros sobre el modelo. En la Figura 2 se comparan las sensibilidades y las incertidumbres relativas de los parámetros.

Las principales conclusiones del trabajo son: (1) La aproximación bayesiana formal y los algoritmos MCMC se muestran como una potente herramienta para la estimación de los parámetros y su distribución Posterior, es decir su incertidumbre. (2) El mayor potencial de estas metodologías se muestra especialmente cuando se trabaja con espacios de parámetros de alta dimensión. (3) Los algoritmos MCMC pueden manejar parámetros con alta correlación, e incluso parámetros poco identificables. (4) La metodología empleada es una buena herramienta para la realización de análisis de sensibilidad global Multivariada sobre los parámetros, cuando estos solamente toman sus valores probables. (5) Todos los cálculos realizados están condicionados a la apropiada identificación y adopción de la función de Verosimilitud que mejor se adapte a cada modelo hidrológico analizado.

REFERENCIAS:

Francés, F., Vélez, I., and Vélez, J. (2007). “Split-parameter structure for the automatic calibration of distributed hydrological models.” Journal of Hydrology, 332(1-2), 226–240.

Haario, H., Laine, M., Mira, A., and Saksman, E. (2006). “DRAM: Efficient adaptive MCMC.” Statistics and Computing, 16(4), 339–354.

Soetaert, K., and Petzoldt, T. (2012). Package “FME” Manual.

0.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0 8.0 9.0 10.0

F2

FP1

FD2

F6

FN2

F1

F9

FN4

FN3

F4

F3

EFECTO SOBRE MODELO INCERT.PARAMETROS

Figura 2. Comparación relativa de la incertidumbre delos parámetros y su efecto sobre el modelo.