Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto...

128
DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN DE CAUDALES MEDIOS MENSUALES EN COLOMBIA Julián David Rojo Hernández – PARH -UNAL Desarrollo de un sistema experto para la predicción de caudales medios mensuales en Colombia Julián David Rojo Hernández Universidad Nacional de Colombia Facultad de Minas – Escuela de Geociencias y Medio Ambiente Medellín-Colombia 2011

Transcript of Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto...

Page 1: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH -UNAL

Desarrollo de un sistema experto para la predicción de caudales medios mensuales en

Colombia

Julián David Rojo Hernández

Universidad Nacional de Colombia Facultad de Minas – Escuela de Geociencias y Medio Ambiente

Medellín-Colombia 2011

Page 2: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH -UNAL

Desarrollo de un sistema experto para la predicción de caudales medios mensuales en

Colombia

Julián David Rojo Hernández

Tesis presentada como requisito parcial para optar al título de:

Maestría en Ingeniería – Recursos Hidráulicos

Director:

I.C Msc. Luis Fernando Carvajal Serna

Líneas de investigación:

Hidrometeorología - Hidrología Estocástica - Planeamiento y Manejo de Recursos Hidráulicos

Posgrado en Aprovechamiento de Recursos Hidráulicos (PARH)

Universidad Nacional de Colombia

Facultad de Minas – Escuela de Geociencias y Medio Ambiente

Medellín-Colombia

2011

Page 3: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH -UNAL

A la memoria de mi abuela Alicia

Page 4: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH -UNAL

AGRADECIMIENTOS

El presente trabajo hace parte de un gran esfuerzo por salir adelante, en el cual, directa o indirectamente, participaron muchas personas enseñando, orientando, leyendo, opinando, corrigiendo, teniéndome paciencia, dándome ánimo y apoyándome en todas las circunstancias.

Agradezco inmensamente al profesor Luis Fernando Carvajal, por su dedicación, apoyo y cercanía, por haber confiado en mi trabajo y por sus consejos. Al profesor Juan David Velásquez, director de la escuela de Sistemas, por sus recomendaciones, a los profesores de la escuela de Geociencias y Medio Ambiente por sus enseñanzas y orientaciones y a mis compañeros del posgrado por la amistad brindada.

Al Departamento Administrativo de Ciencia, Tecnología e Innovación de Colombia (COLCIENCIAS) y la Universidad Nacional de Colombia, por financiar mediante el programa Jóvenes Investigadores – Generación del Bicentenario, el desarrollo del presente trabajo y al instituto Interamericano para la investigación del cambio global (IAI), por su cooperación.

A mi familia, por su apoyo incondicional, por entender mis ausencias y brindarme lo necesario. Ellos son la razón de mis esfuerzos. A Leidy Andrea que desde el primer día hasta hoy apoya de forma incondicional todos mis emprendimientos.

Gracias a todos.

Page 5: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH -UNAL

Resumen

La estrecha relación no lineal entre la hidrología de Colombia y los procesos climáticos a escala global justifican el estudio de modelos no lineales de pronóstico de caudales. El presente trabajo presenta la predicción de caudales medios mensuales en Colombia usando modelos matemáticos ( métodos espectrales y de regresión) y juicio experto. El horizonte de pronóstico es de 1, 3, 6 y 12 meses. Las regresiones localmente ponderadas y las redes neuronales polinómicas son presentadas como dos nuevas técnicas para el pronóstico de caudales medios mensuales en Colombia.

El método del promedio simple (MPS), el método del promedio ponderado (MPP), el método de redes neuronales artificiales (MRN) y el método ANFIS son presentados como técnicas de combinación de pronósticos. La comparación de los resultados muestra que el método ANFIS es el más eficiente en la combinación de pronósticos de caudales medios mensuales. Finalmente lo árboles de regresión- decisión son expuestos para incorporar el juicio experto en los pronósticos de caudales.

Palabras Clave: Hidro-climatología de Colombia, Predicción no lineal de caudales, Modelación de series de tiempo, predicción con variables explicativas, juicio experto.

Abstract

The close nonlinear relationship between Colombian hydrology and global climatic processes justifies the study of nonlinear river flow models. This work shows the nonlinear river flow dynamics in Colombia using mathematical models (regression and spectral methods) and expert opinions. The prediction window length is 1, 3, 6 and 12 months. The locally weighted regression and the polynomial neural networks are present are presented as new techniques of river flow forecast in Colombia.

The simple average method (SAM), the weighted average method (WAM), the neural network method (NNM) and the first order Takagui-Sugeno Fuzzy system are explained to combine together the simulations results of different conceptual modes to river flow forecasting. The comparison of the forecast simulation efficiency of the Takagui-Sugeno method with the other three combination methods demonstrates that the first order Takagui-Sugeno method is the most efficient. Finally the regression-decision tress are presented for incorporate the expert opinions in the forecast process.

Keywords: Hydro-climatology of Colombia, time series modeling, nonlinear river flow prediction, prediction with exogenous variables, expert opinions.

Page 6: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

TABLA DE CONTENIDO

Pg.

1 PROBLEMÁTICA DE LA PREDICCIÓN DE CAUDALES 1-1

1.1 SOBRE LA NECESIDAD DEL PRONÓSTICO DE CAUDALES 1-1

1.2 EXPERIENCIAS EN EL ANÁLISIS Y LA PREDICCIÓN DE CAUDALES MEDIOS MENSUALES EN COLOMBIA.

1-2

1.3 SOBRE LA NECESIDAD DE MEJORAR LOS PRONÓSTICOS 1-3

1.4 BARRERAS QUE DIFICULTAN LA PREDICCIÓN DE CAUDALES MEDIOS MENSUALES EN COLOMBIA.

1-4

1.5 DELIMITACIÓN DEL PROBLEMA DE INVESTIGACIÓN 1-5

1.5.1 En cuanto a los modelos considerados. 1-6

1.5.2 En cuanto al protocolo de predicción. 1-6

1.5.3 En cuanto a los casos de aplicación y el horizonte de pronóstico. 1-6

1.6 OBJETIVOS 1-8

1.6.1 Objetivo general: 1-8

1.6.2 Objetivos específicos: 1-8

1.7 IMPACTOS, APORTES Y CONTRIBUCIÓN 1-8

1.8 SOBRE LA ORGANIZACIÓN DEL DOCUMENTO 1-9

1.9 DIFUSIÓN DE LOS RESULTADOS 1-9

1.9.1 Artículos 1-9

1.9.2 Ponencias en eventos 1-9

1.9.3 Otros 1-10

Page 7: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

2 RELACIONES ENTRE LOS CAUDALES DE COLOMBIA Y LA CLIMATOLOGÍA GLOBAL

2-1

2.1 HIDROCLIMATOLOGÍA DE COLOMBIA A DIFERENTES ESCALAS ESPACIO-TEMPORALES

2-1

2.2 VARIABILIDAD ANUAL DE LOS CAUDALES EN COLOMBIA 2-5

2.2.1 El efecto de la ZCIT 2-5

2.2.2 El chorro del Occidente Colombiano (Chorro del Chocó) 2-6

2.2.3 Advección de humedad desde el Amazonas 2-11

2.3 variabilidad de los caudales medios mensuales a escala inter-anual 2-13

2.4 VARIABILIDAD DE LOS CAUDALES MEDIOS MENSUALES A ESCALA INTER-DECADAL

2-18

2.4.1 La Oscilación Decadal del Pacífico (PDO) 2-18

2.4.2 Oscilación del Atlántico Norte 2-19

2.5 TÉCNICAS ESPECTRALES PARA LA CUANTIFICACIÓN DEL EFECTO DEL MACROCLIMA SOBRE LA HIDROLOGÍA DE COLOMBIA

2-20

2.6 SOBRE LA AUTO-CORRELACIÓN Y LA PERSISTENCIA EN LAS SERIES DE CAUDALES

2-24

2.7 ANÁLISIS DE RESULTADOS 2-24

3 MÉTODOS ACTUALES PARA EL PRONÓSTICO DE CAUDALES 3 -1

3.1 INTRODUCCIÓN AL ANÁLISIS PREDICTIVO 3-1

3.2 TÉCNICAS DE ANÁLISIS PREDICTIVO APLICADAS EN LA PREDICCIÓN DE CAUDALES

3-2

3.2.1 Regresión lineal Múltiple (RLM) 3-2

3.2.2 Modelos de series de tiempo 3-4

3.2.3 Redes Neuronales Artificiales RNA 3-6

Page 8: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

3.2.4 Polinomios Adaptivos de regresión Multivariada (MARS) 3-8

3.3 ESTRATEGIA DE VALIDACIÓN E INTERVALOS DE CONFIANZA 3-12

3.3.1 Validación de los modelos de pronóstico 3-12

3.3.2 Pronósticos probabilísticos e intervalos de confianza 3-15

3.4 TÉCNICAS PARA MEJORAR LOS PRONÓSTICOS DE CAUDALES 3-16

3.4.1 Sobre el pre-procesamiento de los datos 3-16

3.4.2 Estacionariedad de los datos. 3-18

3.4.3 Modelos periódicos de pronóstico 3-21

3.4.4 Incorporación de los métodos espectrales en la predicción. 3-23

3.5 METODOLOGIA GENERAL PARA LA PREDICCIÓN DE CAUDALES 3-24

3.5.1 Protocolo de predicción 3-24

3.6 ANÁLISIS DE RESULTADOS 3-30

4 INCORPORACIÓN DE NUEVAS TÉCNICAS DE PRONÓSTICO 4-1

4.1 POLINOMIOS LOCALMENTE PONDERADOS 4-1

4.1.1 Polinomios localmente ponderados - mínimos cuadrados móviles 4-2

4.1.2 Funciones de influencia Radial (RBF) 4-4

4.2 REDES POLINÓMICAS 4-9

4.2.1 Algoritmo de agrupación para el tratamiento de Datos (GMDH). 4-9

4.2.2 Topología y pasos para la construcción de una red neuronal polinómica 4-10

4.3 APLICACIÓN DE LAS NUEVAS TÉCNICAS AL PRONÓSTICO DE CAUDALES MEDIOS MENSUALES EN COLOMBIA.

4-16

4.4 ANÁLISIS DE LOS RESULTADOS 4-20

Page 9: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

5 COMPARACIÓN Y COMBINACIÓN DE PRONÓSTICOS HIDROLÓGICOS

5-1

5.1 INTRODUCCIÓN 5-1

5.2 COMPARACIÓN DE PRONÓSTICOS 5-2

5.2.1 Test de Diebold y Mariano 5-2

5.2.2 Aplicaciones del test de Diebold y Mariano en la predicción de caudales 5-4

5.3 COMBINACIÓN DE PRONÓSTICOS 5-8

5.3.1 Esquema general de la combinación de pronósticos 5-9

5.3.2 Método del promedio simple (MPS) 5-10

5.3.3 Método del promedio ponderado (MPP) 5-11

5.3.4 Método de las Redes Neuronales (MRNA). 5-12

5.3.5 Método ANFIS. 5-13

5.3.6 Aplicación de los métodos de combinación a los pronósticos de los caudales medios mensuales de algunos ríos en Colombia.

5-15

5.4 ANÁLISIS DE RESULTADOS 5-20

6 PREDICCIÓN BASADA EN REGLAS DE JUICIO 6-1

6.1 ÁRBOLES DE DESICIÓN 6-1

6.2 ÁRBOLES DE REGRESIÓN-DESICIÓN 6-2

6.2.1 Aspectos generales del algoritmo de clasificación M5. 6-2

6.2.2 Variables usadas en el algoritmo M5 6-6

6.2.3 Propuesta metodológica para la incorporación de información climática mediante reglas de juicio.

6-7

Page 10: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

6.2.4 Aplicación del modelo M5 sobre los pronósticos de caudales 6-11

6.3 ÁRBOLES DECISIÓN DERIVADOS EMPÍRICAMENTE 6-15

6.3.1 Matriz de Validación 6-16

6.3.2 Sobre el signo de error de validación 6-19

6.3.3 Construcción de árboles de decisión 6-21

6.4 ANÁLISIS DE RESULTADOS 6-24

Page 11: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

LISTA DE FIGURAS

Pg.

Figura 1 1 Series de caudal y su ubicación aproximada 1-7

Figura 2 1 Tipos de eventos macro-climáticos que afectan la hidrología de Colombia.

2-2

Figura 2 2 Suma vectorial de los ciclo anual y semianual de la precipitación en Colombia, Mejía et al. (1999).

2-6

Figura 2 3 Ciclo anual de los caudales medios mensuales usados en el presente trabajo

2-7

Figura 2 4 Magnitud y dirección de los vientos a 925 mb (m/s) para la estación SON. Poveda et al (2006).

2-9

Figura 2 5 Componentes zonal y meridional de la advección de humedad en 5°N-5º30’ N & 77°W-77°30.

2-10

Figura 2 6 Ciclo anual del trasporte de humedad por los vientos de la corriente del chorro del Chochó y su comportamiento durante los eventos de El Niño y La Niña (Rendón, 2001).

2-11

Figura 2 7 Correlación entre los índices zonal y meridional del chorro del Chocó y los caudales del presente estudio.

2-11

Figura 2 8 Interacción Suelo-Atmósfera en la cuenca del Amazonas. Poveda et al. (2006)

2-12

Figura 2 9 Componente meridional de la advección de humedad desde el Amazonas y su ciclo anual.

2-12

Figura 2 10 Análisis de correlación entre la advección de humedad desde el Amazonas (componente meridional) y los caudales del presente estudio.

2-13

Figura 2 11 Correlación entre las anomalías de temperatura en los océanos y la primera componente principal de las series de caudales de los grupos RVP, RVNRVM,ROC.

2-15

Figura 2 12 Análisis de correlación entre el Índice de Oscilación del Sur (SOI) y los caudales

2-16

Page 12: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

Figura 2 13 Fases e índice de la Oscilación Decadal del Pacífico (PDO) (http://jisao.washington.edu/pdo/PDO.latest).

2-18

Figura 2 14 Análisis de correlación entre la PDO (-2) y los caudales del presente estudio.

2-19

Figura 2 15 Fases e índice de la NAO, adaptado de http://www.atmosphere.mpg.de 2-20

Figura 2 16 Análisis de correlación cruzada entre el índice NAO y los caudales de los ríos en Colombia.

2-21

Figura 2 17 Aplicación de la transformada continua en onditas usando la ondita Morlet para el río Magdalena en Calamar (Poveda et al, 2002)

2-22

Figura 2 18 Aplicación de la trasformada discreta en onditas para 6 niveles de descomposición usando la ondita discreta de Meyer

2-23

Figura 2 19 Autocorrelogramas de las series de caudales estandarizadas 2-25

Figura 3 1 Topología de red neuronal para pronóstico de Caudales 3-7

Figura 3 2 Esquema de validación cruzada 3-13

Figura 3 3 Esquema de validación retroactiva 3-13

Figura 3 4 Predicción de los caudales medios mensuales del río Guadalupe usando RLM para una ventana de un mes, período 2000-2007.

3-15

Figura 3 5 Esquema de pronóstico probabilístico para el río Guadalupe en enero de 2006.

3-16

Figura 3 6 Análisis de estacionariedad clásico aplicado a la predicción de caudales del río Tenche con un modelo Lineal

3-19

Figura 3 7 Evolución de la estacionariedad con el tamaño de la ventana en una serie de tiempo (Koutsoyiannis, 2006).

3-20

Figura 3 8 Análisis de estacionariedad usando la descomposición en modos intrínsecos para la predicción de caudales del río Tenche.

3-20

Figura 3 9 Estacionalidad en el error 3-21

Figura 3 10 Comparación entre modelo lineal y un modelo lineal periódico para la predicción de caudales del rió Grande con horizonte de un mes

3-22

Page 13: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

Figura 3 11 Incorporación de métodos espectrales en el pronóstico hidrológico, caso río Bata

3-23

Figura 3 12 Protocolo para la predicción de caudales medios mensuales en Colombia

3-25

Figura 3 13 Esquema general para la construcción de modelos de pronóstico 3-26

Figura 3 14 El problema del pronóstico de los caudales máximos 3-31

Figura 3 15 Comparación indicadores de error para los ríos Guadalupe, Tenche y Grande

3-32

Figura 3 16 Comparación indicadores de error para los ríos Porce, Guatapé y Nare 3-33

Figura 3 17 Comparación indicadores de error para los ríos San Carlos, San Lorenzo y Miel.

3-34

Figura 3 18 Comparación indicadores de error para los ríos Magdalena, Guavio y Batá.

3-35

Figura 3 19 Error MAPE para MARS (p) +OND a diferentes horizontes de pronóstico

3-36

Figura 4 1 Comparación entre una regresión global y una regresión local. 4-3

Figura 4 2 Caudales del rio Guadalupe Vs SST Niño 1-2 y Niño 3-4 4-5

Figura 4 3 El concepto de influencia Radial 4-6

Figura 4 3 Aplicación de RBF Multicuadrática para el pronóstico de caudales. 4-8

Figura 4 2 Algoritmo de agrupación para el tratamiento de datos. I: primer capa de auto-selecciones, II segunda capa de autoselección, III: selección de todas las soluciones, IV: optimización.

4-9

Figura 4 3 Descripción general de una red Polinómica 4-12

Figura 4 4 Topología de una red polinómica 4-13

Figura 5 1 Comparación entre casos de predicción del río guadalupe con ventanas de un mes usando variables explicativas del enso

5-5

Figura 5 2 Introducción de rezagos de la serie de caudales como variable 5-6

Page 14: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

Explicativa en el río guadalupe-comparación.

Figura 5 3 Procedimiento general para la combinación de pronósticos 5-10

Figura 5 4 Esquema de red neuronal usada en la combinación de pronósticos. 5-12

Figura 5 5 Modelo anfis para la combinación de pronósticos. 5-14

Figura 5 6 Pronósticos a un mes del río miel arrojados por los diferentes modelos. 5-16

Figura 5 7 Resultados de combinación de pronósticos 5-17

Figura 6 1 Modelo de árbol binario 6-2

Figura 6 2 Esquema de un árbol de regresión por inducción. 6-3

Figura 6 3 Esquema de un árbol de regresión por inducción. 6-4

Figura 6 4 Pronóstico de las SST en la región Niño 3.4 usando un modelo marcoviano (http://www.cpc.ncep.noaa.gov/products/people/yxue/SL_forecast_clim71-00_godas.html).

6-8

Figura 6 5 Pronóstico probabilístico del ENSO elaborado por el IRI 6-9

Figura 6 6 Variables utilizadas en la construcción del árbol de decisión para el río Guadalupe

6-11

Figura 6 7 Árbol de decisión generado por el Algoritmo M5 para el río Guadalupe 6-12

Figura 6 8 Validación de la corrección de los pronósticos usando un árbol de Decisión M5

6-13

Figura 6 9 Árboles de decisión para la predicción de los ríos Guadalupe, Tenche, Grande, Porce

6-16

Figura 6 10 Árboles de decisión para la predicción de los ríos Guadalupe, Tenche, Grande, Porce

6-20

Figura 6 11 Árboles de decisión para la predicción de los ríos Guadalupe, Tenche, Grande, Porce

6-21

Figura 6 12 Árboles de decisión para el pronóstico la predicción de los ríos Nare y Guatapé

6-22

Page 15: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

Figura 6 13 Árboles de decisión para el pronóstico de los ríos San Carlos y San Lorenzo

6-22

Figura 6 14 Árboles de decisión para el pronóstico de los ríos Miel y Magdalena en Betania

6-23

Figura 6 15 Árboles de decisión para el pronóstico de los ríos Batá y Guavio 6-23

Page 16: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

LISTA DE TABLAS

Pg.

Tabla 1 1 Información de caudales 1-6

Tabla 2 1 Ciclo anual y variabilidad de los caudales medios mensuales del los ríos analizados

2-8

Tabla 2 2 El ciclo anual de los caudales para periodos Niña, Niño y Normal según el ONI.

2-17

Tabla 2 3 Periodos asociados a las componentes principales en algunos ríos de Colombia (Rojo & Carvajal 2007)

2-22

Tabla 3 1 Validación 2000-2007, Río Guadalupe con los diferentes modelos de pronóstico

3-28

Tabla 3 2 Validación 2000-2007, Río Batá con los diferentes modelos de pronóstico

3-29

Tabla 4 1 Estructuras de una red polinómica 4-14

Tabla 4 2 Comparación de los PPON usando diferentes métodos espectrales 4-18

Tabla 4 2 Predicción de caudales río Guadalupe con Polinomios ponderados y Redes polinómicas

4-20

Tabla 4 3 Predicción de caudales río Batá con Polinomios ponderados y Redes polinómicas

4-21

Tabla 5 1 Valores del estimador S del test de de Diebold y Mariano para casos

de pronóstico usando diferentes variables explicativas

5-5

Tabla 5 2 Valores de S obtenidos en la comparación entre modelos de

pronóstico con variables macro-climáticas y rezagos de caudal para el río Guadalupe

5-6

Tabla 5 3 Valores de S obtenidos en la comparación de pronósticos de caudales

en el río Guadalupe v=1;

5-7

Tabla 5 4 Valores de S obtenidos en la comparación de pronósticos de 5-7

Page 17: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

caudales en el río Guadalupe v=3;

Tabla 5 5 Valores de S obtenidos en la comparación de pronósticos de caudales

en el río Guadalupe v=6;

5-8

Tabla 5 6 Valores de S obtenidos en la comparación de pronósticos de caudales

en el río Guadalupe v=12

5-8

Tabla 5 7 combinación de pronósticos para el río Guadalupe validación 2000-2007

5-18

Tabla 5 8 Combinación de pronósticos para el río Batá validación 2000-2007 5-19

Tabla 6 1 Clasificación de las fases del ENSO para los pronósticos probabilísticos del IRI

6-10

Tabla 6 2 Tipos de variables utilizadas para la corrección de pronósticos usando M5

6-10

Tabla 6 3 Corrección de pronósticos usando M5 para los ríos Tenche y Guatapé. 6-13

Tabla 6 4 Corrección de pronósticos usando M5 para los ríos Nare, San Carlos y san Lorenzo.

6-14

Tabla 6 5 Corrección de pronósticos usando M5 para los ríos Magdalena, Guavio y Batá.

6-15

Tabla 6 6 Matriz de Validación para los ríos Guadalupe, Tenche , Porce y Grande, para pronósticos durante eventos El Niño, Normales (Neutros) y La Niña

6-17

Tabla 6 7 Matriz agregada de validación para los ríos del Grupo 1. 6-18

Tabla 6 8 Matriz de validación y signo del error para los ríos del Grupo 1 (Guadalupe, Tenche, Porce y Riogrande)

6-20

Page 18: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH -UNAL

Capítulo 1:

Problemática de la

predicción de caudales

“. . . it is always very difficult to predict the future on the basis of the past. Indeed it has been likened to driving a car blindfolded while

following directions given by a person looking out of the back window . . .”

Harvey (1989, p. xi)

Page 19: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL 1-1

1 PROBLEMÁTICA DE LA PREDICCIÓN DE CAUDALES

RESUMEN

El presente capítulo tiene por objeto exponer la necesidad que existe de mejorar la predicción de caudales medios mensuales en Colombia. Se explica la importancia de las predicciones hidrológicas en el planeamiento y manejo de los recursos hídricos y a su vez se hace un resumen de las diferentes experiencias que ha tenido Colombia en la materia. Como las condiciones de pronóstico son dependientes de la hidro-climatología del país a diferentes escalas espacio-temporales, se exponen algunas de las barreras que dificultan la obtención de predicciones acertadas permitiendo identificar la predicción de caudales medios mensuales como un problema difícil, relevante y oportuno.

Según los objetivos, el presente trabajo pretende abordar el reto de mejorar el pronóstico de los caudales medios mensuales en Colombia utilizando nuevos modelos y reglas de juicio experto. Para ello se desarrollará un protocolo de predicción aplicado a las series de caudales de los doce ríos más relevantes dentro del sector eléctrico nacional. Finalmente se espera que los resultados y metodologías obtenidas en el presente trabajo sirvan para entregar a los usuarios finales de las predicciones pronósticos más acertados y acordes con la realidad hidro-climatológica del país.

1.1 SOBRE LA NECESIDAD DEL PRONÓSTICO DE CAUDALES

De todos los elementos del ciclo hidrológico los caudales de los ríos pueden ser los que mayores consecuencias tienen sobre la vida de los seres humanos. La seguridad alimentaría depende de hectáreas de tierras irrigadas con el agua proveniente de ríos y los embalses que regulan su flujo, en muchas zonas del planeta los diferentes cursos de agua representan la fuente primaria para el consumo doméstico y la generación de hidroelectricidad, gran parte de la industria y el comercio requiere del agua de los ríos para su abastecimiento, innumerables poblaciones desarrollan su vida cotidiana y hacen de los ríos su vía de comunicación, motivos suficientes para convertir los pronósticos de caudales en el objetivo principal de muchos tipos de estudios relacionados con el planeamiento y manejo de los recursos hídricos.

Son muchos los sectores de la economía nacional que están estrechamente ligados a la oferta hídrica provista por los ríos del país; el caso particular del sector eléctrico cobra relevancia en épocas donde las sequías golpean con severidad los ríos que surten los embalses de Colombia. La disminución de las lluvias y la reducción del nivel de los embalses han llevado en muchas ocasiones a las autoridades de la nación a proponer planes de ahorro de energía y cortes de agua ante la amenaza de un posible racionamiento, los periodos de sequía han puesto al Sector Eléctrico en condiciones criticas que recuerdan el racionamiento de los años 1992-1993 donde los niveles de los embalses llegaron al catorce por ciento de su capacidad y cuyas

Page 20: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL 1-2

consecuencias llevaron a una profunda reforma del sistema eléctrico nacional; desde entonces el mercado mayorista de la energía en Colombia utiliza la predicción de caudales medios mensuales como un insumo de gran importancia que permite inferir precios futuros de la electricidad valorando así los beneficios económicos derivados de la aplicación de tales predicciones en la operación del Sistema Eléctrico Nacional.

Pese a ser el sector eléctrico el principal usuario de los pronósticos de caudales medios mensuales en Colombia, en países desarrollados tales previsiones también son utilizadas en la planificación y manejo de distritos de riego, los sistemas de agua potable, de navegación fluvial, el Control de inundaciones, la previsión de los rendimientos de cultivos, y el aprovechamiento de los recursos hídricos en general.

1.2 EXPERIENCIAS EN EL ANÁLISIS Y LA PREDICCIÓN DE CAUD ALES MEDIOS MENSUALES EN COLOMBIA.

En cuanto a los modelos utilizados para predecir caudales medios mensuales en Colombia, en el sector eléctrico colombiano fue común durante los años setenta y ochenta el uso de modelos tipo AR, ARMA y ARIMA para la generación de series sintéticas de tiempo (Múnera, 1983) pretendiendo representar comportamientos futuros de la hidrología que pueden ocurrir en periodos de tiempo indeterminados, algo no muy convencional para efectos de la predicción pues dichos modelos solo requieren de registros de caudales para su ejecución desconociendo la dinámica externa no lineal asociada a los fenómenos macro-climáticos, además son construidos bajo el supuesto de la normalidad y linealidad de los datos. La no linealidad de los procesos hidrológicos ha hecho necesario el estudio de nuevos modelos de predicción no lineal asociados a novedosas técnicas de tratamiento matemático y estadístico de los datos; la primera apuesta en dicho sentido fue aplicada a la hidrología colombiana por Carvajal y Salazar (1994) presentando el Análisis Espectral Singular, las Redes Neuronales y los modelos dependientes del régimen (RAR).

Los modelos auto-regresivos dependientes del régimen (RAR) (Salazar, 1994) son una clase de modelos no lineales cuya idea básica consiste en asumir que el régimen hidrológico está claramente ligado a las variaciones macro-climáticas, explorando la posibilidad de que las series de precipitación y caudal tengan propiedades estadísticas dependientes del estado que presentan las variables macro-climáticas, así pues, el objeto de los modelos tipo RAR es el de ajustar las propiedades estocásticas de una serie dependiendo del estado de una variable externa que se considera influyente en el comportamiento del fenómeno analizado.

Dada la complejidad en los problemas de pronósticos Carvajal (1994-1998) combinó el Análisis Espectral Singular (AES) con métodos auto-regresivos y regresiones lineales múltiples para el desarrollo de una nueva herramienta de predicción de caudales, cuya aplicación corresponde a la primera aplicación de los métodos espectrales en la predicción hidrológica de Colombia. Posteriormente Hoyos (1999) introdujo algunas aplicaciones del método espectral basado en la descomposición en onditas y Poveda et al. (2002) presentan el

Page 21: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL 1-3

modelo PREBEO (“Predicción en Bandas Espectrales usando Onditas”) para pronósticos de caudales, cuyo funcionamiento combina la descomposición en óndulas de una serie con regresiones lineales múltiples. Finalmente el trabajo de Carmona (2010) introdujo la trasformada de Hilbert Huang en el estudio de series hidro-climáticas y su aplicación en la predicción hidrológica.

Desde el PARH de la Universidad Nacional de Colombia se han propuesto además: Las redes neuronales artificiales (RNA), introducidas por Carvajal (1994) para la predicción de caudales medios mensuales en Colombia, como un modelo de regresión no lineal y no paramétrico que puede desarrollar un buen trabajo de ajuste tolerando adecuadamente componentes caóticas generadoras de ruido en la serie; los Modelos Lineales Inversos (MLI) para la predicción de diferentes condiciones del ENSO (Ceballos, 2005); las técnicas de regresión no paramétrica como las regresiones Kernel (Poveda et al, 2002), los polinomios Multivariados y adaptivos conocidos como MARS (Rendón,1997) y las funciones Holt – Winters (Poveda, 2006) cuya aplicación busca capturar la no estacionalidad presente en las series de caudales, así mismo las redes adaptivas Neuro-Difusas (ANFIS) que aparecen en los 90 como sistemas capaces de combinar los sistemas de inferencia difusos con redes neuronales fueron propuestas como técnicas de regresión para la predicción de caudales (Smith et al, 2004); los sistemas de inferencia difusos proveen un mecanismo intuitivo de alto nivel para representar el conocimiento mediante reglas de juicio IF/THEN y las redes neuronales poseen un alto grado de adaptabilidad, capacidad de aprendizaje y de generalización, siendo una aproximación idónea al problema del pronóstico hidrológico.

Así pues, los investigadores del tema a nivel nacional han conseguido recopilar una notable cantidad de modelos utilizados para la predicción de caudales, sin embargo en muchas ocasiones los pronósticos no son los más acertados en el tiempo y espacio por lo que se requiere de la aplicación de varios modelos para manejar la incertidumbre a fin de tomar una decisión.

1.3 SOBRE LA NECESIDAD DE MEJORAR LOS PRONÓSTICOS

La predicción mensual de caudales medios se ve seriamente afectada por las condiciones climatológicas cambiantes del año, en consecuencia los pronósticos no siempre coinciden en tiempo y espacio con los eventos reales. Los grandes cambios en la hidrología de Colombia suelen estar relacionadas con la alta variabilidad espacio-temporal de fenómenos macro-climáticos a gran escala (Poveda, 2004) y por ello la capacidad de predicción para los caudales de los ríos de Colombia cambia según las condiciones en las que se encuentre el año analizado (Smith et al. 2004). De manera análoga también debe tenerse en cuenta la dinámica no lineal de la hidro-climatología para modelar el comportamiento de los caudales dado que la predicción está sujeta a un alto grado de incertidumbre derivada del caos inherente a la naturaleza. Las relaciones existentes entre la hidrología del país y la climatología global no son del todo claras en términos de su intensidad espacio-temporal, por cuanto no existen formas de cuantificar el efecto no lineal con el que actúa el macro-clima sobre la hidrología

Page 22: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL 1-4

del país; para mejorar la predicción de caudales se deben establecer una serie de metodologías tendientes a evaluar más a fondo las relaciones entre la hidro-climatología a gran escala y la variabilidad espacio-temporal de nuestra hidrología permitiendo potenciar las posibilidades de los modelos de predicción que hasta ahora son utilizados.

Algunas de las dificultades más notorias en los procesos y aleatoriedad de predicción tienen relación con la ventana de pronóstico, al aumentar dicho horizonte la incertidumbre es mayor y el desconocimiento de la variable a predecir aumenta. La experiencia muestra que todos los modelos aplicados hasta el momento arrojan buenos pronósticos para caudales mínimos, pero para los máximos los resultados no son los más acertados. La mayoría de los modelos para el pronóstico de caudales medios mensuales en Colombia, se reducen a un tipo de regresión matemática cuya calidad se ve afectada por las posibles discriminaciones del modelo a la hora de involucrar variables explicativas, en relación a lo anterior suele pasar que los modelos matemáticos aprecian mas la persistencia de la propia serie que a las variables macro-climáticas, por lo que el efecto futuro del macro-clima sobre los caudales suele ser subvalorado, en adición, muchos de los modelos poseen dificultades para reconocer relaciones causales simultáneamente, y en especial, cuando ellas son no-lineales. Por otro lado, los pronósticos basados en juicios son más creíbles que aquellos basados en sofisticados modelos matemáticos (Bunn y Wright, 1991), sin embargo, la calidad del pronóstico se ve afectada a falta de un proceso sistemático de razonamiento que los hace poco defendibles, argumentables, estando soportados en las evidencias difíciles documentar (Velásquez, 2008).

El desarrollo de un sistema basado en modelos matemáticos y juicio experto para la predicción de caudales medios mensuales en Colombia pretende mejorar la capacidad y la eficiencia de los modelos actualmente utilizados para predecir caudales en el país. Su propósito será el de articular atributos hidro-climáticos a los pronósticos mensuales de caudales mediante la incorporación de nuevas técnicas de pronóstico así como decisiones inteligentes obtenidas en forma de reglas basadas en la experiencia y el juicio de un experto. Una investigación de esta naturaleza es del todo necesario porque se requiere obtener un mejor entendimiento de la relación existente entre la hidro-climatología global y los caudales de los ríos colombianos, además, sus resultados permitirán establecer criterios de planeación que sirvan de apoyo en la toma de decisiones para el sector eléctrico, el sector agrícola, y entidades relacionadas con la prevención de desastres y la gestión del riesgo climático en Colombia.

1.4 BARRERAS QUE DIFICULTAN LA PREDICCIÓN DE CAUDALES M EDIOS MENSUALES EN COLOMBIA.

Los caudales de un determinado río son el resultado de una interacción compleja, e incluso caótica, entre muchas variables; la principal barrera para el pronóstico de caudales radica en la complejidad del sistema hidrológico y su interrelación con los procesos climáticos de gran escala, dicha complejidad suele minimizarse cuando se plantea un modelo matemático cuyas hipótesis tienen una influencia directa sobre la eficiencia de los pronósticos puesto que solo

Page 23: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL 1-5

capturan ciertas partes del comportamiento hidrológico, además, a los modelos matemáticos les resulta difícil incorporar información cualitativa, subjetiva y contextual en los pronósticos.

Las características particulares de las series de caudales medios mensuales, relacionadas con sus propiedades estadísticas (no estacionalidad, cuasi-periodicidad, etc.), la complejidad y el gran número de factores que los afectan, imponen los siguientes requerimientos en la formulación de modelos para el pronóstico de caudales (Velásquez, 2008):

• Modelación no lineal.

• Capacidad para manejar simultáneamente una gran cantidad de variables explicativas.

• Capacidad de ponderar la información disponible en el tiempo.

La aplicación de los modelos matemáticos en predicción hidrológica posee una dificultad directamente relacionada con la cantidad de información utilizada para entrenar el modelo, poder describir de manera adecuada un proceso requiere los datos suficientes para hacerlo y en muchas ocasiones ocurre que el ajuste de la muestra de entrenamiento es muy preciso mientras que el modelo de toda la población es relativamente pobre, este peligro ha sido señalado por Velásquez (2008) citando las palabras de Harvey (1989, p. xi):

“. . . it is always very difficult to predict the future on the basis of the past. Indeed it has been likened to driving a car blindfolded while following directions given by a person looking out of the back window . . .”

En resumen, todos los modelos están limitados por la influencia de los eventos macro-climáticos, la cantidad de datos utilizados, la longitud de la ventana de predicción, además de la capacidad matemática y estadística para reconocer la dinámica no lineal del sistema analizado, en ese sentido las predicciones varían según los modelos, requiriendo de varios resultados para tomar una decisión.

1.5 DELIMITACIÓN DEL PROBLEMA DE INVESTIGACIÓN

Se ha identificado la predicción de caudales medios mensuales como un problema difícil, relevante y oportuno; no obstante, es imposible intentar dar respuesta a todos los interrogantes planteados arriba en una única tesis, por lo tanto es necesario delimitar la investigación de tal forma que sea alcanzable en los tiempos y la dedicación estipulados.

Page 24: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL 1-6

1.5.1 En cuanto a los modelos considerados.

En cuanto a los modelo de predicción de caudales, se espera describir de forma general los modelos existentes y de uso más frecuente, proponiendo algunas técnicas que permitan mejorar sustancialmente su capacidad de pronóstico. Dos nuevas técnicas matemáticas, los polinomios ponderados y las redes polinómicas, serán propuestas e implementadas para la predicción de caudales medios mensuales en Colombia.

1.5.2 En cuanto al protocolo de predicción.

De manera paralela se presenta una secuencia metodológica que permite orientar el proceso de predicción de caudales, mediante la comparación de los resultados, la combinación de información y la incorporación del juicio experto durante la elaboración de los pronósticos.

1.5.3 En cuanto a los casos de aplicación y el horizonte de pronóstico.

Los modelos y procedimientos aquí presentados serán aplicados al pronóstico de los caudales medios mensuales de doce de los ríos más relevantes para la generación eléctrica del país, ellos son: Guadalupe, Tenche, Riogrande, Porce, Nare, Guatapé, San Carlos y San Lorenzo en el departamento de Antioquia; Miel en el departamento de Caldas, Magdalena en el sitio Betania del departamento del Huila; el río Guavio en Cundinamarca y el río Batá en Boyacá. Dicha información es provista de forma libre por las diferentes compañías oferentes del sector eléctrico nacional y administrada por la compañía de Expertos en Mercados XM. En la Figura 1-1 se presenta la localización aproximada de las estaciones de medición de caudal en el territorio nacional y en la ¡Error! No se encuentra el origen de la referencia. se hace una descripción de los datos. Los horizontes de pronóstico planteados para el desarrollo del presente estudio serán de uno (1), tres (3), seis (6) y doce (12) meses.

Tabla 1-1 Información de caudales

NOMBRE DATO INICIAL DATO FINAL TOTAL DATOS (meses) GUADALUPE 1-1936 12-2008 816 TENCHE 1-1955 12-2008 648 REIOGRANDE 1-1942 12-2008 804 PORCE 1-1973 12-2008 432 NARE 1-1956 12-2008 636 GUATAPÉ 1-1959 12-2008 600 SAN CARLOS 1-1965 12-2008 528 SAN LORENZO 1-1967 12-2008 504 MIEL 1-1965 12-2008 528 MAGDALENA 1-1961 12-2008 576 GUAVIO 1-1963 12-2008 552 BATA 1-1956 12-2008 636

Page 25: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL 1-7

Figura 1-1 Series de caudal y su ubicación aproximada

Page 26: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL 1-8

1.6 OBJETIVOS

1.6.1 Objetivo general:

• Mejorar la predicción de caudales medios mensuales mediante la utilización de un prototipo basado en modelos matemáticos y juicio experto.

1.6.2 Objetivos específicos:

• Establecer un Benchmark del estado actual de predicción de caudales medios mensuales en el país.

• Incorporar en la construcción del modelo el uso de variables explicativas que reflejen el comportamiento macro-climático

• Revisar los últimos avances en temas relacionados con la predicción en hidrología e incorporar aquellos que sean relevantes para caso colombiano.

• Ajustar los pronósticos mediante reglas de juicio.

• Desarrollar un Prototipo de Software para la predicción de caudales medios mensuales basado en modelos matemáticos y reglas de juicio.

1.7 IMPACTOS, APORTES Y CONTRIBUCIÓN

Se pretende que los resultados y metodologías obtenidas mediante el presente proyecto sirvan para desarrollar un procedimiento que permita entregar a los usuarios finales de las predicciones valores más acertados y acordes con la realidad hidro-climatológica del país.

Las medidas para mitigar los efectos de eventos macro-climáticos sobre la oferta hídrica nacional solo podrán ser mas efectivas al pronosticar con mayor certidumbre el impacto que tiene dichos eventos sobre la magnitud de los caudales de los ríos del país, una correcta previsión de dichas condiciones permitiría al Sector Eléctrico (y demás interesados) operar sus sistemas de forma más óptima; entre los impactos indirectos se pueden contabilizar las ganancias derivadas de una operación acertada del sector eléctrico colombiano acorde con la hidrología del país.

Page 27: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL 1-9

1.8 SOBRE LA ORGANIZACIÓN DEL DOCUMENTO

El capitulo 2 del presente documento describe de forma general las relaciones entre la climatología global y la hidrología de Colombia y propone algunas técnicas de diagnóstico climático que permiten establecer la correspondencia entre los caudales de Colombia y diversos sistemas macro-climáticos; en el capítulo 3 presenta una explicación general de los modelos de pronóstico de caudales con mayor relevancia en el caso Colombiano, se introducen algunas técnicas de validación y de pronóstico probabilístico, así como algunas técnicas para mejorar la eficiencia de los modelos actuales concluyendo con la predicción y validación de los esquemas de pronóstico propuesto. En el capítulo 4 se introducen dos nuevas técnicas para el pronóstico de caudales, los polinomios localmente ponderados (o de mínimos cuadrados móviles) y las redes Polinómicas y se comparan sus resultados con lo modelos actuales de pronóstico. El capitulo 5 introduce el concepto de comparación y combinación de pronósticos y se aplican dichas metodologías al caso de los pronósticos de caudales medios mensuales en Colombia, El capítulo 6 introduce los árboles de regresión y decisión aplicados al mejoramiento de los pronósticos y finalmente todos los capítulos serán concatenados en la construcción de un protocolo para pronosticar caudales usando modelos matemáticos y juicio experto, se hace un análisis general de los resultados y las conclusiones del trabajo.

1.9 DIFUSIÓN DE LOS RESULTADOS

Los trabajos y contribuciones de esta tesis han sido difundidos mediante la presentación de ponencias en congresos, y la publicación de artículos en revistas especializadas, los cuales son detallados a continuación.

1.9.1 Artículos

ROJO, J. D. y L. F. CARVAJAL. 2010. “Predicción no lineal de caudales usando variables macro-climáticas y análisis espectral singular. Tecnología y Ciencias del Agua antes Ingeniería Hidráulica de México, vol 1, num 4, oct-dic de 2010, México, pp 59-73.

1.9.2 Ponencias en eventos

Rojo J.D. Carvajal, L.F. Velásquez, J.D. (2010). “Combinación de pronósticos de Caudales Medios Mensuales en el río Guadalupe-Colombia”. XXIV Congreso Latinoamericano de Hidráulica”. Punta del este-Uruguay.

Rojo J.D. Carvajal, L.F.( 2010). “Simulación no lineal de Caudales usando la trasformada en Onditas”. XXIV Congreso Latinoamericano de Hidráulica”. Punta del este-Uruguay.

Page 28: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL 1-10

Rojo, J.D. 2010. “Streamflow forecasting using CPT. A comparison with others Models and incorporate the results in a Multimodel Ensemble”; IAI Training Institute on the use of seasonal climate predictions for applications in Latin America. Buenos Aires-Argentina.

1.9.3 Otros

http://www.agenciadenoticias.unal.edu.co/nc/detalle/article/optimizacion-de-metodos-para-prediccion-de-caudales/

http://www.caracol.com.co/nota.aspx?id=1384587

Page 29: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL 1-11

Referencias

Ceballos, L. I., y G. Poveda (2005), Diagnóstico y Predicción de El Niño 2002-2003, Avances en Recursos Hidráulicos, No. 12, 183-198.

Carvajal, L.F., (1994), Acerca de la predicción no lineal en hidrología. Tesis de Maestría, Universidad Nacional de Colombia, Facultad de Minas, Medellín, Colombia. 136 pp.

Carvajal, Luis F, Mesa, Oscar y Poveda, Germán. Predicción Hidrológica en Colombia mediante Análisis Espectral Singular y Máxima Entropía.(1998). En: Ingeniería Hidráulica en México. Vol. XII, Núm. 1, II Época, (enero-abril de 1998); p. 7-16.

Múnera, L. (1983). Modelos Estocásticos para las series Hidrológicas, Universidad Nacional de Colombia, Sede Medellín

Poveda, G., Mesa, O.J, L.F Carvajal, C.D Hoyos, J.F. Mejía, L.A Cuartas y A. Pulgarín. (2002). “Predicción de caudales medios mensuales en ríos colombianos usando métodos no lineales”. Meteorología Colombiana, 6, 101-110.

Poveda, G. (2004), La Hidroclimatología de Colombia: Una síntesis desde la escala interdecadal hasta la escala diurna. Revista Academia Colombiana de Ciencias, Vol 28 (107), 201-222.

Rendón, L.( 1997). Beneficios de la predicción Hidrológica en el sector eléctrico Colombiano, considerando la variabilidad climática. Tesis de Maestría Ingeniería Recursos Hidráulicos, Facultad de Minas, Universidad Nacional de Colombia, Sede Medellín.

Smith R.A. et al. (2001). “Modelos de predicción de caudales mensuales para el sector Eléctrico Colombiano”. Avances en recursos Hidráulicos, 11, Facultad de Minas, septiembre de 2004. P 91-102.

Hoyos, C. (1999), Algunas aplicaciones de la transformada de Fourier y la descomposición en onditas a señales hidrológicas y sísmicas. Tesis Ingeniería Civil, Universidad Nacional de Colombia, Medellín.

Page 30: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH -UNAL

Capítulo 2:

Relaciones entre los caudales de Colombia y la climatología

global.

“… Las estaciones se suceden de la misma manera que en la mayor parte de la zona tórrida; esto es, se conocen dos, verano é invierno: la

última cuando llueve y la otra cuando deja de llover.

Los meses de lluvia en Antioquia principian a mediados de Marzo y terminan a mediados de Junio, para comenzar luego en Septiembre y acabar en los primeros días de Diciembre; pero esta regla está sujeta a numerosas variaciones, pues con frecuencia se invierten los tiempos, volviéndose lluviosos los días de verano y viceversa. A veces el año es húmedo en su mayor parte, y en ocasiones notable por su excesiva

sequedad, muchos de los viejos habitantes del país creen haber observado, y aún lo afirman por la tradición de sus mayores, que los tiempos de lluvia abundante y de gran sequedad, están divididos por

períodos casi fijos de siete a ocho años. Nos parece que tienen razón.”

Manuel Uribe Ángel (1881).

Page 31: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

2-1

2 RELACIONES ENTRE LOS CAUDALES DE COLOMBIA Y LA CLIMATOLOGÍA GLOBAL

RESUMEN

En este capítulo se analiza la variabilidad espacio-temporal de los caudales de los ríos del presente estudio. Se describen las relaciones que existen entre la climatología global y las series de caudales a escalas anuales, interanuales e interdecadales. Los resultados de los análisis de correlación y de evaluación espectral permiten afirmar que la magnitud y la variabilidad del ciclo anual de los ríos analizados está estrechamente ligado con el ciclo de la precipitación en el país y depende de la ubicación de sus cuencas sobre la geografía nacional, la humedad del Chorro del Occidente Colombiano afecta principalmente los ríos de norte y el oriente antioqueño y que existe una fuerte dependencia de los ríos Guavio y Batá de la advección de humedad desde el amazonas.

A escala Interanual el sistema ENSO posee una fuerte influencia en los ríos del presente trabajo, y la variabilidad de los caudales en el país está estrechamente vinculada a la variabilidad de la temperatura del océano Pacífico en las regiones Niño 3 y Niño 4. El ENSO posee una mayor influencia sobre los ríos del norte y el oriente antioqueño y su efecto disminuye de occidente a oriente en el país. El acoplamiento entre el sistema ENSO y el ciclo anual de los caudales analizados muestra que la fase cálida de dicho sistema provoca una disminución en la magnitud de los caudales ubicados en el centro occidente del país.

A escala interdecadal se destaca la relación existente entre los caudales del presente trabajo y la PDO; los métodos espectrales aplicados en el presente estudio detectaron los ciclos de 10-12 años, 5-3 años, 2 años, 6-12 meses 1 y 3 meses y finalmente el estudio de la persistencia en las series de caudales permite demostrar que los caudales son altamente autodependientes.

2.1 HIDROCLIMATOLOGÍA DE COLOMBIA A DIFERENTES ESCALAS ESPACIO-TEMPORALES

Los caudales de los ríos en Colombia están ligados a la alta variabilidad de los fenómenos macro-climáticos que influyen sobre la hidrología a diversas escalas espacio-temporales; cualquier evento hidrológico que se desee modelar posee un carácter altamente no lineal y su predicción estará sujeta a cambios drásticos definidos por las condiciones iniciales y la ubicación espacio-temporal en la que se analicen las variables y fenómenos involucrados.

En términos de la variabilidad a diferentes escalas temporales de la hidrología en Colombia se sabe que el clima del país responde a tres tipos de eventos macro-climáticos: el primero de ellos relaciona aquellos sistemas de carácter astronómico que contribuyen forzando el clima

Page 32: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

2-2

mediante procesos periódicos como los ciclos anuales y diurno de insolación, en segunda instancia se encuentran las oscilaciones climáticas auto-reguladas derivadas de la retroalimentación no lineal entre distintos subsistemas y un tercer grupo de procesos relacionados con las fluctuaciones aleatorias de los factores físicos o químicos que componen el sistema climático (Figura 2-1).

Figura 2-1 Tipos de eventos macro-climáticos que afectan la hidrología de Colombia.

Una síntesis de la hidrología-climatología de Colombia desde la escala inter-decadal hasta la escala diurna fue presentada por Poveda en 2004 donde se pone en evidencia que el clima de Colombia varía en todas las escalas temporales. A escala inter-decadal el cambio climático por acción antropogénica ha aumentado la complejidad del sistema climático puesto que el ser humano se ha convertido en una nueva fuerza geofísica con capacidad para alterar los balances naturales de gases trazadores como el CO2, en este sentido la amenaza más evidente para Colombia se ve reflejada en la inminente deforestación de los bosques y las selvas y sus consecuentes perturbaciones sobre los regímenes hidrológicos. A escalas interde-cadales también existen algunos fenómenos auto-regulados no lineales de importante influencia sobre el clima de Colombia tales como la denominada Oscilación Decadal del Pacífico (PDO) y la Oscilación del Atlántica Norte (NAO).

A escalas de tiempo inter-anuales la variabilidad climática global está fuertemente controlada por el evento El Niño/Oscilación de sur (ENSO) el cual puede resumirse en un aumento de las temperaturas superficiales del Pacifico tropical generando grandes alteraciones en los patrones de circulación de vientos, presiones atmosféricas superficiales, precipitación y nubosidad sobre el océano Pacifico, la fase fría del ENSO se conoce como La Niña y también altera de ostensiblemente el sistema climático global. Los cambios en los balances de agua y energía derivados del ENSO dan origen a fuertes perturbaciones hidro-climáticas sobre la geografía colombiana con altas repercusiones sociales, económicas y ambientales que pueden resumirse de la siguiente manera: durante El Niño se presenta una disminución de precipitación y en consecuencia de los caudales de los ríos así como la humedad del suelo y la

Page 33: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

2-3

actividad vegetal, durante La Niña los eventos intensos de precipitación son el común denominador y en consecuencia las frecuentes inundaciones, avalanchas, pérdidas de vidas humanas, cosechas e infraestructuras se convierten en la realidad nacional.

Desde el punto de vista temporal, la migración meridional de la Zona de Convergencia Intertropical (ZCIT) es uno de los mecanismos preponderantes para explicar la variabilidad anual y semianual de la precipitación en Colombia. La bimodalidad o unimodalidad de la distribución de la precipitación en el ciclo anual está asociada al paso de la ZCIT por la geografía Colombiana, así como de su interacción con las circulaciones de los océanos Pacífico, Atlántico y de la cuenca del Amazonas. La distribución espacial de la lluvia sobre Colombia está asociada a la época del año. Cuando la ZCIT se encuentra más al sur (en el verano del hemisferio sur), la zona de la costa sobre el Caribe sufre una disminución en las lluvias; lo mismo sucede en la zona sur durante el verano del hemisferio norte (Julio-Agosto). La ZCIT pasa dos veces por encima del territorio Colombiano; en su camino hacia el sur en la época de octubre- noviembre y hacia el norte en la época de abril-mayo, produciendo dos temporadas de más alta pluviosidad (bimodalidad) en el centro de Colombia debido a la presencia de la cordillera de los Andes (Mejía et al. 1999).

A escalas de tiempo intra-anuales el paso de frentes sobre la geografía Colombiana puede explicar buena parte del tiempo Atmosférico en nuestro país (aunque no todo). Las oscilaciones de 30-60 días (Madden y Julian, 1971) caracterizadas por las anomalías de los campos de presión y precipitación en forma de ondas que afectan fuertemente el ciclo diurno de precipitación en Colombia. Otro tipo de frentes son las llamadas Ondas Tropicales del Este que están estrechamente ligadas a la formación de tormentas y huracanes sobre el mar Caribe y océano Atlántico, se describen como ondas atmosféricas de circulación ciclónica que se desplazan desde el occidente de África hacia el Atlántico con una longitud de onda de 2000 km, tienen además un periodo de 4 a 8 días, otras viajan por la ZCIT con velocidad de propagación de 8 a10 m/s, longitud de onda entre 3000 y 4000 km y período en el rango entre 4-5 días (Mesa et al., 2007).

A escala diurna los grandes cambios de temperatura derivados del ciclo de insolación (también astronómico) representan un factor determinante en la formación, desarrollo e intensidad de la convección, mecanismo muy importante en la génesis de la lluvia tropical. Se han observado diferentes comportamientos cíclicos diurnos según las condiciones locales, y además, estos ciclos varían durante los distintos meses del año dado que los mecanismos físicos que explican tales comportamientos también varían según el tiempo y las condiciones macro-climáticas influyentes (Agudelo et al. 2001, Poveda, 2004).

Desde el punto de vista espacial los análisis hidro-climáticos tienen su fundamento en la siguiente afirmación: Colombia está situada en el trópico Americano “Como una isla entre tres océanos” (Snow, 1976) donde se incluye la cuenca del Amazonas; la presencia de los Andes induce a la formación de climas locales y regionales de alta complejidad y difícil entendimiento por lo que cada pronostico hidrológico varia de un lugar a otro (Mesa, Poveda y Carvajal, 1997).

Page 34: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

2-4

El océano Pacifico es quizás uno de los mayores controladores del clima planetario y Colombia no queda exento de su influencia. Además de los ya mencionados fenómenos auto-regulados como el ENSO y la PDO que afectan nuestra climatología a diferentes escalas de tiempo también existen otros aspectos como la corriente de vientos en chorro o Chorro del Chocó (Poveda & Mesa 1999,2000) que tiene alta influencia sobre el occidente y centro del país, es el responsable de que el Chocó colombiano sea una de las regiones más lluviosas del mundo y está ligado a la formación de sistemas convectivos de meso escala (Poveda, 1998) sobre gran parte del país.

Cuando los vientos alisios pasan por el istmo de Panamá éstos se recurvan y generan una nueva corriente en chorro conocida como Chorro de San Andrés que trae consigo humedad del océano Atlántico y afecta la hidrología de la costa Caribe Colombiana. Desde la cuenca del Amazonas también se transportan grandes cantidades de humedad con incidencia directa en el pie de monte llanero contribuyendo a la formación de los grandes ríos en la Orinoquía.

Para las cuencas tropicales la precipitación reciclada es quizás uno de los aspectos que más influyen sobre la hidrología, se estima que entre el 35% y el 50% de la lluvia tropical es autogenerada (Cuartas y Poveda, 2002) y se sabe que la vegetación del país es muy eficaz en la formación de núcleos de condensación para la activación de la lluvia, en consecuencia cualquier proceso de predicción hidrológica debería incluir la doble retroalimentación biota-clima y de ahí la importancia de nuestra región amazónica en el contexto internacional y de los bosques tropicales para Colombia.

Los Andes como precursores en gran parte de nuestro paisaje contribuyen orográficamente a la modelación del clima y la hidrología del país. La existencia en los valles interandinos del “óptimo pluviométrico” es un rasgo característico en relación al cambio de la precipitación según la altura sobre el nivel del mar. Además muchos de los frentes que transportan humedad desde el océano deben enfrentar la barrera impuesta por la cordillera y por ello la distribución de los regímenes hidrológicos varía de un lado a otro del país.

Lo anterior conlleva a que los intentos por predecir la hidrología o la climatología de nuestro país arrojen mucha incertidumbre y que los resultados dependan en gran medida de las condiciones en las que se encuentre el año analizado y la escala espacio temporal a la que se desee predecir (Smith et al, 2004).

Page 35: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

2-5

2.2 VARIABILIDAD ANUAL DE LOS CAUDALES EN COLOMBIA

2.2.1 El efecto de la ZCIT

El ciclo anual de la hidro-climatología de Colombia está dominado por fenómenos físicos como la migración latitudinal de la zona de convergencia intertropical (ZCIT), asociada con la dinámica trans-ecuatorial de los vientos alisios del este, la actividad del chorro del Chocó y los sistemas convectivos de meso escala (Poveda, 2004).

La zona de convergencia intertropical (ZCIT) es un cinturón de baja presión que ciñe el globo terrestre en la región ecuatorial. Está formado, como su nombre indica, por la convergencia de aire cálido y húmedo de latitudes por encima y por debajo del Ecuador. El aire es empujado a la zona por la acción de la célula de Hadley, un rasgo atmosférico de escala sinóptica que forma parte del sistema planetario de distribución del calor y la humedad; las regiones situadas en esta área reciben precipitación más de 200 días al año; La posición de esta región varía con el ciclo estacional siguiendo la posición del sol en el cenit y alcanza su posición más al norte (8º N) durante el verano del hemisferio norte, y su posición más al sur (1º N) durante el verano del hemisferio sur.

La ZCIT constituye el mecanismo físico de mayor relevancia en la explicación del ciclo anual (o semi-anual) de la hidroclimatología de Colombia sobre el centro y el occidente de Colombia dada la existencia de dos temporadas lluviosas (abril-mayo y octubre-noviembre) y dos temporadas secas (diciembre-febrero y junio-agosto) como resultado del doble paso de la ZCIT sobre el territorio nacional (Eslava 1993; Mejía et al. 1999; León et al. 2000; Poveda 2004, Poveda et al. 2007).

En el trabajo de Mejía et al. (1999) se desarrolló un estudio sobre la distribución espacio-temporal del ciclo anual de la precipitación en Colombia cuyos resultados se muestran en la Figura 2-2. Allí se esquematiza la suma vectorial del ciclo anual (correspondiente a un periodo de doce meses) y semianual (con periodo de seis meses) para representar los máximos absolutos de cada ciclo debidos a la variabilidad anual y semianual de la precipitación en Colombia, que se asocian directamente con la migración de la ZCIT. El tamaño de las flechas representa la amplitud y la dirección de los vectores señala al máximo de cada ciclo dentro del año, con enero hacia el norte, julio hacia el sur, abril hacia el este y octubre al oeste. Cuando el ángulo entre los vectores que salen de cada punto sea más parecido a 180º, el ciclo semianual es más importante que el anual. Cuando ambos vectores están aproximadamente superpuestos la explicación es el predominio del ciclo anual sobre el semianual del dicho punto. Mejía et al. encontraron que el paso de la ZCIT por Colombia, ocasiona sobre la región andina en el centro del país dos máximos temporales en la precipitación, además se observa que la presencia de las cordilleras ejerce gran importancia en la dirección del máximo del ciclo anual.

En la Figura 2-3 se muestra la forma del ciclo anual para las diferentes series de caudal estudiadas en el presente trabajo, es posible observar un comportamiento bimodal en las

Page 36: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

2-6

estaciones ubicadas en las regiones centro y centro-occidente de Colombia, con valores máximos en los periodos Abril-Mayo, y Octubre-Noviembre por lo que existe una correspondencia entre los ciclos anuales de la precipitación y de caudal. Los ríos Guavio y Batá ubicados en el extremo oriental de la cordillera oriental se ven fuertemente influenciados por el efecto monzónico de los vientos alisios y por tanto poseen un ciclo anual que corresponde con la precipitación en el oriente del país. La magnitud y variabilidad del ciclo anual de los caudales analizados en el presente trabajo se muestra en la Tabla 1, puede constatarse que los meses de invierno son los más variables dentro del ciclo anual.

Figura 2-2 Suma vectorial de los ciclo anual y semianual de la precipitación en Colombia, Mejía et al. (1999).

2.2.2 El chorro del Occidente Colombiano (Chorro del Chocó)

La corriente de vientos en chorro del occidente colombiano, o chorro del Chocó (Poveda, 1998; Poveda & Mesa, 1999, 2000), es una corriente de vientos que ejerce una fuerte influencia sobre la climatología de Colombia, particularmente en las regiones occidental y central del país.

Page 37: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

2-7

Figura 2-3 Ciclo anual de los caudales medios mensuales usados en el presente trabajo

Page 38: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

2-8

Tabla 2-1 Ciclo anual y variabilidad de los caudales medios mensuales del los ríos analizados

Page 39: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

2-9

La distribución de los vientos alrededor del trópico americano durante los meses de septiembre, octubre y noviembre (Estación SON) se presenta en la Figura 2-4. Es de notarse la circulación de oeste a este sobre el Pacífico oriental en la latitud de Colombia. Dichos vientos se recurvan al pasar el Ecuador adoptando la dirección noreste en la costa pacífica colombiana. El ciclo anual juega un papel muy importante en la dinámica de estos vientos ya que se debilita durante El Niño y se intensifica durante La Niña. Los mecanismos físicos que regulan la posición e intensidad de la corriente del Choco se describen a continuación (Poveda, 1998, Poveda y Mesa, 1997, 2000, Rendón, 2001, Mejia y Poveda 2005, Poveda et al., 2006):

Recurvatura de los vientos alisios: los vientos alisios que soplan sobre la costa del océano Pacífico de Sur América cruzan la línea ecuatorial en dirección primordial de sur a norte asociados con la posición casi permanente de la ZCIT al norte del ecuador. El cruce de hemisferio de los vientos alisios significa un cambio en el signo de la aceleración de Coriolis que a su vez se ve reflejado en la ecuación que describe la dinámica de los flujos trans-ecuatoriales (Hastenrath, 1991 pp. 176).

Gradiente de temperaturas tierra-océano: El calentamiento diferencial aumenta la energía potencial del sistema continente-océano al establecer una diferencia de presión entre las partes de cada uno de los componentes del sistema. Dicho gradiente de presiones obliga a que el aire más frio y denso del océano se mueva hacia el continente dando lugar a la entrada vigorosa de aire húmedo procedente del océano pacífico.

Gradiente de temperaturas en el océano: la corriente del chorro del Chocó obtiene su energía del gradiente de temperaturas superficiales existente entre la zona de temperaturas mas frías de la llamada “Lengua fría” en las aguas del Pacífico en Ecuador y Perú, y las temperaturas mas cálidas del pacífico al frente de las costas de Colombia.

Figura 2-4 Magnitud y dirección de los vientos a 925 mb (m/s) para la estación SON. Poveda et al (2006).

Page 40: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

2-10

La corriente de vientos del Chorro del Chocó tiene su entrada principal hacia los 5°N además está confinada en las capas más superficiales de la atmósfera (1000 a 850 hPa), y satisface todos los requerimientos que Stensrud (1996) le exige a las corrientes de bajo nivel y que son enumeradas a continuación: (1) Alcanza sus máximas velocidades de viento alrededor de 900-1000hPa; (2) Está asociado con fuertes gradientes de temperatura océano-tierra y por lo tanto con baroclinidad superficial (Inestabilidad de presiones); (3) Exhibe considerable esfuerzo cortante vertical y horizontal; (4) Está relacionado con el origen y desarrollo de fuerte convección profunda; (5) Está asociado con fuerte transporte de humedad sobre el Pacífico tropical del este; (6) Está intervenido por el desarrollo de sistemas convectivos de mesoescala sobre el océano Pacífico que penetran a Colombia e interactúan con la ZCIT; (7) Está asociado con el estrecho topográfico que existe en el ramal occidental de los Andes entre 5°N y 5º30’ N, conocido como el Paso de Mistrató, donde el promedio de las alturas decrece desde aproximadamente 3.000 a 1.500 m. Se considera que este estrecho actúa como una boquilla de convergencia de flujo, donde la velocidad de los vientos se incrementa y la presión decrece, contribuyendo así a enfocar, sostener y desarrollar la corriente en forma de chorro.

Un indicador para la caracterización del chorro del Chocó puede ser construido usando la advección de humedad por el Paso de Mistrató, en la región 5°N-5º30’ N & 77°W-77°30; La advección de humedad se obtiene de multiplicar cada componente de los vientos (zonal y meridional) por la humedad específica en ese punto, la Figura 2-5 presenta los índices Chocó zonal y Chocó Meridional obtenidos a partir de los datos del re-análisis NCEP-NCAR, y un esquema del ciclo anual del chorro del Chocó se presenta en la Figura 2-6. Durante la estación SON (Septiembre, Octubre, Noviembre) el trasporte de humedad por la corriente de vientos del Chocó alcanza sus máximos niveles por lo que el segundo periodo de inverno en Colombia (SON) es mucho más intenso en el centro – occidente del país (Poveda, 2004). La Figura 2-7 presenta los coeficientes de correlación con rezago de un mes entre los caudales utilizados en el presente estudio y las series de Chocó zonal y Chocó meridional. Los resultados muestran fuertes dependencias (correlaciones > 0.6) entre los ríos del occidente del país y el Chorro del Chocó mientras en el centro y el oriente del país la dependencia es menos evidente.

Figura 2-5 Componentes zonal y meridional de la advección de humedad en 5°N-5º30’ N & 77°W-77°30.

Page 41: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

2-11

Figura 2-6 Ciclo anual del trasporte de humedad por los vientos de la corriente del chorro del Chochó y su comportamiento durante los eventos de El Niño y La Niña (Rendón, 2001).

Figura 2-7 Correlación entre los índices zonal y meridional del chorro del Chocó y los caudales del presente estudio.

2.2.3 Advección de humedad desde el Amazonas

La cuenca del rio Amazonas es un excelente ejemplo de la interacción existente entre el sistema tierra-atmósfera. Debido a su gran tamaño (> a 6.4 millones de kilómetros cuadrados) su carácter tropical y su compleja dinámica eco-hidro-climátologica la cuenca del amazonas

Page 42: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

2-12

ejerce una influencia a escala global (Poveda et al. 2006). Colombia posee en su territorio una parte importante de la cuenca del rio amazonas, se sabe además que gracias a la retroalimentación que existe entre los Andes y el Amazonas (Figura 2-8) el pie de monte llanero corresponde a la región más lluviosa de dicha cuenca (Poveda, 2006). La humedad del Amazonas es traída con mayor intensidad durante los meses de mayo a septiembre donde la barrera orográfica de los Andes la convierte en precipitación convectiva afectando a buena parte del oriente de Colombia. Del mismo modo que en el caso del Chorro del Chocó, para la humedad del amazonas puede ser construido un índice de advección que permita cuantificar el efecto de la cuenca del amazonas sobre los caudales del los ríos de Colombia. Dicho índice se muestra en la Figura 2-9 y fue construido usando la advección de humedad en la región 4°N-4º30’ N & 72°W-72°30. Un análisis de correlación entre la componente meridional de la advección de humedad desde el Amazonas y los caudales medios mensuales del presente estudio se muestran en la Figura 2-10. Las máximas correlaciones se presentan con los ríos del oriente colombiano (superiores a 0.6).

Figura 2-8 Interacción Suelo-Atmósfera en la cuenca del Amazonas. Poveda et al. (2006)

Figura 2-9 Componente meridional de la advección de humedad desde el Amazonas y su ciclo anual.

Page 43: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

2-13

Figura 2-10 Análisis de correlación entre la advección de humedad desde el Amazonas (componente meridional) y los caudales del presente estudio.

2.3 VARIABILIDAD DE LOS CAUDALES MEDIOS MENSUALES A ESC ALA INTER-ANUAL

La variabilidad climática a escala de tiempo inter-anual a nivel global está fuertemente controlada por el sistema El Niño/Oscilación del Sur (ENSO). En general, la fase cálida del ENSO (El Niño), que inicia en la primavera boreal, se caracteriza por el aumento en la temperatura superficial del océano pacífico generando alteraciones importantes en la circulación de los vientos, las presiones atmosféricas y la precipitación en todo el océano Pacífico, la fase fría se conoce como La Niña y en ambos casos las distorsiones en los balances globales de agua y energía ocasionan fuertes perturbaciones hidró-climáticas con amplias repercusiones sociales, ambientales, ecológicas y económicas (Poveda, 2004).

La dinámica del ENSO y su relación con la hidrología de Colombia ha sido ampliamente estudiada, por mencionar algunos trabajos: Poveda, (1994, 2004), Poveda & Mesa (1995, 1996, 1997) Poveda et al. (1998, 1999, 2001a, 2001b, 2010). En general, durante El Niño se presenta una disminución de la precipitación en el país, así como una disminución en la humedad del suelo y la actividad vegetal (Poveda et al, 2001a) acompañada de un aumento en las temperaturas del aire. Durante La Niña ocurren anomalías con efectos contrarios caracterizados por excesos en las lluvias.

Page 44: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

2-14

Los mecanismos físicos por los cuales se presentan déficits hidrológicos durante El Niño se pueden resumir como (Poveda, 2004): (1) debilitamiento del chorro del Chocó. (2) el debilitamiento de la corriente de chorro ecuatorial (700 hPa.). (3) la reducción en la intensidad y número de ondas tropicales del este sobre el Atlántico tropical norte. (4) el desplazamiento de la ZCIT hacia el suroeste de su posición normal como consecuencia de una celda de Hadley anómala sobre el trópico americano, (5) la alteración del balance de humedad atmosférica, en particular en los niveles más bajos de la atmósfera (Cuartas y Poveda, 2002), los déficits de humedad en el suelo afectan la evapotranspiración de las plantas y por consiguiente disminuyen la precipitación reciclada.

En el presente trabajo es utilizado el Análisis de Componentes principales y la correlación cruzada para cuantificar la relación existente entre los caudales medios mensuales de los ríos en Colombia y el sistema ENSO. Los ríos fueron reunidos en cuatro grupos a saber: ríos de la vertiente del Porce (RVP : Guadalupe, Tenche, Riogrande, Porce), ríos de la vertiente del Nare (RVN: Nare, Guatapé, San Carlos, San Lorenzo); ríos del valle del Magdalena (RVM: Magdalena-Betania, Miel), y los ríos del oriente Colombiano (ROC: Batá, Guavio). Con el objeto de obtener la variabilidad conjunta de los ríos se estimó la primera componente principal de las series de caudales estandarizados de cada grupo y esta se correlacionó con las anomalías de temperatura en los océanos del planeta. Los resultados se muestran en la Figura 2-11. Las máximas correlaciones (0.5-0.6) se presentan en la zona de desarrollo del sistema ENSO sobre el océano pacífico, específicamente sobre la región Niño-3.4 lo que evidencia la fuerte dependencia que existe entre los caudales del occidente del país y la variabilidad en dicha región del océano pacífico.

Un análisis de correlación cruzada entre los rezagos de las series de caudales estandarizadas y el índice de oscilación del sur (SOI) se muestra en la Figura 2-12. El índice de oscilación del sur corresponde a la diferencia de los valores de presión estandarizados entre Tahiti y Darwin y representa la componente de presiones del ENSO. Los resultados del análisis de correlación indican que el sistema ENSO actúa como una onda que se propaga de occidente a oriente en el país perdiendo intensidad en dicha dirección; el efecto del ENSO es casi inmediato sobre los caudales del occidente del país (máxima correlación para rezagos de un mes) mientras en el centro- oriente del país el efecto del ENSO suele ser retardado y de menor intensidad (máximas correlaciones para rezagos de cinco a seis meses). Se aprecia además una persistencia en el efecto de ENSO de más de 6 meses sobre los caudales del occidente del país. El acoplamiento entre el sistema ENSO y el ciclo anual de los caudales, afecta la amplitud del ciclo anual, mas no su fase (Poveda et al, 2010). La Tabla 2-2 presenta el ciclo anual de los caudales medios mensuales durante los periodos La Niña, Normal y El Niño clasificados según el índice oceánico de El Niño ONI (Oceanic Niño Index,: el promedio de tres meses corridos de las anomalías de temperatura sobre la región niño 3-4, http://www.cpc.ncep.noaa.gov/products/analysis_monitoring/ensostuff/ensoyears.shtml) a excepción de los ríos Guavio y Batá, la amplitud del ciclo incrementa durante la Niña y decrece durante El Niño, sin embargo los efectos varían según el rio y las condición hidro-climática analizada.

Page 45: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

2-15

Figura 2-11 Correlación entre las anomalías de temperatura en los océanos y la primera componente principal de las series de caudales de los grupos RVP, RVNRVM,ROC.

El efecto de La Niña es más intenso en el segundo periodo de invierno (SON) sobre los ríos del centro-occidente del país, ello debido a una intensificación en el trasporte de humedad por el chorro del Chocó (Poveda, 2004), mientras el efecto del Niño es mucho más intenso durante el primer periodo verano (DEF) donde se presentan los mínimos caudales (Tabla 2-2)

Page 46: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

2-16

Figura 2-12 Análisis de correlación entre el Índice de Oscilación del Sur (SOI) y los caudales

Page 47: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

2-17

Tabla 2-2 El ciclo anual de los caudales para periodos Niña, Niño y Normal según el ONI.

Page 48: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

2-18

2.4 VARIABILIDAD DE LOS CAUDALES MEDIOS MENSUALES A ESC ALA INTER-DECADAL

2.4.1 La Oscilación Decadal del Pacífico (PDO)

La Oscilación Decadal del Pacifico (PDO) puede describirse como un patrón de la variabilidad climática en el océano Pacifico de características similares al fenómeno macro-climático El Niño/La Niña, ya que exhibe aproximadamente las mismas relaciones en cuanto a las anomalías o desviaciones en las temperaturas superficiales del mar; pero a diferencia de éste, la PDO tiene un período de oscilación de más o menos 10-20 años y sus efectos se encuentran localizados más al Pacifico Norte.

Varios estudios independientes encuentran la evidencia considerable para apenas dos ciclos completos de PDO en el último siglo: los regímenes "fríos" de PDO prevalecieron a partir de 1890-1924 y otra vez a partir de 1947-1976, mientras que los regímenes "calientes" de PDO dominados a partir de 1925-1946 y a partir del 1977. Así mismo, la predictibilidad para esta oscilación es bastante incierta, pero en la actualidad existen modelos de simulación del clima que ayudan a explicar la naturaleza y el comportamiento de este fenómeno macro-climático. El índice PDO se obtiene tomando la primera componente principal de las anomalías de temperatura en el océano Pacífico Norte desde la latitud 20N hacia el polo norte (Figura 2-13).

Figura 2-13 Fases e índice de la Oscilación Decadal del Pacífico (PDO) (http://jisao.washington.edu/pdo/PDO.latest).

Un análisis de correlación entre los caudales medios mensuales de los ríos del presente estudio y el índice de la PDO muestra que existe una dependencia significativa entre los caudales y las oscilaciones decadales para un rezago de dos meses y sus efectos son más notorios en los ríos

Page 49: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

2-19

del occidente del país donde se presentan las mayores correlaciones (correlaciones significativas superiores 0.3). En la Figura 2-14 se presentan los coeficientes de correlación entre los caudales del presente estudio y la PDO para rezagos de dos meses.

Figura 2-14 Análisis de correlación entre la PDO (-2) y los caudales del presente estudio.

2.4.2 Oscilación del Atlántico Norte

Es la alternación de la masa atmosférica entre las regiones subtropical y subpolar del océano Atlántico Norte; se caracteriza por variaciones en el gradiente de presiones a nivel del mar en escalas mensual y estacional, en los vientos del oeste en las latitudes medias, en las temperaturas superficiales del mar y en el clima de las regiones continentales adyacentes. Se define en términos de la variabilidad de la presión en dos sitios claves, un centro de presión en las islas Azores, influenciado por el centro de alta presión subtropical, y el otro centro de presión sobre Islandia, lugar donde predominan las bajas de presiones. Cuando la alta presión subtropical está anormalmente fuerte y simultáneamente está anormalmente profunda la baja presión de Islandia, se presenta el modo positivo de la NAO y es cuando los vientos del oeste del Atlántico están anormalmente fuertes. Por otro lado, la fase negativa se da cuando ambos centros de presión están anormalmente débiles lo que implica disminución en los vientos. Se sugiere que la precipitación promedio sobre el Caribe y las Américas tropicales podría variar significativamente en los extremos de la NAO (Rogers, 1988). Esta observación nos muestra una primera evidencia del posible vínculo entre la situación hidro-climatológica de Colombia y la NAO dada la influencia que estaría ejerciendo la hidro-climatología del norte de América

Page 50: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

2-20

del sur sobre la situación del mar Caribe y el océano Atlántico (Poveda y Mesa, 1996b). Aunque los valores de las correlaciones no son muy altos, no son despreciables estadísticamente. Además, como los registros del SOI y la NAO parecen no correlacionados, puede ser útil involucrar la NAO como variable para tener en cuenta en modelos para predicción de la hidrología colombiana. Un análisis de correlación cruzada entre la NAO y los caudales de los ríos usados para el desarrollo del presente trabajo se muestra en la Figura 2-16.

Figura 2-15 Fases e índice de la NAO, adaptado de http://www.atmosphere.mpg.de

2.5 TÉCNICAS ESPECTRALES PARA LA CUANTIFICACIÓN DEL EFE CTO DEL MACROCLIMA SOBRE LA HIDROLOGÍA DE COLOMBIA

Físicamente los caudales de los ríos Colombianos deben ser tratados como un sistema dinámico, no lineal y no estacionario cuya modelación requiere del estudio y de la incorporación de los principales ciclos que afectan la producción de escorrentía en cuencas tropicales (Rojo, 2010). Con el objeto de Analizar a mayor profundidad el efecto de la actividad macro-climática en términos del tiempo y la frecuencia sobre la hidrología del país se han aplicado diversas metodologías espectrales como el análisis espectral singular (Carvajal, 1994 ;Rojo, 1998 Rojo & Carvajal, 2010) la transformada en onditas (Hoyos, 1999; Poveda et al 2002, Rojo & Carvajal, 2010.) y la trasformada de hilbert Huang (Carmona, 2010). Dichas técnicas permiten descomponer las series de caudales en el dominio tiempo-frecuencia a fin de determinar los modos dominantes de la variabilidad para asociarlos a diversos fenómenos físicos. Por ejemplo ciclos anuales, semianuales, o de 30-60 dias (1-3 meses) pueden ser detectados con dichas técnicas.

Usando el Análisis Espectral Singular y la transformada en onditas Rojo y Carvajal (2010) hallaron los modos de variabilidad más importantes de los ríos San Carlos, Grande, Nare, Guavio y Betania (Tabla 2-3), en la Figura 2-18 se presentan los resultados de dicho análisis para la estación RG8 del río Riogrande usando la transformada en onditas; las componentes de

Page 51: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

2-21

más baja frecuencia suelen aportar una mayor cantidad de varianza dentro del sistema dinámico en comparación con las componentes de alta frecuencia consideradas ruido dentro del análisis espectral.

Figura 2-16 Análisis de correlación cruzada entre el índice NAO y los caudales de los ríos en Colombia.

Page 52: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

2-22

Tabla 2-3 Periodos asociados a las componentes principales en algunos ríos de Colombia (Rojo & Carvajal 2007)

1CP 2CP 3CP 4CP 5CP 6CP 7CP 8CP 9CP 10CP 11CP 12CP RIO SAN CARLOS 128-256 32 14 8 4 8 - 3 5 4 3 4 - 2 3 4 RIO GRANDE 128 - 64 32 - 64 16 8 6 5 4 3 2 3 3 3 RIO NARE 128 - 64 32 16 8 8 6 5 4 4 3 3 2 RIO GUAVIO 128 - 64 16 64-12 6 5 4 4 2 3 2 2 2 RIO BETANIA 128 - 64 32-12 32-16 8 6 4 5 8 - 4 - 2 2 4 3 3

La utilización del espectro de potencias con onditas continúas, específicamente la ondita de Morlet, fue presentada en el trabajo de Poveda et al (2002) para cuantificar la influencia de los fenómenos macro-climáticos sobre la hidrología de Colombia, dicha técnica permitió localizar en tiempo y en frecuencia, fenómenos físicos presentes en las series de caudales; en la Figura 2-17 se presenta el espectro de potencias usando la ondita continua de Morlet para la serie de caudales medios mensuales del río Magdalena en la estación Calamar, allí se observan períodos importantes de 6 y 12 meses (ciclo anual y semianual) y de 50 a 64 meses (asociados al ENSO); en general, en todas las estaciones analizadas en dicho trabajo se observaron los anteriores períodos como los de mayor importancia.

Figura 2-17 Aplicación de la transformada continua en onditas usando la ondita Morlet para el río Magdalena en Calamar (Poveda et al, 2002)

Page 53: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

2-23

La trasformada en onditas también puede ser usada de forma discreta para descomponer una señal en dos señales mediante el algoritmo de multiresolución conocido como filtro de dos bandas (Mallat,1989), de las dos componentes obtenidas una será de alta frecuencia y la otra de baja frecuencia. La aplicación sucesiva del filtro a dos bandas sobre las componentes de baja frecuencia permite descomponer una señal en múltiples niveles cuyos periodos igualmente pueden ser asociados a diferentes eventos macro-climáticos. En la Figura 2-18 se presenta la descomposición de la serie de caudales de la estación RG8 (de Rio grande) usando la transformada discreta de onditas con la ondita de Meyer.

Figura 2-18 Aplicación de la trasformada discreta en onditas para 6 niveles de descomposición usando la ondita discreta de Meyer

Page 54: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

2-24

2.6 SOBRE LA AUTO-CORRELACIÓN Y LA PERSISTENCIA EN LAS SERIES DE CAUDALES

La autocorrelación es una herramienta matemática utilizada frecuentemente en el procesamiento de señales. La auto-correlación se define como la correlación cruzada de la señal consigo misma. La función de auto-correlación resulta de gran utilidad para encontrar patrones repetitivos dentro de una señal, como por ejemplo, la periodicidad de una señal enmascarada bajo el ruido o para identificar la frecuencia fundamental de una señal que no contiene dicha componente, pero aparecen numerosas frecuencias armónicas de esta.

Otra característica de interés de las series de caudales es aquella relacionada con el almacenamiento de embalses a largo plazo. Los primeros análisis fueron desarrollados por Hurst (1951) empleando un estadístico conocido con el nombre de rango reajustado a las desviaciones acumuladas o rango de fluctuación. El rango de fluctuación )(* nR puede considerarse como la capacidad que un embalse debería tener para suplir una demanda igual a la media sin incurrir en vertimientos o déficit durante un periodo de n años, por ello es un indicativo de la intensidad y duración de las sequías que presenta la serie de caudales.

En sus investigaciones Hurst (1957) calculó el valor de )(* nR para múltiples series del río Nilo, de los más diversos tamaños y cada valor de )(* nR lo dividió por la desviación típica de la serie de n observaciones, obteniendo el estadístico )(/)(* nSnR conocido con el nombre del rango ajustado reescalado. Hurst encontró que este estadístico variaba con el tamaño de la muestra n de manera exponencial (Poveda, 1993). El hecho de que el exponente h no sea igual a 0.5 es lo que se conoce como fenómeno de Hurst y dicho exponente se le relaciona con la persistencia en la serie, una medida que indica el grado de influencia del presente sobre el futuro. Las series con un 5.0>h son series persistentes donde la auto dependencia juega un rol importante en el proceso, así por ejemplo 7.05.0 << h implica persistencia es de corto plazo y 7.0>h implica persistencia de largo plazo. 5.0=h correspondería a series con distribución normal no persistentes, lo que equivale a un ruido blanco, y 5.0<h corresponde a series antipersistentes.

2.7 ANÁLISIS DE RESULTADOS

El ciclo anual de los ríos analizados está estrechamente ligado con el ciclo anual de la precipitación en el país y depende de la ubicación de las cuencas sobre la geografía nacional.

Los caudales de los ríos ubicados en el centro-occidente del país (Tenche, Guadalupe, Riogrande, Porce, Nare, San Carlos, San Lorenzo, Guatapé, Miel y Betania) poseen un ciclo bimodal dada la fuerte influencia de la ZCIT sobre los andes colombianos, mientras los ríos del oriente del país (Guavio y Batá) poseen un ciclo unimodal reflejando la dependencia que poseen con los procesos ocurrentes en las estribaciones cordillera oriental. Finalmente los caudales en los meses de invierno poseen una mayor variabilidad que los caudales en meses de

Page 55: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

2-25

verano por lo que el ciclo anual no solo está ligado a la magnitud de las descargas sino también a su varianza.

Figura 2-19 Autocorrelogramas de las series de caudales estandarizadas

Según el análisis de correlación entre los índices zonal y meridional del Chorro del Chocó y los ríos analizados, la humedad del Chorro del Occidente Colombiano afecta principalmente los ríos de norte y el oriente Antioqueño (Occidente del país) pues se obtienen correlaciones

Page 56: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

2-26

significativas superiores a 0.6. El análisis de correlación también demuestra que el efecto del chorro del Chocó se disipa de occidente a oriente con correlaciones inferiores (aunque significativas) para los ríos Magdalena, Miel, Guavio y Bata. La intensificación del Chorro del Chocó durante la estación SON coincide con las estación más lluviosa de los ríos Tenche, Guadalupe, Riogrande, Porce, Nare, San Carlos, San Lorenzo y Guatapé lo que refuerza la hipótesis de que el chorro del Chocó hace que la segunda temporada invernal (OND) sea de mayor magnitud que la primera temporada invernal en los meses MAM.

La estrecha relación entre los Andes de Colombia y la cuenca del Amazonas explica de forma significativa la variabilidad de los caudales del oriente del país. La intensificación de la advección de humedad desde el Amazonas entre mayo y septiembre coincide con un incremento significativo en los caudales de los ríos Batá y Guavio. El análisis de correlación entre la componente meridional de advección de humedad desde el Amazonas y los caudales de los ríos involucrados en el presente trabajo muestra que los ríos Guavio y Batá poseen una fuerte dependencia (correlaciones superiores a 0.6) con la humedad proveniente del Amazonas. Los ríos Magdalena y Miel son moderadamente afectados por la humedad del Amazonas y los ríos del occidente Colombiano poseen baja correlación (inferior a 0.3) con dicha variable.

A escala Interanual el sistema ENSO posee una fuerte influencia en los ríos del presente estudio. El análisis de correlación entre las componentes principales de los diferentes conjuntos de ríos y las anomalías de temperaturas en el pacífico demuestran la vinculación que existen entre la variabilidad de los caudales y la variabilidad de la temperatura del océano Pacífico en las regiones Niño 3 y Niño 4 dado que allí se presentan las máximas correlaciones. Espacialmente el ENSO posee una mayor influencia sobre los ríos del norte y el oriente antioqueño y su efecto disminuye de occidente a oriente. Las correlación entre el índice SOI y los caudales del presente trabajo muestran que la dependencia entre el ENSO y las descargas de los ríos varia temporalmente, mientras los ríos del occidente del país se ven afectados por el ENSO casi inmediatamente (máxima correlación para rezagos de un mes) los caudales del oriente del país se ven afectados cinco o seis meses después. El acoplamiento entre el sistema ENSO y el ciclo anual de los caudales analizados muestra que la fase cálida de dicho sistema provoca una disminución en la magnitud de los caudales del centro-oriente del país y en el oriente del país los efectos se observan poco significativos. La fase Fría del ENSO (La Niña) incrementa la intensidad del Chorro del Chocó y provoca un aumento en los valores del ciclo anual de caudales en el occidente del país. A escala interanual existe una relación significativa (correlaciones superiores a 0.3) entre la PDO y los caudales del cetro-occidente del país mientras las correlaciones con la NAO son muy bajas.

La localización temporal y de frecuencia de los métodos espectrales, permite el estudio de fenómenos transitorios, y ayuda a entender el comportamiento no – lineal existente entre la climatología global y la hidrología de Colombia. Es posible asociar los picos espectrales con fenómenos físicos con mayor claridad. Con los métodos espectrales se detectaron los ciclos de 10-12 años, 5-3 años, 2 años, 6-12 meses 1 y 3 meses. A manera de diagnóstico se pueden

Page 57: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

2-27

relacionar los periodos de las componentes de baja frecuencia con los ciclos que presentan las variables macro-climáticas cuya influencia es de carácter interanual como por ejemplo la PDO (10 años), el ENSO (Entre 3 y 5 años), el ciclo anual y semi-anual con períodos de 12 y 6 meses. Los períodos menores pueden estar relacionados con variaciones intranuales como el paso de la zona de convergencia intertropical (ZCIT) y los diferentes periodos de verano e invierno en el país; Las componentes de alta frecuencia pueden relacionarse con variables como las oscilaciones de Madden-Julian (1-3 meses). En la mayoría de los casos las componentes de baja frecuencia (10,5, 3 años) son las de mayor aporte a la variabilidad de los caudales los resultados del análisis espectral Singular.

El estudio de la autocorrelación y la persistencia permite demostrar que los caudales analizados en el presente trabajo son altamente autodependientes y poseen persistencias muy altas.

Page 58: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

2-28

Referencias

Agudelo P.A, Arias, Salazar L.F (2002). “Caracterización del ciclo diurno de precipitación en los andes tropicales de Colombia, Región Centro”. Trabajo dirigido de grado, Ingeniería Civil, Universidad Nacional de Colombia, sede Medellín.

Carmona M.A. (2010). Identificación de modos principales de variabilidad hidroclimática en Colombia y la cuenca Amazónica. Tesis de Maestría en Ingeniería - Recursos Hidráulicos. Universidad Nacional de Colombia.

Cuartas, L. A., y G. Poveda (2002), Balance atmosferico de humedad y estimacion de la precipitación reciclada en Colombia según el Reanalisis NCEP/NCAR. Meteorología Colombiana 5:49-57.

Hastenrath, S., (1991). Climate Dynamics of the Tropics. Kluwer Academic Publishers, Dordrecht, The Netherlands, 488 pp.

Hoyos, C. (1999)., Algunas Aplicaciones de la Transformada de Fourier y la Descomposición en Onditas a Señales Hidrológicas y Sísmicas. Trabajo Dirigido de Grado, Ingeniería Civil, Facultad de Minas, Universidad Nacional de Colombia, Sede Medellín.

Eslava, J. (1993). “Algunas particularidades climáticas de la región pacífica Colombiana”. Atmésfera 17:45–63

Mejía, J.F.; Mesa, O.J.; Poveda G. (1999) “Distribución especial de los ciclos anual y semianual de la precipitación en Colombia”. DYNA 127:7–26

León, G.E. Zea, J.A., Eslava J.A. (2000). General circulation and the intertropical convergence zone in Colombia (in Spanish). Meteorol Colomb 1:31–38.

Poveda, G., y Mesa, O.J.. (1993). “Metodologías de predicción de la hidrología Colombiana considerando el evento El Niño-Oscilación del Sur (ENOS)”. Revista Atmósfera, 17, Sociedad Colombiana de Meteorología, Bogotá.

Poveda, G., and Mesa O. J. (1994), Estimation of the Hurst exponent and GEOS diagrams for a non-stationary stochastic process. In: Time Series Modelling of Water Resources and Environmental Systems, K. W. Hipel y A. I. McLeod (Eds.), Kluwer Academic Publisher, Amsterdam, pp. 409-420.

Poveda, G., Cuantificación del Efecto de El Niño y La Niña sobre los caudales en Colombia, Memorias del XVI Congreso Latinoamericano de Hidráulica e Hidrología, IAHR, Santiago de Chile, 107-117, 1994b.

Poveda, G., Funciones Ortogonales Empíricas en el Análisis de la Relación entre los Caudales Medios en Colombia y las Temperaturas de los Océanos Pacífico y Atlántico, Memorias del

Page 59: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

2-29

XVI Congreso Latinoamericano de Hidráulica e Hidrología, IAHR, Santiago de Chile, Volumen 4, 131-144, 1994c.

Poveda, G., y Mesa, O.J.,(1995) .”The Relationship between ENSO and the Hydrology of Tropical South America,. The Case of Colombia,” Proceedings of the Fifteenth Annual American Geophysical Union Hydrology Days, Atherton, CA, USA, Hydrology Days Publications, 227- 236,,.

Poveda, G. (1996), Modulación de la Hidroclimatología de Colombia por el ENSO y otros Fenómenos de Gran Escala, Trabajo de promoción a profesor Asociado, Posgrado en Aprovechamiento de Recursos Hidráulicos, Universidad Nacional de Colombia, Medellín,.

Poveda, G., Mesa, O.J. (1997). “Feedbacks between hydrological processes in tropical South America and large-scale oceanic–atmospheric phenomena”. J Clim 10:2690–2702.

Poveda G, Gil MM, Quiceno N (1998) El ciclo anual de la hidrología de Colombia en relación con el ENSO y la NAO. Bull Inst Fr Etud And 27(3):721–731.

Poveda, G. Mesa, O.J. (1999) “The low level westerly jet (CHOCO jet) and two other jets in Colombia: climatology and variability during ENSO phases (in Spanish). Rev Acad Colomb Cienc 23(89):517–528

Poveda G, Gil MM, Quiceno N (1999) The relationship between ENSO and the annual cycle of Colombia’s hydro-climatology. 10th Symposium on Global Change Studies. Am Met Soc, Dallas.

Poveda, G., Mesa, O.J. (2000). “On the existence of Lloró (the rainiest locality on Earth): enhanced ocean-atmosphere-land interaction by a low-level jet”. Geophys Res Lett 27:1675–1678.

Poveda G, Jaramillo A, Gil MM, Quiceno N, Mantilla R (2001a) Seasonality in ENSO related precipitation, river discharges, soil moisture, and vegetation index (NDVI) in Colombia. Water Resour Res 37(8):2169–2178

Poveda G, Rojas W, Vlez ID, et al (2001b) Coupling between annual and ENSO timescales in the malaria-climate association in Colombia. Environ Health Persp 109:489–493

Poveda G, Salazar LF (2004) Annual and interannual (ENSO) variability of spatial scaling properties of a vegetation index (NDVI) in Amazonia. Rem Sens Environ 93:391–401.

Poveda, G. (2004), La Hidroclimatología de Colombia: Una síntesis desde la escala interdecadal hasta la escala diurna. Revista Academia Colombiana de Ciencias, Vol 28 (107), 201-222.

Page 60: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA EL PRONÓSTICO

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

2-30

Poveda, G. Waylen, P., Pulwarty R. (2006). “Annual and inter-annual variability of the present climate in northern South America and southern Mesoamerica”/ Palaeogeography, Palaeoclimatology, Palaeoecology 234 3–27.

Poveda, G. Vélez, J.I., Mesa, O.J. (2007). “Linking long-term water balances and statistical scaling to estimate river flows along the drainage network of Colombia”. Jour Hydrol Eng 12(1):4–13

Rojo, J. D. & Carvajal L.F.( 2010). “Predicción no lineal de caudales usando variables macro-climáticas y análisis espectral singular. Tecnología y Ciencias del Agua antes Ingeniería Hidráulica de México, vol 1, num 4, oct-dic de 2010, México, pp 59-73.

Stensrud DJ (1996) Importance of low-level jets to climate: a review. J Clim 9:1698–1711.

Snow JW (1976) The climate of northern South America. In: Schwerdtfeger W (ed) Climates of Central and South America. Elsevier, Amsterdam, pp 295–403

Nepstad DC, de Carvalho CR, Davidson EA., and co-authors (1994) The role of deep roots in the hydrological and carbon cycles of Amazonian forests and pastures. Nature 372:666–669

Madden, R.A., y P. R. Julian, (1971). Detection of a 40-50 day oscillation in the zonal wind in the tropical Pacific. J. Atmos. Sci. 28, 702-708.

Mesa, O. J., and G. Poveda (1993), The Hurst Effect: The scale of fluctuation approach, Water Resources Research, Vol. 29, No. 12, 3995-4002.

Mesa, O. J., Poveda, G. y Carvajal, L.F (1997). Introducción al Clima de Colombia, Imprenta Universidad Nacional de Colombia, Bogotá.

Mallat, S.(1989) "Multiresolution approximation and wavelet orthonormal bases of L2,” Trans. Amer. Math. Soc., June.

Page 61: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH -UNAL

Capítulo 3:

Métodos actuales para el pronóstico de caudales

Físicamente los caudales de los ríos en Colombia deben ser tratados como un sistema dinámico, no lineal y no estacionario cuya modelación requiere del estudio y de la incorporación de los

principales ciclos que afectan la producción de escorrentía en cuencas tropicales. Dado que no se conoce a ciencia cierta el proceso de

formación de la variable dinámica que se desea modelar, el análisis de regresión se convierte en la herramienta básica del presente trabajo.

Pese a tener fundamento en muchas suposiciones que se hacen sobre el proceso dinámico, el análisis de regresión perite corroborar dichas

suposiciones si se tiene una cantidad suficiente de datos, además los modelos de regresión suelen ser útiles aún cuando los supuestos sean violados moderadamente, aunque no pueden lograr un rendimiento

óptimo.

Page 62: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

3-1

3 METODOS ACTUALES PARA EL PRONÓSTICO DE CAUDALES

RESUMEN

En el presente capítulo se introducen los modelos matemáticos más aplicados en la predicción de caudales medios mensuales en Colombia. Se describen las ecuaciones fundamentales de los diferentes esquemas de regresión y se explica brevemente la estrategia de validación utilizada para comparar la habilidad de pronóstico de los modelos expuestos, además se introduce el procedimiento usado en la estimación los intervalos de confianza y las previsiones probabilísticas. Se proponen algunas técnicas para mejorar la capacidad de pronóstico de los diferentes modelos entre ellas el tratamiento y manejo de la información, la inclusión de esquemas periódicos y el uso de técnicas de descomposición espectral.

Finalmente se presenta un protocolo para la predicción de caudales medios mensuales en Colombia usando los métodos de regresión existentes. Los resultados de la aplicación de dicho procedimiento sugieren que se puede lograr un buen ajuste si se combinan esquemas periódicos de pronóstico con métodos espectrales; un modelo híbrido entre el MARS y la transformada en onditas es el más eficiente de los modelos convirtiéndose en el referente ante eventuales mejoras propuestas durante la tesis.

3.1 INTRODUCCIÓN AL ANÁLISIS PREDICTIVO

En la predicción de caudales medios mensuales en Colombia diversas técnicas han sido exploradas, todas surgidas del análisis predictivo, un área del análisis estadístico que se refiere a la extracción de información a partir de datos históricos para usarla en la inferencia de futuras tendencias y patrones de comportamiento. Básicamente el análisis predictivo busca captar las relaciones entre variables explicativas y una variable de interés usando diversas técnicas que relacionan los hechos históricos y actuales para hacer predicciones sobre acontecimientos futuros.

Una amplia cantidad de métodos surgidos de la matemática aplicada (Funciones multivariadas de aproximación), el análisis estadístico (regresiones no paramétricas), la inteligencia artificial (redes neuronales, sistemas de aprendizaje), y la minería de datos (técnicas de selección y agrupamiento de datos) han sido sugeridas para abordar dicho problema y todas ellas conducen al denominado análisis de regresión, considerado como la herramienta básica del análisis predictivo cuando la atención se centra en conocer la relación que existe entre una variable dependiente y una o más variables independientes. Más concretamente, el análisis de regresión ayuda a entender cómo cambia el valor típico de la variable dependiente cuando cambia cualquiera de las variables independientes. Por lo general, el análisis de regresión estima el valor esperado (esperanza condicional) de una variable dependiente y dadas las

variables independientes( )nXXX ,.....,, 21 , y, con menos frecuencia (pero no menos

importante), la atención se centra en un cuantil u otros parámetros de localización de la

Page 63: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

3-2

distribución condicional de la variable dependiente en función de las variables independientes, algo que comúnmente se conoce como predicción probabilística. En todos los casos, el objetivo es el de desarrollar una función de estimación denominada función de regresión, cuya forma general es la siguiente:

( ) ε+= nXXXfy ,.....,, 21 3-1

Sobre el dominio( ) nn RDXXX ⊂∈,.....,, 21 que contiene los datos. El valor determinístico

obtenido de la evaluación del vector n dimensional de argumentos en la función f refleja la

relación conjunta de y sobre ( )nXXX ,.....,, 21 . La componente estocástica ε se define de

forma tal que su valor esperado sea cero, reflejando la dependencia de y con otros valores

( )**2

*1 ,.....,, nXXX que no son controlados por el observador, ni están presentes en la muestra

histórica.

Dado que no se conoce a ciencia cierta el proceso de formación de la variable dinámica que se desea modelar, el análisis de regresión se fundamenta en muchas suposiciones que se hacen del proceso, las cuales pueden ser corroboradas si se tiene una cantidad suficiente de datos, sin embargo los modelos de regresión son útiles aún cuando los supuestos sean violados moderadamente, aunque no pueden lograr un rendimiento óptimo.

A continuación se presenta de forma general algunos métodos se regresión utilizados para el pronóstico de caudales medios mensuales en Colombia, con sus hipótesis básicas y los conceptos generales usados en la creación de las diversas herramientas computacionales.

3.2 TÉCNICAS DEL ANÁLISIS PREDICTIVO APLICADAS EN LA PR EDICCIÓN DE CAUDALES

3.2.1 Regresión lineal Múltiple (RLM)

En el modelo de regresión lineal se analiza una relación entre una variable dependiente y un conjunto de variables independientes o de predicción expresada como una función lineal. Los parámetros son ajustados minimizando el tamaño de los residuos buscando que su distribución corresponda a un ruido blanco.

El modelo lineal general determinístico (sin variable aleatoria) es de la forma:

nn XCXCXCy +++= ...ˆ 2211 3-2

Page 64: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

3-3

Donde y es el valor estimado de la variable dependiente, el conjunto ( )nXXX ,....,, 21

contiene las variables independientes y el vector ( )nCCC ,....,, 21 representa los parámetros de

ajuste desconocidos.

En general se tienen p observaciones de la variable dependiente y p observaciones para cada una de las variables independientes, obteniéndose p ecuaciones para n coeficientes desconocidos, por lo que el número de observaciones p debe ser mayor o igual a n . En la práctica, p debe ser por lo menos cuatro o cinco veces n . Las p ecuaciones son de la forma:

pnnppp

nn

nn

XCXCXCy

XCXCXCy

XCXCXCy

,,22,11

1,2,222,111

1,1,221,111

...

........................................................

...

...

+++=

+++=+++=

3-3

Donde iy es la i -ésima observación de la variable dependiente y ijX es la i -ésima

observación de la j -ésima variable independiente. Las ecuaciones anteriores se pueden rescribir de forma matricial como:

=

npnpp

n

n

p C

C

C

XXX

XXX

XXX

y

y

y

.

....

. .. . .

....

....

.

. 1

1

,,2 ,1

1,1,2 1,1

1,1,2 1,1

2

1

3-4

En forma abreviada XCY = , donde Y es el vector 1×p de observaciones de la variable dependiente, X es la matriz np× formada por las p observaciones de cada una de las n variables independientes y C es el vector 1×n de los parámetros de ajuste desconocidos. El vector de parámetros C puede ser estimado minimizando ∑ ie2 , donde

ji

p

j jiiii XCyyye ,1ˆˆ ∑ =

−=−= , y jC es el valor estimado de jC usando mínimos cuadrados.

Finalmente, luego de derivar e igualar a cero, se obtiene la siguiente expresión para estimar C :

( ) YXXXC TT 1ˆ −= 3-5

Page 65: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

3-4

El modelo de regresión lineal asume que los errores ie son independientes y están

idénticamente distribuidos, además se requiere que las variables ijX sean independientes (no

estén correlacionadas) y que la observaciones de variable dependiente iy estén normalmente

distribuidas.

Pese a sus hipótesis, el modelo de regresión lineal múltiple es fácilmente programable y puede ser ampliamente utilizado en problemas relacionados con el aprovechamiento de los recursos hidráulicos. Algunos trabajos como el de Carvajal et al. (1998), Poveda et al. (2002), Smith et al. (2004), Rojo y Carvajal (2010) han usado la regresión lineal múltiple para la predicción de caudales medios mensuales, ya sea utilizando una regresión general (que ajuste toda la muestra) o mediante una regresión periódica (que ajusta una regresión por mes). Como antecedente, en el trabajo de Poveda et al. (2002) los modelos PREBEO (RLM + ONDITAS) y RLM fueron en su orden los de mayor habilidad de pronóstico puesto que exhiben los menores errores de predicción, para todos los ríos y todas las ventanas de pronóstico.

3.2.2 Modelos de series de tiempo

Los modelos de series temporales buscan representar el hecho de que los datos tomados a través del tiempo pueden tener una estructura interna (como la persistencia, la tendencia o la variación estacional) que deben tenerse en cuenta a la hora de elaborar un pronóstico, dado que, en la modelación de la trayectoria dinámica de una variable, se pueden mejorar las previsiones mediante la proyección de dicha estructura interna. La primera aproximación a los modelos estocásticos son los denominados procesos autorregresivos construidos sobre variables estandarizadas iz de la serie de los iy . Es decir:

k

kkiki

yz

σµ−

= ,, 3-6

Donde kµ y kσ corresponden a la media y la varianza del mes k al que pertenece la i -ésima

observación de los kiy , .

Los modelos auto-regresivos de orden p AR(p) pueden describirse como aquellos en los que

una variable estandarizada tz en el tiempo t se explica, al menos en parte, en función de los

valores pasados de esa misma variable, así por ejemplo:

tptpttt zzzz εφφφ ++++= −−− ...2211 3-7

Donde:

tz : Es el valor de la variable estandarizada en el instante t , y

Page 66: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

3-5

tε : Ruido independiente de ktz − para todo 1≥k .

Los parámetros de la ecuación, iφ , presentes en la expresión 3-7 se estiman mediante las

ecuaciones de Yule-Walker, que en forma matricial se expresan como:

+++=

+++=

+++=

+++=

pppp

p

p

p

φρφρφρ

ρφρφρφρρφφρφρρφρφφρ

...

.............................................

...

...

...

21

332313

22212

11211

3-8

Donde los kρ corresponden a los coeficientes de auto-correlación de orden k .

Los modelos ARMA son modelos estocásticos que combinan los modelos autorregresivos (AR) con los modelos de media móvil (MA), cuya forma general está dada por:

qtqttptz −−− −−−+++= εθεθεφφ ...... z z 11p1-t1t 3-9

Donde los parámetrosiφ , qθ y iε tienen el mismo significado que para los modelos AR(p) y

MA(q).

Una manera eficiente de garantizar la estacionalidad de una serie consiste en diferenciarla la cantidad d de veces que sea necesaria, En general, la diferenciación de orden d tiene la forma:

dttt zza −−= 3-10

Los modelos autorregresivos integrados de media móvil (ARIMA), equivalen a aplicar un modelo ARMA sobre la serie de caudales no estacionaria diferenciada y su representación es como se muestra a continuación:

ttd aBzB )()( θϕ =∇ 3-11

Donde tz corresponde a la serie estandarizada, )(Bϕ son los coeficientes de la parte auto-

regresiva, )(Bθ los coeficientes de media móvil del modelo y d∇ el diferenciador de orden d .

Page 67: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

3-6

Quizás los modelos autorregresivos fueron los primeros en ser usados en la predicción de caudales medios mensuales en Colombia, trabajos como el de Mesa et al (1995), Poveda et al (2002), Smith et al (2004), muestran que los modelos autoregresivos lineales han sido poco eficientes pese a su facilidad en la programación; sin embargo el desempeño de dichos modelos mejora contundentemente cuando se estima el ruido mediante una técnica bilineal (Cadavid, 2009) o cuando se combinan con una técnica espectral (Carvajal, 1994; Carmona 2010).

3.2.3 Redes Neuronales Artificiales RNA

Una típica red neuronal consiste en una estructura conformada por un número de elementos (nodos) y las líneas de conexiones entre éstos. Los nodos correspondes a los elementos computacionales de la red y usualmente son conocidos como neuronas pues su diseño se basa en el funcionamiento de las neuronas que se encuentran en el cerebro humano. Las líneas de conexión transfieren información entre un par de neuronas y sobre cada conexión se designa un valor denominado peso de la conexión.

Una red neuronal usualmente posee una matriz de datos de entrada, que constituyen la denominada capa de entrada, las neuronas en la red acumulan los datos de entrada multiplicados por los pesos en las conexiones y mediante fórmulas de transformación matemática, conocidas como funciones de transferencia, convierte dichas acumulaciones en las salidas de cada neurona. Las salidas de cada neurona generalmente son distribuidas (pero no divididas) según el numero de conexiones a fin de proveer de entradas a otras neuronas que se encuentran en una nueva capa denominada capa oculta. Por último las salidas de la capa oculta son trasformadas y llevadas por medio de conexiones a la neurona de salida.

A manera de ejemplo en la Figura 3-1 se propone una topología de red neuronal para predecir una variable dependiente y , dadas las variables explicativas ( )321 ,, XXX , la red sugerida

posee seis neuronas esquematizadas por los círculos, cada par de neuronas se conecta con una flecha o conexión sobre la cual existe un peso nmw , siendo m la neurona de partida de la

conexión y n la neurona de llegada. El número de neuronas de la capa de entrada es de tres (neuronas 1, 2 y 3), el número de neuronas en la capa oculta es de dos (neuronas 4 y 5) y existe una sola neurona de salida (neurona 6). Los valores que ingresan a la red (inputs) corresponden a la variables independientes ( )321 ,, XXX y la salida de la red corresponde al

valor estimado de y .

Existen varios tipos de redes neuronales pero el utilizado en el presente trabajo se denomina: “ Perceptrón Multicapa de Retropropagación” , una red especialmente aplicada en la predicción hidrológica (Maier & Dandy, 2000). El perceptrón multicapa es un tipo de red neuronal con una capa de entrada, una capa de salida y varias capas ocultas, para éste caso solo consideramos una capa oculta. La capa de entrada tendrá un número de neuronas igual al número de entradas externas a la red. Las entradas a cada neurona son trasformadas utilizando

Page 68: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

3-7

una función de transferencia ()g . Por ejemplo, en la capa de entrada, las variables externas

iX son trasformadas por una función que las deja idénticas.

Figura 3-1 Topología de red neuronal para pronóstico de Caudales

ii XXg =)( 3-12

Las neuronas de la capa oculta suman las salidas trasformadas de las neuronas en la capa de entrada multiplicadas por el peso de las conexiones, y transforman dicha sumatoria mediante una función de trasferencia de la forma:

= ∑=

n

iimimmout Xwgy

1,,, 3-13

Donde mouty , corresponde a la salida de la neurona m , imX , es la entrada a la neurona m

proveniente de la neurona i y ()g es la función de transferencia que en este caso corresponde a la sigmoidea bipolar dada por la ecuación:

1)1(

2)(

2−

+= − xe

xg 3-14

Los pesos de la red neuronal deben ser ajustados mediante un entrenamiento que consiste en comparar las salidas de la red con datos históricos de un período previamente elegido, el algoritmo de ajuste de los pesos se conoce como algoritmo de retropropagación , el lector

Page 69: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

3-8

podrá consultarlo en el trabajo de Hammerstrom (1993). La ecuación del perceptrón multicapa para la predicción de una variable y dependiente de los datos ( )nXXX ,.....,, 21 :

∑ ∑=

=

⋅⋅=

H

j

m

iijiji

l

Xwgwy1

1

0,, 3-15

Siendo H el número de neuronas en la capa oculta, ()g la función de transferencia y jiw , el

peso de la conexión entre la neurona i de la capa j .

La primera aproximación de predicción de caudales medios mensuales utilizando las redes neuronales fue presentada por Carvajal (1994), en adelante sería un método obligado para la predicción de caudales en trabajos posteriores. En el trabajo de Poveda et al (2002) la RNA mostraba los resultados mas deficientes seguido por los métodos Auto regresivos, además una observación preliminar de los resultados permite afirmar que el RMSE (raíz del error cuadrático medio) no es proporcional con el tamaño de la ventana ( se esperaría que a menor tamaño de ventana menor RMS), y si bien el modelo puede ser competitivo para ventanas de 12 meses a horizontes de pronóstico inferiores su eficiencia puede ser equiparada a la de los modelos auto-regresivos para los ríos Alicachin, San Carlos, Salvajina, Betania, Guavio y Nare (Velasquez, 2009).

3.2.4 Polinomios Adaptivos de regresión Multivariada (MARS)

El modelo MARS (acrónimo de Multivariate adaptive regression splines) es una forma de análisis de regresión introducida por Jerome Friedman en 1991, una técnica no paramétrica caracterizada por el ajuste de una función global basado en varias funciones paramétricas simples, generalmente polinomios de bajo orden, definidas sobre una subregión del dominio mediante ajuste por tramos. El problema de este tipo de modelamiento se presenta en las discontinuidades y cambios bruscos dependientes en los límites de las funciones, que debe ser controlado limitando el número de subregiones y estableciendo derivadas continuas en los límites de cada subregión.

El método MARS es una generalización del particionamiento recursivo, el cual resulta adecuado para la expansión de funciones de altas dimensiones y que consiste en la aproximación de una función diferente en cada subregión al ser dividida óptimamente (minimizando la falta de ajuste) en dos regiones: región izquierda y región derecha. Se optimiza la partición en todas las variables )(n y en todos los puntos t usando un buen criterio de ajuste. Las subregiones son entonces recombinadas hasta que se encuentra un óptimo que tenga el mínimo de subregiones posibles.

La función de aproximación del modelo MARS puede ser de la forma (Rendon, 1997):

Page 70: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

3-9

)()(ˆ1

XBaXf m

M

mm∑

== 3-16

Donde M es el número de subregiones, ma son los coeficientes de la función y )(XBm es una

función básica o base, dada por:

( )[ ]+=

∏ −=MK

kKMKMm tmkXSHXB

1

),()( 3-17

Donde H es una función de paso que va desde 1=k hasta Mk , el número de divisiones

resultantes en la función básica, KMS es igual a 1± según sea la división derecha ó izquierda

respectivamente, KMt es el nudo o partición de la variable y X es la variable predictora. El signo (+ ) como subíndice de dicha expresión significa que sólo se toma como resultado cuando el argumento de la función es positivo, de lo contrario se hace igual a cero. Esta metodología de aproximación de funciones básicas o bases se conoce entonces con el nombre de particionamiento recursivo de regresión revisada (Rendón, 1997).

MARS, al igual que las demás herramientas de ajuste usadas en predicción, trata de encontrar la mejor relación de dependencia entre la variable por predecir y las variables de apoyo o variables predictoras. Es un método que “ajusta” el mejor modelo de predicción mediante una búsqueda de minimización de errores de ajuste de los datos, y utilizando criterios de penalización por un mayor número de variables predictoras. En general, si y es la variable por

predecir y X es el vector de variables predictoras ( nXXX ,...,, 21 ), se trata de ajustar una

función del tipo 3-16. El ajuste por tramos posibilita la inclusión o la exclusión de una determinada variable en el modelo de ajuste, dentro de un sub-dominio determinado. Sin embargo, en la modelación no paramétrica estará siempre presente la competencia entre la suavidad de la función ajustada y la flexibilidad del ajuste. Además, la modelación no paramétrica presenta dificultades en la aproximación de funciones en dominios de alta dimensión, asociados con la gran cantidad de datos necesarios en el dominio, cuando hay un número considerable de variables predictoras.

Las estrategias para mejorar la aproximación de funciones en espacios de alta dimensionalidad, están basadas en la computación adaptiva (de la minería de datos), la cual ajusta dinámicamente los polinomios teniendo en cuenta el comportamiento de la función por aproximar. Una de las bases de la computación adaptiva es el particionamiento recursivo, cuyo objetivo es usar los datos para estimar simultáneamente un buen conjunto de subregiones y parámetros asociados con cada una de las funciones de cada subregión. La partición recursiva tiene la capacidad de detectar la baja dimensionalidad de las funciones de ajuste. Una función puede depender fuertemente de un gran número de parámetros de manera global, pero localmente la dependencia es fuerte sólo en unas pocas variables. El problema de ésta

Page 71: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

3-10

herramienta es que la función aproximada es discontinua en los límites de las subregiones del dominio. Otra dificultad es que cierto tipo de funciones simples son difíciles de aproximar. Las dificultades aparecen cuando las interacciones dominantes involucran una pequeña fracción del número total de variables. En Friedman (1991) se detallan los aspectos relacionados con la modelación no paramétrica y la computación adaptiva. Allí se presenta completamente el algoritmo de ajuste de MARS.

En general, MARS intenta superar las limitaciones de la modelación no paramétrica y el particionamiento recursivo, generalizando los procedimientos. Por ejemplo, garantizando modelos continuos y derivadas continuas. El modelo de ajuste de MARS se puede escribir de la forma:

( ) ( ) ( ) ( )∑∑∑===

++++=321

0 ........,,,ˆmmm k

kjiijkk

jiijk

ii XXXfXXfXfaXf 3-18

Donde 0a es una constante, el segundo término representa la suma de todas las funciones

básicas que involucran sólo una variable, el tercer término representa la suma de todas las

funciones básicas que involucran dos variables y así sucesivamente. Si ( ) ( ){ } mkmkvmV 1,= es

el conjunto de variables asociadas con la m-ésima función base mB , cada función en el

segundo término de la ecuación se puede expresar según la ecuación 3-17. Cada función bivariada en el tercer término de la ecuación puede ser expresada como:

( ) ( )( )

∑∈

=

=mVi

mkjimmjiij XXBaXXf

2

,, 3-19

Que es la suma de todas las funciones básicas bivariadas que involucran un par determinado de variables iX y jX . Si a la expresión se le suman los correspondientes aportes univariados,

expresión de cada variable que conforma un par, se obtiene:

( ) ( ) ( ) ( )jjiijiijjiij XfXfXXfXXf ++= ,,* 3-20

Que representa la contribución bivariada al modelo global de las variables iX y jX .

Para la selección del modelo final se tiene en cuenta el criterio de “falta de ajuste”, (Lack Of Fit), definido como el máximo número de funciones básicas maxM . Adicionalmente, el criterio

de falta de ajuste usado depende de la función de pérdida “delta” especificada como el error integral o el error esperado. Una función para dicho error está definida como:

Page 72: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

3-11

( )[ ]∑

=

−==

N

i

iMiM

N

MC

Xfy

NMGCVfLOF

12

2

)(1

ˆ1)()ˆ( 3-21

El criterio )(MGCV es el promedio de los residuos al cuadrado afectado por un factor de penalización, el cual se presenta en el denominador. La penalización se relaciona por el número de parámetros por ajustar al modelo, en este caso por la cantidad de funciones básicas, y que es una función de costo dada por la siguiente expresión.

1))(()( 1 += − TT BBBBtrazaMC 3-22

Donde B es la matriz de datos de las M funciones básicas ( )( jiij XBB = ). La reducción en

la desviación es directamente reflejada en reducción del error promedio esperado al cuadrado (numerador). El denominador depende del incremento en varianza debido al número adicional de parámetros.

Friedman y Silverman (1989) sugieren usar un incremento en la función de costo dM para reflejar los parámetros adicionales (Funciones Básicas), que con los coeficientes de expansión ( )(MC ) se ajustan a los datos. Esta función de costo puede ser expresada como:

dMMCMC += )()(' 3-23

Donde M es el número de funciones básicas no constantes en el modelo MARS y d representa el costo para cada una de las funciones básicas de optimización, el cual es un parámetro del procedimiento. Friedman y Silverman (1989) sugieren 2=d , pero también puede ser hallado por técnicas de remuestreo.

Los conceptos aquí presentados corresponden a una selección de los presentados por Friedman en 1991 y pueden ser ampliamente consultados en el trabajo de Rendón (1997). Al respecto de la aplicación de dicho método para la predicción de caudales medios mensuales en Colombia MARS ha sido un modelo obligado y de bastante trascendencia dada su habilidad para modelar series no estacionarias de manera no paramétrica, al respecto de la aplicación del método, Rendón (1997,2001) utilizó el MARS para valorar los beneficios de la predicción Hidrológica en el sector eléctrico Colombiano, considerando la variabilidad climática. Poveda et al (2001, 2004) MARS demostró ser un modelo muy eficiente.

Page 73: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

3-12

3.3 ESTRATEGIA DE VALIDACIÓN E INTERVALOS DE CONFIANZA

3.3.1 Validación de los modelos de pronóstico

El objeto del análisis de regresión es la construcción de una función ( )nXXXf ,.....,,ˆ21 que

sea una aproximación razonable de ( )nXXXf ,.....,, 21 en el dominio D de interés. La noción

de razonable depende del propósito para el cual la función aproximada f vaya a ser utilizada y en casi todas las aplicación esta ligado a una medida de la precisión que a menudo está dada por el error integral:

( ) ( )[ ]∫ ∆=D

dxxfxfxwI ,ˆ)( 3-24

O el error esperado:

( ) ( )[ ]∑=

∆=N

iiii xfxfxw

NE

1

,ˆ)(1

3-25

Donde ∆ es el operador distancia y w es una función de ponderación. El error integral 3-24 caracteriza la aproximación sobre todo el dominio de interés, mientras la discretización 3-25 refleja solo la precisión en relación al conjunto de puntos ( )nXXX ,.....,, 21 que componen la

muestra de información. Cabe recordar que el interés de los modelos de pronóstico es estimar valores futuros que por defecto no se encuentran en la historia siendo el error 3-24 mucho más importante. Se vuelve entonces necesario definir una estrategia de validación que permita confrontar la habilidad de pronóstico de f cuando los datos no se encuentran en la muestra usada para calibrar los parámetros del modelo.

Como encontrar el error en todos los puntos del dominio es una tarea casi imposible, se requiere diseñar un procedimiento que permita evaluar la bondad de ajuste de los modelos para aquellos datos que no necesariamente se encuentran en la historia, es así como un conjunto de datos se extraen de la información histórica cuando se calibra un determinado modelo para ser usados después en la validación del mismo. La literatura general muestra dos procedimientos básicos para la verificación de los modelos de pronóstico: el primero se conoce como validación cruzada y el segundo como validación retroactiva.

En la validación cruzada (Figura 3-2) se omite un periodo de información con tamaño igual al de la ventana de pronóstico para un año específico, el resto de la información se utiliza en la calibración del modelo; luego se elaboran pronósticos para los años omitidos y al final los datos predichos se comparan con los datos históricos a fin de estimar el error de ajuste.

En contraste la validación retroactiva define claramente las porciones de información correspondientes a la calibración y la validación del modelo, y suele ser un ejercicio mas

Page 74: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

3-13

exigente que predice cada dato del periodo de validación sin incluirlo dentro de la muestra de calibración como lo muestra la Figura 3-3.

.

Figura 3-2 Esquema de validación cruzada

Figura 3-3 Esquema de validación retroactiva

Page 75: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

3-14

La precisión de las predicciones durante el período de validación puede estimarse mediante las diferentes medidas del error presentadas en la literatura de series de tiempo, muchas de ellas expuestas en el trabajo de Velásquez (2008), cuyo cálculo se basa en la siguiente notación: ty

denota la observación histórica en el tiempo t y ty corresponde al valor esperado de la

predicción para el periodo t donde Tt ,...,2,1= . Se define entonces el error (o residuo) de la

predicción como ttt yye ˆ−= , y el error porcentual como ttt yep /100×= . Con base en la

anterior notación se definen las siguientes medidas del error:

Sumatoria de errores al cuadrado:

∑=

=T

tteSSE

1

2 3-26

Error cuadrático medio o varianza del predictor:

T

SSEMSE= 3-27

La raíz del error cuadrático medio:

MSERMSE= 3-28

Si y corresponde al valor medio de la serie de datos entonces, el error cuadrático medio expresado como porcentaje del valor medio de los datos será:

100% ×=y

RMSERMSE 3-29

Y el promedio del error porcentual absoluto esta dado por:

∑=

=T

itp

TMAPE

1

1 3-30

Otro método utilizado para estimar la bondad de ajuste de un modelo es el coeficiente de determinación, o de correlación de Pearson, el cual consiste en establecer la correlación que existe entre los valores predichos y los valores históricos durante el periodo de validación; Así por ejemplo los resultados del pronóstico de caudales en validación retroactiva usando el modelo de regresión lineal múltiple para el río Guadalupe con ventana de un mes, durante el periodo comprendido entre enero de 2000 y diciembre de 2007 se presentan en la Figura 3-4, Se tiene una correlación de Pearson de 0.67 y un error medio cuadrático medio del 17.95%, y un promedio en el error porcentual de 16.1%.

Page 76: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

3-15

Figura 3-4 Predicción de los caudales medios mensuales del río Guadalupe usando RLM para una ventana de un mes, período 2000-2007.

3.3.2 Pronósticos probabilísticos e intervalos de confianza

La indicación de los diversos valores que puede adoptar la variable y y su probabilidad de ocurrencia son el objeto de las predicciones probabilísticas, una predicción probabilística añade valor a la predicción al incorporar información de la confianza que el sujeto que elabora la predicción le otorga al pronóstico obtenido, ésta confianza debería recoger las fuentes de incertidumbre de los sistemas de predicción y es expresada en términos de intervalos y/o percentiles. Una predicción probabilística se define como un sesgo en la distribución de probabilidad de la variable de interés con respecto a su distribución histórica, así pues, la calidad los pronósticos puede ser medida de forma objetiva mediante la utilización de los siguientes criterios:

Fidelidad: mide el grado de cumplimiento de los intervalos de confianza (la capacidad de saber distinguir a priori entre situaciones inciertas y ciertas).

Precisión: mide la desviación entre los valores predichos y los realmente obtenidos.

En la Figura 3-5 se muestra un esquema de las predicciones probabilísticas para el caudal medio de enero de 2006 en el río Guadalupe utilizando la historia y otros dos modelos. El modelo 1 representa un sesgo con respecto a la distribución histórica, sin embargo su rango de variabilidad es muy alto con respecto al modelo 2, por ello se considera que el modelo 2 es el más preciso. El caudal histórico para dicho mes fue de 23 m3/s y se encuentra dentro de los intervalos de confianza de los modelos 1-2 por tanto ambos modelos cumplen con el criterio de confiabilidad.

Page 77: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

3-16

Figura 3-5 Esquema de pronóstico probabilístico para el río Guadalupe en enero de 2006.

Existen diferentes formas para convertir los pronósticos arrojados por los modelos (valores determinísticos) en pronósticos probabilísticas, pero la manera mas fiable consiste en utilizar la varianza de los errores en el período de validación para ajustar una distribución de probabilidades que permitan la definición de los intervalos de confianza. Si se supone que los residuos de validación poseen media cero y distribución Gaussiana, las probabilidades podrán ser integradas usando la distribución t de Student tomando como media de la distribución la esperanza condicional arrojada por un modelo de regresión (el valor predicho) y la varianza igual a la varianza de los residuos del modelo de regresión para el mes especifico de la predicción (Simon & Baddour, 2007).

3.4 TÉCNICAS PARA MEJORAR LOS PRONÓSTICOS DE CAUDALES

3.4.1 Sobre el pre-procesamiento de los datos

Ya sea para optimizar el rendimiento de los algoritmos de ajuste, o para cumplir ciertas hipótesis de los modelos de regresión, algunas transformaciones a los datos son requeridas y en si mismas mejoran la precisión de los resultados. Básicamente el pre-procesamiento de los datos consiste en algunas adecuaciones que se hacen a la información para poder calibrar los modelos, por ejemplo, el algoritmo de retropropagación requiere que los datos hidrológicos se encuentren escalados para optimizar los pesos de las conexiones. También los modelos

Page 78: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

3-17

lineales RML, AR, ARMA, ARIMA, ARMAX, requieren datos estandarizados, normales y estacionarios que deben ser provistos bajo dichas condiciones para evitar errores en los cálculos; sin embargo es importante resaltar que no todos los modelos requieren un pre-procesamiento de la información y por lo general es decisión del modelador el uso de los diferentes tipos de transformación. A continuación se enumeran algunos de los tipos de transformación.

3.4.1.1 Algunos tipos de transformación

Para la operación eficiente de algunos de los modelos propuestos es necesario un tratamiento previo de los datos que incluye un proceso de normalización y escalonamiento de los datos (Ochoa, 2002). Un primer paso consiste en remover de la serie original el coeficiente de asimetría con el objeto de obtener una distribución de probabilidades que se encuentre centrada en la media, para tal efecto se aplica la siguiente trasformación:

( )ττττ QcQX vv −= log 3-31

Donde

τ gac = 3-32

Siendo τvQ el caudal medio para el mes τ ( 12,...,1=τ ) y año v ( aNv ,...,1= ) con aN el

número de años de la series; τQ es el caudal medio mensual del mes τ y a es un parámetro

adimensional cuyo valor es de 0.35 (Ochoa, 2002) el cual resulta de un análisis de regresión entre τg y τc ; τg es el coeficiente de asimetría para el conjunto τττ Nas QQQ ,...,,1 ; y τvX es la

serie normalizada de los caudales para el año v y el mes τ .

Para eliminar la periodicidad, la serie de caudales es estandarizada mediante la siguiente ecuación:

τ

τττ

Q

vv s

QQY

−= 3-33

Donde τQ y τQs son la media y la desviación estándar de la serie de caudales para el mes τ ,

y τvY son los valores estandarizados para el año v y el mes τ .

Finalmente una trasformación adicional es aplicada a la serie τvQ para llevar los datos a una

escala conveniente que permita su procesamiento en alguno de los métodos de ajuste propuestos. El rango de variación será reducido al intervalo [0,1] usando la siguiente trasformación:

Page 79: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

3-18

mM

mtt QQ

QQZ

−−

= 3-34

Siendo tQ el valor del caudal con ( ) τ+−= 112 vt ; MQ es el máximo valor de la serie τvQ ;

mQ es el mínimo valor de la serie, Este proceso ayuda a eliminar las inhabilidades internas de

la red neuronal (ASCE-TCAANNH, 2000) y el modelo MARS durante su operación.

3.4.2 Estacionariedad de los datos.

Dada su sencillez, los modelos lineales no son aptos para reconocer patrones relacionados con la falta de estacionariedad de los datos, de hecho los datos deben ser estacionarios para evaluar cualquier modelo lineal. El procedimiento típico para análisis de estacionariedad utiliza métodos cuantitativos que se basan en el uso de las pruebas de hipótesis de la estadística muestral; una hipótesis estadística es una afirmación que se hace acerca de la distribución de una población basado en una muestra de ella; en una prueba de hipótesis definimos una hipótesis nula (Ho) y una hipótesis alternativa (Ha), la prueba consiste en comparar un valor analizado asociado a Ho o a Ha contra un valor crítico que define la aceptación o el rechazo de la hipótesis evaluada. Para las pruebas de hipótesis aquí usadas intervienen generalmente las siguientes características de la serie:

• Una característica estadística del parámetro analizado.

• Un nivel de “significancia” de la prueba (α), que corresponde a la probabilidad de rechazar la hipótesis nula cuando era verdadera, o en términos mas sencillos α nos da una indicación de cuanta es la probabilidad de equivocarnos en la toma de decisión basados en la prueba. Generalmente se usa un nivel de significancia de un 5% de probabilidad.

• Grados de libertad de la prueba. La incertidumbre asociada a la medición de un parámetro depende del tamaño de la muestra, los grados de libertad son una indicación de esta incertidumbre debido al tamaño muestral.

Así pueden encontrarse cambios en la media, cambios en la varianza y tendencias, el procedimiento clásico implica una remoción de los cambios y tendencias encontrados para aplicar cualquier modelo lineal de ajuste, en la Figura 3-6. Se presenta el procedimiento clásico basado en pruebas de hipótesis aplicado en la predicción de la serie de caudales del río Tenche con una ventana de 12 meses.

Page 80: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

3-19

Figura 3-6 Análisis de estacionariedad clásico aplicado a la predicción de caudales del río Tenche con un modelo Lineal

Las series hidrológicas son no estacionarias por naturaleza y en muchas ocasiones las tendencias encontradas suelen depender de la cantidad de datos analizados, es así como en ocasiones no basta suponer tendencias lineales o polinómicas para describir los cambios en las series hidrológicas; en el ejemplo hipotético de la Figura 3-7 (Koutsoyiannis, 2006) se ilustra como varía la estacionalidad con la ventana de información, en la ventana A se asume que los datos son estacionarios en la media, en la ventana B se puede ajustar una ley parabólica para explicar la tendencia de los datos, pero en la ventana C donde la historia es mucho mas amplia se muestra que en el largo plazo el comportamiento es periódico sinusoidal.

Así pues, no basta solo con ajustar polinomios o usar pruebas de hipótesis para caracterizar las evidencias de cambio en series que por naturaleza son no estacionarias, un procedimiento alternativo fue presentado por Carmona (2010) para el análisis de tendencias de las oscilaciones de baja frecuencia de la serie usando la descomposición espectral, específicamente la trasformada de Hilbert Huang. Dicho procedimiento aplicado a la serie de caudales del río Tenche se presenta en la Figura 3-8. Los resultados indican una disminución en el porcentaje de error (%RMS) en los modelos lineales incorporando la no estacionariedad.

Page 81: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

3-20

Figura 3-7 Evolución de la estacionariedad con el tamaño de la ventana en una serie de tiempo (Koutsoyiannis, 2006).

Figura 3-8 Análisis de estacionariedad usando la descomposición en modos intrínsecos para la predicción de caudales del río Tenche.

Page 82: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

3-21

3.4.3 Modelos periódicos de pronóstico

Dada la dependencia de las variables hidrológicas de los diferentes ciclos astronómicos y macro-climáticos las series de caudales y precipitación poseen una estructura cuasi-periódica caracterizada por ciclos anuales y semianuales muy marcados. Por ejemplo, en el caso del rio Grande la magnitud y variabilidad de los caudales cambia con el transcurrir de los meses, incidiendo en la habilidad de pronóstico de los modelos. En la Figura 3-9 se superpone el ciclo anual del río Grande (en azul) y el coeficiente de correlación de Pearson obtenido para cada mes utilizando el método de regresión lineal múltiple con variables macro-climáticas, puede notarse que los meses de menor capacidad de pronóstico corresponden a los meses de invierno cuya variabilidad es mayor. Tal observación es consecuente con los comentarios de Poveda et al (2002) relacionando el ciclo anual y la estacionalidad del error.

Figura 3-9 Estacionalidad en el error

Dichas observaciones permiten justificar la construcción de modelos especializados para el pronóstico de meses específicos, lo que equivaldría a un modelo de regresiones periódicas, los cuales se definen a continuación:

Sea τvQ corresponde al caudal medio mensual para el mes τ ( 12,...,1=τ ) y año v

( aNv ,...,1= ) siendo aN el número de años de la serie. Al agrupar los caudales por mes se

pueden formular la función de ajuste por tramos:

Page 83: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

3-22

( )

( )( )

( )

( )

=⇒

=⇒

=⇒

==

12...,ˆ

...,ˆ

2...,ˆ

1...,ˆ

,ˆˆ

12,12,212,112

,,2,1

2,2,22,12

1,1,21,11

τ

τ

τ

τττττ

τ

n

n

n

n

v

XXXf

XXXf

XXXf

XXXf

XfQ

M

M 3-35

Donde τf corresponde a la función de ajuste estimada con uno de los modelos ya descritos

para el mes τ ( 12,...,1=τ ) y los τ,nX son las n variables independientes utilizadas para crear

la función de regresión correspondiente al mes τ . Básicamente se propone construir funciones de regresión especializadas en la predicción de cada mes a fin de capturar con mayor fidelidad la variabilidad de los caudales. En Figura 3-10 se presenta una comparación de la predicción de caudales para el río Grande con horizonte de un mes utilizando regresión lineal múltiple y regresiones lineales múltiples periódicas, los resultados muestran que el modelo periódico es más eficiente (posee mejor ajuste y menor error) que un modelo global de regresión.

Figura 3-10 Comparación entre modelo lineal y un modelo lineal periódico para la predicción de caudales del rió Grande con horizonte de un mes

Page 84: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

3-23

3.4.4 Incorporación de los métodos espectrales en la predicción.

La dinámica no lineal del sistema imprime un comportamiento caótico sobre la serie y por tanto ésta puede dividirse en dos partes: la señal propiamente dicha y el ruido, clasificación derivada de los periodos que posee cada oscilador y su aporte a la varianza total de la serie (Vautard, et al, 1992), en tanto la dinámica global de la serie puede ser parcialmente reconstruida utilizando aquellas componentes de baja frecuencia que mayor aporte hacen a la variabilidad de la serie de tiempo, la reconstrucción equivale a la aplicación de un filtro que elimina el ruido de la serie; las series filtradas reflejan la dinámica general de la variable y al mismo tiempo son mas predecibles (Carvajal 1994, Rojo & Carvajal 2010). Esquemas híbridos de pronóstico han demostrado ser muy eficientes en diferentes ventanas de pronóstico.

Los métodos espectrales presentados en el Anexo 1 pueden ser utilizados como filtros para la reconstrucción de la serie de tiempo. Por ejemplo, en la Figura 3-11 se muestra la reconstrucción de la serie estandarizada de caudales del el río Bata usando nueve componentes principales del Análisis Espectral Singular (AES), en dicha figura se evidencia que utilizar un método espectral conjuntamente con regresiones periódicas mejora ostensiblemente la capacidad de pronóstico de los caudales.

Figura 3-11 Incorporación de métodos espectrales en el pronóstico hidrológico, caso río Bata

Page 85: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

3-24

3.5 METODOLOGIA GENERAL PARA LA PREDICCIÓN DE CAUDALES

3.5.1 Protocolo de predicción

El procedimiento propuesto en este trabajo para la predicción de los caudales medios mensuales en los diferentes ríos de Colombia se esquematiza en la Figura 3-12, los datos de caudales y variables explicativas (variables macro-climáticas, lluvia, etc.) deben ser provistos por el modelador siendo almacenado en la memoria; para efectos del pronóstico de caudales se definen los siguientes procesos:

• Análisis de estacionariedad: una vez ingresan los datos dentro del modelo de pronóstico, han de ser analizados usando los procesos predefinidos de análisis de homogeneidad y el de análisis espectral. Ambos tienen por objeto analizar la estacionariedad de la series y establecer puntos de cambio, tendencias o componentes que puedan ser incorporadas para mejorar el pronostico de series de Caudales.

• Trasformación: con los parámetros hallados en el proceso anterior y los tipos de trasformación existentes el usuario podrá indicar los tipos de transformación sobre las series de caudales a fin de mejorar el rendimiento de los modelos de pronóstico, como resultado se obtendrá una serie trasformada y parámetros de dicha trasformación.

• Elección del modelo de predicción: cuenta con dos procesos predefinidos (o librerías) que permiten escoger entre diferentes métodos de regresión y de análisis espectral para la construcción del modelo predictivo. El usuario deberá fijar los parámetros básicos del modelo (periodicidad, componentes para la reconstrucción espectral, orden auto regresivo, número de capas y neuronas, número de tramos, etc.) así como el horizonte (o ventana) de pronóstico y los periodos de calibración y validación. Al final del proceso se obtienen las predicciones para la serie trasformada.

• Trasformada inversa: sobre los pronósticos de la serie trasformada se aplican las trasformaciones inversas de acuerdo a los tipos y parámetros de trasformación establecidos dos pasos atrás a fin de obtener los pronósticos preliminares.

• Evaluación de los resultados: con los pronósticos preliminares se plantea un esquema de validación que permita establecer algunas medidas estadísticas sobre la habilidad del modelo propuesto para el pronóstico de la serie de caudales. Si los indicadores estadísticos satisfacen las expectativas del modelador se aceptan dichas predicciones, de lo contrario deben cambiarse los parámetros del modelo seleccionado o las variables explicativas.

Page 86: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

3-25

Figura 3-12 Protocolo para la predicción de caudales medios mensuales en Colombia

Page 87: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

3-26

Para la construcción de los modelos de pronóstico el modelador podrá combinar los modelos de regresión con alguno de los métodos de reconstrucción espectral (Análisis Espectral Singular (AES), descomposición mediante la trasformada en onditas (OND), o la descomposición en modos empíricos de la trasformada de Hilbert Huang (HH)) pudiendo también optar por un esquema general o periódico (P) de regresión. En la Figura 3-13 se muestra la diversidad de modelos que pueden ser construidos usando la metodología propuesta.

Figura 3-13 Esquema general para la construcción de modelos de pronóstico

Así pues, se tienen cuatro métodos de regresión y tres métodos espectrales, que pueden ser usados o no para crear híbridos (combinaciones de modelos de regresión con métodos espectrales), lo que permite generar 16 modelos diferentes (12 modelos híbridos y 4 de solo regresión); si además se considera la posibilidad de usar esquemas periódicos de regresión, en

Page 88: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

3-27

total se pueden construir 32 modelos que son en principio completamente diferentes (probablemente unos modelos serán más eficientes que otros).

Quizás uno de los aportes más significativos del presente trabajo sea el haber construido sobre el entorno de MATLAB una gran cantidad de funciones que permiten tener en una sola plataforma todos los métodos de regresión y los métodos espectrales expuestos en el presente documento, así como funciones intermedias que permiten acoplar fácilmente los métodos espectrales a los esquemas de regresión y optar por funciones generales o periódicas para calibrar y validar los modelos de pronóstico. Todas las combinaciones expuestas en la Figura 3-13 se pueden recrear con el prototipo desarrollado, pero ante la enorme cantidad de modelos posibles, se han elegido los siguientes para continuar con la investigación:

AR (2) Modelo auto-regresivo de orden 2.

RLM Regresión lineal múltiple.

RNA (P) + HH Modelo periódico de regresión basado RNA y HH.

RLM (P) + AES Modelo periódico de regresión basado RLM y AES.

MARS (P) + OND Modelo periódico de regresión basado MARS y OND.

Los primeros dos son ampliamente utilizados en el medio y en la literatura como métodos generales de pronóstico. Los últimos tres son combinaciones de modelos de regresión, con métodos espectrales en esquemas periódicos.

Finalmente para la calibración y validación de los modelos propuestos se seleccionaron los siguientes períodos:

Período de Calibración: desde Año inicial de la serie hasta 1989.

Período de Validación: desde 1990 hasta el 2007.

Tipo de validación: Validación retroactiva.

Los resultados de validación para los ríos descritos en esta tesis de maestría para el período comprendido entre 2000-2007 con ventanas de pronósticos de 1, 3, 6 y 12 meses se presentan en el Anexo 2, y a manera de ejemplo, en Tabla 3-1 se muestran los resultados de la validación de los diferentes modelos para el río Guadalupe y en Tabla 3-2 para el río Bata.

Page 89: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

3-28

Tabla 3-1 Validación 2000-2007, Río Guadalupe con los diferentes modelos de pronóstico

1 MES 3 MESES 6 MESES 12 MESES

AR

(2)

RLM

RN

A (

P)

+ H

H

RLM

(P

)+A

ES

MA

RS

(P

)+O

ND

Page 90: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

3-29

Tabla 3-2 Validación 2000-2007, Río Batá con los diferentes modelos de pronóstico

1 MES 3 MESES 6 MESES 12 MESES

AR

(2)

RLM

RN

A (

P)

+ H

H

RLM

(P

)+A

ES

MA

RS

(P

)+O

ND

Page 91: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

3-30

3.6 ANÁLISIS DE RESULTADOS

En el presente capítulo han sido descritos los diferentes aspectos de los modelos más utilizados en la predicción de caudales medios mensuales en Colombia, se ha dado un repaso general por las principales metodologías aplicadas durante los últimos 20 años para el pronóstico de los caudales medios mensuales. Actualmente existe un número considerable de esquemas de regresión cuya aplicación ha sido ampliamente difundida en el pronóstico de caudales medios mensuales en Colombia. Los métodos lineales (ARIMA, RLM) son fácilmente programables y sus resultados pueden ser considerados como una primera aproximación en la obtención de los caudales futuros, la relación existente entre la climatología global y la hidrología del país no es lineal por lo que se justifica la utilización de modelos no lineales. Estos modelos aunque mucho más elaborados, son más eficientes.

Con el objeto de evaluar la eficiencia de los modelos usando criterios aplicables a todos los modelos se ha propuesto la validación retroactiva como el método general para la evaluación de los pronósticos hidrológicos. El esquema de validación retroactivo es el más exigente de los métodos de validación y los diferentes indicadores derivados de dicha evaluación (el %RMSE, el MAPE y el coeficiente de correlación de Pearson) son una herramienta útil para comparar los resultados de los diferentes modelos. Usando los residuos de validación se pueden generar predicciones probabilísticas y los intervalos de confianza. Los pronósticos probabilísticos permiten estimar los diversos cuantiles de la distribución de los pronósticos.

La transformación de la información, es un paso obligado en muchas de las metodologías planteadas, dado que mejoran la eficiencia de los modelos y permiten que los diversos algoritmos de regresión tengan un mejor desempeño. Algunas hipótesis como normalidad, estacionariedad, etc, también deben ser seriamente estudiadas en la formulación de los esquemas de regresión puesto que se debe cumplir con los requerimientos básicos de los modelos, y, si bien puede generarse una discusión sobre la naturaleza de los datos hidrológicos, la diversidad de modelos aquí presentados permite ensayar diferentes esquemas de manejo de la información a fin de de obtener la mejor representación de la naturaleza.

El uso de esquemas periódicos de pronóstico busca resolver (al menos en parte) el problema de la estacionalidad en el error que poseen las predicciones como fruto de la variabilidad intra-anual en las series de tiempo. La especialización de esquemas de regresión mediante la elaboración de modelos periódicos para el pronóstico de meses específicos amplia la gama de posibilidades para manejar la no-estacionalidad de los datos y su aplicación implica una reducción considerable en los indicadores de error. La aplicación de los esquemas periódicos puede aumentar el número de parámetros de los modelos (aunque puede abrirse una discusión de si existe un modelo global de muchos parámetros o doce modelos de pocos parámetros) aumentando el tiempo de cómputo. Al respecto se puede argumentar que la reducción en los indicadores de error es tan significativa que se justifica el uso de modelos más elaborados.

La aplicación de la descomposición espectral incrementa de forma sustancial la capacidad de la predicción de los diferentes modelos, incluso esquemas periódicos de modelos lineales

Page 92: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

3-31

alcanzan indicadores de error aceptables cuando se utilizan métodos espectrales para reconstruir las señales hidrológicas. Un aspecto destacable de los modelos analizados en el presente capítulo es su habilidad para el pronóstico de los caudales mínimos, los caudales máximos son mucho más difíciles de predecir, como se muestra en la Figura 3 14.

Figura 3-14 El problema del pronóstico de los caudales máximos

En términos generales el mejor de los modelos de pronóstico para los cuatro horizontes de predicción y los doce ríos del presente estudio es el MARS combinado con la transformada en onditas, seguido por las regresiones lineales múltiples con el AES, ambos usando un esquema periódico. Además, es evidente que los métodos no lineales (Redes neuronales y MARS) son mucho más eficientes que las regresiones lineales múltiples y los métodos auto-regresivos.

En general los pronósticos para los ríos del Norte y Oriente Antioqueño (con excepción de San Carlos) poseen errores inferiores al 20% para ventanas de 12 meses. La incorporación de variables asociadas al ENSO y al chorro del Chocó contribuyen significativamente a la obtención de dichos errores. En el pronóstico de los ríos del centro y el oriente del país se obtiene errores del 20% al 30% para ventanas de 12 meses incorporando variables asociadas al ENSO y a la humedad desde la cuenca Amazónica. EL caso particular del rio San Carlos donde los errores no son semejantes a los obtenidos en ríos vecinos puede evidenciar condiciones climáticas locales o errores en la construcción de la serie de tiempo, el presente trabajo solo se limita a reportar el caso. Una comparación de los diferentes criterios de error para todos los ríos se muestran en las Figuras 3-15, 3.16, 3-17 y 3-18.

Según los diferentes criterios para evaluar la habilidad de pronóstico de los modelos, los ríos de menor error en las predicciones son Guadalupe y Porce y los de mayor error son san Carlos y Batá, pese a ello el río Batá posee unos coeficientes de determinación muy altos. La distribución del error medio porcentual (MAPE) para los diferentes ríos con horizontes de pronósticos de uno, tres, seis y doce meses se muestran en la Figura 3 19.

Page 93: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

3-32

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

10.00

12.00

14.00

16.00

18.00

20.00

22.00

24.00

26.00

28.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%R

MS

E, M

AP

E)

MODELOS DE PRONÓSTICO RÍO GUDALUPE V=1

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%

RM

SE,

MA

PE)

MODELOS DE PRONÓSTICO RÍO GUDALUPE V= 3

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%R

MSE

, MA

PE)

MODELOS DE PRONÓSTICO RÍO GUDALUPE V=6

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%R

MSE

, MA

PE)

MODELOS DE PRONÓSTICO RÍO GUDALUPE V=12

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%R

MS

E, M

AP

E)

MODELOS DE PRONÓSTICO RÍO TENCHE V=1

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%

RM

SE,

MA

PE)

MODELOS DE PRONÓSTICO RÍO TENCHE V= 3

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%R

MSE

, MA

PE)

MODELOS DE PRONÓSTICO RÍO TENCHE V=6

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%R

MSE

, MA

PE)

MODELOS DE PRONÓSTICO RÍO TENCHE V=12

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%R

MS

E, M

AP

E)

MODELOS DE PRONÓSTICO RÍO GRANDE V=1

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%

RM

SE,

MA

PE)

MODELOS DE PRONÓSTICO RÍO GRANDE V= 3

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

43.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%R

MSE

, MA

PE)

MODELOS DE PRONÓSTICO RÍO GRANDE V=6

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

43.00

48.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%R

MSE

, MA

PE)

MODELOS DE PRONÓSTICO RÍO GRANDE V=12

%RMSE MAPE R2

Figura 3-15 Comparación indicadores de error para los ríos Guadalupe, Tenche y Grande

Page 94: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

3-33

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

10.00

12.00

14.00

16.00

18.00

20.00

22.00

24.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%R

MS

E, M

AP

E)

MODELOS DE PRONÓSTICO RÍO PORCE V=1

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%

RM

SE,

MA

PE)

MODELOS DE PRONÓSTICO RÍO PORCE V= 3

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%R

MSE

, MA

PE)

MODELOS DE PRONÓSTICO RÍO PORCE V=6

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%R

MSE

, MA

PE)

MODELOS DE PRONÓSTICO RÍO PORCE V=12

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%R

MS

E, M

AP

E)

MODELOS DE PRONÓSTICO RÍO GUATAPÉ V=1

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%

RM

SE,

MA

PE)

MODELOS DE PRONÓSTICO RÍO GUATAPÉ V= 3

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%R

MSE

, MA

PE)

MODELOS DE PRONÓSTICO RÍO GUATAPÉ V=6

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%R

MSE

, MA

PE)

MODELOS DE PRONÓSTICO RÍO GUATAPÉ V=12

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%R

MS

E, M

AP

E)

MODELOS DE PRONÓSTICO RÍO NARE V=1

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%

RM

SE,

MA

PE)

MODELOS DE PRONÓSTICO RÍO NARE V= 3

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%R

MSE

, MA

PE)

MODELOS DE PRONÓSTICO RÍO NARE V=6

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%R

MSE

, MA

PE)

MODELOS DE PRONÓSTICO RÍO NARE V=12

%RMSE MAPE R2

Figura 3-16 Comparación indicadores de error para los ríos Porce, Guatapé y Nare

Page 95: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

3-34

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

43.00

48.00

53.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%R

MS

E, M

AP

E)

MODELOS DE PRONÓSTICO RÍO SAN CARLOS V=1

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

43.00

48.00

53.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%

RM

SE,

MA

PE)

MODELOS DE PRONÓSTICO RÍO SAN CARLOS V= 3

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

43.00

48.00

53.00

58.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%R

MSE

, MA

PE)

MODELOS DE PRONÓSTICO RÍO SAN CARLOS V=6

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

43.00

48.00

53.00

58.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%R

MSE

, MA

PE)

MODELOS DE PRONÓSTICO RÍO SAN CARLOS V=12

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%R

MS

E, M

AP

E)

MODELOS DE PRONÓSTICO RÍO SAN LORENZO V=1

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

43.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%

RM

SE,

MA

PE)

MODELOS DE PRONÓSTICO RÍO SAN LORENZO V= 3

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

43.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%R

MSE

, MA

PE)

MODELOS DE PRONÓSTICO RÍO SAN LORENZO V=6

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

43.00

48.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%R

MSE

, MA

PE)

MODELOS DE PRONÓSTICO RÍO SAN LORENZO V=12

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

43.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%R

MS

E, M

AP

E)

MODELOS DE PRONÓSTICO RÍO MIEL V=1

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

43.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%

RM

SE,

MA

PE)

MODELOS DE PRONÓSTICO RÍO MIEL V= 3

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

43.00

48.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%R

MSE

, MA

PE)

MODELOS DE PRONÓSTICO RÍO MIEL V=6

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

43.00

48.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%R

MSE

, MA

PE)

MODELOS DE PRONÓSTICO RÍO MIEL V=12

%RMSE MAPE R2

Figura 3-17 Comparación indicadores de error para los ríos San Carlos, San Lorenzo y Miel.

Page 96: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

3-35

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%R

MS

E, M

AP

E)

MODELOS DE PRONÓSTICO RÍO MAGDALENA V=1

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%

RM

SE,

MA

PE)

MODELOS DE PRONÓSTICO RÍO MAGDALENA V= 3

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

43.00

48.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%R

MSE

, MA

PE)

MODELOS DE PRONÓSTICO RÍO MAGDALENA V=6

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

43.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%R

MSE

, MA

PE)

MODELOS DE PRONÓSTICO RÍO MAGDALENA V=12

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

43.00

48.00

53.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%R

MS

E, M

AP

E)

MODELOS DE PRONÓSTICO RÍO GUAVIO V=1

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

43.00

48.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%

RM

SE,

MA

PE)

MODELOS DE PRONÓSTICO RÍO GUAVIO V= 3

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

43.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%R

MSE

, MA

PE)

MODELOS DE PRONÓSTICO RÍO GUAVIO V=6

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

43.00

48.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%R

MSE

, MA

PE)

MODELOS DE PRONÓSTICO RÍO GUAVIO V=12

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

43.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%R

MS

E, M

AP

E)

MODELOS DE PRONÓSTICO RÍO BATA V=1

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

43.00

48.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%

RM

SE,

MA

PE)

MODELOS DE PRONÓSTICO RÍO BATA V= 3

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

43.00

48.00

53.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%R

MSE

, MA

PE)

MODELOS DE PRONÓSTICO RÍO BATA V=6

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

13.00

18.00

23.00

28.00

33.00

38.00

43.00

48.00

53.00

AR(2) RLM RNA (P) + HH RLM (P) + AES MARS (P) +

OND

R2

ERR

OR

(%R

MSE

, MA

PE)

MODELOS DE PRONÓSTICO RÍO BATA V=12

%RMSE MAPE R2

Figura 3-18 Comparación indicadores de error para los ríos Magdalena, Guavio y Batá.

Page 97: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

3-36

Figura 3-19 Error MAPE para MARS (p) +OND a diferentes horizontes de pronóstico

Page 98: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

3-37

Referencias

ASCE Task Committee on Application of Artificial Neural Networks in Hydrology (2000): “Artificial neural networks in hydrology II: hydrologic applications”, J. Hydrol. Eng., 5, 124–137, 2000b.

Box, G. E. P., G. M. Jenkins, y G.C Reinsel. (1994). Time Series Analysis: Forecasting and Control, Prentice-Hall, Englewood Cliffs, New Jersey.

Cadavid, J.D. (2009). “Modelo auto-regresivo bilineal aplicado a la predicción mensual de caudales en Colombia”. Tesis de grado Ingeniería Civil- Facultad de Minas. Universidad Nacional de Colombia, Medellín.

Carmona M.A. (2010). Identificación de modos principales de variabilidad hidroclimática en Colombia y la cuenca Amazónica. Tesis de Maestría en Ingeniería - Recursos Hidráulicos. Universidad Nacional de Colombia-Medellín.

Carvajal, L.F., (1994). Acerca de la predicción no lineal en hidrología. Tesis de Maestría, Universidad Nacional de Colombia, Facultad de Minas, Medellín, Colombia. 136 pp.

Carvajal, Luis F, Mesa, Oscar y Poveda, Germán (1998). Predicción Hidrológica en Colombia mediante Análisis Espectral Singular y Máxima Entropía. En: Ingeniería Hidráulica en México. Vol. XII, Núm. 1, II Época, (enero-abril de 1998); p. 7-16.

Friedman, J. H., Multivariate Adaptive Regression Splines (1991). Ann. Stat., 19, 1-142.

Hammerstrom D.W.& Rehfus S. (1993). “Neurocomputing hardware: present and future”. Artif. Intell. Rev. 7(5): 285-300.

Hoyos, C. (1999). Algunas aplicaciones de la transformada de Fourier y la descomposición en onditas a señales hidrológicas y sísmicas. Tesis Ingeniería Civil, Universidad Nacional de Colombia, Medellín,

Koutsoyiannis D. (2006). Nonstationarity versus scaling in hydrology, Journal of hydrology. Volume: 324. Issue: 1-4. Pages: 239-254.

Mesa O., Smith, R., Salazar, J.E. y Carvajal, L.F. (1995). Modelos de predicción de caudales para el sector eléctrico colombiano. Parte I. Avances en Recursos Hidráulicos, 3. Agosto de 1995. Universidad Nacional de Colombia. Sede Medellín. Facultad de Minas.

Mesa, O. et al. Streamflows Prediction Models for the Colombian Generation System Considering El Niño Effect (1996). Conference Procceding Paper in North and Environment Congress & Destructive Water, ASCE Publications, New York, 1477-1482.

Page 99: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

3-38

Mesa, O. et al. Beneficios de la Predicción no lineal de la Hidroclimatología en la Operación de un Sistema Hidrotérmico (2002). VI Congreso de Meteorología, Bogotá, Colombia.

MESA, O.J. et al. (2002). Predicción de caudales medios mensuales usando métodos no lineales. VI Congreso de Meteorología, Bogotá, Colombia.

Maier, H. and Dandy, G. (2000). “Neural networks for the prediction and forecasting of water resources variables: A review of modeling issues and applications”. Environ. Modell. Softw., 15(1), 101– 104.

Poveda, G., y Mesa, O.J.. (1993). “Metodologías de predicción de la hidrología Colombiana considerando el Fenómeno El Niño-Oscilación del Sur (ENOS)”. Revista Atmósfera, 20, Sociedad Colombiana de Meteorología pp. 26-39, Bogotá.

Poveda, G., Mesa, O.J, L.F Carvajal, C.D Hoyos, J.F. Mejía, L.A Cuartas y A. Pulgarín. (2002). “Predicción de caudales medios mensuales en ríos colombianos usando métodos no lineales”. Meteorología Colombiana, 6, 101-110.

Poveda, Germán et al. (2001). Predicción no lineal de la hidrometeorología de Colombia. Caso de estudio, caudales del Río Nare. IX Congreso Latinoamericano e Ibérico de Meteorología y VIII Congreso Argentino de Meteorología. Buenos Aires, 10 p.

Poveda, G., C. Hoyos, J. F. Meja, L. F. Cavajal, O. J. Mesa, A. Cuartas, y J. Barco, (2001). Predicción no lineal de los caudales medios mensuales del rio Nare. Revista Avances Recursos Hidráulicos, Posgrado en Aprovechamiento de Recursos Hidráulicos, no 8, septiembre de 2001. p 65-76.

ROJO, J. D. y L. F. CARVAJAL (2010). Predicción no lineal de caudales usando variables macro-climáticas y análisis espectral singular. Tecnología y Ciencias del Agua antes Ingeniería Hidráulica de México, vol 1, num 4, oct-dic, México, pp 59-73.

Smith R. A, Vélez J. I., Velásquez J. D., Ceballos A., Correa P. L., Góez C., Hernández O, Salazar L.F y Zapata E. (2004). “Modelos de predicción de caudales mensuales para el sector Eléctrico Colombiano”. Avances en recursos Hidráulicos, 11, Facultad de Minas, septiembre de 2004. P 91-102.

SMITH, Ricardo, Mesa, Oscar, Salazar, José y Carvajal Luis F. (1998).Modelos de Predicción de Caudales mensuales considerando anomalías climáticas. Aceptado para publicación en el XV III Congreso Latinoamericano de Hidráulica. Octubre.

SMITH, Ricardo, Mesa, Oscar, Salazar, José, Carvajal Luis F., Restrepo, Pedro y Juan D. Velázquez. (1998) Predicción de Caudales diarios para el Sector Eléctrico Colombiano. Aceptado para publicación en el XV III Congreso Latinoamericano de Hidráulica. Octubre.

Page 100: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH-UNAL

3-39

Rendón, L. (1997). Beneficios de la predicción Hidrológica en el sector eléctrico Colombiano, considerando la variabilidad climática. Tesis de Maestría Ingeniería Recursos Hidráulicos, Facultad de Minas, Universidad Nacional de Colombia, Sede Medellín.

Troccoli A.. (2007), Seasonal Climate: Forecasting and Managing Risk, © Springer. Printed in the Netherlands.

VAUTARD, R., YIOU and GHIL (1992). Singular-spectrum analysis: A toolkit for shot, noisy chaotic signals. Physica. D 58, 1992, pp. 95-126.

Velasquez, J.D. (2008). “Construcción de Escenarios de Pronóstico del Precio de Eléctricidad en Mercados de Corto Plazo”. Programa de Doctorado en Ingeniería – Área Sistemas Energéticos. Universidad Nacional de Colombia.

Velásquez N. (2009). Redes neuronales aplicadas a la predicción de caudales. Tesis de pregrado, Ingeniería Civil. Universidad Nacional de Colombia sede Medellín.

Page 101: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH -UNAL

Capítulo 4:

Incorporación de nuevas técnicas de pronóstico

En los últimos años, la frecuente aplicación del análisis estadístico a todo tipo de problemas ha originado la búsqueda de soluciones no

habituales que se adapten a los requerimientos y circunstancias actuales de predicción no lineal y no estacionaria. El campo no

paramétrico es uno de los más populares y está siendo empleado como una nueva herramienta de análisis estadístico. Esta herramienta ofrece

una alternativa más sofisticada en comparación con los modelos paramétricos tradicionales en la exploración de datos univariados o multivariados sin presuponer ninguna distribución específica de los

datos.

Page 102: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH -UNAL 4-1

4 INCORPORACIÓN DE NUEVAS TÉCNICAS DE PRONÓSTICO

RESUMEN

El presente capítulo tiene por objeto introducir dos nuevas metodologías para la predicción de caudales medios mensuales en Colombia. La primera de ellas son los polinomios localmente ponderados que pueden ser divididos en dos grandes grupos: El método de mínimos cuadrados móviles y las funciones de influencia radial, ambos esquemas de regresión tienen por idea básica ponderar con mayor valor aquellas observaciones más cercanas al momento de elaborar un pronóstico; se presentan las ecuaciones básicas de cada método y el procedimiento para encontrar los parámetros de la regresiones locales. Las redes neuronales polinómicas son un algoritmo de regresiones polinómicas sucesivas sobre un conjunto de variables independientes cuyo objeto es el de combinar pronósticos parciales de la variable dependiente mediante un algoritmo de agrupación de datos basado en los polinomios de Ivakhnenko y la teoría de mínimos cuadrados.

La aplicación de dichas técnicas de regresión en un esquema periódico de manera conjunta con los métodos espectrales, permiten desarrollar una poderosa herramienta de pronóstico que está por encima de los métodos tradicionalmente usados en el país para la predicción de caudales medios mensuales.

4.1 POLINOMIOS LOCALMENTE PONDERADOS

En los últimos años, la frecuente aplicación del análisis estadístico a todo tipo de problemas ha originado la búsqueda de soluciones no habituales que se adapten a los requerimientos y circunstancias actuales de predicción no lineal y no estacionaria. El campo no paramétrico es uno de los más populares y está siendo empleando como una nueva herramienta de análisis estadístico. Esta herramienta ofrece una alternativa más sofisticada en comparación con los modelos paramétricos tradicionales en la exploración de datos univariados o multivariados sin presuponer ninguna distribución específica de los datos. La estimación no paramétrica de la distribución de probabilidades ha llegado a ser un importante objeto de investigación estadística, aunque los primeros intentos de estimación no paramétrica de la densidad comenzaron en la década de los treinta, la preocupación por desarrollar este tema no surge hasta los años ochenta, siendo numerosas las publicaciones de trabajos realizados sobre los aspectos teóricos de este tipo de estimación.

A este tipo de estimaciones no paramétricas corresponden las funciones Kernel (Priestley & Chao, 1972), los polinomios localmente ponderados (mínimos cuadrados locales, polinomios móviles) (Cleveland 1979,1988) y las funciones de influencia radial (Powell, 1987). Dichas metodologías son conocidas como técnicas de interpolación y alisado porque perfeccionan el ajuste asignando diferentes pesos a los datos que coexisten en una vecindad. La idea consiste en ponderar con mayor valor aquellas observaciones más cercanas al momento de elaborar un pronóstico y con menor valor aquellas que quedan más lejos. En el caso de la predicción de

Page 103: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH -UNAL 4-2

caudales medios mensuales en Colombia se han aplicado técnicas de alisado como las funciones Kernel (Poveda et al, 2002) y Holt – Winters (Poveda, 2006). En el presente trabajo se estudian y aplican los polinomios localmente ponderados a la predicción de caudales medios mensuales en Colombia.

4.1.1 Polinomios localmente ponderados - mínimos cuadrados móviles

Los polinomios localmente ponderados (también llamados regresión polinomial móvil) o LWP (Locally Weighted Polynomials) fueron desarrollados por Cleveland (1979) como método de interpolación y luego mejorados por el autor (Cleveland, 1988) implementando las aproximaciones polinómicas locales. Algunos ejemplos de sus aplicaciones aparecen en Schmerling y Peil (1985). La aproximación LWP se elabora mediante un ajuste puntual de polinomios de bajo grado en subconjuntos localizados de datos, la idea básica es usar un polinomio ordinario para la regresión local eligiendo intervalos [ ]bxbx +− , siendo b el

ancho de banda; en cada intervalo se estima una función ( )xy . Los coeficientes del polinomio ajustado son hallados mediante mínimos cuadrados ponderados dando mayor peso en la ponderación a los puntos de datos más cercanos y menor peso a los puntos más alejados dentro del intervalo [ ]bxbx +− , .

Dado un modelo localizado, por ejemplo un polinomio de primer grado:

( ) xxy 10ˆ ββ += 4-1

Los coeficientes β suelen ser estimados minimizando la expresión:

( )( ) ( )∑∑==

+−=−=N

kkk

N

kkk xyxyy

1

210

1

2 minˆmin βββ 4-2

Para el ajuste de una regresión lineal localmente ponderada debe suministrarse un punto de referencia queryx con base al cual se construye un nuevo ajuste lineal que está mucho más

influenciado por puntos en la vecindad del queryx según la distancia euclidiana entre dichos

puntos. La regresión local es obtenida mediante la ponderación de cada punto en la vecindad del queryx en función de su distancia euclidiana, así pues un punto que se encuentre alejado del

queryx tendrá una ponderación de cero y un punto más cercano tendrá una ponderación alta.

Los parámetros de la regresión pueden ser estimados como:

( ) ( )( ) ( )( )∑∑==

+−=−=N

kkkkquery

N

kkkkquery xyxxwxyyxxw

1

210

1

2 ,minˆ,min βββ 4-3

Page 104: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH -UNAL 4-3

El lado derecho de la Figura 4-1 , muestra el efecto de la ponderación, cerca del punto de referencia (marcado con una X), los residuos más grandes son penalizados fuertemente, mientras con aquellos lejanos la ponderación es despreciable. Si el punto de referencia cambia de posición entonces los pesos sobre los datos podrían cambiar generando un nuevo ajuste lineal, por lo que el método también recibe el nombre de mínimos cuadrados móviles.

Figura 4-1 Comparación entre una regresión global y una regresión local.

La función de ponderación w depende de la distancia euclidiana entre el punto de referencia

queryx y las observaciones en la vecindad x , una de las funciones de ponderación más

utilizadas es la función Gaussiana dada por:

( ) ( )2exp, iiquery xxw αµ−= 4-4

Siendo

farthestquery xx ,=µ 4-5

Donde es el operador de la distancia euclidiana, farthestx es el punto más lejano de la

vecindad; cada aproximación local se controla variando el valor del coeficiente α y el mejor valor de dicho parámetro se obtiene automáticamente por validación cruzada.

En términos generales supóngase que una regresión polinómica local, construida alrededor de un punto de referencia queryx está dada por:

( ) ( ) ( ) ( )xtxtxtxy MMβββ +++= ...ˆ 2211 4-6

Page 105: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH -UNAL 4-4

Donde ( )xt j es una función que genera el j -ésimo término del polinomio de regresión, por

ejemplo, para un polinomio bicuadrático con datos de entrada ( )21, xx se tiene: ( ) 11 =xt ,

( ) 12 xxt = , ( ) 23 xxt = , ( ) 214 xxt = , ( ) 2

25 xxt = , ( ) 216 xxxt = . La ecuación 4-5 puede ser reescrita

más compactamente como:

( ) ( )xtxy Tβ=ˆ 4-7

Donde ( )xt es el vector de los términos del polinomio( ) ( ) ( ) ( )[ ]xtxtxtxt M,...,, 21= . La ponderación para el k -ésimo dato es computada como una función decreciente de la distancia euclidiana entre el kx y el queryx . Los valores de los coeficientes β son estimados

minimizando la expresión:

( )( )∑=

−N

kk

Tkk xtyw

1

2β 4-8

Con ( )kqueryk xxww ,= , usando mínimos cuadrados:

( ) yXXX TT 1−=β 4-9

Siendo ( )XX T una matriz de longitud MM × y yX T una matriz de 1×M donde:

( ) ( ) ( )∑=

=N

kkjkikji

T xtxtwXX1

, 4-10

( ) ( )∑=

=N

kikiki

T yxtwyX1

4-11

4.1.2 Funciones de influencia Radial (RBF)

Considere la relación que existe entre los caudales medios mensuales del río Guadalupe y las temperaturas superficiales del océano (SST) en las regiones Niño 1-2 y Niño 3-4, dicha relación puede ser presentada en un esquema tridimensional tal como se ilustra en la Figura 4-2. La escala de colores permite definir la localización de los caudales según su magnitud en función de las SST, por ejemplo los caudales máximos (los puntos de color rojo y anaranjado)

Page 106: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH -UNAL 4-5

parecen concentrarse en la región donde las SST para ambas regiones Niño son más bajas, es decir, los eventos más altos de caudal se presentan cuando las temperaturas en la región Niño 1-2 varían entre 18°C y 21°C y simultáneamente las temperaturas en la región Niño 3-4 varían entre 24°C y 27°C. Así mismo pueden definirse otras regiones para la existencia de caudales bajos (en Azul oscuro) e intermedios (en amarillo y azul claro). La Figura 4-2 muestra que los datos evidentemente coexisten en una vecindad y por tanto puede ser usada la información de de la vecindad para estimar la magnitud de los caudales para distintos valores de las SST.

Figura 4-2 Caudales del rio Guadalupe Vs SST Niño 1-2 y Niño 3-4

Así pues, el problema del pronóstico en hidrología puede ser entendido como un problema de interpolación, muy común en geoestadística, el cual dependen de la distancia o norma a los puntos en una determinada vecindad. En el subcampo matemático del análisis numérico, se denomina interpolación a la obtención de nuevos puntos partiendo del conocimiento de un conjunto discreto de puntos. Las funciones de influencia radial son un método de interpolación basado en un tipo especial de funciones cuya principal característica es que reducen (o aumentan) su respuesta monótonamente con su distancia a un punto central (Queipo et al. 2005). El centro, la distancia escalar y la forma precisa de la función de base radial son parámetros del modelo. Un modelo RBF puede ser expresado como:

( ) ( )∑=

−+=N

iii xxxy

1

ˆ φλµ 4-12

Page 107: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH -UNAL 4-6

Donde µ es una constante o un polinomio ponderado, λ son los coeficientes calculados

mediante la resolución de ecuaciones lineales, ( )φ es la función de base, ixx−

corresponde a la distancia radial ( ixxdist −= ) y N representa a la cantidad de datos

presentes en la muestra.

µ puede definirse como un promedio (simple o ponderado) de la información en la vecindad

y ( )∑=

−N

iii xx

1

φλ es una corrección a dicho promedio que depende de la distancia del punto

evaluado al conjunto discreto de puntos en la vecindad.

Volviendo al caso del río Guadalupe, supóngase que se desea conocer el valor da caudal para condiciones de las SST que no están presentes en la muestra de datos, para ello son usadas las funciones de influencia radial; en un punto establecido x se calcula la norma hacia todos los puntos de la vecindad ix (Figura 4-3), buscando obtener el caudal para el punto x como una

ponderación de los datos en la vecindad en función de la distancia radial.

Figura 4-3 El concepto de influencia Radial

Existen diferentes tipos de funciones de influencia radial ( )φ , entre ellos la función biarmónica, la multicuadrática, multicuadrática inversa, poliarmónica, Gausiana, etc. una completa revisión de los tipos de RB son presentados en Powell (1987) y Gutmann (2001) y algunas de sus ecuaciones son:

B.F Biarmónica (lineal):

( ) distdist =φ 4-13

Page 108: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH -UNAL 4-7

B.F Multicuadrática:

( ) 22 cdistdist +=φ 4-14

B.F Multicuadráica inversa:

( )22

1cdist

dist+

=φ 4-15

B.F Poliarmónica:

( ) ( ) ( )2222 ln cdistcdistdist ++=φ 4-16

B.F Gausiana:

( )

−=2

2

2exp

δφ dist

dist 4-17

Donde c es una constante de forma, que puede tomar el valor de 1 (Acar & Rais-Rohani 2009), y δ es la ventana (o radio) de ponderación. µ Será un valor constante definido como el promedio de y , es decir:

∑=

=n

iiy

n 1

1µ 4-18

Y en algunos casos, con el fin de evitar singularidad en la matriz para el cálculo de los parámetros λ , la RBF puede ser aumentada mediante la inclusión de una función polinómica de la forma:

( )∑=

=M

jjj xt

1

βµ 4-19

Donde ( )xt j son los términos del polinomio y jβ sus correspondientes coeficientes. Nótese

que 4-19 corresponde a una regresión local (de la forma 4-5), con lo que se puede afirmar que las funciones de influencia radial son una generalización mejorada de los mínimos cuadrados locales. Como la ecuación 4-11 es indeterminada (hay más parámetros a encontrar que numero de ecuaciones), entonces se imponen la condición de ortogonalidad a los coeficientes λ de la siguiente manera:

Page 109: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH -UNAL 4-8

( ) 01

=∑=

N

iiji xtλ 4-20

Combinando las ecuaciones 4-11 y 4-19 se obtiene el sistema matricial:

=

00

y

t

tAT β

λ 4-21

Donde ( )jiji xxA −= φ, con ni ,...,2,1= y nj ,...,2,1= , ( )ijji xtt =, , [ ]Tnλλλλ ,...,, 21= y

[ ]Tnββββ ,...,, 21= .

La solución del sistema (4-21) permite obtener los parámetros λ de ponderación de las RBF y los coeficientes β del polinomio.

La aplicación de la RBF multicuadrática sobre toda la región de la Figura 4-3, permite estimar mediante interpolación, valores de caudal para puntos que no están dentro de la muestra de datos. En la Figura 4-4 se muestran los resultados de interpolación para el río Guadalupe. Finalmente la ecuación 4-12 puede ser aplicada usando más de tres variables dado que

depende solo de la norma ji xx − cuyo cálculo pueden ser extendido a cualquier dimensión,

así pues, 4-12 es directamente una función de regresión. Las variables explicativas a usar en el modelo deben corresponder con rezagos de las variables independientes para asegurar la predicción del futuro en función de datos actuales o precedentes, y son usadas para definir la vecindad a usar en la ponderación.

Figura 4-4 Aplicación de RBF Multicuadrática para el pronóstico de caudales.

Page 110: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH -UNAL 4-9

4.2 REDES POLINÓMICAS

En el año 1971 del académico Alexis G. Ivakhnenko de instituto Soviético de Control Automático (Avlomatika) presentó su trabajo sobre la teoría polinómica de sistemas complejos usando una estructura de red tipo perceptrón multicapa, donde cada neurona ajusta una función no lineal que usualmente es un polinomio de segundo grado, cada neurona acepta dos entradas y la función implementada es de la forma:

( ) 2152

242

13221102 XXaXaXaXaXaaXAz +++++== 4-22

Donde ( )XA2 denota una transformación de segundo orden; en la Figura 4-2, tomada del trabajo original de Ivakhnenko, se presenta el diagrama de flujo de las redes polinómicas cuyo esquema se conoce como el método de agrupación para el tratamiento de datos (en inglés Group Method of Data Handling, GMDH).

Figura 4-5 Algoritmo de agrupación para el tratamiento de datos. I: primer capa de auto-selecciones, II segunda capa de autoselección, III: selección de todas las soluciones, IV: optimización.

4.2.1 Algoritmo de agrupación para el tratamiento de Datos (GMDH).

El algoritmo de agrupación para el tratamiento de datos tiene por objeto ajustar polinomios mediante funciones básicas de regresión involucrando a pequeños subconjuntos de las variables de entrada, cada uno de los polinomios obtenidos conforman lo que se denomina descripción parcial de la información (PD) (Oh et al, 2002). Si y es la variable a predecir y

X es el vector de variables predictoras ( nXXX ,...,, 21 ), un polinomio básico para la

construcción de una PD esta dado por:

Page 111: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH -UNAL 4-10

( ) FuvEvDuCvBuAvuAz +++++== 222 , 4-23

Donde FEDCBA ,,,,, son los parámetros de la PD y vu, corresponden a un par de variables extraídas de X tales que z corresponda al polinomio que mejor se ajusta a la variable dependiente y .

El proceso iterativo de construcción de cada capa del GMDH requiere tres pasos básicos a seguir:

Paso 1: se toman dos variables del conjunto de variables independientes nXXX ,...,, 21 , de

esta manera el número total de polinomios que pueden ser construidos usando 4-22 es igual a ( ) 2/1−nn ; como resultado, se obtiene una columna con los mz ( ( ) 2/1,...,2,1 −= nnm ) los

cuales corresponden a nuevas variables “mejoradas” altamente correlacionadas con la variable y de mayor habilidad de pronóstico en comparación con las variables iniciales del sistema

nXXX ,...,, 21 .

Paso 2: Se identifican las mejores mz utilizando como criterio de selección el mínimo error

cuadrático medio hallado por validación cruzada en relación a la variable de salida y , el

método de selección podrá eliminar aquellas mz cuyo ajuste no supere un umbral predefinido

con lo que al final se obtiene un grupo reducido de variables z que servirán de entradas a otra capa de la red.

Los pasos 1 y 2 corresponden a una iteración del algoritmo GMDH, luego las variables independientes nXXX ,...,, 21 cambian de posición en la red para generar nuevas PD en la

siguiente iteración.

Paso 3: este paso busca comprobar si el conjunto de ecuaciones del modelo, obtenidas en cada iteración se puede mejorar. El valor más bajo del criterio de bondad de ajuste obtenido durante la presente iteración es comparado con el valor más pequeño en la pasada iteración. Los pasos 1 y 2 se repiten hasta conseguir el menor error. Al final se llega a la obtención de un polinomio conocido como el polinomio de Ivakhnenko que esta dado por:

∑∑∑∑∑∑= = == ==

++++=m

i

m

j

m

kkjiij

m

ij

m

jiij

m

iii XXXcXXcXbay

1 1 11 11

...ˆ 4-24

4.2.2 Topología y pasos para la construcción de una red neuronal polinómica

El algoritmo de las redes neuronales polinómicas está basado en el método GMDH y utiliza polinomios como el lineal, cuadrático, cúbico etc. para la construcción de las descripciones

Page 112: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH -UNAL 4-11

parciales de los datos. Al elegir las variables de entrada más significativas y el orden del polinomio se pueden obtener las mejores descripciones parciales de datos (PD) cuya capacidad de ajuste depende del número de capas y neuronas definidas en la red. Así pues una red polinómica busca una relación del tipo:

( ) ∑∑∑ ++++==321

32132121

21211

11021 ...,...,ˆkkk

kkkkkkkk

kkkkk

kkn XXXcXXcXccXXXfy 4-25

Donde los sck ' denotan los coeficientes del modelo.

Un esquema general de red polinómica se presenta en la Figura 4-6, para determinar el valor de y , se construirá una PD para cada par de variables independientes en la primera interacción usando el método de los mínimos cuadrados; las PD óptimas serán seleccionadas mediante un criterio de bondad de ajuste y los valores ajustados miz han de ser utilizados como entradas en

una nueva capa de la red, el proceso se repetirá hasta obtener el mejor ajuste posible. Una vez la capa final haya sido construida aquel nodo caracterizado por el mejor criterio de ajuste será seleccionado como el nodo de salida del modelo, los nodos restantes de dicha capa se descartan, y, además, todos los nodos de las capas anteriores que no tienen influencia sobre el nodo de salida son eliminados al trazar la trayectoria del flujo de datos en cada iteración.

Múltiples iteraciones son requeridas para obtener el mejor ajuste y es por ello que la construcción de una red polinómica consta se los siguientes pasos:

Paso 1: determinar las variables de entrada del sistema:

nXXX ,...,, 21 se toman como predictores del sistema.

Paso 2: formar grupos de datos para el entrenamiento y la validación del modelo:

Las variables de entrada y salida del modelo ( ) ( )niiiiii XXXyXy ,...,,,, 21= con pi ,...,2,1=

(siendo p el número de observaciones) serán divididas en dos partes que denotan los

conjuntos de datos para el entrenamiento entp y la validación valp de la red, obviamente

valent ppp += . Los datos de entrenamiento de la red sirven para la construcción de la red

Polinómica (incluyendo el cálculo de los coeficientes de las PD en cada nodo) y los datos de la validación para la estimación del error de la red.

Page 113: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH -UNAL 4-12

Figura 4-6 Descripción general de una red Polinómica

Paso 3: selección de la topología de red Polinómica: la estructura de la red polinómica es seleccionada en función del número de variables de entrada y el orden de la PD en cada capa. Existen básicamente dos tipos de estructuras (Figura 4-7) llamadas red básica y red Modificada, que se pueden clasificar de la siguiente manera:

(a) Estructura de red básica: cuando el número de variables de entrada en cada PD es el mismo en todas las capas.

Caso 1: el orden del polinomio de las PD es el mismo en cada capa de la red.

Caso 2: el orden del polinomio de las PD varía en las capas de la red.

(b) Estructura de red Modificada: cuando el número de variables de entrada de cada PD cambia en las diferentes capas.

Caso 1: el orden del polinomio de las PD es el mismo en cada capa de la red.

Caso 2: el orden del polinomio de las PD varía en las capas de la red.

Paso 4: Determinar el número de variables de entrada y el orden del polinomio para formar la descripción parcial de los datos (PD):

Page 114: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH -UNAL 4-13

Figura 4-7 Topología de una red polinómica

Page 115: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH -UNAL 4-14

La determinación del orden de del polinomio y el numero de de variables de cada PD se establece en función de la arquitectura de la red seleccionada. En la Tabla 4-1 se presenta el tipo de polinomio a usar según el número de variables de entrada en cada PD.

Tabla 4-1 Estructuras de una red polinómica

Los tipos de polinomios son los siguientes:

Bilineal:

( ) CvBuAvuA ++=,1 4-26

Bicuadrático:

( ) ( ) FuvEvDuvuAvuA +++= 2212 ,, 4-27

Bicúbico:

( ) ( ) 223323 ,, JuvvIuHvGuvuAvuA ++++= 4-28

Trilineal:

( ) DwCvBuAwvuA +++=,,1 4-29

Tricuadrático:

( ) ( ) JvwIuwHuvGwFvEuwvuAwvuA ++++++= 22212 ,,,, 4-30

Tricúbico:

( ) ( ) NuvwMwLvKuwvuAwvuA ++++= 33323 ,,,, 4-31

Page 116: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH -UNAL 4-15

Paso 5: Estimación de los coeficientes de la PD.

El vector de coeficientes iC para cada PD es obtenido minimizando el error cuadrático medio

E , entre iy y miz .

( )∑=

−=trN

imii

tr

zyN

E0

21 4-32

Siendo

iiimi XCyz == ) 4-33

Utilizando la porción de información para calibrar el modelo se establece un conjunto de ecuaciones lineales de la forma:

ii XCY = 4-34

Y mediante la técnica de mínimos cuadrados, los coeficientes de las PD en cada nodo se estiman como:

( ) YXXXC Tii

Tii

1−= 4-35

Siendo [ ]TntryyyY ,...,, 21= , [ ]Tinkiiii tr

XXXXX ,...,,...,, 21= , [ ]Tiniii cccC ′= ,...,, 10 con la siguiente

notación: i : número del nodo, k : número del dato, trn número de datos en el periodo de

calibración y n′ el número total de coeficientes estimados. El proceso es implementado en forma repetitiva para todos los nodos de cada capa y para todas las capas de la red Polinómica.

Paso 6: Seleccionar las PDs con mejor capacidad predicativa.

Cada PD es estimada y evaluada usando los datos en el periodo de calibración, luego se hace una comparación entre los valores obtenidos y se seleccionan aquellas PDs con la mejor capacidad predicativa. Usualmente se seleccionan un número predefinido (W ) de PDs o en su defecto se define un umbral (índice) θ de capacidad predicativa para seccionar las PDs bajo la siguiente condición:

δθ +=< *EE j 4-36

Donde jE es el menor error de ajuste en la capa actual, *E es el menor error de ajuste en la

capa anterior y δ es una constante positiva especificada por el modelador.

Page 117: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH -UNAL 4-16

Paso 7: Chequear el criterio para detener el entrenamiento de la red.

La corrida de una red neuronal Polinómica se puede terminar cuando:

*EE j ≥ 4-37

El algoritmo de la RNP también puede terminar cuando el número de iteraciones definidas por el usuario es excedido.

Paso 8: Determinar las variables de entrada para la próxima capa de la red.

Si jE (el menor error de ajuste en la capa actual) no satisface la condición 4-36 entonces la

red puede ser expandida definiendo una nueva capa.

4.3 APLICACIÓN DE LAS NUEVAS TÉCNICAS AL PRONÓSTICO DE CAUDALES MEDIOS MENSUALES EN COLOMBIA.

Las técnicas de pronóstico del presente capítulo son funciones de regresión que pueden ser combinadas con cualquier método espectral para formar nuevos modelos de predicción. Igualmente pueden ser implementados en esquema periódico utilizando el protocolo propuesto en el capítulo 3. Se propone la combinación de los polinomios ponderados (PPON), en este caso las RBFs en un esquema periódico (P) combinados con la transformada de Hilbert Huang (HH) y las redes neuronales polinómicas (RNPOL) en un esquema periódico (P) con el Análisis espectral Singular (AES). Inicialmente la serie estandarizada de caudales se descomponen en sus principales armónicos usando uno de los métodos espectrales del Anexo 1, la serie descompuesta es parcialmente reconstruida para eliminar el ruido, por ejemplo la descomposición en modos intrínsecos (IMFs) para la serie del río Guatapé se presenta en la Figura 4-5. El uso de RBFs de forma adjunta con un método espectral permite aumentar de forma significativa la habilidad de pronóstico del modelo como se muestra en la Figura 4-6.

Las variables explicativas, en el caso de los polinomios ponderados usando RBFs, son usadas para establecer la coexistencia de los caudales dados diferentes valores de variables macroclimáticas. Para el caso del río Guatapé, la serie de caudales reconstruida usando la trasformada de Hilbert-Huang es analizada de manera conjunta con las anomalías de temperatura rezagadas (con dos retardos) para las regiones Niño 1-2 y Niño 3-4 usando RBFs (Figura 4-7). Los valores más altos en las anomalías estandarizadas de caudales se presentan cuando las anomalías de temperaturas en la región Niño 1-2 están en el rango [ ]1,2− y las

anomalías de la región Niño 3-4 se encuentran sobre la región [ ]1,2−− .

Page 118: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH -UNAL 4-17

Figura 4-5 Aplicación de la descomposición en modos intrínsecos para la serie de caudales del río Guatapé (a) Descomposición; (b) Reconstrucción.

Figura 4-6: Incorporación de un método espectral en la predicción con polinomios ponderados

Page 119: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH -UNAL 4-18

Figura 4-7: Incorporación de un método espectral en la predicción con polinomios ponderados

Finalmente para todos los horizontes de pronóstico se evalúa el uso de las diferentes técnicas espectrales y se selecciona la mejor para ser usada en la predicción de caudales. En la Tabla 4-2

Tabla 4-2 Comparación de los PPON usando diferentes métodos espectrales

1 mes 3 meses 6 meses

PPON

+

AES.

PPON

+

OND.

PPON

+

IMFS

Page 120: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH -UNAL 4-19

Para la aplicación de las redes polinómicas al pronóstico de caudales se seleccionan aquellas variables explicativas cuya correlación con la serie de caudales sea significativa, dichas variables pueden corresponder a varios rezagos de caudal, rezagos de lluvia, y variables macro-climáticas. Las múltiples variables seleccionadas son adoptadas como la capa de entrada de la red polinomica (Figura 4-8).

Figura 4-8: Incorporación de un método espectral en la predicción con polinomios ponderados

En la Tabla 4-3 se presenta una comparación entre el mejor de los modelos tradicionales (MARS), los polinomios ponderados y las redes polinómicas para la predicción de los caudales del río Guadalupe con ventanas de 1, 3 6, y 12, meses; en la Análisis de los resultados

Se han propuesto como nuevas técnicas para la predicción de caudales medios mensuales en Colombia los polinomios ponderados y las redes neuronales polinómicas. Al igual que el modelo de regresión MARS las metodologías aquí expuestas tienen la ventaja de ser no-paramétricas, por lo que el cálculo de los parámetros de calibración no depende de la distribución probabilística de los datos, lo que convierte a los modelos aquí expuestos en excelentes candidatos para la modelación de procesos no lineales y no estacionarios como los caudales.

Al igual que los demás métodos de regresión presentados en el capítulo anterior, los polinomios ponderados y las redes polinómicas pueden ser combinadas con un método

Page 121: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH -UNAL 4-20

espectral para generar modelos de pronóstico más robustos, los mejores híbridos fueron obtenidos combinando los polinomios ponderados con la transformada de Hilbert Huang (PPON +HH) y las redes polinómicas con el Análisis espectral singular (RNPOL +AES), ambos usando un esquema periódico ((P)).

Tabla 4-4 se presenta igualmente los resultados para el río Batá. La aplicación de las metodologías aquí presentadas en los demás ríos puede ser consultada en el Anexo 2.

Tabla 4-3 Predicción de caudales río Guadalupe con Polinomios ponderados y Redes polinómicas

1 mes 3 meses 6 meses 12 meses

MA

RS

(P

)+O

ND

PP

ON

(P

)+H

H

RN

PO

L (P

)+A

ES

Page 122: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH -UNAL 4-21

4.4 ANÁLISIS DE LOS RESULTADOS

Se han propuesto como nuevas técnicas para la predicción de caudales medios mensuales en Colombia los polinomios ponderados y las redes neuronales polinómicas. Al igual que el modelo de regresión MARS las metodologías aquí expuestas tienen la ventaja de ser no-paramétricas, por lo que el cálculo de los parámetros de calibración no depende de la distribución probabilística de los datos, lo que convierte a los modelos aquí expuestos en excelentes candidatos para la modelación de procesos no lineales y no estacionarios como los caudales.

Al igual que los demás métodos de regresión presentados en el capítulo anterior, los polinomios ponderados y las redes polinómicas pueden ser combinadas con un método espectral para generar modelos de pronóstico más robustos, los mejores híbridos fueron obtenidos combinando los polinomios ponderados con la transformada de Hilbert Huang (PPON +HH) y las redes polinómicas con el Análisis espectral singular (RNPOL +AES), ambos usando un esquema periódico ((P)).

Tabla 4-4 Predicción de caudales río Batá con Polinomios ponderados y Redes polinómicas

1 mes 3 meses 6 meses 12 meses

MA

RS

(P

)+O

ND

PP

ON

(P

)+H

H

RN

PO

L (P

)+A

ES

Page 123: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH -UNAL 4-22

En las Figuras 4-6, 4-7, 4-8 y 4-9 se presenta la comparación entre el mejor de los modelos del capítulo 3 y los nuevos modelos propuestos. Dicha comparación demuestra una disminución significativa en los indicadores de error (RMSE y MAPE) y un aumento en el coeficiente de Pearson para todos los ríos al usar los métodos propuestos en el presente capítulo (ver anexo 2), analizando solo la ventana de doce meses y tomando como indicador el MAPE, el río Guadalupe pasa del 17% al 16%, el Rio Grande del 21% al 18.6%, el río Porce del 16% al 15% , en el Guatapé del 18.1 al 17.5% , Nare del 21.5% al 18.8%, San Carlos del 33% al 31%, en San Lorenzo del 23% al 22%, Miel del 23.9% al 22.2%; Magdalena del 22.6% al 20.5%, Guavio del 27% al 24% y Batá del 34% a 28%. Para las demás ventanas los esquemas de predicción propuestos casi siempre son mejores que el MARS (P)+OND, lo que sugiere que los métodos no paramétricas expuestos en el presente capítulo poseen una habilidad de pronóstico que supera la de los métodos tradicionales. Así pues, los métodos aquí expuestos constituyen un avance significativo en la implementación de técnicas no paramétricas para el pronóstico de caudales medios mensuales en Colombia.

Page 124: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH -UNAL 4-23

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

9.00

10.00

11.00

12.00

13.00

14.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ERR

OR

(%R

MS

E, M

AP

E)

MÉTODOS PROPUESTOS RÍO GUDALUPE V=1

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

8.00

9.00

10.00

11.00

12.00

13.00

14.00

15.00

16.00

17.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ERR

OR

(%R

MSE

, MA

PE

)

MÉTODOS PROPUESTOS RÍO GUDALUPE V= 3

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

12.00

13.00

14.00

15.00

16.00

17.00

18.00

19.00

20.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ER

RO

R (

%R

MS

E, M

AP

E)

MÉTODOS PROPUESTOS RÍO GUDALUPE V=6

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

12.00

13.00

14.00

15.00

16.00

17.00

18.00

19.00

20.00

21.00

22.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ER

RO

R (

%R

MS

E, M

AP

E)

MÉTODOS PROPUESTOS RÍO GUDALUPE V=12

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

13.00

13.50

14.00

14.50

15.00

15.50

16.00

16.50

17.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ERR

OR

(%R

MS

E, M

AP

E)

MÉTODOS PROPUESTOS RÍO TENCHE V=1

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

13.00

14.00

15.00

16.00

17.00

18.00

19.00

20.00

21.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ERR

OR

(%R

MSE

, MA

PE

)

MÉTODOS PROPUESTOS RÍO TENCHE V= 3

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

13.00

14.00

15.00

16.00

17.00

18.00

19.00

20.00

21.00

22.00

23.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ER

RO

R (

%R

MS

E, M

AP

E)

MÉTODOS PROPUESTOS RÍO TENCHE V=6

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

15.00

16.00

17.00

18.00

19.00

20.00

21.00

22.00

23.00

24.00

25.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AESR

2

ER

RO

R (

%R

MS

E, M

AP

E)

MÉTODOS PROPUESTOS RÍO TENCHE V=12

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

11.00

11.50

12.00

12.50

13.00

13.50

14.00

14.50

15.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ERR

OR

(%R

MS

E, M

AP

E)

MÉTODOS PROPUESTOS RÍO GRANDE V=1

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

13.00

13.50

14.00

14.50

15.00

15.50

16.00

16.50

17.00

17.50

18.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ERR

OR

(%R

MSE

, MA

PE

)

MÉTODOS PROPUESTOS RÍO GRANDE V= 3

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

13.00

14.00

15.00

16.00

17.00

18.00

19.00

20.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ER

RO

R (

%R

MS

E, M

AP

E)

MÉTODOS PROPUESTOS RÍO GRANDE V=6

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

15.00

16.00

17.00

18.00

19.00

20.00

21.00

22.00

23.00

24.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ER

RO

R (

%R

MS

E, M

AP

E)

MÉTODOS PROPUESTOS RÍO GRANDE V=12

%RMSE MAPE R2

Figura 4-6: Comparación de modelos ríos Guadalupe, Tenche y Grande.

Page 125: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH -UNAL 4-24

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

0.00

2.00

4.00

6.00

8.00

10.00

12.00

14.00

16.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ERR

OR

(%R

MS

E, M

AP

E)

MÉTODOS PROPUESTOS RÍO PORCE V=1

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

13.00

13.50

14.00

14.50

15.00

15.50

16.00

16.50

17.00

17.50

18.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ERR

OR

(%R

MSE

, MA

PE

)

MÉTODOS PROPUESTOS RÍO PORCE V= 3

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

13.00

14.00

15.00

16.00

17.00

18.00

19.00

20.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ER

RO

R (

%R

MS

E, M

AP

E)

MÉTODOS PROPUESTOS RÍO PORCE V=6

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

15.00

15.50

16.00

16.50

17.00

17.50

18.00

18.50

19.00

19.50

20.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ER

RO

R (

%R

MS

E, M

AP

E)

MÉTODOS PROPUESTOS RÍO PORCE V=12

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

12.00

12.50

13.00

13.50

14.00

14.50

15.00

15.50

16.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ERR

OR

(%R

MS

E, M

AP

E)

MÉTODOS PROPUESTOS RÍO GUATAPÉ V=1

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

13.00

14.00

15.00

16.00

17.00

18.00

19.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ERR

OR

(%R

MSE

, MA

PE

)

MÉTODOS PROPUESTOS RÍO GUATAPÉ V= 3

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

13.00

14.00

15.00

16.00

17.00

18.00

19.00

20.00

21.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ER

RO

R (

%R

MS

E, M

AP

E)

MÉTODOS PROPUESTOS RÍO GUATAPÉ V=6

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

15.00

16.00

17.00

18.00

19.00

20.00

21.00

22.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AESR

2

ER

RO

R (

%R

MS

E, M

AP

E)

MÉTODOS PROPUESTOS RÍO GUATAPÉ V=12

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

10.00

11.00

12.00

13.00

14.00

15.00

16.00

17.00

18.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ERR

OR

(%R

MS

E, M

AP

E)

MÉTODOS PROPUESTOS RÍO NARE V=1

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

13.00

14.00

15.00

16.00

17.00

18.00

19.00

20.00

21.00

22.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ERR

OR

(%R

MSE

, MA

PE

)

MÉTODOS PROPUESTOS RÍO NARE V= 3

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

13.00

15.00

17.00

19.00

21.00

23.00

25.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ER

RO

R (

%R

MS

E, M

AP

E)

MÉTODOS PROPUESTOS RÍONARE V=6

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

15.00

17.00

19.00

21.00

23.00

25.00

27.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ER

RO

R (

%R

MS

E, M

AP

E)

MÉTODOS PROPUESTOS RÍO NARE V=12

%RMSE MAPE R2

Figura 4-7 Comparación de modelos para los ríos Porce, Guatapé y Nare

Page 126: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH -UNAL 4-25

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

10.00

15.00

20.00

25.00

30.00

35.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ERR

OR

(%R

MS

E, M

AP

E)

MÉTODOS PROPUESTOS RÍO SAN CARLOS V=1

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

13.00

15.00

17.00

19.00

21.00

23.00

25.00

27.00

29.00

31.00

33.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ERR

OR

(%R

MSE

, MA

PE

)

MÉTODOS PROPUESTOS RÍO SAN CARLOS V= 3

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

13.00

18.00

23.00

28.00

33.00

38.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ER

RO

R (

%R

MS

E, M

AP

E)

MÉTODOS PROPUESTOS RÍO SAN CARLOS V=6

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

15.00

20.00

25.00

30.00

35.00

40.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ER

RO

R (

%R

MS

E, M

AP

E)

MÉTODOS PROPUESTOS RÍO SAN CARLOS V=12

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

10.00

12.00

14.00

16.00

18.00

20.00

22.00

24.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ERR

OR

(%R

MS

E, M

AP

E)

MÉTODOS PROPUESTOS RÍO SAN LORENZO V=1

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

13.00

15.00

17.00

19.00

21.00

23.00

25.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ERR

OR

(%R

MSE

, MA

PE

)

MÉTODOS PROPUESTOS RÍO SAN LORENZO V= 3

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

13.00

15.00

17.00

19.00

21.00

23.00

25.00

27.00

29.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ER

RO

R (

%R

MS

E, M

AP

E)

MÉTODOS PROPUESTOS RÍO SAN LORENZO V=6

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

15.00

17.00

19.00

21.00

23.00

25.00

27.00

29.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AESR

2

ER

RO

R (

%R

MS

E, M

AP

E)

MÉTODOS PROPUESTOS RÍO SAN LORENZO V=12

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

10.00

12.00

14.00

16.00

18.00

20.00

22.00

24.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ERR

OR

(%R

MS

E, M

AP

E)

MÉTODOS PROPUESTOS RÍO MIEL V=1

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

13.00

15.00

17.00

19.00

21.00

23.00

25.00

27.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ERR

OR

(%R

MSE

, MA

PE

)

MÉTODOS PROPUESTOS RÍO MIEL V= 3

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

13.00

15.00

17.00

19.00

21.00

23.00

25.00

27.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ER

RO

R (

%R

MS

E, M

AP

E)

MÉTODOS PROPUESTOS RÍO MIEL V=6

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

15.00

17.00

19.00

21.00

23.00

25.00

27.00

29.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ER

RO

R (

%R

MS

E, M

AP

E)

MÉTODOS PROPUESTOS RÍO MIEL V=12

%RMSE MAPE R2

Figura 4-8 Comparación de modelos para los ríos San Carlos, San Lorenzo y Miel.

Page 127: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH -UNAL 4-26

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

10.00

11.00

12.00

13.00

14.00

15.00

16.00

17.00

18.00

19.00

20.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ERR

OR

(%R

MS

E, M

AP

E)

MÉTODOS PROPUESTOS RÍO MAGDALENA V=1

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

13.00

14.00

15.00

16.00

17.00

18.00

19.00

20.00

21.00

22.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ERR

OR

(%R

MSE

, MA

PE

)

MÉTODOS PROPUESTOS RÍOMAGDALENA V= 3

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

13.00

15.00

17.00

19.00

21.00

23.00

25.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ER

RO

R (

%R

MS

E, M

AP

E)

MÉTODOS PROPUESTOS RÍO MAGDALENA V=6

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

15.00

17.00

19.00

21.00

23.00

25.00

27.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ER

RO

R (

%R

MS

E, M

AP

E)

MÉTODOS PROPUESTOS RÍO MAGDALENA V=12

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

10.00

12.00

14.00

16.00

18.00

20.00

22.00

24.00

26.00

28.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ERR

OR

(%R

MS

E, M

AP

E)

MÉTODOS PROPUESTOS RÍO GUAVIO V=1

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

13.00

15.00

17.00

19.00

21.00

23.00

25.00

27.00

29.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ERR

OR

(%R

MSE

, MA

PE

)

MÉTODOS PROPUESTOS RÍO GUAVIO V= 3

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

13.00

18.00

23.00

28.00

33.00

38.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ER

RO

R (

%R

MS

E, M

AP

E)

MÉTODOS PROPUESTOS RÍO GUAVIO V=6

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

15.00

17.00

19.00

21.00

23.00

25.00

27.00

29.00

31.00

33.00

35.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AESR

2

ER

RO

R (

%R

MS

E, M

AP

E)

MÉTODOS PROPUESTOS RÍO GUAVIO V=12

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

10.00

12.00

14.00

16.00

18.00

20.00

22.00

24.00

26.00

28.00

30.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ERR

OR

(%R

MS

E, M

AP

E)

MÉTODOS PROPUESTOS RÍO BATA V=1

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

13.00

15.00

17.00

19.00

21.00

23.00

25.00

27.00

29.00

31.00

33.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ERR

OR

(%R

MSE

, MA

PE

)

MÉTODOS PROPUESTOS RÍO BATA V= 3

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

13.00

18.00

23.00

28.00

33.00

38.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ER

RO

R (

%R

MS

E, M

AP

E)

MÉTODOS PROPUESTOS RÍO BATA V=6

%RMSE MAPE R2

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

15.00

20.00

25.00

30.00

35.00

40.00

MARS (P) + OND PPON (P) + HH RNPOL (P) +AES

R2

ER

RO

R (

%R

MS

E, M

AP

E)

MÉTODOS PROPUESTOS RÍO BATA V=12

%RMSE MAPE R2

Figura 4-9 Comparación de modelos para los ríos San Carlos, San Lorenzo y Miel.

Page 128: Desarrollo de un sistema experto para la predicción de ... · desarrollo de un sistema experto para la predicciÓn de caudales medios mensuales en colombia julián david rojo hernández

DESARROLLO DE UN SISTEMA EXPERTO PARA LA PREDICCIÓN

DE CAUDALES MEDIOS MENSUALES EN COLOMBIA

Julián David Rojo Hernández – PARH -UNAL 4-27

Referencias

Cleveland, W. S. (1979) Robust locally weighted regression and smoothing scatterplots, Journal of American Statistical Association, 74 (368), 829-836.

Cleveland, W. S. and Devlin, S. J. (1988) Locally weighted regression: an approach to regression analysis by local fitting, Journal of American Statistical Association., 83 (403), 596-610.

Cleveland, W. S., Devlin, S. J, and Grosse, E. (1988) Regression by local fitting, Journal of Econometrics, 37, 87-114. Craven, P. and Wahba, G. (1979) Smoothing noise data with spline functions, Numerische Mathematik, 31, 377-403.

Hardy R.L. Multiquadratic equations of topography and other irregular surfaces (1971). Journal of Geophysical Research, Vol. 76, pp. 1905-1915

Ivahnenko AG. Polynomial theory of complex systems (1971). IEEE Trans Systems Man Cybernet;SMC-1:364–78.

Poveda G., "Aplicación de los métodos MARS, Holt-Winters y ARIMA generalizado en el pronóstico de caudales medios mensuales en ríos de Antioquia"(2006). En: Colombia Meteorologia Colombiana, ISSN: 0124-6984 ed: Gente Nueva v.10 fasc.1 p.36 - 46 ,

Powell M.J.D. (1987) Radial basis functions for multivariable interpolation: a review, Algorithms for Approximation, Mason J.C., Cox M.G. (eds.), London, Oxford University Press,

PRIESTLEY, M. B. y CHAO, M. T. (1972): "Non-parametric function fitting". J. Royal Stat. Soc, B, 34, 385-392.

SCHMERLING, S. y PEIL, J. (1986): ' Improvement of the method of kernel estimation by local polynomial approximation of the empirical distribution function and this application to empirical regression". Gegenbaurs morphologisches Jahrbuch, 132,29-35.

Sk Oh, W P. Identification of fuzzy systems by means of an auto-tuning algorithm and its application to nonlinear systems. Fuzzy Sets and Systems. 2000;115(2):205-30.

S.J. Farlow, The GMDH algorithm, in: S.J. Farlow (Ed.) (1984). Self-organizing Methods in Modeling: GMDH Type Algorithms, Marcel Dekker, New York, pp. 1–24.