Metodología para el modelado y predicción del ...

73
Metodolog´ ıa para el modelado y predicci´on del comportamiento de las barras de arena Sebasti´ an Fernando M´ unera ´ Alvarez Universidad Nacional de Colombia Facultad de Minas Departamento de Ciencias de la Computaci´ on y la Decisi´ on Medell´ ın, Colombia 2013

Transcript of Metodología para el modelado y predicción del ...

Page 1: Metodología para el modelado y predicción del ...

Metodologıa para el modelado yprediccion del comportamiento de las

barras de arena

Sebastian Fernando Munera Alvarez

Universidad Nacional de Colombia

Facultad de Minas

Departamento de Ciencias de la Computacion y la Decision

Medellın, Colombia

2013

Page 2: Metodología para el modelado y predicción del ...
Page 3: Metodología para el modelado y predicción del ...

Metodologıa para el modelado yprediccion del comportamiento de las

barras de arena

Sebastian Fernando Munera Alvarez

Tesis presentada como requisito parcial para optar al tıtulo de:

Magıster en Ingenierıa de Sistemas e Informatica

Director:

Ph.D. Juan David Velasquez Henao

Co-director:

Ph.D. Andres Fernando Osorio Arias

Universidad Nacional de Colombia

Facultad de Minas

Departamento de Ciencias de la Computacion y la Decision

Medellın, Colombia

2013

Page 4: Metodología para el modelado y predicción del ...
Page 5: Metodología para el modelado y predicción del ...

Prediction is very difficult,

especially if it’s about the future.

Niels Bohr

Page 6: Metodología para el modelado y predicción del ...
Page 7: Metodología para el modelado y predicción del ...

Agradecimientos

Agradezco a todas las personas que ayudaron a que esta tesis fuera posible:

A los profesores Juan David Velasquez y Andres Osorio por su apoyo, paciencia y

orientacion. Por el conocimiento transmitido, no solamente academico que fue muy

variado y valioso para mi desarrollo profesional, sino por el conocimiento a partir de

sus propias experiencias de vida, que de alguna manera, me ayudo a crecer como

profesional y como ser humano.

A mi familia y amigos, por el apoyo incondicional, por la comprension y por estar

ahı en los momentos en que mas los necesite. Sin ellos, no hubiera podido lograr lo que

he logrado.

A mis companeros y amigos del grupo OCEANICOS, por haberme acogido durante

estos tres anos y por el invaluable apoyo y conocimiento que me brindaron mientras

estuve trabajando en el grupo. Sin ellos, no hubiera podido adquirir el conocimiento

necesario ajeno a mi area que era indispensable para el desarrollo de mi tesis. Tam-

bien les agradezco por los momentos inolvidables que siempre quedaran ahı, como

un recordatorio que desde cualquier lugar siempre tendre amigos con los que siempre

podre contar.

A los jurados evaluadores por los valiosos comentarios y sugerencias.

Finalmente, agradezco a COLCIENCIAS por el apoyo financiero que hizo posible la

realizacion del trabajo.

Page 8: Metodología para el modelado y predicción del ...
Page 9: Metodología para el modelado y predicción del ...

ix

Resumen

Las barras de arena son caracterısticas naturales generadas en las zonas costeras por la

interaccion entre el mar y la costa. Los procesos de corto plazo que determinan el comporta-

miento de las barras son las olas y el transporte de sedimentos. La interaccion entre el oleaje

y la costa es altamente no lineal y, tradicionalmente, los modelos basados en procesos (es

decir, modelos de evolucion) han sido utilizados para modelar y analizar el comportamiento

de las barras en el corto plazo. Sin embargo, las predicciones a mediano y largo plazo no

siempre son posibles con estos modelos por las siguientes razones: i) imprecisiones en los

datos usados para calibrar o validar los modelos y lımites en la capacidad computacional

ocasionando acumulacion exponencial de errores, ii) poco entendimiento del sistema estu-

diado, y iii) esfuerzo computacional al simular en el mediano a largo plazo. Los modelos

basados en datos surgen como una alternativa a los modelos basados en procesos, pues no se

requiere el conocimiento fısico para el modelo, sino que extraen el conocimiento unicamente

a partir de los patrones encontrados en los datos.

Las tecnicas basadas en datos: descomposicion empırica en modos (EMD, por su sigla en

ingles) y redes neuronales autorregresivas (ARNN, por su sigla en ingles) se aplicaron a

las series de tiempo de las barras y oleaje de la costa de Cartagena de Indias, Colombia

para encontrar la dependencia no lineal entre ellas. El primer metodo se usa para analizar

la relacion entre las barras y las condiciones de oleaje de forma grafica; mientras que el

segundo metodo se usa para derivar los coeficientes de autocorrelacion/correlacion cruzada

simple/parcial entre ellas. Se detecta evidencia de dependencias no lineales entre el estado

presente de la posicion de las barras y el oleaje, y el estado pasado de las barras.

El principal objetivo de esta tesis es desarrollar una metodologıa para modelar las series

de tiempo no lineales de la posicion de las barras con la altura significante de ola y el

perıodo pico como variables exogenas. La metodologıa se basa en la clasica metodologıa

Box–Jenkins para identificacion de sistemas dinamicos lineales, pero extendiendola al caso

no lineal. Los modelos utilizados en este enfoque estan basados en redes neuronales artificiales

y unos hıbridos entre modelos lineales y no lineales, los cuales demuestran tener una buena

capacidad de prediccion.

Palabras clave: series de tiempo no lineales; modelado no lineal; identificacion de modelos;

barras de arena; descomposicion empırica en modos; zonas costeras; modelos basados en

datos.

Page 10: Metodología para el modelado y predicción del ...

x

Abstract

Sandbars are natural features generated in the nearshore zones by the interaction between

the sea and the coast. The short-term processes that drive sandbar behavior are waves and

sediment transport. The interaction between waves and the coast is highly nonlinear and,

traditionally, process-based models (e.g., evolution models) have been used for modelling and

analyzing sandbar behavior in the short term. However, medium- to long-term predictions

are not always possible with these models due to some reasons: i) inaccuracies in data used

to calibrate or validate the model, limit on computational capacity causing exponential error

accumulation, ii) little understanding of the system to be studied, and iii) computational

effort when looking to mid-term and long-term simulations. Data-driven models emerge as

an alternative to process-based models as they do not need insight on the physical knowledge

of the model, but they extract knowledge from patterns found in the data.

The data-driven techniques: EMD (empirical mode decomposition) method and ARNN (au-

toregressive neural networks) are applied on sandbar and wave time series from the coast of

Cartagena de Indias, Colombia for finding the nonlinear dependency. The former is used for

analyzing the relationship between sandbar and wave conditions in a graphical way; and the

latter is used for deriving nonlinear simple/partial cross/auto-correlation coefficients. Evi-

dence of nonlinear dependencies is detected between the present state of sandbar location

and past states of wave conditions.

The main goal of this thesis is to develop a methodology for modelling a nonlinear time series

of sandbar position with significant wave height and peak period as exogenous variables. The

methodology is based on the classical methodology by Box–Jenkins for model identification

in linear dynamical systems, but extending it to the nonlinear case. The models used in

this approach are based on artificial neural networks and some hybrid between linear and

nonlinear show good skills for prediction.

Keywords: nonlinear time series; nonlinear modelling; model identification; sandbars; em-

pirical mode decomposition; nearshore zones; data-driven models.

Page 11: Metodología para el modelado y predicción del ...

Contenido

Agradecimientos VII

Resumen IX

1. Introduccion 2

1.1. Definicion del problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.1.1. Barras de arena . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.1.2. Modelos basados en datos vs. modelos basados en procesos . . . . . . 4

1.1.3. Modelos lineales vs. no lineales . . . . . . . . . . . . . . . . . . . . . 5

1.1.4. Sistemas de monitorizacion costera . . . . . . . . . . . . . . . . . . . 6

1.2. Trabajos relacionados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.2.1. Modelos no lineales basados en datos en sistemas costeros . . . . . . 7

1.2.2. Modelos no lineales basados en datos en otros sistemas . . . . . . . . 8

1.2.3. Conclusiones de la revision de literatura . . . . . . . . . . . . . . . . 9

1.3. Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2. Datos 11

2.1. Cartagena de Indias, Colombia . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.2. Oleaje . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2.3. Posicion de las barras a partir de las imagenes HORUS . . . . . . . . . . . . 16

2.3.1. Extraccion de la posicion de las barras . . . . . . . . . . . . . . . . . 17

3. Metodologıa para la construccion de la red neuronal 22

3.1. Deteccion de la relacion entre la variable de interes y las variables exogenas . 22

3.1.1. Dependencia no lineal . . . . . . . . . . . . . . . . . . . . . . . . . . 23

3.1.2. Analisis grafico con descomposicion empırica en modos . . . . . . . . 25

3.2. Planteamiento de modelos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

3.2.1. Funciones de transferencia . . . . . . . . . . . . . . . . . . . . . . . . 27

3.2.2. Modelo ARX . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

Page 12: Metodología para el modelado y predicción del ...

xii Contenido

3.2.3. Perceptron multicapa (MLP) . . . . . . . . . . . . . . . . . . . . . . 27

3.2.4. Red neuronal autorregresiva (ARNN) . . . . . . . . . . . . . . . . . . 28

3.2.5. Maquina de aprendizaje extremo (ELM) . . . . . . . . . . . . . . . . 29

3.2.6. Modelos hıbridos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

3.3. Estimacion de parametros . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

3.4. Diagnostico de los modelos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

3.5. Uso de los modelos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

4. Resultados y Discusion 34

4.1. Deteccion de la relacion entre la variable de interes y las variables exogenas . 34

4.1.1. Dependencia no lineal . . . . . . . . . . . . . . . . . . . . . . . . . . 34

4.1.2. Analisis grafico con descomposicion empırica en modos . . . . . . . . 38

4.2. Estimacion de parametros . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

5. Conclusiones 52

Bibliografıa 54

Page 13: Metodología para el modelado y predicción del ...

Lista de Figuras

2-1. Rosa de vientos en Bocagrande que relaciona la altura de ola significante con

la direccion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2-2. Zona de estudio: (izq.) Cartagena de Indias, (der.) Posicion de Bocagrande y

el Edificio Bavaria donde la estacion HORUS esta instalada. . . . . . . . . . 13

2-3. Grafica de correlacion entre la altura de ola medida y modelada . . . . . . . 14

2-4. Grafica de correlacion entre el perıodo pico medido y modelado . . . . . . . 15

2-5. Camaras de la estacion HORUS en Cartagena . . . . . . . . . . . . . . . . . 16

2-6. Area de monitorizacion en la costa de Cartagena . . . . . . . . . . . . . . . . 17

2-7. Imagen time exposure en Bocagrande, Cartagena (la lınea negra es la aproxi-

macion) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2-8. Imagen rectificada que muestra la posicion de la barra y la lınea paralela a la

lınea de costa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2-9. Pila de columnas de pixeles de imagenes mostrando las posiciones extraıdas . 20

2-10.Serie de tiempo de (a) posicion de las barras, (b) altura de ola, (c) perıodo de

ola y (d) parametro adimensional de caıda del grano . . . . . . . . . . . . . . 21

4-1. Funcion de correlacion cruzada simple no lineal entre la posicion de la barra

y la altura de ola significante . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

4-2. Funcion de correlacion cruzada parcial no lineal entre la posicion de la barra

y la altura de ola significante . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

4-3. Funcion de correlacion cruzada simple no lineal entre la posicion de la barra

y perıodo pico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

4-4. Funcion de correlacion cruzada parcial no lineal entre la posicion de la barra

y perıodo pico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

4-5. Funcion de correlacion cruzada parcial no lineal entre la posicion de la barra

y la combinacion entre altura de ola significante y perıodo pico . . . . . . . . 37

4-6. Funcion de autocorrelacion parcial no lineal de la posicion de la barra dados

la altura de ola significante y perıodo pico . . . . . . . . . . . . . . . . . . . 38

Page 14: Metodología para el modelado y predicción del ...

xiv Lista de Figuras

4-7. Descomposicion de la serie de tiempo de la posicion de las barras . . . . . . 40

4-8. Decomposicion de la serie de tiempo Ω . . . . . . . . . . . . . . . . . . . . . 41

4-9. Suma de los IMFs seleccionados para la serie de tiempo de las barras . . . . 42

4-10.Suma de los IMFs seleccionados para la serie de tiempo Ω . . . . . . . . . . 43

4-11.Correlacion entre la posicion de la barra y el parametro adimensional de ve-

locidad de caıda del grano (Ω) . . . . . . . . . . . . . . . . . . . . . . . . . . 44

4-12.Errores de entrenamiento y validacion del modelo MLP . . . . . . . . . . . . 46

4-13.Errores de entrenamiento y validacion del modelo ARNN . . . . . . . . . . . 47

4-14.Errores de entrenamiento y validacion del modelo hıbrido L-NL . . . . . . . 47

4-15.Errores de entrenamiento y validacion del modelo hıbrido NL-L . . . . . . . 48

4-16.Errores de entrenamiento y validacion del modelo ELM . . . . . . . . . . . . 48

4-17.Error de entrenamiento del modelo hıbrido NL-NL . . . . . . . . . . . . . . . 49

4-18.Error de validacion del modelo hıbrido NL-NL . . . . . . . . . . . . . . . . . 49

Page 15: Metodología para el modelado y predicción del ...

Lista de Tablas

4-1. MSE y MAE para cada uno de los modelos seleccionados . . . . . . . . . . . 50

Page 16: Metodología para el modelado y predicción del ...

1 Introduccion

En este capıtulo se presenta el problema del modelado y prediccion del comportamiento de

las barras de arena, como instrumento para la toma de decisiones en la gestion de zonas

costeras, y al mismo tiempo, se introduce el estudio del modelado de variables fısicas no

lineales con variables exogenas por medio de modelos no lineales como las redes neuronales.

En la seccion 1.1 se define el problema de investigacion desarrollado en esta tesis. En la

seccion 1.2 se presentan los trabajos realizados en el modelado y prediccion de las barras de

arena y otras variables similares. Por ultimo, en la seccion 1.3 se listan los objetivos general

y especıficos a alcanzar con esta tesis.

1.1. Definicion del problema

Actualmente, muchos investigadores dedican sus esfuerzos en intentar modelar y predecir el

comportamiento de la costa para ayudar a los gestores costeros a implementar medidas que

permitan mitigar la erosion para minimizar los efectos negativos en el turismo y el comercio,

o para salvaguardar la fauna que depende de las costas.

Es un tema actual de interes el poder predecir de manera precisa la variabilidad de las

barras en el corto plazo (horas a semanas), mediano plazo (semanas a meses) y largo plazo

(meses hasta anos), y profundizar en el entendimiento de su dinamica. Se sabe que esta

variabilidad, ademas de estar sujeta al oleaje, tambien depende de los estados pasadosl (Pape

and Ruessink, 2011).

En la subseccion 1.1.1 se describe la dinamica de las barras y su complejidad no lineal,

luego en la subseccion 3.2 se presentan los principales metodos utilizados para representar

la dinamica, haciendo enfasis en los metodos basados en datos, en la subseccion 1.1.3 se

revisan los modelos lineales y no lineales, y por ultimo, en la subseccion 1.1.4 se introducen

los sistemas de monitorizacion con camaras de video y su importancia en el desarrollo de

esta tesis.

Page 17: Metodología para el modelado y predicción del ...

1.1 Definicion del problema 3

1.1.1. Barras de arena

Las barras son formas naturales que se generan en zonas costeras, principalmente, debido

a la interaccion entre el oleaje y la costa. En general, son acumulaciones longitudinales de

arena, paralelas a la costa, que se forman de manera natural, generalmente, en profundidades

menores a 10m. Se generan a partir del transporte de sedimentos producido por la energıa de

las olas y tambien constituyen una barrera natural contra la energıa potencialmente erosiva

de las olas (Plant et al., 2001). Son defensas naturales de la costa, pues al llegar las olas a las

zonas donde las barras estan sumergidas, la disminucion repentina en la profundidad hace

que la energıa de las olas se acumule en la cresta hasta romper, disipando ası su energıa y

evitando en cierta medida el efecto erosivo en la playa. Las olas afectan el comportamiento y

las caracterısticas morfologicas de las barras (tales como la posicion transversal respecto a la

costa, la geometrıa (ancho y alto), y la forma longitudinal (en forma de luna, rip channels,

entre otros)) en una escala temporal que va desde los dıas hasta las semanas.

Los procesos hidrodinamicos y de transporte de sedimentos que generan las barras en la costa

son altamente no lineales —a diferencia de los fenomenos en grandes profundidades, como

el oleaje, que se pueden describir con la teorıa lineal de ondas—; la escala de variabilidad

temporal de estos procesos esta en el orden de los minutos a las horas (pequena escala),

mientras que dependiendo de los tiempos de respuesta de las barras, estas pueden variar en

el orden de los dıas. Actualmente, un creciente numero de investigadores dedican sus esfuerzos

a intentar modelar y predecir la variabilidad de las barras, ya que es uno de los aspectos mas

relevantes para ayudar a los gestores costeros a implementar medidas que permitan mitigar

la erosion, pues a menudo, las medidas que se toman involucran la modificacion de las barras

mediante alimentacion con arena (Hamm et al., 2002).

El aspecto mas significativo del comportamiento de las barras es su posicion transversal

respecto a la costa y la migracion. Se ha observado que las olas de alta energıa dirigen las

barras en la direccion de la costa al oceano, tomando arena de la playa y erosionandola,

mientras que las olas de baja energıa dirigen las barras hacia la costa (Hoefel and Elgar,

2003). Este comportamiento se desarrolla en cuestion de dıas y cuando hay un aumento

repentino en la altura de ola (tormentas), esta migracion se puede dar incluso en la escala

de las horas. Adicionalmente, las barras tienen comportamientos estacionales en el ano, y

a menudo tienen tendencias de largo plazo (meses a anos) que no son explicadas por la

variabilidad de las olas en el corto plazo.

Page 18: Metodología para el modelado y predicción del ...

4 1 Introduccion

1.1.2. Modelos basados en datos vs. modelos basados en procesos

Tradicionalmente, en areas como la oceanografıa, meteorologıa e ingenierıa costera se ha

utilizado el conocimiento de la dinamica de los procesos que intervienen en un fenomeno

con el fin de modelar y predecir de manera cuantitativa el comportamiento y las interac-

ciones entre las variables involucradas (ver (Brø ker and Roelvink, 1993)). Estos modelos

son llamados modelos basados en procesos y, en general, son idealizaciones de los sistemas

fısicos plasmadas en ecuaciones diferenciales o integrales que describen la dinamica. Compu-

tacionalmente, estas ecuaciones se resuelven mediante metodos numericos que aproximan

una solucion analıtica, ya que en la mayorıa de los casos, la complejidad de estas ecuaciones

impiden obtener una solucion exacta.

Los modelos basados en procesos tienen limitaciones al hacer predicciones en el medio al largo

plazo (meses a anos) por varias razones: i) la medicion de los datos puede ser inexacta, esto

aplica para las observaciones del sistema, de las variables exogenas involucradas y de los datos

usados para calibrar el modelo; ii) en general, no es completamente claro como representar

los procesos fısicos en el modelo porque no se entienden por completo, lo cual implica que el

comportamiento real a menudo no se representa correctamente, esto es especialmente cierto

para las zonas costeras, pues los procesos como el transporte de sedimentos son complejos

(ver por ejemplo, (Pape, 2010) y (De Vriend, 1991b)). Por ultimo, iii) con horizontes mas

amplios, sufren acumulacion de errores debido a las imprecisiones en los modelos numericos,

que puede ser exponencial cuando las ecuaciones son no lineales (De Vriend, 1991a; Southgate

et al., 2003).

A pesar de las limitaciones de los modelos basados en procesos, aun son muy utilizados,

principalmente porque los cientıficos estan interesados en observar las dinamicas e interac-

ciones entre las variables. Sin embargo, otro tipo de modelos que han ganado popularidad

son los modelos basados en datos, los cuales a diferencia de los modelos basados en procesos,

no representan la dinamica del sistema con ecuaciones fısicas, sino a partir de los patrones

encontrados en los datos estadısticos encontrados en las observaciones obtenidas a traves

del tiempo. Usualmente, este enfoque se ha utilizado cuando los procesos fısicos no son muy

bien entendidos y permite superar algunas de las limitaciones de los modelos basados en

procesos. Con estos modelos, la dinamica del sistema es aprendida unicamente de los datos,

y por lo tanto, estos modelos son considerados cajas negras, lo cual si bien puede verse como

una fortaleza, desde otro punto de vista es una debilidad, pues las ecuaciones que describen

el modelo no son fısicamente interpretables y el comportamiento especıfico aprendido de un

conjunto de datos no siempre se puede aplicar a otro en diferentes condiciones, es decir, no

son modelos generalizados (Larson et al., 2003; Southgate et al., 2003).

Page 19: Metodología para el modelado y predicción del ...

1.1 Definicion del problema 5

Estos modelos solamente capturan los comportamientos y patrones presentes en los datos

usados para la calibracion de los parametros, haciendo necesario utilizar una gran cantidad

de datos de alta resolucion que capturen la mayor parte de la dinamica del sistema (Horrillo-

Caraballo and Reeve, 2010; Smit et al., 2007). No obstante, debido a que no se utilizan

metodos numericos iterativos para estimar soluciones numericas, el problema de la acumu-

lacion de errores debido a imprecisiones numericas no esta presente. Por estas razones, los

modelos basados en datos presentan ventajas para hacer predicciones en el mediano al largo

plazo. Estos modelos pueden ser lineales o no lineales, siendo las redes neuronales artificiales

uno de los modelos mas adecuados.

1.1.3. Modelos lineales vs. no lineales

Diversas tecnicas provenientes de distintos campos del conocimiento se han utilizado para

el modelado y prediccion basada en datos, tales como la estadıstica, teorıa de sistemas

dinamicos, teorıa de caos e inteligencia computacional. Estas tecnicas se pueden dividir en

dos grandes ramas, lineales y no lineales. La eleccion de uno u otro tipo de tecnica depende de

las necesidades y caracterısticas del sistema observado. Las principales tecnicas lineales para

el analisis de las observaciones costeras como las Funciones Ortogonales Empıricas (EOF,

por su sigla en ingles), Analisis de Correlacion Canonica (CCA, por su sigla en ingles) y

Patrones de Oscilaciones Principales (POP), tienen su origen en el Analisis de Componentes

Principales. Algunos autores han utilizado estas tecnicas principalmente para analizar o

predecir la variabilidad de algun aspecto de la costa, por ejemplo, en (Fairley et al., 2009)

y (Reeve et al., 2008) se utiliza EOF para analizar la variabilidad de la lınea de costa y la

evolucion de los bancos de arena respectivamente; en (Horrillo-Caraballo and Reeve, 2010)

se emplea CCA para analizar el cambio en el largo plazo de los perfiles de playa y analizar el

desempeno de la prediccion con respecto a una ventana de prediccion; en (Rozynski, 2003) se

utiliza EOF para determinar patrones en las barras longitudinales y CCA para establecer las

relaciones entre ellas; en (Kroon et al., 2008) se analizan estadısticamente series de tiempo

de variables morfodinamicas en diferentes escalas temporales utilizando distintos metodos

lineales y no lineales. En (Larson et al., 2003) se hace una revision detallada de todas estas

tecnicas aplicadas a la prediccion en el largo plazo del comportamiento de los sistemas

costeros morfodinamicos.

Otros trabajos han hecho uso de modelos estadısticos lineales directamente sobre las series de

tiempo como regresion lineal, modelos autorregresivos o Box–Jenkins (AR, ARMA, ARIMA),

como es el caso de (LaValle et al., 2001) donde se modelan las variaciones espacio–temporales

de series de playa y lınea de costa mediante modelos tipo Box–Jenkins; en (Southgate, 2008)

Page 20: Metodología para el modelado y predicción del ...

6 1 Introduccion

se utilizan modelos de regresion lineal y Holt–Winters para predecir el volumen de playa

en el medio plazo con datos mensuales en un perıodo de 20 anos. Algunas de estas tecnicas

estadısticas se revisan en (Smit et al., 2007).

Los modelos lineales basados en datos han podido aproximar tendencias en diferentes es-

calas para hacer predicciones; sin embargo se sabe que los procesos fısicos en la costa son

altamente no lineales (Pape et al., 2010a), por lo tanto, es natural pensar en utilizar tecni-

cas no lineales para capturar los patrones complejos e interacciones entre variables que no

se pueden detectar con los metodos lineales, ası como para incorporar en los modelos las

dependencias temporales de estados pasados del sistema. Entre las tecnicas no lineales mas

utilizadas en costas para la caracterizacion del sistema, reduccion de datos y prediccion, se

encuentran las basadas en Dimension de Tiempo Embebido (TDE, por su sigla en ingles),

que permite encontrar el caracter caotico o periodico de un conjunto de datos, Analisis Es-

pectral Singular (SSA, por su sigla en ingles) el cual se basa en EOF pero incorpora rezagos

en el tiempo, Analisis Fractal principalmente en sistemas altamente complejos y dimensio-

nales como el costero, y redes neuronales artificiales empleadas para prediccion de series de

tiempo (ver (Southgate et al., 2003) para una revision de estas tecnicas). La poca utilizacion

de estos metodos se debe principalmente a la poca disponibilidad de datos—aunque ahora

se comienza a tener la cantidad necesaria—y al desconocimiento de las tecnicas pues por

lo general pertenecen a areas del conocimiento distintas a la ingenierıa costera, y requie-

ren adaptacion en las metodologıas para su aplicacion (Pape, 2010), especialmente las redes

neuronales artificiales.

Considerando las ventajas que ofrecen los modelos basados en datos sobre los modelos ba-

sados en procesos y la disponibilidad de datos historicos de la posicion de las barras, en este

trabajo se explora la utilizacion de modelos basados en datos no lineales para el problema

del modelado y prediccion de la posicion de las barras. La informacion usada corresponde a

las observaciones diarias a traves de camaras desde donde se extrae la posicion de las barras

en Cartagena de Indias, Colombia y a datos de oleaje generados con el modelo de generacion

de oleaje SWAN.

1.1.4. Sistemas de monitorizacion costera

El uso de los modelos basados en datos se ha incrementado debido a la creciente disponi-

bilidad de datos de alta resolucion espacial y temporal medidos remotamente (Pape, 2010;

Southgate et al., 2003; Rozynski, 2003), y por el avance en la capacidad computacional.

Especıficamente, las tecnicas de medicion costera a traves de sistemas de monitorizacion

basados en video tales como ARGUS (Holman and Stanley, 2007; Ruiz de Alegrıa-Arzaburu

Page 21: Metodología para el modelado y predicción del ...

1.2 Trabajos relacionados 7

et al., 2010) y HORUS (Osorio et al., 2007), han permitido obtener datos de alta resolucion

a partir de imagenes capturadas en intervalos regulares de tiempo. La principal ventaja de

estos sistemas es su bajo costo comparado con metodos tradicionales de medicion in situ,

pues consisten simplemente de camaras ubicadas en partes altas de edificios, conectadas a

un computador local que almacena, procesa y transfiere las imagenes a un servidor central.

1.2. Trabajos relacionados

1.2.1. Modelos no lineales basados en datos en sistemas costeros

A diferencia de las areas de hidrologıa, oceanografıa y meteorologıa, las aplicaciones de

tecnicas de inteligencia computacional como las redes neuronales en costas aun son esca-

sas, principalmente debido a la carencia de datos. Varios trabajos se han reportado en la

literatura:

En (Kingston et al., 2000) se emplean las redes neuronales para eliminar el efecto del

oleaje y las mareas en la desviacion entre la posicion transversal de las barras y la

posicion de las zonas de rompientes obtenidas a partir de las imagenes time exposure.

En (Hashemi et al., 2010) se predice la evolucion del perfil de playa con una red

neuronal y utilizan Analisis de Componentes Principales y correlacion cruzada para

excluir parametros altamente correlacionados.

En (Yan et al., 2008) utilizan redes neuronales para predecir la geometrıa (ancho y

alto) de los ripples de arena.

En (Pape et al., 2007) utilizan redes neuronales recurrentes NARX para investigar el

rol de la no linealidad y la memoria en el comportamiento de las barras, con datos

de posicion de barras extraıdas de las imagenes time exposure del sistema ARGUS

en distintos lugares teniendo en cuenta las series de tiempo del oleaje como variables

exogenas para el modelo. Se corrobora el hecho de que la no linealidad es significativa

para el desempeno del modelo para predicciones en el mediano plazo (varios dıas).

En (Pape and Ruessink, 2011) se extiende el trabajo de (Pape et al., 2007) aplicando

el mismo tipo de red neuronal (NARX) para hacer predicciones de dıas hasta meses

(largo plazo) en series de datos de Hasaki, Japon y Gold Coast, Australia. Encuentran

que la red es capaz de capturar aspectos del comportamiento de las barras como la

migracion rapida hacia el mar durante tormentas, migraciones lentas hacia la costa

Page 22: Metodología para el modelado y predicción del ...

8 1 Introduccion

en epocas de olas de baja energıa, comportamientos estacionales y tendencias hacia el

mar de largo plazo.

En (Singh et al., 2007) combinan redes neuronales con programacion genetica para

modelar la tasa de transporte de sedimentos teniendo en cuenta las caracterısticas del

oleaje.

En (Lin et al., 2005) proponen un modelo numerico para predecir el transporte de

sedimentos acoplado a una red neuronal que simula la concentracion de referencia, la

cual es difıcil de estimar con modelos tradicionales.

En (Van Maanen et al., 2010) utilizan una red neuronal para predecir el transporte

de sedimentos, pero le adicionan al modelo un metodo para determinar que variables

influyen mas en el sistema llamado Derivadas Parciales (PaD, por su sigla en ingles),

y argumentan que dado que la red neuronal es una caja negra, el metodo PaD sirve

para aclarar el modelo, resultando en un modelo generalizado.

La mayorıa de los artıculos analizados, concuerdan en que a pesar de que el modelo de red

neuronal siempre mejora las predicciones comparado con los modelos basados en procesos, es

importante mantener la interpretabilidad del modelo para que se pueda observar de alguna

manera la dinamica, sin embargo, no siempre es posible. En algunos casos se mantiene la

interpretabilidad del modelo involucrando metodos que reflejan la dinamica y las influencias

externas: incorporando las dependencias temporales en el modelo NARX de (Pape et al.,

2007; Pape and Ruessink, 2011) y determinando la influencia de las variables exogenas con

PaD en el modelo de (Van Maanen et al., 2010).

1.2.2. Modelos no lineales basados en datos en otros sistemas

A manera de comparacion se presenta a continuacion un analisis de trabajos que han aplicado

modelos basados en datos no lineales en sistemas provenientes de hidrologıa, oceanografıa

y climatologıa, que si bien no son equivalentes, tienen caracterısticas muy similares a los

sistemas costeros, tales como la no linealidad y la memoria. Las aplicaciones de redes neu-

ronales para modelar y predecir el comportamiento de sistemas fısicos en oceanografıa e

hidrologıa son numerosas y han tenido exito pues han mejorado de alguna manera a los

modelos tradicionales (basados en procesos). Algunos trabajos reportados en la literatura:

En (Birkinshaw et al., 2008) se propone un modelo hıbrido de red neuronal y modelo

numerico para predecir el impacto de abstraccion de aguas.

Page 23: Metodología para el modelado y predicción del ...

1.2 Trabajos relacionados 9

En (Menezes Jr and Barreto, 2008) se utiliza una red neuronal NARX para predecir a

varios pasos precipitaciones de lluvias.

En (Bhattacharya et al., 2007) se modela el transporte de sedimentos en rıos mediante

redes neuronales y arboles modelo.

En (Van Den Boogaard et al., 2000) se emplean redes neuronales autorregresivas

(ARNN, por su sigla en ingles) para predecir en el corto y medio plazo el balance

de agua, ademas incorporan asimilacion de datos por medio del filtrado de Kalman

para mejorar la prediccion en condiciones operacionales.

En (Cherkassky et al., 2006) se hace una revision del rol de la inteligencia computacional

en las ciencias de la tierra y medio ambiente.

En (Siek and Solomatine, 2009) se emplea una red neuronal NARX como metodo de

asimilacion de datos para reanalizar y mejorar las predicciones de un modelo caotico

de oleadas (surge) en el oceano.

En (Krasnopolsky et al., 2002) se emplean las redes neuronales como medio para me-

jorar la precision de los modelos numericos.

En (Krasnopolsky, 2007) se hace una revision de la aplicacion de redes neuronales en

la geofısica, oceanografıa y meteorologıa, especıficamente utilizado como mecanismo

de hibridacion con otros modelos y como medio para asimilacion de datos.

Una conclusion comun de todos estos trabajos es que la aplicacion del modelo no lineal

supera el desempeno de los modelos tradicionales a la hora de hacer predicciones. En la

mayorıa de los casos la arquitectura de red neuronal ha sido feed forward estandar con

el algoritmo backpropagation como metodo de entrenamiento del modelo, lo cual implica

que no se ha explotado completamente el potencial de otras arquitecturas para capturar de

manera precisa las dependencias temporales y el efecto de las variables exogenas al sistema,

exceptuando las aplicaciones con NARX. Adicionalmente, pocos esfuerzos se han hecho en

intentar utilizar el potencial de estos modelos para profundizar en el entendimiento que se

tiene actualmente de la dinamica de los sistemas ya que estos modelos son cajas negras. No

existe una metodologıa clara para determinar el modelo mas adecuado.

1.2.3. Conclusiones de la revision de literatura

Se ha evidenciado en la literatura un creciente interes en los modelos basados en datos para

la prediccion en escalas de tiempo cada vez mayores a medida que surgen nuevos datos para

Page 24: Metodología para el modelado y predicción del ...

10 1 Introduccion

alimentar estos modelos. En cuanto a las tecnicas basadas en datos para predecir series de

tiempo de algun aspecto de la costa se han encontrado tecnicas estadısticas lineales como

Box–Jenkins, Holt–Winters, regresion lineal, entre otros, que han sido utiles para estimar

tendencias y analizar variabilidad, pero no son aptos para capturar patrones mas complejos

en los datos. Entre las tecnicas no lineales se han obtenido muy buenos resultados con las

redes neuronales artificiales, aunque no se han aprovechado al maximo.

En los trabajos analizados que intentan modelar y predecir las barras se hace mucho enfasis en

que no solo es importante obtener predicciones mas precisas en diferentes escalas de tiempo,

sino que es fundamental que los modelos no lineales ayuden a aportar en el entendimiento que

se tiene de los procesos fısicos que afectan el comportamiento de la costa y las predicciones

tengan significado fısico.

Se plantea en varios trabajos la utilizacion de arquitecturas de red neuronal mas sofisticadas

que permitan capturar mejor las no linealidades y dependencias temporales teniendo en

cuenta los forzadores externos.

De los trabajos que han utilizado redes neuronales no se ha establecido ninguna metodologıa

para construir el modelo basado en el efecto de las variables explicativas, el grado de no

linealidad y la influencia de otros factores para predecir el comportamiento de las barras en

el mediano al largo plazo.

1.3. Objetivos

Como objetivo general para esta tesis, se plantea desarrollar una metodologıa basada en

redes neuronales que permita modelar el comportamiento de las barras de arena a partir de

datos extraıdos de imagenes time exposure teniendo en cuenta las caracterısticas del oleaje

como variables exogenas.

Para lograr el objetivo general, se plantea alcanzar los siguientes objetivos especıficos:

Establecer los pasos de la metodologıa teniendo en cuenta los vacıos encontrados en la

literatura.

Implementar un prototipo de la metodologıa propuesta para aplicarla al caso colom-

biano en Cartagena de Indias.

Modelar y pronosticar la posicion de las barras en el mediano plazo (semanas hasta

meses) con la metodologıa propuesta.

Page 25: Metodología para el modelado y predicción del ...

2 Datos

Existen varias tecnicas para medir el movimiento del agua y la evolucion de la topografıa

bajo el mar. Entre los metodos mas utilizados para medir la hidrodinamica de un lugar se

encuentran las mediciones por boyas y los instrumentos especializados que miden la varia-

cion de superficie libre, los cuales pueden medir durante largos perıodos de tiempo diferentes

estadısticas del oleaje, como altura de ola, perıodo de ola y direccion. Sin embargo, estos

instrumentos pueden ser muy costosos, y la disponibilidad puede ser limitada para ciertos

sitios. Una alternativa son los modelos numericos que simulan la generacion del oleaje to-

mando como entrada la velocidad de los vientos y la batimetrıa del lugar, o condiciones de

oleaje de otras locaciones que se propagan hasta el punto deseado.

Para medir los cambios en la morfologıa bajo el mar (batimetrıa), se requieren de campanas

de campo las cuales son costosas en esfuerzo y dinero, y solo proveen informacion durante

un corto perıodo de tiempo. En algunos lugares, utilizan muelles para medir la batimetrıa,

tomando un perfil de la costa y midiendo la profundidad en intervalos regulares durante

mucho tiempo. Sin embargo, este metodo es costoso y solo permite obtener informacion en

areas limitadas (perfiles lineales), y pueden afectar los procesos hidrodinamicos que se dan

en las cercanıas del muelle. Todas estas dificultades impiden tener series de datos extensas

y de calidad para procesos como la generacion y decaimiento de las barras. Los sistemas

de monitorizacion remota con camaras de video, como Argus (Holman and Stanley, 2007)

y HORUS (Osorio et al., 2007), surgen como una alternativa de bajo costo, que permiten

tener datos de alta resolucion espacial y temporal.

En este capıtulo, se describen los datos utilizados para alimentar los modelos presentados

en esta tesis. En la seccion 2.1 se describe el area de estudio de Cartagena de Indias en

Colombia. En la seccion 2.2 se describe el proceso de generacion de oleaje y validacion de los

datos generados. Finalmente, en la seccion 2.3 se describe el proceso para extraer la posicion

de las barras de las imagenes de HORUS.

Page 26: Metodología para el modelado y predicción del ...

12 2 Datos

2.1. Cartagena de Indias, Colombia

El clima en Cartagena de Indias esta influenciado por varios factores, a saber, la region es

afectada por los movimientos de la Zona de Convergencia Intertropical (ZCIT), debido a

fenomenos subtropicales; y por los vientos alisios (del N y NE). Hay dos principales perıodos

climaticos, el perıodo seco y el perıodo humedo. Tambien hay un perıodo intermedio. El

perıodo seco va desde diciembre hasta abril y esta caracterizado por fuertes vientos del N

y NE y una leve lluvia, y swell proveniente del hemisferio norte. El perıodo humedo va

desde agosto hasta noviembre y esta caracterizado por lluvia abundante y vientos debiles.

Finalmente, el perıodo intermedio va desde mayo hasta julio (tambien llamado “Veranillo de

San Juan”) y esta caracterizado por vientos fuertes y constantes.

Las mareas en la zona de estudio son mixtas diurnas y estan categorizadas como micromarea-

les debido a su bajo rango. La amplitud de marea es a menudo de menos de 50 cm. La marea

metereologica tiene un fuerte efecto en nivel medio del mar, y es debido principalmente a

huracanes caribenos y frentes frıos, a menudo aumentando el nivel en 15− 20 cm.

Las olas que golpean Cartagena de Indias se producen a partir del viento proveniente del

noreste, con una altura promedio de 0,25 m. Tambien hay olas provenientes del oeste con

una altura promedio de 0,5 m. En la figura 2-1 se presenta una rosa de vientos de la zona

en el tiempo del estudio.

20%

40%

60%

80%

WEST EAST

SOUTH

NORTH

0 − 0.20.2 − 0.40.4 − 0.60.6 − 0.80.8 − 11 − 1.21.2 − 1.4

Wave height (m)

Figura 2-1: Rosa de vientos en Bocagrande que relaciona la altura de ola significante conla direccion.

La playa de Bocagrande esta localizada en el distrito de Cartagena de Indias, Colombia, en

la zona central de la costa caribe colombiana, en 10 25’ 22”N, 75 31’ 56”W (ver figura 2-2),

y es uno de los sitios mas visitados por los turistas en Cartagena. La estacion de HORUS

Page 27: Metodología para el modelado y predicción del ...

2.2 Oleaje 13

esta instalada en lo alto de un edificio de aproximadamente 80 m de altura (el Edificio

Bavaria) con tres camaras cubriendo toda la playa de Bocagrande.

Figura 2-2: Zona de estudio: (izq.) Cartagena de Indias, (der.) Posicion de Bocagrande yel Edificio Bavaria donde la estacion HORUS esta instalada.

La zona de estudio es la porcion de playa entre dos espolones localizados ortogonalmente a

la lınea de costa: el espolon oeste (Iribarren) tiene 187 m de longitud y el espolon este tiene

91 m de longitud. La porcion de playa tiene 260 m de largo y 25 m de ancho (en promedio).

2.2. Oleaje

La variabilidad temporal del comportamiento de las barras esta directamente relacionado

con el oleaje, especıficamente, la altura de ola y el perıodo. Los datos de oleaje se pueden

obtener con mediciones de boyas en lugares cercanos a la zona de estudio; sin embargo,

no hay boyas disponibles cerca de Cartagena para el tiempo del estudio, por lo tanto, fue

necesario usar un modelo numerico de propagacion de oleaje llamado SWAN (Booij et al.,

1999) para estimar los estadısticos de oleaje, como la altura de ola significante, el perıodo

pico y la direccion en la zona de Bocagrande, usando batimetrıas y vientos de reanalisis del

Mar Caribe tomados de la base de datos del NCEP North American Regional Reanalysis

(NARR).

Las series generadas proveen informacion precisa del oleaje en un largo perıodo de tiempo.

La metodologıa para generas las series consiste en ejecutar el modelo en una escala oceanica

y luego en ejecuciones anidadas, reduciendo la escala y aumentando la resolucion, hasta

obtener la escala de la playa de Bocagrande.

Para evaluar la precision de las series, una comparacion con mediciones hechas in situ cerca

del sitio fue realizado en dos dominios: el tiempo y la probabilidad.

Page 28: Metodología para el modelado y predicción del ...

14 2 Datos

En la figura 2-3 se muestra una grafica de correlacion entre los datos medidos y los datos

modelados por el SWAN para la altura de ola significante en la costa de Bocagrande, con

un coeficiente de correlacion R2 = 79,8 % en el dominio del tiempo y de R2 = 94,9 % en

el dominio de la probabilidad, lo cual es un buen ajuste. En la figura 2-4 se muestra una

grafica de correlacion para el perıodo pico con un coeficiente de correlacion en el dominio

del tiempo de R2 = 1,13 % y de R2 = 89,8 % en el dominio de la probabilidad.

0 0.375 0.75 1.125 1.5

0

0.375

0.75

1.125

1.5

Hs modeled

Hs m

easu

red

fitted curve

0 0.375 0.75 1.125 1.5

0

0.375

0.75

1.125

1.5

Hs modeled

Hs m

easure

d

fitted curve

Figura 2-3: Grafica de correlacion entre la altura de ola medida y modelada

Para mayor detalle en la metodologıa de generacion de oleaje ver (Ortega et al., 2013).

Page 29: Metodología para el modelado y predicción del ...

2.2 Oleaje 15

3 4.5 6 7.5 93

4.5

6

7.5

9

Tp modeled

Tp m

easure

d

fitted curve

3 4.5 6 7.5 93

4.5

6

7.5

9

Tp modeled

Tp m

easure

d

fitted curve

Figura 2-4: Grafica de correlacion entre el perıodo pico medido y modelado

Page 30: Metodología para el modelado y predicción del ...

16 2 Datos

2.3. Posicion de las barras a partir de las imagenes

HORUS

La estacion HORUS consiste en tres camaras ubicadas en lo alto del edificio Bavaria de la

zona turıstica de Cartagena (ver Figura 2-5) desde donde se cubren varios cientos de metros

de costa (ver Figura 2-6). Las camaras estan conectadas a un computador local que procesa y

envıa las imagenes capturadas a un servidor central donde se postprocesan. Se capturan tres

tipos de imagenes: snapshot o imagenes instantaneas que muestran en un instante de tiempo

el estado de la zona; time exposure que son imagenes capturadas a una alta frecuencia (entre

2 y 15 Hz) promediadas en un tiempo predeterminado (2 minutos para el caso de Cartagena);

y variance o varianza de imagenes, que a diferencia de las imagenes time exposure son la

varianza del conjunto de imagenes capturadas en el tiempo de exposicion y a la frecuencia

dada. Para esta tesis se utilizan las imagenes time exposure porque son las que permiten

determinar la posicion estimada de las barras de arena.

Figura 2-5: Camaras de la estacion HORUS en Cartagena

Dado que las imagenes oblicuas capturadas no permiten hacer mediciones o localizar ele-

mentos en un sistema de coordenadas real, es necesario realizar un proceso de rectificacion

en el que se proyectan las imagenes, en un plano horizontal con coordenadas reales, y esto

permite realizar mediciones directamente desde las imagenes (ver Figura 2-8).

Los datos de la posicion de las barras se obtuvieron de imagenes capturadas en Cartagena,

Colombia, por la estacion de monitorizacion HORUS1 (Osorio et al., 2007), desde mayo de

2009 hasta diciembre de 2011. Los datos corresponden a observaciones extraıdas de imagenes

1http://www.horusvideo.com

Page 31: Metodología para el modelado y predicción del ...

2.3 Posicion de las barras a partir de las imagenes HORUS 17

Figura 2-6: Area de monitorizacion en la costa de Cartagena

time exposure, donde los patrones de rotura de oleaje son corregidos y aproximados a las

posiciones reales, tal como se describe en (Pape et al., 2010b).

Las imagenes fueron tomadas a una frecuencia de dos imagenes por segundo, promediadas

durante dos minutos, cada 30 minutos durante las horas del dıa. Estas imagenes muestran

bandas longitudinales de alta intensidad que indican la posicion de los patrones de rotura

de oleaje sobre la cresta de las barras sumergidas (Lippmann and Holman, 1989) como se

muestra en la figura 2-7. La posicion de estas bandas es una aproximacion precisa de la

posicion real de la barra.

2.3.1. Extraccion de la posicion de las barras

Se utilizo el software BLIMTOOL (Pape, 2008) para la extraccion de las lıneas de rotura

de oleaje, el cual esta basado en un algoritmo propuesto por (Van Enckevort and Ruessink,

2001), y la metodologıa descrita en (Pape et al., 2010b) para seleccionar las imagenes diarias.

Este algoritmo localiza los pixeles de alta intensidad en la imagen en una region de interes,

considerando la extraccion en la imagen previa y la siguiente (ver figura 2-7). Este enfoque

permite estimar las posiciones de las barras donde hay un regimen de olas de baja energıa y

los patrones de rotura no se ven muy claros en las imagenes.

Entre todas las imagenes en un dıa, la correspondiente a la marea mas baja fue seleccionada

ya que ese es el tiempo cuando en teorıa la rotura de oleaje es mas visible en la imagen, y

solo una imagen por dıa fue escogida, pues la variabilidad en el dıa es relativamente pequena.

Las posiciones de las barras fueron obtenidas de imagenes oblicuas como la que se muestra

en la figura 2-7, para luego ser rectificadas y proyectadas en plano real y medible. Para esto,

una lınea paralela a la lınea de costa fue fijada en la playa, y las mediciones de las barras

corresponden a las distancias desde la posicion rectificada a la lınea, como se muestra en la

Page 32: Metodología para el modelado y predicción del ...

18 2 Datos

Figura 2-7: Imagen time exposure en Bocagrande, Cartagena (la lınea negra es la aproxi-macion)

Page 33: Metodología para el modelado y predicción del ...

2.3 Posicion de las barras a partir de las imagenes HORUS 19

figura 2-8.

Figura 2-8: Imagen rectificada que muestra la posicion de la barra y la lınea paralela a lalınea de costa

Para cada dıa, las posiciones de las barras fueron promediadas longitudinalmente, aunque

hubo dıas en los que no fue posible obtener informacion debido a imagenes faltantes o baja

calidad. Estos saltos en la informacion, cuando corresponden a unos pocos dıas, fueron

rellenados usando un metodo basado en el metodo de descomposicion empırica en modos

(EMD, por su sigla en ingles) (Moghtaderi et al., 2012), el cual consiste en descomponer las

series en modos intrınsecos, cada uno de los cuales tiene un comportamiento regular que se

puede interpolar para luego combinarlos todos de nuevo. Este enfoque ha probado ser preciso

comparado con otros metodos de rellenado de informacion (Moghtaderi et al., 2012). En la

figura 2-9 se muestra la informacion observada y la rellenada sobre un stack de columnas

de pixeles, tomados de la imagen.

En la figura 2-10, se muestran las series de tiempo de la posicion de la barra (figura 2-10a),

altura significante de ola (figura 2-10b), perıodo de ola (figura 2-10c) y direccion de ola

Page 34: Metodología para el modelado y predicción del ...

20 2 Datos

Figura 2-9: Pila de columnas de pixeles de imagenes mostrando las posiciones extraıdas

(figura 2-10d) utilizados para el analisis presentado en este trabajo.

Page 35: Metodología para el modelado y predicción del ...

2.3 Posicion de las barras a partir de las imagenes HORUS 21

07−2009 10−2009 01−2010 04−2010 07−2010 10−2010 01−2011 04−2011 07−20110

100

200

x (

m)

Sandbar location

07−2009 10−2009 01−2010 04−2010 07−2010 10−2010 01−2011 04−2011 07−2011−1

0

1

2

Hs (

m)

Significant wave height

07−2009 10−2009 01−2010 04−2010 07−2010 10−2010 01−2011 04−2011 07−20110

10

20

Tp

(s)

Peak wave period

07−2009 10−2009 01−2010 04−2010 07−2010 10−2010 01−2011 04−2011 07−2011−0.01

0

0.01Dimensionless Grain fall velocity parameter

Figura 2-10: Serie de tiempo de (a) posicion de las barras, (b) altura de ola, (c) perıodo deola y (d) parametro adimensional de caıda del grano

Page 36: Metodología para el modelado y predicción del ...

3 Metodologıa para la construccion de la

red neuronal

La metodologıa propuesta en este artıculo esta basada en el proceso de seleccion de modelos

de Box y Jenkins (Box et al., 1994), el cual esta disenado para procesos lineales. Sin embargo,

debido a que el comportamiento morfodinamico e hidrodinamico en las proximidades de la

costa es altamente no lineal, se propone modificar esta metodologıa para la identificacion y

seleccion de modelos no lineales, utilizando principalmente, redes neuronales. Los pasos de

la metodologıa propuesta son:

A) Deteccion de la relacion entre la variable de interes y las variables exogenas.

B) Especificacion de modelos.

C) Estimacion de parametros.

D) Diagnostico de los modelos.

E) Uso de los modelos.

3.1. Deteccion de la relacion entre la variable de interes y

las variables exogenas

Las barras son parte de un complejo sistema donde el agua interactua con la arena, y se

ha observado que muchos de estos procesos son no lineales en las zonas costeras. Algunos

trabajos han estudiado como estas no-linealidades son reflejadas en la posicion y migracion

de las barras (Pape and Ruessink, 2008). Sin embargo, no hay consenso en cuales son los

factores que mitigan o aumentan el efecto de las no-linealidades subyacentes en el nivel de

abstraccion de las barras. En esta seccion se utilizaran dos metodos para analizar la relacion

entre la variable de interes y las variables exogenas, la primera es empleando una red neuronal

autorregresiva (ARNN, por su sigla en ingles) para determinar de forma cuantitativa la

Page 37: Metodología para el modelado y predicción del ...

3.1 Deteccion de la relacion entre la variable de interes y las variables exogenas 23

dependencia; la segunda es empleando descomposicion empırica en modos (EMD, por su

sigla en ingles) para determinar de manera grafica la relacion.

3.1.1. Dependencia no lineal

El primer paso en la metodologıa es escoger que variables explicativas participan en el modelo.

Estas variables pueden ser rezagos de la variable de interes o los estados presentes o rezagados

de las variables exogenas. En la metodologıa de Box–Jenkins (Box et al., 1994), se seleccionan

las variables explicativas utilizando las funciones de autocorrelacion simple y parcial, y las

funciones de correlacion cruzada simple y parcial. Sin embargo, estas medidas de la relacion

entre las variables son lineales, por lo tanto, no necesariamente capturan las relaciones no

lineales presentes.

Se emplea el metodo propuesto en (Martınez and Velasquez, 2011), el cual es una modifi-

cacion de la propuesta de Nielsen & Madsen (Nielsen and Madsen, 2001) donde plantean

funciones de correlacion no lineales basadas en funciones de base radial cuyo comportamiento

es similar a las funciones de correlacion propuestas por Box–Jenkins (Box et al., 1994). La

modificacion consiste en reemplazar las funciones de aproximacion en (Nielsen and Madsen,

2001), por redes neuronales autorregresivas (ARNN, por su sigla en ingles) con el fin de

detectar dependencias no lineales entre las variables.

El modelo ARNN usado en esta seccion tiene la forma mostrada en la ecuacion 3-1. Este

modelo tiene dos partes, una lineal autorregresiva (AR) y una parte no lineal (perceptron

multicapa, MLP). La parte AR es una combinacion lineal de los regresores (variables exoge-

nas y valores rezagados) y la parte MLP es una red neuronal artificial organizada en capas,

tres en este caso: capa de entrada, capa oculta y capa de salida.

y[t] = η +I∑

i=1

φixi +H∑

h=1

ωhG

(τh +

I∑i=1

ωi,hxi

)+ ε[t], (3-1)

donde η y τ son los bias; φ y ω son los parametros a ser calibrados; I es el numero de variables

de entrada; H es el numero de neuronas ocultas; x y y son las variables de entrada y salida,

respectivamente; ε son los residuales del modelo; y G(·) es una funcion no lineal (sigmoidea)

que transforma la suma ponderada de las entradas y pasa los valores transformados a la

siguiente capa (funcion de activacion).

Las funciones de dependencia no lineal propuestas son:

Page 38: Metodología para el modelado y predicción del ...

24 3 Metodologıa para la construccion de la red neuronal

Funcion de autocorrelacion simple entre yt y yt−k:

ρk = 1− V ar[yt|yt−k]

V ar[yt](3-2)

Funcion de autocorrelacion parcial entre yt y yt−k:

ρkk = 1− V ar[yt|yt−1, . . . , yt−k]

V ar[yt|yt−1, . . . , yt−k+1](3-3)

Funcion de correlacion cruzada simple entre yt y xt−k:

ck = 1− V ar[yt|xt−k]

V ar[yt](3-4)

Funcion de correlacion cruzada parcial entre yt y xt−k:

ckk = 1− V ar[yt|xt−1, . . . , xt−k]

V ar[yt|xt−1, . . . , xt−k+1](3-5)

En estas funciones, las varianzas condicionales de la forma V ar[y|x1, . . . , xn] son estimadas

como la varianza de los residuales obtenidos al aproximar y mediante el modelo ARNN

usando como regresores x1, . . . , xn.

Para el caso en el que el modelo ARNN no tiene neuronas ocultas, la aproximacion se vuelve

lineal, resultando ası una estimacion de las funciones autocorrelacion y correlacion cruzada

clasicas de la metodologıa de Box–Jenkins.

El proceso de seleccion de variables explicativas consiste en los siguientes pasos:

Se comienza con la determinacion de las posibles variables exogenas. Se determinan

a partir del conocimiento fısico que se tiene sobre los procesos. Para este artıculo, se

sabe que las barras son influidas directamente por las condiciones del oleaje (altura

significante de ola y perıodo pico).

Se determina el numero de rezagos a considerar para cada variable exogena y la variable

de interes. Tambien es determinado por el conocimiento fısico que se tiene de los

procesos y de la zona de estudio.

Se selecciona el nivel de significancia de cada rezago utilizando pruebas de permutacion,

con el fin establecer con un nivel de confianza dado, el valor a partir del cual se considera

significativa la relacion.

Page 39: Metodología para el modelado y predicción del ...

3.1 Deteccion de la relacion entre la variable de interes y las variables exogenas 25

Se estiman las funciones de dependencia no lineales (ver Ecuaciones 3-2, 3-3, 3-4 y 3-

5) para cada variable exogena por separado. Las funciones de correlacion parciales

eliminan el efecto de los rezagos intermedios entre la variable de interes y el rezago

considerado.

Se estiman las funciones de dependencia no lineales de la misma manera que en el

paso anterior, dejando fijos los rezagos de la variable mas significativa, con el fin de

seleccionar los rezagos de la otra variable en el modelo conjunto (dependencia no lineal

condicional).

Finalmente, dejando fijos en el modelo ARNN los rezagos de las variables exogenas, se

escogen los rezagos mas significativos de la variable de interes.

3.1.2. Analisis grafico con descomposicion empırica en modos

En esta seccion se utiliza el metodo de descomposicion empırica en modos (EMD, por su

sigla en ingles) para filtrar las series de la posicion de las barras y estadısticos de oleaje.

EMD es una novedosa tecnica para procesamiento de senales capaz de extraer los modos

oscilatorios de una serie de tiempo en diferentes escalas temporales (Huang et al., 1998).

El metodo EMD descompone una serie en un conjunto de componentes llamados Funciones de

Modo Intrınsecas (IMF, por su sigla en ingles) los cuales satisfacen las siguientes condiciones:

Para cada IMF el numero de maximos, mınimos y cruces por cero debe ser igual o

diferir en una unidad.

En cualquier punto, la media de la envoltura superior e inferior debe ser cero.

El algoritmo para extraer los IMFs de una series de tiempo y(t) es el siguiente (Huang et al.,

1998):

1. Identificar todos los maximos y los mınimos de y(t).

2. Generar una envoltura superior e inferior acotados por los maximos y los mınimos,

usando interpolacion spline.

3. En cada punto, calcular la media m entre la envoltura superior e inferior.

4. Calcular c = y(t)−m, candidato para ser un IMF.

Page 40: Metodología para el modelado y predicción del ...

26 3 Metodologıa para la construccion de la red neuronal

5. Si c no satisface las condiciones IMF, reemplazar y(t) con c y repetir el proceso desde

el paso 1 hasta que c sea considerado un IMF. Si c es un IMF, calcular r = y(t)− c, el

residual.

6. Repetir el proceso desde el paso 1 hasta obtener la tendencia de la serie en r.

Cuando el proceso termina, r es la tendencia de la serie y la suma de todos los modos da la

serie original como resultado.

Para aplicar este metodo a una serie de tiempo, es necesario que se cumplan dos condiciones:

i) la serie de ser no estacionaria y ii) no lineal, a diferencia de otros metodos como las

funciones empıricas ortogonales o analisis de Fourier, los cuales imponen linealidad. En

terminos generales, una serie de tiempo es no estacionaria si la media y la varianza no son

constantes en diferentes porciones de los datos. En la figura 2-10a los cambios en la media y

la varianza son evidentes para ambas series, donde hay secciones donde la variacion es mayor

y hay tendencias de alza y baja.

Se encontro que el metodo EMD es util para este analisis, puesto que, si bien es un metodo

empırico, es capaz de separar los comportamientos en diferentes escalas temporales, permi-

tiendo ignorar las mas altas frecuencias correspondientes a los procesos de mas baja escala,

y ası se puede estudiar el comportamiento medio en el mediano plazo para la posicion de las

barras y el oleaje.

Para simplificar el analisis grafico de la relacion entre las barras y el oleaje, se utilizo el

parametro adimensional de velocidad de caıda del grano (Ω) (Dean, 1973), el cual relaciona

la altura significante de ola y el perıodo pico en una ecuacion ası:

Ω =Hs

ωsTp, (3-6)

donde Hs es la altura significante de ola, ωs es la velocidad de caıda del grano (relacionada

con el diametro medio del grano) y Tp es el perıodo pico.

El parametro adimensional de velocidad de caıda del grano (Dean, 1973) fue propuesto como

un modelo para determinar el estado de la playa dadas unas condiciones de oleaje (Hs y Tp)

y caracterısticas morfologicas (ωs). Sin embargo, en esta tesis se utiliza este parametro como

una forma simplificada de representar el efecto de la energıa del oleaje y las caracterısticas

del sedimento en la zona costera.

Page 41: Metodología para el modelado y predicción del ...

3.2 Planteamiento de modelos 27

3.2. Planteamiento de modelos

3.2.1. Funciones de transferencia

Para el caso de las barras, los tradicionales modelos de evolucion consideran estados pasados

del suelo oceanico en la zona costera, y el estado actual y pasados de los forzadores (variables

exogenas), generalmente, el oleaje. Este tipo de sistemas se pueden modelar con funciones

de transferencia (Box et al., 1994), que buscan explicar una variable de salida y mediante

variables de entrada x, de la siguiente forma:

y[t] =M

(P∑

p=1

αpy[t− p] +

Q∑q=0

βqx[t− q]

)+ ε[t] (3-7)

donde M es una familia de funciones que representa el modelo; P es el orden de la variable

de salida; Q es el orden de la variable de entrada; y αp y βq son los parametros ajustables.

El termino ε[t] representa los residuales del modelo, la cual es una variable aleatoria inde-

pendiente e identicamente distribuida, con media cero y varianza constante: ε[t] ∼ N(0, σ2).

Dependiendo de la funcion N ∈ M se puede tener modelos lineales, como el ARX, o no

lineales como las redes neuronales.

3.2.2. Modelo ARX

Cuando la funcion N ∈M de la Ec. (3-7) es lineal, es decir, se tiene una combinacion lineal

de las variables de entrada para determinar la variable de salida, el modelo se llama modelo

autorregresivo con entradas externas (ARX, por su sigla en ingles):

y[t] =P∑

p=1

αpy[t− p] +

Q∑q=0

βqx[t− q] + ε[t] (3-8)

Para estimar los parametros αp y βq es suficiente utilizar el metodo de mınimos cuadrados

ordinarios.

3.2.3. Perceptron multicapa (MLP)

Los perceptrones multicapa son aproximadores universales de funciones (Hornik et al., 1989)

porque son capaces de mapear una entrada con una salida sin importar la complejidad de la

Page 42: Metodología para el modelado y predicción del ...

28 3 Metodologıa para la construccion de la red neuronal

relacion. Tambien pueden ser vistos como modelos no lineales de regresion. La arquitectura de

un perceptron multicapa consiste en tres capas: entrada, oculta y salida. Para este trabajo, la

capa de entrada contiene las variables explicativas seleccionadas x1, x2, . . . , xI , que pueden ser

valores rezagados de la variable de interes y, o valores presentes y rezagados de otras variables

exogenas. La capa oculta contiene H neuronas (metaparametro que debe ser estimado, como

se vera mas adelante), y el valor de cada neurona h corresponde a la suma ponderada de los

valores de la capa de entrada xi, 1 ≤ i ≤ I, con los pesos ωi,h, trasladado por una constante

τh o bias. La capa de salida contiene una neurona y[t], que corresponde al valor estimado con

el modelo de la variable de interes; el valor de esta neurona es la suma ponderada con pesos

ωh de los valores calculados en cada neurona de la capa oculta h, transformados mediante la

funcion de activacion G(·) (la cual es una funcion no lineal, generalmente, la funcion logıstica

o tangente hiperbolica), y trasladado por una constante η. La representacion matematica de

esta arquitectura se muestra en la Ec. (3-9).

y[t] = η +H∑

h=1

ωhG

(τh +

I∑i=1

ωi,hxi

)+ ε[t] (3-9)

Para estimar el valor de los parametros η, ωh, τh y ωi,h, para 1 ≤ h ≤ H, 1 ≤ i ≤ I, se

emplean metodos de optimizacion basados en gradientes como backpropagation, gradiente

conjugado, BFGS, entre otros.

3.2.4. Red neuronal autorregresiva (ARNN)

Un perceptron multicapa extendido con un componente lineal autorregresivo produce una

red neuronal ARNN. En la Ec. (3-10) se muestra el MLP extendido con un termino que por

sı solo es un modelo ARX, donde los parametros φi, 1 ≤ i ≤ I, se ajustan al mismo tiempo

que los parametros del MLP. Cuando los parametros φi son iguales a cero, es modelo se

reduce a un MLP estandar, y cuando se fija el numero de neuronas H a cero, el modelo se

reduce a un ARX.

y[t] = η +I∑

i=1

φixi +H∑

h=1

ωhG

(τh +

I∑i=1

ωi,hxi

)+ ε[t] (3-10)

Page 43: Metodología para el modelado y predicción del ...

3.2 Planteamiento de modelos 29

3.2.5. Maquina de aprendizaje extremo (ELM)

El algoritmo ELM es un eficiente metodo para entrenar un MLP con una sola capa oculta.

Se basa en las siguientes ideas: i) un MLP, con pesos iniciales calculados aleatoriamente,

con una sola capa oculta y N muestras de entrenamiento, puede aprender exactamente los

valores de entrada teniendo un numero de neuronas en la capa oculta H ≤ N ; ii) no es

necesario ajustar los pesos de la capa de entrada y de los bias de la capa oculta, siempre y

cuando la funcion de activacion sea infinitamente diferenciable (Huang et al., 2006). Cabe

notar que el MLP del ELM no tiene el parametro η mostrado en la Ec. (3-9).

Los metodos tradicionales para entrenar las redes neuronales son los basados en gradiente

descendente, pero estos metodos pueden ser muy lentos para alcanzar un error aceptable, o

se pueden quedar atascados en mınimos locales. El algoritmo ELM ha probado ser mucho

mas rapido en la convergencia y al mismo tiempo generaliza mejor (Huang et al., 2006) en

muchos casos.

Dado un conjunto de entrenamiento (x(j),y(j))|x(j) ∈ RI ,y(j) ∈ RO, j = 1, . . . , N, una

funcion de activacion G(·) y un numero H de neuronas en la capa oculta, la matriz W se

calcula como:

W =

G(τ1 +∑I

i=1 ωi,1x(1)i ) · · · G(τH +

∑Ii=1 ωi,Hx

(1)i )

... · · ·...

G(τ1 +∑I

i=1 ωi,1x(N)i ) · · · G(τH +

∑Ii=1 ωi,Hx

(N)i )

N×H

(3-11)

El algoritmo realiza los siguientes pasos:

1. Inicializar los pesos ωi,h, y τh aleatoriamente, para 1 ≤ i ≤ I, 1 ≤ h ≤ H.

2. Calcular la matriz W de pesos entre la capa oculta y la capa de salida, como se muestra

en la Ecuacion 3-11.

3. Calcular los pesos de salida ω = W†Y, donde Y = [y(1), . . . ,y(N)]T y W†H×N es la

inversa generalizada Moore–Penrose de W.

Con los nuevos pesos calibrados se construye la red neuronal.

3.2.6. Modelos hıbridos

Algunos autores han planteado utilizar modelos hıbridos que combinen modelos lineales

como los ARIMA y no lineales como las redes neuronales (ver por ejemplo (Zhang, 2003)).

Page 44: Metodología para el modelado y predicción del ...

30 3 Metodologıa para la construccion de la red neuronal

Estos modelos permiten capturar tanto patrones lineales como no lineales en los datos, que

no siempre son apropiadamente capturados utilizando modelos completamente lineales o

completamente no lineales. Adicionalmente, no siempre se sabe si los procesos que se quieren

modelar son lineales o no lineales, por lo tanto, es aconsejable utilizar modelos que puedan

detectar ambos tipos de patrones.

Los modelos hıbridos estiman la variable de salida a partir de las variables explicativas

aplicando un tipo de modelo y luego, a los residuales, aplicando otro tipo de modelo para

capturar los patrones no capturados inicialmente. La forma general de estos modelos es la

siguiente:

y[t] = z1[t] + z2[t] (3-12)

donde z1[t] y z2[t] son las componentes de uno y otro tipo de modelo, y se estiman de la

siguiente manera:

z1[t] = f(x1, . . . , xI ;φ) (3-13)

se calculan los residuales del modelo como:

e[t] = y[t]− z1[t] (3-14)

luego, se calcula la otra componente ası:

z2[t] = g(e[t− 1], . . . , e[t− P ];ψ) + ε[t] (3-15)

donde el orden de la parte autorregresiva de los residuales, P , se estima haciendo un auto-

correlograma de los residuales o utilizando algun criterio como el AIC para determinar el

numero de rezagos significativos.

Para obtener la estimacion de la variable de salida:

y[t] = z1[t] + z2[t] + ε[t] (3-16)

Page 45: Metodología para el modelado y predicción del ...

3.3 Estimacion de parametros 31

Se propone utilizar los siguientes modelos hıbridos:

L-NL: f(·) lineal y g(·) no lineal, ver Ec. (3-17).

z1[t] = φ0 +I∑

i=1

φixi

z2[t] = ψ0 +J∑

j=1

ψjG

(ψ0,j +

P∑p=1

ψp,je[t− p]

) (3-17)

NL-L: f(·) no lineal y g(·) lineal, ver Ec. 3-18.

z1[t] = φ0 +H∑

h=1

φhF

(φ0,h +

I∑i=1

φi,hxi

)

z2[t] = ψ0 +P∑

p=1

ψpe[t− p](3-18)

NL-NL: f(·) no lineal y g(·) no lineal, ver Ec. 3-19.

z1[t] = φ0 +H∑

h=1

φhF

(φ0,h +

I∑i=1

φi,hxi

)

z2[t] = ψ0 +J∑

j=1

ψjG

(ψ0,j +

P∑p=1

ψp,je[t− p]

) (3-19)

En las Ecs. (3-17), (3-18) y (3-19), F (·) y G(·) son las funciones de activacion de las redes

neuronales artificiales, usualmente la funcion logıstica; H y J representan el numero de

neuronas en la capa oculta para z1 y z2, respectivamente.

3.3. Estimacion de parametros

Cada uno de los modelos presentados en la seccion anterior requiere la estimacion de los

parametros libres. La estimacion siempre se realiza minimizando una medida de error, en

Page 46: Metodología para el modelado y predicción del ...

32 3 Metodologıa para la construccion de la red neuronal

este caso, el error cuadratico medio (MSE, por su sigla en ingles) como se muestra en la

Ecuacion 3-20.

MSE =1

N

N∑i=1

(y[t]− y[t])2 (3-20)

Para los modelos, se utiliza un conjunto de datos de entrenamiento para estimar los parame-

tros libres y un conjunto de datos de validacion, que no pertenecen al conjunto de entre-

namiento, para evaluar la calidad de las predicciones. Para el caso de los modelos lineales,

el entrenamiento se realiza con mınimos cuadrados, pues el modelo es una regresion lineal,

mientras que para los modelos no lineales se utilizan algoritmos mas sofisticados ya que la

superficie de la funcion de error es mas compleja y puede tener mınimos locales que hacen

difıcil la estimacion optima.

Un aspecto importante en la seleccion de los modelos es la estimacion de los metaparametros,

que en este caso es el numero de neuronas en la capa oculta. Para este fin se plantea utilizar

el siguiente procedimiento:

Escoger un numero maximo de neuronas H.

Iterar sobre h desde 1 hasta H. Para h = 1, escoger valores aleatorios para la primera

neurona.

Para h > 1, dejar fijos los parametros de las h− 1 neuronas anteriores, e inicializar en

valores cercanos a cero los parametros de la neurona actual. Todos los parametros se

varıan durante el entrenamiento.

Seleccionar el modelo que reporte el menor error de validacion con un error de entre-

namiento bajo.

3.4. Diagnostico de los modelos

Los modelos se construyen con el supuesto que todos los patrones o dinamicas son captura-

das. Sin embargo, para determinar si el modelo es adecuado para representar el proceso, es

necesario evaluar los residuales. Una condicion para que el modelo se considere adecuado es

que los residuales sean independientes e identicamente distribuidos con media cero y varianza

constante.

Page 47: Metodología para el modelado y predicción del ...

3.5 Uso de los modelos 33

En la metodologıa propuesta, se analizan los residuales de cada modelo con la funcion de au-

tocorrelacion, para determinar si existen dependencias con rezagos que no fueron capturadas

durante el proceso de construccion del modelo. En caso de existir patrones no capturados,

se agregan los componentes no capturados y se itera nuevamente sobre todo el proceso de

seleccion.

3.5. Uso de los modelos

Finalmente, se selecciona el modelo que haya proporcionado una mejor estimacion de la

variable de interes, teniendo en cuenta que debe ser un modelo que no solamente se ajuste

bien en el entrenamiento, sino que tenga buena generalizacion, de tal manera que tenga buen

desempeno con datos que no pertenecen al conjunto de entrenamiento.

Page 48: Metodología para el modelado y predicción del ...

4 Resultados y Discusion

La metodologıa descrita en el capıtulo 3 fue aplicada a los datos presentados en el capıtulo 2.

La variable de interes es la posicion de la barra externa en Cartagena, y las variables exogenas

son la altura de ola significante y el perıodo pico. Como paso previo al analisis, las series de

tiempo se normalizaron en el intervalo [−1, 1] para evitar problemas de precision numerica

al comparar o al realizar operaciones aritmeticas entre variables con ordenes de magnitud

diferentes.

En las siguientes subsecciones se describiran los resultados obtenidos en cada paso de la

metodologıa.

4.1. Deteccion de la relacion entre la variable de interes y

las variables exogenas

4.1.1. Dependencia no lineal

La determinacion de las relaciones no lineales entre las variables se realizo aplicando las

Ecs. (3-2), (3-3), (3-4) y (3-5). Para calcular los coeficientes de correlacion se entreno un

modelo ARNN con tres neuronas en la capa oculta, utilizando el metodo de optimizacion

BFGS (Broyden-Fletcher-Goddart-Shanno) (Broyden, 1970; Fletcher, 1970; Goldfarb, 1970;

Shanno, 1970). El criterio de convergencia para el entrenamiento de la red neuronal se

tomo como el momento en el que el error cambie muy poco entre interaciones consecuti-

vas, o hasta un maximo de 500 iteraciones. Para garantizar la convergencia se realizaron

un maximo de 150 reinicios aleatorios, teniendo en cuenta los parametros que produjeron el

error mas bajo.

Se consideraron 20 rezagos, suponiendo que el estado actual de la playa en Cartagena puede

ser afectado por estados pasados hasta dos o tres semanas.

Los resultados de aplicar los coeficientes de correlacion a la posicion de la barra como variable

dependiente y altura de ola como variable independiente se muestra en las Figs. 4-1 (simple)

y 4-2 (parcial).

Page 49: Metodología para el modelado y predicción del ...

4.1 Deteccion de la relacion entre la variable de interes y las variables exogenas 35

0 5 10 15 20

−1.0

−0.5

0.0

0.5

1.0

Lag

Figura 4-1: Funcion de correlacion cruzada simple no lineal entre la posicion de la barra yla altura de ola significante

0 5 10 15 20

−1.0

−0.5

0.0

0.5

1.0

Lag

Figura 4-2: Funcion de correlacion cruzada parcial no lineal entre la posicion de la barra yla altura de ola significante

Page 50: Metodología para el modelado y predicción del ...

36 4 Resultados y Discusion

Los resultados de aplicar los coeficientes de correlacion a la posicion de la barra como variable

dependiente y perıodo pico como variable independiente se muestra en las Figs. 4-3 (simple)

y 4-4 (parcial).

0 5 10 15 20

−1.0

−0.5

0.0

0.5

1.0

Lag

Figura 4-3: Funcion de correlacion cruzada simple no lineal entre la posicion de la barra yperıodo pico

La posicion de la barra tiene una clara dependencia con el primer rezago tanto de la altura de

ola como del perıodo pico, siendo mas fuerte la relacion con la altura de ola. Este resultado

es esperado, pues es bien conocido que el estado de la playa depende en gran medida de las

condiciones marıtimas, siendo el oleaje el principal forzador.

Para ver el efecto combinado de la altura de ola significante y el perıodo pico, se investiga

la correlacion entre la posicion de la barra y el perıodo pico, dado que el rezago cero de la

altura de ola esta incluido en el modelo ARNN. Esta dependencia condicional indica si el

modelo unicamente con la informacion de la altura de ola es suficiente para modelar la barra.

En la Fig. 4-5 se muestran los coeficientes de correlacion no lineal para diferentes rezagos.

Este resultado indica que es necesario incluir tambien el primer rezago del perıodo pico para

completar el modelo.

Finalmente, se repite el procedimiento dejando fijas la altura de ola y el perıodo pico, y

evaluando uno a uno los rezagos de la variable de interes (posicion de la barra). En la Fig. 4-

6 se muestra la funcion de autocorrelacion no lineal dados la altura de ola y perıodo pico.

Page 51: Metodología para el modelado y predicción del ...

4.1 Deteccion de la relacion entre la variable de interes y las variables exogenas 37

0 5 10 15 20

−1.0

−0.5

0.0

0.5

1.0

Lag

Figura 4-4: Funcion de correlacion cruzada parcial no lineal entre la posicion de la barra yperıodo pico

0 5 10 15 20

−1.0

−0.5

0.0

0.5

1.0

Lag

Figura 4-5: Funcion de correlacion cruzada parcial no lineal entre la posicion de la barra yla combinacion entre altura de ola significante y perıodo pico

Page 52: Metodología para el modelado y predicción del ...

38 4 Resultados y Discusion

Es claro que el rezago 1 de la posicion de la barra debe ir incluido en el modelo.

0 5 10 15 20

−1.0

−0.5

0.0

0.5

1.0

Lag

Figura 4-6: Funcion de autocorrelacion parcial no lineal de la posicion de la barra dados laaltura de ola significante y perıodo pico

4.1.2. Analisis grafico con descomposicion empırica en modos

Para visualizar el comportamiento de la posicion de las barras con respecto a las condiciones

de oleaje, se propone aplicar un metodo de filtrado adecuado para series de tiempo no lineales

y no estacionarias llamado EMD. La idea es filtrar las series de tiempo extrayendo los modos

de altas frecuencias, los cuales pueden estar allı debido a ruido o impresiciones diarias tales

como diferencias leves en los niveles de mareas o condiciones atıpicas de oleaje de corta

duracion.

El metodo EMD descompone las series de tiempo en IMFs, lo cual es aproximadamente

equivalente a aislar la variabilidad en diferentes escalas de tiempo. Ası, se suman de las

ultimas IMFs y se ignoran las primeras (que corresponden a las altas frecuencias, o los

comportamientos de mas pequena escala temporal).

Las series de tiempo de altura significante de ola y perıodo pico se combinan en una serie

de tiempo (Ω) llamada el parametro adimensional de velocidad de caıda del grano (Dean,

1973) (ver ecuacion 3-6)

Page 53: Metodología para el modelado y predicción del ...

4.1 Deteccion de la relacion entre la variable de interes y las variables exogenas 39

The wave time series, e.g. significant wave height and peak period, are combined into one

time series (Ω) which is called the dimensionless grain fall velocity parameter (Dean, 1973)

(see equation 3-6). The grain fall velocity is represented as:

ωs = 273D1,350 , (4-1)

donde D50 es el diametro medio del grano, el cual en el caso de la playa de Bocagrande

en Cartagena es igual a 0,140 mm (ωs = 2192,097) de acuerdo a la granulometrıa llevada a

cabo por el Instituto de Hidraulica y Saneamiento Ambiental de la Universidad de Cartagena,

Colombia en marzo de 2011.

El metodo EMD fue aplicado a las series de tiempo de la posicion de las barras y Ω en la

porcion continua mas larga (del 1 de octubre de 2010 al 4 de mayo de 2011). En la figura 4-7

se muestran los IMFs resultantes de la series de tiempo de las barras y en la figura 4-8 se

muestran los IMFs de la serie de tiempo Ω.

La idea de aplicar EMD a las series de tiempo es con el fin de poder suavizarlas para

determinar mas claramente la relacion de forma grafica. Para las series de tiempo estudiadas,

se seleccionaron las ultimas tres IMFs que representan aproximadamente la tendencia (ver

figura 4-9 para la posicion de las barras y figura 4-10 para Ω).

La descomposicion con EMD extrae los modos en distintas escalas de tiempo. El residual

corresponde a la tendencia de la serie (el cual no es necesariamente la tendencia fısica) y los

IMFs son los modos oscilatorios alrededor de la media en diferentes escalas. Las variaciones

cıclicas son evidentes en el orden de los dıas y las semanas en la posicion de las barras.

La figura 4-11 muestra la grafica de correlacion entre las tendencias de las series de la

posicion de la barra y Ω.

La relacion entre la posicion de la barra y las condiciones de oleaje parece ser compleja

pero existen algunos patrones que puede ser analizados. En algunos dıas cuando las olas

incrementan su energıa en poco tiempo, las barras comienzan a avanzar en direccion al mar,

pero este comportamiento tiene lugar despues de un tiempo (retardo), este es un efecto

elastico que se puede ver en la figura 4-11. Son cambios lentos en la energıa del oleaje, las

barras tambien experimentan cambios lentos tambien. Por otro lado, son rapidos cambios

en la energıa del oleaje, las barras siguen su movimiento experimentando inercia, pero el

continuo efecto de la energıa del oleaje en las barras, las obliga a cambiar su comportamiento

mostrando ese efecto elastico.

En la figura 4-11 se observan fluctuaciones en la posicion de las barras para diferentes

intensidades de energıa. Olas de poca energıa causan un movimiento lento y alargado de

Page 54: Metodología para el modelado y predicción del ...

40 4 Resultados y Discusion

Oct−2010 Jan−2011 Apr−2011−20

0

20

(m)

IMF 1 − Sandbar

Oct−2010 Jan−2011 Apr−2011−10

0

10

(m)

IMF 2 − Sandbar

Oct−2010 Jan−2011 Apr−2011−50

0

50

(m)

IMF 3 − Sandbar

Oct−2010 Jan−2011 Apr−2011−10

0

10

(m)

IMF 4 − Sandbar

Oct−2010 Jan−2011 Apr−201140

50

60

70

(m)

IMF 5 − Sandbar

Figura 4-7: Descomposicion de la serie de tiempo de la posicion de las barras

Page 55: Metodología para el modelado y predicción del ...

4.1 Deteccion de la relacion entre la variable de interes y las variables exogenas 41

Oct−2010 Jan−2011 Apr−2011−2

0

2x 10

−3

IMF 1 − Ω

Oct−2010 Jan−2011 Apr−2011−2

0

2x 10

−3

IMF 2 − Ω

Oct−2010 Jan−2011 Apr−2011−2

0

2x 10

−3

IMF 3 − Ω

Oct−2010 Jan−2011 Apr−2011−1

0

1x 10

−3

IMF 4 − Ω

Oct−2010 Jan−2011 Apr−2011−2

0

2x 10

−3

IMF 5 − Ω

Oct−2010 Jan−2011 Apr−20112

3

4x 10

−3

IMF 6 − Ω

Figura 4-8: Decomposicion de la serie de tiempo Ω

Page 56: Metodología para el modelado y predicción del ...

42 4 Resultados y Discusion

Oct−2010 Nov−2010 Dec−2010 Jan−2011 Feb−2011 Mar−2011 Apr−2011 May−201120

30

40

50

60

70

80

90

Time

Sandbar

location (

m)

Original series

Sum of IMFs

Figura 4-9: Suma de los IMFs seleccionados para la serie de tiempo de las barras

Page 57: Metodología para el modelado y predicción del ...

4.1 Deteccion de la relacion entre la variable de interes y las variables exogenas 43

Oct−2010 Nov−2010 Dec−2010 Jan−2011 Feb−2011 Mar−2011 Apr−2011 May−2011−1

0

1

2

3

4

5

6x 10

−3

Time

Dim

ensio

nle

ss g

rain

fall

velo

city p

ara

me

ter

Original series

Sum of IMFs

Figura 4-10: Suma de los IMFs seleccionados para la serie de tiempo Ω

Page 58: Metodología para el modelado y predicción del ...

44 4 Resultados y Discusion

20 30 40 50 60 70 80

−1

0

1

2

3

4

5

6

x 10−3

10−2010

11−2010

12−2010

01−2011

02−2011

03−2011

04−2011

05−2011

Sandbar IMFs from 3 to 5

Ω IM

Fs fro

m 3

to 6

Figura 4-11: Correlacion entre la posicion de la barra y el parametro adimensional de ve-locidad de caıda del grano (Ω)

Page 59: Metodología para el modelado y predicción del ...

4.2 Estimacion de parametros 45

un lado al otro como se puede ver en la parte inferior de la figura; por otro lado, olas

de alta energıa causan cambios rapidos en la posicion de la barra como se muestra en la

parte superior de la figura. Este comportamiento es esperado y va en concordancia con

observaciones anteriores del comportamiento de las barras, las cuales demuestran que las

olas de alta energıa dirigen a las barras en direccion al mar y las olas de baja energıa las

dirigen hacia la costa (Hoefel and Elgar, 2003).

El comportamiendo oscilatorio de la posicion de las barras debido a altas energıas puede ser

causado por la presencia de algun atractor hacia un punto de equilibrio. Algunos trabajos

recientes han demostrado la presencia de estados de equilibrio en el comportamiento de las

barras (Pape et al., 2010b). Este tipo de comportamiento solo puede ser observado en el

nivel de abstraccion de las barras y es difıcil de reproducir a partir de modelos que simulan

los procesos subyacentes de pequena escala, es decir, los procesos basados en procesos.

El parametro Ω fue un intento inicial para determinar el estado de la playa categorizando

su valor en seis configuraciones morfologicas (desde disipativa hasta reflejante). Este modelo

supone que el estado de la playa depende linealmente solamente de las condiciones de oleaje y

las caracterısticas del sedimento. Sin embargo, de la figura 4-11 es claro que esta influencia

no es necesariamente lineal, y tiene un componente de memoria que se presenta cuando

las barras se aproximan a un estado de equilibrio. Estudios recientes como el de (Turki

et al., 2012) y (Turki et al., 2013) mencionan el comportamiento de la playa y su memoria

influenciada por la energıa del oleaje. Los estudios concluyen que las diferentes dinamicas

(rotacion y traslacion) tienen una dependencia en las condiciones de energıa de oleaje que

cubre de unos pocos dıas a varias semanas, y que otros aspectos como el tamano del grano y

la longitud de la playa determinan que tan rapido responde la playa a la energıa del oleaje.

4.2. Estimacion de parametros

Los modelos presentados en la seccion 3.2 fueron entrenados con los datos ya descritos. En

total se tienen 596 muestras las cuales se dividieron en 574 datos para entrenamiento y 22

datos para validacion. Esta division se determino utilizando el conocimiento de la dinamica

de las barras en la zona de estudio.

El numero de neuronas en la capa oculta de cada modelo se determino empleando un enfoque

incremental, en el cual se comienza con el modelo con una neurona (h = 1), inicializando

aleatoriamente los parametros. Para cada modelo a partir de dos neuronas en la capa oculta

(h > 1), se toman los parametros encontrados en el modelo inmediatamente anterior como

estimados iniciales para los parametros de las primeras h−1 neuronas, y los nuevos parame-

Page 60: Metodología para el modelado y predicción del ...

46 4 Resultados y Discusion

tros se inicializan en valores cercanos a cero, durante el entrenamiento se varıan todos los

parametros del modelo hasta encontrar un nuevo mınimo o hasta alcanzar un numero maxi-

mo de iteraciones, en este caso, 500 iteraciones. El numero maximo de neuronas seleccionado

es diez y para el modelo hıbrido con z1 no lineal y z2 no lineal, este numero es cinco.

Todos los modelos tienen como base el modelo MLP y el modelo ARX, y las combinaciones

entre estos. Por lo tanto, el metodo de entrenamiento utilizado es el mismo para todos,

en este caso, BFGS (excepto el modelo ELM). Este metodo ha demostrado ser eficiente y

efectivo para encontrar el valor optimo en la funcion de error.

En las Figs. 4-12 a la 4-16, se presentan los errores de entrenamiento y validacion para cada

uno de los modelos presentados en funcion del numero de neuronas en la capa oculta y se

muestra la comparacion con el error encontrado al aplicar el modelo ARX.

2 4 6 8 10

0.0

050

0.0

055

0.0

06

00.0

065

0.0

07

00

.0075

H

MS

E

Training error

Validation error

Figura 4-12: Errores de entrenamiento y validacion del modelo MLP

Para el modelo hıbrido NL-NL se varıan el numero de neuronas en la capa oculta de ambas

redes neuronales, por lo que el error se presenta como una superficie. En la Fig. 4-17 se

presenta la superficie del MSE de entrenamiento y en la Fig. 4-18 se presenta la superficie

del MSE de validacion. Es claro que a medida que se incrementa el numero de neuronas, el

MSE de entrenamiento disminuye. Por otro lado, el menor MSE de validacion se obtiene en

la esquina superior derecha, es decir, con una neurona para z1 y cinco neuronas para z2.

El error de entrenamiento se reduce a medida que se aumenta el numero de neuronas como es

Page 61: Metodología para el modelado y predicción del ...

4.2 Estimacion de parametros 47

2 4 6 8 10

0.0

050

0.0

055

0.0

06

00.0

065

0.0

07

00

.00

75

H

MS

E

Training error

Validation error

Figura 4-13: Errores de entrenamiento y validacion del modelo ARNN

2 4 6 8 10

0.0

050

0.0

055

0.0

060

0.0

065

0.0

070

0.0

07

5

H

MS

E

Training error

Validation error

Figura 4-14: Errores de entrenamiento y validacion del modelo hıbrido L-NL

Page 62: Metodología para el modelado y predicción del ...

48 4 Resultados y Discusion

2 4 6 8 10

0.0

050

0.0

055

0.0

06

00.0

065

0.0

07

00

.00

75

H

MS

ETraining error

Validation error

Figura 4-15: Errores de entrenamiento y validacion del modelo hıbrido NL-L

2 4 6 8 10

0.0

00.0

50.1

00.1

50

.20

H

MS

E

Training error

Validation error

Figura 4-16: Errores de entrenamiento y validacion del modelo ELM

Page 63: Metodología para el modelado y predicción del ...

4.2 Estimacion de parametros 49

H for z2

H f

or

z1

1 2 3 4 5

1

2

3

4

55.1

5.2

5.3

5.4

5.5

5.6

5.7

x 10−3

Figura 4-17: Error de entrenamiento del modelo hıbrido NL-NL

H for z2

H f

or

z1

1 2 3 4 5

1

2

3

4

5

6.4

6.5

6.6

6.7

6.8

6.9

7

7.1

7.2

7.3

x 10−3

Figura 4-18: Error de validacion del modelo hıbrido NL-NL

Page 64: Metodología para el modelado y predicción del ...

50 4 Resultados y Discusion

de esperarse. Sin embargo, la capacidad de generalizacion tambien se reduce, por lo tanto, el

error de validacion aumenta a partir de cierta cantidad de neuronas. El modelo seleccionado

es el que presenta el menor error de validacion.

En la Tabla 4.2 se presenta el error cuadratico medio (MSE) y el error absoluto medio

(MAE) para cada modelo, habiendo seleccionado, entre los modelos con distintos numeros

de neuronasH, el que presenta el menor error de validacion. Los modelos se listan como ARX,

MLP, ARNN, L-NL, NL-L, NL-NL, MLE. Para el modelo NL-NL, el numero de neuronas

ocultas se presenta como un par (h, j) donde h es el numero optimo para z1 y j es el numero

optimo para z2.

Para establecer una base de comparacion, se incluye el resultado de entrenar un modelo ARX

con la misma cantidad de datos de entrenamiento y validacion.

Tabla 4-1: MSE y MAE para cada uno de los modelos seleccionados

Modelo Neuronas MSE MSE MAE MAEocultas entrenamiento validacion entrenamiento validacion

ARX – 0.005828 0.007177 0.052903 0.063198MLP 4 0.005343 0.006572 0.050812 0.061680ARNN 3 0.005260* 0.006879 0.050286* 0.063113L-NL 10 0.005716 0.007076 0.052842 0.063208NL-L 5 0.005343 0.006516 0.050709 0.061811NL-NL (1, 5) 0.005592 0.006373* 0.053069 0.057626*MLE 7 0.005666 0.006438 0.052455 0.059492

Entre los modelos presentados el que reporta tanto el menor MSE como el menor MAE de

validacion es el modelo NL-NL. En comparacion con los resultados del modelo ARX, el error

de entrenamiento y de validacion, medido tanto con el MSE como con el MAE, siempre

es mayor que el de los modelos no lineales. Esto apoya la idea de que la dinamica costera

tiene comportamientos no lineales que no son capturados por modelos basados en datos

meramente lineales como el ARX.

El modelo ARNN tiene el menor MSE y MAE de entrenamiento, pero no de validacion.

Esto indicar que el modelo NL-NL pudo generalizar mejor para los datos no conocidos que

el ARNN.

Entre los modelos presentados el que utiliza un algoritmo de entrenamiento de naturaleza

diferente es el ELM. Este modelo emplea un enfoque de entrenamiento rapido, que se basa en

la aleatorizacion de los parametros con el fin de encontrar rapidamente los valores mınimos

en la funcion de error con alta precision. El error de validacion (MSE y MAE) reportado para

este metodo es el segundo mejor despues del modelo NL-NL. En comparacion, este metodo

Page 65: Metodología para el modelado y predicción del ...

4.2 Estimacion de parametros 51

es mucho mas eficiente en cuanto al entrenamiento, por lo que resalta como una alternativa

en aplicaciones reales de sistemas con variables exogenas.

El modelo que presenta un mayor error de validacion es el modelo L-NL. Esto indica que para

esta aplicacion, la aplicacion de un modelo lineal primero, impide que el segundo modelo

no lineal capture correctamente los patrones no lineales. Sin embargo, esto depende de las

caracterısticas de los sistemas analizados en cada caso.

Page 66: Metodología para el modelado y predicción del ...

5 Conclusiones

En los ultimos anos, ha habido un creciente interes en las tecnicas basadas en datos para

el modelado, prediccion y entendimiento de las costas. Los modelos tradicionales como los

modelos basados en procesos tienen algunas desventajas que impiden ser usados en sistemas

fısicos como las barras: i) imprecisiones en los datos usados para calibrar o validar los modelos

y el lımite en la capacidad computacional causando acumulacion exponencial de los errores,

ii) poco entendimiento del sistema estudiado, y iii) esfuerzo computacional para simulaciones

a mediano y largo plazo.

La creciente disponibilidad de datos de alta resolucion espacial y temporal de diversas fuentes,

como los sistemas de monitorizacion basados en video, han abierto la posibilidad de utilizar

tecnicas modernas basadas en datos, a pesar del hecho de que son mayormente modelos caja

negra, han superado algunas de las desventajas de los modelos basados en procesos.

En este trabajo se utilizo un tipo de modelos alternativos, categorizados como modelos

basados en datos, que se basan en la informacion historica de observaciones realizadas durante

largos perıodos de tiempo. Los datos utilizados corresponden a las observaciones compiladas

por la estacion de monitorizacion costera HORUS en Cartagena de Indias, Colombia. Los

datos de la posicion de las barras fueron extraıdos de las imagenes, y los datos de oleaje

fueron generados por el modelo de generacion de oleaje SWAN, de los cuales se selecciona

la altura de ola significante y el perıodo pico como variables exogenas. Estos datos sirvieron

para alimentar los modelos lineales y no lineales descritos.

Debido a la complejidad en la seleccion de modelos no lineales basados en datos para sis-

temas dinamicos con variables exogenas, se propuso una metodologıa con la que se pueden

seleccionar diferentes aspectos de los modelos, tales como el numero de rezagos de las varia-

bles que influencian de forma no lineal el estado presente de las barras, la significancia en

la interaccion entre las variables exogenas, y parametros y metaparametros propios de los

modelos.

Para el caso estudiado en este artıculo, se encontro que la posicion de las barras depende del

estado actual de la altura de ola y el perıodo pico, y del estado anterior de la misma posicion

de las barras. Varios modelos con diferentes propiedades fueron comparados con la finalidad

de escoger uno que represente apropiadamente la dinamica de las barras. Entre los modelos

Page 67: Metodología para el modelado y predicción del ...

53

propuestos, hıbridos con componente lineal y no lineal fueron entrenados, aunque el modelo

con mejores resultados fue el NL-NL.

Dos tecnicas basadas en datos se utilizaron para estudiar el efecto de las condiciones del

oleaje en la posicion de la barra, y las dependencias no lineales en los estados pasados. Pri-

mero, se empleo un modelo ARNN para determinar los coeficientes de correlacion no lineales

semejantes a las funciones lineales de autocorrelacion/correlacion cruzada simple/parcial,

que permiten detectar las dependencias del estado presente de la posicion de las barras con

el estado presente o pasado (rezagos) de las condiciones de oleaje o la misma posicion. Los

resultados revelaron dependencias no lineales entre el estado presente de las barras y las

condiciones de oleaje, y el estado previo de la posicion de la barra, lo cual sugiere que las

barras tienen memoria.

Un metodo grafico que consiste en filtrar las series de tiempo de las barras y el oleaje con

EMD, con el fin de remover las variaciones de pequena escala, permitio visualizar el efecto

de las condiciones del oleaje en la posicion de las barras. Se mostro que las variaciones en la

energıa del oleaje causa un efecto elastico en la posicion de las barras, tal que para olas de

alta energıa, las barras tienden a ir en direccion al mar, y para olas de baja energıa las olas

hacen que las barras se dirijan hacia la costa pero a una tasa menor.

El comportamiento de las barras con la influencia de las olas muestra oscilaciones alrededor

de regiones en el plano, los cuales se pueden pensar como atractores o estados de equilibrio.

El efecto elastico del comportamiento de las barras puede ser explicado por la memoria

presente en el sistema, la cual causa que el movimiento de las barras tenga un retardo.

Page 68: Metodología para el modelado y predicción del ...

Bibliografıa

Bhattacharya, B., Price, R. K., and Solomatine, D. P. (2007). Machine Learning Approach

to Modeling Sediment Transport. Journal of Hydraulic Engineering, 133(4):440–450.

Birkinshaw, S. J., Parkin, G., and Rao, Z. (2008). A hybrid neural networks and numerical

models approach for predicting groundwater abstraction impacts. Journal of Hydroin-

formatics, 10(2):127–137.

Booij, N., Ris, R. C., and Holthuijsen, L. H. (1999). A third-generation wave model for

coastal regions 1 . Model description and validation. Journal of Geophysical Research,

104(C4):7649 –7666.

Box, G. E. P., Jenkins, G. M., and Reinsel, G. C. (1994). Time Series Analysis: Forecasting

and Control. Prentice-Hall, Upper Saddle River, New Jersey, third edit edition.

Brø ker, I. and Roelvink, J. (1993). Cross-shore profile models.

Broyden, G. C. (1970). The convergence of a class of double rank minimization algorithms:

2. The new algorithm. Journal of the Institute of Mathematics and Its Applications,

6:76–231.

Cherkassky, V., Krasnopolsky, V. M., Solomatine, D. P., and Valdes, J. (2006). Computatio-

nal intelligence in earth sciences and environmental applications: issues and challenges.

Neural Networks, 19(2):113–21.

De Vriend, H. J. (1991a). Mathematical modelling and large-scale coastal behaviour. Part

1: Physical processes. Journal Of Hydraulic Research, 29(6):727–740.

De Vriend, H. J. (1991b). Mathematical modelling and large-scale coastal behaviour. Part

2: Predictive models. Journal Of Hydraulic Research, 29(6):741–753.

Dean, R. (1973). Heuristic Models of Sand Transport in the Surf Zone. In First Australian

Conference on Coastal Engineering, 1973: Engineering Dynamics of the Coastal Zone,

pages 215–221, Sidney. Institution of Engineers.

Page 69: Metodología para el modelado y predicción del ...

BIBLIOGRAFıA 55

Fairley, I., Davidson, M. A., Kingston, K. S., Dolphin, T., and Phillips, R. (2009). Empi-

rical orthogonal function analysis of shoreline changes behind two different designs of

detached breakwaters. Coastal Engineering, 56(11-12):1097–1108.

Fletcher, R. (1970). A new approach to variable metric algorithms. The Computer Journal,

13(3):317–322.

Goldfarb, D. (1970). A Family of Variable-Metric Methods Derived by Variational Means.

Mathematics of Computation, 24(109):23–26.

Hamm, L., Capobianco, M., Dette, H. H., Lechuga, A., Spanhoff, R., and Stive, M. J. F.

(2002). A summary of European experience with shore nourishment. Coastal Enginee-

ring, 47(2):237 – 264.

Hashemi, M. R., Ghadampour, Z., and Neill, S. P. (2010). Using an artificial neural network

to model seasonal changes in beach profiles. Ocean Engineering, 37(14-15):1345–1356.

Hoefel, F. and Elgar, S. (2003). Wave-Induced Sediment Transport and Sandbar Migration.

Science, 299(5614):1885–1887.

Holman, R. A. and Stanley, J. (2007). The history and technical capabilities of Argus.

Coastal Engineering, 54(6-7):477–491.

Hornik, K., Stinchcombe, M., and White, H. (1989). Multilayer Feedforward Networks are

Universal Approximators. Neural Networks, 2(5):359–366.

Horrillo-Caraballo, J. M. and Reeve, D. E. (2010). An investigation of the performance of a

data-driven model on sand and shingle beaches. Marine Geology, 274(1-4):120–134.

Huang, G.-B., Zhu, Q.-Y., and Siew, C.-K. (2006). Extreme learning machine: Theory and

applications. Neurocomputing, 70(1-3):489–501.

Huang, N. E., Shen, Z., Long, S. R., Wu, M. C., Shih, H. H., Zheng, Q., Yen, N. C., Tung,

C. C., and Liu, H. H. (1998). The empirical mode decomposition and the Hilbert

spectrum for nonlinear and non-stationary time series analysis. In Proceedings of the

Royal Society of London. Series A: Mathematical, Physical and Engineering Sciences,

volume 454, pages 903–995.

Kingston, K. S., Ruessink, B. G., Van Enckevort, I. M. J., and Davidson, M. A. (2000). Ar-

tificial neural network correction of remotely sensed sandbar location. Marine Geology,

169(1-2):137–160.

Page 70: Metodología para el modelado y predicción del ...

56 BIBLIOGRAFıA

Krasnopolsky, V. M. (2007). Neural Network Emulations for Complex Multidimensional

Geophysical Mappings: Applications of Neural Network Techniques to Atmospheric and

Oceanic Satellite Retrievals and Numerical Modeling. Reviews of Geophysics, 45(3):34.

Krasnopolsky, V. M., Chalikov, D. V., and Tolman, H. L. (2002). A neural network technique

to improve computational efficiency of numerical oceanic models. Ocean Modelling, 4(3-

4):363–383.

Kroon, A., Larson, M., Moller, I., Yokoki, H., Rozynski, G., Cox, J., and Larroude, P.

(2008). Statistical analysis of coastal morphological data sets over seasonal to decadal

time scales. Coastal Engineering, 55(7-8):581–600.

Larson, M., Capobianco, M., Jansen, H., Rozynski, G., Southgate, H. N., Stive, M. J. F.,

Wijnberg, K. M., and Hulscher, S. J. M. H. (2003). Analysis and Modeling of Field

Data on Coastal Morphological Evolution over Yearly and Decadal Time Scales. Part

1: Background and Linear Techniques. Journal of Coastal Research, 19(4):760–775.

LaValle, P. D., Lakhan, V. C., and Trenhaile, A. S. (2001). Space-time series modelling of

beach and shoreline data. Environmental Modelling & Software, 16(4):299–307.

Lin, B., Parade, T., and Namin, M. M. (2005). Modelling suspended sediment transport using

an integrated numerical and ANNs model. Journal Of Hydraulic Research, 43(3):302–

310.

Lippmann, T. C. and Holman, R. A. (1989). Quantification of Sandbar Morphology: A Video

Technique Based on Wave Dissipation. Journal of Geophysical Research, 94(C1):995–

1011.

Martınez, C. A. and Velasquez, J. D. (2011). Analisis de dependencias no lineales utilizando

redes neuronales artificiales. Revista Facultad de Ingenierıa Universidad de Antioquia,

60:182–193.

Menezes Jr, J. M. P. and Barreto, G. A. (2008). Multistep-Ahead Prediction of Rainfall

Precipitation Using the NARX Network. In ESTSP 2008.

Moghtaderi, A., Borgnat, P., and Flandrin, P. (2012). Gap-Filling by the Empirical Mode

Decomposition. In IEEE International Conference on Acoustics, Speech and Signal

Processing, Kyoto, Japan.

Nielsen, H. A. and Madsen, H. (2001). A generalization of some classical time series tools.

Computational Statistics & Data Analysis, 37(1):13–31.

Page 71: Metodología para el modelado y predicción del ...

BIBLIOGRAFıA 57

Ortega, S., Osorio, A. F., and Agudelo, P. (2013). Estimation of the wave power resource

in the Caribbean Sea in areas with scarce instrumentation. Case study: Isla Fuerte,

Colombia. Renewable Energy, 57(January 2009):240–248.

Osorio, A. F., Perez, J. C., Ortiz, C. A., and Medina, R. (2007). Tecnicas basadas en

imagenes de video para cuantificar variables ambientales en zonas costeras. Avances en

Recursos Hidraulicos, 16:51–64.

Pape, L. (2008). BLIM Toolbox Manual. Technical Report November, Institute for Marine

and Atmospheric Research Utrecht, Utrecht, The Netherlands.

Pape, L. (2010). Predictability of nearshore sandbar behavior. PhD thesis, Utrecht University.

Pape, L., Kuriyama, Y., and Ruessink, B. G. (2010a). Models and scales for cross-shore

sandbar migration. Journal of Geophysical Research, 115(F03043):13.

Pape, L., Plant, N. G., and Ruessink, B. G. (2010b). On cross-shore migration and equili-

brium states of nearshore sandbars. Journal of Geophysical Research, 115(F03008):16.

Pape, L. and Ruessink, B. (2011). Neural-network predictability experiments for nearshore

sandbar migration. Continental Shelf Research, 31(9):1033–1042.

Pape, L. and Ruessink, B. G. (2008). Multivariate analysis of nonlinearity in sandbar beha-

vior. Nonlinear Processes in Geophysics, 15(1):145–158.

Pape, L., Ruessink, B. G., Wiering, M. A., and Turner, I. L. (2007). Recurrent neural

network modeling of nearshore sandbar behavior. Neural networks, 20(4):509–518.

Plant, N. G., Freilich, M. H., and Holman, R. A. (2001). Role of morphologic feedback in

surf zone sandbar response. Journal of Geophysical Research, 106(C1):973–989.

Reeve, D. E., Horrillo-Caraballo, J. M., and Magar, V. (2008). Statistical analysis and

forecasts of long-term sandbank evolution at Great Yarmouth, UK. Estuarine, Coastal

and Shelf Science, 79(3):387–399.

Rozynski, G. (2003). Data-driven modeling of multiple longshore bars and their interactions.

Coastal engineering, 48(3):151–170.

Ruiz de Alegrıa-Arzaburu, A., Pedrozo-Acuna, A., Horrillo-Caraballo, J. M., Masselink, G.,

and Reeve, D. E. (2010). Determination of wave-shoreline dynamics on a macrotidal

gravel beach using Canonical Correlation Analysis. Coastal Engineering, 57(3):290–303.

Page 72: Metodología para el modelado y predicción del ...

58 BIBLIOGRAFıA

Shanno, D. F. (1970). Conditioning of Quasi-Newton Methods for Function Minimization.

Mathematics of Computation, 24(111):647–656.

Siek, M. and Solomatine, D. P. (2009). Chaotic Model with Data Assimilation Using NARX

Network. In 2009 International Joint Conference on Neural Networks, pages 2928–2935,

Atlanta, Georgia. IEEE.

Singh, A. K., Deo, M. C., and Sanil Kumar, V. (2007). Neural network-genetic programming

for sediment transport. Maritime Engineering, 160(MA3):113–119.

Smit, M. W. J., Aarninkhof, S. G. J., Wijnberg, K. M., Gonzalez, M., Kingston, K. S.,

Southgate, H. N., Ruessink, B. G., Holman, R. A., Siegle, E., Davidson, M. A., and

Medina, R. (2007). The role of video imagery in predicting daily to monthly coastal

evolution. Coastal Engineering, 54(6-7):539–553.

Southgate, H. N. (2008). Data-based forecasting of beach volumes on monthly to yearly

timescales. Coastal Engineering, 55(12):1005–1015.

Southgate, H. N., Wijnberg, K. M., Larson, M., Capobianco, M., and Jansen, H. (2003).

Analysis of Field Data of Coastal Morphological Evolution over Yearly and Decadal

Timescales. Part 2: Non-Linear Techniques. Journal of Coastal Research, 19(4):776–

789.

Turki, I., Medina, R., and Gonzalez, M. (2012). BEACH MEMORY. Coastal Engineering

Proceedings, 1(33):1–7.

Turki, I., Medina, R., Gonzalez, M., and Coco, G. (2013). Natural variability of shoreline

position: Observations at three pocket beaches. Marine Geology, 338:76–89.

Van Den Boogaard, H., Ten Brummelhuis, P. G. J., and Mynett, A. E. (2000). On-Line Data

Assimilation in Auto-Regressive Neural Networks. In Hydroinformatics 2000 conference,

IOWA City. The University of Engineering.

Van Enckevort, I. M. J. and Ruessink, B. G. (2001). Effect of hydrodynamics and bathymetry

on video estimates of nearshore sandbar position. Journal of Geophysical Research,

106(C8):16969–16979.

Van Maanen, B., Coco, G., Bryan, K. R., and Ruessink, B. G. (2010). The use of artifi-

cial neural networks to analyze and predict alongshore sediment transport. Nonlinear

Processes in Geophysics, 17(5):395–404.

Page 73: Metodología para el modelado y predicción del ...

BIBLIOGRAFıA 59

Yan, B., Zhang, Q.-H., and Wai, O. W. H. (2008). Prediction of sand ripple geometry under

waves using an artificial neural network. Computers & Geosciences, 34(12):1655–1664.

Zhang, G. (2003). Time series forecasting using a hybrid ARIMA and neural network model.

Neurocomputing, 50:159–175.