72051756 Doble Gumbel Ponencia
Transcript of 72051756 Doble Gumbel Ponencia
CAPITULO DE INGENIERÍA CIVIL – COLEGIO DE INGENIEROS CIVILES DE PERÚ
CONSEJO DEPARTAMENTAL CAJAMARCA
XVIII CONGRESO NACIONAL DE INGENIERÍA CIVIL
CONIC 2011
ESTIMACIÓN DE CAUDALES DE DISEÑO CON LA
DISTRIBUCIÓN DE DOBLE GUMBEL
M.Sc. Ing. Clara Marina Farías Zegada de Reyes, Ing. Claudia Palacios Santa Cruz
Instituto de Hidráulica, Hidrología e Ingeniería Sanitaria de la Universidad de Piura,
Av. Ramón Mugica 131, Urb. San Eduardo, Piura, Perú, [email protected],
[email protected], 73-284520
CAJAMARCA - PERÚ
RESUMEN:
Para determinar los caudales de diseño la modelación probabilística juega un papel
importante, la elección de la distribución más adecuada es difícil ante diversas opciones
disponibles. Durante años se han usado distribuciones probabilísticas de una sola
población: Log-Normal, Gamma, Gumbel, Pearson, etc. Sin embargo, en México, donde se
tiene presencia de crecidas debidas a dos mecanismos generadores: crecidas normales y las
debidas a huracanes, éstas se modelan bajo la distribución Doble Gumbel, ajustando a cada
grupo un modelo Gumbel individual. En Piura, ubicada en el noroeste peruano, las lluvias
se presentan generalmente en el verano y son de poca intensidad, trayendo consigo un
aumento no muy significativo del caudal del río Piura. Sin embargo, existen también años
en que son originadas por el mundialmente conocido Fenómeno El Niño (FEN), las cuales
significan un aumento excepcional en los caudales del río. Ya que la ocurrencia de lluvia y
caudales en la región están regidos por dos mecanismos diferentes, como es el caso
mexicano, se han estimado los caudales de diseño con mayor precisión utilizando la
distribución Doble Gumbel y se ha comprobado que dicho modelo ajusta mejor a esta serie
que los clásicos de una sola población.
PALABRAS CLAVES: Caudal, probabilidades, Doble Gumbel
INDICE DE MATERIAS
INTRODUCIÓN: ............................................................................................................................... 4
1 MARCO TEÓRICO: .................................................................................................................. 4
1.1 Distribución de Gumbel ..................................................................................................... 4
1.2 Distribución Doble Gumbel ............................................................................................... 6
1.2.1 Función de distribución Doble Gumbel ..................................................................... 6
1.2.2 Ajuste de parámetros .................................................................................................. 6
1.2.3 Bondad de ajuste ........................................................................................................ 7
1.2.4 Estimaciones con la distribución Doble Gumbel ....................................................... 7
2 ANÁLISIS DE LOS CAUDALES DEL RIO PIURA ............................................................... 8
3 RESULTADOS Y CONCLUSIONES ....................................................................................... 9
BIBLIOGRAFÍA .............................................................................................................................. 10
INTRODUCIÓN:
La Hidrología aplicada a la Ingeniería Civil busca resolver principalmente dos
interrogantes: de cuánta agua dispongo y de cuánta agua debo proteger a mi
infraestructura. Para ello dispone de muestras de caudales y precipitaciones puntuales o
regionales que analiza para llegar a las mejores estimaciones de valores de diseño. En este
contexto, la modelación probabilística juega un papel importante, siendo que la elección de
la distribución de probabilidad más adecuada es difícil ante las diversas opciones que se
presentan.Durante muchos años las distribuciones probabilísticas que modelan una sola
población han sido las más utilizadas, tales como Log-Normal, Gamma, Gumbel, Pearson,
etc. Sin embargo, en regiones de México, donde se tiene presencia de crecidas debidas a
dos tipos de mecanismos generadores, las crecidas normales y las debidas a huracanes,
éstas se modelan bajo la distribución de Doble Gumbel y a cada grupo se le ajusta un
modelo Gumbel propio.
En la ciudad de Piura, ubicada en el noroeste peruano, las lluvias se presentan
generalmente en el verano. Durante este periodo de tiempo hay lluvias de poca intensidad,
las cuales traen consigo un aumento del caudal del río Piura, pero no muy significativo. Sin
embargo, existen también años en que las lluvias son originadas por el Fenómeno El Niño
(FEN), las cuales sí significan un aumento excepcional en los caudales del río del mismo
nombre (Reyes, 2003).
El FEN es un evento climático cíclico y de carácter mundial, que se manifiesta en la
región Piura con fuertes precipitaciones debido a su situación geo-climática caracterizada
por la presencia de la cordillera de los Andes relativamente baja en esta zona, que permite
la presencia de nubes calientes amazónicas, mar caliente durante la primavera y el verano,
mar frío durante el invierno-otoño. A este escenario se le asocia con lluvias de gran
intensidad y destrucción de bienes e infraestructura.
Ya que la ocurrencia de lluvia y caudales en la región Piura están regidos por dos
mecanismos diferentes, como es el caso mexicano, se plantea estimar el caudal de diseño
con mayor precisión utilizando la distribución Doble Gumbel.
1 MARCO TEÓRICO:
1.1 Distribución de Gumbel
La distribución de valores extremos tipo I o de Gumbel busca representar la
distribución de una variable aleatoria definida como la mayor de una serie de n variables
aleatorias independientes e idénticamente distribuidas con una distribución de tipo
exponencial a medida que n crece indefinidamente.
La función de distribución acumulada o probabilidad de no excedencia de Gumbel
viene dada mediante la expresión siguiente:
x
eexF )( ............................................................................................................... (1)
Donde:
x : Evento hidrológico a considerar, viene de los datos muestrales
: Parámetro de posición de la función
: Parámetro de escala de la función
Estos parámetros se pueden estimar conociendo que la media y la desviación
estándar de la función son respectivamente: . ...................................................................................................................... (2)
6
......................................................................................................................... (3)
Siendo la constante de Euler-Mascheroni ( ≈ 0.577216).
De modo que si se tuviera una muestra de tamaño infinito se podrían estimar los
parámetros de la función, α y β, a través de los estadígrafos de la muestra, con las
siguientes expresiones:
6xs ......................................................................................................................... (4)
. x ....................................................................................................................... (5)
Donde x y son la media y la desviación estándar muestrales, respectivamente.
Sin embargo, en la práctica se trabaja con muestras de tamaño finito, por tanto el
valor de los parámetros debe modificarse. Gumbel obtuvo valores modificados
minimizando la suma de cuadrados de los errores perpendiculares a la recta de ajuste de
valores extremos. Las ecuaciones que obtuvo están en función del tamaño de la muestra y
de los parámetros y son las siguientes (Varas y Bois, 1998):
n
x
s
s .............................................................................................................................. (6)
.nyx ...................................................................................................................... (7)
Donde:
: Valor esperado de la variable reducida ym
: Desviación estándar de la variable reducida ym
Estos estadígrafos pueden obtenerse de la variable reducida ordenando la muestra de
manera decreciente y calculando para cada xi la correspondiente variable reducida ym con
la siguiente expresión de Weibull:
1
1lnln
n
mnym ............................................................................................... (8)
Donde:
: Tamaño de la muestra
: Número de orden
Suele ser útil trabajar con tablas que entreguen el valor de yn y sn directamente en
función del tamaño de la muestra n, ya que éstos no dependen de los valores xi de la
muestra (Tabla 1 y Tabla 2).
Tabla 1 - Valor esperado, yn, de la variable reducida, ym
n 0 1 2 3 4 5 6 7 8 9
10 0,4952 0,4996 0,5035 0,5070 0,5100 0,5128 0,5157 0,5181 0,5202 0,5220
20 0,5230 0,5252 0,5268 0,5283 0,5296 0,5309 0,5320 0,5332 0,5343 0,5353
30 0,5362 0,5371 0,5380 0,5388 0,5396 0,5402 0,5410 0,5418 0,5424 0,5430
40 0,5436 0,5442 0,5448 0,5453 0,5458 0,5463 0,5468 0,5473 0,5477 0,5481
50 0,5485 0,5489 0,5493 0,5497 0,5501 0,5504 0,5508 0,5511 0,5515 0,5518
60 0,5521 0,5524 0,5527 0,5530 0,5533 0,5535 0,5538 0,5540 0,5543 0,5545
70 0,5548 0,5550 0,5552 0,5555 0,5557 0,5559 0,5561 0,5563 0,5565 0,5567
80 0,5569 0,5570 0,5572 0,5574 0,5576 0,5578 0,5580 0,5581 0,5583 0,5585
90 0,5586 0,5587 0,5589 0,5591 0,5592 0,5593 0,5595 0,5596 0,5598 0,5599
100 0,5600
Tabla 2- Desviación estándar, sn, de la variable reducida, ym
n 0 1 2 3 4 5 6 7 8 9
10 0,9496 0,9676 0,9833 0,9971 1,0095 1,0206 1,0316 1,0411 1,0493 1,0565
20 1,0628 1,0696 1,0754 1,0811 1,0864 1,0915 1,0961 1,1004 1,1047 1,1086
30 1,1124 1,1159 1,1193 1,2260 1,1255 1,1285 1,1313 1,1339 1,1363 1,3880
40 1,1413 1,1430 1,1458 1,1480 1,1499 1,1519 1,1538 1,1557 1,1574 1,1590
50 1,1607 1,1623 1,1638 1,1658 1,1667 1,1681 1,1696 1,1708 1,1721 1,1734
60 1,1747 1,1759 1,1770 1,1782 1,1793 1,1803 1,1814 1,1824 1,1834 1,1844
70 1,1854 1,1863 1,1873 1,1881 1,1890 1,1898 1,1906 1,1915 1,1923 1,1930
80 1,1938 1,1945 1,1953 1,1959 1,1967 1,1973 1,1980 1,1987 1,1994 1,2001
90 1,2007 1,2013 1,2020 1,2026 1,2032 1,2038 1,2044 1,2049 1,2055 1,2060
100 1,2065
1.2 Distribución Doble Gumbel
Mientras que la función de distribución de Gumbel está pensada para una población,
la distribución de Doble Gumbel permite modelar el comportamiento de dos poblaciones
consideradas mutuamente excluyentes.
Una función de distribución de probabilidad para dos poblaciones se puede plantear
como sigue (Raynal y Raynal, 2004):
( ) ( ) ( ) ( ) ............................................................................ (9)
Donde:
: Probabilidad de que la variable x pertenezca a la segunda población, que
agrupa a elementos sucedidos en condiciones climatológicas ordinarias.
1.2.1 Función de distribución Doble Gumbel
Con base en la ecuación (9), la probabilidad de excedencia de Gumbel de dos
poblaciones se expresa mediante la ecuación siguiente:
( ) ( ) ( )
( )
.................................................................... (10)
Esta función de distribución cuenta con cinco parámetros, dos de cada población:
,,,, 2211 mientras el quinto es la proporción de mezcla, p.
1.2.2 Ajuste de parámetros
El ajuste más adecuado se realiza mediante un proceso de iteración hasta llegar a un
juego de parámetros apropiados a la muestra disponible.
Se inicia con el análisis de la muestra de máximos anuales disponible para identificar
aquellos años que se alejan de la “normalidad”, es decir que son muy diferentes al resto,
que exceden cierto umbral y que por información histórica se conoce además que tuvieron
presencia del fenómeno diferente, tal como FEN, huracán, etc.
Con esa clasificación, la muestra de nt años quedará dividida en dos grupos, el
primero de n1 años extraordinarios y el segundo de n2 años ordinarios o normales,
definiendo preliminarmente el parámetro p como:
21
2
nn
np
..................................................................................................................... (11)
A continuación se trabaja por separado con los dos grupos definidos, ajustando los
parámetros Gumbel de una sola población con las ecuaciones (6), (7) y (8) y las Tablas 1 y
2. Esto permitirá contar con los cuatros parámetros restantes.
1.2.3 Bondad de ajuste
El ajuste realizado según el acápite anterior deberá ser evaluado mediante una prueba
de bondad de ajuste. Estas pruebas evalúan el grado de concordancia entre la distribución
de un conjunto de valores de la muestra y alguna distribución teórica específica. Determina
si razonablemente puede pensarse que las mediciones muestrales analizadas provienen de
una población que tiene dicha distribución teórica, mediante la comparación de las
distribuciones de frecuencia acumulativa, teórica y observada.
De uso frecuente son la prueba 2, la de Kolmogorov-Smirnov y la del error
cuadrático estándar. La primera trabaja con valores agrupados, por lo que no es muy
práctica; la segunda no requiere agrupar valores, se concentra en determinar el punto en el
que estas dos distribuciones muestran la mayor divergencia, pero no evalúa las diferencias
en su conjunto; mientras que la tercera es una mezcla de ambas pruebas, trabajando con los
datos independientes y sumando las divergencias parciales entre las probabilidades de
excedencia o distribuciones de frecuencias, teórica, Pteo, y empírica, Pemp. Para esta prueba
de error cuadrático estándar se aplica la siguiente fórmula:
∑ √(
)
(12)
Donde:
: Número de parámetros de la distribución teórica, que en el caso de Doble
Gumbel es 5.
A continuación se deberá repetir el análisis anterior para diferentes valores del
parámetro p, mayores y menores que el preliminar, con la finalidad de determinar aquél
que arroja el mínimo error, E, y el conjunto definitivo de parámetros.
1.2.4 Estimaciones con la distribución Doble Gumbel
Contando con la función de Doble Gumbel ajustada a la serie, se pueden hacer
estimaciones de caudales máximos para diferentes períodos de retorno utilizando la
expresión (10) y sabiendo que la probabilidad de no excedencia, F(x), y el período de
retorno, Tr, están relacionados por la siguiente expresión:
( )
(13)
2 ANÁLISIS DE LOS CAUDALES DEL RIO PIURA
Se cuenta con los registros de los caudales máximos anuales del río Piura desde el
año 1925 al 2008, conformando una muestra de 84 datos. Dentro de este periodo se han
presentado lluvias debidas a los dos mecanismos descritos anteriormente: lluvias normales
y lluvias por FEN, las cuales originan un crecimiento diferente del caudal en el río Piura.
Por ello se han considerado dos poblaciones, la primera para los caudales durante el FEN y
la segunda para los caudales durante las lluvias regulares, cada una con un número
diferente de datos.
El cálculo se inició con un p preliminar de 0,70, probando además con valores desde
0,88 hasta 0,50, obteniéndose el mejor valor del error E para p = 0,55 (Tabla 3); esto
significa que, dada la muestra de 84 años utilizada, lo más probable es que ésta provenga
de un universo con el 45% de los años dominados por eventos lluviosos asociados al FEN,
mientras que el 55% de los años corresponde a años normales con características secas.
Tabla 3 – Errores estándar E obtenidos para diferentes valores de p en los caudales del río Piura
p 0,88 0,80 0,74 0,70 0,60 0,55 0,52 0,50
E 0,423 0,225 0,172 0,158 0,131 0,113 0,124 0,145
Este ajuste corresponde a los siguientes parámetros: α1=988,8, β1=821,0; α2=63,7,
β2=92,7; y p=0,55. Luego de ajustar la distribución, ésta se aplicó de forma inversa para
estimar los caudales de diseño para diferentes periodos de retorno, según se describió en
1.2.4.
Asimismo se ajustaron modelos de uso frecuente en Hidrología para una sola
población, tales como Gamma, Exponencial, Gumbel, Log Normal 3, Pearson III, Log
Pearson III, y se realizaron las pruebas de bondad de ajuste, obteniéndose con ellos errores
mayores que con la distribución de Doble Gumbel (Tabla 4).
Tabla 4 – Estimaciones de crecidas con diferentes modelos usados en Hidrología
Tr Doble Gumbel LP III Gamma LN3 Exponencial Pearson III Gumbel
2 230 353 378 290 432 474 566
5 1.431 1.188 1.173 1.011 1.267 1.306 1.429
10 2.128 1.830 1.844 1.911 1.899 1.903 2.001
20 2.750 2.394 2.546 3.221 2.531 2.492 2.549
25 2.943 2.555 2.777 3.748 2.734 2.681 2.723
50 3.531 2.986 3.503 5.783 3.366 3.268 3.259
100 4.109 3.321 4.242 8.536 3.998 3.857 3.791
1.000 6.008 3.905 6.751 25.376 6.096 5.836 5.548
10.000 7.899 4.044 9.310 62.158 8.195 7.867 7.302
Error 0,222 0,288 0,356 0,379 0,513 0,608 0,749
3 RESULTADOS Y CONCLUSIONES
3.1.Análisis de Resutados
Al aplicar a los datos las distribuciones clásicas de una sola población de mayor
difusión para estimar los caudales de diseño, se obtuvo un error cuadrático estándar de
0,222 para Doble Gumbel y 0,288 para Log-Pearson III, como el mejor ajuste de las
distribuciones de una sola población.
Como se puede apreciar, si se utiliza el mejor ajuste a una sola población, el modelo
de Log Pearson III daría estimaciones muy bajas afectando la seguridad de las obras. Si por
el contrario se hubiera tomado directamente la clásica distribución Log-Normal 3, como
aquella que casi siempre se logra ajustar las muestras hidrológicas, se tendrían valores de
caudales mucho mayores que los hallados con la distribución Doble Gumbel y que los
observados.
Esto lleva a que al momento que se diseñen las estructuras se sobredimensionen, ya
que en realidad estos caudales están muy por encima de lo que se espera. Este
sobredimensionamiento genera una mayor inversión y en algunos casos impide la
ejecución de proyectos por falta de presupuesto suficiente. Para tiempos de retorno
mayores, como 10.000 años, se aprecia que la distribución Doble Gumbel también dará
mejores resultados (Fig.1 y 2), por el lado de mayor seguridad para el diseño de obras de
envergadura como aliviaderos de presas.
Figura 1 – Caudales estimados hasta 10.000 años con LN3, LPIII y Doble Gumbel
Figura 2 – Detalle de caudales estimados hasta 100 años con LN3, LPIII y Doble Gumbel
-
10,000
20,000
30,000
40,000
50,000
60,000
70,000
1 10 100 1,000 10,000
Caud
al (m
3/s)
Tr (años)
LN3
DbGumb
LP III
Empírica
-
1,000
2,000
3,000
4,000
5,000
6,000
7,000
8,000
9,000
10,000
1 10 100
Caud
al (m
3/s)
Tr (años)
LN3
DbGumb
LP III
Empírica
3.2.Conclusiones
Tradicionalmente la Hidrología Probabilística ha manejado la estimación de caudales
de diseño bajo el enfoque de una sola población, con modelos de mucha difusión y
aceptación, tales como Log Pearson III, Log Normal 2 y 3, etc.
Existen regiones geográficas que por su naturaleza ven configurada su Hidrología
por dos mecanismos de formación, tal es el caso de regiones donde se presentan huracanes
y aquellas afectadas por el Fenómeno El Niño. El modelo Doble Gumbel permite manejar
las muestras hidrometeorológicas dividiéndolas en dos grupos y modelar adecuadamente
los caudales, evitando sobre estimar o subestimar los valores de diseño, lo que incide en la
realización y en la economía de las obras proyectadas.
Los caudales máximos anuales del río Piura, en la costa norte del Perú, se han
logrado modelar probabilísticamente mediante Doble Gumbel, que se ajusta más que los
modelos de una sola población.
El modelo ajustado indica una presencia de años atípicos del 55% debida al FEN en
la cuenca del río Piura.
BIBLIOGRAFÍA
Raynal, J.A.; Raynal, M.E. (2004). “Cálculo de los límites de confianza de la
Distribución de Probabilidad de valores extremos tipo I para dos poblaciones”
Información tecnológica La Serena V.15 n°.1, pp. 87 – 94. Disponible en
<http://www.scielo.cl/scielo.php?script= sci_arttext&pid=S0718-
07642004000100014&lng=es&nrm=iso>. accedido en 17 jun. 2011. doi: 10.4067/S0718-
07642004000100014.
Reyes, J. (2003). “Perú”, en Inundaçoes urbanas na América do Sul. Org. por Tucci, E.
M.; Bertoni, J.C. Ed. Associaçao Brasileira de Recursos Hidricos, Porto Alegre, pp. 379 -
428.
Varas, E. ; Bois, P. (1998). Hidrología Probabilística. Ediciones Universidad Católica
de Chile, 156 p.