Estadistica Dist. gumbbel

22
Índice 1. Introducción……… .... ………………………………………………………………………………………3 2. Historia y antecedentes………………………………. ……………………………………………….4 3. Conceptos previos 3.1 Tiempo de Retorno ……………………….. ……………………………………………………..4 3.2 Riesgo………………………………………………………………………………………………………4 3.3 Datos de máximos…………………………………………………………………………………..5 4. Distribución Gumbel 4.1 Fórmulas y características………………………………………………………………………6 5. Distribución Log-Gumbel 5.2 Fórmulas y características………………………………………………………………………9 6. Aplicaciones y ejemplos …………………………. …………………………………………………………10 1

Transcript of Estadistica Dist. gumbbel

Page 1: Estadistica Dist. gumbbel

Índice

1. Introducción………....………………………………………………………………………………………3

2. Historia y antecedentes……………………………….……………………………………………….4

3. Conceptos previos

3.1 Tiempo de Retorno ………………………..……………………………………………………..4

3.2 Riesgo………………………………………………………………………………………………………4

3.3 Datos de máximos…………………………………………………………………………………..5

4. Distribución Gumbel

4.1 Fórmulas y características………………………………………………………………………6

5. Distribución Log-Gumbel

5.2 Fórmulas y características………………………………………………………………………9

6. Aplicaciones y ejemplos ………………………….…………………………………………………………10

1

Page 2: Estadistica Dist. gumbbel

INTRODUCCIÓN

El desbordamiento de un río lleva consigo una serie de riesgos que pueden afectar gravemente tanto a construcciones como a la población en general. Por ello, la sociedad demanda un instrumento para acotar ese riesgo y obtener una seguridad de que la zona a ocupar quede libre de ser susceptible de una intrusión de las aguas fluviales debido a una tormenta extraordinaria.

El caudal punta es el caudal máximo que se registra durante el aumento inusual del caudal de agua de un cauce natural o artificial, superando con creces los valores medios normales. La predicción de la magnitud de la creciente para el diseño de obras hidráulicas, ha sido siempre motivo de controversia debido a que los métodos que analizan caudales punta, deben realizar una proyección hacia el futuro, aplicando teoría de probabilidades, con un alto grado de incertidumbre. Las estaciones hidrométricas registran caudales mínimos, medios y máximos que fluyen por un punto determinado de una cuenca. Esta información hidrológica permite cuantificar la oferta hídrica de la cuenca y estimar los caudales máximos para distintos períodos de retorno, con el propósito de solucionar los problemas que implica el diseño de obras hidráulicas (Chow et al., 1994).

Si se conocen con un nivel de aproximación razonable las magnitudes de las crecientes que se van a presentar durante la vida útil de una obra, es claro que las estructuras se pueden diseñar con una gran confianza en cuanto a los aspectos técnicos y económicos. En efecto, la estabilidad de una obra durante la vida útil de diseño, depende en gran parte de su capacidad para soportar los efectos que se producen sobre la estructura cuando pasan las crecientes extraordinarias. Estos efectos se traducen en impactos, presiones, socavación, taponamientos y desbordamientos. Para lograr la seguridad que reduzca el riesgo de falla de dichas obras, se debe construir un modelo probabilístico y con ello contar con una función de distribución de probabilidad representativa de la variable hidrológica de interés, indicando claramente su probabilidad de excedencia (Muñoz, 2004).

El presente informe pretende entregar una metodología que permita predecir con cierta probabilidad los valores que puede tomar una variable hidrológica, en función de la información de que se disponga, planteándose lo anterior, en valores máximos probables, aplicando la ley de distribución de Gumbel.

Se plantea la utilización de la ley de distribución de Gumbel, dado que ella ha demostrado poseer una adecuada capacidad de ajuste, a valores máximos de caudales, precipitación en distintos períodos de tiempo, aportaciones anuales, etc.

2

Datos:

Precipitación

Caudal

Temperatura

RESULTADO HIDROLOGICO ESPERADO

Page 3: Estadistica Dist. gumbbel

OBJETIVOS:

Incrementar el conocimiento acerca del comportamiento de los caudales máximos instantáneos, por medio de funciones de distribución de probabilidad. (Gumbel)

Determinar las características de la distribución Gumbel y en que situaciones puede ser utilizada para obtener buenos resultados.

Destacar la importancia de la distribución Gumbel en la construcción de obras de ingeniería.

3

ANÁLISIS ESTADÍSTICO

Page 4: Estadistica Dist. gumbbel

1. Historia y antecedentes

Fue descubierta por Emil Julius Gumbel matemático judío nacido en Alemania a finales del siglo XIX. Es un caso particular de la distribución de valores extremos generalizada y también es conocida como la distribución log – Weibull, o como la distribución exponencial doble. Según Reiss y Thomas (1997), la distribución de Gumbel tiene la misma importancia que la distribución normal en otras aplicaciones.

2. Conceptos necesarios2.1 Probabilidades y periodos de retorno

Cuando la variable aleatoria considerada es una magnitud relacionada con algún fenómeno natural (caudales, velocidades de viento), es conveniente referirse a períodos de retorno en lugar de a probabilidades de ocurrencia. Si p es la probabilidad de que una variable x supere un dado valor X en un cierto lapso (por lo general un año), el período de retorno T representará el número de unidades de tiempo que transcurrirán en promedio entre dos oportunidades en que la variable supere dicho valor, es decir:

Por lo tanto, es equivalente especificar un período de retorno o recurrencia de 100 años o una probabilidad anual de 0,01.

El análisis estadístico consiste en hallar la función que mejor represente el comportamiento de la variable aleatoria x, para luego asignar a cada valor X una probabilidad o un período de recurrencia. Si Φ(x) es la función de distribución, resulta que:

2.2 Riesgo

No debe olvidarse que, cualquiera sea la función o procedimiento de ajuste utilizado, el resultado obtenido será una relación entre la variable aleatoria y el período de retorno y que esa variable aleatoria ya sea un caudal, una cota hidrométrica, un nivel de precipitación o una velocidad de viento será empleada para un cálculo de ingeniería.

Dicho cálculo se efectuará tomando como base un cierto período de recurrencia que asegure que la probabilidad de que la variable aleatoria supere un valor de referencia sea muy baja, tal como 1% anual (período milenario). Sin embargo, aunque se trabaje con elevados períodos, la probabilidad de que la variable aleatoria supere el valor de diseño no será

4

Page 5: Estadistica Dist. gumbbel

nula, aunque será pequeña. Esa probabilidad es denominada riesgo y su valor debe ser calculado antes de proseguir con los restantes cálculos ingenieriles.

Entonces la probabilidad de que en un año genérico cualquiera no se supere la cota X de proyecto relativa a un período de retorno T es:

Si N es la vida útil del emprendimiento u obra para la cual se ha efectuado el cálculo probabilístico, cada año de su vida puede ser considerado como un suceso independiente. Luego, puede aplicarse la regla de la multiplicación para determinar la probabilidad de que en ninguno de esos N años se supere la cota de diseño.

Finalmente, la probabilidad de al menos una vez sea superado el valor de diseño a lo largo de toda la vida útil del proyecto será una medida del riesgo que implica trabajar con el período de retorno utilizado para los cálculos.

2.3 Datos de máximosEl “valor máximo” que se quiere determinar para un determinado período de retorno se determina

por medio de la expresión:

x = xm + D x = xm + k· s n-1

x: valor máximo (caudal o precipitación) para un período de retorno T.

xm: media de la serie dada de valores máximos

D x: desviación respecto a la media, que se estima mediante el producto: k· s n-1

Donde:

k: factor de frecuencia, que indica el número de veces de desviación típica en que el valor extremo

considerado excede a la media de la serie.

s n-1 : desviación estándar, desviación típica de los valores extremos.

El valor de la variable “k” se estima a partir del conocimiento del período de retorno en años y del

número de años disponibles en la serie. Así: k = (yT – yn)/Sn

yT : variable de Gumbel para el período de retorno T. Se determina a partir del valor del período de

5

Page 6: Estadistica Dist. gumbbel

retorno. El valor se puede obtener de la tabla adjunta. yT = -ln ln (T/T-1)

yn: valor que se obtiene a partir del número de años de la serie, mediante tablas

Sn: valor que se obtiene a partir del número de años de la serie, mediante tablas

Tabla. Valores de " yT " para distintos períodos de retorno T

Determinación matemática de las curvas IDF

Para la elaboración de las ecuaciones matemáticas, que representen la relación entre la intensidad, la duración y la frecuencia de las precipitaciones, para cada una de las estaciones, se optó por la expresión validada por Aparicio (1997), definida de la siguiente manera:

Dónde:

I = intensidad de precipitación (mm/h);

T = período de retorno (años);

D = duración (horas);

k, m, n = parámetros a estimar a través de un análisis de regresión lineal múltiple.

Aparicio (1997), señala que esta expresión permite generar las curvas IDF a través de un modelo de regresión lineal, pudiéndose extrapolar la ecuación generada, a zonas que carecen de registros pluviográficos y que se encuentran relativamente cerca.

Para obtener una expresión con la forma de un modelo de regresión lineal múltiple, se aplicaron logaritmos a la ecuación anterior, quedando de la siguiente manera:

O de otra manera:

Dónde:

y = log I a0 = log k

X1 = log T a1 = m

X2 = log D a2 = -n

6

Page 7: Estadistica Dist. gumbbel

3. Distribución Gumbel

3.1 Fórmulas y características

Distribución acumulada de Gumbel:

Donde los parámetrosy se definen como:

y

siendola media y la desviación típica

Media

Desviación típica

Los valores y son la media y la desviación típica de una variable

que solo depende del tamaño de la muestra N y que se define como

7

Page 8: Estadistica Dist. gumbbel

Para un evento cualquiera

F(x) es la probabilidad de que se produzca dicho evento con un valor menor o igual que x, es decir F(x) representa la probabilidad de que un valor dado de x no sea superado.

El período o lapso de tiempo T(x) dentro del cual sería esperable que se produjese dicho evento de valor x, llamado tiempo de retorno para ese evento x, sería:

Fórmula analítica para calcular un evento esperable para un tiempo de retorno T(x) dado

Volviendo a la ecuación de Gumbel y

despejando teniendo en cuenta que

se obtiene

Gráficos:

8

Función de densidad de probabilidad

Función de distribución acumulativa

Page 10: Estadistica Dist. gumbbel

Donde:

(Constante de Euler-Mascheroni)

(Constante de Apéry ) = 1,20206 aprox.

Propiedades

La función de distribución acumulativa de la distribución Gumbel es

En la cual:

- La moda es μ,

- La mediana es

- La media está dada por

Donde = Constante de Euler-Mascheroni

- La desviación estándar es

Distribución Gumbel Estándar

La distribución estándar Gumbel es el caso en el que y con:

La función de distribución acumulativa

Y la función de densidad de probabilidad

En este caso:

- La moda es 0, la mediana es - La media es , y

- La desviación estándar es de

Función Gumbel de confiabilidad

10

Page 11: Estadistica Dist. gumbbel

La fiabilidad de una misión de tiempo para la distribución Gumbel viene dada por:

La función de la falta de fiabilidad está dada por:

Donde

Gumbel Vida Real

La vida fiable Gumbel está dada por:

tR= µ + β [ln(-ln(R))]

Función Gumbel de tasa de fracaso

La tasa de fracaso Gumbel instantánea está dada por:

λ= ez / β

La siguiente tabla se utiliza para los valores de Yn y Sn

Tabla N°01

Método de Gumbel Valores de Yn y Sn

11

Page 12: Estadistica Dist. gumbbel

4. Distribución Log-Gumbel

3.2 Fórmulas y características

Su expresión es similar a la distribución de Gumbel, pero la variable reducida está vinculada con la variable aleatoria original de forma logarítmica.

F ( y )=e−e− y¿

¿

y=α (lnx−u )

El campo de variación de x se extiende entre 0 y +∞.

Partiendo de esta expresión puede estudiarse la tendencia para grandes periodos de retorno.

θx−α = lnT /(T−1)

12

Page 13: Estadistica Dist. gumbbel

Características

Parámetros  

Dominio

Función de densidad(pdf)

Función de distribución(cdf)

Media

Mediana

Moda

5. Aplicaciones y ejemplos5.1 Aplicaciones y ejemplos Gumbel

La distribución de Gumbel para valores extremos o mínimos tiene diversas aplicaciones, estando vinculado especialmente a la hidrología. En proyectos de ingeniería la distribución de Gumbel es muy importante porque permite hacer estimaciones de:

Resistencia de estructuras como presas, puentes, y estructuras de resistencia en general frente a incrementos de caudal o precipitaciones máximos.

Prever inundaciones o desastres vinculados a crecidas de ríos. Evaluar e indicar los beneficios anuales de un proyecto.

Caso específico: Descargas anuales máximas de un río.

Para desarrollar este ejemplo de aplicación se tomarán los datos de caudales Máximos Anuales del Rio Ica en un periodo de información de 25 años (1992-1998)

13

Page 14: Estadistica Dist. gumbbel

Tabla N°02

Datos Máximos Caudales del Rió Ica 1978-1998

AñoCaudal Máximo Anual (m3/s)

1978 381979 791980 661981 1271982 1331983 3501984 1001985 1151986 1551987 481988 1011989 991990 1071991 1261992 161993 1041994 1671995 3701996 1411997 541998 817

Fuente: PETACC -WOL, 1998 en Guía metodológica para proyectos de protección y/o control de inundaciones en áreas agrícolas.

Datos Para realizar la estimación.

Media 163.75Desviación estándar 176.76355n 20N+1 21

¿Cuál será la probabilidad de que en el día de mayor precipitación del año, el caudal del río supere 350m^3/s?

1° De acuerdo a la TABLA N°0 para 20 datos se toman los valores de Y n =

0.5236 y Sn = 1.0628

2° Calculamos los valores de α y u

α = Sn / Sx = 1.0628/ 176.76355 = 0.006012552

u= x - Y n/¿ α = 76.666

14

Page 15: Estadistica Dist. gumbbel

3° Aplicamos la fórmula de la distribución de Gumbel

F ( x )=e−e−α( x−u )

= e−e−0.006012552 (350−76.666)

= 0.82422

Por lo tanto la probabilidad de que se supere ese caudal es de : 1- 0.82422 = 0.1757

Finalmente el periodo de retorno es el inverso: 1/ 0.1757= 5.6 años.

De manera similar se pueden calcular la probabilidad y el tiempo de retorno para cada dato y generar una tabla como la siguiente:

Tabla N°0

Análisis de caudales máximos y mínimos para el Rio Ica

N°Caudal Máximo Anual (m3/s)

Probabilidad acumulada de ocurrencia de

caudales menores

Probabilidad acumulada de ocurrencia de caudales mayores

Periodo de retorno(años)

1 817 0.988404764 0.011595236 86.2

2 370 0.84247696 0.15752304 6.3

3 350 0.82422496 0.17577504 5.7

4 167 0.559384455 0.440615545 2.3

5 155 0.535592675 0.464407325 2.2

6 141 0.507014847 0.492985153 2.0

7 133 0.49032626 0.50967374 2.0

8 127 0.477656142 0.522343858 1.9

9 126 0.4755325 0.5244675 1.9

10 115 0.451967774 0.548032226 1.8

11 107 0.434622696 0.565377304 1.8

12 104 0.428080572 0.571919428 1.7

13 101 0.421520541 0.578479459 1.7

14 100 0.419330192 0.580669808 1.7

15 99 0.417138118 0.582861882 1.7

16 79 0.373042965 0.626957035 1.6

17 66 0.3443047 0.6556953 1.5

15

Page 16: Estadistica Dist. gumbbel

18 54 0.317905485 0.682094515 1.5

19 48 0.304800256 0.695199744 1.4

20 16 0.236888759 0.763111241 1.3

Fuente: Elaboración propia

5.2 Aplicaciones Log Gumbel

Para el caso de la aplicación de la distribución de Log-Gumbel en lugar de trabajar con los valores iniciales de las variables se trabaja con el logaritmo neperiano de ellas, Ln(X).

Tabla N°

Datos Máximos Caudales del Rió Ica 1978-1998

Año

Caudal Máximo Anual (m3/s)

Ln (X)

19783.63758616

19794.36944785

19804.18965474

19814.84418709

19824.89034913

19835.85793315

19844.60517019

19854.74493213

19865.04342512

19873.87120101

19884.61512052

19894.59511985

19904.67282883

19914.83628191

1992 2.77258872

16

Page 17: Estadistica Dist. gumbbel

19934.6443909

19945.11799381

19955.91350301

19964.94875989

19973.98898405

19986.70563909

Fuente: Elaboración propia

Del mismo modo seguido en los procedimientos para la aplicación de Gumbel se genera la siguiente tabla:

Tabla N°

Análisis Log-Gumbel para los caudales Máximos

N°Caudal Máximo Anual (m3/s)

Probabilidad acumulada de

ocurrencia1 817 0.954688135

2 370 0.877289981

3 350 0.868658218

4 167 0.689867109

5 155 0.664074562

6 141 0.629128544

7 133 0.606361334

8 127 0.587739142

9 126 0.584495863

10 115 0.545918483

11 107 0.514141013

12 104 0.501318556

13 101 0.487965602

14 100 0.483392577

15 99 0.478757038

16 79 0.371584967

17 66 0.285660098

17

Page 18: Estadistica Dist. gumbbel

18 54 0.195976318

19 48 0.149311209

20 16 0.000328058

Fuente: Elaboración propia

Ejemplo 2 Log- Gumbel

En un río se tienen 30 años de registros de Q máximos instantáneos anuales con x= 15 m3/s, S = 5 m3/s (media y desviación estándar para los datos originales). xy=2.655, sy = 0.324 (media y desviación estándar de los datos transformados). Encontrar el caudal para un periodo de retorno de 100 años y los límites de confianza para un = 5%. 1

Para el ejemplo encontrar el Q de 100 años de periodo de retorno y los intervalos de confianza. x= 15 m3/s, s = 5 m3/s

QTr100 = x + KT s

KT=−√6π

{0 .577+ln [ ln 100− ln(99 ) ]}

KT = 3.14

QTr100 = 15 + 3.14*5

QTr100 = 30.7 m3/s

Intervalos de confianza

t(1-) = t(0.95) = 1.645 (Leído de la tabla de la normal)

= 3.93

Xt t(1-) Se

30.7 m3/s (1.64) (3.58)

18

Page 19: Estadistica Dist. gumbbel

[24.83 m3/s 36.58 m3/s] Intervalo de confianza para QTr100

Referencias

Maggio, J. (s.f.) ANALISIS ESTADISTICO DE VALORES EXTREMOS, Aplicaciones en hidrología

APARICIO, F. 1997. Fundamentos de Hidrología de Superficie. Balderas, México: Limusa. 303 p.

Velásquez, T. (2008). Guía metodológia para proyectos de protección y/o control de inundaciones en Áreas Urbanas y Argícolas. Anexos. P. 188

Webs:

https://prezi.com/j61_lmng1b0b/distribuciones-de-probabilidad/ Estimación de funciones de distribución de probabilidad, para caudales máximos.

Universidad de Talca. Facultad de ciencias forestales. Escuela de ingeniería forestal. Leyes de distribución de procesos hidrológicos. Sociedad estándares de ingeniería para

aguas y suelos LTDA.

19