Distribución normal 2015.docx

download Distribución normal 2015.docx

of 18

Transcript of Distribución normal 2015.docx

AJUSTES DE MODELOS PROBABILISTICOS DISTRIBUCION NORMAL DISTRIBUCION LOG NORMAL

UNIVERSIDAD NACIONAL DE CAJAMARCA14

I. INTRODUCCION

En la determinacin de valores extremos (caudales mximos o mnimos, niveles mximos o mnimos, etc.) necesarios para el anlisis y solucin de muchos problemas relacionados con la ingeniera hidrulica, resulta comn emplear las distribuciones probabilsticas ms usuales para el estudio de problemas hidrolgicos. As, a partir de un registro histrico de valores extremos, se infiere aquellos valores mximos o mnimos asociados a un cierto perodo de retorno de diseo.Es relativamente comn apreciar estudios en los cuales, a partir de una data histrica de valores extremos, se haya hecho uso de distribuciones tales como: Gumbel, Normal o Log Pearson tipo III, para estimar los valores extremos asociados a un periodo de retorno seleccionado. En menor medida se observar el empleo de distribuciones tales como: log normal de 2 parmetros, log normal de 3 parmetros o la distribucin gamma de 2 de 3 parmetros.En este sentido cabra preguntarse: qu ha llevado al especialista a seleccionar una determinada distribucin probabilstica para el anlisis efectuado? Se ha verificado que la distribucin escogida sea la que efectivamente mejor se ajusta o representa a la serie histrica de datos? Cul de las distribuciones disponibles debi haberse empleado en verdad en la estimacin requerida de valores extremos? Estas preguntas nos conducen a la necesidad de revisar los temas relacionados con las pruebas de ajuste.

II. OBJETIVOS

Interpretar y explicar las caractersticas del modelo normal. Interpretar y analizar las caractersticas de los modelos logartmicos. Entender las aplicaciones de la distribucin normal y log normal.

III. MARCO TEORICO

MODELO MATEMATICO

Descripcin de un fenmeno de la naturaleza.

A. M.M.DETERMINISTICO: Resultado determinado por las condiciones en que se realiza el experimento. Solo cambia si se cambian las condiciones.Es formulado en trminos de un grupo de variables y parmetros y ecuaciones relacionadas a ellos.Implica una relacin causa efecto entre valores de los parmetros elegidos y los resultados obtenidos de la aplicacin de las ecuaciones .

B. M.M.PROBABILISTICO O NO DETERMINISTICO: Las condiciones en que se produce el fenmeno no determinan el resultado. Un modelo probabilstico se formula siguiendo las leyes del azar. Se dividen en dos tipos: (1) estadsticos, y (2) estocsticosLos modelos estadsticos tratan con ejemplos observados, mientras que los modelos estocsticos con la estructura del azar observada en ciertas series hidrolgicas temporales

El desarrollo de modelos estadsticos requieren invariablemente el uso de datos; los modelos estocsticos enfatizan sobre las caractersticas estocsticas de los procesos hidrolgicos.

C. PRINCIPALES MODELOS PROBABILISTICOS CONTINUOS: Uniforme Normal Log-Normal Exponencial Gamma o Pearson II Chi cuadrado Valores extremos tipo I.gumbel.

D. DISTRIBUCIN NORMAL

Una distribucin normal de media y desviacin tpica se designa por N(, ). Su grfica es la campana de Gauss:

El readel recinto determinado por la funcin y el eje de abscisases igual a la unidad.Al sersimtricarespecto al eje que pasa porx = , deja unrea igual a 0.5 a la izquierda y otra igual a 0.5 a la derecha.La probabilidad equivale al rea encerrada bajo la curva.E. DISTRIBUCIN NORMAL ESTNDARN(0, 1)Ladistribucin normal estndar, o tipificada o reducida,es aquella que tiene pormediael valorcero, =0, y pordesviacin tpica la unidad, =1.

La probabilidad de la variable X depender del rea del recinto sombreado en la figura. Y para calcularla utilizaremos unatablaTipificacin de la variablePara poder utilizar la tabla tenemos que transformar la variableXque sigue una distribucinN(, )en otra variableZque siga una distribucinN(0, 1).

F. CLCULO DE PROBABILADADES EN DISTRIBUCIONES NORMALESLatablanos da lasprobabilidades de P(z k), siendozla variable tipificada.Estas probabilidades nos dan lafuncin de distribucin(k).(k) = P(z k)Bsqueda en la tabla de valor de kUnidades y dcimasen la columna de la izquierda.Centsimasen la fila de arriba.

La distribucin normal es una distribucin simtrica en forma de campana, tambin conocida como Campana de Gauss. Aunque muchas veces no se ajusta a los datos hidrolgicos tiene amplia aplicacin por ejemplo a los datos transformados que siguen la distribucin normal.FUNCIN DE DENSIDAD:La funcin de densidad est dada por

Los dos parmetros de la distribucin son la media y desviacin estndar para los cuales (media) y s (desviacin estndar) son derivados de los datos.ESTIMACIN DE PARMETROS:

FACTOR DE FRECUENCIA:

1. Si se trabaja con los X sin transformar el K se calcula como

este factor es el mismo de la variable normal estndar

LIMITES DE CONFIANZA:

Donde: es el nivel de probabilidad es el cuantil de la distribucin normal estandarizada para una probabilidad acumulada de 1- y Se es el error estndar

G. DISTRIBUCIN LOG-NORMAL

1. CARACTERSTICAS DE LA DISTRIBUCINLa distribucin log normal se obtiene cuando los logaritmos de una Variable se describen mediante una distribucin normal. Es el caso en el que las variaciones en la fiabilidad de una misma clase de componentes tcnicos se representan considerando la tasa de falloslaleatoria en lugar de una variable constante.Es la distribucin natural a utilizar cuando las desviaciones a partir del valor del modelo estn formadas por factores, proporciones o porcentajes ms que por valores absolutos como es el caso de la distribucin normal.La distribucin lognormal tiene dos parmetros: m* (media aritmtica del logaritmo de los datos o tasa de fallos) ys(desviacin estndar del logaritmo de los datos o tasa de fallos).2. PROPIEDADESLa distribucin lognormal se caracteriza por las siguientes propiedades: Asigna a valores de la variable < 0 la probabilidad 0 y de este modo se ajusta a las tasas y probabilidades de fallo que de esta forma slo pueden ser positivas. Como depende de dos parmetros, segn veremos, se ajusta bien a un gran nmero de distribuciones empricas. Es idnea para parmetros que son a su vez producto de numerosas cantidades aleatorias (mltiples efectos que influyen sobre la fiabilidad de un componente). La esperanza matemtica o media en la distribucin lognormal es mayor que su mediana. De este modo da ms importancia a los valores grandes de las tasas de fallo que una distribucin normal con los mismos percentiles del 5% y 50% tendiendo, por tanto, a ser pesimista. Esta propiedad se puede apreciar en la figura 2.

Comparacin entre una distribucin normal y una lognormal con los mismos percentiles del 5% y 50%. (Distribucin normal normalizada a 1, distribucin lognormal con el mismo factor)

Enprobabilidadesyestadsticas, ladistribucin log-normales unadistribucin de probabilidadde unavariable aleatoriacuyologaritmoestnormalmente distribuido. Es decir, siXes una variable aleatoria con una distribucin normal, entonces exp(X) tiene una distribucin log-normal.La base de una funcin logartmica no es importante, ya que logaXest distribuida normalmente si y slo si logbXest distribuida normalmente, slo se diferencian en un factor constante.Log-normaltambin se escribelog normalolognormal.Una variable puede ser modelada como log-normal si puede ser considerada como unproductomultiplicativo de muchos pequeos factores independientes. Un ejemplo tpico es un retorno a largo plazo de una inversin: puede considerarse como un producto de muchos retornos diarios.

La distribucin log-normal tiende a la funcindensidad de probabilidad

para, dondeyson lamediay ladesviacin estndardel logaritmo de variable. Elvalor esperadoes

y lavarianzaes.

H. DISTRIBUCION LOGNORMAL DE DOS PARAMETROS

Si los logaritmos Y de una variable aleatoria X se distribuyen normalmente se dice que X se distribuye normalmente.Esta distribucin es muy usada para el clculo de valores extremos por ejemplo Qmax, Qmnimos, Pmax, Pmnima (excelentes resultados en Antioquia). Tiene la ventaja que X>0 y que la transformacin Log tiende a reducir la asimetra positiva ya que al sacar logaritmos se reducen en mayor proporcin los datos mayores que los menores.Limitaciones: tiene solamente dos parmetros, y requiere que los logaritmos de las variables estn centrados en la media

FUNCIN DE DENSIDAD:

y = ln x

donde, y : media de los logaritmos de la poblacin (parmetro escalar), estimado y : Desviacin estndar de los logaritmos de la poblacin, estimado sy.

Estimacin de parmetros:

FACTOR DE FRECUENCIA:

Puede trabajarse en el campo original y en el campo transformado.

2. Campo transformado: Si se trabaja en el campo transformado se trabaja con la media y la desviacin estndar de los logaritmos, as:

Ln(XTr) = xTr+KSyde donde,XTr = eln (xTr)

con K con variable normal estandarizada para el Tr dado, xy media de los logaritmos y Sy es la desviacin estndar de los logaritmos.

3. Campo original: Si se trabaja con los X sin transformar el K se calcula como

K es la variable normal estandarizada para el Tr dado, es el coeficiente de variacin, x media de los datos originales y s desviacin estndar de los datos originales.LIMITES DE CONFIANZA:En el campo transformado.

en donde, n nmero de datos, Se error estndar, KT variable normal estandarizada.

AJUSTE DE DISTRIBUCIONES

Para la modelacin de caudales mximos se utilizan, entre otras, las distribuciones Log - Normal, Gumbel y Log-Gumbel principalmente. Para seleccionar la distribucin de probabilidades de la serie histrica se deben tener en cuenta algunas consideraciones.

Cuando en la serie histrica se observan outliers[footnoteRef:1] es necesario verificar la sensibilidad del ajuste debido a la presencia de estos, (Ashkar, et al. 1994) [1: Aunque no existe una definicin generalmente aceptada, se puede entender como valores extremos, muy superiores a los dems registrados (Ashkar, et al. 1994).]

Para el ajuste a las distribuciones Log-Normal, Log-Gumbel y Log-Pearson se requiere transformar la variable al campo logartmico para modelarla, con lo que se disminuye la varianza muestral, pero tambin se filtran las variaciones reales de los datos.

Las distribuciones de dos parmetros fijan el valor del coeficiente de asimetra, lo que en algunos casos puede no ser recomendable. La distribucin Log - Normal de dos parmetros slo es recomendable s el coeficiente de asimetra es cercano a cero. Las distribuciones Gumbel y Log - Gumbel son recomendables si el coeficiente de asimetra de los eventos registrados es cercano a 1.13

Para ajustar distribuciones de tres parmetros (Log Normal III, Log Pearson) se requiere estimar el coeficiente de asimetra de la distribucin; para ello es necesario disponer de una serie con longitud de registros larga, mayor de 50 aos, (Kite, 1988). Las distribuciones de dos parmetros son usualmente preferidas cuando se dispone de pocos datos, porque reducen la varianza de la muestra, (Ashkar, et al. 1994).

Para seleccionar la distribucin de probabilidades adecuada se debe tratar de utilizar informacin adicional del proceso hidrolgico que permita identificar la forma en que se distribuye la variable. Usualmente es muy difcil determinar las propiedades fsicas de los procesos hidrolgicos para identificar el tipo de distribucin de probabilidad que es aplicable.

Kite (1988) y Mamdouh (1993) afirman que no existe consistencia sobre cual es la distribucin que mejor se ajusta a los caudales mximos y recomiendan seleccionar el mejor ajuste a criterio del modelador con la prueba de ajuste grfico o basado en el comportamiento de las pruebas estadsticas de bondad del ajuste (por ejemplo Chi Cuadrado, Smirnov-Kolmogorov, Cramer-Von Mises) en las que se calcula un estimador y se compara con un valor tabulado para determinar si el ajuste es adecuado o no. En la prueba de ajuste grfica se dibujan los valores registrados en la serie contra la distribucin terica de probabilidades y de manera visual (subjetiva) se determina si el ajuste es adecuado o no.

Cuando la informacin es adecuada el anlisis de frecuencia es la metodologa ms recomendable para la evaluacin de eventos extremos, ya que la estimacin depende solamente de los caudales mximos anuales que han ocurrido en la cuenca y no da cuenta de los procesos de transformacin de la precipitacin en escorrenta. Obviamente tiene algunas limitaciones relacionadas con el comportamiento de la serie histrica y con el tamao y calidad de los datos de la muestra.

Cuando se presenten cambios o tendencias en la serie histrica se deben utilizar tcnicas estadsticas que permitan removerlos para poder realizar el anlisis de frecuencias (Kite, 1988; Mamdouh, 1993; Ashkar, et al. 1994).

La seleccin inadecuada de la distribucin de probabilidades de la serie histrica arrojar resultados de confiabilidad dudosa, (Ashkar, et al. 1994).

El tamao de la muestra influye directamente en la confiabilidad de los resultados, as a mayor perodo de retorno del estimativo mayor longitud de registros necesaria para mejor confiabilidad en los resultados.

El ajuste a distribuciones se puede hacer de dos tcnicas, con el factor de frecuencia como se refiri en el numeral 2 o hallando la distribucin emprica de los datos muestrales, por el mtodo de Plotting Position.

Plotting Position

Trabaja con la probabilidad de excedencia asignada a cada valor de la muestra. Se han propuesto numerosos mtodos empricos. Si n es el total de valores y m es el rango de un valor en una lista ordenada de mayor a menor (m=1 para el valor mximo) la probabilidad de excedencia se puede obtener por medio de las siguientes expresiones

California

Weibull

Hazen

La expresin ms utilizada es la Weibull. Con las anteriores expresiones se halla lo que se conoce como la distribucin emprica de una muestra, esta luego se puede ajustar a una de las distribuciones tericas presentadas anteriormente. Los resultados pueden ser dibujados en el papel de probabilidad; este es diseado para que los datos se ajusten a una lnea recta y se puedan comparar los datos mustrales con la distribucin terica (lnea recta).

IV. APLICACIONES

V. CONCLUSIONES

La distribucin log normal se obtiene cuando los logaritmos de una Variable se describen mediante una distribucin normal. Una variable puede ser modelada como log-normal si puede ser considerada como un productomultiplicativo de muchos pequeos factores independientes.

VI. RECOMENDACIONES

VII. ANEXOSa. Tabla de distribucin normal..