Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... ·...

38
Alfredo Olvera Gómez Simulación bajo Parámetros de Incertidumbre

Transcript of Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... ·...

Page 1: Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... · La teoría requiere describir la correlación espacial está encuentra en las ...

Alfredo Olvera Gómez

Simulación bajo Parámetros de Incertidumbre

Page 2: Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... · La teoría requiere describir la correlación espacial está encuentra en las ...

• Se introducirá los conceptos básicos de probabilidad que servirán de herramienta para poder modelar el flujo y transporte de agua subterránea .

• Comenzaremos con la discusión de los siguientes conceptos:

1. Introducción a la probabilidad2. Campos Aleatorios3. Semivariograma4. Kriging

Objetivos:

Page 3: Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... · La teoría requiere describir la correlación espacial está encuentra en las ...

Introducción a la Probabilidad

• La teoría de probabilidad es una aparato matemático que describe los fenómenos aleatorios. Los eventos aleatorios estos se distinguen de los deterministas de la siguiente forma:

1. Los experimentos aleatorios son aquellos que cuando se les repite bajo las mismas condiciones iniciales el resultado no siempre es el mismo. Ejemplo el lanzamiento de una moneda, el lanzamiento de un dado, la lotería etc. Entonces entenderemos como fenómeno aleatorio a aquel que esta gobernado por el azar.

2. Los experimentos deterministas son aquellos que cuando se les repite bajo las mismas condiciones iniciales el resultado siempre es el mismo. Ejemplo la gravedad, el flujo de un liquido, la velocidad, etc.

Page 4: Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... · La teoría requiere describir la correlación espacial está encuentra en las ...

Espacio Muestral.

Dado un experimento aleatorio ξ, el espacio muestral asociado al experimento es el conjunto de todos los posibles resultados del experimento ξ. Ejemplo.

1. ξ=Lanzar una moneda.Ω=águila, sol

2. ξ = Lanzar un dado.Ω=1,2,3,4,5,6

Page 5: Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... · La teoría requiere describir la correlación espacial está encuentra en las ...

¿Qué es un evento?

Un evento es un elemento asociado del campo asociado al espacio muestral Ω, es decir un subconjunto del espacio muestral. Ejemplo.

1. ξ = Lanzar un dado.Ω=1,2,3,4,5,6A=caer número par=2,4,6B=caer número impar=1,3,5C=que caiga el número uno=1

Page 6: Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... · La teoría requiere describir la correlación espacial está encuentra en las ...

Nuestro objetivo es definir la probabilidad

Decimos que la probabilidad es una función que va de un espacio muestral al intervalo [0,1], es decir que se mide en el segmento de recta del 0 al 1.

P:ξ [0,1]Existen tres formas de asignar probabilidades a

eventos:i. Probabilidad clásica.ii. Probabilidad frecuentista.iii. Probabilidad subjetiva.

Page 7: Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... · La teoría requiere describir la correlación espacial está encuentra en las ...

Probabilidad clásica.Consiste en dado un

evento A, se define como:

Casos favorables entre casos totales

( )Ω#

# AAP =

Page 8: Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... · La teoría requiere describir la correlación espacial está encuentra en las ...

El clásico experimento conceptual que es usado para introducirnos a la noción de probabilidad es el lanzamiento de una moneda.

Calculamos nuestra espacio Muestral ΩΩ=águila, sol #Ω=2Describimos nuestro experimento

A=caer águila, #A=1Calculamos la probabilidad y obtenemos lo siguiente

( )21AAP ==

Ω##

Page 9: Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... · La teoría requiere describir la correlación espacial está encuentra en las ...

La probabilidad de un evento o de un suceso se describe usando la función de distribución. Si consideramos como ejemplo, la conductividad hidráulica relativa esto significa valores como una variable aleatoria y llamamos a está como X, la función de distribución FX(x) está definida como

(7.121)

La ecuación (7.121) dice que la probabilidad que el valor de una variablealeatoria X puede tomar valores menores o iguales a x es FX(x). La función FX(x)desaparece cuando x tiende a menos infinito. De manera análoga FX(x) cuando x tiende a infinito es 1.

Page 10: Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... · La teoría requiere describir la correlación espacial está encuentra en las ...

Lo más común utilizado una función de distribución es la distribución normal de acumulación . Está es de la forma

Haciendo uso de está notación, es posible expresar la probabilidad dado un valor de la conductividad hidráulica dependiendo entre dos valores a y b. la relación es

(7.122)

Page 11: Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... · La teoría requiere describir la correlación espacial está encuentra en las ...

Un ejemplo de la distribución normal de acumulación está descrito por la ecuación (7.122) está se muestra en la grafica de la figura (7.19). El valor de la media es cero y el valor de la varianza es la unidad.

Otra función importante función de densidad de probabilidad fX(x), la cual puede ser determinada por tomar la derivada de (7.122) con respecto a x. uno obtiene

(7.123)

(7.124)

Una representación Gráfica de fX(x) dada como la ecuación (7.124) se muestra en la figura (7.20)

Page 12: Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... · La teoría requiere describir la correlación espacial está encuentra en las ...

El valor esperado, también llamado conjunto de medias y conjunto promedio, de una variable aleatoria X está denotado como E(X) y dado como

La función μ(X) también es llamada de primer momento. Quizás una forma más intuitiva de declararlo es de la forma siguiente

donde N es el número de datos observados de la variable aleatoria X.

Page 13: Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... · La teoría requiere describir la correlación espacial está encuentra en las ...

El segundo momento es la varianza y está dado por

La varianza es una medida de la tendencia central de las observaciones alrededor de la media. Esto define la tendencia de la distribución. El tercer momento es la desviación estándar definida como

(7.125)

La desviación estándar describe la asimetría en la distribución. En el caso de la distribución normal la desviación estándar es cero, está distribución es simétrica.

Page 14: Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... · La teoría requiere describir la correlación espacial está encuentra en las ...

Para abordar la incertidumbre en la conductividad hidráulica, requerimos de teoría que se acomode a la distribución de variables aleatorias. En este caso la conductividad hidráulica, no solo está valuada en diferentes locaciones de incertidumbre, pero también valuada en locaciones vecinas correlacionadas.

La teoría requiere describir la correlación espacial está encuentra en las matemáticas conjuntamente variables distribuidas. El primer caso es definir el concepto de arreglo de una variable aleatoria, la cual se denotara como X y se escribe

(7.126)

La unión de la distribución de X es

(7.127)

Page 15: Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... · La teoría requiere describir la correlación espacial está encuentra en las ...

Donde xi es una medida que toma de Xi y P(x1≤X1,…,xn ≤Xn) en el contexto de la ecuación (7.127), puede ser interpretad como la media de la probabilidad de x1 ≤X1,…xn ≤Xn simultáneamente. La consecuencia lógica de está definición de la unión de función de densidad, la cual puede ser descrita como

La conductividad hidráulica se supone de manera general como lognormal que es normalmente distribuida.

•Una característica de la distribución lognormal >0

• En el caso de la conductividad hidráulica es normalmente distribuida. Por tanto podemos sustituir X←lnX.

•En otras palabras, la ecuación (7.127) describe la interdependencia de los valores de la conductividad en varios puntos de medida

Page 16: Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... · La teoría requiere describir la correlación espacial está encuentra en las ...

La covarianza de dos variables aleatorias Xk y Xl, esta definida como

La matriz principal de la covarianza, que es, cov(Xk,Xl) es la varianza, como puede ser observado en las ecuaciones (7.125) y (7.128). En el evento de dos variables aleatorias Xk y Xl están definidas en diferentes cantidades físicas, cov(Xk,Xl), es llamada el cruce de las covarianzas. Ejemplo considere el ejemplo entre la relación entre la carga hidráulica y la conductividad hidráulica.

La normalización de la covarianza es llamada el coeficiente de correlación dado por

(7.128)

Page 17: Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... · La teoría requiere describir la correlación espacial está encuentra en las ...

En los eventos de dos variables aleatorias, donde no está relacionados una con otra, es decir las dos variables son independientes. La afirmación matemática es

Una desconexión par de una distribución conjunta de variables aleatorias se caracteriza por valores cero en la diagonal principal de los elementos de la matriz correlación que es

El valor esperado de un vector es igual al valor esperado de la componente que es

Page 18: Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... · La teoría requiere describir la correlación espacial está encuentra en las ...

La la covarianza de un vector aleatorio está dada por la covarianza de la matriz PX dada por

Page 19: Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... · La teoría requiere describir la correlación espacial está encuentra en las ...

Campos AleatoriosCampos AleatoriosEn está subsección formalizaremos el concepto de dependencia espacial de una variable aleatoria. Denotaremos la familia de variables aleatorias que dependen de la locación s como un campo espacial aleatorio. Un campo espacial aleatorio puede ser continuo o discontinuo dependiendo si las locaciones asociadas con la variable aleatoria son continuas o discontinuas. El valor de la media está dada en función de s

donde en el caso de una variable aleatoria escalar es la conductividad hidráulica isotrópica , el resultado es un número. Si la variable aleatoria es un tensor, tal caso es la conductividad hidráulica, entonces el resultado también es un tensor.

Page 20: Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... · La teoría requiere describir la correlación espacial está encuentra en las ...

La covarianza de un campo aleatorio escalar, dada por dos locaciones s y s+r,donde r es la distancia del vector, dada por

(7.129)

y su correspondiente correlación es

Page 21: Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... · La teoría requiere describir la correlación espacial está encuentra en las ...

Desde un punto de vista estadístico los parámetros descritos, en nuestro ejemplo de la conductividad hidráulica, que es ahora una función del espacio, hay dos nuevos conceptos que necesitamos considerar. El primero es el caso estacionario.

Un campo aleatorio X(s) es considerado estacionario si cumple:

1. Tiene un numero de varianzas finitas.

2. Tiene una media constante (independiente de la posición)

3. Tiene una covarianza que sólo depende de las distancias entre las locaciones de la variable aleatoria.

Así tenemos

(7.130)

(7.131)

R30

Page 22: Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... · La teoría requiere describir la correlación espacial está encuentra en las ...

El segundo caso es el isotrópico. Un campo aleatorio es isotrópico cumplen con 1 y 2 del caso anterior, y la covarianza sólo depende de la magnitud de las diferencias entre la locaciones de los valores del campo aleatorio y no de la dirección.

Una función que está relacionada pero a diferencia de la covarianza en el variograma. Este está definido como la varianza de las diferencias entre dos variables del campo aleatorio una distancia r separada. El variogramanormalmente está escrito de la siguiente manera

donde está definida como la semivarianza. Está relacionada con la covarianza como

(7.133)

(7.132)

R

Page 23: Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... · La teoría requiere describir la correlación espacial está encuentra en las ...

Lógicamente llamamos como la distancia entre dos puntos incrementados, las propiedades estadísticas estudiadas en dos puntos deberían convertirse en menos correlación. A estos dos medidas de esta tendencia son la escala de correlación y el rango de correlación. La escala de correlación λX está definida como

A la distancia r=λX la covarianza es aproximadamente la mitad de la varianza.

Page 24: Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... · La teoría requiere describir la correlación espacial está encuentra en las ...

El semivariograma.Mientras ahora tenemos nociones básicas de la nomenclatura asociada con el campo aleatorio, tal como la conductividad hidráulica, no sabemos como generar un campo aleatorio continuo de un conjunto de medidas discretas. En otras palabras, como hacer determinar las propiedades estadísticas de la conductividad hidráulica en una locación donde las medidas no existen. El método más popular para llevar a cabo está meta es en interpolar un algoritmo llamado kriging, el cual se discutirá.

El semivarianza proviene de la ecuación (7.132) es claramente una función de distancia. Lo más cerca de las dos variables en la región sencible, entre más pequeño sea . A la grafica de una semivarianza se le conoce como una función de distancia r, es llamado un semivariograma.

Page 25: Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... · La teoría requiere describir la correlación espacial está encuentra en las ...

Tenemos que dos semivariogramas están graficados en la en la figura 7.21. El semivariograma puede ser computado por las siguientes relación

Donde el superindice * indica el cálculo está hecho usando observaciones directas y N es el número de pares. El semivariograma puede ser interpretado como la mitad de la suma de las raíces de las diferencias en N observaciones pares, cada una con una separación r de una a otra, dividida por N.

Uno de los problemas con este concepto es que si el espacio es irregular, los cambios buscados en dos puntos exactamente a distancia r aparentemente es cero. Así hay magnitudes y direcciones de tolerancia construidas dentro del valor de r que están incluidas en la ecuación (7.134). El valor de r usado en el semivariograma graficado será el promedio de todas las distancias entre N pares buscados dentro de la tolerancia especifica.

(7.134)

Page 26: Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... · La teoría requiere describir la correlación espacial está encuentra en las ...

Mientras el concepto de dato derivado directo de los variogramas podrían ser usados en kriging esto no es normalmente bien usado. El núcleo teórico del variograma exhibe, las propiedades geométricas son ocupadas. La forma más común de usar es el modelo de la exponencial, el cual está dado por

(7.135)

La terminología asociada con el variograma, como pozos u otros es la siguiente

•El valor de c0 está identificado con el concepto de pepita. Este término proporcionan la disolución de la medida del error. Esto identifica con la medida del punto en la intersección.

•El rango, mencionado anteriormente, es el factor que describe el grado de la correlación entre los datos de los puntos, usualmente denotado por distancia.

•El derrame (sill) es el valor del variograma como el valor cuando r→∞. Esto es igual al total de la varianza de el conjunto de datos y está dado por c en la ecuación (7.135).

Page 27: Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... · La teoría requiere describir la correlación espacial está encuentra en las ...

KrigingKriging es un estimación desarrollada por G. Matheron y D.G. Krige y usada como un método de interpolación optima. En Kriging ordinario, una suposición básica es que la búsqueda antes de la variables aleatoria, es nuestro caso la distribución de la conductividad hidráulica es segundo orden estacionario. Los requerimientos para un caso estacionario están dados por las ecuaciones (7.130) y (7.131).mientras en la practica esto significa que distribución de la conductividad hidráulica es raramente constante.

Una aproximación del sorteo de este problema es primero crear una mejor superficie de interpolación para datos usando una función simple polinomial y datos disponibles en los puntos. Los resultados de estos datos son llamados desviación. Los residuos computacionales como las diferencias entre los actuales datos y la desviación, deberían en el concepto estacionario. Para el caso no estacionario tenemos kriging universal.

Page 28: Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... · La teoría requiere describir la correlación espacial está encuentra en las ...

Kriging ( )uZ *

Planteamiento básico de la estimación por Kriging:

Considerar la estimación de ( )uZ como una combinación lineal de las

observaciones disponibles

( ) ( ) ( )∑=

=N

uZuuZ1

*

αααλ

y escoger los pesos bajo un criterio en el cual se considera que dicha estimación es óptima. Este es que el estimador sea insesgado y que

( ) ( )[ ]uZuZ *var − sea mínima

Page 29: Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... · La teoría requiere describir la correlación espacial está encuentra en las ...

Kriging Simple ( )uZ *

El caso más simple se denomina kriging simple y la hipótesis básica es la estacionalidad junto con el hecho de que se asume que la media de la función aleatoria es conocida. Esto es,

( )( ) conocidaesy μμ=uZE

KRIGING SIMPLE

KRIGING ORDINARIOGeneralmente el valor de la media μ es desconocido y por lo tanto no se puede utilizar el kriging simple.El kriging ordinario establece una condición adicional al sistema de ecuaciones del kriging simple para filtrar el valor desconocido de la media. Al igual que antes el estimador propuesto es de la forma

( ) ( ) ( )∑=

=N

uZuuZ1

*

αααλ

Page 30: Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... · La teoría requiere describir la correlación espacial está encuentra en las ...

UK ( )uZ *

KRIGING UNIVERSAL

El kriging universal asume que la función aleatoria Z se puede descomponer en la forma:

( ) ( ) ( )uuRuZ μ+=

Donde R es una función aleatoria estacionaria de orden 2 con E(R(u))=0 y m es una función no aleatoria dependiente de la localización u. Bajo estas hipótesis se tiene que:

( )( ) ( )( ) ( )umuREuZE +=

( )um=

Page 31: Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... · La teoría requiere describir la correlación espacial está encuentra en las ...

Kriging Ordinario ( )uZ *

El primer paso para desarrollar la interpolación de Kriging es representar las estadísticas estacionarias como se define en la siguiente relación

(7.136)

Donde es la función de peso xi=1,2,…,N son los valores de los datos observados. Así el valor de la aproximación de la variable de interpolación es el peso de la suma de los datos existentes. La notación s0 implica una estimación pero la locación arbitraria y el uso del asterisco como superíndice implica una estimación.

R

Page 32: Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... · La teoría requiere describir la correlación espacial está encuentra en las ...

Los cambios están definidos para una metodología que suministrará el peso de

si consideramos los datos de los puntos xi como una realización de una variable aleatoria, podemos a lo mejor usar las propiedades de las variables aleatorias para obtener los pesos. Dos condiciones son impuestas sobre la selección de los pesos, wi(s). El primero es que el estimador debe ser imparcial, del valor esperado de la variable aleatoria X*(s) es igual a μ. El resultado obligado es

(7.137)

Segundo este requiere que la varianza de la estimación de X(s0), la varianza de Kriging debe ser mínima. Para determinar primero definimos la cantidad

Page 33: Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... · La teoría requiere describir la correlación espacial está encuentra en las ...

El cual es la diferencia entre la interpolación estimada de la variable aleatoria X, a saber X* y el verdadero valor de X en la locación s0. la varianza de Kriging estádefinida como

(7.138)

Para simplificar la situación nosotros redefinimos los términos X(s0) como X0. nosotros seguiremos el desarrollo de DeMarsily en la formulación de la ecuaciones de Kriging. Tenemos que sustituir la ecuación (7.136) en ecuación (7.38) y obtenemos

Page 34: Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... · La teoría requiere describir la correlación espacial está encuentra en las ...

(7.139)

De la ecuación (7.132) tenemos

Page 35: Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... · La teoría requiere describir la correlación espacial está encuentra en las ...

Nótese que el valor esperado del término que aparece en la ecuación (7.140) también aparece en la ecuación (7.139). Así sustituyendo la forma de la ecuación dentro la última obtenemos

(7.140)

(7.141)

Page 36: Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... · La teoría requiere describir la correlación espacial está encuentra en las ...

Uno puede sacar el factor en el segundo término en el lado derecho de la ecuación (7.141) y en el tercer término. De ambas sumas son iguales a la ecuación (7.137), de los dos últimos términos se convierte en

Los cuales son idénticos. Así la ecuación (7.141) se reduce a

(7.142)

Page 37: Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... · La teoría requiere describir la correlación espacial está encuentra en las ...

Recordando que nuestra meta fue minimizar la varianza de Kriging ecuación (7.138) sujeta a imponer por la ecuación (7.137) nuestro objetivo es convertir la función

Donde η es llamada el multiplicador de Lagrage. El multiplicador de Lagrage es introducido por que hay una o más ecuaciones que son desconocidas. El multiplicador de Lagrage agrega desconocido fuera de la ecuación (7.142) el valor mínimo para f(w1,…,wn,η) está realizado por una diferenciación f(w1,…,wn,η) con respecto a N+1 desconociendo los valores w1,…,wn,η y puesta en cada resultado N+1 ecuaciones cero. El resultado es

Page 38: Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... · La teoría requiere describir la correlación espacial está encuentra en las ...

La ecuación (7.43) podemos resolver los pesos y el coeficiente η. Sustituyendo dentro de la ecuación (7.136) permite obtener un valor de la variable aleatoria X en algún punto (s0).

Es también posible estimar el valor de la varianza del error. Recordando que la varianza del error está dada por la ecuación (7.138) es

(7.143)

Por lo tanto sustituyendo en la ecuación (7.143) dentro de la ecuación (7.142) la varianza del error puede ser computada para el punto s0.