Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... ·...

Post on 09-Oct-2020

5 views 0 download

Transcript of Simulación bajo Parámetros de Incertidumbremmc2.geofisica.unam.mx/cursos/tfs/TFSPresentaci... ·...

Alfredo Olvera Gómez

Simulación bajo Parámetros de Incertidumbre

• Se introducirá los conceptos básicos de probabilidad que servirán de herramienta para poder modelar el flujo y transporte de agua subterránea .

• Comenzaremos con la discusión de los siguientes conceptos:

1. Introducción a la probabilidad2. Campos Aleatorios3. Semivariograma4. Kriging

Objetivos:

Introducción a la Probabilidad

• La teoría de probabilidad es una aparato matemático que describe los fenómenos aleatorios. Los eventos aleatorios estos se distinguen de los deterministas de la siguiente forma:

1. Los experimentos aleatorios son aquellos que cuando se les repite bajo las mismas condiciones iniciales el resultado no siempre es el mismo. Ejemplo el lanzamiento de una moneda, el lanzamiento de un dado, la lotería etc. Entonces entenderemos como fenómeno aleatorio a aquel que esta gobernado por el azar.

2. Los experimentos deterministas son aquellos que cuando se les repite bajo las mismas condiciones iniciales el resultado siempre es el mismo. Ejemplo la gravedad, el flujo de un liquido, la velocidad, etc.

Espacio Muestral.

Dado un experimento aleatorio ξ, el espacio muestral asociado al experimento es el conjunto de todos los posibles resultados del experimento ξ. Ejemplo.

1. ξ=Lanzar una moneda.Ω=águila, sol

2. ξ = Lanzar un dado.Ω=1,2,3,4,5,6

¿Qué es un evento?

Un evento es un elemento asociado del campo asociado al espacio muestral Ω, es decir un subconjunto del espacio muestral. Ejemplo.

1. ξ = Lanzar un dado.Ω=1,2,3,4,5,6A=caer número par=2,4,6B=caer número impar=1,3,5C=que caiga el número uno=1

Nuestro objetivo es definir la probabilidad

Decimos que la probabilidad es una función que va de un espacio muestral al intervalo [0,1], es decir que se mide en el segmento de recta del 0 al 1.

P:ξ [0,1]Existen tres formas de asignar probabilidades a

eventos:i. Probabilidad clásica.ii. Probabilidad frecuentista.iii. Probabilidad subjetiva.

Probabilidad clásica.Consiste en dado un

evento A, se define como:

Casos favorables entre casos totales

( )Ω#

# AAP =

El clásico experimento conceptual que es usado para introducirnos a la noción de probabilidad es el lanzamiento de una moneda.

Calculamos nuestra espacio Muestral ΩΩ=águila, sol #Ω=2Describimos nuestro experimento

A=caer águila, #A=1Calculamos la probabilidad y obtenemos lo siguiente

( )21AAP ==

Ω##

La probabilidad de un evento o de un suceso se describe usando la función de distribución. Si consideramos como ejemplo, la conductividad hidráulica relativa esto significa valores como una variable aleatoria y llamamos a está como X, la función de distribución FX(x) está definida como

(7.121)

La ecuación (7.121) dice que la probabilidad que el valor de una variablealeatoria X puede tomar valores menores o iguales a x es FX(x). La función FX(x)desaparece cuando x tiende a menos infinito. De manera análoga FX(x) cuando x tiende a infinito es 1.

Lo más común utilizado una función de distribución es la distribución normal de acumulación . Está es de la forma

Haciendo uso de está notación, es posible expresar la probabilidad dado un valor de la conductividad hidráulica dependiendo entre dos valores a y b. la relación es

(7.122)

Un ejemplo de la distribución normal de acumulación está descrito por la ecuación (7.122) está se muestra en la grafica de la figura (7.19). El valor de la media es cero y el valor de la varianza es la unidad.

Otra función importante función de densidad de probabilidad fX(x), la cual puede ser determinada por tomar la derivada de (7.122) con respecto a x. uno obtiene

(7.123)

(7.124)

Una representación Gráfica de fX(x) dada como la ecuación (7.124) se muestra en la figura (7.20)

El valor esperado, también llamado conjunto de medias y conjunto promedio, de una variable aleatoria X está denotado como E(X) y dado como

La función μ(X) también es llamada de primer momento. Quizás una forma más intuitiva de declararlo es de la forma siguiente

donde N es el número de datos observados de la variable aleatoria X.

El segundo momento es la varianza y está dado por

La varianza es una medida de la tendencia central de las observaciones alrededor de la media. Esto define la tendencia de la distribución. El tercer momento es la desviación estándar definida como

(7.125)

La desviación estándar describe la asimetría en la distribución. En el caso de la distribución normal la desviación estándar es cero, está distribución es simétrica.

Para abordar la incertidumbre en la conductividad hidráulica, requerimos de teoría que se acomode a la distribución de variables aleatorias. En este caso la conductividad hidráulica, no solo está valuada en diferentes locaciones de incertidumbre, pero también valuada en locaciones vecinas correlacionadas.

La teoría requiere describir la correlación espacial está encuentra en las matemáticas conjuntamente variables distribuidas. El primer caso es definir el concepto de arreglo de una variable aleatoria, la cual se denotara como X y se escribe

(7.126)

La unión de la distribución de X es

(7.127)

Donde xi es una medida que toma de Xi y P(x1≤X1,…,xn ≤Xn) en el contexto de la ecuación (7.127), puede ser interpretad como la media de la probabilidad de x1 ≤X1,…xn ≤Xn simultáneamente. La consecuencia lógica de está definición de la unión de función de densidad, la cual puede ser descrita como

La conductividad hidráulica se supone de manera general como lognormal que es normalmente distribuida.

•Una característica de la distribución lognormal >0

• En el caso de la conductividad hidráulica es normalmente distribuida. Por tanto podemos sustituir X←lnX.

•En otras palabras, la ecuación (7.127) describe la interdependencia de los valores de la conductividad en varios puntos de medida

La covarianza de dos variables aleatorias Xk y Xl, esta definida como

La matriz principal de la covarianza, que es, cov(Xk,Xl) es la varianza, como puede ser observado en las ecuaciones (7.125) y (7.128). En el evento de dos variables aleatorias Xk y Xl están definidas en diferentes cantidades físicas, cov(Xk,Xl), es llamada el cruce de las covarianzas. Ejemplo considere el ejemplo entre la relación entre la carga hidráulica y la conductividad hidráulica.

La normalización de la covarianza es llamada el coeficiente de correlación dado por

(7.128)

En los eventos de dos variables aleatorias, donde no está relacionados una con otra, es decir las dos variables son independientes. La afirmación matemática es

Una desconexión par de una distribución conjunta de variables aleatorias se caracteriza por valores cero en la diagonal principal de los elementos de la matriz correlación que es

El valor esperado de un vector es igual al valor esperado de la componente que es

La la covarianza de un vector aleatorio está dada por la covarianza de la matriz PX dada por

Campos AleatoriosCampos AleatoriosEn está subsección formalizaremos el concepto de dependencia espacial de una variable aleatoria. Denotaremos la familia de variables aleatorias que dependen de la locación s como un campo espacial aleatorio. Un campo espacial aleatorio puede ser continuo o discontinuo dependiendo si las locaciones asociadas con la variable aleatoria son continuas o discontinuas. El valor de la media está dada en función de s

donde en el caso de una variable aleatoria escalar es la conductividad hidráulica isotrópica , el resultado es un número. Si la variable aleatoria es un tensor, tal caso es la conductividad hidráulica, entonces el resultado también es un tensor.

La covarianza de un campo aleatorio escalar, dada por dos locaciones s y s+r,donde r es la distancia del vector, dada por

(7.129)

y su correspondiente correlación es

Desde un punto de vista estadístico los parámetros descritos, en nuestro ejemplo de la conductividad hidráulica, que es ahora una función del espacio, hay dos nuevos conceptos que necesitamos considerar. El primero es el caso estacionario.

Un campo aleatorio X(s) es considerado estacionario si cumple:

1. Tiene un numero de varianzas finitas.

2. Tiene una media constante (independiente de la posición)

3. Tiene una covarianza que sólo depende de las distancias entre las locaciones de la variable aleatoria.

Así tenemos

(7.130)

(7.131)

R30

El segundo caso es el isotrópico. Un campo aleatorio es isotrópico cumplen con 1 y 2 del caso anterior, y la covarianza sólo depende de la magnitud de las diferencias entre la locaciones de los valores del campo aleatorio y no de la dirección.

Una función que está relacionada pero a diferencia de la covarianza en el variograma. Este está definido como la varianza de las diferencias entre dos variables del campo aleatorio una distancia r separada. El variogramanormalmente está escrito de la siguiente manera

donde está definida como la semivarianza. Está relacionada con la covarianza como

(7.133)

(7.132)

R

Lógicamente llamamos como la distancia entre dos puntos incrementados, las propiedades estadísticas estudiadas en dos puntos deberían convertirse en menos correlación. A estos dos medidas de esta tendencia son la escala de correlación y el rango de correlación. La escala de correlación λX está definida como

A la distancia r=λX la covarianza es aproximadamente la mitad de la varianza.

El semivariograma.Mientras ahora tenemos nociones básicas de la nomenclatura asociada con el campo aleatorio, tal como la conductividad hidráulica, no sabemos como generar un campo aleatorio continuo de un conjunto de medidas discretas. En otras palabras, como hacer determinar las propiedades estadísticas de la conductividad hidráulica en una locación donde las medidas no existen. El método más popular para llevar a cabo está meta es en interpolar un algoritmo llamado kriging, el cual se discutirá.

El semivarianza proviene de la ecuación (7.132) es claramente una función de distancia. Lo más cerca de las dos variables en la región sencible, entre más pequeño sea . A la grafica de una semivarianza se le conoce como una función de distancia r, es llamado un semivariograma.

Tenemos que dos semivariogramas están graficados en la en la figura 7.21. El semivariograma puede ser computado por las siguientes relación

Donde el superindice * indica el cálculo está hecho usando observaciones directas y N es el número de pares. El semivariograma puede ser interpretado como la mitad de la suma de las raíces de las diferencias en N observaciones pares, cada una con una separación r de una a otra, dividida por N.

Uno de los problemas con este concepto es que si el espacio es irregular, los cambios buscados en dos puntos exactamente a distancia r aparentemente es cero. Así hay magnitudes y direcciones de tolerancia construidas dentro del valor de r que están incluidas en la ecuación (7.134). El valor de r usado en el semivariograma graficado será el promedio de todas las distancias entre N pares buscados dentro de la tolerancia especifica.

(7.134)

Mientras el concepto de dato derivado directo de los variogramas podrían ser usados en kriging esto no es normalmente bien usado. El núcleo teórico del variograma exhibe, las propiedades geométricas son ocupadas. La forma más común de usar es el modelo de la exponencial, el cual está dado por

(7.135)

La terminología asociada con el variograma, como pozos u otros es la siguiente

•El valor de c0 está identificado con el concepto de pepita. Este término proporcionan la disolución de la medida del error. Esto identifica con la medida del punto en la intersección.

•El rango, mencionado anteriormente, es el factor que describe el grado de la correlación entre los datos de los puntos, usualmente denotado por distancia.

•El derrame (sill) es el valor del variograma como el valor cuando r→∞. Esto es igual al total de la varianza de el conjunto de datos y está dado por c en la ecuación (7.135).

KrigingKriging es un estimación desarrollada por G. Matheron y D.G. Krige y usada como un método de interpolación optima. En Kriging ordinario, una suposición básica es que la búsqueda antes de la variables aleatoria, es nuestro caso la distribución de la conductividad hidráulica es segundo orden estacionario. Los requerimientos para un caso estacionario están dados por las ecuaciones (7.130) y (7.131).mientras en la practica esto significa que distribución de la conductividad hidráulica es raramente constante.

Una aproximación del sorteo de este problema es primero crear una mejor superficie de interpolación para datos usando una función simple polinomial y datos disponibles en los puntos. Los resultados de estos datos son llamados desviación. Los residuos computacionales como las diferencias entre los actuales datos y la desviación, deberían en el concepto estacionario. Para el caso no estacionario tenemos kriging universal.

Kriging ( )uZ *

Planteamiento básico de la estimación por Kriging:

Considerar la estimación de ( )uZ como una combinación lineal de las

observaciones disponibles

( ) ( ) ( )∑=

=N

uZuuZ1

*

αααλ

y escoger los pesos bajo un criterio en el cual se considera que dicha estimación es óptima. Este es que el estimador sea insesgado y que

( ) ( )[ ]uZuZ *var − sea mínima

Kriging Simple ( )uZ *

El caso más simple se denomina kriging simple y la hipótesis básica es la estacionalidad junto con el hecho de que se asume que la media de la función aleatoria es conocida. Esto es,

( )( ) conocidaesy μμ=uZE

KRIGING SIMPLE

KRIGING ORDINARIOGeneralmente el valor de la media μ es desconocido y por lo tanto no se puede utilizar el kriging simple.El kriging ordinario establece una condición adicional al sistema de ecuaciones del kriging simple para filtrar el valor desconocido de la media. Al igual que antes el estimador propuesto es de la forma

( ) ( ) ( )∑=

=N

uZuuZ1

*

αααλ

UK ( )uZ *

KRIGING UNIVERSAL

El kriging universal asume que la función aleatoria Z se puede descomponer en la forma:

( ) ( ) ( )uuRuZ μ+=

Donde R es una función aleatoria estacionaria de orden 2 con E(R(u))=0 y m es una función no aleatoria dependiente de la localización u. Bajo estas hipótesis se tiene que:

( )( ) ( )( ) ( )umuREuZE +=

( )um=

Kriging Ordinario ( )uZ *

El primer paso para desarrollar la interpolación de Kriging es representar las estadísticas estacionarias como se define en la siguiente relación

(7.136)

Donde es la función de peso xi=1,2,…,N son los valores de los datos observados. Así el valor de la aproximación de la variable de interpolación es el peso de la suma de los datos existentes. La notación s0 implica una estimación pero la locación arbitraria y el uso del asterisco como superíndice implica una estimación.

R

Los cambios están definidos para una metodología que suministrará el peso de

si consideramos los datos de los puntos xi como una realización de una variable aleatoria, podemos a lo mejor usar las propiedades de las variables aleatorias para obtener los pesos. Dos condiciones son impuestas sobre la selección de los pesos, wi(s). El primero es que el estimador debe ser imparcial, del valor esperado de la variable aleatoria X*(s) es igual a μ. El resultado obligado es

(7.137)

Segundo este requiere que la varianza de la estimación de X(s0), la varianza de Kriging debe ser mínima. Para determinar primero definimos la cantidad

El cual es la diferencia entre la interpolación estimada de la variable aleatoria X, a saber X* y el verdadero valor de X en la locación s0. la varianza de Kriging estádefinida como

(7.138)

Para simplificar la situación nosotros redefinimos los términos X(s0) como X0. nosotros seguiremos el desarrollo de DeMarsily en la formulación de la ecuaciones de Kriging. Tenemos que sustituir la ecuación (7.136) en ecuación (7.38) y obtenemos

(7.139)

De la ecuación (7.132) tenemos

Nótese que el valor esperado del término que aparece en la ecuación (7.140) también aparece en la ecuación (7.139). Así sustituyendo la forma de la ecuación dentro la última obtenemos

(7.140)

(7.141)

Uno puede sacar el factor en el segundo término en el lado derecho de la ecuación (7.141) y en el tercer término. De ambas sumas son iguales a la ecuación (7.137), de los dos últimos términos se convierte en

Los cuales son idénticos. Así la ecuación (7.141) se reduce a

(7.142)

Recordando que nuestra meta fue minimizar la varianza de Kriging ecuación (7.138) sujeta a imponer por la ecuación (7.137) nuestro objetivo es convertir la función

Donde η es llamada el multiplicador de Lagrage. El multiplicador de Lagrage es introducido por que hay una o más ecuaciones que son desconocidas. El multiplicador de Lagrage agrega desconocido fuera de la ecuación (7.142) el valor mínimo para f(w1,…,wn,η) está realizado por una diferenciación f(w1,…,wn,η) con respecto a N+1 desconociendo los valores w1,…,wn,η y puesta en cada resultado N+1 ecuaciones cero. El resultado es

La ecuación (7.43) podemos resolver los pesos y el coeficiente η. Sustituyendo dentro de la ecuación (7.136) permite obtener un valor de la variable aleatoria X en algún punto (s0).

Es también posible estimar el valor de la varianza del error. Recordando que la varianza del error está dada por la ecuación (7.138) es

(7.143)

Por lo tanto sustituyendo en la ecuación (7.143) dentro de la ecuación (7.142) la varianza del error puede ser computada para el punto s0.