Runge Kutt A
-
Upload
pruebaprueba123 -
Category
Documents
-
view
243 -
download
0
description
Transcript of Runge Kutt A
THI, Integracion numerica Sistemas
de EDOs: Metodos de Runge-Kutta
C. Palencia ([email protected])
ETSI Telecomunicacion, UVA
Determinismo vs sistemas de EDOs
Los problemas de valores inciales relativos a los sistemas de
Ecuaciones Diferenciales Ordinarias (SEDOs) son muy frecuentes
en las Leyes de la Naturaleza y en el modelado de un sinnumero
de situaciones, pues son la expresion matematica de la idea de
determinismo.
Supongamos que cierto sistema (de cualquier naturaleza) esta
totalmente descrito, en un instante dado t ∈ R, toda vez que
conocieramos un vector de estado x ∈ Ωt ∈ Rd correspondiente a
dicho instante. El conjunto Ωt recoge todos los estados potencial-
mente concebibles, los diferentes estados que el sistema podrıa
adoptar el en instante t.
1
En ciertos instantes t0 ∈ R podemos llevar a cabo mediciones del
vector de estado del sistema y nos proponemos, sobre la base
de esta unica medicion, tanto anticipar como volver la vista al
pasado, saber cual sera o era el vector de estado en cualquier
instante diferente de t0. En algunas ocasiones, en lugar de medir,
estamos en condiciones de forzar la situacion de suerte que en
t0 el sistema adopte un estado admisible (en Ωt0) a nuestra
eleccion y nos planteamos entonces el mismo objetivo (en rigor
ahora hacia el futuro).
Una evolucion concreta de dicho sistema vendra dada por una
curva u : I ⊂ R→ Rd de suerte que u(t) es el vector de estado que
corresponde al sistema en el instante t ∈ I. En este contexto, I
es el intervalo que consta de todos los instantes para los cuales
tiene sentido concebir la materializacion del sistema.2
La hipotesis determinista se puede formular diciendo que u(t),
para cualquier t ∈ I, es una funcion de u(t0) y del propio t0 ∈ R.
Debe existir por tanto una aplicacion
Φ : Dom (Φ) ⊂ R× R× Rd → Rd
tal que
Φ(t, t0,x0) = vector de estado en t sabiendo que en t0 es x0.
El dominio de definicion Dom consta de los tripletes
(t, t0,x0) ∈ R× R× Rd
tales que x0 ∈ Ωt0 y t pertenece al intervalo donde tiene sentido
hablar de la evolucion que corresponde a la observacion (t0,x0).
3
Sea ahora u : I ⊂ R→ Rd una evolucion del sistema y tomemos
dos instantes t0, t1 ∈ I. Por definicion,
u(t0) = Φ(t0, t0,u(t0))
y, para todo t ∈ I,
u(t) = Φ(t, t0,u(t0)) = Φ(t, t1,u(t1)) = Φ(t, t1,Φ(t1, t0,u(t0))).
Estas propiedades definen lo que llamamos un flujo (en este
contexto). No es difıcil probar el siguiente aserto: supongamos
que Φ es diferenciable en la primera variable, llamemos
Ω = (t,x) ∈ R× Rd : (t, t,x) ∈ Dom (Φ)
y sea f : Ω→ R la aplicacion dada por f(t,x) = ∂1Φ(t, t,x).
4
Entonces se puede demostrar que toda evolucion u : I ⊂ R→ Rd
del sistema cumple
u′(t) = f(t,u(t)), t ∈ I,
esto es, las evoluciones se rigen por un SEDOs de primer orden.
Evidentemente es mucho mas sencillo afirmar algo sobre la velocidad
del estado, conocido el estado del sistema, que hacer predicciones.
No es de sorprender pues que los modelos deterministas se formulen
habitulmente mediante un SEDOs (generador infinitesimal del
flujo), lo mismo que las Leyes fısicas de tipo determinista.
5
Por otra parte, con frecuencia, por ejemplo en mecanica o en
circuitos, el determinismo se expresa diciendo que conocida la
configuracion de sistema u(t0) en un instante y, conocida la
velocidad del mismo u′(t0) en el mismo, entonces la configuracion
u(t) esta determinada en todo tiempo t ∈ I. Esta situacion se
reduce a la anterior sin mas que llamar vector de estado al
vector ampliado [u(t),u′(t)]T ∈ R2d. En terminos de SEDOs,
esto conduce a que u(t) es solucion de un SEDOs de segundo
orden
u′′(t) = g(t,u(t),u′(t)),
como ya sabemos por ejemplo ocurre en la mecanica. A su vez,
los sistemas de segundo orden se reescriben como sistemas de
primer orden para el vector ampliado [u(t),u′(t)]T , por lo que en
el resto de la exposicion nos limitaremos a estos ultimos.
6
Es una cuestion de hecho que, salvo en contadas ocasiones,
no es posible integrar un SEDOs vıa algoritmos basados en
cuadraturas. Por ello es necesario recurrir a metodos numericos.
Antes de proseguir, vamos a hacer algunos comentarios sobre la
unicidad y la propagacion de errores en los SEDOs.
Nos centramos en la aplicacion f : Ω ⊂ R× Rd → Rd que define
un SEDO sistema. Las variables son mudas, pero las vamos a
denotar por (t,x) ∈ Ω. Fijada una condicion inicial (t0,x0) ∈ Ω,
planteamos el problema de Cauchy (problema de valores iniciales)
(1)
x′(t) = f(t,x(t)),x(t0) = x0.
Sin otra suposicion que la continuidad de f , se puede demostar
(Teorema de Peano( que el problema tiene al menos una solucion
siempre que (t0,x0) sea interior a Ω.
7
Es de interes la situacion en la que f admite una constante de
Lipschitz L ≥ 0 respecto de x, es decir, cuando
‖f(t,x2)− f(t,x1)‖ ≤ L‖x2 − x1‖, (t,x1), (t,x2) ∈ Ω.
Esta condicion se cumple “localmente”siempre que f admita
parciales contuinuas respecto de x. La existencia de una constante
de Lipschitiz local implica la unicidad: dos posibles soluciones del
PC (1) han de coincidir en el intervalo comun de definicion. Si L
es global, entonces dadas dos soluciones del sistema uj : Ij → Rd,con t0 ∈ I1 ∩ I2, tenemos
‖u2(t)− u1(t)‖ ≤ exp(L|t− t0|)‖u2(t0)− u1(t0)‖, t ∈ I1 ∩ I2.
Esta desigualdad da una cota (pesimista en muchos casos, pero
alcanzable en otros) sobre la separacion entre distintas soluciones.
Observemos que implica la unicidad.
8
Metodos de un paso
Si bien en ciertos casos particulares es posible obtener las soluciones
de (1) mediante un algoritmo basado en cuadraturas (cuadraturas
es en este contexto sinonimmo de primitivas)), lo cierto es que
por regla general hay que trabajar con algun metodo numerico
para aproximar las soluciones. Lagrange demostro que para la
ecuacion de Ricatti
u′(t) + u(t)2 = λ/t
no existe algoritmo alguno (basado en cuadraturas) que la permita
integrar (esto sucede para una infinidad de valores de λ).
9
Dado un paso temporal ∆t > 0, nos proponemos pues aproximar
los valores u(tn) de la solucion de (1) en los niveles discretos
tn = t0 + n∆t, 0 ≤ n ≤ N . Estos niveles recorren el intervalo
[t0, t0 + T ], con T = N∆t. Las aproximaciones numericas de
u(tn) se denotaran por un ∈ Rd, 0 ≤ n ≤ N .
La forma en la que se obtienen estas aproximaciones depende
naturalmente del metodo numerico. En los llamados metodos
explıcitos de un paso, que son los que vamos a estudiar, los
valores numericos un, 0 ≤ n ≤ N , vienen definidos recursivamente
en la forma
(2)
un+1 = un + ∆tδ(∆t, tn,un), 1 ≤ n ≤ N − 1,u0 = u(t0).
10
La aplicacion δ(∆t, t,x) viene dada por el metodo. Depende de
(d+ 2) variables (∆t, t,x) ∈ Ω∗ ⊂ R× R× Rd y el metodo numerico
ha de precisar la manera de obtener δ en terminos de f , sin
hacer llamada a las soluciones de (1). Notemos que δ tiene las
dimensiones de f . De hecho, siempre δ ≈ f .
Posponemos por ahora la obtencion efectiva de los metodos
numericos. Pasamos a estudiar la convergencia, pues este estudio
se lleva a cabo bajo condiciones muy amplias y nos servira de
ayuda a la hora de construir los metodos. El estudio de la
convergencia se hace a traves de los conceptos fundamentales
de consistencia y estabilidad.
11
Consistencia y Estabilidad
Los llamados errores de truncacion del metodo τn ∈ Rd, 0 ≤ n ≤ N ,correspondientes a la solucion u, se definen como los residuosque produce dicha solucion continua en las ecuaciones discretasdel metodo, es decir
(3) un+1 = un + ∆td(∆t, tn,un) + τn+1.
Notemos que τn no depende en absoluto de los valores discretos.No hay que confundir los errores de truncacion con los erroresdel metodo, que naturalmente son
en = u(tn)− un, 0 ≤ n ≤ N.Si bien no tenemos forma practica de calcular los errores detruncacion, pues hacen referencia a la solucion continua, si quees posible estimar su norma, lo que sera suficiente para el analisisde la convergencia.
12
Se dice que el metodo es consistente de orden p ≥ 0 entero,
cuando admitiendo que f tiene p derivadas continuas (esto implica
que u tiene p+ 1 derivadas continuas) se cumple que
(4) ‖τn‖ ≤ Cckp+1, 0 ≤ n ≤ N,
donde Cc > 0 es una constante que solo depende del metodo y
de las derivadas de ordenes ≤ p de f y de las de orden ≤ p+ 1
de u. Es importante notar de nuevo que el orden consistencia
depende unicamente de la solucion u y del comportamiento de
f alrededor de la misma, no depende por tanto de los valores
numericos obtenidos por el metodo.
13
Para el estudio de la convergencia vamos a combinar la consistenciaya definida con la estabilidad. Esta ultima nocion se refiere alcomportamiento del metodo numerico frente a perturbaciones, yes por tanto independiente de la solucion continua. Supongamosque resolvemos la recurrencia (2) de manera aproximada, desuerte que en cada paso introducimos una perturbacion εn, 0 ≤ n ≤ N ,y en realidad computamos la nueva recurrencia
(5)
u∗n+1 = u∗n + ∆tδ(∆t, tn,u∗n) + εn, 1 ≤ n ≤ N − 1,
u0 = u(t0) + ε0.
Nos preguntamos por la dependencia de u∗n respecto de las perturbaciones.Esto conduce a la siguiente definicion: Diremos que el esquemanumerico (2) es estable cuando exista un constante Ce (independientede las perturbaciones en (5) tal que
‖u∗n − un‖ ≤ Cen∑
j=0
‖εj‖, 1 ≤ n ≤ N.
14
La constante Ce puede depender de la longitud T = tN − t0 delintervalo de integracion, pero no del paso temporal ∆t > 0 utilizado.La estabilidad esta ligada exclusivamente al metodo numerico,siendo pues independiente de las soluciones del problema continuo(1).
Vamos a enunciar el teorema central: Consistencia y estabilidadimplican convergencia.
TEOREMA. Sea p ≥ 1 entero. Supongamos que (i) f admiteparciales continuas de orden p, (ii) el metodo numerico es consistentede orden p con constante Cc para u y (iii) el metodo numerico esestable con constante Ce. Supongamos que el metodo numericoempieza en un valor u0 ∈ Rd. Entonces se tiene la siguienteacotacion para el error(6)‖u(tn)− un‖ ≤ Ce‖u(t0)− u0‖+ CcCe(tn − t0)∆tp, 1 ≤ n ≤ N.
15
La demostracion del teorema es muy sencilla, basta considerar
que los valores u(tn) son solucion de la recurrencia perturbada
por los terminos εn = τn, esto conduce directamente a
‖en‖ ≤ Ce‖e0‖+ CenCc∆tp+1 = Ce‖e0‖+ (tn − t0)CcCe∆tp, 0 ≤ n ≤ N,
donde hemos denotado en = u(tn)− un.
Bajo las condiciones del Teorema, se dira que el metodo es
convergente de orden p, pues ciertamente el error es O(∆tp)
siempre que ‖u0 −U0‖ = 0 o bien sea a lo sumo ‖u0 −U0‖ = O(∆tp).
16
Es pues importante el disponer de algun criterio de estabilidad.Vamos a probar que si la funcion δ del metodo es lipchitzianarespecto de la variable x, es decir, si existe L ≥ 0 tal que
‖δ(∆t, t,x2)− δ(∆t, t,x1)‖ ≤ L‖x2 − x1‖, (∆t, t,x1), (∆t, t,x2) ∈ Ω∗,
entonces el esquema numerico (2) es estable. Esto se basa en ellema siguiente, cuya demostracion es elemental por induccion.
LEMA. Sean en ≥ 0, ρn ≥ 0, 0 ≤ n ≤ N , dos sucesiones finitastales que
en+1 ≤ (1 + L∆t)en + ρn+1, 0 ≤ n ≤ N − 1,
donde L > 0 y ∆t > 0 son fijas. Entonces, para 1 ≤ n ≤ N , secumple
(7) en ≤ exp(Ln∆t)e0 + exp(L(n− 1)∆t)n∑
j=1
ρj.
17
Se concluye directamente del lema que si la funcion δ es lipschitziana
respecto de x, con constante L ≥ 0, entonces el esquema numerico
es estable con constante Ce = exp(L(tN − t0)).
La presencia del factor exponencial hace que la acotacion para
el error sea muy mala cuando L(tN − t0) sea grande. Ası, las
cotas no son significativas sobre intervalos largos. Los metodos
explıcitos adolecen siempre de esta limitacion. Para obviarla
se deben utilizar metodos implıcitos, cuyo estudio abordamos
posteriormente.
18
El estudio de la consistencia es bastante mas difıcil. Supondremosque f admite derivadas parciales continuas hasta el orden p ≥ 0.Vamos a explicar como es posible calcular las derivadas de u(t)directamente en terminos de las derivadas de f en el punto(t,u(t)). En efecto, el propio sistema de ecuaciones diferencialesproporciona la derivada primera
u′(t) = f(t,u(t)).
Volviendo a derivar respecto de t, encontramos
u′′(t) = ft(t,u(t)) + fx(t,u(t)) u′(t)
= ft(t,u(t)) + fx(t,u(t)) f(t,u(t)),
donde fx denota la matriz jacobiana
fx = [fx1, fx2, . . . , fxd] ∈ Rd×d.
19
Derivando de nuevo la ultima expresion hallamos
u′′′(t) = ft,t + ft,xf + fx,tf + fx,x · f · f + fxft + fxfxf ,
donde el segundo miembro esta evaluado en (t,u(t)) y hace
llamada a las diferenciales de segundo orden de f .
El proceso se puede iterar, llegandose a la conclusion de que
todas las derivadas u(j)(t), 0 ≤ j ≤ p+ 1 son expresables mediante
composiciones de ciertas derivadas de f actuando en el punto
(t,u(t)) ∈ Ω. Se puede comprobar que, para 1 ≤ j ≤ p, existen
funciones f [j](t,x), definidas para cualquier punto (t,x) ∈ Ω, que
son expresables en terminos de las derivadas de f hasta el orden
j − 1, y tales que
u(j)(t) = f [j](t,u(t)).
20
Lo cierto que las expresiones que dan f [j], j ≥ 3, se complican
muchısimo. En realidad, esta es una de las grandes dificultades
que surge en la construccion y analisis de los metodos numericos
para los sistemas de EDOs.
Podemos enunciar el siguiente teorema, que resuelve el estudio
de la consistencia.
TEOREMA. Supongamos que f admite derivadas hasta el orden
p y que estas son continuas. El metodo numerico es consistente
de orden p si, y solamente si, la funcion δ del metodo cumple
δ(∆t, t,x) =
p∑j=1
∆tj−1
rj!f [j](t,x) + O(∆tp), (t,x) ∈ Ω.
21
Metodos de Taylor El metodo de Taylor de orden p adoptala forma
δ(∆t, t,x) =
p∑j=1
∆tj−1
j!f [j](t,x).
Trivialmente es de orden p. En particular tendremos:
(1) El metodo de Taylor de orden p = 1,
δ(∆t, x,x) = f [1](t,x) = f(t,x).
(2) El metodo de Taylor de orden p = 2,
δ(∆t, x,x) = f [1](t,x) +∆t
2f [2](t,x)
= f(t,x) +∆t
2
(fx(t,x)f(t,x) + ft(t,x)
).
22
No hay problema en cuanto a la estabilidad se refiere, siempre quef admita derivadas parciales continuas de los ordenes adecuados,pues ya sabemos que toda funcion diferenciable con continuidades lipschitziana.
Tradicionalmente se consideraba que los metodos de Taylor deordenes superiores eran poco practicos, pues es muy costosoobtener las expresiones de f [j](t,x), 2 ≤ j ≤ p. En efecto, aunquedispusieramos de alguna aplicacion capaz de llevar a cabo laderivacion simbolica (MAPLE o MATHEMATICA, por ejemplo),es frecuente que la escritura de f [j] requiera varias paginas,incluso para funciones f sencillas. Sin embargo, recientementeel panorama ha cambiado y se espera cierto crecimiento de usode los metodos de Taylor. La razon es que en la actualidadse han desarrollado programas que son capaces de evaluar f [j]
directamente, sin necesidad de escribir estas funciones.
23
Metodos de Runge–Kutta Estos metodos de nacen con la
idea de evitar el calculo de derivadas de f . Ası, estos metodos
proponen expresiones para δ que unicamente conllevan evaluaciones
de la propia funcion f . En la acualidad son los metodos mas
eficientes para la integracion de SEDOs.
Un metodo de Runge–Kutta explıcito tiene asociado un entero
s ≥ 1, llamado el numero de etapas del metodo, que indica las
veces que hay que evaluar f para calcular δ. Para describir el
metodo son precisos ciertos parametros que denotamos por dos
vectores
c = clsl=1, b = blsl=1 ∈ Rs
y una matriz A = ak,lsk,l=1 ∈ Rs×s.
24
Generalmente, las componentes de c se ordenan de forma creciente
y estan contenidas en el intervalo [0,1],
0 ≤ c1 ≤ c2 ≤ · · · ≤ cs ≤ 1.
Dichas componentes se interpretan como nodos de cuadratura.
Las componentes de b son pesos de cuadratura para la integral
sobre [0,1], mientras que la k-esima de A son pesos para la
integral sobre [0, ck], 1 ≤ k ≤ s. Ası, dada una funcion g : [0,1]→ Rd,tenemos en mente que∫ 1
0g(σ)dσ ≈
s∑k=1
bkg(cl),
∫ ck
0g(σ)dσ ≈
s∑l=1
ak,lg(cl), 1 ≤ k ≤ s.
25
Cuando estemos trabajando en el intervalo [tn, tn+1], 0≤ n ≤ N − 1,
las cuadraturas se conviertiran en∫ tn+1
tn
g(t)dt ≈∆t
s∑k=1
bkg(tkn),
∫ tln
tn
g(t)dt ≈∆t
s∑l=1
ak,lg(tln), 1 ≤ k ≤ s,
donde hemos introducido la notacion tln = tn + ∆tcl, 1 ≤ l ≤ s,que constituyen las llamadas abscisas intermedias.
26
En principio, para la solucion continua escribimos
u(tn+1)− u(tn) =
∫ tn+1
tn
f(t,u(t))dt ≈∆t
s∑k=1
bkf(tlnk,u(tkn)),
e
u(tkn)− u(tn) =
∫ tkn
tn
f(t,u(t))dt ≈∆t
s∑l=1
ak,lf(tln,u(tln)), 1 ≤ k ≤ s.
El metodo de Runge–Kutta trata de emular esto al nivel discreto
y para ello, junto con las aproximaciones un ≈ u(tn), debe construir
aproximaciones ukn ≈ u(tkn), 1 ≤ k ≤ s, llamadas etapas intermedias.
27
Ası, alcanzada la aproximaacion un, el metodo consiste en hacer
un+1 = un + ∆t
s∑k=1
bkf(tlnk,ukn),
donde las etapas se definen por
ukn = un + ∆t
s∑l=1
ak,lf(tln,uln), 1 ≤ k ≤ s.
En general, se trata de un sistema de ecuaciones para las etapas.
28
En los metodos explıcitos (matriz A triangular inferior) la primera
etapa es siempre
u1n = un
y las restantes se obtiene recursivamente como
ukn = un + ∆t
k−1∑l=1
ak,lf(tln,uln), 2 ≤ k ≤ s,
y no hay neecesidad de resolver sistema alguno.
Es claro que la mayor precision de las formulas de cuadratura
redundara en un mayor orden de consistencia, pero es un tema
muy delicado. La combinacion final de las etapas puede dar
lugar a un orden de consistencia mayor que el individual que
correspionde a las cuadraturas de definidas por las filas de A.
29
La funcion δ del metodo se escribe como un promedio con pesos
b1, b2, . . . , bs ∈ R de funciones mas sencillas
δ(k, t,x) =s∑
j=1
bjFj(∆t, t,x),
donde las nuevas funciones F1,F2, . . . ,Fs ∈ Rd se definen recursivamente
como
F1(∆t, t,x) = f(t+ c1∆t,x)
y por
Fk(∆t, t,x) = f(t+ ck∆t,x + ∆t
k−1∑l=1
ak,lFl(∆t, t,x)), 2 ≤ k ≤ s.
Es claro que si f es lipchitziana en x con constante L, entonces
δ lo es con consante∑sk=1L
s, lo que garantiza la estabilidad.
30
En terminos de las funciones anteriores el metodo se puede
escribir como
un+1 = un + ∆t
s∑k=1
bkFkn,
donde
F1n = f(t1n,un),
y
Fkn = f(tkn,un + ∆t
k−1∑l=1
ak,lFln), 2 ≤ k ≤ n.
Ası, tenemos dos formar de implementar el metodo, vıa las
etapas intermedias ukn o vıa las pendientes intermedias Fkn. En
todo caso son precisas s evaluaciones de la funcion f .
31
Notemos la relacion, para 1 ≤ k ≤ n
Fkn = f(tkn,ukn); ukn = un + ∆t
s∑l=1
ak,lFln.
Comentemos que el estudio del orden para los metodos de Runge–
Kutta es difıcil y hasta la decada de los 60 no se ha establecido
la teorıa general, debida a Butcher.
Seguidamente vamos a dar los parametros e indicar los ordenes
de los metodos clasicos. Es recomendable hacer el ejercicio de
comprobar que los ordenes son los indicados, al menos para los
metodos de orden ≤ 2.
32
1.Metodo de Euler: p = 1, s = 1 c1 = 0, b1 = 1, A = [0].
un+1 = un + kf(tn,un).
2. Metodo de Euler modificado:
p = 2, s = 2, c = [0,1/2]T , b = [0,1]T , A =
[0 0
1/2 0
].
un+1 = un + kF2n,
donde
F1n = f(tn,un),
F2n = f
(tn + (k/2),un + (k/2)F1
n
).
33
3. Metodo de Euler mejorado: p = 2, s = 2, c = [0,1]T , b = [1/2,1/2]T ,
A =
[0 01 0
].
un+1 = un + (k/2)[F1n + F2
n
],
donde
F1n = f(tn,un),
F2n = f(tn + k,un + kF1
n).
34
4. Regla de Heun de tercer orden: p = 3, s = 3, c = [0,1/3,2/3]T ,
b = [1/4,0,3/4]T ,
A =
0 0 01/3 0 0
0 2/3 0
.un+1 = un + (k/4)
[F1n + 3F3
n
]donde
F1n = f(tn,un),
F2n = f(tn + (k/3),un + (k/3)F1
n),
F3n = f(tn + (2k/3),Uun + (2k/3)F2
n),
35
5. El metodo de Runge–Kutta de tercer orden: p = 3, s = 3,
c = [0,1/2,1]T , b = [1/6,2/3,1/6]T ,
A =
0 0 01/2 0 0−1 2 0
.un+1 = un + (k/6)
[F1n + 4F2
n + F3n
],
donde
F1n = f(tn,un),
F2n = f(tn + (k/2),un + (k/2)F1
n),
F3n = f(tn + k,un − kF1
n + 2kF1n).
36
6. El metodo de Runge–Kutta de cuarto orden (“El metodo deRunge–Kutta”):
p = 4, s = 4, c = [0,1/2,1/2,1]T , b = [1/6,1/3,1/3,1/6]T ,
A =
0 0 0 0
1/2 0 0 00 1/2 0 00 0 1 0
.un+1 = un + (k/6)
[F1n + 2F2
n + 2F3n + F4
n
],
donde
F1n = f(tn,un),
F2n = f(tn + (k/2),un + (k/2)F1
n),
F3n = f(tn + (k/2),un + (k/2)F2
n),
F4n = f(tn + k,un + kF3
n).
37
Metodos implıcitos
Vamos a considerar un sistema de d ecuaciones diferenciales
u′(t) = f(t,u(t)).
Consideremos dos soluciones u1(t), u2(t). Es de gran interes elestudio del comportamiento de las diferencias
‖u2(t)− u1(t)‖en terminos de su discrepancia en un tiempo inicial t0.
Tıpicamente se disponen de cotas del tipo
‖u2(t)− u1(t)‖ ≤ K exp(L|t− t0|)‖u2(t0)− u1(t0)‖,donde L es esencialmente una cota de las derivadas primeras def en una region (convexa) que contenga a ambas soluciones.
38
Cuando discreticemos en tiempo hemos de comparar u(tn) con
un y, como es logico, no podemos esperar nada mejor de lo que
sucede con la propagacion de las discrepancias de las soluciones
continuas. Ası, en general, para un metodo de orden p podremos
esperar una cota como sumo del tipo
‖u(tn)− un‖ ≤ K exp(L|tn − t0|)|∆t|p.
Estas cotas son poco o nada significativas cuando L|tn − t0| es
grande. Lamentablemente, esta situacion se produce de forma
muy habitual.
Cuando L es grande se dice que el sistema es rıgido (stiff).
39
Una situacion de gran interes aplicado es la que encontramoscunado el problema esta razonablemente bien puesto en un sentidode avance del tiempo, pongamos para t ≥ t0. Es decir, nosvamos a centrar en situaciones para las que (i) Las derivadasde f pueden ser grandes (gran rigidez), pero (ii) a pesar de esto
‖u2(t)− u1(t)‖ ≤ C(t− t0)‖u2(t0)− u1(t0)‖, t > t0,
donde C crece moderadamente (o no la hace en absoluto) cont− t0 > 0.
Es de pues de interes el diponer de metodos numericos de integracionque, para problemas rıgidos pero unidireccionalmente bien puestos(en el sentido anterior), sean capaces de proporcionar aproximacionesnumericas sujetas a cotas de error del tipo
‖u(tn)− un‖ ≤ C(tn − t0)|∆t|p, tn > t0,
con C de crecimiento moderado.40
Para avanzar en esta direccion se estudia primero la llamada
ecuacion test: se fija un parametro complejo λ con <λ ≤ 0 y se
considera la ecuacion
u′(t) = λu(t).
Siendo la solucion de la forma
u(t) = exp(λt)u(0),
se comprende que independientemente de la ridigez (valor de |λ|,el problema esta bien puesto (controlado) para t > 0.
41
Por comprobacion directa, se ve que el resultado de aplicar un
metodo de RK explıcito, con s etapas, a la ecuacion test lleva a
una recurrencia
un+1 = Ps(λ∆t)un, n ≥ 0,
donde Ps es un polinomio de grado s. Es decir,
un = Ps(λ∆t)nu0, n ≥ 0.
En el momento en el que |Ps(λ∆t)| > 1, cosa que puede suceder
si pensamos que λ puede ser muy grande, la solucion numerica
crece exponencialmente con n, a pesar de que la continua permanece
acotada.
Ningun metodo explıcito es pues adecuado para integrar la ecuacion
test en la situacion de gran rigidez.
42
Por ejemplo, el metodo de Euler explıcito, aplicado a la ecuacion
test, lleva a
un+1 = (1 + λ∆t)nu0, n ≥ 1,
que es absolutamente inadecuado en la situacion |λ| grande, salvo
que ∆t sea extremadamente small.
Los metodos implıcitos van a superar estas limitaciones, si bien
seran mas costosos, pues necesitan resolver sistemas no lineales
de ecuaciones. Nos limitaremos al metodo de Euler y a la regla
del punto medio.
43
Metodo de Euler implıcito
Para el PC
u′(t) = f(t,u(t)), u(t0) = u0,
partiendo de u0, se definen las aproximaciones un ≈ u(tn) por la
recurrencia:
un+1 = un + ∆tf(tn+1,un+1),
Cada paso necesita pues resolver un sistema de ecuaciones para
determinar el vector un+1.
44
La propiedad mas importante es que, para t > t0, conserva la
contractividad: supongamos que para cada par u1, u2 de soluciones
del sistema de EDOs se tuviera
‖u2(t)− u1(t)‖ ≤ ‖u2(t0)− u1(t0)‖, t ≥ t0.
Entonces, para las respectivas soluciones numericas (vıa Euler
implıcito) (denotadas por la misma letra con subındices)
‖u2,n − u1,n‖ ≤ ‖u2(t0)− u1(t0)‖, tn ≥ t0.
45
Por ejemplo, para la ecuacion test, el metodo genera las aproximaciones
un =u0
(1− λ∆t)n, n ≥ 1,
que, cuando <λ ≤ 0 y ∆t > 0, heredan la contractividad, pues
entonces
|1− λ∆t| ≥ 1.
46
Mas en general, si V es un funcional convexo (definido en el
espacio donde tomas valores las soluciones del sistema de EDOs)
y si V decrece a lo largo de todas las soluciones, es decir,
V (u(t)) ≤ V (u(s)), t ≥ s,
cualquiera que sea la solucion del sistema de EDOs, entonces
V (un+1) ≤ V (un),
para todas las aproximaciones vıa el metodo de Euler implıcito.
47
En lo relativo al error y la el metodo de Euler implıcito, se
obtienen cotas del tipo
‖u(tn)− un‖ ≤ Ctn(∆t), n ≥ 0,
donde C es una cota de la derivada segunda de la solucion.
48
Regla del punto medio
Para el PC
u′(t) = f(t,u(t)), u(t0) = u0,
partiendo de u0, se definen las aproximaciones un ≈ u(tn) por la
recurrencia:
un+1 = un + ∆tf((tn+1 + tn)/2, (un+1 + un)/2, ), n ≥ 0.
Cada paso necesita pues resolver un sistema de ecuaciones para
determinar el vector un+1.
49
Aplicada a la ecuacion test,
u′(t) = λu(t), u(0) = u0,
la regla del punto medio proporciona aproximaciones
un+1 = ∆tλun + un+1
2,
es decir
un+1 =1 + ∆tλ/2
1−∆tλ/2un,
o bien, de forma global,
un =
(1 + ∆tλ/2
1−∆tλ/2
)nu0, n ≥ 0.
50
Observamos que, para <λ ≤ 0,∣∣∣∣1 + ∆tλ/2
1−∆tλ/2
∣∣∣∣n ≤ 1, n ≥ 0,
lo que garantiza la estabilidad con independencia de la rigidez.
51
Una propiedad muy importante es que si la distancia entre dossoluciones arbitrarias del sistema de EDOs se conserva en unanorma que derive de un producto interno (es decir, supongamosque para cada par u1, u2 de soluciones del sistema de EDOs setuviera
‖u2(t)− u1(t)‖ = ‖u2(t0)− u1(t0)‖,
donde ‖ · ‖ es una norma que provenga de un producto interno),entonces, para las respectivas soluciones numericas (vıa la regladel punto medio) tambien se tiene la conservacion de distancias:
‖u2,n − u1,n‖ = ‖u2(t0)− u1(t0)‖, tn ≥ t0.
Tambien se puede demostrar que si un funcional cuadraticodecrece (o se conserva) a lo largo de todas las soluciones delsistema de EDOs, entonces lo mismo sucede con los valores delfuncionional a lo largo de las soluciones discretas (punto medio).
52