Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf ·...

221
E.T.S. DE INGENIER ´ IA INFORM ´ ATICA Apuntes de ´ ALGEBRA NUM ´ ERICA para la titulaci´ on de INGENIER ´ IA INFORM ´ ATICA Fco. Javier Cobos Gavala

Transcript of Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf ·...

Page 1: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

E.T.S. DE INGENIERIA INFORMATICA

Apuntes de

ALGEBRA NUMERICA

para la titulacion de

INGENIERIA INFORMATICA

Fco. Javier Cobos Gavala

Page 2: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion
Page 3: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Contenido

Portada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

Contenido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1 Ecuaciones no lineales 7

1.1 Errores y condicionamiento en problemas numericos . . . . . . 8

1.2 Metodo y algoritmo de la biseccion: analisis de errores . . . . 12

1.3 Punto fijo e iteracion funcional . . . . . . . . . . . . . . . . . . 19

1.4 Analisis del metodo de Newton-Raphson . . . . . . . . . . . . 25

1.4.1 Metodo de Newton generalizado . . . . . . . . . . . . . 31

1.5 Un problema mal condicionado: ceros de un polinomio . . . . 34

1.5.1 Sucesiones de Sturm . . . . . . . . . . . . . . . . . . . 38

1.5.2 Algoritmo de Horner . . . . . . . . . . . . . . . . . . . 41

1.6 Sistemas de ecuaciones no lineales . . . . . . . . . . . . . . . . 43

1.6.1 Metodo de Newton para sistemas . . . . . . . . . . . . 46

1.7 Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . 48

1.8 Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . 59

2 Sistemas de ecuaciones lineales 67

2.1 Normas vectoriales y matriciales . . . . . . . . . . . . . . . . . 67

2.1.1 Normas vectoriales . . . . . . . . . . . . . . . . . . . . 68

2.1.2 Distancia inducida por una norma . . . . . . . . . . . . 68

2.1.3 Convergencia en espacios normados . . . . . . . . . . . 69

2.1.4 Normas matriciales . . . . . . . . . . . . . . . . . . . . 70

3

Page 4: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

4 Contenido

2.1.5 Transformaciones unitarias . . . . . . . . . . . . . . . . 72

2.1.6 Radio espectral . . . . . . . . . . . . . . . . . . . . . . 73

2.2 Sistemas de ecuaciones lineales . . . . . . . . . . . . . . . . . . 77

2.2.1 Numero de condicion . . . . . . . . . . . . . . . . . . . 80

2.3 Metodos directos de resolucion de sistemas lineales . . . . . . 86

2.3.1 Factorizacion LU . . . . . . . . . . . . . . . . . . . . . 86

2.3.2 Factorizacion de Cholesky . . . . . . . . . . . . . . . . 90

2.4 Metodos iterados de resolucion de sistemas lineales . . . . . . 93

2.4.1 Metodo de Jacobi . . . . . . . . . . . . . . . . . . . . . 98

2.4.2 Metodo de Gauss-Seidel . . . . . . . . . . . . . . . . . 99

2.4.3 Metodos de relajacion (SOR) . . . . . . . . . . . . . . 99

2.5 Metodos del descenso mas rapido y del gradiente conjugado . 100

2.5.1 Metodo del descenso mas rapido . . . . . . . . . . . . . 102

2.5.2 Metodo del gradiente conjugado . . . . . . . . . . . . . 103

2.6 Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . 104

2.7 Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . 108

3 Sistemas inconsistentes y sistemas indeterminados 115

3.1 Factorizaciones ortogonales . . . . . . . . . . . . . . . . . . . . 115

3.1.1 Factorizacion QR de Gram-Schmidt . . . . . . . . . . . 115

3.1.2 Factorizacion QR mediante rotaciones . . . . . . . . . 116

3.1.3 Factorizacion QR de Householder . . . . . . . . . . . . 118

3.2 Sistemas superdeterminados.Problema de los mınimos cuadrados127

3.2.1 Transformaciones en sistemas superdeterminados . . . 130

3.3 Descomposicion en valores singulares y pseudoinversa de Penrose133

3.3.1 Pseudoinversa de Penrose . . . . . . . . . . . . . . . . 134

3.4 Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . 136

3.5 Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . 142

4 Autovalores y autovectores 157

4.1 Conceptos basicos . . . . . . . . . . . . . . . . . . . . . . . . . 157

Page 5: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Contenido 5

4.2 Matrices normales . . . . . . . . . . . . . . . . . . . . . . . . . 162

4.3 Metodos iterados para la obtencion de autovalores y autovectores168

4.3.1 Metodo de la potencia simple y variantes . . . . . . . . 168

4.3.2 Algoritmo QR de Francis . . . . . . . . . . . . . . . . . 178

4.3.3 Metodo de Jacobi para matrices simetricas reales . . . 181

4.4 Reduccion del problema a matrices hermıticas . . . . . . . . . 185

4.5 Reduccion del problema a matrices simetricas reales . . . . . . 187

4.6 Aplicacion al calculo de las raıces de un polinomio . . . . . . . 189

4.7 Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . 190

4.8 Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . 201

Bibliografıa 221

Page 6: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion
Page 7: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

1. Ecuaciones no lineales

Dada una funcion no nula f : C → C, resolver la ecuacion f(x) = 0 es hallar

los valores x que anulan a dicha funcion. A estos valores x se les denomina

raıces o soluciones de la ecuacion, o tambien, ceros de la funcion f(x).

Los metodos de resolucion de ecuaciones y sistemas de ecuaciones se clasifican

en

• Metodos directos

Proporcionan la solucion mediante un numero finito de operaciones ele-

mentales.

ax2 + bx + c = 0 =⇒ x =−b±

√b2 − 4ac

2a

• Metodos iterados

Construyen una sucesion (xn) convergente a la solucion x de la ecuacion

o del sistema.

Sin embargo, el siglo XIX, Abel probo que no existe ninguna formula equi-

valente (en termino de raıces) para resolver ecuaciones de grado superior a

cuatro.

Ademas, si la ecuacion no es polinomica no podemos resolverla mas que me-

diante metodos iterados que, incluso en el caso de las polinomicas de grado no

superior a cuatro, son mas eficientes.

Definicion 1.1 [Multiplicidad de una raız]

Una solucion x de la ecuacion f(x) = 0 se dice que tiene multiplicidad n si

f(x) = f ′(x) = f ′′(x) = · · · = f (n−1(x) = 0 y f (n(x) 6= 0

Si la multiplicidad es 1, diremos que se trata de una raız simple.

7

Page 8: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

8 Ecuaciones no lineales

Todos los metodos numericos de resolucion de ecuaciones presentan dificulta-

des cuando la ecuacion tiene raıces multiples, ya que todos ellos se basan en

los cambios de signo de la funcion y estos son difıcilmente detectables en un

entorno de una raız multiple.

Ese hecho nos lleva a un mal condicionamiento del problema.

1.1 Errores y condicionamiento en problemas

numericos

Cualquier problema numerico se resuelve a traves de un algoritmo que nos

proporciona unos resultados a partir de unos datos iniciales. Es decir, se trata

de realizar un proceso del tipo

Datos =⇒ Algoritmo =⇒ Resultados

Dado que cualquier algoritmo puede cometer errores, no solo por el algoritmo

en sı, sino porque los datos pueden venir afectados de algun tipo de error

(redondeo, etc.) es muy importante el estudio de los distintos tipos de error

que puedan cometerse con vista a la fiabilidad de los resultados.

Definicion 1.2 [Errores absoluto y relativo]

Supongamos que el valor exacto de un dato es x y disponemos de un valor

aproximado x.

• Se denomina error absoluto de x a la distancia que lo separa del valor

exacto x, es decir |x− x|.

Observese que si solo disponemos del dato de que el error es, por ejemplo,

de 1m. no sabemos nada acerca de la fiabilidad del resultado, ya que no

es lo mismo decir que se ha cometido un error de un metro al medir la

altura de una persona que al medir la distancia entre dos galaxias.

Debemos reflejar de alguna manera “lo que se esta evaluando” en el dato

del error.

• Se denomina error relativo de x al cociente entre el error absoluto y el

objeto evaluado, es decir,

∣∣∣∣x− x

x

∣∣∣∣. En el caso x = 0 solo se utiliza el

error absoluto.

Page 9: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Errores y condicionamiento en problemas numericos 9

En la mayorıa de los procesos numericos utilizaremos como error el error abso-

luto ya que lo que nos interesa conocer es el numero de cifras decimales exactas

que posee la solucion de un determinado problema.

Evidentemente cualquier algoritmo que trabaje con unos datos afectados de

algun tipo de error nos proporcionara unos resultados que tambien vendran

afectados de errores. Estos errores pueden depender solo de los datos iniciales

o tambien del proceso que se ha realizado.

Supongamos que, queremos evaluar f(x) y damos un dato aproximado x. Es

evidente que, en general, si x 6= x sera f(x) 6= f(x).

Dado que f(x)− f(x) ' (x− x)f ′(x), se tiene que

|f(x)− f(x)| ' |x− x| · |f ′(x)|

por lo que aunque el error del dato sea muy pequeno, si la derivada f ′(x) es

muy grande, el resultado obtenido f(x) puede diferir mucho del valor exacto

f(x).

Para el problema inverso, es decir conocido f(x) buscar el valor de x (resolver

una ecuacion) se tendra que

|x− x| ' 1

|f ′(x)||f(x)− f(x)|

por lo que si |f ′(x)| fuese muy pequeno el error de la solucion puede ser muy

grande.

Ademas el problema no esta en el algoritmo que se aplique para evaluar f(x)

sino en el propio problema a resolver.

Definicion 1.3 [Condicionamiento de un problema]

Diremos que un problema esta mal condicionado si pequenos errores en los

datos producen grandes errores en los resultados.

Se trata entonces de definir algun numero que nos indique el condicionamiento

del problema. A este numero lo llamaremos numero de condicion del problema

y lo denotaremos por κ.

En el ejemplo anterior es evidente que

κ(x) = |f ′(x)|

Page 10: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

10 Ecuaciones no lineales

Ası pues, un problema (en ambos sentidos) estara mejor condicionado mientras

mas se acerque a 1 su numero de condicion.

Ejemplo 1.1 Si queremos calcular la tangente de 89◦59′ lo primero que de-

bemos hacer es expresar el angulo en radianes, por lo que necesariamente

debemos redondear el dato (el numero π hay que redondearlo), por lo que el

dato vendra afectado de un error de redondeo.

Utilicemos el metodo que utilicemos, dado que | tg x−tg x| ' |1+tg 2 x|·|x−x|y tg x → +∞ cuando x → π, el problema estara mal condicionado.

Sin embargo si tenemos en cuenta que tg (a + b) =tg a + tg b

1− tg a tg bpodemos

reducir nuestro problema al calculo de la tangente de 44◦59′ resultando este

un proceso bien condicionado, ya que tg 45 = 1. �

Definicion 1.4 [Estabilidad de un algoritmo]

Respecto al algoritmo que se utiliza para resolver un determinado problema,

diremos que es inestable cuando los errores que se cometen en los diferentes

pasos del algoritmo hacen que el error total que se genera sea muy grande.

Si, por el contrario los errores que se producen en los distintos pasos no alteran

de forma significativa el resultado del problema, diremos que el algoritmo es

estable.

Ejemplo 1.2 Supongamos que se quiere calcular la integral

I10 =

∫ 1

0

x10

a + xdx

Llamando In =

∫ 1

0

xn

a + xdx observamos que

In =

∫ 1

0

xn

a + xdx =

∫ 1

0

xn−1(x + a− a)

a + xdx =

=

∫ 1

0

xn−1(x + a)

a + xdx− a

∫ 1

0

xn−1

a + xdx =

∫ 1

0

xn−1dx− a

∫ 1

0

xn−1

a + xdx =

=

[xn

n

]1

0

− aIn−1 =1

n− aIn−1

Page 11: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Errores y condicionamiento en problemas numericos 11

por lo que podemos pensar en la posibilidad de calcular I10 de forma recursiva

mediante el siguiente algoritmo:

Algoritmo

I0 = ln

a + 1

a

In =1

n− aIn−1

Sin embargo, dado que para a = 10 es I0 = ln11

10= 0.09531017980432 . . .

y el numero 0.09531017980432 . . . no podemos introducirlo en el ordenador

de manera exacta, debemos cometer algun error introduciendo un numero

aproximado I0 de tal forma que cometemos un error inicial ε0 = |I0 − I0|.

El error εn que se cometera al calcular In vendra dado por

εn = |In − In| =∣∣∣∣ 1n − aIn−1 − (

1

n− aIn−1)

∣∣∣∣ = | − a(In−1 − In−1)| = |a|εn−1

es decir,

εn = |a|εn−1 = |a|2εn−2 = · · · = |a|nε0

por lo que si tomamos las 10 primeras cifras decimales de I0, es decir, si

tomamos

I0 = 0.0953101798 con ε0 < 10−10

obtendremos un error en la decima iteracion

ε10 < 1010 · 10−10 = 1

en otras palabras,

I10 no tiene ninguna cifra decimal exacta

Se trata pues de un algoritmo muy inestable. �

Observese que si el algoritmo es inestable no va a generar un resultado fiable,

por lo que deberemos utilizar otro algoritmo. Sin embargo, por muy estable

que sea el algoritmo, si el problema esta mal condicionado lo unico que pode-

mos hacer es plantear un problema equivalente al nuestro pero con la seguridad

de que se trata de un problema bien condicionado.

Page 12: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

12 Ecuaciones no lineales

1.2 Metodo y algoritmo de la biseccion: ana-

lisis de errores

Teorema 1.1 [Teorema de Bolzano]

Si f es una funcion continua en el intervalo cerrado [a, b] y f(a) · f(b) < 0,

existe un punto α ∈ (a, b) en el cual f(α) = 0.

Nuestro problema se reduce a localizarla. Para ello, supongamos que esta

separada, es decir, que en el intervalo [a, b] es la unica raız que existe. Esto

podemos garantizarlo, por ejemplo, viendo que f ′(x) 6= 0 en todo el intervalo,

ya que entonces, el Teorema de Rolle nos garantiza la unicidad de la raız.

Teorema 1.2 [Teorema de Rolle]

Si f(x) es una funcion continua en el intervalo [a, b], derivable en (a, b) y

f(a) = f(b), existe un punto α ∈ (a, b) para el que f ′(α) = 0.

En efecto, si f(x) tuviese dos raıces α1 y α2 en el intervalo [a, b], verificarıa

las hipotesis del teorema de Rolle en el intervalo [α1, α2] ⊂ [a, b], por lo que

deberıa existir un punto α ∈ (α1, α2) =⇒ α ∈ (a, b) en el que se anulara la

derivada, por lo que si f ′(x) 6= 0 en todo el intervalo [a, b], no pueden existir

dos raıces de la ecuacion en dicho intervalo.

Metodo de la biseccion o dicotomıa

Supongamos que tenemos separada una raız x de la ecuacion f(x) = 0 en el

intervalo [a1, b1] = [a, b] es decir

sig f(a) 6= sig f(b) y f ′(x) 6= 0 ∀x ∈ [a, b]

Tomando el punto medio x1 =a1 + b1

2

• Si f(x1) = 0, hemos encontrado la solucion: x = x1.

• Si f(x1) 6= 0, solo en uno de los dos subintervalos [a1, x1] o [x1, b1] se pro-

ducira un cambio de signo en los extremos y el teorema de Bolzano nos

asegura que la raız se encuentra en el subintervalo en el que se produce

dicho cambio de signo, al cual lo renombramos como [a2, b2]

Page 13: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Metodo y algoritmo de la biseccion: analisis de errores 13

Reiterando el procedimiento podemos construir una sucesion de interva-

los [an, bn] con amplitudes

|bn − an| =|b− a|

2n−→ 0 cuyos puntos medios xn −→ x

Cota del “error a priori”

El error cometido, tomando como raız de la ecuacion el punto medio xn del

intervalo [an, bn] obtenido en la en la iteracion n-esima, viene dado por

εn ≤b− a

2n

por lo que si b − a = 1 y n = 10 se tiene que ε10 ≤1

210< 10−3, es decir,

en 10 iteraciones obtenemos tres cifras decimales exactas, por lo que podemos

estimar el error de una determinada iteracion sin necesidad de realizarlas pre-

viamente.

Lo verdaderamente importante de esta formula del error a priori es que nos

permite conocer el numero de iteraciones que van a ser necesarias para obtener

la raız con una determinada precision.

Ası, por ejemplo, si queremos obtener la solucion de la ecuacion f(x) = 0 en

el intervalo [a, b] de amplitud 1 con 14 cifras decimales exactas, debera ser

εn ≤1

2n< 10−14 ⇐⇒ 2n > 1014 =⇒ n ≥ 47

es decir, deberemos detenernos en la iteracion 47.

Algoritmo de la biseccion

Para i = 1, . . . , n, . . ., Ii = [ai, bi] y mi =ai + bi

2(punto medio de Ii) con

I1 = [a, b] y Ii+1 =

[ai, mi] si sig(f(ai)) 6= sig(f(mi))

[mi, bi] si sig(f(bi)) 6= sig(f(mi))

El proceso debe repetirse hasta que

f(mi) = 0 o bien bi − ai < ε con ε > 0 prefijado.

Un algoritmo para MatLab con entradas a, b, ε y f(x) y salida la raız m serıa

el siguiente:

Page 14: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

14 Ecuaciones no lineales

Algoritmo de la Biseccion

while (b-a)/2>εm = a+(b-a)/2;

if f(m) == 0

a = m;

b = m;

end

if sign f(a) == sign f(m)

a = m;

else

b = m;

end

end

m

El hecho de calcular el punto medio de [a, b] como m = a+(b−a)/2 es debido

a que para valores muy pequenos de a y b puede darse el caso de que (a+ b)/2

se encuentre fuera del intervalo.

Metodo de la “Regula falsi”

Una variante del metodo de la biseccion es el metodo de la regula falsi , de la

falsa posicion o metodo de la cuerda consistente en dividir el intervalo [a, b] en

dos subintervalos [a, c] ∪ [c, b] donde el punto c, a diferencia del punto medio

del metodo de la biseccion, es el punto de corte de la recta secante que pasa

por los puntos (a, f(a)) y (b, f(b)) con el eje de abscisas OX.

f(b)

f(a)

(c, 0)

(a, f(a))

(b, f(b))

O

Y

X

��

��

��

��

��

��

tt

tFigura 1.1: Metodo de la regula falsi.

Page 15: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Metodo y algoritmo de la biseccion: analisis de errores 15

La pendiente de dicha secante viene determinada por

m =f(b)− f(a)

b− a=

0− f(b)

c− b

Segun se utilicen los puntos (a, f(a)) y (b, f(b)) o (c, 0) y (b, f(b)) respectiva-

mente.

Despejando el valor de c obtenemos que

c = b− f(b) · b− a

f(b)− f(a)=

af(b)− bf(a)

f(b)− f(a)

pudiendose dar los mismos casos que en el metodo de la biseccion, es decir:

• Si f(c) = 0 la raız buscada es c.

• Si f(a) y f(c) tienen signos contrarios, la raız se encuentra en el intervalo

[a, c].

• Si son f(c) y f(b) los que tienen signos contrarios, la raız esta en el

intervalo [c, b].

El algoritmo con entradas a, b, ε y f(x) y salida la raız c serıa el siguiente:

Algoritmo de la Regula falsi

c = a;

while abs f(c)>εc = (a*f(b)-b*f(a))/(f(b)-f(a));

if f(c) == 0

a = c;

b = c;

end

if sign f(a) == sign f(c)

a = c;

else

b =c;

end

end

c

Page 16: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

16 Ecuaciones no lineales

En este caso las amplitudes de los intervalos [an, bn] no se van reduciendo a la

mitad como en el caso del metodo de dicotomıa, por lo que ya no es valida

la formula del error a priori, siendo necesario encontrar otra forma de poder

estimar el error que se comete en cada iteracion.

Error “a posteriori”

Supongamos conocido que la funcion f(x) tiene un cero en el intervalo [a, b] y

que por cualquier metodo hemos aproximado la solucion como xn.

Lo primero que se nos ocurre para comprobar si es valido el resultado es

calcular f(xn) y, en general, obtendremos que f(xn) 6= 0 ya que no tendremos

exactamente la raız x sino una aproximacion.

Supongamos que obtenemos f(xn) = 2.2345.

¿estamos cerca o lejos de la raız buscada?

Si la pendiente de la funcion en dicho punto f ′(xn) es grande estaremos cerca

de ella, pero si es pequena estaremos lejos.

f(x)f(x)

x xxn

Figura 1.2: El error es inversamente proporcional a la pendiente.

Ası pues, el error es inversamente proporcional a la pendiente de la funcion,

en otras palabras,

ε ≈ |f(xn)||f ′(x)|

¿Donde debemos medir la pendiente?

Si la medimos en un punto en concreto puede que sea muy grande y pensemos

que estamos muy cerca de la solucion cuando aun estamos muy lejos.

Page 17: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Metodo y algoritmo de la biseccion: analisis de errores 17

xn

f(x)

f(x)

xx

Figura 1.3: Se debe tomar el mınimo valor de la pendiente.

Debemos, por tanto, tomar el mınimo valor de la pendiente en todo el intervalo,

para decir que

εn ≤|f(xn)|

mınx∈(a,b)

|f ′(x)|(1.1)

Veamos ahora una justificacion formal de la formula anterior.

Teorema 1.3 [Teorema del valor medio]

Si f(x) es una funcion continua en el intervalo [a, b] y derivable en (a, b),

existe un punto c ∈ (a, b) tal quef(b)− f(a)

b− a= f ′(c).

Sea x una solucion de la ecuacion f(x) = 0 y sea xn una aproximacion de ella

obtenida por un metodo iterado cualquiera.

Supongamos f(x) continua en el intervalo cerrado [xn, x] o [x, xn] (dependiendo

de que x sea mayor o menor que xn) y derivable en el abierto.

Existe entonces un punto c ∈ (xn, x) o c ∈ (x, xn) tal que

f(x)− f(xn)

x− xn

= f ′(c).

Page 18: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

18 Ecuaciones no lineales

Como f(x) = 0, nos queda que x− xn = −f(xn)

f ′(c), obteniendose:

εn =|f(xn)||f ′(c)|

≤ |f(xn)|mın

x∈{

(x, xn)

(xn, x)

|f ′(x)|≤ |f(xn)|

mınx∈(a,b)

|f ′(x)|con

(x, xn)

(xn, x)

}∈ (a, b)

Lo unico que debemos exigir es que la derivada de la funcion no se anule en

ningun punto del intervalo (a, b).

Tengase en cuenta que si la funcion esta mal condicionada es decir, si |f ′(x)| esmuy grande, el calculo de f(xn) estara muy mal condicionado ya que cualquier

error en el valor de xn hace que lo que estemos calculando sea f(xn) en un

punto x′n muy cercano a xn verificandose que

|f(x′n)− f(xn)| ' |x′n − xn| · |f ′(xn)|

es decir, puede que obtengamos por ejemplo que f(xn) = k y sin embargo su

verdadero valor difiera mucho de k debido a la fuerte pendiente existente en

dicho punto, con lo que obtendremos una cota erronea del error.

Debemos, por tanto, asegurarnos de que nuestro problema esta bien condicio-

nado, es decir, no existen en el intervalo pendientes muy grandes (condiciona-

miento directo) ni muy pequenas (condicionamiento inverso) para garantizar

la fiabilidad del “error a posteriori”.

Aplicando el metodo de la regula falsi al calculo de la raız de 3, se obtienen

14 cifras decimales exactas, en solo 14 iteraciones frente a las 47 necesarias

mediante el metodo de la biseccion.

Sin embargo, en el metodo de la regula falsi la convergencia no tiene porque

ser mas rapida que en el de la biseccion.

Ambos metodos son de convergencia lenta siendo necesario, por tanto, buscar

otros metodos cuya convergencia sea mas rapida.

Dichos metodos estan basados en el denominado Teorema del punto fijo que

estudiamos en la siguiente seccion.

Page 19: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Punto fijo e iteracion funcional 19

1.3 Punto fijo e iteracion funcional

Definicion 1.5 [Funcion contractiva]

Una funcion f : R → R se dice contractiva si verifica que

|f(x1)− f(x2)| ≤ q |x1 − x2| ∀x1, x2 ∈ R con q < 1

q recibe el nombre de factor de contractividad.

Lema 1.4 [Caracterizacion de las funciones contractivas]

Si una funcion f(x) continua en [a, b] y derivable en (a, b) verifica que

|f ′(x)| ≤ q < 1 ∀x ∈ [a, b]

es contractiva en dicho intervalo.

Demostracion. Para cualquier par de puntos x1, x2 ∈ [a, b]

f(x1)− f(x2) = (x1 − x2)f′(c) con c ∈

{[x1, x2]

[x2, x1]=⇒ c ∈ [a, b]

|f(x1)− f(x2)| = |x1 − x2| · |f ′(c)| ≤ q |x1 − x2| con q < 1

por lo que es contractiva en [a, b].

Definicion 1.6 [Punto fijo]

Se dice que x es un punto fijo de la funcion f(x) si f(x) = x.

Teorema 1.5 [Teorema del punto fijo]

Sea ϕ(x) una funcion continua en [a, b], derivable en (a, b), con ϕ([a, b]) ⊆ [a, b]

tal que |ϕ′(x)| ≤ q < 1 ∀x ∈ [a, b], y sea x0 un punto cualquiera del intervalo

[a, b]. La sucesion

x0, x1, x2, . . . , xn, . . . con xn+1 = ϕ(xn)

converge al unico punto fijo de la funcion ϕ(x) en [a, b].

Page 20: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

20 Ecuaciones no lineales

Demostracion.

• Convergencia

xn+1 − xn = ϕ(xn)− ϕ(xn−1) = (xn − xn−1)ϕ′(c) con c ∈

{[xn, xn+1]

[xn+1, xn]

y por tanto, con c ∈ [a, b].

|xn+1 − xn| = |xn − xn−1| · |ϕ′(c)| ≤ q|xn − xn−1|

por lo que

|x2 − x1| ≤ q|x1 − x0||x3 − x2| ≤ q|x2 − x1| ≤ q2|x1 − x0|

...

|xn+1 − xn| ≤ qn|x1 − x0|...

|x0|+ |x1 − x0|+ |x2 − x1|+ · · ·+ |xn+1 − xn|+ · · · ≤

≤ |x0|+ |x1 − x0|+ q|x1 − x0|+ · · ·+ qn|x1 − x0|+ · · · =

= |x0|+ |x1 − x0|(1 + q + · · ·+ qn + · · ·) con q < 1 =⇒

|x0|+ |x1 − x0|+ · · ·+ |xn+1 − xn|+ · · · ≤ |x0|+ |x1 − x0|1

1− q

por lo que la serie

Sn = x0 + (x1 − x0) + (x2 − x1) + · · ·+ (xn+1 − xn) + · · ·

es convergente por ser absolutamente convergente. Dado que

S1 = x0

S2 = x0 + (x1 − x0) = x1

...

Sn+1 = Sn + (xn − xn−1) = xn

...

la convergencia de Sn nos garantiza la de la sucesion (xn).

Page 21: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Punto fijo e iteracion funcional 21

• Convergencia al punto fijo

x = lim xn =⇒ ϕ(x) = ϕ(lim xn) = lim ϕ(xn) = lim xn+1 = x

es decir

ϕ(x) = x =⇒ x = lim xn es punto fijo de ϕ(x) en [a, b]

• Unicidad

Sea x′ otro punto fijo de ϕ(x) en [a, b]].

|x−x′| = |ϕ(x)−ϕ(x′)| = |(x−x′)ϕ′(c)| = |(x−x′)| · |ϕ′(c)| con c ∈ [a, b]

|x− x′|(1− |ϕ′(c)|) = 0

y dado que |ϕ′(c)| ≤ q < 1 =⇒ 1 − |ϕ′(c)| 6= 0, obtenemos que

|x− x′| = 0 y, por tanto, que x = x′.

En otras palabras, x es el unico punto fijo de la funcion ϕ(x) en el

intervalo [a, b].

Interpretacion geometrica del teorema del punto fijo

Dependiendo de los valores que toma ϕ′(x) en el intervalo [a, b], podemos

distinguir cuatro casos:

a) ϕ′(x) < −1 b) − 1 < ϕ′(x) < 0

c) 0 < ϕ′(x) < 1 d) ϕ′(x) > 1

pudiendose observar (vease la Fig. 1.4) que en los casos (a) y (d) la sucesion

resulta ser divergente ya que |ϕ′(x)| > 1.

En los casos (b) y (c), en los que |ϕ′(x)| ≤ q < 1 el metodo converge

monotonamente en (b) y de forma oscilatoria en (c).

Aplicacion a la resolucion de ecuaciones

Si se desea resolver la ecuacion f(x) = 0, se escribe esta de la forma x = ϕ(x),

donde ϕ(x) es una funcion contractiva, y partiendo de un determinado valor

inicial x0, se construye la sucesion xn+1 = ϕ(xn).

Page 22: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

22 Ecuaciones no lineales

Figura 1.4: Esquema de la convergencia para el teorema del punto fijo.

El teorema del punto fijo nos garantiza la convergencia de esta sucesion al

punto fijo de la funcion ϕ(x) o lo que es lo mismo, a la raız de la ecuacion

f(x) = 0.

Para acotar el error de una determinada iteracion utilizamos la formula (1.1)

del error “a posteriori”.

Ejemplo 1.3 El calculo de la raız cuadrada de 3 equivale al calculo de la raız

positiva de la ecuacion x2 = 3. Aunque mas adelante veremos metodos cuya

convergencia es mas rapida, vamos a realizar los siguientes cambios:

x2 = 3 =⇒ x + x2 = x + 3 =⇒ x(1 + x) = 3 + x =⇒ x =3 + x

1 + x

Es decir, hemos escrito la ecuacion de la forma x = ϕ(x) con

ϕ(x) =3 + x

1 + x

Dado que sabemos que la raız de 3 esta comprendida entre 1 y 2 y que

|ϕ′(x)| = 2

(1 + x)2≤ 2

22=

1

2< 1 para cualquier x ∈ [1, 2]

Page 23: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Punto fijo e iteracion funcional 23

|ϕ′(x)| = 2

(1 + x)2≥ 2

32=

2

9para cualquier x ∈ [1, 2]

podemos garantizar que partiendo de x0 = 1 el metodo convergera a la raız

cuadrada de 3 y que el “error a posteriori” sera fiable.

Ası pues, partiendo de x0 = 1 y haciendo xn+1 =3 + xn

1 + xn

obtenemos:

x1 = 2

x2 = 1.66666666666667

x3 = 1.75000000000000

x4 = 1.72727272727273

x5 = 1.73333333333333

x6 = 1.73170731707317

x7 = 1.73214285714286

x8 = 1.73202614379085

x9 = 1.73205741626794

x10 = 1.73204903677758

x11 = 1.73205128205128

x12 = 1.73205068043172

x13 = 1.73205084163518

x14 = 1.73205079844084

x15 = 1.73205081001473

x16 = 1.73205080691351

x17 = 1.73205080774448

x18 = 1.73205080752182

x19 = 1.73205080758148

x20 = 1.73205080756550

x21 = 1.73205080756978

x22 = 1.73205080756863

x23 = 1.73205080756894

x24 = 1.73205080756886

x25 = 1.73205080756888

x26 = 1.73205080756888

El error vendra dado por εn <|f(xn)|

mınx∈[1,2]

|f ′(x)|donde f(x) = x2 − 3, por lo que

ε26 <|x2

26 − 3|2

= 4.884981308350688 · 10−15 < 10−14

es decir,√

3 = 1.73205080756888 con todas sus cifras decimales exactas. �

Habıamos visto que el metodo de la regula falsi solo necesitaba de 14 iteraciones

mientras que ahora hemos necesitado 26.

¿A que se debe que la convergencia haya sido muy lenta?

La respuesta es bien sencilla: a la mala eleccion de la funcion ϕ(x).

¿De que dependera la velocidad de convergencia?

Page 24: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

24 Ecuaciones no lineales

Orden de convergencia

• ϕ(x) =x

2en [−1, 1] es contractiva ya que |ϕ′(x)| = 1

2< 1 ∀x ∈ [−1, 1]

x0 = 1 =⇒ x1 = 0′5 ⇒ x2 = 0′25 ⇒ x3 = 0′125 =⇒ x4 = 0′0625 · · ·

Observamos que la convergencia a cero es lenta y ello es debido a que

ϕ′(0) 6= 0 =⇒ convergencia lineal o de primer orden.

• ϕ(x) =x2

4en [−1, 1] es contractiva: |ϕ′(x)| =

∣∣∣x2

∣∣∣ ≤ 1

2< 1 ∀x ∈ [−1, 1]

x0 = 1 ⇒ x1 = 0′25 ⇒ x2 = 0′015625 ⇒ x3 = 6′105 . . . · 10−5 · · ·

La convergencia a cero es ahora rapida debido a que

ϕ(x) =x

2⇒ ϕ′(0) = 0

ϕ′′(x) =1

2⇒ ϕ′′(0) 6= 0

⇒ convergencia de segundo orden.

• ϕ(x) =x3

6en [−1, 1] es contractiva: |ϕ′(x)| =

∣∣∣∣x2

2

∣∣∣∣ ≤ 1

2< 1 ∀x ∈ [−1, 1]

x0 = 1 ⇒ x1 = 0′16666 ⇒ x2 = 0′00077 ⇒ x3 = 7′6565 · 10−11 · · ·

La convergencia a cero es ahora muy rapida debido a que

ϕ′(x) =x2

2⇒ ϕ′(0) = 0

ϕ′′(x) = x ⇒ ϕ′′(0) = 0

ϕ′′′(x) = 1 ⇒ ϕ′′′(0) 6= 0

=⇒ convergencia de tercer orden.

EL orden de convergencia nos lo da el orden de la primera derivada de la

funcion ϕ(x) que no se anula en su punto fijo x.

La funcion ϕ(x) =3 + x

1 + xque obtuvimos para calcular

√3 en el Ejemplo 1.3

verifica que

ϕ′(x) =1

(1 + x)2=⇒ ϕ′(

√3) =

1

(1 +√

3)26= 0

por lo que ha resultado una convergencia de primer orden (similar a la de los

metodos de la biseccion y la regula falsi).

Page 25: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Analisis del metodo de Newton-Raphson 25

¿Como elegir una funcion de iteracion ϕ(x) que nos garantice una convergen-

cia, al menos, de segundo orden?

Vamos a ver como el metodo de Newton-Raphson, generalmente conocido como

metodo de Newton, nos permite escribir la ecuacion f(x) = 0 de la forma

x = ϕ(x) de tal manera que la convergencia sea, al menos de segundo orden.

1.4 Analisis del metodo de Newton-Raphson

Si tratamos de resolver la ecuacion f(x) = 0 y lo que obtenemos no es la

solucion exacta x sino solo una aproximacion xn tal que x = xn +h tendremos

que

f(x) ' f(xn) + h · f ′(xn) =⇒ h ' − f(xn)

f ′(xn)=⇒ x ' xn −

f(xn)

f ′(xn)

obteniendose la denominada formula de Newton-Raphson

xn+1 = xn −f(xn)

f ′(xn)(1.2)

Hemos transformado la ecuacion f(x) = 0 en x = ϕ(x) con

ϕ(x) = x− f(x)

f ′(x)

Si partiendo de x0 ∈ [a, b] la sucesion (xn) con xn+1 = ϕ(xn) = xn −f(xn)

f ′(xn)converge entonces ϕ(x) es contractiva.

Ademas:

lim xn+1 = lim xn −f(lim xn)

lim f ′(xn)=⇒ f(lim xn)

lim f ′(xn)= 0 =⇒ f(lim xn) = 0

es decir, lim xn = x.

Interpretacion geometrica: Metodo de la tangente

Si trazamos la tangente a la curva y = f(x) en el punto (xn, f(xn)) obtenemos

la recta

y = f(xn) + f ′(xn)(x− xn)

Page 26: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

26 Ecuaciones no lineales

que corta al eje y = 0 en el punto de abscisa

x = xn −f(xn)

f ′(xn)

que es precisamente el valor de xn+1 de la formula de Newton-Raphson.

En otras palabras, xn+1 viene determinado por el punto en el que la tangente

a la curva y = f(x) en (xn, f(xn)) corta al eje de abscisas, por lo que este

metodo es tambien conocido como metodo de la tangente.

xx0x1x2

y = f(x)

Figura 1.5: Interpretacion geometrica del metodo de Newton.

Orden de convergencia

Si el metodo converge, ϕ(x) = x− f(x)

f ′(x)es contractiva y ademas

ϕ′(x) = 1− f ′2(x)− f(x)f ′′(x)

f ′2(x)=

f(x)f ′′(x)

f ′2(x)con f ′(x) 6= 0 =⇒ ϕ′(x) = 0

El metodo de Newton es, al menos, de segundo orden.

Cota del error: Error “a priori”

La diferencia entre la solucion exacta x y la aproximacion xn+1 viene dada por

en+1 = x− xn+1 = x− xn +f(xn)

f ′(xn)= en +

f(xn)

f ′(xn)

Dado que

0 = f(x) = f(xn + en) = f(xn) + f ′(xn)en +f ′′(t)

2e2

n con t ∈

{(x, xn)

(xn, x)

Page 27: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Analisis del metodo de Newton-Raphson 27

Si f ′(x) 6= 0 ∀x ∈ [a, b] podemos dividir entre f ′(xn) 6= 0 obteniendose

0 =f(xn)

f ′(xn)+ en +

f ′′(t)

2f ′(xn)e2

n = en+1 +f ′′(t)

2f ′(xn)e2

n

Tomando valores absolutos:

εn+1 =|f ′′(t)|

2|f ′(xn)|ε2

n ≤ k ε2n con k ≥ max |f ′′(x)|

2 mın |f ′(x)|

es decir, en cada iteracion dispondremos, aproximadamente, del doble de cifras

decimales exactas que en la iteracion anterior, que es lo que significa el hecho

de ser una convergencia de segundo orden.

Ademas, podemos obtener, multiplicando por k,

kεn+1 ≤ k2ε2n = (kεn)2 ≤ (kεn−1)

4 ≤ (kεn−2)8 ≤ · · · ≤ (kε0)

2n+1

=⇒

εn ≤1

k(kε0)

2n

con k ≥ max |f ′′(x)|2 mın |f ′(x)|

lo que nos proporciona una cota del error “a priori”, pudiendose garantizar la

convergencia siempre que kε0 < 1 es decir, si ε0 ≤1

k.

Algoritmo

Una vez realizado un estudio previo para ver que se cumplen las condiciones

que requiere el metodo, establecer el valor inicial x0 y calcular el valor de

m = mınx∈[a,b]

|f ′(x)|, el algoritmo, que tiene por entradas los valores de a, b, x, ε,

f(x) y m y por salida la raız x, es el siguiente:

Algoritmo de Newton

e = abs (f(x)/m);

while e > εx = x-f(x)/f′(x);

e = abs (f(x)/m);

end

x

Page 28: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

28 Ecuaciones no lineales

Ejemplo 1.4 En el Ejemplo 1.3 calculamos la raız de 3 con 14 cifras decimales

exactas en 26 iteraciones. Vamos a ver como se disminuye considerablemente

el numero de iteraciones cuando se utiliza la formula de Newton-Raphson.

Partimos de la ecuacion f(x) = x2 − 3 = 0, por lo que la formula de Newton-

Raphson nos dice que

xn+1 = xn −f(xn)

f ′(xn)= xn −

x2n − 3

2xn

=x2

n + 3

2xn

=1

2

(xn +

3

xn

)

Dado que la raız de 3 es un numero comprendido entre 1 y 2 y la funcion

f ′(x) = 2x no se anula en dicho intervalo, podemos aplicar el metodo de

Newton tomando como valor inicial x0 = 2. (Mas adelante veremos porque

debemos tomar 2 como valor inicial), obteniendose:

x0 = 2

x1 = 1.75000000000000

x2 = 1.73214285714286

x3 = 1.73205081001473

x4 = 1.73205080756888

El error vendra dado, al igual que en el Ejemplo 1.3 por εn <|f(xn)|

mınx∈[1,2]

|f ′(x)|,

por lo que

ε4 <|x2

4 − 3|2

= 4.884981308350688 · 10−15 < 10−14

es decir,√

3 = 1.73205080756888 con todas sus cifras decimales exactas. �

La formula xn+1 =1

2

(xn +

A

xn

)es conocida como formula de Heron ya que

este matematico la utilizaba para aproximar la raız cuadrada de un numero

real positivo A hacia el ano 100 a.C. pues sabıa que si disponıa de un valor

aproximado xn y este fuese mayor que la raız buscada, necesariamente A/xn

serıa menor que su raız y viceversa, por lo que la media entre ambos debıa ser

una mejor aproximacion que xn. En otras palabras, en cada iteracion tomaba

como aproximacion de la raız la media aritmetica entre el valor xn anterior y

el cociente A/xn.

Page 29: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Analisis del metodo de Newton-Raphson 29

Analisis de la convergencia: Regla de Fourier

Hay que tener en cuenta que la naturaleza de la funcion puede originar difi-

cultades, llegando incluso a hacer que el metodo no converja.

Ejemplo 1.5 Tratemos de determinar, por el metodo de Newton-Raphson, la

raız positiva de la funcion f(x) = x10−1, tomando como valor inicial x0 = 0.5.

La formula de Newton-Raphson es, en este caso,

xn+1 = xn −x10

n − 1

10x9n

.

Aplicando el algoritmo se obtienen los valores

x1 = 51.65

x2 = 46.485

x3 = 41.8365

x4 = 37.65285

x5 = 33.887565

x10 = 20.01026825685012

x20 = 6.97714912329906

x30 = 2.43280139954230

x40 = 1.00231602417741

x41 = 1.00002393429084

x42 = 1.00000000257760

x43 = 1

Puede observarse que la convergencia es muy lenta y solo se acelera (a partir

de x40) cuando estamos muy cerca de la raız buscada. �

• Si en las proximidades de la raız existe un punto de inflexion, las itera-

ciones divergen progresivamente de la raız.

������������

��������������9x0x1

x2x

Figura 1.6: En las proximidades de un punto de inflexion puede diverger.

Page 30: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

30 Ecuaciones no lineales

• El metodo de Newton-Raphson oscila en los alrededores de un maximo

o un mınimo local, persistiendo o llegando a encontrarse con pendientes

cercanas a cero, en cuyo caso la solucion se aleja del area de interes.

x0 x1x

y = f(x)

Figura 1.7: En las proximidades de un extremo local puede oscilar o diverger.

¿Quiere decir eso que el metodo de Newton puede ser divergente?

El metodo de Newton siempre converge en las proximidades de la raız. El

problema surge cuando se toma un valor inicial x0 inadecuado (proximo a un

punto crıtico).

¿Como podemos saber que el valor inicial x0 es adecuado?

La eleccion de x0: Regla de Fourier

Si la funcion f(x) cambia de signo en los extremos de un intervalo [a, b] y

ademas, en dicho intervalo, no se anulan ni f ′(x) ni f ′′(x), nos aseguramos

de que en [a, b] existe una unica raız de la ecuacion f(x) = 0 y no existen

extremos locales ni puntos de inflexion.

Por otra parte, como no nos interesa que x0 este situado cerca de un extremo

local, vamos a estudiar los diferentes casos con que podemos encontrarnos

y elegir, en cada uno de ellos, un valor adecuado para x0 (aquel que no se

encuentre cercano a un extremo local).

Page 31: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Analisis del metodo de Newton-Raphson 31

f ′(x) > 0f ′′(x) < 0

f ′(x) > 0f ′′(x) > 0

f ′(x) < 0f ′′(x) > 0

f ′(x) < 0f ′′(x) < 0

ab

ab a

ba

b

x0 = a x0 = b x0 = a x0 = b

Figura 1.8: Los cuatro casos posibles

Observese que en cualquiera de los cuatro casos (vease la Figura 1.8) hemos

optado por elegir, como valor inicial x0, el extremo en el que la funcion tiene

el mismo signo que su segunda derivada.

Este resultado, que formalizamos a continuacion en forma de teorema es co-

nocido como regla de Fourier.

Teorema 1.6 [Regla de Fourier]

Sea f(x) una funcion continua y dos veces derivable [a, b]. Si sig f(a) 6= sig f(b)

y sus dos primeras derivadas f ′(x) y f ′′(x) no se anulan en [a, b] existe una

unica raız de la ecuacion f(x) = 0 en dicho intervalo y se puede garantizar la

convergencia del metodo de Newton tomando como valor inicial x0 el extremo

del intervalo en el que la funcion y su segunda derivada tienen el mismo signo.

1.4.1 Metodo de Newton generalizado

Cuando el metodo de Newton converge lentamente se debe a que la raız que

estamos aproximando es multiple.

Supongamos que x fuese una raız doble de f(x). La funcion de iteracion

ϕ(x) = x− f(x)

f ′(x)del metodo de Newton verifica que

ϕ′(x) = 1− f ′ 2(x)− f(x)f ′′(x)

f ′ 2(x)=

f(x)f ′′(x)

f ′ 2(x)

ϕ′(x) es una indeterminacion del tipo 00

que resulta ser distinta de cero, por lo

Page 32: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

32 Ecuaciones no lineales

que la convergencia es de primer orden. De ahı su lentitud.

¿Serıa posible alguna modificacion en el metodo para que la convergenciavolviese a ser, al menos, de segundo orden?

• La raız x de f(x) tambien lo es de g(x) =f(x)

f ′(x)pero con la particularidad

de que

ϕ(x) = x− g(x)

g′(x)

verifica que ϕ′(x) y ϕ′′(x) tienden a cero cuando x lo hace a x, por lo

que al aplicar el metodo de Newton a la funcion g(x) obtenemos x con

una convergencia de, al menos, tercer orden.

Este proceso tiene el inconveniente de que si f(x) es, por ejemplo, un

polinomio, g(x) es una funcion racional, por lo que se complican los

calculos.

• Sea x una raız de multiplicidad k de la ecuacion f(x) = 0.

Si en vez de hacer xn+1 = xn −f(xn)

f ′(xn)hacemos

xn+1 = xn − kf(xn)

f ′(xn)(1.3)

donde k representa el orden de la primera derivada que no se anula para

x = x (multiplicidad de la raız x), la convergencia vuelve a ser, al menos,

de segundo orden.

En la practica, el problema es que no conocemos k pero podemos determinar

su valor estudiando las derivadas de la funcion f(x).

Ejemplo 1.6 Para resolver la ecuacion x − sen x = 0 comenzamos por ex-

presarla de la forma x = sen x, por lo que las soluciones seran los puntos de

interseccion de la curva y = sen x con y = x (Fig.1.9).

Aunque es conocido que la solucion de la ecuacion es x = 0, supondremos que

solo conocemos que esta comprendida entre -1 y 1 y vamos aplicar el metodo

de Newton.

xn+1 = xn −xn − sen xn

1− cos xn

=sen xn − xn cos xn

1− cos xn

Page 33: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Analisis del metodo de Newton-Raphson 33

y = x

y = sen x

1

-1

0

��

��

��

��

��

Figura 1.9: Las graficas de y = x e y = sen x.

Comenzando con x0 = 1 se obtiene:

x0 = 1

. . . . . . . . . . . . . . . . . . . . .

x10 = 0.016822799 . . .

f ′(x10) = 0.0001 . . .

f ′′(x10) = 0.016 . . .

f ′′′(x10) = 0.9998 . . .

. . . . . . . . . . . . . . . . . . . . .

x20 = 0.0000194 . . .

f ′(x20) = 0.00000001 . . .

f ′′(x20) = 0.0019 . . .

f ′′′(x20) = 0.9999 . . .

Como la convergencia es muy lenta, hace pensar que se trata de una raız

multiple. Ademas, como la primera y la segunda derivadas tienden a cero y

la tercera lo hace a 1, parece que nos encontramos ante una raız triple, por lo

que aplicamos el metodo generalizado de Newton.

xn+1 = xn − 3xn − sen xn

1− cos xn

que comenzando, al igual que antes, por x0 = 1 se obtiene:

x0 = 1

x1 = −0.034 . . .

x2 = 0.000001376 . . .

x3 = 0.00000000000009 . . .

que se ve que converge rapidamente a x = 0. �

Page 34: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

34 Ecuaciones no lineales

1.5 Un problema mal condicionado: ceros de

un polinomio

Si queremos resolver la ecuacion P (x) = 0 el problema viene condicionado por

los valores de |P ′(x)| (su numero de condicion), por lo que si la derivada es

muy pequena el problema estara mal condicionado, pero si la derivada es muy

grande cualquier metodo se hace muy lento, por lo que lo ideal serıa que la

derivada estuviese muy proxima a 1, pero claro esta, ese derivada ha de estar

muy proxima a 1 en todas las raıces del polinomio, cosa que es estadısticamente

casi imposible. Por tanto, el calculo de los ceros de un polinomio es un ejemplo

de problema mal condicionado. Sin embargo, vamos a estudiar como podemos

aproximar un determinado cero del polinomio.

Hemos visto que uno de los mayores problemas que presenta la resolucion de

una ecuacion es encontrarnos que posee raıces multiples ya que, en un entorno

de ellas, o bien la funcion no cambia de signo, o bien se aproxima demasiado

a cero y, por tanto, cualquier metodo puede dar soluciones erroneas.

En el caso de las ecuaciones algebraicas (Pn(x) = 0) este problema puede

solventarse buscando otra ecuacion que posea las mismas raıces que la dada

pero todas ellas simples, es decir, eliminando las raıces multiples.

Eliminacion de las raıces multiples

Por el teorema fundamental del Algebra sabemos que Pn(x) posee n raıces y,

por tanto, puede ser factorizado de la forma

Pn(x) = a0(x− x1)(x− x2) · · · (x− xn)

donde {x1, x2, . . . , xn} son los ceros del polinomio.

Si existen raıces multiples, las podemos agrupar para obtener:

Pn(x) = a0(x− x1)m1(x− x2)

m2 · · · (x− xk)mk

donde mi (i = 1, 2, . . . k) representa la multiplicidad de la raız xi y verificando-

se que m1 + m2 + · · ·mk = n

Derivando esta expresion obtenemos:

P ′(x)=na0(x− x1)m1−1 · · · (x− xk)

mk−1Qk−1(x)

con Qk−1(xi) 6= 0 i = 1, 2, . . . , k

Page 35: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Un problema mal condicionado: ceros de un polinomio 35

Por tanto, si x es una raız de la ecuacion P (x) = 0 con multiplicidad k, es

tambien una raız de P ′(x) = 0 pero con multiplicidad k − 1.

D(x) = mcd [P (x), P ′(x)] = (x− x1)m1−1 · · · (x− xk)

mk−1

por lo que

Q(x) =P (x)

D(x)= a0(x− x1)(x− x2) · · · (x− xk)

Es decir, hemos encontrado un polinomio cuyas raıces son las mismas que las

de P (x) pero todas ellas simples.

Ejemplo 1.7 El polinomio P (x) = x3 − 5x2 + 8x− 4 = (x− 1)(x− 2)2 tiene

la raız 1 simple y la 2 doble.

D(x) = mcd (P (x), P ′(x)) = mcd (x3 − 5x2 + 8x− 4, 3x2 − 10x + 8) = x− 2

por lo que

Q(x) =P (x)

D(x)= x3 − 3x + 2 = (x− 1)(x− 2)

que tiene las mismas raıces que P (x) pero todas simples. �

Acotacion de las raıces

Si ya conocemos que una ecuacion solo tiene raıces simples y queremos calcu-

larlas, parece apropiado que un primer paso consista en detectar donde pueden

encontrarse. Ası por ejemplo, si son reales, determinar intervalos de una am-

plitud reducida en los que se encuentren las raıces de la ecuacion.

Dada una ecuacion f(x) = 0 (en general com-pleja) se denomina acotar las raıces a bus-car dos numeros reales positivos r y R talesque r ≤ |x| ≤ R para cualquier raız x de laecuacion.Geometricamente consiste en determinar unacorona circular de radios r y R dentro de lacual se encuentran todas las raıces.En el caso real se reduce a los intervalos(−R,−r) y (r, R).

Page 36: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

36 Ecuaciones no lineales

Proposicion 1.7 Si x es una raız de la ecuacion

P (x) = a0xn + a1x

n−1 + · · ·+ an−1x + an = 0

se verifica que:

|x| < 1 +A

|a0|siendo A = max

i≥1|ai|

Demostracion. Sea P (x) = a0xn + a1x

n−1 + · · · + an−1x + an. Tomando

modulos tenemos

|P (x)| = |a0xn + a1x

n−1 + · · ·+ an−1x + an| ≥

≥ |a0xn| − |a1x

n−1 + · · ·+ an−1x + an| ≥

+ · · ·+ |an−1x|+ |an|]

=

= |a0xn| −

[|a1| · |xn−1|+ · · ·+ |an−1| · |x|+ |an|

]≥

≥ |a0xn| − A [|x|n−1 + · · ·+ |x|+ 1]

(Para considerar el ultimo parentesis como una progresion geometrica habrıa

que anadir los terminos que, probablemente, falten en P (x) y suponer que,

ademas, es |x| 6= 1).

|P (x)| ≥ |a0| · |x|n − A|x|n − 1

|x| − 1

Dado que el teorema es trivial para |x| < 1, supondremos que |x| > 1 y

entonces:

|P (x)| > |a0| · |x|n − A|x|n

|x| − 1= |x|n

(|a0| −

A

|x| − 1

)Como la expresion anterior es cierta para cualquier |x| > 1, sea |x| > 1 con

P (x) = 0. Entonces

0 > |x|n(|a0| −

A

|x| − 1

)=⇒ |a0| −

A

|x| − 1< 0 =⇒

|a0| <A

|x| − 1=⇒ |x| − 1 <

A

|a0|=⇒

|x| < 1 +A

|a0|con |x| > 1

Es evidente que esta cota tambien la verifican las raıces x con |x| < 1.

Page 37: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Un problema mal condicionado: ceros de un polinomio 37

Proposicion 1.8 [Regla de Laguerre]

Consideremos la ecuacion

P (x) = a0xn + a1x

n−1 + · · ·+ an−1x + an = 0

Sean C(x) = b0xn−1 + · · ·+ bn−2x + bn−1 el cociente y r el resto de la division

de P (x) entre x− c.

Si r ≥ 0 y bi ≥ 0 para 0 ≤ i ≤ n − 1, el numero real c es una cota superior

para las raıces positivas de la ecuacion. (Trivialmente lo es tambien para las

raıces negativas).

El procedimiento consiste en comenzar con la cota obtenida anteriormente

(que no suelen ser muy buena) e ir disminuyendola hasta afinarla todo lo que

podamos.

Ejemplo 1.8 Consideremos la ecuacion 2x4 − 9x3 − x2 + 24x + 12 = 0.

Sabemos que

|x| < 1 +A

|a0|siendo A = max

i≥1|ai| =⇒ |x| < 1 +

24

2= 13

por lo que cualquier raız real del polinomio debe estar en el intervalo (−13, 13).

Aplicando la regla de Laguerre obtenemos:

2 −9 −1 24 12

4 8 −4 −20 16

2 −1 −5 4 28

2 −9 −1 24 12

5 10 5 20 240

2 1 4 48 252

Dado que para x = 4 se obtienen valores negativos no podemos garantizar que

4 sea una cota superior para las raıces positivas de la ecuacion, pero para x = 5

todos los valores obtenidos han sido positivos, por lo que podemos garantizar

que las raıces reales de la ecuacion se encuentran en el intervalo (−13, 5).

No debemos confundir el hecho de que la regla de Laguerre no nos garantice

que 4 sea una cota superior de las raıces positivas y 5 sı lo sea, con que la

Page 38: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

38 Ecuaciones no lineales

ecuacion deba tener alguna raız en el intervalo (4, 5). En otras palabras, 4

puede ser una cota superior para las raıces positivas de la ecuacion aunque la

regla de Laguerre no lo garantice. De hecho, la mayor de las raıces positivas

de nuestra ecuacion es x = 3.56155281280883 . . . < 4. �

Separacion de las raıces

Las cotas obtenidas anteriormente nos delimitan la zona en la que debemos

estudiar la existencia de soluciones de la ecuacion pero, en realidad, lo que mas

nos acerca a nuestro problema (resolver la ecuacion) es separar cada raız en un

intervalo. A este proceso se le conoce como separacion de raıces y estudiaremos

un metodo que se conoce como metodo de Sturm que nos permite separar las

raıces de una ecuacion.

1.5.1 Sucesiones de Sturm

Definicion 1.7 [Sucesion de Sturm]

Una sucesion de Sturm en [a, b] es un conjunto de funciones continuas en dicho

intervalo f0(x), f1(x), . . . , fn(x) que cumplen las siguientes condiciones:

• fn(x) 6= 0 cualquiera que sea x ∈ [a, b]. Es decir, el signo de fn(x)

permanece constante en el intervalo [a, b].

• Las funciones fi(x) y fi+1(x) no se anulan simultaneamente. En otras

palabras, si fi(c) = 0 entonces fi−1(c) 6= 0 y fi+1(c) 6= 0.

• Si fi(c) = 0 entonces fi−1(c) y fi+1(c) tienen signos opuestos, es decir,

fi−1(c) · fi+1(c) < 0. (Engloba al apartado anterior).

• Si f0(c) = 0 con c ∈ [a, b] entoncesf0(x)

f1(x)pasa de negativa a positiva

en c. (Esta bien definida en c por ser f1(c) 6= 0 y es creciente en dicho

punto).

Construccion de una sucesion de Sturm para un polinomio

La construccion de una sucesion de Sturm es, en general, complicada. Sin

embargo, cuando se trabaja con funciones polinomicas, el problema es mucho

mas simple ademas de que siempre es posible construir una sucesion de Sturm

valida para cualquier intervalo.

Page 39: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Un problema mal condicionado: ceros de un polinomio 39

Dada la ecuacion algebraica Pn(x) = 0, partimos de

f0(x) = Pn(x) y f1(x) = P ′n(x)

Para determinar las demas funciones de la sucesion vamos dividiendo fi−1(x)

entre fi(x) para obtener

fi−1(x) = ci(x) · fi(c) + ri(x)

donde ri(x) tiene grado inferior al de fi(x) y hacemos

fi+1(x) = −ri(x)

Como el grado de fi(x) va decreciendo, el proceso es finito. Si se llega a un

resto nulo (el proceso que estamos realizando es precisamente el del algoritmo

de Euclides) la ecuacion posee raıces multiples y se obtiene el maximo comun

divisor D(x) de Pn(x) y P ′n(x). Dividiendo Pn(x) entre D(x) obtenemos una

nueva ecuacion que solo posee raıces simples.

La sucesionfi(x)

D(x)es una sucesion de Sturm para la ecuacion

P (x)

D(x)= Q(x) = 0

que posee las mismas raıces que P (x) = 0 pero todas simples.

Si llegamos a un resto constante, no nulo, es este quien nos determina la

finalizacion del proceso. Hemos obtenido, de esta manera, una sucesion de

Sturm valida para cualquier intervalo [a, b].

Teorema 1.9 [Teorema de Sturm]

Sea f0(x), f1(x), . . . , fn(x) una sucesion de Sturm en el intervalo [a, b] y

consideremos las sucesiones

sig[f0(a)] sig[f1(a)] · · · sig[fn(a)]

sig[f0(b)] sig[f1(b)] · · · sig[fn(b)]

teniendo en cuenta que si alguna de las funciones se anula en uno de los

extremos del intervalo [a, b] pondremos en su lugar, indistintamente, signo +

o - y denotemos por N1 al numero de cambios de signo de la primera sucesion

y por N2 al de la segunda (siempre es N1 ≥ N2).

En estas condiciones, el numero de raıces reales existentes en el intervalo [a, b]

de la ecuacion f0(x) = 0 viene dado por N1 −N2.

Page 40: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

40 Ecuaciones no lineales

Ejemplo 1.9 Vamos a construir una sucesion de Sturm que nos permita se-

parar las raıces de la ecuacion x4 + 2x3 − 3x2 − 4x− 1 = 0.

f0(x) = x4 + 2x3 − 3x2 − 4x− 1. f ′0(x) = 4x3 + 6x2 − 6x− 4.

f1(x) = 2x3 + 3x2 − 3x− 2.

2x4 + 4x3 − 6x2 − 8x− 2 |2x3 + 3x2 − 3x− 2

− 2x4 − 3x3 + 3x2 + 2x x ‖ 1

x3 − 3x2 − 6x− 2 multiplicando por 2

2x3 − 6x2 − 12x− 4

−2x3 − 3x2 + 3x + 2

−9x2 − 9x− 2

f2(x) = 9x2 + 9x + 2.

18x3 + 27x2 − 27x− 18 |9x2 + 9x + 2

− 18x3 − 18x2 − 4x 2x + 1

9x2 − 31x− 18

− 9x2 − 9x− 2

−40x− 20

f3(x) = 2x + 1.

18x2 + 18x + 4 |2x + 1

− 18x2 − 9x 9x ‖ 9

9x + 4 multiplicando por 2

18x + 8

− 18x− 9

−1

f4(x) = 1.

−∞ −3 −2 −1 0 1 2 +∞f0(x) = x4 + 2x3 − 3x2 − 4x− 1 + + − − − − + +

f1(x) = 2x3 + 3x2 − 3x− 2 − − 0 + − 0 + +

f2(x) = 9x2 + 9x + 2 + + + + + + + +

f3(x) = 2x + 1 − − − − + + + +

f4(x) = 1 + + + + + + + +

cambios de signo 4 4 3 3 1 1 0 0

Page 41: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Un problema mal condicionado: ceros de un polinomio 41

Sabemos, por ello, que existe una raız en el intervalo (−3,−2), dos raıces en

el intervalo (−1, 0) y una cuarta raız en el intervalo (1, 2).

Como f0(−1) = −1 < 0, f0(−0.5) = 0.0625 > 0 y f0(0) = −1 < 0 podemos

separar las raıces existentes en el intervalo (−1, 0) y decir que las cuatro raıces

de la ecuacion dada se encuentran en los intervalos

(−3− 2) (−1,−0.5) (−0.5, 0) y (1, 2) �

Si, una vez eliminadas las raıces multiples y separadas las raıces, queremos

resolver la ecuacion, utilizaremos el metodo de Newton.

Al aplicarlo nos encontramos con que tenemos que calcular, en cada paso, los

valores de P (xn) y P ′(xn) por lo que vamos a ver, a continuacion, un algo-

ritmo denominado algoritmo de Horner que permite realizar dichos calculos

en tiempo lineal.

1.5.2 Algoritmo de Horner

Supongamos un polinomio P (x) y un numero real (en general tambien puede

ser complejo) x0 ∈ R. Si dividimos P (x) entre x− x0 sabemos que el resto es

un polinomio de grado cero, es decir, un numero real, por lo que

P (x) = (x− x0)Q(x) + r con

r ∈ R

y

gr[Q(x)] = gr[P (x)]− 1

Haciendo x = x0 obtenemos que

P (x0) = 0 ·Q(x0) + r =⇒ P (x0) = r

Este resultado es conocido como teorema del resto y lo enunciamos a conti-

nuacion.

Teorema 1.10 [Teorema del resto]

El valor numerico de un polinomio P (x) para x = x0 viene dado por el resto

de la division de P (x) entre x− x0.

Page 42: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

42 Ecuaciones no lineales

Algoritmo de Horner

Consideremos el polinomio P (x) = a0xn + a1x

n−1 + · · ·+ an−1x + an.

Si llamamos bi (0 ≤ i ≤ n− 1) a los coeficientes del polinomio cociente

P (x)− P (x0)

x− x0

= Q(x) = b0xn−1 + b1x

n−2 + · · ·+ bn−2x + bn−1

se tiene que

b0 = a0

b1 = a1 + x0b0

b2 = a2 + x0b1

...

bn−1 = an−1 + x0bn−2

r = P (x0) = an + x0bn−1

Este procedimiento para calcular el polinomio cociente Q(x) y el valor nume-

rico de P (x0) es conocido como algoritmo de Horner.

Ademas, dado que

P (x) = Q(x)(x− x0) + P (x0) =⇒ P ′(x) = Q′(x)(x− x0) + Q(x)

se tiene que

P ′(x0) = Q(x0)

y el calculo de Q(x0) es analogo al que hemos realizado para P (x0), es decir,

aplicando el algoritmo de Horner a Q(x) obtenemos

Q(x) = C(x)(x− x0) + Q(x0) donde Q(x0) = P ′(x0).

Regla de Ruffini

Una regla util para hacer los calculos a mano es la conocida regla de Ruffini

que consiste en disponer las operaciones como se indica a continuacion.

a0 a1 a2 · · · an−1 an

x0 x0b0 x0b1 · · · x0bn−2 x0bn−1

b0 b1 b2 · · · bn−1 P (x0)

Page 43: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Sistemas de ecuaciones no lineales 43

Si utilizamos la regla de Ruffini solo tenemos que volver a dividir por x0, como

se muestra a continuacion, para obtener el valor de P ′(x0).

a0 a1 a2 · · · an−2 an−1 an

x0 x0b0 x0b1 · · · x0bn−3 x0bn−2 x0bn−1

b0 b1 b2 · · · bn−2 bn−1 P (x0)

x0 x0c0 x0c1 · · · x0cn−3 x0cn−2

c0 c1 c2 · · · cn−2 P ′(x0)

Ejemplo 1.10 Consideremos el polinomio P (x) = 2x4 + x3 − 3x2 + 4x − 5

y vamos a calcular los valores de P(2) y P’(2). Aplicando reiteradamente al

regla de Ruffini obtenemos

2 1 −3 4 −5

2 4 10 14 36

2 5 7 18 31

2 4 18 50

2 9 25 68

por lo que

P (2) = 31 y P ′(2) = 68 �

Evidentemente, la regla de Ruffini nos es util para realizar calculos a mano

con una cierta facilidad, pero cuando los coeficientes de P (x) y el valor de x0

no son enteros sino que estamos trabajando con varias cifras decimales, deja

de ser efectivo y debemos recurrir al algoritmo de Horner en una maquina.

1.6 Sistemas de ecuaciones no lineales

Dado un sistema de ecuaciones no lineales

f1(x1, x2, . . . , xm) = 0

f2(x1, x2, . . . , xm) = 0

...

fm(x1, x2, . . . , xm) = 0

Page 44: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

44 Ecuaciones no lineales

podemos expresarlo de la forma f(x) = 0 donde x es un vector de Rm y f una

funcion vectorial de variable vectorial, es decir:

f : D ⊂ Rm → Rm

o lo que es lo mismo, f = (f1, f2, . . . , fm) con fi : Rm → R para 1 ≤ i ≤ m.

Ejemplo 1.11 Considerese el sistema

x2 − 2x− y + 0.5 = 0

x2 + 4y2 + 4 = 0

����tt

1

-1

-0.5

1

2-2

-1

f2(x)

f1(x)

Figura 1.10: Grafica del sistema.

Podemos considerarlo como la ecuacion f(x) = 0 (observese que 0 representa

ahora al vector nulo, es decir, que 0 = (0, 0)T ) con x = (x, y)T y f = (f1, f2)

siendo f1(x) = x2 − 2x− y + 0.5

f2(x) = x2 + 4y2 + 4 �

Como hemos transformado el sistema en una ecuacion del tipo f(x) = 0, parece

logico que tratemos de resolverla por algun metodo paralelo a los estudiados

para ecuaciones no lineales como puedan ser la iteracion funcional o el metodo

de Newton.

Page 45: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Sistemas de ecuaciones no lineales 45

Si buscamos un metodo iterado basado en el teorema del punto fijo, debemos

escribir la ecuacion f(x) = 0 de la forma x = F (x) (proceso que puede rea-

lizarse de muchas formas, la mas sencilla es hacer F (x) = x + f(x)) para,

partiendo de un vector inicial x0 construir la sucesion de vectores

xn+1 = F (xn)

x1n+1 = F1(x

1n, x

2n, . . . , x

mn )

x2n+1 = F2(x

1n, x

2n, . . . , x

mn )

...

xmn+1 = Fm(x1

n, x2n, . . . , x

mn )

En el Ejemplo 1.11 podemos hacer

x2 − 2x− y + 0.5 = 0 =⇒ 2x = x2 − y + 0.5 =⇒ x =x2 − y + 0.5

2

x2 + 4y2 − 4 = 0 =⇒ x2 + 4y2 + y − 4 = y =⇒ y = x2 + 4y2 + y − 4

es decir,

x = F (x) con

x = (x, y)T

y

F (x) = (x2 − y + 0.5

2, x2 + 4y2 + y − 4)T

Si x es una solucion de la ecuacion y xn+1 es una aproximacion obtenida, se

tiene que

‖x− xn+1‖ = ‖F (x)− F (xn)‖ = ‖F ′(α)(x− xn)‖ ≤ ‖F ′(α)‖ · ‖x− xn‖

por lo que si ‖F ′(x)‖ ≤ q < 1 para cualquier punto de un determinado entorno

de la solucion, se tiene que

‖x− xn+1‖ ≤ ‖x− xn‖

y la sucesion

x0,x1, . . . ,xn, . . .

converge a la unica raız de la ecuacion x = F (x) en la bola considerada

(intervalo de Rm).

Page 46: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

46 Ecuaciones no lineales

Es importante observar que:

• Se ha utilizado el concepto de norma vectorial al hacer uso de ‖x−xn‖.

• Se ha utilizado una version del teorema del valor medio para varias va-

riables al decir que

‖F (x)− F (xn)‖ ≤ ‖F ′(α)‖ · ‖(x− xn)‖

• Se ha utilizado el concepto de norma matricial al hacer uso de ‖F ′(α)‖ya que F ′(x) es la matriz jacobiana de la funcion F , es decir

F ′(x) =

∂F1

∂x1

· · · ∂F1

∂xm

.... . .

...

∂Fm

∂x1

· · · ∂Fm

∂xm

• Se supone que ‖F ′(α)(x − xn)‖ ≤ ‖F ′(α)‖ · ‖x − xn‖ o de forma mas

general, que para cualquier matriz A (cuadrada de orden n) y cualquier

vector de Rn se verifica que

‖Ax‖ ≤ ‖A‖ · ‖x‖

• Que el teorema del punto fijo es generalizable a funciones vectoriales de

variable vectorial.

1.6.1 Metodo de Newton para sistemas

Consideremos la ecuacion f(x) = 0 (donde f es una funcion vectorial de

variable vectorial) equivalente a un sistema de ecuaciones no lineales.

Sea x la solucion exacta del sistema y xn una aproximacion de ella. Si deno-

tamos por h = x− xn se tiene que

x = xn + h

y haciendo uso del desarrollo de Taylor obtenemos que

0 = f(x) = f(xn + h) ' f(xn) + f ′(xn)h

Page 47: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Sistemas de ecuaciones no lineales 47

de donde

h ' −f ′−1(xn)f(xn)

y, por tanto

x ' xn − f ′−1(xn)f(xn).

Esta aproximacion es que utilizaremos como valor de xn+1, es decir

xn+1 = xn − f ′−1(xn)f(xn)

Observese entonces que cada iteracion del metodo de Newton se reduce al

calculo del vector h correspondiente y este no es mas que la solucion del sistema

de ecuaciones lineales

f ′(xn)h + f(xn) = 0

En el Ejemplo 1.11 se tiene que f(x) = 0 con x = (x, y)T y f = (f1, f2)T donde

f1(x) = x2 − 2x− y + 0.5 y f2(x) = x2 + 4y2 − 4

Tomando como valor inicial x0 = (−0.5, 1)T se tiene que

f(x0) = (0.75, 0.25)T

J(x) =

2x− 2 −1

2x 8y

=⇒ f ′(x0) = J(x0) =

−3 −1

−1 8

por lo que debemos resolver el sistema −3 −1

−1 8

h11

h21

=

−0.75

−0.25

cuya solucion es h1 =

h11

h21

=

0.25

0

y, por tanto

x1 = x0 + h1 =

−0.25

1

Aplicando de nuevo el metodo se obtiene

f(x1) =

0.0625

0.0625

f ′(x1) = J(x1) =

−0.25 −1

−0.5 8

Page 48: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

48 Ecuaciones no lineales

obteniendose el sistema −0.25 −1

−0.5 8

h12

h22

=

−0.0625

−0.0625

cuya solucion es h2 =

h12

h22

=

0.022561 . . .

−0.006 . . .

y, por tanto

x2 = x1 + h2 =

−0.227439 . . .

0.994 . . .

En definitiva, podemos observar que la resolucion de un sistema de ecuaciones

no lineales mediante el metodo de Newton se reduce, en cada iteracion, a la

resolucion de un sistema de ecuaciones lineales por lo que el tema siguiente lo

dedicaremos al estudio de dichos sistemas de ecuaciones.

1.7 Ejercicios resueltos

Ejercicio 1.1 Dada la ecuacion xex − 1 = 0, se pide:

a) Estudiar graficamente sus raıces reales y acotarlas.

b) Aplicar el metodo de la biseccion y acotar el error despues de ocho ite-

raciones.

c) Aplicar el metodo de Newton, hasta obtener tres cifras decimales exactas.

Solucion:

a) La ecuacion puede escribirse de laforma:

ex =1

x

Graficamente, se observa que existeuna unica solucion real (intersec-cion de las dos curvas) y que esta espositiva. La demostracion analıticade este hecho es la siguiente:

Page 49: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Ejercicios resueltos 49

Para x < 0:1

x< 0 y ex > 0 =⇒ ex 6= 1

xy por tanto, no existen raıces negativas.

Para x > 0:

f(x) = xex − 1 =⇒

{f(0) = −1 < 0

f(+∞) = +∞ > 0

y existe, por tanto, un numero impar de raıces positivas (al menos una).

La funcion derivada f ′(x) = xex + ex = (x + 1)ex solo se anula para

x = −1. Dado que, si existiese mas de una raız positiva, el teorema de

Rolle nos asegura que la funcion derivada debe anularse en algun punto

intermedio y hemos visto que f ′(x) no se anula para ningun valor positivo

de la variable, podemos asegurar que solo existe una raız real α, que esta

es positiva y simple, pues f ′(α) 6= 0.

Dado que f(1) = e − 1 > 0 y f(0) = −1 < 0, podemos asegurar que la

unica raız real de la ecuacion se encuentra en el intervalo (0, 1).

b) Metodo de la biseccion:

[a1, b1] = [a, b] = [0, 1] con

{f(0) = −1 < 0

f(1) = e− 1 > 0

f(0.5) < 0 =⇒ [a2, b2] = [0.5, 1]

f(0.75) > 0 =⇒ [a3, b3] = [0.5, 0.75]

f(0.625) > 0 =⇒ [a4, b4] = [0.5, 0.625]

f(0.5625) < 0 =⇒ [a5, b5] = [0.5625, 0.625]

f(0.59375) > 0 =⇒ [a6, b6] = [0.5625, 0.59375]

f(0.578125) > 0 =⇒ [a7, b7] = [0.5625, 0.578125]

f(0.5703125) > 0 =⇒ [a8, b8] = [0.5625, 0.5703125]

Tomando como aproximacion a la raız el punto medio del intervalo

x8 = 0.56640625 =⇒ ε8 ≤1

28= 0.00390625 =⇒ ε8 < 10−2

Si redondeamos a las dos primeras cifras decimales, es decir, si tomamos

α = 0.57, el error acumulado verifica que

ε < |0.57− 0.56640625|+ 0.00390625 = 0.0075 < 10−2

por lo que puede asegurarse que la solucion de la ecuacion es 0.57 con

las dos cifras decimales exactas.

Page 50: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

50 Ecuaciones no lineales

c) Metodo de Newton:

La formula de Newton-Raphson es xn+1 = xn −f(xn)

f ′(xn)

Dado que, por el apartado anterior, se conoce que la raız se encuentra

en el intervalo [0.5625, 0.5703125] y que

f(x) = xex − 1 =⇒

f(0.5625) < 0

f(0.5703125) > 0

f ′(x) = (x + 1)ex =⇒ f ′(x) > 0 ∀x ∈ [0.5625, 0.5703125]

f ′′(x) = (x + 2)ex =⇒ f ′′(x) > 0 ∀x ∈ [0.5625, 0.5703125]

la regla de Fourier nos dice que x0 = 0.5703125

Al ser positiva la segunda derivada, la primera es creciente, por lo que

mınx∈[0.5625,0.5703125]

|f ′(x)| = f ′(0.5703125) = 2.74227290150047 . . .

es decir

εn ≤|f(xn)|

mınx∈[0.5625,0.5703125]

|f ′(x)|<|f(xn)|2.74

obteniendose que

x0 = 0.5703125 con ε0 <|f(x0)|2.74

= 0.00320437856505 . . .

x1 = 0.56715149835900 . . . con ε1 <|f(x1)|2.74

= 0.00000827757122 . . .

Si redondeamos a 0.567 el error acumulado es

ε < 0.00015149835900 . . . + 0.00000827757122 . . . < 10−3

Por lo que la solucion de la ecuacion es 0.567 con sus tres cifras decimales

exactas.

Ejercicio 1.2 Probar que la ecuacion x2 + ln x = 0 solo tiene una raız real y

hallarla, por el metodo de Newton, con 6 cifras decimales exactas.

Solucion: Si representamos las graficas de las funciones y = ln x e y = −x2

obtenemos

Page 51: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Ejercicios resueltos 51

Puede observarse que solo existe un punto de corte entre ellas, por lo que la

ecuacion x2 + ln x = 0 solo posee una raız real.

Analıticamente hay que probar que las graficas no vuelven a cortarse en ningun

otro punto, sin embargo, dado que en su dominio de definicion, que es (0, +∞),

ln x es creciente y −x2 decreciente, no pueden volver a cortarse.

Partiendo de x0 = 0.1 y aplicando el metodo de Newton, en el intervalo (0.1, 1)

(no tomamos (0, 1) por no estar definido el logaritmo en 0), dado por la formula

xn+1 = xn −f(xn)

f ′(xn)= xn −

x2n + ln xn

2xn + 1xn

=x3

n + xn − xn ln xn

2x2n + 1

con un error, a posteriori, dado por εn ≤|f(xn)|

mınx∈(0,1)

|f ′(x)|=|f(xn)|

2, obtenemos:

x1 = 0.32476324441118 . . . con ε1 ≤ 0.509593 . . .

x2 = 0.59809970985991 . . . con ε2 ≤ 0.078137 . . .

x3 = 0.65258567248750 . . . con ε3 ≤ 4.7239 . . . · 10−4

x4 = 0.65291863363348 . . . con ε4 ≤ 9.6269 . . . · 10−9

Por lo que la raız buscada es 0.652919 con un error

ε ≤ 0.00000036636642 . . . + 9.6269 . . . · 10−9 < 10−6

es decir, con las seis cifras decimales exactas.

Ejercicio 1.3 Eliminar las raıces multiples en la ecuacion

x6 − 2x5 + 3x4 − 4x3 + 3x2 − 2x + 1 = 0

Resolver, exactamente, la ecuacion resultante y comprobar la multiplicidad de

cada raız en la ecuacion original.

Page 52: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

52 Ecuaciones no lineales

Solucion: Aplicamos el Algoritmo de Euclides para calcular el maximo co-

mun divisor entre el polinomio P (x) = f0(x) = x6−2x5+3x4−4x3+3x2−2x+1

y su derivada f1(x) = 6x5 − 10x4 + 12x3 − 12x2 + 6x− 2. Para ello podemos

multiplicar, previamente, f0(x) por 3 y dividir f1(x) entre 2.

3x6 − 6x5 + 9x4 − 12x3 + 9x2 − 6x + 3 |3x5 − 5x4 + 6x3 − 6x2 + 3x− 1− 3x6 + 5x5 − 6x4 + 6x3 − 3x2 + x x ‖ − 1

−x5 + 3x4 − 6x3 + 6x2 − 5x + 3 multiplicando por 3−3x5 + 9x4 − 18x3 + 18x2 − 15x + 9

3x5 − 5x4 + 6x3 − 6x2 + 3x− 14x4 − 12x3 + 12x2 − 12x + 8

Por lo que (dividiendo el resto entre 4) f2(x) = x4 − 3x3 + 3x2 − 3x + 2.

Dividimos ahora f1(x) (dividido, previamente entre 2) entre f2(x).

3x5 − 5x4 + 6x3 − 6x2 + 3x− 1 |x4 − 3x3 + 3x2 − 3x + 2

− 3x5 + 9x4 − 9x3 + 9x2 − 6x 3x + 4

4x4 − 3x3 + 3x2 − 3x− 1

−4x4 + 12x3 − 12x2 + 12x− 8

9x3 − 9x2 + 9x− 9 =⇒ f3(x) = x3 − x2 + x− 1

Dividiendo, ahora, f2(x) entre f3(x) se obtiene:

x4 − 3x3 + 3x2 − 3x + 2 |x3 − x2 + x− 1

− x4 + x3 − x2 + x x− 2

−2x3 + 2x2 − 2x + 2

2x3 − 2x2 + 2x− 2

0

El maximo comun divisor entre P (x) y su derivada es

D(x) = x3 − x2 + x− 1

El polinomio cuyas raıces son las mismas que las de P (x), pero simples, es

Q(x) =P (x)

D(x)=

x6 − 2x5 + 3x4 − 4x3 + 3x2 − 2x + 1

x3 − x2 + x− 1= x3 − x2 + x− 1

Como Q(x) = x3 − x2 + x − 1 = (x − 1)(x2 + 1) = (x − 1)(x + i)(x − i) susraıces son 1, i y −i.

Page 53: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Ejercicios resueltos 53

Veamos la multiplicidad de ellas en P (x).

Dado que P ′(x) = 2(3x5 − 5x4 + 6x3 − 6x2 + 3x− 1) se tiene:P ′(1) = 2 (3− 5 + 6− 6 + 3− 1) = 0

P ′(−i) = 2 (−3i− 5 + 6i + 6− 3i− 1) = 0

P ′(i) = 2 (3i− 5− 6i + 6 + 3i− 1) = 0

Luego las tres raıces son dobles (no pueden tener mayor multiplicidad ya queel grado de P (x) es 6, es decir, 2+2+2).

Ejercicio 1.4 Dado el polinomio P (x) = x3 + 3x2 + 2 se pide:

a) Acotar sus raıces reales.

b) Probar, mediante una sucesion de Sturm, que P (x) solo posee una raızreal y determinar un intervalo de amplitud 1 que la contenga.

c) ¿Se verifican, en dicho intervalo, las hipotesis del teorema de Fourier?En caso afirmativo, determinar el extremo que debe tomarse como valorinicial x0 para garantizar la convergencia del metodo de Newton.

d) Sabiendo que en un determinado momento del proceso de Newton se haobtenido xn = −3.1958, calcular el valor de xn+1 ası como una cota delerror en dicha iteracion.

Solucion:

a)

|x| < 1 +3

1= 4 =⇒ −4 < x < 4

b) f0(x) = P (x) = x3 + 3x2 + 2.

P ′(x) = 3x2 + 6x =⇒ f1(x) = x2 + 2x

x3 + 3x2 + 2 = (x2 + 2x)(x + 1) + (−2x + 2) =⇒ f2(x) = x− 1

x2 + 2x = (x− 1)(x + 3) + 3 =⇒ f3(x) = −1

−4 −3 4

x3 + 3x2 + 2 − + +

x2 + 2x + + +

x− 1 − − +

−1 − − −Cambios de signo 2 1 1

Page 54: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

54 Ecuaciones no lineales

por lo que solo posee una raız real, la cual se encuentra en el intervalo(−4,−3).

c) f(x) = x3 + 3x2 + 2 =⇒

f(−4) = −14 < 0

f(−3) = 2 > 0es decir, la funcion

cambia de signo en los extremos del intervalo (−4,−3).

f ′(x) = 3(x2 + 2x) > 0 ∀x ∈ (−4,−3)

f ′′(x) = 6(x + 1) < 0 ∀x ∈ (−4,−3)

por lo que se verifican las hipotesis del teorema de Fourier y, por tanto,tomando como valor inicial x0 = −4 (extremo en el que la funcion tieneel mismo signo que la segunda derivada) se tiene garantizada la conver-gencia del metodo de Newton.

d) Dado que xn+1 = xn −f(xn)

f ′(xn)= xn −

x3n + 3x2

n + 2

3x2n + 6xn

se obtiene que

xn+1 = −3.19582334575880.

El error “a posteriori” viene dado

εn+1 ≤|f(xn+1)|

mınx∈(−4,−3)

|f ′(x)|=|f(xn+1)|f ′(−3)

=|f(xn+1)|

9< −3.989·10−10 <10−9.

Ejercicio 1.5 Aplicar el metodo de Sturm para separar las raıces de la ecua-cion

2x6 − 6x5 + x4 + 8x3 − x2 − 4x− 1 = 0

y obtener la mayor de ellas con seis cifras decimales exactas por el metodo deNewton.

Solucion: Comencemos por construir la sucesion de Sturm.

f0(x) = P (x) = 2x6 − 6x5 + x4 + 8x3 − x2 − 4x− 1

P ′(x) = 12x5 − 30x4 + 4x3 + 24x2 − 2x− 4, por lo que

f1(x) = 6x5 − 15x4 + 2x3 + 12x2 − x− 2

Page 55: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Ejercicios resueltos 55

Multiplicando f0(x) por tres y dividiendo el resultado entre f1(x) obtenemos:

6x6 − 18x5 + 3x4 + 24x3 − 3x2 − 2x− 3 |6x5 − 15x4 + 2x3 + 12x2 − x− 2− 6x6 + 15x5 − 2x4 − 2x3 + x2 + 2x x ‖ − 1

−3x5 + x4 + 12x3 − 2x2 − 10x− 3 multiplicando por 2−6x5 + 2x4 + 24x3 − 4x2 − 20x− 6

6x5 − 15x4 + 2x3 + 12x2 − x− 2−13x4 + 26x3 + 8x2 − 21x− 8

f2(x) = 13x4 − 26x3 − 8x2 + 21x + 8

Multiplicando f1(x) por trece y dividiendo el resultado entre f2(x) obtenemos:

78x5 − 195x4 + 26x3 + 156x2 − 13x− 26 |13x4 − 26x3 − 8x2 + 21x + 8

− 78x5 + 156x4 + 48x3 − 126x2 − 48x 6x− 3

−39x4 + 74x3 + 30x2 − 61x− 26

39x4 − 78x3 − 24x2 + 63x + 24

−4x3 + 6x2 + 2x− 2

f3(x) = 2x3 − 3x2 − x− 1

Multiplicando f2(x) por dos y dividiendo el resultado entre f3(x) obtenemos:

26x4 − 52x3 − 16x2 + 42x + 16 |2x3 − 3x2 − x + 1

− 26x4 + 39x3 + 13x2 − 13x 13x ‖ − 13

−13x3 − 3x2 + 29x + 16 multiplicando por 2

−26x3 − 6x2 + 58x + 32

26x3 − 39x2 − 13x + 13

−45x2 + 45x + 45

f4(x) = x2 − x− 1

Dividimos ahora f3(x) entre f4(x), obteniendo:

2x3 − 3x2 − x + 1 |x2 − x− 1

− 2x3 + 2x2 + 2x 2x− 1

−x2 + x + 1

x2 − x− 1

0

Al haber llegado a un resto nulo sabemos que la ecuacion original tiene raıcesmultiples.

Page 56: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

56 Ecuaciones no lineales

El maximo comun divisor entre P (x) y su derivada es f4(x) = x2 − x − 1,por lo que el polinomio cuyas raıces son las mismas que las de P (x) solo quesimples es

Q(x) =P (x)

x2 − x− 1= 2x4 − 4x3 − x2 + 3x + 1

Debemos, ahora, de construir una sucesion se Sturm para Q(x).

g0(x) = Q(x) = 2x4 − 4x3 − x2 + 3x + 1

g1(x) = f1(x)/(x2 − x− 1) = 6x3 − 9x2 − x + 2

g2(x) = f2(x)/(x2 − x− 1) = 13x2 − 13x− 8

g3(x) = f3(x)/(x2 − x− 1) = 2x− 1

g4(x) = f4(x)/(x2 − x− 1) = 1

Dado que |x| < 1 +A

|a0|, donde A = 4 y |a0| = 2, se tiene que |x| < 3, o lo que

es lo mismo, −3 < x < 3.

−3 −1 −0.5 0 1 1.5 2 3

2x4 − 4x3 − x2 + 3x + 1 + + − + + − + +

6x3 − 9x2 − x + 2 − − − + − + + +

g2(x) = 13x2 − 13x− 8 + + + − − + + +

2x− 1 − − − − + + + +

1 + + + + + + + +

Cambios de signo 4 4 3 2 2 1 0 0

Existen, por tanto, cuatro raıces reales situadas en los intervalos:

[−1,−0.5] [−0.5, 0] [1, 1.5] [1.5, 2]

La mayor de las raıces se encuentra en el intervalo [1.5, 2], pero dado queQ′(1.5) = 0 podemos tomar el intervalo [1.6, 2] en el cual:

Q(x) = 2x4 − 4x3 − x2 + 3x + 1

{Q(1.6) < 0

Q(2) > 0

Q′(x) = 8x3 − 12x2 − 2x + 3 > 0 ∀x ∈ [1.6, 2]

Q′′(x) = 24x2 − 24x− 2 > 0 ∀x ∈ [1.6, 2]

La regla de Fourier no dice que debemos comenzar a iterar en x0 = 2.

Page 57: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Ejercicios resueltos 57

Teniendo en cuenta que xn+1 = xn −Q(x)

Q′(x)se obtiene la sucesion:

x0 = 2

x1 = 1.8

x2 = 1.684726867

x3 = 1.632243690

x4 = 1.618923782 =⇒ ε4 ≤ 0.01841

x5 = 1.618037855 =⇒ ε5 ≤ 0.0011

x6 = 1.618033989 =⇒ ε6 ≤ 0.0000047

x7 = 1.618033989 =⇒ ε7 ≤ 0.885 · 10−10

Es decir, la mayor de las soluciones, redondeando a seis cifras decimales es1.618034 con un error acumulado

ε ≤ 0.000000011 + 0.000000000885 < 10−6

por lo que sus seis cifras decimales son exactas.

Ejercicio 1.6 En este ejercicio se pretende calcular 10√

1 por el metodo deNewton. Consideramos, para ello, la funcion f(x) = x10− 1 cuya grafica se daen la Figura 1.

Fig. 1 Fig. 2

a) Probar, analıticamente, que en el intervalo [0.5, 1.5] posee una unica raızreal.

b) Si tomamos x0 = 0.5 obtenemos la raız x = 1 en la iteracion numero 43,mientras que si tomamos x0 = 1.5 se consigue el mismo resultado en laiteracion numero 9. ¿Como podrıamos haber conocido a priori el valorque se debe elegir para x0?

c) ¿Sabrıas justificar el porque de la extremada lentitud de la convergenciacuando iniciamos el proceso en x0 = 0.5? y ¿por que sigue siendo lentoel proceso si comenzamos en x0 = 1.5? Justifica las respuestas.

Page 58: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

58 Ecuaciones no lineales

d) Dado que en el intervalo [0.5, 1.5] no se anula la funcion x5, las raıces def(x) son las mismas que las de g(x) = f(x)/x5 = x5 − x−5 cuya graficase da en la Figura 2. ¿Se puede aplicar a g(x) la regla de Fourier endicho intervalo?

e) Si resolvemos, por el metodo de Newton, la ecuacion g(x) = 0, ¿ seobtendra la raız con mayor rapidez que cuando lo hicimos con f(x) = 0?Justifica la respuesta sin calcular las iteraciones.

Solucion:

a) Dado que la funcion f(x) es continua y derivable en R verificandose que f(0.5) = 0.510 − 1 < 0

f(1.5) = 1.510 − 1 > 0

por lo que admite un numero impar de raıces en el intervalo [0.5,1.5].

Como f ′(x) = 10x9 no se anula en [0.5,1.5], solo puede existir una raızreal en dicho intervalo.

b) Dado que f ′(x) = 10x9 y f ′′(x) = 90x8 son positivas (tienen signo cons-tante) en todo el intervalo, debe tomarse como valor inicial el extremoen que f(x) tiene el mismo signo que la segunda derivada (Regla deFourier), es decir x0 = 1.5.

c) Basta observar que la recta tangente a la curva y = f(x) en el puntode abscisa x = 0.5 es casi horizontal, por lo que en la primera iteracionnos distanciamos de la raız de forma considerable. Ademas, en las pro-ximidades del 1, la curva es muy vertical, por lo que las tangentes sontambien muy verticales y las iteraciones se aproximan muy lentamentea x = 1. Por tanto, si partimos de x = 0.5 nos distanciamos muchoy nos acercamos muy lentamente, pero si partimos de 1.5 tambien nosacercamos muy lentamente.

d) g′(x) = 5x4 + 5x−6 y g′′(x) = 20x3 − 30x−7 con

g′′(0.5) < 0

g′′(1.5) > 0

por lo que no puede aplicarse la regla de Fourier en dicho intervalo. (Sireducimos el intervalo a [0.5, 1.01] si podemos aplicarla, obteniendo quedebemos tomar x0 = 0.5).

e) El proceso convergera mas rapidamente debido a que hemos eliminadolas tangencias casi horizontales y las casi verticales.

Page 59: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Ejercicios propuestos 59

1.8 Ejercicios propuestos

Ejercicio 1.7 Dada la ecuacion 8x3− 4x2− 18x+9 = 0, acotar y separar susraıces reales.

Sol : |x| ≤ 3.25, x1 ∈ (−2,−1), x2 ∈ (0, 1) y x3 ∈ (1, 2).

Ejercicio 1.8 Se considera el polinomio P (x) = x3 − 6x2 − 3x + 7.

a) Probar, mediante una sucesion de Sturm, que posee una unica raız en elintervalo (6, 7).

b) Si expresamos la ecuacion P (x) = 0 de la forma

x = F (x) =1

3(x3 − 6x2 + 7),

¿podemos asegurar su convergencia?

Sol : No. F ′(x) > 1 en todo el intervalo, por lo que no es contractiva.

c) Probar, aplicando el criterio de Fourier, que tomando como valor inicialx0 = 7, el metodo de Newton es convergente.

d) Aplicando Newton con x0 = 7 se ha obtenido, en la segunda iteracion,x2 = 6.3039. ¿Que error se comete al aproximar la raız buscada por elvalor x3 que se obtiene en la siguiente iteracion?

Sol : ε3 ≤ 6.62 . . . · 10−6 < 10−5.

Ejercicio 1.9 Dada la ecuacion x7 − 14x + 7 = 0 se pide:

a) Probar que solo tiene una raız real negativa.

b) Encontrar un entero a de tal forma que el intervalo [a, a + 1] contenga ala menor de las raıces positivas de la ecuacion.

Sol : a = 0.

c) ¿Cual de los extremos del intervalo [a, a + 1] debe tomarse como valorinicial para asegurar la convergencia del metodo de Newton?

Sol : x0 = a = 0.

d) Aplicar el metodo de Newton para obtener la menor de las raıces positivasde la ecuacion con seis cifras decimales exactas.

Sol : x = 0.500562.

Page 60: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

60 Ecuaciones no lineales

Ejercicio 1.10 Sea el polinomio p(x) = x4 − x2 + 1/8.

a) Utilizar el metodo de Sturm para determinar el numero de raıces realespositivas del polinomio p, ası como para separarlas.

Sol : x1 ∈ (0, 1/2) y x2 ∈ (1/2, 1).

b) Hallar los 2 primeros intervalos de la sucesion ([a1, b1], [a2, b2], . . .) obte-nida de aplicar el metodo de dicotomıa para obtener la mayor raız, r, delpolinomio p. Elegir el intervalo [a1, b1] de amplitud 1/2 y tal que uno desus extremos sea un numero entero.

Sol : [a1, b1] = [1/2, 1], [a2, b2] = [3/4, 1].

c) Sea la sucesion definida por la recurrencia x0 = 1, xn+1 = F (xn), dondela iteracion es la determinada por el metodo de Newton. Estudiar sila regla de Fourier aplicada al polinomio p en el intervalo [a1, b1] delapartado anterior garantiza la convergencia de la sucesion a la raız r.¿Y en el intervalo [a2, b2]?

Sol : En el primero no, en el segundo sı con x0 = 1.

d) Hallar la aproximacion x1 del apartado anterior, determinando una cotadel error cometido.

Sol : x1 = 0.9375 con ε1 ≤ 0.0990 . . .

e) ¿Cuantas iteraciones se deben realizar para garantizar una aproximacionde r con veinte cifras decimales exactas?

Indicacion: En+1 =1

k(kE1)

2n, con k =

max |f ′′(x)|2 mın |f ′(x)|

en un intervalo

adecuado.

Sol : 5 iteraciones (utilizar el intervalo (0.8385, 0.9375)).

Ejercicio 1.11 Dado el polinomio P (x) = x4 + 4x3 − 2x2 + 4x− 3 se pide:

a) Acotar las raıces y construir una sucesion de Sturm para probar que soloposee dos raıces reales, una positiva y otra negativa, dando intervalos deamplitud 1 que las contengan.

Sol : x1 ∈ (−5,−4) y x2 ∈ (0, 1).

b) Partiendo de que la raız positiva se encuentra en el intervalo (0, 1) ydespejando la x del termino lineal

x = −1

4x4 − x3 +

1

2x2 +

3

4⇐⇒ x = ϕ(x)

Page 61: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Ejercicios propuestos 61

¿se puede asegurar la convergencia de la sucesion x1, x2, . . . , xn, . . . defi-nida de la forma x1 = 0, xn+1 = ϕ(xn) ?

Sol : No. La funcion ϕ(x) no es contractiva en [0, 1].

c) Aplicar Fourier para determinar el valor inicial que debe tomarse paragarantizar la convergencia del metodo de Newton en el calculo de la raıznegativa. ¿Tenemos las tres cifras exactas si tomamos como raız -4.646 ?

Sol : x0 = −5. Las tres cifras son exactas.

Ejercicio 1.12 Sea el polinomio p(x) = −3− x + x3.

a) Utilizar una sucesion de Sturm para probar que el polinomio p(x) solotiene una raız α ∈ R y que esta se encuentra en el intervalo I = [0, 3].

b) Comprobar que la grafica adjunta se corresponde con la de la funciony = ϕ(x) cuya iteracion, xn+1 = ϕ(xn) = xn − p(xn)/p′(xn), es la obte-nida con el metodo de Newton para resolver p(x) = 0. Tomando x1 = 0,estudiar geometricamente (sobre el dibujo) si se obtendrıa una sucesion(xn) convergente a α. ¿Y empezando en x1 = 3?

Sol : Con x1 = 0 no pero con x1 = 3 sı.

Page 62: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

62 Ecuaciones no lineales

c) Tomar un subintervalo de I en el que la regla de Fourier garantice laconvergencia del Metodo de Newton y, con un valor inicial apropiado,obtener una aproximacion de α con, al menos, tres cifras decimales exac-tas.

Sol : x ∈ [1, 2], x0 = 2, x = 1.672.

Ejercicio 1.13 Dado el polinomio P (x) = x3 + 6x2 + 9x + k con k ∈ R sepide:

a) ¿Puede carecer de raıces reales? ¿y tener dos y solo dos raıces reales?

Sol : No puede carecer de raıces reales. Sı si una de ellas es doble.

b) Utilizar el metodo de Sturm para probar que tiene una unica raız realsi, y solo si, k < 0 o k > 4, y que solo tiene raıces multiples si k = 0 ok = 4 no existiendo, en ningun caso, una raız triple.

c) Para k = −4 admite una unica raız real en el intervalo [0, 1]. Si tomamoscomo valor aproximado de la raız x = 0.3553 ¿de cuantas cifras decimalesexactas disponemos?

Sol : x = 0.35530 con las 5 cifras decimales exactas.

d) Si, en el caso anterior en que k = −4, aplicamos el metodo de Newtonpara hallar la raız del polinomio, ¿cual de los extremos del intervalo [0, 1]deberıamos tomar como valor inicial x0 para garantizar la convergencia?y ¿que valor obtendrıamos para x2?

Sol : x0 = 1, x2 = 0.365079 . . ..

Page 63: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Ejercicios propuestos 63

Ejercicio 1.14 Dados los polinomios

P (x) = 2x3 − 2x2 − 2αx + 3α

Q(x) = x3 − 3x2 − 3αx + 2α

a) Determinar el valor de α sabiendo que se trata de un entero par y quelos valores de dichos polinomios solo coinciden, para valores positivos dex, en un punto del intervalo (1, 2).

Sol : α = −2 (estudiar el polinomio diferencia D(x) = P (x)−Q(x)).

b) Probar (mediante una sucesion de Sturm) que, para α = −2, el polinomioP (x) solo tiene una raız real, que esta es positiva, y dar un intervalo deamplitud 1 que la contenga.

Sol : x ∈ [1, 2].

c) ¿Verifica el polinomio P (x) las condiciones de Fourier para la convergen-cia del metodo de Newton en el intervalo (1.2, 1.3)?

Sol : Sı, x0 = 1.3.

d) Si tomamos como valor inicial x0 = 1.3, calcular el valor que se obtienepara x1 dando una cota del error.

Sol : x1 = 1.27606263982103, ε1 ≤ 4.20 · 10−4 < 10−3.

Ejercicio 1.15

“Cuando dos raıces positivas de una ecuacion polinomica estan muy proximas,suele ser difıcil separarlas mediante intervalos cerrados. Para alejarlas sepuede proceder como sigue:

Paso 1: Sea la ecuacion polinomica

P (x) = anxn + an−1x

n−1 + · · ·+ a1x + a0 = an(x− α1) · · · (x− αn) = 0

Paso 2: Cambiar x por x2 en P (x) = 0

P (x2) = an(x2 − α1) · · · (x2 − αn) = 0

Paso 3: Cambiar x por −x2 en P (x) = 0

P (−x2) = an(−x2 − α1) · · · (−x2 − αn) = (−1)nan(x2 + α1) · · · (x2 + αn)=0

Page 64: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

64 Ecuaciones no lineales

Paso 4: Multiplicar las dos ecuaciones anteriores para obtener la nuevaecuacion

P (x2)P (−x2) = (−1)na2n(x4 − α2

1) · · · (x4 − α2n)=0

Paso 5: En el polinomio obtenido, cambiar x4 por una nueva variable t,obteniendo una ecuacion del tipo (t− α2

1) · · · (t− α2n) = 0.

Se obtiene ası una ecuacion polinomica cuyas raıces son los cuadrados de lasraıces de la ecuacion P (x) = 0. La relacion entre las raıces de la nuevaecuacion con las de P (x) = 0 es α2

i −α2j = (αi + αj)(αi−αj). Ası, se observa

que las nuevas raıces se alejan (o se acercan) αi + αj veces mas que las raıcesde P (x) = 0.

Si este procedimiento se aplica dos veces se obtiene una ecuacion de la forma(t− α4

1) · · · (t− α4n) = 0”

Sea la ecuacion P (x) = 2x2−9x+10 = 0, y sea Q(x) = 0 la ecuacion obtenidaal aplicar dos veces el metodo anteriormente descrito. Se pide:

a) Mediante una sucesion de Sturm, demostrar que P (x) = 0 posee dosraıces reales.

b) Comprobar que se obtiene el polinomio Q(x) = 16x2 − 881x + 10000

c) Separando previamente las raıces de Q(x) = 0, utilizar una formula deerror a posteriori para calcular la mayor de ellas, con dos cifras decima-les exactas, aplicando el metodo de Newton. Denotemos por α la raızobtenida tomando solo dos cifras decimales.

Sol : x1 ∈ [10, 20], x2 ∈ [30, 40], α = 39.06.

d) Para resolver la ecuacion x4 − α = 0 por el metodo de Newton y asıcalcular la raız de P (x) = 0, hacer lo siguiente:

d.1) Encontrar un intervalo [a, b] que solo contenga a la mayor raız realde esta ecuacion y en donde se verifiquen las hipotesis de la reglade Fourier.

Sol : [2, 3].

d.2) ¿Cuantas iteraciones son necesarias para obtener 25 cifras decimales

exactas? Indicacion: En+1 ≤1k(kE1)2

n, con k =

max |f ′′(x)|2 mın |f ′(x)|

en un

intervalo adecuado.

Sol : 3 iteraciones (reducir el intervalo inicial al [2, 2.5]).

Page 65: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Ejercicios propuestos 65

d.3) Con una calculadora se ha obtenido β = 4√

α = 2.49995999903 comomejor aproximacion.

¿Cuantas de las cifras decimales se podrıan garantizar que coincidencon las de la verdadera raız de P (x)?

Sol : A lo mas de 2 que son las que tenıa el valor de α.

Ejercicio 1.16

a) Dado el polinomio P (x) = x3 − 7x2 + 20x− 26, utilizar una sucesion deSturm para comprobar que P (x) = 0 solo tiene una raız real positiva yque se encuentra en el intervalo [3, 4].

b) Justificar la convergencia del metodo de Newton para aproximar la raızreal de la ecuacion P (x) = 0 contenida en el intervalo [3, 4]. Realizardos iteraciones del metodo y dar una cota del error de la aproximacionobtenida. ¿Se trata de un problema bien o mal condicionado? Razonarla respuesta.

Sol : x2 = 3.35483870967742, ε2 ≤ 0.01413849820416. La derivada deP (x) oscila de 5 a 12, por lo que esta bien condicionado.

Ejercicio 1.17 Queremos aproximar las raıces de la ecuacion (5− x)ex = 5.

a) Probar, graficamente, que existen dos soluciones, una es x = 0 y la otrax = α se encuentra en el intervalo [1, 5]. Aproximarla realizando dospasos del metodo de la Regula falsi.

Sol : x2 = 4.78799912600669

b) ¿Es posible aproximar α aplicando un metodo de iteracion funcional

sobre la funcion ϕ1(x) = ln

(5 + xex

5

)partiendo de cualquier punto del

intervalo I = [1, 5]? Justifica tu respuesta.

Sol : No. Solo en [1, ln 5]

c) ¿Y sobre la funcion ϕ2(x) = 5 − 5

expartiendo de cualquier punto del

intervalo I = [1, 5]? Justifica tu respuesta.

Sol : No. Solo en [ln 5, 5]

d) ¿Y sobre ϕ2(x) en I = [2, 5]? Justifica tu respuesta.

Sol : Sı.

Page 66: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion
Page 67: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

2. Sistemas de ecuaciones linea-les

2.1 Normas vectoriales y matriciales

Definicion 2.1 [Concepto de norma]

Sea E un espacio vectorial definido sobre un cuerpo K. Se define una normacomo una aplicacion, que denotaremos por ‖ ‖, de E en R que verifica lassiguientes propiedades:

• ‖x‖ ≥ 0 ∀x ∈ E siendo ‖x‖ = 0 ⇐⇒ x = 0. Definida positiva.

• ‖λ x‖ = |λ|‖x‖ ∀λ ∈ K, ∀x ∈ E. Propiedad de homogeneidad.

• ‖x + y‖ ≤ ‖x‖+ ‖y‖ ∀x, y ∈ E. Desigualdad triangular.

Es frecuente que en el espacio E se haya definido tambien el producto de doselementos. En este caso, si se verifica que

‖x · y‖ ≤ ‖x‖ · ‖y‖

se dice que la norma es multiplicativa.

Esta propiedad de las normas es fundamental cuando trabajamos en el con-junto de las matrices cuadradas de orden n.

Un espacio E en el que hemos definido una norma recibe el nombre de espacionormado.

67

Page 68: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

68 Sistemas de ecuaciones lineales

2.1.1 Normas vectoriales

Sea E un espacio vectorial de dimension n y sea B = {u1, u2, . . . , un} una basesuya. Cualquier vector x ∈ E puede ser expresado de forma unica en funcionde los vectores de la base B.

x =n∑

i=1

xiui

donde los escalares (x1, x2, . . . , xn) se conocen como coordenadas del vector xrespecto de la base B.

Utilizando esta notacion, son ejemplos de normas los siguientes:

• Norma-1 ‖x‖1 =n∑

i=1

|xi|

• Norma euclıdea o Norma-2 ‖x‖2 =

√√√√ n∑i=1

|xi|2 =√

x∗x

• Norma infinito ‖x‖∞ = maxi|xi|

Ejemplo 2.1 Para los vectores

x = (2, 3, 0, −12)T y = (1 + i, i)T

• ‖x‖1 = 2 + 3 + 0 + 12 = 17 ‖y‖1 = |1 + i|+ |i| =√

2 + 1

• ‖x‖2 =√

22 + 32 + 02 + 122 = 13 ‖y‖2 =√|1 + i|2 + |i|2 =

√3

• ‖x‖∞ = | − 12| = 12 ‖y‖∞ = |1 + i| =√

2

2.1.2 Distancia inducida por una norma

Definicion 2.2 [Distancia]

Dado un espacio vectorial E, se define una distancia como una aplicaciond : E × E → R cumpliendo que:

Page 69: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Normas vectoriales y matriciales 69

• d(x, y) ≥ 0 ∀x, y ∈ E siendo d(x, y) = 0 ⇐⇒ x = y.

• d(x, y) = d(y, x) ∀x, y ∈ E.

• d(x, y) ≤ d(x, z) + d(z, y) ∀x, y, z ∈ E.

Teorema 2.1 [Distancia inducida por una norma]

Si(E, ‖ ‖

)es un espacio normado, la norma ‖ ‖ induce una distancia en E

que se conoce como distancia inducida por la norma ‖ ‖ y viene definida por:

d(x, y) = ‖x− y‖

Demostracion. Veamos que, en efecto, se trata de una distancia:

• d(x, y) ≥ 0 por tratarse de una norma, y ademas:

d(x, y) = 0 ⇐⇒ ‖x− y‖ = 0 ⇐⇒ ‖x− y‖ = 0 ⇐⇒ x = y.

• d(x, y) = ‖x− y‖ = ‖ − 1(y− x)‖ = | − 1| · ‖y− x‖ = ‖y− x‖ = d(y, x).

• d(x, y) = ‖x− y‖ = ‖x− z + z − y‖ ≤ ‖x− z‖+ ‖z − y‖ =

= d(x, z) + d(z, y).

2.1.3 Convergencia en espacios normados

Una sucesion de vectores v1, v2, . . . de un espacio vectorial normado (V, ‖ ‖) sedice que es convergente a un vector v si

limk→∞

‖vk − v‖ = 0

Esta definicion coincide con la idea intuitiva de que la distancia de los vectoresde la sucesion al vector lımite v tiende a cero a medida que se avanza en lasucesion.

Teorema 2.2 Para un espacio vectorial normado de dimension finita, el con-cepto de convergencia es independiente de la norma utilizada.

Page 70: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

70 Sistemas de ecuaciones lineales

2.1.4 Normas matriciales

Dada una matriz A y un vector x, consideremos el vector transformado Ax.La relacion existente entre la norma del vector transformado y la del vectororiginal va a depender de la matriz A. El mayor de los cocientes entre dichasnormas, para todos los vectores del espacio, es lo que vamos a definir comonorma de la matriz A, de tal forma que de la propia definicion se deduce que

‖Ax‖ ≤ ‖A‖ ‖x‖

cualquiera que sea el vector x del espacio. (Observese que no es lo mismo quela propiedad multiplicativa de una norma, ya que aquı se estan utilizando dosnormas diferentes, una de matriz y otra de vector).

Definicion 2.3 [Norma de una matriz]

Se define

‖A‖ = maxx∈V−{0}

‖Ax‖‖x‖

= max{‖Ax‖ : ‖x‖ = 1}

de tal forma que a cada norma vectorial se le asociara, de forma natural, unanorma matricial.

• Norma-1 ‖A‖1 = max{‖Ax‖1 : ‖x‖1 = 1}.

Dado que Ax = y =⇒ yi =n∑

k=1

aikxk se tiene que

‖A‖1 = max{n∑

i=1

n∑k=1

|aikxk| : ‖x‖1 = 1}.

Por ultimo, si descargamos todo el peso sobre una coordenada, es decir,si tomamos un vector de la base canonica, obtenemos que

‖A‖1 = maxj

n∑i=1

|aij|.

• Norma euclıdea ‖A‖2 = max{√

x∗A∗Ax :√

x∗x = 1}

Descargando ahora el peso en los autovectores de la matriz A∗A obtene-mos que

‖A‖2 = maxi{√

x∗λix :√

x∗x = 1} = maxi

√λi = max

iσi

donde σi representa a los valores singulares de la matriz A, es decir, lasraıces cuadradas positivas de los autovalores de la matriz A∗A.

Page 71: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Normas vectoriales y matriciales 71

• Norma infinito ‖A‖∞ = max{n∑

j=1

|aijxj| : ‖x‖∞ = 1}.

Como ahora se dara el maximo en un vector que tenga todas sus coor-denadas iguales a 1, se tiene que

‖A‖∞ = maxi

n∑j=1

|aij|.

Tenemos pues, que las normas asociadas (algunas veces llamadas subordinadas)a las normas de vector estudiadas anteriormente son:

Norma-1 ‖A‖1 = maxj

n∑i=1

|aij|.

Norma euclıdea ‖A‖2 = maxi

σi.

Norma infinito ‖A‖∞ = maxi

n∑j=1

|aij|.

Si consideramos la matriz como un vector de m × n coordenadas, podemosdefinir (de manera analoga a la norma euclıdea de vector) la denominada

Norma de Frobenius ‖A‖F =

√∑i,j

|aij|2 =√

tr A∗A

Ejemplo 2.2 Para la matriz A =

1 1 2

2 −1 1

1 0 1

se tiene:

• ‖A‖1 = maxj

n∑i=1

|aij| = max{(1 + 2 + 1), (1 + | − 1|+ 0), (2 + 1 + 1)} = 4

• El polinomio caracterıstico de la matriz AT A =

6 −1 5

−1 2 1

5 1 6

es

p(λ) = λ3 − 14λ2 + 33λ = λ(λ− 3)(λ− 11)

Los autovalores de la matriz AT A son 0, 3 y 11, por lo que los valoressingulares de la matriz A son 0,

√3 y

√11 y, por tanto,

‖A‖2 = maxi

σi =√

11

Page 72: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

72 Sistemas de ecuaciones lineales

• ‖A‖∞ = maxi

n∑j=1

|aij| = max{(1+1+2), (2+ |− 1|+1), (1+0+1)} = 4

• ‖A‖F =√

tr AT A =√

6 + 2 + 6 =√

14. �

2.1.5 Transformaciones unitarias

Definicion 2.4 [Matriz unitaria]

La matriz U ∈ Cn×n de una transformacion se dice unitaria si

U∗U = UU∗ = I ⇐⇒ U∗ = U−1

Proposicion 2.3 La norma de Frobenius y la norma euclıdea de vector soninvariantes mediante transformaciones unitarias.

Demostracion.

• Para la norma matricial de Frobenius:

‖UA‖F =√

tr [(UA)∗(UA)] =√

tr (A∗U∗UA) =√

tr (A∗A) = ‖A‖F

‖AU‖F =√

tr [(A U)∗(A U)] =√

tr [(A U)(A U)∗] =

=√

tr (A U U∗A∗) =√

tr (A A∗) =√

tr (A∗A) = ‖A‖F

• Para la norma euclıdea de vector.

‖Ux‖2 =√

(Ux)∗(Ux) =√

x∗U∗Ux =√

x∗x = ‖x‖2

Proposicion 2.4 Las matrices A, A∗, AU y UA, donde U es una matrizunitaria, poseen los mismos valores singulares y, por tanto, lo misma normaeuclıdea.

Demostracion. Veamos, en primer lugar que las matrices A∗A y AA∗ poseenlos mismos autovalores. En efecto:

Sea λ un autovalor de A∗A y x un autovector asociado a λ.

A∗Ax = λx =⇒ AA∗Ax = λAx

y llamando y = Ax tenemos que AA∗y = λy, por lo que λ es un autovalor dela matriz AA∗ asociado al autovector y = Ax. Ası pues, cualquier autovalorde A∗A lo es tambien de AA∗.

Razonando de igual forma se obtiene que cualquier autovalor de AA∗ lo estambien de A∗A, por lo que ambas matrices poseen los mismos autovalores.

Page 73: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Normas vectoriales y matriciales 73

• Como los valores singulares de la matriz A son las raıces cuadradas posi-tivas de los autovalores de A∗A y los de A∗ las raıces cuadradas positivasde los autovalores de AA∗ (los mismos que los de A∗A), las matrices Ay A∗ poseen los mismos valores singulares.

• Los valores singulares de UA son las raıces cuadradas positivas de losautovalores de (UA)∗(UA) = A∗U∗UA = A∗A que eran precisamente losvalores singulares de la matriz A.

• Los valores singulares de AU son (por el primer apartado) los mismosque los de (AU)∗ = U∗A∗ es decir, las raıces cuadradas positivas de losautovalores de (U∗A∗)∗(U∗A∗) = AUU∗A∗ = AA∗ cuyos autovalores sonlos mismos que los de A∗A, por lo que AU tiene tambien los mismosvalores singulares que la matriz A.

Proposicion 2.5 La norma euclıdea de una matriz unitaria vale siempre 1.

Demostracion.

‖U‖2 = maxx∈V−{0}

‖Ux‖2

‖x‖2

= maxx∈V−{0}

‖x‖2

‖x‖2

= 1

Proposicion 2.6 La norma euclıdea es invariante mediante transformacionesde semejanza unitarias.

Demostracion. Sea A y B dos matrices unitariamente semejantes, es decir,tales que

B = U∗AU con U unitaria

B = U∗AU =⇒ ‖B‖2 ≤ ‖U∗‖2‖A‖2‖U‖2 = ‖A‖2

A = UBU∗ =⇒ ‖A‖2 ≤ ‖U‖2‖B‖2‖U∗‖2 = ‖B‖2

=⇒ ‖B‖2 = ‖A‖2

2.1.6 Radio espectral

Definicion 2.5 [Radio espectral]

Se define el radio espectral de una matriz A, y se denota por ρ(A) como elmaximo de los modulos de los autovalores de la referida matriz.

ρ(A) = maxi|λi|

Geometricamente representa el radio del cırculo mınimo que contiene a todoslos autovalores de la matriz.

Page 74: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

74 Sistemas de ecuaciones lineales

Teorema 2.7 El radio espectral de una matriz es una cota inferior de todaslas normas multiplicativas de dicha matriz.

Demostracion. Sean {λ1, λ2, . . . , λr} los autovalores de la matriz A y sean{x1, x2, . . . , xr} autovectores asociados a dichos autovalores.

‖Axi‖ = ‖λixi‖ = |λi| ‖xi‖.

Por otra parte sabemos que ‖Axi‖ ≤ ‖A‖ ‖xi‖. Por tanto:|λi| ‖xi‖ ≤ ‖A‖ ‖xi‖ siendo ‖xi‖ 6= 0 por tratarse de autovectores.

Se obtiene entonces que |λi| ≤ ‖A‖ para cualquiera que sea i = 1, 2, . . . , r, dedonde max

i|λi| ≤ ‖A‖, es decir: ρ(A) ≤ ‖A‖.

Definicion 2.6 [Matriz de diagonal dominante]

Una matriz cuadrada de orden n A = (aij)i = 1, 2, . . . , n

j = 1, 2, . . . , n

se dice que es una matriz

de diagonal dominante o de Hadamard si

|aii| >n∑

k = 1

k 6= i

|aik| i = 1, 2, . . . , n

Ejemplo 2.3 La matriz A =

3 1 1

0 2 1

2 −1 5

es de diagonal dominante por

verificar que

3 > 1 + 1 2 > 0 + 1 y 5 > 2 + | − 1| = 3 �

Teorema 2.8 Toda matriz de diagonal dominante es regular.

Demostracion. Supongamos que A es de diagonal dominante y que su deter-minante fuese nulo. En ese caso, el sistema Ax = 0 posee solucion no trivial(α1, α2, . . . , αn) 6= (0, 0, . . . , 0).

Sea |αk| = maxi|αi| > 0 y consideremos la k-esima ecuacion:

ak1α1 + ak2α2 + · · ·+ akkαk + · · ·+ aknαn = 0 =⇒

ak1α1

αk

+ ak2α2

αk

+ · · ·+ akk + · · ·+ aknαn

αk

= 0 =⇒

akk = −ak1α1

αk

− · · · − ak k−1αk − 1

αk

− ak k+1αk + 1

αk

− · · · − aknαn

αk

=⇒

Page 75: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Normas vectoriales y matriciales 75

|akk| ≤n∑

i = 1

i 6= k

|aki|∣∣∣∣αi

αk

∣∣∣∣ ≤ n∑i = 1

i 6= k

|aki|

en contra de la hipotesis de que A es de diagonal dominante, por lo que todamatriz de diagonal dominante es regular.

Definicion 2.1 Matrices fundamentales de una matriz A

Se denominan matrices fundamentales de una matriz A, y se denotan por Ak, alas submatrices constituidas por los elementos de A situados en las k primerasfilas y las k primeras columnas, es decir:

A1 = (a11) A2 =

(a11 a12

a21 a22

)A3 =

a11 a12 a13

a21 a22 a23

a31 a32 a33

· · ·

Teorema 2.9 Las matrices fundamentales Ak de una matriz A de diagonaldominante, son tambien de diagonal dominante.

Demostracion. La demostracion es trivial, ya que si A es de diagonal domi-nante se verifica que

|aii| >n∑

j = 1

j 6= i

|aij| ≥k∑

j = 1

j 6= i

|aij|

luego Ak tambien lo es.

Definicion 2.7 [Cırculos de Gerschgorin]

Sea A ∈ Kn×n. Se definen los cırculos de Gerschgorin como los conjuntos

C1 = {z : |z − a11| ≤ r1}

C2 = {z : |z − a22| ≤ r2}...

Cn = {z : |z − ann| ≤ rn}

con ri =

n∑j = 1

j 6= i

|aij| para 1 ≤ i ≤ n

Teorema 2.10 [Teorema de Gerschgorin]

Sean C1, C2, . . . , Cn los cırculos de Gerschgorin de una matriz A. Si λ es un

autovalor de A, se verifica que λ ∈n⋃

i=1

Ci.

Page 76: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

76 Sistemas de ecuaciones lineales

Demostracion. Si λ 6∈n⋃

i=1

Ci es porque λ 6∈ Ci para ningun i = 1, 2, . . . , n,

por lo que

|λ− a11| > r1

|λ− a22| > r2

...

|λ− ann| > rn

y, por tanto, la matriz

λI − A =

λ− a11 −a12 · · · −a1n

−a21 λ− a22 · · · −a2n

......

. . ....

−an1 −an2 · · · λ− ann

es una matriz de diagonal dominante, por lo que det(λI−A) 6= 0 y, por tanto,λ no puede ser un autovalor de la matriz A en contra de la hipotesis.

Observese que como det A = det AT se verifica que

det(λI − A) = det(λI − A)T = det(λI − AT )

es decir, A y AT tienen el mismo polinomio caracterıstico y, por tanto, losmismos autovalores.

Ello nos lleva a que los cırculos de Gerschgorin obtenidos por columnas de-terminan tambien el dominio de existencia de los autovalores de la matriz A,es mas, la interseccion de los cırculos obtenidos por filas y los obtenidos porcolumnas contienen a todos los autovalores de la matriz A.

Teorema 2.11 Si un conjunto de k cırculos de Gerschgorin de una matriz Aconstituyen un dominio conexo aislado de los otros cırculos, existen exacta-mente k autovalores de la matriz A en dicho dominio.

Ejemplo 2.4 Dada la matriz A =

0 2 3

2 8 2

2 0 10

, sus cırculos de Gerschgorin

Page 77: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Sistemas de ecuaciones lineales 77

obtenidos por filas son

C1 = {z : |z − 0| ≤ 5}

C2 = {z : |z − 8| ≤ 4}

C3 = {z : |z − 10| ≤ 2}

Mientras que los obtenidos por columnas son

C1 = {z : |z − 0| ≤ 4}

C2 = {z : |z − 8| ≤ 2}

C3 = {z : |z − 10| ≤ 5}

Estos ultimos nos dicen que la matriz tiene, al menos, un autovalor real (hayun cırculo que solo contiene a un autovalor y este debe ser real ya que deser complejo el conjugado tambien serıa autovalor de A y al tener el mismomodulo se encontrarıa en el mismo cırculo contra la hipotesis de que en dichocırculo solo se encuentra un autovalor), es decir los cırculos obtenidos por filasno nos dan informacion sobre el autovalor real, mientras que los obtenidos porcolumnas nos dicen que existe un autovalor real en el intervalo (-4,4). �

2.2 Sistemas de ecuaciones lineales

En el capıtulo anterior se estudiaron metodos iterados para la resolucion deecuaciones no lineales. Dichos metodos se basaban en el teorema del puntofijo y consistıan en expresar la ecuacion en la forma x = ϕ(x) exigiendo queϕ′(x) ≤ q < 1 para cualquier x del intervalo en el cual se trata de buscar lasolucion.

Para los sistemas de ecuaciones lineales, de la forma Ax = b, trataremos debuscar metodos iterados de una forma analoga a como se hizo en el caso de lasecuaciones, es decir, transformando el sistema en otro equivalente de la formax = F (x) donde F (x) = Mx + N . Evidentemente habra que exigir algunascondiciones a la matriz M para que el metodo sea convergente (al igual que seexigıa que ϕ′(x) ≤ q < 1 en el caso de las ecuaciones) y estas condiciones sebasan en los conceptos de normas vectoriales y matriciales.

Page 78: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

78 Sistemas de ecuaciones lineales

Dada una aplicacion f : Rm → Rn y un vector b ∈ Rn, resolver el sistemade ecuaciones f(x) = b no es mas que buscar el conjunto de vectores de Rm

cuya imagen mediante f es el vector b, es decir, buscar la imagen inversa de bmediante f .

Un sistema de ecuaciones se dice lineal en su componente k-esima si verificaque

f(x1, . . . , xk−1, αx1k +βx2

k, xk+1, . . . , xm) = αf(x1, . . . , xk−1, x1k, xk+1, . . . , xm)+

+ βf(x1, . . . , xk−1, x2k, xk+1, . . . , xm)

Diremos que un sistema es lineal si lo es en todas sus componentes, pudiendose,en este caso, escribir de la forma Ax = b.

Transformacion de un sistema complejo en otro real

Si la aplicacion f se define de Cm en Cn resulta un sistema complejo que puedeser transformado en otro sistema real.

Ası, por ejemplo, si el sistema es lineal

f : Cm → Cn ⇐⇒ Mz = k con

M ∈ Cm×n

x ∈ Cn×1

k ∈ Cm×1

podemos descomponer la matriz M en suma de otras dos de la forma

M = A + iB con A, B ∈ Rm×n

y analogamente

z = x + iy con x, y ∈ Rn×1

k = k1 + ik2 con k1, k2 ∈ Rm×1

por lo que (A + iB)(x + iy) = k1 + ik2 es decir Ax−By = k1

Bx + Ay = k2

=⇒

A −B

B A

x

y

=

k1

k2

sistema real de 2m ecuaciones con 2n incognitas.

Es por ello, que centraremos nuestro estudio en los sistemas reales.

Clasificacion de los SS.EE.LL

Podemos clasificar los sistemas de ecuaciones lineales atendiendo a

Page 79: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Sistemas de ecuaciones lineales 79

• Su tamano

– Pequenos: n ≤ 300 donde n representa el numero de ecuaciones.

– Grandes: n > 300

(Esta clasificacion corresponde al error de redondeo)

• Su estructura

– Si la matriz posee pocos elementos nulos diremos que se trata deun sistema lleno.

– Si, por el contrario, la matriz contiene muchos elementos nulos,diremos que la matriz y, por tanto, que el sistema es disperso osparce. Matrices de este tipo son las denominadas

∗ Tridiagonales:

a11 a12 0 0

a21 a22 a23 0

0 a32 a33 a34

0 0 a43 a44

∗ Triangulares superiores:

a11 a12 a13 a14

0 a22 a23 a24

0 0 a33 a34

0 0 0 a44

∗ Triangulares inferiores:

a11 0 0 0

a12 a22 0 0

a31 a32 a33 0

a41 a42 a43 a44

En cuanto a los metodos de resolucion de sistemas de ecuaciones lineales,podemos clasificarlos en

• Metodos directos

Aquellos que resuelven un sistema de ecuaciones lineales en un numerofinito de pasos.

Se utilizan para resolver sistemas pequenos.

• Metodos iterados Aquellos que crean una sucesion de vectores queconvergen a la solucion del sistema.

Se utilizan para la resolucion de sistemas grandes, ya que al realizar un

Page 80: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

80 Sistemas de ecuaciones lineales

gran numero de operaciones los errores de redondeo pueden hacer ines-table al proceso, es decir, pueden alterar considerablemente la soluciondel sistema.

2.2.1 Numero de condicion

Definicion 2.8 [Condicionamiento de un sistema]

Un sistema de ecuaciones lineales Ax = b se dice bien condicionado cuandolos errores cometidos en los elementos de la matriz A y del vector b producenen la solucion un error del mismo orden, mientras que diremos que el sistemaesta mal condicionado si el error que producen en la solucion del sistema esde orden superior al de los datos. Es decir:

‖A− A‖ < ε

‖b− b‖ < ε=⇒

‖x− x‖ ' ε sistema bien condicionado

‖x− x‖ � ε sistema mal condicionado

Consideremos el sistema cuadrado Ax = b con A regular, es decir, un sistemacompatible determinado. En la practica, los elementos de A y de b no suelenser exactos bien por que procedan de calculos anteriores, o bien porque seanirracionales, racionales periodicos, etc. Es decir, debemos resolver un sistemaaproximado cuya solucion puede diferir poco o mucho de la verdadera soluciondel sistema.

Ası, por ejemplo, en un sistema de orden dos, la solucion representa el puntode interseccion de dos rectas en el plano. Un pequeno error en la pendiente deuna de ellas puede hacer que dicho punto de corte se desplace solo un poco ouna distancia considerable (vease la Figura 2.1), lo que nos dice que el sistemaesta bien o mal condicionado, respectivamente.

Podemos ver que el sistema esta mal condicionado cuando las pendientes de lasdos rectas son muy similares y que mientras mas ortogonales sean las rectas,mejor condicionado estara el sistema.

Ejemplo 2.5 Si consideramos el sistema de orden 2 3x + 4y = 7

3x + 4.00001y = 7.00001de solucion

(x

y

)=

(1

1

)

Page 81: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Sistemas de ecuaciones lineales 81

r1 r′1

r2

Sistema mal condicionado

r1 r′1

r2

Sistema bien condicionado

��

��

��

��

��

��

���������������@

@@

@@

@@

@@

��

��

��

��

��

��

���

%%

%%

%%

%%

%%

%%

%%

ss s

s

Figura 2.1: Condicionamiento de un sistema.

y cometemos un pequeno error en los datos, podemos obtener el sistema 3x + 4y = 7

3x + 3.99999y = 7.00004de solucion

(x

y

)=

(7.6

−4

)

o bien este otro 3x + 4y = 7

3x + 3.99999y = 7.000055de solucion

(x

y

)=

(9.6

−5.5

)

lo que nos dice que estamos ante un sistema mal condicionado.

Si sustituimos la segunda ecuacion por la que resulta de sumarle la primeramultiplicada por −1.0000016 (la ecuacion resultante se multiplica por 106 y sedivide por −1.2) nos queda el sistema 3x + 4y = 7

4x− 3y = 1de solucion

(x

y

)=

(1

1

)

siendo este un sistema bien condicionado.

Se puede observar entonces que si, en un sistema mal condicionado, sustituimosuna de las ecuaciones por una combinacion lineal de las restantes, podemoshacer que el sistema resultante este bien condicionado o viceversa. �

El estudio del condicionamiento de un sistema se realiza a traves del denomi-nado numero de condicion que estudiamos a continuacion.

Page 82: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

82 Sistemas de ecuaciones lineales

Definicion 2.9 Sea A una matriz cuadrada y regular. Se define el numero decondicion de la matriz A y se denota por κ(A) como

κ(A) = ‖A‖ · ‖A−1‖

donde la norma utilizada ha de ser una norma multiplicativa.

Este numero nos permite conocer el condicionamiento del sistema Ax = b.

Dado que en la practica el calculo de la matriz inversa A−1 presenta grandesdificultades lo que se hace es buscar una cota del numero de condicion.

κ(A) = ‖A‖ · ‖A−1‖ < ‖A‖ · k

siendo k una cota de la norma de la matriz inversa.

Si ‖I − A‖ < 1 entonces ‖A−1‖ ≤ ‖I‖1− ‖I − A‖

. En efecto:

A · A−1 = I =⇒ [I − (I − A)]A−1 = I =⇒A−1 − (I − A)A−1 = I =⇒ A−1 = I + (I − A)A−1 =⇒‖A−1‖ = ‖I + (I −A)A−1‖ ≤ ‖I‖+ ‖(I −A)A−1‖ ≤ ‖I‖+ ‖I −A‖ ‖A−1‖ ⇒‖A−1‖ − ‖I − A‖ ‖A−1‖ ≤ ‖I‖ =⇒ (1− ‖I − A‖)‖A−1‖ ≤ ‖I‖ =⇒

‖A−1‖ ≤ ‖I‖1− ‖I − A‖

Es decir:

κ(A) ≤ ‖A‖ · k con k =‖I‖

1− ‖I − A‖

Debemos tener cuidado con esta acotacion ya que si tenemos una matriz casiregular, es decir, con det(A) ' 0, quiere decir que tiene un autovalor proximoa cero, por lo que la matriz I − A tiene un autovalor proximo a 1 y sera elmayor de todos. En este caso ‖I −A‖ ' 1, por lo que k →∞ y darıa lugar aun falso condicionamiento, ya que A no tiene que estar, necesariamente, malcondicionada.

Ejemplo 2.6 Para estudiar el condicionamiento del sistema 3x + 4y = 7

3x + 4.00001y = 7.00001

Page 83: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Sistemas de ecuaciones lineales 83

Se tiene que

A =

(3 4

3 4.00001

)=⇒ det(A) = 0.00003

A−1 =1

0.00003

(4.00001 −4

−3 3

)

Utilizando la norma infinito ‖A‖∞ = maxi

n∑j=1

|aij| se tiene que

‖A‖∞ = 7.00001

‖A−1‖∞ =8.00001

0.00003

=⇒ κ∞(A) ' 56

3· 105 > 1.8 · 106

Se trata pues, de un sistema mal condicionado.

Si utilizamos la norma-1 ‖A‖1 = maxj

n∑i=1

|aij| obtenemos:

‖A‖1 = 8.00001

‖A−1‖1 =7.00001

0.00003

=⇒ κ1(A) ' 56

3· 105 > 1.8 · 106

obteniendose, tambien, que se trata de un sistema mal condicionado. �

Propiedades del numero de condicion.

• κ(A) ≥ 1 cualquiera que sea la matriz cuadrada y regular A.

Demostracion.

‖x‖ = ‖Ix‖ ≤ ‖I‖‖x‖ =⇒ ‖I‖ ≥ 1

cualquiera que sea la norma utilizada.

Como, por otra parte AA−1 = I se tiene que

1 ≤ ‖I‖ = ‖AA−1‖ ≤ ‖A‖‖A−1‖ = κ(A) =⇒ κ(A) ≥ 1.

• Si B = zA, con z ∈ C no nulo, se verifica que κ(B) = κ(A).

Page 84: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

84 Sistemas de ecuaciones lineales

Demostracion.

κ(B) = ‖B‖ ‖B−1‖ = ‖zA‖ ‖1

zA−1‖ = |z| ‖A‖‖A

−1‖|z|

= ‖A‖ ‖A−1‖ =

= κ(A)

Dado que det(B) = zn det(A), donde n representa el orden de la matrizA, y κ(B) = κ(A) se ve que el condicionamiento de una matriz nodepende del valor de su determinante.

• Utilizando la norma euclıdea, κ2(A) =σn

σ1

donde σ1 y σn representan,

respectivamente, al menor y al mayor de los valores singulares de lamatriz A.

Demostracion. Sabemos que los valores singulares σi de la matriz Ason las raıces cuadradas positivas de los autovalores de la matriz A∗A.

σi =√

λi(A∗A)

Si suponemos σ1 ≤ σ2 ≤ · · · ≤ σn se tiene que

‖A‖2 =√

maxi

λi(A∗A) = σn

‖A−1‖2 =√

maxi

λi

((A−1)∗A−1

)=√

maxi

λi

((A∗)−1A−1

)=

=√

maxi

λi(AA∗)−1 =

√max

i

1

λi(AA∗)=

√1

mıni

λi(AA∗)=

=

√1

mıni

λi(A∗A)

=

√1

mıni

σ2i

=⇒ ‖A−1‖2 =1

σ1

Podemos concluir, por tanto, que

‖A‖2 = σn

‖A−1‖2 =1

σ1

=⇒ κ2(A) =σn

σ1

En cuanto a su relacion con los numeros de condicion obtenidos con otrasnormas de matriz se tiene que:

‖A‖2 ≤ ‖A‖F ≤√

n‖A‖2 =⇒ ‖A−1‖2 ≤ ‖A−1‖F ≤√

n‖A−1‖2

κ2(A) = ‖A‖2‖A−1‖2 ≤ ‖A‖F‖A−1‖F = κ(A)F

Page 85: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Sistemas de ecuaciones lineales 85

κF (A) = ‖A‖F‖A−1‖F ≤√

n√

n‖A‖2‖A−1‖2 = nκ2(A) =⇒

κ2(A) ≤ κF (A) ≤ nκ2(A)

Ademas:

‖A‖2≤√‖A‖1‖A‖∞

‖A−1‖2≤√‖A−1‖1‖A−1‖∞

⇒ κ2(A)≤√

κ1(A)κ∞(A)

• La condicion necesaria y suficiente para que κ2(A) = 1 es que A = zUsiendo z ∈ C (no nulo) y U una matriz unitaria (UU∗ = U∗U = I).

Demostracion.

⇐) A = zU =⇒ κ2(A) = 1.

A = zU =⇒ A∗A = zU∗zU = |z|2U∗U = |z|2I =⇒λi(A

∗A) = |z|2 cualquiera que sea i = 1, 2, . . . , n y, por tanto,

σ1 = σ2 = · · · = σn = |z|

por lo que

κ2(A) =σn

σ1

= 1

⇒) κ2(A) = 1 =⇒ A = zU .

Sabemos que si A es diagonalizable existe una matriz regular Rtal que R−1AR = D con D = diag(λi) (R es la matriz de pasocuyas columnas son los autovectores asociados los autovalores λi).Por otra parte sabemos que toda matriz hermıtica (A = A∗) esdiagonalizable mediante una matriz de paso unitaria.

Como A∗A es hermıtica existe una matriz unitaria R tal que

R∗A∗AR =

σ2

1

σ22

. . .

σ2n

κ2(A) =

σn

σ1

= 1 =⇒ σ1 = σ2 = · · · = σn = σ, por lo que

R∗A∗AR = σ2I

EntoncesA∗A = R(σ2I)R∗ = σ2(RIR∗) = σ2I

Page 86: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

86 Sistemas de ecuaciones lineales

de donde (1

σA∗)(

1

σA

)= I

Llamando U =1

σA se tiene que U∗ =

1

σA∗, ya que σ ∈ R ⇒ σ = σ.

U∗U =

(1

σA∗)(

1

σA

)= I =⇒ U es unitaria

y, por tanto,A = σU con U unitaria

Los sistemas mejor condicionados son aquellos que tienen sus filas o columnasortogonales y mientras mayor sea la dependencia lineal existente entres ellaspeor es el condicionamiento del sistema.

Al ser κ(UA) = κ(A) trataremos de utilizar metodos de resolucion de sistemasde ecuaciones lineales que trabajen con transformaciones unitarias que no em-peoren su condicionamiento como lo hace, por ejemplo, el metodo de Gaussbasado en la factorizacion LU y que tambien estudiaremos a continuacion.

2.3 Metodos directos de resolucion de siste-

mas lineales

2.3.1 Factorizacion LU

Al aplicar el metodo de Gauss al sistema Ax = b realizamos transformacioneselementales para conseguir triangularizar la matriz del sistema.

Si este proceso puede realizarse sin intercambios de filas, la matriz triangularsuperior U obtenida viene determinada por el producto de un numero finitode transformaciones fila FkFk−1 · · ·F1 aplicadas a la matriz A.

Llamando L−1 = FkFk−1 · · ·F1 (ya que el determinante de una transformacionfila es ±1 y, por tanto, su producto es inversible) se tiene que L−1A = U , o loque es lo mismo, A = LU .

Ademas, la matriz L es una triangular inferior con unos en la diagonal.

Esta factorizacion es unica ya que de existir otra

A = L′U ′ = LU =⇒ L−1L′ = UU ′−1

Page 87: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Metodos directos de resolucion de sistemas lineales 87

Como L−1 tambien es triangular inferior con unos en la diagonal, el productoL−1L′ tambien es una matriz del mismo tipo.

Analogamente, el producto UU ′−1 resulta ser una triangular superior.

El hecho de que L−1L′ = UU ′−1 nos dice que necesariamente L−1L′ = I, ya quees simultaneamente triangular inferior y superior y su diagonal es de unos.

Ası pues L−1L′ = I, por lo que L = L′ y, por tanto U = U ′ es decir, lafactorizacion es unica.

Debido a la unicidad de la factorizacion, esta puede ser calculada por unmetodo directo, es decir, haciendo

A =

1 0 0 · · · 0

l21 1 0 · · · 0

l31 l32 1 · · · 0...

......

. . ....

ln1 ln2 ln3 · · · 1

u11 u12 u13 · · · u1n

0 u22 u23 · · · u2n

0 0 u33 · · · u3n

......

.... . .

...

0 0 0 · · · unn

y calculando los valores de los n2 elementos que aparecen entre las dos matrices.

Ejemplo 2.7 Considerese la matriz A =

3 1 2

6 3 2

−3 0 −8

3 1 2

6 3 2

−3 0 −8

=

1 0 0

l21 1 0

l31 l32 1

u11 u12 u13

0 u22 u23

0 0 u33

=

=

u11 u12 u13

l21u11 l21u12 + u22 l21u13 + u23

l31u11 l31u12 + l32u22 l31u13 + l32u23 + u33

por lo que de la primera fila obtenemos que

u11 = 3 u12 = 1 u13 = 2

de la segunda (teniendo en cuenta los valores ya obtenidos) se tiene que

3l21 = 6

l21 + u22 = 3

2l21 + u23 = 2

=⇒l21 = 2

u22 = 1

u23 = −2

Page 88: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

88 Sistemas de ecuaciones lineales

y de la tercera (teniendo tambien en cuenta los resultados ya obtenidos)

3l31 = −3

l31 + l32 = 0

2l31 − 2l32 + u33 = −8

=⇒l31 = −1

l32 = 1

u33 = −4

es decir:

3 1 2

6 3 2

−3 0 −8

=

1 0 0

2 1 0

−1 1 1

3 1 2

0 1 −2

0 0 −4

Teorema 2.12 Una matriz regular A admite factorizacion LU si, y solo si,sus matrices fundamentales Ai (i = 1, 2, . . . , n) son todas regulares.

Demostracion. Supongamos que A admite factorizacion LU . En ese caso

A =

(Ak

)=

(Lk

)(Uk

)=⇒

Ak = LkUk =⇒ det(Ak) = det(Lk) det(Uk) = 1 · r11r22 · · · rkk 6= 0

ya que, por sea A regular, todos los pivotes rii i = 1, 2, . . . , n son no nulos.

Recıprocamente, si todas las matrices fundamentales son regulares, A admitefactorizacion LU , o lo que es equivalente, se puede aplicar Gauss sin intercam-bio de filas. En efecto:

Dado que, por hipotesis es a11 6= 0, se puede utilizar dicho elemento comopivote para anular al resto de los elementos de su columna quedandonos lamatriz

A(2) =

a

(2)11 a

(2)12 · · · a

(2)1n

0 a(2)22 · · · a

(2)2n

......

. . ....

0 a(2)n2 · · · a

(2)nn

donde a

(2)1i = a1i para i = 1, 2, . . . , n.

Si nos fijamos ahora en a222 = a22− a12

a21

a11

podemos ver que es no nulo, ya que

de ser nulo serıaa11a22 − a12a21 = det(A2) = 0

en contra de la hipotesis de que todas las matrices fundamentales son regulares.Por tanto, podemos utilizar a

(2)22 6= 0 como nuevo pivote para anular a los

elementos de su columna situados bajo el.

Page 89: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Metodos directos de resolucion de sistemas lineales 89

Reiterando el procedimiento se puede ver que todos los elementos que vamosobteniendo en la diagonal son no nulos y, por tanto, validos como pivotes. Esdecir, puede realizarse la factorizacion LU .

Comprobar si una matriz admite factorizacion LU estudiando si todas susmatrices fundamentales son regulares es un metodo demasiado costoso debidoal numero de determinantes que hay que calcular.

Corolario 2.13 Toda matriz de diagonal dominante admite factorizacion LU .

Demostracion. Es consecuencia directa de los Teoremas 2.8, 2.9 y 2.12.

Corolario 2.14 Toda matriz hermıtica y definida positiva

hermıtica ⇐⇒ A = A∗

definida positiva ⇐⇒

{x∗Ax ≥ 0 ∀x

x∗Ax = 0 ⇐⇒ x = 0

admite factorizacion LU .

Demostracion. Las matrices fundamentales de estas tienen todas determi-nante positivo, por lo que el Teorema 2.12 garantiza la existencia de las ma-trices L y U .

Una vez realizada la factorizacion LU , el sistema Ax = b puede escribirse de laforma LUx = b y llamando Ux = y transformamos el problema de resolver elsistema cuadrado Ax = b en la resolucion de los sistemas triangulares Ly = by Ux = y.

Ax = b ⇐⇒

Ly = b

Ux = y

Ejemplo 2.8 Consideremos el sistema Ax = b con

A =

3 1 2

6 3 2

−3 0 −8

b =

0

1

5

Page 90: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

90 Sistemas de ecuaciones lineales

En el Ejemplo 2.7 realizamos la factorizacion LU de la matriz A.

Ly = b ⇐⇒

1 0 0

2 1 0

−1 1 1

y1

y2

y3

=

0

1

5

=⇒ y =

0

1

4

Ux = y ⇐⇒

3 1 2

0 1 −2

0 0 −4

x1

x2

x3

=

0

1

4

=⇒ x =

1

−1

−1

2.3.2 Factorizacion de Cholesky

Es conocido que toda matriz hermıtica y definida positiva tiene sus autovaloresreales y positivos y, ademas, en la factorizacion LU todos los pivotes son realesy positivos.

Teorema 2.15 [Factorizacion de Cholesky]

Toda matriz A hermıtica y definida positiva puede ser descompuesta de laforma A = R∗R siendo R una matriz triangular superior.

Demostracion. Por tratarse de una matriz hermıtica y definida positiva,sabemos que admite factorizacion LU . Sea

A =

1 0 · · · 0

l21 1 · · · 0...

.... . .

...

ln1 ln2 · · · 1

u11 u12 · · · u1n

0 u22 · · · u2n

......

. . ....

0 0 · · · unn

=

=

1 0 · · · 0

l21 1 · · · 0...

.... . .

...

ln1 ln2 · · · 1

u11 0 · · · 0

0 u22 · · · 0...

.... . .

...

0 0 · · · unn

1 u12/u11 · · · u1n/u11

0 1 · · · u2n/u22...

.... . .

...

0 0 · · · 1

=

= L

u11 0 · · · 0

0 u22 · · · 0...

.... . .

...

0 0 · · · unn

V =

Page 91: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Metodos directos de resolucion de sistemas lineales 91

= L

u11 0 · · · 0

0√

u22 · · · 0...

.... . .

...

0 0 · · · √unn

u11 0 · · · 0

0√

u22 · · · 0...

.... . .

...

0 0 · · · √unn

V ⇒

A = BR

B = L

√u11 0 0 · · · 0

0√

u22 0 · · · 0

0 0√

u33 · · · 0...

......

. . ....

0 0 0 · · · √unn

es triangular inferior.

R =

√u11 0 0 · · · 0

0√

u22 0 · · · 0

0 0√

u33 · · · 0...

......

. . ....

0 0 0 · · · √unn

V es triangular superior.

Como A es hermıtica, BR = A = A∗ = R∗B∗, por lo que (R∗)−1B = B∗R−1, ydado que (R∗)−1B es triangular inferior y B∗R−1 es triangular superior, ambashan de ser diagonales.

Por otra parte,

B∗R−1 = (LD)∗(DV )−1 = D∗L∗V −1D−1 = DL∗V −1D−1 = L∗V −1

ya que las matrices diagonales conmutan.

Dado que la matriz L∗V −1 tiene unos en la diagonal y es igual a B∗R−1 quees diagonal, debe ser B∗R−1 = I, por lo que B∗ = R o, lo que es lo mismo,B = R∗, es decir A = R∗R con R = DV .

Hemos visto que toda matriz hermıtica y definida positiva admite factorizacionde Cholesky, pero podemos llegar mas lejos y enunciar el siguiente teorema.

Teorema 2.16 Una matriz hermıtica y regular A es definida positiva si, ysolo si, admite factorizacion de Cholesky.

Demostracion. Si es hermıtica y definida positiva admite factorizacion LUcon todos los elementos diagonales de U (pivotes) positivos, por lo que admitefactorizacion de Cholesky.

Page 92: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

92 Sistemas de ecuaciones lineales

Recıprocamente, si A admite factorizacion de Cholesky es A = R∗R por lo que

A∗ = (R∗R)∗ = R∗R = A =⇒ A es hermıtica

Para cualquier vector x no nulo es

x∗Ax = x∗R∗Rx = (Rx)∗(Rx) = ‖Rx‖2 ≥ 0

siendo cero solo si Rx = 0 pero al ser R regular (si no lo fuese tampoco loserıa A en contra de la hipotesis) Rx = 0 =⇒ x = 0 en contra de la hipotesisde que x no es el vector nulo.

Se tiene pues que x∗Ax > 0 para cualquier vector x no nulo, es decir, A esdefinida positiva.

La unicidad de las matrices L y U implica la unicidad de la matriz R y, portanto, esta puede ser calculada por un metodo directo.

Ejemplo 2.9 Consideremos el sistema 4 2i 4 + 2i

−2i 2 2− 2i

4− 2i 2 + 2i 10

x1

x2

x3

=

0

0

−4

Realicemos la factorizacion R∗R directamente, es decir 4 2i 4 + 2i

−2i 2 2− 2i

4− 2i 2 + 2i 10

=

r11 0 0

r12 r22 0

r13 r23 r33

r11 r12 r13

0 r22 r23

0 0 r33

Se obtiene multiplicando, que r2

11 = 4 =⇒ r11 = 2.

Utilizando este resultado tenemos que

2r12 = 2i =⇒ r12 = i

2r13 = 4 + 2i =⇒ r13 = 2 + i

r212 + r2

22 = 2 =⇒ r222 = 1 =⇒ r22 = 1.

r12r13 + r22r23 = 2− 2i =⇒ 1− 2i + r23 = 2− 2i =⇒ r23 = 1.

r213 + r2

23 + r233 = 10 =⇒ 5 + 1 + r2

33 = 10 =⇒ r233 = 4 =⇒ r33 = 2.

Ası pues, el sistema nos queda de la forma 2 0 0

−i 1 0

2− i 1 2

2 i 2 + i

0 1 1

0 0 2

x1

x2

x3

=

0

0

−4

Page 93: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Metodos iterados de resolucion de sistemas lineales 93

R∗y = b ⇐⇒

2 0 0

−i 1 0

2− i 1 2

y1

y2

y3

=

0

0

−4

=⇒ y =

0

0

−2

Rx = y ⇐⇒

2 i 2 + i

0 1 1

0 0 2

x1

x2

x3

=

0

0

−2

=⇒ x =

1

1

−1

2.4 Metodos iterados de resolucion de siste-

mas lineales

Un metodo iterado de resolucion del sistema Ax = b es aquel que genera, apartir de un vector inicial x0, una sucesion de vectores (xn) con xn+1 = f(xn).

Definicion 2.10 [Consistencia]

Un metodo iterado se dira que es consistente con el sistema Ax = b, si el lımitede dicha sucesion, en caso de existir, es solucion del sistema.

Definicion 2.11 [Convergencia]

Un metodo iterado para la resolucion del sistema Ax = b se dira que es con-vergente si la sucesion generada por cualquier vector inicial x0 es convergentea la solucion del sistema.

Es evidente que si un metodo es convergente es consistente, sin embargo, elrecıproco no es cierto como prueba el siguiente ejemplo.

Ejemplo 2.10 El metodo xn+1 = 2xn − A−1b es consistente con al sistemaAx = b pero no es convergente. En efecto:

xn+1 − x = 2xn − A−1b− x = 2xn − 2x− A−1b + x = 2(xn − x)− (A−1b− x)

y como A−1b = x, se tiene que

xn+1 − x = 2(xn − x)

Si existe limn→∞

xn = x∗ tendremos que

x∗ − x = 2(x∗ − x) =⇒ x∗ − x = 0 =⇒ x∗ = x

Page 94: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

94 Sistemas de ecuaciones lineales

es decir, el lımite es solucion del sistema Ax = b, por lo que el metodo esconsistente.

Sin embargo, de xn+1 − x = 2(xn − x) obtenemos que

‖xn+1 − x‖ = 2‖xn − x‖

es decir, el vector xn+1 dista de x el doble de lo que distaba xn, por lo que elmetodo no puede ser convergente. �

Los metodos iterados que trataremos son de la forma

xn+1 = Kxn + c

en los que K sera la que denominemos matriz del metodo y que dependera deA y de b y en el que c es un vector que vendra dado en funcion de A, K y b.

Teorema 2.17 Un metodo iterado, de la forma xn+1 = Kxn+c, es consistentecon el sistema Ax = b si, y solo si, c = (I − K)A−1b y la matriz I − K esinvertible

Demostracion.

• Supongamos que el metodo es consistente con el sistema Ax = b.

Como x = Kx + (I −K)x = Kx + (I −K)A−1b, se tiene que

xn+1 − x = K(xn − x) + c− (I −K)A−1b (2.1)

Por ser consistente el metodo, de existir x∗ = limn→∞

xn ha de ser x∗ = x.

Pasando al lımite en la Ecuacion (2.1) obtenemos que

x∗ − x = K(x∗ − x) + c− (I −K)A−1b

por lo que

(I −K)(x∗ − x) = c− (I −K)A−1b (2.2)

y dado que x∗ = x nos queda que 0 = c− (I −K)A−1b, es decir,

c = (I −K)A−1b.

Ademas, dado que x = Kx + c, el sistema (I −K)x = c posee solucionunica x y, por tanto, la matriz I −K es invertible.

Page 95: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Metodos iterados de resolucion de sistemas lineales 95

• Si c = (I − K)A−1b y la matriz I − K es invertible, cuando existalim

n→∞xn = x∗ se tendra de (2.2) que

(I −K)(x∗ − x) = 0

Como I −K es invertible, x∗ = x, y el metodo es consistente.

Teorema 2.18 Un metodo iterado de la forma xn+1 = Kxn + c consistentecon el sistema Ax = b es convergente si, y solo si, lim

n→∞Kn = 0.

Demostracion. Por tratarse de un metodo consistente con el sistema Ax = b,se verifica que c = (I −K)A−1b, por lo que

xn+1 = Kxn + (I −K)A−1b

restando el vector solucion x a ambos miembros, podemos escribir

xn+1−x = Kxn−(K+I−K)x+(I−K)A−1b = K(xn−x)+(I−K)(A−1b−x)

y dado que A−1b− x = 0 obtenemos que xn+1 − x = K(xn − x).

Reiterando el proceso se obtiene:

xn − x = K(xn−1 − x) = K2(xn−2 − x) = · · · = Kn(x0 − x)

limn→∞

(xn − x) = ( limn→∞

Kn)(x0 − x) (2.3)

• Si el metodo es convergente, limn→∞

(xn − x) = x− x = 0, por lo que de la

ecuacion (2.3) obtenemos que

limn→∞

Kn = 0

• Si limn→∞

Kn = 0, obtenemos de la ecuacion (2.3) que

limn→∞

(xn − x) = 0 ⇐⇒ limn→∞

xn = x

por lo que el metodo es convergente.

Teorema 2.19 [Teorema del punto fijo]

Si para alguna norma matricial es ‖K‖ < 1, la sucesion (xn) definida porxn+1 = Kxn+c, donde x0 ∈ Rn es un vector cualquiera, converge a la solucionde la ecuacion x = Kx + c que existe y es unica.

Page 96: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

96 Sistemas de ecuaciones lineales

Demostracion.

• Existencia y unicidad

Veamos, en primer lugar, que la ecuacion x = Kx + c posee solucionunica.

En efecto: x = Kx + c =⇒ (I −K)x = c. Este sistema tiene solucionunica si, y solo si, el sistema homogeneo asociado (I −K)z = 0 admitesolo la solucion trivial z = 0, es decir, si I −K es invertible.

La solucion z no puede ser distinta del vector nulo ya que de serlo, como‖K‖ < 1 se tiene que al ser (I −K)z = 0, o lo que es lo mismo, z = Kz

‖z‖ = ‖Kz‖ ≤ ‖K‖‖z‖ < ‖z‖

lo cual es un absurdo, por lo que el sistema homogeneo solo admite lasolucion trivial y, por tanto, el sistema completo x = Kx + c poseesolucion unica.

• Convergencia

Probaremos ahora que la sucesion (xn) converge a x.

Dado que xn+1 − x = (Kxn + c) − (Kx + c) = K(xn − x), podemosreiterar el proceso para obtener que xn − x = Kn(x0 − x) por lo que

‖xn − x‖ ≤ ‖Kn‖‖x0 − x‖ ≤ ‖K‖n‖x0 − x‖

y dado que ‖K‖ < 1, pasando al lımite se obtiene

limn→∞

‖xn − x‖ = 0 =⇒ limn→∞

xn = x

Teorema 2.20 [Condicion necesaria y suficiente de convergencia]

La sucesion (xn) definida por xn+1 = Kxn + c, donde x0 ∈ Rn es un vectorcualquiera, es convergente si, y solo si, la matriz K tiene radio espectral menorque 1.

xn+1 = Kxn + c con x0 ∈ Rn convergente ⇐⇒ ρ(K) < 1

Page 97: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Metodos iterados de resolucion de sistemas lineales 97

Demostracion.

• Condicion suficiente

Si λ1, . . . , λm son los autovalores de la matriz K, los de la matriz Kn sonλn

1 , . . . , λnm.

ρ(K) < 1 =⇒ |λi| < 1 (i = 1, . . . ,m) =⇒ λi, λ2i , . . . , λ

ni , . . . → 0

por lo que los autovalores de la matriz lımite limn→∞

Kn son todos nulos,

es decir, limn→∞

Kn = 0 por lo que

ρ(K) < 1 =⇒ el proceso es convergente.

• Condicion necesaria

El teorema del punto fijo establece como condicion necesaria para laconvergencia que ‖K‖ < 1 y dado que ρ(K) es una cota inferior decualquier norma multiplicativa, es ρ(K) ≤ ‖K‖ < 1, por lo que

El proceso es convergente =⇒ ρ(K) < 1.

Metodos de descomposicion

Los metodos que vamos a estudiar consisten en descomponer la matriz inver-tible A del sistema Ax = b de la forma A = M −N de manera que la matrizM sea facilmente invertible, por lo que reciben el nombre generico de metodosde descomposicion.

El sistema queda entonces de la forma

(M −N)x = b =⇒ Mx = Nx + b =⇒ x = M−1Nx + M−1b

es decir, expresamos el sistema de la forma

Ax = b ⇐⇒ x = Kx + c con

K = M−1N

c = M−1b

Dado que

(I−K)A−1b = (I−M−1N)(M−N)−1b = M−1(M−N)(M−N)−1b=M−1b=c

y la matriz (I − K) = (I −M−1N) = M−1(M − N) = M−1A es invertible,estamos en las condiciones del Teorema 2.17 por lo que xn+1 = Kxn + c esconsistente con el sistema Ax = b.

Page 98: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

98 Sistemas de ecuaciones lineales

Es decir, si el proceso converge, lo hace a la solucion del sistema.

Sabemos tambien, por el Teorema 2.19, que el proceso sera convergente si severifica que ‖K‖ = ‖M−1N‖ < 1 para alguna norma.

Para el estudio de los metodos que trataremos a continuacion, vamos a des-componer la matriz A de la forma A = D − E − F siendo

D =

a11 0 0 · · · 0

0 a22 0 · · · 0

0 0 a33 · · · 0...

......

. . ....

0 0 0 · · · ann

− E =

0 0 0 · · · 0

a21 0 0 · · · 0

a31 a32 0 · · · 0...

......

. . ....

an1 an2 an3 · · · 0

−F =

0 a12 a13 · · · a1n

0 0 a23 · · · a2n

0 0 0 · · · a3n

......

.... . .

...

0 0 0 · · · 0

2.4.1 Metodo de Jacobi

Consiste en realizar la descomposicion

A = M −N = D − (E + F )

El sistema queda de la forma

Ax = b =⇒ Dx = (E + F )x + b =⇒ x = D−1(E + F )x + D−1b

Metodo de Jacobi xn+1 = Jxn + c con

{J = D−1(E + F )

c = D−1E

La matriz J recibe el nombre de matriz de Jacobi.

Teorema 2.21 Si A es una matriz de diagonal dominante, el metodo de Ja-cobi es convergente.

Page 99: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Metodos iterados de resolucion de sistemas lineales 99

Demostracion. La matriz J = D−1(E + F ) tiene todos los elementos diago-nales nulos y las sumas de los modulos de los elementos de sus filas son todasmenores que 1 ya que

|aii| >n∑

k = 1

k 6= i

|aik| i = 1, 2, . . . , n =⇒n∑

k = 1

k 6= i

|aik||aii|

< 1

por lo que los cırculos de Gerschgorin estan todos centrados en el origen ytienen radios menores que 1 es decir, todos los autovalores de J son menoresque 1, por lo que ρ(J) < 1 y el metodo converge.

2.4.2 Metodo de Gauss-Seidel

Este metodo es el resultado de realizar la descomposicion

A = M −N = (D − E)− F

El sistema nos queda

Ax = b =⇒ (D − E)x = Fx + b =⇒ x = (D − E)−1Fx + (D − E)−1b

Metodo de Gauss-Seidel xn+1 = L1xn + c con

{L1 = (D − E)−1F

c = (D − E)−1b

La matriz L1 recibe el nombre de matriz de Gauss-Seidel.

Teorema 2.22 Si A es una matriz de diagonal dominante, el metodo deGauss-Seidel es convergente.

Teorema 2.23 Si A es una matriz simetrica y definida positiva, el metodo deGauss-Seidel es convergente.

2.4.3 Metodos de relajacion (SOR)

Estos metodos realizan la descomposicion

A =1

ωD − 1− ω

ωD − E − F =

1

ω(D − ωE)−

(1− ω

ωD + F

)= M −N

Page 100: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

100 Sistemas de ecuaciones lineales

El sistema se transforma entonces en

1

ω(D − ωE)x =

(1− ω

ωD + F

)x + b =⇒

(D − ωE)x =((1− ω)D + ωF

)x + ωb =⇒

x = (D − ωE)−1((1− ω)D + ωF

)x + ω(D − ωE)−1b

Metodos de relajacion xn+1 = Lωxn + c con{Lω = (D − ωE)−1

((1− ω)D + ωF

)c = ω(D − ωE)−1b

La matriz Lω recibe el nombre de matriz de relajacion.

• Si ω = 1 la matriz se reduce a L1 = (D − E)−1F , es decir, se trata delmetodo de Gauss Seidel.

• Si ω > 1 se dice que se trata de un metodo de sobre-relajacion

• Si ω < 1 se dice que se trata de un metodo de sub-relajacion

Teorema 2.24 Una condicion necesaria para que converja el metodo de rela-jacion es que ω ∈ (0, 2).

Teorema 2.25 Si A es de diagonal dominante, el metodo de relajacion esconvergente cualquiera que sea ω ∈ (0, 1].

Teorema 2.26 Si A es simetrica y definida positiva, el metodo de relajacionconverge si, y solo si, ω ∈ (0, 2)

2.5 Metodos del descenso mas rapido y del

gradiente conjugado

Los metodos que vamos a tratar a continuacion son validos para sistemasAx = b cuya matriz A es simetrica y definida positiva, es decir, para matricestales que AT = A (simetrica) y xT Ax > 0 cualquiera que sea el vector x 6= 0(definida positiva).

Page 101: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Metodos del descenso mas rapido y del gradiente conjugado 101

Lema 2.27 Si A es simetrica y definida positiva, el problema de resolver elsistema Ax = b es equivalente al de minimizar la forma cuadratica

q(x) = 〈x, Ax 〉 − 2〈x, b 〉

donde 〈x, y 〉 = xT y representa el producto escalar de los vectores x e y.

Demostracion. Fijemos una direccion v (rayo unidimensional) y vamos a vercomo se comporta la forma cuadratica q para vectores de la forma x+tv dondet es un escalar.

Teniendo en cuenta que A es simetrica

q(x + tv) = 〈x + tv, A(x + tv) 〉 − 2〈x + tv, b 〉= 〈x, Ax 〉+ 2t〈x, Av 〉+ t2〈 v, Av 〉 − 2〈x, b 〉 − 2t〈 v, b 〉= q(x) + 2t〈 v, Ax 〉 − 2t〈 v, b 〉+ t2〈 v, Av 〉

q(x + tv) = q(x) + 2t〈 v, Ax− b 〉+ t2〈 v, Av 〉 (2.4)

La ecuacion (2.4) (ecuacion de segundo grado en t con el coeficiente de t2

positivo, tiene un mınimo que se calcula igualando a cero la derivada

d

dtq(x + tv) = 2〈 v, Ax− b 〉+ 2t〈 v, Av 〉

es decir, en el puntot = 〈 v, b− Ax 〉/〈 v, Av 〉.

El valor mınimo que toma la forma cuadratica sobre dicho rayo unidimensionalviene dado por

q(x + tv) = q(x) + t [2〈 v, Ax− b 〉+ t〈 v, Av 〉]= q(x) + t [2〈 v, Ax− b 〉+ 〈 v, b− Ax 〉]= q(x)− t〈 v, b− Ax 〉= q(x)− 〈 v, b− Ax 〉2/〈 v, Av 〉

Esto nos indica que al pasar de x a x + tv siempre hay una reduccion en elvalor de q excepto si v ⊥ (b − Ax), es decir, si 〈 v, b− Ax 〉 = 0. Ası pues, six no es una solucion del sistema Ax = b existen muchos vectores v tales que〈 v, b− Ax 〉 6= 0 y, por tanto, x no minimiza a la forma cuadratica q. Por elcontrario, si Ax = b, no existe ningun rayo que emane de x sobre el que q tomeun valor menor que q(x), es decir, x minimiza el valor de q.

El lema anterior nos sugiere un metodo para resolver el sistema Ax = b pro-cediendo a minimizar la forma cuadratica q a traves de una sucesion de rayos.

Page 102: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

102 Sistemas de ecuaciones lineales

En el paso k del algoritmo se dispondra de los vectores

x(0), x(1), x(2), . . . , x(k).

Estos vectores nos permitiran buscar una direccion apropiada v(k) y el siguientepunto de la sucesion vendra dado por

x(k+1) = x(k) + tkv(k),

donde

tk =〈 v(k), b− Ax(k) 〉〈 v(k), Av(k) 〉

Graficamente, si ‖v(k)‖ = 1, tk mide la distancia que nos movemos de x(k) paraobtener x(k+1)

--

��

��

���3

������

tkv(k) v(k)

x(k)x(k+1)

2.5.1 Metodo del descenso mas rapido

Si tomamos v(k) como el gradiente negativo de q en x(k), es decir, como ladireccion del residuo r(k) = b − Ax(k) obtenemos el denominado metodo deldescenso mas rapido.

Teniendo en cuenta que los diferentes vectores x(i) no es necesario conservarlos,los podemos sobreescribir obteniendose el siguiente algoritmo que teniendocomo entrada los valores de x, A, b y n tiene como salida la solucion x:

Algoritmo del Descenso mas rapido

for k = 1:n

v = b-A*x;

t = (v′*v)/(v′Av);

x = x+t*v;

end

x

Observese que a medida que crece el valor de k, el residuo v = b− Ax va dis-minuyendo, por lo que al encontrarnos en las proximidades de la solucion, el

Page 103: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Metodos del descenso mas rapido y del gradiente conjugado 103

calculo de t se convierte practicamente en una division de 00

lo que puede alte-rar considerablemente el valor exacto que deberıa tomar t y que generalmentenos lleva a que el metodo diverge.

Este metodo resulta, en general, muy lento si las curvas de nivel de la formacuadratica estan muy proximas, por lo que no suele utilizarse en la formadescrita. Sin embargo, utilizando condiciones de ortogonalidad en las denomi-nadas direcciones conjugadas, puede ser modificado de forma que se conviertaen un metodo de convergencia rapida que es conocido como metodo del gra-diente conjugado.

2.5.2 Metodo del gradiente conjugado

Por no profundizar en el concepto de direcciones conjugadas y en como sedeterminan, nos limitaremos a dar el algoritmo correspondiente al metodo quetiene por entrada los valores de x, A, b, n,ε y δ y como salida la solucion x.

Es necesario tener en cuenta las mismas precauciones que en el algoritmo deldescenso mas rapido, es decir, debido a los errores de calculo puede resultarun algoritmo divergente.

Algoritmo del Gradiente conjugado

r = b-A*x;

v = r;

c = r′*r;

for k = 1:n

if sqrt(v′*v)< δ then stop

z = A*v;

t = c/(v′*z);

x = x+t*v;

r = r-t*z;

d = r′*r;

if d<ε then stop

v = r+(d/c)*v;

c = d;

end

x

Page 104: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

104 Sistemas de ecuaciones lineales

2.6 Ejercicios resueltos

Ejercicio 2.1 Estudiar el numero de condicion de Frobenius de la matriz

A =

(a −b

a + ε −b

).

Solucion: El determinante de A es |A| = −ab + b(a + ε) = b ε.

Si b 6= 0 y ε 6= 0 es |A| 6= 0 y, por tanto, A es invertible, siendo su inversa:

A−1 =1

b ε

(−b b

−a− ε a

)

El numero de condicion de Frobenius viene dado por κF (A) = ‖A‖F‖A−1‖F .

‖A‖2F = a2 + b2 + (a + ε)2 + b2 = 2a2 + 2b2 + 2a ε + ε2

‖A−1‖2F =

b2 + b2 + (−a− ε)2 + a2

b2ε2=

2a2 + 2b2 + 2a ε + ε2

b2ε2

Por lo que:

κ2F (A) =

(2a2 + 2b2 + 2a ε + ε2)2

b2ε2=⇒ κF (A) =

|2a2 + 2b2 + 2a ε + ε2||b ε|

.

Observese que cuando ε tiende a cero, el numero de condicion de FrobeniusκF (A) lo hace a infinito, por lo que la matriz A esta mal condicionada.

Por ejemplo: para a = 10 y b = 1 se tiene que

κF (A) =202 + 20ε + ε2

|ε|=

202

|ε|± 20 + |ε|

Si ε = 10−8 κF (A) ' 2 · 1010.

Ejercicio 2.2 Dado el sistema:{3x + 4y = 7

3x + 5y = 8

a) Calcular su numero de condicion euclıdeo.

Page 105: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Ejercicios resueltos 105

b) Sustituir la segunda ecuacion por una combinacion lineal de ambas, deforma que el numero de condicion sea mınimo.

Solucion:

a) La matriz del sistema es A =

(3 4

3 5

).

A∗A =

(3 3

4 5

)(3 4

3 5

)=

(18 27

27 41

)

P (λ) =

∣∣∣∣∣ λ− 18 −27

−27 λ− 41

∣∣∣∣∣ = (λ− 18)(λ− 41)− 272 = λ2 − 59λ + 9.

Las raıces de P (λ) son: λ =59±

√3481− 36

2=

59±√

3445

2=⇒

σ1 =

√59−

√3445

2y σ2 =

√59 +

√3445

2

κ2(A) =σ2

σ1

=

√59 +

√3445

59−√

3445=

√(59 +

√3445)2

36=

59 +√

3445

6=⇒

κ2(A) = 19.61568707 . . .

b) La matriz resultante de la combinacion lineal es

B =

(3 4

3a + 3b 4a + 5b

).

Una matriz tiene numero de condicion euclıdeo mınimo (y vale 1) si, ysolo si, es proporcional a una matriz unitaria. Por tanto, B debe tenerlas filas (o las columnas) ortogonales y de igual norma.

• (3 4)

(3a + 3b

4a + 5b

)= 0 ⇒ 3(3a + 3b) + 4(4a + 5b) = 0 =⇒

25a + 29b = 0

• Ambas filas han de tener la misma norma, por lo que

(3 4)

(3

4

)= (3a + 3b 4a + 5b)

(3a + 3b

4a + 5b

)=⇒

25 = 25a2 + 34b2 + 58ab

Page 106: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

106 Sistemas de ecuaciones lineales

Las condiciones que tenemos son:

25a + 29b = 0

25a2 + 34b2 + 58ab = 25

=⇒

a = ±29

3

b = ∓25

3

Tomando, por ejemplo, a =29

3y b = −25

3(el otro caso es analogo),

obtenemos:

B =

(3 4

4 −3

)= 5 U con U =

(0.6 0.8

0.8 −0.6

)unitaria.

El sistema resultante es

{3x + 4y = 7

4x − 3y = 1y su numero de condicion

euclıdeo es κ2(B) = 1.

Ejercicio 2.3 Sea α ∈ {0.5, 1.5, 2.5} y consideremos el sistema iterado

(xn+1

yn+1

)=

1

α− 1 1

−11

α+ 1

(

xn

yn

)+

1− 1

α

1− 1

α

Se pide

a) Resolver el sistema resultante de tomar lımites para probar que, en caso

de que converja, el lımite de la sucesion

( (x0

y0

),

(x1

y1

),

(x2

y2

). . .

)no depende de α.

b) ¿Para que valores de α converge la sucesion?

c) Para los valores anteriores que hacen que la sucesion sea convergente,¿con cual lo hace mas rapidamente?

d) Comenzando con el vector

(x0

y0

)=

(0.5

0.5

), aproximar iteradamente

el lımite de la sucesion utilizando el valor de α que acelere mas la con-vergencia.

Page 107: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Ejercicios resueltos 107

Solucion:

a) En caso de que converja, tomando lımites obtenemos que(1 0

0 1

)(x

y

)=

1

α− 1 1

−11

α+ 1

( x

y

)+

1− 1

α

1− 1

α

o lo que es lo mismo 2− 1

α−1

1 − 1

α

( x

y

)=

1− 1

α

1− 1

α

=⇒

1− 1

α−1 +

1

α

1 − 1

α

( x

y

)=

0

1− 1

α

por lo que

x = y(1− 1

α

)x = 1− 1

α

=⇒ x = y = 1 ya que α 6= 1

es decir, la solucion (el lımite de la sucesion) no depende de α.

b) El polinomio caracterıstico de la matriz

1

α− 1 1

−11

α+ 1

del metodo

iterado es P (λ) = λ2 − 2

αλ +

1

α2que admite la raız doble

1

α.

Dado que el radio espectral de la matriz debe ser menor que 1, α ha deser mayor que 1, por lo que converge para α = 1.5 y para α = 2.5, perono lo hace para α = 0.5.

c) El metodo converge mas rapidamente para el valor de α que hace menorel radio espectral de la matriz, es decir, para α = 2.5.

d) Partiendo de

(x0

y0

)=

(0.5

0.5

)y tomando α = 2.5 se obtiene:

(x1

y1

)=

(4/54/5

) (x2

y2

)=

(23/2523/25

) (x3

y3

)=

(121/125

121/125

). . .

Page 108: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

108 Sistemas de ecuaciones lineales

que podemos observar como converge a

(x

y

)=

(1

1

)que era la

solucion del sistema.

2.7 Ejercicios propuestos

Ejercicio 2.4 Dado el sistema

{x + y = 2

2x + y = 3

a) Calcular su numero de condicion de Frobenius.

Sol : κF (A) = 7.

b) Calcular “a” para que el numero de condicion del sistema resultante desumarle a la segunda ecuacion la primera multiplicada por dicha cons-tante “a”, sea mınimo.

Sol : a = −3/2.

Ejercicio 2.5 Comprobar que la matriz:

A =

1 2 0 0 0

1 4 3 0 0

0 4 9 4 0

0 0 9 16 5

0 0 0 16 25

admite factorizacion LU y realizarla.

Sol : L =

1 0 0 0 0

1 1 0 0 0

0 2 1 0 0

0 0 3 1 0

0 0 0 4 1

y U =

1 2 0 0 0

0 2 3 0 0

0 0 3 4 0

0 0 0 4 5

0 0 0 0 5

. Todas sus matrices

fundamentales son regulares.

Ejercicio 2.6 Resolver, por el metodo de Cholesky, el sistema de ecuaciones: 6 −1 + 3i 1− 2i

−1− 3i 3 −1 + i

1 + 2i −1− i 2

x1

x2

x3

=

−1− 2i

1 + i

1− 2i

Page 109: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Ejercicios propuestos 109

Sol : x1 = −1− 2i, x2 = 3− i, x3 = 1 + 2i.

Ejercicio 2.7 Dada la matriz A =

p −p 2p

−p p + 2 −1

2p −1 6p− 1

se pide:

a) Determinar para que valores de p es hermıtica y definida positiva.

Sol : p ∈ (1/2, 3/2).

b) Para p = 1, efectuar la descomposicion de Cholesky y utilizarla pararesolver el sistema Ax = b siendo b = (1 0 3)t.

Sol : x1 = −1, x2 = 0, x3 = 1.

Ejercicio 2.8 Resolver, utilizando MatLab y comenzando con el vector nulo,el sistema:

10x1 − x2 + 2x3 = 6

−x1 + 11x2 − x3 + 3x4 = 25

2x1 − x2 + 10x3 − x4 = −11

3x2 − x3 + 8x4 = 15

por los metodos de Jacobi, Gauss-Seidel y SOR con ω = 1.2.

Sol : (x1, x2, x3, x4) = (1, 2,−1, 1). Jacobi 42 iteraciones, Gauss-Seidel 16 ySOR 24.

Ejercicio 2.9 Al resolver el sistemax− 3y + 5z = 5

8x− y − z = 8

−2x + 4y + z = 4

por el metodo de Gauss-Seidel, utilizando MATLAB, observamos que el pro-grama se detiene en la iteracion 138 dandonos el vector (inf inf -inf)T .

a) El metodo de Gauss-Seidel realiza el proceso xn+1 = L1xn+c. Determinala matriz L1.

Sol : L1 =

0 3 −5

0 24 −41

0 −90 154

Page 110: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

110 Sistemas de ecuaciones lineales

b) Utilizar los cırculos de Gerschgorin para estimar el modulo de los auto-valores de L1.

Sol : |λi| ≤ 244.

c) Justificar el porque de la divergencia del metodo.

Sol : ρ(L1) > 1.

d) ¿Existe alguna condicion suficiente que deba cumplir la matriz de unsistema para garantizar la convergencia del metodo de Gauss-Seidel?Hacer uso de ella para modificar el sistema de forma que el proceso seaconvergente?

Sol : Llevando la primera ecuacion al ultimo lugar, la matriz del sistemaresultante es de diagonal dominante y por tanto converge el metodo.

Ejercicio 2.10 Sea el sistema Ax = b, donde

A =

(1000 999

999 998

), x =

(x1

x2

)y b =

(1999

1997

).

a) Obtener la factorizacion LU de la matriz A. ¿Se puede conseguir la fac-torizacion de Cholesky?

Sol : L =

(1 0

0.999 1

), U =

(1000 999

0 −0.001

). No admite factori-

zacion de Cholesky.

b) Resolver el sistema Ax = b utilizando la factorizacion A = LU obtenidaen el apartado anterior.

Sol : (x1, x2) = (1, 1).

c) Calcular ‖A‖∞ , ‖A−1‖∞ y el numero de condicion de la matriz κ∞(A).¿Se puede decir que esta bien condicionada?

Sol : ‖A‖∞ = 1999, ‖A−1‖∞ = 1999, κ∞(A) = 19992 ≈ 4 · 106 es decir,la matriz esta mal condicionada.

d) Comprueba que ‖Ax‖∞ = ‖A‖∞ para la solucion x = (1, 1)T del sistemaAx = b.

¿Cual es el maximo valor que puede tomar ‖Ax‖∞, cuando x es un vectorunitario para la norma ‖ ‖∞?

Sol : 1999.

Page 111: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Ejercicios propuestos 111

e) Si se perturba b en b + δb = (1998.99, 1997.01)T , calcular ‖δb‖∞/‖b‖∞.

Si x + δx es la solucion obtenida para el nuevo sistema Ax = b + δb, ¿esel error relativo ‖δx‖∞/‖x‖∞ el maximo que se puede cometer?

Indicacion:‖δx‖∞‖x‖∞

≤ κ∞(A)‖δb‖∞‖b‖∞

.

Sol : Es el maximo posible.

Ejercicio 2.11

a) Dado un sistema Ax = b, el metodo de Gauss-Seidel consiste en cons-truir la sucesion xn+1 = L1xn + c, a partir de un vector inicial x0. Siconocemos el valor de xn+1 ¿podrıamos determinar el de xn haciendoxn = L−1

1 (xn+1 − c)?

Sol : No. L1 no tiene inversa. ¿Porque?, justifıcalo.

b) Si la matriz A del sistema es de diagonal estrictamente dominante,¿puede ser el radio espectral de L1 mayor que 1?

Sol : No. ¿Porque?, justifıcalo.

c) Si, para un determinado sistema y comenzando con un determinado vec-tor x0, el metodo de Gauss-Seidel requiere 50 iteraciones para aproximarla solucion con un error menor que ε y en la iteracion 49 se pierde la pri-mera coordenada del vector x49 y la sustituimos por un valor arbitrario,¿se obtendra en el paso siguiente la solucion buscada con el mismo errorque si no hubiesemos perdido el dato? ¿que ocurrirıa si la coordenadaque perdemos del vector x49 es la segunda en vez de la primera?

Sol : Si se pierde la primera: Sı. Si se pierde la segunda: No.

d) Tomando como vector inicial x0 = (2,−1, 2)T , realizar dos pasos del

metodo de Gauss-Seidel para el sistema

4 2 1

0 2 1

−1 0 2

x

y

z

=

16

0

0

.

¿Podrıas decir cual es la solucion exacta del sistema?

Sol : (4,-1,2).

Ejercicio 2.12 Considerese el sistema Ax = b en el que

A =

(a b

c d

), x =

(x

y

)y b =

β

)con α, β ∈ R.

Page 112: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

112 Sistemas de ecuaciones lineales

a) Determinar la matriz B1, para que el metodo iterativo xn+1 = B1xn + c1

sea el que se obtiene con el metodo de Jacobi aplicado al sistema Ax = b.

Sol : B1 =

(0 −b/a

− c/d 0

).

b) Hallar los autovalores de B1 y probar, en este caso particular, que si lamatriz A es simetrica y definida positiva, entonces el metodo de Jacobiconverge.

Sol : λi = ±√

bc/ad =⇒ ρ(B1) = +√

bc/ad. Si A es simetrica y definidapositiva ρ(B1) < 1 y converge.

c) Determinar la matriz B2, para que el metodo iterativo xn+1 = B2xn + c2

sea el que se obtiene con el metodo de Gauss-Seidel aplicado al sistemaAx = b.

Sol : B2 =

(0 −b/a

0 bc/ad

).

d) Hallar los autovalores de B2 y dar un ejemplo de matriz A (con a 6= 1)para la que el metodo de Gauss-Seidel no converja. ¿Puede, en tal caso,ser convergente el metodo de Jacobi?

Sol : λ1 = 0, λ2 = bc/ad. Uno de los infinitos ejemplos para A serıa

A =

(0 2

1 1

). Jacobi tambien diverge.

e) Comprobar la matriz A =

(1 2

1 1

)es otro ejemplo para la no conver-

gencia del metodo de Gauss-Seidel.

Calcular, para dicha matriz y el vector b =

(1

1

)el termino general

de la sucesion xk obtenida por el metodo de Gauss-Seidel a partir del

vector x0 =

(m

n

)y comprobar que dicha sucesion no converge para

valores arbitrarios de m y n.

¿Existe algun vector inicial x0 para el que converja el metodo? y, encaso de existir, ¿contradice dicho ejemplo el hecho de que el metodo nosea convergente?

Page 113: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Ejercicios propuestos 113

Sol : xk =

(−2kn + 1

2kn

)que diverge si n 6= 0. No existe contradiccion

¿porque?. Justifıcalo.

Ejercicio 2.13 Se quiere encontrar una funcion de la forma f(x) = ax3+bx+cque pase por los puntos (1, 4), (−2,−23) y (2, 21).

a) Plantear un sistema de ecuaciones para calcular los coeficientes de f yresolverlo usando la descomposicion LU de la matriz del sistema.

Sol : f(x) = 2x3 + 3x− 1.

b) Usar una sucesion de Sturm para saber cuantas raıces reales tiene laecuacion f(x) = 0.

Sol : Solo una.

c) Separar dichas raıces por intervalos adecuados para que se den las hipo-tesis de las condiciones de Fourier.

Sol : x ∈ [0.3, 0.4]

d) ¿Cuantas iteraciones son necesarias para obtener las raıces reales con 6cifras decimales exactas usando para su calculo el metodo de Newton?

Sol : Tres.

e) Aplicar dicho metodo para calcularlas con una precision de 12 cifrasdecimales exactas asegurando en cada paso del metodo el numero decifras que se van obteniendo.

Sol : x = 0.312908409479.

Page 114: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion
Page 115: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

3. Sistemas inconsistentes y sis-temas indeterminados

3.1 Factorizaciones ortogonales

Si tratamos de resolver un sistema Ax = b mediante la factorizacion LU (o lade Cholesky), lo que hacemos es transformar el sistema en Ax = LUx = b parahacer Ux = L−1b que es un sistema triangular que se resuelve por sustitucionregresiva. Sin embargo, la matriz del nuevo sistema es U = L−1A y dado queL−1 no es una matriz unitaria (ortogonal en el caso real) el numero de condicionde la matriz del sistema ha cambiado pudiendo estar peor condicionada quela matriz A del sistema original.

Vamos a estudiar, a continuacion, otro tipo de factorizacion A = QR dondeR es, al igual que U , una matriz triangular superior, pero donde Q va a seruna matriz unitaria, por lo que el sistema Ax = b lo transformaremos enRx = Q−1b = Q∗b y, a diferencia del caso anterior, R = Q∗A tiene el mismonumero de condicion que la matriz A del sistema original, ya que Q∗ es unitaria.

3.1.1 Factorizacion QR de Gram-Schmidt

Consideremos la matriz regular A =

a11 a12 · · · a1n

a21 a22 · · · a2n

......

. . ....

an1 an2 · · · ann

= (a1 a2 · · · an)

donde ai representa a su columna i-esima.

Aplicando Gram-Schmidt existe un sistema ortonormal {y1, y2, . . . , yn} tal queL{y1, y2, . . . , yk} = L{a1, a2, . . . , ak}, por lo que yk+1 ∈ L⊥{a1, a2, . . . , ak}.Sea Q la matriz cuyas columnas son los vectores yi, Q = (y1 y2 · · · yn).

115

Page 116: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

116 Sistemas inconsistentes y sistemas indeterminados

Entonces,

Q∗A =

y∗1...

y∗n

(a1 · · · an) ⇐⇒ Q∗A =

〈 a1, y1 〉 · · · 〈 an, y1 〉...

. . ....

〈 a1, yn 〉 · · · 〈 an, yn 〉

Como yk+1 ∈ L⊥{a1, a2, . . . , ak}, se tiene que 〈 ai, yj 〉 = 0 si, y solo si, i < j,por lo que la matriz Q∗A es una triangular superior.

Q∗A = R =

r11 r12 · · · r1n

0 r22 · · · r2n

......

. . ....

0 0 · · · rnn

Como las columnas de Q constituyen un sistema ortonormal de vectores, Q esunitaria, es decir Q∗Q = I, por lo que A = QR.

El problema que plantea la descomposicion QR es que la matriz Q no es otraque la constituida por una base ortonormal obtenida a partir de las columnasde A por el metodo de Gram-Schmidt. Las transformaciones que se realizanpara ortonormalizar los vectores columna de la matriz A mediante el metodode Gram-Schmidt son transformaciones no unitarias, por lo que aunque elresultado sea una factorizacion ortogonal, los pasos que se han dado parallegar a ella han sido transformaciones no ortogonales. Ello nos lleva a tratarde buscar un metodo por el que podamos realizar una factorizacion QR en laque todos los pasos que se realicen sean transformaciones ortogonales.

3.1.2 Factorizacion QR mediante rotaciones

Consideremos la matriz

A =

a11 · · · a1i · · · a1j · · · a1n

.... . .

......

...

ai1 · · · aii · · · aij · · · ain

......

. . ....

...

aj1 · · · aji · · · ajj · · · ajn

......

.... . .

...

an1 · · · ani · · · anj · · · ann

Page 117: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Factorizaciones ortogonales 117

y tratemos de anular el elemento aji 6= 0. Para ello vamos a aplicar unarotacion

Qji =

1 · · · 0 · · · 0 · · · 0...

. . ....

......

0 · · · cos α · · · sen α · · · 0...

.... . .

......

0 · · · − sen α · · · cos α · · · 0...

......

. . ....

0 · · · 0 · · · 0 · · · 1

La matriz QjiA nos queda

QjiA =

a′11 · · · a′1i · · · a′1j · · · a′1n...

. . ....

......

a′i1 · · · a′ii · · · a′ij · · · a′in...

.... . .

......

a′j1 · · · a′ji · · · a′jj · · · a′jn...

......

. . ....

a′n1 · · · a′ni · · · a′nj · · · a′nn

con a′ji = −aii sen α + aji cos α, por lo que

• Si aii = 0 =⇒ a′ji = aji cos α y si queremos anularlo aji cos α = 0.Dado que suponemos que aji 6= 0, basta con hacer cos α = 0, es decir:α = π/2.

• Si aii 6= 0 tendremos que hacer −aii sen α + aji cos α = 0, por lo que

t = tg α =aji

aii

y, por tanto,

sen α =t√

1 + t2cos α =

1√1 + t2

Observese ademas que los unicos elementos que se alteran en la matriz QjiAson los correspondientes a la filas y columnas i y j.

Podemos, por tanto, mediante rotaciones, anular todos los elementos subdia-gonales y llegar a una matriz R triangular superior

Qk · · ·Q2Q1A = R ⇐⇒ Q∗A = R con Q∗ = Qk · · ·Q2Q1

Page 118: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

118 Sistemas inconsistentes y sistemas indeterminados

Dado que las matrices Qi de las rotaciones son ortogonales, su productotambien los es, por lo que Q∗ es una matriz ortogonal y, por tanto, A = QR.

En este metodo de factorizacion QR, a diferencia del aplicado anteriormentemediante el metodo de Gram-Schmidt todos los pasos que se dan estan asocia-dos a transformaciones ortogonales, sin embargo resulta costoso ya que cadarotacion hace un unico cero en la matriz A, por lo que para una matriz de

orden n serıan necesariasn2 − n

2rotaciones.

Otra posibilidad es hacer reflexiones en vez de rotaciones, ya que estas consi-guen anular todos los elementos situados por debajo de uno prefijado de unadeterminada columna. Este tipo de transformaciones vamos a estudiarlas acontinuacion con las denominadas transformaciones de Householder.

3.1.3 Factorizacion QR de Householder

Consideremos un espacio vectorial de dimension n definido sobre un cuerpoK, que denotaremos por Kn (en general trabajaremos en Rn o Cn).

Definicion 3.1 [Transformaciones de Householder]

Dado un vector v ∈ Kn se define la transformacion H de Householder asociadaal vector v a la que viene definida por la matriz:

H =

I ∈ Kn×n si v = 0

I − 2

v∗vvv∗ si v 6= 0

Proposicion 3.1 La transformacion H de Householder asociada a un vectorv ∈ Kn posee las siguientes propiedades:

a) H es hermıtica (H∗ = H).

b) H es unitaria (H∗H = HH∗ = I).

c) H2 = I o lo que es lo mismo, H−1 = H.

Page 119: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Factorizaciones ortogonales 119

Demostracion.

a) H∗ =

(I − 2

v∗vvv∗)∗

= I∗ −(

2

v∗v

)(vv∗)∗ = I − 2

v∗vvv∗ = H

Observese que v∗v = 〈 v, v 〉 = ‖v‖2 ∈ R, por lo que v∗v = v∗v

b) Teniendo en cuenta que H∗ = H

HH∗ = HH =

(I − 2

v∗vvv∗)(

I − 2

v∗vvv∗)

=

= I − 4

v∗vvv∗ +

(2

v∗v

)2

vv∗vv∗ =

= I − 4

v∗vvv∗ +

4

(v∗v)2v(v∗v)v∗ = I − 4

v∗vvv∗ +

4

(v∗v)vv∗ = I

c) H2 = HH = HH∗ = I.

Interpretacion geometrica en Rn

Sean v ∈ Rn un vector tal que ‖v‖2 = 1 y H la transformacion de Householderasociada a el:

H = I − 2vvT

Dado un vector x ∈ Rn se tiene que

Hx =(I − 2vvT

)x = x− 2vvT x = x− 2v〈x, v 〉 =

= x− 2v(‖x‖ ‖v‖ cos α) = x− 2v(‖x‖ cos α) =

= x− 2λv con λ = ‖x‖ cos α

donde α representa el angulo que forman los vectores x y v.

-

v

x

α

λ

��

��

��

��

��

��3

-�

Figura 3.1: λ = ‖x‖ cos α.

Page 120: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

120 Sistemas inconsistentes y sistemas indeterminados

Sea y el vector simetrico de x respecto del hiperplano perpendicular a v.

-��

��

��

��3

v

xy

� QQ

QQ

QQ

QQk

−v

λv −λv-�

6 6

x− λvy + λv

Figura 3.2: Un vector x y su transformado y = Hx.

Podemos observar que

y + λv = x− λv ⇐⇒ y = x− 2λv = Hx

H refleja al vector x respecto del hiperplano perpendicular al vector v, por loque las transformaciones de Householder son tambien conocidas como refle-xiones.

El siguiente resultado, valido para cualquier espacio vectorial (real o complejo),es facil de comprobar, geometricamente, en el caso real.

Proposicion 3.2 Sea H la transformacion de Householder asociada a un vec-tor no nulo v.

a) x ⊥ v =⇒ Hx = x.

b) x ‖ v =⇒ Hx = −x en particular Hv = −v.

Demostracion.

a) Por ser x ⊥ v, su producto escalar v∗x es nulo, por lo que

Hx = (I − 2

v∗vvv∗)x = x− 2

v∗vv(v∗x) = x

b) x ‖ v =⇒ x = λv

Hx = (I − 2

v∗vvv∗)λv = λv − 2

v∗vvv∗λv = λv − 2λ

v∗vv(v∗v) =

= λv − 2λv = −λv = −x

En particular, para x = v se obtiene Hv = −v.

Page 121: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Factorizaciones ortogonales 121

Interpretacion geometrica en Cn

Cualquier vector x ∈ Cn puede ser descompuesto de forma unica en la sumade uno proporcional a v y otro w perteneciente a la variedad W ortogonal av, es decir

x = λv + w con w ⊥ v

Ası pues,Hx = H(λv + w) = H(λv) + Hw = −λv + w

Hx es el vector simetrico de x respecto del hiperplano ortogonal a v.

Determinacion de las transformaciones

• Caso real

Proposicion 3.3 Si x 6= y son dos vectores de Rn con ‖x‖ = ‖y‖, latransformacion de Householder asociada al vector v = x− y transformaal vector x en el vector y, es decir, Hx = y.

Demostracion. Dado que ambos vectores tienen la misma norma,

〈x + y, x− y 〉 = ‖x‖2 − 〈x, y 〉+ 〈 y, x 〉 − ‖y‖2 = 0

AA

AA

AAK

�������

-

6x + y

y x

x− y

Figura 3.3: Hx−y transforma x en y.

Ademas, los vectores x e y son simetricos respecto de la direccion del vec-tor x+y (vease la Fig. 3.3), por lo que la transformacion de Householderasociada al vector v = x− y transforma a x en y.

Considerense los vectores de igual norma x = (x1, x2, . . . , xn)T

y = (x1, x2, . . . , xk, ‖(xk+1, . . . , xn)T‖, 0, . . . , 0)T

Page 122: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

122 Sistemas inconsistentes y sistemas indeterminados

La transformacion de Householder asociada al vector v = x − y trans-forma x en y y deja invariante a cualquier vector que tenga nulas todassus coordenadas a partir de la k + 1-esima.

Ejemplo 3.1 Sean x = (1, 1, 1, 2, 2)T

y = (1, 1,√

12 + 22 + 22, 0, 0)T = (1, 1, 3, 0, 0)T

La transformacion de Householder asociada al vector

v = x− y = (0, 0,−2, 2, 2)T

H = I − 2

v∗vvv∗ = I − 2

12vv∗

verifica que:

Hx = (I − 2

12vv∗)x = x− 2

12v(v∗x) = x− 2

12v6 = x− v = y

y para cualquier vector que tenga sus tres ultimas coordenadas nulas

w = (a, b, 0, 0, 0)T

Hw = (I − 2

12vv∗)w = w − 2

12v(v∗w) = w − 2

12v · 0 = w

• Caso complejo

Considerense los vectores de igual normax = (x1, x2, . . . , xn)T

y = (x1, x2, . . . , xk,±‖(xk+1, . . . , xn)T‖

|xk+1|xk+1, 0, . . . , 0)T

La transformacion de Householder asociada al vector v = x − y trans-forma x en y y deja invariante a cualquier vector que tenga nulas todassus coordenadas a partir de la k + 1-esima.

Ejemplo 3.2 Seanx = (i, 3i, 4i)T

y = (i,

√|3i|2 + |4i|2|3i|

3i, 0)T = (i, 5i, 0)T

Page 123: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Factorizaciones ortogonales 123

La transformacion de Householder asociada al vector

v = x− y = (0,−2i, 4i)T

H = I − 2

v∗vvv∗ = I − 2

12vv∗

verifica que:

Hx = (I − 2

20vv∗)x = x− 2

20v(v∗x) = x− 2

20v10 = x− v = y

y para cualquier vector que tenga su ultima coordenada nula

w = (a, b, 0)T

Hw = (I − 2

20vv∗)w = w − 2

20v(v∗w) = w − 2

20v · 0 = w

Factorizacion QR de Householder

Sea A = (a1 a2 · · · an), donde ai representa la columna i-esima de la matriz.

Sean x1 = a1 =

a11

a21

...

an1

e y1 =

‖x1‖

0...

0

=

r11

0...

0

.

La transformacion de Householder H1, asociada al vector v1 = x1 − y1, trans-forma x1 en y1, es decir, anula a todos los elementos de la primera columnasituados debajo de a11.

H1A =

r11 a

(1)12 · · · a

(1)1n

0 a(1)22 · · · a

(1)2n

......

. . ....

0 a(1)n2 · · · a

(1)nn

= (a(1)1 a

(1)2 · · · a(1)

n )

en la que a(1)i representa la columna i-esima de la matriz H1A.

Busquemos ahora otro vector v2 tal que la transformacion de Householder H2

asociada a el, deje invariante al vector a(1)1 y transforme al vector a

(1)2 en otro

de la forma (r12, r22, 0, . . . , 0)T .

Page 124: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

124 Sistemas inconsistentes y sistemas indeterminados

Tomando x2 = a(1)2 =

a

(1)21

a(1)22

a(1)32...

a(1)n2

e y2 =

a

(1)21

‖(a(1)22 , . . . , a

(1)n2 )T‖

0...

0

, la trans-

formacion H2 asociada al vector v2 = x2 − y2 deja invariante al vector a(1)1 y

transforma x2 = a(1)2 en y2.

Reiterando al procedimiento se puede transformar la matriz A en una trian-gular superior R en, a lo mas, n− 1 transformaciones.

Llegados a ese paso se tiene que

HkHk−1 · · ·H1A = R ⇐⇒ Q∗A = R con Q∗ = HkHk−1 · · ·H1

de dondeA = QR. con Q = H1 H2 · · · Hk

Si lo que nos interesa es resolver el sistema aplicamos las transformaciones alsistema y no solo a la matriz A.

HkHk−1 · · ·H1Ax = HkHk−1 · · ·H1b ⇐⇒ Rx = b′

sistema triangular de facil resolucion.

Ejemplo 3.3 Consideremos la matriz A =

1 −1 −1

2 0 1

−2 7 1

.

Como x1 =

1

2

−2

e y1 =

12 + 22 + (−2)2

0

0

=

3

0

0

, se tiene que

v1 = x1 − y1 =

−2

2

−2

H1 = I− 2

v∗1v1

v1v∗1 = I− 2

12

−2

2

−2

( −2 2 −2)

=

1/3 2/3 −2/32/3 1/3 2/3

−2/3 2/3 1/3

H1A =

1/3 2/3 −2/32/3 1/3 2/3

−2/3 2/3 1/3

1 −1 −1

2 0 1

−2 7 1

=

3 −5 −1/3

0 4 1/3

0 3 5/3

Page 125: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Factorizaciones ortogonales 125

x2 =

−5

4

3

y2 =

−5√42 + 32

0

=

−5

5

0

=⇒ v2 = x2−y2 =

0

−1

3

H2 = I − 2

v∗2v2

v2v∗2 = I − 2

10

0

−1

3

( 0 −1 3)

=

1 0 0

0 4/5 3/5

0 3/5 −4/5

H2H1A =

1 0 0

0 4/5 3/5

0 3/5 −4/5

3 −5 −1/3

0 4 1/3

0 3 5/3

=

3 −5 −1/3

0 5 19/15

0 0 −17/15

= R

Q = H1H2 =

1/3 2/15 14/15

2/3 2/3 −1/3

−2/3 11/15 2/15

Verificandose que A = QR con Q unitaria y R triangular superior. �

Observese que H1A =

α11 a

(1)12 · · · a

(1)1n

0... A(1)

0

siendo A(1)una matriz de

un orden inferior al de la matriz A.

El vector v2 tiene la primera coordenada nula, por lo que

H2 = I − 2

v∗2v2

v2v∗2 =

1 0 · · · 0

0... H(2)

0

H2(H1A) =

1 0 · · · 0

0... H(2)

0

α11 a(1)12 · · · a

(1)1n

0... A(1)

0

=⇒

H2H1A =

α11 a

(1)12 · · · a

(1)1n

0... H(2)A(1)

0

Page 126: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

126 Sistemas inconsistentes y sistemas indeterminados

Es decir, H2 deja invariantes a los elementos de la primera fila y la primeracolumna de H1A.

Analogamente, H3 =

1 0 0 · · · 0

0 1 0 · · · 0

0 0...

... H(3)

0 0

dejara invariantes a los elemen-

tos de las dos primeras filas y las dos primeras columnas de H2H1A y asısucesivamente.

Podemos, por lo tanto, trabajar, para cada transformacion, en un espacio deuna dimension inferior que en la transformacion anterior.

Ejemplo 3.4 Para la matriz del Ejemplo 3.3 se tiene:

x1 =

1

2

−2

y1 =

12 + 22 + (−2)2

0

0

=

3

0

0

=⇒

v1 = x1 − y1 =

−2

2

−2

H1 = I− 2

v∗1v1

v1v∗1 = I− 2

12

−2

2

−2

( −2 2 −2)

=

1/3 2/3 −2/32/3 1/3 2/3

−2/3 2/3 1/3

H1A =

1/3 2/3 −2/32/3 1/3 2/3

−2/3 2/3 1/3

1 −1 −1

2 0 1

−2 7 1

=

3 −5 −1/3

0 4 1/3

0 3 5/3

Hasta aquı, igual que en el Ejemplo 3.3.

Nos fijamos ahora en la matriz A(1)=

(4 1/3

3 5/3

).

Tomando

x2 =

(4

3

)y2 =

( √42 + 32

0

)=

(5

0

)=⇒ v2 = x2 − y2 =

(−1

3

)

H(2)= I2 −

2

v∗2v2

v2v∗2 = I2 −

2

10

(−1

3

)(−1 3

)=

(4/5 3/53/5 −4/5

)

Page 127: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Sistemas superdeterminados. Problema de los mınimos cuadrados 127

Por lo que H2 =

1 0 0

0 4/5 3/5

0 3/5 −4/5

Teniendo en cuenta que

H(2)A(1)=

(4/5 3/53/5 −4/5

)(4 1/3

3 5/3

)=

(5 19/15

0 −17/15

)Podrıamos obtener

H2H1A =

3 −5 −1/3

0 5 19/15

0 0 −17/15

que es el mismo resultado que el obtenido en el Ejemplo 3.3 pero trabajandocada vez con una dimension menos. �

3.2 Sistemas superdeterminados.Problema de

los mınimos cuadrados

Sea A = (a1 a2 · · · an) una matriz cuadrada de orden n, A ∈ Kn×n, donde ai

representa la columna i-esima de la matriz A, y sean x y b son vectores de Kn.Sabemos, por el teorema de Rouche-Frobenius, que el sistema Ax = b tienesolucion si, y solo si, existen x1, x2, . . . , xn ∈ Kn tales que

x1 a1 + x2 a2 + · · ·+ xn an = b

Es decir, el vector b puede expresarse como una combinacion lineal de lascolumnas ai de la matriz A, por lo que b ∈ C(A) (espacio columna de A).

Sin embargo, existen problemas en los que no ocurre ası. Supongamos quese tienen tres puntos en el plano y se desea calcular la recta que pasa porellos. Evidentemente, y dado que una recta la determinan solo dos puntos, elproblema no tiene solucion (salvo que los tres puntos esten alineados). Desdeel punto de vista algebraico este problema se expresa de la siguiente forma:sean P = (a1, b1), Q = (a2, b2) y R = (a3, b3). Si tratamos de hallar la ecuacionde la recta y = mx + n que pasa por ellos se obtiene

ma1 + n = b1

ma2 + n = b2

ma3 + n = b3

⇐⇒

a1 1

a2 1

a3 1

( m

n

)=

b1

b2

b3

Page 128: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

128 Sistemas inconsistentes y sistemas indeterminados

Decir que el sistema no posee solucion equivale a decir que el vector

b =

b1

b2

b3

no pertenece al espacio columna de la matriz A =

a1 1

a2 1

a3 1

.

Definicion 3.2 [Sistema superdeterminado]

Se define un sistema superdeterminado como aquel sistema de ecuaciones li-neales Ax = b en el que A ∈ Km×n con m > n, x ∈ Kn y b ∈ Km.

Supongamos que se tiene un sistema superdeterminado

a11 · · · a1n

.... . .

...

an1 · · · ann

......

am1 · · · amn

x1

...

xn

=

b1

...

bn

...

bm

con m > n, en el que rg A = n es decir, en el que la matriz del sistema tienerango maximo, y denotemos por a1, a2, . . . , an las columnas de A.

Si el sistema es incompatible es debido a que el vector b no pertenece al espaciocolumna de A. Tomando cualquier vector b ∈ C(A) se sabe que el sistemaAx = b posee solucion unica.

Definicion 3.3 [Problema de los mınimos cuadrados]

Se conoce como problema de los mınimos cuadrados al problema de encontrar,de entre todos los vectores del espacio columna de A, aquel que minimiza sudistancia al vector b, es decir, aquel vector b ∈ C(A) tal que ‖b− b‖ es mınima.

Dicho vector es la proyeccion ortogonal de b sobre el espacio C(A) y, respectode la base formada por las columnas ai (1 ≤ i ≤ n) de la matriz A, tiene porcoordenadas

b = (〈 b, a1 〉, 〈 b, a2 〉, . . . , 〈 b, an 〉}

Page 129: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Sistemas superdeterminados. Problema de los mınimos cuadrados 129

Dado que b 6∈ C(A) y b ∈ C(A) (b proyeccion ortogonal de b sobre C(A)),podemos expresar b como suma de b mas otro vector c de la variedad ortogonala C(A) y, ademas, de forma unica.

b

C(A)

-

b

6

c

��

��

�� �

��

��

Figura 3.4: La proyeccion de b en el espacio columna de A.

Entonces:

〈 b, ai 〉 = 〈 b + c, ai 〉 = 〈 b, ai 〉+ 〈 c, ai 〉 = 〈 b, ai 〉 1 ≤ i ≤ n

El sistema Ax = b posee solucion unica es decir, existen (α1, α2, . . . , αn) unicos,tales que

α1a1 + α2a2 + · · ·+ αnan = b ⇐⇒ A

α1

...

αn

= b

Multiplicando esta ecuacion por a1, a2, . . ., an, obtenemos

α1〈 a1, a1 〉+ · · ·+ αn〈 a1, an 〉 = 〈 b, a1 〉 = 〈 b, a1 〉. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

α1〈 an, a1 〉+ · · ·+ αn〈 an, an 〉 = 〈 b, an 〉 = 〈 b, an 〉

que equivale a a∗1a1 · · · a∗1an

.... . .

...

a∗na1 · · · a∗nan

α1

...

αn

=

a∗1b...

a∗nb

es decir a∗1

...

a∗n

( a1 · · · an

) α1

...

αn

=

a∗1...

a∗n

b

Page 130: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

130 Sistemas inconsistentes y sistemas indeterminados

o, lo que es lo mismo:

A∗A

α1

...

αn

= A∗b

Ası pues, la solucion del sistema A∗Ax = A∗b nos proporciona las coordenadas,respecto de la base formada por las columnas de la matriz A, del vector bproyeccion ortogonal de b sobre el espacio columna C(A).

Definicion 3.4 [Ecuaciones normales de un sistema]

Las ecuaciones A∗Ax = A∗b reciben el nombre de ecuaciones normales delsistema superdeterminado Ax = b.

Definicion 3.5 [Soluciones en mınimos cuadrados:Pseudosolucion]

Las soluciones del sistema determinado por las ecuaciones normales de un sis-tema superdeterminado Ax = b reciben el nombre de solucion(es) en mınimoscuadrados y de todas las posibles soluciones en mınimos cuadrados, la de me-nor norma recibe el nombre de pseudosolucion del sistema.

Observese que si la matriz A no tiene rango maximo, lo unico que se dispone delespacio columna de A es de un sistema generador y no de una base, por lo quelas coordenadas del vector proyeccion respecto de dicho sistema generador noson unicas obteniendose infinitas soluciones en mınimos cuadrados del sistema.

3.2.1 Transformaciones en sistemas superdeterminados

Sabemos que dado un sistema compatible Ax = b y mediante transformacioneselementales puede obtenerse otro sistema BAx = Bb equivalente al anterior,es decir, obtenemos un sistema que posee la misma (o las mismas) solucionesque el sistema dado.

Si partimos de un sistema superdeterminado y realizamos, al igual que antes,transformaciones elementales, puede que el sistema obtenido no posea la mismapseudosolucion que el sistema dado.

Observese que para que los sistemas superdeterminados

Ax = b y BAx = Bb

Page 131: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Sistemas superdeterminados. Problema de los mınimos cuadrados 131

posean la misma pseudosolucion, han de tener igual solucion (han de ser equi-valentes) los sistemas

A∗Ax = A∗b

(BA)∗BAx = (BA)∗Bb ⇐⇒ A∗(B∗B)Ax = A∗(B∗B)b

por lo que solo podremos garantizar que ambos sistemas son equivalentes siB∗B = I ya que, en dicho caso, ambos sistemas son el mismo.

Es decir, las unicas transformaciones que podemos garantizar que no alteraranla solucion de un sistema superdeterminado son las unitarias.

Dado que las transformaciones de Householder son unitarias, podemos utili-zarlas para resolver sistemas superdeterminados.

Consideremos el sistema superdeterminado Ax = b (en el que suponemos Ade rango maximo). Mediante transformaciones de Householder H1, H2, . . . , Hn

podemos transformar la matriz A en otra de la forma

HA = Hn · · ·H1A =

t11 t12 · · · t1n

0 t22 · · · t2n

......

. . ....

0 0 · · · tnn

0 0 · · · 0...

......

0 0 · · · 0

=

(T

Θ

)

La pseudosolucion de este sistema superdeterminado es la solucion del sistema

(HA)∗(HA)x = (HA)∗Hb ⇐⇒(

T ∗ Θ)( T

Θ

)x =

(T ∗ Θ

)Hb

o llamando Hb = b′ =

b′1...

b′n...

b′m

,(

T ∗ Θ)( T

Θ

)x =

(T ∗ Θ

)b′.

Page 132: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

132 Sistemas inconsistentes y sistemas indeterminados

Es facil comprobar que(

T ∗ Θ)

b′1...

b′n...

b′m

= T ∗

b′1...

b′n

, por lo que el calculo

de la pseudosolucion del sistema superdeterminado Ax = b se hace resolviendoel sistema

T ∗Tx = T ∗

b′1...

b′n

y dado que estamos suponiendo que A tiene rango maximo, la matriz T poseeinversa y por tanto T ∗, por lo que la solucion es la misma que la del sistematriangular

Tx =

b′1...

b′n

⇐⇒ Tx = b

Una vez calculada la pseudosolucion, la norma del error esta representada porla distancia ‖b− b‖ que viene dada por

∥∥∥∥∥∥∥∥∥∥∥∥∥

(T

Θ

)x−

b′1...

b′n...

b′m

∥∥∥∥∥∥∥∥∥∥∥∥∥=

∥∥∥∥∥∥∥∥∥∥∥∥∥∥∥

b′1...

b′n0...

0

b′1...

b′nb′n+1

...

b′m

∥∥∥∥∥∥∥∥∥∥∥∥∥∥∥=

∥∥∥∥∥∥∥ b′n+1

...

b′m

∥∥∥∥∥∥∥

Por ultimo, si la matriz A no tiene rango maximo, sus columnas no son li-nealmente independientes, por lo que solo constituyen un sistema generador(no una base) del espacio columna C(A). Ello nos lleva a la existencia deinfinitas n-uplas (α1, α2, . . . , αn) soluciones del sistema Ax = b y, por tanto, ainfinitas soluciones en mınimos cuadrados del sistema superdeterminado, peroteniendo en cuenta que al ser unica la proyeccion ortogonal b de b sobre el es-pacio columna C(A), todas ellas representan diferentes coordenadas del vectorb respecto del sistema generador de C(A) dado por las columnas de A.

Sin embargo, el error cometido ‖b − b‖ es el mismo para todas las solucionesen mınimos cuadrados del sistema. De entre todas ellas, la de menor normaeuclıdea es la pseudosolucion.

Page 133: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Descomposicion en valores singulares y pseudoinversa de Penrose 133

3.3 Descomposicion en valores singulares y

pseudoinversa de Penrose

La descomposicion en valores singulares es otra factorizacion matricial quetiene muchas aplicaciones.

Teorema 3.4 [Descomposicion en valores singulares]

Toda matriz compleja A, de orden m × n puede ser factorizada de la formaA = UΣV ∗ donde U es una matriz unitaria m × m, Σ una matriz diagonalm× n y V una unitaria de orden n× n.

Demostracion. La matriz A∗A es hermıtica de orden n × n y semidefinidapositiva, ya que

x∗(A∗A)x = (Ax)∗(Ax) ≥ 0

Resulta, de ello, que sus autovalores son reales no negativos σ21, σ

22, . . . , σ

2n

(pudiendo estar repetidos, pero ordenados de forma que los r primeros son nonulos y los n− r ultimos son nulos). Los valores σ1, σ2, . . . , σn son los valoressingulares de la matriz A.

Sea {v1, v2, . . . , vn} un conjunto ortonormal de vectores propios de A∗A, dis-puestos de forma que

A∗Avi = σ2i vi

Se verifica entonces que

‖Avi‖22 = v∗i A

∗Avi = v∗i σ2i vi = σ2

i

Esto nos muestra que Avi = 0 si i ≥ r + 1. Observese que

r = rg(A∗A) ≤ mın{rg(A∗), rg(A)} ≤ mın{m, n}

Construyamos la matriz V de orden n× n cuyas columnas son v1, v2, . . . , vn ydefinamos

ui = σ−1i Avi 1 ≤ i ≤ r

Los vectores ui constituyen un sistema ortonormal, ya que para 1 ≤ i, j ≤ rse tiene que

u∗i uj = σ−1i (Avi)

∗σ−1j (Avj) = (σiσj)

−1(v∗i A∗Avj) = (σiσj)

−1(v∗i σ2j vj) = δij

Eligiendo vectores adicionales ur+1, ur+2, . . . , um de tal forma que {u1, . . . , um}constituya una base ortonormal de Cm y construyendo las matrices U de orden

Page 134: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

134 Sistemas inconsistentes y sistemas indeterminados

m×m cuyas columnas son los vectores ui y la matriz Σ de orden m×n cuyoselementos diagonales Σii = σi y los restantes elementos nulos, se tiene que

A = UΣV ∗

Para probarlo vamos a ver que U∗AV = Σ. En efecto:

(U∗AV )ij = u∗i Avj = u∗i σjuj = σju∗i uj = σjδij = Σij

3.3.1 Pseudoinversa de Penrose

Definicion 3.6 [Pseudoinversa]

Para las matrices D de orden m × n tales que dij = 0 si i 6= j y dii > 0, sedefine la pseudoinversa como la matriz n×m D+ cuyos elementos diagonalesson los inversos de los elementos diagonales de D y el resto de los elementosson nulos.

En el caso general de una matriz A de orden m×n se define la pseudoinversaA+ a traves de la factorizacion en valores singulares A = UΣV ∗ de la formaA+ = V Σ+U∗

La pseudoinversa comparte algunas propiedades con la inversa, pero solo al-gunas ya que, por ejemplo

A ∈ Km×n con m > n =⇒ A+ ∈ Kn×m =⇒ AA+ ∈ Km×m

rg AA+ ≤ mın{rg A, rg A+} ≤ n < m =⇒ AA+ 6= I

Teorema 3.5 [Propiedades de Penrose]

Para cada matriz A existe, a lo mas, una matriz X que verifica las siguientespropiedades:

a) AXA = A

b) XAX = X

c) (AX)∗ = AX

d) (XA)∗ = XA

Page 135: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Descomposicion en valores singulares y pseudoinversa de Penrose 135

Demostracion. Sean X e Y dos matrices que verifique las cuatro propiedades.Se tiene entonces que

X = XAX (b)

= XAY AX (a)

= XAY AY AY AX (a)

= (XA)∗(Y A)∗Y (AY )∗(AX)∗ (d) y (c)

= A∗X∗A∗Y ∗Y Y ∗A∗X∗A∗

= (AXA)∗Y ∗Y Y ∗(AXA)∗

= A∗Y ∗Y Y ∗A∗ (a)

= (Y A)∗Y (AY )∗

= Y AY AY (d) y (c)

= Y AY (b)

= Y (b)

Teorema 3.6 La pseudoinversa de una matriz tiene las cuatro propiedadesde Penrose y, por tanto, es unica.

Demostracion. Sea A = UΣV ∗ la descomposicion en valores singulares deuna matriz A. Sabemos que A+ = V Σ+U∗.

Si la matriz A es de orden m× n y tiene rango r, la matriz Σ es tambien delmismo orden y tiene la forma

Σij =

{σi si i = j ≤ r

0 en caso contrario

Se tiene entonces queΣΣ+Σ = Σ

ya que

(ΣΣ+Σ)ij =n∑

k=1

Σik

m∑l=1

Σ+klΣlj.

Los terminos Σik y Σlj hacen que el segundo miembro de la igualdad sea nuloexcepto en los casos en que i, j ≤ r en cuyo caso

(ΣΣ+Σ)ij =r∑

k=1

Σik

r∑l=1

Σ+klΣlj = σi

r∑l=1

Σ+il Σlj = σiσ

−1i Σij = Σij.

Razonamientos analogos nos permiten probar que Σ+ verifica las otras trespropiedades de Penrose.

Page 136: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

136 Sistemas inconsistentes y sistemas indeterminados

Si nos fijamos ahora en A+, se tiene que

AA+A = UΣV ∗V Σ+U∗UΣV ∗ = UΣΣ+ΣV ∗ = UΣV ∗ = A

y razonamientos similares nos permiten probar las otras tres propiedades.

Si la matriz A es de rango maximo, la matriz A∗A es invertible. Las ecuacionesnormales del sistema Ax = b vienen dadas por A∗Ax = A∗b y dado que A∗Aes invertible se tiene que

x = (A∗A)−1A∗b. (3.1)

Por otra parte, si hubiesemos resuelto el sistema a traves de la pseudoinversade Penrose habrıamos obtenido

x = A+b. (3.2)

por lo que comparando las ecuaciones (3.1) y (3.2) obtenemos, teniendo encuenta la unicidad de la pseudoinversa, que si A es de rango maximo, la pseu-doinversa viene dada por

A+ = (A∗A)−1A∗.

3.4 Ejercicios resueltos

Ejercicio 3.1 Dado el sistema:

4x + 5y = 13

3x + 5y = 11

a) Realizar la factorizacion QR de la matriz, y resolverlo basandose en ella

a.1) Mediante el metodo de Gram-Schmidt,

a.2) Mediante transformaciones de Householder.

b) Calcular el numero de condicion euclıdeo del sistema inicial y del trans-formado, comprobando que son iguales.

Solucion:

a) El sistema a resolver es Ax = b ⇐⇒

(4 5

3 5

)(x

y

)=

(13

11

)

Page 137: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Ejercicios resueltos 137

a.1) Utilizando el metodo de Gram-Schmidt:

v1 =

(4

3

)v2 =

(5

5

)+ λ

(4

3

)

v1 ⊥ v2 =⇒ 〈 v1, v2 〉 = 0 =⇒ 35 + 25λ = 0 =⇒ λ = −7/5

por tanto,

v2 =1

5

[(25

25

)− 7

(4

3

)]=

(−3/5

4/5

)⇒ Q =

(4/5 −3/53/5 4/5

)

R = Q∗A =

(4/5 3/5

−3/5 4/5

)(4 5

3 5

)=

(5 7

0 1

)Se obtiene, por tanto, que A = QR donde Q es unitaria y R trian-gular superior. El sistema se transforma en otro triangular de lamanera siguiente:

Ax = b ⇐⇒ QRx = b ⇐⇒ Rx = Q∗b

En nuestro caso:

Q∗b =

(4/5 3/5

−3/5 4/5

)(13

11

)=

(17

1

)

quedandonos el sistema triangular(5 7

0 1

)(x

y

)=

(17

1

)

cuya solucion es

x = 2 y = 1.

a.2) Utilizando transformaciones de Householder se obtiene:

x =

(4

3

)y =

( √42 + 32

0

)=

(5

0

)v = x− y =

(−1

3

)

H = I − 2

v∗vvv∗ =

(1 0

0 1

)− 1

5

(1 −3

−3 9

)=

(4/5 3/53/5 −4/5

)

Page 138: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

138 Sistemas inconsistentes y sistemas indeterminados

Al solo ser necesaria una transformacion de Householder, se tieneque

Q = H∗ = H =

(4/5 3/53/5 −4/5

)

R = Q∗A = HA =

(4/5 3/53/5 −4/5

)(4 5

3 5

)=

(5 7

0 −1

)Transformando el sistema obtenemos:

Ax = b ⇐⇒ QRx = b ⇐⇒ Rx = Q∗b = Hb

Dado que

Hb =

(4/5 3/53/5 −4/5

)(13

11

)=

(17

−1

)

nos queda el sistema triangular(5 7

0 −1

)(x

y

)=

(17

−1

)

cuya solucion

x = 2 y = 1.

b) El numero de condicion euclıdeo viene dado por κ2(A) =σ2

σ1

donde σ2 el

mayor y σ1 el menor de los valores singulares de la matriz A.

Los valores singulares son las raıces cuadradas positivas de los autovalo-res de la matriz A∗A.

Cuando calculamos el numero de condicion de la matriz R del sistematransformado, realizaremos el mismo proceso con esta nueva matriz, esdecir, debemos calcular los autovalores de la matriz R∗R.

Dado que

A∗A =

(4 3

5 5

)(4 5

3 5

)=

(25 35

35 50

)

R∗R =

(5 0

7 1

)(5 7

0 1

)=

(25 35

35 50

)los valores singulares de las matrices A y R son los mismos, por lo quese obtiene el mismo numero de condicion euclıdeo.

Page 139: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Ejercicios resueltos 139

El polinomio caracterıstico de A∗A es p(λ) = λ2 − 75λ + 25, porlo que sus autovalores son λ1 ' 74.665 y λ2 ' 0.335 y, por tanto,los valores singulares de la matriz A son σ2 '

√74.665 ' 8.64 y

σ1 '√

0.335 ' 0.58, de donde

κ2(A) = κ2(R) =σ2

σ1

' 14.9

Ejercicio 3.2 Resolver por el metodo de Householder el sistema: 1 −1 −1

2 0 1

−2 7 1

x

y

z

=

0

4

−7

Solucion:

x =

1

2

−2

y =

3

0

0

v1 = x− y =

−2

2

−2

H1 = I3 − 2v∗1v1

v1v∗1 = I3 −

2

12

−2

2

−2

( −2 2 −2)

=

= I3 −1

3

2 −2 2

−2 2 −2

2 −2 2

=

1/3 2/3 −2/32/3 1/3 2/3

−2/3 2/3 1/3

Aplicando la transformacion al sistema se obtiene 3 −5 −1/3

0 4 1/3

0 3 5/3

x

y

z

=

22/3

−10/31/3

Dado que la segunda transformacion no va a afectar ni a la primera ecuacionni a la primera columna de la matriz A, la calculamos solo para el menorasociado al elemento a11.

x =

(4

3

)y =

(5

0

)v2 = x− y =

(−1

3

)

Page 140: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

140 Sistemas inconsistentes y sistemas indeterminados

H2 = I2 −2

v∗2v2

v2v∗2 = I2 −

1

5

(−1

3

)(−1 3

)=

(4/5 3/53/5 −4/5

)

H2

(4 1/3

3 5/3

)=

(5 19/15

0 −17/15

)H2

(−10/3

1/3

)=

(−37/15

−34/15

)Por lo que nuestro sistema ha quedado reducido a 3 −5 −1/3

0 5 19/15

0 0 −17/15

x

y

z

=

22/3

−37/15

−34/15

cuya solucion es x = 1, y = −1, z = 2.

Ejercicio 3.3 Buscar la solucion de mınimos cuadrados del sistema Ax = b,siendo:

A =

3 −1

4 2

0 1

y b =

0

2

1

a) A traves de sus ecuaciones normales.

b) Por el metodo de Householder.

Solucion:

a) Las ecuaciones normales, dadas por A∗Ax = A∗b son(3 4 0

−1 2 1

) 3 −1

4 2

0 1

( x

y

)=

(3 4 0

−1 2 1

) 0

2

1

Es decir: (

25 5

5 6

)(x

y

)=

(8

5

)sistema que es equivalente a(

25 5

0 5

)(x

y

)=

(8

17/5

)y cuya solucion (la solucion en mınimos cuadrados buscada) es

x =23

125, y =

17

25.

Page 141: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Ejercicios resueltos 141

b)

x1 =

3

4

0

=⇒ y1 =

‖x1‖0

0

=

5

0

0

=⇒ v1 = x1−y1 =

−2

4

0

H1 = I3 − 2v∗1v1

2v1v∗1 = I3 −

2

20

−2

4

0

( −2 4 0)

=

=

3/5 4/5 04/5 −3/5 0

0 0 1

Aplicando la transformacion al sistema, se obtiene 5 1

0 −2

0 1

( x

y

)=

8/5

−6/5

1

Para que x(1)2 =

(−2

1

)se transforme en y

(1)2 =

(‖x(1)

2 ‖0

)=

( √5

0

)construimos la transformacion H

(2)2 de Householder asociada al vector

v2 = x(1)2 − y

(1)2 =

(−2−

√5

1

)

H(2)2 =

(−2

√5/5

√5/5√

5/5 2√

5/5

)=⇒ H2 =

1 0 0

0 −2√

5/5√

5/5

0√

5/5 2√

5/5

que aplicada al sistema anterior nos da 5 1

0√

5

0 0

( x

y

)=

8/517/5

√5

4/5√

5

porlo que la pseudosolucion del sistema es x =

23

125, y =

17

25y el error

viene dado por

∣∣∣∣ 4

5√

5

∣∣∣∣ ' 0.3578.

Page 142: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

142 Sistemas inconsistentes y sistemas indeterminados

3.5 Ejercicios propuestos

Ejercicio 3.4 Se considera el sistema de ecuaciones Ax = b con

A =

1 2

1 0

1 1

1 1

y b =

3

2

0

1

.

Se pide:

a) Calcular la pseudosolucion, a traves de las ecuaciones normales, utili-zando el metodo de Cholesky.

Sol : x = 1, y = 1/2.

b) Sea v = (−1, 1, 1, 1)T . Demostrar que la transformacion de Householderasociada al vector v transforma la primera columna de la matriz A en elvector (2, 0, 0, 0)T dejando invariante la segunda columna de A ası comoal vector b.

c) Calcular la pseudosolucion del sistema utilizando transformaciones deHouseholder, ası como la norma del error.

Sol : x = 1, y = 1/2, E = 3√

2/2.

d) Si la matriz A del sistema fuese cuadrada y su numero de condicion fuesemayor que 1, ¿que ventajas e inconvenientes tendrıa el resolver el sistemamultiplicando por la traspuesta de A y el resolverlo por transformacionesde Householder?

Sol : Si κ(A) > 1, κ(AT A) >> 1 mientras que Householder no altera elcondicionamiento.

Ejercicio 3.5 Hallar la recta de regresion de los puntos:

(1.1, 5), (1, 5.1), (2, 7.3), (1.8, 6.9), (1.5, 6.1), (3, 8.8), (3.1, 9) y (2.9, 9.1)

Sol : y = mx + n = 1.959803x + 3.1449029.

Ejercicio 3.6 Hallar la parabola de regresion de los puntos:

(1, 0), (0, 0), (−1, 0), (1, 2) y (2, 3)

Sol : y = ax2 + bx + c =1

2x2 +

1

2x.

Page 143: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Ejercicios propuestos 143

Ejercicio 3.7 Dado el sistema superdeterminado:1 1 0

1 0 1

1 1 1

1 2 1

x

y

z

=

1

2

0

−1

calcular, mediante transformaciones de Householder, la solucion en mınimoscuadrados (pseudosolucion) ası como la norma del error.

Sol : x = 5/2, y = −3/2, z = −2/3, ‖E‖ =√

6/6.

Ejercicio 3.8 Resolver el sistema 2 1

2 0

−1 2

( x

y

)=

1

1

−5

y obtener la norma del error:

a) Mediante sus ecuaciones normales.

b) Mediante transformaciones de Householder.

c) Hallando la inversa generalizada de la matriz del sistema.

Sol : x = 1, y = −9/5, ‖E‖ = 3√

5/5, A+ =

(2/9 2/9 −1/9

1/5 0 2/5

)

Ejercicio 3.9 Se considera el sistema superdeterminado Ax = b con

A =

1 7 15

1 4 8

1 0 1

1 3 6

y b =

7

7

−5

−9

a) Resolverlo mediante transformaciones de Householder, dando la norma

del vector error.

Sol : x1 = −8, x2 = −2, x3 = −2, ‖E‖ = 10.

Page 144: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

144 Sistemas inconsistentes y sistemas indeterminados

b) Hallar la inversa generalizada A+ de la matriz A.

Sol : A+ =1

100

−49 43 49 57

−86 102 −114 98

50 −50 50 −50

.

c) Utilizar la inversa generalizada para resolver el sistema y hallar la normadel vector error.

Ejercicio 3.10 Resolver el sistema superdeterminado−3 1 1

1 −3 1

1 1 −3

1 1 1

x

y

z

=

8

4

0

4

calculando la inversa generalizada de la matriz A.

Sol : x = −1, y = 0, z = 1, ‖E‖ = 8, A+ =

−1/4 0 0 1/4

0 −1/4 0 1/4

0 0 −1/4 −1/4

Ejercicio 3.11 Dado sistema superdeterminado Ax = b con

A =

1 5 5

1 2 3

1 1 3

1 2 1

y b =

7

16

−3

10

a) Resolverlo mediante transformaciones de Householder, dando la norma

del vector error.

Sol : x = 9, y = 3, z = −3, ‖E‖ = 12.

b) Teniendo en cuenta el rango de la matriz A, hallar su inversa generali-zada.

Sol : A+ =1

36

−20 10 12 34

8 −4 −12 8

3 3 9 −15

.

c) Utilizar la inversa generalizada obtenida en el apartado anterior paracalcular la pseudosolucion del sistema y hallar la norma del vector error.

Page 145: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Ejercicios propuestos 145

Ejercicio 3.12 Consideremos el sistema de ecuaciones Ax = b, con

A =

2 −2

1 −1

−2 2

, x =

(x1

x2

)y b =

6

3

3

,

y un vector unitario u. Se pide:

a) Demostrar que si H = I−2uuT es la matriz de Householder, asociada alvector u, entonces: H es ortogonal, H2 = I y ‖Ha‖2 = ‖a‖2 cualquieraque sea el vector a.

b) Obtener la matriz de Householder que transforma el vector (2, 1,−2)T

en otro de la forma (α, 0, 0)T , con α > 0.

Sol : H =

2 1 −2

1 2 2

−2 2 −1

.

c) Aplicando el metodo de Householder, probar que el sistema Ax = bposee infinitas soluciones en cuadrados mınimos y que el error cometido,al considerar cualquiera de ellas, es el mismo.

Sol : x = (1 + λ, λ)T ∀λ ∈ R, ‖E‖ = 3.

d) Obtener la pseudosolucion del sistema Ax = b.

Sol : (1/2 , −1/2)T .

Ejercicio 3.13 Sea el sistema Ax = b, donde

A =

0 3

−3 5

4 0

, x =

(x

y

)y b =

−10

6

−8

.

a) Probar que la matriz AT A es definida positiva, obteniendo la factori-zacion de Cholesky.

Sol : AT A =

(25 −15

−15 34

)=

(5 0

−3 5

)(5 −3

0 5

).

b) Plantear la iteracion Xn+1 = L1 · Xn + c que se obtiene de aplicar elmetodo de Gauss-Seidel a las ecuaciones normales del sistema Ax = b.

Page 146: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

146 Sistemas inconsistentes y sistemas indeterminados

¿Sera convergente el proceso iterativo a la pseudosolucion?

Sol : xn+1 =

(0 3/5

0 9/34

)(xn

yn

)+

(−2

−15/17

). Convergente por ser un

sistema de diagonal dominante.

c) Hallar la matriz Hu = I − βuuT de la reflexion que transforma el vectora = (0,−3, 4)T en el vector r = (−5, 0, 0).

Sol : Hu =1

25

0 15 −20

15 16 12

−20 12 9

.

d) Obtener la solucion en mınimos cuadrados del sistema Ax = b, utilizandoel metodo de Householder, y determinar la norma del error.

Sol : x = −68/25, y = −6/5, ‖E‖ = 8.

e) Sin haber resuelto el apartado anterior, ¿podrıan predecirse HuA y Hubde las relaciones geometricas entre L =< u >, L⊥ y los vectores columnasimplicados?

Sol : Sı. Si A = (a1 a2), Hua1 = (−5, 0, 0)T , Hua2 = a2, Hub = −b.

Ejercicio 3.14 Se considera el sistema superdeterminado Ax = b con

A =

3 2

4 5

12 0

y b =

3

1

13

a) Calcular la pseudosolucion (solucion de mınimos cuadrados) ası como la

norma del error utilizando transformaciones de Householder.

Sol : x = 71/65, y = −3/5, ‖E‖ = 1.

b) Sea T =

1 0 0

0 1 0

0 0 1/12

la matriz asociada a la transformacion elemen-

tal que divide por 12 la tercera de las ecuaciones del sistema:

TAx = Tb ⇐⇒

3 2

4 5

1 0

( x

y

)=

3

113/12

Page 147: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Ejercicios propuestos 147

Calcular su pseudosolucion haciendo uso de las ecuaciones normales. De-terminar la norma del error.

Sol : x = 113/72, y = −37/36, ‖E‖ = 5√

78/72.

c) ¿A que se debe que no coincidan las pseudosoluciones obtenidas en losdos apartados anteriores? ¿Que habrıa ocurrido si la matriz T hubiesesido unitaria?

Sol : T no es unitaria. Si T hubiese sido unitaria se hubiesen obtenidolas mismas pseudosoluciones.

Ejercicio 3.15 Sea el sistema Ax = b, donde

A =

3 −2

0 3

4 4

, x =

(x

y

)y b =

2

0

1

.

a) Probar que la matriz B = AT A es definida positiva, obteniendo la fac-torizacion de Cholesky B = GT G.

Sol : B =

(25 10

10 29

), G =

(5 2

0 5

).

b) Hacer uso de la factorizacion obtenida en el apartado anterior para hallarla pseudosolucion mediante las ecuaciones normales del sistema. Calcularel numero de condicion, κ∞(B), de la matriz B para la norma ‖ ‖∞.¿Hasta que punto se podrıa considerar fiable la pseudosolucion obtenidacon aritmetica de ordenador?

Sol : x = 58/125, y = −4/25, κ∞(B) = 1521/625 ' 2.4336. Es fiable.

c) Hallar la matriz de la reflexion (matriz de Householder) Hu que trans-forma el vector a = (3, 0, 4)T en el vector r = (−5, 0, 0)T . Una vez de-terminado el vector u, justificar que se pueden conocer HuA y Hub sinnecesidad de efectuar los productos.

Sol : Hu =

−3/5 0 −4/5

0 1 0

−4/5 0 3/5

. Si A = (a1 a2), Hua2 = a2 H2b = −b.

d) Obtener la solucion en mınimos cuadrados del sistema Ax = b, utilizandoel metodo de Householder y determinar la norma del error. Operandocon el ordenador, ¿puede obtenerse una pseudosolucion distinta de la

Page 148: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

148 Sistemas inconsistentes y sistemas indeterminados

obtenida en el apartado b? Si ası ocurriera, ¿puede ser mayor el error?

Sol : x = 58/125, y = −4/25, ‖E‖ = 3/5. Es posible obtener en elordenador soluciones distintas. Nunca, ya que las transformaciones deHouseholder son unitarias.

Ejercicio 3.16 Sea el sistema Ax = b, donde

A =

1 −1 2

0 3 −3

0 −4 4

, x =

x

y

z

y b =

0

1

2

.

a) Hallar ‖A‖∞. ¿Que se puede decir sobre el numero de condicion de lamatriz A para la norma infinito? ¿Que estimacion darıa MATLAB parael numero de condicion espectral obtenido con el comando cond(A)?

Sol : cond(A) = ∞.

b) Utilizar la descomposicion LU de la matriz AT A para resolver el sistemaAT Ax = AT b. ¿Que propiedad caracteriza a las soluciones en relacion alsistema Ax = b? Interpreta geometricamente el resultado.

Sol : x = t− 1/5, y = 3t− 1/5, z = t.

c) Encontrar una matriz ortogonal Q que transforme el vector a=(0, 3,−4)T

en el vector r = (0, 5, 0)T . Obtener la norma del error para las solucionesen mınimos cuadrados del sistema QAx = Qb.

Sol : Q =

1 0 0

0 3/5 −4/5

0 −4/5 −3/5

. ‖E‖ = 2.

d) ¿Que relacion hay entre las soluciones obtenidas en los apartados ante-riores?

Si se obtienen las soluciones en mınimos cuadrados del sistema Ax = b,escalonando previamente la matriz A, ¿se debe obtener mismo resultadoque en alguno de los apartados anteriores?

Sol : Son las mismas. No, el escalonado no se hace mediante transforma-ciones unitarias.

e) Probar que la matriz P =

23

325

− 425

13

325

− 425

13

0 0

es la pseudoinversa de A,

Page 149: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Ejercicios propuestos 149

verificando las propiedades de Penrose. (Hacer la comprobacion solo condos de ellas).

De entre todas las soluciones en mınimos cuadrados del sistema Ax = b,hallar la de menor norma euclıdea.

Solucion: x = −1/5, y = −1/5, z = 0.

Ejercicio 3.17

a) En lo que sigue, Hv denota la transformacion de Householder asociada alvector v. Sean x, y, v, z vectores no nulos, con Hvx = y y z ⊥ v. Probarque Hvv = −v y Hvz = z. Determinar razonadamente todos los vectoresw tales que Hwx = y.

b) Se considera el sistema de ecuaciones dado por −12

1 0

1 2 1

1 0 −1

x

y

z

=

2

−1

−1

b.1) Estudiar el condicionamiento del sistema, utilizando la norma 1.

Sol : κ1(A) = 6.

b.2) Resolver el sistema por medio de transformaciones de Householder.

Sol : x = −2, y = 1, z = −1.

b.3) Desde un punto de vista numerico, ¿serıa razonable resolver el sis-tema escalonando por Gauss? Razonar la respuesta.

Sol : No.

c) Demostrar que el vector c = (−4

3,1

2,−4a

3− 1)T y la matriz

L1 =

0 −23

0

0 0 −12

0 −2a3

0

son los propios del metodo de Gauss-Seidel asociado al sistema

32

1 0

0 2 1

a 0 −1

x

y

z

=

−2

1

1

Page 150: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

150 Sistemas inconsistentes y sistemas indeterminados

d) Estudiar, en funcion del parametro a, el caracter diagonal dominantepor filas de la matriz de coeficientes del sistema dado, ası como el radioespectral de L1. ¿Para que valores de a es convergente el metodo ante-rior?

Sol : Diagonal dominante si |a| < 1, ρ(L1) =√

a/3. Converge si |a| < 3.

e) Para a = 0 el metodo resulta convergente. Utilizando aritmetica exacta,y tomando como vector inicial x0 = (0, 0, 0)T , realizar dos iteraciones,acotando el error cometido. Razonar que ocurre cuando se itera portercera vez. ¿Hubiera ocurrido otro tanto al trabajar con aritmetica deordenador?

Sol : x1 =

−4/31/2

−1

y x2 =

−5/3

1

−1

, ‖E‖ = 1/2. x3 es la solucion

exacta pero con aritmetica de ordenador es solo una buena aproximacion.

Ejercicio 3.18 Sea el sistema Ax = b, donde

A =

1 1

α 0

−2 2

, x =

(x

y

)y b =

2

β

γ

con α > 0 y β, γ ∈ R

a) Hallar α sabiendo que que existe una matriz de Householder, Hv, quetransforma la primera columna de la matriz A en el vector r = (3, 0, 0)T .¿Quien es Hv?

Sol : α = 2, Hv =

1/3 2/3 −2/32/3 1/3 2/3

−2/3 2/3 1/3

.

b) Determinar el conjunto de vectores b para los que se verifica Hvb = b,siendo Hv la matriz del apartado anterior. Encontrar, entre ellos, el quetiene menor norma euclıdea.

Sol : b = (2, β, β − 2)T con β ∈ R. (2, 1,−1)T .

c) Hallar la pseudosolucion del sistema Ax = bm, para α = 2 y bm =(2, 1,−1)T , utilizando transformaciones ortogonales para determinar elerror.

Sol : x = 5/6, y = 1/2, ‖E‖ = 1.

Page 151: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Ejercicios propuestos 151

d) Probar que si una matriz real B tiene sus columnas linealmente inde-pendientes, entonces BT B es definida positiva.

e) Sea el sistema AT Ax = AT bm, con α y bm como en el apartado (c).

e.1) ¿Serıa posible utilizar una descomposicion AT A = GGT , con Gtriangular inferior, para resolver el sistema?

Sol : Sı, AT A admite factorizacion de Cholesky.

e.2) Utilizando la norma ‖ ‖∞ para medir el condicionamiento, ¿es unsistema mal condicionado para utilizar aritmetica de ordenador ensu resolucion?

Sol : No.

e.3) Sea (s0, s1, s2, . . .) la sucesion que se obtiene al aplicar el metodode Gauss-Seidel al sistema, con s0 = (0, 0)T . Probar que, operandoen aritmetica exacta, la sucesion (sn) es convergente y obtener sulımite s.

Sol : AT A simetrica y definida positiva =⇒ Gauss-Seidel converge.Al tratarse de las ecuaciones normales, lo hace a la pseudosolucion.

Ejercicio 3.19 Se considera el sistema Ax = b con

A =

0 5

3 0

4 0

, x =

(x

y

)y b =

5

2

11

a) ¿Existe alguna transformacion de Householder que permute las columnas

de la matriz A? Justificar la respuesta.

Sol : Sı, ambas tienen igual norma.

b) Calcular la pseudosolucion del sistema mediante transformaciones deHouseholder dando la norma del vector error.

Sol : x = 2, y = 1, ‖E‖ = 5.

c) Calcular la inversa generalizada A+ de la matriz A a traves de su des-composicion en valores singulares y hacer uso de ella para encontrar lapseudosolucion del sistema Ax = b dando la norma del vector error.

Sol : A+ =

(0 3/25 4/25

1/5 0 0

)

Page 152: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

152 Sistemas inconsistentes y sistemas indeterminados

d) ¿Hubiesemos podido, en este caso, calcular la inversa generalizada sinnecesidad de realizar su descomposicion en valores singulares?

Sol : Sı ya que rg A = 2.

Ejercicio 3.20 Se considera el sistema Ax = b con

A =

1 2

4 8

−1 −2

, x =

(x

y

)y b =

1

5

3

Determinar la pseudosolucion del sistema dando la norma del error:

a) Mediante transformaciones de Householder.

Sol : x = 1/5, y = 2/5, ‖E‖ =√

17.

b) A traves de la inversa generalizada de la matriz A.

Sol : A+ =

(1/90 2/45 −1/90

1/45 4/45 −1/45

).

Ejercicio 3.21 Hallar la pseudosolucion del sistema Ax = b en el que

A =

3 −4

4 3

0 12

y b =

65

−65

0

ası como la norma del error a traves de la pseudoinversa de la matriz A calcu-lada mediante la descomposicion en valores singulares.

Sol : A+ =

3/25 4/25 0

−4/169 3/169 12/169

, x = −13/5, y = −35/13, ‖E‖ = 84.

Ejercicio 3.22 Se considera el sistema superdeterminado Ax = b con

A =

2 1

2 0

1 −2

0 2

x =

(x

y

)y b =

3

6

0

3

Page 153: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Ejercicios propuestos 153

a) Encontrar una transformacion de Householder que transforme la primeracolumna de la matriz A en el vector r = (3, 0, 0, 0)T .

Sol : H =

2/3 2/3 1/3 02/3 −1/3 −2/3 01/3 −2/3 2/3 0

0 0 0 1

.

b) Probar que el producto de dos matrices de Householder es una matrizunitaria.

Hallar una matriz ortogonal Q tal que A = QR siendo R una matriztriangular superior de las mismas dimensiones que A.

Sol : Q =

2/3 1/3 0 2/32/3 0 −1/3 −2/31/3 −2/3 2/3 0

0 2 2 −1/3

.

c) Probar que si Q es ortogonal, los sistemas Ax = b y QT Ax = QT b tienenlas mismas soluciones en mınimos cuadrados.

Hallar el error cometido al obtener la pseudosolucion del sistema Ax = b,utilizando transformaciones ortogonales.

Sol : x = 2, y = 1, ‖E‖ = 3.

d) Teniendo en cuenta el rango de la matriz A, calcular el vector s = A+bdonde A+ representa la pseudoinversa de la matriz A.

Sol : A+ =

(2/9 2/9 1/9 01/9 0 −2/9 2/9

).

e) Sea xn+1 = L1xn+c la sucesion resultante de aplicar el metodo de Gauss-Seidel a la resolucion de las ecuaciones normales del sistema Ax = b.¿Cuantas iteraciones son necesarias para la convergencia del metodo?Determina la pseudosolucion ası como la norma del error.

Sol : Solo una iteracion.

Ejercicio 3.23 El equipo Astronomıa para aficionados, adquirido por el pro-fesor Dana este verano, permitıa determinar el plano Π ≡ αx + βy + γz = 1donde se encuentra la trayectoria de Marte alrededor del Sol. En las instruc-ciones indicaba introducir en el “calculador magico” una serie de coordenadas

Page 154: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

154 Sistemas inconsistentes y sistemas indeterminados

locales (xi, yi, zi), obtenidas con el “telescopio marciano”, y automaticamenteproporcionarıa los coeficientes α, β, γ. Entre otras cosas, sugerıa introducirentre 5 y 10 coordenadas para que el ajuste obtenido en el sentido delos mınimos cuadrados promediara “cientıficamente” los errores de obser-vacion...

a) Plantear el sistema superdeterminado, Aα= b, con α=(α, β, γ)T , paradeterminar el plano Π, cuando las coordenadas locales son

(2, 1, 0), (−1, 2, 1), (0, 1, 2), (−1, 0, 1), (0, 1, 0).

¿Puede ser nulo el error cometido para la pseudosolucion del sistema?

Sol : El error no puede ser nulo.

b) Poniendo A = [a1 a2 a3], donde ai indica la correspondiente columna deA, razonar si es posible encontrar una transformacion de Householderque transforme a1 en a2. Hallar una matriz unitaria, Q, de modo queQa1 = a3.

Sol : Q =

0 0 1 0 00 −1 0 0 01 0 0 0 00 0 0 −1 00 0 0 0 1

.

c) Obtener las ecuaciones normales, Bα= c, del sistema inicial Aα= b.¿Esta la matriz B mal condicionada para la norma || ||∞?

Sol : κ∞(B) = 15/2. Bien condicionada.

d) Probar que los metodos iterados de Jacobi y Gauss-Seidel aplicados alsistema Bα= c son convergentes. ¿Cual de ellos converge mas rapido?

Sol : Gauss-Seidel mas rapido que Jacobi.

e) Partiendo de α0= (0, 0, 0)T , obtener la aproximacion α3, al aplicar 3pasos del metodo de Gauss-Seidel al sistema Bα= c, operando con doscifras decimales. ¿Cual es el error obtenido al tomar α3 como la solucionen mınimos cuadrados de Aα= b?

Sol : α3 = (0.09, 0.55, 0.33)T con ‖E3‖ ' 1.01.

Ejercicio 3.24 Dada la matriz A =

1 5 5

1 2 1

1 2 3

, se pide:

Page 155: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Ejercicios propuestos 155

a) Estudiar si admite factorizaciones LU y/o de Cholesky.

Sol : Solo LU .

b) Utilizar dichas factorizaciones (en caso de existir) para resolver el sistema

Ax = b con x =

x

y

z

y b =

3

2

1

.

Sol : x = 1/2, y = 1, z = −1/2.

c) Resolver, mediante transformaciones de Householder el sistema superde-terminado resultante de anadir a nuestro sistema la ecuacion x+y+3z =α. Hallar la norma del error.

Sol : x = (2α + 3)/6, y = (3− α)/3, z = (α− 2)/4, ‖E‖ = |α|/2.

d) ¿Se puede calcular el valor de α que minimiza la norma del error sinresolver el sistema anterior?

Sol : Sı, α = 0.

Ejercicio 3.25 En R4 se busca un hiperplano de la forma αx + βy + γz = tque pase por los puntos

x

y

z

t

1

0

0

0

1

2

4

1

−1

0

1

2

a) Plantear el sistema de ecuaciones y resolverlo usando la factorizacion LUde la matriz del sistema.

Sol : El hiperplano buscado es 7y − 4z + 2t = 0.

b) Comenzando por el vector x0 = (2, 2, 2)T , resolverlo iterativamente porlos metodos de Jacobi y Gauss-Seidel. ¿Que metodo es mas rapido?Razona la respuesta.

Sol : Jacobi 3, Gauss-Seidel 1 aunque ambos son igualmente convergentes.

c) Al obligar que, ademas, pase por el punto (−1, 2, 0,−1) se obtiene unaecuacion mas que hace incompatible al sistema.

Usar transformaciones de Householder para encontrar la pseudosoluciondel sistema incompatible dando la norma del error.

Page 156: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

156 Sistemas inconsistentes y sistemas indeterminados

Sol : x = −2/3, y = −8/9, z = 8/9, ‖E‖ =√

2/3.

Ejercicio 3.26 Se sabe que un movil en R3 sigue una velocidad instantaneadada por una expresion de la forma V (x, y, z) = ax + by + cz con a, b, c ∈ R.Con un velocımetro se han tomado los datos siguientes:

V (1, 2,−53) = −3

V (1, 2,−4) = 2

V (2,−1, 2) = −2

V (1, 0,−2) = −1

V (3, 2,−1) = −2

a) Demostrar que el velocımetro esta desajustado. Es decir, que los datosobtenidos son incompatibles.

b) Una vez planteado el sistema incompatible y usando las ecuaciones nor-males de dicho sistema, usar el metodo de Cholesky para calcular elgrado de desajuste del velocımetro. Es decir, el error al suponer la pseu-dosolucion como los verdaderos valores de a, b y c.

Sol : ‖E‖ = 3.0651.

c) Calcular el error usando transformaciones de Householder en el sistemaincompatible.

Sol : ‖E‖ = 3.0651.

Page 157: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

4. Autovalores y autovectores

4.1 Conceptos basicos

Definicion 4.1 [Variedad lineal invariante]

Una variedad lineal V de Kn se dice que es invariante para una aplicacion Asi cualquier vector x ∈ V se transforma, mediante A, en otro vector de V

Ax ∈ V ∀x ∈ V

Las variedades invariantes mas simples son aquellas que tienen dimension 1,por lo que una base esta constituida por un unico vector v 6= 0.

Podemos observar que, en ese caso, cualquier vector x ∈ V puede expresarsede la forma x = αv con α 6= 0 si x 6= 0 y que, por tratarse de una variedadinvariante, ha de ser Ax = βv, pero entonces:

Ax = Aαv = αAv = βv =⇒ Av =β

αv = λv

Definicion 4.2 [Autovalores y autovectores de una matriz]

Las variedades invariantes de dimension 1 vienen determinadas por un vectorv 6= 0 tal que Av = λv.

Estos vectores reciben en nombre de autovectores o vectores propios de la ma-triz A y los correspondientes valores de λ reciben el nombre de autovalores ovalores propios de A.

Proposicion 4.1 Si v 6= 0 es un autovector de la matriz A asociado al au-tovalor λ, cualquier vector v proporcional a el, es tambien autovector de Aasociado a λ.

157

Page 158: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

158 Autovalores y autovectores

Demostracion. Por ser v un autovector asociado a λ se tiene que Av = λv.

Si x = αv se verifica que

Ax = Aαv = αAv = αλv = λ(αv) = λx

La proposicion anterior establece que lo que caracteriza a un autovector no essu norma ni su sentido, sino su direccion.

Proposicion 4.2 Autovectores asociados a autovalores diferentes son lineal-mente independientes

Demostracion. Sean u y v dos autovectores de la matriz A asociados a losautovalores λ y µ respectivamente con λ 6= µ.

Si u y v fuesen linealmente dependientes se verificarıa que u = αv con α 6= 0.Entonces:

λu = Au = A(αv) = αAv = αµv = µ(αv) = µu

y por tanto (λ − µ)u = 0, pero dado que u 6= 0 se tiene que λ = µ en contrade la hipotesis de que λ 6= µ, lo que prueba el resultado.

Los autovalores de una matriz son, en general, numeros complejos. Sin em-bargo, las matrices hermıticas (en el caso real, las simetricas) tienen todos susautovalores reales como prueba el siguiente teorema.

Teorema 4.3 Los autovalores de una matriz hermıtica son todos reales y au-tovectores correspondientes a dos autovalores diferentes son ortogonales.

Demostracion. Sea A una matriz hermıtica, es decir, una matriz tal queA∗ = A y sea λ un autovalor de A asociado al autovector x. Se verificaentonces que Ax = λx.

Multiplicando la expresion anterior, por la izquierda por x∗ obtenemos que

x∗Ax = x∗λx = λx∗x (4.1)

Trasponiendo y conjugando la expresion (4.1) obtenemos

(x∗Ax)∗ = (λx∗x)∗ =⇒ x∗A∗x = λx∗x =⇒ x∗Ax = λx∗x (4.2)

Si comparamos las expresiones (4.1) y (4.2) obtenemos que

λx∗x = λx∗x

Page 159: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Conceptos basicos 159

y dado que x es un autovector (un vector no nulo) sabemos que x∗x = ‖x‖2 6= 0,por lo que podemos dividir por x∗x para obtener que λ = λ, es decir, λ ∈ R.

Por otra parte, si x e y son autovectores asociados a dos autovalores λ 6= µ deuna matriz hermıtica A se verifica que

Ax = λx =⇒ (Ax)∗ = (λx)∗ =⇒ x∗A = λx∗

x∗Ay = λx∗y =⇒ x∗µy = λx∗y =⇒ µx∗y = λx∗y =⇒ (λ− µ)x∗y = 0

y dado que λ 6= µ =⇒ λ− µ 6= 0 obtenemos que

x∗y = 0 ⇐⇒ x ⊥ y

Teorema 4.4 Si A una matriz regular y λ un autovalor suyo asociado alautovector v, se verifica que 1/λ es un autovalor de A−1 asociado al mismoautovector v.

Demostracion. Si λ es un autovalor de A asociado a v sabemos que Av = λv.Al tratarse de una matriz invertible (det(A) 6= 0) sus autovalores son todosno nulos, por lo que podemos dividir por λ y multiplicar por A−1 la ultima

igualdad para obtener que A−1v =1

λv es decir, 1/λ es un autovalor de A−1

asociado a v.

Teorema 4.5 Si λ es un autovalor de una matriz A asociado a un autovectorv y α una constante cualquiera se verifica que λ − α es un autovalor de lamatriz A− αI asociado al mismo autovalor v.

Demostracion. Sabemos, por hipotesis, que Av = λv, por lo que Av − αv =λv − αv y, por tanto,

(A− αI)v = (λ− α)v

es decir, λ− α es un autovector de A− αI asociado a v.

Teorema 4.6 Si λ es un autovalor de una matriz A asociado a un autovectorv y α (una constante cualquiera) no es autovalor de A entonces 1/(λ− α) esun autovalor de la matriz (A− αI)−1 asociado al autovector v.

La demostracion se basa en los Teoremas 4.4 y 4.5 y se deja al lector.

Sea A una matriz cuadrada de orden n y supongamos que existen V1, V2, . . . , Vk

subespacios invariantes tales que Kn = V1 ⊕ V2 ⊕ · · · ⊕ Vk.

Page 160: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

160 Autovalores y autovectores

Si {xi1, xi2, . . . , xini} es una base de Vi se tiene que

B = {x11, . . . , x1n1 , x21, . . . , x2n2 , . . . , xk1, . . . , xknk}

constituye una base de Kn. Si P es la matriz del cambio de base de la basecanonica a la base B, se tiene que

P−1AP =

J1 Θ · · · Θ

Θ J2 · · · Θ...

.... . .

...

Θ Θ · · · Jk

donde cada Ji es una caja cuadrada de dimension ri = dim(Vi).

La justificacion es que Axij = (0, . . . , 0, αi1, . . . , αini, 0, . . . , 0)T

B con 1 ≤ i ≤ k,1 ≤ j ≤ ni y, por tanto, puede verse facilmente que

AP = P

J1 Θ · · · Θ

Θ J2 · · · Θ...

.... . .

...

Θ Θ · · · Jk

Definicion 4.3 [Matriz diagonalizable]

Una matriz A se dice que es diagonalizable, si existe una matriz P , llamadamatriz de paso tal que P−1AP = D siendo D = diag(λ1, . . . , λn) la matrizdiagonal cuyos elementos diagonales son los autovalores de la matriz A.

Es obvio que si A posee un autovector es porque existe un vector v 6= 0 tal queAv = λv, o lo que es lo mismo, tal que (λI − A)v = 0. Por tanto, el sistema(λI−A)x = 0 es compatible y ademas indeterminado (infinitas soluciones), yaque si v 6= 0 es solucion del sistema, cualquier vector proporcional a el tambienlo es.

Se verifica entonces que rg(λI − A) < n (donde n representa el orden de lamatriz) y, por tanto det(λI − A) = 0.

Definicion 4.4 [Polinomio caracterıstico]

Al polinomio p(λ) = det(λI − A) se le denomina polinomio caracterıstico dela matriz A y a la ecuacion p(λ) = 0 ecuacion caracterıstica.

Page 161: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Conceptos basicos 161

Notese que si λ es una raız de la ecuacion caracterıstica de la matriz A, existeun autovector v asociado al autovalor λ. Por tanto, desde el punto de vistateorico, el problema del calculo de los autovectores de una matriz se reducea la resolucion de los sistemas (λiI − A)x = 0 obtenidos para las diferentesraıces λi de la ecuacion caracterıstica.

Es decir, el calculo de los autovectores de una matriz, una vez calculados losautovalores, se reduce, teoricamente, a la resolucion de un sistema de ecuacio-nes por cada autovalor.

Trataremos, por tanto, en primer lugar, de calcular sus autovalores a partirde la propiedad de ser las raıces del polinomio caracterıstico de la matriz.Es decir, dada una matriz cuadrada A de orden n pretendemos calcular supolinomio caracterıstico P (λ) = det(λI − A) para, posteriormente, hallar susraıces mediante alguno de los metodos de resolucion de ecuaciones estudiados.

Al ser P (λ) = det(λI−A) su obtencion conlleva el calculo de un determinantede orden n que no es numerico, pues contiene al parametro λ, lo cual no esfacil de realizar.

¿Como evitar el calculo del determinante con el parametro λ?

Metodo interpolatorio para la obtencion del polinomio carac-terıstico

Este metodo consiste en dar n valores a λ, para calcular n determinantes y,posteriormente, resolver el sistema de n ecuaciones con n incognitas resultante.

Sea P (λ) = det(λI − A) = λn + a1λn−1 + · · ·+ an−2λ

2 + an−1λ + an.

Dando a λ n valores λ1, λ2, . . . , λn se tiene que:

λ = λ1 =⇒ λn1 + a1λ

n−11 + · · ·+ an−2λ

21 + an−1λ1 + an = det(λ1I − A)

λ = λ2 =⇒ λn2 + a1λ

n−12 + · · ·+ an−2λ

22 + an−1λ2 + an = det(λ2I − A)

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

λ = λn =⇒ λnn + a1λ

n−1n + · · ·+ an−2λ

2n + an−1λn + an = det(λnI − A)

donde det(λiI − A) 1 ≤ i ≤ n son determinantes numericos.

La solucion del sistema resultante nos proporciona los coeficientes del polino-mio caracterıstico.

Page 162: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

162 Autovalores y autovectores

Ejemplo 4.1 Dada la matriz A =

1 3 2 5

4 2 −1 0

0 1 0 1

2 −2 −1 1

, su polinomio ca-

racterıstico es de grado cuatro P (λ) = λ4 + a1λ3 + a2λ

2 + a3λ + a4, por lo quevamos a dar a λ cuatro valores:

λ = 0 =⇒ a4 = det (−A) = 41

λ = 1 =⇒ 1 + a1 + a2 + a3 + a4 = det(I − A) = 74

λ = −1 =⇒ 1− a1 + a2 − a3 + a4 = det(−I − A) = −20

λ = 2 =⇒ 16 + 8a1 + 4a2 + 2a3 + a4 = det(2I − A) = 67

dado que a4 = 41 el sistema se reduce a

a1 + a2 + a3 = 32

−a1 + a2 − a3 = −62

8a1 + 4a2 + 2a3 = 10

=⇒ a1 = −4, a2 = −15 y a3 = 51

por lo que su polinomio caracterıstico es

P (λ) = λ4 − 4λ3 − 15λ2 + 51λ + 41 �

4.2 Matrices normales

Un ejemplo de matriz, de orden n, no diagonalizable lo constituyen las matricesde la forma

A =

0

0 In−1

0

0 0 0 0

cuyo polinomio caracterıstico es PA(λ) = λn y por tanto, con sus n autovaloresnulos.

Si introducimos en la matriz una perturbacion y en vez de la matriz A tomamosla matriz

B = A + E =

0

0 In−1

0

ε 0 0 0

Page 163: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Matrices normales 163

siendo ε > 0 muy pequeno (incluso mas pequeno que la resolucion del orde-nador) se obtiene como polinomio caracterıstico PB(λ) = λn + (−1)nε queposee n raıces distintas (las raıces n-esimas de (−1)n−1ε), por lo resultan muysensibles a cualquier perturbacion que se produzca en la matriz, por pequenaque esta sea.

Nos preguntamos entonces,

¿Como afecta una pequena perturbacion a los autovalores de una matrizdiagonalizable?

Teorema 4.7 Sean A una matriz diagonalizable, B = A+E una perturbacionde dicha matriz, λi los autovalores de la matriz A y µ uno cualquiera de losautovalores de la matriz B con λi 6= µ.

En las condiciones anteriores se tiene que

mıni|µ− λi| ≤ ‖P‖

∥∥P−1∥∥ ‖E‖ = ‖E‖κ(P )

donde P representa a la matriz de paso que diagonaliza a la matriz A.

Demostracion. Por ser A diagonalizable existe P tal que P−1AP = D.

Sea x un autovector de B asociado a µ. Entonces Bx = µx o lo que es lomismo:

(A + E)x = µx =⇒ (µI − A)x = Ex =⇒ (µI − PDP−1)x = Ex =⇒

P (µI −D)P−1x = Ex =⇒ (µI −D)(P−1x) = P−1Ex = P−1EPP−1x

Supuesto que µ 6= λi cualquiera que sea i = 1, 2, . . . , n, la matriz µI − D esregular, por lo que

P−1x = (µI −D)−1(P−1EP )P−1x

y para cualquier norma multiplicativa se tiene∥∥P−1x∥∥ ≤ ∥∥(µI −D)−1

∥∥∥∥P−1EP∥∥∥∥P−1x

∥∥es decir

1 ≤∥∥(µI −D)−1

∥∥∥∥P−1EP∥∥

Dado que (µI −D)−1 = diag

(1

µ− λ1

, . . . ,1

µ− λn

)tenemos que

1 ≤ maxi

{∣∣∣∣ 1

µ− λi

∣∣∣∣} ∥∥P−1∥∥ ‖E‖ ‖P‖

Page 164: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

164 Autovalores y autovectores

por lo quemın

i|µ− λi| ≤

∥∥P−1∥∥ ‖P‖ ‖E‖ = ‖E‖κ(P )

Observese que la perturbacion cometida en los autovalores depende del numerode condicion de la matriz de paso P y dado que esta no es unica.

Trataremos de elegir, entre todas las posibles matrices de paso, aquella cuyonumero de condicion sea mınimo.

Corolario 4.8 Si A es unitariamente diagonalizable (diagonalizable medianteuna matriz de paso unitaria), la perturbacion producida en los autovalores esmenor o igual que la perturbacion producida en la matriz.

mıni|µ− λi| ≤ ‖E‖

Por tanto, las mejores matrices para el calculo efectivo de sus autovalores yautovectores son las diagonalizables unitariamente y estas reciben el nombrede matrices normales.

Es evidente que no podemos estudiar si una matriz es normal calculando susautovalores y autovectores para comprobar que se puede diagonalizar por se-mejanza mediante una matriz de paso unitaria (matriz constituida por unabase ortonormal de autovectores).

Es necesario, por tanto, encontrar alguna forma de detectar si una matriz es,o no es, normal sin necesidad de calcular sus autovalores y autovectores paraver si es posible diagonalizarla mediante una matriz de paso unitaria.

Caracterizacion de las matrices normales

Proposicion 4.9 Sea T una matriz triangular. Si T ∗T = TT ∗ entonces T esdiagonal.

Demostracion. Probaremos que se trata de una matriz diagonal por in-duccion en el orden de la matriz.

Para n = 1 es obvio.

Para n = 2 es T =

(a b

0 c

)=⇒ T ∗ =

(a 0

b c

).

T ∗T =

(a 0

b c

)(a b

0 c

)=

(|a|2 ab

ab |b|2 + |c|2

)

Page 165: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Matrices normales 165

TT ∗ =

(a b

0 c

)(a 0

b c

)=

(|a|2 + |b|2 bc

bc |c|2

)Dado que T ∗T = TT ∗, igualando ambas matrices se obtiene que |b|2 = 0 esdecir b = 0 y, por tanto, T es diagonal.

Supongamos ahora que el teorema es cierto para cualquier matriz triangularcon T ∗T = TT ∗ de orden n y vamos a probarlo para otra de orden n + 1.

Sean T =

a1 a2 · · · an+1

0... Tn

0

y T ∗ =

a1 0 · · · 0

a2

... T ∗n

an+1

TT ∗ =

n+1∑i=1

|ai|2

TnT∗n

T ∗T =

(|a1|2

T ∗nT

)

De la igualacion de ambas obtenemos que

TT ∗ = T ∗T =⇒ |a2|2 + · · ·+ |an+1|2 = 0 =⇒ a2 = a3 = · · · = an+1 = 0

Como, ademas, es TnT∗n = T ∗

nTn, por hipotesis de induccion sabemos que Tn

es diagonal y, por tanto, T es diagonal.

Teorema 4.10 [Teorema de Schur]

Cualquier matriz cuadrada A es unitariamente semejante a una triangularsuperior T . Es decir, existe una unitaria U tal que

U∗AU = T.

Demostracion. Aplicamos induccion en el orden de la matriz A.

Si n = 1 e obvio. Supuesto cierto para n vamos a probarlo para una matrizde orden n + 1.

Sean A ∈ K(n+1)×(n+1), λ un autovalor de A y x un autovector asociado a λcon ‖x‖ = 1.

Consideremos la matriz P = (x e2 · · · en) en la que sus columnas x, e2, . . . , en

constituyen una base ortonormal de Kn+1

P ∗AP =

(λ αij

Θ An

)

Page 166: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

166 Autovalores y autovectores

Sea Q =

(1 Θ

Θ Un

)en donde Un es la matriz unitaria que, por hipotesis de

induccion, verifica que U∗nAnUn = Triangular superior.

Si consideremos la matriz U = PQ es facil comprobar que U∗AU = Q∗P ∗APQes una triangular superior.

Teorema 4.11 [Caracterizacion de las matrices normales]

Una matriz A es normal si, y solo si, AA∗ = A∗A.

Demostracion. Supongamos que AA∗ = A∗A. Por el Teorema 4.10 sabemosque existe una matriz unitaria U tal que U∗AU = T con T triangular superior.Entonces A = UTU∗, por lo que

AA∗ = (UTU∗)(UTU∗)∗ = UTU∗UT ∗U∗ = UTT ∗U∗

A∗A = (UTU∗)∗(UTU∗) = UT ∗U∗UTU∗ = UT ∗TU∗

}=⇒ TT ∗ = T ∗T

por lo que al ser T una matriz normal y triangular, la Proposicion 4.9 nosasegura que es diagonal y, por tanto, A es diagonalizable unitariamente, esdecir, es normal.

Recıprocamente, si A es unitariamente diagonalizable (normal) existe una ma-triz unitaria U tal que U∗AU = D o lo que es lo mismo, A = UDU∗.

AA∗ = UDU∗(UDU∗)∗ = UDD∗U∗ = U diag(|d1|2 , . . . , |dn|2)U∗

A∗A = (UDU∗)∗UDU∗ = UD∗DU∗ = U diag(|d1|2 , . . . , |dn|2)U∗

}=⇒

AA∗ = A∗A

¿Como podemos prever el comportamiento de los autovalores ante una pertur-bacion cuando la matriz no es normal?

En otras palabras, ¿como estudiar el condicionamiento de una matriz para elcalculo de sus autovalores?

• Desviacion de la normalidad

Por el Teorema 4.10 cualquier matriz cuadrada A es unitariamente se-mejante a una triangular superior T donde

T =

t11 t12 · · · t1n

0 t22 · · · t2n

......

. . ....

0 0 · · · tnn

=

t11 0 · · · 00 t22 · · · 0...

.... . .

...0 0 · · · tnn

+

0 t12 · · · t1n

0 0 · · · t2n

......

. . ....

0 0 · · · 0

Page 167: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Matrices normales 167

Es decir, T = D + M y, obviamente, A es normal si, y solo si, M = Θ.

La norma de la matriz M recibe el nombre de desviacion de la normalidady nos va a medir el condicionamiento del problema.

Ademas, ‖M‖2 no depende de U ni de T sino solo de A ya que

‖M‖22 = ‖T‖2

2 − ‖D‖22 = ‖U∗AU‖2

2 − ‖D‖22 = ‖A‖2

2 −n∑

i=1

|λi|2 =⇒

‖M‖2 =

√√√√‖A‖22 −

n∑i=1

|λi|2

• Matriz conmutatriz

Hemos visto que A es normal si, y solo si,

A∗A = AA∗ ⇐⇒ A∗A− AA∗ = Θ

Se denomina matriz conmutatriz de una matriz cuadrada A a la matriz

C(A) = A∗A− AA∗

Evidentemente, A no es normal si A∗A− AA∗ 6= Θ.

La matriz C(A) = A∗A−AA∗ se le llama matriz conmutatriz y su normaeuclıdea tambien nos permite medir el condicionamiento del problema.

Ambas formas de medir el condicionamiento estan relacionadas como muestrael siguiente resultado:

Teorema 4.12 Dada una matriz A ∈ Kn×n se verifica:

• ‖C(A)‖22

6 ‖A‖22

≤ ‖M‖22 Desigualdad de Eberlein.

• ‖M‖22 ≤

√n3 − 3

12‖C(A)‖2

2 Desigualdad de Heurici.

Teorema 4.13 [Teorema espectral para matrices hermıticas]

Sea A una matriz hermıtica de orden n. Existe una base de Cn constituidapor autovectores de A. Dicho de otra forma, toda matriz hermıtica es diago-nalizable por semejanza (es normal).

Page 168: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

168 Autovalores y autovectores

4.3 Metodos iterados para la obtencion de au-

tovalores y autovectores

Los metodos que veremos a continuacion tratan de encontrar una sucesionconvergente cuyo lımite nos permitira conocer los autovalores y autovectoresde una matriz dada. El primero que estudiaremos consiste en buscar unasucesion de vectores que convergen a la direccion del autovector asociado alautovalor de mayor modulo de la matriz dada.

Vamos a comenzar, por ello, a estudiar como podemos aproximar el autovalorcorrespondiente a un determinado autovector cuando lo que conocemos es unaaproximacion de este.

Cociente de Rayleigh

Si nos limitamos a calcular la sucesion (xn) hasta obtener una aproximacion xadecuada del autovector podemos obtener el autovalor resolviendo el sistemavectorial λ x = Ax. Este sistema resulta, en general, incompatible por noser x exactamente un autovector sino solo una aproximacion, por lo que lasolucion que mejor se ajusta es la pseudosolucion del sistema, que nos darauna aproximacion del autovalor λ.

λ x∗x = x∗Ax =⇒ λ =x∗Ax

x∗x

Definicion 4.5 [Cociente de Rayleigh]

Dada una matriz cuadrada A y un vector x, se denomina cociente de Rayleighdel vector x respecto de la matriz A al cociente x∗Ax

x∗x.

Podemos, por tanto, obtener una aproximacion del autovector por un metodoiterado para mas tarde aproximar el autovalor mediante el cociente de Ray-leigh.

4.3.1 Metodo de la potencia simple y variantes

Metodo de la potencia simple

Sea A ∈ Rn×n una matriz diagonalizable y supongamos que sus autovaloresverifican que:

|λ1| > |λ2| ≥ · · · ≥ |λn|en cuyo caso diremos que λ1 es el autovalor dominante de la matriz.

Page 169: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Metodos iterados para la obtencion de autovalores y autovectores 169

Sea B = {x1, x2, · · · , xn} una base de Rn formada por autovectores asociadosa λ1, λ2, . . . , λn respectivamente. Se verifica entonces que

A2xi = A(Axi) = A(λixi) = λiAxi = λi(λixi) = λ2i xi

por lo que es facil probar, por induccion, que

Akxi = λki xi para cualquier i = 1, 2, . . . , n

Dado un vector z0 ∈ Rn se define, a partir de el, la sucesion (zn) con

zn = Azn−1 = A2zn−2 = · · · = Anz0.

Si las coordenadas del vector z0 respecto de la base B son (α1, α2, . . . , αn) setiene que z0 = α1x1 + α2x2 + · · ·+ αnxn, por lo que

zk = Akz0 = Ak(α1x1 + · · ·+ αnxn) = α1Akx1 + · · ·+ αnA

kxn =

= λk1α1x1 + · · ·+ λk

nαnxn = λk1

[α1x1 +

n∑i=2

(λi

λ1

)k

αixi

]

Dado que |λ1| > |λi| se tiene que limk→∞

(λi

λ1

)k

= 0 ∀i = 2, 3, . . . , n.

Se verifica entonces que limk→∞

zk

λk1

= α1x1 que es un autovector de A asociado al

autovalor λ1.

Si k es suficientemente grande, se tiene

Azk = zk+1 ≈ λk+11 α1x1 = λ1(λ

k1α1x1) = λ1zk

por lo que la sucesion (zn) nos proporciona un metodo para aproximar elautovalor λ1.

Teniendo en cuenta que, para valores de k suficientemente grandes se verificaque

Azk = zk+1 ≈ λ1zk (4.3)

el metodo no convergera a un vector en concreto ya que

zk+1 ≈ λ1zk 6= zk.

Ahora bien, dado que zk+1 y zk tienen la misma direccion, ambos representanal autovector buscado.

Page 170: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

170 Autovalores y autovectores

Geometricamente la matriz A transforma al vector zk (para valores de k su-ficientemente grandes, en otro proporcional a el y dado que se verifica laecuacion (4.3) ese factor de proporcionalidad es precisamente el autovalor bus-cado λ1.

Escalado

Si |λ1| > 1 la sucesion (zn) converge a una direccion determinada (la delautovector), pero las normas de los vectores van creciendo llegando a divergera un vector de coordenadas infinitas. Si, por el contrario, |λ1| < 1, la sucesion(zn) converge al vector nulo. Es decir: en ninguno de los dos casos podremoscalcular ni el autovalor ni el autovector.

Como solo nos interesa la direccion y los vectores de la sucesion (zn) convergena una determinada direccion, podemos dividir o multiplicar en cada paso elvector zk por una constante sin que ello modifique su direccion. Con elloconseguiremos que la sucesion (zn) converja a un autovector asociado a λ1.Este proceso de modificar las normas de los vectores recibe el nombre deescalado.

La cantidad por la que se escala puede ser arbitraria, pero lo mas util es escalarpor la coordenada de mayor modulo.

De esa forma los vectores escalados wk y wk+1 =zk

‖zk‖∞al ser muy proximos

tendran la coordenada de mayor modulo en en la misma posicion y ademasvaldran 1 por lo que se evita el problema de la divergencia a infinito o laconvergencia al vector nulo. Ademas, dado que llamando α al factor de pro-porcionalidad se verifica que

αwk = zk = Awk−1

el factor de proporcionalidad α existente entre los vectores zk y wk es precisa-mente el autovalor λ1 buscado. En otras palabras, escalando los vectores porsu coordenada de mayor modulo, el proceso converge a un autovector cuyacoordenada de mayor modulo (antes de escalar) es el autovalor buscado.

Ejemplo 4.2 Para calcular, por el metodo de la potencia simple, el autovalorde mayor valor absoluto de la matriz

A =

6 2 5

2 2 3

5 3 6

partiendo del vector z0 = (1 1 1)T obtenemos:

Page 171: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Metodos iterados para la obtencion de autovalores y autovectores 171

z1 =

13.00007.0000

14.0000

z2 =

11.57145.8571

12.1429

z3 =

11.68245.8706

12.2118

z4 =

11.70135.8748

12.2254

z5 =

11.70395.8753

12.2273

z6 =

11.70425.8754

12.2275

z7 =

11.70425.8754

12.2275

El vector z7 es una aproximacion del autovector asociado al autovalor domi-nante. Su coordenada de mayor modulo es 12.2275, por lo que λ1 ≈ 12.2275.

No obstante, dado que no hemos obtenido el lımite sino una aproximacion, notodas sus coordenadas tendran el mismo factor de proporcionalidad (variaraen poco, pero variara), por lo que es mas correcto decir: si z7 es un autovectorasociado a λ es porque Az7 = λz7, sistema que, en general es incompatible,por lo que buscamos λ resolviendo el sistema superdeterminado en termino demınimos cuadrados, es decir, mediante el cociente de Rayleigh.

λ1 =zT7 Az7

zT7 z7

= 12.22753579693696. �

Algoritmo de la Potencia Simple

z = ones(length(A),1);

w = zeros(length(A),1);

n = 0;

while norm(z-w)>10^ (-14)

n = n + 1;

w = z;

z = A*w;

for i = 1:length(A)

if abs(z(i)) == max(abs(z))

break

end

end

z= z/z(i);

end

n

autovalor = (z’*A*z)/(z’*z)

Error = norm(A*z-autovalor*z)

Page 172: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

172 Autovalores y autovectores

Ejecutando este algoritmo con MatLab para la matriz del Ejemplo 4.2 obtene-mos la aproximacion 12.22753579693706 del autovalor con un error del ordende 1.986027322597819 · 10−15 en 17 iteraciones.

Una forma de acelerar el proceso es la siguiente: una vez calculado el va-lor de wn (vector zn escalado) aproximar el autovector mediante el sistemahomogeneo (A−λI)wn = 0 donde λ es la aproximacion obtenida para el auto-valor mediante el cociente de Rayleigh aplicado a la matriz A y el vector wn.Esta aproximacion del autovector es la que utilizaremos en el siguiente pasodel metodo de la potencia simple.

Hay que tener cuidado ya que puede darse le caso de que al aproximar elautovalor mediante el cociente de Rayleigh (cuando el vector wn esta aundistante del autovector) nos acerquemos a otro autovalor de la matriz y, alfinal, el proceso nos conduzca a un autovalor diferente del dominante.

Algoritmo de la Potencia Simple Mejorado

z = ones(length(A),1);

w = zeros(length(A),1);

n = 0;

while norm(z-w)>10^ (-14)

n = n + 1;

w = z;

z = A*w;

l=(z’*A*z)/(z’*z);

if rcond(A-l*eye(length(A)))>10^ (-15)

z = (A-l*eye(length(A)))z;end

for i = 1:length(A)

if abs(z(i)) == max(abs(z))

break

end

end

z= z/z(i);

end

n

autovalor = (z’*A*z)/(z’*z)

Error = norm(A*z-autovalor*z)

Page 173: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Metodos iterados para la obtencion de autovalores y autovectores 173

Ejecutando este algoritmo con MatLab para la matriz del Ejemplo 4.2 obtene-mos la aproximacion 12.22753579693706 del autovalor con un error del ordende 2.664535259100376 ·10−15 en tan solo 4 iteraciones, frente a las 17 que erannecesarias con algoritmo anterior.

Este metodo solo nos permite calcular, en caso de existir, el autovalor do-minante de una matriz. Existen sin embargo otras variantes del metodo dela potencia simple que nos permiten calcular cualquiera de sus autovalores apartir de una aproximacion de ellos. Debido a la existencia de dichas varianteses por lo que el metodo estudiado anteriormente es conocido como metodo dela potencia simple para distinguirlo de los que estudiaremos a continuacion.

Metodo de la potencia inversa

Sea A ∈ Rn×n una matriz diagonalizable regular para la que sus autovaloresverifican que:

0 < |λ1| < |λ2| ≤ · · · ≤ |λn| (4.4)

Los autovalores µ1, µ2, . . . , µn de la matriz A−1 son los inversos de los autova-lores de A,

µi =1

λi

para i = 1, 2, . . . , n.

Invirtiendo la expresion (4.4) nos queda

1

|λ1|>

1

|λ2|≥ · · · ≥ 1

|λn|⇐⇒ |µ1| > |µ2| ≥ · · · ≥ |µn|

es decir, el autovalor de menor valor absoluto de la matriz A se correspondecon el de mayor valor absoluto de A−1, por lo que aplicando el metodo dela potencia simple a la matriz A−1 obtenemos el autovalor de menor valorabsoluto de la matriz A.

Observese que debemos ir calculando, en cada paso, los vectores zn = A−1ωn−1

y ωn =zn

‖zn‖∞. Pues bien, el calculo de zn se realiza resolviendo, por alguno

de los metodos estudiados, el sistema Azn = ωn−1 lo que nos evita calcularA−1 y arrastrar los errores que se cometan a lo largo de todo el proceso.

Este metodo es conocido como metodo de la potencia inversa y nos permitecalcular, en caso de existir, el autovalor de menor valor absoluto de una matrizinvertible A.

Page 174: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

174 Autovalores y autovectores

Ejemplo 4.3 Para calcular, por el metodo de la potencia inversa, el autovalorde menor valor absoluto de la matriz del Ejemplo 4.2 aplicamos el metodo dela potencia inversa y partiendo del vector z0 = (1 1 1)T obtenemos:

z1 =

0.50001.5000

−1.0000

z2 =

1.66674.3333

−3.6667

z3 =

1.88464.7308

−4.0769

z4 =

1.91064.7724

−4.1220

z5 =

1.91404.7777

−4.1278

z6 =

1.91444.7784

−4.1285

z7 =

1.91454.7785

−4.1286

z8 =

1.91454.7785

−4.1287

z9 =

1.91454.7785

−4.1287

Tenemos, por tanto, que z9 es una aproximacion al autovector asociado alautovalor de menor valor absoluto de la matriz A, por lo que el cociente deRayleigh nos proporcionara una aproximacion de este.

λ3 =zT9 Az9

zT9 z9

= 0.20927063325837. �

Algoritmo de la Potencia Inversa

z = ones(length(A),1);

w = zeros(length(A),1);

n = 0;

while norm(z-w)>10^ (-14)

n = n + 1;

w = z;

z = A\w;for i = 1:length(A)

if abs(z(i)) == max(abs(z))

break

end

end

z= z/z(i);

end

n

autovalor = (z’*A*z)/(z’*z)

Error = norm(A*z-autovalor*z)

Page 175: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Metodos iterados para la obtencion de autovalores y autovectores 175

Al igual que hicimos con el metodo de la potencia simple, podemos acelerar laconvergencia del metodo de la potencia inversa.

Algoritmo de la Potencia Inversa Mejorado

z = ones(length(A),1);

w = zeros(length(A),1);

n = 0;

while norm(z-w)>10^ (-14)

n = n + 1;

w = z;

z = A\w;l=(z’*A*z)/(z’*z);

if rcond(A-l*eye(length(A)))>10^ (-15)

z = (A-l*eye(length(A)))z;end

for i = 1:length(A)

if abs(z(i)) == max(abs(z))

break

end

end

z = z/z(i);

end

n

autovalor = (z’*A*z)/(z’*z)

Error = norm(A*z-autovalor*z)

Para la matriz de nuestro Ejemplo 4.2 obtenemos, con MatLab, mediante el al-goritmo del metodo de la potencia inversa, la aproximacion 0.20927063325837del autovalor de menor modulo con un error 5.119756492560000 · 10−16 en 18iteraciones, mientras que con el mejorado, obtenemos, en tan solo 8 iteraciones,la misma aproximacion con un error del orden de 9.723368807669973 · 10−16.

Veamos, por ultimo, una nueva variante de este metodo nos permite calcularun autovalor cualquiera de una matriz regular A a partir de una aproximacionsuya. Sin embargo, hay que tener en cuenta que si el autovalor que vamos aaproximar es multiple o existen otros con el mismo modulo aparecen dificul-tades que solo podremos solventar utilizando otros metodos.

Page 176: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

176 Autovalores y autovectores

Metodo de la potencia inversa con desplazamiento

Consideremos una matriz A regular tal que todos sus autovalores tengan dife-rente modulo y supongamos conocida una aproximacion α de un determinadoautovalor λk. Si la aproximacion es buena se verificara que |λk −α| < |λi−α|para cualquier i = 1, 2, . . . n con i 6= k.

Dado que 1/(λi − α) son los autovalores de A− αI y esta posee un autovalor(λk − α) de menor valor absoluto que los demas, el metodo de la potencia

inversa nos proporcionara el valor µk =1

λk − αpudiendose, a partir de este

ultimo, hallar el valor de λk.

Esta variante es conocida como metodo de la potencia inversa con desplaza-miento.

Ejemplo 4.4 Supongamos ahora que sabemos que el otro autovalor de lamatriz A del Ejemplo 4.2 es aproximadamente 1.5.

Para calcular dicho autovalor, por el metodo de la potencia inversa con des-plazamiento, aplicamos el metodo de la potencia inversa a la matriz

(A− 1.5I) =

4.5 2 5

2 0.5 3

5 3 4.5

Partiendo del vector z0 = (1 1 1)T obtenemos:

z1 =

−3.14292.57142.0000

z2 =

−15.870113.84428.5455

z3 =

−15.849913.74668.5663

z4 =

−15.823313.72728.5501

z5 =

−15.824413.72808.5508

z6 =

−15.824413.72798.5508

z7 =

−15.824413.72798.5508

Tenemos, por tanto, que z7 es una aproximacion al autovector asociado alautovalor buscado, por lo que

λ2 =zT7 Az7

zT7 z7

= 1.56319356980456.�

Page 177: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Metodos iterados para la obtencion de autovalores y autovectores 177

Algoritmo de la Potencia Inversa conDesplazamiento

z = ones(length(A),1);

w = zeros(length(A),1);

n = 0;

while norm(z-w)>10^ (-14)

n = n + 1;

w = z

z = (A-αI)\w;for i = 1:length(A)

if abs(z(i)) == max(abs(z))

break

end

end

z = z/z(i);

end

n

autovalor = (z’*A*z)/(z’*z)

Error = norm(A*z-autovalor*z)

Para la matriz del Ejemplo 4.2 y conociendo que tiene un autovalor proximoa 1.5, el algoritmo de la potencia inversa con desplazamiento, ejecutado conMatLab, nos proporciona la aproximacion 1.56319356980457 del autovalor conun error de 3.845925372767128 · 10−16 en 12 iteraciones.

Tambien, en este caso, podemos hacer la misma mejora que en los anterioresalgoritmos.

Page 178: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

178 Autovalores y autovectores

Algoritmo de la Potencia Inversa conDesplazamiento Mejorado

z = ones(length(A),1);

w = zeros(length(A),1);

n = 0;

while norm(z-w)>10^ (-14)

n = n + 1;

w = z;

z = (A-αI)\w;l=(z’*A*z)/(z’*z);

if rcond(A-l*eye(length(A)))>10^ (-15)

z = (A-l*eye(length(A)))z;end

for i = 1:length(A)

if abs(z(i)) == max(abs(z))

break

end

end

z = z/z(i);

end

n

autovalor = (z’*A*z)/(z’*z)

Error = norm(A*z-autovalor*z)

Este algoritmo mejorado nos proporciona la aproximacion 1.56319356980456del autovalor con un error de 5.978733960281817 · 10−16 en tan solo 3 iteracio-nes.

4.3.2 Algoritmo QR de Francis

Dada una matriz A ∈ Kn×n, se pretende encontrar una sucesion de matrices(An)n∈N convergente a la matriz triangular de Schur T (en cuya diagonalaparecen los autovalores de la matriz A).

La construccion de dicha sucesion se hace de la siguiente manera: A0 = A.

Supuesta encontrada An, se realiza la factorizacion An = QnRn mediantematrices de Householder y An+1 = RnQn. En otras palabras:

Page 179: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Metodos iterados para la obtencion de autovalores y autovectores 179

A0 = A = Q0R0

A1 = R0Q0 = Q∗0AQ0 = Q1R1

A2 = R1Q1 = Q∗1Q

∗0AQ0Q1 = Q2R2

...

An+1 = RnQn = Q∗n · · ·Q∗

1Q∗0AQ0Q1 · · ·Qn = Qn+1Rn+1

...

=⇒

An+1 = (Q0Q1 · · ·Qn)∗A(Q0Q1 · · ·Qn)

Al ser An semejante a A cualquiera que sea n ∈ N, todas las matrices de lassucesion tienen los mismos autovalores.

Si λ1, λ2, . . . , λn son los autovalores de una matriz A tales que

|λ1| > |λ2| > · · · > |λn| > 0

el algoritmo converge.

En general, si existen autovalores de igual modulo, la sucesion converge a unamatriz triangular por cajas en la que cada caja contiene a los autovalores delmismo modulo.

En otras palabras,

• Si todos los autovalores tienen distinto modulo el lımite de la sucesiones una matriz triangular superior en la que los elementos de su diagonalson los autovalores de la matriz.

• Si existen autovalores de igual modulo la matriz lımite es una matriztriangular superior por cajas en la que cada caja de orden k de su diagonales una matriz cuyos autovalores son todos los k autovalores de igualmodulo de la matriz A.

Ası, por ejemplo, si una matriz A de orden 3 tiene un autovalor realy dos autovalores complejos conjugados (por tanto de igual modulo) dedistinto modulo que el autovalor real se llegarıa a una matriz del tipo a11 a12 a13

0 a22 a23

0 a32 a33

donde a11 es el autovalor real y los autovalores de la matriz

(a22 a23

a32 a33

)son los dos autovalores complejos de la matriz A.

Page 180: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

180 Autovalores y autovectores

De forma mas general, si A es una matriz cualquiera (normal o no), al aplicarleel algoritmo, la sucesion converge (en la mayorıa de los casos) a su forma deSchur.

Ejemplo 4.5 Para el calculo de los autovalores de la matriz A =

1 2 3

2 2 3

3 3 3

se tiene:

A0 = A =

1 2 3

2 2 3

3 3 3

A1 =

7 −1.9415 0.6671

−1.9415 −0.5385 0.1850

0.6671 0.1850 −0.4615

A2 =

7.5034 0.3365 0.0344

0.3365 −1.1474 −0.1174

0.0344 −0.1174 −0.3554

A3 =

7.5162 −0.0530 0.0016

−0.0530 −1.1758 0.0348

0.0016 0.0348 −0.3404

A4 =

7.5165 0.0083 0.0001

0.0083 −1.1775 −0.0100

0.0001 −0.0100 −0.3390

A5 =

7.5165 −0.0013 0.0000

−0.0013 −1.1776 0.0029

0.0000 0.0029 −0.3389

A6 =

7.5165 0.0002 0

0.0002 −1.1776 −0.0008

0 −0.0008 −0.3389

A7 =

7.5165 0 0

0 −1.1776 0

0 0 −0.3389

Por lo que los autovalores de la matriz A son:

−1.1776 − 0.3389 y 7.5165 �

Ejemplo 4.6 La matriz A =

2 3 5

1 4 6

−1 3 1

tiene por autovalores 7 y ±√

2.

Al tener dos autovalores de igual modulo no converge a una matriz triangular,sino a la matriz triangular por cajas.

Realizando el proceso con MatLab hemos obtenido en la iteracion 31 que

A31 =

7.0000 6.7412 −0.6901

−0.0000 0.5797 2.4374

0.0000 0.6826 −0.5798

Page 181: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Metodos iterados para la obtencion de autovalores y autovectores 181

por lo que sabemos que un autovalor es 7 y los otros dos son los autovaloresde la matriz

B =

(0.5797 2.4374

0.6826 −0.5798

)cuyos autovalores son ±

√2. �

4.3.3 Metodo de Jacobi para matrices simetricas reales

Comenzaremos viendo el metodo para dimension dos y, mas tarde, generaliza-remos para una dimension cualquiera.

Dada una matriz simetrica y real A =

(a b

b c

)el metodo trata de buscar un

valor para α de tal forma que la rotacion P =

(cos α sen α

− sen α cos α

)haga que

la matriz P−1AP sea diagonal.

P−1AP =

(cos α − sen α

sen α cos α

)(a b

b c

)(cos α sen α

− sen α cos α

)=

(∗ 0

0 ∗

)Se debe verifica, por tanto, que

(a− c) cos α sen α + b(cos2 α− sen2 α) = 0

es decir:b(cos2 α− sen2 α) = (c− a) cos α sen α

Si c = a basta tomar α =π

4.

Si c 6= a podemos dividir por c− a y obtenemos que

2b

c− a=

2 cos α sen α

cos2 α− sen2 α=

sen 2α

cos 2α= tg 2α

Llamando m =2b

c− ase tiene que tg 2α = m, por lo que

t = tg α =−1±

√1 + m2

m

y, a partir del valor de t obtenido, se pueden calcular

cos α =1√

1 + t2y sen α =

t√1 + t2

valores, estos ultimos, que nos permiten determinar la matriz P .

Page 182: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

182 Autovalores y autovectores

Algoritmo de calculo

a) Dada A =

(a b

b c

)a.1) Si b = 0 FIN.

a.2) Si b 6= 0 y a = c

P =

√2/2

√2/2

−√

2/2√

2/2

y P−1AP =

∗ 0

0 ∗

. FIN.

b) m =2b

c− at =

−1±√

1 + m2

m.

c) cos α =1√

1 + t2sen α =

t√1 + t2

.

P =

cos α sen α

− sen α cos α

y P−1AP =

∗ 0

0 ∗

. FIN.

Para dimensiones superiores sea P la matriz diagonal por bloques

P =

Ip−1

Tq−p+1

In−q

en la que

Tq−p+1 =

cos α sen α

Iq−p−1

− sen α cos α

y todos los demas elementos nulos.

• Si apq = 0, hacemos cos α = 1 y sen α = 0.

• Si app = aqq, hacemos cos α = sen α =

√2

2.

• Si app 6= aqq llamando m =2apq

aqq − app

y t =−1±

√1 + m2

mhacemos

cos α =1√

1 + t2y sen α =

t√1 + t2

Page 183: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Metodos iterados para la obtencion de autovalores y autovectores 183

Entonces, los elementos que ocupan los lugares pq y qp de la matriz P−1APson nulos.

El metodo de Jacobi consiste en buscar el elemento apq con p 6= q de mayormodulo, anularlo mediante una matriz P1, buscar el siguiente elemento demayor modulo y anularlo mediante otra matriz P2 y ası sucesivamente hastadiagonalizar la matriz A.

Dado que las matrices Pk, o matrices de Jacobi, son ortogonales, se verificaque P−1

k = P Tk por lo que se trata, en definitiva, de buscar P1, P2, . . . , Pk de la

forma descrita anteriormente, para obtener

P Tk · · ·P T

1 AP1 · · ·PK = D

Lo mas importante de este metodo es que el calculo de las matrices Pi puedehacerse simultaneamente ya que no se requiere el conocimiento de ninguna deellas en el calculo de cualquier otra. Es decir, el metodo es paralelizable.

Ejemplo 4.7 Consideremos la matriz A =

1 −2 3 1

−2 0 4 2

3 4 1 1

1 2 1 0

que es

simetrica y real.

El elemento extradiagonal de mayor valor absoluto es a23 = 4, por lo quecomenzamos haciendo

m =2a23

a33 − a22

t =−1 +

√1 + m2

mcos α =

1√1 + t2

sen α =t√

1 + t2

P23 = I4 p22 = p33 = cos α p23 = −p32 = sen α

obteniendose

P23 =

1 0 0 0

0 0.7497 0.6618 0

0 −0.6618 0.7497 0

0 0 0 1

por lo que

P T23AP23 =

1 −3.4848 0.9254 1

−3.4848 −3.5311 0 0.8376

0.9254 0 4.5311 2.0733

1 0.8376 2.0733 0

Page 184: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

184 Autovalores y autovectores

Observese que la transformacion de semejanza solo ha afectado a las filas ycolumnas 2 y 3 dejando invariantes a los demas elementos.

Si queremos aplicar el metodo a la matriz P T23AP23 obtenida, utilizando como

referencia el elemento a14 = 1, podemos observar que todos los calculos nece-sarios para obtener la nueva matriz P14 podıamos haberlos realizados al mismotiempo que los realizados para P23 ya que solo necesitamos los valores de loselementos (1, 1), (1, 4), (4, 1) y (4, 4) de la matriz P T

23AP23, que por haberquedado invariantes son los mismos que los de la matriz A.

Realizando los calculos necesarios de forma analoga al caso anterior obtenemos

P14 =

0.8507 0 0 −0.5257

0 1 0 0

0 0 1 0

0.5257 0 0 0.8507

que aplicarıamos a P T

23AP23 para obtener P T14P

T23AP23P14 = P T AP donde la

matriz P viene dada por P = P23P14.

Ahora bien, la matriz

P = P23P14 =

0.8507 0 0 −0.5257

0 0.7497 0.6618 0

0 −0.6618 0.7497 0

0.5272 0 0 0.8507

puede ser escrita directamente sin necesidad de construir previamente P23 yP14 y multiplicarlas.

En resumen, se pueden enviar a un ordenador los valores de a22, a23 = a32

y a33 para que calcule el angulo de giro correspondiente y nos devuelva losvalores de p22 = p33 y p23 = −p32, mientras que de forma simultanea enviamosa otro ordenador los valores de a11, a14 y a44 y nos devolvera los de p11 = p44

y p14 = −p41.

En el ordenador central construimos la matriz P con los datos recibidos ycalculamos

P T AP =

1.6180 −2.5240 1.8772 0

−2.5240 −3.5311 0 2.5445

1.8772 0 4.5311 1.2771

0 2.5445 1.2771 −0.6180

que volveremos a renombrar con A.

Page 185: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Reduccion del problema a matrices hermıticas 185

A la vista de la matriz enviarıamos al Ordenador 1 los datos de los elementosa22, a24 = a42 y a44 mientras que enviarıamos al Ordenador 2 los de a11,a13 = a31 y a33 que nos devolverıan los elementos necesarios para construiruna nueva matriz

P =

0.8981 0 0.4399 0

0 0.8661 0 0.5016

−0.4399 0 0.8981 0

0 −0.5016 0 0.8651

y a partir de ella

P T AP =

0.6986 −1.6791 0 −1.6230

−1.6791 −5.0065 −1.5358 0

0 −1.5358 5.4506 0.4353

−1.6230 0 0.4353 0.8573

Reiterando el proceso llegamos a la matriz

2.5892 0 0 0

0 −5.6823 0 0

0 0 5.7118 0

0 0 0 −0.6188

cuyos elementos diagonales son los autovalores de la matriz original. �

4.4 Reduccion del problema a matrices hermı-

ticas

Los autovalores de una matriz normal cualquiera pueden ser reales o com-plejos mientras que los de una matriz hermıtica son todos reales, por lo quesi pudieramos transformar el calculo de los autovalores de una matriz nor-mal en los de otra hermıtica habrıamos simplificado el problema. Es mas,si pudieramos transformarlo en el calculo de los autovalores de una matrizsimetrica real, podrıamos trabajar en el campo real en vez de hacerlo en elcampo complejo y, entre otras cosas, podrıamos utilizar el metodo de Jacobi apartir de una matriz normal cualquiera, previa transformacion en un problemade autovalores de una matriz simetrica real.

Page 186: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

186 Autovalores y autovectores

Proposicion 4.14 [Componentes hermıticas de una matriz]

Dada cualquier matriz cuadrada A, existen dos matrices hermıticas H1 y H2

tales que A = H1+iH2 las cuales reciben el nombre de componentes hermıticasde la matriz A.

Demostracion. Si se quiere que A = H1 + iH2 con H1 y H2 hermıticas, setendra que A∗ = H∗

1 − iH∗2 = H1 − iH2, por lo que resolviendo el sistema

resultante se tiene que

H1 =A + A∗

2H2 =

A− A∗

2i

ademas, la solucion es unica.

Teorema 4.15 Sea A = H1+iH2 una matriz normal con H1 y H2 hermıticas.Si x 6= 0 es un autovector de A asociado al autovalor α + iβ (α, β ∈ R) severifica que

H1x = αx y H2x = βx

Demostracion. Por ser A normal, existe una matriz unitaria U tal queU∗AU = D

D = U∗AU =

α + iβ 0 · · · 0

0 α2 + iβ2 · · · 0...

.... . .

...

0 0 · · · αn + iβn

=⇒

A = U

α 0 · · · 0

0 α2 · · · 0...

.... . .

...

0 0 · · · αn

U∗ + iU

β 0 · · · 0

0 β2 · · · 0...

.... . .

...

0 0 · · · βn

U∗ =⇒

H1 = U

α 0 · · · 0

0 α2 · · · 0...

.... . .

...

0 0 · · · αn

U∗ H2 = U

β 0 · · · 0

0 β2 · · · 0...

.... . .

...

0 0 · · · βn

U∗

donde H1 y H2 son hermıticas. Se tiene entonces que α es un autovalor deH1 asociado a x (primera columna de U) y β un autovalor de H2 asociadotambien a x.

Page 187: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Reduccion del problema a matrices simetricas reales 187

Las componentes hermıticas H1 y H2 de una matriz cuadrada A nos propor-cionan otro metodo para estudiar si la matriz A es, o no es, normal.

Teorema 4.16 Una matriz cuadrada A es normal si, y solo si, sus compo-nentes hermıticas conmutan.

A es normal ⇐⇒ H1H2 = H2H1

Demostracion.

H1H2 =A + A∗

2· A− A∗

2i=

A2 − AA∗ + A∗A + (A∗)2

4i

H2H1 =A− A∗

2i· A + A∗

2=

A2 + AA∗ − A∗A + (A∗)2

4i

• Si A es normal se verifica que AA∗ = A∗A por lo que

H1H2 =A + A∗

2· A− A∗

2i=

A2 + (A∗)2

4i

H2H1 =A− A∗

2i· A + A∗

2=

A2 + (A∗)2

4i

=⇒ H1H2 = H2H1

• Si H1H2 = H2H1 se verifica que

A2 − AA∗ + A∗A + (A∗)2 = A2 + AA∗ − A∗A + (A∗)2

por lo que

−AA∗+A∗A = A2 +AA∗−A∗A ⇐⇒ 2A∗A = 2AA∗ ⇐⇒ A∗A = AA∗

y, por tanto, A es normal.

4.5 Reduccion del problema a matrices sime-

tricas reales

Sea H una matriz hermıtica y sean hij = aij + ibij con 1 ≤ i, j ≤ n suselementos.

Podemos descomponer la matriz H de la forma H = A + iB donde A y B sonmatrices reales con A = (aij) y B = (bij).

Page 188: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

188 Autovalores y autovectores

Por ser H hermıtica se verifica que

A+iB=H =H∗=A∗−iB∗=AT−iBT (por ser A y B reales)=⇒

A=AT

B=−BT

Sea x = a + ib un autovector de H asociado al autovalor α (recuerdese queα ∈ R por ser H una matriz hermıtica). Se verifica entonces que

Hx = (A + iB)(a + ib) = (Aa−Bb) + i(Ab + Ba)

αx = α(a + ib) = αa + iαb

Hx = αx ⇒

Aa−Bb = αa

Ab + Ba = αb

por lo que (A −B

B A

)(a

b

)= α

(a

b

)

Observese ademas que la matriz real

(A −B

B A

)es simetrica, ya que

(A −B

B A

)T

=

(AT BT

−BT AT

)=

(A −B

B A

)

Los autovalores de la matriz

(A −B

B A

)son, por tanto, los mismos que los

de H y si un autovector de

(A −B

B A

)es (x1, . . . , xn, xn+1, . . . , x2n), el co-

rrespondiente autovector de la matriz H es((x1 + ixn+1), . . . , (xn + ix2n)

).

Dada una matriz normal calcularemos sus autovalores de la siguiente forma:

Algoritmo de calculo de los autovalores de una matriz normal

Paso 1 Calcular las componentes hermıticas

H1 =A + A∗

2y H2 =

A− A∗

2i

de la matriz A.

Page 189: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Aplicacion al calculo de las raıces de un polinomio 189

Paso 2 Calcular los autovalores λi (1 ≤ i ≤ n) de la primera componentehermıtica H1 y sus autovectores asociados vi reduciendo previamente elproblema al caso de matrices reales y simetricas.

Paso 3 Calcular los cocientes de Rayleigh µi =v∗i H2vi

v∗i vi

.

Como los vectores vi (1 ≤ i ≤ n) son tambien autovectores de H2, los µi

obtenidos son sus autovalores asociados.

Paso 4 Los autovectores de A son los mismos vectores vi y sus autovaloresasociados vienen dados por λi + iµi.

4.6 Aplicacion al calculo de las raıces de un

polinomio

Consideremos el polinomio

P (x) = a0xn + a1x

n−1 + a2xn−2 + · · ·+ an−1x + an

Dado que el polinomio caracterıstico de la matriz

A =

−a1/a0 −a2/a0 · · · −an−1/a0 −an/a0

In−1

0...

0

(donde In−1 representa la matriz unidad de orden n−1) es precisamente P (x),la raıces de dicho polinomio coinciden con los autovalores de la matriz A, porlo que dichas raıces pueden ser obtenidas, en bloque, mediante un metodoiterado de calculo de autovalores.

Ası, por ejemplo, MATLAB en su comando roots(P) para calcular las raıcesde un polinomio P construye, en primer lugar, la matriz A definida anterior-mente y se limita luego a calcular sus autovalores aplicando internamente elcomando eig(A) de calculo de los autovalores de una matriz. Este comandolo que hace, en primer lugar, es aplicar un algoritmo para llevar la matriz A auna matriz de Hessenberg y posteriormente aplicarle el algoritmo QR mediantetransformaciones de Householder.

Page 190: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

190 Autovalores y autovectores

4.7 Ejercicios resueltos

Ejercicio 4.1 Realizar la descomposicion de Schur de la matriz

A =

1 0 1

0 1 1

−1 0 −1

Solucion: El polinomio caracterıstico de la matriz A es

p(λ) = det(λI − A) =

∣∣∣∣∣∣∣λ− 1 0 −1

0 λ− 1 −1

1 0 λ + 1

∣∣∣∣∣∣∣ = λ3 − λ2 = λ2(λ− 1)

por lo que los autovalores de A son 1 simple y 0 doble.

Para λ = 1 el autovector asociado viene dado por la solucion del sistema

(A− I)v = 0 ⇐⇒

0 0 1

0 0 1

−1 0 −2

v =

0

0

0

=⇒ v =

0

1

0

Para ampliar hasta una base ortonormal de R3 podemos utilizar los vectores

de la base canonica para obtener la matriz de paso P =

0 1 0

1 0 0

0 0 1

, por lo

que

P−1AP = P T AP =

1 0 1

0 1 1

0 −1 −1

La submatriz

(1 1

−1 −1

)tiene como autovalores el 0 doble y un autovec-

tor asociado a el es el vector (1 − 1)T que puede ser ampliado hasta unabase ortogonal de R2 con el vector (1 1)T por lo que una base ortonor-mal de R2 es le constituida por ambos vectores normalizados y, por tanto

Q =

1 0 0

0 1√2

1√2

0 − 1√2

1√2

obteniendose que

QT P T APQ = UT AU =

1 −√

22

√2

2

0 0 2

0 0 0

Page 191: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Ejercicios resueltos 191

que es una forma de Schur de la matriz A con

U = PQ =

0 1√2

1√2

1 0 0

0 − 1√2

1√2

Ejercicio 4.2 Comprobar que la matriz U =

(0.6 0.8

−0.8 0.6

)es unitaria (or-

togonal) y obtener, basandose en ella, una matriz normal A que tenga porautovalores 2 y 3i. Calcular la conmutatriz de A y comprobar que sus compo-nentes hermıticas conmutan.

Solucion:

U∗U = UT U =

(0.6 −0.8

0.8 0.6

)(0.6 0.8

−0.8 0.6

)=

(1 0

0 1

)= I

Por tanto, la matriz es unitaria.

Si A debe ser normal y ha de tener los autovalores 2 y 3i, tiene que serdiagonalizable unitariamente y, la matriz diagonal tendra a los autovaloresen su diagonal.

U∗AU = D =

(2 0

0 3i

)=⇒ A = UDU∗

Podemos utilizar cualquier matriz unitaria, por ejemplo, la del enunciado delejercicio.

A =

(0.6 −0.8

0.8 0.6

)(2 0

0 3i

)(0.6 0.8

−0.8 0.6

)

=

(0.72 + 1.92i −0.96 + 1.44i

−0.96 + 1.44i 1.28 + 1.08i

).

Hallemos, por ultimo, la conmutatriz de la matriz A.

C(A) = AA∗ − A∗A = 2i(H2H1 −H1H2)

H1 =1

2(A+A∗) =

(0.72 −0.96

−0.96 1.28

)H2 =

1

2i(A−A∗) =

(1.92 1.44

1.44 1.08

)

H1H2 =

(0 0

0 0

)= Θ H2H1 =

(0 0

0 0

)= Θ =⇒ H1H2 = H2H1

Por tanto, C(A) = Θ.

Page 192: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

192 Autovalores y autovectores

Ejercicio 4.3 Probar, basandose en el teorema de Gerschgorin, que la matriz:

A =

9 1 −2 1

0 8 1 1

−1 0 7 0

1 0 0 1

tiene, al menos, dos autovalores reales.

Solucion:

Los cırculos de Gerschgorin por filas son:

a11 = 9 r1 = 1 + 2 + 1 = 4

a22 = 8 r2 = 1 + 1 = 2

a33 = 7 r3 = 1

a44 = 1 r4 = 1

1 7 9���� ����&%'$

El cırculo C4(1, 1) es disjunto con los demas:

|a44 − a11| = 8 > r4 + r1

|a44 − a22| = 7 > r4 + r2

|a44 − a33| = 6 > r4 + r3

Por tanto, en el hay un autovalor λ1 y los otros tres se encuentran en C1 ∪C2 ∪ C3.

El autovalor λ1 debe ser real ya que, si fuese complejo, su conjugado λ1 tambienserıa autovalor de la matriz(1) y deberıa pertenecer a C4 cosa que no sucede,pues en C4 solo existe un autovalor.

En conclusion: la matriz tiene, al menos, un autovalor real λ1 con 0 ≤ λ1 ≤ 2.

Los tres autovalores restantes no pueden ser complejos ya que P (λ) es unaecuacion polinomica de grado cuatro con coeficientes reales, por lo que debeexistir, al menos, otra raız real de P (λ) y, por tanto, la matriz A tiene, almenos, dos autovalores reales.

Ejercicio 4.4 Dada la matriz A =

(2 + 3i 1 + 2i

1 + 2i 2 + 3i

)se pide:

(1) En una matriz real, P (λ) tiene coeficientes reales y, por tanto, sus raıces o son reales oson complejas conjugadas.

Page 193: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Ejercicios resueltos 193

a) Comprobar que es normal sin calcular la matriz conmutatriz.

b) Calcular sus autovalores a partir de los de sus componentes hermıticas.

c) Comprobar que estos autovalores estan en el dominio de Gerschgorin.

Solucion:

a) H1 =1

2(A + A∗) =

(2 1

1 2

)H2 =

1

2i(A− A∗) =

(3 2

2 3

)

H1H2 =

(8 7

7 8

)H2H1 =

(8 7

7 8

)=⇒ H1H2 = H2H1 =⇒

A es normal.

b) Calculemos, en primer lugar los autovalores y autovectores de sus com-ponentes hermıticas H1 y H2.

• Componente H1

P (λ) =

∣∣∣∣∣ λ− 2 −1

−1 λ− 2

∣∣∣∣∣ = λ2 − 4λ + 3 = (λ− 1)(λ− 3) =⇒

λ11 = 1 y λ12 = 3

Los autovectores viene dados por las soluciones de los sistemas:

– Para λ11 = 1 =⇒ (I −H1)x = 0(−1 −1

−1 −1

)(x1

x2

)=

(0

0

)⇒ x1 + x2 = 0 ⇒ u11 =

(1

−1

)

– Para λ12 = 3 =⇒ (3I −H1)x = 0(1 −1

−1 1

)(x1

x2

)=

(0

0

)⇒ x1 − x2 = 0 ⇒ u12 =

(1

1

)

• Componente H2

Los autovectores son los mismos que los de H1.

Sus autovalores vienen dados por

λ21 =uT

11H2u11

uT11u11

= 1 λ22 =uT

12H2u12

uT12u12

= 5

Page 194: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

194 Autovalores y autovectores

La matriz A tiene, por tanto, los autovectores v1 = (1,−1)T y v2 =(1, 1)T asociados, respectivamente, a los autovalores λ1 = 1 + i y λ2 =3 + 5i.

c) Dominio de Gerschgorin.

a11 = 2 + 3i r1 = |1 + 2i| =√

5

a22 = 2 + 3i r1 = |1 + 2i| =√

5

=⇒ C1 ∪ C2 ≡ C(2 + 3i,√

5).

d(λ1, 2 + 3i) = |(1 + i)− (2 + 3i)| =√

5

d(λ2, 2 + 3i) = |(3 + 5i)− (2 + 3i)| =√

5

=⇒

Ambos se encuentran en la frontera del dominio.

Ejercicio 4.5 Dada la matriz A =

6 2 5

2 2 3

5 3 6

se pide:

a) Utilizar el metodo de la potencia simple para aproximar su autovalor

dominante partiendo del vector z0 =(

1 1 1)T

b) Hacer uso del metodo de la potencia inversa para, partiendo de z0, apro-ximar el autovalor minimante de la matriz A.

c) Sabiendo que una aproximacion del tercer autovalor de la matriz A es1.5, aproximarlo haciendo uso del metodo de la potencia inversa condesplazamiento.

Solucion:

a) Escalando los vectores zn por su coordenada de mayor valor absoluto(renombrados como wn) y haciendo zn+1 = Awn obtenemos:

z1 =

13.00007.0000

14.0000

z2 =

11.57145.8571

12.1429

z3 =

11.68245.8706

12.2118

z4 =

11.70135.8748

12.2254

z5 =

11.70395.8753

12.2273

z6 =

11.70425.8754

12.2275

z7 =

11.70425.8754

12.2275

por lo que

λ1 'zT7 Az7

zT7 z7

' 12.22753579693696

Page 195: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Ejercicios resueltos 195

b) Escalando los vectores zn (renombrados como wn) y resolviendo los sis-temas Azn+1 = wn:

z1 =

0.50001.5000

−1.0000

z2 =

1.66674.3333

−3.6667

z3 =

1.88464.7308

−4.0769

z4 =

1.91064.7724

−4.1220

z5 =

1.91404.7777

−4.1278

z6 =

1.91444.7784

−4.1285

z7 =

1.91454.7785

−4.1286

z8 =

1.91454.7785

−4.1287

z9 =

1.91454.7785

−4.1287

por lo que

λ3 'zT9 Az9

zT9 z9

' 0.20927063325837

c) Escalando los vectores zn (renombrados como wn) y resolviendo los sis-temas (A− 1.5 I)zn+1 = wn:

z1 =

−3.14292.57142.0000

z2 =

−15.870113.84428.5455

z3 =

−15.849913.74668.5663

z4 =

−15.823313.72728.5501

z5 =

−15.824413.72808.5508

z6 =

−15.824413.72798.5508

z7 =

−15.824413.72798.5508

por lo que

λ2 'zT7 Az7

zT7 z7

' 1.56319356980456

Ejercicio 4.6 Dada la matriz A =

(1 + i −2 + i

2− i 1 + i

)se pide:

a) Comprobar que es normal y que v1 =

(−i

1

)es un autovector de su

primera componente hermıtica H1 asociado al autovalor λ1 = 0.

b) Calcular el otro autovalor (y un autovector asociado) de la matriz H1

aplicando el metodo de la potencia simple.

Page 196: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

196 Autovalores y autovectores

c) Considerese la matriz real y simetrica S =

(x y

y x

). Probar que la

transformacion de Jacobi QtSQ con Q =

(cos α sen α

− sen α cos α

)y α = π/4

nos anula los elementos extradiagonales.

d) Transformar el problema del calculo de los autovalores de la matriz H2

(segunda componente hermıtica de la matriz A) al del calculo de los au-tovalores de una matriz C simetrica real y comprobar que son suficientesdos transformaciones de Jacobi Q1 y Q2, del tipo de las del apartadoanterior, para diagonalizar dicha matriz C y obtener los autovalores deH2.

e) Obtener, a partir de las columnas de la matriz Q = Q1Q2, los autovec-tores de la matriz H2. ¿Cuales son los autovalores de la matriz A?

Solucion:

a)A∗A =

(1− i 2 + i

−2− i 1− i

)(1 + i −2 + i

2− i 1 + i

)=

(7 6i

−6i 7

)

AA∗ =

(1 + i −2 + i

2− i 1 + i

)(1− i 2 + i

−2− i 1− i

)=

(7 6i

−6i 7

) =⇒

A∗A = AA∗, por lo que la matriz es normal.

H1 =A + A′

2=

(1 i

−i 1

)y H2 =

A− A′

2i=

(1 2i

−2i 1

)

H1

(−i

1

)=

(1 i

−i 1

)(−i

1

)=

(0

0

)= 0 ·

(−i

1

)lo que prueba que λ1 = 0 es una autovalor de H1 asociado al autovector

v1 =

(−i

1

).

b) Partiendo, por ejemplo, de z0 =

(1

1

)obtenemos w0 = z0

z1 = H1w0 =

(1 + i

1− i

)=⇒ w1 =

z1

1− i=

(i

1

)

Page 197: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Ejercicios resueltos 197

z2 = H1w1 =

(2i

2

)=⇒ w2 =

z2

2=

(i

1

).

Hemos obtenido que w2 = w1, por lo que v2 =

(i

1

)es un autovector

de H1 asociado al autovalor

λ2 =v∗2H1v2

v2 ∗ v2

= 2

c) QT SQ =

∗ y(cos2 α− sen2 α)

y(cos2 α− sen2 α) ∗

por lo que, para

α = π/4, se anulan los elementos extradiagonales.

d) Hacemos M = real(H2) =

(1 0

0 1

)y N = imag(H2) =

(0 2

−2 0

)para construir la matriz simetrica y real

C =

(M −N

N M

)=

1 0 0 −2

0 1 2 0

0 2 1 0

−2 0 0 1

Las transformaciones que debemos realizar son

Q1 =

2/2 0 0√

2/2

0 1 0 0

0 0 1 0

−√2/2 0 0

√2/2

y Q2 =

1 0 0 0

0√

2/2√

2/2 0

0 −√2/2

√2/2 0

0 0 0 1

Es decir, la transformacion Q = Q1Q2 =

2/2 0 0√

2/2

0√

2/2√

2/2 0

0 −√2/2

√2/2 0

−√2/2 0 0

√2/2

y obtenemos QT CQ =

3 0 0 0

0 −1 0 0

0 0 3 0

0 0 0 −1

por lo que los autovalores

de H2 son -1 y 3.

Page 198: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

198 Autovalores y autovectores

e) Las columnas de Q son los autovectores de C asociados, respectivamente,a los autovalores 3,−1, 3 y -1, por lo que los autovectores de C asociados

a −1 son

0

1

−1

0

y

1

0

0

1

, que nos definen el autovector

(−i

1

)de

la matriz H2 asociado al autovalor -1.

De manera analoga, los autovectores de C asociados a 3 son

1

0

0

−1

y

0

1

1

0

, que nos definen el autovector

(i

1

)de la matriz H2 asociado

al autovalor 3.

Los autovalores de A son, visto todo lo anterior, −i y 2 + 3i, asociados,

respectivamente, a los autovectores

(−i

1

)y

(i

1

).

Ejercicio 4.7 Justifica todas tus respuestas.

a) Se considera el proceso iterado xn+1 = ϕ(xn) = xn − 1 +2

exn.

a.1) ¿Se puede garantizar que, partiendo de cualquier numero realx0 ∈ [0.5, 1], el proceso convergera a un punto fijo?

a.2) En caso de converger, ¿cual es el punto fijo de la sucesion?

a.3) Utiliza la figura adjunta para justificar, geometricamente, la con-vergencia del proceso para cualquier valor inicial x0 ∈ [0.5, 1].

Page 199: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Ejercicios resueltos 199

a.4) Si el proceso xn+1 = φ(xn) verifica que |φ′(x)| < 0.1 en el intervalo[0.5, 1] ¿cual de los dos procesos anteriores tendra una convergenciamas rapida?

b) Se considera la matriz A =

0 1/2 1/31/4 0 1/51/6 α 0

b.1) A la vista de los cırculos de Gerschgorin, ¿convergera el proceso

xn+1 = Axn para cualquier valor de α ∈ [0, 1/2] y cualquier vectorinicial x0?

b.2) Probar que si α ∈ [0, 1/2], A no puede tener el autovalor 1.

b.3) ¿Cual es el vector x (punto fijo) lımite de la sucesion (xn) del pro-ceso anterior?

b.4) Para α = 1/2, los autovalores de A son 0.6130 y −0.3065± 0.0352 i.¿Se puede calcular el autovalor real aplicando el metodo de la po-tencia simple?

Si no se realiza ningun tipo de escalado de los vectores y trabajamoscon un ordenador que cualquier numero menor que 10−10 lo hacecero (tolerancia del ordenador), ¿que ocurrirıa con el vector xN sihacemos un excesivo numero N de iteraciones?

¿Ocurrirıa lo mismo haciendo ese numero N de iteraciones esca-lando los vectores?

¿Por que es una buena estrategia escalar por la coordenada de ma-yor modulo de los vectores que se obtienen?

Solucion:

a) a.1) Tenemos un metodo de la forma xn+1 = ϕ(xn) con ϕ(x) = x−1+2

ex.

ϕ′(x) = 1− 2

ex.

Dado que ϕ′′(x) =2

exes siempre positiva, sabemos que ϕ′(x) es

creciente pasando de ϕ′(0.5) = −0.2131 a ϕ′(1) = 0.2642 es decir

|ϕ′(x)| ≤ 0.2642 < 1

por lo que la funcion es contractiva y el metodo es convergente aun punto fijo.

Page 200: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

200 Autovalores y autovectores

a.2) Aplicando lımites, y llamando lim xn = x, se obtiene x = x−1+2

ex

de donde2

ex= 1 =⇒ ex = 2 =⇒ x = ln 2

a.3) Basta ver el comportamiento de la red que se forma al ir de lagrafica a la recta, de la recta a la grafica y ası sucesivamente.

a.4) Teniendo en cuenta que ϕ′(ln 2) = 0 es decir, que la tangente endicho punto es horizontal, el metodo tiene una convergencia de se-gundo orden.

Si φ′(ln 2) 6= 0 el proceso xn+1 = φ(xn) tendra una convergenciade primer orden y sera mas lento, y solo sera mas rapida su con-vergencia si φ′(ln 2) = 0 y ademas es |φ′′(x)| < |ϕ′′(x)| en dichointervalo.

b) b.1) Para que el metodo sea convergente ha de ser el radio espectral dela matriz A menor que 1.Los cırculos de Gerschgorin de la matriz A vienen dados por

C1 : centro en el origen y radio1

2+

1

3=

5

6

C2 : centro en el origen y radio1

4+

1

5=

9

20

C2 : centro en el origen y radio α +1

6

Como el radio del tercer cırculo puede oscilar en el intervalo

[0 + 1/6, 1/2 + 1/6] = [1/6, 2/3]

los dos ultimos estan incluidos dentro del primero, por lo que elmodulo de cualquiera de sus autovalores es menor que 5/6 < 1, esdecir, el radio espectral de la matriz A es ρ(A) < 1 y, por tanto, elmetodo es convergente.

Page 201: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Ejercicios propuestos 201

b.2) Dado que, a la vista de los cırculos de Gerschgorin, los autovalorestienen modulos menores o iguales a 5/6 < 1, la matriz A no puedetener el autovalor 1.

b.3) El metodo nos dice que si x es el vector al que converge, se verificaque

x = Ax ⇐⇒ Ax = 1 · x

por lo que si converge a un vector x 6= 0 resultarıa que dicho vectorserıa un autovector de la matriz A asociado al autovalor 1 y, dadoque 1 no es autovalor de la matriz, el metodo no puede convergera ningun vector no nulo, por lo que limxn = 0 es decir, el metodoconverge al vector nulo.

b.4) Al ser |0.6130| > | − 0.3065 ± 0.0352 i|, el autovalor real es domi-nante y, por tanto, podemos aproximarlo mediante el metodo de lapotencia simple.

Al aplicar el metodo de la potencia simple (sin escalar los vectores),es evidente que convergera al vector nulo, por lo que si hacemosun numero excesivo de iteraciones podrıa el ordenador ir anulandotodas sus coordenadas, obtener en dicha iteracion el vector nulo yno permitir el calculo del autovalor.

Si escalamos los vectores evitamos que converja al vector nulo, porlo que lo hara a un vector que tiene la direccion del autovectorasociado al autovalor dominante y podremos calcular este ultimo.

Al escalar por la coordenada de mayor valor absoluto el proceso per-mite calcular el autovalor y la sucesion de vectores que obtenemostendra siempre su mayor coordenada igual a 1.

4.8 Ejercicios propuestos

Ejercicio 4.8 Realizar la descomposicion de Schur de la matriz

A =

−6 9 3

−2 3 1

−4 6 2

.

Sol :

0 0 −7√

14√5

0 0 − 17√5

0 0 −1

con U =1√70

14 6 2√

5

0 5 −3√

5

2√

14 −3 −√

5

.

Page 202: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

202 Autovalores y autovectores

Ejercicio 4.9 Dada la matriz A =

a 1 1

1 a 1

1 1 a

donde a es un numero com-

plejo cualquiera, se pide:

a) Obtener su polinomio caracterıstico.

Sol : P (λ) = λ3 − 3aλ2 + 3(a2 − 1)λ− (a3 − 3a + 2).

b) Probar que tiene por autovalores: λ = a− 1 doble y λ = a + 2 simple.

c) Calcular los autovectores y comprobar que no dependen de a.

Sol : v1 = (1, 0,−1)T , v2 = (0, 1,−1)T , v3 = (1, 1, 1)T .

Ejercicio 4.10 Dada la matriz A =

2− i 0 −2 + 4i

0 4− 5i 2− 4i

−2 + 4i 2− 4i 3− 3i

, se pide:

a) Probar que es normal.

b) Obtener su primera componente hermıtica H1 y calcular el polinomiocaracterıstico de dicha componente.

Sol : H1 =

2 0 −2

0 4 2

−2 2 3

, P (λ) = λ3 − 9λ2 + 18λ.

c) Calcular los autovalores y los autovectores de H1.

Sol :

λ1 = 0 v1 = (2,−1, 2)T

λ2 = 3 v2 = (2, 2,−1)T

λ3 = 6 v3 = (−1, 2, 2)T

.

d) Teniendo en cuenta que estos autovectores tambien lo son de la matrizH2 (segunda componente hermıtica), calcular sus autovalores.

Sol : µ1 = 3, µ2 = −3, µ3 = −9.

e) Obtener, a partir de los resultados anteriores, los autovalores y autovec-tores de A, ası como la matriz de paso unitaria U tal que U∗AU = D.

Sol :

λ1 = 3i v1 = (2,−1, 2)T

λ2 = 3− 3i v2 = (2, 2,−1)T

λ3 = 6− 9i v3 = (−1, 2, 2)T

U =

2/3 2/3 −1/3

−1/3 2/3 2/32/3 −1/3 2/3

.

Page 203: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Ejercicios propuestos 203

Ejercicio 4.11 Dada la matriz A =

(2 1

1 0

)se pide:

a) Calcular su polinomio caracterıstico por el metodo interpolatorio.

Sol : λ2 − 2λ− 1.

b) Tomar una aproximacion, con dos cifras decimales exactas, del mayor delos autovalores y afinarla con el cociente de Rayleigh.

Sol : λ = 1 +√

2 ' 2.41 =⇒ λ ' 2.41421.

Ejercicio 4.12 Dada la matriz A =

1 2 3

2 2 3

3 3 3

a) Hallar sus autovalores mediante el algoritmo QR.

Sol : Se obtienen con MatLab 7.5165, −1.1776, −0.3389.

b) Hallar el autovalor de mayor valor absoluto, por el metodo de la potencia,partiendo del vector (10, 11, 1)

Sol : 7.51653848519179, ‖E‖ ≤ 6.280369834735101 · 10−15.

Ejercicio 4.13 Sea λ = α + iβ, α, β ∈ R, autovalor de la matriz

A =

(2i −2

2 2i

).

a) Utilizar el teorema de Gerschgorin para probar que el unico autovalorreal de la matriz A solo puede ser λ = 0.

b) Probar que A∗ = −A y deducir, a partir de ello, que A es una matriznormal. ¿Puede no ser diagonalizable una matriz compleja que verifiqueesa relacion?

Sol : No. Siempre es diagonalizable.

c) Utilizar la descomposicion hermıtica de la matriz, A = H1 + iH2, paradeducir que la parte real de los autovalores de A tiene que ser α = 0.

Sol : Basta observar que H1 es la matriz nula.

Page 204: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

204 Autovalores y autovectores

d) Hallar el autovalor dominante de la componente hermıtica H2 aplicandoel metodo de la potencia. ¿Quien es el autovalor dominante de A?

Sugerencia: Iniciar el metodo con el vector v1 = (1, 0)T .

Sol : 4i en ambos casos.

e) Si se perturba la matriz A en la matriz

A + δA =

((2− 10−3) i −2

2 (2 + 10−2) i

),

hallar la norma euclıdea de la matriz δA. ¿Puedes encontrar una cotadel error E = |µ− λ|, transmitido al autovalor dominante?

Indicacion: |µ− λ| ≤ ‖P‖ ‖P−1‖ ‖δA‖, siendo P−1AP diagonal.

Sol : ‖δA‖ = 10−2, |λ− µ| ≤ 10−2.

Ejercicio 4.14

a) Probar que las raıces del polinomio P (λ) = a + bλ + cλ2 + λ3 son los

autovalores de la matriz A(p) =

0 1 0

0 0 1

−a −b −c

.

Sol : P (λ) es el polinomio caracterıstico de A(p).

b) Si el metodo de la potencia simple aplicado a la matriz A(p) converge aun vector v, ¿que relacion tiene v con las raıces del polinomio P (λ)?

Sol : La raız de mayor modulo de P (λ) viene dada porvT A(p)v

vT v.

c) Si el algoritmo QR aplicado a la matriz A(p) converge a una matriztriangular T , ¿que relacion tiene T con las raıces del polinomio P (λ)?

Sol : Sus elementos diagonales son las raıces del polinomio.

d) Si se puede obtener la factorizacion LU de la matriz PA(p), siendo Puna matriz de permutacion, ¿quienes tienen que ser P, L y U?

Sol : P =

0 0 1

1 0 0

0 0 1

, L = I y U =

−a −b −c

0 1 0

0 0 1

.

Page 205: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Ejercicios propuestos 205

Ejercicio 4.15 Sean el polinomio p(x) = x3+2x2−2x−4 y su correspondientematriz A = A(p), definido en el ejercicio 4.14

a) Utilizar una sucesion de Sturm para probar que el polinomio p(x) tienesus raıces reales y que solo una de ellas, que denotaremos α, es positiva.

Sol : α ∈ [1, 2].

b) Utilizar el metodo de Newton para obtener una aproximacion de la raızα, garantizando 5 cifras decimales exactas.

Sol : α = 1.41421, ε ≤ 8.481 · 10−9.

c) Obtener la pseudosolucion, β, del sistema (A2v)x = A3v, determinandola norma del error, para v = (1, 1, 1)T . ¿Deberıa ser β una aproximacionde α?

Sol : β = −1.71428, ‖E‖ ≤ 14.6385. A2vx = A3v ⇐⇒ Av = xv βhubiese sido una aproximacion de α si v lo hubiese sido del autovectorasociado a α.

d) Obtener la matriz de Householder que transforma el vector a = (0, 0, 4)T

en el vector b = (4, 0, 0)T . ¿Se podıa haber predicho el resultado?

Sol : H =

0 0 1

0 1 0

1 0 0

y se podrıa haber predicho.

e) Obtener la factorizacion QR de la matriz A, utilizando el metodo deHouseholder. (Sugerencia: ¡el apartado anterior!)

Sol : Q = H, R =

4 2 −2

0 1 0

0 0 1

.

f) Dar el primer paso del algoritmo QR aplicado a la matriz A. Indicarcomo podrıa el metodo de Gram-Schmidt utilizarse para los sucesivospasos del algoritmo y si esto serıa una buena decision para obtener lasraıces del polinomio p(x).

Sol : A1 =

−2 4 2

0 0 1

1 0 0

. Gram-Schmidt no es una buena opcion.

Page 206: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

206 Autovalores y autovectores

Ejercicio 4.16

a) ¿Que pasos se dan para calcular los autovalores de una matriz cuadradaA mediante el algoritmo QR? y ¿que forma tiene la matriz a la queconverge el algoritmo en los siguientes casos?

a.1) Si todos sus autovalores tienen distinto modulo.

a.2) Si existen autovalores de igual modulo.

b) El polinomio caracterıstico de la matriz A =

−4 2 −4 3

1 0 0 0

0 1 0 0

0 0 1 0

es

el polinomio del Ejercicio 1.11 P (x) = λ4+4λ3−2λ2+4λ−3. Calculandosus autovalores mediante el algoritmo QR el proceso converge a la matriz

−4.64575131106459 4.07664693269566 1.32820441231845 −2.21143157264058

0 −0.24888977635522 −0.86635866374600 0.589880790501080 1.22575806673700 0.24888977635522 0.038489788258900 0 0 0.64575131106459

Calcular, a partir de dicha matriz, las raıces del polinomio (autovaloresde A).

Sol : −4.64575131106459, 0.64575131106459, i,−i.

c) Al aplicar el metodo de la potencia y comenzando el proceso con el vec-

tor x =

1

1

1

1

se obtiene en la cuarta iteracion el vector

1

−0.2152

0.0463

−0.0100

.

Determinar una aproximacion de la raız de mayor valor absoluto del po-linomio P (x) (autovalor correspondiente) utilizando el cociente de Ray-leigh.

Sol : −4.64565808596372.

Ejercicio 4.17 Sean las matrices A, An y B definidas como:

A =

0 1 0

0 0 1

3 1 0

, An =

1.671 0.242 2.164

0.00 −0.50 1.47

0.00 −0.81 −1.16

y B =

0 1 0

0 0 1

3 1 0.1

.

Page 207: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Ejercicios propuestos 207

a) Aplicando el algoritmo QR real a la matriz A se obtiene (iterando sufi-cientemente), como aproximacion “aceptable” del metodo, la matriz An.¿Por que las matrices A y An deben tener los mismos autovalores?

Hallar las aproximaciones de los autovalores de la matriz A que se ob-tienen de An.

Sol : 1.671, −0.83 + 1.04 i, −0.83− 1.04 i.

b) Tomando v0 aleatoriamente, ¿se debe esperar convergencia o divergenciaen el metodo de la potencia aplicado a la matriz A?

Empezar en v0 = (1, 1, 1)T y determinar los tres primeros vectores v1,v2 y v3 que proporciona el metodo. Hallar la mejor aproximacion delautovalor dominante de A, en norma ‖ ‖2, que se obtiene con v3.

Sol : Se espera convergencia. v1 = (0.25, 0.25, 1)T , v2 = (0.25, 1, 1)T ,v3 = (0.5714, 0.5714, 1)T y una aproximacion del autovalor dominante es1.9259.

c) Estudiar si A es una matriz normal. Si se perturba A en la matrizB = A + δA, hallar la medida de la perturbacion ‖δA‖2.

¿Se podrıa asegurar que los autovalores dominantes de las matrices A yB difieren, a lo mas, en 0.1?

Sol : No es normal. ‖δA‖2 = 0.1. No se puede asegurar.

Ejercicio 4.18 Sean A =

1 1 2

0 1 1

1 −1 ε

con 0 < ε ≤ 1, b =

0

−1

2

y

J =

0 −1 −2

0 0 −1

−1 1 0

.

a) Obtener la factorizacion A = LU . Utilizar la factorizacion obtenida pararesolver el sistema Ax = b.

Sol : L =

1 0 0

0 1 0

1 −2 1

, U =

1 1 2

0 1 1

0 0 ε

, x = (1,−1, 0)T .

b) Hallar el numero de condicion κ∞(A) de la matriz A para la norma ‖ ‖∞.Razonar si el resultado del apartado anterior, obtenido con aritmetica

Page 208: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

208 Autovalores y autovectores

de ordenador, podrıa ser considerado fiable para ε proximo a cero.

Sol : κ∞(A) = 8 +16

ε. No, mientras mas pequeno sea ε, peor condicio-

nada.

c) Para ε = 1, comprobar que J es la matriz de la iteracion xn+1 = J ·xn + c que se obtiene al aplicar el metodo de Jacobi al sistema Ax = b.Determinar c y, empezando en x1 = (1, 0, 0)T , hallar el vector x3.

Sol : x3 = (−1,−2, 1)T .

d) Hallar la aproximacion λ3 del autovalor dominante λ de la matriz Jutilizando el metodo de la potencia, con v0 = (1, 0, 0)T , y el cociente deRayleigh para determinar λ3 con el valor obtenido para v3.

Sabiendo que λ3 tiene una cota de error estimada en e < 0.5. ¿Essuficiente dicha aproximacion para analizar la convergencia de la sucesion(xn) del metodo de Jacobi?

Sol : λ3 = −1.5. Jacobi no converge.

e) Para ε = 0, hallar la solucion en mınimos cuadrados del sistema A′x = bque se obtiene al suprimir la primera columna de A, utilizando las ecua-ciones normales. Determinar el error y justificar el resultado obtenido.

Sol : x = (−2, 1)T , ‖E‖ = 0 pues se trata de un sistema compatibledeterminado

f) Analizar si es posible encontrar la matriz H de Householder que trans-forma la segunda columna de A′ en el vector b. En caso afirmativo, ¿esnormal la matriz H resultante?

Sol : Es posible encontrarla y ademas es normal.

Ejercicio 4.19 Considerese la matriz A =

3 0 −1

1 −2 2

−1 −1 8

.

a) Hacer uso de los cırculos de Gerschgorin para estudiar el numero deautovalores reales que posee.

Obtener su polinomio caracterıstico P (λ) y un intervalo de amplitud 1que contenga a su autovalor dominante.

Sol : Los tres son reales. P (λ) = λ3 − 9λ2 + 3λ + 39. [8, 9].

Page 209: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Ejercicios propuestos 209

b) Comprobar que la formula de Newton-Raphson asociada a dicho polino-mio es

λn+1 = ϕ(λn) =2λ3

n − 9λ2n − 39

3λ2n − 18λn + 3

.

Sabiendo que la grafica de la funcion y = ϕ′(λ) en el intervalo [8, 9]viene dada por la figura adjunta, ¿podemos garantizar la convergenciadel metodo de Newton partiendo de cualquier punto λ0 ∈ [8, 9]?

Nota: ϕ(λ) es la funcion que aparece en la formula de Newton-Raphson.

Sol : Si, ϕ(x) es contractiva.

c) Si tomamos λ0 = 8 ¿con que error se obtiene la aproximacion λ1?

Sol : ε1 ≤ 1.1323 · 10−4.

d) ¿Existe algun vector v0 para el que podamos garantizar la convergenciadel metodo de la potencia simple aplicado a la matriz A? ¿Que aproxi-macion se obtiene para el autovalor dominante aplicando el cociente deRayleigh al vector v1 si partimos de v0 = (1 0 0)T ?

Sol : Cualquiera no nulo. λ1 = 3.7272.

e) Aplicando el metodo QR para el calculo de los autovalores de A, conuna aritmetica de ordenador con una precision de cuatro decimales, elmetodo se estabiliza en la matriz An en la que hemos omitido dos de suselementos x e y

An =

8.0195 −0.5134 2.7121

0 2.7493 1.5431

0 x y

¿Puede ser nulo el elemento x?, ¿se pueden determinar los elementosque faltan sin necesidad de volver a aplicar el algoritmo QR? ¿Sabrıasdecir cual es la aproximacion obtenida para los otros dos autovalores de

Page 210: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

210 Autovalores y autovectores

la matriz A?

Solucion: x = 0, y = −1.7461, λ2 = 2.7493, λ3 = −1.7461.

Ejercicio 4.20 Se considera la matriz A =

0 1 0

0 0 1

−0.25 −0.125 1

.

a) Demostrar que las raıces del polinomio P (x) = 2+x−8x2+8x3 coincidencon los autovalores de A. Acotar y separar las raıces de P (x), indicandocuantas raıces reales y complejas tiene. Comparar los resultados con lainformacion que se desprende del estudio de los cırculos de Gerschgorin.

Sol : La ecuacion caracterıstica es P (x)/8 = 0 ⇐⇒ P (x) = 0. Solo unareal en (−1, 0). Gerschgorin no mejora la informacion.

b) Determinar un intervalo de amplitud 0.5 con un extremo entero quecontenga a la raız negativa de P (x). Razonar si se verifican en dicho in-tervalo las condiciones de Fourier. Aproximar por el metodo de Newton-Raphson dicha raız con 2 cifras decimales exactas.

Sol : En [−0.5, 0] se verifican las condiciones de Fourier. x = −0.38.

c) Tomando como vector inicial z0 = (0, 1, 0)T , realizar dos iteraciones delmetodo de la potencia inversa. Por medio del cociente de Rayleigh aso-ciado al vector hallado, determinar una aproximacion del autovalor de Acorrespondiente. ¿Que relacion existe entre este valor y la aproximacionhallada en el apartado anterior? ¿Puede haber autovalores de la matrizA en el cırculo de centro 0 y radio 1

4? Razonar las respuestas.

Sol : λ = −0.3768. No existen autovalores en dicho cırculo.

d) Al aplicar el algoritmo QR a la matriz A se obtiene como salida la matrizT = Q∗AQ, para cierta matriz unitaria Q. ¿Puede ser T una matriztriangular superior? Justificar la respuesta.

Sol : T no puede ser triangular.

Ejercicio 4.21

a) Utilizar el metodo interpolatorio para determinar el polinomio carac-terıstico P (λ) de la matriz

A =

2 −1 0

0 −2 1

1 0 5

Page 211: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Ejercicios propuestos 211

Sol : P (λ) = λ3 − 5λ2 − 4λ + 21.

b) A la vista de los cırculos de Gerschgorin, ¿se puede garantizar que elalgoritmo QR aplicado a la matriz A convergera a una matriz triangularcon sus autovalores en la diagonal? ¿Se puede garantizar la convergenciadel metodo de la potencia simple si comenzamos a iterar con el vectorv = (1 1 1)T ?

Sol : Gerschgorin no nos garantiza una triangular pero sı la convergenciadel metodo de la potencia simple.

c) Haciendo uso de los cırculos de Gerschgorin, determinar cuantos auto-valores reales posee y calcular un intervalo de amplitud 1 y extremosenteros que contenga al autovalor dominante.

Sol : Los tres son reales y el dominante se encuentra en (4, 5).

d) Comprobar que, en dicho intervalo, se verifican las hipotesis de Fou-rier para la convergencia del metodo de Newton. ¿En que extremo de-berıamos comenzar a iterar?

Sol : x0 = 5

e) Tomando x0 = 5 y aplicando el metodo de Newton, ¿con cuantas cifrasexactas se obtiene x1?

Sol : Dos cifras decimales exactas.

Ejercicio 4.22 Dado el polinomio P (x) = x3 − 3x2 + 3x + 5

a) Probar, mediante una sucesion de Sturm, que solo tiene una raız realy determinar α ∈ Z para que dicha raız este contenida en el intervalo[α, α + 1].

Sol : α = −1.

b) Comprobar, mediante las condiciones de Fourier, que el metodo de New-ton converge tomando como valor inicial x = α.

c) Si tomamos como aproximacion de la raız el valor x = −0.50 ¿se tienegarantizada alguna cifra decimal exacta?

Sol : No.

Page 212: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

212 Autovalores y autovectores

d) Utilizar el metodo interpolatorio para comprobar que el polinomio carac-

terıstico de la matriz A =

3 −3 −5

1 0 0

0 1 0

es el polinomio P (x) dado.

e) Para resolver el sistema (A + 0.5 · I3)x = (1,−1, 1)T observamos queresulta mas comodo llevar la primera ecuacion al ultimo lugar, es decir,

multiplicar el sistema por la matriz P =

0 1 0

0 0 1

1 0 0

. ¿Se altera de

esta forma el condicionamiento del sistema? Comprueba que la soluciones el vector x = 1

21(−50, 58,−74)T .

Sol : No se altera el condicionamiento por ser P ortogonal.

f) Tomando −0.50 como una primera aproximacion de su autovalor real,partiendo del vector z0 = (1,−1, 1)T y trabajando solo con dos cifras de-cimales, realizar una iteracion del metodo de la potencia inversa con des-plazamiento para calcular, mediante el cociente de Rayleigh, una nuevaaproximacion de dicho autovalor. ¿Se puede garantizar ahora alguna ci-fra decimal exacta?

Sol : λ = −0.83. La primera cifra decimal es exacta.

Ejercicio 4.23 Sean A, B y C las matrices definidas por

A =

(−1− i 3− 3i

−3 + 3i −1− i

)B =

1√2

(1 i

i 1

)C =

(2 + 2i 0

0 −4− 4i

)

a) Probar que A∗ = −iA y que B∗ = B−1. ¿Es normal la matriz BCB∗?

Sol : BCB∗ es normal.

b) Comprobar que se verifica la igualdad A = BCB∗. Hallar los autovaloresy autovectores de las componentes hermıticas de la matriz A.

Sol : H1 = H2. Autovalores 2 y -4. Autovectores (1, i)T y (i, 1)T .

c) Probar que si una matriz M verifica la propiedad M∗ = −iM , entonceses normal y sus autovalores son de la forma α + iα, con α ∈ R. ¿Puedela matriz M tener unicamente autovalores reales?

Indicacion: De M = QDQ∗, deducir D∗ = −iD.

Sol : M tendra todos sus autovalores reales solo si es la matriz nula.

Page 213: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Ejercicios propuestos 213

d) Se perturba la matriz A en A+δA, de modo que ||δA||2 ≤ 10−6. Razonarsi los autovalores de A + δA, obtenidos con MatLab, pueden ser muydiferentes de los de la matriz A. ¿Sucederıa lo mismo para una matrizM , con M∗ = −iM y dimension elevada?

Sol : No, |µ− λ| ≤ 10−6 y no depende de la dimension de M .

e) Hallar la aproximacion del autovalor dominante de A que se obtiene conun paso del metodo de la potencia, partiendo de q0 = (1, 0)T , y utilizandoel cociente de Rayleigh.

Explicar como se aplicarıa el algoritmo QR para obtener aproximacionesde los autovalores y autovectores de la matriz A. ¿Cual serıa la formade Schur de A?

Sol : −2.8− 2.8 i. T es diagonal.

Ejercicio 4.24 En R4 se considera el vector a = (1,−1, 1,−1)T .

a) Determinar el valor que debe tomar β ∈ R − {0} para que la matrizQ = I − βaaT verifique la igualdad Q2 = I. Probar que, entonces, Q esuna matriz normal.

Sol : β = 1/2.

b) Utilizar las ecuaciones normales para obtener la solucion en mınimoscuadrados del sistema superdeterminado S1 ≡ Ax = −a, donde x =(x, y)T y la matriz de coeficientes A = [a1 a2] esta formada por las dosprimeras columnas a1, a2 de la matriz B = 2I − aaT .

¿Esta mal condicionada la matriz AT A para la norma || ||∞?

Sol : (1/2,−1/2)T . No puede estar mejor condicionada, ‖AT A‖∞ = 1.

c) Hallar la matriz H de Householder que transforma el vector a2, definidoen el apartado anterior, en un vector de la forma r = (0, σ, 0, 0)T , conσ > 0.

Partir del sistema S2 ≡ HAx = −Ha, para evaluar el error en el sistemaS1 del apartado anterior utilizando, en caso necesario, transformacionesunitarias. Justificar que los sistemas S1 y S2 tienen la misma pseudoso-lucion y el mismo error.

Sol : H = Q (primer apartado). ‖E‖ =√

2. Al tratarse de transforma-ciones unitarias los dos sistemas son equivalentes.

Page 214: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

214 Autovalores y autovectores

d) Para calcular un autovector de la matriz H del apartado anterior, aplicarel metodo de la potencia simple partiendo del vector x = (1, 2, 3, 4)T .¿Por que no funciona el metodo en este caso?

Describir como se aplica el algoritmo QR a la matriz H. En este caso,¿por que no converge a la forma de Schur de H?

Indicacion: ¿Cual es la factorizacion QR de cualquier matriz ortogonal?

Sol : H no tiene un autovalor dominante. Sus autovalores son 1, 1, 1,−1todos de igual modulo. La sucesion resultante es x, Hx, x, Hx, . . . quesolo es convergente si se parte de un autovalor asociado al autovalor 1.El algoritmo QR no converge a la forma de Schur (una diagonal) ya quela sucesion que se obtiene es constante igual a H.

e) Probar que Ha = −a y que si v es ortogonal al vector a, entonces Hv = v.En virtud de esto, encontrar razonadamente los autovalores de H y unautovector v1 asociado al autovalor negativo.

Si {v1} se completara a una base {v1, v2, v3, v4} formada por autovectoresde H, ¿como se podrıa ortonormalizar dicha base de una forma compu-tacionalmente estable?

Sol : -1 simple con autovector a y 1 triple. Se deberıa ortonormalizarmediante transformaciones unitarias (ortogonales).

Ejercicio 4.25

a) Calcular el polinomio caracterıstico de la matriz A =

0 3 0

3 28 4

0 4 5

mediante el metodo interpolatorio. ¿Puede no ser real alguno de susautovalores?

Sol : P (λ) = λ3 − 33λ2 + 115λ + 45. No, ya que A simetrica.

b) Haciendo uso de los cırculos de Gerschgorin, estudiar si resultara conver-gente el metodo de la potencia simple aplicado a la matriz A partiendode un vector arbitrario z0.

Sol : Convergera por existir un autovalor dominante.

c) Realizar la factorizacion QR de la matriz A mediante transformacionesde Householder. (Dar las matrices Q y R).

Page 215: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Ejercicios propuestos 215

Sol : Q =

0 0.6 0.8

1 0 0

0 0.8 −0.6

R =

3 28 4

0 5 4

0 0 −3

.

d) Utilizar la factorizacion anterior para resolver el sistema Ax = b conb = (−3, 6, 1)T .

Sol : x = (10,−1, 1)T .

e) Comenzando por el vector z0 = (−3, 6, 1)T calcular el vector z2 delmetodo de la potencia inversa (al ser solo dos pasos no merece la penaescalar el vector, es decir, dividir en cada paso por su norma infinito) yaproximar el autovalor de menor valor absoluto de la matriz A medianteel cociente de Rayleigh.

Sol : z2 = (−28.1555, 3.3333,−2.4666)T , λ ' −0.3548

f) Teniendo en cuenta que el autovalor de menor valor absoluto es negativo,determinar, haciendo uso del polinomio caracterıstico, una cota del errorde la aproximacion obtenida en el apartado anterior.

Sol : ε ≤ 4.8 · 10−5.

Ejercicio 4.26 Se considera el polinomio P (x) = x3 + 3x2 + 3ax + a cona ∈ R.

a) Hacer uso de una sucesion de Sturm para determinar, en funcion delparametro “ a”, el numero de raıces reales de dicho polinomio ası comosu multiplicidad.

Sol :

a < 0 =⇒ tres raıces reales.

a = 0 =⇒ una real doble (0) y una real simple (-3).

0 < a < 1 =⇒ una real simple y dos complejas conjugadas.

a = 1 =⇒ una real triple (-1).

a > 1 =⇒ una real simple y dos complejas conjugadas.

b) Para a = 3, determinar un intervalo adecuado en el que se encuentrela raız real del polinomio y en el que se verifiquen las condiciones deFourier para garantizar la convergencia del metodo de Newton. ¿Quevalor debemos dar inicialmente a x para comenzar a iterar?

Sol : [−0.5, 0], x0 = 0.

Page 216: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

216 Autovalores y autovectores

c) Realizar dos iteraciones del metodo de Newton y determinar una cotadel error.

Sol : x2 = −0.3737373737, ε2 ≤ 4.739279 · 10−4.

d) Teniendo en cuenta que la matriz A =

−3 −9 −3

1 0 0

0 1 0

tiene, como

polinomio caracterıstico, el polinomio P (x) cuando a = 3, ¿podemosgarantizar la convergencia del metodo de la potencia simple? ¿y del dela potencia inversa?

Sol : La potencia simple no (los autovalores complejos tienen modulomayor que el real), pero el de la potencia inversa sı.

e) ¿Convergera a una matriz triangular superior el algoritmo QR aplicandoaritmetica real a la matriz A?

Sol : No, lo hara a una triangular por bloque con un bloque de orden 2(las dos raıces complejas conjugadas).

Ejercicio 4.27 Se considera la matriz A =

4 5 3

3 5 1

0 2 3

.

a) Realizar la factorizacion QR (dar las matrices Q y R) de la matriz A:

a.1) Mediante rotaciones o giros

a.2) Mediante reflexiones

Sol : Q =1

25

20 15 0

−3√

5 4√

5 10√

5

6√

5 −8√

5 5√

5

R =

5 7 3

06√

5√

5

0 0√

5

.

b) Determinar su polinomio caracterıstico por el metodo interpolatorio.

Sol : P (λ) = λ3 − 12λ2 + 30λ− 25.

c) Probar, mediante una sucesion de Sturm, que A solo tiene un autovalorreal y que se encuentra en el intervalo [8,9].

d) Sabiendo que el producto de los autovalores de una matriz coincide consu determinante, probar que A posee un autovalor dominante.

Page 217: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Ejercicios propuestos 217

e) Partiendo del vector z0 = (1, 1, 1)T realizar dos iteraciones del metodode la potencia simple (trabajar con 2 cifras decimales) y utilizar z2 paraaproximar el autovalor real de la matriz A.

Solucion: λ ' 8.95.

f) ¿Se ha obtenido, en el apartado anterior, la aproximacion del autovalorreal con un error menor que 10−2?

Sol : ε ≤ 0.04 < 10−1 por lo que solo se dispone de un decimal exacto.

Ejercicio 4.28 Sea la matriz A =

2 −2 0

2 3 ω

1 0 2

a) Para ω = −3, se pide:

a.1) Utilizar los cırculos de Gerschgorin por filas para probar que Acarece de autovalores mayores que 10. De la observacion de dichoscırculos, ¿puede deducirse que A tiene un autovalor de maximomodulo?

Sol : No puede garantizarse la existencia de un autovalor dominante.

a.2) Demostrar que el metodo de Gauss-Seidel aplicado al sistemaAx = (1, 3

4, 0)T es convergente empezando con cualquier vector

x0 ∈ R3. Hacer dos iteraciones de dicho metodo partiendo delvector x0 = (−1

2, 5

4, 1

3)T y hallar la norma del error.

Sol : Es convergente por ser ρ(L1) < 1. x2 = (−1/12,−41/72, 1/24)T ,‖E‖ = 2.987241.

b) Para ω = 0, se pide:

b.1) Partiendo del vector z0 = (1, 1, 1)T , aplicar el metodo de la potenciainversa a la matriz A haciendo dos iteraciones y usar el cociente deRayleigh para aproximar el autovalor de menor modulo de A.

Sol : λ = 2.5.

b.2) Siendo F =

1 0

0 −1

0 −1

y B = AF , hallar la pseudosolucion del sis-

tema Bx=

2

7

4

resolviendo el sistema formado por las ecuaciones

Page 218: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

218 Autovalores y autovectores

normales usando el metodo de Cholesky. Calcular la norma delerror.

Sol : Las ecuaciones normales son

(9 −4

−4 17

)x =

(22

−25

).

Para la facrorizacion de Cholesky R =

(4 −4/3

0√

137/3

). La pseu-

dosolucion es (2,−1)T y el error ‖E‖ = 0.

Ejercicio 4.29 Consideremos la matriz A =

4

9+

4

9i

2

9i

2

9

5

9+

5

9i

. Se pide:

a) Hallar las componentes hermıticas de la matriz A y probar que esta esnormal.

Sol : H1 = H2 =

(49

19

+ 19i

19− 1

9i 5

9

).

b) A partir de H1, construir una matriz S real y simetrica, de dimension eldoble de la de H1, de forma que a partir de los autovalores y autovectoresde S se deduzcan los de H1.

Sol :

4/9 1/9 0 −1/91/9 5/9 1/9 0

0 1/9 4/9 1/9

−1/9 0 1/9 5/9

c) Usando MATLAB se tiene que el polinomio caracterıstico de la matriz

S es

P (λ) = λ4 − 2λ3 +13

9λ2 − 4

9λ +

4

81

Sin realizar ningun calculo ¿podrıas garantizar que P (λ) es el cuadradode un polinomio de segundo grado?.

Sol : Sı. Las raıces de P (λ) son los autovalores de H1 pero todos dupli-cados.

d) Reducir la multiplicidad de las raıces de P (λ) y encontrar una sucesionde Sturm para el polinomio reducido Q(λ).

Sol : Q(λ) = λ2 − λ + 2/9. g0(λ) = Q(λ), g1(λ) = 2λ− 1 y g2(λ) = 1.

Page 219: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Ejercicios propuestos 219

e) Haciendo uso de la sucesion de Sturm, separar las raıces de Q(λ).

Sol : [0, 1/2] y [1/2, 1].

f) Encontrar un intervalo que contenga a la menor de las raıces de Q(λ)y en el que se pueda garantizar la convergencia del metodo Newton.Determina las raıces exactas de Q(λ).

Sol : [0, 0.4]. Las raıces son 1/3 y 2/3.

g) En virtud de los resultados anteriores, calcular los autovalores y auto-vectores de la matriz A.

Sol : Autovalores λ1 = 1/3 + 1/3 i y λ2 = 2/3 + 2/3 i. Autovectoresv1 = (1 + i,−1)T y v2 = (1 + i, 2)T respectivamente.

Ejercicio 4.30 Se considera la matriz A =

1 −1 1

−1 2 1

1 2 2

a) Calcular su polinomio caracterıstico por el metodo interpolatorio.

Sol : P (λ) = λ3 − 5λ2 + 4λ + 5.

b) Separar sus raıces mediante una sucesion de Sturm.

Sol : [−1, 0], [2, 3] y [3, 4].

c) ¿Convergera el metodo de la potencia simple comenzando por el vectorx0 = (1, 1, 1)T ? Justifica la respuesta.

Sol : Si por tener un autovalor dominante.

d) Realiza dos iteraciones del metodo de la potencia simple comenzando porel vector x0 = (1, 5, 8)T y aproxima el autovalor dominante mediante elcociente de Rayleigh.

Sol : λ ' 3.38685028129986.

e) Realiza dos iteraciones del metodo de la potencia inversa comenzandopor el vector x0 = (6, 5,−6)T . ¿De quien es una aproximacion x2?

Sol : x1 = (−10,−7, 9)T , x2 = (15, 11,−14)T . Es una aproximacion delautovector asociado al autovalor de menor valor absoluto.

Page 220: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion
Page 221: Apuntes de ALGEBRA NUM ´ ERICA´ para la titulacion dema1.eii.us.es/Material/Alg_Num_ii_Ap.pdf · E.T.S. DE INGENIER´IA INFORMATICA´ Apuntes de ALGEBRA NUM´ ERICA´ para la titulacion

Bibliografıa

[1] Burden, R.L. y Faires, J.D. Analisis Numerico (Sexta edicion). Interna-cional Thomson Ed. 1998.

[2] Golub, G.H. y Van Loan, C.F. Matrix Computations (Third edition). JohnsHopkins University Press

[3] Hager, W. Applied Numerical Linear Algebra. Ed. Prentice-Hall Interna-tional. 1988.

[4] Kincaid, D. y Cheney, W. Analisis Numerico. Ed. Addison-Wesley Ibe-roamericana. 1994.

[5] Noble, D. y Daniel, J.W. Algebra Lineal Aplicada. Ed. Prentice-Hall. 1989.

[6] Watkins, D.S. Fundamentals of MATRIX Computations. John Wiley &Sons. 1991.

221