Fisica Conceptos y Aplicaciones - Paul Tippens - Septima Edicion

7
Determinaci´ on Num´ erica de Eigenvalores y Eigenvectores. Jos´ e Mar´ ıa Rico Mart´ ınez Departamento de Ingenier´ ıa Mec´ anica. Universidad de Guanajuato, F. I. M. E. E. Calle Tampico No. 912, Col. Bellavista. CP 36730, Salamanca, Gto., M´ exico Tel. +52-464-6480911, Fax: +52-464-6472400. E-mail: [email protected] 1 Introducci´ on Estas notas tienen como objetivo presentar los conceptos fundamentales de la teor´ ıa de Eigenvalores y Eigen- vectores, tambi´ en conocidos como valores y vectores carater´ ısticos o como valores y vectores propios, de una matriz cuadrada, as´ ı como una revisi´on somera de los m´ etodos num´ ericos empleados para su determinaci´ on. 2 Establecimiento del problema y definiciones. Considere una matriz A n×n dada por A = a 11 a 12 a 13 ... a 1n a 21 a 22 a 23 ... a 2n a 31 a 32 a 33 ... a 3n . . . . . . . . . . . . . . . a n1 a n2 a n3 ... a nn (1) Definici´on: Eigenvalor y Eigenvector. Un vector b n , tal que b = 0, se dice que es un eigenvector, vector propio o vector caracter´ ıstico, de la matriz A si y s´olo si 1 A b = λ b, donde λ C. (2) Adem´as, se dice que el escalar λ es el eigenvalor, valor propio o valor characteristico de la matriz A asociado al eigenvector b; de manera rec´ ıproca, se dice que b es un eigenvector de A asociado al eigenvalor λ. Debe notarse que, a´ un cuando la matriz A es real, los eigenvalores asociados a la matriz pueden ser n´ umeros complejos. Teorema I. El conjunto de todos los eigenvectores b asociados al eigenvalor λ constituyen un subespacio vectorial de n , concido como el eigenespacio asociado al eigenvalor λ. Prueba: Es suficiente mostrar que el conjunto de vectores E = { b n | A b = λ b} est´a cerrado respecto a la adici´on de vectores y la multiplicaci´on por escalar. 1 Debe notarse que la ecuaci´on (2) requiere necesariamente que la matriz deba ser cuadrada. 1

Transcript of Fisica Conceptos y Aplicaciones - Paul Tippens - Septima Edicion

Page 1: Fisica Conceptos y Aplicaciones - Paul Tippens - Septima Edicion

Determinacion Numerica de Eigenvalores y Eigenvectores.

Jose Marıa Rico MartınezDepartamento de Ingenierıa Mecanica.

Universidad de Guanajuato, F. I. M. E. E.Calle Tampico No. 912, Col. Bellavista.

CP 36730, Salamanca, Gto., MexicoTel. +52-464-6480911, Fax: +52-464-6472400.

E-mail: [email protected]

1 Introduccion

Estas notas tienen como objetivo presentar los conceptos fundamentales de la teorıa de Eigenvalores y Eigen-vectores, tambien conocidos como valores y vectores caraterısticos o como valores y vectores propios, de unamatriz cuadrada, ası como una revision somera de los metodos numericos empleados para su determinacion.

2 Establecimiento del problema y definiciones.

Considere una matriz A ∈ �n×n dada por

A =

⎡⎢⎢⎢⎢⎢⎣

a11 a12 a13 . . . a1n

a21 a22 a23 . . . a2n

a31 a32 a33 . . . a3n

......

......

...an1 an2 an3 . . . ann

⎤⎥⎥⎥⎥⎥⎦

(1)

Definicion: Eigenvalor y Eigenvector. Un vector �b ∈ �n, tal que �b �= �0, se dice que es un eigenvector,vector propio o vector caracterıstico, de la matriz A si y solo si1

A�b = λ�b, donde λ ∈ C. (2)

Ademas, se dice que el escalar λ es el eigenvalor, valor propio o valor characteristico de la matriz Aasociado al eigenvector �b; de manera recıproca, se dice que �b es un eigenvector de A asociado al eigenvalor λ.Debe notarse que, aun cuando la matriz A es real, los eigenvalores asociados a la matriz pueden ser numeroscomplejos.

Teorema I. El conjunto de todos los eigenvectores �b asociados al eigenvalor λ constituyen un subespaciovectorial de �n, concido como el eigenespacio asociado al eigenvalor λ.

Prueba: Es suficiente mostrar que el conjunto de vectores

E = {�b ∈ �n | A�b = λ�b}

esta cerrado respecto a la adicion de vectores y la multiplicacion por escalar.1Debe notarse que la ecuacion (2) requiere necesariamente que la matriz deba ser cuadrada.

1

Page 2: Fisica Conceptos y Aplicaciones - Paul Tippens - Septima Edicion

1. Sean �b1,�b2 ∈ E, por lo tantoA�b1 = λ�b1 y A�b2 = λ�b2

Puesto que la multiplicacion de matrices es una operacion lineal, se tiene que

A(�b1 +�b2

)= A�b1 + A�b2 = λ�b1 + λ�b2 = λ

(�b1 +�b2

)

por lo tanto, el conjunto esta cerrado respecto de la adicion.

2. Sea �b1 ∈ E y μ ∈ �, por lo tantoA�b1 = λ�b1.

Puesto que la multiplicacion de matrices es una operacion lineal, se tiene que

A(μ�b1

)= μA�b1 = μλ�b1 = λμ�b1 = λ

(μ�b1

).

por lo tanto, el conjunto esta cerrado respecto a la multiplicacion por escalar.

Estas dos pruebas parciales verifican que el conjunto de todos los eigenvectores �b asociados al eigenvalor λconstituyen un subespacio vectorial de �n

Considere ahora la ecuacion (2), que puede reescribirse de la siguiente forma

A�b = λ�b, o A�b = Inλ�b, o [A− λIn]�b = �0 (3)

donde In es la matriz identidad de orden n. Puesto que, por definicion, �b �= �0, la unica posibilidad para quela ecuacion (3) se satisfaga es que, la matriz [A − λIn] sea singular y que �b sea un elemento del espacio nulo okernel de la matriz. Una condicion necesaria y suficiente para que la matriz [A − λIn] sea singular es que sudeterminante sea cero; es decir

p(λ) =| A− λIn |= 0. (4)

Expandiendo el determinante de la ecuacion (4), se obtiene una ecuacion polinomial real de n-esimo orden en λ.Esta ecuacion se denomina la ecuacion caracterıstica de la matriz A. Las raices de la ecuacion caracterısticason los eigenvalores de la matriz y los vectores que satisfacen la ecuacion (3) son los eigenvectores asociados alos eigenvalores respectivos.

Es importante senalar que si la matriz A es real, la ecuacion caracterıstica de orden n es real. Del teoremafundamental del algebra, se sabe que la ecuacion (4) tiene n raices cuando se analiza en el campo de los numeroscomplejos, tomando en cuenta la multiplicidad de una raiz; es decir, cuantas veces aparece como repetida unaraiz. Ademas, si la ecuacion (4) tiene una raiz compleja o imaginaria, el complejo conjugado de esa raiz, tambienes raiz de la ecuacion. En otras palabras, las raices complejas o imaginarias de una ecuacion polinomial realsiempre aparecen como pares conjugados.

3 Metodo directo de determinacion de los eigenvalores y eigenvec-

tores de una matriz.

Las observaciones indicadas al termino de la seccion 2, constituyen las bases de la determinacion de eigenvaloresy eigenvectores por el metodo directo. Los pasos necesarios para esta determinacion se indican a continuacion.

1. Determine la ecuacion caracterıstica de la matriz; es decir determine

p(λ) =| A − λIn |= 0.

2. Encuentre las n raices de la ecuacion caracterıstica. Estas raices son los eigenvalores de la matriz.

2

Page 3: Fisica Conceptos y Aplicaciones - Paul Tippens - Septima Edicion

3. Para cada uno de los eigenvalores determine el subespacio solucion de la ecuacion

[A − λIn]�b = �0.

Estos subespacios solucion constituyen el eigenespacio asociado al eigenvalor λ.

3.1 Ejemplo 1.

Considere la matriz dada por

A =

⎡⎢⎢⎢⎢⎢⎣

8 2 4 1

2 6 −2 1

4 3 −8 0

−2 3 4 5

⎤⎥⎥⎥⎥⎥⎦

La ecuacion caracterıstica de la matriz A esta dada por

0 =| A− λI4 |= p(λ) = −1636 + 756 λ− 49 λ2 − 11 λ3 + λ4

La figura 1 muestra la grafica de la ecuacion caracterıstica, es evidente, de la figura que existen 4 raices realesLas raices de la ecuacion caracterıstica y, por lo tanto, los eigenvalores de la matriz A estan dadas por

2,000

10

−2,000

−4,000

1,000

lambda

0

−1,000

−3,000

86420−2−4−6−8

Figure 1: Grafica de la Ecuacion Caracterıstica de la Matriz A.

λ1 = −8.382430513, λ2 = 3.094656787, λ3 = 6.339424118, λ4 = 9.948349608.

Para la determinacion de los eigenvectores asociados a λ1 = −8.382430513, se tienen que realizar los siguien-tes calculos.

1. Determinar la matriz A− λ1 I4, dada por

A − λ1 I4 =

⎡⎢⎢⎢⎢⎢⎣

16.38243051 2 4 1

2 14.38243051 −2 1

4 3 0.382430513 0

−2 3 4 13.38243051

⎤⎥⎥⎥⎥⎥⎦

3

Page 4: Fisica Conceptos y Aplicaciones - Paul Tippens - Septima Edicion

2. Obtener la forma escalonada reducida de la matriz A − λ1 I4, dada por⎡⎢⎢⎢⎢⎢⎣

16.38243051 2.0 4.0 1.0

0 14.13826650 −2.488328029 0.8779179928

0 0 5.059299318 13.30306562

0 0 0 0.0000000009

⎤⎥⎥⎥⎥⎥⎦

Este resultado parece contradictorio, si los calculos se hubieran realizado de manera exacta, la matrizA − λ1 I4 debe ser singular, y el termino (4, 4) de la forma escalonada reducida deberıa ser igual a 0. Ladiferencia es el resultado de no realizar los calculos de manera exacta.

3. Despreciando el error indicado en el punto anterior, el eigenvector asociado al eigenvalor λ1 esta dado porla solucion del sistema

⎡⎢⎢⎣

16.38243051 2.0 4.0 1.0

0 14.13826650 −2.488328029 0.8779179928

0 0 5.059299318 13.30306562

⎤⎥⎥⎦

⎡⎢⎢⎣

x1

x2

x3

x4

⎤⎥⎥⎦ =

⎡⎣

000

⎤⎦

La solucion esta dada por

�bλ1 =[ −0.2453188593 0.1996149746 1 −0.3803107842

]T.

Es importante senalar que cualquier multiplo escalar de �bλ1 es igualmente un eigenvector de la matriz Aasociado al eigenvalor λ1.

Procediendo de manera semejante con los restantes eigenvalores, se tiene que

1. Para λ2 = 3.094656787, se tiene que

�bλ2 =[

0.06478833904 −0.4579574956 −0.1004735120 1]T

.

2. Para λ3 = 6.339424118, se tiene que

�bλ3 =[ −0.5802494150 0.2153771052 −0.1168015068 1

]T.

3. Para λ4 = 9.948349608, se tiene que

�bλ4 =[

1 0.3756429166 0.2856490351 0.05446763308]T

.

4 Determinacion de Eigenvalores y Eigenvectores de Matrices Si-metricas.

Esta seccion inicia definiendo de manera formal una matriz simetrica.Definicion. Una matriz A ∈ �n×n se dice que es simetrica, si y solo si, su transpuesta es igual a la matriz

original, es decir:AT = A.

Si la matriz cuyos eigenvalores y eigenvectores se desea determinar es simetrica, entonces es posible encontrarinteresantes resultados teoricos que simplifican esa determinacion. Por ejemplo, en la seccion 2, se comento que

4

Page 5: Fisica Conceptos y Aplicaciones - Paul Tippens - Septima Edicion

los eigenvalores de una matriz real pueden ser reales o complejos, sin embargo, si la matriz es simetrica, puedeprobarse que todos sus eigenvalores son reales. Sin embargo, para probar estos resultados, es necesario emplearalgunos resultados acerca de matrices definidas sobre el campo de los numeros complejos y de espacios vectorialescomplejos.

Definicion. Considere el espacio vectorial Cn, definido sobre el campo de los numeros complejos, C, esposible definir la siguiente forma cuadratica

q : Cn → � q(�v) = �v∗�v,

donde la barra indica la transpuesta conjugado del vector.Es necesario probar que la imagen de este mapeo es efectivamente un numero real

q(�v) = �vT�v =

n∑j=1

vjvj =n∑

j=1

(aj + i bj)(aj + i bj) =n∑

j=1

(a2j + b2

j) ∈ �

Teorema II. La forma cuadratica definida en la definicion anterior es positiva definida.Prueba: Es evidente que

q(�v) ≥ 0 ∀�v ∈ Cn.

En particular, si q(�v) = 0, entonces

n∑j=1

(a2j + b2

j) = 0 ⇔ aj = bj = 0 ∀j = 1, 2, . . . , n.

Por lo tanto,q(�v) = 0 ⇔ �v = �0.

Ahora se analizaran algunas propiedades de matrices complejas.Definicion. Considere el algebra de matrices cuadradas, Cn×n, definidas sobre el campo de los numeros

complejos. Una matriz A ∈ Cn×n se denomina hermitiana si

A∗

= A.

Donde, A∗

representa la transpuesta conjugada de la matrix A. Es decir, una matriz es hermitiana, si la matrizes igual a su transpuesta conjugada.

Puesto que el campo de los numeros reales es un subcampo de los numeros complejos, � < C, entonces sia ∈ �, entonces a = a, y se tiene el siguiente resultado.

Teorema III. Una matriz simetrica, real, es una matriz hermitiana.Prueba: Suponga que A ∈ �n×n < Cn×n es simetrica, entonces A

∗= AT , y se tiene que

A∗

= AT = A.

por lo tanto es hermitiana.Teorema IV. Sea A ∈ Cn×n una matriz hermitiana. Entonces

1. �x∗A �x es un numero real para todo �x ∈ Cn, y

2. Todos los eigenvalores de A son reales.

Prueba: Para la primera parte, considere el numero complejo

(�x∗A �x

)∗= �x

∗A

∗�x∗∗

= �x∗A �x

5

Page 6: Fisica Conceptos y Aplicaciones - Paul Tippens - Septima Edicion

puesto que el numero complejo satisface la propiedad de que su conjugado es igual al numero, entonces elnumero “complejo” es, en realidad, un numero real.

Para la segunda parte considere, un eigenvalor λ de la matriz A hermitiana y sea �x un eigenvector de Aasociado a λ y con la propiedad que su forma cuadratica q(�x) = �x

∗�x = 1, entonces

A �x = λ�x

Ademasλ = λ�x

∗�x = �x

∗λ�x = �x

∗A �x.

Debe notarse que por el primer resultado de este teorema λ es un numero real.Debe recordarse que como indica el Teorema III, todas las matrices simetricas son hermitianas, de manera

que todos los resultados del Teorema IV son aplicables a todas las matrices simetricas.Puede, ademas, mostrarse que si la matriz es simetrica los eigenvectores son ortogonales, sin embargo, la

prueba de este resultado requiere de conceptos bastante mas complicados.

4.1 Ejemplo 2.

Considere la matriz dada por

A =

⎡⎢⎢⎢⎢⎢⎣

8 2 4 1

2 6 −2 1

4 −2 −8 0

1 1 0 5

⎤⎥⎥⎥⎥⎥⎦

La ecuacion caracterıstica de la matriz A esta dada por

0 =| A− λI4 |= p(λ) = −2444 + 946 λ− 60 λ2 − 11 λ3 + λ4

La figura 2 muestra la grafica de la ecuacion caracterıstica, es evidente, de la figura que existen 4 raices realesLas raices de la ecuacion caracterıstica y, por lo tanto, los eigenvalores de la matriz A estan dadas por

2

1,000

−1,000

−2

−3,000

−6

lambda

10864

3,000

2,000

0

0

−2,000

−4,000

−4

−5,000

−6,000

−8−10

Figure 2: Grafica de la Ecuacion Caracterıstica de la Matriz A.

6

Page 7: Fisica Conceptos y Aplicaciones - Paul Tippens - Septima Edicion

λ1 = −9.325502313, λ2 = 4.446795311, λ3 = 5.915205526, λ4 = 9.963501476.

Para la determinacion de los eigenvectores asociados a λ1 = −9.325502313, se tienen que realizar los siguien-tes calculos.

1. Determinar la matriz A− λ1 I4, dada por

A − λ1 I4 =

⎡⎢⎢⎢⎢⎢⎣

17.32550231 2 4 1

2 15.32550231 −2 1

4 −2 1.325502313 0

1 1 0 14.32550231

⎤⎥⎥⎥⎥⎥⎦

2. Obtener la forma escalonada reducida de la matriz A − λ1 I4, dada por⎡⎢⎢⎢⎢⎢⎣

17.32550231 2.0 4.0 1.0

0 15.09462877 −2.461747074 0.8845632315

0 0 −0.0866122253 14.21594747

0 0 0 −0.00000000332

⎤⎥⎥⎥⎥⎥⎦

Este resultado parece contradictorio, si los calculos se hubieran realizado de manera exacta, la matrizA − λ1 I4 debe ser singular, y el termino (4, 4) de la forma escalonada reducida deberıa ser igual a 0. Ladiferencia es el resultado de no realizar los calculos de manera exacta.

3. Despreciando el error indicado en el punto anterior, el eigenvector asociado al eigenvalor λ1 esta dado porla solucion del sistema

⎡⎢⎢⎣

17.32550231 2.0 4.0 1.0

0 15.09462877 −2.461747074 0.8845632315

0 0 −0.0866122253 14.21594747

⎤⎥⎥⎦

⎡⎢⎢⎣

x1

x2

x3

x4

⎤⎥⎥⎦ =

⎡⎣

000

⎤⎦

La solucion esta dada por

�bλ1 =[ −0.2500102856 0.1627305853 1 0.006092610111

]T.

Es importante senalar que cualquier multiplo escalar de �bλ1 es igualmente un eigenvector de la matriz Aasociado al eigenvalor λ1.

Procediendo de manera semejante con los restantes eigenvalores, se tiene que

1. Para λ2 = 4.446795311, se tiene que

�bλ2 =[ −0.07156723992 −0.4816374493 0.05439198782 1

]T.

2. Para λ3 = 5.915205526, se tiene que

�bλ3 =[ −0.5818315235 1 −0.3109782378 0.4569120971

]T.

3. Para λ4 = 9.963501476, se tiene que

�bλ4 =[

1 0.4961701156 0.1674317099 0.3014344054]T

.

7