GEOMETRIA Y ALGEBRA LINEAL 2 TEMA DIAGONALIZACIÓNmaperez.net/documents/GAL2-diagonalizacion.pdf ·...

28
GEOMETRIA Y ALGEBRA LINEAL 2 TEMA 1 DIAGONALIZACIÓN Una cuestión que se ha podido apreciar cuando se estudia la matriz asociada a una trans- formación lineal T respecto a bases del dominio y codominio de T , es que solamente con dicha matriz podemos resolver varios problemas sin hacer uso de los elementos de es- tas bases o de la definición explícita de T . Por ejemplo, si tenemos un operador lineal T : V V donde V posee bases A y B, y conocemos además B ((T )) A , entonces podemos calcular la dimensión del núcleo de T sin necesidad de describir el subespacio Ker(T ),y solamente usando la representación matricial de T . Efectivamente, por el Teorema de la Dimensión sabemos que dim(Ker(T )) = dim(V ) - dim(Im(T )), donde dim(Im(T )) se sabe que coincide con el rango de B ((T )) A . Entonces, para este tipo de problemas que pueden resolverse conociendo únicamente la representación matricial B ((T )) A del operador T , conviene encontrar bases A 0 y B 0 de V y W para las cuales la matriz B ((T )) A sea semejante a B 0 ((T )) A 0 , y que además B 0 ((T )) A 0 tenga la forma más sencilla posible (por ejemplo, que sea una matriz diagonal). En estas notas vamos a estudiar cuándo B ((T )) A es semejante a una matriz diagonal. Esto definirá una familia especial de operadores lineales que se conocen como diagonalizables. 1.1 Valores y vectores propios de un operador lineal Sea T : V V un operador lineal sobre un K-espacio vectorial V de dimensión n. Supong- amos que, de alguna manera, hemos hallado una base B = {v 1 ,v 2 ,...,v n } de V tal que B ((T )) B es una matriz diagonal, es decir, que existen escalares λ 1 , λ 2 , ... , λ n tales que: B ((T )) B = λ 1 0 ··· 0 0 λ 2 ··· 0 . . . . . . . . . . . . 0 0 ··· λ n . 1

Transcript of GEOMETRIA Y ALGEBRA LINEAL 2 TEMA DIAGONALIZACIÓNmaperez.net/documents/GAL2-diagonalizacion.pdf ·...

Page 1: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA DIAGONALIZACIÓNmaperez.net/documents/GAL2-diagonalizacion.pdf · calcular la dimensión del núcleo de Tsin necesidad de describir el subespacio

GEOMETRIA Y ALGEBRA LINEAL 2 TEMA 1

DIAGONALIZACIÓN

Una cuestión que se ha podido apreciar cuando se estudia la matriz asociada a una trans-formación lineal T respecto a bases del dominio y codominio de T , es que solamente condicha matriz podemos resolver varios problemas sin hacer uso de los elementos de es-tas bases o de la definición explícita de T . Por ejemplo, si tenemos un operador linealT : V → V donde V posee bases A y B, y conocemos además B((T ))A, entonces podemoscalcular la dimensión del núcleo de T sin necesidad de describir el subespacio Ker(T ), ysolamente usando la representación matricial de T . Efectivamente, por el Teorema de laDimensión sabemos que dim(Ker(T )) = dim(V )− dim(Im(T )), donde dim(Im(T )) se sabeque coincide con el rango de B((T ))A.

Entonces, para este tipo de problemas que pueden resolverse conociendo únicamente larepresentación matricial B((T ))A del operador T , conviene encontrar bases A′ y B′ de Vy W para las cuales la matriz B((T ))A sea semejante a B′((T ))A′ , y que además B′((T ))A′tenga la forma más sencilla posible (por ejemplo, que sea una matriz diagonal). En estasnotas vamos a estudiar cuándo B((T ))A es semejante a una matriz diagonal. Esto definiráuna familia especial de operadores lineales que se conocen como diagonalizables.

1.1 Valores y vectores propios de un operador lineal

Sea T : V → V un operador lineal sobre un K-espacio vectorial V de dimensión n. Supong-amos que, de alguna manera, hemos hallado una base B = {v1, v2, . . . , vn} de V tal queB((T ))B es una matriz diagonal, es decir, que existen escalares λ1, λ2, . . . , λn tales que:

B((T ))B =

λ1 0 · · · 00 λ2 · · · 0...

... . . . ...0 0 · · · λn

.

1

Page 2: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA DIAGONALIZACIÓNmaperez.net/documents/GAL2-diagonalizacion.pdf · calcular la dimensión del núcleo de Tsin necesidad de describir el subespacio

Entonces, se tiene para cada i = 1, . . . , n la igualdad

T (vi) = λi · vi.

De aquí se puede deducir que la propiedad de ser diagonalizable tiene que ver con las exis-tencia de vectores v ∈ V para los cuales existe un escalar λ ∈ K tal que T (v) = λ · v. Es deaquí que surge el concepto de valor y vector propio de T .

Definición 1.1.1. Sea V un K-espacio vectorial y T : V → V un operador lineal. Un vectorno nulo v ∈ V se llama vector propio de T si existe un escalar λ ∈ K tal que

T (v) = λ · v.

A tal escalar λ se le conoce como valor propio de T . En ciertas ocaciones convendrá decirque v es un vector propio de T asociado a λ. ♣

Observación 1.1.2.1. Se excluye el vector nulo ~0 de la definición anterior de vector propio. A pesar de

que T (~0) = λ · ~0, se tendría que todo escalar λ ∈ K sería un valor propio de T , yqueremos evitar este tipo de trivialidades para poder tener un concepto consistentede operador diagonalizable.

Sin embargo, sí puede ocurrir que λ = 0 sea un valor propio de T . De hecho, nóteseque 0 es un valor propio de T si, y sólo si, Ker(T ) es un subespacio no nulo de V .

2. Si T posee un vector propio, entonces realmente posee infinitos vectores propios. Enefecto, si v 6= ~0 es un vector propio de T asociado a λ, entonces α · v también lo es(asociado a αλ) para todo escalar α ∈ K no nulo, pues T (α · v) = αT (v) = (αλ) · v.

Notamos además que la suma de dos vectores propios de T , no colineales, y asoci-ados al mismo valor propio, es también un vector propio de T (asociado al mismovalor propio). En efecto, si v, w ∈ V son vectores no nulos y no colineales tales queT (v) = λ · v y T (w) = λ · w, entonces

T (v + w) = T (v) + T (w) = λ · v + λ · w = λ · (v + w),

donde v + w 6= ~0 porque v y w no son colineales.

3. Un operador lineal no tiene por qué tener siempre un vector propio. Por ejemplo,si consideramos Rθ : R2 → R2 el operador lineal que a cada vector v ∈ R2 lo rota enun ángulo de θ 6= kπ (donde la rotación se hace alrededor del origen y en sentidoanti-horario), podemos ver (de forma geométrica al hacer un dibujo de Rθ) que Rθ

no tiene vectores propios (y por lo tanto tampoco valores propios).

2

Page 3: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA DIAGONALIZACIÓNmaperez.net/documents/GAL2-diagonalizacion.pdf · calcular la dimensión del núcleo de Tsin necesidad de describir el subespacio

Podemos probar esto también de manera algebraica. En efecto, supongamos queexiste v = (x, y) ∈ R2 tal que Rθ(x, y) = λ(x, y) para algún λ ∈ R. Es útil recordarque Rθ posee representación matricial en la base canónica E dada por

E((Rθ))E =

(cos(θ) −sen(θ)sen(θ) cos(θ)

),

de donde,(λxλy

)= Rθ(x, y) =

(cos(θ) −sen(θ)sen(θ) cos(θ)

)(xy

)=

(cos(θ) · x− sen(θ) · ysen(θ) · x+ cos(θ) · y

).

Luego, obtenemos el sistema de ecuaciones{λx = cos(θ) · x− sen(θ) · y,λy = sen(θ) · x+ cos(θ) · y

que conviene reescribirlo como:{(λ− cos(θ))x+ sen(θ)y = 0,−sen(θ)x+ (λ− cos(θ))y = 0

Este sistema tiene por matriz asociada a

A =

(λ− cos(θ) sen(θ)−sen(θ) λ− cos(θ)

),

por lo que el sistema anterior posee únicamente solución trivial si, y sólo si, el deter-minante de dicha matriz es diferente de cero. Calculamos entonces det(A):

det(A) = (λ− cos(θ))2 + sen2(θ) = λ2 − 2cos(θ)λ+ 1.

Entonces, det(A) 6= 0 si, y sólo si, el discriminante ∆ del polinomio anterior quedescribe a det(A) es menor estricto que cero, es decir

∆ = −4sen2(θ) < 0,

y esto siempre ocurre porque θ 6= kπ. Por lo explicado anteriormente, podemosconcluir que Rθ no posee vectores propios. ♠

Ejemplo 1.1.3.1. Sea T : R2 → R2 el operador lineal dado por T (x, y) = (3x+ y, 3y+ x). Notamos queT (1,−1) = (2,−2) = 2 · (1,−1), por lo que (1,−1) es un vector propio de T asociadoal valor propio 2.

3

Page 4: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA DIAGONALIZACIÓNmaperez.net/documents/GAL2-diagonalizacion.pdf · calcular la dimensión del núcleo de Tsin necesidad de describir el subespacio

2. Denotemos por C∞(0, 1) el R-espacio vectorial formado por aquellas funciones dela forma f : (0, 1) → R que poseen derivadas de todos los órdenes. Consideremosel operador lineal D : C∞(0, 1) → C∞(0, 1) dado por D(f) := f ′. Tenemos que lafunción f(x) = e5x es un vector propio de D asociado al valor propio 5, ya que

D(f)(x) = f ′(x) = 5e5x = 5f(x), para todo x ∈ (0, 1),

D(f) = 5 · f.

3. Sea PXY : R3 → R3 la proyección sobre el plano XY , es decir,

PXY (x, y, z) = (x, y, 0), para todo (x, y, z) ∈ R3.

Es fácil ver que todos los vectores del plano XY (es decir, todos aquéllos de la forma(x, y, 0)) son vectores propios de PXY asociados al valor propio 1. ♦

En los ejemplos anteriores verificamos que ciertos vectores eran vectores propios para al-gunos operadores lineales. Sin embargo, hasta el momento no sabemos cómo se puedenobtener los vectores y valores propios de un operador lineal (si es que los tiene). El restode esta sección lo dedicaremos a estudiar una serie de resultados que nos permiten hallarlos vectores propios de un operador lineal. Empezaremos con el siguiente, que nos dicecómo hallar un vector propio de un operador por medio de cualquier representación ma-tricial para dicho operador.

Proposición 1.1.4. Sea T : V → V un operador lineal sobre un K-espacio vectorial (dedimensión finita), B = {v1, . . . , vn} una base de V , y B((T ))B la matriz asociada a T enla base B. Entonces, v ∈ V es un vector propio de T si, y sólo si, las coordenadas de ven la base B, es decir coordB(v), son una solución no trivial para el siguiente sistema deecuaciones:

(B((T ))B − λIn) ·

x1...xn

=

0...0

. (i)

Demostración: Supongamos primero que v ∈ V es un vector propio de T asociado a λ, ysea

coordB(v) =

x1...xn

el vector de coordenadas de v en la base B. Consideremos el vector de coordenadas deT (v) en B:

4

Page 5: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA DIAGONALIZACIÓNmaperez.net/documents/GAL2-diagonalizacion.pdf · calcular la dimensión del núcleo de Tsin necesidad de describir el subespacio

coordB(T (v)) =

y1...yn

.

Luego,T (v) = y1 · v1 + · · ·+ yn · vn.

Por otro lado, como v es un vector propio de T asociado a λ, se tiene que T (v) = λv, esdecir,

y1 · v1 + · · ·+ yn · vn = λx1 · v1 + · · ·+ λxnvn

(y1 − λx1)v1 + · · ·+ (yn − λxn)vn = 0,

y como B es un conjunto linealmente independiente, se tiene que yi = λxi, para todoi = 1, . . . , n. Entonces:

B((T ))B ·

x1...xn

= B((T ))B · coordB(v) = coordB(T (v)) =

y1...yn

= λ

x1...xn

,

B((T ))B ·

x1...xn

− λ x1

...xn

=

0...0

(B((T ))B − λIn) ·

x1...xn

=

0...0

Nótese que la solución (x1, . . . , xn) es no trivial porque las xi son coordenadas de un vec-tor no nulo (y por lo tanto al menos una de ellas es diferente de 0).

Recíprocamente, supongamos ahora que

coordB(v) =

a1...an

son una solución no trivial del sistema (i). Luego,

coordB(T (v)) = B((T ))B · coordB(v) = B((T ))B ·

a1...an

= λ ·

a1...an

=

λa1...

λan

.

5

Page 6: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA DIAGONALIZACIÓNmaperez.net/documents/GAL2-diagonalizacion.pdf · calcular la dimensión del núcleo de Tsin necesidad de describir el subespacio

Se tiene entonces que

T (v) = (λa1) · v1 + · · ·+ (λan) · vn = λ(a1 · v1 + · · ·+ an · vn) = λ · v.

Como además v 6= ~0 (pues al menos uno de los ai es no nulo), tenemos entonces de laigualdad anterior que v es un vector propio asociado a λ.

También se puede usar la matriz B((T ))B para dar una caracterización de valores propiosde T en términos del sistema (i). Nótese que nos interesan sistemas como en (i) que tengansolución, por lo que debemos hallar condiciones sobre λ para que esto suceda.

Corolario 1.1.5. Sean T : V → V un operador lineal sobre un K-espacio vectorial V , y Buna base de V . Entonces, λ ∈ K es un valor propio de T si, y sólo si,

det(B((T ))B − λI) = 0.

Demostración: Supongamos primero que λ ∈ K es un valor propio de T , y sea v ∈ Vno nulo un vector propio asociado a λ. Entonces, por la proposición anterior, tenemosque el sistema (i) tiene solución no trivial. Para que esto ocurra, al tratarse de un sis-tema homogéneo de n ecuaciones con n incógnitas (siendo n = dim(V )), la matriz aso-ciada a dicho sistema, a saber B((T ))B − λIn, debe tener determinante nulo, es decir,det(B((T ))B − λIn) = 0. Tenga en cuenta que cuando este determinante es no nulo, obten-emos como única solución al sistema la solución trivial.

Recíprocamente, supongamos que λ ∈ K es un escalar que satisface la igualdad

det(B((T ))B − λIn) = 0.

Entonces, la matriz B((T ))B−λIn no es invertible, por lo que el sistema (i) tiene solución notrivial, es decir, existe un vector x ∈ Kn no nulo para el cual B((T ))B · x = λx. Aplicandola proposición anterior nuevamente, tenemos que v = x1v1 + · · · + xnvn (haciendo B ={v1, . . . , vn}) es un vector propio de T asociado a λ, por lo que λ es entonces un valorpropio de T .

Ejemplo 1.1.6.1. Sea T : R3 → R3 el operador lineal cuya matriz asociada a la base canónica viene

dada por

A =

3 1 −12 2 −12 2 0

.

6

Page 7: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA DIAGONALIZACIÓNmaperez.net/documents/GAL2-diagonalizacion.pdf · calcular la dimensión del núcleo de Tsin necesidad de describir el subespacio

Calculemos los valores propios de T , es decir, hallemos los λ ∈ R que anulen laexpresión det(A− λI3):

det(A− λI3) = det

3− λ 1 −12 2− λ −12 2 −λ

= det

3− λ 1 −12 2− λ −10 λ 1− λ

= det

3− λ 1 −1λ− 1 1− λ 0

0 λ 1− λ

= (λ− 1)det

3− λ 1 −11 −1 00 λ 1− λ

= (λ− 1)det

0 4− λ −11 −1 00 λ 1− λ

= −(λ− 1)det

1 −1 00 4− λ −10 λ 1− λ

= −(λ− 1)det

(4− λ −1λ 1− λ

)= −(λ− 1)[(4− λ)(1− λ) + λ]

= −(λ− 1)(4− 5λ+ λ2 + λ)

= −(λ− 1)(λ2 − 4λ+ 4)

= −(λ− 1)(λ− 2)2.

Entonces, λ1 = 1 y λ2 = 2 son los valores propios de S.

Calculemos ahora los vectores propios asociados a 1, es decir, las soluciones delsistema de ecuaciones con matriz asociada A− I3:

(A− I3) ·

xyz

=

000

2 1 −1

2 1 −12 2 −1

· x

yz

=

000

.

Tenemos entonces que 2x+ y − z = 0 y 2x+ 2y − z = 0, de donde 2x+ y = 2x+ 2y.Luego, y = 2y, por lo que y = 0. Así nos queda z = 2x. Entones, las soluciones delsistema anterior son de la forma (x, 0, 2x) = x(1, 0, 2). Es decir, los vectores propiosde T asociados a 1 vienen dados por x(1, 0, 2) con x ∈ R\{0}. En particular, (1, 0, 2)es un vector propio de T .

Para calcular los vectores propios asociados a 2, tenemos el sistema: 1 1 −12 0 −12 2 −2

· x

yz

=

000

.

7

Page 8: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA DIAGONALIZACIÓNmaperez.net/documents/GAL2-diagonalizacion.pdf · calcular la dimensión del núcleo de Tsin necesidad de describir el subespacio

Luego, x+y−z = 0 y 2x−z = 0. Así, z = 2x. Entonces, 0 = x+y−2x = y−x, por loque y = x. Por lo tanto, las soluciones de este sistema son de la forma (x, x, 2x).Es decir, los vectores propios de T asociados a 2 vienen dados por x(1, 1, 2) conx ∈ R\{0}. En particular, (1, 1, 2) es otro vector propio de T .

2. Tea S : C2 → C2 el operador lineal cuya matriz en la base canónica de C2 viene dadapor

A =

(cos(θ) −sen(θ)sen(θ) cos(θ)

)donde θ es un número real fijo (distinto de kπ con k ∈ Z). Tenemos entonces

S(z1, z2) =

(cos(θ) −sen(θ)sen(θ) cos(θ)

)·(z1z2

).

Calculemos los valores propios de S, para lo cual debemos resolver la ecuacióndet(A− λI2) = 0 en el cuerpo C de los números complejos:

det(A− λI2) = det

(cos(θ)− λ −sen(θ)

sen(θ) cos(θ)− λ

)= λ2 − 2cos(θ)λ+ 1 (por la Observación 1.1.2)

Luego, det(A− λI2) = 0 si, y sólo si, λ2 − 2cos(θ)λ+ 1 = 0, de donde:

λ =2cos(θ)±

√4cos2(θ)− 4

2= cos(θ)±

√−sen2(θ) = cos(θ)± sen(θ)i

=

{cos(θ) + sen(θ)icos(θ)− sen(θ)i

=

{eiθ

e−iθ,

donde a la expresión eiθ = cos(θ) + isen(θ) se le conoce como fómula de Euler.Tenemos entonces que

λ1 = eiθ y λ2 = e−iθ

son los valores propios de S.

Hallemos ahora los vectores propios asociados a λ1. Tenemos que (z1, z2) ∈ C2 es unvector propio de S asociado a eiθ si es solución del sistema

(A− eiθI2) ·(z1z2

)=

(00

), (ii)

es decir:[(cos(θ) −sen(θ)sen(θ) cos(θ)

)−(

cos(θ) + isen(θ) 00 cos(θ) + isen(θ)

)]·(z1z2

)=

(00

)

8

Page 9: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA DIAGONALIZACIÓNmaperez.net/documents/GAL2-diagonalizacion.pdf · calcular la dimensión del núcleo de Tsin necesidad de describir el subespacio

(−isen(θ) −sen(θ)

sen(θ) −isen(θ)

)·(z1z2

)=

(00

)−sen(θ)

(i 1−1 i

)·(z1z2

)=

(00

).

Como θ no es múltiplo de π, tenemos que el sistema se simplifica a:(i 1−1 i

)·(z1z2

)=

(00

)Entonces, z1i+ z2 = 0. Por lo que las soluciones del sistema (ii) (es decir, los vectorespropios asociados a eiθ) son de la forma z(1,−i) con z ∈ C\{0}. En particular, (1,−i)es un vector propio asociado a eiθ.

De manera análoga, los vectores propios de S asociados a λ2 = e−iθ son de la formaz(1, i) con z variando en los complejos no nulos. En particular, (1, i) es un vectorpropio de S.

1.2 Subespacios propios

En el Ejemplo 1.1.6 1., notamos que los vectores propios asociados al valor propio λ1 = 1son aquéllos de la forma x(1, 0, 2) con x ∈ R. Es decir, al hallar un vector propio asociado aeste valor propio, terminamos encontrando realmente un número infinito de vectores pro-pios. Esto último tiene sentido al ser los vectores propios soluciones (infinitas) al sistemade ecuaciones (A − I3)~x = ~0 con matriz A − I3 cuyo determinante es nulo. Más aún, esteconjunto infinito de soluciones forman un espacio vectorial (en este caso de dimensión 1).

Lo anterior motiva el siguiente concepto, que asocia a cada operador lineal T sobre V unsubespacio de V por cada uno de sus valores propios.

Definición 1.2.1. Sea T : V → V un operador lineal sobre un K-espacio vectorial V , yλ ∈ K un valor propio de T . Se define el subespacio propio de T asociado a λ como elconjunto

Sλ := {v ∈ V : T (v) = λv}.

El calificativo de subespacio para el conjunto Sλ no es casual, pues se puede ver que Sλ esun subespacio vectorial de V . En efecto, basta con notar que Sλ = Ker(T − λidV ).

9

Page 10: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA DIAGONALIZACIÓNmaperez.net/documents/GAL2-diagonalizacion.pdf · calcular la dimensión del núcleo de Tsin necesidad de describir el subespacio

Ejemplo 1.2.2.1. Para la matrizA del Ejemplo 1.1.6 1., tenemos los subespacios propios de T asociados

a λ1 = 1 y λ2 = 2 dados por:

S1 = {x(1, 0, 2) : x ∈ R},S2 = {x(1, 1, 2) : x ∈ R}.

En este caso, los subespacios propios de T son rectas en el espacio euclidiano R3.Específicamente, S1 es la recta en R3 que pasa por el origen (0, 0, 0) y con dirección(1, 0, 2), mientras que S2 es la recta que pasa por (0, 0, 0) y con dirección (1, 1, 2).

2. Los subespacios propios del operador S : C2 → C2 vienen dados por:

Seiθ = {z(1,−i) : z ∈ C},Se−iθ = {z(1, i) : z ∈ C}.

En este caso, ambos subespacios también son de dimensión 1, aunque no tenemos lamisma interpretación geométrica de los subespacios del ejemplo anterior. ♦

Observación 1.2.3. Tenga en cuenta que aunque ~0 ∈ Sλ, ~0 no es un vector propio de T .En otras palabras, los vectores propios de T asociados a λ son los elementos no nulos delsubespacio Sλ. ♠

1.3 Polinomio característico de un operador lineal

En esta sección estudiaremos una función asociada a un operador lineal T : V → V quenos dará información sobre los valores y vectores propios de T , el llamado polinomio car-acterístico.

Recordemos que para el cálculo de valores propios de T , considerábamos la expresióndet(B((T ))B−λIn) = 0, donde B es una base de V y n = dim(V ). Esto define un polinomiode grado n y de variable λ. Llamemos de momento a este polinomio χB(λ). Por lo quehemos visto de matrices semejantes, podemos probar que para cualquier elección de Bvamos a obtener siempre el mismo polinomio, como se mostrará a continuación.

Proposición 1.3.1. Sean B y B′ dos bases de un K-espacio vectorial de dimensión n, yT : V → V un operador lineal. Entonces, χB(λ) = χB′(λ). ♥

Demostración: Sean B((T ))B y B′((T ))B′ las matrices asociadas a T en las bases B y B′,respectivamente. Sabemos que ambas matrices son semejantes, es decir, que existe unamatriz invertible P ∈ Mn(K) tal que B′((T ))B′ = P−1 · B((T ))B · P (sabemos que se puedetomar P como la matriz de cambio de la base B′ a la base B). Tenemos así la siguienteigualdad:

10

Page 11: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA DIAGONALIZACIÓNmaperez.net/documents/GAL2-diagonalizacion.pdf · calcular la dimensión del núcleo de Tsin necesidad de describir el subespacio

χB′(λ) = det(B′((T ))B′ − λIn) = det(P−1 · B((T ))B · P − λP−1 · In · P )

= det(P−1 · (B((T ))B − λIn) · P ) = (det(P ))−1 · det(B((T ))B − λIn) · det(P )

= χB(λ).

Definición 1.3.2. Se define el polinomio característico de un operador T : V → V como

χT (λ) := det(B((T ))B − λI)

donde B es una base de V . ♣

Observación 1.3.3.1. El polinomio característico χT (λ) no depende de la elección de B, como vimos en la

proposición anterior. En otras palabras, χT (λ) está bien definido.

2. Si dim(V ) = n, entonces χT (λ) es un polinomio de grado n.• El coeficiente del término de χT (λ) de grado n viene dado por (−1)n.• El coeficiente del término de χT (λ) de grado n−1 viene dado por (−1)n−1tr(A).• El término independiente de χT (λ) coincide con el determinante de B((T ))B.

Entonces, se puede expresar a χT (λ) como:

χT (λ) = (−1)nλn + (−1)n−1tr(A)λn−1 + · · ·+ det(B((T ))B).

3. Si A es una matriz cuadrada de orden n y con coeficientes en K, y TA : Kn → Kn esel operador lineal determinano por A (es decir, TA(~x) = A · ~x, para todo ~x ∈ Kn),entonces a χTA(λ) se le llama polinomio característico de A, y por simplicidad se lesuele denotar por χA(λ) (es decir, χTA(λ) = χA(λ)). ♠

Ejemplo 1.3.4.1. El polinomio característico del operador T en el Ejemplo 1.1.6 1. es:

χT (λ) = −(λ− 1)(λ− 2)2 = −λ3 + 5λ2 − 8λ+ 4,

de donde det(A) = 4.

2. Para el operador S del Ejemplo 1.1.6 2., tenemos que su polinomio característicoviene dado por:

ξS(λ) = (λ− eiθ)(λ− e−iθ) = λ2 − 2cos(θ)λ+ 1.

Entonces, el determinante de la matriz de rotación A es igual a 1. ♦

11

Page 12: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA DIAGONALIZACIÓNmaperez.net/documents/GAL2-diagonalizacion.pdf · calcular la dimensión del núcleo de Tsin necesidad de describir el subespacio

Observación 1.3.5. Nótese que en la primera parte del ejemplo anterior, la multiplicidadalgebraica de 2 (es decir, el exponente en el factor (λ − 2)2) no coincide con la dimensiónde S2. Esto será analizado en detalle más adelante, cuando veamos cómo se relacionan lossubespacios propios de un operador sobre V con el mismo espacio V . ♠

1.4 Operadores diagonalizables

Ahora que conocemos cómo calcular los valores y vectores propios de un operador linealT : V → V , estamos listos para determinar cuándo podemos encontrar una base B de V talque B((T ))B sea una matriz diagonal. Usando la definición de B((T ))B, sabemos que cadavector vi ∈ B satisface T (vi) = λivi, para algún λi ∈ K, por lo que tiene sentido conjeturarque tal base B estará formada por vectores propios de T . Esto lo vamos a demostrar acontinuación.

Definición 1.4.1. Sea T : V → V un operador lineal sobre un K-espacio vectorial V . Se diceque T es diagonalizable si existe alguna base B de V tal que la matriz B((T ))B asociada aT en base B es una matriz diagonal (es decir, las entradas de B((T ))B que no pertenecen asu diagonal son cero). ♣

Observación 1.4.2. Sea A ∈ Mn(K) y TA : Kn → Kn su operador lineal asociado. Diremosque A es una matriz diagonalizable si TA es un operador diagonalizable. Nótese que A esdiagonalizable si, y sólo si, existe una matriz invertible P ∈ Mn(K) tal que P−1 · A · P esuna matriz diagonal. ♠

Para poder entender algunos ejemplos de operadores diagonalizables, es importante mostrar,en caso de que sea posible, cómo construir la base B de la Definición 1.4.1.

Teorema 1.4.3. Sea T : V → V un operador lineal sobre un K-espacio vectorial V . En-tonces, T es diagonalizable si, y sólo si, V posee una base formada por vectores propiosde T . En este caso, si B es tal base, entonces B((T ))B es una matriz diagonal. ♥

Demostración: Supongamos primero que T es diagonalizable. Entonces, según la Defini-ción 1.4.1, existe una base B = {v1, v2, . . . , vn} de V tal que:

B((T ))B =

λ1 0 · · · 00 λ2 · · · 0...

... . . . ...0 0 · · · λn

.

12

Page 13: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA DIAGONALIZACIÓNmaperez.net/documents/GAL2-diagonalizacion.pdf · calcular la dimensión del núcleo de Tsin necesidad de describir el subespacio

Tengamos en cuenta que

coordB(T (vi)) =

0...λi...0

,

por lo queT (vi) = 0 · v1 + 0 · v2 + · · ·+ λi · vi + · · · 0 · vn = λi · vi.

Esto último implica que vi es un vector propio de T asociado a λi, para todo i = 1, 2, . . . , n.Por lo tanto, B es una base de V formada por vectores propios de T .

Recíprocamente, supongamos que V posee una base B = {v1, v2, . . . , vn} formada porvectores propios de T . Luego, para cada i = 1, 2, . . . , n existe un escalar λi ∈ K tal queT (vi) = λi · vi. Entonces, se tiene que

coordB(T (vi)) =

0...λi...0

,

de donde

B((T ))B =(

coordB(T (v1)) coordB(T (v2)) · · · coordB(T (vn)))

=

λ1 0 · · · 00 λ2 · · · 0...

... . . . ...0 0 · · · λn

.

Ejemplo 1.4.4.1. Sea A ∈M3(R) la matriz dada por

A =

5 −6 −6−1 4 23 −6 −4

.

Veamos si A es diagonalizable. Primero, hallamos los valores propios de A:

det(A− λI3) = det

5− λ −6 −6−1 4− λ 23 −6 −4− λ

= det

2− λ 0 λ− 2−1 4− λ 23 −6 −4− λ

13

Page 14: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA DIAGONALIZACIÓNmaperez.net/documents/GAL2-diagonalizacion.pdf · calcular la dimensión del núcleo de Tsin necesidad de describir el subespacio

det(A− λI3) = det

2− λ 0 λ− 2−1 4− λ 20 6− 3λ 2− λ

= (λ− 2)2det

−1 0 1−1 4− λ 20 −3 −1

= (λ− 2)2det

−1 0 10 4− λ 10 −3 −1

= −(λ− 2)2(−(4− λ) + 3)

= −(λ− 1)(λ− 2)2

Tenemos entonces que λ1 = 1 y λ2 = 2 son los valores propios de A.

Calculemos los vectores propios asociados a λ1 = 1. Resolvemos el siguiente sistemade ecuaciones:

(A− λ1I3) ·

xyz

=

4 −6 −6−1 3 23 −6 −5

· x

yz

.

Reducimos la matriz asociada del sistema: 4 −6 −6−1 3 23 −6 −5

;

0 6 2−1 3 20 3 1

;

0 0 0−1 3 20 3 1

;

0 0 0−1 0 10 3 1

.

Tenemos entonces que z = x e y = −z/3 = −x/3. Es decir, el subespacio propio deA asociado a 1 es el subespacio generado por (1,−1/3, 1):

S1 =

{x

(1,−1

3, 1

): x ∈ R

}.

Escojamos, por ejemplo, el vector propio v1 = (3,−1, 3). Ahora calculemos los vec-tores propios de A asociados a λ2 = 2:

(A− λ2I3) ·

xyz

=

3 −6 −6−1 2 23 −6 −6

· x

yz

.

Podemos ver fácilmente que la matriz reducida del sistema nos da: 1 −2 −20 0 00 0 0

.

14

Page 15: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA DIAGONALIZACIÓNmaperez.net/documents/GAL2-diagonalizacion.pdf · calcular la dimensión del núcleo de Tsin necesidad de describir el subespacio

Luego, los vectores propios de A asociados a 2 son de la forma:

(2y + 2z, y, z) = (2y, y, 0) + (2z, 0, z) = y(2, 1, 0) + z(2, 0, 1).

Tenemos entonces que el subespacio propio S2 es el subespacio generado por (2, 1, 0)y (2, 0, 1).

Por lo tanto, tenemos que A es diagonalizable, y para la base

B = {(3,−1, 3), (2, 1, 0), (2, 0, 1)}

la matriz asociada a A (es decir, a TA) está dada por

B((TA))B =

1 0 00 2 00 0 2

.

La matriz A es semejante a la matriz anterior, es decir, A = P−1 · B((TA))B · P , dondeP es la matriz de cambio de la base canónica de R3 a la base B:

A =

5 −6 −6−1 4 23 −6 −4

=

3 2 2−1 1 03 0 1

· 1 0 0

0 2 00 0 2

· −1 2 2−1 3 23 −6 −5

.

2. Sea T : R2 → R2 el operador lineal cuya matriz asociada en la base canónica de R2 es

A =

(0 −11 0

).

Para ver si T es diagonalizable, verificamos primero si T tiene valores propios en R.El polinomio característico de T viene dado por:

χT (λ) = det(A− λI2) = det

(−λ −11 −λ

)= λ2 + 1.

Este polinomio no posee raíces reales, por lo que T no tiene valores propios en R.Esto implica que T no tiene tampoco vectores propios, por lo que no puede ser dia-gonalizable sobre R (al no ser posible encontrar una base de R2 formada por vectorespropios).

Lo anterior puede cambiar cuando trabajamos con el mismo operador lineal peroconsiderado sobre el C-espacio vectorial C2. En efecto, sea U : C2 → C2 el ope-rador lineal cuya matriz asociada en la base canónica de C2 (a saber, {(1, 0), (0, 1)})es la matriz A anterior. Tenemos el polinomio característico (en C[λ]) de U dado porχU(λ) = λ2 + 1 = (λ− i)(λ+ i). Así, λ1 = i y λ2 = −i son los valores propios de U .

15

Page 16: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA DIAGONALIZACIÓNmaperez.net/documents/GAL2-diagonalizacion.pdf · calcular la dimensión del núcleo de Tsin necesidad de describir el subespacio

Para encontrar los vectores propios de U asociados a λ1, resolvemos el sistema deecuaciones (

−i −11 −i

)·(zw

)=

(00

).

La solución a dicho sistema viene dada por los vectores v1 ∈ C2 de la forma v1 =(z,−iz) con z ∈ C\{0}. De manera análoga, los vectores propios de U asociadosa λ2 son aquéllos de la forma v2 = (z, iz) con z ∈ C\{0}. Por ejemplo, podemostomar v1 = (1,−i) y v2 = (1, i) como instancias particulares de vectores propios deU , los cuales son claramente linealmente independientes. Al ser 2 vectores l.i. en elC-espacio vectorial C2 de dimensión 2, forman entonces una base de C2. Tenemospor lo tanto por el teorema anterior que U es un operador diagonalizable. La matrizasociada a U en la base B = {(1,−i), (1, i)} se forma al colocar los valores propiosen la diagonal de una matriz diagonal (en el orden en el que se alistan los vectorespropios en la base anterior), es decir,

B((U))B =

(i 00 −i

).

En lo que sigue, veremos cómo darnos cuenta si un operador lineal es diagonalizable fi-jándonos únicamente en sus valores propios. Probemos el siguiente resultado sobre laindependencia lineal de los vectores propios de un operador.

Teorema 1.4.5. Sea T : V → V un operador lineal sobre un K-espacio vectorial V , y seanλ1, λ2, . . . , λh valores propios distintos dos a dos (en decir, λi 6= λj si i 6= j), y sean v1, v2,. . . , vh los vectores propios correspondientes a cada uno de los valores propios anteriores.Entonces, {v1, v2, . . . , vh} es un conjunto linealmente independiente. ♥

Haremos dos demostraciones: una usando el Principio de Inducción Matemática sobreh ∈ N, y otra por reducción al absurdo.

Demostración por inducción:• Paso inicial: Para h = 1, tenemos que {v1} es un conjunto linealmente independi-

ente, pues v1 6= ~0.

• Paso inductivo: Supongamos que el resultado vale para h, es decir, supongamos que{v1, . . . , vh} es un conjunto linealmente independiente (hipótesis inductiva). Debe-mos probar que el resultado también se cumple para h+1, es decir, que {v1, . . . , vh, vh+1}es también linealmente independiente (tesis inductiva).

16

Page 17: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA DIAGONALIZACIÓNmaperez.net/documents/GAL2-diagonalizacion.pdf · calcular la dimensión del núcleo de Tsin necesidad de describir el subespacio

Supongamos entonces que α1, . . . , αh, αh+1 ∈ K son escalares tales que

α1v1 + · · ·+ αhvh + αh+1vh+1 = ~0. (iii)

Debemos probar que α1 = · · · = αh = αh+1 = 0. Aplicamos el operador T a laexpresión anterior y obtenemos:

α1λ1v1 + · · ·+ αhλhvh + αh+1λh+1vh+1 = ~0. (iv)

Multiplicamos (iii) por λh+1 y el resultado se lo restamos a (iv):

(iv)− λh+1(iii) : α1(λ1 − λh+1)v1 + · · ·+ αh(λh − λh+1)vh = ~0.

Sabemos por hipótesis inductiva que {v1, . . . , vh} es un conjunto linealmente inde-pendiente, y esto junto con la igualdad anterior implica que αi(λi−λh+1) = 0. Comoλi − λh+1 6= 0 ya que i 6= h+ 1, tenemos que αi = 0 para todo i = 1, . . . , h. Entonces,la expresión (iii) se convierte en

αh+1vh+1 = 0.

Luego, como vh+1 6= ~0, debe ocurrir que αh+1 = 0. Por lo tanto, αi = 0 para todo i =1, . . . , h, h+ 1, es decir, {v1, . . . , vh, vh+1} es un conjunto linealmente independiente.

Demostración por reducción al absurdo: Supongamos que {v1, v2, . . . , vh} es linealmentedependiente. Luego, podemos encontrar k ∈ N el menor número natural tal que vk ∈〈v1, v2, . . . , vk−1〉, es decir, vk es combinación lineal de los vectores anteriores (los vi con1 ≤ i < k). Entonces, tenemos que existen escalares αi ∈ K, con i = 1, . . . , k − 1, tales que

vk = α1v1 + α2v2 + · · ·+ αk−1vk−1. (v)

Aplicamos T a ambos lados de la igualdad anterior, y obtenemos:

λkvk = α1λ1v1 + α2λ2v2 + · · ·+ αk−1λk−1vk−1. (vi)

Multiplicamos la igualdad (v) por λk, y el resultado se lo restamos a (vi):

(vi)− λk(v) : α1(λ1 − λk)v1 + α2(λ2 − λk)v2 + · · ·+ αk−1(λk−1 − λk)vk−1 = ~0

Por la definición de k, sabemos que el conjunto {v1, . . . , vk−1} debe ser linealmente inde-pendiente. Esto implica que αi(λi − λk) = 0 para i = 1, . . . , k − 1. Por otro lado, comoλi 6= λk, tenemos entonces que αi = 0 para i = 1, . . . , k − 1. Por lo tanto, vk = ~0 por laigualdad (v), y esto es una contradicción, porque los vectores propios de un operador sondiferentes del vector nulo ~0.

17

Page 18: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA DIAGONALIZACIÓNmaperez.net/documents/GAL2-diagonalizacion.pdf · calcular la dimensión del núcleo de Tsin necesidad de describir el subespacio

Corolario 1.4.6. Sea T : V → V un operador lineal sobre un K-espacio vectorial V de di-mensión n. Si T tiene n valores propios distintos, entonces T es diagonalizable. ♥

Demostración: Sean v1, v2, . . . , vn los vectores propios asociados a los valores propiosdistintos de T . Por el teorema anterior, tenemos que {v1, v2, . . . , vn} es un conjunto lineal-mente independiente de un espacio vectorial de dimensión n. Entonces, {v1, v2, . . . , vn} esuna base de V formada por vectores propios de T , y por lo tanto T es diagonalizable.

Observación 1.4.7. El recíproco del corolario anterior no es necesariamente cierto, es decir,puede existir operadores lineales diagonalizables que tengan valores propios repetidos.Por ejemplo, basta considerar el operador TA de la parte 1. del Ejemplo 1.4.4. ♠

Ejemplo 1.4.8. Veamos si la matriz

A =

2 −4 10 7 00 −5 2

es diagonalizable o no.

Empezamos calculando el polinomio característico de A:

χA(λ) = det

2− λ −4 10 7− λ 00 −5 2− λ

= (2− λ) · det

(7− λ 0−5 2− λ

)= −(λ− 7)(λ− 2)2.

Tenemos que λ1 = 7 y λ2 = 2 son los valores propios de A.

Calculemos ahora los subespacios propios asociados a cada valor propio. Para λ1 = 7,resolvemos el sistema de ecuaciones homogéneo asociado a la matriz A− 7I3:

−5 −4 10 0 00 −5 −5

· x

yz

=

000

.

Podemos notar que z = −y y −5x − 4y + z = 0. Luego, −5x − 5y = 0, y así x = −y.Entonces,

S7 = {(−y, y,−y) : y ∈ R} .

18

Page 19: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA DIAGONALIZACIÓNmaperez.net/documents/GAL2-diagonalizacion.pdf · calcular la dimensión del núcleo de Tsin necesidad de describir el subespacio

Para λ2 = 2, resolvemos el sistema: 0 −4 10 5 00 −5 0

· x

yz

=

000

.

Notamos que y = 0, 0 = z − 4y = z, y x ∈ R. Entonces,

S2 = {(x, 0, 0) : x ∈ R}.

Notamos que no podemos formar una base de R3 formada por vectores propios de A. Porlo tanto, A no es diagonalizable. ♦

En el ejemplo anterior, notamos que dim(S2) = 1. Por otro lado, la multiplicidad de laraíz λ2 = 2 de χA(λ) es 2. ¿El hecho de que A no es diagonalizable tendrá que ver conque la multiplicidad de la raíz λ2 no coincide con la dimensión del subespacio propio Sλ2?Responderemos esta pregunta en la siguiente sección.

1.5 Multiplicidades algebraicas y geométricasde valores propios

Comenzamos con el siguiente par de conceptos.

Definición 1.5.1. Sea λ ∈ K un valor propio de un operador lineal T : V → V . Se definenlos siguientes valores para λ:

1. La multiplicidad algebraica de λ es el orden de multiplicidad de λ como raíz delpolinimio característico de T , y la denotaremos por m.a.(λ).

2. La multiplicidad geométrica de λ es la dimensión del subespacio propio Sλ, y ladenotaremos por m.g.(λ). ♣

Proposición 1.5.2. Sea T : V → V un operador lineal sobre un K-espacio vectorial V dedimensión dim(V ) = n. Para cualquier valor propio λ ∈ K, se cumple la desigualdad:

1 ≤ m.g.(λ) ≤ m.a.(λ) ≤ n.

Demostración: Sólo hace falta probar la desigualdad central, pues es claro que 1 ≤ m.g.(λ)y que m.a.(λ) ≤ n. Para probar m.g.(λ) ≤ m.a.(λ), debemos hallar una expresión parael polinomio característico que T que involucre a m.g.(λ). Para simplificar, hagamosm = m.g.(λ). Consideremos {v1, . . . , vm} una base del subespacio propio Sλ. Sabemos

19

Page 20: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA DIAGONALIZACIÓNmaperez.net/documents/GAL2-diagonalizacion.pdf · calcular la dimensión del núcleo de Tsin necesidad de describir el subespacio

que tal base se puede completar a una base de V , digamos B = {v1, . . . , vm, vm+1, . . . , vn}.Ahora consideremos la matriz asociada a T en dicha base:

A = B((T ))B =

(λIm X0 Y

),

donde X ∈ Mm×n−m(K), Y ∈ M(n−m)×(n−m)(K) y 0 ∈ Mm×(n−m)(K). Podemos entoncescalcular χT (λ):

χT (λ) = det(A− xIn) = det

(λIm − xIm X

0 Y − xIn−m

)= det((λ− x)Im) · det(Y − xIn−m)

= (λ− x)mdet(Y − xIn−m)

El factor (λ−x) puede volver a aparecer o no si factorizamos el polinomio det(Y −xIn−m)(esto depende de si λ− x divide a det(Y − xIn−m) o no). En cualquier caso, es claro que mes menor o igual que la multiplicidad algebraica de λ. Por lo tanto,

m.g.(λ) = m ≤ m.a.(λ).

Estamos listos para extender nuestra caracterización de concepto de operador diagonal-izable. El siguiente resultado nos permite saber si un operador es diagonalizable o nosimplemente verificando si las multiplicidades algebraicas y geométricas de sus valorespropios coinciden.

Teorema 1.5.3. Sea T : V → V un operador lineal sobre un K-espacio vectorial V de di-mensión n. Entonces, T es diagonalizable si, y sólo si, toda raíz del polinomio caracterís-tico χT se encuentra en K y además se verifica la igualdad m.g.(λ) = m.a.(λ) para todovalor propio λ ∈ K. ♥

Demostración: Sean λ1, λ2, . . . , λh ∈ K los valores propios distintos de T .

Supongamos primero que T es diagonalizable. Entonces, la unión de las bases de lossubespacios propios Sλ1 , Sλ2 , . . . , Sλh da lugar a una base de V . Tenemos así que

n =h∑i=1

dim(Sλi) =n∑i=1

m.g.(λi).

Por otro lado,h∑i=1

m.g.(λi) ≤h∑i=1

m.a.(λi) ≤∑

λ es raíz de χT

m.a.(λ) = n.

20

Page 21: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA DIAGONALIZACIÓNmaperez.net/documents/GAL2-diagonalizacion.pdf · calcular la dimensión del núcleo de Tsin necesidad de describir el subespacio

Tenemos entonces

n =h∑i=1

m.g.(λi) =h∑i=1

m.a.(λi),

de dondeh∑i=1

(m.a.(λi)−m.g.(λi)) = 0.

Como m.a.(λi) − m.g.(λi) ≥ 0 para todo i = 1, . . . , h, la igualdad anterior implica quem.a.(λi) −m.g.(λi) = 0 para todo i = 1, . . . , h, es decir, m.a.(λi) = m.g.(λi). Por otro lado,la igualdad

h∑i=1

m.a.(λi) =∑

λ es raíz de χT

m.a.(λ) = n

implica que toda raíz de χT se encuentra en K. (Expliquemos un poco esto último: supongamosen esta ocasión que V es un espacio vectorial real y que χT tiene una raíz compleja, llamémosla λ0.Se tiene entonces que m.a.(λ0) no aparece en la suma

∑hi=1 m.a.(λi), por lo cual

h∑i=1

m.a.(λi) <∑

λ es raíz de χT

m.a.(λ),

y esto no es cierto por lo que probamos anteriormente).

Ahora supongamos que toda raíz de χT se encuentra en K y que todo valor propio λ ∈ Kverifica m.g.(λ) = m.a.(λ). Esto implica que:

h∑i=1

m.g.(λi) =h∑i=1

m.a.(λi) =∑

λ es raíz de χT

m.a.(λ) = n.

Como∑h

i=1 m.g.(λi) = n, tenemos que la suma de las dimensiones de los subespaciospropios Sλi coincide con la dimensión de V , por lo que las bases de los Sλi forman unabase de V , y por lo tanto T es diagonalizable.

Observación 1.5.4. La condición m.g.(λ) = m.a.(λ) para todo valor propio de T (con Tcomo en el enunciado del teorema anterior) por sí sola no necesariamente implica que Tes diagonalizable. Por ejemplo, consideremos la matriz

A =

1 0 0 00 −1 0 00 0 0 −10 0 1 0

∈M4(R).

21

Page 22: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA DIAGONALIZACIÓNmaperez.net/documents/GAL2-diagonalizacion.pdf · calcular la dimensión del núcleo de Tsin necesidad de describir el subespacio

Tenemos que su polinomio característico viene dado por:

χA(λ) = det

1− λ 0 0 0

0 −1− λ 0 00 0 −λ −10 0 1 −λ

= (λ− 1)(λ+ 1)det

(−λ 11 −λ

)

= (λ− 1)(λ+ 1)(λ2 + 1).

Tenemos que λ1 = 1 y λ2 = −1 son los únicos valores propios de A, con multiplicidadesalgebraicas m.a.(1) = 1 y m.a.(−1) = 1. Por la Proposición 1.5.2, tenemos que m.g.(1) = 1 ym.g.(−1) = 1, es decir, que los subespacios propios S1 y S−1 tienen dimensión 1. Entonces,no se puede formar una base de R4 formada por vectores propios de A, porque sólo esposible calcular dos vectores propios. Tenemos por lo tanto que A no es diagonalizablea pesar de que m.g.(1) = m.a.(1) y m.g.(−1) = m.a.(−1). Tenga en cuenta que en estecaso estamos trabajando con R como cuerpo de escalares, y las raíces i y −i del polinomiocaracterístico χA no están en R.

Si consideramos en cambioA ∈M4(C), tenemos cuatro valores propios diferentes (a saber,1, −1, i y −i) que pertenecen a C, por lo cual A sí es diagonalizable como matriz con en-tradas complejas. ♠

1.6 Descomposición de un espacio vectorial como sumadirecta de subespacios propios

En esta sección probaremos una última caracterización del concepto de operador diago-nalizable, que tiene que ver con la relación entre V y la suma directa de todos los sub-espacios propios de tales operadores. Más específicamente, nuestro objetivo es probar elsiguiente resultado.

Teorema 1.6.1. Sea T : V → V un operador lineal sobre un K-espacio vectorial V de di-mensión n, y sean λ1, . . . , λh todos los valores propios distintos de T . Entonces, las sigu-ientes afirmaciones son equivalentes:

(a) T es diagonalizable.

(b) V = Sλ1 ⊕ · · · ⊕ Sλh .

(c) n = dim(Sλ1) + · · ·+ dim(Sλh). ♥

Necesitamos un resultado previo antes de demostrar la equivalencia anterior.

22

Page 23: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA DIAGONALIZACIÓNmaperez.net/documents/GAL2-diagonalizacion.pdf · calcular la dimensión del núcleo de Tsin necesidad de describir el subespacio

Lema 1.6.2. Sea T : V → V un operador lineal sobre un K-espacio vectorial V de di-mensión n, y sean λ1, . . . , λh todos los valores propios distintos de T . Entonces, la sumaSλ1 + · · ·+ Sλh de los subespacios propios de T es una suma directa. ♥

Demostración: Recordemos que Sλ1 + · · · + Sλh es el subespacio vectorial de V cuyoselementos son de la forma:

v = v1 + · · ·+ vh (vii)

donde v1 ∈ Sλ1 , . . . , vh ∈ Sλh . Para ver que el espacio suma Sλ1 + · · · + Sλh es realmenteuna suma directa, debemos probar que la expresión (vii) es única para cada vector v enSλ1 + · · ·+ Sλh . Supongamos entonces que tenemos otra expresión

v = v′1 + · · ·+ v′h (viii)

con v′1 ∈ Sλ1 , . . . , v′h ∈ Sλh . Restamos ambas expresiones (vii) y (viii) y nos queda:

(vii)− (viii) : (v1 − v′1) + · · ·+ (vh − v′h) = ~0,

donde vi − v′i ∈ Sλi para i = 1, . . . , h. Veamos que vi − v′i = ~0 para todo i = 1, . . . , h. Paraesto, usaremos el método de demostración por reducción al absurdo. Supongamos que almenos una de las diferencias vi − v′i es diferente del vector nulo, y sea k ∈ N el número(positivo) de estas diferencias que son no nulas. Sin pérdida de generalidad, podemosasumir que v1 − v′1 6= ~0, . . . , vk − v′k 6= ~0 y que vk+1 − v′k+1 = ~0, . . . , vh − v′h = ~0 (si no,siempre podemos reordenar). Tenemos entonces

(v1 − v′1) + · · ·+ (vk − v′k) = ~0 (ix)

donde vi−v′i ∈ Sλi es un vector propio de T para cada i = 1, . . . , k (por ser no nulo). Al ser{v1−v′1, . . . , vk−v′k} un conjunto linealmente independiente por el Teorema 1.4.5, tenemosque la igualdad (ix) representa una contradicción. Por lo tanto, tenemos vi − v′i = ~0 paratodo i = 1, . . . , h, es decir, vi = v′i, por lo que la expresión (vii) es única para cada v.

Demostración del Teorema 1.6.1: Probaremos las implicaciones (a)⇒ (b), (b)⇒ (a) y (c)⇒ (b) para concluir que (a), (b) y (c) son equivalentes. Nótese que (b)⇒ (c) es clara.

• (a) ⇒ (b): Supongamos que T es un operador diagonalizable. Entonces, V poseeuna base B = {v1, v2, . . . , vn} formada por vectores propios de T . Ordenando estabase, podemos asumir que los primeros n1 vectores corresponden al valor propio λ1,que los siguientes n2 corresponden a λ2, y así hasta llegar hasta los últimos nh quecorresponden a λh. Entonces, en esta matriz, tenemos la siguiente representaciónmatricial de T :

23

Page 24: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA DIAGONALIZACIÓNmaperez.net/documents/GAL2-diagonalizacion.pdf · calcular la dimensión del núcleo de Tsin necesidad de describir el subespacio

B((T ))B =

λ1 · · · 0 0 · · · 0 · · · 0 · · · 0... . . . ...

... · · · ... · · · ... · · · ...0 · · · λ1 0 · · · 0 · · · 0 · · · 00 · · · 0 λ2 · · · 0 · · · 0 · · · 0... · · · ...

... . . . ... · · · ... · · · ...0 · · · 0 0 · · · λ2 · · · 0 · · · 0...

......

......

... . . . ......

...0 · · · 0 0 · · · 0 · · · λh · · · 0... · · · ...

... · · · ... · · · ... . . . ...0 · · · 0 0 · · · 0 · · · 0 · · · λh

=

λ1In1 0 · · · 00 λ2In2 · · · 0...

... . . . ...0 0 · · · λhInh

Notamos que n1 + n2 + · · · + nh = n. Además, para cada subespacio propio Sλi secumple la relación dim(Sλi) ≥ ni. Al ser Sλ1 ⊕Sλ2 ⊕· · ·⊕Sλh un subespacio de V porel lema anterior, tenemos lo siguiente:

n ≥ dim(Sλ1 ⊕ Sλ2 ⊕ · · · ⊕ Sλh) = dim(Sλ1) + dim(Sλ2) + · · ·+ dim(Sλh)

≥ n1 + n2 + · · ·+ nh = n.

Entonces, dim(V ) = dim(Sλ1 ⊕ Sλ2 ⊕ · · · ⊕ Sλh), lor lo cual V = Sλ1 ⊕ Sλ2 ⊕ · · · ⊕ Sλh .

• (b)⇒ (a): Supongamos ahora que los espacios V y Sλ1 ⊕ Sλ2 ⊕ · · · ⊕ Sλh coinciden, ysea Bi una base de Sλi para cada i = 1, . . . , h. Entonces, la unión B = B1∪B2∪· · ·∪Bhforma una case de Sλ1 ⊕ Sλ2 ⊕ · · · ⊕ Sλh = V , es decir, que V tiene una base formadapor vectores propios de T .

• (c) ⇒ (b): Finalmente, supongamos que n = dim(Sλ1) + dim(Sλ2) + · · · + dim(Sλh).Entonces, dim(Sλ1 ⊕ Sλ2 ⊕ · · · ⊕ Sλh) = dim(Sλ1) + dim(Sλ2) + · · · + dim(Sλh) = n.Tenemos así que Sλ1 ⊕ Sλ2 ⊕ · · · ⊕ Sλh es un subespacio de V de dimensión n, por locual Sλ1 ⊕ Sλ2 ⊕ · · · ⊕ Sλh = V .

1.7 El Teorema de Gershgorin

Hasta el momento, a la hora de determinar si una matriz es diagonalizable o no, nos hemosenfocado en el cálculo explícito de sus valores y vectores propios. Esto por supuestono es muy complicado cuando trabajamos con matrices pequeñas y cuyas entradas sonnúmeros enteros pequeños. Sin embargo, cuando se trabaja con aplicaciones del álgebralineal en el estudio de diferentes fenómenos (ya sea en física, computación, probabilidady estadística, etc) lo normal es lidiar con matrices bastante grandes y cuyas entradas re-

24

Page 25: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA DIAGONALIZACIÓNmaperez.net/documents/GAL2-diagonalizacion.pdf · calcular la dimensión del núcleo de Tsin necesidad de describir el subespacio

sultan números bastante complicados a la hora de hacer cálculos a mano (por ejemplo,números racionales con muchos decimales). En estos casos, no es humanamente posibleponernos a calcular específicamente cada valor y vector propio. Sin embargo, muchasveces los datos recolectados en las entradas de tales matrices son resultados de varios en-sayos en algún experimento, y son por lo tanto aproximaciones de la realidad. Por estarazón, no es incorrecto pensar en aproximar los valores propios de estas matrices, en lugarde ponerse a calcularlos en detalle. (Inclusive con la ayuda de un computador, esto puederesultar un proceso largo).

Por ejemplo, en el área de procesamiento digital de imágenes, uno de los procesos quese practican es recolectar información del brillo de una fotografía (digamos de un rostrohumano). A cada foto se le asocia un vector cuyas entradas guardan el brillo que cor-responde a cada pixel. Luego se construye una matriz (llamada matriz de covarianza) endonde se guarda la variación del brillo entre un pixel y otro de cada foto. A los vectorespropios de esta matriz de covarianza se les conoce como eigenfaces, y son utilizados ensistemas de reconocimiento facial.

El Teorema de Gershgorin nos dará un método para aproximar los valores propios de unamatriz utilizando ciertos discos en el plano complejo C. Para poder comprender su enun-ciado, necesitamos introducir alguna notación previa.

Consideremos una matriz A ∈ Mn(C). Cada fila de A determinará el radio de cada unode los discos mencionados anteriormente. Por ejemplo, podemos definir

r1 = |a12|+ |a13|+ · · ·+ |a1n| =n∑j=2

|a1j|.

Recuerde que si z es un número complejo, puede representarse usando su forma binomialcomo

z = x+ iy (donde x = Re(z) e y = Im(z)),

y al valor|z| :=

√x2 + y2

se le conoce como módulo de z.

De manera similar, podemos definir para cada i = 1, . . . , n el radio:

ri = |ai1|+ · · ·+ |ai i−1|+ |ai i+1|+ · · ·+ |ain| =n∑j=1j 6=i

|aij|.

Es decir, el radio ri se define como la suma de los módulos de las entradas de la i-ésimafila que no están en la diagonal principal de A.

25

Page 26: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA DIAGONALIZACIÓNmaperez.net/documents/GAL2-diagonalizacion.pdf · calcular la dimensión del núcleo de Tsin necesidad de describir el subespacio

Definición 1.7.1. Dada una matriz A ∈ Mn(C), se define el disco de Gershgorin de radiori y centro aii como:

Ci := {z ∈ C : |z − aii| ≤ ri}.

Teorema 1.7.2 (Teorema de Gershgorin). Para toda matrizA ∈Mn(C) se cumplen las sigu-ientes afirmaciones:

1. Todo valor propio de A se encuentra en al menos un disco de Gershgorin. Es decir,si λ es un valor propio de A, entonces λ ∈

⋃ni=1Ci.

2. Si el conjunto U = Ci1 ∪ · · · ∪Cim es disjunto con la unión de los discos restantes, en-tonces U contiene exactamente m valores propios de A (contando multiplicidades).

Demostración: Sólo probaremos la primera parte del teorema. La segunda es un pocomás técnica y vamos a ignorarla.

Consideremos entonces λ un valor propio de A. Queremos probar la desigualdad

|λ− aii| ≤ ri =n∑j=1j 6=i

|aij| (x)

para algún i entre 1 y n. Para hallar tal i, consideremos ~v = (x1, . . . , xn) un vector propiode A asociado a λ, es decir, A · ~v = λ~v. Sea m = max{|x1|, . . . , |xn|} y consideremos elvector ~w := 1

m~v = (y1, . . . , yn). Podemos notar que ~w es un vector propio de A asociado a

λ, y que además max{|y1|, . . . , |yn|} = 1. Luego, existe i entre 1 y n tal que |yi| = 1. Para tali probaremos la desigualdad (x). En efecto, a partir de A · ~w = λ~w tenemos que

ai1y1 + ai2y2 + · · ·+ ainyn = λyin∑j=1j 6=i

aijyj = (λ− aii)yi.

Y así:

|λ− aii| = |λ− aii||yi| = |(λ− aii)yi| =

∣∣∣∣∣∣∣∣n∑j=1j 6=i

aijyj

∣∣∣∣∣∣∣∣ ≤n∑j=1j 6=i

|aijyj| =n∑j=1j 6=i

|aij||yj| ≤n∑j=1j 6=i

|aij| = ri.

26

Page 27: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA DIAGONALIZACIÓNmaperez.net/documents/GAL2-diagonalizacion.pdf · calcular la dimensión del núcleo de Tsin necesidad de describir el subespacio

Observación 1.7.3. El Teorema de Gershgorin también vale si definimos los radios de losdiscos usando las columnas de la matriz A. Esto es consecuencia de aplicar dicho teoremaa la matriz At. Es decir, si definimos

ρj =n∑i=1i 6=j

|aij|,

Dj = {z ∈ C : |z − ajj| ≤ ρj},

tenemos que:

1. Todo valor propio de A se encuentra en al menos un disco Dj .

2. Si el conjunto U = Dj1 ∪· · ·∪Djm es disjunto con la unión de los discos restantes, en-tonces U contiene exactamente m valores propios de A (contando multiplicidades).

Ejemplo 1.7.4. Consideremos la matriz A =

10 1 −13 25 02 1 32

.

Tenemos los siguientes radios:

r1 =3∑j=1j 6=1

|a1j| = |1|+ | − 1| = 2, r2 =3∑j=1j 6=2

|a2j| = |3|+ |0| = 3, r3 =3∑j=1j 6=3

|a3j| = |2|+ |1| = 3.

Y los discos de Gershgoring quedan como sigue:

C1 = {z ∈ C : |z − 10| ≤ 2}, C2 = {z ∈ C : |z − 25| ≤ 3}, C3 = {z ∈ C : |z − 32| ≤ 3}.

Notamos que los tres discos son disjuntos. Tenemos entonces por el Teorema de Ger-shgorin que cada disco contiene exactamente un valor propio de A. Por lo tanto, A esdiagonalizable.

Otra cosa que podemos notar es que estos tres valores propios son reales (con parte imagi-naria igual a cero). En efecto, sea z = x+ iy un valor propio complejo con parte imaginariano nula, es decir, una raíz de χA(λ). Aunque no lo hemos calculado, es fácil ver que χAes un polinomio de grado tres con coeficientes enteros. Un resultado de álgebra implicaque el conjugado z = x − iy también es una raíz de χA. (A saber: para todo polinomiocon coeficientes reales p, si w es una raíz de p, entonces w también lo es). Entonces, z estáen alguno de los discos anteriores por la primera parte del Teorema de Gershgorin, y sepuede ver que tal disco coincide con el disco en donde se encuentra z. Esto último con-

27

Page 28: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA DIAGONALIZACIÓNmaperez.net/documents/GAL2-diagonalizacion.pdf · calcular la dimensión del núcleo de Tsin necesidad de describir el subespacio

tradice la segunda parte del citado teorema. Por lo tanto, todos los valores propios de Ason reales. ♦

El ejemplo anterior está puesto para simplemente entender cómo deducir que una matrizes diagonalizable usnado el Teorema de Gershgorin, pues la matriz que trabajamos no estan complicada y se pueden hallar sus valores propios (a saber, ...). Hagamos a contin-uación otro ejemplo donde trabajaremos con una matriz de mayor tamaño y con entradasracionales.

Ejemplo 1.7.5. Acotemos los valores propios de la siguiente matriz:

A =

3 0 −1 −1

414

0 5 12

0 1−1

40 6 1

412

0 −1 12−3 1

416−1

613

13

4

Tenemos los siguientes radios y discos de Gershgorin:

r1 =3

2, D1 =

{z ∈ C : |z − 3| ≤ 3

2

},

r2 =3

2, D2 =

{z ∈ C : |z − 5| ≤ 3

2

},

r3 = 1, D3 = {z ∈ C : |z − 6| ≤ 1},

r4 =7

4, D4 =

{z ∈ C : |z + 3| ≤ 7

4

},

r5 = 1, D5 = {z ∈ C : |z − 4| ≤ 1}.

Luego, como D4 no intersecta a la unión del resto de los discos, tenemos que exactamenteun valor propio, digamos λ4 (que debe ser real debido a los argumentos del ejemplo an-terior) se encuentra entre −19/4 y −5/4. El resto de los valores propios λ1, λ2, λ3 y λ5(pueden darse repeticiones) están en la unión D1 ∪D2 ∪D3 ∪D5 y no necesariamente sonreales, pero 3/2 ≤ Re(λ1),Re(λ2),Re(λ3),Re(λ5) ≤ 7. ♦

28