III Transformaciones Lineales y Matrices

Dr. Isaias Ochoa Landín Página 1 12/04/2023

3. Transformaciones Lineales y Matrices

3.1 Espacios vectoriales

3.1.1 Espacio euclidiano n-dimensional

La idea de usar parejas de números para localizar puntos en el plano y

ternas para localizar puntos en el espacio tridimensional se concibió por

primera vez con claridad a mediados del s. XVII. A fines del s. XIX,

matemáticos y físicos empezaron a darse cuenta que no era necesario

quedarse en las ternas. Se reconoció que los conjuntos ordenados de cuatro

números (a1, a2, a3, a4) podían considerarse como puntos en el espacio

“tetradimensional”, los conjuntos ordenados de cinco números (a1, a2, a3, a4, a5)

como puntos en el espacio “pentadimensional”, etc. Aún cuando la concepción

geométrica no se extiende más allá del espacio tridimensional, es posible

extender muchas ideas conocidas más allá de tal espacio, trabajando con

propiedades analíticas o numéricas de puntos y vectores, en lugar de las

propiedades geométricas.

DEFINICION 1 : Si n es un entero positivo, entonces una n-ada ordenada es

una sucesión de n números reales (a1, a2,… an). El conjunto de todas las n-

adas se conoce como espacio n-dimensional euclidiano y se denota por Rn

Cuando n = 2, o bien n = 3, es común usar los términos “parejas

ordenadas” y “terna ordenada”. Cuando n = 1, cada n-ada ordenada consta de

un número real y, por tanto, R1 se puede concebir como el conjunto de los

números reales. Para este conjunto, es común escribir R en lugar de R1.

En el estudio del espacio tridimensional, el símbolo (a1, a2, a3) tiene dos

interpretaciones geométricas diferentes. Puede interpretarse como un punto, en

cuyo caso a1, a2 y a3 son las coordenadas o puede interpretarse como un

vector, en cuyo caso a1, a2 y a3 son las componentes:

Figura 3.1 Interpretación geométrica de una terna de números: Como punto o como vector.

A(a1,a2,a3) a = (a1,a2,a3)


Por lo tanto, se concluye que una n-ada ordenada (a1, a2,…, an) puede

concebirse como un “punto generalizado” o como un “vector generalizado.”

DEFINICION 2 : Se dice que dos vectores u = (u1, u2,…,un) y v = (v1, v2,…,vn) en

Rn son iguales si:

u1 = v1, u2 = v2,…un=vn

La suma u + v se define por:

u + v = (u1+v1, u2+v2,…,un+vn)

y si k es cualquier escalar, el múltiplo escalar ku se define por:

ku = (ku1, ku2,…,kun)

Las operaciones de adición y multiplicación escalar dadas en esta

definición se denominan operaciones estándar sobre Rn.

Se define el vector cero en Rn como el vector

0 = (0, 0,…, 0)

Si u es un vector cualquiera en Rn, entonces el negativo (o inverso

aditivo) de u se denota por – u y se define por:

- u = (-u1, -u2,…,-un)

Se define la sustracción de vectores en Rn por v – u = v + (−u) o, en

términos de las componentes:

v – u = (v1-u1, v2-u2,…, vn-un)

Las propiedades más importantes de la adición y la multiplicación

escalar de vectores en Rn se listan en el siguiente teorema:

TEOREMA 1: Si u = (u1, u2,…un), v = (v1, v2,…,vn) y w = (w1, w2,…, wn) son

vectores en Rn y k y l son escalares, entonces:

a). u + v = v + u

b). u + (v + w) = (u + v) + w

c). u + 0 = 0 + u = u

d). u + (−u) = 0

e). k(lu) = (kl)u

f). k(u + v) = ku + kv

g). (k + l)u = ku + lu

h). 1 u = u

Con este teorema los vectores en Rn pueden manipularse sin

expresarlos en términos de componentes, casi de la misma manera como se


manipulan los números reales. Por ejemplo, si deseamos despejar x en la

siguiente expresión vectorial:

x + u = v

(x + u) + (−u) = v + (−u)

x + (u – u) = v – u

x + 0 = v – u

x = v – u

A fin de extender las nociones de norma y ángulo entre vectores en Rn,

se principia con la generalización siguiente del producto escalar sobre R2 y R3.

DEFINICION 3: Si u = (u1, u2,…un) y v = (v1, v2,…,vn) son vectores cualesquiera

en Rn, entonces el producto euclidiano interior u•v se define por:

u•v = u1v1 + u2v2 + …+ unvn

TEOREMA 2: Si u y v son vectores en Rn y k es un escalar cualquiera,

entonces:

a). u•v = v•u

b). (u + v)•w = u•w + v•w

c). (ku)•v = k(u•v)

d). v•v ≥ 0. Además, v•v = 0 si y solo si v = 0.

Por analogía con las conocidas fórmulas en R2 y R3, se define la norma

euclidiana de un vector u = (u1, u2,…un) en Rn por

De modo análogo, si se conocen los puntos inicial y terminal del vector

U(u1, u2,…un) y V(v1, v2,…,v3), respectivamente, entonces la norma del vector

viene dada por:

La notación matricial para representar vectores, también es muy

recurrida por algunos autores. Así, si u y v son vectores columnas en Rn, las

siguientes operaciones matriciales pueden llevarse a cabo:

y


Las cuales producen los mismos resultados que las operaciones vectoriales.

Además, el producto escalar de dos vectores columnas u y v en Rn, expresado

en forma matricial, es:

Si θ es el ángulo formado por dos vectores u y v en Rn, entonces::

3.1.2 Espacios vectoriales

Para generalizar todavía más el concepto de vector, se definen los

espacios vectoriales bajos ciertas propiedades tales que, si son cumplidas por

los objetos que conforman el espacio vectorial, dichos objetos reciben el

nombre de vectores. Las propiedades son elegidas por medio de la abstracción

de las propiedades más importantes de los vectores en Rn; como

consecuencia, los vectores en Rn automáticamente satisfacen estas

propiedades. Por lo tanto, este nuevo concepto de vector incluye tanto a los

que se dieron con anterioridad como a muchas nuevas clases de vectores.

DEFINICION 4: Sea V un conjunto arbitrario de objetos sobre los cuales se

definen dos operaciones, la adición y la multiplicación por escalares. Por

adición se entiende una regla para asociar, con cada pareja de objetos u y v en

V, un elemento u + v llamado suma de u y v; por multiplicación escalar se

entiende una regla para asociar, con cada escalar k y cada objeto u en V, un

elemento ku, llamado múltiplo escalar de u por k. Si los axiomas siguientes

son satisfechos por todos los objetos u, v, w en V y todos los escalares k y l,

entonces V recibe el nombre de espacio vectorial y a los objetos en V se les

denomina vectores.

Propiedades de la suma 1. Si u є V y v є V, entonces u + v є V. Propiedad de cerradura 2. u + v = v + u Propiedad conmutativa 3. u + (v + w) = (u + v) + w Propiedad Asociativa 4. Existe un objeto 0 є V tal que:

u + 0 = 0 + u = u para todo u є V.Existencia del elemento identidad

5. Para cada u є V, existe un objeto –u є V, tal que u + (-u) = (-u) + u = 0 Existencia del inverso aditivo


Propiedades de la multiplicación por un escalar 6. Si k es cualquier número real y u є V,

entonces ku є V. Propiedad de cerradura 7. k(lu) = (kl)u Propiedad asociativa 8. k(u + v) = ku + kv Primera propiedad distributiva 9. (k + l)u = ku + lu Segunda propiedad distributiva10. 1 u = u Donde “1” es el número real 1

Algunos ejemplos de espacios vectoriales se muestran a continuación.

Como se mencionó anteriormente, para saber si un conjunto de vectores es un

espacio vectorial es necesario verificar los axiomas dados arriba, si alguno de

ellos no se cumple, el conjunto analizado no es un espacio vectorial.

Ejemplo 1. El conjunto de puntos en R2 que están en una recta que pasa por el

origen constituye un espacio vectorial:

Sea V = {(x,y)│y = mx, m es constante, m є R, x є R}, es decir, V

consiste en todos los puntos que están sobre la recta y = mx que pasa por el

orígen y tiene pendiente m.

1. Si u1 = (x1, y1) y u2 = (x2, y2) є V, entonces:

y1 = mx1

y2 = mx2

la suma (u1 + u2) є V como se muestra enseguida:

u1 + u2 = (x1, y1) + (x2, y2) (3.1a)

u1 + u2 = (x1, mx1) + (x2, mx2) (3.1b)

u1 + u2 = (x1 + x2, mx1 + mx2) (3.1c)

u1 + u2 = (x1 + x2, m(x1 + x2)) є V (3.1d)

2. Esta propiedad se cumple si aplicamos la propiedad conmutativa de los

números reales en la ecuación (3.1c):

u1 + u2 = (x2 + x1, mx2 + mx1) = u2 + u1

u2 + u1 = (x2 + x1, m(x2 + x1)) є V

3. Si existe un tercer vector u3 = (x3, y3), entonces la suma u1 + u2 + u3, es:

u1 + u2 + u3 = (x1, y1) + (x2, y2) + (x3, y3)

u1 + u2 + u3 = (x1, m x1) + (x2, m x2) + (x3, m x3)

u1 + u2 + u3 = (x1+ x2 + x3, m x1 +m x2 + m x3)

Aplicando la propiedad asociativa de los números reales, tenemos:

u1 + u2 + u3 = (x1+ (x2 + x3), m x1 + m(x2 + x3)) = u1 + (u2 + u3)

u1 + u2 + u3 = ((x1+ x2) + x3, m (x1 + x2 )+ m x3) = (u1 + u2) + u3


4. Como la recta pasa por el origen, podemos decir que u2 = 0 = (0, 0) є V.

Sustituyendo en (3.1d):

u1 + 0 = (x1 + 0, m(x1 + 0)) є V

5. Del mismo modo, si u2 = -u1 = (-x1, -y1) en (3.1d), tenemos:

u1 + (-u1) = (x1 + (-x1), mx1 + m(-x1))

u1 - u2 = (x1 – x1, m(x1 – x1)) = (0, 0) є V

6. Si el punto u1 = (x1, y1) є V y k є R es un número cualquiera, entonces el

producto por un escalar, es decir, el punto:

k u1 = k (x1, y1) (3.2a)

k u1 = (k x1, k (m x1)) є V (3.2b)

7. Sea l є R, entonces

k (l u1) = k (l x1, l y1)

k (l u1) = (k l)( x1, m x1) = (k l) u1 є V

8. Si k є R y u1 y u2 є V, entonces, de (3.1c)

k (u1 + u2) = k (x1 + x2, mx1 + mx2)

k (u1 + u2) = (k x1 + k x2, k mx1 + k mx2)

k (u1 + u2) = (k x1, k mx1) + (k x2, k mx2)

k (u1 + u2) = k (x1, mx1) + k (x2, mx2) = k u1 + k u2 є V

9. Si k y l є R, entonces:

(k + l) u1 = (k + l) (x1, y1)

(k + l) u1 = ((k + l) x1, (k + l) y1)

(k + l) u1 = ((k x1+ l x1), (k y1+ l y1))

(k + l) u1 = (k x1, k y1) + (l x1, l y1)

(k + l) u1 = k u1 + l u1 є V

10. Si hacemos k = 1 en (3.2b), tenemos:

1 u1 = (1 x1, 1 (m x1)) є V

Ejemplo 2. Sea V = {1}, es decir, V consiste solamente del número 1. Este no

es un espacio vectorial pues no cumple la propiedad de cerradura para la

suma:

La cerradura del producto por un escalar tampoco se cumple. Si r є R,

entonces:

por lo que podemos decir que V NO es un espacio vectorial.


Ejemplo 3: Verificar que el conjunto de matrices de 2 × 2 de la forma

con las operaciones usuales de la suma y multiplicación por un escalar, NO es

un espacio vectorial.

1. Verificamos la propiedad de cerradura para la suma. Sean dos matrices A y

B є V de la forma:

Entonces, la suma A + B viene dada por:

Como no cumple esta propiedad, entonces el conjunto de matrices NO es un

espacio vectorial.

3.1.3 Subespacios

Si V es un espacio vectorial, entonces ciertos subconjuntos de V forman

por sí mismos espacios vectoriales bajo la adición vectorial y la multiplicación

escalar definidas para V.

DEFINICION 5: Un subconjunto W de un espacio vectorial V es un subespacio

de V, si W es a sí mismo un espacio vectorial bajo la adición y multiplicación

escalar definidas sobre V.

En general, se deben verificar los diez axiomas de los espacios

vectoriales para demostrar que un conjunto W, con la adición y la multiplicación

escalar, forma un espacio vectorial. Sin embargo, si W es parte de un conjunto

mayor V del que ya se sabe que es un espacio vectorial, entonces ciertos

axiomas se “heredan” de V y no es necesario verificarlos para W. En este caso,

hablamos de los axiomas 2, 3, 4, 5, 7, 8, 9 y 10. Por lo tanto, para demostrar

que un conjunto W es un subespacio de un espacio vectorial V, solo es

necesario verificar los axiomas 1 y 6 correspondientes a la cerradura.

TEOREMA 3: Si W es un conjunto de uno o más vectores de un espacio

vectorial V, entonces W es un subconjunto de V si y solo si se cumplen las

siguientes propiedades:

i. Si u y v son vectores en W, entonces (u + v) є W.

ii. Si k є R y u є W entonces (k u) є W.


Estas propiedades se resumen diciendo que W es cerrado bajo la

adición y es cerrado bajo la multiplicación escalar.

Todo espacio vectorial V tiene al menos dos subespacios. El propio V es

un subespacio y el conjunto {0} que solo consta del vector cero en V es otro

subespacio denominado subespacio cero. Todos los otros subespacios se

conocen como subespacios propios.

Ejemplo 4: Verificar si es un subconjunto de R2.

i. Si y є S, entonces:

ii. Si y α є R, entonces:

por lo que el conjunto de vectores S es un subconjunto de R2.

Ejemplo 5: Sea S = {[x1 x2 x3]T │ x1 = x2}. ¿Es S un subespacio de R3?

i. Si [a a b]T є S y [c c d]T є S, entonces

[a a b]T + [c c d]T = [a+c a+c b+d]T є S

ii. Si x = [a a b]T є S y α є R, entonces:

[αa, αa, αb]T є S

y por lo tanto S es un subespacio de R3.

Ejemplo 6: El espacio nulo de una matriz. Sea A una matriz de m×n. Sea que

N(A) denote el conjunto de todas los vectores solución al sistema homogéneo

AX = 0, es decir, N(A) = {X є Rn │ AX = 0}. Verificar que N(A) es un subespacio

de Rn:

i. Si X e Y є N(A), entonces:

A(X + Y) = AX + AY = 0 + 0 = 0 є N(A)

por la propiedad distributiva del producto de matrices compatibles para la

multiplicación

.

ii. Si X є N(A) y α є R, entonces:

A(α X) = α AX = α 0 = 0 є V

por lo que, el espacio nulo de una matriz, N(A), es un subespacio de Rn.


3.1.4 Combinación lineal y espacio generado

DEFINICION 7: Sean v1, v2,…,vn vectores en un espacio vectorial V. Una suma

de la forma α1 v1 + α2 v2 +…+ αn vn, donde α1, α2,…,αn son escalares, recibe el

nombre de combinación lineal de v1, v2,…,vn.

Ejemplo 7: Todo vector v = (vx, vy, vz) є R3 puede escribirse en la forma:

v = vx i + vy j + vz k

es decir, v es una combinación lineal de los tres vectores unitarios i, j, k.

Ejemplo 8: Una matriz de 2×2 puede escribirse como combinación lineal de

matrices “unitarias”:

DEFINICION 8: Sean v1, v2,…,vk k vectores en un espacio vectorial V. El

espacio generado por {v1, v2,…,vk} es el conjunto de combinaciones lineales de

v1, v2,…,vk. En otras palabras:

gen{ v1, v2,…,vk} = {v │v = a1 v1 + a2 v2 +…+ ak vk}

donde a1, a2,…,ak son escalares arbitrarios.

Por lo estudiado anteriormente, se sabe que un espacio vectorial es

generado por un conjunto de vectores S = {v1, v2, … , vr}, si cada vector en V

es una combinación lineal de v1, v2, … , vr . Los conjuntos generadores resultan

útiles en una gran diversidad de problemas ya que, a menudo, es posible

estudiar un espacio vectorial V estudiando primero los vectores en un conjunto

generador S y, a continuación, extendiendo los resultados hacia el resto de V.

TEOREMA 4: Si v1, v2,…,vk son vectores en un espacio vectorial V, entonces

gen{ v1, v2,…,vk} es un subespacio de V.

Ejemplo 9: Espacio generado por dos vectores v1 = (2, -1, 4) y v2 = (4, 1, 6).

Solución: Cualquier vector v contenido en el espacio generado por v1 y v2

puede escribirse como una combinación lineal de estos dos vectores:

211 vvv 2aa

O bien, en términos de coordenadas:


De aquí podemos escribir el sistema de ecuaciones siguientes para encontrar

las constantes a1 y a2:

zaa

yaa

xaa

21

21

21

64

42

Resolviendo el sistema, tenemos:

zx

yx

x

z

yx

x

z

y

x

z

y

xRRRR

R

22

12

1

20

30

21

2

12

1

64

30

212

1

64

11

21

64

11

423121

1 42

1

Para que este sistema tenga solución, el último renglón debe de

satisfacerse, es decir:

03

2

3

5 zyx

O bien:

0325 zyx

la cual es la ecuación de un plano que pasa por el origen. Las trazas del plano

se obtienen al hacer cero cada una de las variables una por una. (Las trazas

son curvas en el espacio obtenidas de la intersección de dos superficies y es

por eso que deben especificarse las ecuaciones de ambas superficies. El que

una variable sea cero, representa un plano formado por las dos variables que

no aparecen en la ecuación.)

xyz

xzy

yzx

2

5,0

3

5,0

3

2,0


Así, cualquier vector que se encuentre en el plano definido por los

vectores v1 y v2, puede escribirse como una combinación lineal de ellos. Por

ejemplo, si consideramos el vector w = (-3, 0, -5), este vector puede escribirse:

21 vvw2

1

2

1

Un bosquejo del plano -5x+2y+3z=0 se muestra a continuación. Los

planos XY, XZ y YZ del primer octante han sido coloreados de gris para

resaltarlos. El perímetro de la porción del plano se ha coloreado de verde. La

porción del plano en el primer octante se ha coloreado de amarillo. De igual

manera, las porciones del plano que se verían en otros octantes se han

coloreado de azul y anaranjado.

Figura 3.2 Bosquejo del plano de ecuación -5x + 2y + 3z = 0.

Las trazas se han indicado de diferentes colores y su ecuación se ha

escrito del mismo color para fácil identificación. Las líneas continuas

representan intersecciones visibles de planos, mientras que las líneas

discontinuas representan líneas que se encuentran en la parte posterior o

inferior de otros planos.


En general, podemos decir que el espacio generado por dos vectores

diferentes de cero en R 3 que no son paralelos, es un plano que pasa por el

origen.

Ejemplo 10: Espacio generado por dos vectores en R3. Sean v1 = (3, -2, 1) y v2

= (1, 3, -4) dos vectores en R3. El espacio generado, H, por los vectores v1 y v2

en R3 es el conjunto de todos los vectores que se pueden escribir como

combinación lineal de ellos, es decir,

H = gen{v1, v2} = {v │ v = a1 v1 + a2 v2}

Solución: Para escribir un vector v = (x, y, z) є H como combinación lineal de

v1 y v2, debemos determinar las constantes a1 y a2 de la expresión:

v = (x, y, z) = a1 (3, -2, 1) + a2 (1, 3, -4) = (3a1 + a2, -2a1 + 3a2, a1 – 4a2)

El sistema de ecuaciones asociado se obtiene igualando componente a

componente los vectores anteriores:

3a1 + a2 = x

-2a1 + 3a2 = y

a1 – 4a2 = z

La matriz asociada al sistema no homogéneo y la matriz escalonada se

muestran enseguida: el proceso para escalonar la matriz se ha obviado.

Del último renglón tenemos:

5x + 13y +11z = 0

Esta es la ecuación de un plano que pasa por el origen del sistema

coordenado cuyo bosquejo se muestra en la Figura 3.3.

Únicamente aquellos vectores que estén contenidos en ese plano

podrán escribirse como combinación lineal de los vectores generadores v1 y v2.


Figura 3.3 Bosquejo del plano cuya ecuación es 5x + 13y +11z = 0.

Por lo estudiado anteriormente, se sabe que un espacio vectorial es

generado por un conjunto de vectores S = {v1, v2, … , vr}, si cada vector en V

es una combinación lineal de v1, v2, … , vr . Los conjuntos generadores resultan

útiles en una gran diversidad de problemas ya que, a menudo, es posible

estudiar un espacio vectorial V estudiando primero los vectores en un conjunto

generador S y, a continuación, extendiendo los resultados hacia V.

Ejemplo 11: Una compañía de concreto almacena tres mezclas básicas, dadas

en la tabla. Las cantidades se miden en gramos y cada “unidad” de mezcla

pesa 60 gramos. Puede formular mezclas especiales revolviendo

combinaciones de las tres mezclas básicas; entonces las mezclas especiales

posibles pertenecen al espacio generado por los tres vectores que representan

las tres mezclas básicas:

A B CCemento 20 18 12

Agua 10 10 10Arena 20 25 15Grava 10 5 15Tobas* 0 2 8TOTAL 60 60 60

*Piedra caliza porosa


a). ¿Puede hacer una mezcla que consiste en 1000 g de cemento, 200 g de

agua, 1000 g de arena, 500 g de grava y 300 g de tobas? ¿Porqué puede o

porqué no? Si puede, ¿cuántas unidades de cada una de las mezclas A, B y C

se necesitan para formular la mezcla especial?

Solución: Llamemos MA, MB y MC a la cantidad de la mezcla A, B y C,

respectivamente, necesaria para la mezcla final. Cada mezcla proporcionará

una determinada cantidad de cada componente, como sigue:

El vector (u, v, w, x, y) es el vector composición deseado. A pesar de

que sabemos la composición deseada de la mezcla, resolveremos el sistema

en forma general para usar el resultado en la parte (b).

La matriz asociada al sistema NO homogéneo, es:

El escalonamiento conduce a la siguiente matriz:

Cada una de las mezclas especiales A, B y C son vectores en R5 que

nos definen un espacio vectorial. Una mezcla obtenida de combinar estas

mezclas se puede expresar como combinación lineal de estas tres mezclas

especiales y esto solo es posible si la composición deseada de la mezcla

cumple las siguientes condiciones obtenidas de la matriz escalonada B:


En particular, deseamos una mezcla cuya composición sea:

entonces vemos que al sustituir estos valores en las ecuaciones, tenemos:

por lo que dicha mezcla no es posible de realizar.

b). Suponga que quiere hacer 5000 g de concreto que tiene una razón de agua

a cemento de 2 a 3, con 1250 g de cemento. Si debe incluir 1500 g de arena y

1000 g de grava en las especificaciones, encuentre la cantidad de tobas para

hacer 5000 g de concreto. ¿Se puede formular ésta como una mezcla

especial? Si es así, ¿cuántas unidades de cada mezcla se necesitan para

formular la mezcla especial?

Solución: Para esta mezcla, el vector composición es:

Las componentes de este vector están especificadas por las

componentes de la mezcla deseada. La componente v ha sido determinada de

la razón agua/cemento también especificada y requerida:

Para saber si es posible realizar esta mezcla debe cumplirse que:

Además:

de donde obtenemos que la cantidad de tobas requerida es:


Para calcular la cantidad requerida de cada mezcla especial, tenemos de

la matriz B:

Es importante notar la diferencia entre el espacio generado por un

conjunto de vectores y los vectores generadores de un espacio vectorial. En los

ejemplos anteriores hemos trabajado con el espacio generado por un conjunto

de vectores. En este caso, los vectores en el espacio generado pueden

escribirse como combinación lineal de dichos vectores. La siguiente definición

trata de los vectores generadores de un espacio vectorial.

Definición 9: Se dice que los vectores v1, v2,..., vn en un espacio vectorial V

generan a V si todo vector en V puede escribirse como una combinación lineal

de ellos. Es decir, para todo v є V, existen escalares a1, a2,..., an tales que

v = a1 v1 + a2 v2 + ... + an vn

Teorema: Si v1, v2,..., vk son vectores en un espacio vectorial V, entonces

gen{ v1, v2,..., vk} es un subespacio de V.

Demostración: Sean u y v dos vectores en gen{ v1, v2,..., vk} entonces deben

poder escribirse como combinación lineal de los vectores generadores:

u = a1 v1+ a2 v2 +... + ak vk

v = b1 v1+ b2 v2 +... + bk vk

Además, para que gen{ v1, v2,..., vk} sea una subespacio de V, deben de

cumplirse la propiedad de cerradura para la suma y el producto por un escalar:

u + v = (a1 v1+ a2 v2 +... + ak vk) + (b1 v1+ b2 v2 +... + bk vk)

u + v = (a1+ b1) v1+ (a1 + b2) v2 +... + (ak + bk) vk


Por lo tanto, la propiedad de cerradura se cumple. De la misma manera,

si α es número real:

α u = α (a1 v1+ a2 v2 +... + ak vk)

α u = α a1 v1+ α a2 v2 +... + α ak vk

la propiedad de cerradura para el producto de un vector por un escalar también

se cumple. De aquí que gen{ v1, v2,..., vk} es un subespacio de V.

3.1.5 Dependencia e independencia lineal

Sean v1, v2,…, vn, n vectores en un espacio vectorial V. Entonces se dice

que los vectores son linealmente dependientes si existen n escalares c1, c2,

…, cn no todos cero tales que:

c1 v1 + c2 v2 +…+ cn vn = 0

Si la única manera de satisfacer la relación anterior es que c1 = c2 =…=

cn = 0, se dice que v1, v2,…, vn son linealmente independientes.

Ejemplo 12: Determinar si los vectores son linealmente

independientes.

Solución: Necesitamos encontrar constantes ci diferentes de cero tales que:

El sistema de ecuaciones asociado para encontrar c1 y c2, es:

Podemos escribir el sistema de ecuaciones como sigue:

Como los vectores v1 y v2 son proporcionales, entonces son linealmente

dependientes.

Ejemplo 13: ¿Son los siguientes vectores linealmente independientes?


Solución: Si v1, v2 y v3 son linealmente dependientes, deben existir constantes

c1, c2 y c3 tales que:

c1 v1 + c2 v2 + c3 v3 = 0

O bien:

El sistema asociado para determinar c1, c2 y c3 es:

Como es un sistema homogéneo, la matriz aumentada no es necesaria y

trabajaremos solamente con la matriz de coeficientes para encontrar los

valores de ci’s:

100

010

001

1002

110

001

1002

110

101

10002

110

101

7602

110

101

7602

110

021

760

120

021

703

120

021

703

122

021

2313

332

122

3121

2

1

10

16

22

132

RRRRR

RR

RRRRRRR

De aquí que, como c1 = 0, c2 = 0 y c3 = 0, los vectores v1, v2 y v3 son

linealmente independientes

Note que en este caso tenemos un sistema cuadrado, es decir, el

número de ecuaciones y de incógnitas es el mismo (n = m). Note también que

el determinante de la matriz A es:

Esto significa que la inversa existe y que por lo tanto el sistema tiene

solución, pero también implica que la solución del sistema homogéneo es la

solución trivial y por lo tanto los vectores son linealmente independientes.


Teorema 5: Sea A una matriz de n × n. Entonces las ocho afirmaciones

siguientes son equivalentes:

i. A es invertible.

ii. La única solución del sistema homogéneo AX = 0 es la solución trivial.

iii. El sistema AX = B tiene una solución única para todo n-vector B.

iv. A es equivalente por renglones a la matriz identidad de n × n, In.

v. A se puede escribir como el producto de matrices elementales.

vi. La forma escalonada por renglones de A, tiene n pivotes.

vii. det (A) ≠ 0.

viii. Las columnas (y renglones) de A son linealmente independientes.

Ejemplo 14: Los siguientes vectores, ¿son linealmente independientes?

Solución: La matriz asociada del sistema y la matriz escalonada son:

de donde obtenemos: c1 = -2c3

c2 = -3c3

c3 = c3

Podemos encontrar valores de c1, c2 y c3 diferentes de cero por lo que

los vectores son linealmente dependientes. En otras palabras, tenemos:

(3.3)

por lo que los vectores son linealmente dependientes.

Nuevamente tenemos un sistema en el que n = m. Sin embargo, el

determinante de A en este caso, es:

Esto implica que la inversa de la matriz no existe y que por lo tanto los

vectores son linealmente dependientes al no cumplir el punto i del Teorema 5.

Ejemplo 15: Los vectores v1 = (-2, -3) y v2 = (1,6) en R2, ¿son linealmente

independientes?


Solución: La matriz asociada del sistema homogéneo es:

El determinante de A es:

por lo que los vectores son linealmente independientes.

Ejemplo 16: Si incluimos un vector v3 = (-2, 5) a los dos vectores del ejemplo

anterior, ¿son los vectores linealmente independientes?

Solución: La matriz del sistema y la matriz escalonada son:

De la matriz escalonada obtenemos que:

de aquí que ahora los vectores son linealmente dependientes pues se ha

introducido un vector adicional al conjunto de vectores que antes eran

linealmente independientes. En otras palabras, en el sistema de ecuaciones

tenemos más incógnitas que ecuaciones (n > m) y los vectores son linealmente

dependientes al tener el sistema un infinito número de soluciones.

Ejemplo 17: Tres matrices linealmente independientes en M23. Determine si las

siguientes matrices son linealmente independientes o no.

Solución: Si son linealmente independientes existen constantes ci tales que:

donde 0 en la ecuación anterior representa la matriz con componentes 0:

Desarrollando, tenemos:

El sistema de ecuaciones para determinar las ci es:


de donde se obtiene que c1 = c2 = c3 = 0 y por lo tanto A1, A2 y A3 son

linealmente independientes.

Ejemplo 18: Los siguientes polinomios (2x), (x3 – 3), (1 + x - 4x3), (x3 + 18x – 9)

en P3, ¿son linealmente independientes?

Solución: Debemos encontrar constantes tales que:

Para escribir el sistema de ecuaciones para calcular las constantes ci,

damos a x valores arbitrarios (tantos valores como constantes haya):

x = 0; -3c2 + c3 -9c4 = 0

x = 1; 2c1 – 2c2 – 2c3 + 10c4 = 0

x = -1; -2c1-7c2 + 4c3 – 28c4 = 0

x = 2; 4c1 + 5c2 – 29c3 + 35c4 = 0

La matriz asociada al sistema homogéneo es:

El determinante de A es:

por lo que los polinomios son linealmente dependientes.

Escalonando la matriz de coeficientes obtenemos:

11/6100

0000

11/35010

11/96001

352954

10222

9130

28442

De donde obtenemos que c1 = 96, c2 = 35, c3 = 6 y c4 = -11.


El sistema de ecuaciones para determinar las constantes ci también

pudo obtenerse derivando los polinomios tres veces (número de constantes

menos uno):

Así, la matriz de coeficientes es:

El escalonamiento de esta matriz produce el siguiente resultado:

de donde se obtiene que c1 = 96, c2 = 35, c3 = 6 y c4 = -11 como anteriormente.


De los ejercicios anteriores podemos extraer la siguiente propiedad de

Conjuntos Linealmente Dependientes:

Teorema 6: Un conjunto H = {v1, v2, …, vk}, k 2, es linealmente

dependiente sí y sólo si por lo menos uno de los vectores vj puede

expresarse como una combinación lineal de los demás vectores en H.

Un corolario del teorema anterior es el siguiente:

Dos vectores u y v en un espacio vectorial V son linealmente

dependientes sí y sólo si uno de ellos es un múltiplo escalar del otro.

Las siguientes definiciones son muy importantes para la independencia

lineal de funciones reales de variable real.

Definición 10: Sea dado un sistema finito de n funciones y1(x), y2(x), ..., yn(x)

definidas en un intervalo (a, b). Se dice que éstas son linealmente

dependientes en el intervalo (a, b), si existen constantes α1, α2, ..., αn, no

simultáneamente iguales a cero, tales que para todos los valores de x de este

intervalo se cumple la identidad:

α1 y1(x) + α2 y2(x) + ... + αn yn(x) ≡ 0

Si esta identidad se cumple solamente para α1 = α2 = ... = αn = 0, se dice que

las funciones y1(x), y2(x), ..., yn(x) son linealmente independientes en el intervalo

(a, b).

Definición 11: Sean y1, y2, ..., yn, funciones que admiten derivadas hasta el

orden (n-1), continuas en el intervalo a ≤ x ≤ b. El determinante:

se llama determinante de Wronsky (o wronskiano) de estas funciones.

Obsérvese que, por lo general, el wronskiano es una función de x definida en

cierto intervalo.

El wronskiano se usa para determinar si dos o más funciones son

linealmente dependientes o independientes:

Teorema 7: Si las funciones y1(x), y2(x), ..., yn(x) son linealmente dependientes

en el segmento [a, b], su wronskiano es idénticamente nulo en [a, b].


Demostración: A continuación se prueba el teorema para el caso n = 2 por

contradicción. Supóngase que W(f1(x0), f2(x0)) ≠ 0 para un valor x0 fijo en un

intervalo I y que f1(x) y f2(x) son linealmente dependientes en el intervalo. Esto

último significa que existen constantes c1 y c2, no simultáneamente nulas, para

las cuales:

c1 f1(x) + c2 f2(x) = 0

para todo x є I. Derivando esta combinación, resulta:

c1 f1’(x) + c2 f2’(x) = 0

obteniendo así un sistema de ecuaciones lineales. La dependencia lineal

implica que dicho sistema tiene una solución no trivial para cada x del intervalo.

Consecuentemente:

para todo x є I. Esto contradice el haber supuesto que W(f1(x0), f2(x0)) ≠ 0. Se

concluye que f1 y f2 son linealmente independientes.

Este teorema solamente indica la condición necesaria para la

dependencia lineal de un sistema de funciones. El recíproco no se cumple,

puesto que el wronskiano puede ser nulo también cuando las funciones

consideradas forman en el intervalo un sistema linealmente independiente.

Volviendo al ejemplo 18, si tratamos los polinomios como funciones

polinomiales definidas en un intervalo [a, b], entonces las funciones (2x), (x3 –

3), (1 + x - 4x3), (x3 + 18x – 9) son linealmente independientes si existen

constantes no todas cero simultáneamente tales que:

Como existen cuatro constantes por determinar, debemos derivar esta

ecuación tres veces y escribir el sistema de ecuaciones como sigue:

El wronskiano de este sistema de ecuaciones es:


La solución por cofactores se facilita tomando la primera columna. Así,

los menores M11 y M21 y sus respectivos determinantes son:

Como los menores son cero, se concluye que W = 0 y que las funciones

polinomiales son LI.

3.1.6 Interpretación geométrica de la dependencia lineal en R3

Si u, v y w son tres vectores en R3 linealmente dependientes, entonces

existen constantes c1, c2 y c3 є R y no todas cero tales que:

Si suponemos que c3 ≠ 0, entonces:

Es fácil demostrar que u, v y w son coplanares pues se cumple que:

Sustituyendo la expresión para w, tenemos:

De la propiedad v Teorema 1.5, tenemos para el triple producto escalar:

De la propiedad vi de teorema 1.5, sabemos que:

Esto es cierto dado que el vector u × v es perpendicular al plano formado por

los vectores u y v por lo que es perpendicular a cada uno de estos vectores.

Entonces:


lo que implica que u, v y w son coplanares.

En resumen podemos decir que tres vectores en R3 son linealmente

dependientes si y solo si son coplanares.

Ejemplo 19: En el Ejemplo 14 anterior, es importante notar que podemos

despejar v3 de la ecuación (3.3) para obtener:

v3 = 2v1 + 3v2 (3.4)

esto significa que cuando los vectores son L.D., es posible expresar uno de

ellos en términos de los otros. Pero lo más importante es que los vectores

linealmente dependientes son coplanares:

0)( 213 vvv (3.5)

Recordando que el producto vectorial de dos vectores, v1 y v2, da como

resultado otro vector que es perpendicular al plano formado por los vectores v1

y v2. Si otro vector v3 es perpendicular a este vector resultante (v1 × v2),

entonces el producto escalar debe ser cero, tal como lo indica la ecuación (3.5).

Esto puede demostrarse sustituyendo (3.4) en (3.5) y aplicando la

propiedad distributiva:

)(3)(2)()32( 2122112121 vvvvvvvvvv

Ahora, es posible ver que cada término del lado derecho es igual a cero:

kji

kji

vv 21 9412

403

031 -

0)9)(4()4)(0()12)(3()9,4,12()4,0,3()(

0)9)(0()4)(3()12)(1()9,4,12()0,3,1)(

1

22

211

vvv

vvv (

Con lo que queda demostrada la ecuación (3.5) y además que tres vectores

en R3 son linealmente dependientes si y solo si son coplanares.

Ejemplo 20: Determinar si los siguientes vectores son linealmente

independientes o no:

3

7

2

4

11

18

,

6

7

4

,

4

3

2

y

.


Solución: El sistema asociado para determinar las constantes ci es:

03464

071173

021842

4321

4321

4321

cccc

cccc

cccc

La matriz de coeficientes y la matriz escalonada se muestran enseguida:

64/23100

4/3010

64/47001

3464

71173

21842

De aquí que, si hacemos c4 = 64, las otras constantes son: c1 = 47, c2 = 48 y c3

= -23 y por lo tanto los vectores son linealmente dependientes.

Con estas constantes, podemos escribir:

0

0

0

3

7

2

64

4

11

18

23

6

7

4

48

4

3

2

47

En este ejemplo se obtuvo un sistema que tenía un mayor número de

incógnitas que de ecuaciones. Como resultado, la matriz de coeficientes

contenía más columnas que renglones y para este tipo de sistemas siempre

habrá un número infinito de soluciones y por lo tanto los vectores serán

linealmente dependientes.

Lo anterior puede generalizarse como sigue: Un conjunto de n vectores en

Rm siempre serán Linealmente Dependientes si n > m.

Teorema 8: Cualquier conjunto de n vectores linealmente independientes en Rn

genera a Rn.

Ejemplo 21: Del Ejemplo 13, los vectores v1 = (1, -2, 3), v2 = (2, -2, 0) y v3 = (0,

1, 7) son linealmente independientes. Ahora queremos ver como estos vectores

generan R3. Para esto, cualquier vector w en R3 debe poder escribirse como

combinación lineal de los vectores vi como sigue:

32 vvvw 3211 bbb

o, expresado en forma analítica:

7

1

0

0

2

2

3

2

1

321 bbb

z

y

x

(3.6)

El sistema de ecuaciones para determinar las bi es:


zbb

ybbb

xbb

31

321

21

73

22

2

y la matriz aumentada y escalonada nos da:

zyx

zyx

zyx

z

y

x

10

1

10

3

10

320

1

20

7

20

1710

1

10

7

10

7

100

010

001

703

122

021

Así, las constantes vienen dadas por:

zyxb

zyxb

zyxb

10

1

10

3

10

320

1

20

7

20

1710

1

10

7

10

7

3

2

1

Como no hay ninguna condición a ser cumplida (como sucedió en los

ejemplos 9 y 10), los vectores vi generan R3 y cualquier vector en R3 puede

escribirse como una combinación lineal de los vecotres vi. Por ejemplo, para

escribir el vector w = (-5, 2, -1) como combinación lineal de v1, v2 y v3,

calculamos bi:

1)1(10

1)2(

10

3)5(

10

32

7)1(

20

1)2(

20

7)5(

20

17

2)1(10

1)2(

10

7)5(

10

7

3

2

1

b

b

b

321 2

72 vvvw

Una expresión analítica se obtiene de la ecuación (3.6)

Geométricamente lo que esto significa se muestra en la Figura 3.4:


Figura 3.4 Generación de R3 por tres vectores en R3 linealmente independientes.

Note como los vectores v1, v2 y v3 se ven afectados por las

correspondientes bi para localizar el vector w en R3.

3.2 Base de un espacio vectorial

Definición 9: Un conjunto finito de vectores {v1, v2,…,vn} es una base para un

espacio vectorial V si

1. {v1, v2,…,vn} es linealmente independiente

2. {v1, v2,…,vn} genera a V

De acuerdo al Teorema 6, dado que cualquier conjunto de n vectores en Rn

linealmente independientes genera a Rn, todo conjunto de n vectores L.I. en Rn

es una base para Rn.

Así como en R2 se definen los vectores unitarios i = (1, 0) y j = (0, 1) y

esta idea se extiende a R3 con i = (1, 0, 0), j = (0, 1, 0) y k = (0, 0, 1), en Rn se

definen los vectores e1 = (1, 0,…, 0), e2 = (0, 1,…, 0),…, en = (0, 0,…, 1). Estos

vectores son las columnas de una matriz identidad obtenida al escribir un

vector v = (v1, v2,…, vn) є Rn como combinación lineal de los vectores ei:

es decir:


En forma matricial lo anterior queda expresado como:

La matriz identidad, In, en el lado izquierdo de la igualdad anterior tiene

por determinante:

entonces los vectores ei son linealmente independientes. Esta base en Rn

constituida por ei se llama base canónica en Rn.

Ejemplo 22: Haciendo referencia de nuevo al Ejemplo 13, ya se vio como los

vectores v1 = (1, -2, 3), v2 = (2, -2, 0) y v3 = (0, 1, 7) generan a R3 y cómo

podemos escribir el vector w = (-5, 2, -1) como una combinación lineal de estos

vectores (Ejemplo 21). Entonces, estos tres vectores vi es una base para R3.

Sin embargo ésta base no es única, ya que existen los vectores unitarios i, j y k

que son L.I. y que también generan a R3:

1

0

0

0

1

0

,

0

0

1

kji y

y el vector w = (-5, 2, -1) queda expresado como una combinación lineal de los

vectores unitarios como sigue:

kjiw 25

Ejemplo 22: Encontrar una base para los vectores que están en el plano -5x +

2y + 3z = 0.

Solución: Queremos encontrar los vectores que generen el espacio vectorial

de los vectores contenidos en el plano -5x + 2y + 3z = 0:


Estos vectores generadores del espacio vectorial nos permitirán

expresar cualquier vector en el plano Π como combinación lineal de ellos. Para

hallar estos vectores generadores, despejamos una de las variables del plano,

digamos la variable z:

Por lo que cualquier vector v = (x, y, z) puede escribirse como:

Una pareja de vectores generadores es entonces v1 = (1, 0, 5/3) y v2 =

(0, 1, -2/3). Estos vectores son linealmente independientes y generan el

espacio vectorial de los vectores contenidos en el plano Π.

Por ejemplo, el vector w = (2, -1, 4) está contenido en el plano y puede

expresarse como combinación lineal de v1 y v2:

Al resolver el sistema encontramos que a1 = 2 y a2 = -1 por lo que tenemos:

3.2.1 Cambio de base

Enseguida veremos como pasar de una base a otra para expresar

cualquier vector en Rn en otra base. Para facilitar la explicación y obtener

resultados generales, supongamos que deseamos pasar de una base B1

formada por los vectores v1, v2 y v3 en R3 a otra base B2 formada por los

vectores unitarios i, j y k. Sabemos que es más fácil utilizar la base canónica

para expresar un vector como combinación lineal de los vectores unitarios, pero

esto nos servirá para generalizar los resultados.

Como v1, v2 y v3 generan R3, cualquier vector w puede expresarse como

combinación lineal de ellos:

332211 vvvw aaa (3.7)

Supongamos que la base B1 está perfectamente bien definida y se

conocen las constantes ai para expresar el vector w en términos de los vectores

vi.


Este vector w también puede escribirse como combinación lineal de los

vectores unitarios de la base B2, la base canónica:

kjiw 321 bbb (3.8)

En este caso las constantes bi se “desconocen” y hay que determinarlas. Para

esto, expresemos la base anterior B1 en términos de la nueva base B2 como

sigue:

Los subíndices de las constantes ci’s se han escrito así por conveniencia.

Sustituyendo en (3.7):

Comparando término a término con le ec.(3.8), vemos que:

(3.9)

Las constantes ci’s tienen el valor de las componentes escalares de los

vectores vi’s de la base vectorial:

por lo que el vector w queda expresado como

kjiw zzzyyyxxx vavavavavavavavava 332211332211332211

y la ec (3.9), queda de la siguiente manera:

3

2

1

321

321

321

3

2

1

a

a

a

vvv

vvv

vvv

b

b

b

zzz

yyy

xxx


Este producto de matrices nos dará los valores de las b’s para expresar w en

términos de los vectores de la base B2. Está por demás decir que estos valores

de bi son precisamente las componentes escalares del vector w pues esa es la

ventaja de trabajar con una base canónica. Pero ahora, si lo que queremos es

pasar de la base canónica B2 a la base B1, simplemente despejamos el vector

de coeficientes a’s de (3.9):

z

y

x

zzz

yyy

xxx

w

w

w

vvv

vvv

vvv

a

a

a1

321

321

321

3

2

1

(3.10)

La matriz de la Ec (3.9) se llama matriz de transición de la base B1 a la base B2

y, como puede verse, los componentes de la matriz de transición son las

componentes escalares de los vectores v’s que conforman la base B1.

Ejemplo 23: Supongamos que deseamos encontrar una base B2 formada por

u1 = (-4, 2) y u2 = (1, 7) para expresar el vector w = (-3, -5) en términos de B2 a

partir de la base canónica B1.

Solución: Deseamos expresar w como:

2211 uuw aa

La matriz de transición de B1 a B2 es la inversa de la matriz de transición

de B2 a B1.formada por las componentes de los vectores u1 y u2:

42

17

30

1

72

141

Así, los coeficientes ai son de acuerdo a (3.10):

15

1315

8

5

3

42

17

30

1

2

1

a

a

entonces el vector w en términos de la nueva base B2 es:

21 15

13

15

8uuw

7

1

15

13

2

4

15

8

5

3

La siguiente figura muestra la representación gráfica de w en términos

de las dos bases B1 y B2:


Figura 3.5 Representación geométrica del vector w = (-3, -5) en términos de una base B2

formada por los vectores u1 = (-4, 2) y u2 = (1, 7)

En el ejemplo 22, cualquier otro par de vectores que se encuentren en el

plano pueden servir como base para generar el espacio vectorial. Estos

vectores coplanares deben de ser NO colineales (paralelos) para que sean

linealmente independientes. Por ejemplo, en el Ejemplo 18, los vectores (2, -1,

4) y (4, 1, 6) son coplanares (porque satisfacen la ecuación del plano) y

generan el espacio vectorial porque son linealmente independientes. Cualquier

vector en el plano puede escribirse como combinación lineal de ellos. En

particular el vector (-1, 2, -3) puede escribirse como:

Puede verse, entonces, que la base que genera un espacio vectorial no

es única. El siguiente ejemplo muestra como pasar de una base a otra donde

ninguna de ellas es la base canónica.

Ejemplo 24: Construir una base B2 formada por los vectores:

a partir de una base B1 formada por los vectores:


7

1

0

0

2

2

,

3

2

1

31 vvv 2 y

para expresar el vector w = (-5, 2 ,-1)

Solución: El vector w en términos de vi de la base B1 es:

32 vvvw 3211 bbb

en donde suponemos que está bien definido pues es la base de donde

partimos. Entonces, el vector w puede expresarse como combinación lineal de

los vectores vi’s, como sigue:

O bien:

En la base B2, el vector w queda en términos de los vectores ui, como:

32 uuuw 3211 aaa

La base B1 expresada en términos de la base nueva B2 es:

0

2

1

1

5

0

0

0

4

7

1

0

0

2

1

1

5

0

0

0

4

0

2

2

0

2

1

1

5

0

0

0

4

3

2

1

3323133

3222122

3121111

ccc

ccc

ccc

v

v

v

Esta vez, encontrar las constantes ci no es tan directo como cuando se

involucra una base canónica. Sin embargo, el sistema de ecuaciones para

encontrar sus valores no es difícil de resolver:


La base B1 en términos de la base B2, es:

3213

312

3211

1872

9

0

2

1

18

1

5

0

7

0

0

4

2

9

7

1

0

4

1

0

2

1

1

5

0

0

0

0

4

4

1

0

2

2

2

133

8

15

0

2

1

2

13

1

5

0

3

0

0

4

8

15

3

2

1

uuuv

uuv

uuuv

Entonces, la matriz de transición es:

3

2

1

3

2

1

1812/13

703

2/94/18/15

b

b

b

a

a

a

Como los valores de bi ya se conocen, los valores de las ai pueden ser

estimados para dar:

2/3

1

8/13

1

2/7

2

1812/13

703

2/94/18/15

3

2

1

a

a

a

y así escribir w como:

321 2

3

8

13uuuw

Ejemplo 25: Escribir la matriz

64

12

en términos de la base nueva B2

formada por las matrices

40

20,

01

10,

13

02,

01

11

.


Solución: Queremos expresar la matriz como:

40

20

01

10

13

02

01

11

64

124321 aaaa

(3.11)

Desarrollando la suma del lado derecho de (3.11), tenemos:

Igualando componente a componente, tenemos el sistema de

ecuaciones siguientes para determinar las ai’s:

La matriz de transición de B1 a B2 es la inversa de la matriz de transición

de B2 a B1:

3110

1062014

2440

48814

14

1

4010

0131

2101

00211

Generalizando la Ec. (3.10), los valores de las ai son:

14/15

7/18

7/12

7/10

6

4

1

2

3110

1062014

2440

48814

14

1

4

3

2

1

a

a

a

a

Sustituyendo en (3.11), tenemos:

40

20

14

15

01

10

7

18

13

02

7

12

01

11

7

10

64

12

Ejemplo 26: Expresar el polinomio 2x3 – 3x2 + 5x – 6 en P3 en términos de la

nueva base B2 formada por los polinomios: (1), (1 + x), (x + x2), (x2 + x3).

Solución: Una vez más, deseamos expresar el polinomio en términos de la

nueva base:

2x3 – 3x2 + 5x – 6 = a1 (1) + a2 (1 + x) + a3 (x + x2) + a4 (x2 + x3)

Como en los ejemplos anteriores, la matriz de transición de la base canónica B1

a la nueva base B2 es la inversa de la matriz de transición de la base B2 a la

base canónica B1. Para facilitar la escritura de esta matriz de transición


hagamos analogía con la forma de escribir un vector en términos de vectores

unitarios y escribamos la base nueva B2 en términos de la base anterior

canónica B1:

1

1

0

0

1)(1)(1)(0)1(0

0

1

1

0

1)(0)(1)(1)1(0

0

0

1

1

1)(0)(0)(1)1(11

0

0

0

1

1)(0)(0)(0)1(11

323232

32322

3232

3232

xxxxxxxx

xxxxxxxx

xxxxxxx

xxxxxx

Los vectores columnas forman la matriz de transición. Dicha matriz y su inversa

se muestran enseguida:

1000

1100

1110

1111

1000

1100

0110

00111

Los valores de las ai’s son entonces:

3.2.2 Bases ortonormales

Definición 9: Se dice que un conjunto de vectores S={v1, v2, … , vn} en Rn es

un conjunto ortonormal si

1. vi · vj = 0 si i ≠ j


2. vi · vi = 1

Si sólo se satisface la condición [1], se dice que el conjunto es ortogonal. La

condición [2] solamente asegura que los vectores sean unitarios.

Se ha mencionado anteriormente que dos vectores son linealmente

independientes si ellos no son proporcionales, es decir, uno no se puede

escribir en términos del otro. Esto mismo sucede con los vectores ortogonales

(los que cumplen la propiedad [1] anterior). Como ellos son perpendiculares, no

hay manera de encontrar constantes que nos permitan expresar uno en

términos del otro. Así, los vectores ortogonales son linealmente

independientes.

La base canónica en Rn está formada por vectores ortogonales, o mejor

dicho, ortonormales dado que sus magnitudes son igual a uno. Es posible

encontrar una base ortonormal a partir de una base del espacio vectorial. Este

es el proceso de ortonormalización de Gram-Schmidt que se explica a

continuación con un ejemplo.

Antes de ver el ejemplo, recordaremos algunas expresiones importantes.

La primera de ellas es la de la obtención de un vector unitario n a partir de otro

vector m:

(3.12)

Otra expresión a recordar es la del cálculo de la proyección de un vector

a sobre otro vector b:

Y

X

a

b bb

baab 2

proy

bb

baac

2


Figura 3.6 Proyección ortogonal de un vector.

No siempre la proyección de a y el vector b tendrán la misma dirección. Si

sucede que estos vectores tienen direcciones opuestas, entonces tendremos

que el término .

Otra expresión a recordar es la del vector c el cual es la componente

perpendicular de a sobre b, también mostrado en la figura. La expresión para c

se obtiene de la suma de a, c y proyba:

(3.12)

En el caso particular de que el vector b sea un vector unitario, es decir,

║b║= 1, La Ec. (3.12) se simplifica a:

(3.13)

Aunque estas expresiones se obtuvieron en su momento para vectores

en R2, éstas se cumplen también para vectores en Rn.

Es fácil verificar que si c y b son perpendiculares, su producto escalar es

cero:

Para esta última expresión se utilizó el hecho de que b · b = 0 y la propiedad

conmutativa del producto escalar.

Por último, también utilizaremos la siguiente expresión basada en la Ec.

(3.13). Sea

(3.14)

Si multiplicamos escalarmente ambos miembros de (3.14) por bi, i = 1,2,…,k y

sabiendo que bi · bj = 0 si i ≠ j y que bi · bi = 1 por ser b un vector unitario,

entonces:

Esto nos dice que el conjunto {b1, b2,…, bk, c/║c║} es linealmente

independiente y ortonormal.


Ejemplo 28: Construya una base ortonormal en R4 a partir de la base formada

por los vectores .

Solución:

1. Elección del primer vector unitario: Primero escribimos el primer vector

unitario de la siguiente manera:

2. Cálculo de un vector ortogonal a u1: El siguiente paso es encontrar un

vector perpendicular al vector unitario u1. Llamemos a este vector v2’ y

utilicemos la Ec. (3.13) para calcularlo:

(3.15)

La Ec (3.15) comprende el cálculo de la proyección de v2 sobre u1 (Ec.

(3.13)) y el de la componente perpendicular a u1.

Las componentes del vector v2’ son, de acuerdo a (3.15):

cuya norma es:

Así, el segundo vector unitario, u2, es:


Si u1 y u2 son perpendiculares, entonces, u1 · u2 = 0

3. Cálculo de un tercer vector ortogonal a u1 y u2: El tercer vector unitario se

obtiene con la Ec. (3.14). Primero obtenemos un vector, llamémosle v3’, que

sea perpendicular a los vectores unitarios u1 y u2:

La norma del vector es

y el tercer vector unitario es:


4. Cálculo del cuarto vector ortogonal a u1, u2 y u3: El cuarto y último vector

unitario se obtiene de la misma forma con la Ec. (3.14). Primero obtenemos un

vector al cual llamaremos v4’, que será perpendicular a los vectores unitarios

u1, u2 y u3:

La norma del vector es

y el tercer vector unitario es:

Así, una base ortonormal para los vectores en R4 siguientes


es:

Definición 12: Una matriz Q de n × n se llama matriz ortogonal si Q es

invertible y su inversa es igual a su transpuesta:

Para escribir una matriz ortogonal de n × n, podemos usar una base

ortonormal para Rn.

Teorema 10: La matriz Q de n × n es ortogonal si y sólo si las columnas de Q

forman una base ortonormal para Rn.

Por ejemplo, considere los siguient

es vectores ortonormales:

Estos vectores son ortonormales pues tienen las siguientes propiedades:

Entonces, una matriz ortogonal puede construirse a partir de estos

vectores:

Es fácil verificar que Q -1 = QT y por lo tanto, Q es una matriz ortogonal:


Definición 13: Sea H un subespacio de Rn con base ortonormal {u1, u2, ..., uk}

Si v є Rn, entonces la proyección ortogonal de v sobre H, denotada proyH v,

está dada por:

Como puede verse, esta expresión es una generalización de la

proyección de un vector sobre otro, sólo que esta vez se está proyectando un

vector sobre una base, es decir, sobre un conjunto de vectores.

Ejemplo 29: Dado el plano:

Encuentre una base ortonormal para el conjunto de vectores en R3 que están

en el plano π y encuentre la proyección del vector m = (3, -2, 4) sobre el plano.

Solución: Para encontrar el conjunto de vectores generadores del

subespacio vectorial, despejamos una de las variables de la ecuación del

plano:

y cualquier vector w = (x, y, z) є π lo escribimos como sigue:

por lo que una base del subespacio vectorial es la formada por los vectores:

Para encontrar una base ortonormal obtenida a partir de la base B,

procedemos como anteriormente:

1. Encontramos un vector unitario:


2. La proyección de v2 sobre u1 se obtiene como sigue:

3. El vector v’2 ortogonal al vector unitario u1, es:

4. El segundo vector unitario u2 es, entonces,

Una manera alternativa de encontrar una base para el plano π, es darle

valores a las variables x e y en la ecuación del plano y calcular el valor de z

para cada una de las parejas. Esto nos conduce al siguiente conjunto de

vectores: v3 = (1, 2, -3) y v4 = (-2, -3, 3) los cuales generan el plano π.

La base ortonormal a partir de esta base se construye igual y,

obviamente, se obtendrá una base diferente. Esto nos conduce a la siguiente

base ortonormal:

Esta base ortonormal es diferente a la encontrada anteriormente pues se

obtuvieron a partir de bases diferentes.

La proyección del vector m = (3, -2, 4) є R3 sobre el plano π en términos

de la base B1 = {u1, u2}, es:

La proyección del vector m = (3, -2, 4) є R3 sobre el plano π en términos

de la base B1 = {u3, u4}, es:


De aquí que “la proyección del vector m = (3, -2, 4) є R 3 sobre el plano π ,

es independiente de la base ortonormal elegida.”

Teorema 11: Sea B = {u1, u2, ..., uk} una base ortonormal para Rn y sea v є Rn.

Entonces v = proyRn v, esto es:

Este teorema nos permite expresar un vector en el plano π del ejemplo

anterior en términos de los vectores generadores de la base ortonormal. Por

ejemplo para expresar el vector (1, 1, 0) є π, en términos de la base ortonormal

formada por los vectores

procedemos como lo dice el teorema anterior:

De la misma manera, para la base ortonormal formada por los vectores:


Ejemplo 30: Encuentre una base ortonormal para los vectores en R3 que están

en el plano XY.

Solución: Cualquier conjunto de dos vectores en R3 con z = 0 y que sean LI es

una base para R3. Una base vectorial podría ser el conjunto de vectores:

Cualquier vector en el plano Z = 0 puede escribirse en términos de B1:

Los coeficientes se encuentran al pasar de una base canónica a la base B1:

o bien:

De aquí obtenemos las siguientes expresiones para ai:

Así, el vector w = (-6, 5, 0) se escribirá en términos de B1 como:

Una base ortonormal encontrada a partir de B1 es:

Cualquier vector en el plano XY puede escribirse como combinación

lineal de estos vectores ortonormales. Los coeficientes se encuentran utilizando

el teorema 11. Por ejemplo, el vector w = (-½, ¼, 0), se expresa como:


3.2.3 Ajuste de curvas por mínimos cuadrados

En muchos problemas de las ciencias biológicas, físicas y sociales

resulta útil describir la relación entre las variables del problema por medio de

una expresión matemática.

Desafortunadamente, no es fácil obtener una fórmula como las que uno

está familiarizado. Una manera común de encontrar la relación entre las

variables de un problema es ajustar una curva entre los distintos grupos de

datos. Esta curva puede ser recta, cuadrática, cúbica, etc. El objetivo es

encontrar la curva del tipo específico que se ajuste mejor a los datos dados.

Estudiaremos el caso en que se tienen dos variables suponiendo que existen n

pareja de datos (x1, y1), (x2, y2), …, (xn, yn).

Aproximación por una recta . Buscamos la recta de la forma y = b + mx que

mejor represente a los n datos (x1, y1), (x2, y2), …, (xn, yn).

Si los valores x y y están relacionados por la fórmula y = b + mx,

entonces para x = x1 el valor correspondiente de y es b + mx1 que puede ser

igual al valor real y1. Esto se muestra en el siguiente esquema:


Figura 3.7 Ajuste lineal de datos por el método de mínimos cuadrados.

Lo que se busca es la recta que pase lo más cerca posible de todos los

puntos, es decir, aquella recta que minimiza la suma de los cuadrados de las

diferencias entre los valores reales y los estimados con la recta

correspondiente:

Claro que si los puntos caen sobre la recta, entonces se cumple que:

o bien:

que expresado en forma matricial nos queda:

O bien:

(3.16)

Si los puntos NO caen sobre la recta, entonces:

(x4, b+mx4)

Datos reales

Datos estimados

X

Y(x1, y1)

(x2, y2)

(x3, y3)

(x4, y4)

(x1, b+mx1)

(x2, b+mx2)

(x3, b+mx3)

y = b + mx


y debemos encontrar el valor de tal que la norma euclidiana sea

mínima. Gráficamente, en R3, esto significa lo siguiente:

Figura 3.8 Diferencia entre vectores de valores reales y valores ajustados.

Si es el vector que minimiza la norma Euclideana, entonces: ┴

, es decir:

como UT ≠ 0, entonces y de aquí obtenemos:

(3.17)

Ejemplo 31: Encuentre la recta que mejor ajusta los puntos: (1, 4), (-2, 5), (3, -

1) y (4, 1)

Solución: Un bosquejo de la gráfica se da en la Figura 3.9. Para encontrar

de la Ec.(3.17), debemos encontrar los términos de dicha expresión. La matriz

A del sistema es, de acuerdo a la Ec. (3.16):

y su transpuesta es:

X

Y

Z

AU

Y

Y − AU


Figura 3.10 Datos experimentales y recta de ajuste obtenida por mínimos cuadrados.

Así, de acuerdo con (3.16), primero debemos encontrar el producto ATA:

Ahora debemos encontrar la inversa de este producto:

Después realizamos el producto (AT A)-1 AT:

Y por último, calculamos los parámetros de la recta de ajuste como

sigue:

Así, la recta que mejor ajusta los puntos tiene por ecuación:

Ejemplo 32: Estimación de g. Se dejó caer un cuerpo desde una altura de 200

m y se midieron los tiempos en que dicho cuerpo pasó por ciertas posiciones

dadas en seguida:


Tiempo (s) 0 1 2 4 6

Altura (m) 200 195 180 120 25

Solución: Sabemos que la forma en que se relaciona la posición, s, con el

tiempo, t, de un cuerpo en caída libre es:

Así que para estimar el valor de g debemos usar un polinomio de segundo

grado:

Para facilitar la solución del problema, se usarán solamente los datos de

las celdas marcadas de color gris. La matriz del sistema y su transpuesta son:

El producto de estas dos matrices es:

La inversa de esta matriz es:

Después calculamos el producto (AT A)-1 AT:

y por último el producto (AT A)-1 ATY, es:

Así, la ecuación cuadrática que mejor ajusta los datos es:


Por comparación con la ecuación cuadrática de movimiento, tenemos lo

siguiente:


3.3 Dimensión de una base de un espacio vectorial

A continuación se da una serie de las definiciones relacionadas con el

tema de Base y Dimensión.

Definición 14: Si el espacio vectorial V tiene una base finita, entonces la

dimensión de V, denotada dim (V), es el número de vectores en todas las

bases y V se llama espacio vectorial de dimensión finita. De otra manera, V se

llama espacio vectorial de dimensión infinita. Si V = {0}, entonces se dice que V

tiene dimensión cero.

Definición 15: El espacio nulo de una matriz o KERNEL, denotado como NA,

es el conjunto de vectores en Rn que satisfacen el sistema homogéneo:

Definición 16: La nulidad de NA, denotado por (A), se refiere al número de

vectores en la base que genera dicho espacio vectorial NA:

Definición 17: La imagen de una matriz A de m × n, denotada por Imagen(A),

se refiere al conjunto de vectores formado por los términos independientes en

el sistema de ecuaciones:

Definición 18: El rango de una matriz A de m × n, denotado por ρ(A), es la

dimensión de la imagen de la matriz A:

Definición 19: El espacio de las columnas, CA, y de los renglones, RA, de

una matriz A de m × n son los espacios generados por las columnas y los

renglones, respectivamente, de la matriz A:

RA = gen{r1, r2, … , rm}

CA = gen{c1, c2, … , cn}

Es decir, solamente aquellas columnas y renglones que sean linealmente

independientes generarán dichos espacios de columnas y renglones. En

algunas ocasiones se usarán todas las columnas y todos los renglones de la

matriz A para generar dichos espacios y en algunas ocasiones solamente se

usarán ciertas columnas y ciertos renglones para generarlos. Esto se sabe

después de verificar si las columnas y los renglones son o no L.I. o no. Sin


embargo, existe un teorema que nos permite determinar la dimensión de estos

espacios vectoriales fácilmente:

dim(RA) = dim (CA) = ρ(A)

Además, existe un teorema que dice: la imagen de una matriz A es igual

al espacio de las columnas. Esto nos permite estimar la imagen de la matriz A,

imagen(A), a partir de la matriz de coeficientes como se verá más adelante.

Otro teorema nos permite conocer todos estos elementos de una matriz

a partir de la forma escalonada por renglones:

Teorema 12: Si A es equivalente por renglones a B, entonces RA = RB, ρ(A) =

ρ(B), (A) = (B).

Apliquemos estas definiciones en los siguientes ejemplos:

Ejemplo 33: Encuentre el rango (ρ(A)) y la nulidad ((A)), una base para la

imagen y el espacio nulo de la matriz dada:

Solución: Esta matriz A es la matriz de coeficientes de un sistema de

ecuaciones. Podemos decir que es la matriz de un sistema homogéneo como

el siguiente:

y también de un sistema no homogéneo cuyos términos independientes no

conocemos pues depende de cada caso particular. Sin embargo, podemos

llamar a esta vector Y con componentes Y = (y1, y2, y3). El sistema no

homogéneo es entonces:

Resolveremos éste último sistema para ver la conveniencia de trabajar

con las definiciones anteriores. La matriz aumentada del sistema es entonces:

Cuando esta matriz se escalona, obtenemos los siguiente:


(3.18)

Primero trabajaremos con el lado izquierdo de esta matriz equivalente.

Esto es similar a trabajar con el sistema homogéneo. Entonces tendremos:

(3.19)

Si quisiéramos construir el espacio de las columnas, tendríamos que

verificar si las columnas de la matriz son o no L.I. Para esto tendríamos las

siguientes tres columnas:

Después, si c1, c2 y c3 son L.I., encontraríamos las constantes, ai, que nos

permitieran escribir a1c1 + a2c2 + a3c3 = 0. En términos de componentes

quedaría expresado como:

El sistema homogéneo para encontrar las constantes ai sería, entonces,

el mismo sistema mencionado arriba con la misma matriz A de coeficientes

escalonada anteriormente (vea (3.19)). De aquí podemos ver que como el

último renglón son solamente ceros, las columnas ci son L.D. pues las

constantes ai son, de acuerdo a (3.19):

De acuerdo con esto, dado que las columnas son L.D., entonces no

debemos tomarlas todas para formar el espacio de las columnas; dos de ellas

serán suficientes, digamos c1 y c2. Así, tenemos que:

CA = gen{c1, c2}


Solo como comprobación, si c1 y c2 generan el espacio de columnas,

entonces c3 puede expresarse como combinación lineal de ellas, tal como se

muestra a continuación:

Además, como se requieren dos vectores, c1 y c2, para generar CA,

entonces:

dim (CA) = 2

Todo esto se refleja en el número de pivotes de la Ec. (3.19). Hay dos

pivotes y por lo tanto se requieren dos vectores para generar el espacio

vectorial de las columnas.

Siguiendo con la matriz del sistema homogéneo, para determinar una

base del espacio nulo, NA, de la matriz volvemos a (3.19). La solución del

sistema homogéneo la expresamos como:

Esto nos permite expresar el sistema solución, X, como:

es decir, una base para el espacio nulo, NA, es el vector

entonces la nulidad es (A) = 1.

Para obtener la imagen de A, imagen(A), utilizamos el sistema no

homogéneo. De (3.18) vemos que para que el sistema tenga solución, debe

ocurrir que:

-2y1 – y2 + y3 = 0

Despejando cualquiera de las variables, tenemos:

y2 = -2y1 + y3

Lo que nos permite escribir el conjunto de términos independientes como:


Así, una base para la imagen de A es:

De aquí que, dado que se requieren dos vectores para formar una base para la

imagen de A, el rango de A es: ρ(A) = dim(imagen(A)) = 2.

Toda esta información también se ve en la matriz escalonada por

renglones (3.19). No es una coincidencia que el número de pivotes sea igual al

rango de A, ρ(A), y que una base para la imagen de A sean las columnas

tomadas para construir el espacio de las columnas. Es decir, otra base para la

imagen de A es:

Una manera de comprobar el resultado obtenido, es tomando un vector

X cualquiera y evaluando el sistema NO HOMOGENEO para obtener un vector

Y y entonces escribir este vector como combinación lineal de los vectores que

forman la base de Y:

Así, si , sustituyendo en el sistema no homogéneo tenemos

el cual se puede escribir como:

o utilizando las columnas c1 y c2:


Para generar el espacio de los renglones, RA, también necesitamos

solamente dos vectores, pues ρ(A) = 2. Así, por ejemplo r1 = (1, -1, 2) y r2 = (3,

1, 4) generan el espacio de los renglones RA. El otro renglón, r3, es una

combinación lineal de ellos:

Ahora que ya sabemos la relación entre los sistemas de ecuaciones

homogéneo y no homogéneo con las definiciones, obtendremos estos

elementos de la matriz a partir de la propia matriz en el siguiente ejemplo.

Ejemplo 34: Encuentre el espacio nulo, la nulidad, CA, RA, imagen (A), el rango,

de la matriz

Solución Primero obtenemos la matriz equivalente de A escalonada por

renglones, para obtener la información requerida.

(3.20)

Esta matriz tiene 3 pivotes, por lo tanto el rango de la matriz A es 3 y

además:

dim(CA) = dim(RA) = ρ(A) = 3

Esto quiere decir, que para construir el espacio de las soluciones de A, el

espacio de las columnas y el espacio de los renglones, se requieren tres

vectores que formen las respectivas bases:


Para obtener el espacio nulo, de (3.20) podemos escribir las variables xi

como sigue:

Con lo que escribimos el vector X como:

Este vector forma la base del espacio vectorial que contiene los vectores

X solución del sistema homogéneo. Por lo tanto, la nulidad es (A) = 1 y el

espacio nulo:


3.4 Transformaciones lineales

Definición 20: Sean V y W espacios vectoriales reales. Una transformación

lineal T de V en W es una función que asigna a cada vector v en V un vector

único Tv en W y que para cada u y v en V y cada escalar k, satisface las

siguientes dos condiciones:

i). T(u + v) = T(u) + T(v)

ii). T(kv) = k T(v)

Ejemplo 35: La proyección ortogonal de un vector v = (vx, vy) sobre la línea

recta en la dirección del vector u = (2, 1) es una transformación de R2 en R2

definida en cada vector v como:

(3.21)

Sustituyendo las componentes del vector u en (3.21), tenemos:

(3.22)

Así, para encontrar la proyección de un vector v1 sobre el vector u

aplicamos (3.22) a dicho vector. Por ejemplo, sea el vector v1 = (-3, 1),

Aplicando (3.22) a v1 = (-3, 1), obtenemos:

Para otro vector v2 = (3, -2), con (3.22), tenemos:

La Figura 3.11 muestra la proyección de v1 y v2 sobre u.


Figura 3.11 Proyección ortogonal como transformación lineal.

La transformación por proyección es una Transformación Lineal

pues satisface las condiciones (i) y (ii) dadas en la Definición 15.

Si definimos dos vectores v = (vx, vy) y w = (wx, wy), la proyección sobre

un vector u se obtiene aplicando (3.21):

Si ahora definimos un número real α, entonces:

La matriz de transformación AT, para una transformación por proyección

T: R2→ R2 se obtiene aplicando (3.21) a los vectores de la base canónica:


Entonces, AT es:

(3.23)

Para el ejemplo particular con v = (-3, 1) y u = (2, 1), aplicando (3.23),

tenemos:

Teorema: Sea T: Rn → Rm una transformación lineal. Entonces existe una

matriz única AT de m × n tal que:

T x = AT x para todo x є Rn

Definición: Si AT es una matriz de m × n y una transformación T: Rn → Rm está

definida por Tx = ATx, entonces T es una transformación lineal.

Definición: Sean V y W dos espacios vectoriales y sea T: V → W una

transformación lineal. Entonces:

1. El núcleo de la transformación, denotado núcleo (T), está dado por:

nucleo(T) = {v є V│Tv = 0}

2. La imagen de T, denotada Imagen (T), está dada por:

Imagen (T) = {w є W │ w = Tv para algún v є V}

3. La nulidad de T, denotada ν(T), se define como:

ν(T) = dim(nucleo(T))

4. El rango de T, denotado ρ(T), se define como:

ρ(T) = dim(Imagen(T))

Dado que una transformación lineal posee una matriz de transformación,

entonces las definiciones dadas arriba pueden referirse a dicha matriz:

nucleo(T) = N(AT)

Imagen(T) = Imagen(AT) = CAT

ν(T) = ν(AT)

ρ(T) = ρ(AT)


Siguiendo con el ejemplo 35, sabemos que los vectores ortonormales

y , es una base canónica para el espacio vectorial R2 y que cualquier

vector en R2 puede escribirse como combinación lineal de ellos. Un vector

cualquiera v = (vx , vy) є R2, es entonces expresado como:

1

0

0

1yx

y

x vvv

vv

Si aplicamos la transformación T sobre el vector v, y por las propiedades

de linealidad de la transformación, tenemos:

1

0

0

1

1

0

0

1)( TvTvvvT

v

vTT yxyx

y

xv

La transformación aplicada sobre los vectores de la base canónica nos

da por resultado otros vectores con los que puede escribirse una matriz

llamada matriz de transformación.

La matriz de transformación, AT, para una transformación por proyección

T: R2→ R2 se obtiene aplicando (3.21) a los vectores de la base canónica:

2

2

2

2

2

0

1

u

u

u

u

yx

x

xy

xx

uu

u

uu

uu

T

2

2

2

2

2

1

0

u

u

u

u

y

yx

yy

yx

u

uu

uu

uu

T

Entonces, AT es:

2

2

2

1

yyx

yxxT uuu

uuuA

u (3.23)

Para el ejemplo particular con v = (-3, 1) y u = (2, 1), aplicando (3.23),

tenemos:


1

2

1

3

12

24

5

11

1

32

2

2y

x

yyx

yxxT v

v

uuu

uuuAT

uv

Ejemplo 34: Encuentre la representación matricial AT de la transformación

lineal:

zyx

zyx

zyx

z

y

x

T

363

242

2

Aplicamos la transformación a los vectores de la base canónica:

3

2

1

1

0

0

,

6

4

2

0

1

0

,

3

2

1

0

0

1

TTT

Entonces, la matriz de transformación es:

363

242

121

TA

Si queremos determinar el núcleo, la imagen, la nulidad y el rango de la

transformación, partimos de su matriz de transformación AT y la escalonamos

para encontrar una matriz equivalente:

000

000

121

363

000

121

363

242

121

363

242

1213132121 RRRRR

El espacio nulo de la matriz AT se obtiene de la matriz equivalente por

renglones:

1

0

1

0

1

22

zy

z

y

zy

z

y

x

Así, una base para generar N(AT) son los vectores anteriores. Por lo

tanto, el núcleo de la transformación T, es el espacio nulo de AT:

nucleo(T) = N(AT) = gen


y la nulidad de la transformación es entonces ν(T) = 2.

Además, como la matriz equivalente por renglones contiene únicamente

un pivote, el rango de AT, y por lo tanto de la transformación T, es:

ρ(T) = ρ(AT) = 1

De igual manera, la imagen de la transformación es la imagen de AT:

Imagen(T) = Imagen(AT) = CAT =

Ejemplo 36: Considere la transformación de rotación y determine las

imágenes bajo una rotación de φ = ½ π de la curva:

Rt

t

tB 2

Primero encontraremos la transformación por rotación de un vector v.

Supongamos que tenemos un vector v = (vx , vy) en el plano XY. Este vector v

tiene una dirección θ medido desde la parte positiva del eje X en sentido

contrario a las manecillas del reloj. Si este vector v se rota un ángulo φ medido

desde su posición inicial y en sentido contrario a las manecillas del reloj, su

norma ║v║ no cambia, pero sus componentes escalares SÍ. Llamemos a este

nuevo vector v’ = (v’x , v’y).

De la figura tenemos figura tenemos las siguientes relaciones:

sin,cos vv yx vv

)sin(',)cos(' vv yx vv

Desarrollando el coseno y el seno de la suma de dos ángulos, tenemos:

sinsincoscos)cos(' vvxv

θ

θ + φφ

v = (vx , vy)

v’ = ( v’x , v’y)


sinsincoscos' vv xv

y para v’y:

Así, la transformación de rotación aplicada a un vector v nos da otro

vector v’ cuyas componentes son:

La matriz de transformación se obtiene al aplicar esta transformación por

rotación a los vectores de la base canónica:

y la matriz de transformación AT, es:

La transformación por rotación puede, entonces expresarse como:

y

x

y

x

v

v

v

vT

cossin

sincos

o de forma más compacta:

vv TAT )(

Volviendo al problema inicial, si v = (t , t2) y φ = ½ π, entonces la

transformación T sobre v es:

x

x

x

x

x

x

x

xT

2

222 01

10

2cos

2sin

2sin

2cos


-20 -18 -16 -14 -12 -10 -8 -6 -4 -2 0 2 4 6-10

-8

-6

-4

-2

0

2

4

6

8

10

12

14

16

18

20

Ejemplo 34: Transformación de proyección ortogonal de un vector en R3 sobre

un plano que pasa por el origen del sistema coordenado tridimensional.

Un plano, Π, que pasa por el origen tiene por ecuación:

0 CzByAx

Este plano tiene una base ortonormal formada por los vectores unitarios u1 y

u2. Así, es posible estimar la proyección ortogonal sobre el plano Π de

cualquier vector w є R3mediante la expresión:

2211 uuwuuww proy

Ahora consideremos el vector w = (wx, wy, wz) y estimemos su

proyección sobre el plano coordenado XY. La base ortonormal para el plano XY

son los vectores unitarios:

0

1

0

,

0

0

1

1B

Entonces, la proyección de w sobre el plano XY es el vector con

coordenadas:

2211 uuwuuww XYproy

00

1

0

0

1

0

0

0

1

0

0

1

y

x

zyxzyxXY w

w

wwwwwwproy w


Así, la transformación de proyección de un vector w є R3 sobre el plano

coordenado XY es:

0y

x

z

y

x

w

w

w

w

w

T

Aplicando esta transformación a los vectores unitarios, tenemos:

0

0

0

1

0

0

,

0

1

0

0

1

0

,

0

0

1

0

0

1

TTT

y la matriz de transformación es:

Como puede verse, esta matriz ya está escalonada por renglones, el

núcleo de la transformación es el vector (0, 0, wz) por lo que la nulidad de la

transformación es ν(T) = 1. Solamente hay dos pivotes por lo que el rango de la

transformación es ρ(T) = 2 y la imagen de la transformación es

Imagen(T) = Imagen(AT) = gen

3.4.1 Geometría de las transformaciones lineales

Existen otras transformaciones que pueden considerarse elementales y

que se definen a continuación:

Transformación por REFLEXIÓN. Existen tres tipos elementales de

transformación por reflexión:

Reflexión respecto al eje X:

Cuando esta transformación se aplica sobre un vector lo que se obtiene

es otro vector simétrico al primero con respecto al eje X.


Reflexión sobre el eje Y: Como la anterior, esta reflexión, produce un vector

simétrico pero respecto al eje Y como se muestra en la figura. La

transformación y la matriz, son:

Observe que las matrices de transformación son como matrices

elementales obtenidas de realizar el producto por -1 sobre los renglones de las

matrices identidad.

La representación geométrica de la reflexión sobre los ejes X y Y se

muestra enseguida:

Figura 3.12 Transformación de reflexión sobre los ejes X y Y.

Reflexión sobre la recta y = x. Esta reflexión viene dada por:

la cual tiene la siguiente matriz de transición:

Note que esta reflexión es equivalente a una permutación aplicada sobre

la matriz identidad. Geométricamente, esto significa lo siguiente:

Y

X

v = (x, y)

T(v) = (x, −y)

X

v = (x, y)T(v) = (−x, y)Y


Figura 3.13 Reflexión sobre la recta y = x.

Transformación por EXPANSIÓN y COMPRESIÓN. En este tipo de

transformaciones existen también dos tipos de ellas: a lo largo del eje X y del

eje Y.

La transformación a lo largo del eje X se define como sigue:

donde c es un número real. La matriz de transformación, AT, es:

La transformación a lo largo del eje Y se define como:

y la matriz elemental es:

Así, las matrices de transformación son equivalentes a multiplicar el

renglón correspondiente de la matriz identidad por el número real c.

En ambos casos, si c > 1, la transformación es una EXPANSIÓN, si 0 <

c < 1, la transformación es una COMPRESIÓN.

En la Figura 3.14 se muestra la expansión a lo largo del eje X y la

compresión a lo largo del eje Y como ejemplo de estas transformaciones.

X

Yv

T(v)

y = x


Figura 3.14 Expansión a lo largo de los ejes X y Y.

Transformación por CORTE, Un “corte” a lo largo del eje X es una

transformación que toma al vector (x, y) y lo convierte en un nuevo vector

(x+cy, y) donde c es un número real, es decir:

La matriz de transformación es:

la cual es equivalente a la siguiente matriz elemental:

La Figura 3.15 muestra un “corte” a lo largo del eje X:

Figura 3.15 Corte a lo largo del eje X.

Note como la base del rectángulo sombreado no cambia al aplicar el

“corte”. De hecho, si aplica la transformación a estos puntos sus coordenadas

no cambiarán.

El “corte” a lo largo del eje Y viene dado por:

Y

T(v) = (ac, b)

X

v =(a, b)

(a, 0)

(0, b)

(ac, 0)

T(v) = (a, bc)

X(a, 0)

(0, bc)

(0, b)

Yv =(a, b)

0 < c < 1

c > 1

X

Y

(a, b)

(a, 0)

(0, b)

(0, 0)X

Y

(a, 0)

(0, b) (bc, b)(a+bc, b)

(0, 0)

c > 0


y su matriz de transformación es:

Como antes, la matriz de transformación es equivalente a la matriz elemental

siguiente:

y la siguiente figura muestra un “corte” a lo largo del eje Y:

Figura 3.16 Corte a lo largo del eje Y.

En el corte a lo largo del eje Y, son las coordenadas de lado del

paralelogramo sobre el eje Y cuyas coordenadas no cambian al aplicarles la

transformación.

X

Y

(a, b)

(a, 0)

(0, b)

(0, 0)X

Y

(a, 0)

(0, b)

(a, ac)

(0, 0)

(a, ac + b)

c > 0


La siguiente tabla resume las transformaciones anteriores:

TransformaciónRespecto al

eje

Matriz de

Transformación, AT

Condiciones

REFLEXIÓN

X

Y

Rectay = x

EXPANSIÓN &COMPRESIÓN

X Si c > 0 se trata de una Expansión.Si 0 < c < 1 se trata de una Compresión.Y

CORTE

XSi c > 0, el Corte es en el sentido positivo del eje coordenado y en sentido opuesto en caso contrario.

Y

Ejercicios: Exprese la matriz de transformación dada como una sucesión de

EXPANSIÓN, COMPRESIÓN, REFLEXIÓN Y CORTE.

1. 2. 3. 4.

5. 6. 7. 8.

Resolveremos algunos de los ejercicios para explicar el procedimiento:

Ejercicio 2. La matriz de transformación es . Para expresar esta

matriz como el producto de matrices, primero encontramos su inversa:

Como se vio anteriormente, la matriz de transformación AT puede

escribirse como un producto de inversas de matrices elementales. La ventaja

de las matrices elementales es que su inversa se calcula rápidamente por

inspección. Así, AT puede escribirse como sigue:


De acuerdo a la tabla anterior, la matriz de transformación, AT, es el

resultado de un conjunto simultáneo de transformaciones:

Etapa Transformación Elemental Resultado de la transformación

1Como el valor de la constante c = 2/3, la transformación consiste en un Corte a lo largo del eje X.

2 Esta transformación se trata de una Expansión a lo largo del eje Y pues c = 14/3 > 0.

3 Esta es una transformación de Corte a lo largo del eje Y con c = -1.

4 Esta es una expansión a lo largo del eje X pues c = 3 > 0.

Veamos ahora que significa geométricamente lo anterior. Cuando se

aplican todas estas transformaciones a un vector, digamos v = (-2, 5), tenemos:

Etapa 1: Corte a lo largo del eje X. Esta transformación aplicada al vector es:

Figura 3.17 Etapa 1: Corte a lo largo del eje X.

Etapa 2. La siguiente etapa consiste en una expansión a lo largo del eje Y. La

matriz de transformación es aplicada al vector resultante de la Etapa 1:


Figura 3.18 Etapa 2: Expansión a lo largo del eje Y.

Etapa 3. Esta es otra transformación por Corte aplicada al vector resultante de

la etapa anterior, pero en esta ocasión el corte es realizado a lo largo del eje Y

en la dirección negativa dado que c = -1:

En la figura se incluyen, nuevamente, el vector resultado de la

transformación anterior (etapa 2) y el vector resultado de la transformación de

la etapa 3. Note que, como el Corte se hizo en el sentido negativo del eje Y, la

longitud del vector se ha reducido ligeramente. Note, también, que el lado del

paralelogramo que descansa sobre el eje Y se mantiene intacto, es decir, sus

coordenadas se mantienen igual a pesar de aplicarles la transformación.


Figura 3.19. Etapa 3: Corte a lo largo del eje Y.

Etapa 4: Finalmente el vector resultante de la transformación anterior,

experimenta una expansión a lo largo del eje Y:

Figura 3.20 Etapa 4: Expansión a lo largo del eje Y.

El resultado final es igual al que se obtendría si se efectúa la

transformación total sobre el vector como puede verse a continuación:


Para resolver el ejercicio (3), empezamos nuevamente escalonando la

matriz de transformación:

La matriz AT puede entonces escribirse como el producto de matrices

elementales inversas:

EtapaTransformación

ElementalResultado de la Transformación

1

Reflexión sobre la recta y = x. Note que esto es

similar a una permutación hecha sobre la matriz

identidad.

2Debido a que c > 1, la transformación se trata de

una Expansión a lo largo del eje Y.

3

Esta transformación es, en realidad, una

combinación de una Expansión a lo largo del eje

Y seguida de una Reflexión respecto al eje X.

4Esta transformación consiste en un corte a lo

largo de la parte negativa del eje X pues c < 0.

Respecto a la Etapa 3, a primera vista y por la posición que tiene el

parámetro c, podríamos pensar que se trata de una “Expansión” o

“Compresión” a lo largo del eje Y. Sin embargo, el hecho de que este

parámetro sea menor que cero nos hace pensar que no puede ser ni una ni la

otra pues aquéllas ocurren cuando c > 1 y 0 < c < 1, respectivamente, y no se

ha dicho nada acerca de otro valor de c. Como se menciona en la tabla, la

Etapa 3 es, en realidad, una combinación de dos transformaciones. Para ver

esto, es necesario descomponer, aún más, la matriz de transformación

correspondiente:


Los valores de las constantes t, u, v y w, pueden obtenerse por

inspección o realizando el producto de matrices e igualando las matrices de

ambos, componente a componente:

De este producto obtenemos que t = 1, u = 0, v = 0 y w = 2. Así, la matriz

para esta etapa queda descompuesta como sigue:

Con esto, es fácil ver que la primera parte es una Expansión a lo largo

del eje Y, seguida por una Reflexión sobre el eje X, como se mencionó

anteriormente.

III Transformaciones Lineales y Matrices

Documents

Transcript of III Transformaciones Lineales y Matrices