III Transformaciones Lineales y Matrices
-
Upload
isaias8a7562 -
Category
Documents
-
view
920 -
download
1
Transcript of III Transformaciones Lineales y Matrices
Dr. Isaias Ochoa Landín Página 1 12/04/2023
3. Transformaciones Lineales y Matrices
3.1 Espacios vectoriales
3.1.1 Espacio euclidiano n-dimensional
La idea de usar parejas de números para localizar puntos en el plano y
ternas para localizar puntos en el espacio tridimensional se concibió por
primera vez con claridad a mediados del s. XVII. A fines del s. XIX,
matemáticos y físicos empezaron a darse cuenta que no era necesario
quedarse en las ternas. Se reconoció que los conjuntos ordenados de cuatro
números (a1, a2, a3, a4) podían considerarse como puntos en el espacio
“tetradimensional”, los conjuntos ordenados de cinco números (a1, a2, a3, a4, a5)
como puntos en el espacio “pentadimensional”, etc. Aún cuando la concepción
geométrica no se extiende más allá del espacio tridimensional, es posible
extender muchas ideas conocidas más allá de tal espacio, trabajando con
propiedades analíticas o numéricas de puntos y vectores, en lugar de las
propiedades geométricas.
DEFINICION 1 : Si n es un entero positivo, entonces una n-ada ordenada es
una sucesión de n números reales (a1, a2,… an). El conjunto de todas las n-
adas se conoce como espacio n-dimensional euclidiano y se denota por Rn
Cuando n = 2, o bien n = 3, es común usar los términos “parejas
ordenadas” y “terna ordenada”. Cuando n = 1, cada n-ada ordenada consta de
un número real y, por tanto, R1 se puede concebir como el conjunto de los
números reales. Para este conjunto, es común escribir R en lugar de R1.
En el estudio del espacio tridimensional, el símbolo (a1, a2, a3) tiene dos
interpretaciones geométricas diferentes. Puede interpretarse como un punto, en
cuyo caso a1, a2 y a3 son las coordenadas o puede interpretarse como un
vector, en cuyo caso a1, a2 y a3 son las componentes:
Figura 3.1 Interpretación geométrica de una terna de números: Como punto o como vector.
A(a1,a2,a3) a = (a1,a2,a3)
Dr. Isaias Ochoa Landín Página 2 12/04/2023
Por lo tanto, se concluye que una n-ada ordenada (a1, a2,…, an) puede
concebirse como un “punto generalizado” o como un “vector generalizado.”
DEFINICION 2 : Se dice que dos vectores u = (u1, u2,…,un) y v = (v1, v2,…,vn) en
Rn son iguales si:
u1 = v1, u2 = v2,…un=vn
La suma u + v se define por:
u + v = (u1+v1, u2+v2,…,un+vn)
y si k es cualquier escalar, el múltiplo escalar ku se define por:
ku = (ku1, ku2,…,kun)
Las operaciones de adición y multiplicación escalar dadas en esta
definición se denominan operaciones estándar sobre Rn.
Se define el vector cero en Rn como el vector
0 = (0, 0,…, 0)
Si u es un vector cualquiera en Rn, entonces el negativo (o inverso
aditivo) de u se denota por – u y se define por:
- u = (-u1, -u2,…,-un)
Se define la sustracción de vectores en Rn por v – u = v + (−u) o, en
términos de las componentes:
v – u = (v1-u1, v2-u2,…, vn-un)
Las propiedades más importantes de la adición y la multiplicación
escalar de vectores en Rn se listan en el siguiente teorema:
TEOREMA 1: Si u = (u1, u2,…un), v = (v1, v2,…,vn) y w = (w1, w2,…, wn) son
vectores en Rn y k y l son escalares, entonces:
a). u + v = v + u
b). u + (v + w) = (u + v) + w
c). u + 0 = 0 + u = u
d). u + (−u) = 0
e). k(lu) = (kl)u
f). k(u + v) = ku + kv
g). (k + l)u = ku + lu
h). 1 u = u
Con este teorema los vectores en Rn pueden manipularse sin
expresarlos en términos de componentes, casi de la misma manera como se
Dr. Isaias Ochoa Landín Página 3 12/04/2023
manipulan los números reales. Por ejemplo, si deseamos despejar x en la
siguiente expresión vectorial:
x + u = v
(x + u) + (−u) = v + (−u)
x + (u – u) = v – u
x + 0 = v – u
x = v – u
A fin de extender las nociones de norma y ángulo entre vectores en Rn,
se principia con la generalización siguiente del producto escalar sobre R2 y R3.
DEFINICION 3: Si u = (u1, u2,…un) y v = (v1, v2,…,vn) son vectores cualesquiera
en Rn, entonces el producto euclidiano interior u•v se define por:
u•v = u1v1 + u2v2 + …+ unvn
TEOREMA 2: Si u y v son vectores en Rn y k es un escalar cualquiera,
entonces:
a). u•v = v•u
b). (u + v)•w = u•w + v•w
c). (ku)•v = k(u•v)
d). v•v ≥ 0. Además, v•v = 0 si y solo si v = 0.
Por analogía con las conocidas fórmulas en R2 y R3, se define la norma
euclidiana de un vector u = (u1, u2,…un) en Rn por
De modo análogo, si se conocen los puntos inicial y terminal del vector
U(u1, u2,…un) y V(v1, v2,…,v3), respectivamente, entonces la norma del vector
viene dada por:
La notación matricial para representar vectores, también es muy
recurrida por algunos autores. Así, si u y v son vectores columnas en Rn, las
siguientes operaciones matriciales pueden llevarse a cabo:
y
Dr. Isaias Ochoa Landín Página 4 12/04/2023
Las cuales producen los mismos resultados que las operaciones vectoriales.
Además, el producto escalar de dos vectores columnas u y v en Rn, expresado
en forma matricial, es:
Si θ es el ángulo formado por dos vectores u y v en Rn, entonces::
3.1.2 Espacios vectoriales
Para generalizar todavía más el concepto de vector, se definen los
espacios vectoriales bajos ciertas propiedades tales que, si son cumplidas por
los objetos que conforman el espacio vectorial, dichos objetos reciben el
nombre de vectores. Las propiedades son elegidas por medio de la abstracción
de las propiedades más importantes de los vectores en Rn; como
consecuencia, los vectores en Rn automáticamente satisfacen estas
propiedades. Por lo tanto, este nuevo concepto de vector incluye tanto a los
que se dieron con anterioridad como a muchas nuevas clases de vectores.
DEFINICION 4: Sea V un conjunto arbitrario de objetos sobre los cuales se
definen dos operaciones, la adición y la multiplicación por escalares. Por
adición se entiende una regla para asociar, con cada pareja de objetos u y v en
V, un elemento u + v llamado suma de u y v; por multiplicación escalar se
entiende una regla para asociar, con cada escalar k y cada objeto u en V, un
elemento ku, llamado múltiplo escalar de u por k. Si los axiomas siguientes
son satisfechos por todos los objetos u, v, w en V y todos los escalares k y l,
entonces V recibe el nombre de espacio vectorial y a los objetos en V se les
denomina vectores.
Propiedades de la suma 1. Si u є V y v є V, entonces u + v є V. Propiedad de cerradura 2. u + v = v + u Propiedad conmutativa 3. u + (v + w) = (u + v) + w Propiedad Asociativa 4. Existe un objeto 0 є V tal que:
u + 0 = 0 + u = u para todo u є V.Existencia del elemento identidad
5. Para cada u є V, existe un objeto –u є V, tal que u + (-u) = (-u) + u = 0 Existencia del inverso aditivo
Dr. Isaias Ochoa Landín Página 5 12/04/2023
Propiedades de la multiplicación por un escalar 6. Si k es cualquier número real y u є V,
entonces ku є V. Propiedad de cerradura 7. k(lu) = (kl)u Propiedad asociativa 8. k(u + v) = ku + kv Primera propiedad distributiva 9. (k + l)u = ku + lu Segunda propiedad distributiva10. 1 u = u Donde “1” es el número real 1
Algunos ejemplos de espacios vectoriales se muestran a continuación.
Como se mencionó anteriormente, para saber si un conjunto de vectores es un
espacio vectorial es necesario verificar los axiomas dados arriba, si alguno de
ellos no se cumple, el conjunto analizado no es un espacio vectorial.
Ejemplo 1. El conjunto de puntos en R2 que están en una recta que pasa por el
origen constituye un espacio vectorial:
Sea V = {(x,y)│y = mx, m es constante, m є R, x є R}, es decir, V
consiste en todos los puntos que están sobre la recta y = mx que pasa por el
orígen y tiene pendiente m.
1. Si u1 = (x1, y1) y u2 = (x2, y2) є V, entonces:
y1 = mx1
y2 = mx2
la suma (u1 + u2) є V como se muestra enseguida:
u1 + u2 = (x1, y1) + (x2, y2) (3.1a)
u1 + u2 = (x1, mx1) + (x2, mx2) (3.1b)
u1 + u2 = (x1 + x2, mx1 + mx2) (3.1c)
u1 + u2 = (x1 + x2, m(x1 + x2)) є V (3.1d)
2. Esta propiedad se cumple si aplicamos la propiedad conmutativa de los
números reales en la ecuación (3.1c):
u1 + u2 = (x2 + x1, mx2 + mx1) = u2 + u1
u2 + u1 = (x2 + x1, m(x2 + x1)) є V
3. Si existe un tercer vector u3 = (x3, y3), entonces la suma u1 + u2 + u3, es:
u1 + u2 + u3 = (x1, y1) + (x2, y2) + (x3, y3)
u1 + u2 + u3 = (x1, m x1) + (x2, m x2) + (x3, m x3)
u1 + u2 + u3 = (x1+ x2 + x3, m x1 +m x2 + m x3)
Aplicando la propiedad asociativa de los números reales, tenemos:
u1 + u2 + u3 = (x1+ (x2 + x3), m x1 + m(x2 + x3)) = u1 + (u2 + u3)
u1 + u2 + u3 = ((x1+ x2) + x3, m (x1 + x2 )+ m x3) = (u1 + u2) + u3
Dr. Isaias Ochoa Landín Página 6 12/04/2023
4. Como la recta pasa por el origen, podemos decir que u2 = 0 = (0, 0) є V.
Sustituyendo en (3.1d):
u1 + 0 = (x1 + 0, m(x1 + 0)) є V
5. Del mismo modo, si u2 = -u1 = (-x1, -y1) en (3.1d), tenemos:
u1 + (-u1) = (x1 + (-x1), mx1 + m(-x1))
u1 - u2 = (x1 – x1, m(x1 – x1)) = (0, 0) є V
6. Si el punto u1 = (x1, y1) є V y k є R es un número cualquiera, entonces el
producto por un escalar, es decir, el punto:
k u1 = k (x1, y1) (3.2a)
k u1 = (k x1, k (m x1)) є V (3.2b)
7. Sea l є R, entonces
k (l u1) = k (l x1, l y1)
k (l u1) = (k l)( x1, m x1) = (k l) u1 є V
8. Si k є R y u1 y u2 є V, entonces, de (3.1c)
k (u1 + u2) = k (x1 + x2, mx1 + mx2)
k (u1 + u2) = (k x1 + k x2, k mx1 + k mx2)
k (u1 + u2) = (k x1, k mx1) + (k x2, k mx2)
k (u1 + u2) = k (x1, mx1) + k (x2, mx2) = k u1 + k u2 є V
9. Si k y l є R, entonces:
(k + l) u1 = (k + l) (x1, y1)
(k + l) u1 = ((k + l) x1, (k + l) y1)
(k + l) u1 = ((k x1+ l x1), (k y1+ l y1))
(k + l) u1 = (k x1, k y1) + (l x1, l y1)
(k + l) u1 = k u1 + l u1 є V
10. Si hacemos k = 1 en (3.2b), tenemos:
1 u1 = (1 x1, 1 (m x1)) є V
Ejemplo 2. Sea V = {1}, es decir, V consiste solamente del número 1. Este no
es un espacio vectorial pues no cumple la propiedad de cerradura para la
suma:
La cerradura del producto por un escalar tampoco se cumple. Si r є R,
entonces:
por lo que podemos decir que V NO es un espacio vectorial.
Dr. Isaias Ochoa Landín Página 7 12/04/2023
Ejemplo 3: Verificar que el conjunto de matrices de 2 × 2 de la forma
con las operaciones usuales de la suma y multiplicación por un escalar, NO es
un espacio vectorial.
1. Verificamos la propiedad de cerradura para la suma. Sean dos matrices A y
B є V de la forma:
Entonces, la suma A + B viene dada por:
Como no cumple esta propiedad, entonces el conjunto de matrices NO es un
espacio vectorial.
3.1.3 Subespacios
Si V es un espacio vectorial, entonces ciertos subconjuntos de V forman
por sí mismos espacios vectoriales bajo la adición vectorial y la multiplicación
escalar definidas para V.
DEFINICION 5: Un subconjunto W de un espacio vectorial V es un subespacio
de V, si W es a sí mismo un espacio vectorial bajo la adición y multiplicación
escalar definidas sobre V.
En general, se deben verificar los diez axiomas de los espacios
vectoriales para demostrar que un conjunto W, con la adición y la multiplicación
escalar, forma un espacio vectorial. Sin embargo, si W es parte de un conjunto
mayor V del que ya se sabe que es un espacio vectorial, entonces ciertos
axiomas se “heredan” de V y no es necesario verificarlos para W. En este caso,
hablamos de los axiomas 2, 3, 4, 5, 7, 8, 9 y 10. Por lo tanto, para demostrar
que un conjunto W es un subespacio de un espacio vectorial V, solo es
necesario verificar los axiomas 1 y 6 correspondientes a la cerradura.
TEOREMA 3: Si W es un conjunto de uno o más vectores de un espacio
vectorial V, entonces W es un subconjunto de V si y solo si se cumplen las
siguientes propiedades:
i. Si u y v son vectores en W, entonces (u + v) є W.
ii. Si k є R y u є W entonces (k u) є W.
Dr. Isaias Ochoa Landín Página 8 12/04/2023
Estas propiedades se resumen diciendo que W es cerrado bajo la
adición y es cerrado bajo la multiplicación escalar.
Todo espacio vectorial V tiene al menos dos subespacios. El propio V es
un subespacio y el conjunto {0} que solo consta del vector cero en V es otro
subespacio denominado subespacio cero. Todos los otros subespacios se
conocen como subespacios propios.
Ejemplo 4: Verificar si es un subconjunto de R2.
i. Si y є S, entonces:
ii. Si y α є R, entonces:
por lo que el conjunto de vectores S es un subconjunto de R2.
Ejemplo 5: Sea S = {[x1 x2 x3]T │ x1 = x2}. ¿Es S un subespacio de R3?
i. Si [a a b]T є S y [c c d]T є S, entonces
[a a b]T + [c c d]T = [a+c a+c b+d]T є S
ii. Si x = [a a b]T є S y α є R, entonces:
[αa, αa, αb]T є S
y por lo tanto S es un subespacio de R3.
Ejemplo 6: El espacio nulo de una matriz. Sea A una matriz de m×n. Sea que
N(A) denote el conjunto de todas los vectores solución al sistema homogéneo
AX = 0, es decir, N(A) = {X є Rn │ AX = 0}. Verificar que N(A) es un subespacio
de Rn:
i. Si X e Y є N(A), entonces:
A(X + Y) = AX + AY = 0 + 0 = 0 є N(A)
por la propiedad distributiva del producto de matrices compatibles para la
multiplicación
.
ii. Si X є N(A) y α є R, entonces:
A(α X) = α AX = α 0 = 0 є V
por lo que, el espacio nulo de una matriz, N(A), es un subespacio de Rn.
Dr. Isaias Ochoa Landín Página 9 12/04/2023
3.1.4 Combinación lineal y espacio generado
DEFINICION 7: Sean v1, v2,…,vn vectores en un espacio vectorial V. Una suma
de la forma α1 v1 + α2 v2 +…+ αn vn, donde α1, α2,…,αn son escalares, recibe el
nombre de combinación lineal de v1, v2,…,vn.
Ejemplo 7: Todo vector v = (vx, vy, vz) є R3 puede escribirse en la forma:
v = vx i + vy j + vz k
es decir, v es una combinación lineal de los tres vectores unitarios i, j, k.
Ejemplo 8: Una matriz de 2×2 puede escribirse como combinación lineal de
matrices “unitarias”:
DEFINICION 8: Sean v1, v2,…,vk k vectores en un espacio vectorial V. El
espacio generado por {v1, v2,…,vk} es el conjunto de combinaciones lineales de
v1, v2,…,vk. En otras palabras:
gen{ v1, v2,…,vk} = {v │v = a1 v1 + a2 v2 +…+ ak vk}
donde a1, a2,…,ak son escalares arbitrarios.
Por lo estudiado anteriormente, se sabe que un espacio vectorial es
generado por un conjunto de vectores S = {v1, v2, … , vr}, si cada vector en V
es una combinación lineal de v1, v2, … , vr . Los conjuntos generadores resultan
útiles en una gran diversidad de problemas ya que, a menudo, es posible
estudiar un espacio vectorial V estudiando primero los vectores en un conjunto
generador S y, a continuación, extendiendo los resultados hacia el resto de V.
TEOREMA 4: Si v1, v2,…,vk son vectores en un espacio vectorial V, entonces
gen{ v1, v2,…,vk} es un subespacio de V.
Ejemplo 9: Espacio generado por dos vectores v1 = (2, -1, 4) y v2 = (4, 1, 6).
Solución: Cualquier vector v contenido en el espacio generado por v1 y v2
puede escribirse como una combinación lineal de estos dos vectores:
211 vvv 2aa
O bien, en términos de coordenadas:
Dr. Isaias Ochoa Landín Página 10 12/04/2023
De aquí podemos escribir el sistema de ecuaciones siguientes para encontrar
las constantes a1 y a2:
zaa
yaa
xaa
21
21
21
64
42
Resolviendo el sistema, tenemos:
zx
yx
x
z
yx
x
z
y
x
z
y
xRRRR
R
22
12
1
20
30
21
2
12
1
64
30
212
1
64
11
21
64
11
423121
1 42
1
Para que este sistema tenga solución, el último renglón debe de
satisfacerse, es decir:
03
2
3
5 zyx
O bien:
0325 zyx
la cual es la ecuación de un plano que pasa por el origen. Las trazas del plano
se obtienen al hacer cero cada una de las variables una por una. (Las trazas
son curvas en el espacio obtenidas de la intersección de dos superficies y es
por eso que deben especificarse las ecuaciones de ambas superficies. El que
una variable sea cero, representa un plano formado por las dos variables que
no aparecen en la ecuación.)
xyz
xzy
yzx
2
5,0
3
5,0
3
2,0
Dr. Isaias Ochoa Landín Página 11 12/04/2023
Así, cualquier vector que se encuentre en el plano definido por los
vectores v1 y v2, puede escribirse como una combinación lineal de ellos. Por
ejemplo, si consideramos el vector w = (-3, 0, -5), este vector puede escribirse:
21 vvw2
1
2
1
Un bosquejo del plano -5x+2y+3z=0 se muestra a continuación. Los
planos XY, XZ y YZ del primer octante han sido coloreados de gris para
resaltarlos. El perímetro de la porción del plano se ha coloreado de verde. La
porción del plano en el primer octante se ha coloreado de amarillo. De igual
manera, las porciones del plano que se verían en otros octantes se han
coloreado de azul y anaranjado.
Figura 3.2 Bosquejo del plano de ecuación -5x + 2y + 3z = 0.
Las trazas se han indicado de diferentes colores y su ecuación se ha
escrito del mismo color para fácil identificación. Las líneas continuas
representan intersecciones visibles de planos, mientras que las líneas
discontinuas representan líneas que se encuentran en la parte posterior o
inferior de otros planos.
Dr. Isaias Ochoa Landín Página 12 12/04/2023
En general, podemos decir que el espacio generado por dos vectores
diferentes de cero en R 3 que no son paralelos, es un plano que pasa por el
origen.
Ejemplo 10: Espacio generado por dos vectores en R3. Sean v1 = (3, -2, 1) y v2
= (1, 3, -4) dos vectores en R3. El espacio generado, H, por los vectores v1 y v2
en R3 es el conjunto de todos los vectores que se pueden escribir como
combinación lineal de ellos, es decir,
H = gen{v1, v2} = {v │ v = a1 v1 + a2 v2}
Solución: Para escribir un vector v = (x, y, z) є H como combinación lineal de
v1 y v2, debemos determinar las constantes a1 y a2 de la expresión:
v = (x, y, z) = a1 (3, -2, 1) + a2 (1, 3, -4) = (3a1 + a2, -2a1 + 3a2, a1 – 4a2)
El sistema de ecuaciones asociado se obtiene igualando componente a
componente los vectores anteriores:
3a1 + a2 = x
-2a1 + 3a2 = y
a1 – 4a2 = z
La matriz asociada al sistema no homogéneo y la matriz escalonada se
muestran enseguida: el proceso para escalonar la matriz se ha obviado.
Del último renglón tenemos:
5x + 13y +11z = 0
Esta es la ecuación de un plano que pasa por el origen del sistema
coordenado cuyo bosquejo se muestra en la Figura 3.3.
Únicamente aquellos vectores que estén contenidos en ese plano
podrán escribirse como combinación lineal de los vectores generadores v1 y v2.
Dr. Isaias Ochoa Landín Página 13 12/04/2023
Figura 3.3 Bosquejo del plano cuya ecuación es 5x + 13y +11z = 0.
Por lo estudiado anteriormente, se sabe que un espacio vectorial es
generado por un conjunto de vectores S = {v1, v2, … , vr}, si cada vector en V
es una combinación lineal de v1, v2, … , vr . Los conjuntos generadores resultan
útiles en una gran diversidad de problemas ya que, a menudo, es posible
estudiar un espacio vectorial V estudiando primero los vectores en un conjunto
generador S y, a continuación, extendiendo los resultados hacia V.
Ejemplo 11: Una compañía de concreto almacena tres mezclas básicas, dadas
en la tabla. Las cantidades se miden en gramos y cada “unidad” de mezcla
pesa 60 gramos. Puede formular mezclas especiales revolviendo
combinaciones de las tres mezclas básicas; entonces las mezclas especiales
posibles pertenecen al espacio generado por los tres vectores que representan
las tres mezclas básicas:
A B CCemento 20 18 12
Agua 10 10 10Arena 20 25 15Grava 10 5 15Tobas* 0 2 8TOTAL 60 60 60
*Piedra caliza porosa
Dr. Isaias Ochoa Landín Página 14 12/04/2023
a). ¿Puede hacer una mezcla que consiste en 1000 g de cemento, 200 g de
agua, 1000 g de arena, 500 g de grava y 300 g de tobas? ¿Porqué puede o
porqué no? Si puede, ¿cuántas unidades de cada una de las mezclas A, B y C
se necesitan para formular la mezcla especial?
Solución: Llamemos MA, MB y MC a la cantidad de la mezcla A, B y C,
respectivamente, necesaria para la mezcla final. Cada mezcla proporcionará
una determinada cantidad de cada componente, como sigue:
El vector (u, v, w, x, y) es el vector composición deseado. A pesar de
que sabemos la composición deseada de la mezcla, resolveremos el sistema
en forma general para usar el resultado en la parte (b).
La matriz asociada al sistema NO homogéneo, es:
El escalonamiento conduce a la siguiente matriz:
Cada una de las mezclas especiales A, B y C son vectores en R5 que
nos definen un espacio vectorial. Una mezcla obtenida de combinar estas
mezclas se puede expresar como combinación lineal de estas tres mezclas
especiales y esto solo es posible si la composición deseada de la mezcla
cumple las siguientes condiciones obtenidas de la matriz escalonada B:
Dr. Isaias Ochoa Landín Página 15 12/04/2023
En particular, deseamos una mezcla cuya composición sea:
entonces vemos que al sustituir estos valores en las ecuaciones, tenemos:
por lo que dicha mezcla no es posible de realizar.
b). Suponga que quiere hacer 5000 g de concreto que tiene una razón de agua
a cemento de 2 a 3, con 1250 g de cemento. Si debe incluir 1500 g de arena y
1000 g de grava en las especificaciones, encuentre la cantidad de tobas para
hacer 5000 g de concreto. ¿Se puede formular ésta como una mezcla
especial? Si es así, ¿cuántas unidades de cada mezcla se necesitan para
formular la mezcla especial?
Solución: Para esta mezcla, el vector composición es:
Las componentes de este vector están especificadas por las
componentes de la mezcla deseada. La componente v ha sido determinada de
la razón agua/cemento también especificada y requerida:
Para saber si es posible realizar esta mezcla debe cumplirse que:
Además:
de donde obtenemos que la cantidad de tobas requerida es:
Dr. Isaias Ochoa Landín Página 16 12/04/2023
Para calcular la cantidad requerida de cada mezcla especial, tenemos de
la matriz B:
Es importante notar la diferencia entre el espacio generado por un
conjunto de vectores y los vectores generadores de un espacio vectorial. En los
ejemplos anteriores hemos trabajado con el espacio generado por un conjunto
de vectores. En este caso, los vectores en el espacio generado pueden
escribirse como combinación lineal de dichos vectores. La siguiente definición
trata de los vectores generadores de un espacio vectorial.
Definición 9: Se dice que los vectores v1, v2,..., vn en un espacio vectorial V
generan a V si todo vector en V puede escribirse como una combinación lineal
de ellos. Es decir, para todo v є V, existen escalares a1, a2,..., an tales que
v = a1 v1 + a2 v2 + ... + an vn
Teorema: Si v1, v2,..., vk son vectores en un espacio vectorial V, entonces
gen{ v1, v2,..., vk} es un subespacio de V.
Demostración: Sean u y v dos vectores en gen{ v1, v2,..., vk} entonces deben
poder escribirse como combinación lineal de los vectores generadores:
u = a1 v1+ a2 v2 +... + ak vk
v = b1 v1+ b2 v2 +... + bk vk
Además, para que gen{ v1, v2,..., vk} sea una subespacio de V, deben de
cumplirse la propiedad de cerradura para la suma y el producto por un escalar:
u + v = (a1 v1+ a2 v2 +... + ak vk) + (b1 v1+ b2 v2 +... + bk vk)
u + v = (a1+ b1) v1+ (a1 + b2) v2 +... + (ak + bk) vk
Dr. Isaias Ochoa Landín Página 17 12/04/2023
Por lo tanto, la propiedad de cerradura se cumple. De la misma manera,
si α es número real:
α u = α (a1 v1+ a2 v2 +... + ak vk)
α u = α a1 v1+ α a2 v2 +... + α ak vk
la propiedad de cerradura para el producto de un vector por un escalar también
se cumple. De aquí que gen{ v1, v2,..., vk} es un subespacio de V.
3.1.5 Dependencia e independencia lineal
Sean v1, v2,…, vn, n vectores en un espacio vectorial V. Entonces se dice
que los vectores son linealmente dependientes si existen n escalares c1, c2,
…, cn no todos cero tales que:
c1 v1 + c2 v2 +…+ cn vn = 0
Si la única manera de satisfacer la relación anterior es que c1 = c2 =…=
cn = 0, se dice que v1, v2,…, vn son linealmente independientes.
Ejemplo 12: Determinar si los vectores son linealmente
independientes.
Solución: Necesitamos encontrar constantes ci diferentes de cero tales que:
El sistema de ecuaciones asociado para encontrar c1 y c2, es:
Podemos escribir el sistema de ecuaciones como sigue:
Como los vectores v1 y v2 son proporcionales, entonces son linealmente
dependientes.
Ejemplo 13: ¿Son los siguientes vectores linealmente independientes?
Dr. Isaias Ochoa Landín Página 18 12/04/2023
Solución: Si v1, v2 y v3 son linealmente dependientes, deben existir constantes
c1, c2 y c3 tales que:
c1 v1 + c2 v2 + c3 v3 = 0
O bien:
El sistema asociado para determinar c1, c2 y c3 es:
Como es un sistema homogéneo, la matriz aumentada no es necesaria y
trabajaremos solamente con la matriz de coeficientes para encontrar los
valores de ci’s:
100
010
001
1002
110
001
1002
110
101
10002
110
101
7602
110
101
7602
110
021
760
120
021
703
120
021
703
122
021
2313
332
122
3121
2
1
10
16
22
132
RRRRR
RR
RRRRRRR
De aquí que, como c1 = 0, c2 = 0 y c3 = 0, los vectores v1, v2 y v3 son
linealmente independientes
Note que en este caso tenemos un sistema cuadrado, es decir, el
número de ecuaciones y de incógnitas es el mismo (n = m). Note también que
el determinante de la matriz A es:
Esto significa que la inversa existe y que por lo tanto el sistema tiene
solución, pero también implica que la solución del sistema homogéneo es la
solución trivial y por lo tanto los vectores son linealmente independientes.
Dr. Isaias Ochoa Landín Página 19 12/04/2023
Teorema 5: Sea A una matriz de n × n. Entonces las ocho afirmaciones
siguientes son equivalentes:
i. A es invertible.
ii. La única solución del sistema homogéneo AX = 0 es la solución trivial.
iii. El sistema AX = B tiene una solución única para todo n-vector B.
iv. A es equivalente por renglones a la matriz identidad de n × n, In.
v. A se puede escribir como el producto de matrices elementales.
vi. La forma escalonada por renglones de A, tiene n pivotes.
vii. det (A) ≠ 0.
viii. Las columnas (y renglones) de A son linealmente independientes.
Ejemplo 14: Los siguientes vectores, ¿son linealmente independientes?
Solución: La matriz asociada del sistema y la matriz escalonada son:
de donde obtenemos: c1 = -2c3
c2 = -3c3
c3 = c3
Podemos encontrar valores de c1, c2 y c3 diferentes de cero por lo que
los vectores son linealmente dependientes. En otras palabras, tenemos:
(3.3)
por lo que los vectores son linealmente dependientes.
Nuevamente tenemos un sistema en el que n = m. Sin embargo, el
determinante de A en este caso, es:
Esto implica que la inversa de la matriz no existe y que por lo tanto los
vectores son linealmente dependientes al no cumplir el punto i del Teorema 5.
Ejemplo 15: Los vectores v1 = (-2, -3) y v2 = (1,6) en R2, ¿son linealmente
independientes?
Dr. Isaias Ochoa Landín Página 20 12/04/2023
Solución: La matriz asociada del sistema homogéneo es:
El determinante de A es:
por lo que los vectores son linealmente independientes.
Ejemplo 16: Si incluimos un vector v3 = (-2, 5) a los dos vectores del ejemplo
anterior, ¿son los vectores linealmente independientes?
Solución: La matriz del sistema y la matriz escalonada son:
De la matriz escalonada obtenemos que:
de aquí que ahora los vectores son linealmente dependientes pues se ha
introducido un vector adicional al conjunto de vectores que antes eran
linealmente independientes. En otras palabras, en el sistema de ecuaciones
tenemos más incógnitas que ecuaciones (n > m) y los vectores son linealmente
dependientes al tener el sistema un infinito número de soluciones.
Ejemplo 17: Tres matrices linealmente independientes en M23. Determine si las
siguientes matrices son linealmente independientes o no.
Solución: Si son linealmente independientes existen constantes ci tales que:
donde 0 en la ecuación anterior representa la matriz con componentes 0:
Desarrollando, tenemos:
El sistema de ecuaciones para determinar las ci es:
Dr. Isaias Ochoa Landín Página 21 12/04/2023
de donde se obtiene que c1 = c2 = c3 = 0 y por lo tanto A1, A2 y A3 son
linealmente independientes.
Ejemplo 18: Los siguientes polinomios (2x), (x3 – 3), (1 + x - 4x3), (x3 + 18x – 9)
en P3, ¿son linealmente independientes?
Solución: Debemos encontrar constantes tales que:
Para escribir el sistema de ecuaciones para calcular las constantes ci,
damos a x valores arbitrarios (tantos valores como constantes haya):
x = 0; -3c2 + c3 -9c4 = 0
x = 1; 2c1 – 2c2 – 2c3 + 10c4 = 0
x = -1; -2c1-7c2 + 4c3 – 28c4 = 0
x = 2; 4c1 + 5c2 – 29c3 + 35c4 = 0
La matriz asociada al sistema homogéneo es:
El determinante de A es:
por lo que los polinomios son linealmente dependientes.
Escalonando la matriz de coeficientes obtenemos:
11/6100
0000
11/35010
11/96001
352954
10222
9130
28442
De donde obtenemos que c1 = 96, c2 = 35, c3 = 6 y c4 = -11.
Dr. Isaias Ochoa Landín Página 22 12/04/2023
El sistema de ecuaciones para determinar las constantes ci también
pudo obtenerse derivando los polinomios tres veces (número de constantes
menos uno):
Así, la matriz de coeficientes es:
El escalonamiento de esta matriz produce el siguiente resultado:
de donde se obtiene que c1 = 96, c2 = 35, c3 = 6 y c4 = -11 como anteriormente.
Dr. Isaias Ochoa Landín Página 23 12/04/2023
De los ejercicios anteriores podemos extraer la siguiente propiedad de
Conjuntos Linealmente Dependientes:
Teorema 6: Un conjunto H = {v1, v2, …, vk}, k 2, es linealmente
dependiente sí y sólo si por lo menos uno de los vectores vj puede
expresarse como una combinación lineal de los demás vectores en H.
Un corolario del teorema anterior es el siguiente:
Dos vectores u y v en un espacio vectorial V son linealmente
dependientes sí y sólo si uno de ellos es un múltiplo escalar del otro.
Las siguientes definiciones son muy importantes para la independencia
lineal de funciones reales de variable real.
Definición 10: Sea dado un sistema finito de n funciones y1(x), y2(x), ..., yn(x)
definidas en un intervalo (a, b). Se dice que éstas son linealmente
dependientes en el intervalo (a, b), si existen constantes α1, α2, ..., αn, no
simultáneamente iguales a cero, tales que para todos los valores de x de este
intervalo se cumple la identidad:
α1 y1(x) + α2 y2(x) + ... + αn yn(x) ≡ 0
Si esta identidad se cumple solamente para α1 = α2 = ... = αn = 0, se dice que
las funciones y1(x), y2(x), ..., yn(x) son linealmente independientes en el intervalo
(a, b).
Definición 11: Sean y1, y2, ..., yn, funciones que admiten derivadas hasta el
orden (n-1), continuas en el intervalo a ≤ x ≤ b. El determinante:
se llama determinante de Wronsky (o wronskiano) de estas funciones.
Obsérvese que, por lo general, el wronskiano es una función de x definida en
cierto intervalo.
El wronskiano se usa para determinar si dos o más funciones son
linealmente dependientes o independientes:
Teorema 7: Si las funciones y1(x), y2(x), ..., yn(x) son linealmente dependientes
en el segmento [a, b], su wronskiano es idénticamente nulo en [a, b].
Dr. Isaias Ochoa Landín Página 24 12/04/2023
Demostración: A continuación se prueba el teorema para el caso n = 2 por
contradicción. Supóngase que W(f1(x0), f2(x0)) ≠ 0 para un valor x0 fijo en un
intervalo I y que f1(x) y f2(x) son linealmente dependientes en el intervalo. Esto
último significa que existen constantes c1 y c2, no simultáneamente nulas, para
las cuales:
c1 f1(x) + c2 f2(x) = 0
para todo x є I. Derivando esta combinación, resulta:
c1 f1’(x) + c2 f2’(x) = 0
obteniendo así un sistema de ecuaciones lineales. La dependencia lineal
implica que dicho sistema tiene una solución no trivial para cada x del intervalo.
Consecuentemente:
para todo x є I. Esto contradice el haber supuesto que W(f1(x0), f2(x0)) ≠ 0. Se
concluye que f1 y f2 son linealmente independientes.
Este teorema solamente indica la condición necesaria para la
dependencia lineal de un sistema de funciones. El recíproco no se cumple,
puesto que el wronskiano puede ser nulo también cuando las funciones
consideradas forman en el intervalo un sistema linealmente independiente.
Volviendo al ejemplo 18, si tratamos los polinomios como funciones
polinomiales definidas en un intervalo [a, b], entonces las funciones (2x), (x3 –
3), (1 + x - 4x3), (x3 + 18x – 9) son linealmente independientes si existen
constantes no todas cero simultáneamente tales que:
Como existen cuatro constantes por determinar, debemos derivar esta
ecuación tres veces y escribir el sistema de ecuaciones como sigue:
El wronskiano de este sistema de ecuaciones es:
Dr. Isaias Ochoa Landín Página 25 12/04/2023
La solución por cofactores se facilita tomando la primera columna. Así,
los menores M11 y M21 y sus respectivos determinantes son:
Como los menores son cero, se concluye que W = 0 y que las funciones
polinomiales son LI.
3.1.6 Interpretación geométrica de la dependencia lineal en R3
Si u, v y w son tres vectores en R3 linealmente dependientes, entonces
existen constantes c1, c2 y c3 є R y no todas cero tales que:
Si suponemos que c3 ≠ 0, entonces:
Es fácil demostrar que u, v y w son coplanares pues se cumple que:
Sustituyendo la expresión para w, tenemos:
De la propiedad v Teorema 1.5, tenemos para el triple producto escalar:
De la propiedad vi de teorema 1.5, sabemos que:
Esto es cierto dado que el vector u × v es perpendicular al plano formado por
los vectores u y v por lo que es perpendicular a cada uno de estos vectores.
Entonces:
Dr. Isaias Ochoa Landín Página 26 12/04/2023
lo que implica que u, v y w son coplanares.
En resumen podemos decir que tres vectores en R3 son linealmente
dependientes si y solo si son coplanares.
Ejemplo 19: En el Ejemplo 14 anterior, es importante notar que podemos
despejar v3 de la ecuación (3.3) para obtener:
v3 = 2v1 + 3v2 (3.4)
esto significa que cuando los vectores son L.D., es posible expresar uno de
ellos en términos de los otros. Pero lo más importante es que los vectores
linealmente dependientes son coplanares:
0)( 213 vvv (3.5)
Recordando que el producto vectorial de dos vectores, v1 y v2, da como
resultado otro vector que es perpendicular al plano formado por los vectores v1
y v2. Si otro vector v3 es perpendicular a este vector resultante (v1 × v2),
entonces el producto escalar debe ser cero, tal como lo indica la ecuación (3.5).
Esto puede demostrarse sustituyendo (3.4) en (3.5) y aplicando la
propiedad distributiva:
)(3)(2)()32( 2122112121 vvvvvvvvvv
Ahora, es posible ver que cada término del lado derecho es igual a cero:
kji
kji
vv 21 9412
403
031 -
0)9)(4()4)(0()12)(3()9,4,12()4,0,3()(
0)9)(0()4)(3()12)(1()9,4,12()0,3,1)(
1
22
211
vvv
vvv (
Con lo que queda demostrada la ecuación (3.5) y además que tres vectores
en R3 son linealmente dependientes si y solo si son coplanares.
Ejemplo 20: Determinar si los siguientes vectores son linealmente
independientes o no:
3
7
2
4
11
18
,
6
7
4
,
4
3
2
y
.
Dr. Isaias Ochoa Landín Página 27 12/04/2023
Solución: El sistema asociado para determinar las constantes ci es:
03464
071173
021842
4321
4321
4321
cccc
cccc
cccc
La matriz de coeficientes y la matriz escalonada se muestran enseguida:
64/23100
4/3010
64/47001
3464
71173
21842
De aquí que, si hacemos c4 = 64, las otras constantes son: c1 = 47, c2 = 48 y c3
= -23 y por lo tanto los vectores son linealmente dependientes.
Con estas constantes, podemos escribir:
0
0
0
3
7
2
64
4
11
18
23
6
7
4
48
4
3
2
47
En este ejemplo se obtuvo un sistema que tenía un mayor número de
incógnitas que de ecuaciones. Como resultado, la matriz de coeficientes
contenía más columnas que renglones y para este tipo de sistemas siempre
habrá un número infinito de soluciones y por lo tanto los vectores serán
linealmente dependientes.
Lo anterior puede generalizarse como sigue: Un conjunto de n vectores en
Rm siempre serán Linealmente Dependientes si n > m.
Teorema 8: Cualquier conjunto de n vectores linealmente independientes en Rn
genera a Rn.
Ejemplo 21: Del Ejemplo 13, los vectores v1 = (1, -2, 3), v2 = (2, -2, 0) y v3 = (0,
1, 7) son linealmente independientes. Ahora queremos ver como estos vectores
generan R3. Para esto, cualquier vector w en R3 debe poder escribirse como
combinación lineal de los vectores vi como sigue:
32 vvvw 3211 bbb
o, expresado en forma analítica:
7
1
0
0
2
2
3
2
1
321 bbb
z
y
x
(3.6)
El sistema de ecuaciones para determinar las bi es:
Dr. Isaias Ochoa Landín Página 28 12/04/2023
zbb
ybbb
xbb
31
321
21
73
22
2
y la matriz aumentada y escalonada nos da:
zyx
zyx
zyx
z
y
x
10
1
10
3
10
320
1
20
7
20
1710
1
10
7
10
7
100
010
001
703
122
021
Así, las constantes vienen dadas por:
zyxb
zyxb
zyxb
10
1
10
3
10
320
1
20
7
20
1710
1
10
7
10
7
3
2
1
Como no hay ninguna condición a ser cumplida (como sucedió en los
ejemplos 9 y 10), los vectores vi generan R3 y cualquier vector en R3 puede
escribirse como una combinación lineal de los vecotres vi. Por ejemplo, para
escribir el vector w = (-5, 2, -1) como combinación lineal de v1, v2 y v3,
calculamos bi:
1)1(10
1)2(
10
3)5(
10
32
7)1(
20
1)2(
20
7)5(
20
17
2)1(10
1)2(
10
7)5(
10
7
3
2
1
b
b
b
321 2
72 vvvw
Una expresión analítica se obtiene de la ecuación (3.6)
Geométricamente lo que esto significa se muestra en la Figura 3.4:
Dr. Isaias Ochoa Landín Página 29 12/04/2023
Figura 3.4 Generación de R3 por tres vectores en R3 linealmente independientes.
Note como los vectores v1, v2 y v3 se ven afectados por las
correspondientes bi para localizar el vector w en R3.
3.2 Base de un espacio vectorial
Definición 9: Un conjunto finito de vectores {v1, v2,…,vn} es una base para un
espacio vectorial V si
1. {v1, v2,…,vn} es linealmente independiente
2. {v1, v2,…,vn} genera a V
De acuerdo al Teorema 6, dado que cualquier conjunto de n vectores en Rn
linealmente independientes genera a Rn, todo conjunto de n vectores L.I. en Rn
es una base para Rn.
Así como en R2 se definen los vectores unitarios i = (1, 0) y j = (0, 1) y
esta idea se extiende a R3 con i = (1, 0, 0), j = (0, 1, 0) y k = (0, 0, 1), en Rn se
definen los vectores e1 = (1, 0,…, 0), e2 = (0, 1,…, 0),…, en = (0, 0,…, 1). Estos
vectores son las columnas de una matriz identidad obtenida al escribir un
vector v = (v1, v2,…, vn) є Rn como combinación lineal de los vectores ei:
es decir:
Dr. Isaias Ochoa Landín Página 30 12/04/2023
En forma matricial lo anterior queda expresado como:
La matriz identidad, In, en el lado izquierdo de la igualdad anterior tiene
por determinante:
entonces los vectores ei son linealmente independientes. Esta base en Rn
constituida por ei se llama base canónica en Rn.
Ejemplo 22: Haciendo referencia de nuevo al Ejemplo 13, ya se vio como los
vectores v1 = (1, -2, 3), v2 = (2, -2, 0) y v3 = (0, 1, 7) generan a R3 y cómo
podemos escribir el vector w = (-5, 2, -1) como una combinación lineal de estos
vectores (Ejemplo 21). Entonces, estos tres vectores vi es una base para R3.
Sin embargo ésta base no es única, ya que existen los vectores unitarios i, j y k
que son L.I. y que también generan a R3:
1
0
0
0
1
0
,
0
0
1
kji y
y el vector w = (-5, 2, -1) queda expresado como una combinación lineal de los
vectores unitarios como sigue:
kjiw 25
Ejemplo 22: Encontrar una base para los vectores que están en el plano -5x +
2y + 3z = 0.
Solución: Queremos encontrar los vectores que generen el espacio vectorial
de los vectores contenidos en el plano -5x + 2y + 3z = 0:
Dr. Isaias Ochoa Landín Página 31 12/04/2023
Estos vectores generadores del espacio vectorial nos permitirán
expresar cualquier vector en el plano Π como combinación lineal de ellos. Para
hallar estos vectores generadores, despejamos una de las variables del plano,
digamos la variable z:
Por lo que cualquier vector v = (x, y, z) puede escribirse como:
Una pareja de vectores generadores es entonces v1 = (1, 0, 5/3) y v2 =
(0, 1, -2/3). Estos vectores son linealmente independientes y generan el
espacio vectorial de los vectores contenidos en el plano Π.
Por ejemplo, el vector w = (2, -1, 4) está contenido en el plano y puede
expresarse como combinación lineal de v1 y v2:
Al resolver el sistema encontramos que a1 = 2 y a2 = -1 por lo que tenemos:
3.2.1 Cambio de base
Enseguida veremos como pasar de una base a otra para expresar
cualquier vector en Rn en otra base. Para facilitar la explicación y obtener
resultados generales, supongamos que deseamos pasar de una base B1
formada por los vectores v1, v2 y v3 en R3 a otra base B2 formada por los
vectores unitarios i, j y k. Sabemos que es más fácil utilizar la base canónica
para expresar un vector como combinación lineal de los vectores unitarios, pero
esto nos servirá para generalizar los resultados.
Como v1, v2 y v3 generan R3, cualquier vector w puede expresarse como
combinación lineal de ellos:
332211 vvvw aaa (3.7)
Supongamos que la base B1 está perfectamente bien definida y se
conocen las constantes ai para expresar el vector w en términos de los vectores
vi.
Dr. Isaias Ochoa Landín Página 32 12/04/2023
Este vector w también puede escribirse como combinación lineal de los
vectores unitarios de la base B2, la base canónica:
kjiw 321 bbb (3.8)
En este caso las constantes bi se “desconocen” y hay que determinarlas. Para
esto, expresemos la base anterior B1 en términos de la nueva base B2 como
sigue:
Los subíndices de las constantes ci’s se han escrito así por conveniencia.
Sustituyendo en (3.7):
Comparando término a término con le ec.(3.8), vemos que:
(3.9)
Las constantes ci’s tienen el valor de las componentes escalares de los
vectores vi’s de la base vectorial:
por lo que el vector w queda expresado como
kjiw zzzyyyxxx vavavavavavavavava 332211332211332211
y la ec (3.9), queda de la siguiente manera:
3
2
1
321
321
321
3
2
1
a
a
a
vvv
vvv
vvv
b
b
b
zzz
yyy
xxx
Dr. Isaias Ochoa Landín Página 33 12/04/2023
Este producto de matrices nos dará los valores de las b’s para expresar w en
términos de los vectores de la base B2. Está por demás decir que estos valores
de bi son precisamente las componentes escalares del vector w pues esa es la
ventaja de trabajar con una base canónica. Pero ahora, si lo que queremos es
pasar de la base canónica B2 a la base B1, simplemente despejamos el vector
de coeficientes a’s de (3.9):
z
y
x
zzz
yyy
xxx
w
w
w
vvv
vvv
vvv
a
a
a1
321
321
321
3
2
1
(3.10)
La matriz de la Ec (3.9) se llama matriz de transición de la base B1 a la base B2
y, como puede verse, los componentes de la matriz de transición son las
componentes escalares de los vectores v’s que conforman la base B1.
Ejemplo 23: Supongamos que deseamos encontrar una base B2 formada por
u1 = (-4, 2) y u2 = (1, 7) para expresar el vector w = (-3, -5) en términos de B2 a
partir de la base canónica B1.
Solución: Deseamos expresar w como:
2211 uuw aa
La matriz de transición de B1 a B2 es la inversa de la matriz de transición
de B2 a B1.formada por las componentes de los vectores u1 y u2:
42
17
30
1
72
141
Así, los coeficientes ai son de acuerdo a (3.10):
15
1315
8
5
3
42
17
30
1
2
1
a
a
entonces el vector w en términos de la nueva base B2 es:
21 15
13
15
8uuw
7
1
15
13
2
4
15
8
5
3
La siguiente figura muestra la representación gráfica de w en términos
de las dos bases B1 y B2:
Dr. Isaias Ochoa Landín Página 34 12/04/2023
Figura 3.5 Representación geométrica del vector w = (-3, -5) en términos de una base B2
formada por los vectores u1 = (-4, 2) y u2 = (1, 7)
En el ejemplo 22, cualquier otro par de vectores que se encuentren en el
plano pueden servir como base para generar el espacio vectorial. Estos
vectores coplanares deben de ser NO colineales (paralelos) para que sean
linealmente independientes. Por ejemplo, en el Ejemplo 18, los vectores (2, -1,
4) y (4, 1, 6) son coplanares (porque satisfacen la ecuación del plano) y
generan el espacio vectorial porque son linealmente independientes. Cualquier
vector en el plano puede escribirse como combinación lineal de ellos. En
particular el vector (-1, 2, -3) puede escribirse como:
Puede verse, entonces, que la base que genera un espacio vectorial no
es única. El siguiente ejemplo muestra como pasar de una base a otra donde
ninguna de ellas es la base canónica.
Ejemplo 24: Construir una base B2 formada por los vectores:
a partir de una base B1 formada por los vectores:
Dr. Isaias Ochoa Landín Página 35 12/04/2023
7
1
0
0
2
2
,
3
2
1
31 vvv 2 y
para expresar el vector w = (-5, 2 ,-1)
Solución: El vector w en términos de vi de la base B1 es:
32 vvvw 3211 bbb
en donde suponemos que está bien definido pues es la base de donde
partimos. Entonces, el vector w puede expresarse como combinación lineal de
los vectores vi’s, como sigue:
O bien:
En la base B2, el vector w queda en términos de los vectores ui, como:
32 uuuw 3211 aaa
La base B1 expresada en términos de la base nueva B2 es:
0
2
1
1
5
0
0
0
4
7
1
0
0
2
1
1
5
0
0
0
4
0
2
2
0
2
1
1
5
0
0
0
4
3
2
1
3323133
3222122
3121111
ccc
ccc
ccc
v
v
v
Esta vez, encontrar las constantes ci no es tan directo como cuando se
involucra una base canónica. Sin embargo, el sistema de ecuaciones para
encontrar sus valores no es difícil de resolver:
Dr. Isaias Ochoa Landín Página 36 12/04/2023
La base B1 en términos de la base B2, es:
3213
312
3211
1872
9
0
2
1
18
1
5
0
7
0
0
4
2
9
7
1
0
4
1
0
2
1
1
5
0
0
0
0
4
4
1
0
2
2
2
133
8
15
0
2
1
2
13
1
5
0
3
0
0
4
8
15
3
2
1
uuuv
uuv
uuuv
Entonces, la matriz de transición es:
3
2
1
3
2
1
1812/13
703
2/94/18/15
b
b
b
a
a
a
Como los valores de bi ya se conocen, los valores de las ai pueden ser
estimados para dar:
2/3
1
8/13
1
2/7
2
1812/13
703
2/94/18/15
3
2
1
a
a
a
y así escribir w como:
321 2
3
8
13uuuw
Ejemplo 25: Escribir la matriz
64
12
en términos de la base nueva B2
formada por las matrices
40
20,
01
10,
13
02,
01
11
.
Dr. Isaias Ochoa Landín Página 37 12/04/2023
Solución: Queremos expresar la matriz como:
40
20
01
10
13
02
01
11
64
124321 aaaa
(3.11)
Desarrollando la suma del lado derecho de (3.11), tenemos:
Igualando componente a componente, tenemos el sistema de
ecuaciones siguientes para determinar las ai’s:
La matriz de transición de B1 a B2 es la inversa de la matriz de transición
de B2 a B1:
3110
1062014
2440
48814
14
1
4010
0131
2101
00211
Generalizando la Ec. (3.10), los valores de las ai son:
14/15
7/18
7/12
7/10
6
4
1
2
3110
1062014
2440
48814
14
1
4
3
2
1
a
a
a
a
Sustituyendo en (3.11), tenemos:
40
20
14
15
01
10
7
18
13
02
7
12
01
11
7
10
64
12
Ejemplo 26: Expresar el polinomio 2x3 – 3x2 + 5x – 6 en P3 en términos de la
nueva base B2 formada por los polinomios: (1), (1 + x), (x + x2), (x2 + x3).
Solución: Una vez más, deseamos expresar el polinomio en términos de la
nueva base:
2x3 – 3x2 + 5x – 6 = a1 (1) + a2 (1 + x) + a3 (x + x2) + a4 (x2 + x3)
Como en los ejemplos anteriores, la matriz de transición de la base canónica B1
a la nueva base B2 es la inversa de la matriz de transición de la base B2 a la
base canónica B1. Para facilitar la escritura de esta matriz de transición
Dr. Isaias Ochoa Landín Página 38 12/04/2023
hagamos analogía con la forma de escribir un vector en términos de vectores
unitarios y escribamos la base nueva B2 en términos de la base anterior
canónica B1:
1
1
0
0
1)(1)(1)(0)1(0
0
1
1
0
1)(0)(1)(1)1(0
0
0
1
1
1)(0)(0)(1)1(11
0
0
0
1
1)(0)(0)(0)1(11
323232
32322
3232
3232
xxxxxxxx
xxxxxxxx
xxxxxxx
xxxxxx
Los vectores columnas forman la matriz de transición. Dicha matriz y su inversa
se muestran enseguida:
1000
1100
1110
1111
1000
1100
0110
00111
Los valores de las ai’s son entonces:
3.2.2 Bases ortonormales
Definición 9: Se dice que un conjunto de vectores S={v1, v2, … , vn} en Rn es
un conjunto ortonormal si
1. vi · vj = 0 si i ≠ j
Dr. Isaias Ochoa Landín Página 39 12/04/2023
2. vi · vi = 1
Si sólo se satisface la condición [1], se dice que el conjunto es ortogonal. La
condición [2] solamente asegura que los vectores sean unitarios.
Se ha mencionado anteriormente que dos vectores son linealmente
independientes si ellos no son proporcionales, es decir, uno no se puede
escribir en términos del otro. Esto mismo sucede con los vectores ortogonales
(los que cumplen la propiedad [1] anterior). Como ellos son perpendiculares, no
hay manera de encontrar constantes que nos permitan expresar uno en
términos del otro. Así, los vectores ortogonales son linealmente
independientes.
La base canónica en Rn está formada por vectores ortogonales, o mejor
dicho, ortonormales dado que sus magnitudes son igual a uno. Es posible
encontrar una base ortonormal a partir de una base del espacio vectorial. Este
es el proceso de ortonormalización de Gram-Schmidt que se explica a
continuación con un ejemplo.
Antes de ver el ejemplo, recordaremos algunas expresiones importantes.
La primera de ellas es la de la obtención de un vector unitario n a partir de otro
vector m:
(3.12)
Otra expresión a recordar es la del cálculo de la proyección de un vector
a sobre otro vector b:
Y
X
a
b bb
baab 2
proy
bb
baac
2
Dr. Isaias Ochoa Landín Página 40 12/04/2023
Figura 3.6 Proyección ortogonal de un vector.
No siempre la proyección de a y el vector b tendrán la misma dirección. Si
sucede que estos vectores tienen direcciones opuestas, entonces tendremos
que el término .
Otra expresión a recordar es la del vector c el cual es la componente
perpendicular de a sobre b, también mostrado en la figura. La expresión para c
se obtiene de la suma de a, c y proyba:
(3.12)
En el caso particular de que el vector b sea un vector unitario, es decir,
║b║= 1, La Ec. (3.12) se simplifica a:
(3.13)
Aunque estas expresiones se obtuvieron en su momento para vectores
en R2, éstas se cumplen también para vectores en Rn.
Es fácil verificar que si c y b son perpendiculares, su producto escalar es
cero:
Para esta última expresión se utilizó el hecho de que b · b = 0 y la propiedad
conmutativa del producto escalar.
Por último, también utilizaremos la siguiente expresión basada en la Ec.
(3.13). Sea
(3.14)
Si multiplicamos escalarmente ambos miembros de (3.14) por bi, i = 1,2,…,k y
sabiendo que bi · bj = 0 si i ≠ j y que bi · bi = 1 por ser b un vector unitario,
entonces:
Esto nos dice que el conjunto {b1, b2,…, bk, c/║c║} es linealmente
independiente y ortonormal.
Dr. Isaias Ochoa Landín Página 41 12/04/2023
Ejemplo 28: Construya una base ortonormal en R4 a partir de la base formada
por los vectores .
Solución:
1. Elección del primer vector unitario: Primero escribimos el primer vector
unitario de la siguiente manera:
2. Cálculo de un vector ortogonal a u1: El siguiente paso es encontrar un
vector perpendicular al vector unitario u1. Llamemos a este vector v2’ y
utilicemos la Ec. (3.13) para calcularlo:
(3.15)
La Ec (3.15) comprende el cálculo de la proyección de v2 sobre u1 (Ec.
(3.13)) y el de la componente perpendicular a u1.
Las componentes del vector v2’ son, de acuerdo a (3.15):
cuya norma es:
Así, el segundo vector unitario, u2, es:
Dr. Isaias Ochoa Landín Página 42 12/04/2023
Si u1 y u2 son perpendiculares, entonces, u1 · u2 = 0
3. Cálculo de un tercer vector ortogonal a u1 y u2: El tercer vector unitario se
obtiene con la Ec. (3.14). Primero obtenemos un vector, llamémosle v3’, que
sea perpendicular a los vectores unitarios u1 y u2:
La norma del vector es
y el tercer vector unitario es:
Dr. Isaias Ochoa Landín Página 43 12/04/2023
4. Cálculo del cuarto vector ortogonal a u1, u2 y u3: El cuarto y último vector
unitario se obtiene de la misma forma con la Ec. (3.14). Primero obtenemos un
vector al cual llamaremos v4’, que será perpendicular a los vectores unitarios
u1, u2 y u3:
La norma del vector es
y el tercer vector unitario es:
Así, una base ortonormal para los vectores en R4 siguientes
Dr. Isaias Ochoa Landín Página 44 12/04/2023
es:
Definición 12: Una matriz Q de n × n se llama matriz ortogonal si Q es
invertible y su inversa es igual a su transpuesta:
Para escribir una matriz ortogonal de n × n, podemos usar una base
ortonormal para Rn.
Teorema 10: La matriz Q de n × n es ortogonal si y sólo si las columnas de Q
forman una base ortonormal para Rn.
Por ejemplo, considere los siguient
es vectores ortonormales:
Estos vectores son ortonormales pues tienen las siguientes propiedades:
Entonces, una matriz ortogonal puede construirse a partir de estos
vectores:
Es fácil verificar que Q -1 = QT y por lo tanto, Q es una matriz ortogonal:
Dr. Isaias Ochoa Landín Página 45 12/04/2023
Definición 13: Sea H un subespacio de Rn con base ortonormal {u1, u2, ..., uk}
Si v є Rn, entonces la proyección ortogonal de v sobre H, denotada proyH v,
está dada por:
Como puede verse, esta expresión es una generalización de la
proyección de un vector sobre otro, sólo que esta vez se está proyectando un
vector sobre una base, es decir, sobre un conjunto de vectores.
Ejemplo 29: Dado el plano:
Encuentre una base ortonormal para el conjunto de vectores en R3 que están
en el plano π y encuentre la proyección del vector m = (3, -2, 4) sobre el plano.
Solución: Para encontrar el conjunto de vectores generadores del
subespacio vectorial, despejamos una de las variables de la ecuación del
plano:
y cualquier vector w = (x, y, z) є π lo escribimos como sigue:
por lo que una base del subespacio vectorial es la formada por los vectores:
Para encontrar una base ortonormal obtenida a partir de la base B,
procedemos como anteriormente:
1. Encontramos un vector unitario:
Dr. Isaias Ochoa Landín Página 46 12/04/2023
2. La proyección de v2 sobre u1 se obtiene como sigue:
3. El vector v’2 ortogonal al vector unitario u1, es:
4. El segundo vector unitario u2 es, entonces,
Una manera alternativa de encontrar una base para el plano π, es darle
valores a las variables x e y en la ecuación del plano y calcular el valor de z
para cada una de las parejas. Esto nos conduce al siguiente conjunto de
vectores: v3 = (1, 2, -3) y v4 = (-2, -3, 3) los cuales generan el plano π.
La base ortonormal a partir de esta base se construye igual y,
obviamente, se obtendrá una base diferente. Esto nos conduce a la siguiente
base ortonormal:
Esta base ortonormal es diferente a la encontrada anteriormente pues se
obtuvieron a partir de bases diferentes.
La proyección del vector m = (3, -2, 4) є R3 sobre el plano π en términos
de la base B1 = {u1, u2}, es:
La proyección del vector m = (3, -2, 4) є R3 sobre el plano π en términos
de la base B1 = {u3, u4}, es:
Dr. Isaias Ochoa Landín Página 47 12/04/2023
De aquí que “la proyección del vector m = (3, -2, 4) є R 3 sobre el plano π ,
es independiente de la base ortonormal elegida.”
Teorema 11: Sea B = {u1, u2, ..., uk} una base ortonormal para Rn y sea v є Rn.
Entonces v = proyRn v, esto es:
Este teorema nos permite expresar un vector en el plano π del ejemplo
anterior en términos de los vectores generadores de la base ortonormal. Por
ejemplo para expresar el vector (1, 1, 0) є π, en términos de la base ortonormal
formada por los vectores
procedemos como lo dice el teorema anterior:
De la misma manera, para la base ortonormal formada por los vectores:
Dr. Isaias Ochoa Landín Página 48 12/04/2023
Ejemplo 30: Encuentre una base ortonormal para los vectores en R3 que están
en el plano XY.
Solución: Cualquier conjunto de dos vectores en R3 con z = 0 y que sean LI es
una base para R3. Una base vectorial podría ser el conjunto de vectores:
Cualquier vector en el plano Z = 0 puede escribirse en términos de B1:
Los coeficientes se encuentran al pasar de una base canónica a la base B1:
o bien:
De aquí obtenemos las siguientes expresiones para ai:
Así, el vector w = (-6, 5, 0) se escribirá en términos de B1 como:
Una base ortonormal encontrada a partir de B1 es:
Cualquier vector en el plano XY puede escribirse como combinación
lineal de estos vectores ortonormales. Los coeficientes se encuentran utilizando
el teorema 11. Por ejemplo, el vector w = (-½, ¼, 0), se expresa como:
Dr. Isaias Ochoa Landín Página 49 12/04/2023
3.2.3 Ajuste de curvas por mínimos cuadrados
En muchos problemas de las ciencias biológicas, físicas y sociales
resulta útil describir la relación entre las variables del problema por medio de
una expresión matemática.
Desafortunadamente, no es fácil obtener una fórmula como las que uno
está familiarizado. Una manera común de encontrar la relación entre las
variables de un problema es ajustar una curva entre los distintos grupos de
datos. Esta curva puede ser recta, cuadrática, cúbica, etc. El objetivo es
encontrar la curva del tipo específico que se ajuste mejor a los datos dados.
Estudiaremos el caso en que se tienen dos variables suponiendo que existen n
pareja de datos (x1, y1), (x2, y2), …, (xn, yn).
Aproximación por una recta . Buscamos la recta de la forma y = b + mx que
mejor represente a los n datos (x1, y1), (x2, y2), …, (xn, yn).
Si los valores x y y están relacionados por la fórmula y = b + mx,
entonces para x = x1 el valor correspondiente de y es b + mx1 que puede ser
igual al valor real y1. Esto se muestra en el siguiente esquema:
Dr. Isaias Ochoa Landín Página 50 12/04/2023
Figura 3.7 Ajuste lineal de datos por el método de mínimos cuadrados.
Lo que se busca es la recta que pase lo más cerca posible de todos los
puntos, es decir, aquella recta que minimiza la suma de los cuadrados de las
diferencias entre los valores reales y los estimados con la recta
correspondiente:
Claro que si los puntos caen sobre la recta, entonces se cumple que:
o bien:
que expresado en forma matricial nos queda:
O bien:
(3.16)
Si los puntos NO caen sobre la recta, entonces:
(x4, b+mx4)
Datos reales
Datos estimados
X
Y(x1, y1)
(x2, y2)
(x3, y3)
(x4, y4)
(x1, b+mx1)
(x2, b+mx2)
(x3, b+mx3)
y = b + mx
Dr. Isaias Ochoa Landín Página 51 12/04/2023
y debemos encontrar el valor de tal que la norma euclidiana sea
mínima. Gráficamente, en R3, esto significa lo siguiente:
Figura 3.8 Diferencia entre vectores de valores reales y valores ajustados.
Si es el vector que minimiza la norma Euclideana, entonces: ┴
, es decir:
como UT ≠ 0, entonces y de aquí obtenemos:
(3.17)
Ejemplo 31: Encuentre la recta que mejor ajusta los puntos: (1, 4), (-2, 5), (3, -
1) y (4, 1)
Solución: Un bosquejo de la gráfica se da en la Figura 3.9. Para encontrar
de la Ec.(3.17), debemos encontrar los términos de dicha expresión. La matriz
A del sistema es, de acuerdo a la Ec. (3.16):
y su transpuesta es:
X
Y
Z
AU
Y
Y − AU
Dr. Isaias Ochoa Landín Página 52 12/04/2023
Figura 3.10 Datos experimentales y recta de ajuste obtenida por mínimos cuadrados.
Así, de acuerdo con (3.16), primero debemos encontrar el producto ATA:
Ahora debemos encontrar la inversa de este producto:
Después realizamos el producto (AT A)-1 AT:
Y por último, calculamos los parámetros de la recta de ajuste como
sigue:
Así, la recta que mejor ajusta los puntos tiene por ecuación:
Ejemplo 32: Estimación de g. Se dejó caer un cuerpo desde una altura de 200
m y se midieron los tiempos en que dicho cuerpo pasó por ciertas posiciones
dadas en seguida:
Dr. Isaias Ochoa Landín Página 53 12/04/2023
Tiempo (s) 0 1 2 4 6
Altura (m) 200 195 180 120 25
Solución: Sabemos que la forma en que se relaciona la posición, s, con el
tiempo, t, de un cuerpo en caída libre es:
Así que para estimar el valor de g debemos usar un polinomio de segundo
grado:
Para facilitar la solución del problema, se usarán solamente los datos de
las celdas marcadas de color gris. La matriz del sistema y su transpuesta son:
El producto de estas dos matrices es:
La inversa de esta matriz es:
Después calculamos el producto (AT A)-1 AT:
y por último el producto (AT A)-1 ATY, es:
Así, la ecuación cuadrática que mejor ajusta los datos es:
Dr. Isaias Ochoa Landín Página 54 12/04/2023
Por comparación con la ecuación cuadrática de movimiento, tenemos lo
siguiente:
Dr. Isaias Ochoa Landín Página 55 12/04/2023
3.3 Dimensión de una base de un espacio vectorial
A continuación se da una serie de las definiciones relacionadas con el
tema de Base y Dimensión.
Definición 14: Si el espacio vectorial V tiene una base finita, entonces la
dimensión de V, denotada dim (V), es el número de vectores en todas las
bases y V se llama espacio vectorial de dimensión finita. De otra manera, V se
llama espacio vectorial de dimensión infinita. Si V = {0}, entonces se dice que V
tiene dimensión cero.
Definición 15: El espacio nulo de una matriz o KERNEL, denotado como NA,
es el conjunto de vectores en Rn que satisfacen el sistema homogéneo:
Definición 16: La nulidad de NA, denotado por (A), se refiere al número de
vectores en la base que genera dicho espacio vectorial NA:
Definición 17: La imagen de una matriz A de m × n, denotada por Imagen(A),
se refiere al conjunto de vectores formado por los términos independientes en
el sistema de ecuaciones:
Definición 18: El rango de una matriz A de m × n, denotado por ρ(A), es la
dimensión de la imagen de la matriz A:
Definición 19: El espacio de las columnas, CA, y de los renglones, RA, de
una matriz A de m × n son los espacios generados por las columnas y los
renglones, respectivamente, de la matriz A:
RA = gen{r1, r2, … , rm}
CA = gen{c1, c2, … , cn}
Es decir, solamente aquellas columnas y renglones que sean linealmente
independientes generarán dichos espacios de columnas y renglones. En
algunas ocasiones se usarán todas las columnas y todos los renglones de la
matriz A para generar dichos espacios y en algunas ocasiones solamente se
usarán ciertas columnas y ciertos renglones para generarlos. Esto se sabe
después de verificar si las columnas y los renglones son o no L.I. o no. Sin
Dr. Isaias Ochoa Landín Página 56 12/04/2023
embargo, existe un teorema que nos permite determinar la dimensión de estos
espacios vectoriales fácilmente:
dim(RA) = dim (CA) = ρ(A)
Además, existe un teorema que dice: la imagen de una matriz A es igual
al espacio de las columnas. Esto nos permite estimar la imagen de la matriz A,
imagen(A), a partir de la matriz de coeficientes como se verá más adelante.
Otro teorema nos permite conocer todos estos elementos de una matriz
a partir de la forma escalonada por renglones:
Teorema 12: Si A es equivalente por renglones a B, entonces RA = RB, ρ(A) =
ρ(B), (A) = (B).
Apliquemos estas definiciones en los siguientes ejemplos:
Ejemplo 33: Encuentre el rango (ρ(A)) y la nulidad ((A)), una base para la
imagen y el espacio nulo de la matriz dada:
Solución: Esta matriz A es la matriz de coeficientes de un sistema de
ecuaciones. Podemos decir que es la matriz de un sistema homogéneo como
el siguiente:
y también de un sistema no homogéneo cuyos términos independientes no
conocemos pues depende de cada caso particular. Sin embargo, podemos
llamar a esta vector Y con componentes Y = (y1, y2, y3). El sistema no
homogéneo es entonces:
Resolveremos éste último sistema para ver la conveniencia de trabajar
con las definiciones anteriores. La matriz aumentada del sistema es entonces:
Cuando esta matriz se escalona, obtenemos los siguiente:
Dr. Isaias Ochoa Landín Página 57 12/04/2023
(3.18)
Primero trabajaremos con el lado izquierdo de esta matriz equivalente.
Esto es similar a trabajar con el sistema homogéneo. Entonces tendremos:
(3.19)
Si quisiéramos construir el espacio de las columnas, tendríamos que
verificar si las columnas de la matriz son o no L.I. Para esto tendríamos las
siguientes tres columnas:
Después, si c1, c2 y c3 son L.I., encontraríamos las constantes, ai, que nos
permitieran escribir a1c1 + a2c2 + a3c3 = 0. En términos de componentes
quedaría expresado como:
El sistema homogéneo para encontrar las constantes ai sería, entonces,
el mismo sistema mencionado arriba con la misma matriz A de coeficientes
escalonada anteriormente (vea (3.19)). De aquí podemos ver que como el
último renglón son solamente ceros, las columnas ci son L.D. pues las
constantes ai son, de acuerdo a (3.19):
De acuerdo con esto, dado que las columnas son L.D., entonces no
debemos tomarlas todas para formar el espacio de las columnas; dos de ellas
serán suficientes, digamos c1 y c2. Así, tenemos que:
CA = gen{c1, c2}
Dr. Isaias Ochoa Landín Página 58 12/04/2023
Solo como comprobación, si c1 y c2 generan el espacio de columnas,
entonces c3 puede expresarse como combinación lineal de ellas, tal como se
muestra a continuación:
Además, como se requieren dos vectores, c1 y c2, para generar CA,
entonces:
dim (CA) = 2
Todo esto se refleja en el número de pivotes de la Ec. (3.19). Hay dos
pivotes y por lo tanto se requieren dos vectores para generar el espacio
vectorial de las columnas.
Siguiendo con la matriz del sistema homogéneo, para determinar una
base del espacio nulo, NA, de la matriz volvemos a (3.19). La solución del
sistema homogéneo la expresamos como:
Esto nos permite expresar el sistema solución, X, como:
es decir, una base para el espacio nulo, NA, es el vector
entonces la nulidad es (A) = 1.
Para obtener la imagen de A, imagen(A), utilizamos el sistema no
homogéneo. De (3.18) vemos que para que el sistema tenga solución, debe
ocurrir que:
-2y1 – y2 + y3 = 0
Despejando cualquiera de las variables, tenemos:
y2 = -2y1 + y3
Lo que nos permite escribir el conjunto de términos independientes como:
Dr. Isaias Ochoa Landín Página 59 12/04/2023
Así, una base para la imagen de A es:
De aquí que, dado que se requieren dos vectores para formar una base para la
imagen de A, el rango de A es: ρ(A) = dim(imagen(A)) = 2.
Toda esta información también se ve en la matriz escalonada por
renglones (3.19). No es una coincidencia que el número de pivotes sea igual al
rango de A, ρ(A), y que una base para la imagen de A sean las columnas
tomadas para construir el espacio de las columnas. Es decir, otra base para la
imagen de A es:
Una manera de comprobar el resultado obtenido, es tomando un vector
X cualquiera y evaluando el sistema NO HOMOGENEO para obtener un vector
Y y entonces escribir este vector como combinación lineal de los vectores que
forman la base de Y:
Así, si , sustituyendo en el sistema no homogéneo tenemos
el cual se puede escribir como:
o utilizando las columnas c1 y c2:
Dr. Isaias Ochoa Landín Página 60 12/04/2023
Para generar el espacio de los renglones, RA, también necesitamos
solamente dos vectores, pues ρ(A) = 2. Así, por ejemplo r1 = (1, -1, 2) y r2 = (3,
1, 4) generan el espacio de los renglones RA. El otro renglón, r3, es una
combinación lineal de ellos:
Ahora que ya sabemos la relación entre los sistemas de ecuaciones
homogéneo y no homogéneo con las definiciones, obtendremos estos
elementos de la matriz a partir de la propia matriz en el siguiente ejemplo.
Ejemplo 34: Encuentre el espacio nulo, la nulidad, CA, RA, imagen (A), el rango,
de la matriz
Solución Primero obtenemos la matriz equivalente de A escalonada por
renglones, para obtener la información requerida.
(3.20)
Esta matriz tiene 3 pivotes, por lo tanto el rango de la matriz A es 3 y
además:
dim(CA) = dim(RA) = ρ(A) = 3
Esto quiere decir, que para construir el espacio de las soluciones de A, el
espacio de las columnas y el espacio de los renglones, se requieren tres
vectores que formen las respectivas bases:
Dr. Isaias Ochoa Landín Página 61 12/04/2023
Para obtener el espacio nulo, de (3.20) podemos escribir las variables xi
como sigue:
Con lo que escribimos el vector X como:
Este vector forma la base del espacio vectorial que contiene los vectores
X solución del sistema homogéneo. Por lo tanto, la nulidad es (A) = 1 y el
espacio nulo:
Dr. Isaias Ochoa Landín Página 62 12/04/2023
3.4 Transformaciones lineales
Definición 20: Sean V y W espacios vectoriales reales. Una transformación
lineal T de V en W es una función que asigna a cada vector v en V un vector
único Tv en W y que para cada u y v en V y cada escalar k, satisface las
siguientes dos condiciones:
i). T(u + v) = T(u) + T(v)
ii). T(kv) = k T(v)
Ejemplo 35: La proyección ortogonal de un vector v = (vx, vy) sobre la línea
recta en la dirección del vector u = (2, 1) es una transformación de R2 en R2
definida en cada vector v como:
(3.21)
Sustituyendo las componentes del vector u en (3.21), tenemos:
(3.22)
Así, para encontrar la proyección de un vector v1 sobre el vector u
aplicamos (3.22) a dicho vector. Por ejemplo, sea el vector v1 = (-3, 1),
Aplicando (3.22) a v1 = (-3, 1), obtenemos:
Para otro vector v2 = (3, -2), con (3.22), tenemos:
La Figura 3.11 muestra la proyección de v1 y v2 sobre u.
Dr. Isaias Ochoa Landín Página 63 12/04/2023
Figura 3.11 Proyección ortogonal como transformación lineal.
La transformación por proyección es una Transformación Lineal
pues satisface las condiciones (i) y (ii) dadas en la Definición 15.
Si definimos dos vectores v = (vx, vy) y w = (wx, wy), la proyección sobre
un vector u se obtiene aplicando (3.21):
Si ahora definimos un número real α, entonces:
La matriz de transformación AT, para una transformación por proyección
T: R2→ R2 se obtiene aplicando (3.21) a los vectores de la base canónica:
Dr. Isaias Ochoa Landín Página 64 12/04/2023
Entonces, AT es:
(3.23)
Para el ejemplo particular con v = (-3, 1) y u = (2, 1), aplicando (3.23),
tenemos:
Teorema: Sea T: Rn → Rm una transformación lineal. Entonces existe una
matriz única AT de m × n tal que:
T x = AT x para todo x є Rn
Definición: Si AT es una matriz de m × n y una transformación T: Rn → Rm está
definida por Tx = ATx, entonces T es una transformación lineal.
Definición: Sean V y W dos espacios vectoriales y sea T: V → W una
transformación lineal. Entonces:
1. El núcleo de la transformación, denotado núcleo (T), está dado por:
nucleo(T) = {v є V│Tv = 0}
2. La imagen de T, denotada Imagen (T), está dada por:
Imagen (T) = {w є W │ w = Tv para algún v є V}
3. La nulidad de T, denotada ν(T), se define como:
ν(T) = dim(nucleo(T))
4. El rango de T, denotado ρ(T), se define como:
ρ(T) = dim(Imagen(T))
Dado que una transformación lineal posee una matriz de transformación,
entonces las definiciones dadas arriba pueden referirse a dicha matriz:
nucleo(T) = N(AT)
Imagen(T) = Imagen(AT) = CAT
ν(T) = ν(AT)
ρ(T) = ρ(AT)
Dr. Isaias Ochoa Landín Página 65 12/04/2023
Siguiendo con el ejemplo 35, sabemos que los vectores ortonormales
y , es una base canónica para el espacio vectorial R2 y que cualquier
vector en R2 puede escribirse como combinación lineal de ellos. Un vector
cualquiera v = (vx , vy) є R2, es entonces expresado como:
1
0
0
1yx
y
x vvv
vv
Si aplicamos la transformación T sobre el vector v, y por las propiedades
de linealidad de la transformación, tenemos:
1
0
0
1
1
0
0
1)( TvTvvvT
v
vTT yxyx
y
xv
La transformación aplicada sobre los vectores de la base canónica nos
da por resultado otros vectores con los que puede escribirse una matriz
llamada matriz de transformación.
La matriz de transformación, AT, para una transformación por proyección
T: R2→ R2 se obtiene aplicando (3.21) a los vectores de la base canónica:
2
2
2
2
2
0
1
u
u
u
u
yx
x
xy
xx
uu
u
uu
uu
T
2
2
2
2
2
1
0
u
u
u
u
y
yx
yy
yx
u
uu
uu
uu
T
Entonces, AT es:
2
2
2
1
yyx
yxxT uuu
uuuA
u (3.23)
Para el ejemplo particular con v = (-3, 1) y u = (2, 1), aplicando (3.23),
tenemos:
Dr. Isaias Ochoa Landín Página 66 12/04/2023
1
2
1
3
12
24
5
11
1
32
2
2y
x
yyx
yxxT v
v
uuu
uuuAT
uv
Ejemplo 34: Encuentre la representación matricial AT de la transformación
lineal:
zyx
zyx
zyx
z
y
x
T
363
242
2
Aplicamos la transformación a los vectores de la base canónica:
3
2
1
1
0
0
,
6
4
2
0
1
0
,
3
2
1
0
0
1
TTT
Entonces, la matriz de transformación es:
363
242
121
TA
Si queremos determinar el núcleo, la imagen, la nulidad y el rango de la
transformación, partimos de su matriz de transformación AT y la escalonamos
para encontrar una matriz equivalente:
000
000
121
363
000
121
363
242
121
363
242
1213132121 RRRRR
El espacio nulo de la matriz AT se obtiene de la matriz equivalente por
renglones:
1
0
1
0
1
22
zy
z
y
zy
z
y
x
Así, una base para generar N(AT) son los vectores anteriores. Por lo
tanto, el núcleo de la transformación T, es el espacio nulo de AT:
nucleo(T) = N(AT) = gen
Dr. Isaias Ochoa Landín Página 67 12/04/2023
y la nulidad de la transformación es entonces ν(T) = 2.
Además, como la matriz equivalente por renglones contiene únicamente
un pivote, el rango de AT, y por lo tanto de la transformación T, es:
ρ(T) = ρ(AT) = 1
De igual manera, la imagen de la transformación es la imagen de AT:
Imagen(T) = Imagen(AT) = CAT =
Ejemplo 36: Considere la transformación de rotación y determine las
imágenes bajo una rotación de φ = ½ π de la curva:
Rt
t
tB 2
Primero encontraremos la transformación por rotación de un vector v.
Supongamos que tenemos un vector v = (vx , vy) en el plano XY. Este vector v
tiene una dirección θ medido desde la parte positiva del eje X en sentido
contrario a las manecillas del reloj. Si este vector v se rota un ángulo φ medido
desde su posición inicial y en sentido contrario a las manecillas del reloj, su
norma ║v║ no cambia, pero sus componentes escalares SÍ. Llamemos a este
nuevo vector v’ = (v’x , v’y).
De la figura tenemos figura tenemos las siguientes relaciones:
sin,cos vv yx vv
)sin(',)cos(' vv yx vv
Desarrollando el coseno y el seno de la suma de dos ángulos, tenemos:
sinsincoscos)cos(' vvxv
θ
θ + φφ
v = (vx , vy)
v’ = ( v’x , v’y)
Dr. Isaias Ochoa Landín Página 68 12/04/2023
sinsincoscos' vv xv
y para v’y:
Así, la transformación de rotación aplicada a un vector v nos da otro
vector v’ cuyas componentes son:
La matriz de transformación se obtiene al aplicar esta transformación por
rotación a los vectores de la base canónica:
y la matriz de transformación AT, es:
La transformación por rotación puede, entonces expresarse como:
y
x
y
x
v
v
v
vT
cossin
sincos
o de forma más compacta:
vv TAT )(
Volviendo al problema inicial, si v = (t , t2) y φ = ½ π, entonces la
transformación T sobre v es:
x
x
x
x
x
x
x
xT
2
222 01
10
2cos
2sin
2sin
2cos
Dr. Isaias Ochoa Landín Página 69 12/04/2023
-20 -18 -16 -14 -12 -10 -8 -6 -4 -2 0 2 4 6-10
-8
-6
-4
-2
0
2
4
6
8
10
12
14
16
18
20
Ejemplo 34: Transformación de proyección ortogonal de un vector en R3 sobre
un plano que pasa por el origen del sistema coordenado tridimensional.
Un plano, Π, que pasa por el origen tiene por ecuación:
0 CzByAx
Este plano tiene una base ortonormal formada por los vectores unitarios u1 y
u2. Así, es posible estimar la proyección ortogonal sobre el plano Π de
cualquier vector w є R3mediante la expresión:
2211 uuwuuww proy
Ahora consideremos el vector w = (wx, wy, wz) y estimemos su
proyección sobre el plano coordenado XY. La base ortonormal para el plano XY
son los vectores unitarios:
0
1
0
,
0
0
1
1B
Entonces, la proyección de w sobre el plano XY es el vector con
coordenadas:
2211 uuwuuww XYproy
00
1
0
0
1
0
0
0
1
0
0
1
y
x
zyxzyxXY w
w
wwwwwwproy w
Dr. Isaias Ochoa Landín Página 70 12/04/2023
Así, la transformación de proyección de un vector w є R3 sobre el plano
coordenado XY es:
0y
x
z
y
x
w
w
w
w
w
T
Aplicando esta transformación a los vectores unitarios, tenemos:
0
0
0
1
0
0
,
0
1
0
0
1
0
,
0
0
1
0
0
1
TTT
y la matriz de transformación es:
Como puede verse, esta matriz ya está escalonada por renglones, el
núcleo de la transformación es el vector (0, 0, wz) por lo que la nulidad de la
transformación es ν(T) = 1. Solamente hay dos pivotes por lo que el rango de la
transformación es ρ(T) = 2 y la imagen de la transformación es
Imagen(T) = Imagen(AT) = gen
3.4.1 Geometría de las transformaciones lineales
Existen otras transformaciones que pueden considerarse elementales y
que se definen a continuación:
Transformación por REFLEXIÓN. Existen tres tipos elementales de
transformación por reflexión:
Reflexión respecto al eje X:
Cuando esta transformación se aplica sobre un vector lo que se obtiene
es otro vector simétrico al primero con respecto al eje X.
Dr. Isaias Ochoa Landín Página 71 12/04/2023
Reflexión sobre el eje Y: Como la anterior, esta reflexión, produce un vector
simétrico pero respecto al eje Y como se muestra en la figura. La
transformación y la matriz, son:
Observe que las matrices de transformación son como matrices
elementales obtenidas de realizar el producto por -1 sobre los renglones de las
matrices identidad.
La representación geométrica de la reflexión sobre los ejes X y Y se
muestra enseguida:
Figura 3.12 Transformación de reflexión sobre los ejes X y Y.
Reflexión sobre la recta y = x. Esta reflexión viene dada por:
la cual tiene la siguiente matriz de transición:
Note que esta reflexión es equivalente a una permutación aplicada sobre
la matriz identidad. Geométricamente, esto significa lo siguiente:
Y
X
v = (x, y)
T(v) = (x, −y)
X
v = (x, y)T(v) = (−x, y)Y
Dr. Isaias Ochoa Landín Página 72 12/04/2023
Figura 3.13 Reflexión sobre la recta y = x.
Transformación por EXPANSIÓN y COMPRESIÓN. En este tipo de
transformaciones existen también dos tipos de ellas: a lo largo del eje X y del
eje Y.
La transformación a lo largo del eje X se define como sigue:
donde c es un número real. La matriz de transformación, AT, es:
La transformación a lo largo del eje Y se define como:
y la matriz elemental es:
Así, las matrices de transformación son equivalentes a multiplicar el
renglón correspondiente de la matriz identidad por el número real c.
En ambos casos, si c > 1, la transformación es una EXPANSIÓN, si 0 <
c < 1, la transformación es una COMPRESIÓN.
En la Figura 3.14 se muestra la expansión a lo largo del eje X y la
compresión a lo largo del eje Y como ejemplo de estas transformaciones.
X
Yv
T(v)
y = x
Dr. Isaias Ochoa Landín Página 73 12/04/2023
Figura 3.14 Expansión a lo largo de los ejes X y Y.
Transformación por CORTE, Un “corte” a lo largo del eje X es una
transformación que toma al vector (x, y) y lo convierte en un nuevo vector
(x+cy, y) donde c es un número real, es decir:
La matriz de transformación es:
la cual es equivalente a la siguiente matriz elemental:
La Figura 3.15 muestra un “corte” a lo largo del eje X:
Figura 3.15 Corte a lo largo del eje X.
Note como la base del rectángulo sombreado no cambia al aplicar el
“corte”. De hecho, si aplica la transformación a estos puntos sus coordenadas
no cambiarán.
El “corte” a lo largo del eje Y viene dado por:
Y
T(v) = (ac, b)
X
v =(a, b)
(a, 0)
(0, b)
(ac, 0)
T(v) = (a, bc)
X(a, 0)
(0, bc)
(0, b)
Yv =(a, b)
0 < c < 1
c > 1
X
Y
(a, b)
(a, 0)
(0, b)
(0, 0)X
Y
(a, 0)
(0, b) (bc, b)(a+bc, b)
(0, 0)
c > 0
Dr. Isaias Ochoa Landín Página 74 12/04/2023
y su matriz de transformación es:
Como antes, la matriz de transformación es equivalente a la matriz elemental
siguiente:
y la siguiente figura muestra un “corte” a lo largo del eje Y:
Figura 3.16 Corte a lo largo del eje Y.
En el corte a lo largo del eje Y, son las coordenadas de lado del
paralelogramo sobre el eje Y cuyas coordenadas no cambian al aplicarles la
transformación.
X
Y
(a, b)
(a, 0)
(0, b)
(0, 0)X
Y
(a, 0)
(0, b)
(a, ac)
(0, 0)
(a, ac + b)
c > 0
Dr. Isaias Ochoa Landín Página 75 12/04/2023
La siguiente tabla resume las transformaciones anteriores:
TransformaciónRespecto al
eje
Matriz de
Transformación, AT
Condiciones
REFLEXIÓN
X
Y
Rectay = x
EXPANSIÓN &COMPRESIÓN
X Si c > 0 se trata de una Expansión.Si 0 < c < 1 se trata de una Compresión.Y
CORTE
XSi c > 0, el Corte es en el sentido positivo del eje coordenado y en sentido opuesto en caso contrario.
Y
Ejercicios: Exprese la matriz de transformación dada como una sucesión de
EXPANSIÓN, COMPRESIÓN, REFLEXIÓN Y CORTE.
1. 2. 3. 4.
5. 6. 7. 8.
Resolveremos algunos de los ejercicios para explicar el procedimiento:
Ejercicio 2. La matriz de transformación es . Para expresar esta
matriz como el producto de matrices, primero encontramos su inversa:
Como se vio anteriormente, la matriz de transformación AT puede
escribirse como un producto de inversas de matrices elementales. La ventaja
de las matrices elementales es que su inversa se calcula rápidamente por
inspección. Así, AT puede escribirse como sigue:
Dr. Isaias Ochoa Landín Página 76 12/04/2023
De acuerdo a la tabla anterior, la matriz de transformación, AT, es el
resultado de un conjunto simultáneo de transformaciones:
Etapa Transformación Elemental Resultado de la transformación
1Como el valor de la constante c = 2/3, la transformación consiste en un Corte a lo largo del eje X.
2 Esta transformación se trata de una Expansión a lo largo del eje Y pues c = 14/3 > 0.
3 Esta es una transformación de Corte a lo largo del eje Y con c = -1.
4 Esta es una expansión a lo largo del eje X pues c = 3 > 0.
Veamos ahora que significa geométricamente lo anterior. Cuando se
aplican todas estas transformaciones a un vector, digamos v = (-2, 5), tenemos:
Etapa 1: Corte a lo largo del eje X. Esta transformación aplicada al vector es:
Figura 3.17 Etapa 1: Corte a lo largo del eje X.
Etapa 2. La siguiente etapa consiste en una expansión a lo largo del eje Y. La
matriz de transformación es aplicada al vector resultante de la Etapa 1:
Dr. Isaias Ochoa Landín Página 77 12/04/2023
Figura 3.18 Etapa 2: Expansión a lo largo del eje Y.
Etapa 3. Esta es otra transformación por Corte aplicada al vector resultante de
la etapa anterior, pero en esta ocasión el corte es realizado a lo largo del eje Y
en la dirección negativa dado que c = -1:
En la figura se incluyen, nuevamente, el vector resultado de la
transformación anterior (etapa 2) y el vector resultado de la transformación de
la etapa 3. Note que, como el Corte se hizo en el sentido negativo del eje Y, la
longitud del vector se ha reducido ligeramente. Note, también, que el lado del
paralelogramo que descansa sobre el eje Y se mantiene intacto, es decir, sus
coordenadas se mantienen igual a pesar de aplicarles la transformación.
Dr. Isaias Ochoa Landín Página 78 12/04/2023
Figura 3.19. Etapa 3: Corte a lo largo del eje Y.
Etapa 4: Finalmente el vector resultante de la transformación anterior,
experimenta una expansión a lo largo del eje Y:
Figura 3.20 Etapa 4: Expansión a lo largo del eje Y.
El resultado final es igual al que se obtendría si se efectúa la
transformación total sobre el vector como puede verse a continuación:
Dr. Isaias Ochoa Landín Página 79 12/04/2023
Para resolver el ejercicio (3), empezamos nuevamente escalonando la
matriz de transformación:
La matriz AT puede entonces escribirse como el producto de matrices
elementales inversas:
EtapaTransformación
ElementalResultado de la Transformación
1
Reflexión sobre la recta y = x. Note que esto es
similar a una permutación hecha sobre la matriz
identidad.
2Debido a que c > 1, la transformación se trata de
una Expansión a lo largo del eje Y.
3
Esta transformación es, en realidad, una
combinación de una Expansión a lo largo del eje
Y seguida de una Reflexión respecto al eje X.
4Esta transformación consiste en un corte a lo
largo de la parte negativa del eje X pues c < 0.
Respecto a la Etapa 3, a primera vista y por la posición que tiene el
parámetro c, podríamos pensar que se trata de una “Expansión” o
“Compresión” a lo largo del eje Y. Sin embargo, el hecho de que este
parámetro sea menor que cero nos hace pensar que no puede ser ni una ni la
otra pues aquéllas ocurren cuando c > 1 y 0 < c < 1, respectivamente, y no se
ha dicho nada acerca de otro valor de c. Como se menciona en la tabla, la
Etapa 3 es, en realidad, una combinación de dos transformaciones. Para ver
esto, es necesario descomponer, aún más, la matriz de transformación
correspondiente:
Dr. Isaias Ochoa Landín Página 80 12/04/2023
Los valores de las constantes t, u, v y w, pueden obtenerse por
inspección o realizando el producto de matrices e igualando las matrices de
ambos, componente a componente:
De este producto obtenemos que t = 1, u = 0, v = 0 y w = 2. Así, la matriz
para esta etapa queda descompuesta como sigue:
Con esto, es fácil ver que la primera parte es una Expansión a lo largo
del eje Y, seguida por una Reflexión sobre el eje X, como se mencionó
anteriormente.