Libro Mate 4

371
CURSO DE C ´ ALCULO DIFERENCIAL EN VARIAS VARIABLES Rub´ en Becerril Fonseca Daniel Jardon Arcos J. Guadalupe Reyes Victoria Departamento de Matem´ aticas UAM-IZTAPALAPA 2002 c UAMI

Transcript of Libro Mate 4

Page 1: Libro Mate 4

CURSO DE CALCULODIFERENCIALEN VARIAS VARIABLES

Ruben Becerril Fonseca

Daniel Jardon Arcos

J. Guadalupe Reyes Victoria

Departamento de Matematicas

UAM-IZTAPALAPA

2002 c© UAMI

Page 2: Libro Mate 4

2

Page 3: Libro Mate 4

Prefacio

Uno de los principales problemas que tiene un lector estudioso de las cien-cias basicas (fısica, quımica, matematicas) o de la ingenierıa, es el de en-contrar aislados en la abundante literatura muchos temas de su interes.Por un lado, los textos clasicos orientados hacia las partes aplicadas de laciencia que tienen relevancia, no son del todo accesibles al joven lector, ypara su lectura imponen una cantidad considerable de prerrequisitos. Porotra parte, la literatura teorica en muchas ocasiones causa tedio en losaspirantes al ejercicio practico de la ciencia.

La presente obra trata de equilibrar las dos cuestiones: la parte teoricade una forma simple, y su uso en las partes aplicadas de la ciencia, pensandoen la formacion del futuro cientıfico, ingeniero, tecnico, etcetera. Para sulectura se presuponen conocimientos elementales de calculo diferencial deuna variable. Los demas conceptos el lector no matematico puede irlosaprendiendo durante el camino.

En el primer capıtulo hacemos un bosquejo de los elementos necesariospara leer el trabajo, como son los sistemas de ecuaciones, las matrices ydeterminantes. De esta manera se hace una resena de los elementos basicosdel Algebra Lineal.

El capıtulo 2 trata de los aspectos basicos de los objetos geometricoselementales en el espacio Euclidiano: las rectas, los planos. Para suconstruccion necesitamos los conceptos de vector, angulo y distancia.Aquı se estudia tambien el problema de vectores y valores propios de unamatriz cuadrada real.

En el capıtulo 3 se estudian los elementos basicos de las curvas planasy espaciales, sus propiedades diferenciables: su velocidad y aceleracion.

El capıtulo 4 muestra el estudio de los campos escalares diferenciablesRn → R , y los elementos para realizarlo: las derivadas parciales, elgradiente, el polinomio de Taylor, etcetera.

Page 4: Libro Mate 4

4

En el capıtulo 5 se hace una muestra somera de la teorıa basica delos campos vectoriales diferenciables del tipo Rn → Rm (n,m ≤ 3) y losconceptos asociados mas importantes se enuncian y ejemplifican: la diver-gencia, el rotor y el gradiente.

En los apendices se incluyen topicos clasicos de los cursos de calculo envarias variables como: elementos basicos de superficies en R3, orientaciony longitud de una curva en R3, lımites y continuidad de campos es-calares, planos tangentes, valores extremos de un campo escalar y lasfunciones implıcitas.

Este libro es producto de varios cursos de Matematicas IV para los es-tudiantes de Ciencias Biologicas y de la Salud (CBS) en la UniversidadAutonoma Metropolitana Iztapalapa, durante los anos 1992 - 1999. Lapresentacion es diferente de la de los cursos clasicos debido a que las necesi-dades de las propias licenciaturas (ingenieros bioquımicos, biotecnologos yen alimentos) ası lo requieren.

Deseamos manifestar nuestro agradecimiento al Dr. Gerardo Saucedo,Director de la Division de CBS, al M. en C. Arturo Preciado, SecretarioAcademico de la Division de CBS, a la Dra. Marıa Jose Arroyo, ex-Directora de la Division de CBI y al Dr. Ernesto Perez, Jefe del Departa-mento de Matematicas por todo el apoyo y entusiasmo que nos brindaron.Tambien queremos resaltar la contribucion de los profesores y alumnos queusaron versiones preliminares y cuyos valiosos comentarios nos ayudaron amejorar el texto. La presentacion final se logro gracias a la colaboracion deDaniel Espinosa (Flash).

Por ultimo, quisieramos agradecer a nuestras respectivas familias portoda la paciencia infatigable a lo largo de este proyecto.

R.B.F., D.R.J.A., J.G.R.V.IZTAPALAPA 2002

Page 5: Libro Mate 4

Contenido

1 Sistemas de ecuaciones, matrices y determinantes 71.1 Sistemas de ecuaciones . . . . . . . . . . . . . . . . . . . . . 71.2 Matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111.3 Operaciones basicas de matrices . . . . . . . . . . . . . . . . 121.4 Determinantes de orden tres . . . . . . . . . . . . . . . . . . 201.5 Inversa de una matriz . . . . . . . . . . . . . . . . . . . . . 311.6 La regla de Cramer . . . . . . . . . . . . . . . . . . . . . . . 331.7 Sistemas lineales homogeneos . . . . . . . . . . . . . . . . . 391.8 El metodo de Gauss-Jordan . . . . . . . . . . . . . . . . . . 45

2 Vectores en R2 y R3 652.1 Sistemas de coordenadas en R2 y R3 . . . . . . . . . . . . . 652.2 El producto escalar y la norma en R3 . . . . . . . . . . . . . 722.3 El producto vectorial . . . . . . . . . . . . . . . . . . . . . . 822.4 El triple producto escalar y bases de R3 . . . . . . . . . . . 862.5 Vectores y valores propios de una matriz . . . . . . . . . . . 962.6 Rectas y Planos en R3 . . . . . . . . . . . . . . . . . . . . . 110

3 Curvas en R2 y en R3 1273.1 Curvas suaves . . . . . . . . . . . . . . . . . . . . . . . . . . 1273.2 La segunda derivada. Aceleracion . . . . . . . . . . . . . . . 146

4 Campos escalares en R3 1494.1 Regiones en R2 y R3 . . . . . . . . . . . . . . . . . . . . . . 1494.2 Campos escalares en R3 . . . . . . . . . . . . . . . . . . . . 1554.3 Superficies y curvas de nivel . . . . . . . . . . . . . . . . . . 1584.4 Derivadas parciales y el gradiente . . . . . . . . . . . . . . . 1654.5 La regla de la cadena . . . . . . . . . . . . . . . . . . . . . . 1704.6 Derivada direccional . . . . . . . . . . . . . . . . . . . . . . 1764.7 El Teorema de Taylor . . . . . . . . . . . . . . . . . . . . . 1794.8 Diferencial total de un campo escalar . . . . . . . . . . . . . 195

Page 6: Libro Mate 4

6 CONTENIDO

5 Campos vectoriales en R3 2055.1 Funciones del tipo Rn → Rm . . . . . . . . . . . . . . . . . 2055.2 La matriz jacobiana . . . . . . . . . . . . . . . . . . . . . . 2195.3 La regla de la cadena . . . . . . . . . . . . . . . . . . . . . . 2235.4 Cambios de coordenadas . . . . . . . . . . . . . . . . . . . . 2285.5 Campos vectoriales en R2 y R3 . . . . . . . . . . . . . . . . 2485.6 Divergencia, gradiente y rotor . . . . . . . . . . . . . . . . . 259

6 Elementos Basicos de Superficies en R3 2776.1 Superficies de revolucion . . . . . . . . . . . . . . . . . . . . 2786.2 Superficies cilındricas . . . . . . . . . . . . . . . . . . . . . . 2826.3 Superficies conicas . . . . . . . . . . . . . . . . . . . . . . . 2836.4 Elipsoides, Hiperboloides y Paraboloides . . . . . . . . . . . 287

7 Orientacion de curvas y poligonales 2997.1 Orientacion. . . . . . . . . . . . . . . . . . . . . . . . . . . . 2997.2 Longitud de arco y angulo entre curvas . . . . . . . . . . . . 3037.3 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 308

8 Lımites y puntos singulares 3098.1 Puntos de acumulacion y lımites . . . . . . . . . . . . . . . 3098.2 Puntos singulares . . . . . . . . . . . . . . . . . . . . . . . . 3128.3 Continuidad . . . . . . . . . . . . . . . . . . . . . . . . . . . 315

9 Valores extremos de funciones R2 → R 3199.1 Plano tangente . . . . . . . . . . . . . . . . . . . . . . . . . 3199.2 Puntos regulares y crıticos . . . . . . . . . . . . . . . . . . . 3229.3 Formas cuadraticas basicas . . . . . . . . . . . . . . . . . . 3259.4 Puntos crıticos no degenerados . . . . . . . . . . . . . . . . 3319.5 Multiplicadores de Lagrange . . . . . . . . . . . . . . . . . . 345

10 Funciones implıcitas 359

Page 7: Libro Mate 4

Capıtulo 1

Sistemas de ecuaciones,

matrices y determinantes

1.1 Sistemas de ecuaciones

Iniciamos con el problema de resolver un sistema de ecuaciones lineales de2× 2 con coeficientes reales de la forma

a11x+ a12y = b1a21x+ a22y = b2

donde a11, a12, a21, a22, b1 y b2 son constantes reales y x, y son incognitas.

C Despejamos a la variable x de la primera ecuacion y la sustituimosen la segunda.

De la relacion

a11x+ a12y = b1

se obtiene que

a11x = b1 − a12y

lo que implica que, si a11 6= 0, entonces

x =b1 − a12y

a11

Al sustituir en la segunda ecuacion del sistema se tiene

b2 = a21

(b1 − a12y

a11

)+ a22y (∗)

Page 8: Libro Mate 4

8 Sistemas de ecuaciones, matrices y determinantes

que nos permite resolver para la variable y de la siguiente forma.

De la ecuacion

b2 =a21(b1 − a12y) + a11a22y

a11

se obtienea11b2 = a21b1 − a21a12y + a11a22y

de donde,a11b2 − a21b1 = y(a11a22 − a21a12)

De esta manera, sia11a22 − a21a12 6= 0

entonces podemos despejar a y, quedando

a11b2 − a21b1a11a22 − a21a12

= y

Es decir,

y =a11b2 − a21b1a11a22 − a21a12

Al sustituir esta igualdad en la ecuacion (∗) se obtiene la indeterminada xde la siguiente cadena de igualdades

x =b1 − a12

(a11b2−a21b1

a11a22−a21a12

)

a11=b1 − a12(a11b12−a21b1)

a11a22−a21−a12

a11

=

b1(a11a22−a21a12)−a12(a11b2−a21b1)a11a22−a21a12

a11=

a11(b1a22 − a12b2)a11(a11a22 − a21a21)

De donde,

x =b1a22 − a12b2a11a22 − a21a12

B

Concluimos la discusion con el siguiente lema.

LEMA 1.1 Para el sistema lineal de dos ecuaciones con dos incognitasx, y

a11x+ a12y = b1a21x+ a22y = by

con a11, a12, a21, a22, b1, b2 numeros reales, se tiene la solucion dada porla pareja

x =b1a22 − a12b2a11a22 − a21a12

Page 9: Libro Mate 4

1.1 Sistemas de ecuaciones 9

y =a11b2 − a21b1a11a22 − a21a12

sabiendo que a11a22 − a21a12 6= 0

NOTACION. Para una expresion real ad− bc definimos el arreglo∣∣∣∣a bc d

∣∣∣∣

mediante la igualdad ∣∣∣∣a bc d

∣∣∣∣ = ad− bc

EJEMPLO. Para a11, a12, a12, , a22, b1, b2 numeros reales arbitrarios te-nemos

C a11a21 − a21a12 =

∣∣∣∣a11 a12a21 a22

∣∣∣∣

b1a22 − a12b2 =

∣∣∣∣b1 a12b2 a22

∣∣∣∣

a11b2 − a21b1 =

∣∣∣∣a11 b1a21 b2

∣∣∣∣ B

En esta notacion, las soluciones del sistema dado en el Lema 1.1 seescriben

x =

∣∣∣∣b1 a12b2 a22

∣∣∣∣∣∣∣∣a11 a12a21 a22

∣∣∣∣, y =

∣∣∣∣a11 b1a21 b2

∣∣∣∣∣∣∣∣a11 a12a21 a22

∣∣∣∣

Para tal sistema de ecuaciones se introduce el siguiente arreglo formadopor los coeficientes que intervienen en el sistema

(a11 a12 b1a21 a22 b2

)

y le llamamos la matriz principal del sistema.

Se obtienen de esta las submatrices cuadradas (2× 2),

(a11 a12a21 a22

),

(b1 a12b2 a22

),

(a11 b1a21 b2

)

y a cada arreglo se le asocia un numero distinguido propio

D =

∣∣∣∣(a11 a12a21 a22

)∣∣∣∣ =∣∣∣∣a11 a12a21 a22

∣∣∣∣ = a11a22 − a12a21

Page 10: Libro Mate 4

10 Sistemas de ecuaciones, matrices y determinantes

Dx =

∣∣∣∣(b1 a12b2 a22

)∣∣∣∣ =∣∣∣∣b1 a12a2 a22

∣∣∣∣ = b1a22 − a12b2

Dy =

∣∣∣∣(a11 b1a21 b2

)∣∣∣∣ =∣∣∣∣a11 b1a21 b2

∣∣∣∣ = a11b2 − b1a21

llamados sus determinantes correspondientes.

Con esta ultima notacion se tiene el siguiente resultado.

COROLARIO 1.1 Las soluciones x, y del sistema inicial se calculan por

x =Dx

Dy =

Dy

D

sabiendo que D 6= 0.

EJEMPLO. Resolver el sistema2x− 3y = 13x+ 2y = 2

C La matriz principal del sistema es(

2 −3 13 2 2

)

Las submatrices asociadas son(2 −33 2

),

(1 −32 2

),

(2 13 2

)

y los determinantes correspondientes se calculan

D =

∣∣∣∣(

2 −33 2

)∣∣∣∣ ==

∣∣∣∣2 −33 2

∣∣∣∣ = 4 + 9 = 13 6= 0

Dx =

∣∣∣∣(

1 −32 2

)∣∣∣∣ =∣∣∣∣1 −32 2

∣∣∣∣ = 2 + 6 = 8

Dy =

∣∣∣∣(

2 13 2

)∣∣∣∣ =∣∣∣∣2 13 2

∣∣∣∣ = 4− 3 = 1

Esto nos lleva a que las soluciones del sistema de ecuaciones son

x =Dx

D=

8

13

y =Dy

D=

1

13B

En la discusion mostrada al resolver un sistema lineal de dos ecuacionescon dos incognitas nos encontramos con los conceptos auxiliares de solucionque son, las matrices y los determinantes. Estudiamos estos objetosmatematicos y sus propiedades en las proximas secciones. Mas adelantevolveremos al problema de resolver sistemas de ecuaciones lineales.

Page 11: Libro Mate 4

1.2 Matrices 11

1.2 Matrices

Un arreglo de la forma

a11 a12 a13 · · · a1na21 a22 a23 · · · a2n...

am1 am2 am3 · · · amn

donde cada aij es un numero real, se llamara una matriz real de dimen-siones m× n. Esto es, el arreglo consta de m− renglones y n− columnas

El i-esimo renglon de la matriz serıa

(ai1, ai2, ai3 · · · ain)

y se llamarıa el i-esimo vector renglon.

Al arreglo

a1ja2ja3j...

amj

se le denomina el j-esimo vector columna.Una entrada aij de la matriz estarıa en el i-esimo renglon y la j-esima

columna (i define los renglones y j define las columnas).

EJEMPLO. La matriz real

1 3 4 6 82 3 2 −1 04 3 5 7 −2

es de (3× 5).

C Mencionamos algunos elementos de la matriz

a34 = 7, a15 = 8, a23 = 1, a32 = 3

El segundo vector renglon es

(2 3 1 − 1 0)

mientras que el tercer vector columna es

425

B

Page 12: Libro Mate 4

12 Sistemas de ecuaciones, matrices y determinantes

Una matriz con dimensiones m = n tal se llamara matriz cuadrada.

EJEMPLO. Las matrices

(1 24 −2

)

2×2,

1 0 00 −2 30 1 0

3×3

son cuadradas.

A una matriz con entradas identicamente nulas se llamara matriz nulay se denota por

O =

0 0 · · · 00 0 · · · 0...0 0 · · · 0

m×n

1.3 Operaciones basicas de matrices

En adelante identificaremos a las matrices reales por letras mayusculas:

A,B,C, · · ·M, · · ·

y sus entradas reales por minusculas

aij , bij , cij , · · ·mij , · · ·

Dos matrices se pueden sumar si tienen las mismas dimensiones, esdecir, si

A = Am×n, B = Bm×n

entonces A+B tiene sentido. De hecho, si las matrices tienen entradas

A = (aij), B = (bij)

entonces su suma se define por la suma de entradas correspondientes, estoes,

A+B = (aij) + (bij) = (aij + bij)

EJEMPLO. Sean las matrices reales

A =

1 0 −30 1 1−1 4 2

3×3

Page 13: Libro Mate 4

1.3 Operaciones basicas de matrices 13

B =

(2 3 4−1 4 2

)

2×3

C No tienen sentido la suma matricial A + B por ser de diferentesdimensiones. B

EJEMPLO. Sean las matrices reales

A =

(−1 4 3 2−2 1 8 2

)

2×4

B =

(0 1 0 1−1 4 −1 2

)

2×4

C Su suma tiene sentido y se calcula

A+B =

(−1 4 3 2−2 1 8 2

)+

(0 1 0 1−1 4 −1 2

)=

(−1 5 3 3−3 5 7 4

)B

Una cantidad escalar es un numero real arbitrario y lo identificamospor las letras griegas

λ, µ, τ, · · ·

Dada la matriz A = (aij)m×n, se define la nueva matriz λA de m × nobtenida al multiplicar por el escalar λ, como aquella que se obtiene demultiplicar por λ cada una de sus entradas, esto es,

λA = λ(aij) = (λaij)

EJEMPLOS.

i. Si tomamos

λ = 3, A =

1 0 30 1 1−1 4 2

entonces

λA = 3

1 0 −30 1 1−1 4 2

=

3 0 −90 3 3−3 12 6

ii. Al considerar

µ = −1, B =

(2 3 0−1 4 2

)

se obtiene la matriz

µB = −1(

2 3 0−1 4 2

)=

(−2 −3 01 −4 −2

)

Page 14: Libro Mate 4

14 Sistemas de ecuaciones, matrices y determinantes

OBSERVACIONES.

1. La matriz O = (0) (nula) es el elemento matricial que al sumarse acualquier matriz no la altera:

A+O = A

2. Dada A una matriz arbitraria y λ = −1, se define −A = (−1)A comola matriz inversa aditiva de A, tal que

A+ (−1)A = O

EJEMPLO. Sean las matrices

A =

(1 −12 2

), B =

(−1 10 −3

)

Calcular: A+B, 3A, A+ 2B, A−B.

C Mediante calculos directos, obtenemos,

A+B =

(1 −12 2

)+

(−1 10 −3

)=

(0 02 −1

)

3A = 3

(1 −12 2

)=

(3 −36 6

)

A+ 2B =

(1 −12 2

)+ 2

(−1 10 −3

)

=

(1 −12 2

)+

(−2 20 −6

)=

(−1 12 −4

)

A−B =

(1 −12 2

)−(−1 10 −3

)=

(2 −22 5

)B

Sea A = (aij) una matriz arbitraria dem×n, se define lamatriz trans-puesta de A como la matriz de n×m que se obtiene de aij intercambiandorenglones por columnas. Identifitada por At, sus entradas la definen por

At = (aji)

EJEMPLOS.

i. Dada la matriz (2× 3)

A =

(1 0 1−1 1 2

)

2×3

Page 15: Libro Mate 4

1.3 Operaciones basicas de matrices 15

se tiene que su transpuesta es la matriz (3× 2)

At =

1 −10 11 2

3×2

ii. Para la matriz renglon

A = (1 − 1 4)

se obtiene la matriz transpuesta dada por el vector columna,

At =

1−14

iii. Para la matriz cuadrada de 2× 2

A =

(1 −12 1

)

su transpuesta es

At =

(1 2−1 1

)

Sean Am×n, Bn×s dos matrices reales. Se define su producto como lamatriz Cm×s obtenida de la siguiente forma:

Am×nBm×s =

a11 a12 · · · a1na21 a22 · · · a2n

...am1 am2 · · · amn

b11 b12 · · · b1sb21 b22 · · · b2s

...bn1 bn2 · · · bns

=

c11 c12 · · · c1sc21 c22 · · · c2s

...cm1 cm2 · · · cms

= (cij) = Cm×s

donde la entrada cij de C se obtiene de multiplicar los elementos del i-eisimo renglon de A con los de la j-esima columna de B, y realizar la sumade estos productos.

Page 16: Libro Mate 4

16 Sistemas de ecuaciones, matrices y determinantes

Esto es,

cij =(ai1 ai2 · · · ain

)︸ ︷︷ ︸

i-esimo renglon

b1jb2j...anj

︸ ︷︷ ︸j-esima columna

= ai1b1j + ai2b2j + ai3b3j + · · · ainbnj =n∑

k=1

aikbkj

siendo que el producto del i-esimo renglon de A con la j-esima columna deB se define por la suma anterior.

Si tenemos

A =

A1

A2

...An

donde

Ai =(ai1 ai2 · · · ain

)

y

B =(B1 B2 · · · Bs

)

siendo el vector columna

Bj =

bijb2j...bnj

entonces los elementos del producto se calculan, mediante

cij = AiBj =

n∑

k=1

aikbkj

con el producto estipulado por la suma anterior.

En otras palabras, para poder multiplicar dos matrices A = Am×n yB = Bn×s es necesario que el numero n de columnas de A coincida conel numero n de renglones de B, y el resultado (producto) es una matrizC = Cm×s de dimensiones m× s

Page 17: Libro Mate 4

1.3 Operaciones basicas de matrices 17

EJEMPLO. Sean las matrices

A =

(3 2−1 0

)

3×2

B =

(1 0 1 −1 4−1 2 3 −1 0

)

2×3

Calcular BA y AB.

C a. BA = B2×5 A3×2, como 5 6= 3 no tiene sentido el producto.

b. AB = A3×2 B2×5, en este caso tiene sentido el producto y se realiza

3 2−1 00 1

(

1 0 1 −1 4−1 2 3 −1 0

)=

1 4 9 −5 12−1 0 −1 1 −4−1 2 3 −1 0

A continuacion mostramos el calculo de algunos elementos cij del pro-ducto de las matrices dadas

c11 = (3 2)(1 − 1) = 3− 2 = 1

c12 = (3 2)(0 2) = 0 + 4 = 4

c13 = (3 2)(1 3) = 3 + 6 = 9

c14 = (3 2)(−1 − 1) = −3− 2 = −5c15 = (3 2)(4 0) = 12 + 0 = 12

c23 = (−1 0)(0 2) = 0 + 2 = 2

c35 = (0 1)(4 0) = 0

La matriz obtenida es de (3× 5) B

EJEMPLO. Sean las matrices

A =

(2 1 51 3 2

)

2×3B =

3 4−1 22 1

3×2

Calcular: AB y BA.

C a. AB = A2×3B3×2 = C2×2 es una matriz cuadrada de (2× 2)

AB =

(2 1 51 3 2

)

3 4−1 22 1

=

(15 154 12

)

Page 18: Libro Mate 4

18 Sistemas de ecuaciones, matrices y determinantes

los calculos se muestran a continuacion:[c11 = 6− 1 + 10 = 15 c21 = 3− 3 + 4 = 4c12 = 8 + 2 + 5 = 15 c22 = 4 + 6 + 2 = 12

]

b. BA = B3×2A2×3 = C3×3 es una matriz cuadrada de (3× 3).

BA =

3 4−1 22 1

(

2 1 51 3 2

)=

10 15 230 5 −15 5 12

Dejamos al lector la verificacion de los calculos. B

El ejemplo precedente muestra que en general el producto de matricesno es conmutativo, es decir, en general AB 6= BA

TEOREMA 1.1 Sean las matrices A = Am×n, B = Bm×n, C = C`×m

a. Se tiene la siguiente regla de distribucion del producto con la suma dematrices

C(A+B) = CA+ CB

b. Si λ es un numero real (escalar) entonces

C(λB) = (λC)B

C Damos a la matriz (A+B) = (Aj +Bj) en forma de columnas.

Por otro lado, si escribimos a la matriz C = (Ci) en renglones entonces

C(A+B) = (Ci) (Aj +Bj) = (CiA

j) + (CiBj) = CA+ CB B

TEOREMA 1.2 Si A = Am×n, B = Bn×s, C = C`×m son matricesreales, entonces el producto es asociativo, esto es,

C(AB) = (CA)B

C Es un calculo directo y se omite B

EJEMPLO. Sean las matrices.

A =

(2 1−1 0

)

(2×2)B =

(0 1−1 0

)

(2×2)C =

3 22 11 0

3×2

a. Verificamos que se cumple la relacion

C(A+B) = (CA+ CB)

Page 19: Libro Mate 4

1.3 Operaciones basicas de matrices 19

C Primeramente realizamos la suma de matrices A + B y luego calcu-lamos C(A+B)

C(A+B) =

3 22 11 0

[(

2 1−1 0

)+

(0 1−1 0

)]

=

3 22 11 0

(

2 2−2 0

)=

2 62 42 2

Por otro lado,

CA+ CB =

3 22 11 0

(

2 1−1 0

)+

3 22 11 0

(

0 1−1 0

)

=

4 33 22 1

+

−2 3−1 20 1

=

2 62 42 2

lo que prueba la validez de la relacion. B

b. Ahora comprobamos la asociatividad

C(AB) = (CA)B

C Por un lado,

C(AB) =

3 22 11 0

[(

2 1−1 0

)(0 1−1 0

)]

=

3 22 11 0

(−1 20 −1

)=

−3 4−2 3−1 2

Por otro lado,

(CA)B =

3 22 11 0

(

2 1−1 0

)(

0 1−1 0

)

=

4 33 22 1

(

0 1−1 0

)=

−3 4−2 3−1 2

Page 20: Libro Mate 4

20 Sistemas de ecuaciones, matrices y determinantes

lo que prueba la igualdad. B

La matriz cuadrada

I =

1 0 0 · · · 00 1 0 · · · 00 0 1 · · · 0...0 0 0 · · · 1

n×n

con 1′s en la diagonal y los otros elementos nulos, es tal que si A = Am×n

es una matriz arbitraria, entonces

AI = A

I se llamara matriz identidad de n×m.

EJEMPLO. Sea la matriz

A =

3 22 11 0

3×2

y sea I = I2×2 la matriz identidad, se tiene que

C AI = AI2×2 =

3 22 11 0

(

1 00 1

)=

3 22 11 0

= A B

1.4 Determinantes de orden tres

En esta parte definimos para las matrices cuadradas de dimensiones 2× 2y 3 × 3, un numero caracterıstico: su determinante. Este concepto, asıcomo sus propiedades, pueden ser generalizadas para matrices cuadradasde dimensiones mayores.

Para una matriz cuadrada de 2× 2 real

A =

(a11 a12a21 a22

)

se define el numero caracterıstico |A| llamado su determinante, por laigualdad

|A| =∣∣∣∣a11 a12a21 a22

∣∣∣∣ = a11a22 − a21a12.

Page 21: Libro Mate 4

1.4 Determinantes de orden tres 21

Cambiando un poco la notacion, lo anterior nos dice que para la matriz

A =

(a1 b1a2 b2

)

su determinante se calcula por la igualdad

|A| =∣∣∣∣a1 b1a2 b2

∣∣∣∣ = a1b2 − a2b1 =

∣∣∣∣a1 a2b1 b2

∣∣∣∣ = |At|

Esto nos dice que los determinantes de una matriz A de orden 2× 2 yla de su transpuesta At son iguales.

EJEMPLO. El determinante de la matriz

A =

(2 11 1

)

se calcula

C |A| =∣∣∣∣2 11 1

∣∣∣∣ = 2− 1 = 1 B

Para una matriz real de 3× 3

A =

a1 b1 c1a2 b2 c2a3 b3 c3

definimos de igual forma su determinante |A| como

|A| =

∣∣∣∣∣∣

a1 b1 c1a2 b2 c2a3 b3 c3

∣∣∣∣∣∣= a1

∣∣∣∣b2 c2b3 c3

∣∣∣∣− b1∣∣∣∣a2 c2a3 c3

∣∣∣∣+ c1

∣∣∣∣a2 b2a3 b3

∣∣∣∣

donde los determinantes 2× 2 en el desarrollo se calculan ordinariamente.

EJEMPLO. Calculamos el determinante de la matriz

1 2 32 3 43 4 5

C

∣∣∣∣∣∣

1 2 32 3 43 4 5

∣∣∣∣∣∣= 1

∣∣∣∣3 44 5

∣∣∣∣− 2

∣∣∣∣2 43 5

∣∣∣∣+ 3

∣∣∣∣2 33 4

∣∣∣∣

= 1(15− 16)− 2(10− 12) + 3(8− 9) = −1 + 4− 3 = 0 B

Page 22: Libro Mate 4

22 Sistemas de ecuaciones, matrices y determinantes

Dado el determinante ∣∣∣∣∣∣

a1 b1 c1a2 b2 c2a3 b3 c3

∣∣∣∣∣∣

los numeros ai, bi, ci, (i = 1, 2, 3) se llaman los elementos del determi-nante .

Si se considera un elemento del determinante, se dice que el determi-nante de la matriz 2 × 2 que se obtiene al quitar el renglon y la columnadonde se localiza tal elemento es su menor correspondiente.

EJEMPLO. En el determinante∣∣∣∣∣∣

1 2 32 3 43 4 5

∣∣∣∣∣∣

para el numero 3 en el centro, su menor correspondiente es∣∣∣∣1 33 5

∣∣∣∣

EJEMPLO. En el determinante∣∣∣∣∣∣

0 1 64 −11 14

π/2√2 1

∣∣∣∣∣∣

para π/2, su menor es ∣∣∣∣1 6−11 14

∣∣∣∣

Definimos la paridad de un elemento de un determinante como la sumadel numero, el renglon y del numero de la columna donde se encuentra.

EJEMPLO. En el determinante∣∣∣∣∣∣

1 2 32 3 43 4 5

∣∣∣∣∣∣

el elemento indicado 4 tiene paridad= 3 + 2 = 5.Es el mismo determinante,

∣∣∣∣∣∣

1 2 32 3 43 4 5

∣∣∣∣∣∣

Page 23: Libro Mate 4

1.4 Determinantes de orden tres 23

el elemento 2 tiene paridad= 1 + 2 = 3.

Igualmente, en ∣∣∣∣∣∣

1 2 32 3 43 4 5

∣∣∣∣∣∣

el elemento 3 tiene la paridad= 1 + 3 = 4

Definimos para un elemento aij de un determinante de 3×3 su cofactorAij como el numero (que lleva signos)

Aij = (−1)i+jMij

donde i es el numero de renglon, j el numero de columna yMij es su menorcorrespondiente.

EJEMPLO. Consideremos nuevamente el determinante del ejemplo ante-rior, entonces,

i. El elemento 4 indicado, ∣∣∣∣∣∣

1 2 32 3 43 4 5

∣∣∣∣∣∣

tiene cofactor (−1)3+2

∣∣∣∣1 32 4

∣∣∣∣ = −∣∣∣∣1 32 4

∣∣∣∣ = −(4− 6) = 2

ii. Analogamente, el elemento 1 indicado,∣∣∣∣∣∣

1 2 32 3 43 4 5

∣∣∣∣∣∣

tiene cofactor (−1)1+1

∣∣∣∣3 44 5

∣∣∣∣ =∣∣∣∣3 44 5

∣∣∣∣ = 15− 16 = −1

iii. De igual manera, en el mismo determinante,∣∣∣∣∣∣

1 2 32 3 43 4 5

∣∣∣∣∣∣

2 tiene cofactor A = (−1)2+1

∣∣∣∣2 34 5

∣∣∣∣ = −∣∣∣∣2 34 5

∣∣∣∣ = −(10− 12) = 2

Observemos que inicialmente un determinante se desarrollo∣∣∣∣∣∣

a1 b1 c1a2 b2 c2a3 b3 c3

∣∣∣∣∣∣= a1

∣∣∣∣b2 c2b3 c3

∣∣∣∣− b1∣∣∣∣a2 c2a3 c3

∣∣∣∣+ c1

∣∣∣∣a2 b2a3 b3

∣∣∣∣

Page 24: Libro Mate 4

24 Sistemas de ecuaciones, matrices y determinantes

Si se definen

A1 = cofactor (a1) = (−1)1+1

∣∣∣∣b2 c2b3 c3

∣∣∣∣ =∣∣∣∣b2 c2b3 c3

∣∣∣∣

B1 = cofactor (b1) = (−1)1+2

∣∣∣∣a2 c2a3 c3

∣∣∣∣ = −∣∣∣∣a2 c2a3 c3

∣∣∣∣

C1 = cofactor (c1) = (−1)1+3

∣∣∣∣a2 b2a3 b3

∣∣∣∣ =∣∣∣∣a2 b2a3 b3

∣∣∣∣

en esta notacion, el determinante se puede desarrollar mediante∣∣∣∣∣∣

a1 b1 c1a2 b2 c2a3 b3 c3

∣∣∣∣∣∣= a1A1 + b1B1 + c1C1

Un resulado mas general sobre el desarrollo de un determinante vienedado por el siguiente teorema, cuya prueba omitimos.

TEOREMA 1.3 (del desarrollo) Cualquier determinante 3× 3 se cal-cula como la suma de los terminos de un renglon (o una columna) por suscofactores.

C En particular, al desarrollar por la tercer columna,∣∣∣∣∣∣

a1 b1 c1a2 b2 c2a3 b3 c3

∣∣∣∣∣∣= c1C1 + c2C2 + c3C3

donde el cofactor de c1 es

C1 =

∣∣∣∣a2 b2a3 b3

∣∣∣∣

el cofactor de c2 es

C2 = −∣∣∣∣a1 b1a3 b3

∣∣∣∣y

C3 =

∣∣∣∣a1 b1a2 b2

∣∣∣∣

es cofactor de c3. B

EJEMPLO. Calcular el determinante∣∣∣∣∣∣

1 0 −14 0 −10 2 4

∣∣∣∣∣∣

Page 25: Libro Mate 4

1.4 Determinantes de orden tres 25

desarrollando por la segunda columna.

C Utilizando las paridades y el teorema del desarrollo 1.3 se tiene que

∣∣∣∣∣∣

1 0 −14 0 −10 2 4

∣∣∣∣∣∣= −0

∣∣∣∣4 −10 4

∣∣∣∣+ 0

∣∣∣∣1 −10 4

∣∣∣∣− 2

∣∣∣∣1 −14 −1

∣∣∣∣

= −2(−1 + 4) = −6. B

EJEMPLO. Calculamos el conocido determinante∣∣∣∣∣∣

1 2 32 3 43 4 5

∣∣∣∣∣∣

desarrollando por el segundo renglon.

C

∣∣∣∣∣∣

1 2 32 3 43 4 5

∣∣∣∣∣∣= −2

∣∣∣∣2 34 5

∣∣∣∣+ 3

∣∣∣∣1 33 5

∣∣∣∣− 4

∣∣∣∣1 23 4

∣∣∣∣

= −2(10− 12) + 3(5− 9)− 4(4− 6) = 4− 12 + 8 = 0. B

LEMA 1.2 Si un determinante cambia los renglones por columnas, no sealtera tal. Esto es, el determinante de una matriz y el determinante de sutranspuesta coinciden.

C Por el teorema del desarrollo tenemos∣∣∣∣∣∣

a1 b1 c1a2 b2 c2a3 b3 c3

∣∣∣∣∣∣= a1A1 + b1B1 + c1C1 =

∣∣∣∣∣∣

a1 a2 a3b1 b2 b3c1 c2 c3

∣∣∣∣∣∣B

LEMA 1.3 Si en un determinante se intercambian dos renglones (o doscolumnas) el signo del determinante se cambia.

C Por el teorema del desarrollo se tiene∣∣∣∣∣∣

a1 b1 c1a2 b2 c2a3 b3 c3

∣∣∣∣∣∣= a1A1 + b1B1 + c1C1

= a1(b2c3 − c2b3)− b1(a2c3 − a3c2) + c1(a2b2 − a3b2)

Page 26: Libro Mate 4

26 Sistemas de ecuaciones, matrices y determinantes

Por otro lado, al calcular el determinante despues de intercambiar losdos primeros renglones, obtenemos∣∣∣∣∣∣

a2 b2 c2a1 b1 c1a3 b3 c3

∣∣∣∣∣∣= a2(b1c3 − c1b3)− b2(a1c3 − a3c1) + c2(a1b3 − a3b1)

= −a1(b2c3 − c2b3) + b1(a2c3 − c2a3)− c1(a2b3 − a3b2)

= −

∣∣∣∣∣∣

a1 b1 c1a2 b2 c2a3 b3 c3

∣∣∣∣∣∣B

EJEMPLO. Ya hemos calculado el determinante∣∣∣∣∣∣

1 0 −14 0 −10 2 4

∣∣∣∣∣∣= −6

C Si intercambiamos las columnas primera y segunda, obtenemos, aldesarrollar por la nueva primer columna

∣∣∣∣∣∣

0 1 −10 4 −12 0 4

∣∣∣∣∣∣= 2

∣∣∣∣1 −14 −1

∣∣∣∣ = 2(−1 + 4) = 6 B

Del Lema 1.3, para el determinante con dos renglones iguales, al inter-cambiarlos, obtenemos

∣∣∣∣∣∣

a1 b1 c1a1 b1 c1a3 b3 c3

∣∣∣∣∣∣= −

∣∣∣∣∣∣

a1 b1 c1a1 b1 c1a3 b3 c3

∣∣∣∣∣∣

lo que implica que tal determinante es nulo debido a que 0 es el uniconumero real que es igual a su negativo. Esto es,

COROLARIO 1.2 Si en un determinante se repiten dos renglones o doscolumnas el determinante vale cero.

EJEMPLO. Por un calculo directo, se tiene que el determinante siguientecon dos renglones iguales

∣∣∣∣∣∣

1 0 11 3 41 3 4

∣∣∣∣∣∣= 3

∣∣∣∣1 11 4

∣∣∣∣− 3

∣∣∣∣1 11 4

∣∣∣∣ = 3(4− 1)− 3(4− 1) = 0

cuando se desarrolla por la segunda columna.

Tenemos ademas el siguiente importante resultado sobre desarrollos.

Page 27: Libro Mate 4

1.4 Determinantes de orden tres 27

COROLARIO 1.3 La suma de los productos pares de los elementos deuna fila o renglon por los complementos algebraicos correspondientes escero.

Es decir, para cualquier determinante se cumplen las igualdades

a1A2 + b1B2 + c1C2 = 0

b1A1 + b2A2 + b3A3 = 0

c1A1 + c2A2 + c3A3 = 0

C Consideremos un determinante arbitrario

D =

∣∣∣∣∣∣

a1 b1 c1a2 b2 c2a3 b3 c3

∣∣∣∣∣∣

entonces

A2 = −∣∣∣∣b1 c1b3 c3

∣∣∣∣ , B2 =

∣∣∣∣a1 c1a3 c3

∣∣∣∣ , C2 = −∣∣∣∣a1 b1a3 b3

∣∣∣∣

Por el colorario 1.2 el siguiente determinante se anula

0 =

∣∣∣∣∣∣

a1 b1 c1a1 b1 c1a3 b3 c3

∣∣∣∣∣∣

al desarrollar tal determinante por el segundo reglon se tiene

0 =

∣∣∣∣∣∣

a1 b1 c1a1 b1 c1a3 b3 c3

∣∣∣∣∣∣= −a1

∣∣∣∣b1 c1b3 c3

∣∣∣∣+ b1

∣∣∣∣a1 c1a3 c3

∣∣∣∣− c1∣∣∣∣a1 b1a3 b3

∣∣∣∣

= a1A2 + b1B2 + c1C2

lo que prueba la primer igualdad.

Las otras se prueban de forma analoga. B

OBSERVACION. Para cualquier escalar λ ∈ R se tiene que

C

∣∣∣∣∣∣

λa1 λb1 λc1a2 b2 c2a3 b3 c3

∣∣∣∣∣∣= λa1A1 + λb1B1 + λc1 = λ(a1A1 + b1B1 + c1C1)

= λ

∣∣∣∣∣∣

a1 b1 c1a2 b2 c2a3 b3 c3

∣∣∣∣∣∣B

Esto se resume en el siguiente resultado.

Page 28: Libro Mate 4

28 Sistemas de ecuaciones, matrices y determinantes

LEMA 1.4 Se puede sacar fuera del determinante un factor comun de loselementos de un renglon (o una columna).

OBSERVACION. Utilizando el Lema 1.4 con λ = 0, obtenemos,

C

∣∣∣∣∣∣

0 0 0a2 b2 c2a3 b3 c3

∣∣∣∣∣∣=

∣∣∣∣∣∣

0a1 0b1 0c1a2 b2 c3a3 b3 c3

∣∣∣∣∣∣= 0

∣∣∣∣∣∣

a1 b1 c1a3 b2 c2a3 b3 c3

∣∣∣∣∣∣= 0 B

lo que nos conduce al siguiente corolario.

COROLARIO 1.4 Si en un determinante un renglon (o una columna)tiene todos sus elementos cero, entonces su valor es cero.

OBSERVACION. Sea λ un numero real tal que a1 = λa2, b1 = λb2, c1 =λc2, entonces de acuerdo al Lema 1.4 y al corolario 1.4,

C

∣∣∣∣∣∣

a1 b1 c1a2 b2 c2a3 b3 c3

∣∣∣∣∣∣=

∣∣∣∣∣∣

λa2 λb2 λc2a2 b2 c2a3 b3 c3

∣∣∣∣∣∣= λ

∣∣∣∣∣∣

a2 b2 c2a2 b2 c2a3 b3 c3

∣∣∣∣∣∣= 0 B

Esto implica el siguiente corolario.

COROLARIO 1.5 Si en un determinante un renglon (o una columna)es proporcional a otro renglon (o a otra columna) entonces tal vale cero.

EJEMPLO. Al calcular el determinante∣∣∣∣∣∣

1 0 11 3 44 12 16

∣∣∣∣∣∣=

∣∣∣∣∣∣

1 0 11 3 4

4(1) 4(3) 4(4)

∣∣∣∣∣∣= 4

∣∣∣∣∣∣

1 0 11 3 41 3 4

∣∣∣∣∣∣= 4(0) = 0

en virtud que el ultimo determinante tiene dos renglones repetidos y seanula.

OBSERVACION. Sean λ1, β1, γ1 numeros reales arbitrarios, entonces

C

∣∣∣∣∣∣

a1 + λ1 b1 + β1 c1 + γ1a2 b2 c2a3 b3 c3

∣∣∣∣∣∣= (a1+λ1)A1+(b1+β1)B1+(c1+γ1)C1

= (a1A1 + b1B1 + c1C1) + (λ1A1 + β1B1 + γ1C1)

=

∣∣∣∣∣∣

a1 b1 c1a2 b2 c2a3 b3 c3

∣∣∣∣∣∣+

∣∣∣∣∣∣

λ1 β1 γ1a2 b2 c2a3 b3 c3

∣∣∣∣∣∣B

Resumimos la discusion previa en el siguiente:

Page 29: Libro Mate 4

1.4 Determinantes de orden tres 29

COROLARIO 1.6 Si en un determinante un renglon (o una columna)los elementos son sumas, entonces tal determinante puede ser descompuestocomo la suma de los determinantes de los sumandos correspondientes (res-petando factores).

EJEMPLO. Calcular el determinante∣∣∣∣∣∣

4 5 61 0 1−1 1 0

∣∣∣∣∣∣

C Claramente se puede descomponer en la siguiente cadena.

∣∣∣∣∣∣

4 5 61 0 11 1 0

∣∣∣∣∣∣=

∣∣∣∣∣∣

2 + 2 2 + 3 3 + 31 0 1−1 1 0

∣∣∣∣∣∣=

∣∣∣∣∣∣

2 2 31 0 1−1 1 0

∣∣∣∣∣∣+

∣∣∣∣∣∣

2 3 31 0 11 1 0

∣∣∣∣∣∣

=

(2

∣∣∣∣0 11 0

∣∣∣∣−∣∣∣∣2 31 0

∣∣∣∣− 1

∣∣∣∣2 31 0

∣∣∣∣)+

(−3∣∣∣∣

1 1−1 0

∣∣∣∣−∣∣∣∣2 31 1

∣∣∣∣)

= (2(−1) + 3− 2) + (3− (2− 3)) = (−1) + 4 = 3

donde los determinantes en la ultima suma se han calculado, el primerodesarrollando por la primer columna, y el segundo por su segunda columna.B

COROLARIO 1.7 El valor del determinante no cambia cuando a unrenglon (o una columna) se le agregan proporcionales de otro renglon (co-lumna) paralelo.

C Sea λ ∈ R un escalar arbitrario, entonces, ya que un determinantecon un renglon repetido es cero, tenemos que

C

∣∣∣∣∣∣

a1 b1 c1a2 b2 c2a3 b3 c3

∣∣∣∣∣∣=

∣∣∣∣∣∣

a1 b1 c1a2 b2 c2a3 b3 c3

∣∣∣∣∣∣± λ

∣∣∣∣∣∣

a2 b2 c2a2 b2 c2a3 b3 c3

∣∣∣∣∣∣=

∣∣∣∣∣∣

a1 b1 c1a2 b2 c2a3 b3 c3

∣∣∣∣∣∣+

∣∣∣∣∣∣

±λa2 ±λb2 ±λc2a2 b2 c2a3 b3 c3

∣∣∣∣∣∣=

=

∣∣∣∣∣∣

a1 ± λa2 b1 ± λb2 c1 ± λc2a2 b2 c2a3 b3 c3

∣∣∣∣∣∣B

Page 30: Libro Mate 4

30 Sistemas de ecuaciones, matrices y determinantes

Todas los resultados enunciados se llaman transformaciones elementa-les de los determinantes.

EJEMPLO. Calcular el determinante∣∣∣∣∣∣

1 2 32 1 23 2 1

∣∣∣∣∣∣

C Con arreglo al Colorario 1.7 esto se puede calcular por la cadena deigualdades

∣∣∣∣∣∣

1 2 32 1 23 2 1

∣∣∣∣∣∣=

∣∣∣∣∣∣

1 2 32− 2(1) 1− 2(2) 2− 2(3)3− 3(1) 2− 3(2) 1− 3(3)

∣∣∣∣∣∣

=

∣∣∣∣∣∣

1 2 30 −3 −40 −4 −8

∣∣∣∣∣∣= 1

∣∣∣∣−3 −4−4 −8

∣∣∣∣ = 24− 16 = 8 B

Estos resultados sobre transformaciones elementales de los determi-nantes se pueden generalizar para ordenes (dimensiones) mas grandes.Aquı hemos detallado la teorıa apenas para ordenes 2 y 3.

Tenemos el siguiente resultado para el calculo del del determinante deun producto de matrices cuadradas.

TEOREMA 1.4 (determinante de un producto) Sean A = A3×3,B = B3×3 dos matrices cuadradas de 3× 3, entonces

|AB| = |A||B|

Esto es, el determinante de un producto es el producto de los determinantes

C Es un calculo directo y omitimos su demostracion B

EJEMPLO. Sean las matrices

A =

1 2 32 3 13 1 2

, B =

1 2 30 3 10 1 2

verificar la igualdad |AB| = |A||B|.C En el anterior ejemplo se calcularon los determinantes

|A| =

∣∣∣∣∣∣

1 2 32 3 13 1 2

∣∣∣∣∣∣= −18, |B| =

∣∣∣∣∣∣

1 2 30 3 10 1 2

∣∣∣∣∣∣= 5

Page 31: Libro Mate 4

1.5 Inversa de una matriz 31

de donde |A||B| = (−18)(5) = −90Por otro lado,

AB =

1 2 32 3 13 1 2

1 2 30 3 10 1 2

=

1 11 112 14 113 11 14

cuyo determinante se calcula

|AB| =

∣∣∣∣∣∣

1 11 112 14 113 11 14

∣∣∣∣∣∣=

∣∣∣∣∣∣

1 11 112− 2(1) 14− 2(11) 11− 2(11)3− 3(1) 11− 3(11) 14− 3(11)

∣∣∣∣∣∣

=

∣∣∣∣∣∣

1 11 110 −8 −110 −22 −19

∣∣∣∣∣∣=

∣∣∣∣−8 −11−22 −19

∣∣∣∣ = 8(19)− 11(22) = 152− 242 = −90

que prueba la igualdad mencionada. B

1.5 Inversa de una matriz

Damos una forma de calcular la inversa de una matriz cuadrada de 2× 2,ası como una condicion necesaria y suficiente de su existencia.

Una matriz cuadrada

A = A2×2 =

(a bc d

)

es invertible si existe una matriz

B = B2×2 =

(x yz w

)

tal que I = AB = BA, donde

I =

(1 00 1

)

es la matriz identidad de 2× 2.

Se identifica B = A−1 y se llama matriz inversa de A.

TEOREMA 1.5 Si A = A2×2 es tal que |A| 6= 0, entonces A es invertible.

Page 32: Libro Mate 4

32 Sistemas de ecuaciones, matrices y determinantes

C Buscamos una matriz de 2× 2

B =

(x yz w

)

tal que I = BA, es decir, buscamos numeros reales x, y, z, w tales que(

1 00 1

)=

(x yz w

)(a bc d

)=

(ax+ cy bx+ dyaz + cw bz + dw

)

lo que nos lleva al sistema de ecuaciones lineales

ax+ cy = 1bx+ dy = 0az + cw = 0bz + dw = 1

Primeramente resolvemos , mediante el Lema 1.1, el sistema de 2× 2ax+ cy = 1bx+ dy = 0

donde tenemos por hipotesis que P = ad− bc 6= 0.

Al calcular los otros determinantes se obtiene

Dx =

∣∣∣∣1 c0 d

∣∣∣∣ = d

Dy =

∣∣∣∣a 1b 0

∣∣∣∣ = −b

lo que implica que

x =Dx

D=

d

ad− bc , y =Dy

D=

−bad− bc

En forma analoga, se obtienen las otras variables

z =c

bc− ad =−c

ad− bc , w =−a

bc− ad =a

ad− bc

De esta manera, A−1 la matriz inversa de A tiene coeficientes,

A−1 =

(d

ad−bc−b

ad−bc−c

ad−bca

ad−bc

)=

1

ad− bc

(d −b−c a

). B

EJEMPLO. Sea la matriz

A =

(2 11 1

)

Page 33: Libro Mate 4

1.6 La regla de Cramer 33

C Calculamos el determinante de A, obteniendo

|A| =∣∣∣∣2 11 1

∣∣∣∣ = 2− 1 = 1 6= 0

y por el teorema 1.5, A es invertible, y su inversa A−1se calcula

A−1 =1

1

(1 −1−1 2

)=

(1 −1−1 2

)

Verificamos esta afirmacion realizando el producto de las matrices

AA−1 =

(2 11 1

)(1 −1−1 2

)=

(1 00 1

)= I B

1.6 La regla de Cramer

En esta parte generalizamos el resultado sobre la solucion de un sistema deecuaciones lineales obtenido en el Lema 1.1, para sistemas lineales de tresecuaciones con tres incognitas.

Consideremos ahora el sistema de tres ecuaciones lineales con coefi-cientes reales con tres incognitas x, y, z

a1x+ b1y + c1z = d1a2x+ b2y + c2z = d2a3x+ b3y + c3z = d3

C Introducimos, de igual forma que para los sistemas lineales de 2× 2los determinantes

D =

∣∣∣∣∣∣

a1 b1 c1a2 b2 c2a3 b3 c3

∣∣∣∣∣∣= a1A1 + b1B1 + c1C1

Dx =

∣∣∣∣∣∣

d1 b1 c1d2 b2 c2d3 b3 c3

∣∣∣∣∣∣= d1A1 + d2A2 + d3A3

Dy =

∣∣∣∣∣∣

a1 d1 c1a2 d2 c2a3 d3 c3

∣∣∣∣∣∣

Dz =

∣∣∣∣∣∣

a1 b1 d1a2 b2 d2a3 b3 d3

∣∣∣∣∣∣

Page 34: Libro Mate 4

34 Sistemas de ecuaciones, matrices y determinantes

Si multiplicamos el primer renglon del sistema por A1, el segundorenglon del sistema por A2, el tercer renglon del sistema por A3, obte-nemos que

a1A1x+ b1A1y + c1A1z = d1A1

a2A2x+ b2A2y + c2A2z = d2A2

a3A3x+ b3A3y + c3A3z = d3A3

Ası, al sumar los miembros derechos e izquierdos respectivos se obtiene

(a1A1 + a2A2 + a3A3)x+ (b1A1 + b2A2 + b3A3)y + (c1A1 + c2A2 + c3A3)z

= d1A1 + d2A2 + d3A3

El colorario 1.3 implica que la anterior igualdad se escribe como

Dx+ 0y + 0z = Dx

De donde, si D 6= 0, entonces, al despejar x, se consigue el valor

x =Dx

D

De igual forma, podemos obtener y, z mediante un procedimiento simi-lar (suponiendo que D 6= 0),

y =Dy

D, z =

Dz

D

Resumimos la anterior discusion en el siguiente resultado.

TEOREMA 1.6 (Regla de Cramer) Para el sistema lineal de tresecuaciones con tres incognitas dado, se tiene una tripleta de solucionesdadas por las igualdades

x =Dx

D, y =

Dy

D, z =

Dz

D

suponiendo que D 6= 0.

EJEMPLO. Resolver, utilizando La regla de Cramer, el sistema de ecua-ciones

x+ 2y + 3z = 12x+ 3y + z = 03x+ y + 2y = 0

Page 35: Libro Mate 4

1.6 La regla de Cramer 35

C Calculamos los determinantes respectivos.

D =

∣∣∣∣∣∣

1 2 32 3 13 1 2

∣∣∣∣∣∣=

∣∣∣∣∣∣

1 2 32− 2(1) 3− 2(2) 1− 2(3)3− 3(1) 1− 3(2) 2− 3(3)

∣∣∣∣∣∣=

∣∣∣∣∣∣

1 2 30 −1 −50 −5 −7

∣∣∣∣∣∣

=

∣∣∣∣−1 −5−5 −7

∣∣∣∣ = 7− 25 = −18 6= 0

Dx =

∣∣∣∣∣∣

1 2 30 3 10 1 2

∣∣∣∣∣∣= 1

∣∣∣∣3 11 2

∣∣∣∣ = 6− 1 = 5

Dy =

∣∣∣∣∣∣

1 1 32 0 13 0 2

∣∣∣∣∣∣= −1

∣∣∣∣2 13 2

∣∣∣∣ = −1

Dz =

∣∣∣∣∣∣

1 2 12 3 03 1 0

∣∣∣∣∣∣= 1

∣∣∣∣2 33 1

∣∣∣∣ = −7

Por La regla de Cramer se obtiene finalmente que

x =Dx

D=

5

−18 y =Dy

D=−1−18 =

1

18z =

Dz

D=−7−18 =

7

18B

A continuacion, iniciamos el estudio de aquellos sistemas de ecuacionesde 3 × 3 (tres ecuaciones por tres incognitas ) donde el determinante delsistema se anula, pero se obtienen soluciones imponiendo una condicionadicional.

Consideremos el mismo sistema inicial

a1x+ b1y + c1z = d1a2x+ b2y + c2z = d2a3x+ b3y + c3z = d3

pero, supongase que en este caso el determinante principal se anula, estoes,

D =

∣∣∣∣∣∣

a1 b1 c1a2 b2 c2a3 b3 c3

∣∣∣∣∣∣= 0

Supongase, ademas, que el determinante tiene el menor de 2× 2

D = C3 =

∣∣∣∣a1 b1a2 b2

∣∣∣∣ 6= 0

Page 36: Libro Mate 4

36 Sistemas de ecuaciones, matrices y determinantes

Consideremos entonces el sistema de 2× 3 dado por las dos ecuacionesprimeras del sistema

(R) :

a1x+ b1y + c1z = d1a2x+ b2y + c2z = d2

Tomamos a la variable z como un parametro t, es decir, hacemos z = ty resolvemos el sistema de 2× 2

a1x+ b1y = d1 − c1ta2x+ b2y = d2 − c2t

mediante El metodo de Cramer, en virtud que el determinante principaldel sistema D = a1b2 − a2b1 no se anula, por hipotesis.

Calculemos los otros determinantes,

Dx =

∣∣∣∣d1 − c1t b1d2 − c2t b2

∣∣∣∣ =∣∣∣∣d1 b1d2 b2

∣∣∣∣+∣∣∣∣−c1 b1−c2 b2

∣∣∣∣ t

=

∣∣∣∣b1 c1b2 c2

∣∣∣∣ t+∣∣∣∣d1 b1d2 b2

∣∣∣∣ = A3t+

∣∣∣∣d1 b1d2 b2

∣∣∣∣

Dy =

∣∣∣∣a1 d1 − c1ta2 d2 − c2t

∣∣∣∣ =∣∣∣∣a1 d1a2 d2

∣∣∣∣+∣∣∣∣a1 −c1a2 −c2

∣∣∣∣ t−

=

∣∣∣∣a1 c1a2 c2

∣∣∣∣ t+∣∣∣∣a1 d1a2 d2

∣∣∣∣ = B3t+

∣∣∣∣a1 d1a2 d2

∣∣∣∣

de donde, por El metodo de Cramer, las soluciones de tal sistema (R)vienen dadas por

x = Dx

D =

A3t+

∣∣∣∣∣∣d1 b1d2 b2

∣∣∣∣∣∣D =

A3t+

∣∣∣∣∣∣d1 b1d2 b2

∣∣∣∣∣∣C3

y =Dy

D =

B3t+

∣∣∣∣∣∣a1 d1a2 d2

∣∣∣∣∣∣C3

z = t

Afirmamos que estas soluciones resuelven la tercera ecuacion tambiencuando el determinante

∣∣∣∣∣∣

a1 b1 d1a2 b2 d2a3 b3 d3

∣∣∣∣∣∣= 0.

Page 37: Libro Mate 4

1.6 La regla de Cramer 37

En efecto, al sustituir los valores de x, y y z, se tiene,

a3x+ b3y+ c3z = a3

A3t+

∣∣∣∣d1 b1d2 b2

∣∣∣∣C3

+ b3

B3t+

∣∣∣∣a1 d1a2 d2

∣∣∣∣C3

+ c3t

=a3A3t+ b3B3t+ c3C3t

C3+

a3

∣∣∣∣d1 b1d2 b2

∣∣∣∣+ b3

∣∣∣∣a1 d1a2 d2

∣∣∣∣C3

=Dt

C3+

a3

∣∣∣∣d1 b1d2 b2

∣∣∣∣+ b3

∣∣∣∣a1 d1a2 d2

∣∣∣∣− d3∣∣∣∣a1 b1a2 b2

∣∣∣∣C3

+

d3

∣∣∣∣a1 b1a2 b2

∣∣∣∣C3

= −

∣∣∣∣∣∣

a1 b1 d1a2 b2 d2a3 b3 d3

∣∣∣∣∣∣C3

+d3C3

C3= − 1

C3

∣∣∣∣∣∣

a1 b1 d1a2 b2 d2a3 b3 d3

∣∣∣∣∣∣+ d3 = d3.

El hecho de que ambos determinantes

D =

∣∣∣∣∣∣

a1 b1 c1a2 b2 c2a3 b3 c3

∣∣∣∣∣∣y

∣∣∣∣∣∣

a1 b1 d1a2 b2 d2a3 b3 d3

∣∣∣∣∣∣

se anulan, se entiende, segun el calculo anterior, de que el sistema inicial de3 × 3 es compatible. Para este caso, las soluciones de tal sistema vienendadas por la tripleta mencionada.

EJEMPLO. Resolver el sistema de ecuaciones

x+ y + z = 1x− y + 3z = −22x+ 4z = −1

C Calculamos primeramente el determinante principal

D =

∣∣∣∣∣∣

1 1 11 −1 32 0 4

∣∣∣∣∣∣= 2

∣∣∣∣1 1−1 3

∣∣∣∣+ 4

∣∣∣∣1 11 −1

∣∣∣∣ = 2(4) + 4(−2) = 0

luego verificamos que tiene el menor

D =

∣∣∣∣1 11 −1

∣∣∣∣ = −1− 1 = −2 6= 0.

Page 38: Libro Mate 4

38 Sistemas de ecuaciones, matrices y determinantes

Posteriormente, para verificar la compatibilidad del sistema calculamos(si se va a utilizar z = t como parametro) el determinante

∣∣∣∣∣∣

1 1 11 −1 −22 0 −1

∣∣∣∣∣∣= 2

∣∣∣∣1 1−1 −2

∣∣∣∣− 1

∣∣∣∣1 11 −1

∣∣∣∣ = 2(−1)− (−2) = 0.

Segun el metodo sugerido, consideramos el primer par de ecuaciones(donde D 6= 0) y hacemos z = t, obteniendo el sistema

x+ y = 1− tx− y = −2− 3t

que resolvemos por El metodo de Cramer.

Dx =

∣∣∣∣1− t 1−2− 3t −1

∣∣∣∣ =∣∣∣∣

1 1−2 −1

∣∣∣∣−∣∣∣∣t 13t −1

∣∣∣∣ = 1−(−t−3t) = 1+4t

Dy =

∣∣∣∣1 1− t1 −2− 3t

∣∣∣∣ = −2− 3t− (1− t) = −2− 3t− 1 + t = −3− 2t

De donde, las soluciones al sistema inicial son

x = Dx

D = 1+4t−2 = − 1

2 − 2t

y =Dy

D = −3−2t−2 = 3

t + t

z = t

donde t ∈ R es un numero real arbitrario. B

Lo anterior se puede resumir en el siguiente resultado.

LEMA 1.5 Para el sistema de ecuaciones lineales

a1x+ b1y + c1z = d1a2x+ b2y + c2z = d2a3x+ b3y + c3z = d3

que satisface las condiciones,

a. El determinante principal se anula:

D =

∣∣∣∣∣∣

a1 b1 c1a2 b2 c2a3 b3 c3

∣∣∣∣∣∣= 0

Page 39: Libro Mate 4

1.7 Sistemas lineales homogeneos 39

b. El menor (2× 2) de D,

C3 =

∣∣∣∣a1 b1a2 b2

∣∣∣∣ 6= 0

c. El determinante de compatibilidad se anula,

∣∣∣∣∣∣

a1 b1 d1a2 b2 d2a3 b3 d3

∣∣∣∣∣∣= 0

se tiene un sistema parametrizado de soluciones

x = A3t+

∣∣∣∣∣∣d1 b1d2 b2

∣∣∣∣∣∣C3

y = B3t+

∣∣∣∣∣∣a1 d1a2 b2

∣∣∣∣∣∣C3

z = t

donde t ∈ R es un numero real arbitrario.

Observamos que el metodo para resolver este tipo de ecuaciones de3× 3 consiste en ignorar la tercer ecuacion y resolver parametricamente elsistema inicial de 2 × 3. La tercer ecuacion se resuelve automaticamentecon las soluciones del sistema de 2 × 3, sabiendo que el determinante decompatibilidad se anula.

1.7 Sistemas lineales homogeneos

En esta seccion iniciamos el estudio de los sistemas de ecuaciones linealesque no tienen terminos independientes. A tales sistemas les llamaremoshomogeneos.

El procedimiento de solucion de estos sistemas sigue el patron de solu-cion de los sistemas lineales en el Lema 1.5.

Considerese el problema por resolver del sistema homogeneo de 2× 2

3x+ 2y = 012x+ 8y = 0

Es claro que cuando x = 0, y = 0 se tiene una solucion del sistema,llamada la solucion trivial.

Page 40: Libro Mate 4

40 Sistemas de ecuaciones, matrices y determinantes

Al tratar de utilizar La regla de Cramer (Lema 1.1) no tiene sentido talregla, pues

D =

∣∣∣∣3 212 8

∣∣∣∣ = 24− 24 = 0

Procedemos entonces a ignorar una de las ecuaciones y nos quedamos,con la primera, por ejemplo,

3x+ 2y = 0

Al despejar y, obtenemos

y =−32x

Sea t ∈ R arbitrario y pongamos x = t, entonces y = −32 t.

Afirmamos que estos valores de x y y (en terminos de t ) tambienresuelven la otra ecuacion.

C En efecto, por una simple sustitucion se tiene

12x+ 8y = 12t+ 8

(−32t

)= 12t− 12t = 0 B

El metodo utilizado en este ejemplo se puede generalizar para cualquiersistema (2× 2)

ax+ by = 0cx+ dy = 0

donde ad− bc = 0.

Consideremos ahora el sistema homogeneo de dos ecuaciones linealescon tres incognitas

a1x+ b1y + c1z = 0a2x+ b2y + c2z = 0

Una simple sustitucion prueba que x = y = z = 0 es una solucion de talsistema (solucion trivial). Nos interesa encontrar soluciones no trivialesdel sistema.

Para ello, supongamos sin perdida de generalidad que z 6= 0. Entonces,del sistema

a1x+ b1y + c1z = 0a2x+ b2y + c2z = 0

se obtiene a1x+ b1y = −c1za2x+ b1y = −c2z

Page 41: Libro Mate 4

1.7 Sistemas lineales homogeneos 41

o equivalentemente, a1x+b1y

z = −c1a2x+b2y

z = −c2o bien,

a1(xz

)+ b1

(yz

)= −c1

a2(xz

)+ b2

(yz

)= −c2

Poniendo v = xz , w = y

z se obtienea1v + b1 w = −c1a2v + b2 w = −c2

que se resuelve por determinantes si D = a1b2 − a2b1 6= 0.

C Primeramente encontramos

(a1 b1 −c1a2 b2 −c2

)

la matriz principal del sistema. Despues, calculamos los determinantesasociados

Dv =

∣∣∣∣−c1 b1−c2 b2

∣∣∣∣ = −c1b2 + b1c2,

Dw =

∣∣∣∣a1 −c1a2 −c2

∣∣∣∣ = −a1c2 + c1a2

Ya que v = Dv

D , w = Dw

D tenemos entonces que

x

z=Dv

D,

y

z=Dw

D

Por lo tanto, para que x, y, z sean soluciones del sistema, se deberacumplir la cadena de igualdades

t =x

Dv=

z

D=

y

Dw

para t ∈ R. B

Se obtiene el siguiente resultado.

LEMA 1.6 Todas las soluciones del sistema lineal homogeneo se obtienenpor

x = Dvt = A3ty = Dwt = B3tz = Dt = C3t

donde t ∈ R, y

D =

∣∣∣∣a1 b1a2 b2

∣∣∣∣ 6= 0, Dv =

∣∣∣∣−c1 b1−c2 b2

∣∣∣∣ , Dw =

∣∣∣∣a1 −c1a2 −c2

∣∣∣∣

Page 42: Libro Mate 4

42 Sistemas de ecuaciones, matrices y determinantes

EJEMPLO. Resolver el sistema lineal homogeneo

x −2y +3z = 04x +5y −6z = 0

C Formamos la matriz del sistema(

1 −2 −34 5 6

)

y calculamos a que los determinantes asociados,

D =

∣∣∣∣1 −24 5

∣∣∣∣ = 5 + 8 = 13

Dv =

∣∣∣∣−3 −26 5

∣∣∣∣ = −15 + 12 = −3

Dw =

∣∣∣∣1 −34 6

∣∣∣∣ = 6 + 12 = 18

De esta manera, la solucion se escribe

x = −3ty = 18tz = 13t

, t ∈ R

Para ilustrar, si t = 1, entonces x = −3, y = 18, z = 13 es solucion delsistema de ecuaciones.

Si t =√2, se tendrıa en este caso que la tripleta x = −3

√2, y =

18√2, z = 13

√2 resuelve tal sistema. B

Consideremos ahora el sistema homogeneo de 3× 3

a1x+ b1y + c1z = 0a2x+ b2y + c2z = 0a3x+ b3y + c3z = 0

donde claramente x = y = z = 0 es una solucion trivial del sistema.

Nos interesa el caso cuando tal sistema tiene soluciones no triviales.Procedemos a buscar tales soluciones no triviales mediante el metodo uti-lizado para resolver, sistemas lineales en el Lema 1.5.

C Habıamos obtenido las ecuaciones

Dx = Dx, Dy = Dy Dz = Dz

en la discusion del Metodo de Cramer (Teorema 1.6).

Page 43: Libro Mate 4

1.7 Sistemas lineales homogeneos 43

Para este caso

Dx =

∣∣∣∣∣∣

0 b1 c10 b2 c20 b3 c3

∣∣∣∣∣∣= 0, Dy = 0, Dz = 0

lo que implica que

Dx = 0, Dy = 0, Dz = 0

De aquı que, si al menos una de las variables x, y o z es diferente de cerotendrıamos necesariamente que D = 0.

Recıprocamente si D = 0 entonces alguna de las variables x, y o zpueden ser diferentes de cero. B

Se obtiene entonces el siguiente resultado.

TEOREMA 1.7 Para que un sistema lineal homogeneo de 3 × 3 tengasoluciones no triviales es necesario y suficiente que D = 0.

Ahora supongamos que D = 0 y que hay un menor 2×2 de D diferentede cero. Esto es, podemos suponer que

0 = D =

∣∣∣∣∣∣

a1 b1 c1a2 b2 c2a3 b3 c3

∣∣∣∣∣∣y

∣∣∣∣a1 b1a2 b2

∣∣∣∣ 6= 0

sin perdida de generalidad.Por el Lema 1.5 el sistema homogeneo tiene solucion debido a que el

determinante de compatibilidad se anula, pues d1 = d2 = d3 = 0

Por otro lado, del Lema 1.6, se tiene que el sistema homogeneo dadopor el par de ecuaciones

a1x+ b1y + c1z = 0a2x+ b2y + c2z = 0

tiene solucion

x =

∣∣∣∣b1 c1b2 c2

∣∣∣∣ t = A3t,

y = −∣∣∣∣a1 c1a2 c2

∣∣∣∣ t = B3t

z =

∣∣∣∣a1 b1a2 b2

∣∣∣∣ t = C3t

Afirmamos que x, y, z soluciones de este sistema resuelven la terceraecuacion.

Page 44: Libro Mate 4

44 Sistemas de ecuaciones, matrices y determinantes

En efecto, al sustituir los valores de x, y, z se cumplea3x+ b3y + c3z = a3(A3t) + b3(B3t) + c3(C3t) =

= (a3A3 + b3B3 + c3C3)t = Dt = 0debido a que D = 0 por hipotesis.Por lo tanto,

x = A3t y = B3t z = C3t

para t ∈ R arbitrario resuelven el sistema lineal homogeneo de 3× 3. B

EJEMPLO. Consideremos el sistema

x+ 2y − 3z = 02x− y + z = 03x+ y − 2z = 0

C Ya que el tercer renglon de la matriz asociada es la suma de los dosprimeros tenemos que

∣∣∣∣∣∣

1 2 −32 −1 13 1 −2

∣∣∣∣∣∣=

∣∣∣∣∣∣

1 2 −32 −1 1

1 + 2 2− 1 −3 + 1

∣∣∣∣∣∣=

=

∣∣∣∣∣∣

1 2 −32 −1 11 2 −3

∣∣∣∣∣∣+

∣∣∣∣∣∣

1 2 −32 −1 12 −1 1

∣∣∣∣∣∣= 0

pues en cada determinante se repiten renglones.

Por otro lado, el menor∣∣∣∣1 22 −1

∣∣∣∣ = −1− 4 = −5 6= 0,

lo que nos dice que para encontrar la solucion, podemos considerar el parde ecuaciones

x+ 2y − 3z = 02x− y + z = 0

Utilizando el Lema 1.4 se tiene que

x = A3t =

∣∣∣∣2 −3−1 1

∣∣∣∣ t = (2− 3)t = −t

y = B3t = −∣∣∣∣1 −32 1

∣∣∣∣ t = −(1 + 6) = −7t

z = C3t =

∣∣∣∣1 22 −1

∣∣∣∣ t = −5t

Page 45: Libro Mate 4

1.8 El metodo de Gauss-Jordan 45

es decir, la solucion del sistema viene dado por la tripleta

x = −ty = −7tz = −5t

,

donde t ∈ R es un numero arbitrario. B

1.8 El metodo de Gauss-Jordan

En esta parte damos , otra metodologıa para resolver sistemas de ecuacioneslineales, utilizando propiedades aritmeticas de las matrices con entradasreales. Como se observara, este metodo no apela en ningun momento alos determinantes menores del sistema, ni al orden mismo del sistema, esdecir, el numero de ecuaciones puede ser arbitrario, ası como el numero deincognitas que intervienen en el sistema.

EJEMPLO. Resolver el sistema de ecuaciones

3x+ 2y + z = 5x+ y − z = 0

4x− y + 5z = 3

C Primeramente cambiamos el orden del sistema intercambiando lasprimeras ecuaciones

x+ y − z = 03x+ 2y + z = 54x− y + 5z = 3

Multiplicamos por tres la primera y la restamos de la segunda

3x+ 2y + z = 53x+ 3y − 3z = 0

−y + 4y = 5

obteniendo el par de ecuacionesx+ y − z = 0−y + 4z = 5

Despues, multiplicamos por la cuatro la primera del sistema inicial y larestamos de la tercera del mismo

4x− y + 5z = 34x+ 4y − 4z = 0

−5y + 9z = 3

Page 46: Libro Mate 4

46 Sistemas de ecuaciones, matrices y determinantes

obteniendo ası el sistemax+ y − z = 0−5y + 9z = 3

De esta manera, hemos obtenido el sistema nuevo 3× 3

x+ y − z = 0−y + 4z = 5−5y + 9z = 3

en la cual la variable x no aparece en las ecuaciones segunda y tercera.

De este, omitimos la primera y resolvemos el sistema 2× 2−y + 4z = 5−5y + 9z = 3

que tiene solo a las variables x, y.

Si multiplicamos por cinco la primer ecuacion de este sistema y la resta-mos de la segunda obtenemos

−5y + 9z = 3−5y + 20z = 25

0− 11z = −22

De esta forma, nos queda entonces el sistema escalonado

x+ y − z = 0−y + 4z = 5−11z = −22

cuyo numero de variables va disminuyendo en cada ecuacion.

Resolviendo la tercera ecuacion final para z,

−11z = −22

se obtiene que

z =−22−11 = 2

Al sustituir en la segunda ecuacion escalonada el valor de z, se tieneque

5 = −y + 4z = −y + 4(2) = y + 8

de donde,y = 8− 5 = 3

Page 47: Libro Mate 4

1.8 El metodo de Gauss-Jordan 47

Finalmente, se sustituyen los valores y = 3, z = 2 en la ecuacion primeradel sistema escalonado y se obtiene,

0 = x+ y − z = x+ 3− 2 = x+ 1

lo que nos lleva a que x = −1Es decir, x = −1, y = 3, z = 2 resuelven el sistema inicial. B

OBSERVACION. Si del sistema inicial se crea la matriz principal

3 2 1 51 1 −1 04 −1 5 3

donde la ultima columna esta formada por los elementos independientesdel sistema, tal proceso se logra tambien escalonando tal matriz medianteoperaciones elementales (como en los determinantes)

C

3 2 1 51 1 −1 04 −1 5 3

R1 → R2, R2 → R1

1 1 −1 03 2 1 54 −1 5 3

(3R1 −R2)→ R2, (4R1 −R3)→ R3

1 1 −1 00 1 −4 −50 5 −9 −3

(5R2 −R3)→ R3

1 1 −1 00 1 −4 −50 0 −11 −22

Donde las expresiones R1 → R2, R2 → R1 definen la operacion elemen-tal de intercambiar los renglones primero y segundo en la primera equiva-lencia de matrices. La operacion de multiplicar por tres el primer renglony restarle el segundo para asignarlo al segundo rengon en la segunda equi-valencia de matrices, se define por (3R1 − R2) → R2. Analogamente, laexpresion (4R1−R3)→ R3 para la segunda equivalencia de matrices definela operacion de multiplicar por cuatro el reglon primero, restarle el tercero,y asignar el resultado a la nueva matriz equivalente como un tercer renglon.Las otras expresiones designan operaciones semejantes.

De la matriz escalonada se tiene el nuevo sistema

x+ y − z = 0y − 4z = −5−11z = −22

Page 48: Libro Mate 4

48 Sistemas de ecuaciones, matrices y determinantes

que se resuelve hacia atras como en el ejemplo anterior. B

EJEMPLO. Resolver el sistema lineal (5× 3),

x+ 2y + 3z = 143x+ 2y + z = 10x+ y + z = 6

2x+ 3y + z = 5x+ y = 3

C Vamos a utilizar el mismo metodo que en el ejemplo anterior, y paraello formamos la matriz del sistema.

1 2 3 143 2 1 101 1 1 62 3 1 51 1 0 3

R3 → R2, R5 → R3R2 → R5

1 2 3 141 1 1 61 1 0 32 3 1 53 2 1 10

(R2 −R1)→ R2, (R3 −R1)→ R3,

(2R1 −R4)→ R4 (3R1 −R5)→ R5

1 2 3 140 −1 −2 −80 −1 −3 −110 1 5 230 4 8 32

(R2 −R3)→ R3, (R2 +R4)→ R4,(4R2 +R5)→ R5

1 2 3 140 −1 −2 −80 0 1 30 0 3 150 0 0 0

(3R3 −R4)→ R4

1 2 3 141 −1 −2 −80 0 1 30 0 0 10 0 0 0

Como se obtiene la ecuacion (inconsistente) del cuarto renglon final

0 = 0x+ 0y + 0z = 1

Page 49: Libro Mate 4

1.8 El metodo de Gauss-Jordan 49

el sistema no es compatible y, por lo tanto, el sistema inicial de 5× 3 notiene solucion. B

EJEMPLO. Resolver el sistema de ecuaciones lineales (5× 3)

x+ 2y + 3z = 143x+ 2y + z = 10x+ y + z = 6

2x+ 3y − z = 5x+ y = 3

que se obtiene del sistema del ejemplo anterior al cambiar apenas el signode z en la cuarta ecuacion.

C Formamos la matriz del sistema y utilizamos el metodo anterior paraescalonar la matriz, como se muestra

1 2 3 143 2 1 101 1 1 62 3 −1 51 1 0 3

R2 ←→ R5,

1 2 3 141 1 0 31 1 1 62 3 −1 53 2 1 10

(R1 −R2)→ R2, (R1 −R3)→ R3,

(2R1 −R4)→ R4, (3R1 −R5)→ R5

1 2 3 140 1 3 110 1 2 80 1 7 230 4 8 32

(R2−R3)→ R3, (R2−R4)→ R4, (4R2−R5)→ R5

1 2 3 140 1 3 110 0 1 30 0 −4 −120 0 4 12

(R4 +R5)→ R5

1 2 3 140 1 3 110 0 1 30 0 −4 −120 0 0 0

(4R3 +R4)→ R4

Page 50: Libro Mate 4

50 Sistemas de ecuaciones, matrices y determinantes

1 2 3 140 1 3 110 0 1 30 0 0 00 0 0 0

que nos lleva al sistema escalonado de 3× 3,

x+ 2y + 3z = 14y + 3z = 11

z = 3

y el cual de inmediato nos da el valor de z.Al sustituir el valor de z en la segunda ecuacion, se tiene

y + 3(3) = 11

de donde, y = 2.Finalmente, si se sustituyen estos valores en la primer ecuacion de este

sistema ultimo se tiene

14 = x+ 2(2) + 3(3) = x+ 13

con lo que x = 1.

Por lo tanto, la solucion del sistema inicial de 5× 3 viene dado por

x = 1, y = 2, z = 3 B

Al metodo mostrado en los ejemplos precedentes se le llama El metodode Gauss-Jordan para la solucion de un sistema de ecuaciones de (m×n).Tal metodo consiste en escalonar mediante operaciones elementales auna matriz para obtener una matriz equivalente que defina un sistema deecuaciones lo mas simple posible.

EJEMPLO. Resolver mediante El metodo de Gauss-Jordan el sistema deecuaciones

x+ 5y + 4z + 3w = 12x− y + 2z − w = 05x+ 3y + 8z + w = 1

C La matriz del sistema se escalona mediante el siguiente proceso:

1 5 4 3 12 −1 2 −1 05 3 8 1 1

(2R1 −R2)→ R2, (5R1 −R3)→ R3

Page 51: Libro Mate 4

1.8 El metodo de Gauss-Jordan 51

1 5 4 3 12 11 6 7 110 22 12 14 4

(2R2 −R3)→ R3

1 5 4 3 10 −11 6 7 20 0 0 0 0

Esta ultima matriz define al nuevo sistema de 2× 4x+ 5y + 4z + 3w = 1−11y + 6z + 7w = 2

Resolvemos tal sistema por El metodo de Cramer, al efectuar el despejede terminos en las variables x, y.

x+ 5y = 1− (4z + 3w)11y = 2− (6z + 7w)

Primeramente, calculamos los determinantes

D =

∣∣∣∣1 50 11

∣∣∣∣ = 11

Dx =

∣∣∣∣1− (4z + 3w) 52− (6z + 7w) 11

∣∣∣∣

= 11[1− (4z + 3w)]− 5[2− (6z + 7w)]

= 1− 14z + 2w

Dy =

∣∣∣∣1 1− (4z + 3w)0 2− (6z + 7w)

∣∣∣∣ = 2− 6z − 7w

Por lo tanto,

x =Dx

D=

1− 14z + 2w

11=

1

11− 14

11z +

2

11w

y =Dy

D=

2− 6z − 7w

11=

2

11− 6

11z − 7

11w

Para dar una solucion parametrica al sistema, utilizamos dos varia-bles auxiliares poniendo: w = u, z = v, lo que nos lleva a que la solucionbiparametrica se escriba

w = uz = v

x = 111 − 14

11v +211u

y = 211 − 6

11v − 711u

B

Page 52: Libro Mate 4

52 Sistemas de ecuaciones, matrices y determinantes

El metodo de Gauss-Jordan involucra el concepto de matrices seme-jantes.

DEFINICION. Sea A = (aij) una matriz real de (n×m), por una ope-racion elemental en A entendemos la suma en alguno de sus renglones(columnas) de un multiplo de un renglon paralelo (o columna paralela),un intercambio de renglones (o de columnas), o suponiendo que ningunrenglon (o columna) se multiplico por un escalar el producto de un renglon(o columna por un escalar).

EJEMPLO. En la matriz

1 5 4 3 12 −1 2 −1 05 3 8 1 1

se multiplica el primer renglon por dos y se resta al segundo renglon asig-nando el resultado al segundo renglon definido por (2R1−R2)→ R2, paraobtener la matriz

1 5 4 3 10 9 6 5 25 3 8 1 1

como en el ejemplo precedente.

Los ejemplos anteriores que muestran El metodo de Gauss-Jordan ilus-tran un buen numero de operaciones elementales en las matrices.

DEFINICION. Dos matrices del mismo orden (m × n) se dicen ser se-mejantes si una se obtiene de la otra por un numero finito de operacioneselementales.

Cuando una matriz cuadrada A = An×n es semejante a otra matrizB = Bn×n, suponiendo que ningun renglon (o columna) se multiplico porun escalar, el corolario 1.7 implica el siguiente resultado.

LEMA 1.7 Si A es semejante (como se menciono) a B, entonces susdeterminantes difieren apenas por un signo.

C Esto se sigue de que pudo haber intercambio de renglones. B

De aquı se obtiene el siguiente resultado.

COROLARIO 1.8 Si A es semejante (como se menciono) a B y en lasoperaciones elementales no hay intercambio de renglones, entonces, susdeterminantes coinciden, esto es,

|A| = |B|

Page 53: Libro Mate 4

1.8 El metodo de Gauss-Jordan 53

EJEMPLO. Consideremos la matriz

A =

1 2 32 1 23 2 1

C Despues de las operaciones elementales siguientes, se tiene

A =

1 2 32 1 23 2 1

(2R1 −R2)→ R2, (3R1 → R3)→ R3

1 2 30 3 40 4 8

Con lo que

∣∣∣∣∣∣

1 2 32 1 23 2 1

∣∣∣∣∣∣=

∣∣∣∣∣∣

1 2 30 3 40 4 8

∣∣∣∣∣∣=

∣∣∣∣4 83 2

∣∣∣∣ = 24− 16 = 8

Esto ya se ha calculado en ejemplo posterior al corolario 1.7 mediantela cadena de igualdades

∣∣∣∣∣∣

1 2 32 1 23 2 1

∣∣∣∣∣∣=

∣∣∣∣∣∣

1 2 32− 2(1) 1− 2(2) 2− 2(3)3− 3(1) 2− 3(2) 1− 3(3)

∣∣∣∣∣∣=

∣∣∣∣∣∣

1 2 30 −3 −40 −4 −8

∣∣∣∣∣∣

=

∣∣∣∣−3 −4−4 −8

∣∣∣∣ =∣∣∣∣3 44 8

∣∣∣∣ = 24− 16 = 8

Estas igualdades involucran (salvo signos) a las matrices semejantes,donde no se ha alterado por factor alguno a los renglones, ni se han per-mutado. B

Utilizando El metodo de Gauss-Jordan para escalonar una matriz, pro-cedemos a encontrar un metodo del calculo de inversa multiplicativa de unamatriz cuadrada, cuando es posible.

Consideremos un sistema de ecuaciones de (3× 3)

a1x+ b1y + c1z = d1a2x+ b2y + c2z = d2a3x+ b3y + c3z = d3

Page 54: Libro Mate 4

54 Sistemas de ecuaciones, matrices y determinantes

Debido a la regla de multiplicacion de matrices, tal sistema se puedeescribir matricialmente como

a1 b1 c1a2 b2 c2a3 b3 c3

xyz

=

d1d2d3

Esto es, si definimos por

A =

a1 b1 c1a2 b2 c2a3 b3 c3

, X =

xyz

, d =

d1d2d3

lo anterior se escribirıa simplemente por la ecuacion matricial

AX = d

Ası, el sistema de ecuaciones inicial se transforma en la ecuacion matri-cial mencionada.

EJEMPLO. Considere el sistema de ecuaciones lineales

2x+ 3y − z = −16x− 7z + 2z = 04x+ y − 11z = −2

C Este sistema se puede escribir como la ecuacion matricial

2 3 −16 −7 24 1 −11

xyz

=

−102

B

Consideremos entonces un sistema matricial

AX = d

asociado a un sistema de ecuaciones, donde A es una matriz cuadrada de3× 3.

Si existiera una matriz inversa B de A, esto es, una matriz B tal que

I = AB = BA

entonces del sistema matricial se obtiene, al multiplicar por B la izquierdade cada miembro, la relacion

BAX = Bd

Page 55: Libro Mate 4

1.8 El metodo de Gauss-Jordan 55

Esto nos lleva, en virtud que BA = I, a que se cumpla la igualdad

IX = Bd.

Por otro lado, la matriz identidad I satisface que

IX =

1 0 00 1 00 0 1

xyz

=

xyz

= X

lo que nos lleva finalmente a la ecuacion matricial

X = Bd

que indica los valores de x, y, z que resuelven el sistema lineal dado. Estopues, si la matriz B se escribe por

B =

α1 β1 γ1α2 β2 γ2α3 β3 γ3

entonces la ecuacion matricial X = Bd que resuelve el sistema se escribecomo

xyz

=

α1 β1 γ1α2 β2 γ2α3 β3 γ3

d1d2d3

=

α1d1 + β1d2 + γ1d3α2d1 + β2d2 + γ2d3α3d1 + β3d2 + γ3d3

o equivalentemente,

x = α1d1 + β1d2 + γ1d3y = α2d1 + β2d2 + γ2d3z = α3d1 + β3d2 + γ3d3

Esta metodologıa de solucion de un sistema de (3 × 3) nos conduceal problema de calcular la matriz inversa B de la matriz principal delsistema A, en caso de que tal matriz inversa exista. Una condicion deexistencia de la matriz B se obtiene a traves de la generalizacion naturaldel teorema 1.6 para el caso de matrices 3× 3.

TEOREMA 1.8 Si A = A3×3 es tal que su determinante no se anula:|A| 6= 0, entonces A es invertible. Esto es, existe una matriz B = B3×3 talque AB = I = BA, donde I es la matriz identidad de 3× 3.

Page 56: Libro Mate 4

56 Sistemas de ecuaciones, matrices y determinantes

EJEMPLO. Considere la matriz

A =

1 2 32 5 31 0 8

C Un calculo directo nos muestra que

|A| =

∣∣∣∣∣∣

1 2 12 5 31 0 8

∣∣∣∣∣∣=

∣∣∣∣2 35 3

∣∣∣∣+ 8

∣∣∣∣1 22 5

∣∣∣∣ = −9 + 8(1) = −1

lo que nos dice que A es una matriz invertible B

EJEMPLO. Considere la matriz

A =

1 6 42 4 −1−1 2 5

C Al calcular su determinante mediante operaciones elementales se tiene∣∣∣∣∣∣

1 6 42 4 −1−1 2 5

∣∣∣∣∣∣=

∣∣∣∣∣∣

1 6 40 8 90 8 9

∣∣∣∣∣∣= 0

lo que hace que A no sea una matriz invertible. B

Analicemos por un momento el sistema matricial asociado al sistema deecuaciones

AX = d

y la ecuacion matricial de soluciones

X = Bd

Estas podrıan escribirse por la parejaAX = IdIX = Bd

donde I es la matriz identidad de 3× 3.

Un procedimiento general del Metodo de Gauss-Jordan para resolver elsistema nos llevarıa a considerar la matriz siguiente de 3× 6

M =

a1 b1 c1 1 0 0a2 b2 c2 0 1 0a3 b3 c3 0 0 1

Page 57: Libro Mate 4

1.8 El metodo de Gauss-Jordan 57

y mediante operaciones elementales llevarla (segun la segunda ecuacionmatricial) a la matriz de 3× 6:

N =

1 0 0 α1 β1 γ10 1 0 α2 β2 γ20 0 1 α3 β3 γ3

que resolverıa el sistema de ecuaciones dado.

En otras palabras, dada una matriz A3×3 que se pueda invertir, el pro-ceso de llevar a la matriz M en la matriz N mediante operaciones elemen-tales nos permite calcular la matriz inversa B de A, cuando se considera lasubmatriz 3× 3 de N que se conforma desde la cuarta columna:

B =

α1 β1 γ1α2 β2 γ2α3 β3 γ3

Este metodo nos permite entonces calcular la inversa de una matrizcuadrada si es invertible. En el caso de que no sea invertible la matrizinicial, el metodo mismo nos lleva a un absurdo durante los calculos de lasoperaciones elementales. Esto se ilustra en los siguientes ejemplos.

EJEMPLO. Calcular la inversa de la matriz

A =

1 2 32 5 31 0 8

C Ya hemos calculado |A| = −1, lo que indica que A es invertible.

Construimos la matriz de Gauss-Jordan y procedemos a realizar opera-ciones elementales.

1 2 3 1 0 02 5 3 0 1 01 0 8 0 0 1

(2R1 −R2)→ R2, (R1 −R3)→ R3

1 2 3 1 0 00 −1 3 2 −1 00 2 −5 1 0 −1

(−R2)→ R2

1 2 3 1 0 00 1 −3 −2 1 00 2 −5 1 0 −1

(2R2 −R3)→ R3

Page 58: Libro Mate 4

58 Sistemas de ecuaciones, matrices y determinantes

1 2 3 1 0 00 1 −3 −2 1 00 0 −1 −5 2 1

(−R3)→ R3

1 2 3 1 0 00 1 −3 −2 1 00 0 1 5 −2 −1

(3R3 +R2)→ R2, (3R3 −R1)→ R1

1 −2 0 14 −6 −30 1 0 13 −5 −30 0 1 5 −2 −1

(2R2 +R1)→ R1

−1 0 0 40 −16 −90 1 0 13 −5 −30 0 1 5 −2 −1

(−R1)→ R1

1 0 0 −40 16 90 1 0 13 −5 −30 0 1 5 −2 −1

Esto implica que la matriz inversa A−1 de matriz dada A es

A−1 =

−40 16 913 −5 −35 −2 −1

Dejamos al lector verificar que a−1A = I B

Este procedimiento sirve tambien para calcular inversas de matrices de2× 2, como lo ilustra el siguiente ejemplo.

EJEMPLO. Sea A la matriz de 2× 2 dada por

A =

(2 11 1

)

C Ya hemos calculado su determinante, obteniendo |A| = 1, lo que lehace una matriz invertible.

Construimos la matriz de Gauss-Jordan y le aplicamos operaciones ele-mentales para calcular A−1:

(2 1 1 01 1 0 1

)R1 ↔ R2

∼(

1 1 0 12 1 1 0

)(2R1 −R2)→ R2

Page 59: Libro Mate 4

1.8 El metodo de Gauss-Jordan 59

∼(

1 1 0 10 1 −1 2

)(R2 −R1)→ R1

∼(−1 0 −1 10 1 −1 2

)(−R1)→ R1

∼(

1 0 1 −10 1 −1 2

)

Esto nos dice que la matriz inversa de A es

A−1 =

(1 −1−1 2

)B

EJEMPLO. Consideremos la matriz

A =

1 6 42 4 −1−1 2 5

C Ya hemos calculado |A| = 0, lo que nos dice que A no es una matrizinvertible.

Usemos El metodo de Gauss-Jordan para tratar de conseguir una in-versa de A.

1 6 4 1 0 02 4 −1 0 1 0−1 2 5 0 0 1

(2R1 −R2)→ R2, (R1 +R3)→ R3

1 6 4 1 0 00 8 9 2 −1 00 8 9 1 0 1

(R2 −R3)→ R3

1 6 4 1 0 00 8 9 1 0 00 0 0 1 −1 −1

Ya que el renglon tercero de esta ultima matriz tiene ceros en sus tresprimeros lugares, no es posible conseguir en adelante una matriz de forma

1 α1 β1 a1 b1 c10 1 β2 a2 b2 c20 0 1 a3 b3 c3

que nos permita continuar el proceso.

De aquı que el mismo Metodo de Gauss-Jordan pone obstrucciones porsı mismo para calcular una inversa de A, si es que A no es invertible. B

Page 60: Libro Mate 4

60 Sistemas de ecuaciones, matrices y determinantes

Ejercicios.

1. Dadas las matrices

A =

−1 0 1 3−2 1 0 −10 1 −1 2

3×4

, B =

4 5 3 2 11 3 4 0 −1−2 0 3 1 0

3×4

Realizar las operaciones matriciales A−B, B−A, 2A,−6B, 2A−3B, (A+B)t, At − 2Bt, Bt − 2At, At + 1

2Bt.

2. Dadas las matrices

C =

1 −1 0−2 0 10 1 2

3×3

,

(3 1 23 −1 1

)

3×3, E =

1 −12 10 1

3×2

a. Calcular C2, C3, DC,CDt, DE,ED, (DE)2, (ED)2.b. Si A y B son como el ejercicio 1, calcular CA,AtC,DCA,DCB.

3. Calcular, usando el teorema 1.5, la inversa de la matriz indicada.

A =

(3 −11 0

), B =

(4 20 3

)C =

1 0 00 2 10 1 1

,

4. Calcular los siguientes determinantes

a.Mediante la segunda columna,

∣∣∣∣∣∣

2 1 10 3 14 −1 1

∣∣∣∣∣∣

b.Mediante el tercer renglon.

∣∣∣∣∣∣

3 −1 01 2 −10 4 3

∣∣∣∣∣∣

c.Mediante la primera columna.

∣∣∣∣∣∣

0 −1 14 3 21 6 3

∣∣∣∣∣∣

d.Mediante la primera columna.

∣∣∣∣∣∣

1 0 00 cosϕ − sinϕ0 sinϕ cosϕ

∣∣∣∣∣∣

Page 61: Libro Mate 4

1.8 El metodo de Gauss-Jordan 61

donde ϕ es un angulo arbitrario.

e.

∣∣∣∣∣∣

2 3 42 a+ 3 b+ 42 c+ 3 d+ 4

∣∣∣∣∣∣f .

∣∣∣∣∣∣

1 x x2

1 y y2

1 z z2

∣∣∣∣∣∣g.

∣∣∣∣∣∣

λ1 0 00 λ2 00 0 λ3

∣∣∣∣∣∣

h.

∣∣∣∣∣∣

λ1 1 00 λ2 10 0 λ2

∣∣∣∣∣∣

5. Un numero real λ se llamara un valor propio de la matriz cuadradaA3×3(o A2×2) si satisface la ecuacion caracterıstica

det(A− λI) = 0

donde I es la matriz identidad. Calcular los valores propios de las siguientesmatrices

a.

(2 11 1

)b.

(1 −12 1

)c.

1 0 00 2 10 0 3

6. Calcular los determinantes de las matrices dadas.

a.

−1 2 42 −1 03 2 1

b.

1 6 9−1 0 00 1 1

c.

4 0 0−3 1 08 14 1

d.

1− t2 1 t0 t3 11 2 + t t2

e.

et 2t2 + 1 t3

et 4t 3t2

et 4 6t

7. Resolver mediante El metodo de Cramer los sistemas,

a.

5x− y − z = 0x+ 2y + 3z = 144x+ 3y + 2z = 16

b.

x+ 3y − 6z = 123x+ 2y + 5z = −102x+ 5y + 2z = 6

c.

−5x+ y + z = 0x− 6y + z = 0x+ y − 7z = 0

Page 62: Libro Mate 4

62 Sistemas de ecuaciones, matrices y determinantes

d.

x+ y + z = 03x+ 6y + 5z = 0x+ 4y + 3z = 0

8. Resolver mediante El metodo Gauss-Jordan los sistemas

a.

3x1 + 2x2 = 4x1 − 4x2 = −17x1 + 10x2 = 125x1 + 6x2 = 8

3x1 − 16x2 = −5

b.

x1 + 5x2 + 4x3 = 12x1 + 10x2 + 8x3 = 33x1 + 15x2 + 12x3 = 5

c.

x1 − 3x2 + 2x3 = −1x1 + 9x2 + 6x3 = 3x1 + 3x2 + 4x3 = 1

d.

2x1 + x2 − x3 = 5x1 − 2x2 + 3x3 = −37x1 + x2 − x3 = 10

e.

2x1 − x2 + 3x3 + 2x5 = 1x1 + x2 − x3 + x4 = 4x1 − x3 + 2x4 = 6

3x1 − x2 + x3 − x4 = 0

f.

3x1 − x2 + x3 + 2x5 = 182x1 − 5x2 + x4 + x5 = −7

x1 − x4 + 2x5 = 62x2 + x3 + x4 − x5 = 10x1 + x2 − 3x3 + x4 = 1

g.

4x1 + 2x2 + 3x3 = −22x1 + 8x2 − x3 = 89x1 + x2 + 8x3 = 0

Page 63: Libro Mate 4

1.8 El metodo de Gauss-Jordan 63

9. Mediante El metodo de Gauss-Jordan, calcular las matrices inversas (silas hay) de

a.

(2 15 3

)b.

(2 −33 5

)c.

(4 −34 2

)d.

(0 −11 0

)

e.

1 1 01 0 10 1 1

f .

5 1 31 4 29 −2 4

g.

1 0 0 01 1 0 01 1 2 01 1 2 4

h.

1 0 0 00 2 0 00 0 3 00 0 0 4

10. Una matriz A se llamara ortogonal si satisface que AtA = I. ¿Cualesde las siguientes matrices son ortogonales?

a.

(0 −11 0

)b.

(2 1−1 0

)c.

(2 −11 2

)

d.

(−1 22 1

)e.

1 0 00 −2 10 −1 −2

f .

−2 0 10 −1 01 0 −1

Page 64: Libro Mate 4

64 Sistemas de ecuaciones, matrices y determinantes

Page 65: Libro Mate 4

Capıtulo 2

Vectores en R2 y R3

2.1 Sistemas de coordenadas en R2 y R3

Comenzamos ahora el estudio de la geometrıa de los espacios R2 y R3

proviendolos de un sistema de coordenadas cartesiano.A cada punto, p en un espacio real se le asocia una n-ada de numeros

de una manera binıvoca

p←→ (x1, x2, · · · , xn)

El numero entero n se llamara la dimension del espacio.La asociacion se llamara un sistema de coordenadas cartesiano del

n-espacio, denominado Rn.

El numero n de coordenadas dependera de la situacion de los puntos deun espacio determinado. Esto es, para asignarle una coleccion de numerosa un punto p, debemos identificar primeramente la situacion del punto y elespacio donde esta contenido. Tal asociacion debe ser dada de manera quea cada punto en un espacio determinado le corresponde una unica coleccionde numeros x1, · · · , xn, y viceversa. Esto es, dada una n-nada de numeros,existe un punto unico p en tal espacio con el cual esta asociado.

EJEMPLO.

Para un espacio unidimensional n = 1, se necesita apenas una coorde-nada,

R1 : p←→ x1

Para un espacio bidimensional n = 2, se necesitan dos coordenadas,

R2 : p←→ (x1, x2)

Page 66: Libro Mate 4

66 Vectores en R2 y R3

Para un espacio tridimensional n = 3, son necesarias tres coordenadas,

R3 : p←→ (x1, x2, x3)

Para el espacio cuatridimensional n = 4, se necesitan cuatro coordena-das,

R4 : p←→ (x1, x2, x3, x4)

La figura 2.1 ilustra este ejemplo para n = 1, 2, 3.

0

-1

1-1(-1,2)

(1,-1,2)

2

2

1

11

3

222

3x

xx

x

xx

Ñ

Ñ

Ña.

b.c.

Figura 2.1: Coordenadas en Rn para un entero positivo n pequeno.

La localizacion de un punto p con sus coordenadas asociadas x1, · · · , xnen un espacio real Rn se hace mediante un sistema rectangular de ejesque tienen coincidencia en el punto comun 0, y que estan graduados porunidades escogidas previamente.

EJEMPLO.

a. El punto (−1, 2) describe de manera unica a un punto en el plano R2.La manera de localizarlo se muestra en la figura 2.1.

b. El punto (1,−1, 2) describe una posicion en el espacio R3. La figura 2.1muestra la forma de localizarlo en el espacio.

c. El punto (0,−1, 1, 4,−3) describe de forma unica una posicion en elespacio real de dimension 5 (R5).

EJEMPLO. Al estudiar un gas ideal se toman las variables principalesP = Presion, V = Volumen, T = Temperatura.

C De esta manera, cada estado del gas se representa por una tripleta

(P, V, T )

Page 67: Libro Mate 4

2.1 Sistemas de coordenadas en R2 y R3 67

que corresponde a un punto en R3. B

EJEMPLO. Para estudiar un sistema de cuerpos puntuales que se muevenen el espacio R3, es necesario determinar la posicion de los cuerpos medianteun sistema de coordenadas. Ası, si tenemos los cuerpos m1,m2, · · · ,mn, acada uno le corresponde una posicion en R3 dada por

(x1, y1, z1), (x2, y2, z2), · · · , (xn, yn, zn)

respectivamente, en cada instante del movimiento. La figura 2.2 ilustraesta situacion.

1

13

2

2

n

x

mx

x

m

m

Figura 2.2: Cuerpos moviendose en el espacio tridimensional.

A continucion, le damos una estructura algebraica a Rn definiendodos operaciones: la suma de puntos, y el producto de un numero real(escalar) por un punto de Rn.

Dados dos puntos p = (x1, x2, · · · , xn), q = (y1, y2, · · · , yn), en el espa-cio Rn, se define el punto p+ q como aquel punto con coordenadas

p+ q = (x1 + y1, x2 + y2, · · · , xn + yn)

EJEMPLO. En el plano R2, si p = (−1, 2), q = (3, 7) entonces el puntop+ q ∈ R2 es aquel que se obtiene mediante

p+ q = (−1, 2) + (3, 7) = (−1 + 3, 2 + 7) = (2, 9)

EJEMPLO. En el espacio R3, si p = (−1, 4, 2) y q = (π,√2, 1

2 ), se tieneque

p+ q =

(π − 1, 4 +

√2,

5

2

)

Dados, el punto p = (x1, x2, · · · , xn) en Rn, y el escalar λ, se define elnuevo punto λp como aquel en Rn con las coordenadas

λp = (λx1, · · · , λxn)

Page 68: Libro Mate 4

68 Vectores en R2 y R3

EJEMPLO.

a. Sean p =(−1, 2, 13 , 4

)en R4 y λ = 3, entonces

λp = 3(−1, 2, 13, 4) = (−3, 6, 1, 12)

b. Sean p =(1,−1, 6, 15 , 8

)en R5 y λ = −5 entonces,

λp = (−5, 5,−30,−1,−40)

Las operaciones definidas de esta manera tienen propiedades heredadasde las propiedades de los numeros reales. Esto se observa en el siguiente,

LEMA 2.1 Si p1, p2, q1, q2 ∈ Rn y λ, µ ∈ R se cumplen las igualdades

a.(p1 + p2) + q1 = p1 + (p2 + q1)

b.p1 + q1 = q1 + p1

c.λ(p1 + q1) = λp1 + λq1

d.(λ+ µ)p1 = λp1 + µp1

e. Si O = (0, · · · , 0) es el punto en Rn con coordenadas nulas, entonces,para todo punto p ∈ Rn se cumple que

p+O = p

f. Si se toma λ = −1, entonces al definir por (−1)p = −p, se cumple

p+ (−p) = O

C Son calculos directos realizados mediante las coordenadas.

Por ejemplo, para demostrar la propiedad b., si p1 = (x1, x2, · · · , xn),y q1 = (y1, y2, · · · , yn), entonces

p1+q1 = (x1, x2, · · · , xn)+(y1, y2, · · · , yn) = (x1+y1, x2+y2, · · · , xn+yn)

= (y1 + x1, y2 + x2, · · · , yn + xn) = (y1, y2 · · · , yn) + (x1, x2, · · · , xn)= q1 + p1

Page 69: Libro Mate 4

2.1 Sistemas de coordenadas en R2 y R3 69

La propiedad c. se demuestra mediante la cadena de igualdades:

λ(p1 + q1) = λ[(x1, x2, · · · , xn) + (y1, y2, · · · , yn)]= λ(x1 + y1, x2 + y2, · · · , xn + yn)

= (λ(x1 + y1), λ(x2 + y2), · · · , λ(xn + yn))

= (λx1 + λy1, λx2 + λy2, · · · , λxn + λyn)

= (λx1, λx2, · · · , λxn) + (λy1, λy2 · · · , λyn)= λ(x1, x2, · · · , xn) + λ(y1, y2, · · · , yn) = λp1 + λq1

Las otras pruebas son analogas y se omiten. B

Vamos ahora a dar una interpretacion geometrica en R2 de las opera-ciones mencionadas.

Dados los puntos p = (x1, y1), q = (x2, y2) estos se pueden localizar enel plano R2 de la forma que se menciono anteriormente.

La suma p + q se comporta como la suma de vectores ordinarios (Leydel paralelogramo).

Un vector es un objeto que tiene una magnitud, direccion y sentido. Seles suele describir graficamente por flechas que tienen extremos en puntossituados en un espacio determinado.

Para sumar dos vectores segun la regla del paralelogramo, se fijan en unextremo comun y se desliza paralelamente uno a traves del otro hasta el otroextremo, creando al realizar el deslizamiento del otro vector paralelamente,un paralelogramo.

La suma de los mencionados vectores es el vector diagonal del parale-logramo que nace en el extremo comun inicial (vease la figura 2.3).

00p

p

λpq p+q

Figura 2.3: Geometrıa de las operaciones en Rn.

A cada punto p y q se les asocia un vector de posicion (nace enel origen de coordenadas (0, 0)) y a la suma p + q se le asocia el vector

Page 70: Libro Mate 4

70 Vectores en R2 y R3

resultante de suma de vectores mediante la regla del paralelogramo (veasefigura 2.3).

De igual forma, un vector en R2 puede ser deformado sobre su direccioncuando se multiplica por un escalar. Esto hace que varıen, su sentido o sumagnitud, pero conservando su direccion.

La geometrıa de la operaciones mencionadas se puede generalizar a Rn.Esto es, si p = (x1, x2, · · · , xn) q = (y1, y2, · · · , yn) entonces el punto

p+ q = (x1, x2, · · · , xn) + (y1, y2, · · · , yn) = (x1 + y1, x2 + y2, · · · , xn + yn)

puede ser visto como el vector resultante de la suma por la regla delparalelogramo.

Por otro lado, si se considera el vector de posicion en el punto

p = (x1, x2, · · · , xn)

entoncesλp = λ(x1, x2, · · · , xn) = (λx1, λx2, · · · , λxn)

tiene un vector de posicion que esta en la misma direccion que p, satisfa-ciendo

i. si 0 < λ < 1, entonces λp es un encogimiento de p, pero tiene el mismosentido.

ii. si 1 < λ, entonces λp es un estiramiento de p en el mismo sentido.

iii. si λ < 0, es λp un vector en sentido inverso de p.

Por lo anterior, a los puntos asociados con vectores de posicion les lla-mamos tambien vectores.

Ası, al conjunto

Rn = (x1, x2, · · · , xn)|xi ∈ R

provisto de la suma de puntos p + q y el producto de un punto por unescalar λp le llamaremos el espacio vectorial real de dimension n. Con-secuentemente, a los puntos de Rn les llamaremos tambien vectores.

NOTACION. En adelante se definen a los puntos de un espacio real es-pecıfico por las letras

p, q, · · ·poniendo subındices en sus coordenadas.

Para ejemplosp = (p1, p2, · · · , pn)

Page 71: Libro Mate 4

2.1 Sistemas de coordenadas en R2 y R3 71

q = (q1, q2, · · · , qn)

Por otro lado, cuando se trate de especificar un punto como un vectoradoptaremos la notacion por letras del tipo

ξ, ζ, η, · · ·

poniendo superındices en sus coordenadas.Para ejemplos

ξ = (ξ1, ξ2, · · · , ξn)

ζ = (ζ1, ζ2, · · · , ζn)

La ventaja de reconocer a un punto de un vector mediante la notacionse observa en las aplicaciones. Por ejemplo, al momento de estudiar a unvector que actua en un punto se hace tal distincion. Esto se concreta acontinuacion.

Dado un punto p ∈ R2 arbitrario y otro q (movil), se define un vectorlocalizado ξ, o de posicion, como el vector que nace en el punto p y tieneextremo final en el punto q.

0

q

p

ξ=q-p

Figura 2.4: Vector localizado en un punto.

C Por la regla del paralelogramo se tiene de la figura 2.4, que

ξ + p = q

de donde

ξ = q − p

que nos indica que, el vector localizado ξ esta definido por la diferenciaq − p B

Este concepto de vector localizado se puede generalizar para p, q, ξ ∈ Rn,sin ninguna dificultad.

Page 72: Libro Mate 4

72 Vectores en R2 y R3

EJEMPLO. Dados p = (1, 2,−1) y q = (−3, 5, 0) en el espacio tridimen-sional, el vector localizado ξ que comienza en p y tiene extremo en q secalcula por

C ξ = q − p = (−3, 5, 0)− (1, 2,−1) = (−4, 3, 1) B

Por otro lado, dados un punto p ∈ Rn y ξ un vector localizado, conun extremo inicial en p, se puede conseguir siempre un punto q tal queξ = q − p.

Observamos que dos vectores de posicion ξ, η,∈ Rn son paralelos sison proporcionales (estan en la misma direccion), es decir, si son multiplospor un escalar λ, es decir, ξ = λη.

Por lo tanto, se tiene que dos vectores localizados son paralelos si sonproporcionales entre sı.

2.2 El producto escalar y la norma en R3

Ahora damos un repaso a los elementos necesarios para poder definir a losobjetos geometricos o fısicos que pueden ser descritos por subconjuntos delplano o del espacio. Estos elementos son ya conocidos seguramente por ellector en los cursos basicos de geometrıa analıtica, pero se repasan para noolvidarlos.

De los cursos basicos de geometrıa analıtica, se sabe de la posibilidadde hacer mediciones de distancias entre dos puntos que estan contenidos enR3, provisto de un sistema coordenado cartesiano.

Dados los puntos p = (x1, y1, z1) y q = (x2, y2, z2), si definimos por ` ladistancia entre ellos, esta se calcula por la formula

`2 = (x1 − x2)2 + (y1 − y2)2 + (z1 − z2)2.

Al espacio R3 con la longitud entre dos puntos definida de esta forma,le llamaremos el espacio Euclidiano R3.

Observamos que en el caso q = (0, 0, 0) se tiene que

`2 = (x1)2 + (y1)

2 + (z1)2

que es la distancia al cuadrado de p al origen.

De esta manera, si p = (x0, y0, z0) es un punto arbitrario de R3, en-tonces su distancia del origen, tambien llamada su norma, se calcula porla expresion

||p|| =√x20 + y20 + z20

Page 73: Libro Mate 4

2.2 El producto escalar y la norma en R3 73

Una manera de inducir una longitud (norma) en R3 es a traves de ladefinicion de un producto escalar.

Esto esta motivado de la relacion para p = (x, y, z),

||p||2 = (x)2 + (y)2 + (z)2 = (x)(x) + (y)(y) + (z)(z)

que puede definirse por

(x)(x) + (y)(y) + (z)(z) =< (x, y, z), (x, y, z) >=< p, p >

donde < p, p > se define por la primer expresion en la cadena de igualdades.

Aquı hacemos la primer distincion entre los puntos y los vectores. Masque definir la operacion < , > para puntos, es mas conveniente definirlapara vectores, con motivo de las aplicaciones.

DEFINICION. Dados los vectores ξ = (ξ1, ξ2, ξ3), η = (η1, η2, η3) en elespacio cartesiano R3, se define el producto escalar de ellos, definido por< ξ, η >, como el numero real (escalar)

< ξ, η >=n∑

i=1

ξi ηi = ξ1η1 + ξ2η2 + ξ3η3.

Observemos que el producto escalar es una operacion ejercida sobre unapareja de vectores y su valor es un numero real.

EJEMPLO. Si ξ1 = (−1, 0, 3) y ξ2 =(12 ,√2, 4)en R3, se tiene que su

producto escalar es

< ξ1, ξ2 >=< (−1, 0, 3),(1

2,√2, 4

)>= (−1)

(1

2

)+ 0(√2) + (3)(4)

=−12

+ 12 =23

2

EJEMPLO. Dados los vectores ξ1 = (4,−1) y ξ2 = (1, 4) se tiene que suproducto escalar en el plano, esta dado por

< ξ1, ξ2 >=< (4,−1), (1, 4) >= (4)(1) + (−1)(4) = 4− 4 = 0

El producto escalar definira una norma en virtud del siguiente Lema.1

1En algunos textos clasicos la notacion utilizada para el producto escalar es medianteun punto •, como se indica

< ξ, η >= ξ • η

que hace que tambien se le llame producto punto. Nosotros utilizaremos en estetrabajo la notacion < , > para efectuar las operaciones que lo requieran.

Page 74: Libro Mate 4

74 Vectores en R2 y R3

LEMA 2.2 Dados los vectores ξ, η, ξ1, ξ2 en el espacio Cartesiano R3, ylos numeros reales λ1, λ2 son justas las formulas

a. < ξ, η >=< η, ξ >

b. < λ1 ξ1 + λ2 ξ2, η >= λ1 < ξ1, η > +λ2 < ξ2, η >

c. < ξ, ξ >≥ 0 para todo ξ. De hecho, < ξ, ξ >= 0 si y solo si, ξ = 0.

C a. Ya que ξ = (ξ1, ξ2, ξ3), η = (η1, η2, η3), entonces

< ξ, η >=< (ξ1, ξ2, ξ3), (η1, η2, η3) >= ξ1η1 + ξ2η2 + ξ3η3

= η1ξ1 + η2ξ2 + η3ξ3 =< (η1, η2, η3), (ξ1, ξ2, ξ3) >

=< η, ξ >

b. Si ξ1 = (ξ11 , ξ22 , ξ

33), ξ2 = (ξ12 , ξ

22 , ξ

33), entonces

< λ1ξ1 + λ2ξ2, η >=< λ1(ξ11 , ξ

21 , ξ

31) + λ2(ξ

12 , ξ

22 , ξ

32), (η

1, η2, η3) >

=< (λ1ξ11 , λ1ξ

21 , λ1ξ

31) + (λ2ξ

12 , λ2ξ

22 , λ2ξ

32), (η

1, η2, η3) >

=< (λ1ξ11 + λ2ξ

12 , λ1ξ

21 + λ2ξ

22 , λ1ξ

31 + λ2ξ

32), (η

1, η2, η3) >

= (λ1ξ11 + λ2ξ

12)η

1 + (λ1ξ21 + λ2ξ

22)η

2 + (λ1ξ31 + λ2ξ

32)η

3

= λ1(ξ11η

1 + ξ21η2 + ξ31η

3) + λ2(ξ12η

1 + ξ22η2 + ξ33η

3)

= λ1 < (ξ11 , ξ21 , ξ

31), (η

1, η2, η3) > +λ2 < (ξ12 , ξ22 , ξ

32), (η

1, η2, η3) >

= λ1 < ξ1, η > +λ2 < ξ2, η >

c. Por un calculo directo,

< ξ, ξ >=< (ξ1, ξ2, ξ3), (ξ1, ξ2, ξ3) >= (ξ1)2 + (ξ2)2 + (ξ3)2 ≥ 0

De hecho, (ξ1)2 + (ξ2)2 + (ξ3)2 = 0⇐⇒ ξ1 = ξ2 = ξ3 = 0. B

Sea ξ ∈ R3, y considerese el conjunto de vectores en R3,

e1 = (1, 0, 0)

e2 = (0, 1, 0)

e3 = (0, 0, 1)

C Si ξ = (ξ1, ξ2, ξ3) es un vector arbitrario, al calcular el productoescalar de ξ con cada uno de estos vectores se tiene que

< ξ, e1 >=< (ξ1, ξ2, ξ3), (1, 0, 0) >= ξ1

Page 75: Libro Mate 4

2.2 El producto escalar y la norma en R3 75

< ξ, e2 >=< (ξ1, ξ2, ξ3), (0, 1, 0) >= ξ2

< ξ1, e3 >= ξ3

es decir, obtenemos las coordenadas de ξ. B

En general, si ξ = (ξ1, ξ2, · · · ξn) es un vector en Rn, y lo definimos por

ei = (0, 0, · · · , 1︸ ︷︷ ︸i

, 0, 0)

al vector con 1 en la i-esima coordenada y con las demas coordenadas nulas,se obtiene que

< ξ, ei >= ξi

lo que nos da la i-esima coordenada de ξ.

De esta forma ξ en R3 se puede escribir como

ξ = ξ1(1, 0, 0) + ξ2(0, 1, 0) + ξ3(0, 0, 1) = (ξ1, ξ2, ξ3)

es decir,ξ = ξ1e1 + ξ2e2 + ξ3e3

donde los vectores ei son como se definieron.

EJEMPLOS.

a. El vector ξ1 = (−1, 4,−2) se puede escribir en terminos de los vectorese1, e2, e3 como,

ξ1 = (−1, 4,−2) = (−1, 0, 0) + (0, 4, 0) + (0, 0,−2)

= −1(1, 0, 0) + 4(0, 1, 0)− 2(0, 0, 1) = −1e1 + 4e2 − 2e3

b. El vector ξ2 = (2, 0, 3) se escribe como

ξ2 = 2e1 + 0e2 + 3e3 = 2e1 + 3e3 B

Los vectores e1, e2, e3 definidos de esta forma son llamados vectorescanonicos y satisfacen:

a. En producto escalar de un vector canonico consigo mismo es la unidad,

< e1, e1 >= 1, < e2, e2 >= 1, < e3, e3 >= 1

b. El producto escalar entre dos de ellos diferentes es cero,

< e1, e2 >=< (1, 0, 0), (0, 1, 0) >= 0, < e1, e3 >= 0, < e2, e3 >= 0

Page 76: Libro Mate 4

76 Vectores en R2 y R3

El conjunto de vectores e1, e2, e3 se dice ser la base canonica de R3.

Dos vectores ξ, η tales que < ξ, η >= 0 se llamaran ortogonales. Masadelante explicaremos el por que de esta definicion.

EJEMPLO.

a. Los vectores ξ = (−1, 1, 2) y η = (2, 2, 0) son ortogonales debido a que

< ξ, η >=< (−1, 1, 2), (2, 2, 0) >= −2 + 2 + 0 = 0.

b. Los vectores ξ = (1,−1, 3) y η = (1,−1, 1) no son ortogonales debido aque

< ξ, η >=< (1,−1, 3), (1,−1, 1) >= 1 + 1 + 3 = 5 6= 0

c. Si ξ = (ξ1, ξ2) es un vector plano (en R2), es facil construir un vectorortogonal a ξ, si se cambia el orden de las coordenadas y el signo de unade ellas: η = (−ξ2, ξ1).

C < ξ, η >=< (ξ1, ξ2), (−ξ2, ξ1) >= −ξ1ξ2 + ξ2ξ1 = 0.

Para muestra, si ξ = (1, 2), entonces η = (−2, 1) es ortogonal a ξ. B

En virtud del Lema 2.3 se pueden definir los conceptos de distanciaentre dos puntos, norma del vector, y angulo entre dos vectores.

DEFINICION. Definimos la norma del vector ξ = (ξ1, ξ2, ξ3), conocidapor ||ξ||, como

||ξ||2 =< ξ, ξ >=< (ξ1, ξ2, ξ3), (ξ1, ξ2, ξ3) >= (ξ1)2 + (ξ2)2 + (ξ3)2

EJEMPLO. Dados los vectores ξ1 = (−1, 0, 3) y ξ2 =(12 ,√2, 4), se cal-

culan sus normas por

||ξ1|| =√< ξ1, ξ1 > =

√1 + 9 =

√10

||ξ2|| =√< ξ2, ξ2 > =

√1

4+ 2 + 16 =

√73

4=

√73

2

No es difıcil comprobar que se cumplen las siguientes propiedades de lanorma.

Page 77: Libro Mate 4

2.2 El producto escalar y la norma en R3 77

LEMA 2.3 Para los vectores ξ, η ∈ R3 y los escalares µ, λ ∈ R se cumpleque

a. ||λξ|| = |λ| ||ξ||b. Si < ξ, η >= 0 entonces ||ξ + η|| = ||ξ − η||. En tal caso, los vectores ξy η se llamaran ortogonales o perpendiculares.

c. Si ξ y η son perpendiculares, entonces es justo El teorema de Pita-goras (vease la figura 2.5 a.)

||ξ + η||2 = ||ξ||2 + ||η||2

d. Se cumple la igualdad de Schwarz

| < ξ, η > | ≤ ||ξ|| ||η||

e. Se cumple la desigualdad triangular

||ξ + η|| ≤ ||ξ||+ ||η||

y la igualdad es valida si ξ y η son multiplos por escalares (vease la figura2.5 b.).

0 0

||ξ||

||ξ||

||η||

||η||

||ξ+η||||ξ+η||

a. b.

Figura 2.5: a. Teorema de Pitagoras b. Desigualdad del Triangulo.

C Demostramos algunos incisos de este Lema.a.

||λξ|| =√< λξ, λξ > =

√λ2 < ξ, ξ > = |λ|

√< ξ, ξ > = |λ| ||ξ||

b.

||ξ + η||2 =< ξ + η, ξ + η >=< ξ, ξ > +2 < ξ, η > + < η, η >

Page 78: Libro Mate 4

78 Vectores en R2 y R3

=< ξ, ξ > + < η, η >=< ξ, ξ > −2 < ξ, η > + < η, η >

=< ξ − η, ξ − η >= ||ξ − η||2

c. Ya se comprobo en b. con las primeras tres igualdades, bajo el supuestoque < ξ, η >= 0.

d. Se deja como ejercicio.

e. Por el inciso d., aplicado en la segunda desigualdad siguiente

||ξ + η||2 =< ξ, ξ > +2 < ξ, η > + < η, η >= ||ξ||2 + 2 < ξ, η > +||η||2

≤ ||ξ||2 + 2| < ξ, η > |+ ||η||2 ≤ ||ξ||2 + 2||ξ||||η||+ ||η||2

= (||ξ||+ ||η||)2

se cumple que||ξ + η||2 ≤ (||ξ||+ ||η||)2

lo que implica nuestra afirmacion. B

EJEMPLO. Sean los vectores ξ = (−1, 1, 0), η = (2, 2, 1). Entonces sonperpendiculares pues < ξ, η >= 0 y se verifica que

||ξ − η||2 = ||(−3,−1,−1)||2 = 9 + 1 + 1 = 11

||ξ + η||2 = ||(1, 3, 1)||2 = 1 + 9 + 1 = 11

es decir, se cumple el inciso a. del Lema 2.4,

||ξ + η|| = ||ξ − η|| =√11

Por otro lado, ||ξ||2 = 2, ||η||2 = 9, lo que verifica que se cumple Elteorema de Pitagoras,

||ξ + η||2 = 2 + 9 = ||ξ||2 + ||η||2 B

EJEMPLO. Sean los vectores ξ = (−1, 1, 1) y η = (2,−2, 1), entonces

C ||ξ + η|| = ||(1,−1, 2)|| =√6

||ξ|| =√3, ||η|| =

√9

lo que indica que se cumple la desigualdad del triangulo para estos vectores,

||ξ + η|| =√6 ≤√9 ≤√9 +√3 = ||η||+ ||ξ|| B

Page 79: Libro Mate 4

2.2 El producto escalar y la norma en R3 79

Un vector ξ ∈ R3 tal que ||ξ|| = 1 se llamara vector unitario.

Ası pues, dado el vector η ∈ R3 que no sea nulo, se garantiza la con-struccion del vector unitario

ξ =η

||η||lo cual se verifica directamente,

C ||ξ|| =∣∣∣∣∣∣∣∣η

||η||

∣∣∣∣∣∣∣∣ =

1

||η|| ||η|| = 1 B

EJEMPLO. Para el vector η = (1, 4,−3) se tiene que ||η|| =√26, con lo

que se construye el vector unitario

ξ =(1, 4,−3)√

26=

(1√26,

4√26,−3√26

).

Ahora pasamos a definir la distancia entre los puntos arbitrarios delespacio, como la norma del vector localizado entre ellos.

Sean dados dos puntos p = (x1, y1, z1), q = (x2, y2, z2) en el espaciocartesiano, se define la distancia ` entre los puntos mencionados, como lanorma del vector ξ = p− q, es decir,

`2 = ||ξ||2 =< p− q, p− q >

=< (x1 − x2, y1 − y2, z1 − z2), (x1 − x2, y1 − y2, z1 − z2) >= (x1 − x2)2 + (y1 − y2)2 + (z1 − z2)2

EJEMPLO. Sean los puntos p = (1, 2, 3) y q = (−2,−1, 0) entonces ladistancia entre los puntos p y q se calcula por la norma del vector ξ =p− q = (3, 3, 3).

C `2 = ||ξ||2 = 33 + 32 + 32 = 27

de donde,` =√27 B

Sean ahora dos vectores, ξ vector unitario y η un vector arbitrario. Bus-camos un vector ζ en la direccion de ξ tal que sea la proyeccion ortogonalde η en ξ, es decir, el vector η−ζ sea ortogonal al vector ξ como lo muestrala figura 2.6.

C Ya que η − ζ se busca ortogonal a ξ, se debera satisfacer que <η − ζ, ξ >= 0.

Page 80: Libro Mate 4

80 Vectores en R2 y R3

Por otro lado, si ζ esta en la direccion de ξ, entonces es suficiente conencontrar un escalar λ tal que ζ = λξ.

Al sustituir en la ecuacion de ortogonalidad se tiene que

0 =< η − ζ, ξ >=< η − λξ, ξ >=< η, ξ > −λ < ξ, ξ >

=< η, ξ > −λ||ξ||2 =< η, ξ > −λen virtud de que ξ es unitario y por lo tanto ||ξ|| = 1.

Esto implica que λ =< η, ξ >=< ξ, η >, y que entonces

ζ =< ξ, η > ξ B

Ası, dados los vectores ξ unitario y η arbitrario, podemos definir laproyeccion ortogonal del vector η en el vector unitario ξ como el vector

ζ =< ξ, η > ξ

que es un vector que esta en la misma direccion que ξ (vease la figura 2.6).

0

θ

η

η−ξ

ξ

Figura 2.6: Proyeccion de un vector.

EJEMPLO. Realizamos la proyeccion del vector η = (−1, 1, 1) en el vectorξ = (2,−1, 5).

C Ya que ξ no es unitario, lo normalizamos mediante la division por sunorma

ξ

||ξ|| =(2,−1, 5)√

30=

(2√30,−1√30,

5√30

)

De esta manera, el vector buscado es

ζ =

⟨ξ

||ξ|| , η⟩

ξ

||ξ|| =1

||ξ||2 < ξ, η > ξ

=1

30< (2,−1, 5), (−1, 1, 1) > (2,−1, 5) = 2

30(2,−1, 5) =

(2

15,−115,1

3

)B

El calculo en este ejemplo prueba el siguiente corolario.

Page 81: Libro Mate 4

2.2 El producto escalar y la norma en R3 81

COROLARIO 2.1 La proyeccion del vector η arbitrario en el vector nonulo ξ, llamado ζ, se calcula por la formula

ζ =< ξ, η >

||ξ||2 ξ

En muchas ocasiones, cuando no haya confusion, entenderemos no alvector ζ obtenido, sino al escalar (factor de ξ)

< ξ, η >

||ξ||2

como la proyeccion mencionada.

De la figura 2.6 se tiene que si ξ, η son vectores arbitrarios y ζ es laproyeccion de η en ξ entonces al considerar el angulo θ entre los vectores ξy η se tiene que

cos θ =||ζ||||η||

Si se sustituye el valor de ζ = <ξ,η>||ξ||2 ξ se tiene entonces que

cos θ =| < ξ, η > |||η|| ||ξ||2 ||ξ|| =

< ξ, η >

||η|| ||ξ||

cuando consideremos a θ ∈ [0, π]. Esto demuestra el siguiente Lema.

LEMA 2.4 Si ξ = (ξ1, ξ2, ξ3), η = (η1, η2, η3) son dos vectores en R3,formando un angulo θ entre ellos, se define este angulo por la igualdad

cos θ =< ξ, η >√

< ξ, η >< η, η >=< ξ, η >

||ξ|| ||η|| ,

donde 0 ≤ θ ≤ π.En otras palabras el producto escalar de los vectores ξ y η se puede

escribir como< ξ, η >= ||ξ|| ||η|| cos θ.

EJEMPLO. Si los vectores ξ y η cumplen que < ξ, η >= 0, sabiendo queambos son no nulos, entonces

||ξ|| ||η|| cos θ = 0

lo que implica que cos θ = 0, y consecuentemente θ = π/2. Esto justificasu nombre de vectores ortogonales.

Page 82: Libro Mate 4

82 Vectores en R2 y R3

EJEMPLO. Sean los vectores ξ = (2,−1, 1) y η = (3,−4,−4), entonces

< ξ, η >= 6 + 4− 4 = 6

y las normas son ||ξ|| =√6 y ||η|| =

√41

C Por lo tanto, el angulo formado por ξ y η es

θ = arc cosx,

(< ξ, η >

||ξ|| ||η||

)= arc cos

6√6√41

= arc cos

√6

41. B

Como ultima observacion de esta seccion tenemos que de las relaciones

cos θ =< ξ, η >

||ξ||||η|| , | cos θ| ≤ 1

podemos decir que ∣∣∣∣< ξ, η >

||ξ|| ||η||

∣∣∣∣ ≤ 1

lo que nos lleva a verificar la desigualdad de Schwarz

| < ξ, η > | ≤ ||ξ|| ||η||

enunciada en el inciso d. del Lema 2.3.

2.3 El producto vectorial

Definimos ahora el producto vectorial en el espacio R3.

DEFINICION. Sean ξ = (ξ1, ξ2, ξ3), η = (η1, η2, η3) dos vectores en R3.Se define el producto vectorial de ξ con η definido por [ξ, η], como elvector en R3 con coordenadas

[ξ, η] = (ξ2η3 − η2ξ3, −(ξ1η3 − η1ξ3), ξ1η2 − ξ2η1)

en la base canonica ordenada e1, e2, e3.2

Una forma de recordar las coordenadas del vector [ξ, η] es a traves dela siguiente cadena convencional de igualdades

[ξ, η] = (ξ2η3 − η2ξ3, −(ξ1η3 − η1ξ3), ξ1η2 − ξ2η1) =2En algunos textos utilizan otra notacion para asegurar la operacion del producto

vectorial, por ejemplo: × y ∧. Para ejemplificar

[ξ, η] = ξ × η = ξ ∧ η

Nosotros utilizaremos la notacion [ , ] donde se requiera efectuar la operacion del pro-ducto vectorial.

Page 83: Libro Mate 4

2.3 El producto vectorial 83

= (ξ2η3 − η2ξ3)e1 − (ξ1η3 − η1ξ3)e2 + (ξ1η2 − ξ2n1)e3

= e1

∣∣∣∣ξ2 ξ3

η2 η3

∣∣∣∣− e2∣∣∣∣ξ1 ξ3

η1 η3

∣∣∣∣+ e3

∣∣∣∣ξ1 ξ2

η1 η2

∣∣∣∣

=

∣∣∣∣∣∣

e1 e2 e3ξ1 ξ2 ξ3

η1 η2 η3

∣∣∣∣∣∣

donde el determinante ultimo se calcula mediante la expresion penultima.

EJEMPLO. Dados los vectores ξ = (1,−1, 1) y η = (−2, 3, 1) se tiene que

[ξ, η] =

∣∣∣∣∣∣

e1 e2 e31 −1 1−2 3 1

∣∣∣∣∣∣= e1

∣∣∣∣−1 13 1

∣∣∣∣− e2∣∣∣∣

1 1−2 1

∣∣∣∣+ e3

∣∣∣∣1 −1−2 3

∣∣∣∣

= e1(−4)− e2(3) + e3(1) = (−4,−3, 1)

EJEMPLO. Para los vectores ξ = (1, 1, 3), η = (2, 2, 6) obtenemos elvector

[ξ, η] =

∣∣∣∣∣∣

e1 e2 e31 1 32 2 6

∣∣∣∣∣∣= e1

∣∣∣∣1 32 6

∣∣∣∣− e2∣∣∣∣1 32 6

∣∣∣∣+ e3

∣∣∣∣1 11 1

∣∣∣∣

= e1(0)− e2(0) + e3(0) = (0, 0, 0)

En este ultimo ejemplo no es extrano tener el resultado vector (0, 0, 0),debido a que los vectores ξ y η dados son paralelos, es decir, ξ es unmultiplo escalar de η, de hecho, ξ = 1

2η.

De manera general, dados dos vectores paralelos ξ y η, su productovectorial es nulo.

C Si ξ = λη para algun λ ∈ R, entonces,

[ξ, η] = [λη, η] = λ[η, η] = λ

∣∣∣∣∣∣

e1 e2 e3η1 η2 η3

η1 η2 η3

∣∣∣∣∣∣= λ(0, 0, 0) = (0, 0, 0). B

La recıproca de esta afirmacion, que toda pareja de vectores cuyo pro-ducto vectorial se anula es una pareja de vectores paralelos, es tambiencierta y es consecuencia del inciso f. del Lema 2.5.

Observamos que el producto vectorial [ , ] esta definido en parejas devectores en R3 y su valor es otro vector en R3.

Mostramos ahora las propiedades del producto vectorial [ , ] de dos vec-tores espaciales.

Page 84: Libro Mate 4

84 Vectores en R2 y R3

LEMA 2.5 Dados los vectores ξ, η, ζ en R3 y los escalares λ, µ ∈ R setiene

a.

[ξ, η] es ortogonal a ξ y η : < [ξ, η], ξ >= 0 y < [ξ, η], η >= 0

b.[ξ, η] = −[η, ξ], (anticonmutatividad)

c.

[λξ, η] = [ξ, λη] = λ[ξ, η] (conmutatividad respecto a escalar).

d.[ξ, λη + µζ] = λ[ξ, η] + µ[ξ, ζ] (distributividad)

e.||[ξ, η]||2 = ||ξ||||η|| − (< ξ, η >)2

f.||[ξ, η]|| = ||ξ|| ||η||sen θ, donde θ es el angulo entre ξ y η

g.[ξ, [η, ζ]] + [ζ, [ξ, η]] + [η, [ζ, ξ]] = 0 (Igualdad de Jacobi)

C Hacemos las pruebas apenas de algunos incisos de este Lema.

a. Si ξ = (ξ1, ξ2, ξ3), η = (η1, η2, η3) entonces

[ξ, η] = (ξ2η3 − ξ3η2,−(ξ1η3 − ξ3η1), ξ1η2 − ξ2η1)

Si escogemos, por ejemplo a ξ, obtenemos

< [ξ, η], ξ >= ξ1(ξ2η3 − ξ3η2)− ξ2(ξ1η3 − ξ3η1) + ξ3(ξ1η2 − ξ2η1)

= ξ1ξ2η3 − ξ1ξ3η2 − ξ2ξ1η3 + ξ2ξ3η1 + ξ3ξ1η2 − ξ3ξ2η1 = 0

b. Por la propiedad de cambiar el signo a un determinante, si se permutandos renglones se tiene

[ξ, η] =

∣∣∣∣∣∣

e1 e2 e3ξ1 ξ2 ξ3

η1 η2 η3

∣∣∣∣∣∣= −

∣∣∣∣∣∣

e1 e2 e3η1 η2 η3

ξ1 ξ2 ξ3

∣∣∣∣∣∣= −[η, ξ]

d. El corolario 1.7 prueba la distribucion mediante la cadena de igualdades:

[ξ, λη + µζ] =

∣∣∣∣∣∣

e1 e2 e3ξ1 ξ2 ξ3

λη1 + µζ1 λη2 + µζ2 λη3 + µζ3

∣∣∣∣∣∣

Page 85: Libro Mate 4

2.3 El producto vectorial 85

= λ

∣∣∣∣∣∣

e1 e2 e3ξ1 ξ2 ξ3

η1 η2 η3

∣∣∣∣∣∣+ µ

∣∣∣∣∣∣

e1 e2 e3ξ1 ξ2 ξ3

ζ1 ζ2 ζ3

∣∣∣∣∣∣= λ[ξ, η] + µ[ξ, ζ]

Los demas incisos se comprueban de manera similar. B

De la propiedad f. del Lema 2.5, se tiene que si dos vectores no nulosξ, η satisfacen que su producto vectorial es el vector cero, entonces

0 = ||(0, 0, 0)|| = ||[ξ, η]|| = ||ξ|| ||η|| sen θ,

lo que implicarıa que el angulo θ formado por ellos satisface que sen θ = 0o bien θ = π. Esto es, los vectores son paralelos. Por esto es que podemosdefinir a un par de vectores como paralelos, si su producto vectorial seanula.

EJEMPLO. Sean los vectores ξ = (1,−1, 2) y η = (0, 1, 3), entonces, porel inciso a. del Lema 2.5 el vector [ξ, η] es ortogonal tanto a ξ como a η.Esto es,

C ζ = [ξ, η] =

∣∣∣∣∣∣

e1 e2 e30 −1 20 1 3

∣∣∣∣∣∣= (−3− 2)e1 − (3)e2 + (1)e3 = (−5,−3, 1)

es ortogonal a ξ y a η. B

Si se consideran dos vectores arbitrarios ξ, η en R3, estos generan unparalelogramo R como lo muestra la figura 2.7

||ξ||

||η|| ||η||

θ

cos θ

Figura 2.7: Area de un paralelogramo.

Tal paralelogramo R tiene una base ||ξ|| y altura ||η|| sen θ, donde θ es elangulo entre ξ y η. De esta manera, el area del paralelogramo es calculadopor

Area (R) = (base × altura) = ||ξ|| ||η|| sen θcon lo que tal area se calcula segun el inciso f. del Lema 2.5 mediante lasigualdades

Area (R) = ||ξ|| ||η|| sen θ = ||[ξ, η]||

Page 86: Libro Mate 4

86 Vectores en R2 y R3

EJEMPLO. Calcular el area del paralelogramo generado por los vectoresξ = (7, 8, 9) y η = (−3, 5, 2).

C Primeramente calculamos el vector [ξ, η],

[ξ, η] =

∣∣∣∣∣∣

e1 e2 e37 8 9−3 5 2

∣∣∣∣∣∣= e1

∣∣∣∣8 95 2

∣∣∣∣− e2∣∣∣∣

7 9−3 2

∣∣∣∣+ e3

∣∣∣∣7 8−3 5

∣∣∣∣

= e1(−29)− e2(41) + e3(59) = (−29,−41, 59).y despues el area del paralelogramo

Area = ||[ξ, η]|| =√

(−29)2 + (−41)2 + (59)2 =√6003 B

ξ

η p

[ξ,η]

Figura 2.8: Momento de accion de ξ en η

Por otro lado, el producto vectorial puede ser considerado mecanica-mente como el momento de accion del vector ξ en el punto p que tieneasociado el vector de posicion η (vease la figura 2.8).

2.4 El triple producto escalar y bases de R3

Ahora, definimos el producto mixto o triple producto escalar de tresvectores ordenados.

DEFINICION. Dados los vectores ξ, η, ζ en R3 se define el productomixto o triple producto escalar de ellos al numero real definido por(ξ, η, ζ) y en ese orden, como

(ξ, η, ζ) =< [ξ, η], ζ >

Obtenemos el siguiente resultado, util para problemas practicos.

Page 87: Libro Mate 4

2.4 El triple producto escalar y bases de R3 87

LEMA 2.6 Dados los vectores espaciales ξ = (ξ1, ξ2, ξ3), η = (η1, η2, η3)y ζ = (ζ1, ζ2, ζ3) se tiene

a. El producto mixto de ξ, η y ζ en coordenadas se calcula por

(ξ, η, ζ) =

∣∣∣∣∣∣

ξ1 ξ2 ξ3

η1 η2 η3

ζ1 ζ2 ζ3

∣∣∣∣∣∣

b. El producto mixto no cambia si se hacen las permutaciones circulares,es decir,

(ξ, η, ζ) = (ζ, ξ, η) = (η, ζ, ξ)

c. El producto mixto es anticonmutativo al transponer dos vectores, porejemplo,

(ξ, η, ζ) = −(η, ξ, ζ).

d. (ξ, η, ζ) = 0 si y solo sı, los tres vectores estan contenidos en un mismoplano.

e. El volumen V del paralelepıpedo tendido sobre ξ, η y ζ se calcula por

V = |(ξ, η, ζ)|.

C Ya que (ξ, η, ζ) =< [ξ, η], ζ >, entonces,

(ξ, η, ζ) =

⟨∣∣∣∣∣∣

e1 e2 e3ξ1 ξ2 ξ3

η1 η2 η3

∣∣∣∣∣∣, (ζ1, ζ2, ζ3)

=

⟨e1

∣∣∣∣ξ2 ξ3

η2 η3

∣∣∣∣− e2∣∣∣∣ξ1 ξ3

η1 η3

∣∣∣∣+ e3

∣∣∣∣ξ1 ξ2

η1 η2

∣∣∣∣ , (ζ1, ζ2, ζ3)

= ζ1∣∣∣∣ξ2 ξ3

η2 η3

∣∣∣∣− ζ2

∣∣∣∣ξ1 ξ3

η1 η3

∣∣∣∣+ ζ3∣∣∣∣ξ1 ξ2

η1 η2

∣∣∣∣

=

∣∣∣∣∣∣

ζ1 ζ2 ζ3

ξ1 ξ2 ξ3

η1 η2 η3

∣∣∣∣∣∣=

∣∣∣∣∣∣

ξ1 ξ2 ξ3

η1 η2 η3

ζ1 ζ2 ζ3

∣∣∣∣∣∣

lo que demuestra el punto a.

Los puntos b. y c. tienen pruebas analogas utilizando las propiedadesde los determinantes.

Page 88: Libro Mate 4

88 Vectores en R2 y R3

[ξ,η]

ξ

η

0

ζ

Figura 2.9: Volumen del paralelepıpedo.

Para demostrar el punto d., de la figura 2.9 se tiene que el paralelepıpedotiene una base con area ||[ξ, η]|| y altura igual a la proyeccion de ζ en [ξ, η]cuya longitud es el valor absoluto

∣∣∣∣< [ξ, η], ζ >

||[ξ, η]||

∣∣∣∣

Por lo tanto, el volumen del paralelepıpedo sera

Volumen=area de la base × altura = ||[ξ, η]||∣∣∣∣< [ξ, η], ζ >

||[ξ, η]||

∣∣∣∣

= | < [ξ, η], ζ > | = |(ξ, η, ζ)|que prueba la afirmacion.

El inciso e. se sigue inmediatamente del inciso d. B

EJEMPLO. Sean los vectores ξ = (1, 1, 0), η = (0,−2, 3), ζ = (1, 1, 1).Entonces, el triple producto escalar de ellos se calcula

(ξ, η, ζ) =

∣∣∣∣∣∣

1 1 00 −2 31 1 1

∣∣∣∣∣∣= 1

∣∣∣∣−2 31 1

∣∣∣∣− 1

∣∣∣∣0 31 1

∣∣∣∣+ 0

∣∣∣∣0 −21 1

∣∣∣∣

= (−5)− (−3) + 0 = −2

EJEMPLO. Dados los vectores ξ = (1, 0, 0), η = (0, 2, 0), ζ = (4, 2, 0)obtenemos

(ξ, η, ζ) =

∣∣∣∣∣∣

1 0 00 2 04 2 0

∣∣∣∣∣∣= 1

∣∣∣∣2 02 0

∣∣∣∣ = 0

Page 89: Libro Mate 4

2.4 El triple producto escalar y bases de R3 89

lo que era de esperarse pues ξ, η y ζ son coplanares. De hecho se observadirectamente que ζ = 4ξ + 2η.

EJEMPLO. El volumen del paralelepıpedo generado por los vectores ζ =(2,−1, 1), η = (1, 2, 3) y ζ = (1, 1,−2) es

V = |(ξ, η, ζ)| =

∣∣∣∣∣∣

∣∣∣∣∣∣

2 −1 11 2 31 1 −2

∣∣∣∣∣∣

∣∣∣∣∣∣= | − 30| = 30

Consideremos ahora los vectores ξ1, ξ2, ξ3 en R3 satisfaciendo que sutriple producto escalar no se anula

(ξ1, ξ2, ξ3) 6= 0

Entonces, por el Lema 2.6 se tiene que no son coplanares, es decir, ningunode ellos depende de los otros. Esto se observa del hecho de que si algunode ellos fuera combinacion lineal de los otros, por ejemplo

ξ3 = λξ1 + µξ2, λ, µ ∈ R

entonces su triple producto escalar serıa, mediante determinantes

(ξ1, ξ2, ξ3) =

∣∣∣∣∣∣

ξ1ξ2ξ3

∣∣∣∣∣∣=

∣∣∣∣∣∣

ξ1ξ2

λξ1 + µξ2

∣∣∣∣∣∣=

=

∣∣∣∣∣∣

ξ1ξ2λξ1

∣∣∣∣∣∣+

∣∣∣∣∣∣

ξ1ξ2µξ2

∣∣∣∣∣∣= λ

∣∣∣∣∣∣

ξ1ξ2ξ1

∣∣∣∣∣∣+ µ

∣∣∣∣∣∣

ξ1ξ2ξ2

∣∣∣∣∣∣= 0

lo que no puede ser.

DEFINICION. El conjunto de vectores ξ1, ξ2, ξ3 ⊂ R3 se dice ser li-nealmente independiente si su triple producto escalar no se anula, esdecir,

(ξ1, ξ2, ξ3) 6= 0

EJEMPLO. Sean los vectores canonicos e1, e2, e3 ⊂ R3.

C Es claro que

(e1, e2, e3) =

∣∣∣∣∣∣

e1e2e3

∣∣∣∣∣∣=

∣∣∣∣∣∣

1 0 00 1 00 0 1

∣∣∣∣∣∣= 1

lo que los hace linealmente independientes. B

Page 90: Libro Mate 4

90 Vectores en R2 y R3

EJEMPLO. Sea el conjunto de vectores

ξ1 = (1, 1, 0),ξ2 = (0, 1, 1),ξ3 = (1, 1, 1)

C Su triple producto escalar se calcula por

(ξ1, ξ2, ξ3) =

∣∣∣∣∣∣

ξ1ξ2ξ3

∣∣∣∣∣∣=

∣∣∣∣∣∣

1 1 00 1 11 1 1

∣∣∣∣∣∣=

∣∣∣∣1 11 1

∣∣∣∣−∣∣∣∣0 11 1

∣∣∣∣ = 1

lo que nos dice que son linealmente independientes. B

EJEMPLO. Sea ahora el conjunto de vectores

ξ1 = (1, 1, 0),ξ2 = (0, 1, 1),ξ3 = (2, 5, 3)

C El triple producto escalar entre ellos es

(ξ1, ξ2, ξ3) ==

∣∣∣∣∣∣

1 1 00 1 12 5 3

∣∣∣∣∣∣=

∣∣∣∣1 15 3

∣∣∣∣−∣∣∣∣0 12 5

∣∣∣∣ = −2 + 2 = 0

lo que hace de ellos un conjunto linealmente dependiente.

Esto es, existen escalares µ, λ tal que, por ejemplo,

ξ3 = λξ1 + µξ2 = λ(1, 1, 0) + µ(0, 1, 1)

es decir,

(2, 5, 3) = (λ, λ, 0) + (0, µ, µ) = (λ, λ+ µ, µ)

o bien,

2 = λ5 = λ+ µ3 = µ

lo que implica que λ = 2, µ = 3.

Por lo tanto, una dependencia lineal entre ellos se da mediante laigualdad

ξ3 = 2ξ1 + 3ξ2. B

Page 91: Libro Mate 4

2.4 El triple producto escalar y bases de R3 91

EJEMPLO. Sea el conjunto ξ1(1, 2), ξ2 = (1/2, 1) ⊂ R2, entonces

∣∣∣∣ξ1ξ2

∣∣∣∣ =∣∣∣∣

1 21/2 1

∣∣∣∣ = 1− 1 = 0

lo que hace de estos vectores un conjunto linealmente dependiente en elplano R2. De hecho ξ1 = 2ξ2.

EJEMPLO. El conjunto de vectores ξ1 = (1, 2), ξ2 = (−2, 1) es lineal-mente independiente en R2 pues

∣∣∣∣ξ1ξ2

∣∣∣∣ =∣∣∣∣

1 2−2 1

∣∣∣∣ = 1 + 4 = 5 6= 0.

En general, un conjunto de n-vectores en Rn

ξ1, ξ2, · · · ξn

se llamara linealmente independiente si el determinante de la matrizformada por tales vectores no se anula, es decir,

∣∣∣∣∣∣∣

ξ1...ξn

∣∣∣∣∣∣∣6= 0

Sea un conjunto ξ1, ξ2, ξ3 de vectores linealmente independientes enR3. Ya que no todos pertenecen a un mismo plano, al considerar cualquiervector espacial η, las proyecciones paralelas de η en cualquiera de los vec-tores nos provee de escalares λ1, λ2, λ3 ∈ R tales que el vector η es unacombinacion lineal de ξ1, ξ2, ξ2 mediante la igualdad

η = λ1ξ1 + λ2ξ2 + λ3ξ3

como lo muestra la figura 2.10.

Esto es, el conjunto de vectores ξ1, ξ2, ξ3 genera al espacio R3 me-diante combinaciones lineales.

DEFINICION. El conjunto de vectores ξ1, ξ2, ξ3 ⊂ R3 se llamara unabase para R3, si todos los vectores son linealmente independientes y gene-ran al espacio R3 mediante combinaciones lineales.

Resumimos la discusion anterior en el siguiente resultado.

Page 92: Libro Mate 4

92 Vectores en R2 y R3

ξ

ξ

ξλ

λ

ξ

ξ

3

2

11

3

1

3

λ ξ2 2

η

Figura 2.10: Proyeccion paralela de η.

TEOREMA 2.1 Un conjunto de vectores ξ1, ξ2, · · · ξk ⊂ Rn es una basede vectores para Rn, si y solo sı, k = n y el determinante

∣∣∣∣∣∣∣

ξ1...ξn

∣∣∣∣∣∣∣6= 0

EJEMPLO. Los vectores canonicos espaciales

e1 = (1, 0, 0), e2 = (0, 1, 0), e3 = (0, 0, 1)

son una base de R3, llamada la base canonica.Cualquier vector η = (η1, η2, η3) ∈ R3 se escribe

η = η1e1 + η2e2 + η3e3.

EJEMPLO. El conjunto de vectores

ξ1 = (1, 1, 0), ξ2 = (0, 1, 1), ξ3 = (1, 1, 1)

es una base de vectores para R3

C De hecho, si η ∈ R3, se tiene que existen escalares λ1, λ2, λ3 tales que

η = λ1ξ1 + λ2ξ2 + λ3ξ3

es decir, si η = (η1, η2, η3), entonces

(η1, η2, η3) = λ1(1, 1, 0) + λ2(0, 1, 1) + λ3(1, 1, 1)

Page 93: Libro Mate 4

2.4 El triple producto escalar y bases de R3 93

= (λ1 + λ3, λ1 + λ2 + λ3, λ2 + λ3)

o equivalentemente, los escalares λ1, λ2, λ3 resuelven el sistema de ecuacio-nes

λ1 + λ3 = η1

λ1 + λ2 + λ3 = η2

λ2 + λ3 = η3

Tal sistema de ecuaciones tiene determinante

D =

∣∣∣∣∣∣

1 0 11 1 10 1 1

∣∣∣∣∣∣=

∣∣∣∣∣∣

ξ1ξ2ξ3

t∣∣∣∣∣∣=

∣∣∣∣∣∣

ξ1ξ2ξ3

∣∣∣∣∣∣= (ξ1, ξ2, ξ3) 6= 0

lo que implica que ese sistema tiene solucion para las incognitas λ1, λ2, λ3.

De hecho, por El metodo de Cramer

λ1 =

∣∣∣∣∣∣

η1 0 1η2 1 1η3 1 1

∣∣∣∣∣∣D

=

∣∣∣∣∣∣

η1 η2 η3

0 1 11 1 1

∣∣∣∣∣∣D

=(η, ξ2, ξ3)

(ξ1, ξ2, ξ3)

λ2 =

∣∣∣∣∣∣

1 η1 11 η2 10 η3 1

∣∣∣∣∣∣D

=

∣∣∣∣∣∣

1 1 0η1 η2 η3

1 1 1

∣∣∣∣∣∣D

=(ξ1, η, ξ3)

(ξ1, ξ2, ξ3)

λ3 =(ξ1, ξ2, η)

(ξ1, ξ2, ξ3)B

Esto se puede generalizar en el siguiente Lema, enunciado apenas parael caso tridimensional.

LEMA 2.7 Si el conjunto ξ1, ξ2, ξ3 ⊂ R3 es una base de vectores paraR3 y η ∈ R3 es tal que η = λ1ξ1 + λ2ξ2 + λ3ξ3, entonces los coeficientesλ1, λ2, λ3 estan dados por las igualdades

λ1 =(η, ξ2, ξ3)

(ξ1, ξ2, ξ3), λ2 =

(ξ1, η, ξ3)

(ξ1, ξ2, ξ3), λ3 =

(ξ1, ξ2, η)

(ξ1, ξ2, ξ3)

EJEMPLO. Sea η = (−1, 3,−1) ∈ R3 y sea la base de R3 dada por

ξ1 = (1, 1, 0), ξ2 = (0, 1, 1), ξ3 = (1, 1, 1)

Page 94: Libro Mate 4

94 Vectores en R2 y R3

C Al calcular los determinantes, tenemos,

(ξ1, ξ2, ξ3) =

∣∣∣∣∣∣

ξ1ξ2ξ3

∣∣∣∣∣∣=

∣∣∣∣∣∣

1 1 00 1 11 1 1

∣∣∣∣∣∣= 1

(η, ξ2, ξ3) =

∣∣∣∣∣∣

ηξ2ξ3

∣∣∣∣∣∣=

∣∣∣∣∣∣

−1 3 −10 1 11 1 1

∣∣∣∣∣∣= −

∣∣∣∣1 11 1

∣∣∣∣+∣∣∣∣3 −11 1

∣∣∣∣ = 4

(ξ1, η, ξ3) =

∣∣∣∣∣∣

ξ1ηξ3

∣∣∣∣∣∣=

∣∣∣∣∣∣

1 1 0−1 3 −11 1 1

∣∣∣∣∣∣=

∣∣∣∣3 −11 1

∣∣∣∣−∣∣∣∣−1 −11 1

∣∣∣∣ = 4

(ξ1, ξ2, η) =

∣∣∣∣∣∣

ξ1ξ2η

∣∣∣∣∣∣=

∣∣∣∣∣∣

1 1 00 1 1−1 3 −1

∣∣∣∣∣∣=

∣∣∣∣1 13 −1

∣∣∣∣−∣∣∣∣

0 1−1 −1

∣∣∣∣ = −5

de donde, por el Lema 2.7 se tiene que

λ1 =(η1, ξ1, ξ2)

(ξ1, ξ2, ξ3)=

4

1= 4

λ2 =(ξ1, η, ξ3)

(ξ1, ξ2, ξ3)=

4

1= 4

λ3 =(ξ1, ξ2, η)

(ξ1, ξ2, ξ3)=−51

= −5

hacen que

λ1ξ1 + λ2ξ2 + λ3ξ3 = 4(1, 1, 0) + 4(0, 1, 1)− 5(1, 1, 1)

= (4, 4, 0) + (0, 4, 4) + (−5,−5,−5) = (4, 8, 4) + (−5,−5,−5)= (−1, 3,−1) = η. B

EJEMPLO. Sean los vectores basicos ξ1 = (1, 2), ξ2 = (−2, 1) de R2.Entonces dado η = (−1, 3) se tiene que

η = λ1ζ1 + λ2ξ2

para los valores de λ1 y λ2 dados por

λ1 =

∣∣∣∣ηξ2

∣∣∣∣∣∣∣∣ξ1ξ2

∣∣∣∣=

∣∣∣∣−1 3−2 1

∣∣∣∣∣∣∣∣

1 2−2 1

∣∣∣∣=

5

5= 1

Page 95: Libro Mate 4

2.4 El triple producto escalar y bases de R3 95

λ2 =

∣∣∣∣ξ1η

∣∣∣∣∣∣∣∣ξ1ξ2

∣∣∣∣=

∣∣∣∣1 2−1 3

∣∣∣∣∣∣∣∣

1 2−2 1

∣∣∣∣=

5

5= 1

Esto se comprueba directamente de la igualdad

λ1ξ1 + λ2ξ2 = 1(1, 2) + 1(−2,−1) = (1, 2) + (−2, 1) = (−1, 3) B

Consideremos ahora una base ξ1, ξ2, ξ3 de R3 y la ordenamos segunel signo del determinante dado por el triple producto escalar

(ξ1, ξ2, ξ3) =

∣∣∣∣∣∣

ξ1ξ2ξ3

∣∣∣∣∣∣

DEFINICION. Decimos que la base dada ξ1, ξ2, ξ3 de R3 tiene unaorientacion positiva a la derecha (regla de la mano derecha) si alconsiderar en el orden ξ1, ξ2, ξ3, el triple producto escalar

(ξ1, ξ2, ξ3)

es positivo.

EJEMPLO. Los vectores basicos

e1 = (1, 0, 0), e2 = (0, 0, 0), e3 = (0, 0, 1)

dados en ese orden le dan una orientacion a la derecha al espacio R3, envirtud de que

(e1, e2, e3) =

∣∣∣∣∣∣

e1e2e3

∣∣∣∣∣∣=

∣∣∣∣∣∣

1 0 00 1 00 1 0

∣∣∣∣∣∣= 1

EJEMPLO. En cambio, si se toma el orden de los vectores basicos cano-nicos dado por

e1 = (1, 0, 0), e3 = (0, 0, 1), e2 = (0, 1, 0)

entonces tal orden le da una orientacion negativa a la derecha a R3 envirtud de que

(e1, e3, e2) =

∣∣∣∣∣∣

e1e2e3

∣∣∣∣∣∣=

∣∣∣∣∣∣

1 0 00 0 10 1 0

∣∣∣∣∣∣= −1

Page 96: Libro Mate 4

96 Vectores en R2 y R3

EJEMPLO. El conjunto de vectores basicos

ξ1 = (1, 1, 0), ξ2 = (0, 1, 1), ξ3 = (1, 1, 1)

ordenados ası, le dan una orientacion a R3 positiva a la derecha en virtudde la igualdad

(ξ1, ξ3, ξ2) =

∣∣∣∣∣∣

ξ1ξ2ξ3

∣∣∣∣∣∣=

∣∣∣∣∣∣

1 1 00 1 11 1 1

∣∣∣∣∣∣= 1

EJEMPLO. Los vectores basicos ξ1 = (1, 2), ξ = (−2, 1) de R2 le danuna orientacion positiva a la derecha al plano en virtud de que el siguientedeterminante es positivo

∣∣∣∣ξ1ξ2

∣∣∣∣ =∣∣∣∣

1 2−2 1

∣∣∣∣ = 5

Se observa que al tomar dos vectores no nulos arbitrarios ξ, η, sı [ξ, η] 6=0, entonces los vectores unitarios

ξ

||ξ|| ,η

||η|| ,[ξ, η]

||[ξ, η]||

conforman una base que esta orientada positiva a la derecha (regla de lamano derecha) por la eleccion del producto [ξ, η].

Todos los conceptos mencionados forman parte de los conocimientosbasicos de los cursos de Geometrıa analıtica del plano y del espacio.

2.5 Vectores y valores propios de una matriz

En algunos problemas de aparicion cotidiana en las ciencias naturales y laingenierıa es necesario resolver una igualdad matricial del tipo

Aξ = λξ

donde A es una matriz cuadrada (n× n), ξ es un vector columna (n× 1) yλ es un escalar.

En otras palabras, dada un matriz cuadrada A, el problema es encontrarun vector ξ y un escalar λ que hagan valida la mencionada ecuacion.

Discutiremos el caso de dimension 3 y mencionaremos los resultadosque se pueden extender para dimensiones arbitrarias.

Page 97: Libro Mate 4

2.5 Vectores y valores propios de una matriz 97

Sea A una matriz de 3× 3,

A =

a11 a12 a13a21 a22 a23a31 a32 a33

y definimos el vector incognita ξ por el vector columna,

ξ =

ξ1

ξ2

ξ3

Entonces la ecuacion matricial se escribe

A =

a11 a12 a13a21 a22 a23a31 a32 a33

ξ1

ξ2

ξ3

= λ

ξ1

ξ2

ξ3

o bien,

000

=

a11 a12 a13a21 a22 a23a31 a32 a33

ξ1

ξ2

ξ3

− λ

ξ1

ξ2

ξ3

=

a11 a12 a13a21 a22 a23a31 a32 a33

ξ1

ξ2

ξ3

− λ

1 0 00 1 00 0 1

ξ1

ξ2

ξ3

=

a11 a12 a13a21 a22 a23a31 a32 a33

− λ

1 0 00 1 00 0 1

ξ1

ξ2

ξ3

que matricialmente se escribe

0 = (A− λI)ξ

y que induce el sistema de ecuaciones lineales

000

=

a11 − λ a12 a13a21 a22 − λ a23a31 a32 a33 − λ

ξ1

ξ2

ξ3

es decir, el sistema homogeneo en ξ1, ξ2, ξ3,

(a11 − λ)ξ1 + a12ξ2 + a13ξ

3 = 0a21ξ

1 + (a22 − λ)ξ2 + a23ξ3 = 0

a31ξ1 + a32ξ

2 + (a33 − λ)ξ3 = 0

Page 98: Libro Mate 4

98 Vectores en R2 y R3

Tal sistema lineal homogeneo tiene asociada a la matriz (A−λI), y porel teorema 1.7, el sistema lineal homogeneo obtenido tiene soluciones notriviales (ξ 6= (0, 0, 0)), si y solo sı, det (A − λI) = 0, donde det define laoperacion determinante de una matriz.

Caracterizamos a los escalares λ y a los vectores ξ que cumplen lacondicion matricial dada inicialmente, para la matriz A.

DEFINICION. Si A es una matriz cuadrada real, entonces el escalar λse dira un valor propio de A si satisface la ecuacion

det (λI −A) = 0

llamada la ecuacion caracterıstica de la matriz A.

Observamos que, de la relacion 0 = det(λI − A) = det(A − λI) paracalcular los valores propios de una matriz, ocuparemos cualquiera de estasecuaciones.

EJEMPLO. Calcule los valores propios de la matriz real de 2× 2

A =

(3 2−1 0

)

C Al realizar las operaciones matriciales

λI −A = λ

(1 00 1

)−(

3 2−1 0

)=

(λ− 3 −21 λ

)

se obtiene,

det(λI −A) = det

(λ− 3 −21 λ

)= λ2 − 3λ+ 2

lo que implica que la ecuacion caracterıstica de A es

λ2 − 3λ+ 2 = 0

Las raıces de esta ecuacion son λ = 1 y λ = 2, y son los valores propiosde A. B

EJEMPLO. Calcule los valores propios de la matriz

A =

(−2 −15 2

)

C Procediendo como en el ejemplo anterior se obtiene

det(λI −A) = det

(λ+ 2 1−5 λ− 2

)= λ2 + 1

Page 99: Libro Mate 4

2.5 Vectores y valores propios de una matriz 99

Con lo cual, los valores propios de A deben satisfacer la ecuacion cua-dratica λ2 + 1 = 0.

Dado que las unicas soluciones de esta ecuacion son los numeros ima-ginarios λ = i y λ = −i, se sigue A no tiene valores propios reales. B

EJEMPLO. Encuentre los valores propios de

A =

2 1 03 2 40 0 4

Como en los ejemplos anteriores, se obtiene

det(λI −A) = det

λ− 2 −1 0−3 λ− 2 00 0 λ− 4

= λ3 − 8λ2 + 17λ− 4

Por lo tanto, los valores propios de A deben satisfacer la ecuacion detercer grado

λ3 − 8λ2 + 17λ− 4 = 0

Por inspeccion λ = 4 es una raız, es decir,

(λ− 4)(λ2 − 4λ+ 1) = 0

consiguientemente, las raıces restantes de tal cubica satisfacen la ecuacion

λ2 − 4λ+ 1 = 0

la cual se puede resolver mediante la formula cuadratica.Por tanto, los valores propios de A son

λ = 4 λ = 2−√3 y λ = 2−

√3 B

DEFINICION. Sean, A una matriz cuadrada, y λ un valor propio de A.El vector ξ se dira un vector propio de A asociado a λ si satisface laecuacion matricial

(A− λI)ξ = 0

EJEMPLO. Sea la matriz cuadrada de 3× 3 dada por

A =

2 −1 0−1 2 00 0 4

Page 100: Libro Mate 4

100 Vectores en R2 y R3

C Calculamos sus valores propios resolviendo la ecuacion

0 = det(A− λI)

es decir,

0 =

∣∣∣∣∣∣

2− λ −1 0−1 2− λ 00 0 4− λ

∣∣∣∣∣∣= (4− λ)(λ2 − 4λ+ 3)

cuyas raıces son λ = 1, 3, 4.

Para calcular los vectores propios asociados a cada valor propio, consi-deramos la ecuacion matricial

(A− λI)ξ = 0

para cada valor de λ, es decir, el sistema homogeneo,

(2− λ)ξ1 − ξ2 = 0−ξ1 + (2− λ)ξ2 = 0

(4− λ)ξ3 = 0,ξ = (ξ1, ξ2, ξ3).

Para λ = 1 se tiene el sistema

ξ1 − ξ2 = 0−ξ1 + ξ2 = 0

3ξ3 = 0

Notamos que la primer ecuacion es la misma que la segunda, y quenecesariamente ξ3 = 0. Si ponemos x = t, entonces la solucion general deeste sistema es

(ξ1, ξ2, ξ3) = (t, t, 0) = t(1, 1, 0)

lo que indica que un vector propio asociado a λ = 1 es

ξ1 =

110

Para λ = 3 se obtiene el sistema homogeneo

−ξ1 − ξ2 = 0−ξ1 − ξ2 = 0

ξ3 = 0

cuya solucion general es del tipo

(ξ1, ξ2, ξ3) = (t,−t, 0) = t(1,−1, 0)

Page 101: Libro Mate 4

2.5 Vectores y valores propios de una matriz 101

lo cual implica que un vector propio asociado a λ = 3 es

ξ2 =

1−10

Analogamente, para λ = 4 se tiene el sistema lineal

−2ξ1 − ξ2 = 0−ξ1 − 2ξ2 = 0

0 ξ3 = 0

La tercer ecuacion nos dice que ξ3 es arbitraria, mientras que el sistemade 2 × 2 formado por las dos primeras ecuaciones tiene solo la soluciontrivial para ξ1, ξ2, debido a que

∣∣∣∣−2 −1−1 −2

∣∣∣∣ = 3 6= 0

Por lo tanto, la solucion general de este ultimo sistema homogeneo es

(ξ1, ξ2, ξ3) = (0, 0, t) = t(0, 0, 1)

lo que implica que un vector propio asociado a λ = 4 es

ξ3 =

001

De esta manera, el conjunto

ξ1 = (1, 1, 0), ξ2 = (1, 1, 0), ξ3 = (0, 0, 1)

es un conjunto de vectores propios de A.

Observamos que este conjunto es una base de R3 debido a que

(ξ1, ξ2, ξ3) =

∣∣∣∣∣∣

1 1 01 −1 00 0 1

∣∣∣∣∣∣= −2 6= 0 B

EJEMPLO. Sea la matriz

A =

1 2 −42 −2 −2−4 −2 1

Page 102: Libro Mate 4

102 Vectores en R2 y R3

Calculamos sus vectores y valores propios.

C Calculamos primeramente el determinante

0 =

∣∣∣∣∣∣

1− λ 2 −42 −2− λ −2−4 −2 1− λ

∣∣∣∣∣∣= λ3 − 27λ− 54

La ecuacion cubica obtenida tiene raıces enteras λ1 = 6, λ2 = −3, λ3 =−3, donde una de ellas es doble.

El sistema lineal homogeneo para un valor propio λ es

(1− λ)ξ1 + 2ξ2 − 4ξ3 = 02ξ1 + (−2− λ)ξ2 − 2ξ3 = 0−4ξ1 − 2ξ2 + (1− λ)ξ3 = 0,

ξ = (ξ1, ξ2, ξ3).

Para el valor propio doble λ = −3 se tiene el sistema lineal homogeneoen las incognitas ξ1, ξ2, ξ3,

4ξ1 + 2ξ2 − 4ξ3 = 02ξ1 + ξ2 − 2ξ3 = 3−4ξ1 − 2ξ2 + 4ξ3 = 0

Al resolver por El metodo de Gauss-Jordan, se tiene,

4 2 −4 02 1 −2 0−4 −2 4 0

(R1 − 2R2)→ R2, (R1 −R3)→ R3

4 2 −4 00 0 0 00 0 0 0

que induce la unica ecuacion con tres incognitas

4ξ1 + 2ξ2 − 4ξ3 = 0 ⇐⇒ 2ξ1 + ξ2 − 2ξ3 = 0

⇐⇒ ξ3 = ξ1 +1

2ξ2

Al poner ξ1 = t, ξ2 = s, la solucion general tiene la forma,

(ξ1, ξ2, ξ3) =

(t, s, t+

1

2s

)= (t, 0, t) +

(0, s,

1

2s

)

= t(1, 0, 1) + s

(0, 1,

1

2

)

Page 103: Libro Mate 4

2.5 Vectores y valores propios de una matriz 103

Esto es, los vectores obtenidos al tomar t = 1, s = 0 y t = 0 , s = 2,

ξ1 =

101

, ξ2 = 2

0112

=

021

son vectores propios asociados a λ = −3.Para el valor propio λ = 6 se tiene el sistema homogeneo

−5ξ1 + 2ξ2 − 4ξ3 = 02ξ1 − 8ξ2 − 2ξ3 = 0−4ξ1 − 2ξ2 − 5ξ3 = 0

que se resuelve mediante El metodo de Gauss-Jordan de la siguiente forma.

−5 2 −4 02 −8 −2 0−4 −2 −5 0

(2R1 + 5R2)→ R2, (4R1 − 5R3)→ R3

−5 2 −4 00 −36 −18 00 18 9 0

(R2 + 2R3)→ R3

−5 2 −4 00 −36 −18 00 0 0 0

(R2

18

)→ R2

−5 2 −4 00 2 1 00 0 0 0

Es decir, se tiene el sistema,

−5ξ1 + 2ξ2 − 4ξ3 = 0

2ξ2 − ξ3 = 0

en el cual, si se pone ξ2 = t se tiene una solucion general,

(ξ1, ξ2, ξ3) =

(6

5t, t, 2t

)= t

(6

5, 1, 2

)

De esta forma, tomando t = 5, se tiene el vector

ξ3 = 5

6/512

=

6510

Page 104: Libro Mate 4

104 Vectores en R2 y R3

que es un vector propio asociado a λ = 6.

Notamos que el sistema de vectores propios

ξ1 = (1, 0, 1), ξ2 = (0, 2, 1), ξ3 = (5, 6, 10)

es una base de vectores para R3, debido a que

(ξ1, ξ2, ξ3) =

∣∣∣∣∣∣

1 0 50 2 61 1 10

∣∣∣∣∣∣= −24 6= 0 B

EJEMPLO. Consideremos la matriz

A =

1 0 01 2 00 1 2

y procedamos a calcular sus vectores y valores propios.

C Un calculo directo nos muestra que

0 =

∣∣∣∣∣∣

1− λ 0 01 2− λ 00 1 2− λ

∣∣∣∣∣∣= (1− λ)(2− λ)2

lo que nos indica inmediatamente que los valores propios son λ1 = 1, λ2 = 2y λ3 = 2.

El sistema de ecuaciones lineales homogeneas que nos ayuda a calcularlos vectores propios es

(1− λ)ξ1 = 0ξ1 + (2− λ)ξ2 = 0ξ2 + (2− λ)ξ3 = 0

De esta forma, para el valor propio λ = 1 se tiene el sistema lineal,

0ξ1 = 0ξ1 + ξ2 = 0ξ2 + ξ3 = 0

lo que nos indica que ξ1 es arbitrario y que ξ2 = −ξ1, ξ3 = ξ1. En otraspalabras, la solucion general es

(ξ1, ξ2, ξ3) = (t,−t, t) = t(1,−1, 1)

Page 105: Libro Mate 4

2.5 Vectores y valores propios de una matriz 105

y por lo tanto,

ξ1 =

1−1−1

es un vector propio asociado a λ = 1.

Para el caso λ = 2 se tiene el sistema lineal

−ξ1 = 0ξ1 + 0ξ2 = 0ξ2 + 0ξ3 = 0

⇐⇒

ξ1 = 00ξ2 = 0

ξ2 + 0ξ3 = 0

lo que nos indica, de la primera ecuacion que ξ1 = 0, de la tercera queξ2 = 0 y que ξ3 es arbitrario, es decir, la solucion del sistema es del tipogeneral

(ξ1, ξ2, ξ3) = (0, 0, t) = t(0, 0, 1)

De esta manera, el vector

ξ3 =

001

es el unico vector propio asociado a λ = 2. B

De la discusion inicial se tiene el siguiente resultado.

TEOREMA 2.2 Las siguientes proposiciones son equivalentes para unamatriz cuadrada (n× n) dada.a. A tiene un valor propio λ.

b. det(A− λI) = 0.

c. Existe un vector propio ξ para A asociado al valor propio λ.

Una matriz cuadrada se dice diagonal si sus entradas que no estansobre su diagonal son todas identicamente nulas.

EJEMPLO. La matriz cuadrada

D =

1 0 00 3 00 0 4

es una matriz diagonal.

DEFINICION. Una matriz cuadrada real (n × n) A se dice diagonali-zable si existe una matriz invertible B tal que el producto B−1AB es unamatriz diagonal. En este caso se dice que B diagonaliza a la matriz A.

Tenemos el siguiente resultado para el proceso de diagonalizacion deuna matriz cuadrada.

Page 106: Libro Mate 4

106 Vectores en R2 y R3

TEOREMA 2.3 Para una matriz cuadrada A de (n×n) son equivalenteslas siguientes proposiciones.

a. A es diagonalizable

b. Los vectores propios A conforman una base de Rn y la matriz B formadapor los vectores propios de A (como vectores columna) diagonaliza A.

C Daremos la prueba apenas para las matrices de 3× 3, indicando quepara dimensiones mayores la prueba es analoga.

Suponemos que A = A3×3 es diagonalizable. Entonces existe una matriz

B =

b11 b12 b13b21 b22 b23b31 b32 b33

tal que B−1 AB es una matriz diagonal D = B−1AB que tiene forma,

D =

λ1 0 00 λ2 00 0 λ3

Esto implica necesariamente que BD = AB.

Por un lado, se tiene

BD =

b11 b12 b13b21 b22 b23b31 b32 b33

λ1 0 00 λ2 00 0 λ3

=

λ1b11 λ2b12 λ3b13λ1b21 λ2b22 λ3b23λ1b31 λ2b32 λ3b33

= (λ1b1 λ2b2 λ3b3)

donde hemos escrito a la ultima matriz mediante sus columnas.

Por otro lado, si escribimos a la matriz B mediante sus columnas, de lamultiplicacion de matrices se tiene

AB = A(b1 b2 b3) = (Ab1 Ab2 Ab2)

De esta manera, al igualar columnas en la igualdad AB = BD se ob-tienen las igualdades

Ab1 = λ1b1, Ab2 = λ2B2, Ab3 = λ3b3

es decir, b1, b2, b3 es un conjunto de vectores propios de A asociados a losvalores propios correspondientes λ1, λ2, λ3.

Page 107: Libro Mate 4

2.5 Vectores y valores propios de una matriz 107

Por otro lado, debido a que B es invertible, se cumple la relacion

(b1, b2, b3) =

∣∣∣∣∣∣

b11 b12 b13b21 b22 b23b31 b32 b33

∣∣∣∣∣∣6= 0

que hace de b1, b2, b3 una base de vectores propios para R3. Esto demues-tra que a. implica b.

Para probar la recıproca, sean ξ1, ξ2, ξ3 los vectores propios de Aasociados a los valores propios λ1, λ2 y λ3 respectivamente, y sea

B = (ξ1 ξ2 ξ3) =

ξ11 ξ21 ξ31ξ12 ξ22 ξ32ξ13 ξ23 ξ33

Entonces B es invertible pues los vectores son linealmente independien-tes.

Por las consideraciones anteriores se tiene que

AB = A(ξ1 ξ2 ξ3) = (Aξ1 Aξ2 Aξ3)

= (λ1ξ1 λ2ξ2 λ3ξ3) = (ξ1 ξ2 ξ3)

λ1 0 00 λ2 00 0 λ3

= BD

donde D es la matriz diagonal, cuyas entradas diagonales son los valorespropios de A, es decir,

D =

λ1 0 00 λ2 00 0 λ3

De esta manera, B diagonaliza a A pues se cumple la igualdad matricialAB = BD, o equivalentemente, B−1AB = D. Esto termina la prueba delteorema. B

Otro resultado util para el proceso se diagonalizacion es el siguiente,cuya prueba omitimos por ser mas tecnica.

LEMA 2.8 Si los valores propios de una matriz cuadrada A son todosdiferentes entre sı, entonces los vectores propios de A conforman una basede vectores propios.

Este resultado, junto con el teorema 2.3, implica el siguiente que es degran utilidad.

Page 108: Libro Mate 4

108 Vectores en R2 y R3

TEOREMA 2.4 Si la matriz cuadrada A de n× n tiene diferentes entresı a todos sus valores propios, entonces es diagonalizable.

Esto implica necesariamente que BD = AB. C Por el Lema 2.8, si losvalores propios de A son diferentes entre sı, entonces los vectores propiosde A conforman una base de Rn. Por el teorema 2.3, A es necesariamentediagonalizable B

EJEMPLO. Para la matriz cuadrada

A =

2 −1 0−1 2 00 0 4

se obtuvieron los vectores propios

ξ1 = (1, 1, 0), ξ2 = (1,−1, 0), ξ2 = (0, 0, 1)

asociados a los valores propios λ = 1, λ3 = 3 y λ = 4 respectivamente, yque conforman una base de R3.

Sea B la matriz

B =

1 1 01 −1 00 0 1

que cambia la base canonica e1, e2, e3 por la base de vectores propiosξ1, ξ2,ξ3.

Por el teorema 1.5 se tiene que

B−1 =

1/2 1/2 01/2 −1/2 00 0 1

y un calculo directo prueba que

B−1AB =

1/2 1/2 01/2 −1/2 00 0 1

2 −1 0−1 2 00 0 4

1 1 01 −1 00 0 1

=

1/2 1/2 03/2 −3/2 00 0 4

1 1 01 −1 00 0 1

=

1 0 00 3 00 0 4

es una matriz diagonal, con los valores propios como elementos diagonales.

Consecuentemente A es diagonalizable por la matriz B. B

Page 109: Libro Mate 4

2.5 Vectores y valores propios de una matriz 109

El siguiente ejemplo nos muestra que una matriz A puede ser diagonal-izable, aun sin tener todos sus valores propios distintos.

EJEMPLO. Para la matriz cuadrada

A =

1 2 −42 −2 −2−4 −2 1

se obtuvo una base de vectores propios

ξ1 = (1, 0, 1), ξ2 = (0, 2, 1), ξ3 = (5, 6, 10),

asociados a los vectores propios λ1 = λ2 = −3 y λ3 = 6 respectivamente.

Sea la matriz B dada por

B =

1 0 50 2 61 1 10

que cambia la base canonica e1, e2, e3 por la base de vectores propiosobtenida.

Mediante El metodo de Gauss-Jordan de la seccion 1.8 se puede obtenerque

B−1 =

7/2 5/4 −5/23/2 5/4 −3/2−1/2 −1/4 1/2

y un calculo directo demuestra que

B−1AB =

7/2 5/4 −5/23/2 5/4 −3/2−1/2 −1/4 1/2

1 2 −42 −2 −2−4 −2 1

1 0 50 2 61 1 10

=

−3 0 00 −3 00 0 6

En otras palabras, la matriz B diagonaliza a la matriz A. B

EJEMPLO. Al considerar la matriz

A =

1 0 01 2 00 1 2

Page 110: Libro Mate 4

110 Vectores en R2 y R3

se obtuvieron los valores propios λ1 = 1 y λ2 = 2, y apenas dos vectorespropios correspondientes a tales valores propios

ξ1 = (1,−1,−1), ξ2 = (0, 0, 1)

C Como este conjunto es linealmente independiente, pero no conformauna base de R3, se sigue que la matriz A no es diagonalizable. B

Sobre metodos mas generales de diagonalizacion el lector interesadopuede referirse al trabajo de Anton (1981), donde encontrara mas datos.

2.6 Rectas y Planos en R3

En esta parte introducimos los conceptos de recta y plano como objetoscontenidos en un espacio tridimensional, caracterizandolos mediante loselementos que les definen.

Rectas en el espacio

Dados, un punto p ∈ Rn y un vector ξ, los puntos q de la recta L ⊂ Rn quepasa por p y es paralela a ξ satisfacen la ecuacion

q = p+ tξ

para algun numero real t ∈ R (vease la figura 2.11).

ξ

p

0

q

Figura 2.11: La recta en Rn.

DEFINICION. Decimos que la ecuacion

q = p+ tξ, t ∈ R

es la ecuacion de la recta contenida Rn por el punto p con el vectordirector ξ. Se llama tambien ecuacion parametrica de L pues dependedel parametro t.

Page 111: Libro Mate 4

2.6 Rectas y Planos en R3 111

EJEMPLO. Hallar la ecuacion parametrica de la recta L en el plano quepasa por los puntos p1 = (3, 2) y p2 = (4, 1).

C La recta pasa por p = (4, 1) y la dirige el vector de posicion

ξ = p2 − p1 = (4, 1)− (3, 2) = (1,−1)

De esta manera, si q = (x, y) esta sobre la recta, entonces satisface larelacion

(x, y) = (4, 1) + t(1,−1) = (4, 1) + (t,−t)= (4 + t, 1− t)

En otras palabras, el par de ecuacionesx = 4 + ty = 1− t , t ∈ R

definen a la recta L.

Si en las relaciones anteriores despejamos t, t = x−4, t = 1−y, entonces,al igualar tales ecuaciones se obtiene

x− 4 = 1− y

que implica la igualdady = −x+ 5

que tambien define a la recta L, pero sin parametro (vease la figura 2.12)B

EJEMPLO. Hallar la ecuacion de la recta L en R4 que pasa por los puntos

p1 = (2, 3, 4, 2), p2 = (6, 4,−5, 1)

C Tal recta pasa por p = (2, 4, 3, 2) y tiene vector director

ξ = p1 − p2 = (2, 4, 3, 2)− (6, 4,−5, 1) = (−4, 0, 8, 1)Por lo tanto, en las coordenadas (x, y, z, w) se tiene que todo punto

q = (x, y, z, w) ∈ L, cumple las igualdades

(x, y, z, w) = (2, 4, 3, 2) + t(−4, 0, 8, 1) = (2, 4, 3, 2) + (−4t, 0, 8t, t)

= (2− 4t, 4, 3 + 8t, 2 + t)

Esto es, la recta L se define por el sistema parametrico

x = 2− 4t

y = 4

z = 3 + 8t

w = 2 + t

t ∈ R

Page 112: Libro Mate 4

112 Vectores en R2 y R3

-1

11

2

2

(3,2)

(4,1)

3

3 4

ξ

Figura 2.12: Recta y = −x+ 5

Para ilustrar, evaluamos en estas igualdades algunos argumentos tem-porales t ∈ R.

Si se toma t = 0 entonces el punto (x = 2, y = 4, z = 3, w = 2) esta enla recta L.

Si t = −1, entonces tambien el punto con coordenadas x = 6, y = 4, z =−5, w = 1 pertenece a L. B

En particular, aquı estamos interesados en las rectas contenidas enR3, tal que si pasan por un punto p = (a, b, c) con vector director ξ =(ξ1, ξ2, ξ3), se tenga su definicion mediante un sistema que tenga la forma,

x = ξ1t+ ay = ξ2t+ bz = ξ3t+ c

Planos en el espacio

Dados, un punto p ∈ R3 y un vector n ∈ R3, se define la ecuacion delplano P pasando por el punto p con el vector normal (ortogonal) n, comoel conjunto de puntos q (variables) ∈ R3, tales que satisfacen la ecuacion.

< n, q − p >= 0

o bien, la ecuacion equivalente,

< n, q >=< n, p >

La figura 2.13 ilustra la definicion para el plano 2-dimensional en R3.

Notamos que para el caso de Rn, se pueden hacer definiciones analogaspara un (n− 1)-plano.

Page 113: Libro Mate 4

2.6 Rectas y Planos en R3 113

q-pp

n

n

0q

Figura 2.13: El plano en R3.

EJEMPLO. Sea el punto p = (−3, 1, 2) en R3 y sea n = (−4, 5, 3) unvector en R3. La ecuacion del plano por el punto p y normal n es, encoordenadas q = (x, y, z), viene dado por la igualdad

C < (−4, 5, 3), (x, y, z) >=< (−4, 5, 3), (−3, 1,−2) >o equivalentemente,

−4x+ 5y + 3z = 12 + 5− 6 = 11

lo cual implica que la ecuacion buscada del plano en R3 es

−4x+ 5y + 3z = 11 B

En general, para la ecuacion

< n, q >=< n, p >

del plano P pasando por p = (p1, p2, p3) con vector normal n = (a, b, c) setiene que en las coordenadas (x, y, z) los puntos q = (x, y, z) de P satisfacenla ecuacion

< (a, b, c), (x, y, z) >=< (a, b, c) , (p1, p2, p3) >

o equivalentemente, satisfacen la ecuacion

ax+ by + cz = ap1 + bp2 + cp3 = d

De esta forma, una ecuacion del tipo

ax+ by + cz = d

representa la ecuacion de un plano en R3 conteniendo un vector normaln = (a, b, c).

Page 114: Libro Mate 4

114 Vectores en R2 y R3

EJEMPLO. La ecuacion

2x+ 3y + 6z = 1

representa a un plano en R3 con un vector normal n = (2, 3, 6)

C Si hacemos y = 0, z = 0 sobre el plano R2y,z entonces, de la ecuacion

dada se tiene 2x = 1, lo que implica que x = 12 .

Por otro lado, si hacemos y = 0, x = 0 sobre el plano R2x,y entonces se

obtendrıa que en este caso z = 16

Finalmente, si tomamos x = 0, z = 0 sobre el plano R2x,z, entonces, a

partir de la ecuacion del plano se tiene que y = 13 .

Lo anterior nos da los cortes del plano sobre los ejes, y la extension deltriangulo mostrado en la figura 2.14 nos realiza totalmente el plano. B

1

1

1

3

2

6

Figura 2.14: Parte del plano 2x+ 3y + 6z = 1 en el primer octante.

OBSERVACION. Dos planos P1, P2 en el espacio son paralelos si susrespectivos vectores normales son paralelos.

EJEMPLO. Sean los planos en R3, dados por las ecuaciones

−x+ 2y − 4z = 2, 3x− 6y + 12z = 7

C Sus normales respectivos son

n1 = (−1, 2,−4), y n2 = (3,−6, 12)

Al calcular el producto vectorial de estos normales,

[n1, n2] =

∣∣∣∣∣∣

e1 e2 e3−1 2 −43 −6 12

∣∣∣∣∣∣

= e1(24− 24)− e2(−12 + 12) + e3(6− 6) = (0, 0, 0)

Page 115: Libro Mate 4

2.6 Rectas y Planos en R3 115

se concluye que n1 y n2 son paralelos, lo que implica que los planos sonparalelos. B

Generalizamos la idea de angulo formado entre dos planos.

DEFINICION. Sean dos planos P1, P2 contenidos en R3 y sean n1, n2sus normales respectivos. Se define el angulo θ formado por los planos P1

y P2 como el angulo θ formado por sus normales n1 y n2. La figura 2.15ilustra esta definicion.

EJEMPLO. Dados los planos en R3

x+ 2y + 3z = 1, x− 2y + z = 3

verificar si son paralelos. De no serlo, calcular su interseccion y el anguloentre ellos.

P

P

nn

2

1

12

θ

θ

Figura 2.15: Angulo formado por dos planos en R3.

C Los vectores normales respectivos son

n1 = (1, 2, 3) y n2 = (1,−2, 1)

con lo que tenemos,

[n1, n2] =

∣∣∣∣∣∣

e1 e2 e31 2 31 −2 1

∣∣∣∣∣∣= (2 + 6,−(1− 3),−2− 2)

= (8, 2,−4) 6= (0, 0, 0)

Por lo tanto, los normales n1 y n2 no son paralelos y consecuentementelos planos se intersectan. Los puntos (x, y, z) contenidos en la intersecciondeberan satisfacer ambas ecuaciones.

Page 116: Libro Mate 4

116 Vectores en R2 y R3

Tales puntos se determinan al resolver el sistema lineal 2× 3,

x+ 2y + 3z = 1x− 2y + z = 3

el cual, al hacer z = t induce el sistema,

x+ 2y = 1− 3tx− 2y = 3− t

Utilizamos La regla de Cramer para resolver este sistema. Calculandolos determinantes, obtenemos,

D =

∣∣∣∣1 21 −2

∣∣∣∣ = −4

Dx =

∣∣∣∣1− 3t 23− t −2

∣∣∣∣ = −2(1− 3t)− 2(3t) = 8t− 8

Dy =

∣∣∣∣1 1− 3t1 3− t

∣∣∣∣ = (3− t)− (1− 3t) = 2t+ 2

y de esta manera,

x =Dx

D=

8t− 8

−4 = −2t+ 2

y =Dy

D=

2t+ 2

−4 = −1

2t− 1

2

Por lo tanto, la solucion del sistema (interseccion de los planos) es larecta parametrizada

x = −2t+ 2y = − 1

2 t− 12

z = t

donde t ∈ R es un parametro temporal.

En particular, si t = 0 se tiene la solucion particular x = 2, y = − 12 , z =

0, es decir, el punto(2, 12 , 0

)esta en ambos planos, lo que se verifica direc-

tamente al sustituir en las ecuaciones de los planos,

2 + 2

(− 1

2

)+ 3(0) = 1

2− 2(− 1

2

)+ 0 = 3

Para calcular el angulo entre los planos se calcula el angulo θ entre susvectores normales

θ = arccos

(< n1, n2 >

||n1||||n2||

)= arccos

(1− 4 + 3√

14√6

)

Page 117: Libro Mate 4

2.6 Rectas y Planos en R3 117

es decir,

θ = arccos(0) =π

2

lo que nos dice que los planos son ortogonales. B

Es facil probar el siguiente Lema utilizando las ideas del ejemplo ante-rior.

LEMA 2.9 Si la pareja de planos

a1x+ b1y + c1z = d1a2x+ b2y + c2z = d2

no es paralela, entonces se intersectan en una recta parametrizada. Masaun, forman el angulo θ dado por,

θ = arccos

(< n1, n2 >

||n1|| ||n2||

)

donde n1 = (a1, b1, c1), n2 = (a2, b2, c2) son los normales respectivos.

C Es un calculo directo al resolver el sistema de ecuaciones lineales dadopor los planos. B

EJEMPLO. Calcular la interseccion de los planos en R3,

x− y + 3z = 93x− 5y + z = −44x− 7y + z = 5

C Resolvemos el sistema de ecuaciones de 3 × 3 usando La regla deCramer.

D =

∣∣∣∣∣∣

1 −1 33 −5 14 −7 1

∣∣∣∣∣∣=

∣∣∣∣−5 1−7 1

∣∣∣∣+∣∣∣∣3 14 1

∣∣∣∣+ 3

∣∣∣∣3 −54 −7

∣∣∣∣ = −2

Dx =

∣∣∣∣∣∣

9 −1 3−4 −5 15 −7 1

∣∣∣∣∣∣= 3

∣∣∣∣−4 −55 −7

∣∣∣∣−∣∣∣∣9 −15 −7

∣∣∣∣+∣∣∣∣

9 −1−4 −5

∣∣∣∣ = 168

Dy =

∣∣∣∣∣∣

1 9 33 −4 14 5 1

∣∣∣∣∣∣= 3

∣∣∣∣3 −44 5

∣∣∣∣−∣∣∣∣1 94 5

∣∣∣∣+∣∣∣∣1 93 −4

∣∣∣∣ = 93

Page 118: Libro Mate 4

118 Vectores en R2 y R3

Dz =

∣∣∣∣∣∣

1 −1 93 −5 −44 −7 5

∣∣∣∣∣∣=

∣∣∣∣−5 1−7 5

∣∣∣∣+∣∣∣∣3 −44 5

∣∣∣∣+ 9

∣∣∣∣3 −54 −7

∣∣∣∣ = −7

Por lo tanto, las soluciones al sistema son

x =Dx

D=

168

−2 = −84, y =Dy

D=

93

−2 = −93

2, z =

Dz

D=−7−2 =

7

2

De esta manera, el punto donde se intersectan los planos tiene coorde-nadas

p =

(−84,−93

2,7

2

)B

De igual forma, para dimensiones mayores (n ≥ 3) podemos definir laecuacion de un plano en Rn (hiperplano) mediante los mismos elementos,n vector normal, p punto por donde pasa y q el vector variable, utilizandola ecuacion

< n, p >=< n, q >

Por ejemplo, la ecuacion

6x− 3y + z − 2w + 3v = 8

define un plano de dimension 4 en el espacio R5 en el sistema de coordenadas(x, y, z, v, w) con un vector normal n = (6,−3, 1,−3,−2).EJEMPLO. Calcular la interseccion en R4 de los hiperplanos de di-mension 3, definidos por,

2x+ 7y + 3z + t = 5x+ 3y + 5z − 2t = 3z + 5y − 9z + 8z = 1

5x+ 18y + 4z + 5t = 12

C Para calcular la interseccion es necesario resolver el sistema, y lorealizamos mediante El metodo de Gauss-Jordan.

2 7 3 1 51 3 5 −2 31 5 −9 8 15 18 4 5 12

(R1 ↔ R2)

1 3 5 −2 32 7 3 1 51 5 −9 8 15 18 4 5 12

(2R1 −R2)→ R2,

Page 119: Libro Mate 4

2.6 Rectas y Planos en R3 119

(R1 −R3)→ R3, (5R1 −R4)→ R4

1 3 5 −2 30 −1 7 −5 10 −2 14 −10 20 −3 21 −15 3

(R3

2

)→ R3,

(R4

−3

)→ R4

1 3 5 −2 30 −1 7 −5 10 1 −7 5 −10 1 −7 5 −1

(R3 +R2)→ R3, (R4 +R2)→ R4

1 3 5 −2 30 −1 7 −5 10 0 0 0 00 0 0 0 0

De esta manera, nos queda el sistema lineal de 2× 4 dado porx+ 3y + 5z − 2t = 3−y + 7z − 5t = 1

,

Tal sistema lo resolvemos por La regla de Cramer en virtud de que

D =

∣∣∣∣1 30 −1

∣∣∣∣ = −1

lo que nos asegura que el sistemax+ 3y = 3− 5z + 2t−y = 1− 7z + 5t

tiene solucion en dos variables libres z, t.La segunda ecuacion indica la solucion para la variable y, y es suficiente

con calcular solo el siguiente determinante,

Dx =

∣∣∣∣3− 5z + 2t 31− 7z + 5t −1

∣∣∣∣ = −6 + 26z − 17t

De esta manera,

x =Dx

D=−6 + 26z − 17t

−1y por lo tanto, las soluciones se escriben

x = 6− 26 + 17ty = −1 + 7z − 5t

z = zt = t

Page 120: Libro Mate 4

120 Vectores en R2 y R3

para argumentos reales arbitrarios de z y t.

Este ultimo sistema define a un plano de dimension 2 contenido en R4,esto es, la interseccion de los hiperplanos dados de dimension 3 es un planode dimension 2. B

Distancia de un punto a un plano

Dados, un plano P y un punto p ∈ R3, la distancia de p al plano P es ladistancia ortogonal de p a los puntos q del plano P.

P

p

l

Figura 2.16: Distancia de un punto a un plano.

Para calcular la distancia mencionada, se procede de la siguiente ma-nera.

C Si el plano P se define por la ecuacion

ax+ by + cz = d

entonces n = (a, b, c) es un vector normal p.Por otro lado, cuando el punto q ∈ P nos da la distancia ortogonal

buscada, entonces el vector p− q es multiplo de n, es decir,

p− q = tn

para algun escalar t (ya que son paralelos), lo que implica que

||p− q|| = |t| ||n||.

Por otro lado, al buscar q ∈ P , este punto esta en la recta con un vectorn que se une a p con q, escrita de la forma

x = t a+ p1y = t b+ p2z = t c+ p3

Page 121: Libro Mate 4

2.6 Rectas y Planos en R3 121

donde p = (p1, p2, p3) y n = (a, b, c) es el vector director de la recta.

Buscamos entonces un escalar t tal que la recta contenga un punto q ∈ Pq satisfaciendo el sitema que define a la recta, pero ademas q este tambiencontenido en P . Para esto, q = (x, y, z) ∈ L debe tambien satisfacer laecuacion del plano, es decir,

d = a(ta+ p1) + b(tb+ p2) + c(tc+ p3) = t(a2 + b2 + c2) + ap1 + bp2 + cp3

= (ap1 + bp2 + cp3) + t(a2 + b2 + c2)

lo que indica, al despejar t,

t =d− (ap1 + bp2 + cp3)

(a2 + b2 + c2)=d− (ap1 + bp2 + cp3)

||n||2

Por otro lado, el punto q ∈ P debe satisfacer ademas la relacion

||q − p|| = |t| ||n||

siendo ||q − p|| la distancia buscada de q a p.

Si entendemos por ` a tal distancia, se tiene

` = |t| ||n|| = |d− (ap1 + bp2 + cp3)|||n||2 ||n||

lo que implica

` =|d− (ap1 + bp2 + cp3)|

||n||

Se resume la anterior discusion en el siguiente lema.

LEMA 2.10 La distancia ` del punto p = (p1, p2, p3) al plano P definidopor la ecuacion

ax+ by + cz = d

se calcula por la formula

` =|d− (ap1 + bp2 + cp3)|

||n||

donde n = (a, b, c) es el normal a PSi p = (p1, p2, p3) esta en el plano, entonces satisface la ecuacion del

plano, es decir,0 = d− (ap1 + bp2 + cp3)

y, por lo tanto, su distancia al plano P es cero.

Page 122: Libro Mate 4

122 Vectores en R2 y R3

EJEMPLO. Sea el plano P dado por la ecuacion

3x+ 2y − z = −1

y tomemos el punto p = (2, 5, 6).

C La distancia ` del punto p al plano P es calculada mediante la cadenade igualdades,

` =| − 1− [3(2) + 2(5)− 6]|√

9 + 4 + 1=| − 1− 10|√

14=

11√14

B

Ejercicios

1. Calcular < ξ, η > para cada pareja de vectores dada.

a. ξ = (−1, 2), η = (3, 1)b. ξ = (−1, 0, 1), η = (1, 2, 3)c. ξ = (−1, 2, 3), η = (1, 2,−4)d. ξ = (1, 1, 0,−1), η = (−1, 0, 1, 2)e. ξ = (4,−2, 3,−1), η = (−1,−2, 3,−4)

¿Cuales de las parejas de vectores dados son ortogonales?

2. Calcular ||ξ|| y ||η|| en cada uno de los incisos del ejercicio 1.

3. Calcular el coseno del angulo formado por cada pareja de vectores ξ yη del ejercicio 1.

4. Calcular los angulos del triangulo formado por los puntosa. (−1, 1, 1), (1,−2, 3), (3,−1, 1)b. (1, 0, 0), (0, 1, 0), (0, 0, 1)

5. a. Calcular la proyeccion de ξ y η de todos los vectores del ejercicio 1.b. Calcular la proyeccion de η en ξ de todos los vectores del ejercicio 1.

6. Demostrar que para dos vectores ξ, η con angulo θ entre ellos se cumplela formula

||ξ − η||2 = ||ξ||2 + ||η||2 − 2||ξ||||η|| cos θ

7. Calcular el producto vectorial [ξ, η] de los vectoresa. ξ = (2, 3,−1) η = (6, 2, 3)b. ξ = (−6, 0, 5) η = (3, 0, 3)c. ξ = (1, 0,−1) η = (−1, 0, 2)d. ξ = (1, 2, 3) η = (2, 4, 6)

¿Cuales de las parejas de vectores dados son paralelos?

8. Calcular el area del paralelogramo formado por los vectores ξ y η encada inciso del ejercicio 7.

Page 123: Libro Mate 4

2.6 Rectas y Planos en R3 123

9. Calcule el volumen del paralelepıpedo formado por las siguientes ternasde vectores. Calcule primero su triple producto escalar.a. ξ = (2, 0, 1), η = (1, 3, 2), ζ = (4,−1, 1)b. ξ = (−2, 1, 1), η = (−4, 3, 2), ζ = (0, 0, 1)c. ξ = (0,−1,−1), η = (0, 0,−1), ζ = (−1, 2, 3)d. ¿Cuales son una base de vectores en R3 ?e. Escriba el vector (−3,−4, 1) como combinacion lineal de cada baseencontrada.

10. ¿Cuales de las siguientes matrices son diagonalizables?

a. A =

(−11 12−20 17

)b. A =

(−2 3−1 1

)

c. A =

(1 0

1/2 1

)d. A =

(1 06 −1

)

e. A =

3 0 00 2 10 0 2

f . A =

2 0 00 2 20 2 2

g. A =

1 0 −11 −3 04 −13 1

h. A =

2 0 −20 3 00 0 1

i. A =

−1 4 −2−3 4 0−3 1 3

j. A =

3 0 01 3 00 1 3

Para el caso afirmativo, calcule la matriz B, que cambia la base canonicapor la base de vectores propios, tal que B−1AB sea diagonal. Compruebe,realizando el calculo, que B−1AB es diagonal, y que los vectores propiosque conforman B son una base.

11. Encontrar la ecuacion parametrica de la recta que pasa por los puntosindicados

a. (1, 1,−1) y (4, 3, 2)

b. (0, 1,−6) y (−4, 0, 2)c. (1,−2) y (2, 1)

d. (1, 1,−1, 1) y (4, 4,−4, 4)12. Calcular la ecuacion parametrica de la recta por p con direccion ξ paracada pareja dada.

a. p = (1, 1,−1), ξ = (−2, 3,−1)b. p = (−2, 1), ξ = (4, 2)

c. p = (2, 3, 0), ξ = (−1, 2, 3)

Page 124: Libro Mate 4

124 Vectores en R2 y R3

d. p = (0, 1, 1, 2), ξ = (−1, 3, 4, 2)13. Dar la ecuacion de la recta que tiene un vector director ξ que esortogonal a los vectores ζ = (1, 1, 1) y η = (−1, 0, 1) , y que pasa por elpunto (−3, 1, 2).14. Calcular la ecuacion del plano que pasa por el punto dado p y tienevector normal n para cada pareja dada.

a. n = (−1, 1, 2), p = (2, 3,−1)b. n = (4,−2, 3), p = (−1, 4, 1)c. n = (−1, 5, 3), p = (4, 1, 6)

15. Calcular la ecuacion del plano que pasa por los tres puntos dados

a. (1, 1, 1), (2, 1,−1), (3, 0, 1)b. (3,−2,−1), (1, 2, 3), (2,−3, 1)c. (4, 0, 2), (2,−1, 0), (0, 2, 3)

16. Calcular el angulo con el que se intersectan los planosa. definidos por a. y b. en el ejercicio 14.b. definidos por a. y b. en el ejercicio 15.c. definidos por c. del ejercicio 14 y c. del ejercicio 15.

d.

x+ y + x = 1−x+ y − z = 0

e.

2x− y − z = 33x+ y − 2z = 1

17. Calcular la interseccion de las parejas de planos dadas en todos losincisos del ejercicio 16.

18. Calcular la ecuacion de la recta que pasa por el punto p y cuyo vectordirector ξ es el normal al plano P cuando:a. p = (1, 1, 1) y P pasa por los puntos (1, 1,−1), (−2, 3, 1), (6, 2, 0)b. p = (1, 0, 3) y P es ortogonal a los planos

x− y + z = 2−x+ y − z = 1

c. p = (2, 3, 1) y P es paralelo al plano qua pasa por los puntos(4, 2,−1), (0, 1,−3), (1, 0, 2)

19. Calcular la interseccion de la recta L con el plano P , si

a. L y P son la recta y el plano de a. en el ejercicio 18.

b. L y P son la recta y el plano de c. en el ejercicio 18.

c. L es la recta por p = (1, 3, 4) con vector director ξ = (2, 1, 0), y P es elplano con ecuacion 2x− y + z = 4

Page 125: Libro Mate 4

2.6 Rectas y Planos en R3 125

20. Calcular la distancia del punto p al plano P si

a. p = (1, 0, 3), P : 6x− 8y + z = 6.

b. p = (−2, 1, 3), P : x+ y + z = 2.

c. p = (4, 3, 2), P pasa por los puntos. (1, 1, 1), (0, 0, 0), (−1, 1,−1)

Page 126: Libro Mate 4

126 Vectores en R2 y R3

Page 127: Libro Mate 4

Capıtulo 3

Curvas en R2 y en R3

3.1 Curvas suaves

En este capıtulo estudiamos aquellos objetos geometricos en R3 conocidoscomo curvas. Lo hacemos de dos maneras, como la imagen de una funcionvectorial de variable real, y como objetos para los cuales localmente seven como una imagen de cierta funcion vectorial de variable real (curvasparametrizadas). Iniciamos la discusion con un ejemplo.

EJEMPLO. Una recta en R3 es un objeto que se describe por un puntodonde pasa p = (p1, p2, p3) y un vector director ξ = (ξ1, ξ2, ξ3).

C Su ecuacion se describe como una relacion de tipo

γ : R→ R3

donde a cada punto t ∈ R se asocia un vector formado por coordenadasque son funciones reales de variable real

γ(t) = (x(t), y(t), z(t)),

siendo las funciones coordenadas definidas por el argumento escalar men-cionado,

x = x(t) = ξ1t+ p1

y = y(t) = ξ2t+ p2

z = z(t) = ξ3t+ p3 B

DEFINICION. Una funcion vectorial de argumento escalar es unarelacion

γ : (a, b)→ R3

Page 128: Libro Mate 4

128 Curvas en R2 y en R3

( (a

t

b

0

γγ( )t

Figura 3.1: Funcion vectorial de variable real.

tal que a cada t ∈ (a, b) se le asocia un vector γ(t) en R3.

En coordenadas x, y, z de R3, tal asociacion se escribe

γ(t) = (x(t), y(t), z(t))

donde x, y, z : (a, b)→ R son funciones reales (definidas sobre R) de varia-ble real t. Esto es, las funciones coordenadas se escriben

x = x(t)y = y(t)z = z(t)

, t ∈ (a, b)

En otra notacion, utilizando la base canonica e1, e2, e3 de R3, pode-mos escribir tal asociacion mediante la igualdad

γ(t) = x(t)e1 + y(t)e2 + z(t)e3

A lo largo de este trabajo, utilizaremos preferentemente la notacionγ(t) = (x(t), y(t), z(t)) que no involucra a los vectores canonicos.

EJEMPLO. Sea la funcion γ : R→ R2 dada por la relacion

γ(t) = (cos t, sen t)

C Es una funcion vectorial (a R2) con argumento escalar dado por lavariable t ∈ R.

Hacemos una asignacion de argumentos y calculamos sus valores, comolo muestra la siguiente tabla.

Page 129: Libro Mate 4

3.1 Curvas suaves 129

t γ(t)0 (1, 0)

π/4(√

22 ,

√22

)

π/2 (0, 1)3π4

(−√22 ,

√22

)

π (−1, 0)(5/4)π

(−√22 ,−

√22

)

(3/2)π (0,−1)(7/4)π

(√22 ,−

√22

)

2π (1, 0)

(9/4)π(√

22 ,

√22

)

A continuacion mostramos como se consiguieron algunos elementos dela tabla.

γ(0) = (cos 0, sen 0) = (1, 0)

γ(π/4) = (cosπ/4, senπ/4) =

(√2

2,

√2

2

)

γ(π/2) = (cosπ/2, senπ/2) = (0, 1)

γ

(3π

4

)=

(−√2

2,

√2

2

)

γ(π) = (−1, 0)

γ((5/4)π) =

(−√2

2,−√2

2

)

γ((3/2)π) = (0,−1)

Observamos que todos los valores de γ obtenidos de esta manera estancontenidos en el cırculo unitario del plano R2

x,y como se muestra en la figura3.2.

Afirmamos que la imagen de R bajo γ es completamente el cırculo uni-tario

S1 = (x, y)|x2 + y2 = 1

Para demostrar esto, sea γ(t) un punto en la imagen, entonces,

||γ(t)||2 = ||(cos t, sen t)||2 = cos2 t+ sen2t = 1

Page 130: Libro Mate 4

130 Curvas en R2 y en R3

γ(0)=γ(2π)γ(π)

π)

π)

))γ(

γ(

γ(γ(3

5

π

π4

4

2

4

(cos t,sen t)

Figura 3.2: Cırculo unitario de S1

por lo tanto, ya que ||γ(t)|| = 1 entonces, para cualquier t ∈ R, γ(t) ∈ S1

Ahora sea (x, y) ∈ S1 y sea t el angulo que forma el vector (x, y) con eleje x. Si sobre el cırculo se localizan las coordenadas (x, y) de un punto. Envirtud de que el radio de S1 es 1, se tienen las igualdades trigonometricas

x = cos ty = sen t

de donde (x, y) ∈ S1 esta en la imagen γ.

De esta manera, la imagen de γ es un cırculo unitario.

Como las funciones sen t, cos t son 2π- periodicas, entonces γ enrrollaal cırculo S1 en contra de las manecillas del reloj un numero infinito (nu-merable) de veces. B

EJEMPLO. Consideremos la funcion vectorial γ : (−∞,∞) → R2 dadapor la regla de correspondencia

γ(t) = (R cos t, R sen t)

donde R es un numero real positivo.

C Tendremos en este caso que, al escribir tal relacion como

γ(t) = (R cos t, R sen t) = R(cos t, sen t)

esta es una deformacion del cırculo unitario a un cırculo de radio R > 0con centro en el origen de coordenadas (vease la figura 3.3). B

EJEMPLO. Sea ahora la funcion γ : (−∞,∞)→ R2 dada por la relacion

γ(t) = (4 cos t, 4 sen t, 2t)

Page 131: Libro Mate 4

3.1 Curvas suaves 131

C γ es la funcion que a cada t le asocia un punto en R3, mediante lasrelaciones

x(t) = 4 cos t

y(t) = 4 sen t

z(t) = 2t

Al olvidar momentaneamente la variable z, se tiene que los puntos concoordenadas (x, y) en la imagen de γ se mueven en un cırculo de radio 4,segun el ejemplo anterior. La variable z solo se mueve con su direccion,dirigiendose positivamente.

Esto nos dice que la imagen γ(t) esta contenida en la superficie dadapor x2 + y2 = 16 que es un cilindro circular de radio 4 con directriz del ejez.

Al evaluar γ en los extremos del intervalo [0, 2π] se obtienen los puntos

(Rcos t,Rsen t)

R

1

Figura 3.3: Cırculo de radio R.

γ(0) = (4, 0, 0)

γ(2π) = (4, 0, 4π)

que quedan verticalmente situados en direccion del eje z, y a una distancia(vertical) igual al 4π, lo que nos dice que la imagen de γ es una helice deradio 4 y con paso de altura 4π (que se repite a intervalos de t iguales a2π) como lo muestra la figura 3.4. B

Iniciamos ahora la discusion de la diferenciabilidad de una curva es-pacial, utilizando para ello los conceptos y resultados clasicos del calculodiferencial en una variable (vease Reyes, 1996).

Page 132: Libro Mate 4

132 Curvas en R2 y en R3

x

y

z

γ( )t

γ(0)

γ(2π)

Figura 3.4: Helice de radio 4 con paso de altura 4π.

Sea γ : (a, b)→ R3 una funcion vectorial de variable real definida en elintervalo (a, b) ⊂ R.

Sean t0, t ∈ (a, b) con el argumento temporal variable t proximo deltiempo prefijado t0.

Calculamos la diferencia entre sus vectores imagenes γ(t)−γ(t0) y luegola comparamos vıa un cociente con la diferencia de argumentos (lo cual esposible pues podemos dividir vectores entre escalares).

γ(t)− γ(t0)t− t0

(=

diferencia de imagenes

diferencia temporal

)

Si pensamos en las imagenes como posiciones de un cuerpo puntual quese mueve en el espacio, tal cociente representarıa un vector velocidadpromedio en el intervalo [t0, t], y el proceso de lımite nos darıa un vectorvelocidad instantanea (en caso de existir) al tiempo t0.

Definimos tal proceso de lımite en el espacio, mediante los lımites de lasfunciones coordenadas que son ya de conocimiento del calculo diferencialde funciones reales de variable real.

DEFINICION. Se dice que la funcion γ : (a, b) → R3 es diferenciableen el punto t0 ∈ (a, b), si existe el lımite vectorial

limt→t0

γ(t)− γ(t0)t− t0

= limt→t0

(x(t), y(t), z(t))− (x(t0), y(t0), z(t0))

t− t0

= limt→t0

(x(t)− x(t0)

t− t0,y(t)− y(t0)

t− t0,z(t)− z(t0)t− t0

)

Page 133: Libro Mate 4

3.1 Curvas suaves 133

En tal caso, tal vector se definira por

dt(t0) = lim

t→t0

γ(t)− γ(t0)t− t0

y se llamara la derivada de γ en el punto t0.

Si en cada punto del intervalo la funcion γ es diferenciable, se dirasimplemente que es una funcion diferenciable.

Ya que el lımite que define a dγdt (t0) depende de la existencia de cada uno

de los lımites por coordenadas (segun la ultima igualdad en la definicion),entonces tenemos,

LEMA 3.1 La funcion γ es diferenciable en t0, si y solo sı, cada funcioncoordenada es diferenciable en t0. Esto es, si cada lımite

dx

dt(t0) = lim

t→t0

x(t)− x(t0)t− t0

,

dy

dt(t0) = lim

t→t0

y(t)− y(t0)t− t0

,

dz

dt(t0) = lim

t→t0

z(t)− z(t0)t− t0

,

existe. De aquı que γ es diferenciable, si y solo sı, cada una de sus funcionescoordenadas es diferenciable.

De esta manera, el problema de diferenciabilidad de una curva se hareducido a la diferenciabilidad de las funciones coordenadas. Por eso pode-mos iniciar una discucion de una propiedad mas fuerte de las funcionesvectoriales de variable real, es decir, de las curvas diferenciables. 1

Por una funcion vectorial suave de clase Cr entenderemos a unafuncion vectorial cuyas funciones coordenadas son diferenciables de claseCr con r ≥ 1.

De esta manera, γ es una funcion suave, si cada una de sus funcionescoordenadas es una funcion real de variable real suave en el intervalo J =(a, b).

Por El teorema de Whitney (Teorema 4.9 de Reyes, 1996), cadauna de las funciones coordenadas de una funcion vectorial de variable realcuando es continua, puede aproximarse por una funcion de clase Cr. Ası,en las aplicaciones, cuando se piensa en una funcion vectorial de variable

1El lector no familiarizado con la clase de diferenciabilidad de una funcion real puedeconsultar el capıtulo 3 de Reyes, 1996.

Page 134: Libro Mate 4

134 Curvas en R2 y en R3

real, esta se supone de una clase de diferenciabilidad lo suficientementealta, de acuerdo a las necesidades del problema que se este solucionando.Esto es, en las aplicaciones, las curvas espaciales genericamente se piensansuaves.

Si la curva γ es suave, definimos a su derivada en el punto arbitrariot ∈ J = (a, b) usando una notacion clasica:

dt= γ(t) = (x(t), y(t), z(t))

donde el punto sobre la variable define a la derivada respecto al tiempo t.El vector derivada γ(t) es un vector que ademas de ser tangente a la curvaγ en el punto γ(t), es un vector localizado posicionado en el punto γ(t).

DEFINICION. Una funcion vectorial γ : (a, b) → R3 se llamara unacurva regular, si para todo t ∈ (a, b) su derivada γ(t) no se anula.

EJEMPLO. Sea la funcion vectorial

γ(t) = (cos t, sen t, t),

entonces la curva de imagen γ en el intervalo (a, b) = (−∞,∞) es una helicede paso de altura 2π, contenida en el cilindro x2 + y2 = 1 del espacio R3.

Claramente

γ(t) = (−sen t, cos t, 1)es un vector que nunca se anula y, por ello, es que la curva es regular.(vease la figura 3.5 a.).

a. b.

Figura 3.5: Curvas imagenes de funciones vectoriales

Page 135: Libro Mate 4

3.1 Curvas suaves 135

EJEMPLO. Sea la funcion vectorial γ : (−∞,∞)→ R2 dada por

γ(t) = (R cos t, R sen t).

Entonces su imagen es un cırculo de radio R > 0 con centro en el origendel plano R2.

Su derivada γ(t) = (−R sen t, R cos t) es un vector que no se anula y, porlo tanto, se entendera tambien como una curva regular (vease la figura3.5 b.).

EJEMPLO. Considerese la curva γ : J → R3 dada por

γ(t) = (t3 − t, t2 − 1)

C Es claro que el dominio de la curva γ es todo el eje real J = (−∞,∞).

Inicialmente, para hacer el dibujo de la imagen de esta curva, asignamosalgunos argumentos a la funcion y calculamos sus valores

t −3 −2 −1 0 1 2 3γ(t) (−24, 8) (−6, 3) (0, 0) (0,−1) (0, 0) (6, 3) (24, 8)

Teniendo estos valores vectoriales en el plano, utilizamos ahora unmetodo analıtico para dibujar mas precisamente la imagen de γ.

Procedemos a analizar los vectores imagenes de la curva plana segun losargumentos en el dominio, utilizando para ello las funciones coordenadas.

A fin de resolver la desigualdad t3 − t ≥ 0 para la primer funcion coor-denada, calculamos las raıces de t3 − t = 0 que son t = 0, 1,−1.

Estos numeros nos dividen el intervalo (−∞,∞) en tres partes que nospermiten resolver tal desigualdad, sabiendo que

t3 − t ≥ 0⇐⇒ t ∈ [−1, 0] o t ∈ [1,∞].

Consecuentemente, para la primer funcion coordenada se tiene

t3 − t ≥ 0⇐⇒ t ∈ [−1, 0] ∪ [1,∞)

t3 − t < 0⇐⇒ t ∈ (−∞,−1) ∪ (0, 1)

Analogamente para la segunda funcion coordenada, la ecuacion t2−1 =0, tiene las raıces t = ±1, lo que implica,

t2 − 1 ≥ 0⇐⇒ (−∞,−1] ∪ [1,∞)

Page 136: Libro Mate 4

136 Curvas en R2 y en R3

t2 − 1 < 0⇐⇒ (−1, 1)

Evaluamos a γ en los puntos importantes t = 0,−1, 1 obtenidos alresolver las desigualdades anteriores:

γ(−1) = ((−1)3 − (−1), (1)2 − 1) = (0, 0)

γ(0) = ((0)3 − (0), 02 − 1) = (0,−1)γ(1) = (−13 − 1, 12 − 1) = (0, 0)

y al dividir al dominio J en los subintervalos

(−∞,−1), (−1, 0), (0, 1), (1,∞)

se obtiene la tabla

(−∞,−1) (−1, 0) (0,−1) (1,−∞)x(t) − + − +y(t) + − − +

que indica la posicion de la imagen de un argumento sobre la curva γ enlos cuadrantes del plano (vease figura 3.6), segun las signaturas de suscoordenadas.

x

y

γ( )t

γ( )-1

γ( )0γ( )0

γ( )-1

)

)

γ(

γ(

3

3

3

3

Ö

Ö

-

Figura 3.6: Posicion de la imagen de la curva γ(t) = (t3 − t, t2 − 1)

Ahora realizamos un analisis cualitativo de γ, usando su derivada

γ(t) = (3t2 − 1, 2t)

Page 137: Libro Mate 4

3.1 Curvas suaves 137

mediante un metodo similar al usado para la signatura de γ en el plano.

Para la primer coordenada x(t) de γ(t) se tiene

x(t) = 3t2 − 1 > 0⇐⇒ 3t2 − 1 > 0⇐⇒ 3t2 > 1

de donde

x(t) > 0⇐⇒ t ∈(−∞,

√3

3

)∪(√

3

3,∞)

Por lo tanto,

x(t) = 3t2 − 1 < 0⇐⇒ t ∈(−√3

3,

√3

3

)

Analogamente, para la segunda coordenada de γ(t),

y(t) = 2t > 0⇐⇒ x ∈ (0,∞)

y(t) = 2t < 0⇐⇒ x ∈ (−∞, 0)

De las dos desigualdades anteriores se consiguen los puntos importantes

t = 0,−√33 ,

√33 .

Ahora calculamos la imagenes bajo γ y γ de estos puntos importantes:

γ(0) = (0,−1)

γ

(−√3

3

)=

(2√3

9,−2

3

)

γ

(√3

3

)=

(−2√3

9,−2

3

)

γ(0) = (−1, 0)

γ

(−√3

3

)=

(0,−2

√3

3

)

γ

(√3

3

)=

(0,

2√3

3

)

La figura 3.6 ilustra a tales puntos y a sus vectores velocidad (tangentes)correspondientes.

Page 138: Libro Mate 4

138 Curvas en R2 y en R3

Con los intervalos(−∞,−

√3

3

),

(−√3

3, 0

),

(0,

√3

3

),

(√3

3,∞)

obtenidos mediante este segundo analisis se forma la siguiente tabla quedescribe la signatura de las coordenadas de γ(t) = (x), y(t)).

(−∞,−

√33

) (−√33 , 0

) (0,√33

) (√33 ,∞

)

x(t) + − − +y(t) − − + +γ(t)

La flecha del renglon correspondiente a γ(t) en cada subintervalo des-cribe cualitativamente la posicion del vector velocidad tangente a γ(t)(vease la figura 3.6).

Ademas, observamos que la imagen de γ tiene una autointerseccion enγ(1) = γ(−1) lo que le hace ser una funcion que no es inyectiva. En elpunto γ(1) = γ(−1) = (0, 0) se tienen dos vectores derivadas

γ(1) = (3t2 − 1, 2t)|1 = (2, 2)

γ(−1) = (3t2 − 1, 2t)|−1 = (2,−2)

De esta forma un trazo de la curva en una region acotada alrededor de(0, 0) estarıa dado por la figura 3.6.

Hacemos el analisis a los extremos del dominio J = (−∞,∞).

Si t→ −∞, entonces,

limt→−∞

γ(t) = limt→−∞

(t3−t, t2−1) = ( limt→−∞

(t3−t), limt→−∞

(t2−1))→ (−∞,∞)

por El teorema de alto orden (vease Teorema 2.23 de Reyes, 1996).

Analogamente, si t → +∞, entonces, por el mismo teorema de altoorden, se tiene

limt→+∞

γ(t) = ( limt→+∞

t3, limt→+∞

t2)→ (∞,∞)

lo que se puede observar en la figura 3.6. B

A los vectores derivadas γ(t) se les entendera tambien como vectoresvelocidad de γ en el punto γ(t). A la longitud de γ(t), es decir a ||γ(t)||se le llamara la rapidez de γ en el punto γ(t).

Page 139: Libro Mate 4

3.1 Curvas suaves 139

EJEMPLO. (La cuspide) Sea la funcion vectorial dada por

γ(t) = (t3, t2)

C Es claro que el dominio de la curva γ es J = (−∞,∞).

Asignamos primeramente algunos argumentos a la funcion γ calculandosus valores, y obteniendo la siguiente tabla.

t −3 −2 −1 0 1 2 3γ(t) (−27, 9) (−8, 4) (−1, 1) (0, 0) (1, 1) (8, 4) (27, 9)

Procedemos de forma analoga al ejemplo anterior, estudiando la signa-turas de la funcion y su derivada.

Para la primer funcion coordenada, resolvemos la desigualdad x(t) =t3 ≥ 0 que simplemente es equivalente a t ≥ 0.

Por lo tanto,x(t) = t3 ≥ 0⇐⇒ t ∈ [0,∞]

y consecuentemente,

x(t) = t3 < 0⇐⇒ t ∈ [−∞, 0)

Analogamente para la segunda coordenada, obtenemos,

y(t) = t2 ≥ 0⇐⇒ t ∈ (−∞,∞)

Evaluamos los puntos importantes encontrados, que es apenas t = 0,

γ(0) = (0, 0)

y con los subintervalos obtenidos se tiene la tabla de signatura de γ(t),

(−∞, 0) (0,∞)x(t) − +y(t) + +

Analizamos la signatura de la derivada de la curva,

γ(t) = (3t2, 2t)

resolviendo primeramente la desigualdad,

x(t) = 3t2 > 0⇐⇒ t ∈ (−∞, 0) ∪ (0,∞)

Page 140: Libro Mate 4

140 Curvas en R2 y en R3

Por otro lado,y = 2t > 0⇐⇒ t ∈ (0,∞)

y(t) = 2t < 0⇐⇒ t ∈ (−∞, 0)y se tiene en este caso, nuevamente el punto importante t = 0.

Calculemos las imagenes bajo γ y γ de este punto importante

γ(0) = (0, 0)

γ(0) = (0, 0)

que hace de γ(t) una curva irregular.

Ahora con los intervalos (−∞, 0), (0,∞) se forma la siguiente tabla designaturas de las componentes de los vectores velocidad,

(−∞, 0) (0,∞)x(t) + +y(t) − +γ(t)

Finalmente, hacemos el analisis a los tiempos extremos del dominioJ = (−∞,∞), calculamos los lımites,

limt→−∞

γ(t) = limt→−∞

(t3, t2) = ( limt→−∞

t3, limt→−∞

t2)→ (−∞,∞)

ylimt→∞

γ(t) = limt→∞

(t3, t2) = ( limt→∞

t3, limt→∞

t2)→ (∞,∞)

La figura 3.7 ilustra el trazo de la curva imagen de esta funcion llamadacuspide. B

Damos ahora unas propiedades aritmeticas de la derivada de funcionesvectoriales con argumento escalar.

LEMA 3.2 Sean γ1, γ2 : (a, b) → R3 dos funciones vectoriales suaves devariable real.

a. Para los escalares λ, µ ∈ R, se verifica facilmente que

d

dt(λγ1 + µγ2)(t) = λ

dγ1dt

(t) + µdγ2dt

(t) = λγ1(t) + µγ2(t)

b. Para una funcion real de variable real suave λ = λ(t) definida en elintervalo (a, b) ⊂ R es justa la relacion

d

dt(λ(t)γ(t)) =

dt(t)γ(t) + λ(t)

dt(t) = λ(t)γ(t) + λ(t)γ(t)

Page 141: Libro Mate 4

3.1 Curvas suaves 141

x

y

(0,0)

Figura 3.7: Curva imagen de la cuspide.

C Son calculos directos y omitimos su prueba B.

Sean ahora dos funciones vectoriales suaves γ1, γ2 : (a, b)→ R3 en todoel intervalo, y consideremos para cada t ∈ (a, b) los vectores velocidadγ1(t), γ2(t). Se tiene el siguiente resultado acerca del calculo de la derivadaen productos escalar y vectorial.

LEMA 3.3 Si γ1, γ2 : (a, b) → R3 son funciones suaves, son justas lasformulas de Leibniz:

a.d

dt< γ1(t), γ2(t) >=

⟨dγ1dt

(t), γ2(t)

⟩+

⟨γ1(t),

dγ2(t)

dt

b.d

dt[γ1(t), γ2(t)] =

[dγ1dt

(t), γ2(t)

]+

[γ1(t),

dγ2dt

(t)

]

c.

d

dt(γ1(t), γ2(t), γ3(t)) =

(dγ1dt

(t), γ2(t), γ3(t)

)+

(γ1(t),

dγ2dt

(t), γ3(t)

)

+

(γ1(t), γ2(t),

dγ3dt

(t)

)= (γ1, γ2, γ3) + (γ1, γ2, γ3) + (γ1, γ2, γ3)

donde ( , , ) es el triple producto escalar.

C Son igualmente calculos directos y se omiten. B

EJEMPLO. Sean las curvas espaciales suaves

γ1(t) = (cos t, sen t, 2π(t)) y γ2(t) = (4t2, 2t,−t)

Page 142: Libro Mate 4

142 Curvas en R2 y en R3

C Ya que γ1(t) = (−sent, cos t, π) y γ2(t) = (8t, 2,−1) se tiene que

a.d

dt< γ1, γ2 >=< γ1, γ2 > + < γ1, γ2 >

=< (−sen t, cos t, 2π), (4t2, 2t,−t) > + < (cos t, sen t, 2πt), (8t, 2,−1) >= −4t2sen t+ 2t cos t− 2πt+ 8t cos t+ 2sent− 2πt

= (2− 4t2)sen t+ 10t cos t− 4πt

b. De igual forma,

d

dt[γ1, γ2] = [γ1, γ2] + [γ1, γ2]

=

∣∣∣∣∣∣

e1 e2 e3−sen t cos t 2π4t2 2t −t

∣∣∣∣∣∣+

∣∣∣∣∣∣

e1 e2 e3cos t sen t 2πt8t 2 −1

∣∣∣∣∣∣

= (−t cos t− 4πt,−tsen t− 8πt2,−2tsen t− 4t2 cos t)

+(−sen t− 4π, cos t+ 8πt2, 2 cos t− 8tsen t)

= (−t cos t− sen t− 8πt, cos t− tsen t,−4t2 cos t− 10tsen t+ 2 cos t) B

Introducimos ahora el concepto de curva regular parametrizada, que esde gran utilidad en las aplicaciones a la mecanica, fısica e ingenierıa. Esteconcepto, aunque en apariencia tiene definicion abstracta, en realidad esestablecida acorde a la experiencia cotidiana. 2

DEFINICION. Una curva regular parametrizada Γ es un subcon-junto de R3 (o de R2) tal que para cualquier punto p ∈ Γ existe unafuncion vectorial de variable real suave

γ : J → R3

satisfaciendo que, si J = (−ε, ε) para un numero ε > 0 , entonces

a. La imagen de 0 bajo γ es el punto p, es decir,

γ(0) = p

b. La velocidad de γ no se anula en todo el intervalo, esto es,

γ(t) 6= 0 para todo t ∈ J2Por ejemplo, cuando se estudia una trayectoria espacial de un cuerpo, es difıcil

estudiarla en su totalidad, ası que se procede a estudiarla por fragmento, es decir, porpartes que se pueden parametrizar con una variable temporal adecuada, en un intervalotemporal adecuado.

Page 143: Libro Mate 4

3.1 Curvas suaves 143

c. La imagen de J bajo γ esta contenida en Γ, en otras palabras,

γ(t) ∈ Γ para todo t ∈ J

Si la imagen de J bajo γ cubre a Γ, diremos que la pareja (γ, J) es unaparametrizacion de Γ. En caso contrario, diremos que la pareja (γ, J) essolo una parametrizacion de Γ alrededor del punto p ∈ Γ.

(

(

(

(t

Γ−ε ε

γ( )t

Figura 3.8: Curva regular parametrizada.

En coordenadas (x, y, z) del espacio cartesiano, la curva γ(t) esta defi-nida por el vector

γ(t) = (x(t), y(t), z(t)) t ∈ J,

donde las coordenadas x(t), y(t), z(t) son funciones reales suaves definidasen el intervalo J = (−ε, ε) que contiene a t = 0 (vease la figura 3.8).

En adelante, cada vez que hagamos referencia al dominio de parame-trizacion de una curva Γ alrededor de un punto p lo definiremos por [a, b]en lugar de (−ε, ε), tomando en este caso, el dominio mas amplio paraparametrizar tal curva Γ.

Esto es, cada vez que demos una curva Γ, la entenderemos, sin perdidade generalidad, como la imagen de una funcion

γ : [a, b]→ Γ

donde [a, b] ⊂ R, siendo γ una funcion suave con coordenadas suaves.

Para γ : [a, b]→ Γ curva regular parametrizada, en cada punto γ(t) ∈ Γse define un vector tangente a Γ en tal punto, como el vector derivadade γ en t, esto es,

γ = v(t) =

(dx

dt,dy

dt,dz

dt

)

La notacion γ = γ(t) es muy conveniente, como ya hemos mencionado,a la hora de hacer calculos, sobre todo en problemas de aplicacion.

Page 144: Libro Mate 4

144 Curvas en R2 y en R3

A continuacion damos ejemplos de parametrizaciones de curvas Γ ⊂ R3

(o R2).

EJEMPLO. Considere la elipse en el plano con semieje mayor a > 0 ysemieje menor b, definida por la ecuacion

Γ :x2

a2+y2

b2= 1

C Una deformacion del cırculo unitario

x2 + y2 = 1,

parametrizado por t→ (cos t, sen t), por un escalar a en la primera coorde-nada, y por el escalar b en la segunda coordenada, nos da la parametrizacionrequerida.

Esto es,

Γ :

x = a cos ty = b sen t,

t ∈ R

parametriza suavemente a la elipse Γ. Si escribimos γ(t) = (a cos t, b sen t),entonces el vector tangente a γ en el punto γ(t) ∈ Γ se calcula por

v(t) = γ(t) = (−a sen t, b cos t)

Como v(t) 6= 0, entonces Γ resulta ser una curva regular. B

EJEMPLO. Sea Γ ⊂ R3 una helice contenida en un cilindro de radio 4 ycon paso de altura h = 4π.

C Para poder parametrizar a Γ, partimos de que una helice contenidaen un cilindro de radio R y paso de altura h = 2kπ tiene la parametrizaciongeneral

γ = v(t) = t→ (R cos t, R sen t, kt), t ∈ R

Si R = 4 y h = 4π = 2(2π), entonces k = 2, lo que lleva a que laparametrizacion de Γ esta bien definida por

Γ :

x = 4 cos t

y = 4 sen t

z = 2t

Si se define por γ(t) = (4 cos t, 4 sent, 2t), t ∈ R, a tal curva, entonces elvector tangente en el punto γ(t) ∈ Γ esta descrito por

v(t) = γ(t) = (−4 sen t, 4 cos t, 2),

vector que no se anula. Esto hace que la helice Γ sea una curva regular. B

Page 145: Libro Mate 4

3.1 Curvas suaves 145

EJEMPLO. Sea Γ el cırculo de radio R > 0 con centro en el origen decoordenadas dado por

Γ : (x, y)|x2 + y2 = R2

C Al considerar la funcion vectorial γ : (−∞,∞)→ R2 dada por

γ(t) = (R cos t, R sen t)

entonces su imagen Γ es el cırculo dado. Su derivada

γ(t) = (−Rsent, R cos t)

es un vector que no se anula y, por lo tanto, se entendera tambien comouna curva regular.

Anotamos que la funcion vectorial γ(t) = (R cos 2t, R sin 2t) tiene comoimagen tambien al mismo cırculo, pero su vector derivada es mas grandede norma que la de γ(t). De hecho,

˙γ(t) = (−2R sen 2t, 2R cos 2t).

lo que implica que

|| ˙γ(t)|| = ||(−2R sen 2t, 2R cos 2t)|| = 2R

= 2||(−R sen t, R cos t)|| = 2||γ(t)||

lo que nos dice que la norma de ˙γ(t) es el doble de la norma de γ(t). (Lafigura 3.9 ilustra esta situacion). Decimos simplemente que la parametri-zacion γ(t) “va mas rapida” que la de γ(t). B

γ( )t γ( )t

γ( )tγ( )t

~

~

Figura 3.9: Parametrizaciones del cırculo de radio R > 0.

Page 146: Libro Mate 4

146 Curvas en R2 y en R3

3.2 La segunda derivada. Aceleracion

Ya se ha mencionado sobre la clase de diferenciabilidad de una funcionvectorial de variable real (curva suave)

γ : J → R3

relegando las definiciones a las propiedades de las funciones coordenadas

x = x(t)y = y(t)z = z(t)

, t ∈ J

Particularmente, una curva de clase C2 es una funcion vectorial devariable real cuyas componentes son funciones de clase C2.

Entendemos por γ(t) la segunda derivada de la curva γ en el punto γ(t),y en coordenadas le escribimos

γ(t) = (x(t), y(t), z(t)) = x(t)e1 + y(t)e2 + z(t)e3

donde los puntos indican derivacion respecto a la variable temporal t ∈ J .DEFINICION. Al vector espacial γ(t) se le llamara el vector aceleracionde la curva γ en el punto γ(t).

EJEMPLO. Sea el cırculo de radio R, con centro en el origen, parametri-zado por,

γ(t) = (R cos t, R sent), t ∈ R

C Un calculo simple nos muestra que

γ(t) = (−Rsen t, R cos t)

γ(t) = (−R cos t,−R sen t) = −R(cos t, sen t)lo que nos dice que γ(t) = −γ(t). Esto es, el vector de posicion γ(t) y suaceleracion γ(t) son paralelos con sentidos opuestos. B

EJEMPLO. Dada la curva suave

γ(t) = (e2t, sen4t, cos t)

calcular γ(t) y γ(t).

C Directamente, obtenemos los vectores velocidad y aceleracion,

γ(t) = (2e2t, 4 cos 4t,−sen t)

Page 147: Libro Mate 4

3.2 La segunda derivada. Aceleracion 147

γ(t) = (4e2t,−16 sen 4t,− cos t) B

EJEMPLO. Dada la curva suave

γ(t) = (t2 + 1, t3 − 2, t4 + 1)

calcular < γ(t), γ(t) > y [γ(t), γ(t)].

C Al calcular directamente los vectores velocidad y aceleracion de γ enγ(t), obtenemos

γ(t) = (2t, 3t2, 4t3)

γ(t) = (2, 6t, 12t2)

de donde< γ(t), γ(t) >= 4t+ 18t3 + 48t5

[γ(t), γ(t)] =

∣∣∣∣∣∣

e1 e3 e32t 3t2 4t3

2 6t 12t2

∣∣∣∣∣∣= e1(36t

4 − 24t4)− e2(24t3 − 8t3)

+e3(12t2 − 6t2) = (12t4,−16t3, 6t2) B

Consideremos ahora cualquier curva γ = γ(t) tal que tenga una normaconstante (por ejemplo γ(t) = (R cos t, Rsen t) el cırculo de radio R), estoes, para todo t ∈ J , tenemos que

||γ(t)|| = k

donde k es una constante no negativa.

C Ya que k = ||γ(t)||, entonces

k2 = ||γ(t)||2 =< γ(t), γ(t) >

de donde, al derivar cada miembro respecto al tiempo t obtenemos

0 =d

dt< γ(t), γ(t) >=< γ, γ(t) > + < γ(t), γ(t) >

= 2 < γ(t), γ(t) >

es decir,< γ(t), γ(t) >= 0

lo que nos dice que γ(t) y γ son ortogonales.

Ası, utilizando este razonamiento para aquellas curvas con vectores ve-locidad con norma constante ||γ(t)|| = k se tiene,

Page 148: Libro Mate 4

148 Curvas en R2 y en R3

Las curvas suaves que tienen rapidez constante son tales que sus vectoresvelocidad y aceleracion son ortogonales.

EJEMPLO. Sea la curva circular espacial

γ(t) = (4 cos t, 4 sen t, 6)

C El vector velocidad se calcula

γ(t) = (−4 sen t, 4 cos t, 0)cuya norma es ||γ(t)|| = 4.

Por lo tanto, el vector velocidad γ(t) es ortogonal al vector aceleracion

γ(t) = (−4 cos r,−4sent, 0)debido a la discusion anterior, y como se puede apreciar mediante el calculodirecto,

< γ(t), γ(t) >= 16 cos t sent− 16 cos t sen t = 0 B

Ejercicios

1. Dibujar la grafica en R2 o R3 segun corresponda, de las funcionesa. γ1(t) = (3t, 4sent)

b. γ2(t) = (cos t, t+ 2sent)

c. γ3(t) = (t2 − 2t, t2 + 2t)

d. γ4(t) = (et cos t, etsent)

e. γ5(t) =(1t cos t,

1t sen t

)

f. γ6(t) =(1+tt cos t, 1+t

t sen t), t ≥ 1

g. γ7(t) = (cos t, sen t, t)

h. γ8(t) = (4 cos t, 4sen t, et)

2. a. Calcule la derivada de las funciones del ejercicio 1.

b. Calcular el vector tangente a cada curva en los puntos t = 1, t =π/2, t = π.

3. Calcular, para las curvas del ejercicio 1,

a. ddt < γ1(t), γ2(t) >

b. ddt [γ3(t), γ4(t)]

c. ddt (γ1(t), γ5(t), γ6(t)).

4. Calcular γ(t) para cada curva en 1. y el vector aceleracion en los puntost = 1, t = π

2 y t = π.

Page 149: Libro Mate 4

Capıtulo 4

Campos escalares en R3

En este capıtulo hacemos el analisis cualitativo de una funcion de varias va-riables reales, generalizando algunos conceptos conocidos ya para funcionesreales de una variable real.

4.1 Regiones en R2 y R3

Iniciamos esta seccion describiendo los objetos geometricos en Rn que vana ser utilizados a lo largo del capıtulo. Estos objetos gozan de carac-terısticas que son usadas para estudiar las propiedades de funciones queestan definidas en subconjuntos del espacio euclidiano Rn.

En general, en la teorıa diferenciable de funciones reales de variable real,los dominios se presumen de la forma

D = (a, b)

es decir, intervalos abiertos.Al intervalo (a, b) se le llama abierto pues no contiene las orillas a, b.

Generalizamos este concepto de conjunto abierto en R3.

Si p ∈ Rn y ε > 0 es un numero real positivo, se define la bola de radioε y centro en p, como el conjunto solido

Bε(p) = q ∈ Rn| ||q − p|| < ε

DEFINICION. Dado un conjunto Ω ⊂ Rn, se dice que es un conjuntoabierto en Rn, si para cada p ∈ Ω existe un numero ε > 0 tal que la bolade radio ε y centro en p esta contenida totalmente en Ω, esto es,

Bε(p) ⊂ Ω

Page 150: Libro Mate 4

150 Campos escalares en R3

Ω

εB (p)

p

Figura 4.1: Conjunto abierto en Rn.

Vease la figura 4.1.

EJEMPLO. Todo intervalo abierto (a, b) ⊂ R es un intervalo abierto.

C Esto ya se demostro anteriormente, notando que en el caso unidimen-sional una bola corresponde a un intervalo.

Bε(p) = q ∈ R| ||q − p|| < ε = q ∈ R| |q − p| < ε

= q | − ε < q − p < ε = q| p− ε < q < p+ ε= (p− ε, p+ ε) B

Los siguientes ejemplos omiten las demostraciones de las afirmacionesmostrando apenas una ilustracion de los subconjuntos que intervienen. Engeneral hacemos hincapie que un conjunto abierto Ω de Rn es un conjunto“gordito” que no tiene orilla (frontera).

EJEMPLO. Una bola de radio ε con centro en cualquier p ∈ Rn es unconjunto abierto.

C En este caso Ω es una bola Bε(p) B

EJEMPLO. Sea Ω ⊂ R2 la parte del plano definido por

Ω = (x, y)|x > y

C El conjunto Ω es abierto en R2 (vease la figura 4.2). B

EJEMPLO. Sea Ω ⊂ R2 el subconjunto dado por

Ω = (x, y)|x2 + y2 > 4

Page 151: Libro Mate 4

4.1 Regiones en R2 y R3 151

Ωx

yy=x

Figura 4.2: Semiplano inferior x > y.

C Claramente Ω es un subconjunto abierto en R2. B

EJEMPLO. Sea el conjunto

Ω = (x, y, z)|x2 + y2 < z2 ⊂ R3

que define el interior de un cono. Se afirma que es un conjunto abierto enR3.

C Al considerar la igualdad

x2 + y2 = z2

tal ecuacion describe a un cono y Ω define el interior del cono como lomuestra la figura 4.3. B

EJEMPLO. Sea el conjunto Ω = (x, y, z) |x2 + y2 > 1 ⊂ R3.

C Entonces Ω es un conjunto abierto en R3 y es el exterior del cilindrounitario (vease la figura 4.4). B

DEFINICION. Definimos al conjunto C ⊂ Rn como un conjunto ce-rrado en Rn, si su complemento en Rn es abierto.

Para ejemplos de conjuntos cerrados tenemos a los complementos de losconjuntos abiertos dados en los ejemplos anteriores.

EJEMPLO.

a. El conjuntoC = (−∞, a] ∪ [b,∞)

Page 152: Libro Mate 4

152 Campos escalares en R3

x

y

z

Figura 4.3: Interior del cono z2 = x2 + y2.

x

y

z

Figura 4.4: Exterior del cilindro unitario.

es cerrado en la recta real R.

b. El conjuntoC = (x, y) |x ≤ y

es cerrado en el plano R2.

c. El conjuntoC = (x, y) |x2 + y2 ≤ 4

es cerrado en R2.

d. El exterior del cono, incluyendolo

C = (x, y, z) |x2 + y2 ≤ z2

Page 153: Libro Mate 4

4.1 Regiones en R2 y R3 153

es un conjunto cerrado en R3.

e. El interior del cilindro unitario, incluyendo al cilindro

C = (x, y, z) |x2 + y2 ≤ 1

es un conjunto cerrado de R3.

Es claro que existen subconjuntos de Rn que no son ni abiertos ni cerra-dos. Por ejemplo D = (−1, 2] es un intervalo que no es abierto ni cerradoen R.

Sea Ω ⊂ R3 un subconjunto. Se dice que el punto q ∈ R3 es puntofrontera de Ω si toda bola con centro en p intersecta a Ω y al complementode Ω.

Al conjunto contenido en Rn definido por

∂Ω = p ∈ Rn| p es frontera de Ω

se llamara frontera de Ω en Rn.

Damos algunos ejemplos de fronteras de conjuntos.

EJEMPLO.

a. La frontera de Ω = (a, b) es el conjunto formado por la pareja de puntos,

∂(a, b) = a, b

b. La frontera del conjunto cerrado C = (x, y)|x ≤ y es la misma que lade su complemento, el abierto Ω = (x, y)|x > y y es la recta

∂C = ∂Ω = (x, y)|x = y

Tal conjunto esta contenido en el cerrado C y no pertenece al subcon-junto abierto Ω.

c. La frontera del abierto Ω = (x, y)|x2 + y2 < 4 es la misma que la delcerrado C = (x, y)|x2 + y2 ≤ 4 y la constituye el conjunto cilındrico

∂Ω = ∂C = (x, y) |x2 + y2 = 4

que esta contenido en el cerrado C.

d. Dados los conjuntos Ω = (x, y, z) |x2 + y2 < z2 abierto, y C =(x, y, z) |x2 + y2 ≥ z2 cerrado, tenemos

∂C = ∂Ω = (x, y, z) |x2 + y2 = z2

Page 154: Libro Mate 4

154 Campos escalares en R3

es la frontera tanto de C como de Ω.

Entre las caracterısticas geometricas de un subconjunto de Rn esta aque-lla que nos asegura que tal subconjunto no esta dividido en pedazos ajenosentre sı.

DEFINICION. Decimos que el conjunto Ω ⊂ Rn es conexo si dados dospuntos p, q,∈ Ω, existe una curva Γ que los une, totalmente contenida enΩ.

Si Ω no es un conjunto conexo se llamara disconexo, (vease la figura4.5).

EJEMPLO. Sea el conjunto del plano

Ω = (x, y)|x2 + y2 ≤ 1 o x2 + y2 ≥ 4

Se afirma que Ω es disconexo.

1 12 2

A Ω

Figura 4.5: Conjuntos conexo y disconexo.

C Dados p y q con ||p|| ≤ 1 con ||q|| ≥ 2 se tiene cualquier curva quelos une se sale del conjunto Ω. B

EJEMPLO. El conjunto anular

A = (x, y) ∈ R2 | 1 ≤ x2 + y2 ≤ 4

encerrado entre los cırculos de radios 1 y 2 respectivamente, con centros enel origen, es un conjunto conexo.

En general un conjunto conexo es aquel que esta formado por una solapieza. Esto es, un conjunto conexo en Rn se entiende intuitivamente comoun conjunto que no se divida en varias piezas.

DEFINICION. Por una region en Rn entenderemos un conjunto Ω ⊂ Rn

que es abierto y conexo.

Page 155: Libro Mate 4

4.2 Campos escalares en R3 155

4.2 Campos escalares en R3

Pasamos ahora a definir a una funcion real con argumento vectorial, uti-lizando los conceptos dados de abierto y conexo.

Por un campo escalar definido en la region Ω ⊂ Rn

f : Ω→ R

entendemos a la funcion real de variable vectorial, es decir, una asociaciontal que cada punto p ∈ Ω se le asocia el numero real f(p).

Ω

p

f

f(p)

Figura 4.6: Funcion vectorial f : Ω ⊂ Rn → R.

En coordenadas x, y, z del espacio R3 esta asociacion se escribe, para elpunto p = (x, y, z),

f(p) = f(x, y, z)

Esto es, si (x, y, z) ∈ Ω, bajo la funcion f se le asociarıa el numero real

(x, y, z)→ f(x, y, z)

En adelante, usaremos indistintamente los nombres de funcion real devariable vectorial y campo escalar.

DEFINICION. La grafica de una funcion f : Ω→ R es un subconjuntoGraf(f) de R4 definido por

Graf (f) = (p, f(p)) | p ∈ Ω, f(p) ∈ R

= ((x, y, z), f(x, y, z))| (x, y, z) ∈ Ω, f(p) ∈ R

Analogamente, para una funcion definida en la region plana Ω ⊂ R2,f : Ω→ R se tiene su grafica como el subconjunto

Graf (f) = (x, y, z) | (x, y) ∈ Ω, z = f(x, y)

Page 156: Libro Mate 4

156 Campos escalares en R3

x

x2 2

y

+y

z

z

=z

Figura 4.7: Grafica de f(x, y) = x2 + y2

contenido en R3, constituyendo una superficie en tal espacio tridimensional.

Damos algunos ejemplos donde la regla de correspondencia es dada deantemano.

EJEMPLO. Sea el campo escalar cuya regla esta dada por

f(x, y) = x2 + y2

C Claramente, el dominio de f es Ω = R2 y su grafica es la superficiedefinida por el conjunto contenido en R3

Graf (f) = ((x, y), x2 + y2)| (x, y) ∈ R2

= (x, y, z)| z = x2 + y2que resulta ser un paraboloide circular (vease la figura 4.7). B

EJEMPLO. Sea la funcion f : Ω→ R dada por la regla de corresponden-cia

f(x, y) =√

4− x2 − y2

C Para calcular el dominio Ω imponemos la condicion 4− x2 − y2 ≥ 0o equivalentemente,

4 ≥ x2 + y2 ⇐⇒ 2 ≥√x2 + y2

Esto es, para (x, y) ∈ Ω se debe cumplir que ||(x, y)|| ≤ 2 lo que nosdice que el dominio Ω debera ser un disco cerrado de radio 2 con centro enel origen de coordenadas.

Page 157: Libro Mate 4

4.2 Campos escalares en R3 157

x

y

z

-y22

4-xz=Ö

Ω

(0,0,2)

Figura 4.8: Grafica de f(x, y) =√

4− x2 − y2.

La grafica de f es el conjunto cerrado

Graf (f) = (x, y,√

4− x2 − y2) | x2 + y2 ≤ 4Si ponemos z =

√4− x2 − y2 entonces, al elevar cuadrados obtenemos

z2 = 4− x2 − y2

de donde,x2 + y2 + z2 = 4

que es una esfera de radio 2 con centro (0, 0, 0).

De esta manera, la grafica de f es la parte superior de tal esfera comolo muestra la figura 4.8. B

Ω Ω

z z

1 1

1

1x

y(x,y)

Figura 4.9: Parte del plano x+ y + z = 1 en el primer octante.

EJEMPLO. Sea la funcion f : Ω→ R dada por la regla

f(x, y, z) = ln(1− x− y − z)

Page 158: Libro Mate 4

158 Campos escalares en R3

C La funcion esta definida en una region de R3 determinada por larelacion

1− x− y − z > 0

es decir,1 > x+ y + z

En la igualdad x+ y + z = 1 tenemos un plano con cortes con los ejesx = 1, y = 1 y z = 1.

Al tomar el punto p = (0, 0, 0) se tiene que sus coordenadas satisfacen

0 + 0 + 0 = 0 < 1

es decir, p satisface la relacion x + y + z < 1 y esta por abajo del planomencionado. Es natural pensar que todos los puntos (x, y, z) satisfaciendola relacion x+ y + z < 1 estan situados por debajo de tal plano.

De esta manera el dominio de f es la region Ω de R3 formada por lospuntos debajo del plano x+ y + z = 1 (vease la figura 4.9).

4.3 Superficies y curvas de nivel

En esta parte estudiaremos un metodo para trazar aproximadamente lagrafica de una funcion de dos variables mediante los conjuntos de nivel detal funcion (imagenes inversas) contenidos en el dominio.

DEFINICION. Para un campo escalar f : Ω ⊂ R3 → R y un valor c ∈ Rdados, se define el conjunto de nivel de f al valor c, definido por f−1(c),como la imagen inversa de c bajo f , esto es,

f−1(c) = (x, y, z)| f(x, y, z) = c

En otras palabras, es el conjunto de puntos (x, y, z) ∈ Ω que bajo f alcanzanel mismo valor f(x, y, z) = c.

EJEMPLO. Sea la funcion

f(x, y, z) = x2 + y2 + z2

Calcular los conjuntos de nivel para los valores c = 1, 0, 1.

C Para el caso c = −1, se tiene que por definicion

f−1(−1) = (x, y, z)|x2 + y2 + z2 = −1

Esto es, los puntos (x, y, z) en tal conjunto deberan satisfacer la relacionx2 + y2 + z2 = −1, lo cual es imposible.

Page 159: Libro Mate 4

4.3 Superficies y curvas de nivel 159

Consecuentemente, el conjunto de nivel obtenido f−1(−1) = Ø es elconjunto vacıo.

Consideremos ahora el valor c = 0. Entonces en este caso,

f−1(0) = (x, y, z)|x2 + y2 + z2 = 0

es decir, los puntos contenidos en tal conjunto deberan satisfacer la relacionx2 + y2 + z2 = 0, y tal relacion es apenas resuelta cuando x = y = z = 0.

Por lo tanto, el conjunto de nivel para c = 0 es apenas el punto

f−1(0) = (0, 0, 0)

Finalmente, consideramos el valor c = 1, y entonces en este caso,

f−1(1) = (x, y, z)|x2 + y2 + z2 = 1

Es decir, los puntos en tal conjunto deberan satisfacer la relacion x2 +y2+ z2 = 1, la cual corresponde a la ecuacion de la esfera S2 ⊂ R3, esto es,

f−1(1) = S2

De esta ultima discusion, se observa que para un valor c arbitrariolos puntos (x, y, z) en el conjunto de nivel f−1(c) deberan de satisfacer laecuacion

x2 + y2 + z2 = c

la cual tiene sentido apenas (puede ser resuelta) para c ≥ 0, es decir, f−1(c)es vacıo si c < 0. Si c = 0 hemos ya notado que f−1(0) se reduce al punto(0, 0, 0). Por otro lado, si c > 0 entonces f−1(c) es una esfera con centroen el origen y de radio R =

√c como lo muestra la figura 4.10.

3-1

Ñ

Plano (x,y)

(c)c c

eje z

0

Figura 4.10: Conjuntos de nivel de x2 + y2 + z2 = c

Page 160: Libro Mate 4

160 Campos escalares en R3

Notamos ademas que para c1 6= c2 se tienen dos esferas diferentesf−1(c1) 6= f−1(c2) en virtud de que los radios de cada una es diferente.

Por lo tanto, los conjuntos de nivel folıan (dividen) al dominio de lafuncion f(x, y, z) = x2 + y2 + z2 mediante esferas (hojas) que no se inter-sectan entre sı. B

La afirmacion ultima es valida en general para cualquier campo escalarf : Ω ⊂ R3 → R. Esto es,

LEMA 4.1 Los conjuntos de nivel de un campo escalar f folıan (dividen)al dominio mediante conjuntos (hojas) f−1(c) que no se intersectan entresı.

C Si para los valores c1 6= c2 ∈ R, los conjuntos de nivel respectivosf−1(c1) y f−1(c2) se intersectan, f−1(c1) ∩ f−1(c2) 6= φ , entonces seap ∈ f−1(c1) ∩ f−1(c2). Ya que p ∈ f−1(c1) y p ∈ f−1(c2), entoncesf(p) = c1 y f(p) = c2, lo que no puede ser pues f es una funcion y a cadapunto del dominio le asocia un valor y solo uno. B

La discusion que hemos realizado se puede llevar a cualquier funcionde varias variables, particularmente para funciones del tipo f(x, y), dondelos conjuntos de nivel f−1(c) son curvas planas que folıan el dominio de f(vease la figura 4.11).

c>0

c>0c=0

c<0

c<0

x

y

z

Figura 4.11: Curvas de nivel y grafica de la funcion f(x, y) = x2 − y2.

EJEMPLO. Dada la funcion en dos variables,

f(x, y) = x2 − y2

describir a los conjuntos de nivel para c = −1, 0, 1.C Para el valor c = −1, se tiene la relacion

x2 − y2 = −1

Page 161: Libro Mate 4

4.3 Superficies y curvas de nivel 161

que corresponde a una hiperbola con sus componentes verticales y pasandopor los vertices (0, 1) y (0,−1) respectivamente.

Para el valor c = 0 se debera de cumplir la relacion

x2 − y2 = 0⇐⇒ (x,+y)(x− y) = 0⇐⇒ y = ±x

que corresponde a un par de rectas por el origen de coordenadas.Tales rectas son las asıntotas de la hiperbola encontrada cuando se

estudio el nivel c = −1.Finalmente para el caso c = 1, se cumplira la relacion

x2 − y2 = 1

que corresponde a una hiperbola con sus componentes horizontales quepasan por los vertices (1, 0) y (−1, 0) respectivamente, teniendo como rectasasıntotas a y = ±x.

Un analisis semejante al realizado nos permite concluir que si c ∈ R esun valor arbitrario se cumple que

a. Para c < 0, el conjunto f−1(c) es una hiperbola vertical con vertices enlos puntos (0,

√c), (0,−√c), y con rectas asıntotas y = ±x.

b. Para c = 0, f−1(c) es la pareja de rectas por el origen y = ±x.c. Para c > 0, el conjunto f−1(c) es una hiperbola horizontal con verticesen los puntos (

√c, 0), (−√c, 0), y con rectas asıntotas y = ±x.

La figura 4.11 ilustra las curvas de nivel en este ejemplo. B

Observemos detenidamente el proceso de foliar el dominio Ω de lafuncion f mediante conjuntos de nivel. Damos inicialmente un valor def a la “altura” c ∈ R y buscamos el conjunto f−1(c) que es la imageninversa de c bajo f . En otras palabras, f−1(c) es la forma del conjunto quetiene la grafica de la funcion f cuando se observa solo a la altura c de losposibles valores.

Mas correctamente, cada subconjunto de nivel f−1(c) es la parte de lagrafica de la funcion f suspendida dentro de la grafica a un nivel del valorigual a c, lo que nos dice que se puede construir la grafica de la funcionf : Ω → R con el simple hecho de foliar Ω con los conjuntos de nivel, ydespues colocar cada conjunto de nivel a su altura correspondiente. Esteproceso nos recuerda a la descripcion de las zonas geograficas mediantemapas topograficos que detallan la configuracion de ellas utilizando curvasde nivel. Cada curva de nivel corresponde a una altura determinada y elconjunto total de curvas nos ayuda a describir la topografıa de la zonaestudiada (vease figura 4.12).

Page 162: Libro Mate 4

162 Campos escalares en R3

C

C

C

C

C

1

2

3

4

5

Figura 4.12: Curvas de nivel en topografıa.

EJEMPLO. Consideremos nuevamente el campo escalar,

f(x, y) = x2 − y2

C Ya hemos estudiado cuales son las curvas de nivel de esta funcion,por lo que se tienen los siguientes resultados.

a. Para un valor c < 0 , el corte de la grafica

Graf(f) = (x, y, z)| z = x2 − y2

con el plano horizontal (a la altura) z = c corresponde a una hiperbolaen el plano R2

x,y en direccion del eje y, con vertices en (0,√c), (0,−√c) y

asıntotas y = ±x.

b. Para el valor c = 0, el corte de la grafica Graf(f) con el plano horizontalz = 0 corresponde al par de rectas y = ±x en el plano R2

x,y.

c. Para el valor c > 0, el corte de la grafica Graf(f) con el plano horizontalz = 0 corresponde a una hiperbola en el plano R2

x,y en direccion del eje x,con vertices en (

√c, 0), (−√c, 0), y con asıntotas y = ±x.

La figura 4.11 describe la grafica de esta funcion que es un paraboloidehiperbolico (silla de montar). B

Los siguientes ejemplos nos indican que en general, hacer el trazo dela grafica de una funcion de dos variables no es simple cuando se usa lametodologıa de las curvas de nivel, y que hay que encontrar argumentosmas sotisficados para el trazo, debido a que la estructura de las curvas denivel es complicado, o demasiado simple para la elaboracion de tal trazo.

EJEMPLO. Considerese la funcion definida en Ω = R2 − (0, 0) por laregla de correspondencia

f(x, y) =xy

x2 + y2

Page 163: Libro Mate 4

4.3 Superficies y curvas de nivel 163

C Calculamos sus curvas de nivel para un valor arbitrario c ∈ R. Lospuntos (x, y) ∈ f−1(c) deberan satisfacer la relacion

xy

x2 + y2= c

o equivalentemente (omitiendo el origen de coordenadas),

xy = c(x2 + y2)⇐⇒ cx2 − xy + cy2 = 0

Si se resuelve la ultima ecuacion para y en terminos de x, se tiene que

y =x±√x2 − 4c2x2

2c=

1±√1− 4c2

2cx

que corresponde a ecuaciones de rectas por el origen cuya pendiente de-pende del valor de c.

Tales valores de c estan condicionados a que 1−4c2 ≥ 0 , es decir, a que− 1

2 ≤ c ≤ 12 . Las curvas de nivel, que realmente no pasan por (0, 0), estan

trazadas en la figura 4.13 para ciertos valores de c. Claramente es difıcilrealizar el dibujo de la grafica con estos elementos en virtud de que el hazde lıneas obtenidas al ser levantados a sus valores respectivos dificultan supegado continuo, ademas de la aparicion del punto singular p = (0, 0).La traza de la grafica de f realizada por el programa de Mathematicase muestra en la figura 4.13 que describe su complejidad cerca del puntosingular. B

c>0

c>0

c<0

c<0

x

y

z

Figura 4.13: Curvas de nivel y graficas de f(x, y) = xyx2+y2 .

EJEMPLO. Consideremos el campo escalar cuartico

f(x, y) = x4 − y4 − 4xy

Page 164: Libro Mate 4

164 Campos escalares en R3

C Para el valor c ∈ R, los puntos (x, y) ∈ f−1(c) deberan satisfacer laecuacion

x4 + y4 − 4xy = c.

Tal ecuacion no es a primera vista reconocida y, de hecho, la forma de lascurvas de nivel varıan segun el valor c. En el capıtulo 9 (de los apendices)buscaremos tales curvas de nivel utilizando un analisis cualitativo de lafuncion alrededor de los llamados puntos crıticos, que determinan local-mente (alrededor de ellos) la estructura de las curvas de nivel. De hechomostraremos las siguientes propiedades de la funcion f .

a. Si c < −2 entonces f−1(c) es vacıo, es decir, solo cuando c ≥ −2 elconjunto de nivel f−1(c) es no vacıo.

b. Cuando c = −2 la curva de nivel es la pareja de puntos crıticosaislados

f−1(−2) = (−1,−1), (1, 1)

c. Cuando −2 < c < 0, la curva de nivel f−1(c) esta compuesta por unapareja de curvas cerradas que encierran a los puntos crıticos mencionadosen b.

d. Cuando c = 0 la curva de nivel f−1(0) es una curva que se autointersectaen (0, 0) en forma de “ocho” y que en cada uno de sus petalos encierra lasparejas de curvas mencionados en c.

e. Cuando c > 0 la curva de nivel f−1(c) es un circuito cerrado que encierraa la figura de “ocho” dada por f−1(0).

Cabe resaltar que una prueba contundente de todos los resultados men-cionados en este ejemplo serıan provistos por la teorıa basica de la rama delas matematicas conocida como Geometrıa Algebraica.

La figura 4.14 ilustra las curvas de nivel de la funcion y su graficatrazada por el programa de Mathematica. B

La moraleja de los ultimos ejemplos es que, en general, no es simple nisiquiera construir las curvas de nivel de una funcion .

Mas aun, ya teniendo las curvas de nivel de una funcion (vertebras dela grafica), en muchas ocasiones no es facil construir su grafica (columnavertebral).

Lo recomendable, entonces, durante el analisis de un campo escalar dedos variables, es el uso de un programa de graficacion ejecutado por unordenador.

Para el caso de una funcion de tres variables, la construccion de sugrafica es imposible debido a que esta sumergida en un espacio real dedimension cuatro, objeto que no es simple dibujar.

Page 165: Libro Mate 4

4.4 Derivadas parciales y el gradiente 165

(-1,-1)

(0,0)(1,1)

z

Figura 4.14: Curvas de nivel y grafica de f(x, y) = x4 + y4 − 4xy.

4.4 Derivadas parciales y el gradiente

A continuacion iniciamos el estudio de la propiedad de diferenciabilidad deun campo escalar definido en una region del espacio R3 (o R2).

Sean, f : Ω → R una funcion real de variable vectorial definida en laregion Ω ⊂ R3, y p = (x0, y0, z0) ∈ Ω un punto arbitrario. Si dejamos fijaslas coordenadas y0, z0 y variamos la variable x0 en el intervalo [x0, x0 + h]podemos formar el cociente (parcial)

f(x0 + h, y0, z0)− f(x0, y0, z0)h

y tomar el lımite cuando h→ 0 (vease la figura 4.15).

DEFINICION. Si tal lımite existe, se llamara la derivada parcial de frespecto a x en el punto p = (x0, y0, z0) y se entendera por

∂f

∂x(x0, y0, z0) = lim

h→0

f(x0 + h, y0, z0)− f(x0, y0, z0)h

Tal cantidad define la variacion de la funcion f en el punto p =(x0, y0, z0) en la direccion del eje x.

Analogamente, se construyen la derivada parcial de f respecto a y enp = (x0, y0, z0) como

∂f

∂y(x0, y0, z0) = lim

k→0

f(x0, y0 + k, z0)− f(x0, y0, z0)k

y la derivada parcial de f respecto a z en el punto (x0, y0, z0) mediantela igualdad

∂f

∂z(x0, y0, z0) = lim

`→0

f(x0, y0, z0 + `)− f(x0, y0, z0)`

Page 166: Libro Mate 4

166 Campos escalares en R3

si tales lımites existen.

x

(x0 0),y y

z

z=f(x,y)

Figura 4.15: Derivada parcial de una funcion respecto a x.

Como (x0, y0, z0) es arbitrario, el calculo de tales parciales se obtienederivando ordinariamente la funcion dada respecto a la variable indicadadejando fijas las otras variables.

EJEMPLO. Sea el campo escalar

f(x, y, z) = x2 + y2 + z2

C Calculamos sus derivadas parciales derivando ordinariamente res-pecto a la variable indicada, fijando las otras variables, obteniendo encualquier punto arbitrario (x, y, z) del plano,

∂f

∂x(x, y, z) = 2x,

∂f

∂y(x, y, z) = 2y,

∂f

∂z(x, y, z) = 2z B

EJEMPLO. Sea la funcion en tres variables

f(x, y, z) = exyz

C Por un calculo directo se tiene, en cualquier punto (x, y, z) del do-minio,

∂f

∂x(x, y, z) = yz exyz

∂f

∂y(x, y, z) = xz exyz

∂f

∂z(x, y, z) = xy exyz B

EJEMPLO. Dado el campo escalar

f(x, y) = sen (xy)

Page 167: Libro Mate 4

4.4 Derivadas parciales y el gradiente 167

calcular las derivadas parciales de f en el punto p = (1, π).

C Calculamos directamente en cada punto (x, y) del dominio,

∂f

∂x(x, y) = y cos(xy)

∂f

∂y(x, y) = x cos(xy)

y al evaluar en p = (1, π) se tiene,

∂f

∂x(1, π) = π cosπ = −π

∂f

∂y(1, π) = 1 cosπ = −1 B

En ocasiones, para fines de calculo, es conveniente omitir el argumentodonde se toman las derivadas parciales, esto es,

∂f

∂z(x, y, z) y

∂f

∂z

se sobreentiende que identifican a la misma cantidad.

Para el campo escalar f : Ω ⊂ R3 → R se define en el punto p ∈Ω el vector formado por las derivadas parciales en tal punto, llamado elgradiente del campo f en el punto p, y definido por

∇fp =

(∂f

∂x(p),

∂f

∂y(p),

∂f

∂z(p)

)

EJEMPLO. Si f(x, y) = sen(xy) y p = (1, π) entonces el vector gradientede f en p es el vector,

∇f(1,π) =(∂f

∂x(1, π),

∂f

∂y(1, π)

)= (−π,−1)

EJEMPLO. Sean f(x, y) = x2y3 y p = (3, 2).

C Para cualquier punto P se tiene

∇fp =

(∂f

∂x,∂f

∂y

)= (2xy3, 3xy2)p

y, por lo tanto, el gradiente de f en el punto p = (3, 2) es el vector

∇f(3,2) = (2xy3, 3xy2)(3,2) = (48, 108) B

Tenemos el siguiente resultado acerca de las propiedades aritmeticas delgradiente de un campo escalar.

Page 168: Libro Mate 4

168 Campos escalares en R3

TEOREMA 4.1 Sean f, g : Ω ⊂ R3 − R dos campos escalares tales quesus derivadas parciales existan en cada punto, entonces

a. El gradiente de la suma de funciones satisface la regla,

∇(f + g)p = ∇fp +∇gp

b. El gradiente es lineal respecto a escalares, es decir,

∇(λf)p = λ∇fp

donde λ ∈ R es un escalar.

c. Se cumple La formula de Leibniz

∇(fg) = g∇f + f∇g

C Damos apenas la demostracion de a.

∇(f + g)p =

(∂(f + q)

∂x(p),

∂(f + g)

∂y(p),

∂(f + g)

∂z(p)

)

=

(∂f

∂x(p) +

∂g

∂x(p),

∂f

∂y(p) +

∂g

∂y(p),

∂f

∂z(p) +

∂g

∂z(p)

)

=

(∂f

∂x(p),

∂f

∂y(p),

∂f

∂z(p)

)+

(∂g

∂x(p),

∂g

∂y(p),

∂g

∂z(p)

)

= ∇fp +∇gp B

EJEMPLO. Sea la funcion continua en tres variables dada por,

f(x, y, z) = senxy + exyz

C Entonces, para cada punto p = (x, y, z) en el espacio,

∇fp = ∇(senxy)p +∇(exyz)p

= (y cosxy, x cosxy, 0)p + (yzexyz, xzexyz, xyexyz)p

= (y cosxy + yzexyz, x cosxy + xzexyz, xyexyz)p

Particularmente, en el punto p = (1, π, 0) se tiene

∇f(1,π,0) = (y cosxy + yzexyz, x cosxy + xzexyz, xyexyz)(1,π,0)

= (π cosπ) + π(0)e(1)(π)(0), 1 cos(π) + (1)(0)e0, πe0)

= (−π,−1, π). B

Page 169: Libro Mate 4

4.4 Derivadas parciales y el gradiente 169

Damos ahora la definicion de diferenciabilidad de un campo escalar.

DEFINICION. Sean, una funcion f : Ω ⊂ R3 → R y p ∈ Ω un punto concoordenadas (x, y, z). Se dice que f es diferenciable en p, si existe unafuncion real de variable vectorial g(h) tal que

f(p+ h)− f(p) = ||h|| g(h)+ < h,∇fp >

limh→(0,0,0) g(h) = 0

suponiendo que el vector gradiente del campo f ,

∇fp =

(∂f

∂x(p),

∂f

∂y(p),

∂f

∂z(p)

)

existe en el punto p.

Si la funcion f : Ω → R es diferenciable en cada punto de Ω, simple-mente diremos que f es diferenciable en Ω.

A continuacion damos una condicion necesaria para que un campo es-calar tenga la propiedad de diferenciabilidad. Su prueba se omite, pero ellector puede referirse a Lima (1992).

TEOREMA 4.2 (de diferenciabilidad). Sea f : Ω ⊂ R3 → R ysupongase que en el punto p ∈ Ω las funciones determinadas por las deri-vadas parciales

∂f

∂x,∂f

∂y,∂f

∂z: Ω→ R

existen y son continuas (vease el capıtulo 8 en los apendices) en el puntop, entonces f es diferenciable en p.

Un corolario inmediato a este teorema es el siguiente.

COROLARIO 4.1 Toda funcion f : Ω→ R que involucre a las funcionesclasicas en las variables independientes x, y, z, es una funcion diferenciable.

EJEMPLOS. Las siguientes funciones son diferenciables en su dominionatural.

a. Cualquier polinomio P (x, y, z) en las variables x, y, z, por ejemplo,

P (x, y, z) = 6xyz3 + 2x2yz − 1

2xy2z2 + 3

b. f(x, y, z) = x−y+zx2+y2+3z

c. f(x, y, z) = sen√1− exy − z

Page 170: Libro Mate 4

170 Campos escalares en R3

d. f(x, y) = ln(1− x1/3 + 1

y2

)

e. f(x, y, z) = arctan(y/x+ z)

f. f(x, y, z) = xy2+ln(z+x)

Un resultado inmediato cuya prueba tampoco realizaremos es el si-guiente, referente, a la aritmetica de las funciones diferenciables.

LEMA 4.2 La suma (y diferencia), el producto y el cociente de funcionesreales de variable vectorial que son diferenciables, es una funcion diferen-ciable

EJEMPLO. Las siguientes funciones son diferenciables en todo su dominionatural.

a. f(x, y, z) = 6xyz2 + x−y+zx2+y2+3z

b. f(x, y, z) = sen√1 + exy − z + ln

(1− 3√xy + z

y2

)

c. f(x, y, z) = arctan(yx

)+ xyz + ln(z + x)

4.5 La regla de la cadena

En muchas ocasiones algunos problemas que involucran funciones de varia-ble vectorial pueden reducirse a problemas de funciones reales de variablereal que son mas simples de estudiar, mediante la composicion con cur-vas contenidas en las regiones donde estan definidas tales funciones. Acontinuacion damos el procedimiento.

Sean, f : Ω → R una funcion diferenciable en todo punto de la regionΩ ⊂ R3, y γ : (a, b)→ Ω una curva diferenciable. Entonces la composicion

f γ : (a, b)→ R

es una funcion real de variable real definida por,

(f γ)(t) = f(γ(t))

EJEMPLO. Sean, el campo escalar,

f(x, y, z) = xeyz + yezx

y la curva diferenciable

γ(t) = (4 cos t, 4 sen t, 2t).

Page 171: Libro Mate 4

4.5 La regla de la cadena 171

-1(c)f

õf

õf

p

p

q

q

Figura 4.16: Gradiente de una funcion.

C Entonces

(f γ)(t) = f(γ(t)) = f(4 cos t, 4 sent, 2t)

= 4 cos te(4sent)(2t) + 4sent e(2t)(4 cos t) = 4e8tsent cos t+ 4e8t cos tsent

es decir,

(f γ)(t) = 4e8tsent cos t+ 4e8t cos tsent

resulta ser una funcion real de variable real, diferenciable.

EJEMPLO. Sean la funcion

f(x, y) = ln(xy)

y la curva diferenciable γ(t) =(t, 1

t2

)con t > 0.

C Calculamos el dominio de f ,

xy > 0, si y solo sı,

x > 0 y y > 0o

x < 0 y y < 0

lo que nos dice que la union de cuadrantes positivo (estricto) y negativo(estricto)

Ω = (x, y) | (x > 0, y > 0), (x < 0, y < 0)

es el dominio de f , y que la curva

γ(t) = (t, 1/t2), t > 0

esta contenida en Ω.

Page 172: Libro Mate 4

172 Campos escalares en R3

γ

γ

f( (t))γγ(t)

f

f

( (a

t

bO

Figura 4.17: Regla de la cadena.

Entonces, la composicion (f γ)(t), que resulta ser una funcion diferen-ciable, se calcula por

(f γ)(t) = f(γ(t)) = f(t, 1/t2) = ln(t 1/t2) = ln(1/t) = − ln t B

Damos una formula para calcular la derivada de una composicion defunciones como la que se ha mencionado (vease la figura 4.17).

TEOREMA 4.3 (Regla de la cadena) Para una curva suave γ(t) yuna funcion diferenciable f(x, y, z) se cumple la formula

d(f γ)dt

(t) =< ∇fγ(t), ˙γ(t) >

que es la derivada de la composicion f γ en el tiempo t.

Esto es, en coordenadas x, y, z del espacio se tiene

d(f γ)dt

(t) =

⟨(∂f

∂x(γ(t)),

∂f

∂y(γ(t)),

∂f

∂z(γ(t))

),

(dx

dt,dy

dt,dz

dt

)⟩

=∂f

∂x

dx

dt+∂f

∂y

dy

dt+∂f

∂x

dz

dt

C Sea t ∈ (a, b) un punto arbitrario y considerese el incremento vectorial

h = γ(t+ s)− γ(t)

Es claro que h→ (0, 0, 0) si s→ 0.

Page 173: Libro Mate 4

4.5 La regla de la cadena 173

En virtud de que f es diferenciable, particularmente en el punto vecto-rial γ(t), se cumple que

f(γ(t) + h)− f(γ(t)) =< ∇fγ(t), h > +||h||g(h)

donde limh→(0,0,0) g(h) = 0, siendo h cualquier incremento vectorial.

Si se toma h = γ(t+ s)− γ(t), entonces se tiene

f(γ(t+ s))− f(γ(t)) =< ∇fγ(t), γ(t+ s)− γ(t) > +||γ(t+ s)− γ(t)||g(h)

que al dividir entre el incremento s nos da

(γ(t+ s)− f(γ(t))s

=

⟨∇fγ(t),

γ(t+ s)− γ(t)s

⟩+

∣∣∣∣∣∣∣∣γ(t+ s)− γ(t)

s

∣∣∣∣∣∣∣∣ g(h)

Si tomamos el lımite cuando s→ 0 se tiene que

d(f γ)dt

(t) = lims→0

f(γ(t+ s))− f(γ(t))s

=

⟨∇fγ(t), lim

s→0

γ(t+ s)− γ(t)s

+

∣∣∣∣∣∣∣∣ lims→0

γ(t+ s)− γ(t)s

∣∣∣∣∣∣∣∣ limh→0

g(h) =⟨∇fγ(t), γ(t)

⟩+ ||γ(t)|| lim

h→0g(h)

=< ∇fγ(t), γ(t) >debido a que limh→(0,0,0) g(h) = 0. B

EJEMPLO. Sea la funcion diferenciable

f(x, y) = x2 + 2xy

y sean x = r cosϕ, y = r senϕ con ϕ ∈ [0, 2π].

C Al formar la funcion g(r, ϕ) = f(r cosϕ, r senϕ) se tiene, al derivarla funcion g respecto a su variable verdadera r,

∂g

∂r=∂f

∂x

dx

dr+∂f

∂y

dy

dr= (2x+ 2y)(cosϕ) + (2y)(senϕ)

= 2r cos2 ϕ+ 2rsenϕ cosϕ+ 2r cosϕ senϕ = 2r cos2 ϕ+ 4 senϕ cosϕ

Si ϕ es variable tambien, entonces, al derivar la funcion g respecto a suvariable explıcita ϕ, se tiene que

∂g

∂ϕ=∂f

∂x

dx

dϕ+∂f

∂y

dy

= (2x+ 2y)(−rsenϕ) + (2x)(r cosϕ)

Page 174: Libro Mate 4

174 Campos escalares en R3

= (2r cosϕ+ 2r senϕ)(−r senϕ) + 2r cosϕ r cosϕ

= −2r2senϕ cosϕ− 2r2sen2ϕ+ 2r2 cos2 ϕ B

EJEMPLO. Considere el campo escalar de tres variables

w = f(x, y, z) = exy cos z

y las funciones

x = tuy = sen(tu)z = u2

C Al calcular la variacion de w respecto a t se tiene,

∂w

dt=∂f

∂x

∂x

∂t+∂f

∂y

∂y

∂t+∂f

∂z

∂z

∂t

= (yexy cos z)u+ (xexy cos z)u cos(tu)− (exysen z)(0)

= uexy cos z[y + x cos(tu)] = uetu sen (tu) cosu2[sen tu+ tu cos(tu)] B

EJEMPLO. Dada la funcion

u = f(x2 − y, xy)

calcular las derivadas parciales,

∂u

∂x,

∂u

∂y

C Construimos variables explıcitas para la funcion f , dadas por

r = x2 − yq = xy

Tenemos entonces que al derivar la funcion u respecto a su variableexplıcita x,

∂u

∂x=∂f

∂r

∂r

∂x+∂r

∂q

∂q

∂x=∂f

∂r(2x) +

∂f

∂q(y) = 2x

∂f

∂r+ y

∂f

∂q

Por otro lado, cuando se deriva u respecto a su variable explıcita y seobtiene

∂u

∂y=∂f

∂r

∂r

∂y+∂f

∂q

∂q

∂y=∂f

∂r(−1) + ∂f

∂q(x) = x

∂f

∂q− ∂f

∂rB

Page 175: Libro Mate 4

4.5 La regla de la cadena 175

EJEMPLO. Sea la funcion

g(t, x, y) = f(t2x, ty)

Calcular las derivadas parciales

∂g

∂t,

∂g

∂x,

∂g

∂y

C Entendemos por u = t2x, v = ty a las coordenadas explıcitas de f .Entonces,

∂g

∂t=∂f

∂u

∂u

∂t+∂f

∂v

∂v

∂t=

(∂f

∂u

)(2tx)

(∂f

∂v

)(y)

= 2tx∂f

∂u+ y

∂f

∂v

Por otro lado,

∂g

∂x=∂f

∂u

du

∂x+∂f

∂v

∂v

∂x=∂f

∂u(t2) +

∂f

∂v(0) = t2

∂f

∂u

Un calculo analogo prueba que,

∂g

∂y=∂f

∂u

∂u

∂y+∂f

∂v

∂v

∂y= t

∂f

∂vB

EJEMPLO. Supongase que en una habitacion Ω ⊂ R3 esta definida unafuncion f : Ω→ R tal que en cada punto p de Ω nos da una temperatura.

C Si un insecto recorre una trayectoria en Ω tal que en cada punto dela trayectoria la temperatura f es constante c, al conocer tal trayectoriapor γ(t) con t ∈ [a, b], se tiene que

f(γ(t)) = c

Al derivar ambos lados esta ecuacion se tiene,

d

dtf(γ(t)) = 0

pero, por la regla de la cadena esto implica que⟨∇fγ(t), γ(t)

⟩= 0

Lo anterior nos dice que los vectores gradiente ∇fγ(t) y velocidad γ(t) sonortogonales para todo punto γ(t) de la trayectoria (vease la figura 4.18).

Se dice en este caso, que el insecto realizo una trayectoria con la mismatemperatura (isotermal). B

Page 176: Libro Mate 4

176 Campos escalares en R3

γ( )tγ( )t

γ( )tõf

fc

Ñ

Figura 4.18: Trayectoria isotermal.

4.6 Derivada direccional

Introducimos ahora un concepto fundamental a la hora de hacer el analisisde un campo escalar (funcion real de variable vectorial) definido en unaregion Ω ⊂ R3.

Sea f : Ω ⊂ R3 → R una funcion diferenciable y, sean, el punto p ∈ Ωy ξ un vector unitario.

La lınea recta que pasa por p y con direccion ξ tiene una ecuacionparametrica dada por

γ(t) = p+ tξ con γ(0) = p, γ(0) = ξ

Para los puntos sobre el segmento de recta, contenido en Ω, se tiene unvalor real bajo la funcion f dado por

f(γ(t)) = f(p+ tξ)

Si calculamos la variacion de f a lo largo de tal lınea obtenemos, porla regla de la cadena,

d(f γ)dt

(t) =⟨∇fγ(t), γ(t)

Particularmente, en t = 0 se tiene

df(p+ tξ)

dt|t=0 =

⟨∇fγ(0), γ(0)

⟩= (∇fp, ξ〉

DEFINICION. Tal variacion de f se llamara la derivada direccionalde f en el punto p ∈ Ω en la direccion de ξ.

Page 177: Libro Mate 4

4.6 Derivada direccional 177

En coordenadas x, y, z se tiene la igualdad

df

dt(p+ tξ)|t=0 =

⟨(∂f

∂x(p),

∂f

∂y(p),

∂f

∂z(p)

), (ξ1, ξ2, ξ)

=∂f

∂x(p)ξ1 +

∂f

∂y(p)ξ2 +

∂f

∂z(p)ξ3

Observamos que para cuando se toma un vector localizado arbitrarioη 6= 0 con extremo inicial en p, tambien se puede hablar de la derivadadireccional de la funcion f en direccion η con el simple hecho de calcularla derivada de f en la direccion del normalizado ξ = η

||η|| , en virtud de que

ξ y η tienen la misma direccion y sentido (vease la figura 4.19).

p

ξ

(p+t )ξ

f(p+t )ξf

f(p)

Figura 4.19: Derivada direccional de f en p en la direccion ξ.

Una notacion apropiada para conocer a la derivada direccional de lafuncion f en el punto p, en la direccion del vector ξ es,

Dξfp =df

dt(p+ tξ) |t=0

EJEMPLO. Sea el campo escalar

f(x, y) = x2 + y2

Calcular la derivada direccional de f en el punto p = (−1, 3) en la direccionη = (1, 2)

C Como el vector η no es unitario pues ||η|| =√5, hemos de hacerlo

unitario mediante la cadena de igualdades,

ξ =η

||η|| =(1, 2)√

5=

(1√5,

2√5

)

De esta manera,

Dξ fp = 〈∇fp, ξ〉 =⟨(2x, 2y) |(−1,3),

(1√5,

2√5

)⟩

Page 178: Libro Mate 4

178 Campos escalares en R3

=

⟨(−2, 6),

(1√5,

2√5

)⟩=−2√5+

12√5=

10√5= 2√5 B

OBSERVACION. Si en particular se toman el vector canonico ξ = e1 =(1, 0, 0) se tiene que

De1fp =

⟨(∂f

∂x(p),

∂f

∂y(p),

∂f

∂z(p)

), (1, 0, 0)

)=∂f

∂x(p)

que es la derivada parcial ordinaria respecto a la primer coordenada.

Analogamente,

De2fp =∂f

∂y(p) y De3fp =

∂f

∂z(p)

OBSERVACION. De la cadena de igualdades

Dξfp = 〈∇fp, ξ〉 = ||∇fp|| ||ξ|| cos θ = ||∇fp|| cos θ

donde θ es el angulo formado por ∇fp y el vector unitario ξ, se tiene unafuncion en la variable θ definida por,

h(θ) = ||∇f || cos θ

Sabiendo que la relacion de ξ con θ esta determinada de manera biunı-voca, tenemos que

a. h tiene un valor maximo en θ = 0, es decir, cuando ξ esta en el mismosentido y direccion que ∇fp.b. h tiene un valor mınimo en θ = π, y se obtiene es decir, cuando ξ estaen direccion de ∇fp pero con sentido contrario.

De esta manera, la funcion f crece mas rapidamente alrededor del puntop en direccion del vector gradiente ∇fp, y decrece mas rapidamente endireccion del vector −∇fp.EJEMPLO. Sea el campo escalar

f(x, y) = x2 + xy + y2

C De la anterior discusion, en el punto p = (−1, 1) la funcion crece masrapidamente en direccion del vector

η = ∇fp = (2x+ y, 2y + x)(−1,1) = (−1, 1)

Page 179: Libro Mate 4

4.7 El Teorema de Taylor 179

Al normalizar η obtenemos el vector unitario

ξ =η

||η|| =(−1, 1)√

2=

(−1√2,1√2

)

que nos permite calcular la derivada direccional en direccion de η, mediante

Dξfp =< ∇fp, ξ >=⟨(−1, 1),

(−1√2,1√2

)⟩=

1√2+

1√2=

2√2=√2

Por otro lado, la funcion f decrece mas rapidamente en p en la direcciondel vector −η = −∇fp = (1,−1). La derivada direccional de la funcion fen el punto p, en tal direccion es, en este caso,

D−ξfp =< ∇fp,−ξ >=⟨(−1, 1),

(1√2,−1√2

)⟩= − 1√

2− 1√

2= −√2 B

4.7 El Teorema de Taylor

En esta parte generalizamos El teorema de Taylor, para funciones realescon variable vectorial que estan definidas en regiones del espacio euclidiano.Lo hacemos apenas para funciones suaves de dos variables, suponiendo unaextension natural para el caso de mas variables.

La idea basica del teorema consiste en aproximar una funcion de ciertaclase de diferenciabilidad por un polinomio en el numero de variables inde-pendientes, de la misma forma que para el caso de una sola variable (veaseReyes, 1996).

Comenzamos la seccion con el concepto de derivada parcial de ordensuperior.

EJEMPLO. Sea el campo escalar diferenciable

f(x, y) = ex2+y2

C Al calcular sus derivadas parciales se obtienen las nuevas funciones

∂f

∂x(x, y) = 2xex

2+y2

= g1(x, y)

∂f

∂y(x, y) = 2y ex

2+y2

= g2(x, y)

Page 180: Libro Mate 4

180 Campos escalares en R3

Claramente g1 y g2 tambien son funciones diferenciables y se puedecalcular sus derivadas parciales

∂g1∂x

(x, y) = 2ex2+y2

+ 2x 2xex2+y2

= (2 + 4x2)ex2+y2

∂g1∂y

(x, y) = 2y2xex2+y2

= 4xyex2+y2

∂g2∂x

(x, y) = 2x2yex2+y2

= 4xyex2+y2

∂g2∂y

(x, y) = 2ex2+y2

+ 2y 2yex2+y2

= (2 + 4y2)ex2+y2

que resultan ser nuevamente funciones diferenciables.

Al omitir (por notacion) las funciones g1, g2 de las ecuaciones anteriores,estas se pueden escribir,

∂x

(∂f

∂x

)= (2 + 4x2)ex

2+y2

∂y

(∂f

∂x

)= 4xyex

2+y2

∂x

(∂f

∂y

)= 4xyex

2+y2

∂y

(∂f

∂y

)= (2 + 4y2)ex

2+y2

De ahora y en adelante, adoptaremos la siguiente notacion para lasllamadas segundas derivadas parciales de la funcion f ,

∂x

(∂f

∂x

)=

∂2f

∂x∂x=∂2f

∂x2

∂y

(∂f

∂x

)=

∂2f

∂y∂x

∂x

(∂f

∂y

)=

∂2f

∂x∂y

∂y

(∂f

∂y

)=

∂2f

∂y∂y=∂2f

∂y2

Page 181: Libro Mate 4

4.7 El Teorema de Taylor 181

Con esta notacion, las segundas derivadas parciales de la funcion dadaf se escriben,

∂2f

∂x2= (2 + 4x2)ex

2+y2

∂2f

∂y∂x= 4xyex

2+y2

∂2f

∂x∂y= 4xyex

2+y2

∂2f

∂y2= (2 + 4y2)ex

2+y2

Observamos que para este caso se cumple la igualdad de las relacionesobtenidas para las segundas derivadas parciales mixtas:

∂2f

∂y∂x=

∂2f

∂x∂y= 4xyex

2+y2

B

DEFINICION. Si la funcion f : Ω ⊂ R2 → R es tal que sus derivadasparciales existen

∂f

∂x: Ω→ R

∂f

∂y: Ω→ R

y como funciones definidas en Ω son continuas, se dice que la funcion es declase C1. Si ademas las funciones ∂f

∂x ,∂f∂y son diferenciables y sus derivadas

parciales (segundas derivadas parciales de la funcion f)

∂2f

∂x2: Ω→ R

∂2f

∂y∂x: Ω→ R

∂2f

∂x∂y: Ω→ R

∂2f

∂y2: Ω→ R

son continuas, entonces f se dira una funcion de clase C2.

Las derivadas parciales segundas

∂2f

∂y∂x,∂2f

∂x∂y

Page 182: Libro Mate 4

182 Campos escalares en R3

se llaman las segundas derivadas parciales mixtas.

En el ejemplo anterior se indico una propiedad de igualdad de talesparciales mixtas. Una condicion suficiente para la igualdad en general setiene el teorema siguiente, cuya prueba es muy tecnica y la omitimos (veaseLima, 1992).

TEOREMA 4.4 (Conmutatividad de las segundas parciales mix-tas). Sea f : Ω → R campo escalar de clase C2, esto es, las funcionesobtenidas para las segundas derivadas parciales son continuas (vease elcapıtulo 8), entonces se cumple la igualdad de conmutatividad,

∂2f

∂y∂x=

∂2f

∂x∂x

EJEMPLO. Dada la funcion

f(x, y) = x2y3 + 3xy

mostramos la validez del teorema 4.4 para este campo escalar.

C Al calcular la derivada parcial de la funcion respecto a x se tiene

∂f

∂x= 2xy3 + 3y

y consecuentemente, al derivar esta ultima funcion respecto a y obtenemos

∂2f

∂y∂x= 6xy2 + 3

Por otro lado,∂f

∂y= 3x2y2 + 3x

lo que implica∂2f

∂x∂y= 6xy2 + 3 =

∂2f

∂x∂yB

Inductivamente, podemos definir a una funcion f(x, y) de clase Cr (conr ≥ 1), si para cualquier particion del entero r en los enteros s y m, laderivada parcial r−esima de f dada por

∂rf

∂ym∂xs: Ω→ R

existe y es una funcion continua. Aquı, 0 ≤ s ≤ r, 0 ≤ m ≤ r y r = m+ s.

Page 183: Libro Mate 4

4.7 El Teorema de Taylor 183

En la expresion∂rf

∂ym∂xs

se entiende que se calcula m−derivadas parciales de f respecto a la variabley y s−derivadas parciales respecto a x, realizando en total un calculo dem+ s = r derivadas parciales.

La extension de la definicion de clase de diferenciabilidad para un campoescalar de mas variables es una analogıa a la dada para apenas dos variables.

El Teorema 4.4 se puede extender para una funcion que depende demas variables. Esto es, si f(x, y, z) es una funcion que satisface las condi-ciones dadas de diferenciabilidad, el teorema de conmutatividad se cumpletambien.

De hecho, por ejemplo,

∂2f

∂x∂z=

∂2f

∂z∂x

∂2f

∂x∂y=

∂2f

∂y∂x

∂2f

∂z∂y=

∂2f

∂y∂z

Si la misma funcion f(x, y, z) es de clase C3, entonces la conmutatividadse extiende de manera natural.

EJEMPLO. Consideremos a f(x, y, z) un campo escalar funcion de claseC3 definido en alguna region del espacio.

C Se tiene la siguiente cadena de igualdades,

∂3f

∂y∂x2=

∂2

∂y∂x

(∂f

∂x

)=

∂2

∂x∂y

(∂f

∂x

)=

∂x

(∂2f

∂y∂x

)

=∂

∂x

(∂2f

∂x∂y

)=

∂3f

∂x2∂y

Tambien se cumplen las igualdades,

∂3f

∂z∂y∂x=

∂3f

∂z∂x∂y=

∂3f

∂x∂y∂z=

∂3f

∂x∂z∂y

ası como la igualdad,∂3f

∂y∂z2=

∂3f

∂z2∂yB

Page 184: Libro Mate 4

184 Campos escalares en R3

Si f(x, y, z) es una funcion de clase C4, tambien se cumple el teoremade conmutatividad de las derivadas parciales. Por ejemplo, son justas lasigualdades

∂4f

∂z∂y∂x2=

∂4f

∂x2∂z∂y=

∂4f

∂y∂x2∂z

∂4f

∂x∂z3=

∂4f

∂z3∂x=

∂4f

∂z∂x∂z2

∂4f

∂y2∂x2=

∂4f

∂x2∂y2=

∂4f

∂y∂x∂y∂x

Generalizando lo anterior, si f(x, y, z) es una funcion de clase Cr con(r ≥ 1), el teorema de conmutatividad tambien se extiende. Por ejemplo,

∂rf

∂z`∂ym∂xn=

∂rf

∂ym∂xn∂z`=

∂rf

∂xn∂z`∂ym

donde ` + m + n = r. Aquı se entiende que la funcion f se va a derivarparcialmente r veces en total: ` veces respecto a la variable z, m vecesrespecto a la variable y y m veces respecto a la variable x.

EJEMPLO. Calcular las derivadas parciales

∂3f

∂x∂y∂z,

∂3f

∂z∂y∂x

para la funcionf(x, y, z) = exyz

C En la notacion dada, tenemos que

∂f

∂z= xyexyz

∂2f

∂y∂z= xexyz + x2yzexyz = (x+ x2yz)exyz

de donde,

∂3f

∂x∂y∂z= (1 + 2xyz)exyz + (x+ x2yz)yzexyz

= (1 + 3xyz + x2y2z2)exyz

Por otro lado,∂f

∂x= yzexyz

Page 185: Libro Mate 4

4.7 El Teorema de Taylor 185

∂2f

∂y∂x= zexyz + yz2xexyz = (z + yxz2)exyz

∂3f

∂z∂y∂x= (1 + 2xyz)exyz + (z + yxz2)xyexyz

= (1 + 3xyz + x2y2z2)exyz

lo que verifica las igualdades de las parciales mixtas. B

Ahora construimos el polinomio de Taylor de una funcion suave con dosvariables.

Recordamos que para funciones reales de variable real se tenıa que si lafuncion f : (a, b) → R es de clase Cr, entonces, por El teorema de Taylor,alrededor del punto p ∈ (a, b) la funcion f se escribe localmente

f(x) = f(p) +f ′(p)

1!(x− p) + f ′′(p)

2!(x− p)2 + f ′′′(p)

3!(x− p)3

+ · · ·+ f (r)(p)

r!(x− p)r + o((x− p)r+1)

donde o((x− p)r+1) significa un error en el monomio x− p de orden r + 1(vease Reyes, 1996).

Aquı, la expresion polinomial de grado r en el monomio x− p

f(p)+f ′(p)

1!(x−p)+ f ′′(p)

2!(x−p)2+ f ′′′(p)

3!(x−p)3+ · · ·+ f (r)(p)

r!(x−p)r

se llama El polinomio de Taylor de grado r de la funcion f en el puntop.

Generalizamos la idea de aproximar una funcion en dos variables f(x, y)mediante un polinomio de grado r en dos variables x, y, para cuando lafuncion dada es de clase Cr.

Un polinomio lineal en las variables x, y es del tipo

P1(x, y) = c00 + c10(x− a) + c01(y − b)

donde, los coeficientes cij son constantes reales, al igual que a y b.

Un polinomio cuadratico en las variables x, y es del tipo:

P2(x, y) = c00 + c10(x− a) + c01(y − b)

+c20(x− a)2 + c11(x− a)(y − b) + c02(y − b)2

donde, nuevamente, los coeficientes cij son constantes reales.

Page 186: Libro Mate 4

186 Campos escalares en R3

Un polinomio cubico tiene la forma

P3(x, y) = c00 + c10(x− a) + c01(y − b)︸ ︷︷ ︸parte lineal

+ c20(x− a)2 + c11(x− a)(y − b) + c02(y − b)2︸ ︷︷ ︸parte cuadratica

+ c30(x− a)3 + c21(x− a)2(y − b) + c12(x− a)(y − b)2 + c03(y − b)3︸ ︷︷ ︸parte cubica

Observamos que, en general, un polinomio de grado r en las variablesx, y se escribe,

Pr(x, y) =r∑

k=1

k=i+j

cij(x− a)i (y − b)j+ c00

Iniciamos un proceso de aproximacion de cualquier funcion de dos va-riables que sea suave, por un polinomio en dos variables.

Sea f(x, y) una funcion arbitraria de clase Cr definida en una region Ω,en el punto p = (a, b) ∈ Ω y sea (x, y) ∈ Ω cualquier punto cercano a p.

Primeramente intentamos aproximar a f linealmente en una cercanıadel punto p, mediante el polinomio

f(x, y) = f(p) + c10(x− a) + c01(x− b)︸ ︷︷ ︸parte lineal

+o((x− a)2, (y − b)2)

donde la expresion o((x − a)2, (x − b)2) define un error en los monomiosx− a y y − b de orden dos.

C Calculamos los coeficientes cij apropiados, calculando primeramente

∂f

∂x= c10 + o((x− a), (y − b)2),

lo que nos dice que, al calcular en p = (a, b), esto es, en x = a, y = b,

∂f

∂x(a, b) = c10 + o((x− a), (y − b))|x=a, y=b = c10

lo que nos da el primer coeficiente.

Page 187: Libro Mate 4

4.7 El Teorema de Taylor 187

Igualmente, de la relacion

∂f

∂y= c01 + o((x− a)2, (y − b))

se obtiene, al evaluar en p = (a, b),

∂f

∂y(a, b) = c01

Por lo tanto, la aproximacion lineal de f alrededor de p serıa mediantela expresion

f(x, y) = f(a, b)+∂f

∂x(a, b)(x−a)+ ∂f

∂y(a, b)(y−b)+o((x−a)2, (y−b)2) B

Aproximamos ahora a la funcion f(x, y) hasta el orden dos, medianteel polinomio cuadratico

f(x, y) = f(a, b) +∂f

∂x(a, b)(x− a) + ∂f

∂y(a, b)(y − b)

+c20(x− a)2 + c11(x− a)(y − b) + c02(y − b)2︸ ︷︷ ︸parte cuadratica

+o((x− a)3, (y − b)3)

donde la expresion o((x− a)3, (y− b)3) define un error de orden cubico enlos monomios indicados.

C Procedemos a calcular las constantes c20, c11, c02 apropiadas del poli-nomio.

∂f

∂x=∂f

∂x(a, b) + 2c20(x− a) + c11(y − b) + o((x− a)2, (y − b)3)

donde la expresion o((x − a)2, (y − b)3) define un error de orden dos en elmonomio x− a junto con un error de orden tres en el monomio y − b.

Por lo tanto,

∂2f

∂x2= 2c20 + o((x− a), (y − b)3)

lo que al evaluar en el punto (a, b) nos dice que

∂2f

∂x2(a, b) = 2c20

es decir,

c20 =1

2

∂2f

∂x2(a, b)

Page 188: Libro Mate 4

188 Campos escalares en R3

Ademas, se tiene

∂2f

∂y∂x= c11 + o((x− a)2, (y − b)2)

lo que nos indica, al elvaluar en el punto (a, b),

∂2f

∂y∂x(a, b) = c11

Por otro lado, al derivar parcialmente respecto a y la funcion inicial fse tiene

∂f

∂y=∂f

∂y(a, b) + c11(x− a) + 2c02(y − b) + o((x− a)3, (y − b)2)

con lo que,∂2f

∂y2= 2c02 + o((x− a)3, (y − b))

Al evaluar en el punto p = (a, b) esta expresion se obtiene,

∂2f

∂y2(a, b) = 2c02

y por lo tanto,

c02 =1

2

∂2f

∂y2(a, b)

De esta forma, hasta el orden dos la aproximacion de la funcion f es,

f(x, y) = f(p) +∂f

∂x(p)(x− a) + ∂f

∂y(p)(y − b)

+1

2

∂2f

∂x2(p)(x− a)2 + ∂2f

∂y∂x(p)(x− a)(y − b) + 1

2

∂2f

∂y2(p)(y − b)2

+o((x− a)3, (y − b)3) B

Un intento de aproximacion a orden tres para f serıa dada por el poli-nomio,

f(x, y) = f(a, b) +∂f

∂x(a, b) (x− a) + ∂f

∂y(a, b)(y − b)

+1

2

∂2f

∂x2(a, b)(x− a)2 + ∂2f

∂y∂x(a, b)(x− a)(y − b) + 1

2

∂2f

∂y2(a, b)(y − b)2

Page 189: Libro Mate 4

4.7 El Teorema de Taylor 189

+c30(x− a)3 + c21(x− a)2(y − b) + c12(x− a)(y − b)2 + c03(y − b)3

+o((x− a)4, (y − b)4)donde o((x − a)4, (y − b)4) es un error de orden cuatro en los monomiosdados.

Calculamos los coeficientes c30, c21, c12, c03 de tal expresion utilizandoel mismo procedimiento.

C Derivando parcialmente la igualdad respecto a la variable x, tenemos

∂f

∂x=∂f

∂x(a, b) +

∂2f

∂x2(a, b)(x− a) + ∂2f

∂y∂x(a, b)(y − b)

+3c30(x− a)2 + 2c21(x− a)(y − b) + c12(y − b)2 + o((x− a)3, (y − b)4)de donde,

∂2f

∂x2=∂2f

∂x2(a, b) + 3! c30(x− a) + 2c21(y − b) + o((x− a)2, (y − b)4)

y entonces,∂3f

∂x3= 3!c30 + o((x− a), (y − b)4)

lo que nos indica, al evaluar el punto (a, b)

∂3f

∂x3(a, b) = 3!c30

Ası, podemos calcular c30 por

c30 =∂3f∂x3 (a, b)

3!

Por otro lado,

∂3f

∂y∂x2= 2c21 + o((x− a)2, (y − b)3)

de donde,∂3f

∂y∂x2(a, b) = 2c21

lo que implica

c21 =

∂3f∂y∂x2 (a, b)

2

Page 190: Libro Mate 4

190 Campos escalares en R3

Ademas, de ∂f∂x podemos obtener

∂2f

∂y∂x=

∂2f

∂y∂x(a, b) + 2c21(x− a) + 2c12(y − b) + o((x− a)3, (y − b)3)

y de esto,∂3f

∂y2∂x= 2c12 + o((x− a)3, (y − b)2)

Por lo tanto,∂3f

∂y2∂x(a, b) = 2c12

con lo que se obtiene el coeficiente

c12 =

∂3f∂y2∂x (a, b)

2

Otro calculo analogo prueba que,

∂3f

∂y3(a, b) = 3!c03

es decir,

c03 =

∂3f∂y3 (a, b)

3!

Por lo tanto, el desarrollo a orden tres nos quedarıa, al sustituir talescoeficientes,

f(x, y) = f(a, b) +∂f

∂x(a, b)(x− a) + ∂f

∂y(a, b)(y − b)

+1

2

∂2f

∂x2(a, b)(x− a)2 + ∂2f

∂y∂x(a, b)(x− a)(y − b) + 1

2

∂2f

∂y2(a, b)(y − b)2

+∂3f∂x3 (a, b)

3!(x−a)3+

∂3f∂y∂x2 (a, b)

2(x−a)2(y− b)+

∂3f∂y2∂x (a, b)

2(x−a)(y− b)2

+

∂3f∂y3 (a, b)

3!(y − b)3 + o((x− a)4, (y − b4)) B

Observamos que la relacion anterior se puede escribir, al tomar p =(a, b), tambien como

f(x, y) = f(p) +∂f∂x (p)

1!0!(x− a) +

∂f∂y (p)

0!1!(y − b)

Page 191: Libro Mate 4

4.7 El Teorema de Taylor 191

+∂2f∂x2 (p)

2!0!(x− a)2 +

∂2f∂y∂x (p)

1!1!(x− a)(y − b) +

∂2f∂y2 (p)

0! 2!(y − b)2

+∂3f∂x3 (p)

3!0!(x− a)3 +

∂3f∂y∂x2 (p)

2! 1!(x− a)2(y − b) +

∂3f∂y2∂x (p)

1! 2!(x− a)(y − b)2

+

∂3f∂y3 (p)

0!3!(y − b)3 + o((x− a)4, (y − b)4).

Procediendo inductivamente, es facil ver que la parte cuartica del poli-nomio buscado es,

C

∂4f∂x4 (p)

4!0!(x− a)4 +

∂4f∂y∂x3 (p)

3!1!(x− a)3(y − b) +

∂4f∂y2∂x2 (p)

2!2!(x− a)2(y − b)2

+

∂4f∂y3∂x (p)

1!3!(x− a)(y − b)3 +

∂4f∂y4 (p)

0!4!(y − b)4 B

Podemos escribir la generalizacion de toda la discusion anterior en elsiguiente resultado.

TEOREMA 4.5 (de Taylor) Si f(x, y) es un campo escalar de claseCr, entonces alrededor del punto p = (a, b) ∈ Ω se tiene que la funcion seescribe como el polinomio de grado r en dos variables

f(x, y) = f(p) +

r∑

k=1

i+j=k

∂kf∂yj∂xi (p)

i!j!(x− a)i(y − b)j

+o((x− a)r+1, (y − b)r+1)

donde la cantidad o((x − a)r+1, (y − b)r+1) es un error de orden r + 1 enlos monomios x− a y y − b.

DEFINICION. A la expresion (sin error) del lado derecho de la ecuacionen El teorema de Taylor se le llamara El polinomio de Taylor de grador de la funcion f en el punto p, en las variables independientes.

EJEMPLO. Sea la funcion

f(x, y) = sen(xy)

Desarrollar El polinomio de Taylor alrededor de p = (0, 0) hasta orden dos.

C Aquı, a = 0, b = 0, y al calcular las parciales (hasta las segundas) setiene

∂f

∂x= y cos(xy),

∂2f

∂y∂x= cos(xy)− xysen(xy)

Page 192: Libro Mate 4

192 Campos escalares en R3

∂2f

∂x2= −y2sen(xy), ∂f

∂y= x cos(xy),

∂2f

∂y2= −x2sen(xy)

Por lo tanto, los coeficientes se calculan evaluando en el punto (a, b) =(0, 0),

∂f

∂x(0, 0) = 0,

∂2f

∂x2(0, 0) = 0,

∂2f

∂y∂x(0, 0) = 1,

∂f

∂y(0, 0) = 0,

∂2f

∂y2(0, 0) = 0

y por la formula de Taylor del teorema 5.2 se tiene que,

f(x, y) = f(0, 0) +∂f∂x (0, 0)

1!0!(x− 0) +

∂f∂y (0, 0)

0!1!(y − 0) +

∂2f∂x2 (0, 0)

2!0!(x− 0)2

+

∂2f∂y∂x (0, 0)

1!1!(x− 0)(y − 0) +

∂2f∂y2 (0, 0)

0!2!(y − 0)2 + o((x− 0)3, (y − 0)3)

= xy + o(x3, y3)

Esto es, hasta orden dos la funcion dada se escribe

sen(xy) = xy + o(x3, y3)

Otra forma de realizar el desarrollo anterior, es observando que parauna variable z real el desarrollo de la funcion seno alrededor de z0 = 0 es

senz = z − z3

3!+z5

5!− z7

7!+ o(8)

Ahora, defınase z = xy, y considerese p = (0, 0). Entonces, z(0, 0) =0 = z0, y sustituyendo la variable z, hasta el orden dos, se obtiene

sen(xy) = (xy)− (xy)3

3!+ o(7) = xy + o(3)

que es la misma expresion obtenida. B

La forma de desarrollar las funciones en varias variables utilizando losdesarrollos conocidos de Taylor para una variable, ayudan en general paraomitir una buena cantidad de calculos. No obstante hay que tener practicapara reconocer las sustituciones apropiadas y los puntos alrededor de loscuales se esta desarrollando. Esto se ha mostrado en el ejemplo anterior yse muestra nuevamente en el siguiente.

EJEMPLO. Desarrollar la funcion

f(x, y) = ln(1 + xy)

Page 193: Libro Mate 4

4.7 El Teorema de Taylor 193

en polinomio de Taylor hasta orden tres alrededor del punto p = (0, 0).

C Calculamos las derivadas parciales hasta orden tres,

∂f

∂x=

y

1 + xy

∂f

∂y=

x

1 + xy

∂2f

∂y∂x=

(1 + xy)− yx(1 + xy)2

=1

(1 + xy)2

∂2f

∂x2=

−y2(1 + xy)2

∂2f

∂y2=

−x2(1 + xy)2

∂3f

∂x3=

2y3

(1 + xy)3

∂3f

∂y3=

2x3

(1 + xy)3

∂3f

∂y2∂x= −2(1 + xy)−3x =

−2x(1 + xy)3

∂3f

∂y∂x2=−2y(1 + xy)2 + y22(1 + yx)x

(1 + xy)4=

−2y(1 + xy)3

De esta manera,∂f

∂x(0, 0) = 0,

∂f

∂y(0, 0) = 0

∂2f

∂x2(0, 0) = 0,

∂2f

∂y∂x(0, 0) = 1,

∂2f

∂y2(0, 0) = 0

∂2f

∂x3(0, 0) = 0,

∂3f

∂y∂x(0, 0) = 0,

∂3f

∂y∂x(0, 0) = 0,

∂3f

∂y3(0, 0) = 0

Por lo tanto, alrededor de p = (0, 0) se tiene que la funcion f(x, y) =ln(1 + xy) se escribe

ln(1 + xy) = ln(1 + 0) +∂f

∂x(0, 0)(x− 0) +

∂f

∂y(0, 0)(y − 0)

+∂2f∂x2 (0, 0)

2!0!(x− 0)2 +

∂2f∂y∂x (0, 0)

1!1!(x− 0)(y − 0) +

∂2f∂y2 (0, 0)

0!2!(y − 0)2

Page 194: Libro Mate 4

194 Campos escalares en R3

+∂3f∂x3 (0, 0)

3!0!(x− 0)3+

∂3f∂y∂x2 (0, 0)

2!1!(x− 0)(y− 0)+

∂3f∂y2∂x (0, 0)

1!2!(x− 0)(y− 0)2

+

∂3f∂y3 (0, 0)

0!3!(y − 0)3 + o((x− 0)4, (y − 0)4) = xy + o(x4, y4)

Por otro lado, el desarrollo alrededor de z0 = 0 de la funcion ln(1 + z)esta dado por la igualdad

ln(1 + z) = z − z2

2+ o(3)

Por eso, si ponemos z = xy entonces el punto (a, b) = (0, 0) correspondeal punto z0 = 0 y entonces

ln(1 + xy) = xy − (xy)2

2+ o(3) = xy − x2y2

z+ o(5)

= xy + o(3)

igualdad que se ha obtenido ya, utilizando el teorema 4.5. B

Damos ahora un ejemplo del desarrollo de un polinomio alrededor deun punto.

EJEMPLO. Dar el polinomio de Taylor alrededor del punto p = (1, 2) dela funcion polinominal

f(x, y) = x3 − 2y3 + 3xy

C Calculamos todas las posibles derivadas parciales, obteniendo,

∂f

∂x= 3x2 − 3y,

∂f

∂y= −6y2 + 3x

∂2f

∂x2= 6x,

∂2f

∂y∂x= −3, ∂

2f

∂y2= −12y

∂3f

∂x3= 6,

∂3f

∂y∂x2= 0,

∂3f

∂y2∂x= 0,

∂3f

∂y3= −12

De esta forma, al evaluar cada derivada obtenida en el punto p se tiene

∂f

∂x(1, 2) = −3, ∂f

∂y(1, 2) = −21

∂2f

∂x2(1, 2) = 6,

∂2f

∂y∂x(1, 2) = −3, ∂2f

∂y2(1, 2) = −24

Page 195: Libro Mate 4

4.8 Diferencial total de un campo escalar 195

∂3f

∂x3(1, 2) = 6,

∂3f

∂y∂x2(1, 2) = 0,

∂3f

∂y2∂x(1, 2) = 0,

∂3f

∂y3(1, 2) = −12

Por lo tanto, por el teorema 4.5, alrededor de (1, 2) la funcion f se escribe

f(x, y) = f(1, 2)− −3(x− 1)

1!0!− 21(y − 2)

0!1!

+6(x− 1)2

2!0!− 3(x− 1)(y − 2)

1!1!− 24(y − 2)2

0!2!

+6(x− 1)3

3!0!+

0(x− 1)2(y − 2)

2!1!+

0(x− 1)(y − 2)2

1!2!− 12(y − 2)3

0!3!

= −9− 3(x− 1)− 21(y − 2) + 3(x− 1)2 − 3(x− 1)(y − 2)− 12(y − 2)2

+(x− 1)3 − 2(y − 2)3

debido a que las derivadas parciales de orden cuatro en adelante se anulantodas. B

4.8 Diferencial total de un campo escalar

Para el campo escalar f : D ⊂ R2 → R y el punto arbitrario p = (x, y) ∈ D,se tiene el incremento total de f en p dado por

∆f = f(x+ h, y + k)− f(x, y)

donde h = ∆x y k = ∆y son incrementos arbitrarios en las variables dadas.

De la definicion de diferenciabilidad de f en p, dada en la seccion 4.4, setiene que f es diferenciable en p si el incremento total ∆f puede escribirseen la forma

∆f =∂f

∂x(p)∆x+

∂f

∂y(p)∆y + o(||(∆x, ∆y)||2)

cuando ||(∆x, ∆y)|| → 0. Podemos escribir lo anterior mediante la notacionconvencional

df =∂f

∂xdx+

∂f

∂ydy

en virtud de que o(||(∆x,∆y)||2)→ 0.

DEFINICION. Para la funcion diferenciable f : D ⊂ R2 → R se definela diferencial total de f por la igualdad

df =∂f

∂xdx+

∂f

∂ydy

Page 196: Libro Mate 4

196 Campos escalares en R3

EJEMPLO. Dada la funcion f(x, y) = ln(x2 + y2) definida en la regionplana D = R2 − (0, 0), calcule su diferencial total.

C En virtud de que

∂f

∂x(x, y) =

2x

x2 + y2,∂f

∂y(x, y) =

2y

x2 + y2

se tiene

df =∂f

∂xdx+

∂f

∂ydy =

2x

x2 + y2dx+

2y

x2 + y2dy =

2xdx+ 2ydy

x2 + y2

De esta manera, para calcular aproximadamente ln(0.0912 + 0.992) to-mamos x = 0 y y = 1 obteniendo que ∆x = 0.091, ∆y = −0.01, lo que nosindica que

df =2(0)(0.091) + 2(1)(−0.01)

02 + 12= −0.02

y consecuentemente,

ln(0.0912 + 0.992) ≈ f(0, 1) + df = ln(02 + 12)− 0.02

es decir,ln(0.0912 + 0.992) ≈ −0.02 B

De manera analoga, para una funcion diferenciable de tres variables, setiene una diferencial total,

df =∂f

∂xdx+

∂f

∂ydy +

∂f

∂zdz

EJEMPLO. Dada la funcion T = exyz, calcular su diferencial total.

C Primero calculamos las derivadas parciales

∂T

∂x= yzexyz,

∂T

∂y= xzexyz,

∂T

∂z= xyexyz

luego construimos la diferencial total

dT =∂T

∂xdx+

∂T

∂ydy +

∂T

∂zdz = yzexyzdx+ xz exyzdy + xy exyzdz

= exyz(yzdx+ xzdy + xydz) B

Para una funcion de clase C2 se define la diferencial total de segundoorden por d2f y se calcula mediante

d2f =∂2f

∂x2dx2 + 2

∂2f

∂y∂xdxdy +

∂2f

∂y2dy2

Page 197: Libro Mate 4

4.8 Diferencial total de un campo escalar 197

Si escribimos la expresion anterior en notacion operacional se tiene,

d2f =∂2f

∂x2dx2 + 2

∂2f

∂y∂xdxdy +

∂2f

∂y2dy2

=

(∂2

∂x2dx2 + 2

∂2f

∂y∂xdxdy +

∂2

∂y2dy2)(f)

=

(∂

∂xdx+

∂ydy

)2

(f)

donde la aplicacion del operador se realiza mediante la convencion

∂x

(∂

∂y

)=

∂2

∂y∂x=

∂2

∂x∂y=

∂y

(∂

∂x

)

EJEMPLO. Sea u = cosx cos y. Calcular d2u.

C Calculamos las derivadas parciales, obteniendo,

∂u

∂x= −senx cos y, ∂u

∂y= − cosx sen y

∂2u

∂x2= − cosx cos y,

∂2u

∂y∂x= senx sen y,

∂2u

∂y2= − cosx cos y,

lo que indica que

du2 = − cosx cos ydx2 + 2 senx sen ydxdy − cosx cos ydy2 B

De manera inductiva, se tiene para un campo escalar f de clase C3 latercera diferencial total d3f = d(d2f), y viene dada por

d3f =∂3f

∂x3dx3 + 3

∂3f

∂y∂x2dx2dy + 3

∂3f

∂y2∂xdxdy2 +

∂3f

∂y3dy3

que en notacion convencional operacional podemos escribir

d3f =

(∂

∂xdx+

∂ydy

)3

(f)

En forma general, en notacion convencional, se tiene la k−esima di-ferencial total del campo escalar de clase Ck dada por

dkf =

(∂

∂xdx+

∂ydy

)k

(f)

Page 198: Libro Mate 4

198 Campos escalares en R3

que se desarrolla de acuerdo a la formula del binomio de Newton.

EJEMPLO. Para el campo escalar u = y lnx calcular d4u.

C De acuerdo al Triangulo de Pascal, los coeficientes del binomio deNewton de grado 4 son 1, 4, 6, 4, 1, lo cual nos indica que

d4u =

(∂

∂xdx+

∂ydy

)4

(u)

=

(∂4

∂x4dx4 + 4

∂4

∂y∂x3dx3dy + 6

∂4

∂y2∂x2dx2dy2+

4∂4

∂y3∂xdxdy3 +

∂4

∂y4dy4)(u)

=∂4u

∂x4dx4 + 4

∂4u

∂y∂x3dx3dy + 6

∂4u

∂y2∂x2dx2dy2 + 4

∂4u

∂y3∂xdxdy3 +

∂4u

∂y4dy4

De esta manera, al calcular las derivadas parciales

∂u

∂x=y

x,∂u

∂y= lnx

∂2u

∂x2= − y

x2,∂2u

∂y∂x=

1

x,∂2u

∂y2= 0

∂3u

∂x3=

2y

x3,

∂3u

∂y∂x2= − 1

x2,

∂3u

∂y2∂x= 0,

∂3u

∂y3= 0

∂4u

∂x4= −6y

x4,∂4u

∂y∂x3=

2

x3,

∂4u

∂y2∂x2=

∂4u

∂y3∂x=∂4u

∂y4≡ 0

y sustituirlas se obtiene

d4u = −6y

x4dx4 + 4

(2

x3

)dx3dy = −6y

x4dx4 +

8

x3dx3dy B

Si consideramos el elemento vectorial diferencial en R3, en la basecanonica e1, e2, e3 dado por el vector simbolico

d~r = (dx, dy, dz)

entonces la diferencial total de un campo escalar f esta dada por

df =∂f

∂xdx+

∂f

∂ydy +

∂f

∂z=

⟨(∂f

∂x,∂f

∂y,∂f

∂z

), (dx, dy, dz)

=< grad f, d~r >

Page 199: Libro Mate 4

4.8 Diferencial total de un campo escalar 199

Ejercicios

1. ¿Cuales de los siguientes subconjuntos son abiertos? ¿Cuales son cerra-dos? ¿Cuales son conexos? Haga un dibujo para cada conjunto dado.

a. Ω = (x, y)| |x| ≥ 1b. Ω = (x, y)| x+ y < 1c. Ω = (x, y)| |x|+ |y| ≥ 1d. Ω = (x, y)| |senx| >

√22

e. Ω = (x, y, z)| x+ y + 2z < 2f. Ω = (x, y, z)| x2 − y2 − z2 ≤ 1g. Ω = (x, y, z)| ||(x, y, z)|| < 1 o 4 ≤ ||(x, y, z)||h. Ω = (x, y, z)| x2 + y2 < z <

√4− x2 − y2

2. Calcular los dominios de los siguientes campos escalares y dar su carac-terıstica topologica (abierto, cerrado, conexo).

a. f1(x, y) =√x2 + y2 − 4

b. f2(x, y) =4√

4−x2y2

c. f3(x, y) = arccos(2x− y)d. f4(x, y) = ln(y2 − x)e. f5(x, y) = y +

√x

f. g1(x, y, z) =√

16− x2 − y2 − z2

g. g2(x, y, z) = arcsen

(3x√y2+z2

)

h. g3(x, y, z) =1

ln(9−x2−y2−z2)

i. g4(x, y, z) =√x+ 2y − 3z

3. Dibujar las curvas de nivel de las siguientes funciones definidas en do-minios del plano. Hallar tales dominios.

a. f1(x, y) = 4x− yb. f2(x, y) =

2yx

c. f3(x, y) = ln(1−x1−y

)

d. f4(x, y) = ex+y

4. Hallar las superficies de nivel de las siguientes funciones definidas endominios de R3.

a. f1(x, y, z) = 6x− 3y + 2z

Page 200: Libro Mate 4

200 Campos escalares en R3

b. f2(x, y, z) = 3x2 + 3y2 + z

c. f3(x, y, z) =√x2 + y2 + z2

d. f4(x, y, z) = x2 − y2 − z2

5. Calcular las derivadas parciales ∂∂x ,

∂∂y ,

∂∂z de cada una de las funciones

indicadas.

a. f1(x, y, z) = x3y4 + xyz2 − 3z3y3

b. f2(x, y, z) = sen(xyz) + xsen y + ysen z

c. f3(x, y, z) = x sen(y − z) + z arctan(xy)

d. f4(x, y, z) =√x2 + y2eyz +

√x2 + z2 ln(xy)

e. f5(x, y, z) =x−y+zx2+y2z2

6. a. Mostrar que la funcion z = yy/xsen(yx

)satisface la ecuacion

x2∂z

∂x+ xy

∂z

∂y= yz

b. Probar que la funcion z = x2

2y + x2 + 1

x − 1y satisface la ecuacion

x2∂z

∂x+ y2

∂z

∂y=x3

y

7. Para los incisos del ejercicio 5. correspondientes, calcular el gradientede la funcion correspondiente en el punto dado.

a. ∇f1(x, y, z) en p = (1, 1, 1)

b. ∇f2(x, y, z) en p =(1, π2 ,

π4

)

c. ∇f3(x, y, z) en p =(0, π2 ,

π4

)

d. ∇f4(x, y, z) en p = (−1, 0, 1)e. ∇f5(x, y, z) en p = (1, 2, 3)

8. a. Sean

x = t+ 2sy = s2 − tz = t2 + s2

y la funcion u = x2 + 2xy + y2 + z2. Calcular ∂u∂s y ∂u

∂t mediante la reglade la cadena.

b. Dadosx = sen(t+ s), y = cos(t+ s)

y la funcion u = x+xyx2+y2 , calcular

∂u∂t ,

∂u∂s mediante la regla de la cadena.

Page 201: Libro Mate 4

4.8 Diferencial total de un campo escalar 201

c. Dado u = (x2 + y2 + z2)3/2, calcular

∂u

∂x,∂u

∂y,∂u

∂z

d. Sea la funcion u = f(r − s, s− t, t− r), demostrar que

∂u

∂s+∂u

∂r+∂u

∂t= 0

e. Sea u = f(x2−y2

x2+y2

), demostrar que

x∂u

∂x+ y

∂u

∂y= 0

f. Dada la funcion g(x, y) = f(x+ y, x− y), demostrar la igualdad

∂g

∂x

∂g

∂y=

(∂f

∂u

)2

−(∂f

∂v

)2

donde u = x+ y, v = x− y.g. Dado el angulo constante ϕ y las relaciones

x = u cosϕ− v senϕy = u senϕ+ v cosϕ

demostrar que la funcion compuesta f(x, y) = g(u, v) satisface la relacion

(∂g

∂u

)2

+

(∂g

∂v

)2

=

(∂f

∂x

)2

+

(∂f

∂y

)2

h. Calcular el gradiente ∇fp para las siguientes funciones, si

r =√x2 + y2 + z2 y f(x, y, z) = h(r)

donde,

i) h(r) = r2

ii) h(r) = ln r

iii) h(r) = e−r2

9. Calcular la derivada direccional Dξfp para las funciones, puntos y vec-tores dados.

Page 202: Libro Mate 4

202 Campos escalares en R3

a. f(x, y) = xy2, p = (1, 1), ξ = (−1, 3)b. f(x, y) = arctan (xy), p = (−1, 1), ξ = (1,−2)c. f(x, y) = e−(x

2+y2), p = (0, 0), ξ = (1, 1)

d. f(x, y, z) = y arctan(xz), p = (1, 1, 1), ξ = (−1, 0, 2)e. f(x, y, z) = xy + yz + zx, p = (−1, 1,−1), ξ = (1,−1, 2)

10. a. Dada la funcion f(x, y, z) = x2 + xy + z2 dar la direccion ξ en laque crece mas rapidamente f en el punto p = (−1, 1, 1). Calcular Dξ fppara estos elementos.

b. Sea la funcion

f(x, y) =x√

x2 + y2

En que direccion crece mas rapidamente f en el punto p = (1, 0)?

11. a. Calcular ∂2f∂y∂x y ∂2f

∂x∂y para f(x, y) = ln tan(y + x)

b. Calcular ∂2f∂y∂x y ∂2f

∂x∂y para f(x, y) = arctan(

x+y1+xy

)

c. Calcular ∂2f∂x2 ,

∂2f∂y2 y ∂2f

∂y∂x para f(x, y) = y senxy + x cosxy

d. Calcular ∂3u∂y∂x2 ,

∂3u∂y2∂x y ∂3u

∂x2∂y para u = sen(2x+ y2)

e. Dada la funcion u = x3y2 demostrar la validez de la igualdad

∂5u

∂y2∂x3=

∂5u

∂x3∂y2

f. Sea la funcion u = 1√te−

x2

4t2 . Probar que satisface la ecuacion

∂u

∂t=∂2u

∂x2

12. Sea f(x, y) = g(r, ϕ) donde

x = r cosϕy = rsenϕ

demostrar que se cumple la igualdad

∂2g

∂r2+

1

r

∂g

∂r+

1

r2∂2g

∂θ2=∂2f

∂x2+∂2f

∂y2

Page 203: Libro Mate 4

4.8 Diferencial total de un campo escalar 203

13. Sea f(x, y) una funcion tal que para cualquier numero real t se cumpleque en todo el dominio de f es justa la igualdad f(tx, ty) = tnf(x, y),donde n es un numero entero.

a. Demostrar que se cumple la igualdad

x∂f

∂x+ y

∂f

∂y= nf(x, y)

b. Mostrar ademas que tambien se cumple que

x2∂2f

∂x2+ 2xy

∂2f

∂x∂y+ y2

∂2f

∂y2= n(n− 1)f(x, y)

14. Demostrar que la funcion u = e3x+4y cos(5z) satisface La ecuaciondiferencial de Laplace,

∂2u

∂x2+∂2u

∂y2+∂2u

∂z2= 0

15. Desarrollar hasta orden tres en formula de Taylor las funciones indi-cadas en los puntos indicados.

a. f(x, y) = e2xsen 2y en el punto p = (1, π/2).b. f(x, y) = cos(x2 − y) en el punto p = (0,−π).c. f(x, y) = ln(1 + x+ y) en el punto p = (1, 1).d. f(x, y) = x2 + xy + y3 en el punto p = (0, 0)e. f(x, y) = x2 + xy + y2 en el punto p = (−1, 1)16. Dado el polinomio

f(x, y) = y3 + 4xy5 + 4x2y4

¿Cual es el termino de orden cuatro de su expresion de Taylor en el puntop = (0, 0)?

17. Calcular df , df2 y d3f para las funciones a.-e. del ejercicio 15.

Page 204: Libro Mate 4

204 Campos escalares en R3

Page 205: Libro Mate 4

Capıtulo 5

Campos vectoriales en R3

5.1 Funciones del tipo Rn → Rm

En este capıtulo hacemos un estudio de los aspectos basicos de las funcionesvectoriales con argumento vectorial del tipo Rn → Rm, llamadas tambiencampos vectoriales definidos en Rn con valores vectoriales en Rm. Dehecho, los dominios de tales funciones en general seran regiones contenidasen el espacio de dimension n.

Dada la region (conjunto abierto conexo) Ω ⊂ Rn, una funcion de tipo

f : Ω→ Rm

a cada punto p ∈ Ω le asocia el punto q = f(p) en Rm.

En los correspondientes sistemas de coordenadas, si p = (x1, · · · , xn),q = (y1, · · · , ym) entonces tal funcion se escribira

(y1, y2, · · · , ym) = f(x1, · · · , xn)

Como las coordenadas yi’s dependen de p, entonces cada una de ellases una funcion real dependiente de p,

y1 = f1(p) = f1(x1, · · · , xn)y2 = f2(p) = f2(x1, · · · , xn)

...ym = fm(p) = fm(x1, · · · , xn)

siendo cada una de las fi, funciones reales de variable vectorial definidasen Ω, para i = 1, 2, · · · ,m,

fi : Ω→ R

Page 206: Libro Mate 4

206 Campos vectoriales en R3

ÑÑ

pf(p)

nm

Figura 5.1: Funcion de Rn → Rm.

y son llamadas las funciones coordenadas de la funcion f (vease la figura5.1).

Esto es, la funcion f se escribe en coordenadas, como

f(x1, · · · , xn) = (f1(x1, · · · , xn), f2(x1, · · · , xn), · · · , fm(x1, · · · , xn))

EJEMPLO. Sea la funcion f cuya regla de correspondencia esta dada por

f(x, y) =

(xy, lnxy2,

y

1 + x2

),

Entonces f esta definida en una region Ω de R2 y toma valores en R3.

C Procedamos a calcular el dominio de la funcion, analizando cadafuncion coordenada.

Ciertamente la coordenada primera xy y la tercera y1+x2 no ofrecen

alguna restriccion. La segunda funcion coordenada impone la condicion deque el argumento xy2 debera ser positivo.

Como xy2 > 0, necesariamente cuando x > 0, y 6= 0, el dominio esentonces

Ω = (x, y)|x > 0, y 6= 0y la funcion f esta bien definida en Ω. Las funciones coordenadas se es-criben explıcitamente,

f1(x, y) = xy, f2(x, y) = lnxy2, f3(x, y) =y

1 + x2B

La figura 5.2 ilustra el dominio de la funcion. B

EJEMPLO. Sea la funcion vectorial de argumento real

γ(t) = (t2 + 1,√1− t, sen t)

Page 207: Libro Mate 4

5.1 Funciones del tipo Rn → Rm 207

Ω

x

y

Figura 5.2: Dominio de (x, y)→(xy, lnxy2, y

1+x2

).

Claramente, es una funcion real con valores en R3, esto es, tiene laforma Ω ⊂ R→ R3.

C Se condiciona la variable t a que 1− t ≥ 0, lo que nos dice que 1 ≥ t,de donde el dominio de γ es entonces,

Ω = t ∈ R | t ≤ 1 = (−∞, 1]

( ]−∞ 1

γ( )t γ( )t

Figura 5.3: Curva espacial.

Las funciones coordenadas de γ vienen dadas por

f1(t) = t2 + 1, f2(t) =√1− t, f3(t) = sen t

La figura 5.3 ilustra la imagen de γ en el espacio de dimension tres. B

EJEMPLO. Sea la funcion dada por

f(x, y, z) = (x2 + y2, lnxz + y)

Page 208: Libro Mate 4

208 Campos vectoriales en R3

Esta funcion esta definida en una region espacial y toma valores en R2,esto es, f es de la forma

Ω ⊂ R3 → R2.

C Para calcular su dominio imponemos la condicion xz > 0, lo queequivale a

x > 0 y z > 0o

x < 0 y z < 0

lo que implica que el dominio es la region espacial

Ω = (x, y, z) | x > 0 y z > 0, o x < 0 y z < 0, y ∈ R

La figura 5.4 ilustra el dominio de la funcion, que es la union de cuatrooctantes en R3.

x

y

z

Figura 5.4: Dominio del campo (x2 + y2, lnxz + y).

Las funciones coordenadas del campo vectorial f son, en este caso

f1(x, y, z) = x2 + y2, f2(x, y, z) = lnxz + y B

EJEMPLO. El campo escalar f : R3 → R dado por la regla de correspon-dencia

f(x, y, z) =√x2 + y2 + z2

esta definido en R3 (n = 3,m = 1), y tiene solo una funcion coordenada.

Le damos una estructura aritmetica al conjunto de funciones del tipoΩ ⊂ Rn → Rm mediante las propiedades vectoriales del codominio Rm.

Page 209: Libro Mate 4

5.1 Funciones del tipo Rn → Rm 209

Si f, g : Ω → Rm son dos funciones definidas en el mismo dominio enRn, se puede definir la suma de ellas

f + g : Ω→ Rm

como la funcion que en coordenadas del dominio y codominio se calculapor

(f + g)(x1, · · · , xn) = f(x1, · · ·xn) + g(x1, · · · , xn)

= (f1(x1, · · · , xn), · · · , fm(x1, · · · , xn))(g1(x1, · · · , xn), · · · , gm(x1, · · · , xn))

= (f1(x1, · · · , xn) + g1(x1, · · · , xn), · · · , fm(x1, · · ·xn) + gm(x1, · · · , xn))

Si λ es un escalar, se define la funcion nueva

λf : Ω→ Rm

como aquella que en coordenadas se escribe

(λf)(x1, · · · , xn) = λf(x1, · · · , xn) = λ(f1(x1, · · ·xn), · · · , fm(x1, · · · , xn))

= (λf1(x1, · · · , xn), · · · , λfm(x1, · · · , xm))

Tambien definimos una categorıa de las funciones vectoriales mediante lacomposicion ordinaria de funciones.

Sean las funciones f : Ω ⊂ Rn → Rm, g : U ⊂ Rm → Rk de tal formaque la imagen de Ω bajo f este contenida en U , es decir, f(Ω) ⊂ U. Sedefine la composicion de la funcion f con g

g f : Ω→ Rk

a traves de la igualdad,

(g f)(p) = g(f(p))

vease la figura 5.5.

A continuacion damos ejemplos de la composicion de funciones vecto-riales de argumento vectorial.

EJEMPLO. Sean las funciones vectoriales dadas por

f(x, y, z) = (x2, y2 + z2)

Page 210: Libro Mate 4

210 Campos vectoriales en R3

Ñ Ñ Ñ

p f(p)f g

U

g(f(p))

n m k

Ω

g f

Figura 5.5: Composicion de funciones.

g(u, v) = (ln(u+ v), euv, uv)

C a. Calculemos g f en un punto arbitrario (x, y, z) del dominio deesta composicion.

(g f)(x, y, z) = g(f(x, y, z)) = g(x2, y2 + z2)

= (ln(x2 + y2 + z2), ex2(y2+z2), x2(y2 + z2))

de donde, la composicion es del tipo

g f : Ω1 ⊂ R3 → R3

b. Calculamos f g en un punto arbitrario (u,w) del dominio correspon-diente.

(fg)(u, v) = f(g(u, v)) = f(ln(u+v), euv, uv) = (ln2(u+v), (euv)2+(uv)2)

= (ln2(u+ v), e2uv + u2v2)

composicion que tiene el tipo

f g : Ω2 ⊂ R2 → R2 B

EJEMPLO. Dadas las funciones vectoriales

f(x, y) =

(y

1 + x2, xy + y2

)

g(u, v, w) = (uv − w, u+ v + w)

Calcular g f , f g.

Page 211: Libro Mate 4

5.1 Funciones del tipo Rn → Rm 211

C a. Ciertamente g f no tiene sentido pues la imagen de f es unsubconjunto del plano R2, mientras que el dominio de g es la region espacialR3.

b. Para el punto (u, v, w) se cumple que

(f g)(u, v, w) = f(g(u, v, w)) = f(uv − w, u+ v + w)

=

(u+ v + w

1 + (uv − w)2 , (uv − w)(u+ v + w) + (u+ v + w)2)

B

Para optimizar la discusion sobre la continuidad de las funciones vec-toriales de argumento vectorial, apelamos a la siguiente definicion quegarantiza la continuidad de los campos vectoriales en los subsecuentes ejem-plos.

DEFINICION. Una funcion f : Ω → Rn → Rm es continua en Ω, si ysolo sı, cada una de sus funciones coordenadas fi : Ω→ R es continua.

Transformaciones Lineales

De entre todas las funciones Rn → Rm se destacan las llamadas tranfor-maciones lineales. Estas ayudaran a definir la diferenciabilidad de unafuncion vectorial de variable vectorial.

Iniciamos el tratado basico con las transformaciones lineales mas simplesR3 → R3, obteniendo la mayor informacion para este tipo de transforma-ciones y argumentamos inductivamente la generalizacion de estos resultadospara transformaciones lineales mas generales del tipo Rn → Rm.

Sea la funcion L : R3 → R3 dada por

L(x, y, z) = (a11x+ a12y + a13z, a21x+ a22 + a23z, a31x+ a32y + a33z)

donde cada aij es un numero real.

C Es claro que si u, v, w son las coordenadas, en el codominio de L,entonces cada funcion se escribira,

u = a11x+ a12y + a13z

v = a21x+ a22y + a23z

w = a31x+ a32y + a33z

que matricialmente se escribe,

uvw

=

a11 a12 a13a21 a22 a23a31 a32 a33

xyz

Page 212: Libro Mate 4

212 Campos vectoriales en R3

En otras palabras, si definimos a los vectores variable dependiente eindependiente como los vectores columna,

p =

xyz

, A = (aij), q =

uvw

la relacion anterior se escribe mediante la igualdad

q = Ap = L(p)

En adelante, abusando de la notacion, cada vez que en una transfor-macion lineal apliquemos a un vector, para el calculo tomaremos a tal vec-tor como un vector columna, escribiendo finalmente el resultado del calculocomo un vector renglon elemento del codominio.

Con esta asociacion y con la converson de notacion se tiene,

a. Si p1, p2 ∈ R3 (considerados como vectores), entonces

L(p1 + p2) = A(p1 + p2) = Ap1 +Ap2 = L(p1) + L(p2)

es decir, se cumple que

L(p1 + p2) = L(p1) + L(p2)

b. Si λ ∈ p entonces L(λp) = A(λp) = λ(Ap) = λL(p), es decir, se satisfacela igualdad,

L(λp) = λL(p)

DEFINICION. La funcion L se dice que es una transformacion linealpor satisfacer las propiedades a. y b.

Hemos observado que una matriz A = A3×3 tiene asociada una trans-formacion lineal L : R3 → R3 que satisface las propiedades a. y b. de ladefinicion.

Recıprocamente, sea dada la transformacion L : R3 → R3 tal que satis-face a. y b. (es decir, es lineal), y sean los vectores e1, e2, e3 basicos enR3 tal que todo punto (x, y, z) se escriba

(x, y, z) = xe1 + ye2 + ze3

Definamos a los vectores columna (escritos convencionalmente de estamanera),

a11a21a31

= L(e1),

a12a22a32

= L(e2),

a13a23a33

= L(e3)

Page 213: Libro Mate 4

5.1 Funciones del tipo Rn → Rm 213

Afirmamos que la matriz construida por los vectores columna ası obte-nidos

A =

a11 a12 a13a21 a22 a23a31 a32 a33

esta asociada a la tranformacion lineal L y la define cuando se evaluan lospuntos del dominio

C En efecto, al tomar un punto (x, y, z) se tiene

L(x, y, z) = L(xe1 + ye2 + ze3) = L(xe1) + L(ye2) + L(ze3)

= xL(e1) + yL(e2) + zL(e3)

= x

a11a21a31

+ y

a12a22a32

+ z

a13a23a33

=

a11x+ a12y + a13za21x+ a22y + a23za31x+ a32y + a33z

=

a11 a12 a13a21 a22 a23a31 a32 a33

xyz

= A

xyz

B

Podemos generalizar esto para dimensiones arbitrarias m,n haciendouna reconstruccion similar a la utilizada para este caso especial. Una tran-formacion lineal L : Rn → Rm es aquel campo vectorial que satisface lascondiciones a. y b. de la definicion dada. De esta manera se tendra elsiguiente teorema general.

TEOREMA 5.1 Sea L : Rn → Rm una transformacion lineal, entoncesexiste una unica matriz real de m × n, A = (aij) asociada a L tal quepara todo x = (x1, · · · , xn) se tiene que (utilizando la convencion para elcalculo),

L(x) = Ax =

a11 · · · a1n...

......

am1 · · · amn

x1...xn

La matriz A es tal que si e1, e2, · · · en es la base en Rn, entonces, Laplicado al vector ej es el vector columna,

L(ej) =

a1ja2j...

amj

esto es, el j−esimo vector columna de la matriz asociada A.

Page 214: Libro Mate 4

214 Campos vectoriales en R3

C La unicidad del teorema se deja como un ejercicio para el lector. B

Hasta aquı, el lector ya habra observado que una transformacion linealen general, tendra solo en sus funciones coordenadas a expresiones linealesen las variables, sin terminos independientes.

En los siguientes ejemplos el lector debera aprender a reconocer porsimple inspeccion una transformacion lineal, y a calcular su matriz aso-ciada.

EJEMPLO. Sea la transformacion L : R3 → R3 dada por,

L(x, y, z) = (y + z, x+ z, x+ y)

C Al considerar la matriz A dada por

A =

0 1 11 0 11 1 0

y a (x, y, z) un vector en R3, se tiene,

A

xyz

=

0 1 11 0 11 1 0

xyz

=

y + zx+ zx+ y

y, por lo tanto, A esta asociada a L, lo que dice que L es una transformacionlineal.

Mas aun, si se toma la base canonica

e1 = (1, 0, 0), e2 = (0, 1, 0), e3 = (0, 0, 0)

entonces, al aplicar A en cada uno de ellos se obtiene

A(e1) =

0 1 11 0 11 1 0

100

=

011

A(e2) =

0 1 11 0 11 1 0

010

=

101

A(e3) =

0 1 11 0 11 1 0

001

=

110

lo que nos da los vectores columnas de la matriz A. B

Page 215: Libro Mate 4

5.1 Funciones del tipo Rn → Rm 215

EJEMPLO. Sea la transformacion L : R2 → R3 definida por

L(x, y) = (2x− y, 3x+ 4y, 2x)

C Al considerar la matriz de 3× 2 dada por

A =

2 −13 42 0

se tiene que

A

(xy

)=

2 −13 42 0

(xy

)=

2x− y3x+ 4y

2x

lo que indica que A esta asociada a L.

Si se toman los vectores basicos e1 = (1, 0), e2 = (0, 1), entoncestendremos los vectores columna de la matriz A mediante los calculos,

L(e1) =

2 −13 42 0

(

10

)=

232

L(e2) =

2 −13 42 0

(

01

)=

−140

B

EJEMPLO. Sea la transformacion lineal

L(x, y, z) = (−x− y + z, 4z − 2x+ 2y)

C Al considerar la matriz real

A =

(−1 −1 1−2 2 4

)

2×3

es facil ver que A es la matriz asociada a L B

EJEMPLO. Sea la transformacion lineal L : R3 → R dada por

L(x, y, z) = 6x− 3y + 2z

C Si se considera el vector renglon,

A =(6 −3 2

)1×3

Page 216: Libro Mate 4

216 Campos vectoriales en R3

para el vector (x, y, z), se obtiene,

A

xyz

= (6 − 3 2)1×3

xyz

3×1

= 6x− 3y + 2z

lo que dice que A es la matriz asociada a la transformacion lineal L. B

Damos ahora una interpretacion geometrica de una transformacion li-neal para el caso L : R2 → R3.

e

Le

L

L( )ξ

Le

Le

Le

ξ

ξξ

ξξ

e

e

e

1

1

1

2

22

1

1

2

1

2

2

Figura 5.6: Geometrıa de una transformacion lineal.

Si consideramos un vector en el plano R2, este se puede escribir comouna combinacion lineal de los vectores basicos,

ξ = ξ1e1 + ξ2e2

De esta manera, su imagen bajo L se escribirıa como

L(ξ) = L(ξ1e1 + ξ2e2) = L(ξ1e1) + L(ξ2e2) = ξ1L(e1) + ξ2L(e2)

lo que nos dice que la imagen de ξ es una combinacion lineal de los vectoresimagenes de los basicos, en R3 (vease la figura 5.6).

De esta manera, la imagen del cuadrado en el plano R2 generado por losvectores e1, e2 bajo la transformacion L es el paralelogramo en R3 tendidosobre los vectores L(e1) y L(e2), como lo muestra la figura 5.6.

En general, si L : Rn → Rm es una transformacion lineal y ξ ∈ Rn esun vector posicionado en el origen, entonces L(ξ) es tambien un vector enRm posicionado en el origen.

Obtenemos ahora una matriz asociada a la composicion de transforma-ciones lineales, en terminos de las matrices asociadas a cada una de las

Page 217: Libro Mate 4

5.1 Funciones del tipo Rn → Rm 217

transformaciones que intervienen en la composicion. Lo hacemos apenaspara el caso especial de las transformaciones lineales del tipo R2 → R2,generalizando el resultado de manera natural.

Consideremos dos transformaciones lineales del plano en el plano, dadaspor

L1(x, y) = (ax+ by, cx+ dy)

L2(u, v) = (αu+ βv, γu+ δv)

donde a, b, c, d, α, β, γ, δ son numeros reales.

C Al realizar su composicion tenemos para un vector (x, y) ∈ R2,

(L2 L1)(x, y) = L2(L1(x, y)) = L2(ax+ by, cx+ dy)

= (α(ax+ by) + β(cx+ dy), γ(ax+ by) + δ(cx+ dy))

= (αax+ αby + βcx+ βdy, γax+ γby + δcx+ δdy)

= ((αa+ βc)x+ (αb+ βd)y, (γa+ δc)x+ (γb+ δd)y)

Como se cumple la igualdad matricial

(αa+ βc αb+ βdγa+ δc γb+ δd

)(xy

)=

((αa+ βc)x+ (αb+ βd)y((γa+ δc)x+ (γb+ δd)y

)

entonces la matriz asociada a la composicion L2 o L1 es

C =

(αa+ βc αb+ βdγa+ δc γb+ δd

)

Por otro lado, las matrices asociadas a L1 y L2 son

A =

(a bc d

), B =

(α βγ δ

)

respectivamente, y un calculo prueba que el producto

BA =

(α βγ δ

)(a bc d

)=

(αa+ βc αb+ βdγa+ δc γb+ d

)= C

lo que nos dice que la composicion L2 o L1 tiene asociada al producto delas matrices correspondientes en el mismo orden. B

Generalizamos la anterior discusion en el siguiente resultado.

Page 218: Libro Mate 4

218 Campos vectoriales en R3

TEOREMA 5.2 Para una pareja de transformaciones lineales

L1 : Rn → Rm, L2 : Rm → Rk

cuyas matrices asociadas son respectivamente

A = Am×n (para L1) y B = Bk×m (para L2)

La composicion L2 L1 tiene asociada a la matriz producto

C = BA = Bk×mAm×n = Ck×n

EJEMPLO. Sean dadas las transformaciones lineales

L1(x, y) = (2x− y, y + x, 4y)

L2(x, y, z) = (−x− y − z, z + 3x)

C Las matrices asociadas respectivas son

A =

2 −11 10 4

(para L1)

B =

(−1 −1 −13 0 1

)(para L2)

y por el teorema 5.3, la matriz de la composicion L2 o L1 es entonces,

C = BA =

(−1 −1 −13 0 1

)

2 −11 10 4

=

(−3 −46 1

)

Por lo tanto, al aplicar convencionalmente en un vector se tiene,

(L2 L1)(x, y) =

(−3 −46 1

)(xy

)=

(−3x− 4y6x+ y

)

lo cual se puede escribir en forma transpuesta como

(L2 L1)(x, y) = (−3x− 4y, 6x+ y) B

Page 219: Libro Mate 4

5.2 La matriz jacobiana 219

5.2 La matriz jacobiana

Comenzamos en esta seccion, a discutir la propiedad de diferenciabilidad deuna funcion vectorial de variable vectorial, generalizando lo que se obtuvopara caso de funciones reales de variable vectorial, donde intervenıa fuerte-mente la continuidad de las derivadas parciales que conforman el gradiente.El objeto matematico necesario para generalizar el gradiente viene dado poruna matriz cuyas entradas en cada punto son las derivadas parciales de lasfunciones coordenadas, respecto a todas las variables independientes. Estamatriz lleva el nombre de Matriz Jacobiana.

Sea f : Ω ⊂ Rn → Rm una funcion tal que en coordenadas del codominiose escriba f(p) = (f1(p), · · · , fm(p)), para p ∈ Ω ⊂ Rn.

Cada funcion coordenada es real de variable vectorial

f1 : Ω→ Rf2 : Ω→ R

...fm : Ω→ R

Si cada funcion fi : Ω → R tiene un gradiente en el punto p para toda1 = 1, 2, · · · ,m

∇(fi)p =

(∂fi∂x1

(p),∂fi∂x2

(p), · · · , ∂fi∂xn

(p)

)

entonces podemos formar la siguiente matriz m× n,

Dfp =

∂f1

∂x1(p) ∂f1

∂x2(p) · · · ∂f1

∂xn(p)

∂f2

∂x1(p) ∂f2

∂x2(p) · · · ∂f2

∂xn(p)

......

∂fm

∂x1(p) ∂fm

∂x2(p) · · · ∂fm

∂xn(p)

m×n

llamada La matriz Jacobiana de la funcion f en el punto p.

Damos ahora algunos ejemplos en dimensiones bajas, esto es, paracuando n,m ≤ 3.

EJEMPLO. Sea la funcion f : R2 → R2 dada por la regla de correspon-dencia.

f(x, y) = (x+ y, x2y)

C Debido a que las funciones coordenadas son

f1(x, y) = x+ y, f2(x, y) = x2y

Page 220: Libro Mate 4

220 Campos vectoriales en R3

La matriz Jacobiana en cualquier p ∈ R2 es

Dfp =

(∂f1

∂x∂f1

∂y∂f2

∂x∂f2

∂y

)=

(1 1

2xy x2

)

p

De esta manera, en el punto particular del dominio p = (1, 2), se tienela matriz Jacobiana de 2× 2,

Df(1,2) =

(1 1

2xy x2

)

(1,2)

=

(1 14 1

)B

EJEMPLO. Sea la funcion f : R2 → R3 dada por la regla,

g(x, y) = (xy, senx, x2 + y2)

C Ya que las funciones coordenadas son

g1(x, y) = xy, g2(x, y) = senx, g3(x, y) = x2 + y2

entonces en cualquier punto p del codominio se tiene una Matriz Jacobianade 3× 2,

Dgp =

∂g1

∂x∂g1

∂y∂g2

∂x∂g2

∂y∂g3

∂x∂g3

∂y

p

=

y xcosx 02x 2y

p

Por ejemplo, si p = (π, π/2) entonces, al evaluar se obtiene la matriz

Dg(π,π/2) =

y xcosx 02x 2y

(π,π/2)

=

π/2 π−1 02π π

B

En este momento damos pauta para iniciar el estudio de la propiedadde diferenciabilidad de una funcion vectorial de argumento vectorial exten-diendo la definicion de diferenciabilidad de un campo escalar.

DEFINICION. Sean f : Ω ⊂ Rn → Rm, una funcion vectorial de argu-mento vectorial y un punto p ∈ Ω. Se dice que f es diferenciable en p si ex-isten, una funcion g : Rn → Rm y una transformacion lineal Lp : Rn → Rm

tales que

f(p+ h)− f(p) = Lp(h) + ||h||g(h)y

lim||h||→0 g(h) = 0

A continuacion se propone una condicion suficiente y necesaria para ladiferenciabilidad de un campo vectorial.

Page 221: Libro Mate 4

5.2 La matriz jacobiana 221

TEOREMA 5.3 (de diferenciabilidad) Una funcion f : Ω → Rm esdiferenciable en el punto p, si y solo sı, La matriz Jacobiana de f en pexiste y las entradas

Dfp =

(∂fi∂xj

)

p

, i = 1, 2, · · · ,m j = 1, 2 · · · , n

son continuas,

Esto es, cada funcion ∂fi

∂xjes continua en p. En este caso, la transfor-

macion lineal Lp : Rn → Rm tiene como asociada a La matriz Jacobiana.

DEFINICION. A la transformacion lineal

Lp : Rn → Rm

se le llama la diferencial de la funcion f en el punto p. A su matrizasociada en la base canonica (Jacobiana)

Dfp =

(∂fi∂xj

)

p

se le llamara la derivada de la funcion f en el punto p.

Ñ

Ñ

p

p

f

f(p)

dfn

m

Ω

ξ

(ξ)

Figura 5.7: Aplicacion de un vector ξ bajo la diferencial dfp.

Observemos en realidad que la diferencial Lp

Lp : Rn → Rm

se aplica en los vectores de posicion ξ con extremo en p,

ξ → Lp(ξ)

bajo La matriz Jacobiana Dfp.

Page 222: Libro Mate 4

222 Campos vectoriales en R3

Entenderemos por Lp = dfp a la transformacion lineal asociada a Dfp,

dfp : Rn → Rm

que define una transformacion lineal entre los espacios Rn y Rm. Esto es,si ξ es un vector de Rn entonces dfp(ξ) es un vector de Rm (vease la figura5.7).

A una funcion que es diferenciable en cada punto de su dominio se lellamara diferenciable.

EJEMPLO. Sean, la funcion diferenciable

f(x, y) = (x cosx, sen x)

el punto p =(π2 , π

), y el vector ξ = (−1, 2). Calcular dfp(ξ).

C Calculamos La matriz Jacobiana de la funcion en el punto p,

Dfp =

(cos y −x sen yx cos z sen x

)

p

y la evaluamos en el punto p =(π2 , π

), obteniendo,

Df(π/2,π) =

(cosπ −π/2 sen π

π cosπ/2 sen π/2

)(−1 00 1

)

Por lo tanto, para ξ = (−1, 2) se tiene, al aplicar convencionalmente,que

dfp(−1, 2) =(−1 00 1

)(−12

)=

(12

)= (1, 2) B

EJEMPLO. Sean, la funcion diferenciable,

f(x, y) = (lnxy, x2 + y2,√xy),

el punto p = (4, 3), y el vector ξ = (2, 1). Calcular dfp(ξ).

C Calculamos La matriz Jacobiana de la funcion en el punto arbitrariop,

Dfp =

1x

1y

2x 2y12

√yx

12

√xy

p

Page 223: Libro Mate 4

5.3 La regla de la cadena 223

de donde, al evaluar en p = (4, 3) se tiene que

Df(4,3) =

14

13

8 612

√34

12

√43

p

=

14

13

8 6√34

√33

Por lo tanto, al aplicar en el vector ξ = (2, 1) de manera convencional,se obtiene,

df(4,3)(ξ) =

14

13

8 6√34

√33

(

21

)=

56225√3

6

=

(56 , 22,

5√3

6

)B

5.3 La regla de la cadena

En el capıtulo 4 hemos dado una version mas general del teorema de dife-renciabilidad, para la composicion de funciones, para cuando eran del tipoR → R3 → R. En esta seccion damos un resultado mas general acerca dela diferenciabilidad de la composicion de funciones diferenciables del tipoRn → Rm → Rk (k, n,m enteros arbitrarios), llamada tambien Regla dela cadena (vease la figura 5.8).

pf(p)

g(f(p))ξ p

p

f(p)f(p)

df

dgdg

p

p

df

(df

(ξ)

(ξ))

f)d(g O

Figura 5.8: Regla de la cadena.

EJEMPLO. Sea la pareja de funciones vectoriales

f(x, y) =

(y

1 + x2, xy + y2

)

g(u, v, w) = (uv − w, u+ v + w)

C Las matrices Jacobianas respectivas estan dadas por,

Dfq =

( −2xy(1+x2)2

11+x2

y x+ 2y

)

q

Page 224: Libro Mate 4

224 Campos vectoriales en R3

Dgp =

(v u −11 1 1

)

p

Observamos que solo tiene sentido la composicion dada por

f g : R3 → R2 → R2

la cual ya ha sido calculada y esta definida por la regla

(f g)(u, v, w) =(

u+ v + w

1 + (uv − w)2 , (u+ v + w)(uv + u+ v)

)

y cuya matriz Jacobiana se calcula en un punto p ∈ R3 por

D(f g)p

=

(1+(uv−w)(uv+w+2v2+2vw)

(1+(uv−w)2)21+(uv−w)(uv+w+2u2+2uv)

(1+(uv−w)2)2

v2 + 2u+ 2v + 2uv + w + w u2 + 2uv + 2u+ 2v + uw + w

1+(uv−w)(u+uv+2w+2v)(1+(uv−w2)2

uv + u+ v

)

cuyo calculo resulta ser muy complicado.

Por ejemplo, si se toma el punto p = (1, 1, 1) entonces,

D(f g)(1,1,1) =(

1 1 19 9 3

)

Por otro lado, sabiendo que g(p) = g(1, 1, 1) = (0, 3) = q se tendra

Dfq = Df(0,3) =

(0 13 6

)

Dgp = Dg(1,1,1) =

(1 1 −11 1 1

)

Pero al realizar el producto de matrices se tiene que

DfqDgp =

(0 13 6

)(1 1 −11 1 1

)=

(1 1 19 9 3

)= D(f g)p

lo que nos indica que

DfqDgp = D(f g)p

Page 225: Libro Mate 4

5.3 La regla de la cadena 225

Ya que el punto q = g(p), entonces lo anterior se escribe de manera masexplıcita y en terminos de p como

D(f g)p = Dfg(p)Dgp B

La formula que se ha obtenido al final del ejemplo sera propuesta comoLa regla de la cadena. El enunciado sera dado en terminos de diferen-ciales, lo cual no nos causa problema alguno, ya que la prueba involucrarasus matrices Jacobianas asociadas.

TEOREMA 5.4 (Regla de la cadena). Sean dos funciones diferencia-bles

f : Ω ⊂ Rn → Rm

g : U ⊂ Rm → Rk

de tal forma que la imagen de Ω bajo la funcion f este contenida en U ⊂Rm.

Si p ∈ Ω es un punto arbitrario, entonces la funcion compuesta

g f : Ω→ U → Rk

es diferenciable en el punto p y la diferencial de tal composicion en el puntop cumple la igualdad

d(g f)p = dgf(p) dfp

C Como las matrices asociadas a las diferenciales son las Jacobianas,sera suficiente con demostrar la igualdad

D(g f)p = Dgf(p)Dfp

Ya que f es diferenciable en p ∈ Ω, existe una funcion φ : Rn → Rm talque

f(p+ h)− f(p) = Dfp(h) + ||h||φ(h)lim||h||→0 φ(h) = 0

Analogamente, como g es diferenciable en el punto q ∈ U , existe unafuncion ψ : Rn → R` tal que

g(p+ k)− g(q) = Dgq(k) + ||k||ϕ(k)

lim||h||→0 ϕ(k) = 0

Sea ahora, q = f(p) y considerese el incremento k = f(p + h) − f(p),entonces

k = f(p+ h)− f(p) = Dfp(h) + ||h||φ(h)

Page 226: Libro Mate 4

226 Campos vectoriales en R3

y ademas

g(f(p+ h)) = g(f(p) + k) = g(f(p)) +Dgf(p) ((Dfp(h) + ||h||φ(h))

+||Dfp(h) + ||h||φ(h)||ψ (Dfp(h) + ||h||φ(h))Por lo tanto, de la linealidad de Dgf(p) se tiene que

g(f(p+ h))− g(f(p)) = Dgf(p)Dfp(h) + ϕ(h)

donde

ϕ(h) = ||h||Dgf(p)(φ(h)) + ||Dfp(h) + ||h||φ(h)||ψ(Dfp(h) + ||h||φ(h))

Como lim||h||→0 φ(h) = 0 y k → 0⇐⇒ h→ 0, se tiene que

lim||h||→0

ϕ(h) = 0

sabiendo que ϕ : Rn → R`.

De esta manera, se cumple la pareja de igualdades

g(f(p+ h))− g(f(p)) = Dgf(p)Dfp(h) + ϕ(h)

lim||h||→0 ϕ(h) = 0

o equivalentemente,

(g f)(p+ h)− (g f)(p) = Dgf(p)Dfp(h) + ϕ(h)

lim||h||→0 ϕ(h) = 0

lo que demuestra el teorema. B

EJEMPLO. Dada la pareja de funciones,

f(x, y, z) = (x2, y2 + z2)

g(u, v) = (ln(u+ v), euv, uv)

calcular D(f g)p, donde p = (1, 1).

C Las matrices Jacobianas estan dadas por

Dgp =

1u+v

1u+v

veuv ueuv

v u

p

Dfq =

(1 0 00 2y 2z

)

q

Page 227: Libro Mate 4

5.3 La regla de la cadena 227

Ya que g(p) = g(1, 1) = (ln 2, e, 1) = q se tiene que

Dg(1,1,1) =

12

12

e e1 1

Df(ln 2,e,1) =

(1 0 00 2e 2

)

Por La regla de la cadena, tenemos finalmente,

D(f g)(1,1) = Df(ln 2,e,1)Dg(1,1) =

(1 0 00 2e 2

)

12

12

e e1 1

=

(1/2 1/2

2e2 + 2 2e2 + 2

)B

EJEMPLO. Sean γ(t) = (x(t), y(t), z(t)) una curva diferenciable y w =f(x, y, z) una funcion arbitraria real de variable vectorial.

Si γ(t) ⊂ Ω, siendo Ω el dominio de f en R3 entonces,

w(γ(t)) = f(x(t), y(t), z(t))

es una funcion real de variable real diferenciable, w γ : R→ R.

C Si p = γ(t) es un punto sobre la curva, por La regla de la cadena setiene

d(w(γ(t))

dt= D(w γ)t = Dwγ(t)Dγ(t) = Dfγ(t)Dγ(t)

=

(∂f

∂x

∂f

∂y

∂f

∂z

)

γ(t)

dxdtdydtdzdt

t

=∂f

∂x

dx

dt+∂f

∂y

dy

dy+∂f

∂z

dz

dt

=< ∇fγ(t), γ(t) >

Notamos que esta igualdad es la que se obtiene en el capıtulo 4 comoun caso especial del teorema de La regla de la cadena establecido en estecapıtulo. B

Page 228: Libro Mate 4

228 Campos vectoriales en R3

5.4 Cambios de coordenadas

En esta seccion mostramos uno de los resultados mas importantes delanalisis matematico moderno, el teorema de la Funcion Inversa. Aunquese omite su demostracion, se ilustra su alcance con ejemplos y se dan refe-rencias para los lectores interesados en la parte teorica.

EJEMPLO. Consideremos el siguiente sistema lineal de ecuaciones de3× 3,

x+ 2y + 3z = 12x+ 5y + 3z = 2x + 8z = 3

C Si se consiera la matriz del sistema,

A =

1 2 32 5 31 0 8

se tiene que detA = −1, de donde A es invertible con inversa,

A−1 =

−40 16 913 −5 −35 −2 −1

que puede ser calculada mediante El metodo de Gauss-Jordan.

Ya que el sistema dado se puede escribir matricialmente

1 2 32 5 31 0 8

xyz

=

123

⇐⇒ A

xyz

=

123

entonces el vector columna con las incognitas puede despejarse mediantela multiplicacion de A−1, esto es,

A−1A

xyz

= A−1

123

⇐⇒

xyz

= A−1

123

lo que nos indica que

xyz

=

−40 −16 913 −5 −35 −2 −1

123

=

3−6−2

y, por lo tanto, que el punto con coordenadas (x, y, z) = (3,−6 − 2) es lasolucion a tal sistema.

Page 229: Libro Mate 4

5.4 Cambios de coordenadas 229

Veamos el problema inicial desde otro angulo.

Si consideremos a LA : R2 → R3 la transformacion lineal asociada a lamatriz A, entonces el sistema de ecuaciones inicial puede ser visto mediantela ecuacion funcional (con notacion convencional),

LA(x, y, z) = A

xyz

=

123

= (1, 2, 3)

es decir, el problema consiste en encontrar un punto (x, y, z) del dominiode LA tal que bajo la aplicacion de la transformacion tenga imagen en elpunto dado (1, 2, 3),

LA(x, y, z) = (1, 2, 3)

Por el proceso mostrado, se tiene que si detA 6= 0, y LA−1 es la trans-formacion lineal asociada a la matriz A−1, entonces el punto buscado es

(x, y, z) = LA−1(1, 2, 3) = (3,−3,−2).

Si se analiza un sistema de ecuaciones mas general,

a11x+ a12y + a13z = ua21x+ a22y + a23z = va31x+ a32y + a33z = w

con la matriz asociada al sistema dada por

A =

a11 a12 a13a21 a22 a23a31 a32 a33

entonces, una condicion para que el sistema tenga solucion para las incog-nitas (x, y, z) en terminos de los numeros (u, v, w) es que detA 6= 0. Si estees el caso y se define por

A−1 =

b11 b12 b13b21 b22 b23b31 b32 b33

entonces la solucion al sistema de ecuaciones viene dado por la ecuacionmatricial

xyz

=

b11 b12 b13b21 b22 b23b31 b32 b33

uvw

Page 230: Libro Mate 4

230 Campos vectoriales en R3

En terminos funcionales, si LA : R3 → R3 es la transformacion linealasociada a la matriz A y LA−1 : R3 → R3 es la transformacion linealasociada a la matriz A−1, el sistema de ecuaciones en las incognitas (x, y, z)y su solucion en terminos de (u, v, w) vienen dados por la equivalenciafuncional

LA(x, y, z) = (u, v, w)⇐⇒ (x, y, z) = LA−1(u, v, w)

Esta equivalencia senala explıcitamente las propiedades de invertibili-dad de cada transformacion lineal mencionada.

De hecho, de la igualdad AA−1 = A−1A = I, donde I es la matrizidentidad se tiene que

LA LA−1 = LAA−1 = LI = I

LA−1 LA = LA−1A = LI = I

lo que nos dice que LA y LA−1 son mutuamente inversas y que

LA−1 = (LA)−1 B

Este problema de invertibilidad se puede formular en terminos mas ge-nerales, cuando se tiene una funcion vectorial de variable vectorial.

Como se entiende del ejemplo anterior, las funciones inversas sirvencomo operaciones de cancelamiento o despeje (vease Capıtulo I de Reyes,1996).

DEFINICION. Sea f : Ω ⊂ Rn → Rn una funcion vectorial de variablevectorial. La funcion g : f(Ω) ⊂ Rn → Ω se dice ser una funcion inversade la funcion si se cumple que

f g : f(Ω)→ Ω→ f(Ω), es tal que f g = 1

g f : Ω→ f(Ω)→ Ω, es tal que g f = 1

siendo I la funcion identidad (vease la figura 5.9).

EJEMPLO. Sea la funcion f : R2 → R2 dada por la regla de correspon-dencia

f(x, y) = (ex cos y, exsen y)

C Si se escriben las coordenadas de la imagen,

u = ex cos yv = exsen y

Page 231: Libro Mate 4

5.4 Cambios de coordenadas 231

Ñ Ñ

p

f

gf(p)

n mΩf(Ω)

Figura 5.9: Invertibilidad de una funcion.

entonces, al dividir la segunda ecuacion por la primera se obtiene

v

u= tan y ⇒ y = arctan

(uv

)

Si se elevan al cuadrado las igualdades en ambos miembros y se sumanlos lados respectivos se tendrıa que

u2 + v2 = e2x cos2 y + e2xsen2y = e2x

lo que implica que

x = ln√u2 + v2

De esta manera, con base en un calculo realizado mediante despejes, seobtiene una funcion

(x, y) = g(u, v) =(ln√u2 + v2, arctan

( vu

))

la cual tiene un dominio de definicion

D1 = R2 − (u, v)|u 6= 0 = R2 − eje v

En otras palabras, bajo esta regla g obtenida, no todo punto (u, v) ∈ R2

acepta solucion para la equivalencia

f(x, y) = (u, v)⇐⇒ (x, y) = g(u, v).

Por eso es que llamamos a g una funcion inversa, porque esta definidano en toda la imagen de f .

Otro calculo simple nos muestra que la funcion,

h(u, v) =(ln√u2 + v2, arccot

(uv

))

Page 232: Libro Mate 4

232 Campos vectoriales en R3

es una funcion obtenida mediante el metodo similar, y que es inversa paraf definida en el conjunto

D2 = R2 − ejeu

Lo que es claro, es que un calculo directo nos mostrarıa que en el con-junto

D1 ∩D2 = D = R2 − ejesu, v

las funciones h y g coinciden en sus valores. B

EJEMPLO. Sea f : D ⊂ R→ R una funcion diferenciable real de variablereal y sea p ∈ D un punto regular de f , es decir la derivada f ′(p) no seanula.

C Por el teorema de la funcion inversa (Capıtulo 3 Reyes, 1996) se tieneque existen intervalos Jp alrededor de p y Jq alrededor de q = f(p) de talforma que la restriccion de la funcion f a esos intervalos

f : Jp → Jq

es invertible y su inversa es diferenciable. Mas aun, si g : Jq → Jp es lafuncion inversa local de f alrededor de q = f(p), entonces la ecuacion

(g f)(x) = x

implica, por La regla de la cadena

1 = (g f)′(x) = g′(f(x))f ′(x)

Al evaluar en x = p se tiene que la derivada de la funcion inversa g enel punto q = f(p) se calcula,

g′(q) = (f ′(p))−1 =1

f ′(p)

Decimos en este caso que la funcion f es una invertible local puestiene una inversa local g que tambien es diferenciable. B

El siguiente resultado generaliza el ejemplo anterior y nos provee de unagran cantidad de funciones localmente invertibles de clase Cr. La prueba seomite, pero el lector interesado puede referirse al trabajo de Lima (1992).

Para una funcion de clase Cr, f : Rn → Rm entenderemos a una funcioncuyas funciones coordenadas fi : Rn → R‘m son de clase Cr.

Page 233: Libro Mate 4

5.4 Cambios de coordenadas 233

TEOREMA 5.5 (de la funcion inversa local) Sean, f : Ω ⊂ Rn →Rn una funcion de clase Cr(r ≥ 1) y p ∈ Ω un punto tal que La matrizJacobiana

A = Dfp =

(∂fi∂xj

)

p

tenga un determinante no nulo: detA 6= 0. Entonces f es una funcionlocalmente invertible en p. Esto es, en una vecindad de p y en otra vecindadde q = f(p), la funcion tiene una inversa local g que es de clase Cr.

Mas aun, si q = f(p) es la imagen se tiene que La matriz Jacobiana deg en q se calcula invirtiendo la matriz Dfp, es decir,

Dgq = (Dfp)−1

EJEMPLO. Considerar nuevamente la funcion f : R2 → R2

f(x, y) = (ex cos y, exsen y)

de la cual no se puede obtener una funcion inversa global explıcita.

C Sea p = (x, y) ∈ R2 un punto arbitrario del dominio. Su matrizJacobiana viene dada por

Dfp =

(ex cos y −exsen yexsen y ex cos y

)

lo que nos dice que

det(Dfp) =

∣∣∣∣ex cos y −exsen yexsen y ex cos y

∣∣∣∣ = ex 6= 0

Por lo tanto, la funcion f es invertible localmente en cada punto y de-pendiendo de este, tendra una funcion inversa local como alguna de las dosdiferentes halladas anteriormente, segun la forma de despejar las variables.B

DEFINICION. Dada La matriz Jacobiana en un punto p de una funcionf : Rn → Rn de clase Cr, definida por Dfp, a su determinante det(Dfp)se le llama el Jacobiano de la funcion f en el punto p y lo calculamos porJfp, es decir

Jfp = det(Dfp)

Ası, repasamos el teorema de la funcion inversa diciendo que una funcionRn → Rn de clase Cr cuyos Jacobianos no se anulan en todo el dominio eslocalmente invertible de clase Cr.

Page 234: Libro Mate 4

234 Campos vectoriales en R3

Para optimizar calculos utilizaremos la notacion clasica que utiliza sub-ındices variables para definir la derivacion parcial. Por ejemplo,

fu =∂f

∂u, fx =

∂f

∂x, uz =

∂u

∂z, · · ·

definira la derivacion parcial respecto a la variable indicada.

Por otro lado, si una funcion Rn → Rn es definida por

(y1 · · · , yn) = f(x1 · · · , xn)

el jacobiano de f en el punto p se definira por

Jfp = det

(∂yi∂xj

)

p

=D(y1, · · · , yn)D(x1 · · · , xn)

(p)

EJEMPLO. En la funcion suave R2 → R2 dada por

(u, v) = f(x, y) = (ex cos y, exsen y)

se tiene

C ux =∂u

∂x= ex cos y, uy =

∂u

∂y= −exseny

vx =∂v

∂x= exseny, vy =

∂v

∂y= ex cos y

Jfp =D(u, v)

D(x, y)=

∣∣∣∣ux uyvx vy

∣∣∣∣ =∣∣∣∣ex cos y −exsenyexseny ex cos y

∣∣∣∣ = ex 6= 0

Particularmente, en el punto p = (1, 1) se tiene que

Jf(1,1) = e1 = e

de donde f es invertible alrededor del punto (1, 1) con una inversa local

g(u, v) =(ln√u2 + v2, arctan

(uv

))

definida alrededor del punto f(1, 1) = (e cos 1, e sen 1). B

EJEMPLO. Dada la funcion

f(x, y, z) = (xz, xy, yz)

verificar su invertibilidad alrededor del punto p = (−1, 1,−1).

Page 235: Libro Mate 4

5.4 Cambios de coordenadas 235

C Si calculamos por (u, v, w) = f(x, y, z) = (xz, xy, yz), es decir,

u = xzv = xyw = yz

entonces

Jfp =D(u, v, w)

D(x, y, z)=

∣∣∣∣∣∣

ux uy uzvx vy vzwx wy wz

∣∣∣∣∣∣=

∣∣∣∣∣∣

z 0 xy x 00 z y

∣∣∣∣∣∣= 2xyz

De esta manera, el Jacobiano se anula solo en los planos coordenadosx = y = z = 0.

Por lo tanto, Jf(1,1,1) = 2 6= 0, lo que nos dice que f es invertible enuna localidad del punto (1, 1, 1), y procedemos a calcular en este caso unafuncion inversa local de f .

De las ecuaciones u = xz, v = xy se obtiene que uv = x2zy. Al utilizarahora w = yz en uv = x2zy se tiene que uv = x2w lo que nos dice que

x2 =uv

w⇐⇒ x = ±

√uv

w

Analogamente, se obtienen,

y = ±√vw

u, z = ±

√uw

v.

Ya que q = (1,−1,−1) = f(−1, 1,−1) esta en el dominio para cualquiereleccion de signos, se tiene, al elegir los apropiados, que la inversa local gtiene la forma,

g(u, v, w) =

(−√vv

w,

√vw

u,−√uw

v

)

en virtud de los signos del punto p = (−1, 1,−1). B

En muchas ocasiones, el sistema cartesiano de coordenadas no es buenopara describir objetos geometricos o mecanicos que estan incluidos en elespacio vectorial R3. Por eso, es preciso utilizar otro tipo de coordenadasque describen con formulas mas simples tales objetos. De esta forma, si seconocen las coordenadas que se van a utilizar en lugar de las cartesianas,

Page 236: Libro Mate 4

236 Campos vectoriales en R3

1

1

1+

ΩH

a. b.

Figura 5.10: Regiones en R3 y R2.

justo es que se establezca una relacion biunıvoca entre las colecciones co-rrespondientes a tales sistemas de coordenadas.

Cabe mencionar que en muchas ocasiones, tal relacion biunıvoca entretales sistemas puede establecerse entre regiones.

EJEMPLO. Sea el campo escalar

F (x, y, z) = x2 + y2 + z2

Ya que F es una funcion suave (por lo tanto, continua) se tiene que

Ω1 = F−1(−∞, 1) = (x, y, z)| x2 + y2 + z2 < 1

es una region abierta de R3 Esto, es la bola de radio 1 con centro en (0, 0, 0)de R3 es una region abierta (vease figura 5.10 a).

EJEMPLO. Considere el semiplano superior

H+ = (x, y) ∈ R2| y > 0

Este conjunto es una region abierta en R2, pues la funcion F (x, y) = y escontinua y H+ = F−1(0,∞) (vease figura 5.10 b). Claramente la cerraduradel semiplano superior

H+ = (x, y) ∈ R2| y ≥ 0

es una region con frontera en el plano R2.

En algunas ocasiones, una region esta definida por varias desigualdades.Esto es, cada punto de la region satisface un numero finito de desigualdadesdel tipo

F1(x, y, z) ≤ a1F2(x, y, z) ≤ a2

...Fn(x, y, z) ≤ an

Page 237: Libro Mate 4

5.4 Cambios de coordenadas 237

donde las funciones F1, · · · , Fn son continuas en el espacio R3, y a1, · · · , anson numeros reales.

EJEMPLO. Consideremos la region en el plano R2 acotada por la elipse

x2

4+y2

2= 1

C De la figura 5.11 se puede observar que la variable x esta necesaria-mente en el intervalo [−2, 2] y que la variable y esta encerrada desde lacurva y = −1√

2

√4− x2 hasta la curva y = 1√

2

√4− x2.

La definicion de y se obtiene al despejar a y de la ecuacion inicial,

y = ± 1√2

√4− x2

x-2 2x

y

y

2

2

4-x

4-x

1

-1

2

2

y=

y=

Ö

Ö

Ö

Ö

Figura 5.11: Region elıptica en R2.

De esta forma, la region Ω se puede describir totalmente por las desi-gualdades

−2 ≤ x ≤ 2 y − 1√2

√4− x2 ≤ y ≤ 1√

2

√4− x2.

Estas desigualdades son equivalentes al sistema de desigualdades

F1(x, y) = −x ≤ 2F2(x, y) = x ≤ 2

F3(x, y) = −(y +

√4−x2√2

)≤ 0

F4(x, y) = y −√4−x2√2≤ 0

que provienen del par de desigualdades obtenido. B

Page 238: Libro Mate 4

238 Campos vectoriales en R3

En general, entender un sistema de desigualdades como el que se obtuvoen la parte final del ejemplo anterior es dıficil, y es mas comodo describir auna region por desigualdades como las que se obtuvieron directamente enel ejemplo anterior, las cuales senalan los conjuntos donde era permisibletomar cada una de las variables.

EJEMPLO. Considerese la region Ω en el plano definida por desigualdades

y ≥ x2, y ≤ 4− x2

C La figura 5.12 nos muestra que la primer desigualdad se refiere a laregion por encima de la parabola y = x2, mientras que la segunda desigual-dad se refiere a la region por debajo de la parabola y = 4 − x2. Por lotanto, la region Ω es aquella acotada inferiormente por y = x2 y acotadasuperiormente por y = 4− x2.

y

y=

y=

x-

[ [2 2Ö Ö

2

2

4-x

x

Figura 5.12: Region Ω del plano R2.

Los puntos de interseccion entre las parabolas satisfacen las ecuaciones

y = x2

y = 4− x2

que al igualar: x2 = 4− x2, nos da los puntos x = ±√2.

Esto hace que x este en el intervalo [−√2,√2], mientras que la variable

y es permisible entre las curvas y = x2 hasta y = 4− x2.Por lo tanto, la region Ω esta completamente descrita por las desigual-

dades−√2 ≤ x ≤

√2, x2 ≤ y ≤ 4− x2. B

EJEMPLO. Sea V ⊂ R3 la region espacial acotada por los planos

x = 0, y = 0, z = 0, x+ y + z = 1

Page 239: Libro Mate 4

5.4 Cambios de coordenadas 239

C Una inspeccion a la ecuacion del plano x+y+z = 1, nos muestra quelos puntos de interseccion con los ejes coordenados son (1, 0, 0), (0, 1, 0) y(0, 0, 1), como se muestra en la figura 5.13, quedando tal porcion del planoen el primer octante: x ≥ 0, y ≥ 0, z ≥ 0

Si en la ecuacion x+ y+ z = 1, ponemos y = 0 y z = 0, entonces x = 1,lo que determina para x el intervalo [0, 1].

z=01

1

1

xx

y

zz=1-x-y

y=1-xy

0 1

Figura 5.13: Region espacial acotada por planos.

Para determinar el dominio de y, hacemos z = 0 en la ecuacion x+ y+z = 1, obteniendo x + y = 1 o y = 1 − x, lo que segun se muestra en lamisma figura, e indica que

0 ≤ y ≤ 1− x

Finalmente, al despejar z de la ecuacion x+y+z = 1, se obtiene z = 1−x−y,lo que dice que la variable z debe satisfacer la desigualdad

0 ≤ z ≤ 1− x− y

Por lo tanto, la region espacial V se describe por el conjunto

V = (x, y, z)| 0 ≤ x ≤ 1, 0 ≤ y ≤ 1− x, 0 ≤ z ≤ 1− x− y. B

EJEMPLO. Consideremos la region espacial acotada por la parte superiorde la esfera

x2 + y2 + z2 = 4.

C Al proceder por analogıa al ejemplo anterior haciendo y = 0, z = 0en la ecuacion dada, se obtiene que x2 = 4 o x = ±2. Al observar la figura5.14, tenemos que el intervalo numerico para x es [−2, 2].

Page 240: Libro Mate 4

240 Campos vectoriales en R3

Por otra parte, si se anula z en la ecuacion, se tiene que x2 + y2 = 4 loque al despejar a y en terminos de x nos da y = ±

√4− x2, que segun la

figura 5.17, nos indica el dominio para la variable y,

−√

4− x2 ≤ y ≤√

4− x2

Finalmente, si en la ecuacion inicial se despeja a z, se obtiene quez = ±

√4− x2 − y2, lo que segun la misma figura 5.17, la variable z debera

satisfacer la desigualdad

0 ≤ z ≤√

4− x2 − y2

pues se considera la parte superior de la esfera.

x-2 2

22 2

2

4-x4-x -y

4-x

y=z=

z=0

y=-

ÖÖ

Ö

y

y

Figura 5.14: Semiesfera superior R3.

De esta manera, la region V ⊂ R3 acotada de esta forma, esta total-mente descrita por las desigualdades

−2 ≤ x ≤ 2, −√

4− x2 ≤ y ≤√

4− x2, 0 ≤ z ≤√

4− x2 − y2 B

Como se menciono antes, situaremos un cambio de sistemas coordenadosen regiones contenidas en R3 (o en R2).

DEFINICION. Sean x, y, z y u, v, w dos sistemas de coordenadas en R3.Por un cambio de sistemas de coordenadas en una region Ω se entiendeuna funcion diferenciable e invertible Ω→ Ω, que en coordenadas se escribe

x = x(u, v, w)y = y(u, v, w)z = z(u, v, w)

Page 241: Libro Mate 4

5.4 Cambios de coordenadas 241

con una funcion inversa diferenciable definida en Ω por

u = u(x, y, z)v = v(x, y, z)w = w(x, y, z)

Para q0 = (u0, v0, w0) ⊂ Ω un punto definido en las coordenadas, u, v, w,considerese el correspondiente en Ω en las coordenadas x, y, z, definido porp0 = (x0, y0, z0).

DEFINICION. El punto p0 ∈ Ω se llama un valor regular para elcambio de coordenadas, sı la matriz

A =

∂x∂u

∂x∂v

∂x∂w

∂y∂u

∂y∂v

∂y∂w

∂z∂u

∂z∂v

∂z∂w

q0

es no singular, es decir, det A 6= 0. El punto q0 se llamara punto regular.

En otras palabras, p0 es un valor regular para el sistema de coordenadas(u, v, w) si la parte lineal A es una matriz invertible.

El siguiente resultado nos habla de la invertibilidad local alrededor deun punto regular de un cambio de coordenadas. Este se sigue del Teoremade la funcion inversa.

TEOREMA 5.6 Si p0 es un punto regular para el cambio de coordenadas,entonces en una vecindad de p0 en Ω se puede definir una transformacioninversa.

En otras palabras, la parte lineal del cambio de coordenadas en q0 de-fine su invertibilidad localmente. Esto es, define localmente un cambio decoordenadas.

A continuacion damos ejemplos de cambios de coordenadas en el planoR2 y en el espacio R3. Se hara uso del Teorema 5.6 en cada uno de ellos.

Coordenadas polares

Considerese en el plano R2 el sistema de coordenadas cartesianas (x, y).Introducimos ahora en el mismo plano otro sistema de coordenadas (r, ϕ),donde r ≥ 0 y ϕ ∈ (0, 2π). La relacion entre los sistemas de coordenadases

x = r cosϕy = r senϕ

Page 242: Libro Mate 4

242 Campos vectoriales en R3

C Dado un punto (r0, ϕ0) = q0, procedemos a verificar la condicion deinvertibilidad local, y para ello necesitamos calcular la matriz Jacobiana enq0

A =

(∂x∂r

∂x∂ϕ

∂y∂r

∂y∂ϕ

)

q0

=

(cos ϕ0 −r0 senϕ0senϕ0 r0 cos ϕ0

).

De esta forma, el determinante de la parte lineal A se calcula

D(x, y)

D(r, ϕ)= detA =

∣∣∣∣cosϕ0 −r0 senϕ0senϕ0 r0 cosϕ0

∣∣∣∣ = r0(cos2 ϕ0 + sen2ϕ0) = r0,

con lo que, detA 6= 0 en R+ × (0, 2π).Una funcion que da un cambio inverso de coordenadas esta dado por

r =

√x2 + y2

ϕ = arctan (y/x)

que no esta definido cuando x = 0. De esta manera, ya que la imagencorresponde al eje y (donde ϕ = π

2 ,32π), se tiene una correspondencia de

coordenadas (x, y) y (r, ϕ) en apenas los cuadrantes (sin los ejes) del plano.La figura 5.15 ilustra esto. Al sistema de coordenadas (r, ϕ) se le llama decoordenadas polares. B

x

r

(r, )ϕ

ϕ

Figura 5.15: Coordenadas Polares en R2.

EJEMPLO. Consideremos la curva en el plano definida por la ecuacionen coordenadas cartesianas

25x2 + 10xy + y2 − 1 = 0

C Al realizar el cambio de coordenadas cartesianas por polares, tenemosque la ecuacion anterior se transforma en

0 = 25x2 + 10xy + y2 − 1 = 25(r cosϕ)2 + 10r cosϕ r senϕ

Page 243: Libro Mate 4

5.4 Cambios de coordenadas 243

+(r senϕ)2 − 1 = 25r2 cos2 ϕ+ 10r2 cosϕ senϕ+ r2sen2ϕ− 1

= r2[25 cos2 ϕ+ 10 cosϕ+ sen2ϕ]− 1

= r2[5 cosϕ+ senϕ]2 − 1

o bien, en la relacion bivalente

r =±1

5 cosϕ+ senϕB

EJEMPLO. Consideremos la relacion en coordenadas polares dada por

r = 1− cosϕ

C Para pasar tal relacion a coordenadas cartesianas, procedemos comosigue, r = 1− cosϕ ⇐⇒ 1− r = cosϕ

Al multiplicar por r de cada miembro, se tiene

r − r2 = r cosϕ = x

o bien, √x2 + y2 = x+ x2 + y2

Consecuentemente (al elevar al cuadrado a cada lado), obtenemos la rela-cion en coordenadas cartesianas

x4 + y4 + 2x3 + 2xy2 + 2x2y2 − y2 = 0 B

EJEMPLO. Consideremos la funcion real definida por

F (x, y) =√x2 + y2 − 1

en la region Ω = (x, y)|x2 + y2 ≥ 1.C Al realizar la transformacion de coordenadas cartesianas a polares

(r, ϕ) se tiene una nueva funcion

F (r, ϕ) = F (r cosϕ, r senϕ) =√

(r cosϕ)2 + (r senϕ)2 − 1 =√r2 − 1

definida en la misma region, en coordenadas polares,

Ω = (r, ϕ)| r2 ≥ 1, ϕ ∈ [0, 2π] B

EJEMPLO. Sea Ω la region con frontera en el plano, definida por lascoordenadas cartesianas

Ω = (x, y)| 1 ≤ x2 + y2 ≤ 4

Page 244: Libro Mate 4

244 Campos vectoriales en R3

Este conjunto corresponde a una region anular con centro en (0, 0) de radiointerior 1 y radio exterior 2.

C Al describir a Ω con coordenadas polares, tenemos

Ω = (r, ϕ) | 1 ≤ r ≤ 2, ϕ ∈ [0, 2π]

pues la relacion dada por

1 ≤ x2 + y2 ≤ 4

es equivalente en polares a 1 ≤ r2 ≤ 4, o bien a 1 ≤ r ≤ 2. B

Coordenadas cilındricas

Considerese en R3 el sistema de coordenadas cartesianas (x, y, z) e in-troduzcase el sistema nuevo dado por la tripleta (r, ϕ, z) donde r, ϕ sonlas coordenadas del ejemplo anterior, y z es la tercera coordenada carte-siana, esto es,

x = r cosϕ,y = r senϕ,

z = z

Al buscar una condicion de invertibilidad para este cambio, se tiene quepara cualquier (r, ϕ, z) ∈ R3 la matriz Jacobiana del cambio de coordenadases

A =

cos ϕ −r senϕ 0senϕ r cos ϕ 00 0 1

De igual forma que en el ejemplo anterior, el determinante de A secalcula

D(x, y, z)

D(r, ϕ, z)= detA =

∣∣∣∣∣∣

cosϕ −r senϕ 0senϕ r cosϕ 00 0 1

∣∣∣∣∣∣=

∣∣∣∣cosϕ −r senϕsenϕ r cosϕ

∣∣∣∣ = r

y este es diferente de cero, si r > 0. Este conjunto corresponde a todo elespacio con excepcion del eje z. Una funcion inversa es calculada por

r =√x2 + y2

ϕ = arctan(y/x)z = z

definida cuando x 6= 0. Como ϕ ∈ (0, 2π), entonces se tiene un cambiode coordenadas (x, y, z) por (r, ϕ, z), y viceversa, solo cuando el punto estomado fuera de los planos x = 0, y = 0 en R3.

Page 245: Libro Mate 4

5.4 Cambios de coordenadas 245

ϕ ( , )r ϕ

( , ,z)r ϕ

x

y

z

z

Figura 5.16: Coordenadas cilındricas.

Este sistema se conoce como coordenadas cilındricas. La figura 5.16ilustra este

EJEMPLO. Considerese la relacion dada en coordenadas cartesianas por

x2 + y2 − 2z2 = 0

C En coordenadas cilındricas (r, ϕ, z) esta relacion se escribe

0 = (x2 + y2)− 2z2 = r2 − 2z2,

es decir, r2 = 2z2 o bien, r = ±√2z B

EJEMPLO. Consideremos la funcion definida por

F (x, y, z) =√z − x2 − y2

en la region Ω = (x, y, z)| z ≥ x2 + y2 ⊂ R3.

C En coordenadas cilındricas la funcion se escribe de forma mas simple

F (r, ϕ, z) = F (r cosϕ, r senϕ, z) =√z − (r cosϕ)2 − (rsenϕ)2 =

√z − r2

definida en la region Ω que en coordenadas cilındricas es escrita como

Ω = (r, ϕ, z) | z ≥ r2, ϕ ∈ [0, 2π]. B

EJEMPLO. La region espacial anular-cilındrica dada por

Ω = (x, y, z)| 1 ≤ x2 + y2 ≤ 4, 0 ≤ z ≤ 1en coordenadas cilındricas se escribe

Ω = (r, ϕ, z)| 1 ≤ r ≤ 2, 0 ≤ z ≤ 1, ϕ ∈ [0, 2π].

Page 246: Libro Mate 4

246 Campos vectoriales en R3

Coordenadas esfericas

Como ultimo ejemplo, sean las coordenadas cartesianas (x, y, z) en R3 yconsidere nuevas coordenadas (r, ϕ, θ) en R3 dadas por las ecuaciones

x = r cos ϕ sen θ,y = r senϕ sen θz = r cos θ

donde r > 0, 0 ≤ θ ≤ π, 0 ≤ ϕ < 2π (vease la figura 5.17.)

La matriz Jacobiana para cada punto (r, ϕ, θ) ⊂ R3 es calculada por

A =

cos ϕ sen θ r cos ϕ cos θ −r sen ϕ sen θsenϕ sen θ r senϕ cos θ r cos ϕ sen θ

cos θ −r sen θ 0

,

y su Jacobiano esD(x, y, z)

D(r, ϕ, θ)= detA = r2sen θ.

De esta manera, detA = 0, si y solo sı , r = 0 o θ = 0, π, lo cualdefine otra vez una transformacion del espacio excepto el eje z en estascoordenadas.

Un calculo directo nos demuestra que una transformacion inversa en laregion de invertibilidad, esta dada por

r =√x2 + y2 + z2

ϕ = arctan(yx

)

θ = arccos

(z√

x2+y2+z2

)

Este sistema se conoce como coordenadas co-geograficas esfericas,y se ilustra en la figura 5.17.

EJEMPLO. Consideremos la ecuacion espacial en coordenadas carte-sianas dada por

x2 + y2 + z2 − 4 = 0

C En coordenadas esfericas (r, ϕ, θ), tal ecuacion se escribe

0 = (r cosϕ sen θ)2 + (r senϕ senθ)2 + (r cos θ)2 − 4

= r2 cos2 ϕ sen2θ + r2 sen2ϕ sen2θ + r2 cos θ − 4

= r2 sen2θ(cos2 ϕ+ sen2ϕ) + r2 cos2 θ − 4 = r2 sen2θ + r2 cos2 θ − 4

= r2( sen2θ + cos2 θ)− 4 = r2 − 4

Page 247: Libro Mate 4

5.4 Cambios de coordenadas 247

ϕ

(r, , )ϕ θ

θ

Figura 5.17: Coordenadas co-geograficas esfericas.

lo que dice que la relacion inicial se lleva, bajo la transformacion de coor-denadas en la relacion simple

r = 2 B

EJEMPLO. Considerese la funcion

F (x, y, z) =1

ln(1− x2 − y2 − z2)

definida en la region Ω = (x, y, z)| 0 < x2 + y2 + z2 < 1C En coordenadas esfericas, esta transformacion se reduce a

F (r, ϕ, θ) = F (r cosϕsen θ, rsenϕsenθ, r cos θ)

=1

ln(1− (r cosϕsen θ)2 − (rsenϕsenθ)2 − (r(cos θ)2)=

1

ln(1− r2)definida en la misma region que en coordenadas esfericas se escribe

Ω = (r, ϕ, θ)| 0 < r < 1, 0 ≤ ϕ ≤ 2π, 0 ≤ θ ≤ π. B

EJEMPLO. Consideremos la region

Ω = (x, y, z)| 0 ≤ x2 + y2 + z2 ≤ R2

correspondiente a una bola solida de radio R en el espacio R3.

C En coordenadas esfericas (r, ϕ, θ) tal region se puede escribir

Ω = (r, ϕ, θ)| 0 ≤ r ≤ R, 0 ≤ ϕ ≤ 2π, 0 ≤ θ ≤ π B

Page 248: Libro Mate 4

248 Campos vectoriales en R3

5.5 Campos vectoriales en R2 y R3

Considerese una region Ω ⊂ R3, de tal forma que a cada punto p ∈ Ω sele asocia un vector espacial X(p) ∈ R3. Entonces diremos que en Ω estadefinido un campo de vectores

X : Ω→ R3

o que en Ω actua el campo vectorial X.

EJEMPLO. Sea Ω ⊂ R3 una region que ocupa el flujo de un lıquidoestacionario.

C Es claro que a cada punto p ∈ Ω le podamos asociar su vector develocidad X(p). De esta forma, se construye el campo de vectores velocidaddel flujo (campo de velocidades), como una funcion X : Ω → R3 que acada p ∈ Ω le asocia el vector velocidad X(p). La figura 5.18 a. ilustra elcampo vectorial de este ejemplo. B

a. b.

Figura 5.18: a. Campo de velocidades b. Campo gravitacional.

EJEMPLO. Consideremos la fuerza de atraccion en R3 ejercida por uncuerpo puntual de masa m que esta situado en el origen de coordenadas.

C Si Ω ⊂ R3 es una region del espacio no conteniendo el origen, entoncespara cada objeto situado en el punto P ∈ Ω, se le asocia el vector (fuerzagravitacional) ejercido por su atraccion hacia el cuerpo puntual de masam.

Si se define el vector por X(p), entonces se esta construyendo un campovectorial (fuerzas gravitacionales) en Ω, definido por la funcion X : Ω→ R3

tal que a cada punto p ∈ Ω le asocia el vector gravitacional X(p) (vease lafigura 5.18 b. B

Page 249: Libro Mate 4

5.5 Campos vectoriales en R2 y R3 249

Si la asociacion p→ X(p) en los ejemplos anteriores es suave, como unafuncion vectorial de argumento vectorial, diremos que los campos vectoria-les son suaves.

DEFINICION. Sea Ω una region del espacio R3. Por un campo vecto-rial suave X actuando en Ω entenderemos una funcion

X : Ω→ R3

que asocia a cada punto p ∈ Ω el vector espacial X(p), de tal forma que laasociacion es suave como una funcion vectorial de argumento vectorial.

El la practica, para visualizar un campo de vectores definido en unaregion Ω, se dibujan los vectores asociados X(p) a los puntos p ∈ Ω, te-niendo a p como punto donde nace el vectorX(p). La figura 5.18 ilustra estaforma de visualizar los campos vectoriales de velocidades y gravitacional.

EJEMPLO. Sea un campo escalar suave arbitrario definido en una regionespacial Ω,

F : Ω→ R

C Podemos asociar a cada punto p ∈ Ω el vector gradiente gradF (p),construyendo ası un campo vectorial X definido por

X = gradF : Ω→ R3

donde X(p) = gradF (p).Se puede comprobar facilmente que si gradF (p) 6= (0, 0, 0), entonces es

un vector ortogonal al conjunto de nivel F−1(h) conteniendo a p.El campo X = gradF se llama el campo gradiente obtenido del

campo escalar F . B

Si se considera el sistema de coordenadas x, y, z para Ω, entonces uncampo de vectores X tiene la forma

X(x, y, z) = (P (x, y, z), Q(x, y, z), R(x, y, z)),

donde P,Q y R son campos escalares,

P,Q,R : Ω→ R

Por ejemplo, el campo gradiente del escalar F se escribe en las coorde-nadas cartesianas x, y, z,

X(p) =

(∂F

∂x(p),

∂F

∂y(p),

∂F

∂z(p)

)

Page 250: Libro Mate 4

250 Campos vectoriales en R3

siendo en este caso

P =∂F

∂x, Q =

∂F

∂y, R =

∂F

∂z

EJEMPLO. Sea el campo escalar F en el plano definido por

F (x, y) = x2 + y2

C Entonces el campo gradiente asociado al campo escalar F es

X(p) =

(∂F

∂x(p),

∂F

∂y(p)

)= (2x, 2y)|p

Para ilustrar como actua este campo vectorial en el plano, calculamos enalgunos puntos sus vectores correspondientes.

X(0, 0) = (0, 0)

X(1, 0) = (2, 0)

X(1, 1) = (2, 2)

X(0, 1) = (0, 2)

Sabemos que para h ∈ R un valor es positivo, los conjuntos de nivel delcampo escalar F tienen una ecuacion,

x2 + y2 = h

y corresponden a cırculos concentricos en el origen. Los vectores gradientesson ortogonales a ellos. La figura 5.19 ilustra este ejemplo. B

EJEMPLO. Determinemos el campo vectorial definido por la fuerza deatraccion gravitacional de un cuerpo A de masa m sobre un cuerpo B demasa 1.

C Supongamos que el cuerpo de masa m esta localizado en R3. De Laley de gravitacion universal se sigue que la fuerza X con la cual atraeel cuerpo A al cuerpo B es X(p) = kmp

|p|3 donde p = (x, y, z) es la posicion

del cuerpo A.Recordemos que |p| =

√x2 + y2 + z2, y por lo tanto

X(x, y, z) =km(xe1 + ye2 + ze3)

(x2 + y2 + z2)3/2

o equivalentemente

X(x, y, z) =kmxe1

(x2 + y2 + z2)3/2+

kmye2(x2 + y2 + z2)3/2

+kmze3

(x2 + y2 + z2)3/2

Page 251: Libro Mate 4

5.5 Campos vectoriales en R2 y R3 251

En este caso las funciones escalares que definen al campo vectorial son

P (x, y, z) =kmx

(x2 + y2 + x2)3/2

Q(x, y, z) =kmy

(x2 + y2 + x2)3/2

R(x, y, z) =kmz

(x2 + y2 + x2)3/2B

Figura 5.19: Campo gradiente de F = x2 + y2.

Mostramos que un campo vectorial crea una “dinamica” dentro de laregion Ω contenida en R3 donde actua.

EJEMPLO. Consideremos nuevamente el campo de velocidades X dellıquido estacionario dentro de la region Ω ⊂ R3. Bajo la influencia de talcampo, cualquier punto se ”movera” por la accion de la velocidad X(p) dellıquido, creando una trayectoria. En los puntos de tal trayectoria tambiense ejercen tangencialmente velocidades que son vectores del campo queactua en Ω.

Si se conoce por γp(t) la trayectoria (curva) que se realiza desde elpunto p (tomado como tiempo incial t = 0), para tiempos t > 0, se tieneque la velocidad γp(t) de la curva en el punto γp(t), pertenece al campo X.Esto es, el punto γp(t) de la trayectoria tiene asociado al vector velocidadX(γp(t)) que tambien es la velocidad γp(t), es decir,

γp(t) = X(γp(t))

Diremos en este caso que la curva t → γp(t), es una curva integral delcampo vectorial X, condicionada a pasar por γp(0) = p.

Page 252: Libro Mate 4

252 Campos vectoriales en R3

En otras palabras, una curva integral del campo X de velocidades esuna curva cuyos vectores tangentes pertenecen ademas al campo X (veasefigura 5.20).

DEFINICION. Sea X un campo vectorial suave en Ω ⊂ R3, y sea

γ : (−ε, ε)→ Ω, ε > 0

una curva suave definida en el intervalo (−ε, ε) a Ω. Decimos que γ esuna curva integral del campo X, si para todo t ∈ (−ε, ε) se satisface laigualdad

γ(t) = X(γ(t))

Esto es, γ es una curva integral de X si sus vectores tangentes γ(t) formanparte del campo (vease la figura 5.20).

γ( )t

γ( )t

Figura 5.20: Curvas integrales de un campo vectorial

Sean x, y, z las coordenadas de Ω donde el campo X se escribe

X(x, y, z) = (P (x, y, z), Q(x, y, z), R(x, y, z))

entonces la curva γ(t) = (x(t), y(t), z(t)) sera una curva integral del campoX si para t ∈ (−ε, ε) se cumple la cadena de igualdades

(x(t), y(t), z(t)) = γ(t) = X(γ(t)) = X(x(t), y(t), z(t))

= (P (x(t), y(t), z(t)), Q(x(t), y(t), z(t)), R(x(t), y(t), z(t)))

Esto es equivalente a que, suprimiendo la variable t (sabiendo que las co-ordenadas dependen de tal variable), se cumpla el siguiente sistema deecuaciones diferenciales

Page 253: Libro Mate 4

5.5 Campos vectoriales en R2 y R3 253

x = P (x, y, z)y = Q(x, y, z)z = R(x, y, z)

, (x, y, z) ∈ Ω.

Consecuentemente, para que una curva γ(t) sea una curva integral delcampo vectorial X = (P,Q,R), sus coordenadas x(t), y(t), z(t) deben sa-tisfacer el sistema de ecuaciones diferenciales mencionado.

Surge el problema de la existencia de curvas integrales de un campovectorial suave X definido en una region Ω ⊂ R3.

El conjunto de tales curvas integrales conformarıan el flujo asociado alcampo de vectores en el cual un objeto se podrıa mover libremente bajo laaccion de tal campo.

El siguiente teorema, el cual no demostraremos, nos garantiza la existen-cia de una curva integral del campo, la cual pasa por un punto condicionadoy que esta determinada de manera unica.

TEOREMA 5.7 Sea Ω una region de R3 y sea X un campo de vectoressuave definido en Ω. Entonces, para el punto p ∈ Ω

a. Existe una curva integral suave

γ : (a, b)→ Ω

del campo integral X, definida en un intervalo maximo (a, b) ⊂ R quecontiene a 0 y tal que γ(0) = p.

b. La curva γ es unica en el sentido de que cualquier otra curva integralsuave del campo

γ : (a′, b′)→ Ω

pasando por p, coincide con γ en (a, b) ∩ (a′, b′), suponiendo de inicio que0 ∈ (a′, b′).

La prueba de este teorema es objeto de La Teorıa de las EcuacionesDiferenciales y sale del alcance de este libro.

Otra forma de determinar las curvas del flujo del campo vectorial

X = P (x, y, z)e1 +Q(x, y, z)e2 +R(x, y, z)e3

es resolver las ecuaciones diferenciales equivalentes,

dx

P (x, y, z)=

dy

Q(x, y, z)=

dz

R(x, y, z)

Page 254: Libro Mate 4

254 Campos vectoriales en R3

pero en este caso, las soluciones estan determinadas sin el parametro tem-poral t.

A continuacion, damos ejemplos de curvas integrales para campos vec-toriales en el plano. La busqueda de tales curvas integrales obedece engeneral a la solucion del sistema de ecuaciones diferenciales mencionado.Se hace mencion al lector que en general no es simple resolver un sistemade este tipo para encontrar las curvas integrales del campo que actua en laregion Ω, ademas de que los metodos de solucion que se conocen merecenun trabajo aparte.

EJEMPLO. Consideremos en Ω = R2 el campo de vectores constante

X(x, y) = (1, 0)

esto es, P (x, y) = 1 y Q(x, y) = 0.

C Entonces sus curvas integrales deberan de satisfacer el sistema deecuaciones diferenciales

x = P = 1y = Q = 0

cuyas soluciones para cualquier punto (x0, y0) ∈ Ω tienen la forma

γ(t) :

x(t) = t+ x0y(t) = y0

Esta curva integral

t→ γ(t) = (x(t), y(t)) = (t+ x0, y0)

corresponde a una recta paralela al eje x, que en el tiempo t = 0 pasa porel punto (x0, y0) ∈ Ω.

La figura 5.21 ilustra el campo vectorial de este ejemplo, junto con suscurvas integrales (flujo del campo). B

EJEMPLO. Sea en Ω = R2 el campo vectorial dado por

X(x, y) = (−y, x)

es decir, P (x, y) = −y, Q(x, y) = x.

C El sistema de ecuaciones diferenciales asociado al campo esx = P (x, y) = −yy = Q(x, y) = x

Mediante metodos del Algebra lineal se puede comprobar que la curvaintegral al tiempo t = 0 pasando por el punto (x0, y0) ∈ Ω, tiene la forma

γ(t) :

x(t) = x0 cos t− y0 sen ty(t) = x0 sen t+ y0 cos t

, t ∈ R

Page 255: Libro Mate 4

5.5 Campos vectoriales en R2 y R3 255

0 00 0(x (x) )

X=(1,0)

+t,y ,y

Figura 5.21: Campo constante X = (1, 0).

Por ejemplo, para el punto (x0, y0) = (1, 1) se tiene que la curva integralpasando por el esta definida por

γ(t) = (cos t− sent, sent+ cos t)

Ya que

||γ(t)||2 = (cos t− sent)2 + (sent+ cos t)2 = 2

se tiene que tal curva integral por (1, 1) es una circunferencia de radio√2

con centro en el origen. De manera analoga, la curva integral de X quepasa por el punto arbitrario (x0, y0) satisface que

||γ(t)||2 = (x0 cos t− y0 sent)2 + (x0 sent+ y0 cos t)2 = x20 + y20

lo que nos indica que tambien es una circunferencia con centro en el origende radio

√x20 + y20 .

La figura 5.22 nos ilustra este campo vectorial junto con sus curvasintegrales, que conforman una familia de cırculos concentricos, sobre loscuales se mueve el campo en direccion contraria a las manecillas del reloj.B

(x,y)

X(x,y)γ( )tγ( )t

Figura 5.22: Curvas integrales del campo X(x, y) = (−y, x).

Page 256: Libro Mate 4

256 Campos vectoriales en R3

Una forma mas simple de obtener las curvas integrales sin la expresionexplıcita del parametro t para el campo del ejemplo anterior, se muestra acontinuacion

EJEMPLO. Determine las lıneas de flujo del campo vectorial plano delejemplo anterior,

X = −ye1 + xe2

C Para encontrar las lıneas de flujo del campo vectorial plano

X = P (x, y)e1 +Q(x, y)e2

debemos resolver la ecuacion diferencial

dx

P (x, y)=

dy

Q(x, y)

es decir,dy

dx=Q(x, y)

P (x, y)

En nuestro ejemplo P (x, y) = −y, Q(x, y) = x, y, por lo tanto, obtene-mos

dy

dx=

x

−yo equivalentemente

∫(−y)dy =

∫xdz ⇐⇒ −y2

2+ c1 =

x2

2+ c2

Reacomodando los terminos, concluimos que las lıneas de flujo son dela forma

x2 + y2 = c

es decir, son circunferencias con centro en el origen. B

EJEMPLO. Encuentre las lıneas de flujo del campo vectorial

X = e1 + x(y − 1)e2

C Las lıneas de flujo se obtienen resolviendo la ecuacion diferencial

dx

1=

dy

x(y − 1)

es decir xdx = dyy−1 .

Page 257: Libro Mate 4

5.5 Campos vectoriales en R2 y R3 257

Integrando en ambos lados obtenemos∫

xdx =

∫dy

y − 1,

es decir, siendo c una constante de integracion, la solucion se escribe im-plıcitamente,

x2

2= ln |y − 1|+ c B

EJEMPLO. (Campo gradiente). Considere un campo escalar F , y elcampo gradiente asociado en la region Ω de R3 en las coordenadas x, y, z.

X(x, y, z) = gradF (x, y, z) =

(∂F

∂x,∂F

∂y,∂F

∂z

)|(x,y,z)

C Entonces las ecuaciones diferenciales para este campo gradiente vie-nen dadas por

x = ∂F∂x

y = ∂F∂y

z = ∂F∂z

Como es sabido, el vector tangente de una curva integral

γ(t) = (x(t), y(t), z(t))

es el vectorγ(t) = gradF (x(t), y(t), z(t))

y este es ortogonal al conjunto de nivel donde se encuentra el punto γ(t).Ya que el campo gradiente es ortogonal a los conjuntos de nivel de F ,

entonces el flujo (conjunto de curvas integrales) de X = gradF es ortogonala los conjuntos de nivel de F .

Particularmente si F = T es el campo de temperaturas, entonces unobjeto situado sobre un conjunto de nivel T−1(T0) tendera a moverse demanera natural hacia la direccion del gradiente X = gradT para ganarcalor, llevado por la accion misma del campo gradiente. B

DEFINICION. El campo vectorial X es conservativo si existe unafuncion escalar F tal que X = ∇F . En tal caso, llamamos a F una funcionpotencial para X.

EJEMPLO.Muestre que el campo vectorial gravitacional es conservativo.

C El campo vectorial esta dado por,

X(x, y, z) =km(xe1 + ye2 + ze3)

(x2 + y2 + z2)3/2

Page 258: Libro Mate 4

258 Campos vectoriales en R3

es decir,

X(x, y, z) =kmxe1

(x2 + y2 + z2)3/2+

kmye2(x2 + y2 + z2)3/2

+kmze3

(x2 + y2 + z2)3/2

Definiendo a la funcion

F (x, y, z) =km√

x2 + y2 + z2

y calculando el gradiente obtenemos,

∇F =∂f

∂xe1 +

∂f

∂ye2 +

∂f

∂ze3

∇F =kmxe1

(x2 + y2 + z2)3/2+

kmye2(x2 + y2 + z2)3/2

+kmze3

(x2 + y2 + z2)3/2= X

con lo cual concluimos que el campo X es conservativo B

EJEMPLO. Determine el campo gradiente definido por el campo escalar

R(x, y, z) = zxex2y

C Ya que el campo gradiente es de la forma

∇R(x, y, z) = ∂R

∂xe1 +

∂R

∂ye2 +

∂R

∂ze3

calculemos primero las derivadas parciales

∂R

∂x= zex

2y + 2x2yz ex2y

∂R

∂y= x3zex

2y

∂R

∂z= xex

2y

De esta manera, el campo gradiente de R(x, y, z) es

∇R(x, y, z) = (zex2y + 2x2yzex

2

y)e1 + x3 + x3zex2ye2 + xex

2ye3 B

EJEMPLO. Si el campo escalar

T (x, y, z) =23

(1 + x2 + y2 + 4z2)

Page 259: Libro Mate 4

5.6 Divergencia, gradiente y rotor 259

da la temperatura en el punto (x, y, z), determine el campo gradiente ∇Ty la direccion en la cual aumenta mas rapido la temperatura en el punto(1, 1, 0).

C Calculemos primero las derivadas parciales de T (x, y, z)

∂T

∂x=

−46x(1 + x2 + y2 + 4z2)2

∂T

∂y=

−46y(1 + x2 + y2 + 4z2)2

∂T

∂z=

−184z(1 + x2 + y2 + 4z2)2

El campo gradiente de T es

∇T =∂T

∂xe1 +

∂T

∂ye2 +

∂T

∂ze3

es decir,

∇T =−46xe1

(1 + x2 + y2 + 4z2)2+

−46ye2(1 + x2 + y2 + 4z2)2

+184ze3

(1 + x2 + y2 + 4z2)2

Calculemos ahora el campo gradiente en el punto (1, 1, 0)

∇T (1, 1, 0) = −46e19

+−46e2

9+ 0e3

= −46

9e1 −

46

9e2 + 0e3

De este ultimo se sigue que la temperatura aumenta mas rapido en ladireccion ξ =

(− 46

9 ,− 469 , 0

)B

El teorema 5.7 muestra que cuando en una region Ω actua un campode vectores, la accion de este en cualquier punto conlleva a movimientosnaturales vıa las curvas integrales del campo. Cualquier otra trayectoriaque no sea dentro de una curva integral debera requerir de un “trabajo”.

5.6 Divergencia, gradiente y rotor

En esta seccion damos algunas formulas que son importantes para la teorıadel analisis vectorial, y se hace con el espıritu de desarrollar un calculo ope-racional en los campos escalares y vectoriales mediante el vector simbolicode Hamilton.

Page 260: Libro Mate 4

260 Campos vectoriales en R3

El vector de Hamilton definido por

∇ =

(∂

∂x,∂

∂y,∂

∂z

)

actua en los campos vectoriales X por las ecuaciones convencionales si-guientes.

Para un campo vectorial X = (P,Q,R) se define su divergencia, defi-nida por divX, como el campo escalar definido por

divX =< ∇, X >

donde el producto escalar se calcula convencionalmente,

divX =< ∇, X >=

⟨(∂

∂x,∂

∂y,∂

∂z

), (P,Q,R)

⟩=∂P

∂x+∂Q

∂y+∂R

∂z

Este campo escalar divX mide, cuando se evalua en el punto p, losposibles desagues o manantiales del campoX en tal punto, como se muestraen la figura 5.23. Un analisis mas profundo de este concepto se realizamediante los metodos del analisis vectorial.

Figura 5.23: Divergencia de un campo vectorial.

Para el campo vectorial X = (P,Q,R) se define su campo de rotaciono rotor, definido por rotX, como el campo vectorial

rotX = [∇, X]

donde el producto vectorial indicado se calcula convencionalmente

rotX = [∇, X] =

∣∣∣∣∣∣

e1 e2 e3∂/∂x ∂/∂y ∂/∂zP Q R

∣∣∣∣∣∣

Page 261: Libro Mate 4

5.6 Divergencia, gradiente y rotor 261

=

(∂R

∂y− ∂Q

∂z

)e1 −

(∂R

∂x− ∂P

∂z

)e2 +

(∂Q

∂x− ∂P

∂y

)e3

=

(∂R

∂y− ∂Q

∂z

)e1 +

(∂P

∂z− ∂R

∂x

)e2 +

(∂Q

∂x− ∂P

∂y

)e3

=

(∂R

∂y− ∂Q

∂z,∂P

∂z− ∂R

∂x,∂Q

∂x− ∂P

∂y

)

El campo vectorial rotX mide, cuando se evalua en el punto p, lasposibles rotaciones que tiene el campo durante su accion en tal punto. Lafigura 5.24 ilustra esta idea, que puede ser estudiada mas profundamentecon la teorıa del analisis vectorial.

Figura 5.24: Rotor de un campo vectorial.

Si F es un campo escalar suave, podemos efectuar la operacion de ∇ enF definiendo el campo vectorial gradiente

gradF = ∇F

donde el vector simbolico de Hamilton ∇ actua en F mediante la igualdad

gradF = ∇F =

(∂

∂x,∂

∂y,∂

∂z

)F =

(∂F

∂x,∂F

∂y,∂F

∂z

)

EJEMPLO. Calcular la divergencia y el rotor del campo

X = (x2, xy, z2y) = x2e1 + xye2 + z2ye3

C Por calculos directos se obtiene

divX(x, y, z) =< ∇, X >=∂x2

∂x+∂(xy)

∂y+∂(z2y)

∂z

Page 262: Libro Mate 4

262 Campos vectoriales en R3

= 2x+ x+ 2zy = 3x+ 2zy

rotX = (x, y, z) = [∇, X] =

∣∣∣∣∣∣

e1 e2 e3∂/∂x ∂/∂y ∂/∂zx2 xy z2y

∣∣∣∣∣∣

=

(∂(z2y)

∂y− ∂(xy)

∂z

)e1 −

(∂(z2y)

∂x− ∂x2

∂z

)e2 +

(∂(xy)

∂x− ∂x2

∂y

)e3

= (z2 − 0)e1 − (0− 0)e2 + (y − 0)e3 = (z2, 0, y) B

EJEMPLO. Calcular grad (divX) y div(rotX) para el campo

X(x, y, z) = (z2x, x2 − y2, y2 + z2)

C Mediante calculos directos se tiene

divX(x, y, z) =< ∇, X >=∂(z2x)

∂x+∂(x2 − y2)

∂y+∂(y2 + z2)

∂z

= z2 − 2y + 2z

rotX = (x, y, z) = [∇, X] =

∣∣∣∣∣∣

e1 e2 e3∂/∂x ∂/∂y ∂/∂zz2x x2 − y2 y2 + z2

∣∣∣∣∣∣

=

(∂(y2 + z2)

∂y− ∂(x2 − y2)

∂z

)e1 −

(∂(y2 + z2)

∂x− ∂(z2x)

∂z

)e2

+

(∂(x2 − y2)

∂x− ∂(z2x)

∂y

)e3

= (2y − 0)e1 − (0− 2zx)e2 + (2x− 0)e3 = (2y, 2zx, 2x)

Consecuentemente,

grad (divX) = ∇(z2 − 2y + 2z)

=

(∂(z2 − 2y + 2z)

∂x

∂(z2 − 2y + 2z)

∂y,∂(z2 − 2y + 2z)

∂z

)= (0,−2, 2z + 2)

div (rotX) =< ∇, (2y, 2zx, 2x) >= ∂(2y)

∂y+∂(2zx)

2y+∂(2x)

∂z= 0 B

Del ejemplo anterior, para el campo dado X se obtuvo la igualdaddiv (rot X) = 0. La siguiente proposicion nos indica que esta igualdadse cumple en general para cualquier campo vectorial. Se obtienen masrelaciones entre los operadores grad,div y rot.

Page 263: Libro Mate 4

5.6 Divergencia, gradiente y rotor 263

LEMA 5.1 Para los campos vectoriales X y Y , y los campos escalaressuaves F y G actuando en una region V ⊂ R3 se cumplen las identidadesbasicas del calculo operacional vectorial

a. rot (gradF ) ≡ 0

b. div (rotX) ≡ 0

c. div (FX) =< ∇F,X > +F < ∇, X >

d. grad (FG) = FgradG+G gradF

e. rot (FX) = F rotX + [∇F,X]

f. div [X,Y ] =< Y, rotX > − < X, rotY >

g.div (gradF ) = ∆F

donde se define el operador Laplaciano

∆ =∂2

∂x2+

∂2

∂y2+

∂2

∂z2

actuando en el campo escalar F mediante la igualdad

∆F =∂2F

∂x2+∂2F

∂y2+∂2F

∂z2.

C Damos la demostracion de algunas de las afirmaciones, dejando elresto para el lector. Como ya se menciono, el espıritu de la prueba espuramente operacional.

a. La siguiente relacion es valida,

rot (gradF ) = [∇,∇F ] = 0

pues los vectores ∇ y ∇F son paralelos.

b. Por un calculo directo,

div (rotX) =< ∇, [∇, X] >= (∇,∇, X) = 0

donde ( , , ) es el triple producto escalar, y en la expresion dada se repiteel vector ∇.c. De la relacion de divergencia, se tiene,

div (FX) =< ∇, FX >=∂

∂x(FP ) +

∂y(FQ) +

∂z(FR)

= F∂P

∂x+ F

∂Q

∂y+ F

∂R

∂z+ P

∂F

∂x+Q

∂F

∂y+R

∂F

∂z

Page 264: Libro Mate 4

264 Campos vectoriales en R3

= F < ∇, X > + < X,∇F >

f. De la definicion del triple producto escalar, se tiene,

div[X,Y ] = (∇, X, Y ) =

∣∣∣∣∣∣

∂/∂x ∂/∂y ∂/∂zP Q RP ′ Q′ R′

∣∣∣∣∣∣

donde X = (P,Q,R), Y = (P ′, Q′, R′). Pero un calculo directo en losdeterminantes (Identidad de Jacobi) muestra que

∣∣∣∣∣∣

∂/∂x ∂/∂y ∂/∂zP Q RP ′ Q′ R′

∣∣∣∣∣∣=

∣∣∣∣∣∣

P ′ Q′ R′

∂/∂x ∂/∂y ∂/∂zP Q R

∣∣∣∣∣∣−

∣∣∣∣∣∣

P Q R∂/∂x ∂/∂y ∂/∂zP ′ Q′ R′

∣∣∣∣∣∣

o bien(∇, X, Y ) = (X,∇, Y )− (Y,∇, X)

lo que prueba la afirmacion f.

Los incisos d., e. y g. se dejan al lector como ejercicio. B

Consideremos un cambio de coordenadas en la region Ω ⊂ R3, dado porel sistema

x = x(u, v, w)y = y(u, v, w)z = z(u, v, w),

entonces, en cada punto p ∈ Ω, la base canonica e1, e2, e3 se transforma,bajo La matriz Jacobiana

A =

∂x∂u

∂x∂v

∂x∂w

∂y∂u

∂y∂v

∂y∂w

∂z∂u

∂z∂v

∂z∂w

en el conjunto de vectores basicos Ae1, Ae2, Ae3, es decir, en la basefu, fv, fw dada por

fu =

(∂x

∂u,∂y

∂u,∂z

∂u

)= Ae1

fv =

(∂x

∂v,∂y

∂v,∂z

∂v

)= Ae2

Page 265: Libro Mate 4

5.6 Divergencia, gradiente y rotor 265

fw =

(∂x

∂w,∂y

∂w,∂z

∂w

)= Ae3

Al normalizar cada uno de esos vectores se tiene una base de vectoreseu, ev, ew, donde,

eu =

(∂x∂u ,

∂y∂u ,

∂z∂u

)

√(∂x∂u

)2+(

∂y∂u

)2+(∂z∂u

)2=

fu||fu||

ev =

(∂x∂v ,

∂y∂v ,

∂z∂v

)

√(∂x∂v

)2+(∂y∂v

)2+(∂z∂v

)2=

fv||fv||

ew =

(∂x∂w ,

∂y∂w ,

∂z∂w

)

√(∂x∂w

)2+(

∂y∂w

)2+(∂z∂w

)2=

fw||fw||

Calculemos las normas de los vectores imagenes iniciales, por

hu =

√(∂x

∂u

)2

+

(∂y

∂u

)2

+

(∂z

∂u

)2

= ||fu||

hv = ||fv||hw = ||fw||

esto es,hueu = fu, hvev = fv, hwew = fw

Supongamos que el conjunto de vectores eu, ev, ew es ortogonal, esdecir, ortogonal entre sı por pares.

El elemento de desplazamiento infinitesimal vectorial d~r, en las coorde-nadas (x, y, z) esta dado por

d~r = (dx, dy, dz) = dxe1 + dye2 + dze3

Al cambiar el sistema coordenado, el desplazamiento infinitesimalvectorial d~r en las coordenadas (u, v, w) esta dado en la base fu, fv, fwpor

d~r = fudu+ fvdv + fwdw

esto es, en la base unitaria eu, ev, ew las coordenadas de d~r son ,

d~r = hueudu+ hvev dv + hwew dw = hudu eu + hvdv ev + hwdw ew

Page 266: Libro Mate 4

266 Campos vectoriales en R3

= (hudu, hvdv, hwdw)

En otras palabras, bajo el cambio de coordenadas, los elementos in-finitesimales son, hudu para la primer coordenada, hvdv para la segunda,y hwdw para la tercera.

Sea F un campo escalar tal que su gradiente en coordenadas (x, y, z) seescribe

gradF =∂F

∂xe1 +

∂F

∂ye2 +

∂F

∂ze3

entonces, para las coordenadas (u, v, w) se tiene la relacion

dF =∂F

∂udu+

∂F

∂vdv +

∂F

∂wdw

=

(1

hu

∂F

∂u

)hudu+

(1

hv

∂F

∂v

)hvdv +

(1

hw

∂F

∂w

)hwdw

lo que indica que las coordenadas del gradiente en la base eu, ev, ew sonnecesariamente,

gradF =

(1

hu

∂F

∂u,

1

hv

∂F

∂v,

1

hw

∂F

∂w

)

Calculos mas complicados nos demuestran que para un campo vectorialX = (P,Q,R), el cambio de coordenadas nos lleva la divergencia de X enlas coordenadas x, y, z,

divX =∂P

∂x+∂Q

∂y+∂R

∂z

en la expresion

divX =1

huhvhw

[∂

∂u(P hvhw) +

∂v(Qhu hw) +

∂w(Rhuhv)

]

en las coordenadas (u, v, w).

Por otro lado, el rotor del campo X en las coordenadas x, y, z dado por

rotX =

(∂R

∂y− ∂Q

∂z

)e1 +

(∂P

∂z− ∂R

∂x

)e2 +

(∂Q

∂x− ∂P

∂y

)e3

se transforma en

rotX =1

hvhw

(∂(Rhw)

∂v− ∂(Qhv)

∂w

)eu

+1

hwhu

(∂(P hu)

∂w− ∂(Rhw)

∂u

)ev +

1

huhv

(∂(Qhv)

∂x− ∂(P hu)

∂z

)ew

Page 267: Libro Mate 4

5.6 Divergencia, gradiente y rotor 267

en las coordenadas (u, v, w).

EJEMPLO. Sean las coordenadas esfericas co-geograficas

x = r cos ϕ sen θy = r senϕ sen θ,z = r cos θ

C Ya se ha demostrado que

A =

cos ϕ sen θ −r senϕ sen θ r cos ϕ cos θsenϕ sen θ r cos ϕ sen θ r senϕ cos θ

cos θ 0 −r sen θ

lo cual implica, haciendo u = r, v = ϕ, w = θ,

fr = (cos ϕ sen θ, senϕ sen θ, cos θ)

fϕ = (−r senϕ sen θ, r cos ϕ sen θ, 0)

fθ = (r cos ϕ cos θ, r senϕ cos θ, −r sen θ)Al calcular las normas se tiene

hr = ||fr|| = 1

hϕ = ||fϕ|| = r sen θ

hθ = ||fθ|| = r

De esta manera, los vectores basicos en las coordenadas (r, ϕ, θ) son

er =frhr

= (cos ϕ sen θ, senϕ sen θ, cos θ)

eϕ =fϕhr

= (−senϕ, cosϕ, 0)

eθ = (cos θ, senϕ cos θ, −sen θ)y un calculo directo prueba que er, eϕ, eθ es ortogonal.

De esta forma, para un campo escalar F , en las coordenadas (r, ϕ, θ) setiene que

gradF =

(1

hr

∂F

∂r,

1

∂F

∂ϕ,1

∂F

∂θ

)

=

(∂F

∂r,

1

r sen θ

∂F

∂ϕ,1

r

∂F

∂θ

)

Page 268: Libro Mate 4

268 Campos vectoriales en R3

Mientras que para un campo vectorial X = (P,Q,R) se cumplen lasformulas

divX =1

hrhϕhθ

[∂(Phϕhθ)

∂r+∂(Qhrhθ)

∂ϕ+∂(Rhrhϕ)

∂θ

]

=1

r2sen θ

[∂(r2senθP )

∂r+∂(rQ)

∂ϕ+∂(rsenθR)

∂θ

]

=1

r2 sen θ

[sen θ

∂(r2P )

∂r+ r

∂Q

∂ϕ+ r

∂(sen θR)

∂θ

]

=1

r2∂(r2P )

∂r+

1

rsen θ

∂Q

∂ϕ+

1

r sen θ

∂(sen θR)

∂θ

rotX =1

hϕhθ

(∂(Rhθ)

∂ϕ− ∂(Qhϕ)

∂θ

)er

+1

hθhr

(∂(Phr)

∂θ− ∂(Rhθ)

∂r

)eϕ +

1

hrhϕ

(∂(Qhϕ)

∂r− ∂(Phr)

∂ϕ

)eθ

=1

r2 sen θ

(∂(rR)

∂ϕ− ∂(r sen θQ)

∂θ

)er

+1

r

(∂P

∂θ− ∂(rR)

∂r

)eϕ +

1

r sen θ

(∂(r senθQ)

∂r− ∂P

∂ϕ

)eθ

=1

r2sen θ

(r∂R

∂ϕ− r ∂(sen θR)

∂θ

)er

+1

r

(∂P

∂θ− ∂(rR)

∂r

)eϕ +

1

r sen θ

(sen θ

∂(rQ)

∂r− ∂P

∂ϕ

)eθ

Dejamos como ejercicio al lector verificar que en las coordenadas (u, v, w)se cumple la siguiente igualdad para el Laplaciano de un campo escalar F .

∆F = div gradF

=1

huhvhw

[∂

∂u

(hvhwhu

∂F

∂u

)+

∂v

(huhwhv

∂F

∂v

)+

∂w

(huhvhw

∂F

∂w

)]

Consecuentemente, para las coordenadas esfericas se tiene, para uncampo escalar F ,

∆F =1

r2senθ

[∂

∂r

(r2sen θ

∂F

∂r

)+

∂ϕ

(1

sen θ

∂F

∂ϕ

)+

∂θ

(sen θ

∂F

∂θ

)]

=1

r2∂

∂r

(r2∂F

∂r

)+

1

r2sen2 θ

∂2F

∂ϕ2+

1

r2sen θ

∂θ

(sen θ

∂F

∂θ

)B

Page 269: Libro Mate 4

5.6 Divergencia, gradiente y rotor 269

La ecuacion del calor

Consideremos un cuerpo fısico Ω ⊂ R3, y designemos su temperatura en elpunto (x, y, z) en el instante t por el campo escalar

u = u(x, y, z, t)

Afirmamos que el campo u satisface la ecuacion diferencial parcial linealde segundo orden

∂u

∂t= a2

(∂2u

∂x2+∂2u

∂y2+∂2u

∂z2

)

donde (x, y, z) ∈ Ω y a ∈ R.Al utilizar el operador de Laplace,

∆ =∂2

∂x2+

∂2

∂y2+

∂2

∂z2

lo anterior equivale a que la funcion u debe satisfacer la ecuacion

∂u

∂t= a2∆u

llamada la ecuacion de conduccion de calor.

C Al tomar un cubo infinitesimal σ del cuerpo Ω (vease la figura 5.25),la cantidad de calor que atraviesa la cara izquierda de σ de derecha aizquierda durante el tiempo (t, t+∆t) es, hasta, un infinitesimo

α∂u

∂x(x, y, z, t)∆y∆z∆t

donde α es el coeficiente de conductibilidad termica del cuerpo que se con-sidera constante en cualquiera de sus puntos.

∆x∆y

∆z

Figura 5.25: Calor atravesando el cubo infinitesimal en Ω.

Page 270: Libro Mate 4

270 Campos vectoriales en R3

Lo anterior se debe a que la cantidad indicada de calor es proporcionalal numero α, al area ∆y∆z de la cara que se examina, al incremento detiempo ∆t y a la velocidad de variacion de la temperatura en la direcciondel eje x que es igual a la derivada parcial ∂u

∂x . La derivada parcial varıadentro de los lımites de la cara, pero, despreciando infinitesimos de ordensuperior, se puede suponer que en toda la cara es igual a ∂u

∂x en el punto(x, y, z).

La cantidad de calor que pasa por la cara derecha de σ de derecha aizquierda es, analogamente, igual a

α∂u

∂x(x+∆x, y, z, t)∆y∆z∆t

De esta forma, la cantidad de calor que entra en el cubo σ por sus carasizquierda y derecha durante el lapso de indicado es igual a

α∂u

∂x(x+∆x, y, z, t)∆y∆z∆t− α∂u

∂x(x, y, z)∆y∆z∆t

pero, por el teorema del valor medio para u en la variable x, se tiene que

α∂u

∂x(x+∆x, y, z, t)∆y∆z∆t− α∂u

∂x(x, y, z)∆y∆z∆t

= α∂2u

∂x2(x, y, z, t)∆x∆y∆z∆t.

En virtud de que en las otras caras del cubo ocurre igual, entonces lacantidad total de calor que entra en σ en el lapso (t, t+∆t) es, la suma delas cantidades de calor que entra durante este tiempo por todas las carasde σ.

α

(∂2u

∂x2+∂2u

∂y2+∂2u

∂z2

)∆x∆y∆z∆t.

Por las mismas consideraciones, hasta un infitesimo del volumen ∆x∆y∆zde σ, este numero (cantidad de calor ) es igual tambien a

β∂u

∂t∆x∆y∆z∆t

donde β es el calor especıfico del cuerpo que suponemos constante en todossus puntos.

Igualando, obtenemos, despues de las simplificaciones, la ecuacion dife-rencial parcial lineal de segundo orden mencionada, donde

a2 =α

β.

Page 271: Libro Mate 4

5.6 Divergencia, gradiente y rotor 271

Se ha mostrado que la temperatura del cuerpo Ω es la funcion u =u(x, y, z, t) que satisface la ecuacion de conduccion del calor, donde a2

es una constante positiva. Nos hemos limitado al caso cuando el cuerpotiene en todos sus puntos un calor especıfico constante y un coeficiente deconductibilidad que no varıa.

La ecuacion diferencial obtenida tiene un conjunto infinito de soluciones,y para encontrar entre ellas una solucion determinada es necesario imponersobre la funcion u condiciones adicionales, llamadas condiciones inicialesy de frontera. Este problema sale del alcance de este trabajo.

La distribucion del calor en un cuerpo se llama estacionaria si la tem-peratura u del cuerpo depende de la posicion del punto (x, y, z) y no de-pende del tiempo t. Es decir, si u = u(x, y, z), entonces

∂u

∂t= 0

lo que implica que el campo escalar u satisface la ecuacion diferencial parciallineal de segundo orden

∆u = 0.

DEFINICION. La funcion u(x, y, z) se llama armonica sobre la region Ωsi tiene derivadas parciales continuas de segundo orden sobre Ω y satisfacesobre Ω la ecuacion

∆u = 0.

llamada la ecuacion de Laplace.

LEMA 5.2 Suponga que la region acotada Ω tiene como frontera suave ala superficie S sobre la cual se da la funcion continua f(x, y, z). Entoncesen la cerradura Ω existe una unica funcion continua u(x, y, z), armonicasobre la region Ω, tal que

u|S = f(x, y, z)

Este resultado tiene una interpretacion fısica sencilla. Si sobre la fron-tera superficial S del cuerpo Ω se mantiene una temperatura u, tal queu|S = f(x, y, z) es la funcion continua dada sobre S, entonces dentro delcuerpo se establece una unica temperatura bien determinada, armonicau(x, y, z).

Desde el punto de vista fısico, esta afirmacion es obvia, aunque puede serdemostrada matematicamente. Este problema, llamado el problema deDirichlet, esta parcialmente investigado y se conocen diferentes metodosnumericos de solucion.

Page 272: Libro Mate 4

272 Campos vectoriales en R3

Ejercicios.

1. Sean las transformaciones lineales

L1(x, y, z) = (x+ 2y + 3z, 4x+ 5y + 6z)

L2(u, v, w) = (u+ 3v + 5w, 6u+ 7v + 9w)

Calcular L1L2 y L2L1, usando sus matrices asociadas en la base canonica.

2. Hacer lo mismo que el ejercicio 1. para las transformaciones lineales

L3(x, y, z) = (x+ y, y + z, z + x)

L4(u, v, w) = (v + w, u+ w, u+ v)

es decir, calcular L3 L4 y L4 L3.

3. Sean las transformaciones lineales,

L5(x, y) = (2x− y, x+ 3y, x)

L6(x, y, z) = (x+ y + z, x− y − z)y considerense las transformaciones L1, L2, L3 y L4 en los ejercicios 1. y2.. Calcular las transformaciones lineales

a. L4 L5

b. L5 L6

c. L2 L5

Calcular la aplicacion de cada transformacion lineal dada en el vectorindicado.

d. L5(ξ), si ξ = (−1, 1)e. L6(ξ), si ξ = (1, 0, 1)

f. L3(ξ), si ξ = (−1, 2, 3)g. L4 L5(ξ), si ξ = (1, 2)

h. L5 L6(ξ), si ξ = (3,−2, 1)

4. Dar los dominios de definicion (regiones) de los siguientes campos vec-toriales.

a. f1(x, y) = (x2 + y2, xy − x2)b. f2(x, y) =

(√x2 − y2, xy3 ln(xy)

)

c. f3(x, y, z) =(xyz2, x

yz

)

Page 273: Libro Mate 4

5.6 Divergencia, gradiente y rotor 273

d. f4(x, y, z) = (arcsen (x+ y + z), xy, x2 + y2 + z2)

5. Utilizando las funciones del ejercicio 4. calcular las composicionesindicadas.

a. f3 f2b. f1 f3c. f3 f4d. f4 f3e. f4 f26. Calcular la matriz Jacobiana de cada uno de los incisos del ejercicio 4.

7. Calcular la matriz Jacobiana de la funcion dada en el punto p indicado.

a. f(x, y, z) = (x2 + y2, x cos yz) en p = (1, 0, π/2)b. f(x, y) = (exsenx, ey cosx) en p = (0, 0)

c. f(x, y, z)(

x2

1+y , 3x+ z2, y2z)

en p = (1, 1, 1)

d. f(x, y) = (lnxy, senxy, x2 + y) en p = (2, 1)

8. a. Hallar los puntos del dominio de la funcion 7. b. donde el Jacobianose anula.

b. Hallar los puntos del dominio de la funcion 8. c. donde el Jacobianose anula.

9. Calcular, utilizando La regla de la cadena, las matrices Jacobianas delas composiciones de todos los incisos del ejercicio 5.

10. ¿Cuales de las siguientes funciones se pueden considerar un cambio decoordenadas local, en el punto que se indica?

a. f(x, y) = (x2y + 1, x2 + y2) en p = (1, 1)b. f(x, y) = (x2 + y2,

√y +√x) en p = (4, 16)

c. f(x, y) = (exy, lnx) en p = (1, ln 2)d. f(x, y, z) = (xz, xy, yz) en p = (1, 4)f. f(x, y, z) = (y cosx, y senx, z) en p = (π/4, 4, 3)

11. Dibuje e integre, sin usar el parametro temporal, los siguientes camposvectoriales.

a. X(x, y) = (x, y)

b. X(x, y) = (−x, y)c. X(x, y) = (x,−y)d. X(x, y) = (−x,−y)e. X(x, y) = (x2, y)

Page 274: Libro Mate 4

274 Campos vectoriales en R3

f. X(x, y) = (x2,−y)g. X = gradF , donde F (x, y) = x2 − y2

12. a. Calcule la divergencia y el rotor de todos los campos vectoriales delejercicio 11.

b. Calcule la divergencia y el rotor de los campos vectoriales siguientes.

i. X1(x, y, z) = (y − x, x+ y, yz)

ii. X2(x, y, z) = (x2e−yz, y2e−xz, z2e−xy)

iii. X3(x, y, z) = (z2y − x, x2z + y, y2x− z)iv. X4(x, y, z) = (xxsen zy, ey cosxz, ezsen yx)

13. Verifique las igualdades siguientes para los campos vectoriales delejercicio 12.

a. div (rotX) = 0, X = X1, X2, X3, X4

b. div [X1, X2] =< X2, rotX1 > − < X1, rotX2 >

c. div [X3, X4] =< X4, rotX3 > − < X3, rotX4 >

14. Si F (x, y, z) = x+ y2 + z2, verifique las igualdades siguientes, usandolos campos vectoriales del ejercicio 12.

a. rot (FX) = F rotX + [∇F,X], X = X1, X2

b. rot (gradF ) = 0

c. div (gradF ) = ∆F

15. Demostrar que en las coordenadas (u, v, w) se cumple la igualdadsiguiente para el Laplaciano de un campo escalar F arbitrario.

∆F =1

huhvhw

[∂

∂u

(hvhwhu

∂F

∂u

)+

∂v

(huhwhv

∂F

∂v

)+

∂w

(huhvhw

∂F

∂w

)]

16. Calcule la divergencia y el rotor de cualquier campo vectorial X, y elgradiente de un campo escalar, en los siguientes sistemas de coordenadas.

a. En coordenadas cilındricas.

b. En las coordenadas (u, v, w) donde

x = uevw

y = veuw

z = weuv

c. En las coordenadas pseudoesfericas (r, χ, ϕ) donde

x = r cosh χy = r senhχ cosϕz = r senhχ senϕ,

donde r > 0, χ > 0, 0 ≤ ϕ ≤ 2π.

Page 275: Libro Mate 4

Apendices

Page 276: Libro Mate 4
Page 277: Libro Mate 4

Capıtulo 6

Elementos Basicos de

Superficies en R3

En este capıtulo introducimos el concepto basico de superficie en el es-pacio euclidiano R3. Damos ejemplos de las superficies mas comunmenteconocidas y un tratamiento general de su estudio.

Utilizamos una notacion para definir a los planos coordenados de lasiguiente manera.

R2x,y definira al plano (x, y) contenido en R3, R2

x,z, definira al plano

(x, z) contenido en R3, mientras que R2y,z definira al plano (y, z) contenido

en R3.

DEFINICION. A los puntos (x, y, z) ∈ R3 que satisfagan una relacionreal del tipo

R(x, y, z) = 0

se les dira que conforman una superficie ordinaria en R3.

EJEMPLO. (El plano). Un conjunto de puntos en el espacio que satis-facen una ecuacion del tipo

ax+ by + cz = d

se dice que forman un plano con vector normal n = (a, b, c).

C Tales puntos tambien satisfacen la relacion

R(x, y, z) = ax+ by + cz − d = 0

lo que asegura que un plano es una superficie (plana) en R3. B

Page 278: Libro Mate 4

278 Elementos Basicos de Superficies en R3

yx

z

r

Figura 6.1: Superficie esferica en R3.

EJEMPLO. (La esfera de radio r) Sea r > 0 un numero real dado.

C Los puntos (x, y, z) ∈ R3 tales que distan r del origen conforman unasuperficie esferica satisfaciendo la ecuacion

√x2 + y2 + z2 = r

o equivalentemente,x2 + y2 + z2 = r2

En otras palabras, los puntos sobre tal esfera, deberan satisfacer larelacion:

R(x, y, z) = x2 + y2 + z2 − r2 = 0

lo que hace que la esfera con radio r y centro en el origen sea una superficieen R3. Esto se ilustra en la figura 6.1.

Para muestra, la ecuacion

x2 + y2 + z2 = 16

describe a una superficie esferica de radio 4 con centro en (0, 0, 0). B

6.1 Superficies de revolucion

Consideremos en el plano x, z una curva γ que es la grafica de una funcionz = f(x), tal que no corta al eje z.

Al hacer girar γ en torno al eje z se obtiene una superficie de revo-lucion S contenida en R3.

Afirmamos que S es una superficie ordinaria segun nuestra definicion.

C Sea el punto (x0, y0, z0) ∈ S. Afirmamos que satisface una relaciondel tipo

R(x0, y0, z0) = 0

Page 279: Libro Mate 4

6.1 Superficies de revolucion 279

Cierto es que (x0, y0, z0) esta en el cırculo obtenido al hacer girar elpunto (x0, z0) de la curva γ. Pero entonces,

z0 = f(x0)

y todos los puntos del cırculo de radio x0 estan a la misma altura z0 ycontenidos en el plano R2

x,y en un cırculo de radio x0. Es decir, tienen unaecuacion en el plano z = z0 dada por x2 + y2 = x20 como se muestra en lafigura 6.2.

xy

z

z = f(√x2 + y2)

Figura 6.2: Superficie de revolucion.

Esto implica que sobre tal cırculo se cumple la igualdad

z0 = f(√x2 + y2)

Ya que (x0, y0, z0) es arbitrario, entonces cada punto (x, y, z) ∈ S debesatisfacer la ecuacion

z = f(√x2 + y2)

es decir, los puntos (x, y, z) ∈ S satisfacen ademas la relacion

R(x, y, z) = z − f(√x2 + y2) = 0

lo que hace de S una superficie. B

De igual forma, si z = f(y) y se hace girar γ alrededor del eje z, seobtiene la misma relacion. Esto es, si z = f(x) o z = f(y) para obtener laecuacion de la superficie S obtenida al girar la grafica γ de f alrededor deleje z es necesario reemplazar, en un caso,

x→√x2 + y2

Page 280: Libro Mate 4

280 Elementos Basicos de Superficies en R3

o bien, en el otro caso,

y →√x2 + y2

EJEMPLO. Consideremos la curva

z = x2

que es la ecuacion de la parabola en el plano x, z con x ≥ 0.

x

z

y

Figura 6.3: Paraboloide circular z = x2 + y2.

La ecuacion de la superficie de la revolucion S (paraboloide circular)obtenida al hacer girar tal parabola alrededor del eje z es

z = (√x2 + y2)2 = x2 + y2

o equivalentemente, la relacion

x2 + y2 − z = 0

Vease la figura 6.3 que describe a esta superficie.

EJEMPLO. Sea

z =1

y

la hiperbola canonica en el plano y, z con y > 0. La ecuacion de la superficiede revolucion S obtenida al hacer girar alrededor del eje z es

z =1√

x2 + y2

que se logra al sustituir y →√x2 + y2.

Page 281: Libro Mate 4

6.1 Superficies de revolucion 281

x

z

y

Figura 6.4: Hiperboloide circular.

Tal superficie se llama un hiperboloide circular y se ilustra en lafigura 6.5.

EJEMPLO. Sea el semicırculo en el plano R2x,y dado por la ecuacion

x =√R2 − y2

donde la variable x ≤ 0.

Al hacer girar en torno al eje y (intercambiando) reemplazando en estecaso la variable

x→√z2 + x2

se obtiene la superficie de revolucion√z2 + x2 =

√R2 − y2

o bien,x2 + y2 + z2 = R2

que es la ya conocida esfera de radio R con centro en (0, 0, 0). B

γ

Figura 6.5: Superficie cilındrica.

Page 282: Libro Mate 4

282 Elementos Basicos de Superficies en R3

6.2 Superficies cilındricas

Sea γ una curva contenida en un plano coordenado y sea ` el eje perpen-dicular a tal plano.

Si por cada punto (x0, y0, z0) ∈ γ pasamos una recta paralela a ` obte-nemos una superficie cilındrica S. La curva γ se llama generatriz deS y ` se llama la directriz.

Se afirma que S es superficie en nuestro contexto.

C Sin perdida de generalidad, supongase que γ esta en el plano R2x,y. Por

ser curva en R2x,y las coordenadas x, y satisfacen una ecuacion R(x, y) = 0

Sea (x, y, z) ∈ S entonces (x, y) ∈ γ lo que implica que R(x, y) = 0.

Claramente el punto (x, y, z), omitiendo a la variable z, tambien lasatisface, es decir, si se define (abusando de la notacion) a la relacion

R(x, y, z) = R(x, y) = 0

entonces S es una superficie (vease la figura 6.5).

EJEMPLO. Sea la curva plana

x2 + y2 = 16

un cırculo de radio 4 con centro en el origen. Esta genera en el espacio lasuperficie cilındrica S definida por la misma ecuacion, quedando libre lavariable z.

xy

z

2 2x +y =16

Figura 6.6: Cilindro circular recto.

Se llama cilindro circular recto de radio 2 con centro en el origen ycon directriz al eje z (vease figura 6.6).

Page 283: Libro Mate 4

6.3 Superficies conicas 283

EJEMPLO. Sea la curva sinusoidal

y = senx,

x ∈ [−π, π]. Tal curva genera la superficie cilındrica en la misma ecuacion,siendo z libre. Se llama cilindro sinusoidal con directriz al eje z. Lafigura 6.7 ilustra a esta superficie.

y

z

x

Figura 6.7: Cilindro sinusoidal.

EJEMPLO. Sea γ la grafica de la funcion z = ey en el plano R2z,y. Esta

curva genera la superficie cilındrica

z − ey = 0

con la variable x libre.

Se llama cilindro exponencial con directriz el eje x (vease la figura6.8).

6.3 Superficies conicas

Dada una curva γ en el espacio R3 y un punto v, se define una superficieS al tomar el haz de rectas por v que intersectan tambien a γ.

Se llama una superficie conica con vertice v y base γ. La figura 6.9ilustra a este tipo de superficies.

Page 284: Libro Mate 4

284 Elementos Basicos de Superficies en R3

x

y

z

Figura 6.8: Cilindro exponencial.

γ

v

Figura 6.9: Superficie conica.

Una relacion R(x, y, z) en las variables x, y, z, se dice homogenea degrado s, si para cualquier t ∈ R y cualquier punto (x, y, z) se cumple laigualdad

R(tx, ty, tz) = tsR(x, y, z)

Para muestra, la relacion

R(x, y, z) = x2 + y2 − z2

es homogenea de grado 2. En efecto,

C R(tx, ty, tz) = (tx)2 + (ty)2 − (tz)2 = t2x2 + t2y2 − t2z2

= t2(x2 + y2 − z2) = t2R(x, y, z) B

Page 285: Libro Mate 4

6.3 Superficies conicas 285

Otro ejemplo, es la relacion

R(x, y, z) = xy2 + x2y + y3 − z2y

la cual es una relacion homogenea de grado 3, como se muestra en el si-guiente calculo.

C R(tx, ty, tz) = tx(ty)2 + (tx)2(ty) + (ty)3 − (tz)2(ty)

= t3(xy2 + x2y + y3 − y2y) = t3R(x, y, z) B

Una relacion R(x, y, z) homogenea, define una superficie como se mues-tra en el siguiente Lema.

LEMA 6.1 La relacion R(x, y, z) = 0, donde R(x, y, z) es homogenea degrado s define una superficie conica.

C Sea R(x, y, z) = 0 tal que R es homogenea de grado s, y supongaseque v = (0, 0, 0). Sea p0 = (x0, y0, z0) tal que R(y0, x0, z0) = 0.

Se afirma que toda la recta por p0 y v satisface la relacion. Tal rectatiene, en las variables x, y, la ecuacion

x = tx0y = ty0z = tz0

De esta manera, si el punto (x, y, z) esta sobre la recta, entonces

R(x, y, z) = R(tx0, ty0, tz0) = tsR(x0, y0, z0) = ts(0) = 0

lo que demuestra que (x, y, z) ∈ S. B

EJEMPLO. La relacion

R(x, y, z) = x2 + y2 − z2

es homogenea de grado 2 y por lo tanto, la relacion

x2 + y2 − z2 = 0

define una superficie conica.

C Claramente R(0, 0, 0) = 02+02−02 = 0, lo que nos dice que el punto(0, 0, 0) esta en la superficie y es su vertice.

De la relacion x2 + y2 − z2 = 0, si despejamos a z2, obtenemos

x2 + y2 = z2.

Page 286: Libro Mate 4

286 Elementos Basicos de Superficies en R3

x

y

z

z = 1, x2 + y2 = 1

Figura 6.10: Cono circular.

Si tomamos z = 1, entonces x2 + y2 = 1 es un cırculo de radio 1, lo quenos dice que la curva γ, base de la superficie es un cırculo.

La superficie conica S es un cono circular con vertice en (0, 0, 0). Lafigura 6.10 muestra esta superficie. B

EJEMPLO. Sea la relacion

R(x, y, z) =x2

a2+y2

b2− z2

c2

homogenea de grado 2, entonces por el Lema 6.1, define una superficieconica.

C Al hacer R(x, y, z) = 0 se obtiene la ecuacion

x2

a2+y2

b2− z2

c2= 0

o bien, despejando los terminos en z se tiene la relacion equivalente

x2

a2+y2

b2=z2

c2

Si se hace z = c obtenemos una curva γ base de la superficie, dada por

x2

a2+y2

b2= 1

que es la ecuacion de una elipse con parametros a, b, a una altura z = c.

Le llamaremos a tal superficie un cono elıptico con vertice en el puntov = (0, 0, 0), y se ilustra en la figura 6.11. B

Page 287: Libro Mate 4

6.4 Elipsoides, Hiperboloides y Paraboloides 287

ba

Figura 6.11: Cono elıptico.

6.4 Elipsoides, Hiperboloides y Paraboloides

En esta parte definimos nuevas superficies a partir de las ya conocidas,utilizando cambios afines de coordenadas, como la deformacion de losejes cordenados y las traslaciones.

C Dada la esfera unitaria en R3,

x2 + y2 + z2 = 1,

en las coordenadas cartesianas x, y, z, la podemos deformar en un elipsoideen R3,

u2

a2+v2

b2+w2

c2= 1

en las nuevas coordenadas u, v, w, mediante la deformacion de los ejes co-ordenados

x = ua

y = vb

z = wc

,

donde los parametros a, b, c > 0, o bien, mediante las relaciones inversas,

u = axv = byw = cz

lo cual se comprueba con la simple sustitucion

1 = x2 + y2 + z2 =(ua

)2+(vb

)2+(wc

)2=u2

a2+v2

b2+w2

c2.

La figura 6.12 ilustra al elipsoide. B

Page 288: Libro Mate 4

288 Elementos Basicos de Superficies en R3

Mediante procesos analogos de deformacion de los ejes y usando otrascoordenadas1, es posible obtener superficies nuevas a partir de superficiesya conocidas. A continuacion damos ejemplos.

EJEMPLO. (Elipsoide circular). Sea γ la elipse centrada en (0, 0) delplano R2

x,z, definida por la ecuacion

x2

a2+z2

c2= 1, a, c > 0

C Si se hace girar γ alrededor del eje z, al reemplazar x →√x2 + y2

se obtiene la superficie de revolucion elipsoidal dada por la ecuacion

1 =(√x2 + y2)2

a2+z2

c2=x2 + y2

a2+z2

c2=x2

a2+y2

a2+z2

c2

llamada elipsoide circular (vease la figura 6.12).

a

cc

x

y

z

Figura 6.12: Elipsoide circular.

Al hacer una deformacion del eje y el reemplazo de la variable y por

y → ay

b

y al sustituir en la ultima ecuacion se tiene

1 =x2

a2+

(ayb

)2

a2+z2

c2=x2

a2+y2

b2+z2

c2

es decir,x2

a2+y2

b2+z2

c2= 1

que es la ecuacion de un elipsoide con parametros a, b, c (vease la figura6.13). B

1En la seccion 5.4 damos un tratamiento mas completo a este proceso de cambiar

coordenadas en el espacio R3.

Page 289: Libro Mate 4

6.4 Elipsoides, Hiperboloides y Paraboloides 289

a bc

x

y

z

Figura 6.13: Elipsoide.

EJEMPLO. (Hiperboloide de una hoja). Consideremos la hiperbolaen el plano R2

x,z dada por la ecuacion,

x2

a2− z2

c2= 1

donde los parametros a, b > 0.

C Al hacerla girar tal curva alrededor del eje z, reemplazando x →√x2 + y2 se obtiene una superficie denominada hiperboloide circular

de una hoja dado por la relacion,

1 =(√x2 + y2)2

a2− z2

c2=x2 + y2

a2− z2

c2

es decir,

1 =x2

a2+y2

a2− z2

c2

Como cada punto de la hiperbola genera un cırculo al girarla. Esto seilustra en la figura 6.14.

Si se deforma el eje y con el reemplazo

y → ay

b

se obtiene la nueva relacion

1 =x2

a2+

(ayb

)

a2− z2

c2=x2

a2+

a2y2

b2

a2− z2

c2=x2

a2+y2

b2− z2

c2

o equivalentemente,x2

a2+y2

b2− z2

c2= 1

Page 290: Libro Mate 4

290 Elementos Basicos de Superficies en R3

x

y

z

Figura 6.14: Hiperboloide circular de una hoja.

que corresponde a una hiperboloide elıptico de una hoja (vease lafigura 6.15).

Para muestra, la relacion

2x2 +1

2y2 − 3z2 = 1

define un hiperboloide elıptico de una hoja B

EJEMPLO. (Hiperboloide de dos hojas). Si la misma hiperbola delejemplo precedente en el plano R2

x,z con la ecuacion

x2

a2− z2

c2= 1

se hace girar alrededor del eje x, al reemplazar z →√y2 + z2 se obtiene la

superficie de revolucion con ecuacion

1 =x2

a2− (√y2 + z2)2

c2=x2

a2− y2 + z2

c2

es decir,

1 =x2

a2− y2

c2− z2

c2

Page 291: Libro Mate 4

6.4 Elipsoides, Hiperboloides y Paraboloides 291

x

y

z

Figura 6.15: Hiperboloide elıptico de una hoja.

y tal superficie se llamara hiperboloide circular de dos hojas.

Al hacer la deformacion del eje y mediante el cambio coordenado

y → cy

b

se obtiene la nueva ecuacion

1 =x2

a2− y2

b2− z2

c2

que corresponde a un hiperboloide elıptico de dos hojas (vease la figura6.16).

Para muestra, la ecuacion

−x2 − y2 + 1

2z2 = 1

es un hiperboloide elıptico de dos hojas. B

EJEMPLO. (Paraboloide elıptico). Sea la parabola cuadratica en elplano R2

x,z dada por la ecuacion

az = x2

C Si se hace girar alrededor del eje z haciendo el reemplazo canonicox →

√x2 + y2 en la ultima relacion, se obtiene un paraboloide con

ecuacion

az =(√

x2 + y2)2

= x2 + y2

Page 292: Libro Mate 4

292 Elementos Basicos de Superficies en R3

x

y

z

Figura 6.16: Hiperboloide elıptico de dos hojas.

o equivalentemente,

z =x2 + y2

a=x2

a+y2

ao bien,

z =x2

a+y2

allamado paraboloide circular.

Si se deforma el eje y por el cambio coordenado y →√ay√b

se obtiene

nueva la ecuacion

z =x2

a2+

(√ay√b

)2

a=x2

a+

ay2

b

a=x2

a+y2

b

es decir,

z =x2

a+y2

bcon los parametros a, b, con el mismo signo, que representa un paraboloideelıptico (vease la figura 6.17). B

NOTA. Si en la ecuacion obtenida en el ejemplo anterior

z =x2

a+y2

b

Page 293: Libro Mate 4

6.4 Elipsoides, Hiperboloides y Paraboloides 293

x

y

z

aab

Figura 6.17: Paraboloide elıptico.

se tienen signos diferentes para a y b, la superficie se llamara paraboloidehiperbolico, y su grafica se muestra en la figura 6.18. A esta superficie sele conoce tambien como silla de montar.

xy

z

Figura 6.18: Paraboloide hiperbolico.

Observamos que hasta este punto todas nuestras superficies obtenidasmediante la deformacion de los ejes han estado centradas en el origen decoordenadas y todas tienen una descripcion dada por una formula cuadra-tica. En realidad, si se tiene una expresion cuadratica del tipo

Ax2 +By2 + Cz2 +Dx+ Ey + Fz +G = 0

donde no hay terminos cruzados en las variables, 2 siempre es posible iden-

2Si hay terminos cruzados el proceso de identificacion se complica y para ello esnecesario utilizar metodos del Algebra Lineal.

Page 294: Libro Mate 4

294 Elementos Basicos de Superficies en R3

tificarla como una de las superficies de la lista que hemos mencionado. Elproceso para la identificacion involucra una translacion de ejes coorde-nados del origen en R3 a otro punto del espacio.

Si p = (h, k, l) es un punto del espacio R3, entonces al utilizar lascoordenadas (u, v, w) en R3 ligadas a las coordendas cartesianas mediantelas formulas

x = u+ hy = v + kz = w + l

⇐⇒

u = x− hv = y − kw = z − l

conseguimos una translacion del punto origen (0, 0, 0) al punto p = (h, k, l)como lo muestra un calculo simple (de hecho una sustitucion).

Si x = h, y = k, z = l, entonces u = 0, v = 0, w = 0, y reciprocamentesi u = 0, v = 0, w = 0, entonces x = h, y = k, z = l, y como lo muestra lafigura 6.19.

x

k

vu

u

y

v

(x,y)

y

xh

Figura 6.19: Translacion de ejes coordenados.

EJEMPLO. Hacer una translacion de ejes del origen de coordenadas alpunto p = (−1, 3,−2).

C Al utilizar formulas se tiene que las nuevas variables u, v, w en estesistema nuevo son dadas por,

u = x− (−1) = x+ 1v = y − 3 = y − 3

w = z − (−2) = z + 2

⇐⇒

x = u− 1y = v + 3z = w − 2

B

Page 295: Libro Mate 4

6.4 Elipsoides, Hiperboloides y Paraboloides 295

EJEMPLO. Identificar a la superficie espacial dada por la ecuacion

x2 + y2 + z2 − x+ y = 0

C Hacemos un completamiento de terminos para tener trinomios cua-drados perfectos, asociando los semejantes,

0 = x2 + y2 + z2 − x+ y = (x2 − x) + (y2 + y) + z2

de donde,

(x2 − 2

(1

2

)x+

(1

2

)2)

+

(y2 + 2

(1

2

)y +

(1

2

)2)

+ z2 =1

4+

1

4

o (x− 1

2

)2

+

(y +

1

2

)2

+ (z − 0)2 =1

2

Al hacer la translacion de ejes con nuevas coordenadas u, v, w dadas por

u = x− 1/2 = x− 1/2v = y + 1/2 = y − (−1/2)

z = z − 0 = z − 0

tenemos el nuevo origen en el punto (1/2,−1/2, 0) y la ecuacion en estasnuevas coordenadas dada por

u2 + v2 + z2 =1

2

que es una esfera de radio√

12 =

√22

De esta manera, la ecuacion inicial describe a una esfera de radio R =√22 con centro en el punto c =

(12 ,−12 , 0

). B

EJEMPLO. Identificar a la superficie en R3 dada por la ecuacion

4x2 + 4z2 − y2 − 8x+ 8z + 4y + 4 = 0

C Al agrupar terminos obtenemos que

0 = (4x2 − 8x)− (y2 − 4y) + (4z2 + 8z) + 4

= 4(x2 − 2x)− (y2 − 4y) + 4(z2 + 2z) + 4

= 4(x2 − 2x+ 1)− (y2 − 4y + 4) + 4(z2 + 2z + 1) + 4− 4

Page 296: Libro Mate 4

296 Elementos Basicos de Superficies en R3

o bien,4(x− 1)2 − (y + 2)2 + 4(z + 1)2 = 0

Al hacer la translacion de ejes al punto (1,−2,−1) mediante las ecuaciones

u = x− 1v = y + 2w = z + 1

⇐⇒

x = u+ 1y = v − 2z = w − 1

obtenemos la nueva ecuacion en el sistema de coordenadas u, v, w dado por

4u2 − v2 + 4w2 = 0

Ya que la relacion es homogenea de grado 2, se tiene una superficieconica, y al despejar la variable con signo negativo, se tiene

v2 = 4u2 + 4w2

De esta forma, si v = c es una constante arbitraria se obtiene la ecuacionde la base del cono

c2 = 4u2 + 4w2 ⇐⇒( c2

)2= u2 + w2

que es un cırculo de radio R = c/2.

De esta manera, la ecuacion

C 4x2 + 4z2 − y2 + 8x+ 8z + 4y + 4 = 0

define a un cono circular en direccion del eje y con vertice en el punto(1,−2,−1). B

EJEMPLO. Identificar la superficie dada por la ecuacion

x2 − z2 − 4x+ 8z − 2y = 0

C Al completar cuadrados obtenemos

0 = (x2 − 4x)− (z2 − 8z)− 2y = (x2 − 4x+ 4)− (z2 − 8z + 16)− 2y + 12

= (x− 2)2 − (z + 4)2 − 2(y − 6)

de donde,2(y − 6) = (x− 2)2 − (z + 4)2

o bien,

(y − 6) =(x− 2)2

2+

(z + 4)2

−2

Page 297: Libro Mate 4

6.4 Elipsoides, Hiperboloides y Paraboloides 297

Al realizar la translacion de ejes al punto (2, 6,−4) usando las ecuaciones

u = x− 2v = y − 6w = z + 4

⇐⇒

x = u+ 2y = v + 6z = w − 4

se obtiene la ecuacion

v =u2

2+w2

−2que corresponde a un paraboloide hiperbolico.

De esta manera, la ecuacion inicial describe a un paraboloide hiperbolicocentrado en el punto (2, 6,−4). B

EJEMPLO. Analizar la ecuacion cuadratica

9x2 + 4y2 − 36z2 − 18x− 8y − 72z + 13 = 0

e identificar a la superficie que define.

C De la completacion de cuadrados en tal ecuacion se obtiene

0 = (9x2 − 18x) + (4y2 + 8y)− (36z2 + 72z) + 13

= 9(x2 − 2x) + 4(y2 + 2y)− 36(z2 + 2z) + 13

= 9(x2 − 2x+ 1) + 4(y2 + 2y + 1)− 36(z2 + 2z + 1) + 13− 9− 4 + 36

es decir,−36 = 9(x− 1)2 + 4(y + 1)2 − 36(z + 1)2

o bien,

1 =−936

(x− 1)2 − 4

36(y + 1)2 + (z + 1)2

lo que equivale a

1 = (z + 1)2 − (x− 1)2

4− (y + 1)2

9

al efectuar la translacion de ejes al punto (1,−1 − 1) mediante al cambiode coordenadas

u = x− 1v = y + 1w = z + 1

⇐⇒

x = u+ 1y = v − 1z = w − 1

obtenemos una nueva ecuacion

1 = w2 − u2

4− v2

9

que corresponde a un hiperboloide elıptico de dos hojas.

De esta manera, la ecuacion inicial define a un hiperboloide elıptico dedos hojas concentrado en el punto (1,−1,−1). B

Page 298: Libro Mate 4

298 Elementos Basicos de Superficies en R3

Ejercicios.

1. Dar las coordendas del centro y dar el radio de la esfera definida por laecuacion

a. x2 + y2 + z2 − y + 2z + 1 = 0b. x2 + y2 + z2 = 4z − 3c. 2x2 + 2y2 + 2z2 = 3z − 4y − 2

2. Dado el punto p = (0,−1, 2) decir si esta dentro, fuera o sobre cada unade las esferas dadas en los incisos del ejercicio 1.

3. Decir que superficies espaciales definen las siguientes ecuaciones

a. y2 = 2xb. z2 = xzc. y3 = 4x2

d. x2 + y2 = 4e. x2 − y2 = 1f. x2 − z2 = 0

4. Dar la ecuacion del cono cuyo vertice es el punto (0, 0,−1) y cuya basees la curva

a. elıptica x2

4 + y2

9 = 1b. circular 4x2 + 4y2 = 1

5. Calcular la ecuacion de la superficie S obtenida al hacer girar

a. La recta x+ y = 1 en el plano R2x,y alrededor del eje x.

b. La parabola y = z2 en el plano R2y,z alrededor del eje y.

c. La hiperbola xz = 1 en el plano R2x,z alrededor del eje z.

6. a. Dar las ecuaciones de las lıneas de interseccion de la superficie dadapor z = y2 − x2 con los planos z = 1, x = 1, y = 1, respectivamente.b. Dar la ecuacion de la lınea de interseccion de las superficies

z = 1− x2 − y2z = x2 + y2

7. Identificar a las siguientes superficies mediante una translacion de ejes.

a. x2 + z2 − 4x− 4z + 4 = 0b. x2 + y2 − z2 − 2y + 2z = 0c. x2 + 2y2 + 2z2 − 4y + 4z + 4 = 0d. 4x2 + y2 − z2 − 24x− 4y + 2z + 35 = 0e. x2 + y2 − z2 − 2x− 2y + 2z + 2 = 0f. x2 + y2 − 6x+ 6y − 4z + 18 = 0g. 9x− z2 − 18x− 18y − 6z = 0

Page 299: Libro Mate 4

Capıtulo 7

Orientacion de curvas y

poligonales

7.1 Orientacion.

En este capıtulo introducimos los conceptos de orientacion de una curvasuave y el de curva poligonal (curva suave por pedazos), que resulta degran utilidad para las aplicaciones en las ciencias naturales.

Dada una curva Γ ⊂ R3 parametrizada por la funcion

γ : [a, b]→ R3

de tal forma que ||γ(t)|| 6= 0, diremos que la orientacion de Γ es del puntoγ(a) ∈ Γ al punto γ(b) ∈ Γ, y que esta inducida por la orientacion delintervalo orientado [a, b]+ (vease la figura 7.1).

Distinguimos a la curva orientada de esta forma por Γ+. Naturalmente,esto hace que Γ+ este orientada por el vector tangente γ(t).

Supongamos que el parametro t es una funcion de un nuevo parametroτ ∈ [c, d], esto es t = t(τ), y que es una biyeccion diferenciable

t : [c, d]→ [a, b]

Entonces diremos que Γ se puede reparametrizar por el parametro τ en elintervalo [c, d] por la composicion

γ(τ) = γ(t(τ))

Dicho de otra forma, Γ esta parametrizada por la funcion γ : [c, d]→ R3.La funcion γ se dice ser una reparametrizacion de Γ.

Page 300: Libro Mate 4

300 Orientacion de curvas y poligonales

x

0

z

y

Figura 7.1: Helice unitaria de paso 2π

EJEMPLO. Sea Γ la primera espira de la helice unitaria de paso 2π, conla parametrizacion

γ(t) = (cos t, sen t, t)

en el intervalo [0, 2π]. Esto orienta a Γ+ del punto (1, 0, 0) al punto(1, 0, 2π).

C Sea ahora la reparametrizacion de Γ inducida por el cambio deparametro

t = 2π − τdefinida para τ ∈ [0, 2π],

γ(τ) = (cos t(2π − τ), sen (2π − τ), 2π − τ)

En este caso γ invierte la orientacion de Γ pues γ(0) = (1, 0, 2π) yγ(2π) = (1, 0, 0).

Notamos que la funcion biyectiva que cambia los parametros

t : [0, 2π]→ [0, 2π], t = 2π − τ

es tal que dtdτ = −1 < 0. La figura 7.1 ilustra esta situacion. B

La ultima observacion en el ejemplo anterior no es extrana. De hecho, elsiguiente resultado nos impone condiciones sobre la derivada de una funcionque cambia los parametros, para que en la reparametrizacion se conservela orientacion.

LEMA 7.1 Sea γ : [a, b] → R3 una parametrizacion de la curva Γ queinduce una orientacion Γ+. Si t ∈ [a, b] es el parametro de γ y existe un

Page 301: Libro Mate 4

7.1 Orientacion. 301

cambio de parametro t = t(τ) definido en el intervalo [c, d], entonces lareparametrizacion dada por

γ(τ) = γ(t(τ))

es tal que,

a. conserva la orientacion de Γ, si dtdτ > 0 en todo el intervalo [c, d].

b. cambia la orientacion de Γ, si dtdτ < 0 en todo el intervalo [c, d].

C Por la regla de la cadena, se tiene que

d

dτγ(τ) = γ(t)

dt

lo que nos indica que los vectores dtdτ γ y γ son paralelos. La cantidad dt

dτindica el sentido de cada uno y, por lo tanto, la orientacion . B

A una curva Γ que es la union (+) de las curvas suaves Γ1,Γ2, · · · ,Γk sele llamara una curva poligonal orientada, o curva suave por pedazosorientada (vease la figura 7.2 a.)

La definimos por simplicidad por

Γ+ = Γ+1 + Γ+

2 + · · ·+ Γ+k

imponiendo la condicion de que la curva Γ+j inicia donde termina Γ+

j−1.

EJEMPLO. Sea Γ la union (+) de los segmentos de las parabolas y1 =x2, y2 = 2 − x2 comprendidos entre sus intersecciones en los puntos (1, 1)y (−1, 1).

C Si Γ1 es el segmento de la parabola y = x2 en el intervalo [−1, 1] yΓ2 es el segmento de la parabola y = 2−x2 en el intervalo [−1, 1], entoncesΓ+ = Γ+

1 +Γ+2 es tal que la orientacion inicia en el punto (−1, 1), recorre por

Γ+1 hasta (1, 1) y luego recorre por Γ+

2 hasta (−1, 1) siguiendo la orientacioninvertida del intervalo [−1, 1] que definimos por [−1, 1]−. La curva Γ+ esen total una curva cerrada iniciandose en el punto (−1, 1) y cerrando sucircuito en el mismo punto (vease la figura 7.2 b.)

Damos una parametrizacion de Γ+ = Γ+1 + Γ2

2 como sigue.

Γ1 es la curva definida por y = x2 si x ∈ [−1, 1]+, de donde, poniendox = t y y = t2 se obtiene la curva γ1(t) = (t, t2) con t ∈ [−1, 1]+ que daorientacion a Γ+

1 .Para parametrizar a Γ2 con la orientacion que define a la poligonal Γ+,

siendo el segmento inmediato de Γ+1 , consideramos su definicion. Γ2 es la

curva y = 2 − x2 con x ∈ [−1, 1], lo que indica que Γ+2 esta orientada por

el intervalo [−1, 1]−. Usemos el cambio lineal de intervalos

x : [1, 2]+ → [−1, 1]− = [1,−1]+

Page 302: Libro Mate 4

302 Orientacion de curvas y poligonales

que lleva 1→ 1, 2→ −1 definido por,

x = x(t) = −2(t− 1) + 1 = 3− 2t.

Ya que los puntos sobre la curva Γ2 son de la forma (x, 2−x2), entoncesγ2(t) = (3− 2t, 2− (3− 2t)2) con t ∈ [1, 2] parametriza a Γ+

2 . Por lo tanto,la curva γ = γ(t) que parametriza a todo el circuito con la orientacionseguida de Γ+ = Γ+

1 + Γ+2 es

γ(t) =

(t, t2) − 1 ≤ t ≤ 1

(3− 2t, 2− (3− 2t)2) 1 ≤ t ≤ 2

donde γ : [−1, 2]→ R2 es regular por pedazos B

ΓΓ

Γ

Γ

1

2

a. b.p

q

y=

y=2-x

x

y

(-1,1) (1,1)

[ [-1 1

2

22

1 x

Figura 7.2: a. Poligonal b. Curva Γ cerrada orientada.

El ejemplo anterior nos da una manera de orientar a una region planaΩ que tiene como frontera a una curva cerrada poligonal Γ. Para orientara tal region, parametrizamos a Γ de tal forma que recorra el circuito ensentido contrario a las manecillas del reloj (regla de la mano derecha). Esto es equivalente a considerar el marco dado por la pareja ordenadade vectores n(t), γ(t), donde n(t) es un vector normal a γ(t) y γ(t) esel vector tangente, satisfaciendo la relacion de orientacion

0 < det

(n(t)γ(t)

)= −det

(γ(t)n(t)

)

No es difıcil ver que esto se logra al orientar la curva cerrada Γ+ en con-tra de las manecillas del reloj y tomar sus vectores normales n(t) apuntandohacia afuera de Ω (vease la figura 7.3). Esta es una manera de orientar auna region Ω provista con una frontera conformada por una poligonal ce-rrada. La definiremos por Ω+.

Page 303: Libro Mate 4

7.2 Longitud de arco y angulo entre curvas 303

Ω+

n

n

γ

γ

Figura 7.3: Orientacion de una region plana Ω+.

7.2 Longitud de arco y angulo entre curvas

Ahora se exponen los conceptos de longitud de arco de curva suave y elde angulo entre dos curvas regulares.

Dada una curva regular Γ ⊂ R3 , parametrizada por

γ : [a, b]→ Γ,

si se toma p ∈ Γ, hasta un infinitesimo de longitud ||dγ|| en tal punto de lacurva, este se descompone infinitesimalmente como

=dxdx

+dy

dy

+dz

||dγ||||dγ||

||dγ||

p

2 2 2 2

Figura 7.4: Longitud de arco de una curva.

||dγ||2 = dx2 + dy2 + dz2,

donde dx, dy, dz son las componentes infinitesimales del infinitesimo delarco (vectorial) dγ (vease la figura 7.4).

Page 304: Libro Mate 4

304 Orientacion de curvas y poligonales

De allı que

||dγ|| =√dx2 + dy2 + dz2

De esta forma, si `(Γ) define la longitud de Γ entonces, esta se calculapor

`(Γ) =

Γ

||dγ|| =∫

Γ

√dx2 + dy2 + dz2

Por lo tanto, si en coordenadas cartesianas γ = γ(t) parametriza a Γ en elintervalo [a, b],

γ(t) = (x(t), y(t), z(t)),

entonces

dx = x(t) dtdy = y(t) dtdz = z(t) dt,

t ∈ [a, b]

y de esta manera, la longitud de Γ se calcula por

`(Γ) =

Γ

√dx2 + dy2 + dz2 =

[a,b]

√x(t)2dt2 + y(t)2dt2 + z(t)2dt2

=

∫ b

a

√x(t)2 + y(t)2 + z(t)2dt.

La igualdad

x(t)2 + y(t)2 + z(t)2 = ||v(t)||2,hace que la siguiente definicion sea natural.

DEFINICION. La longitud de la curva regular parametrizada Γ ⊂ R3

se define por

`(Γ) =

∫ b

a

√< v(t), v(t) >dt =

∫ b

a

||v(t)||dt,

donde v(t) = γ(t) es el vector velocidad tangente a la curva Γ en el puntoγ(t).

El siguiente ejemplo ilustra esta definicion que se ha heredado directa-mente de los resultados basicos del calculo.

EJEMPLO. Sea el subconjunto del plano

S1R = (x, y) ∈ R2|x2 + y2 = R

identificado como el cırculo de radio R y centro en (0, 0).

Page 305: Libro Mate 4

7.2 Longitud de arco y angulo entre curvas 305

C Una parametrizacion que hace de S1R una curva regular, esta dada

por el sistema

γ(t) :

x = R cos ty = R sent

, t ∈ [0, 2π]

De la definicion, la longitud de S1R se calcula por

` = `(S1R) =

∫ 2π

0

√R2 sen2t+R2 cos2 t dt

=

∫ 2π

0

√R2(sen2t+ cos2 t)dt =

∫ 2π

0

Rdt = 2πR. B

EJEMPLO. Sea Γ ⊂ R3 la helice contenida en el cilindro de radio 4 ypaso de altura h = 4π.

C Ya se vio en el Capıtulo 3, que las ecuaciones que definen parametri-camente a Γ son

x = 4 cos ty = 4 sen tz = 2t

lo que implica que,

||v(t)||2 = x2 + y2 + z2 = 16sen2t+ 16 cos2 t+ 4 = 20,

debido a que v(t) = (−4 sen t, 4 cos t, 2).Por lo tanto, en el intervalo [0, 2π], la longitud de esta helice, hasta el

primer paso es

` =

∫ 2π

0

||v(t)||dt =∫ 2π

0

√20dt = 2

√20π B

El siguiente resultado nos asegura la independencia de la longitud deuna curva respecto a una parametrizacion. Esto es, la definicion de longitudesta bien definida, pues no depende de la parametrizacion escogida de lacurva.

LEMA 7.2 Sea Γ una curva regular parametrizada por

γ : [a, b]→ R

donde γ = γ(t), t ∈ [a, b]. Si γ : [c, d] → Γ, con γ = γ(τ) es otraparametrizacion tal que el parametro temporal t = t(τ) es una funciondel parametro τ ∈ [c, d],

t : [c, d]→ [a, b],

Page 306: Libro Mate 4

306 Orientacion de curvas y poligonales

con dtdτ > 0, entonces las longitudes del arco en las parametrizaciones res-

pectivas son las mismas, esto es,

` =

∫ b

a

||γ(t)||dt =∫ d

c

|| ˙γ(τ)||dτ = ¯

C Defınase

γ(τ) = (x1(t(τ)), x2(t(τ)), x3(t(τ)) = (y1(τ), y2(τ), y3(τ)),

y sea el vector velocidad

˙γ = w(τ) =

(dy1

dτ,dy2

dτ,dy3

), c ≤ τ ≤ d.

Entonces, por definicion,

˜=∫ d

c

||w(τ)||dτ.

Por otro lado, por La regla de la cadena,

||w(τ)|| =

√√√√3∑

i=1

(dyi

)2

=

√√√√3∑

i=1

(dxi

dt

dt

)2

=

∣∣∣∣dt

∣∣∣∣

√√√√3∑

i=1

(dxi

dt

)2

=

∣∣∣∣dt

∣∣∣∣ ||v(t)||,

De esta forma, como dt/dτ > 0, por el teorema de cambio de variablese tiene que

˜=∫ d

c

||w(τ)||dτ =

∫ d

c

||v(t(τ))|| dtdτ

dτ =

∫ b

a

||v(t)|| dt = `

lo que concluye la demostracion. B

Finalizamos con el concepto de angulo entre dos curvas.

Consideremos ahora dos curvas regulares suaves Γ1 y Γ2 tal que estanparametrizadas por

γ1 : [a, b]→ R3

γ2 : [a, b]→ R3

Page 307: Libro Mate 4

7.2 Longitud de arco y angulo entre curvas 307

respectivamente. Supongase ademas que en las imagenes del punto t0 seintersectan las curvas Γ1 y Γ2, esto es,

γ1(t0) = γ2(t0)

Si tales curvas estan definidas en coordenadas x, y, z por

γ1(t) = (x1(t), y2(t), z1(t))γ2(t) = (x2(t), y2(t), z2(t))

y son tales que sus vectores tangentes en el punto comun γ1(t0) = γ2(t0)son

ξ =

(dx1dt

,dy1dt,dz1dt

)|t=t0 ,

η =

(dx2dt

,dy2dt,dz2dt

)|t=t0 ,

entonces es natural definir el angulo formado por esas curvas en γ1(t0) =γ2(t0) como el angulo formado por sus vectores tangentes. Esto es, si talangulo es θ, entonces

cos θ =< ξ, η >

||ξ||||η|| .

La figura 7.5 ilustra esta discusion.

ηθ ξ

γ1

γ2

Figura 7.5: Angulo entre dos curvas.

EJEMPLO. Sean las curvas Γ1 y Γ2 definidas por

Γ1 : γ1(t) = (t, t2) con t ∈ [0, 4]

Γ2 : γ2(t) = (t, t3) con t ∈ [0, 4]

Page 308: Libro Mate 4

308 Orientacion de curvas y poligonales

C Es claro que γ1(1) = γ2(1) = (1, 1) es el punto de interseccion de lascurvas Γ1 y Γ2. Si nombramos a los vectores tangentes respectivos por

ξ = γ1(1) = (1, 2)

n = γ2(1) = (1, 3)

entonces el angulo formado en (1, 1) por las curvas Γ1 y Γ2 es

θ = arccos< ξ, n >

||ξ|| ||n|| = arccos

(< (1, 2), (1, 3) >√

5√10

)

= arccos

(7√50

)= arccos

(7√2

10

)B

7.3 Ejercicios

1. De una orientacion a las curvas definidas en los incisos a, b, c y g en elejercicio 1. del capıtulo 4.

2. a. Calcule la longitud de arco de 0 a π en las curvas de los incisos delejercicio 1.

b. Calcular el angulo entre las curvas dadas en los puntos donde se inter-sectan.

γ1(t) = (2 cos t, 2 sen t), γ2(t) = (t, t2)

γ1(t) = (et cos t, et sen t), γ2(t) = (t, t)

γ1(t) = (t2, t3), γ2(t) = (t3, t2).

Indicacion: calcule primero los puntos de interseccion.

Page 309: Libro Mate 4

Capıtulo 8

Lımites y puntos

singulares

En este capıtulo discutimos someramente el concepto de lımite de unafuncion real de variable vectorial en un punto de acumulacion del do-minio. Los temas son tratados de igual forma que en el capıtulo 2 deReyes(1996).

8.1 Puntos de acumulacion y lımites

Sea Ω ⊂ Rn una region del espacio euclidiano, de dimension n, dondeconsideramos apenas n = 2, 3.

DEFINICION. El punto p ∈ R3 se dira que es un punto de acumu-lacion para la region Ω, si toda bola Bε(p) intersecta no vacıamente a Ω.Esto es, para cada bola de radio ε > 0 con centro en p se encuentra unpunto q ∈ Ω contenido en tal bola.

Si p no es de acumulacion para Ω, se dira un punto aislado (vease lafigura 8.1).

En terminos menos precisos, un punto de acumulacion p de la regionΩ es aquel que esta tan proximo de Ω como se desee. El punto p nonecesariamente esta contenido en Ω, pero se puede aproximar a el porpuntos contenidos en Ω.

EJEMPLO. Sea Ω = (a, b) ⊂ R1, es claro que p = a es un punto deacumulacion de Ω. Todo punto q ∈ (a, b) es de acumulacion.

EJEMPLO. Sea Ω = R2 − (0, 0), entonces p(0, 0) es un punto de acu-mulacion de Ω. Tambien todo punto q 6= (0, 0) contenido en Ω es de

Page 310: Libro Mate 4

310 Lımites y puntos singulares

acumulacion para Ω.

EJEMPLO. Sea la region espacial

Ω = (x, y, z)|x+ y + z < 1

C Es claro que el punto frontera p = (0, 0, 1) es un punto de acumulacionde Ω. Por otro lado, el punto q = (1, 1, 1) no pertenece a Ω y ademas es unpunto aislado de Ω. B

acumulación acumulación

aislado

Figura 8.1: Puntos de acumulacion y aislados.

Definamos ahora el concepto de lımite de una funcion real de variablevectorial en un punto de acumulacion de su dominio, en terminos de loslımites de funciones reales de variable real.

Sea f : Ω → R una funcion real de variable vectorial, y sea p ∈ R3 unpunto de acumulacion de Ω. Entendamos por q = (x, y, z) el vector variabley entendemos que el punto q ∈ Ω se aproxima al punto p por la notacionlimq→p.

Ademas, si p = (p1, p2, p3) son las coordenadas, el numero real ||q − p||se entiende como

||q − p|| =√

(x− p1)2 + (y − p2)2 + (z − p3)2.

DEFINICION. Se dice que la funcion f(x, y, z) tiene lımite L en el puntode acumulacion p de Ω, definido por

limq→p

f(x, y, z) = L

si y solo sı, se cumple que existe el lımite real, de variable real

lim||q−p||→0

(f(x, y, z)− L) = 0

Ya que conocemos del calculo diferencial basico, el calculo de los lımitesde variable real, ası como su existencia, se tiene la siguiente lista de resul-tados para los lımites en variables vectoriales.

Page 311: Libro Mate 4

8.1 Puntos de acumulacion y lımites 311

LEMA 8.1 El lımite de la funcion real de variable vectorial,

limq→p

f(x, y, z) = L

cuando existe es unico.

TEOREMA 8.1 (Aritmetica de lımites) Sean f, g : Ω → R dos fun-ciones reales de variable vectorial y p ∈ R3 un punto de acumulacion de laregion Ω tales que,

limq→p

f(x, y, z) = L1, limq→p

g(x, y, z) = L2

entonces

a. limq→p(f ± g)(x, y, z) = limq→p f(x, y, z)± limq→p g(x, y, z) = L1 ± L2

b. limq→p(fg)(x, y, z) = limq→p f(x, y, z) limq→p g(x, y, z) = L1L2

c. Cuando L2 6= 0 se tiene ademas que

limq→p

(f

g

)(x, y, z) =

lim f(x, y, z)

lim g(x, y, z)=L1

L2

Estos resultados nos garantizan el calculo de lımites de funciones enpuntos de acumulacion que estan contenidos en el dominio. A continuaciondamos un par de ejemplos, donde se aplica apenas una simple sustitucion.

EJEMPLO. Sea la funcion

f(x, y, z) = ln(1− x− y − z) + x2 + y2 + z2 + 1

C Es claro que el punto p = (0, 0, 0) esta contenido en el dominio Ω def y es un punto de acumulacion de Ω. Por el teorema anterior se tiene que

lim(x,y,z)→(0,0,0)

f(x, y, z) = lim(x,y,z)→(0,0,0)

[ln(1−x− y− z)+x2+ y2z2+1] = 1

que se obtiene de una sustitucion simple. B

EJEMPLO. Calcular el lımite,

lim(x,y)→(1,1)

ex+y

C Una sustitucion directa nos lleva a que

lim(x,y)→(1,1)

ex+y = e1+1 = e2 B

El problema del calculo de lımites de variable vectorial se complicacuando el punto de acumulacion p no esta en el dominio natural de lafuncion.

Page 312: Libro Mate 4

312 Lımites y puntos singulares

8.2 Puntos singulares

Un caso interesante de un punto de acumulacion es aquel cuando no estacontenido en el dominio de una funcion por generar una indeterminacion almomento de tratar de evaluarlo. Si en el intento de evaluacion genera uncociente por cero se dice que tal punto es una singularidad algebraicade la funcion (vease el capıtulo 2 de Reyes, 1996).

EJEMPLO. Consideremos nuevamente nuestra vieja conocida funcion

f(x, y) =xy

x2 + y2

analizada en el capıtulo 4 y mostrada en la figura 4.13.

C Su dominio es la region Ω = R2 − (0, 0), siendo el punto p = (0, 0)de acumulacion de Ω.

a. Tomemos una aproximacion en Ω a p a traves el eje x, es decir mediantelos puntos de la forma (x, 0), y en este caso se tiene

lim(x,y)→p

f(x, y) = lim(x,0)→(0,0)

xy

x2 + y2= lim

x→0

0

x2= lim

x→00 = 0

b. Consideremos ahora una aproximacion en Ω a p a traves del eje y, esdecir, mediante los puntos de la forma (0, y), y en este caso se tiene

lim(x,y)→(0,0)

f(x, y) = lim(0,y)→(0,0)

xy

x2 + y2= lim

y→0

0

y2= lim

y→00 = 0

c. Si hacemos la aproximacion en Ω al punto p por la recta identidad y = xse obtiene

lim(x,y)→(0,0)

f(x, y) = lim(x,x)→(0,0)

xy

x2 + y2= lim

x→0

x2

x2 + x2= lim

x→0

x2

2x2=

1

2

De esta manera, hemos encontrado que existen trayectorias que seaproximan al punto p = (0, 0) y sus lımites correspondientes no son iguales.Ya que el lımite tiene que ser unico por cualquier forma de aproximacion,se concluye que el lımite

lim(x,y)→(0,0)

xy

x2 + y2

no existe. B

Una forma mas general de estudiar un lımite como el del ejemplo ante-rior es usar un cambio de coordenadas . Esto es, utilizar otras variables

Page 313: Libro Mate 4

8.2 Puntos singulares 313

que identifiquen una posible dependencia del lımite en una direccion o deuna curva.

EJEMPLO. Sea nuevamente el lımite

lim(x,y)→(0,0)

xy

x2 + y2

C Usemos el siguiente cambio de coordenadas polares

x = r cos θy = r sen θ

Entonces el cociente dado se expresa

xy

x2 + y2=r2 cos θ sen θ

r2= cos θ sen θ

De donde, en virtud de que (x, y)→ (0, 0)⇐⇒ r → 0, se tiene que

lim(x,y)→(0,0)

xy

x2 + y2= lim

r→0cos θ sen θ = cos θ sen θ

que depende del angulo θ con el cual se aproximen las variables (x, y) alorigen.

Por ejemplo, sobre la recta y = 0 (eje x) el angulo es θ = 0 lo queimplica que sen θ = 0 y, por lo tanto, el lımite buscado sobre esa recta escero.

Analogamente, sobre la recta x = 0 (eje y) el angulo es θ = π2 , lo que

implica que cos θ = 0 y, por lo tanto, el lımite buscado sobre tal recta esigualmente cero.

En el caso de calcular sobre la recta y = x, el angulo es θ = π/4 y, por

lo tanto, cosπ/4 sen π/4 =√22 .√22 = 2

4 = 1/2 que es el lımite calculadoanteriormente. B

EJEMPLO. Calcular el lımite

lim(x,y)→(0,0)

x2 + y2√x2 + y2 + 1− 1

C Al usar el cambio de coordenadas (polares)

x = r cos θy = r sen θ

Page 314: Libro Mate 4

314 Lımites y puntos singulares

se tiene que x2 + y2 = r2, de donde

x2 + y2√x2 + y2 + 1− 1

=r2√

r2 + 1− 1

Ya que (x, y)→ (0, 0)⇐⇒ r → 0 se tiene que,

lim(x,y)→(0,0)

x2 + y2√x2 + y2 + 1− 1

= limr→0

r2√r2 + 1− 1

= limr→0

r2(√r2 + 1 + 1

)(√r2 + 1− 1

) (√r2 + 1 + 1

) = limr→0

r2(√r2 + 1 + 1

)

(r2 + 1)− 1

= limr→0

r2(√r2 + 1 + 1

)

r2= lim

r→0

(√r2 + 1 + 1

)= 2

Por lo tanto,

lim(x,y)→(0,0)

x2 + y2√x2 + y2 + 1− 1

= 2 B

EJEMPLO. Calcular el lımite

lim(x,y)→(0,0)

(x+ y)2

x2 + y2

C Nuevamente, usando el cambio de coordenadas anterior,

x = r cos θ, y = sen θ

se tiene que

(x+ y)2

x2 + y2=

(r cos θ + r sen θ)2

r2=r2(cos θ + sen θ)2

r2= (cos θ + sen θ)2

que depende de la variable θ.Si se toma por ejemplo θ = 0 (eje x) se tiene que,

lim(x,y)→(0,0)

(x+ y)2

x2 + y2= lim

r→0(cos θ + sen θ)2 = (cos 0 + sen 0)2 = 1

Por otro lado, si se toma θ = π/4 (la recta y = x) se tiene que,

lim(x,y)→(0,0)

(x+ y)

x2 + y2= lim

r→0(cosπ/4+senπ/4) =

(√2

2+

√2

2

)2

= (√2)2 = 2,

lo que nos dice que tal lımite no existe. B

Page 315: Libro Mate 4

8.3 Continuidad 315

8.3 Continuidad

Ahora extendemos el concepto de continuidad que conocemos para fun-ciones reales de variable real, para funciones reales de variable vectorial.

DEFINICION. Sea f : Ω ⊂ R3 → R una funcion y sea p ∈ Ω un puntoarbitrario del dominio. Decimos que la funcion f es continua en el puntop si

a. p es un punto aislado de Ω.

b. cuando p es punto de acumulacion de Ω, entonces

lim(x,y,z)→p

f(x, y, z) = f(p)

Si la funcion f es continua en cada uno de los puntos de su dominio sedira simplemente que f es continua.

Del teorema sobre la aritmetica de lımites se tiene que la suma (y di-ferencia), el producto y el cociente de funciones continuas es una funcioncontinua.

Mas aun, en todas las funciones vectoriales donde intervengan las fun-ciones clasicas: polinomios, exponenciales, trigonometricos, etc, con variasvariables independientes, se tendran funciones continuas.

EJEMPLO. A continuacion todas las funciones que se mencionan soncontinuas (redundante decir que en sus dominios naturales).

a. f(x, y) = xx+y2

b. f(x, y) = arcsen (x2 + y2)

c. f(x, y, z) = x+y−zx2+y2−z2

d. f(x, y, z) = ex+y2

sen(1z

)

e. f(x, y) = 8x2y2+z2

√ln z+lnx

+ ecos(xyz)

Como es de dominio general, un problema interesante es aquel cuandouna funcion con una singularidad p precisa de ser extendida continuamenteen tal punto. Un resultado sobre la extension continua es el siguiente.

TEOREMA 8.2 Si f es una funcion continua en la region Ω ⊂ R3 y pes una singularidad de f , para que f tenga una extension continua F en eldominio D = Ω ∪ p es necesario y suficiente que

lim(x,y,z)→p

f(x, y, z) = L

exista.

Page 316: Libro Mate 4

316 Lımites y puntos singulares

C En este caso, la extension continua de f en p esta dada por la funcion

F (x, y, z) =

f(x, y, z) si (x, y, z) ∈ Ω

L si (x, y, z) = pB

A continuacion ilustramos el teorema 8.2 con un ejemplo.

EJEMPLO. Considerese la funcion

f(x, y) =x3y2

x2 + y2

¿Se puede extender continuamente la funcion en el punto singular p =(0, 0)?

C Ciertamente el dominio de la funcion f es Ω = R2 − (0, 0), siendop = (0, 0) un punto singular de f .

De manera analoga al caso de una sola variable, calculamos el lımite

lim(x,y)→(0,0)

f(x, y) = lim(x,y)→(0,0)

x3y2

x2 + y2

Usando el cambio de variables mencionado anteriormente,

x = r cos θy = r sen θ

se tiene que

x3y2

x2 + y2=r3 cos3 θ r2 sen2θ

r2= r3 cos3 sen2 θ.

De esta manera,

lim(x,y)→(0,0)

f(x, y) = lim(x,y)→(0,0)

x3y2

x2 + y2= lim

r→0r3 cos3 θ sen2θ = 0

Por lo tanto, la extension continua de la funcion f en el punto esta dadapor la nueva funcion,

F (x, y) =

x3y2

x2+y2 (x, y) 6= (0, 0)

0 (x, y) = (0, 0)B

Un resultado importante de la continuidad de una funcion que es deinteres en las aplicaciones en el siguiente

Page 317: Libro Mate 4

8.3 Continuidad 317

TEOREMA 8.3 (del valor intermedio). Si f : Ω→ R es una funcioncontinua definida en una region (conexa) y para los puntos p, q ∈ Ω ⊂ R3

se tiene que f(p) < f(q), entonces para todo valor c ∈ [f(p), f(q)] existe unpunto r ∈ Ω, tal que f(r) = c.

C Sea γ : [0, 1] → Ω una curva continua tal que una a los puntos p yq ∈ Ω, es decir, tal que γ(0) = p y γ(1) = q.

Consideremos ahora la composicion real de variable real,

g = f γ : [0, 1]→ Ω→ R

dada porg(t) = (f γ)(t) = f(γ(t))

Entonces, es facil ver que g es una funcion real de variable real continua,tal que g(0) = f(p), g(1) = f(q). Por el teorema del valor intermedio parafunciones continuas reales de variable real, para c ∈ [f(p), f(q)] existe unargumento t0 ∈ [0, 1] tal que g(t0) = c. Defınase r = γ(t0), entonces setiene que f(r) = f(γ(t0)) = g(t0) = c, lo que termina la prueba. B

Ejercicios

1. Calcular los siguientes lımites.

a. lim(x,y)→(1,2)(4x+ 6y2)

b. lim(x,y)→(−1,1)x√y−x

c. lim(x,y)→(1,0) =arcsen (y/x)

1+xy

d. lim(x,y)→(2,2)xy

y2+x2

e. lim(x,y)→(0,0)exy

4+xy

2. Analizar las siguientes funciones en el punto singular situado en el origen.¿En cuales singularidades se puede extender continuamente la funcion?

a. f1(x, y) =y4−x4

x2+y2

b. f2(x, y) =4x2yx2+y2

c. f3(x, y) =3x2y

1+x4+2y2

d. f4(x, y) =sen (xy)x2+y2

e. f5(x, y) =y2+xy−2x2

y−x

f. f6(x, y) =ex−ey

e−x−e−y

Page 318: Libro Mate 4

318 Lımites y puntos singulares

g. f7(x, y) = (x+ y)sen 1x

h. f8(x, y) = (x+ y) sen 1x+y

Page 319: Libro Mate 4

Capıtulo 9

Valores extremos de

funciones R2 → R

En este capıtulo hacemos el analisis local de una funcion de clase Cr alrede-dor de un punto p, para el caso en que la funcion esta definida en una regionΩ del plano R2. Los resultados aquı obtenidos se generalizan para mas va-riables y damos ejemplos de estas generalizaciones.

9.1 Plano tangente

En esta seccion introducimos el concepto de espacio tangente en un puntode un conjunto de nivel de una funcion real de variable vectorial, medianteel uso del vector gradiente.

Consideremos el caso Rn = R3, y sean, f : Ω ⊂ R3 → R una funcionsuave, c un valor arbitrario en R y la superficie de nivel c de f ,

S = f−1(c) = (x, y, z) ∈ Ω| f(x, y, z) = c

Si γ : (a, b) → Ω es una curva tal que γ(t) ∈ S, entonces para todot ∈ (a, b) se cumple f(γ(t)) = c.

C Al derivar cada lado de la igualdad respecto a t se tiene

d

dt(f γ)(t) = 0

y por La regla de la cadena, en todo el intervalo (a, b), se cumple la igualdad

⟨∇f(γ(t), γ(t)

⟩= 0

Page 320: Libro Mate 4

320 Valores extremos de funciones R2 → R

Tomemos un punto arbitrario q ∈ S y una curva γ tal que γ(0) = q.Entonces γ(0) es un vector tangente a γ en q.

De esto, se tiene que

0 =⟨∇fγ(t), γ(t)

⟩|t=0 = 〈∇fq, γ(0)〉

Concluimos entonces que el vector gradiente ∇fq es ortogonal al vectortangente γ(0).

Resumiendo, dado un punto q ∈ S y una curva γ(t) ∈ S tal que γ(0) = qse tiene que el gradiente de f en q es ortogonal al vector tangente γ(0) = v.Como la curva γ(t) pasando por el punto q es arbitraria, entonces se puederealizar la siguiente definicion.

p

põfÑ

f

-1(c)

c

f

Figura 9.1: Plano tangente a una superficie de nivel.

DEFINICION. Definimos el plano tangente TqS a la superficie de nivelS en el punto q, como el plano pasando por q ortogonal al vector ∇fq, y lodefinimos por TqS (vease la figura 9.1).

Hemos supuesto, en la definicion dada, que necesariamente ∇fq 6=(0, 0, 0).

EJEMPLO. Calcular el plano tangente a la esfera x2 + y2 + z2 = 3 en elpunto q = (1, 1, 1).

C La relacionx2 + y2 + z2 = 3

implica quex2 + y2 + z3 − 3 = 0

Sea f : R3 → R la funcion definida por

f(x, y, z) = x2 + y2 + z2 − 3

Page 321: Libro Mate 4

9.1 Plano tangente 321

entonces la esfera dada se escribe como la superficie de nivel

f−1(0) = (x, y, z)| f(x, y, z) = 0 = (x, y, z)|x2 + y2 + z2 − 3 = 0

El punto (1, 1, 1) pertenece al conjunto de nivel f−1(0), pues 12+12+12−3 = 0

Despues, calculamos el vector gradiente ∇f(1,1,1),

∇f(1,1,1) =(∂f

∂x,∂f

∂y,∂f

∂z

)|(1,1,1) = (2x, 2y, 2z)|(1,1,1) = (2, 2, 2)

Por lo tanto, la ecuacion del plano tangente a S = f−1(0) en (1, 1, 1) secalcula

< (2, 2, 2), (x, y, z) >=< (2, 2, 2), (1, 1, 1) >

es decir, la ecuacion buscada es,

2x+ 2y + 2z = 6 B

Mencionamos que la metodologıa utilizada para calcular planos tan-gentes a superficies se aplica tambien para calcular en general, los espaciostangentes de conjuntos de nivel de funciones suaves. Particularmente, elmetodo se usa para calcular rectas tangentes de curvas planas, como lomuestra el siguiente ejemplo.

EJEMPLO. Calcular la recta tangente a la curva

C : x2y + y3 = 10

en el punto (1, 2).

C Consideremos la funcion f(x, y) = x2y+ y3. Entonces, la curva dadaC esta definida como la curva de nivel,

f−1(10) = (x, y)| f(x, y) = 10 = (x, y)|x2y + y3 = 10 = C.

Verificamos primeramente que el punto (1, 2) ∈ f−1(10), pues

12(2) + (2)3 − 2 + 8 = 10

y despues calculamos el gradiente

∇f(1,2) = (2xy, x2 + 3y2)(1,2) = (4, 13)

Por lo tanto, la ecuacion del tangente (que es una recta) T(2,2)C es,

< (4, 13), (x, y) >=< (4, 13)(1, 2) >

o equivalentemente,4x+ 13y = 30 B

Page 322: Libro Mate 4

322 Valores extremos de funciones R2 → R

9.2 Puntos regulares y crıticos

Sean, f : Ω ⊂ R2 → R una funcion de clase Cr y p = (a, b) un punto enΩ. Entonces, el desarrollo de Taylor de f alrededor de p hasta orden 2 estadado por

f(x, y) = f(p) +∂f

∂x(p)(x− a) + ∂f

∂y(p)(y − b)

+1

2

∂2f

∂x2(p)(x− a)2 + ∂2f

∂y∂x(p)(x− a)(y − b)

+1

2

∂2f

∂y2(p)(y − b)2 + o((x− a)3, (y − b)3)

si el punto variable (x, y) esta proximo del punto p en Ω.

DEFINICION. Si el punto p es tal que ∇fp 6= (0, 0), entonces se dira unpunto regular de f , y f(p) se dira un valor regular.

C En este caso, podemos suponer que ∂f∂x (p) 6= 0, y por El teorema de

Taylor , la funcion se escribe localmente como la aproximacion

z = f(p) +∂f

∂x(p)(x− a) + ∂f

∂y(p)(y − b)

es decir, si A = f(p), B = ∂f∂x (p), C = ∂f

∂y (p), entonces

z = A+B(x− a) + C(y − b)

es la ecuacion del plano tangente de la grafica de la funcion f en el punto(p, f(p)) = (a, b, f(a, b)).

En otras palabras, alrededor de un punto regular la funcion f esta a-proximada por la ecuacion del plano tangente en una vecindad del puntop. La figura 9.2 ilustra esta aproximacion. B

Esta discusion generaliza el concepto de la recta tangente a la grafica deuna funcion real de variable real de los cursos de calculo basico, al del planotangente a la grafica (superficie) de una funcion de dos variables con valoresreales. Dicho en otras palabras, la ecuacion del plano tangente aproxima ala funcion alrededor del punto en cuestion.

EJEMPLO. Calcular aproximadamente f(1.1, 1.1) si

f(x, y) = ln(xy)

C Aproximamos f alrededor del punto p = (1, 1), calculando

∂f

∂x=y

x,

∂f

∂y=x

y

Page 323: Libro Mate 4

9.2 Puntos regulares y crıticos 323

lo que nos dice

B =∂f

∂x(1, 1) = 1, C =

∂f

∂y(1, 1) = 1

Por lo tanto, la ecuacion del plano tangente de la grafica de f en elpunto (1, 1, 0) es

z = f(1, 1) +B(x− 1) + C(y − 1) = (x− 1) + (y − 1).

que aproxima a f(x, y) = ln(xy) alrededor del punto (1, 1).De esto, la aproximacion buscada se calcula por

z(1.1, 1.1) = (1.1− 1) + (1.1− 1) = 0.1 + 0.1 = 0.2

Esto es,ln(1.1)(1.1) ≈ 0.2 B

p

z = f(p) +∂f

∂x(p)(x− a) +

∂f

∂y(p)(y − b)

z = f(x, y)

Figura 9.2: Aproximacion lineal de f en p.

Cuando el punto p no es regular, el problema de aproximacion de unafuncion f se complica. Hacemos un analisis para el caso mas simple decuando no se tiene un punto regular.

DEFINICION. Si ∇fp = (0, 0), es decir, las derivadas parciales de lafuncion f se anulan en el punto p,

∂f

∂x(p) = 0 =

∂f

∂y(p)

entonces p se dira un punto crıtico de f . Al valor f(p) se le llamara unvalor crıtico.

Page 324: Libro Mate 4

324 Valores extremos de funciones R2 → R

Por El teorema de Taylor, alrededor del punto p la funcion f esta apro-ximada por el polinomio cuadratico

z = f(p) +1

2

∂2f

∂x2(p)(x− a)2 + ∂2f

∂y∂x(p)(x− a)(y − b) + 1

2

∂2f

∂y2(p)(y − b)2

= f(p) +1

2

[∂2f

∂x2(p)(x− a)2 + 2

∂2f

∂y∂x(p)(x− a)(y − b) + ∂2f

∂y2(p)(y − b)2

]

lo cual puede escribirse matricialmente como

z = f(p) +1

2(x− a y − b)

(∂2f∂x2 (p)

∂2f∂y∂x (p)

∂2f∂x∂y (p)

∂2f∂y2 (p)

)(x− ay − b

)

C Comprobamos que la multiplicacion de las matrices senaladas enla ultima igualdad conducen a la expresion de la parte cuadratica de laaproximacion. Al realizar el producto de las dos matrices finales, se obtienela expresion

(x− a y − b)(

∂2f∂x2 (p)(x− a) + ∂2f

∂y∂x (p)(y − b)∂2f∂y∂x (p)(x− a) +

∂2f∂y2 (p)(y − b)

)

=∂2f

∂x2(p)(x− a)2 + ∂2f

∂y∂x(p)(y − b)(x− a) + ∂2f

∂y∂x(p)(x− a)(y − b)

+∂2f

∂y2(p)(y − b)2

=∂2f

∂x2(p)(x− a)2 + 2

∂2f

∂y∂x(p)(x− a)(y − b) + ∂2f

∂y2(p)(y − b)2

lo que sigue debido a la conmutatividad de las derivadas parciales mixtasde f en p. B

La matriz cuadrada obtenida de esta manera tiene un nombre y carac-terısticas especiales.

DEFINICION. La matriz de 2× 2 dada por

Hfp =

(∂2f∂x2 (p)

∂2f∂y∂x (p)

∂2f∂y∂x (p)

∂2f∂y2 (p)

)

se llamara matriz Hessiana de la funcion f en el punto crıtico p.

Page 325: Libro Mate 4

9.3 Formas cuadraticas basicas 325

Es claro que La matriz Hessiana Hfp es de la forma

A =

(M LL N

)

y, por lo tanto, es una matriz simetrica, es decir, coincide con su trans-puesta,

At =

(M LL N

)= A

Tales matrices simetricas estan estrechamente relacionadas con las lla-madas formas cuadraticas que definen superficies cuadraticas.

Repasamos , entonces, un aspecto basico de las formas cuadraticasmas simples en dos variables, que ya hemos estudiado en el capıtulo 6.

Antes de iniciar la discusion de las formas cuadraticas, definimos losconceptos de valores maximo y mınimo local de una funcion de argumentovectorial.

DEFINICION. Sean, f : Ω ⊂ R2 → R una funcion arbitraria y p ∈ Ω unpunto en el dominio de f . Decimos que la funcion f tiene en f(p) un

a. Valor mınimo local, si existe un numero ε > 0 tal que para cualquierpunto (x, y) contenido en la bola de radio ε > 0 y centro en p (Bε(p)), setiene que f(p) ≤ f(x, y)b. Valor maximo local, si existe un numero ε > 0 tal que para cualquier(x, y) ∈ Bε(p) se cumple que f(x, y) ≤ f(p)

La figura 9.3 ilustra la definicion.

Si para cualquier (x, y) ∈ Ω se cumple que f(x, y) ≥ f(p) entonces f(p)se dira un mınimo global de la funcion f en Ω. Analogamente se defineun maximo global de la funcion f en Ω.

9.3 Formas cuadraticas basicas

DEFINICION. Por una forma cuadratica de 2 × 2 entendemos a unamatriz simetrica, real, de la forma

A =

(M LL N

), At = A,

tal que a una pareja de vectores ξ = (ξ1, ξ2), η = (η1, η2) los aplica en unnumero real q(ξ, η) mediante la regla matricial

q(ξ, η) = (η1, η2)

(M LL N

)(ξ1

ξ2

)

Page 326: Libro Mate 4

326 Valores extremos de funciones R2 → R

que definimos simplemente por ηtAξ, siendo ξ un vector columna y ηt unvector renglon.

Ası, una forma cuadratica aplicara en un solo vector ξ = (ξ1, ξ2) me-diante la formula

q(ξ) = q(ξ, ξ) = ξtAξ = (ξ1 ξ2)

(M LL N

)(ξ1

ξ2

)

=M(ξ1)2 + 2Lξ1ξ2 +N(ξ2)2

generando una funcion q : R2 → R que esta caracterizada por la matrizdada A.

EJEMPLO. Sea la funcion cuadratica en las variables u, v dada por laexpresion

q1(u, v) = u2 + v2

C Entonces, escribiendo al vector ξ = (u, v), podemos escribir matri-cialmente tal expresion como

q1(u, v) = u2 + 2(0)uv + v2 = (u v)

(1 00 1

)(uv

)

de donde q1 tiene asociada la matriz simetrica (forma cuadratica)

A1 =

(1 00 1

)

Por otro lado, en p = (0, 0) la funcion tiene un valor mınimo local enq1(0, 0) = 0

Esto se puede apreciar observando que la cuadratica z = u2 + v2 co-rresponde a un paraboloide circular que se abre verticalmente en direccionpositiva del eje z. Si consideramos valores c ∈ R proximos de 0, entonceslas imagenes inversas bajo f (curvas de nivel) f−1(c) corresponden a curvascerradas que de hecho son cırculos con ecuaciones u2 + v2 = c.

La figura 9.4 a. ilustra a la grafica de esta forma cuadratica en unaproximidad del origen de coordendas. B

EJEMPLO. Ahora, consideremos la forma cuadratica dada por,

q2(u, v) = −u2 − v2

C Esta tiene un valor maximo local en f(0, 0) = 0 y tiene asociadala matriz simetrica

A2 =

(−1 00 −1

)

Page 327: Libro Mate 4

9.3 Formas cuadraticas basicas 327

mınimolocal

p p

maximo local

Figura 9.3: Valores maximos y mınimos locales.

De igual forma que para el caso anterior, se observa que la grafica deq2(u, v) es un paraboloide circular que se abre verticalmente en direccionnegativa del eje z. Tambien, si consideramos valores negativos c ∈ Rproximos del valor maximo f(0) = 0, las curvas de nivel correspondien-tes u2 + v2 = −c son curvas cerradas, que ademas son cırculos.

La figura 9.4 b. ilustra la grafica de q2(u, v) es una proximidad delorigen. B

u2 + v2 −(u2 + v2)

ua. b.

u

v

v

Figura 9.4: Formas cuadraticas ±(u2 + v2).

EJEMPLO. Consideremos la funcion cuadratica en las variables u, v dadapor

q3(u, v) = u2 − v2

Page 328: Libro Mate 4

328 Valores extremos de funciones R2 → R

que tiene asociada la matriz simetrica

A3 =

(1 00 −1

)

debido a que, si ponemos el vector ξ = (u, v) como un vector columna,matricialmente podrıamos escribir

q3(u, v) = u2 − v2 = (u v)

(1 00 −1

)(uv

)= ξtA3ξ

Por otro lado, la cuadratica q2(u, v) = u2−v2 corresponde a la grafica dela superficie paraboloide hiperbolico. Por esto, al tomar cualquier valorc ∈ R proximo del valor f(0, 0) = 0, la curva de nivel asociada u2 − v2 = ccorresponde a una hiperbola, mientras que la curva de nivel f−1(0) estaformado por la pareja de rectas y = ±x que se intersecan en el origen decoordenadas.

Por lo tanto, en p = (0, 0) se tiene un punto silla f(0, 0) = 0 para lafuncion q3 (ni valor maximo, ni valor mınimo).

La figura 9.5 ilustra esta forma cuadratica. B

EJEMPLO. Analogamente, la forma cuadratica

q4(u, v) = −u2 + v2

tiene asociada la matriz simetrica

A4 =

(−1 00 1

)

y en el punto silla p = (0, 0) tiene asociado un valor f(0, 0) = 0 llamadotambien silla.

Zoologico de formas cuadraticas basicas

Extendemos ahora el tratado general de una forma cuadratica, bosquejandoa todas las formas cuadraticas basicas.

Dada la forma cuadratica

q(u, v) = au2 + bv2,

con a, b constantes diferentes de cero, esta funcion tiene asociada la matrizsimetrica

A =

(a 00 b

)

Page 329: Libro Mate 4

9.3 Formas cuadraticas basicas 329

u

v

Figura 9.5: Forma cuadratica u2 − v2.

cuya grafica tiene un comportamiento alrededor del punto (p, f(p)) =(0, 0, 0) tiene alguna de las formas mostradas en la figura 9.6.

Observamos que las formas cuadraticas basicas no tienen terminoscruzados en xy. Para cuando hay tales terminos, estos se pueden omitirmediante el uso del siguiente resultado del Algebra Lineal y cuya pruebapuede verse en Anton (1981).

LEMA 9.1 (de Sylvester de diagonalizacion) Sea la matriz simetrica

B =

(M LL N

)

Entonces, bajo un cambio lineal de coordenadas en el plano puede serllevada a una matriz diagonal de la forma

A =

(λ1 00 λ2

)

donde λ1 λ2 son los valores propios de A, que satisfacen el polinomiocaracterıstico,

0 = det

[(M LL N

)− λ

(1 00 1

)]

Mas aun se tiene que,

det

(M LL N

)= det

(λ1 00 λ2

)= λ1λ2

Page 330: Libro Mate 4

330 Valores extremos de funciones R2 → R

a, b > 0 a, b < 0

a, b diferentes signos

Figura 9.6: Zoologico de formas cuadraticas basicas.

Para ilustrar el alcance del Lema de Sylvester damos el siguiente ejem-plo.

EJEMPLO. Sea la matriz simetrica

B =

(1 22 1

)

con determinante det(B) = −3.C Procedemos a diagonalizar a la matriz B, calculando sus valores

propios al resolver el polinomio cuadratico,

0 = det

[(1 22 1

)− λ

(1 00 1

)]= det

(1− λ 22 1− λ

)= (1−λ)2−4

= λ2 − 2λ− 3.

cuyas raıces son λ1 = 1, λ2 = −3.De esta manera, la matriz diagonalizada es

A =

(1 00 −3

)

Page 331: Libro Mate 4

9.4 Puntos crıticos no degenerados 331

cuyo determinante es det(A) = −3.

Por otro lado, la matriz A tiene asociada la forma cuadratica

q(u, v) = u2 − 3v2

que corresponde a un paraboloide hiperbolico (silla de montar) con unpunto silla en el origen (0, 0, 0).

Por lo tanto, la forma cuadratica asociada a la matriz B esta dada enlos vectores ξ = (x, y) y matricialmente por,

ξTBξ = (x y )

(1 22 1

)(xy

)= x2 + 2(2xy) + y2 = x2 + 4xy + y2

corresponde cualitativamente a un paraboloide hiperbolico con un puntosilla en el origen (0, 0, 0). B

El ejemplo anterior nos muestra que para analizar y caracterizar a unpunto crıtico p de una funcion f(x, y) es suficiente con calcular su matrizHessiana B = Hfp que es una matriz simetrica, y despues diagonalizarlautilizando el Lema de Sylvester. Al obtener sus valores propios, confor-mamos la matriz diagonal

A =

(λ1 00 λ2

)

que caracteriza a una forma cuadratica basica de las mencionadas, para elcaso en que los valores propios sean ambos diferentes de cero.

9.4 Puntos crıticos no degenerados

DEFINICION. Sea f : Ω → R una funcion de clase C2 tal que en elpunto crıtico p ∈ Ω se tenga que el determinante de La matriz Hessiana

det(Hfp) = det

(∂2f∂x2 (p)

∂2f∂y∂x (p)

∂2f∂y∂x (p)

∂2f∂x2 (p)

)6= 0

entonces llamamos al punto p un punto crıtico no degenerado.

Observamos que si la matriz diagonalizada de Hfp es la matriz

A =

(λ1 00 λ2

)

Page 332: Libro Mate 4

332 Valores extremos de funciones R2 → R

entonces sera suficiente que ambos valores propios λ1 y λ2 sean diferentesde cero para que p sea un punto crıtico no degenerado, en virtud de quepor el Lema de Sylvester, det(A) = det(Hfp) = λ1λ2.

EJEMPLO. Sea la funcion cuadratica en dos variables

f(x, y) = 3x2 − 4xy + y2

Analizar el comportamiento en sus puntos crıticos mediante las matricesHessianas correspondientes.

C El conjunto Ω = Dom(f) = R2 es un dominio abierto y conexo.Realizaremos el analisis de los puntos crıticos. Hallamos primeramente elgradiente, calculando las primeras derivadas parciales.

∂f

∂x= 6x− 4y

∂f

∂y= −4x+ 12y

Es claro que

∇fp = (0, 0) si y solo si,

6x− 4y = 0y

−4x+ 2y = 0

es decir, los puntos crıticos se obtienen al resolver el sistema lineal

6x− 4y = 0−4x+ 2y = 0

Como el determinante principal del sistema

D =

∣∣∣∣6 −4−4 2

∣∣∣∣ = 12− 16 = −4 6= 0,

entonces, x = 0, y = 0 es la unica solucion de tal sistema. Esto es, p = (0, 0)es el unico punto crıtico, con valor cıtico

f(0, 0) = 3(0)2 − 4(0)(0) + 02 = 0

Ahora calculamos las derivadas parciales segundas,

∂2f

∂x2= 6,

∂2f

∂y∂x= −4, ∂2f

∂y2= 2

Page 333: Libro Mate 4

9.4 Puntos crıticos no degenerados 333

y obtenemos en el punto crıtico p(0, 0),

∂2f

∂x2(0, 0) = 6,

∂2f

∂y∂x(0, 0) = −4, ∂2f

∂y2(0, 0) = 2

Por lo tanto la matriz Hessiana de f en el punto crıtico p(0, 0) se calcula

Hf(0,0) =

(6 −4−4 2

)

Despues, encontramos los valores propios λ1, λ2 para diagonalizar lamatriz:

0 = det

[(6 −4−4 2

)− λ

(1 00 1

)]= det

(6− λ −4−4 2− λ

)

=

∣∣∣∣6− λ −4−4 2− λ

∣∣∣∣ = (6− λ)(2− λ)− 16 = λ2 − 8λ− 4 = 0

con lo que,

λ =8±√64 + 16

2=

8±√80

20

de donde,

λ1 =8−√80

2< 0, λ2 =

8 +√80

2> 0

lo que implica que en el punto (0, 0, f(0, 0)) sobre la grafica de f se tieneun punto silla, y ademas que el punto crıtico p = (0, 0) es no degenerado.

Analizamos algunas curvas de nivel de f utilizando los resultados dela descripcion de una forma cuadratica alrededor del origen de cordenadas.

a. Si se toma el valor z = 1 entonces

1 = 3x2 − 4xy + y2

es la ecuacion de una hiperbola en el plano R2

b. Al tomar el valor −1 = z entonces se tiene,

−1 = 3x2 − 4xy + y2

que es la ecuacion de otra hiperbola en R2.

c. Si se considera z = 0 entonces se tiene la ecuacion

0 = 3x2 − 4xy + y2

Page 334: Libro Mate 4

334 Valores extremos de funciones R2 → R

y para resolver en terminos de la variable x nos da,

x =4y ±

√16y2 − 12y2

6=

4y ± 2y

6=

y13y

es decir, la pareja de rectas

y = xy = 3x

que son las asıntotas de las hiperbolas dadas por la familia de ecuaciones

3x2 − 4xy + y2 = c

donde c ∈ R es valor arbitrario de la funcion f .

La figura 9.7 describe la complejidad de la grafica de la funcion f , asıcomo sus curvas de nivel. B

Utilizamos el ejemplo anterior para hacer la siguiente observacion.

C La funcion cuadratica inicial tenıa la ecuacion

f(x, y) = 3x2 − 4xy + y2

que matricialmente se puede escribir

3x2 − 4xy + y2 = 3x2 + 2(−2)xy + y2 = (x y)

(3 −2−2 1

)(xy

)

siendo la matriz simetrica asociada (forma cuadratica)

A =

(3 −2−2 1

)

Por otro lado, encontramos que la matriz Hessiana en el punto crıticoera la forma cuadratica

Hf(0,0) =

(6 −4−4 2

)= 2A

Esto ocurre debido a que en la construccion de la matriz Hessiana du-rante la discusion general se factorizo el escalar 1

2 dando paso a la Hessianacomo se definio. B

Utilizamos ahora toda la herramienta que se ha desarrollado, paraanalizar puntos crıticos de funciones suaves de dos variables.

Page 335: Libro Mate 4

9.4 Puntos crıticos no degenerados 335

x

y

curvas de nivel grafica

Figura 9.7: Curvas de nivel y grafica de f(x, y) = 3x2 − 4xy + y2.

EJEMPLO. Sea la funcion polinomial de grado 4 en dos variables dadapor la igualdad,

f(x, y) = x4 + y4 − 4xy

y cuyo dominio es Ω = R2.

C Calculamos sus puntos crıticos, igualando las coordenadas del gra-diente a cero,

∂f∂x = 4x3 − 4y = 0∂f∂y = 4y3 − 4x = 0

o equivalentemente, resolviendo el sistema de ecuacionesx3 − y = 0y3 − x = 0

Al despejar la variable y de la primera ecuacion se tendra

y = x3

y3 − x = 0

y si se sustituye x3 en la segunda ecuacion se tendrıa (x3)3 − x = 0, lo queimplicarıa que x9 − x = 0. Por lo tanto, es necesario resolver la ecuacionde grado 9,

x(x8 − 1) = 0

Al factorizar el lado izquierdo de esta ecuacion se tiene que

x(x4 − 1)(x4 + 1) = 0⇐⇒ x(x2 + 1)(x2 − 1) = 0

lo que nos da las raıces x = 0, 1,−1.

Page 336: Libro Mate 4

336 Valores extremos de funciones R2 → R

Al sustituir tales raıces en la ecuacion y = 3√x nos darıa que y =

0, 1,−1.Por lo tanto, los puntos crıticos son p1 = (0, 0), p2 = (1, 1), p3 =

(−1,−1) y sus valores crıticos correspondientes seran,

f(0, 0) = 0, f(1, 1) = −2, f(−1,−1) = −2

Al calcular las derivadas parciales segundas de la funcion f se tiene

∂2f

∂x2= 12x2,

∂2f

∂y∂x= −4, ∂2f

∂y2= 12y2

lo que da la matriz Hessiana en cada punto crıtico p,

Hfp =

(12x2 −4−4 12y2

)

p

Procedemos a analizar cada uno de los puntos crıticos obtenidos, me-diante la diagonalizacion de su correspondiente matriz Hessiana

a. Para el punto crıtico (0, 0), su matriz Hessiana es,

Hf(0,0) =

(0 −4−4 0

)

Para calcular los valores propios de esta matriz resolvemos la ecuacioncuadratica caracterıstica.

0 =

∣∣∣∣−λ −4−4 −λ

∣∣∣∣ = λ2 − 16

lo que implica que λ = ±4.De esta forma, la matriz diagonal es la forma cuadratica

A1 =

(4 00 −4

)

lo que nos dice que en el punto (0, 0, f(0, 0)) = (0, 0, 0) hay un punto silla.Ademas en una localidad del punto crıtico (0, 0) las curvas de nivel

son hiperbolas cuyas separatrices son dos curvas que se intersectan en elpunto (0, 0), que es no degenerado.

b. En el punto crıtico (1, 1), se tiene la matriz Hessiana

Hf(1,1) =

(12 −4−4 12

)

Page 337: Libro Mate 4

9.4 Puntos crıticos no degenerados 337

Para calcular los valores propios resolvemos la ecuacion cuadratica

0 =

∣∣∣∣12− λ −4−4 12− λ

∣∣∣∣ = (12− λ)2 − 16 = λ2 − 24λ+ 128

esto es, λ1 = 16, λ2 = 8.

Lo anterior implica que f(1, 1) = −2 es un mınimo local pues la matrizdiagonalizada es, en este caso,

A2 =

(16 00 8

)

En virtud de que f(1, 1) = −2 es un mınimo local, se tiene que las curvas denivel de valores c proximos de −2 (de hecho mayores) son curvas cerradasque encierran al punto crıtico no degenerado (1, 1)

c. Analogamente al inciso anterior, en virtud de que en el punto crıtico(−1, 1) la matriz Hessiana es,

Hf(−1,1) =

(12 −4−4 12

)

la funcion tiene un mınimo local en f(−1,−1) = −2.Una inspecccion simple de la grafica de la funcion mediante los puntos

crıticos y sus valores crıticos nos asegura la forma de las curvas de nivel dela funcion, las cuales vienen dadas por la familia de ecuaciones

x4 + y4 − 4xy = c

siendo c ∈ R un valor que esta condicionado a ser ≥ −2 que es el valormınimo de la funcion.

Cuando c = −2 las curvas de nivel se reducen a la pareja de puntoscrıticos

p1 = (1, 1) y p2 = (−1, 1).

Si −2 < c < 0 entonces la ecuacion x4+y4−4xy = c describe una parejade curvas disconexas que son cerradas y encierran a los puntos crıticos p1y p2.

Si c = 0, la ecuacion x4 + y4 − 4xy = 0 describe una curva que es launion de otras dos que se intersectan en el punto (0, 0) y conforman unafigura en forma de ”ocho”.

Cuando c > 0 la curva de nivel asociada se vuelve un circuito queencierra a la figura de ”ocho”

Page 338: Libro Mate 4

338 Valores extremos de funciones R2 → R

Ya anteriormente habiamos mostrado este ejemplo, y ahora con el uso dela Teorıa diferenciable se ha podido hacer un analisis mas preciso, pero queaun no esta totalmente completado. La figura 9.8 ilustra cualitativamenteel mapa topografico de las curvas de nivel de la grafica de la funcion. B

mınimolocal

mınimolocal

silla

Figura 9.8: Mapa topografico de f(x, y) = x4 + y4 − 4xy.

De hecho, aun para funciones polinomiales de dos variables, el analisisde una curva de nivel es complicado y requiere de metodologıa matematicamoderna provista por areas como la Geometrıa Algebraica. Hablandocon la verdad, estas herramientas estan muy fuera de nuestro alcance yapelamos a las construcciones de las graficas de funciones de dos variablesmediante las computadoras. Este analisis, aunque es cuantitativo y pocoanalıtico, es de gran ayuda en los problemas practicos.

Estos ejemplos muestran cuan complejos pueden ser las curvas de nivelasociadas a una funcion de dos variables.

Es claro que el problema se complica para dimensiones mayores. Ası queen los subsecuentes ejemplos analizaremos apenas la forma de los puntoscrıticos, teniendo en cuenta la forma local de la grafica en una vecindad decada uno de ellos, cuando estos son no degenerados.

EJEMPLO. Analizar los puntos crıticos de la funcion

f(x, y) = x2 + x2y + y2 + 4

C Como es sabido, los puntos crıticos se calculan al resolver la ecuacion

∇fp =

(∂f

∂x,∂f

∂y,

)= (0, 0)

Page 339: Libro Mate 4

9.4 Puntos crıticos no degenerados 339

es decir, al resolver el sistema de ecuaciones

∂f∂x = 2x+ 2xy = 0∂f∂y = 2y + x2 = 0

lo que equivale a que

2(x+ xy) = 02y + x2 = 0

⇐⇒x(1− y) = 0y = −x2/2 ⇐⇒

x = 0 o y = −1y

y = −x2

2

de donde

x = 0 y y = −x2

2

y = −1 y y = −x2

2

⇐⇒

x = 0, y = 0

y = −1, x = ±√2

lo que implica que los puntos crıticos buscados son

p1 = (0, 0), p2 = (−√2,−1), p3 = (

√2,−1)

Calculamos sus valores crıticos correspondientes,

f(0, 0) = 4, f(−√2,−1) = 5, f(

√2,−1) = 5

La matriz Hessiana de f en cualquier punto crıtico p es

Hf(0,0) =

(2 + 2y 2x2x 2

)

p

y pasamos ahora a analizar cada punto crıtico obtenido.

a. En el punto crıtico p1 = (0, 0), tenemos la matriz Hessiana

Hf(0,0) =

(2 + 2y 2x2x 2

)

(0,0)

=

(2 00 2

)

que de hecho ya es una matriz diagonal.

No obstante, para afirmar que su diagonalizacion es la misma, procede-mos a realizar tal diagonalizacion.

Para calcular los valores propios de la matriz Hf(0,0) se tiene que re-solver la ecuacion

0 =

∣∣∣∣2− λ 00 2− λ

∣∣∣∣ = (2− λ)2

Page 340: Libro Mate 4

340 Valores extremos de funciones R2 → R

lo que implica que λ1 = 2 = λ2 > 0, y por lo tanto, f(0, 0) = 4 es un valormınimo local.

b. Para el punto crıtico p2 = (−√2,−1). la matriz Hessiana es, en este

caso,

Hf(−√2,−1) =

(0 2(−

√2)

2(−√2) 2

)=

(0 −2

√2

−2√2 2

)

Calculamos los valores propios,

0 =

∣∣∣∣0− λ −2

√2

−2√2 2− λ

∣∣∣∣ =∣∣∣∣

λ −2√2

−2√2 2− λ

∣∣∣∣ = λ2 − 2λ− 8

de donde, λ1 = 4 λ2 = −2. Esto es, la diagonal asociada es

A2 =

(4 00 −2

)

lo que nos dice que f(−√2,−1) = 5 corresponde a un valor crıtico silla.

c. El punto crıtico p3 = (√2,−1) tiene como matriz Hessiana a

Hf(√2,−1) =

(0 2(

√2)

2(√2) 2

)

Para calcular sus valores propios, es preciso resolver la ecuacion

0 =

∣∣∣∣0− λ 2

√2

2√2 2− λ

∣∣∣∣ =∣∣∣∣

λ 2√2

2√2 2− λ

∣∣∣∣ = λ2 − 2λ− 8

y obtenemos nuevamente, λ1 = 4, λ2 = −2. Por lo tanto, f(√2,−1) = 5

corresponde tambien a un valor silla.

Observamos que todos los puntos crıticos de esta funcion son no dege-nerados, ya que todos los valores propios obtenidos no se anulan. B

EJEMPLO. Dada la funcion

f(x, y) = xy(1− x− y) = xy − x2y − xy2

analizar sus puntos crıticos mediante el metodo mostrado.

C El gradiente de la funcion es

∇fp = (y − 2xy − y2, x− x2 − 2xy)p

y se anula, si y solo si, se satisface el sistemay − 2xy − y2 = 0x− x2 − 2xy = 0

Page 341: Libro Mate 4

9.4 Puntos crıticos no degenerados 341

o equivalentemente, y(1− 2x− y) = 0x(1− x− 2y) = 0

esto es,

y = 0 o 1− 2x− y = 0y

x = 0 o 1− x− 2y = 0

lo que implica que,

y = 0 y y = 0x = 0 y 1− 2x− y = 0y = 0 y 1− x− 2y = 0

1− 2x− y = 0 y 1− x− 2y = 0

de donde se obtienen los puntos crıticos,

p1 = (0, 0), p2 = (0, 1), p3 = (1, 0), p4 =

(1

3,1

3

)

con los valores crıticos correspondientes

f(0, 0) = 0, f(0, 1) = 0, f(1, 0) = 0, f(1/3, 1/3) = 1/27

Procedemos a analizar los puntos crıticos sabiendo que la matriz Hes-siana en cada uno de ellos viene dada por

Hfp =

(−2y 1− 2x− 2y

1− 2x− 2y 2x

)

a. Para el punto crıtico p1 = (0, 0), la matriz Hessiana esta dada por

Hf(0,0) =

(0 11 0

)

y sus valores propios se calculan resolviendo la ecuacion

0 =

∣∣∣∣−λ 11 −λ

∣∣∣∣ = λ2 − 1

de donde λ = ±1. Esto dice que f(0, 0) = 0 corresponde a un valor silla.

b. En el punto p2 = (0, 1), la matriz Hessiana correspondiente es,

Hf(0,1) =

(−2 −1−1 0

)

Page 342: Libro Mate 4

342 Valores extremos de funciones R2 → R

y sus valores propios se calculan al resolver la ecuacion,

0 =

∣∣∣∣−2− λ −1−1 −λ

∣∣∣∣ = −λ(−2− λ)− 1 = λ2 + 2λ− 1

Encontramos los valores propios λ1, λ2 donde,

λ1 =−2 +

√8

2> 0, λ2 =

−2−√8

2< 0

y por lo tanto f(0, 1) = 0 es un valor crıtico silla.

c. El punto crıtico p3 = (1, 0) tiene asociada la matriz Hessiana

Hf(1,0) =

(0 −1−1 −2

)

y sus valores propios se calculan mediante la ecuacion

0 =

∣∣∣∣−λ −1−1 −2− λ

∣∣∣∣ = λ2 + 2λ− 1

que tiene soluciones

λ1 =−2 +

√8

2> 0, λ2 =

−2 +√8

2< 0

lo qua hace tambien de f(1, 0) = 0 un valor crıtico silla.

d. Finalmente, el punto crıtico p4 = (1/3, 1/3) tiene la matriz Hessiana

Hf(1/3,1/3) =

(−2/3 −1/3−1/3 −2/3

)

y los valores propios se calculan al resolver la ecuacion

0 =

∣∣∣∣−2/3− λ− 1/3

−1/3 −13 − λ

∣∣∣∣ = λ2 +4

3λ+

1

3

cuyas soluciones sonλ1 = −1/3, λ2 = −1

que hace de f(13 ,

13

)= 1/27 un valor crıtico mınimo.

Nuevamente, en este ejemplo nos hemos encontrado con puros puntoscrıticos no degenerados, pues todos los valores propios calculados son dis-tintos de cero. B

Page 343: Libro Mate 4

9.4 Puntos crıticos no degenerados 343

EJEMPLO. Analizar los puntos crıticos de la funcion

f(x, y) = y√x− y2 − x+ 6y

C Calculamos sus puntos crıticos resolviendo el sistema,

∂f∂x = 1

2yx−1/2 − 1 = 0

∂f∂y = x1/2 − 2y + 6 = 0

que equivale a (si x 6= 0),

y2√x= 1√

x = 2y − 6

Al igualar las ecuaciones obtenemos y2 = 2y − 6, y resolviendo nos da

y = 4.

Por lo tanto, obtenemos para x,

4

2=√x

lo que nos dice que x = 4.

De esta forma el unico punto crıtico de la funcion es p = (4, 4), y suvalor crıtico es f(4, 4) = 12.

La matriz Hessiana viene dada por,

Hfp =

( −y

4√x3

12√x

12√x

−2

)

p

y de esta manera, la matriz Hessiana en el unico punto crıtico es

Hf(4,4) =

(164

14

14 −2

)

cuyos valores propios se calculan mediante la solucion de la ecuacion

0 =

∣∣∣∣164 − λ 1

414 −2− λ

∣∣∣∣ = λ2 +127

64λ− 3

32

que al resolver nos da los valores de λ,

λ1 =−127 +

√17665

128> 0, λ2 =

−127−√17665

128< 0

Page 344: Libro Mate 4

344 Valores extremos de funciones R2 → R

lo que hace de f(4, 4) = 12 un valor silla. Ademas, se tiene que el puntocrıtico es no degenerado. B

Hacemos hincapie de que el analisis de la grafica de una funcion suavealrededor de un punto crıtico no degenerado es simple y esta totalmentedescrito por la zoologıa de las formas cuadraticas basicas y el Lema deSylvester. No obstante, cuando la matriz Hessiana en el punto crıtico tieneun valor propio λ = 0, el analisis se complica y su estudio sale de nuestrasposibilidades. La Teorıa de singularidades y Catastrofes establecidapor R. Thom, provee de la herramienta moderna necesaria para analizarel caso mencionado. A los puntos crıticos tales que su matriz Hessiana tieneun valor propio nulo, se les llama puntos crıticos degenerados.

Cabe mencionar que la Teorıa expuesta aquı se extiende a varias varia-bles como lo muestra el siguiente ejemplo.

EJEMPLO. Analizar los puntos crıticos de la funcion

f(x, y, z) = x2 + xy + y2 + yz + z2

C Claramente el dominio de la funcion f es toda la region espacialΩ = R3.

Por otro lado, el gradiente de f esta dado por

∇fp = (2x+ y, 2y + x+ z, 2z + y)

de donde ∇fp = (0, 0, 0), si y solo sı, se cumple

2x+ y = 0x+ 2y + z = 0y + 2z = 0

El determinante de tal sistema lineal es∣∣∣∣∣∣

2 1 01 2 10 1 2

∣∣∣∣∣∣= 4 6= 0

lo que nos dice que tal sistema solo tiene la solucion trivial p = (0, 0, 0),que es entonces el unico punto crıtico.

La matriz Hessiana es, para este caso, la matriz simetrica de 3× 3

B =

∂2f∂x2

∂2f∂y∂x

∂2f∂z∂x

∂2f∂x∂y

∂2f∂y2

∂2f∂z∂y

∂2f∂x∂z

∂2f∂y∂z

∂2f∂z2

=

2 1 01 2 10 1 2

Page 345: Libro Mate 4

9.5 Multiplicadores de Lagrange 345

Procedamos a calcular los valores propios de la matriz resolviendo laecuacion cubica

0 = det

2 1 01 2 10 1 2

− λ

1 0 00 1 00 0 1

=

∣∣∣∣∣∣

2− λ 1 01 2− λ 10 1 2− λ

∣∣∣∣∣∣

= (2− λ)∣∣∣∣2− λ 11 2− λ

∣∣∣∣−∣∣∣∣1 10 2− λ

∣∣∣∣ = (2− λ)[(2− λ)2 − 1]− (2− λ)

= (2− λ)(λ2 − 4λ+ 2)

Las raıces de tal ecuacion cubica son los numeros positivos

λ1 = 2, λ2 = 2−√2, λ3 = 2 +

√2

como se puede comprobar facilmente.

De esta manera, la matriz diagonalizada obtenida es

A =

2 0 0

0 2−√2 0

0 0 2 +√2

con la diagonal en numeros positivos.

Esto harıa que el valor crıtico f(0, 0, 0) = 0 sea un valor mınimo localy que el punto crıtico p = (0, 0, 0) sea no degenerado. B

9.5 Multiplicadores de Lagrange

Damos inicio ahora al estudio de los valores extremos de una funcion queestan sujetos a un dominio restringido dentro de su dominio natural. Paraello iniciaremos la discusion pensando que el dominio restringido men-cionado tiene una caracterıstica adecuada en su forma: es un subconjuntodel espacio, que es cerrado, y que esta acotado (limitado) en el sentidoque la norma de cada uno de sus puntos esta superada por un numero fijoapropiado.

DEFINICION. Un conjunto K ⊂ Rn que es cerrado y acotado se llamaracompacto.

Hacemos una extension del Teorema de Weierstrass (Reyes (1996)) parael caso de una funcion en varias variables, con un dominio compacto.

TEOREMA 9.1 (Weierstrass) Toda funcion f : K → R continua (conK compacto) alcanza sus valores maximo y su mınimo dentro de K.

Page 346: Libro Mate 4

346 Valores extremos de funciones R2 → R

fmax

fmin

K ⊂ R2

Figura 9.9: El Teorema de Weierstrass.

C Consideremos el caso en que la funcion f no solo es continua, sinoademas es suave de clase Cr (r ≥ 1).

Si los puntos p1, p2, · · · , pk son crıticos para la funcion f en el interiorde K, calculamos sus valores crıticos

f(p1), f(p2), · · · f(pk)

Despues, se buscan los extremos de f en los puntos q1, · · · , ql en lafrontera, y en tales puntos obtenemos los valores

f(q1), f(q2), · · · , f(ql)

De entre el conjunto de todos los valores obtenidos

f(p1), · · · , f(pk), f(q1), · · · , f(ql)

se escogen el maximo y el mınimo (vease la figura 9.9). B

Por el Teorema de Weierstrass, para calcular los valores extremos de unafuncion real de argumento vectorial definida en un conjunto compacto K,es necesario buscar en su interior los puntos crıticos y evaluarlos, ademas debuscar en la frontera a aquellos puntos que pudieran dar valores extremos(vease la figura 9.9).

Procedamos a dar un metodo para localizar a tales puntos distinguidosen la frontera de K, suponiendo que tal frontera esta definida como unasuperficie de nivel. A este metodo se le conoce como el demultiplicadoresde Lagrange.

Sea S una superficie definida por una ecuacion

g(x, y, z) = 0

Page 347: Libro Mate 4

9.5 Multiplicadores de Lagrange 347

donde g es una funcion suave en una region Ω que contiene a S y tal que

∇g(x,y,z) 6= (0, 0, 0)

Dada f : Ω → R donde Ω es la region conteniendo a S, se dice que ftiene un extremo restringido a S en el punto p ∈ S, sı en una vecindadde p ∈ S se cumple que en una vecindad de p ∈ S se cumple que

f(p) ≥ f(x, y, z)

en cuyo caso se dira que f(p) es un maximo local de f en S. Pero si ental vecindad ocurre que

f(p) ≤ f(x, y, z)en este caso se dira que f(p) es un mınimo local de f en S.

El siguiente resultado debido a Lagrange J.L., nos indica la forma delocalizar a los puntos de S donde se encuentran los posibles extremos.

TEOREMA 9.2 (Lagrange) Si f es un extremo en el punto p ∈ Sentonces existe un escalar λ (llamado el multiplicador de Lagrange) talque en el punto p se satisface la ecuacion,

∇fp = λ∇gp

C Sea γ : J → S una curva diferenciable pasando por γ(0) = p ytomemos la composicion

f γ : J → R

dada por (f γ)(t) = f(γ(t)).

Entonces, por la regla de la cadena, la composicion es diferenciable y

d

dt(f γ)(t) =< ∇fγ(t), γ(t) >

Al evaluar en el tiempo t = 0, se obtiene que

d

dt(f γ)(0) =< ∇fp, γ(0) >

Ya que f(p) es extremo en S (es decir, un maximo o mınimo local sobreS) se tiene

0 =d

dt(f γ)(0) =< ∇fp, γ(0) >

Page 348: Libro Mate 4

348 Valores extremos de funciones R2 → R

debido a que para una funcion real de variable real, cuando alcanza unextremo (local o global) se tiene un punto crıtico en t = 0.

Como γ(0) es un vector tangente en p y la curva γ es arbitraria, entoncesesto nos dice que el vector ∇fp es ortogonal al plano tangente TpS.

Ya que tambien ∇gp⊥TpS, tendremos entonces que el vector ∇fp esparalelo a ∇gp.

Por lo tanto , existe un numero real λ diferente de cero tal que ∇fp =λ∇gp (vease la figura 9.10). B

∇fp

∇gp

g = 0

p

g

f

TpS 0

R

Figura 9.10: Multiplicador de Lagrange.

EJEMPLO. Hallar el maximo y el mınimo de la funcion

f(x, y) = x+ y

sujetos a la restriccion x2+y2 = 1. En otras palabras, encontrar los valoresmaximo y mınimo de f sobre el cırculo unitario S.

C Por el Teorema de Lagrange, es necesario resolver la ecuacion

∇f(x,y) = λ∇g(x,y)

con g(x, y) = x2 + y2 − 1 definiendo a S como el conjunto de nivel

g−1(0) = (x, y)|x2 + y2 − 1 = 0.

Al calcular los gradientes se tiene

∇f(x,y) = (1, 1), y ∇g(x,y) = (2x, 2y)

y entonces, buscamos los valores de x, y y λ tal que satisfagan la ecuacion

(1, 1) = λ(2x, 2y)

Page 349: Libro Mate 4

9.5 Multiplicadores de Lagrange 349

sabiendo ademas que x2 + y2 − 1 = 0.

Al resolver el sistema 1 = 2λx1 = 2λy

usando que λ 6= 0, se tiene que

12λ = x12λ = y

x2 + y2 = 1

Por lo tanto, (1

)2

+

(1

)2

= 1

de donde2

4λ2= 1

es decir,

λ = ±√

1

2= ±√2

2

De esta forma, obtenemos las soluciones de x, y en el cırculo dadas por,

x =1

2(±√22

) = ±√2

2, y = ±

√2

2

que implica que hay 4 puntos candidatos sobre el cırculo x2+y2 = 1, y queestos sean,

(√2

2,

√2

2

),

(√2

2,−√2

2

),

(−√2

2,

√2

2

),

(−√2

2,−√2

2

)

Si evaluamos cada uno de ellos se tiene que,

f

(√2

2,

√2

2

)=

√2

2+

√2

2= 2

√2

2=√2

f

(√2

2,−√2

2

)= 0, f

(−√2

2,

√2

2

)= 0, f

(−√2

2,−√2

2

)= −√2

Page 350: Libro Mate 4

350 Valores extremos de funciones R2 → R

Pm

(−√

22

,−√

22

)

PM

(√2

2,

√2

2

)

Figura 9.11: Extremos de x+ y en el cırculo unitario.

Por lo tanto, los valores maximo y minimo de f sobre el cırculo unitarioson

fmax =√2, alcanzado con el punto pM =

(√2

2,

√2

2

)

fmin = −√2, alcanzado con el punto pm =

(−√2

2, −√2

2

)

La figura 9.11 ilustra este ejemplo. B

EJEMPLO. Sea la funcion en dos variables,

f(x, y) = x+ y2

Calcular sus maximos y minimos sujetos a la restriccion 2x2 + y2 = 1.

C El gradiente de la funcion f se calcula,

∇fp = (1, 2y)

y definimos la funcion auxiliar g(x, y) = 2x2 + y2 − 1 para la restriccion.Entonces, la curva plana 2x2+y2 = 1 que es una elipse, se puede escribir

como la imagen inversa de 0 bajo g, es decir g−1(0) y ademas, sobre cadapunto (x, y) de tal curva,

∇g(x, y) = (4x, 2y)

Ahora buscamos λ 6= 0 tal que ∇fp = λ∇gp para algunos puntos (x, y)sobre la curva, esto es, tal que

(1, 2y) = λ(4x, 2y)

Page 351: Libro Mate 4

9.5 Multiplicadores de Lagrange 351

o equivalentemente, 1 = 4λx2y = 2λy

sujetas a la condicion de restriccion 2x2 + y2 = 1.

De la segunda ecuacion, si y 6= 0 entonces λ = 1, y de la primer ecuacionse tendrıa necesariamente que 1 = 4x, lo que implicarıa que x = 1

4

Al usar la condicion con x = 1/4, obtenemos,

2

(1

4

)2

+ y2 = 1

que al resolver para y nos da,

y = ±√

7

8

Por esto, los puntos candidatos obtenidos mediante este analisis son,

(1

4,−√

7

8

),

(1

4,

√7

8

)

Consideremos ahora el caso cuando y = 0. Entonces, de la primerecuacion (λ 6= 0 ) se tiene que

1

4λ= x

Como que al sustituir en la ecuacion de condicion nos da (con y = 0),

2

(1

)2

= 1

Tal ecuacion nos provee de la solucion para λ,

λ = ±√

1

8

y por lo tanto,

x =1

4(±√

18

) = ±√8

4= ±√2

2

Page 352: Libro Mate 4

352 Valores extremos de funciones R2 → R

De aquı, que los puntos candidatos sean en este caso,

(−√2

2, 0

),

(√2

2, 0

)

Usando ahora el Teorema de Weierstrass, evaluamos todos los puntosobtenidos en ambos casos,

f

(1

4,−√

7

8

)=

1

4+

7

8=

9

8

f

(−√2

2, 0

)= −√2

2+ 02 =

−√2

2

f

(1

4,

√7

8

)=

1

4+

7

8=

9

8

f

(√2

2, 0

)=

√2

2+ 02 =

√2

2

y concluimos que, sobre la elipse 2x2 + y2 = 1, la funcion f tiene losextremos

fmax =9

8, fmin =

−√2

2B

Damos ahora un ejemplo en tres variables donde se conjugan el Teoremade Weirestrass y el metodo de los multiplicadores de Lagrange.

EJEMPLO. Sea la funcion

f(x, y, z) = x2 + xy + y2 + yz + z2

Hallar sus valores maximo y mınimo dentro de la bola de radio 1 con centroen el origen de coordenadas.

C Ya que la bola de radio 1 con centro en el origen es un cerrado yacotado, (compacto) utilizamos el Teorema de Weirestrass.

Este nos indica que hay que buscar los extremos en el interior x2+y2+z2 < 1 a traves de los puntos crıticos , y en la frontera x2 + y2 + z2 = 1mediante el metodo de multiplicadores de Lagrange.

1. Los puntos crıticos de la funcion

f(x, y, z) = x2 + xy + y2 + yz + z2

Page 353: Libro Mate 4

9.5 Multiplicadores de Lagrange 353

se han localizado ya en un ejemplo previo (de hecho en todo R3), obte-niendo apenas el punto crıtico no degenerado q = (0, 0, 0) con valor crıticof(0, 0, 0) = 0. Esto termina la busqueda en el interior de la bola.

2. Procedamos entonces a buscar los extremos en la frontera x2+y2+z2 =1, es decir, los extremos de f sujetos a esta ultima restriccion.

La frontera de la bola, que es una esfera de radio 1, esta definida por laecuacion

x2 + y2 + z2 = 1

Al calcular el vector gradiente de f se tiene entonces,

∇fp = (2x+ y, x+ 2y + z, y + 2z)

Ahora sea la funcion auxiliar g(x, y, z) = x2 + y2 + z2 − 1, entonces laesfera esta definida como el conjunto g−1(0), y en cada punto,

∇gp = (2x, 2y, 2z)

Buscamos entonces un escalar λ tal que ∇fp = λ∇gp, es decir tal que

(2x+ y, x+ 2y + z, y + 2z) = λ(2x, 2y, 2z)

o equivalentemente que satisfaga las ecuaciones del sistema,

2x+ y = 2λxλ+ 2y + z = 2λyy + 2z = 2λz

En otras palabras, buscamos una condicion para λ tal que el sistema

2(1− λ)x+ y = 0x+ 2(1− λ)y + z = 0y + 2(1− λ)z = 0

tenga soluciones no triviales. Pero, el determinante de este sistema ho-mogeneo se anula cuando

D =

∣∣∣∣∣∣

2(1− λ) 1 01 2(1− λ) 10 1 2(1− λ)

∣∣∣∣∣∣= 0⇐⇒ (1− λ)[4(1− λ)2 − 2] = 0

lo que nos dice que hay soluciones no triviales para el sistema solo paravalores del multiplicador λ dados por

λ = 1, λ2,3 = 1±√2

2

Page 354: Libro Mate 4

354 Valores extremos de funciones R2 → R

Buscamos, consecuentemente, las soluciones no triviales considerandoel sistema lineal dado por la pareja,

2(1− λ)x+ y = 0

x+ 2(1− λ)y + z = 0

y para valores que este sistema tenga soluciones no triviales se necesita que

0 6=∣∣∣∣2(1− λ) 1

1 2(1− λ)

∣∣∣∣

Pero tal determinante se anula, sı y solo sı,

4(1− λ)2 − 1 = 0

es decir, λ = 12 , 2/3.

Por lo tanto si λ 6= 12 ,

32 , entonces

D =

∣∣∣∣2(1− λ) 1

1 2(1− λ)

∣∣∣∣ 6= 0

y el sistema lineal inicial tiene soluciones no triviales, que a continucionconseguimos.

Si hacemos z = t, entonces para el sistema con parametro t,

2(1− λ)x+ y = 0x+ 2(1− λ)y = −t

se tienen los determinantes

Dz =

∣∣∣∣0 1−t 2(1− λ)

∣∣∣∣ = t, Dy =

∣∣∣∣2(1− λ) 0

1 −t

∣∣∣∣ = −2t(1− λ)

y por lo tanto la solucion en general es la recta,

x = t4(1−λ)2−1

y = −2t(1−λ)4(1−λ)2−1z = t

que depende de los valores encontrados de λ.

Ya que tenemos las soluciones del sistema, utilizamos las condiciones delos multiplicadores obtenidos λ = 1, λ2, λ3.

a. Multiplicador λ = 1.

Page 355: Libro Mate 4

9.5 Multiplicadores de Lagrange 355

Se obtiene en este caso la ecuacion de la recta

x = −ty = 0z = t

y ademas x2 + y2 + z2 = 1, de donde t2 + t2 = 1, lo que implica que,

t = ±√

1

2= ±√2

2

Por lo tanto sustituyendo el valor de t en la ecuacion de la recta se tienenlos puntos,

p1 =

(−√2

2, 0,

√2

2

), p2 =

(√2

2, 0,−√2

2

)

b. Multiplicador λ = 1−√22 .

Se obtiene en este caso la ecuacion de la recta dada por,

x = t

y = −√2t

z = t

condicionada a x2 + y2 + z2 = 1, de donde,

t2 + 2t2 + t2 = 1⇐⇒ t2 =1

4

lo que implica que t = ± 12 .

De esta manera, se tienen entonces los puntos

p3 =

(1

2,−√2

2,1

2

), p4 =

(−1

2,

√2

2,−1

2

)

c. Multiplicador λ = 1 +√22

Se tiene, en este caso, el sistema solucion

x = t

y =√2t

z = t

y ademas x2 + y2 + z2 = 1, de donde t2 + 2t2 + t = 1, lo que implica quet = ± 1

2 .

Page 356: Libro Mate 4

356 Valores extremos de funciones R2 → R

Los puntos obtenidos son, en este caso,

p5 =

(1

2,

√2

2,1

2

), p6 =

(−1

2,−√2

2,−1

2

)

Se han obtenido mediante todo el proceso los puntos candidatos del Teo-rema de Weierstrass,

(−√2

2, 0,

√2

2

),

(√2

2, 0,−

√2

2

)(1

2,−√2

2,1

2

),

(−1

2,

√2

2,−1

2

),

(1

2,

√2

2,1

2

),

(−1

2,−√2

2,−1

2

)

Al evaluar tales puntos obtenemos sus valores correspondientes

f

(−√2

2, 0,

√2

2

)= 1

f

(−√2

2, 0, −

√2

2

)= 1

f

(1

2,−√2

2,1

2

)= 1−

√2

4−√2

4= 1−

√2

2

f

(−1

2,

√2

2,−1

2

)= 1−

√2

4−√2

4= 1−

√2

2

f

(1

2,

√2

2,1

2

)= 1 +

√2

4+

√2

4= 1 +

√2

2

f

(−1

2,−√2

2,−1

2

)= 1 +

√2

4+

√2

4= 1 +

√2

2

De esta manera, sobre la frontera (esfera) se tienen los valores maximoy mınimo dados por

fmin = 1−√2

2, fmax = 1 +

√2

2

Consecuentemente, ya que el interior se tenıa que f(0, 0, 0) = 0, en-tonces los valores maximo y mınimo de f en toda la bola cerrada son,

fmin = 0 y fmax = 1 +

√2

2. B

Page 357: Libro Mate 4

9.5 Multiplicadores de Lagrange 357

Ejercicios

1. Calcular los valores extremos locales de cada funcion dada, utilizandopara ello el Lema de Sylvester. Clasificarlos como maximos, mınimos osillas.

a. f(x, y) = xy2(1− x− y)b. f(x, y) = x2 + 4y2 − 4x

c. f(x, y) = (x2 + y2)(1− e(−x2+y2))

d. f(x, y) = ex sin y

e. f(x, y) = x3 + y3 − 15xy

2. a. Dar los valores extremos de la funcion de dos variables f(x, y) = x2+y2−xy−4y en la region limitada por las rectas x = 0, y = 0, x+y−4 = 0

b. Dar los valores maximo y mınimo de la funcion f(x, y) = x2+3y2+x−yen el triangulo limitado por las rectas x = 1, y = 1, x+ y = 1

3. Dar los valores extremos de la funcion dada, con la restriccion que seindica.

a. f(x, y, z) = 2x2 + 2y2 − z2, x− y + z = 0

b. f(x, y, z) = zexy, x2 + y2 = z

4. a. Calcular los valores maximo y mınimo de la funcion f(x, y) = x+ y2

en el cırculo unitario.

b. Calcular el valor maximo y el valor mınimo de la funcion f(x, y) =x+ y + z sobre la esfera x2 + y2 + z2 = 1.

5. a. Calcular los valores extremos de la funcion f(x, y, z) = x + 2y − 2zen la bola unitaria x2 + y2 + z2 ≤ 1.

b. Calcular el valor maximo y el valor mınimo de la funcion f(x, z) =x− y − z dentro de la bola x2 + y2 + z2 ≤ 1.

6. Sea un cırculo de radio R. Dar las dimensiones del triangulo que sepuede inscribir dentro del cırculo, y que tenga area maxima.

7. Hallar las dimensiones de un paralelepıpedo de volumen maximo quetenga fija una area dada A.

8. De entre los rectangulos con area dada A, hallar las dimensiones deaquel que tiene perimetro con valor mınimo.

9. Dar la distancia mas corta de la elipse x2

4 + y2 = 1 hasta la rectax+ y − 4 = 0.

Page 358: Libro Mate 4

358 Valores extremos de funciones R2 → R

Page 359: Libro Mate 4

Capıtulo 10

Funciones implıcitas

Sea Ω ⊂ Rn una region con frontera y sea f : Ω→ f(Ω) un difeomorfismoglobal , esto es, una funcion diferenciable, invertible con una inversa di-ferenciable g : f(Ω)→ Ω. El siguiente resultado cuya prueba se omite (puesrequiere de las herramientas de la teorıa de la Topologıa Algebraica) nosindica que los puntos interiores de Ω bajo la aplicacion de f son llevados alinterior de f(Ω), y los puntos de la frontera de Ω son llevados en la fronterade f(Ω). (Vease la figura 10.1).

TEOREMA 10.1 (de la invarianza del dominio) Sean Ω ⊂ Rn unaregion con frontera ∂Ω y sea f : Ω → f(Ω) ⊂ Rn un difeomorfismo global.Entonces f(Ω) es una region con frontera en Rn. Los puntos interiores deΩ son llevados bajo f en puntos interiores de f(Ω) y los puntos fronteraen ∂Ω son llevados bajo f en la frontera ∂f(Ω).

EJEMPLO. Sea la funcion R2 → R2 dada por

f(x, y) = (ax, by) = (u, v), con a, b > 0.

C Si se considera la region circular con frontera conformada por el discounitario de radio 1,

Ω =(x, y)|x2 + y2 ≤ 1

se tienen que bajo la funcion f la region Ω es mapeado en la region elipsoidalcon frontera

f(Ω) =

(u, v)| u

2

a2+v2

b2≤ 1

De las ecuaciones, u = axv = by

Page 360: Libro Mate 4

360 Funciones implıcitas

se obtienen las coordenadas inversas,

x = u

ay = v

b

que dan una funcion inversa R2 → R2 dada por,

g(u, v) =(ua,v

b

)= (x, y)

Claramente la funcion f : Ω → f(Ω) es difeomorfismo que lleva elinterior del disco Ω en el interior del elipsoidal f(Ω), llevando la frontera

del disco x2 + y2 = 1 en la elipse u2

a2 + v2

b2 = 1, cumpliendose el Teorema dela invarianza del dominio, (vease la figura 10.1).

p q

f(q)

f(p)

∂Ω f(∂Ω)

f

Figura 10.1: Teorema de invarianza del dominio.

EJEMPLO. Consideremos la transformacion R2 → R2 dada por

f(r, ϕ) = (r cosϕ, r senϕ)

donde un punto p = (r, ϕ) toma unidades en numeros positivos para laprimer coordenada y en radianes para la segunda.

C Sea Ω la region con frontera en el plano R2 dada por el cuadrado

Ω = (r, ϕ)| 0 ≤ r ≤ 1, 0 ≤ ϕ ≤ π/4

entonces, de la definicion d de la funcion f es claro que en coordenadas x, ydel codominio, las relaciones se escriben

x = r cosϕ, y = r senϕ

que es el cambio de coordenadas cartesiano por coordenadas polares.Una simple inspeccion nos muestra que la region f(Ω) es la cuarta

parte del cırculo unitario en el primer cuadrante, con la frontera incluida.Aquı nuevamente los puntos interiores del cuadrado Ω son llevados en losinteriores de f(Ω) bajo la funcion f , y la frontera de Ω en la frontera de

Page 361: Libro Mate 4

361

f(Ω), cumpliendose totalmente el Teorema de invarianza de dominio.B

Ahora damos paso a la demostracion de un resultado que es equivalenteal Teorema de la funcion inversa, y que en virtud de que ya se conoce este,se presenta como una de sus consecuencias: El Teorema de la funcionimplıcita. Iniciamos la discusion con un ejemplo.

EJEMPLO. Sea la funcion en dos variables

f(x, y) = x2 + y2

C Si c ∈ R+ ∪ 0 es un valor arbitrario, se tiene que la curva de nivelf−1(c) esta dada por la ecuacion x2+y2 = c. Sea (x, y) ∈ f−1(c), entoncesal despejar la variable y se tiene que y = ±

√c− x2.

Si y es una coordenada positiva, entonces necesariamente y =√c− x2.

De esta manera la variable y se puede escribir localmente como unafuncion y = h(x) en los puntos (x, y) ∈ f−1(c), es decir para tales puntos,

c = f(x, y) = f(x, h(x))

la funcion y = h(x) se llama una funcion implıcita para la funcion f .

Observamos que la derivada implıcita y′ se calcula mediante la deriva-cion de la igualdad x2 + y2 = c, es decir,

2x+ 2yy′ = 0

o equivalentemente,

y′ =−2x2y

=x

y=−xh(x)

=−x√c− x2

la cual tiene sentido para −√c < x <√c.

Por ejemplo si x = 0, entonces y =√c de donde en el punto (0,

√c) se

tendrıa una pendiente y′(0) = 0. B

Enunciamos y demostramos el Teorema de la funcion implicita parados variables. La generalizacion se muestra apenas en los ejemplos subse-cuentes.

TEOREMA 10.2 (de la Funcion Implıcita). Sea f : Ω ⊂ R2 → Runa funcion de clase Cr y sea p = (a, b) ∈ Ω tal que f(a, b) = c y tal que∂f∂y (a, b) 6= 0. Entonces existe una funcion y = h(x) de clase Cr definida

en una vecindad del punto x = a en R, tal que h(a) = b y todos los puntos

Page 362: Libro Mate 4

362 Funciones implıcitas

de la grafica de h estan contenidos en el conjunto de nivel f−1(c), es decir,sı el punto (x, y) = (x, h(x)) esta en la grafica de h en el plano, entonces,

c = f(x, y) = f(x, h(x))

C Sea la funcion definida por φ(x, y) = (x, f(x, y)). Se tiene

Dφp =

(1 0fx fy

)

p

donde fx es la derivada parcial de f en la variable x, y fy la derivada parcialde f respecto a la variable y. De esto, el Jacobiano es

Jφp = fy =∂f

∂y(p) 6= 0

y por el Teorema de la funcion inversa, existen, una vecindad de p en Ω yuna vecindad de q = f(p) donde esta definida para la funcion dada φ, unafuncion inversa local ψ de clase Cr.

Sean las coordenadas (x, z) en el codominio de φ y pongase

ψ(x, z) = (x, g(x, z))

Si ademas se denotan z = f(x, y) y y = g(x, z), entonces

(x, y) = ψ φ(x, y) = ψ(φ(x, y)) = ψ(x, f(x, y))

(x, z) = φ ψ(x, z) = φ(ψ(x, z)) = φ(x, g(x, z))

Definamos entonces para c = f(a, b), la funcion suave de clase Cr, enla variable x en una vecindad de x = a, dada por

h(x) = g(x, c)

se tiene entonces

φ(x, h(x)) = φ(x, g(x, c)) = φ(ψ(x, c)) = (x, c)

y por otro lado, para x en la vecindad de x = a,

φ(x, h(x)) = (x, f(x, h(x)))

de donde necesariamente f(x, h(x)) = c.

Ya que c = f(a, b) y f(a, h(a)) = c, se tiene que h(a) = b lo que terminala prueba del Teorema (vease el la figura 10.2). B

Page 363: Libro Mate 4

363

(|||||||)

(|||||||)

(|||||||||||||)b

a

(x,h(x))

f−1(c)

f

R

c

Figura 10.2: Teorema de la funcion implıcita.

Observemos que para este caso, sı sobre la curva de nivel f(x, y) = cla variable y se puede escribir implıcitamente por la funcion y = h(x) enla vecindad del punto (x = a, y = b), entonces al derivar parcialmente laecuacion de la curva de nivel f(x, y) = c respecto a la variable x se obtienela derivada implıcita ordinaria y′ = h′(x) respecto a x.

C Si f(x, y) = c, entonces, por la regla de la cadena,

∂f

∂x

∂x

∂x+∂f

∂y

dy

dx= 0

o equivalentemente, sabiendo que y = h(x)

∂f

∂x+∂f

∂yy′ = 0

que se puede escribir fx + fyy′ = 0.

De esta manera,

y′ =−fxfy

sabiendo que fy = ∂f∂y 6= 0. B

EJEMPLO. Sea la funcion en dos variables dada por,

f(x, y) = x cosxy

C Al calcular la derivada parcial respecto a la variable y se tiene

fy(x, y) = −x2 senxy

Page 364: Libro Mate 4

364 Funciones implıcitas

y particularmente en el punto p = (1, π/2), obtenemos

fy(1, π/2) = 1 6= 0

De aquı, por el Teorema de la funcion implıcita, existe una funciony = h(x) en la cercanıa de x = 1, tal que h(1) = π/2 y tal que la derivadade tal funcion en x = 1 se calcula

y′(1) =−fxfy|(1,π/2) =

cosxy − xy senxy−x2 senxy |(1,π/2) = −

π

2

Procedamos a calcular en este caso la funcion implıcita resolviendo elcaso general para las curvas de nivel. Si c ∈ R, entonces,

f(x, y) = x cosxy = c

implica que, para x 6= 0, se tiene

cosxy =c

x

o equivalentemente, al despejar la variable y obtenemos

y =1

xarccos

( cx

)

Ası, en x = 1, y = π/2 se cumple c = f(1, π/2) = 0, de donde, laconstante c = 0 y la funcion particular buscada es

y = h(x) =1

xarccos (0) =

π/2

x

cuya derivada es,

y′ = h′(x) =−π/2x2

De esta manera, y = h(1) = π/2 y y′ = h′(1) = −π/2 lo que compruebanuestros calculos obtenidos. B

El Teorema de la funcion implıcita para el caso de funciones detres variables se establece de la siguiente manera, y omitimos su pruebaque procede de igual forma que para el caso de dos variables.

TEOREMA 10.3 (Funcion implıcita). Sea f : Ω ⊂ R3 → R unafuncion de clase Cr y sea p = (a, b, c) un punto arbitrario de Ω tal quef(a, b, c) = d y ∂f

∂z (a, b, c) 6= 0. Entonces en una vecindad del punto (a, b)en el plano, existe una funcion z = h(x, y) de clase Cr tal que la grafica

Page 365: Libro Mate 4

365

esta contenida en la superficie de nivel f(x, y, z) = d, esto es, para puntos(x, y) cercanos del punto (a, b) se tiene que

f((x, y), h(x, y)) = d y h(a, b) = c.

Mas aun se cumplen las igualdades para las parciales,

∂h

∂x(a, b) =

−fxfz

(a, b, c)

∂h

∂y(a, b) =

−fyfz

(a, b, c)

El siguiente ejemplo muestra que en general no se puede calcular explı-citamente la funcion h, sino que apenas se demuestra su existencia.

EJEMPLO. Sea la funcion

f(x, y, z) = z3 − z − xy sen z

Mostrar que en una vecindad del punto (0, 0, 0) la variable z se puedeponer en funcion de las otras dos variables sobre la superficie de nivel

f(x, y, z) = f(0, 0, 0) = 0

C Calculamos la derivada parcial de f respecto a z en el punto (0, 0, 0),obteniendo

∂f

∂z(0, 0, 0) = 3z2 − 1− xy cos z|(0,0,0) = −1 6= 0

y por el Teorema de la funcion implicita 10.3, existe en una vecindad delpunto (0, 0) en el plano, y una funcion z = h(x, y) de clase Cr tal que,

h(0, 0) = 0 y f(x, y, h(x, y)) = f(0, 0, 0) = 0

Por otro lado, las derivadas parciales de h en el punto (0, 0) se calculan

∂h

∂x(0, 0) =

−fxfz

(0, 0, 0) =−y sen z

3z2 − 1− xy cos z (0, 0, 0) = 0

∂h

∂y(0, 0) =

−fyfz

(0, 0, 0) =−x sen z

3z2 − 1− xy cos z (0, 0, 0) = 0

Al tratar de proceder a buscar la funcion z = h(x, y) a partir de lasuperficie de nivel z3−z−xy sen z = 0, podemos observar que no es simpledespejar a z en terminos de las otras variables (x, y), lo que nos dice que,en general, la funcion h mencionada en el Teorema 10.3 no es facil deencontrar. B

Page 366: Libro Mate 4

366 Funciones implıcitas

Ejercicios.

1. Mostrar que f(x, y) = c define una funcion implıcita y = h(x) alrededordel punto dado p = (a, b). Calcular y′ = h′(a).

a. f(x, y) = y cosxy en p = (π/2, 1)b. f(x, y) = xey − y + 4 en p = (−2, 1)c. f(x, y) = xy + y4 + x4 en p = (1,−1)d. f(x, y) = x2 + 2xy + y2 en p = (1, 1)

2. Mostrar que la funcion f(x, y, z) = c define una funcion implıcita z =h(x, y) en una vecindad del punto dado p = (a, b, c). Calcular ∂h

∂x (a, b) y∂h∂y (a, b).

a. f(x, y, z) = z − z3 + xy sen z en p = (0, 0, π/2)b. f(x, y, z) = x2 + y2 + z2 + 2xyz en p = (1, 1, 1)c. f(x, y, z) = x− y + 2z − exyz en p = (0, 1, 1)

Page 367: Libro Mate 4

Indice

Algebra Lineal, 3, 339angulo, 3Anton, 112

bola, 153

campo (s)conservativo, 264de rotacion, 267escalar, 159, 181gradiente, 256vectorial, 211, 214, 255vectorial gradiente, 267

cilindrocircular recto, 290exponencial, 292sinusoidal, 291

cırculo, 315unitario, 132

combinacion lineal, 222compacto, 356conexo, 158conjunto abierto, 153cono

circular, 294elıptico, 295

coordenadaspolares, 323, 370pseudoesfericas, 282

curva (s), 3angulo entre, 313, 317de nivel, 343diferenciable, 135

integral, 258longitud de, 314longitud de arco de, 313orientacion de, 309parametrizacion de, 145poligonal, 309poligonal orientada, 311regular, 136, 147regular parametrizada, 144reparametrizacion de, 309suave por pedazos, 311

cuspide, 142

derivada, 227cociente parcial, 170conmutatividad de las segun-

das parciales mixtas, 187direcional, 181parcial, 170parcial de orden superior, 184parciales mixtas, 186, 190segundas derivadas parciales,

185desigualdad del triangulo, 79desplazamiento infinitesimal, 272determinante (s), 10, 11, 21

cofactor de un, 24elementos del, 22menor de un, 23ordenes, 31paridad de, 23Teorema del desarrollo de, 25

difeomorfismo

Page 368: Libro Mate 4

368 INDICE

global, 369diferencial, 227

total, 201total de segundo orden, 202

dimension, 67disconexo, 158distancia, 3, 78, 81, 124divergencia, 266

ecuacionde Laplace, 278del calor, 276del plano, 115diferencial de Laplace, 209parametrica, 113

elipsoide, 295, 297circular, 296

error, 191, 192escalar, 14, 19, 69esfera, 286espacio

Euclidiano, 74tangente, 329vectorial real, 72

estacionaria, 278estructura algebraica, 69

flujo, 259formas cuadraticas, 335, 336, 339frontera, 157funcion

clase de una, 186continua, 325continua en el punto, 325coordenada, 212diferenciable, 134, 135, 173,

174, 227, 228implıcita, 371inversa, 234, 236inversa local, 239potencial, 264vectorial, 129vectorial suave, 135

Geometrıa Algebraica, 169, 348gradiente, 172grafica, 160

helice, 133hiperboloide

circular, 289circular de dos hojas, 299circular de una hoja, 297, 298de dos hojas, 299de una hoja, 297elıptico, 300

hiperplano, 121

intervalo abierto, 153

k−esima diferencial total, 203

Lagrange J. L., 357Lema de Sylvester de diagonali-

zacion, 339ley de gravitacion universal, 257ley del paralelogramo, 71lımite (s), 320

aritmetica de, 321cambio de coordenadas en, 322

marco, 312Mathematica, 167, 169matriz (es), 11

cuadrada, 12diagonal, 108, 339diagonalizable, 108dimensiones de una, 11ecuacion caracterıstica de una,

63entrada de una, 12Hessiana, 334identidad, 21inversa, 32, 56, 57invertible, 32, 58Jacobiana, 225–227Jacobiano de una, 240

Page 369: Libro Mate 4

INDICE 369

nula, 12, 14operaciones elementales de, 48,

52, 53ortogonal, 65principal, 10real, 11semejante, 53, 54simetrica, 335submatrices, 10transpuesta, 15valor propio de una, 63, 100vector propio de una, 102

metodo de Gauss-Jordan, 52multiplicadores de Lagrange, 357

numeros imaginarios, 101

paraboloide, 300circular, 288, 301, 337elıptico, 301hiperbolico, 302, 338

plano (s), 3, 285tangente, 330

polinomiocuadratico, 190cubico, 191de Taylor, 190, 197lineal, 190

problema de Dirichlet, 278punto

aislado, 319crıtico, 168, 333crıtico degenerado, 354crıtico no degenerado, 341de acumulacion, 319frontera, 157regular, 332silla, 338, 346singular, 167

recta (s), 3region, 159regla de la cadena, 177, 229, 231

regla de la mano derecha, 312Reyes J.G, 319

separatrices, 347silla de montar, 167, 302singularidad algebraica, 322sistema

compatible, 38, 50de coordenadas cartesiano, 67escalonado, 48homogeneo, 40, 43inconsistente, 50parametrizado, 40

solucionbiparametrica, 53parametrica, 53trivial, 40, 41, 44

superficiebase de una, 292cilındrica, 290conica, 292de revolucion, 286directriz de una, 290generatriz de una, 290ordinaria, 285

Teorema de diferenciabilidad, 174,227

Teorema de invarianza de dominio,369, 371

Teorema de la funcion implıcita,371, 372, 374, 375

Teorema de La regla de Cramer,35

Teorema de Lagrange, 357Teorema de Pitagoras, 79Teorema de Taylor, 196, 332Teorema de Weierstrass, 356Teorema del determinante de un

producto, 31Teorıa de singularidades y Catastrofes,

354Topologıa Algebraica, 369

Page 370: Libro Mate 4

370 INDICE

tranformacion (es)lineal, 218, 219

transformacion (es)elementales, 31lineal, 217, 219

traslacion de ejes coordenados, 302

valor (es)crıtico, 333extremo restringido, 357maximo global, 335maximo local, 335, 337, 357mınimo global, 335mınimo local, 335, 336, 357propio, 339regular, 332

variacion, 170, 181vector (es), 3, 72

aceleracion, 148angulo entre, 78, 118base canonica de, 78, 95base de, 94, 99canonico, 77columna, 12combinacion lineal de, 91de Hamilton, 266de posicion, 71, 73dependencia lineal de, 93director, 113linealmente independientes, 94norma del, 74, 75, 78normal, 115, 312orientacion negativa, 98orientacion positiva a la derecha,

98ortogonales, 79, 84paralelos, 74, 85, 87producto escalar de, 75, 89producto mixto de, 89producto punto de, 75producto vectorial de, 84proyeccion de un, 83

proyeccion ortogonal de un,82

rapidez, 140regla de la mano derecha, 98,

99renglon, 11resultante, 72tangente, 145unitario, 81velocidad, 134, 140velocidad promedio, 134

vertice, 292

Page 371: Libro Mate 4

Bibliografıa

Anton, H., Introduccion al Algebra Lineal, ed. Limusa, Mexico, 1981.

Lima, E.L., Curso de Analise, Projeto Euclıdes, IMPA, Rio de Janeiro,Brasil, 1992.

Reyes, J. G., Calculo Diferencial para las Ciencias Naturales, Trillas, 1996.