Introducción a la Programación No Lineal

download Introducción a la Programación No Lineal

of 45

description

Se hace una revisión de los algoritmos básicos de programación no lineal y se explora la aplicación de algoritmos genéticos a la optimización en problemas no lineales.

Transcript of Introducción a la Programación No Lineal

Introduccin a la Programacin Lineal

Claudia Liliana Daza Garzn [email protected]

Trabajo de Grado para Optar por el Ttulo de Matemtico

Director: Pervys Rengifo Rengifo Ingeniero Universidad Nacional de Colombia

Fundacin Universitaria Konrad Lorenz Facultad de Matemticas

2 de junio de 2005

Tabla de contenido

Introduccin__________________________________________________________ 3 Programacin no lineal_________________________________________________ 4 Optimizacin clsica variable unidimensional_______________________________ 4Utilizacin de mtodos numricos en la determinacin de puntos crticos___________ 10

Optimizacin clsica variable multidimensional ____________________________ 11Condiciones necesarias y suficientes para la existencia de puntos ptimos __________ 16 Utilizacin de mtodos numricos en la determinacin de puntos estacionarios______ 19Mtodo de Newton para sistemas de ecuaciones _____________________________________20

Extremos restringidos. Multiplicadores de Lagrange ___________________________ 23Mtodo de los multiplicadores de Lagrange ________________________________________24

Optimizacin no clsica variable multidimensional _________________________ 26Mtodo del gradiente ______________________________________________________ 26 Programacin separable ___________________________________________________ 29 Algoritmos Genticos: un cambio de paradigma _______________________________ 35Caractersticas de los algoritmos genticos _________________________________________43

Conclusiones ________________________________________________________ 44 Bibliografa _________________________________________________________ 45

2

IntroduccinLas matemticas prestan su servicio a la sociedad mediante la elaboracin de modelos matemticos de la realidad. Esta modelacin consiste en crear un objeto conceptual que refleje las caractersticas relevantes de un fenmeno para, a partir de tal simplificacin, llegar a extraer conclusiones que enriquezcan, en algn sentido, el conocimiento que hasta el momento se tiene del fenmeno. Una modelacin de gran importancia y utilidad el la modelacin lineal, la cual acude al empleo de funciones lineales para conseguir sus objetivos. Sin embargo, a medida que crece la complejidad de los fenmenos que nos rodean, comienza a hacerse necesario modelar fenmenos con los cuales las aproximaciones lineales son notoriamente ineficaces. Por esta razn es necesario emplear modelos no lineales que se ajustan de una manera ms precisa a las realidades de alto grado de complejidad. Uno de los propsitos fundamentales con los cuales se construyen modelos matemticos es el de obtener respuestas a problemas de ptimizacin, esto es, a la toma de decisiones inmejorables. La modelacin lineal tiene en los mtodos smplex y del punto interior (de Karmarkar) unas herramientas de gran poder que le permiten resolver problemas con grandes cantidades de variables y restricciones. Este no es el caso de los modelos no lineales, en los cuales, como se ver, los caminos de fcil recorrido constituyen ms la excepcin que la norma. Sin embargo, el trabajo realizado en este campo ha estado guiado por unas grandes dosis de ingenio, que han llevado a la creacin de algoritmos de base puramente matemtica, a otros que mezclan resultados matemticos con procesos heursticos y, finalmente, como es el caso de los algoritmos genticos, a emular los procesos de evolucin biolgica, que han llevado a muchas formas de vida a elevados niveles de complejidad y sosfisticacin, como estrategia para la resolucin de problemas. El trabajo, de carcter exploratorio, ha pretendido ser algo ms que una recopilacin muda de resultados ya plenamente establecidos. No se ha dejado escapar la oportunidad de hacer, lo que se han considerado, pequeos aportes, en su mayora de tipo pedaggico. Como su taln de Aquiles puede mencionarse la escasez de los mtodos tratados, muchos de los cuales ni siquiera estn dentro de los considerados como de alto rendimiento, sin embargo, la razn ha sido que, como lo indica el nombre, se trata de una introduccin, que busca llamar la atencin tanto sobre resultados tericos de bajo nivel que muchas veces se pasan por alto, as como tambin sobre el empleo de las herramientas informticas, tanto como ayuda para las tcnicas clsicas, as como cuando son la base de metodologas que estn completamente inspiradas en ellas. El campo es extenso y fascinante. El trabajo realizado es de dimensiones modestas, pero aspira a reflejar, al menos en algn momento, algo de la belleza que se encontr en la etapa exploratoria.

3

Programacin no linealSe puede dar una definicin de programacin no lineal (PNL) por contraposicin con la programacin lineal (PL). Recurdese que esta ltima trata el problema de optimizar una funcin lineal f : R n R sujeta a una serie de restricciones tambin lineales. Si el problema se modifica, cambiando la funcin objetivo y/o, al menos, una de las restricciones, por no lineales, se cae en el campo de la PNL. La teora clsica de la optimizacin acude al empleo del clculo diferencial para determinar los puntos en los cuales la funcin f : R n R asume valores ptimos (mximos o mnimos). Luego de unas definiciones esenciales se expondrn algunos resultados tericos as como ejemplos de solucin de problemas mediante la aplicacin de esta teora. Se inicia con la teora propia de las variables unidimensionales, pues este campo permite la comprensin intuitiva de los conceptos y procedimientos empleados, y tambin, porque algunos de sus resultados tiene aplicacin directa en la extensin de la teora a las variables multidimensionales.

Definicin 1: se dice que una funcin f : S R, S R n tiene un mximo absoluto

(o global) en un punto

S si

f ( [ ) f (D )

para todo x de S. El nmero f (D) se llama mximo absoluto de f en S. D

Definicin 2: se dice que una funcin f : S R, S R n tiene un mximo relativo (of ( [ ) f (D ) para todo x B (D, r ) . El nmero f (D ) se llama mximo relativo de f en S.De las definiciones 1 y 2 se concluye que todo mximo absoluto es, a su vez, mximo relativo. Las definiciones de mnimo absoluto (o global) y mnimo relativo (o local) se hacen de manera equivalente.

local) en un punto

S si existe r > 0 tal que

Optimizacin clsica variable unidimensionalDefinicin 3: Un punto crtico de una funcin f : R R es un nmero c para el cualf (c) = 0 o f (c) no existe.

Teorema 1: Si una funcin f : R R tiene un mximo o mnimo relativo en un puntoc, entonces c es un punto crtico.

4

Demostracin: si f (c) no existe, entonces c es un punto crtico. Supngase ahora quef (c) existe. Defnase la funcin

g ( x) =

f ( x ) f (c ) para x c xc f ' (c ) para x = c

(1)

entonces lim g ( x) = g (c) y, en consecuencia , g es continua en c. Se debe demostrarx c

que g(c) = 0, para ello se procede por contradiccin: si g(c) > 0, por la propiedad de la conservacin del signo para funciones continuas, existe un intervalo que contiene a c en el cual g(x) es positiva. Por lo tanto en (1), para x en el intervalo mencionado, x c, el numerador tiene el mismo signo que el denominador, lo cual implica que si x > c entonces f(x) > f(c), y si x < c entonces f(x) < f(c). Esto contradice la hiptesis de que f tiene un extremo en c. De manera similar se demuestra que suponer que g(c) < 0 conduce a la misma contradiccin, por lo tanto g(c) = 0 y como g(c) = f ' (c) ha concluido la demostracin. El resultado anterior garantiza que si f tiene un ptimo en c, entonces c es un punto crtico. El recproco no es cierto, como lo demuestra el conocido contraejemplo f ( x) = x 3 , pues f ' ( x) = 3 x 2 y entonces f ' (0) = 0 , con lo cual 0 es un punto crtico de f y, sin embargo, f no tiene un ptimo en 0 como se ve en la figura 1.

Figura 1Entonces, para determinar el conjunto de puntos ptimos de una funcin debe hacerse un trabajo adicional, luego de haber determinado el conjunto de puntos crticos, pues solo algunos de ellos sern puntos ptimos. El siguiente teorema aporta las herramientas para realizar este trabajo.

Teorema 2 (criterio de la primera derivada para extremos en un punto crtico): Supngase que f : R R es continua en un intervalo [a, b] y que existe f 'en todo punto de (a, b), excepto posiblemente en c (a, b), entonces: 1. Si f es positiva para toda x, con a < x < c, y negativa para toda x, con c < x < b, entonces f tiene un mximo relativo en c.5

2. Si f es negativa para toda x, con a < x < c, y positiva para toda x, con c < x < b, entonces f tiene un mnimo relativo en c. 3. Si f es positiva (negativa) para toda x, con a < x < b, x un ptimo relativo en c. c, entonces f no tiene

Demostracin: en el caso 1. f es estrictamente creciente en [a, c] y estrictamente decreciente en [c, b]. Entonces f(x) < f(c) para todo x c en [a, b] y por lo tanto f tiene un mximo relativo en c. El caso 2 se demuestra de manera anloga. La hiptesis del caso 3 implica que f es estrictamente creciente (decreciente) en [a, b] y, en consecuencia, no puede tener ptimos relativos en el punto interior c. Ejemplo 1: encuentre los puntos en los cuales f ( x) = x 3 3 x 2 24 x + 2 tienevalores ptimos y determine de que clase son. crticos, en consecuencia, el primer paso es determinarlos:

Solucin: segn el teorema 1 los candidatos a ser puntos ptimos son los puntosf ' ( x) = 3 x 2 6 x 24 = 3( x + 2)( x 4) (2)

la derivada est definida en todo , en consecuencia, se buscan aquellos puntos crticos para los cuales f (x) = 0. 3( x + 2)( x 4) = 0 (3) tiene como soluciones x = 4 y x = -2. El producto en (2) es positivo cuando los dos trminos variables son ambos negativos, o ambos positivos, por lo tanto, f (x) > 0 en (- , -2) y en (4, ), y f (x) < 0 en (-2, 4). Entonces, es posible construir un intervalo alrededor de -2 tal que f (x) > 0 para x < -2 y, f (x) < 0 para x > -2 en consecuencia, segn el teorema 2, f tiene un mximo en x = -2, con un valor f(-2) = 30. Un razonamiento anlogo lleva a concluir que f tiene un mnimo en x = 4, con f(4) = -78. La figura 2 muestra una comprobacin grfica de este hecho.

Figura 26

Ejemplo 2: encuentre los puntos en los cuales f ( x) = 3x 2 / 3 + 5 tiene valoresptimos y determine de que clase son. 2 esta funcin nunca es cero y no est definida en x x = 0. En consecuencia x = 0 es el nico punto crtico. Es evidente que para x < 0, f (x) < 0, y para x > 0, f (x) > 0. Aplicando el teorema 2 se concluye que f tiene un mnimo en x = 0. La figura 3 ilustra la situacin.

Solucin: f ' ( x) = 2 x 1 / 3 =

3

Figura 3

Ejemplo 3: encuentre los puntos crticos de f ( x) = x 3 y establezca si en ellos f tieneptimos relativos.

Solucin: f ' ( x) = 3x 2 entonces f est definida en todo . El nico punto crtico de fes entonces x = 0. Sin embargo, f (x) es positiva para todo x , x 0. Y por el caso 3 del teorema 2 se concluye que f no tiene ptimos relativos en 0, pues es estrictamente creciente en toda vecindad de 0. Vase la figura 1. El siguiente teorema, en algunos casos, facilita los clculos que permiten concluir que tipo de ptimo se presenta en un punto crtico c. Es aplicable nicamente cuando c es tal que f (c) = 0 y f (c) 0. Es til para funciones como la del ejemplo 1; no puede ser usado en funciones como la del ejemplo 2. Para funciones como la del ejemplo 3, para la cual f (c) = 0, se expondr un teorema especial ms adelante.

existe, entonces:

Teorema 3 (criterio de la segunda derivada para extremos en un punto crtico): Supngase que c (a, b) y que f (c) = 0. Supngase, adems, que f (c)1. Si f (c) < 0, f tiene un mximo relativo en c. 2. Si f (c) > 0, f tiene un mnimo relativo en c.

Demostracin: En el caso 1, al ser f negativa en c, f es estrictamente decrecienteen una vecindad alrededor de c y como f (c) = 0 entonces f pasa de positivo a negativo en c, aplicando el caso 1 del teorema 2 se concluye que f tiene un mximo relativo en c. El caso 2 se demuestra de manera anloga.

7

Ejemplo 4: En el ejemplo 1 se estableci que x = 4 y x = -2 son los puntos crticos def ( x) = x 3 3 x 2 24 x + 2 , tales que f (-2) = 0 y f (4) = 0. Empleando el teorema 3, determine que clase de valores ptimos son. f ' ( x) = 3 x 2 6 x 24 f ' ' ( x) = 6 x 6

Solucin:y

f (4) = 18 > 0, entonces f tiene un mnimo relativo en 4. f (-2) = -18 < 0, entonces f tiene un mximo relativo en -2. El teorema 3 no dice que ocurre en el caso de que f (c) = 0. Este es el caso de f ( x) = x 3 y f ( x) = x 4 . El siguiente teorema resuelve este problema.

Teorema 4: Sea f que posee n-sima derivada continua en el intervalo (a, b).Supngase que para un cierto punto c (a, b) se tiene: f ' (c) = f ' ' (c) = ... = f( n 1)

(c) = 0 , pero f ( n ) (c) 0 .(n)

entonces para n par, f posee un mnimo local en c si f c si f(n)

(c) > 0 , y un mximo local en

(c) < 0 . Si n es impar, no existe ptimo en c.

Demostracin: Como f ( n ) (c) 0 existe un intervalo (a, b) que contiene a c, tal quepara cada x (a, b) la derivada f ( n ) ( x) tiene el mismo signo que f ( n ) (c) . Por la frmula de Taylor con resto (con el resto en la forma de Lagrange) se tiene f ( x ) f (c ) = f(n)

( x1 ) ( x c) n , donde x1 (a, b) n!(n)

Si n es par, esta ecuacin implica que f(x) f(c) cuando f(n) (n)

(c) > 0, y f(x) f(c)

cuando f (c) < 0. Si n es impar y f (c) > 0, entonces f(x) > f(c) cuando x > c, y f(x) < f(c) cuando x < c, en consecuencia no existe ptimo en c. Se llega a una conclusin anloga cuando n es impar y f ( n ) (c) < 0. Ntese que el teorema 3 es un caso particular del teorema 4. Este hecho puede ser empleado como nemotecnia para recordar el resultado.

Ejemplo 5: En el ejemplo 3 se estableci que 0 es el nico punto crtico de f ( x) = x 3 ,emplee el teorema 4 para determinar que clase de punto crtico es.

Solucin:

f ' ( x) = 3x 2

entonces

f (0) = 0

8

f ' ' ( x) = 6 x

entonces

f (0) = 0

f ( 3) ( x ) = 6 0 como 3 es impar y la funcin constante 6 es continua se concluye que en x = 0 no se presentan ptimos relativos.

Ejemplo 6: Determine los puntos crticos de f ( x) = x 4 y establezca de que clase son. Solucin:f ' ( x) = 4 x 3 f ' ' ( x) = 12 x f ( 3) ( x) = 24 x f( 4) 2

entonces entonces entonces ( x) = 24 0

f (0) = 0 f (0) = 0 f( 3)

( 0) = 0

como 4 es par y como, adems f ( 4) (0) > 0 , entonces en x = 0 la funcin tiene un mnimo relativo. Hasta el momento no se ha tratado el caso en el cual la funcin a optimizar se encuentra restringida en su dominio. En tales casos los extremos del intervalo, o los intervalos, son candidatos a ser puntos ptimos. Este caso es tratado en el ejemplo siguiente.

Ejemplo 7: Determine los puntos ptimos derestringe segn los casos: a) [-1, 2] b) [2,3].

f ( x) = x 2 cuando su dominio se

Solucin: La figura ilustra el efecto, sobre los puntos ptimos, de restringir el dominio

de una funcin. En el caso a) el mnimo absoluto es el mismo que cuando no hay restriccin, y aparece un mximo absoluto que no existe en el caso irrestricto. Para b) tanto el mximo como el mnimo absolutos no existen en el caso irrestricto y, en este caso, coinciden con los extremos del intervalo.

Figura 4

9

Utilizacin de mtodos numricos en la determinacin de puntos crticosEn algunos casos la solucin de la ecuacin f (x) = 0 no puede calcularse por medios algebraicos y es necesario recurrir a algn mtodo numrico para llevar a cabo esta labor. En el siguiente ejemplo se ilustra esta situacin.

Ejemplo 8: Determine los puntos en los cuales la funcin g ( x) = x 3 sen( x) presentaptimos relativos.

Solucin: En primer lugar se grafca la funcin para tener una idea de donde puedenlocalizarse los ptimos relativos.

Figura 5La figura 5 permite concluir que, efectivamente, existen ptimos y que estos se encuentran, el primero en [-1, 0] y el segundo en [0, 1]. El procedimiento a seguir es similar al de los ejemplos anteriores. g ' ( x) = 3 x 2 - cos(x) Esta funcin est definida en todo , entonces, los puntos crticos son las soluciones de 3x - cos(x) = 0 para resolver esta ecuacin es necesario acudir a los mtodos numricos. En este caso se emplear el mtodo de Newton. Este mtodo consiste en la aplicacin de la ecuacin recursiva f ( xn ) x n +1 = x n f ' ( xn )

10

en donde x0 es un nmero prximo a la raz buscada. Para este caso se tiene f ( x) = 3 x 2 - cos(x) f ' ( x) = 6 x + sen(x) tomando x1 = -0.8 los clculos son los siguientes: Iteracin 0 1 2 3 4 5 xi f ( xi ) -0.8 1.22329329 -0.5782827 0.16583011 -0.53699325 0.00583458 -0.53543049 8.3762E-06 -0.53542824 1.7364E-11 -0.53542824 0 Tabla 1 f ' ( xi ) -5.517356091 -4.016282878 -3.733514265 -3.722794298 -3.722778863 -3.722778863

Se tiene entonces, que x = -0.53542824 es el punto crtico que se encuentra en [-1, 0]. En virtud de la simetra de f se concluye que el punto crtico en [0, 1] es x = 0.53542824. Para determinar que clase de ptimo es x = -0.53542824 evaluamos g en puntos cercanos a x uno a la izquierda y el otro a la derecha: g (-0.54) = 1.7*10 2 > 0 y g (-0.52) = -5.6*10 2 < 0 haciendo analoga con el caso 2 del teorema 2 se concluye que en x = -0.53542824 g tiene un mximo local. Un procedimiento anlogo permite concluir que en x = 0.53542824 g tiene un mnimo local. Estos resultados confirman lo observado en la figura 5. (En este ejemplo hemos incurrido en una imprecisin terica al afirmar que x es igual al nmero encontrado con el mtodo numrico, sin embargo, para efectos prcticos, este hecho es irrelevante pues la solucin puede ser calculada con la precisin requerida por el problema que se este resolviendo en el momento. Como ejemplo se muestra el resultado que se obtiene al emplear Matemtica con una precisin de 40 decimales: x = -0.5354282441646569523641119303647428750992).

Optimizacin clsica variable multidimensionalDefinicin 4 (Derivadas direccional y parcial): Sea f : S R, S R n . Si y esun vector unitario y a es un punto interior a S, la derivada

f ' (D \ ) = limh 0

f ( D + h\ ) f ( D ) , h>0 h

se llama derivada direccional de f en a en la direccin de y. Si y = H k (el k-simo f ' (a; H k ) se denomina derivada parcial respecto a x k y se representa mediante el smbolo vector de la base cannica de R n ) la derivada direccional

11

f (a1 ,..., a n ) . x k En el caso de la variable bidimensional el significado geomtrico de esta derivada es una generalizacin del caso unidimensional. La figura 6 ilustra la situacin

Figura 6las alturas de f (a) y f (a + hy) son perpendiculares a la hoja y pasan por los puntos a y a + hy respectivamente. Como y es unitario la longitud del segmento que une a con a + hy tiene una longitud igual a h. Los cuatro puntos: a, a + hy, f (a) y f (a + hy) estn todos contenidos en un plano perpendicular al plano xy que sigue la direccin del segmento que une a con a + hy. Con esto en mente se puede concluir que la derivada direccional representa la pendiente de la recta tangente a la curva que se forma al intersecar la superficie con el plano que es perpendicular al plano xy, que pasa por a y es paralelo a y.

Definicin 5: El vectorf ( D ) =

f (D) f (D ) f (D ) , , ... , x1 x 2 x n

se conoce como el gradiente de f en a.

Teorema 5: Sea f : S R, S R n . Una condicin necesaria para que f tenga unptimo en a es que f (D ) = .

Demostracin : Si f tiene un ptimo en a, al dejar constantes n-1 variables y analizarproyeccin de la funcin tiene un ptimo en a k y, como se estara en el caso unidimensional, segn el teorema 1 la derivada de la funcin proyeccin debe ser igual a cero. Como este resultado se tiene para todas y cada una de las variables, necesariamente f (D ) = .

la situacin en la variable restante, digamos x k , debe tenerse que, para esta, la

El teorema 5 motiva un mtodo, anlogo al empleado en el caso de variable unidimensional, para encontrar puntos ptimos. Este mtodo consiste en determinar los puntos en los cuales el gradiente se hace cero. Sin embargo, como en el caso

12

unidimensional, la anulacin del gradiente es una condicin necesaria, pero no suficiente, para la existencia de ptimos. La definicin 6 introduce la terminologa que se emplea para clasificar los diferentes casos. Mas adelante se establece un criterio, tambin anlogo al del caso unidimensional, basado en las segundas derivadas para establecer que clase de ptimo (si lo es) es un punto en el cual se anula el gradiente.

Definicin 6: Un punto a para el cual f (D) = se conoce como punto estacionario de f. Un punto estacionario se llama de silla (o de ensilladura) si toda n-bola B(a)contiene puntos x tales que f(x) < f(a) y otros para los cuales f(x) > f(a).

Ejemplo 9 (mtodo de los mnimos cuadrados): Cada planeta, con una nica

excepcin, se halla entre 1,3 y 2,0 veces tan alejado del Sol en relacin al siguiente planeta ms cercano. La nica excepcin es Jpiter, el quinto planeta, que se halla 3,4 veces ms alejado de lo que est Marte. Este hecho intrig notablemente a los astrnomos Podra existir un planeta en el hueco entre Marte y Jpiter? Heinrich Wilhelm Mathias Olbers, astrnomo alemn, reclut un grupo que planeaba emprender la bsqueda sistemtica del planeta faltante. Sin embargo, en la noche del 31 de diciembre de 1800 Giuseppe Piazzi, astrnomo italiano, quien desconoca la existencia y los propsitos del grupo de Olbers, localiz, en el mencionado hueco, un objeto celeste que variaba de posicin de un da al siguiente. Lo denomin Ceres y fue el primer asteroide de que se tuvo noticia. Un mes despus Ceres desapareci detrs del Sol. En los meses posteriores fue buscado infructuosamente en los cielos. Tres meses despus apareci exactamente en el lugar en el cual Carl Friedrich Gauss, matemtico alemn, empleando un mtodo de su invencin para analizar las observaciones hechas, haba predicho que lo hara. El mtodo inventado por Gauss se denomina de los mnimos cuadrados, y consiste en una tcnica que se utiliza para encontrar la curva que se ajusta mejor a un conjunto de resultados experimentales, de manera que sea mnima la suma de los cuadrados de las diferencias entre las ordenadas de dichos puntos y las de la curva que tienen la misma abscisa. El ejemplo que sigue desarrolla la idea del mtodo.

Dadas n parejas ordenadas distintas ( x1 , y1 ), ( x 2 , y 2 ), ... , ( x n , y n ) no siempre es posible encontrar una recta f ( x) = mx + b que pase por todos los puntos ( xi , y i ) . Sin embargo, pueden calcularse las constantes m y b de tal manera que la recta f ( x) = mx + b se ajuste de la mejor manera a la coleccin de puntos. Antes de resolver el problema se considerar el mejor criterio segn el cual se puede afirmar que la recta se ajusta de la mejor manera. En cada punto el error cometido ser igual a la diferencia entre el valor generado por la frmula f ( x) = mx + b y el valor tabulado, esto es, ei = f ( xi ) y i = mxi + b y i . Vase la figura 7.

Figura 7

13

Cualquier mtodo debe, de alguna manera, minimizar el total de los errores cometidos. En un primer momento podra pensarse en minimizar la suma de todos los errores, esto es, minimizarn i =1

f ( xi ) y i

La figura 8 muestra que no es una buena idea, pues lo mnimo que se espera de la recta de ajuste es que, cuando se tienen exactamente dos puntos, pase por ambos. Este no es el caso, pues cualquier recta que pase por el punto medio, con la nica excepcin de una vertical, cumple la condicin de minimizar la suma de los errores, hacindola igual a cero (ntese que los errores son iguales en magnitud pero de signo contrario).

Figura 8Una solucin alternativa sera intentar minimizar la suma de los valores absolutos de los errores, o sea, minimizarn i =1

f ( xi ) y i

la dificultad de este enfoque radica en que es necesario calcular derivadas parciales pero el valor absoluto es una funcin que se define por partes y que, adems, no es derivable en 0. Todas estas dificultades son superadas con el enfoque de los mnimos cuadrados, el cual consiste en minimizar la suma de los errores al cuadrado, esto es, minimizarn i =1

( f ( x i ) y i )2 =

n i =1

(mxi + b yi )2

El problema se concreta entonces a determinar las constantes m y b de tal manera que se minimice S(m, b) =n i =1

(mxi + b yi )2n S = 2 (mxi + b yi )xi m i =1 n S = 2 (mxi + b y i ) b i =1

Solucin:

igualando estas derivadas parciales a cero se obtiene 14

m

n i =1

xi2 + bn i =1

n i =1

xi =

n i =1 n

xi y i

m

xi + nb =

i =1

yi

Este es un sistema lineal de dos ecuaciones con dos incgnitas, resolviendo por el mtodo de sustitucin, de la segunda ecuacin se obtienen

b= reemplazando en la primeran

i =1

yi m nn i =1

n i =1

xi

m

n i =1

x +2 i

i =1

yi m n

xi

n i =1

xi =

n i =1

xi y i

despejando mn n

m=

i =1

xi y i

i =1

xi

n i =1

yi n2

n i =1

nn i =1

=

xi y i n

n i =1 n

xi

n i =1

yi2

n i =1

xi n

n

x 2 i

x 2 i

i =1

i =1

xi

resumiendo

n m=

n i =1

xi yi n

n i =1 n

xi

n i =1

yi2

n

y

b=

i =1

yi m n

n i =1

xi

n

x 2 i

i =1

i =1

xi

es la solucin pedida. Cualquier hoja de clculo o calculadora cientfica genera ests cantidades a partir de los datos introducidos. En consecuencia, la recta de regresin esf ( xi ) = Yi = mxi + b

Ejemplo 10: Demuestre que para la recta de regresin encontrada en el ejemploanterior se tienen i =1

f ( xi ) y i = 0n i =1 n i =1

Solucin:

n i =1

f ( xi ) y i =n i =1

Yi y i =

mxi + b y i =

m

xi + nb

n i =1

yi =

15

m

n i =1

xi +

n i =1

yi m

n i =1

xi

n i =1

yi = 0

Aunque se ha trabajado nicamente la regresin de tipo lineal en dos variables, el enfoque de los mnimos cuadrados puede extenderse directamente a polinomios de grado n (en el caso de que se tengan n + 1 puntos el polinomio de regresin ser precisamente el polinomio de colocacin), el grado del polinomio puede establecerse por algn resultado terico, alguna expectativa o por la aplicacin que se le pretenda dar. Mediante transformaciones, problemas no lineales pueden adaptarse para hacer regresin lineal a datos que, por ejemplo, se ajusten aproximadamente a una exponencial del tipo y = ab cx , ya que, evaluando en ambos lados logaritmos de base b se obtiene log b y = log b a + cx y haciendo las sustituciones Y = log b y y A = log b a se llega a una ecuacin de tipo lineal. Tambin es posible trabajar en ms de dos dimensiones encontrando, ya no la recta, sino el hiperplano que mejor se ajusta a una nube de puntos en R n .

Condiciones necesarias y suficientes para la existencia de puntos ptimosEl mtodo empleado en el ejemplo 9 se limit a determinar un punto estacionario de f. Las derivadas parciales estn definidas en todo el plano y, en consecuencia, este punto estacionario es nico. Consideraciones tericas propias del caso particular que se estaba tratando permitan concluir que la solucin exista. Por lo tanto se asumi que en este punto se presenta el mnimo buscado. Este procedimiento es lcito. Sin embargo, este no es siempre el caso: la existencia de varios puntos estacionarios puede hacer necesario que se clasifiquen en mximos, mnimos o puntos de silla. Tambin puede ocurrir que el modelo matemtico no garantice la existencia de la solucin y, en consecuencia, en los puntos estacionarios hallados pueden presentarse puntos de silla u ptimos de naturaleza contraria a los buscados. Estas consideraciones hacen que sea necesario contar con un criterio de clasificacin de los puntos estacionarios. Las definiciones y el teorema, sin demostracin, que se presentan en seguida suplen esta necesidad.

Definicin 7: La matriz n x n de las segundas derivadas parciales de f es llamadamatriz hessiana y se designa por H(x). As, se tiene 2 f ([ ) x12 2 f ([ ) H ( [ ) = x x 2 1 2 f ([ ) x n x1 2 f ([ ) x1x 2 2 f ([ ) 2 x 2 2 f ([ ) x n x 2 2 f ([) x1x n 2 f ([) x 2 x n 2 f ([) 2 x n

16

Definicin 8: Dada la matriz A n x n se define el k-simo menor principal de A comoa11 a 21 a k1 a12 a 22 ak 2 a1k a2k a kk

k = 1,2, . . . , n

Definicin 9: Dada la matriz simtrica A n x n se dice que A es:1. definida positiva si los valores de los menores principales de A son positivos (no negativos). 2. definida negativa si el valor del k-simo menor principal tiene signo (1) k

Teorema 6: sea a un punto estacionario de f entonces1. Si H(a) es definida positiva f tiene un mnimo en a. 2. Si H(a) es definida negativa f tiene un mximo en a.

Ejemplo 11: encuentre los puntos ptimos de la funcin2 2 f ( x1 , x 2 , x3 ) = x1 + 2 x3 + x 2 x3 x12 x 2 x3

Solucin: el sistema

f = 1 2 x1 = 0 x1 f = x3 2 x 2 = 0 x 2 f = 2 + x 2 2 x3 = 0 x3

tiene como solucin el vector a = (1/2, 2/3, 4/3), entonces

2 H (D) = D 0 0

0

0

2 1 1 2

los menores principales de H tienen valores -2, 4, -6. Segn la definicin 9, H es definida negativa. Aplicando el teorema 6 se concluye que f tiene un mximo en a.

Ejemplo 12: Determine el punto del plano x + 2y + z = 1 ms cercano al origen. Solucin: El problema puede representarse comominimizar f (x, y, z) = x 2 + y 2 + z 2

17

sujeto a

x + 2y + z = 1

despejando z en la restriccin se tiene z = 1- x - 2y , reemplazndola en la funcin objetivo queda f = x 2 + y 2 + (1 x 2 y ) 2 calculando las derivadas parciales e igualando a cero f = 2 x 2(1 x 2 y ) = 0 x f = 2 y 4(1 x 2 y ) = 0 y o f = 4x + 4 y 2 = 0 x f = 4 x + 10 y 4 = 0 y

que tiene como solucin y = 1/3, x = 1/6. En consecuencia z = 1/6. As, el punto estacionario a es igual a (1/6, 1/3). Como ya se mencion, caractersticas propias del problema en particular (en este caso el hecho de que la distancia mnima de un punto a un plano siempre existe) garantizan que el punto encontrado corresponde a la solucin. Sin embargo, se harn los clculos que verifican este hecho. H (D) = 4 4

4 10

Los menores principales de H son 4 y 24. Por consiguiente H es definida positiva y f tiene un mnimo en a. Hecha esta confirmacin se puede afirmar que el punto solucin es (1/6, 1/3, 1/6).

Ejemplo 13: encuentre los puntos estacionarios def (x, y, z) = 2xyz - 4xz - 2yz + x + y + z - 2x - 4y + 4z.

Solucin: calculando las derivadas parciales e igualando a cerof = 2yz - 4z +2x - 2 = 0 x f = 2xz - 2z + 2y - 4 = 0 y

Nota: este problema pude resolverse acudiendo exclusivamente a argumentos geomtricos. La distancia mnima de un punto a un plano es la perpendicular del punto al plano. La solucin se halla, entonces, intersecando la recta (x, y, z) = t (1, 2 ,1) =(t, 2t, t), t que es perpendicular al plano con el plano. Para ello se resuelve para t la ecuacin t + 2(2t) + t = 1. La solucin es t = 1/6 y el punto es 1/6*(1, 2, 1) = (1/6, 1/3, 1/6).

18

f = 2xy 4x - 2y + 2z + 4 = 0 z Para resolver este sistema no lineal de 3 ecuaciones con 3 incgnitas se emplea el mtodo de sustitucin. Despejando x en la primer ecuacin reemplazando en la segunda x = 1 yz + 2z 2(1 yz + 2z)z - 2z + 2y - 4 = 0 haciendo el producto, simplificando y factorizando factorizando de nuevo z(4 - 2y) + 2y 4 = 0 (4 2y)(z - 1) = (4 2y)(z - 1)(z + 1) = 0 de esta ltima igualdad se concluye que y = 2 o z = 1 o z = -1. Reemplazando x en la segunda ecuacin 2(1 yz + 2z)y 4(1 yz + 2z) - 2y + 2z + 4 = 0 simplificando y factorizando en consecuencia z(y - 4y + 3) = z(y 3)(y - 1) = 0 z = 0 o y = 3 o y = 1.

Se escogen las parejas (y, z) de tal manera que se cumplan las 2 condiciones, por ejemplo, si se escoge y = 3 en la segunda condicin entonces, por la primera condicin, z = 1 o z = -1. Se tienen, por lo tanto, las parejas (3, 1) y (3, -1). Consideraciones anlogas dan como resultado las parejas (1, 1), (1, -1) y (2, 0). Tomando, por ejemplo, la pareja (3, 1) se obtiene x = 1 3*1 + 2*1 = 0, con lo cual se tiene la tripla (0, 3, 1). El mismo procedimiento conduce a la obtencin de los puntos (1, 2, 0), (2, 3, -1), (2, 1, 1) y (0, 1, -1) como puntos estacionarios de f.

Utilizacin de mtodos numricos en la determinacin de puntos estacionariosEl ejemplo 13, de fcil solucin, ilustra las bondades de un problema artificial, esto es, un problema que ha sido creado para que tenga una solucin relativamente fcil. En este caso la solucin del sistema de ecuaciones, originado al igualar el gradiente a cero, se pudo realizar acudiendo nicamente al lgebra elemental. Sin embargo, este tipo de

19

problemas constituyen la excepcin y no la regla cuando se presentan como parte de la solucin de un problema real de aplicacin. En estos casos, de manera similar a lo visto en el trabajo con variable unidimensional, hay que recurrir a algn mtodo numrico para resolver el sistema. El mtodo que se tratar aqu es el de Newton para sistemas de ecuaciones no lineales.

Mtodo de Newton para sistemas de ecuacionesDado el sistema de n ecuaciones F(x) = 0, donde

)( [ ) =

f1 ( [ ) f 2 ([ ) f n ([ )

El mtodo de Newton para sistemas consiste en la aplicacin de la ecuacin recursiva

[ k = [ k 1 [J ( [ k 1 )] )( [ k 1 )1

en donde [ 0 es un punto prximo a la raz buscada y

f 1 ( [ ) x1 f 2 ( [ ) J ( [ ) = x1 f n ( [ ) x1

f1 ( [ ) x 2 f 2 ( [ ) x 2 f n ( [ ) x 2

f 1 ( [ ) x n f 2 ( [ ) x n f n ( [ ) x n

Ejemplo 14: Encuentre los puntos estacionarios def (x, y, z) = 2x + y + z + 6(x + y + z) + 2xyz

Solucin: Calculando las derivadas parciales e igualando a cerof = 4x + 2yz + 6 = 0 x f = 2y + 2xz + 6 = 0 y f = 2z + 2x y + 6 = 0 z Para aplicar el mtodo de Newton se construye la matriz J

20

4

2z 2 y

J ([ ) = 2 z 2 2 x 2 y 2x 2Comenzando con [ 0 =(0, 0, 0) se tiene

4 0 0 J (0,0,0) = 0 2 0 0 0 2adems y

[J (0,0,0)]6

1/ 4 = 0 0

0

0

1

1/ 2 0 0 1/ 2

F(0, 0, 0) = 6

6se tiene entonces

1/ 4

0

0

6 6 = (-3/2, -3, -3) 6Zi 0 -3 -1.10526316 6.76180141 2.69855772 0.11834204 -0.92876013 2.17392051 1.01241321 2.46146365 1.79535061 1.6406222 1.63437 1.63436529 1.63436529

[ 1 = (0, 0, 0) -

0 0

1/ 2 0 0 1/ 2

Iteracin (i) 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Xi 0 -1.5 -0.31578947 6.5843733 3.11386779 1.82175404 -1.38308621 0.95034839 -1.33794065 -3.47952806 -2.88978861 -2.83385015 -2.83556311 -2.83557496 -2.83557496

Tabla 2

Yi 0 -3 -1.10526316 6.76180141 2.69855772 0.11834204 -0.92876013 2.17392051 1.01241321 2.46146365 1.79535061 1.6406222 1.63437 1.63436529 1.63436529

La tabla 2 resume los clculos. Ntese que los valores en la iteracin 14 coinciden con los de la 13 esto se debe a que F(x) = 0. As, partiendo del punto (0, 0, 0) se ha encontrado una solucin al sistema consistente en x = -2.83557496, y = 1.63436529 y z = 1.63436529. Sin embargo, en el ejemplo 13 se encontraron 5 puntos estacionarios (5 soluciones al sistema no lineal de ecuaciones) por lo tanto es probable que tambin en este caso existan varias soluciones. Un procedimiento intuitivo consiste en ejecutar las iteraciones a partir de diferentes puntos en busca de las otras races del sistema, por ejemplo, a partir del punto (15, -15, 5) se obtiene la solucin x = 1, y = - 4.1925824 y z = 1.1925824. Como los papeles de y y z en el sistema son simtricos, a partir de esta ltima solucin se deduce que x = 1, y = 1.1925824 y z = - 4.1925824 tambin es solucin. Obviamente esta tcnica de ensayo y error no constituye un mtodo de

21

aplicacin general y adems las simetras son extraas. Para evadir estas dificultades, se puede, en el caso particular del sistema que se est resolviendo, disminuir la dimensin del problema despejando x en la primera ecuacin y reemplazndola en las otras 2 con lo cual se obtiene: x = -(yz + 3)/2 y el sistema se reduce a y(2 - z ) - 3z + 6 = 0 - yz - 3y + 2z + 6 = 0 como para una solucin cualquiera deben satisfacerse simultneamente las dos ecuaciones, las soluciones se localizan en los puntos de interseccin de las 2 grficas. Esta situacin se ilustra en la figura 9

Figura 9As, es posible verificar de forma grfica que las races encontradas son todas las existentes. Es importante insistir que la tcnica empleada para la resolucin de este ejemplo no siempre es aplicable. En general es difcil determinar el nmero exacto de races, como tambin el lugar aproximado en donde se encuentran. Lo que se desea indicar es que, en la resolucin de cada problema en particular, es aconsejable acudir a todas las herramientas que sea lcito emplear en el momento. De manera anloga al caso unidimensional los ptimos de una funcin f de variable multidimensional, f : S R, S R n , tambin pueden presentarse en aquellos puntos para los cuales no existen las derivadas parciales o que corresponden a la frontera. El propsito del ejemplo 15 es ilustrar esta situacin.

Ejemplo 15: Dada f ( x, y ) = x 2 + y 2 definida en {(x, y) / x + y 4} que aparecegraficada en la figura 10

22

Figura 10es evidente que presenta un mnimo en (0, 0), punto en el cual las derivadas parciales

f = x

x x +y2 2

y

f = y

y x + y22

no existen. Adems f toma un valor mximo de 2 en todos y cada uno de los puntos de la frontera.

Extremos restringidos. Multiplicadores de LagrangeDe la misma manera que la derivada unidimensional f (a) representa la pendiente de la recta tangente a la curva f(x) en el punto (a, f(a)), el vector gradiente tiene una interpretacin geomtrica que es til en el momento de dar una motivacin del mtodo conocido como de los multiplicadores de Lagrange. El vector gradiente f (D ) es un vector normal (perpendicular) al plano tangente a la superficie f(x) en el punto (a, f(a)). Este hecho se ilustra en la figura 11.

Figura 11Se introducen las ideas del mtodo mediante la solucin de un problema de aplicacin.

23

Ejemplo 15: Encuentre los puntos de la superficie z - xy = 1 ms prximos al origen. Solucin: Al plantear el problema de la forma1

Minimizar (x + y + z) 2 Sujeto a z - xy = 1 Se hace evidente que se trata de un problema de optimizacin con restricciones. Un punto (x, y, z) se encuentra a una distancia r del origen si, y solo si, est en la esfera

x + y + z = rEsta esfera es una superficie de nivel de la funcin f(x, y, z) = x + y + z que hay que minimizar. Como la superficie z - xy = 1 no pasa por el origen, la idea de la solucin consiste en comenzar con r = 0 e ir aumentando hasta que la esfera sea tangente a la superficie. Cada punto de contacto ser una solucin del problema. En el punto de tangencia las dos superficies tienen el mismo plano tangente y, en consecuencia, gradientes paralelos. El paralelismo de los gradientes se traduce en que uno es mltiplo del otro. Definiendo g ( x, y, z ) = z 2 xy 1 se tiene que la superficie queda definida por g(x, y, z) = 0 y que

f = gen consecuencia ( 2 x, 2 y , 2 z ) = ( y , x, 2 z ) 2x = -y 2y = -x 2z = 2z

que equivale a las 3 ecuaciones

la cuarta ecuacin est dada por g(x, y, z) = 0 o sea z 2 xy 1 = 0 . Este sistema tiene como solucin: = 1, x = y = 0, z = 1 o z = -1. Se tienen, en consecuencia, las dos soluciones (0, 0, 1) y (0, 0, -1). El mtodo empleado en la solucin del ejemplo 15 se generaliza de la siguiente manera.

Mtodo de los multiplicadores de LagrangeSi f : S R, S R n tiene un ptimo relativo cuando est sometida a m condiciones

g1 ( x1 ,..., x n ) = 0,..., g m ( x1 ,..., x n ) = 0

24

con m < n, existen entonces m escalares 1 ,..., m tales que

f = 1g 1 +

+ n g n

Los escalares 1 ,..., m que se introdujeron para resolver este tipo de problemas se denominan multiplicadores de Lagrange.

Ejemplo 16: Encuentre las dimensiones de la cubeta que aparece en la figura 12 de talmanera que se minimice el material empleado y se cumplan las dos restricciones: 1. cada uno de los espacios debe tener una seccin horizontal cuadrada. 2. el volumen total (sin tener en cuenta las particiones) debe ser igual a 12 pulgadas cbicas.

Figura 12

Solucin:El problema se plantea de la siguiente manera: Minimizar 3xz + xy + 6yz Sujeto a x/5-y/2=0 xyz-12 = 0 en donde f (x, y, z) = 3xz + xy + 6yz, g1 ( x, y, z ) = x / 5 y / 2 y g 2 ( x, y, z ) = xyz 12 . Entonces

f = (3 z + y, x + 6 z ,3 x + 6 y ) , g1 = (1 / 5,1 / 2,0) y g 2 = ( yz , xz , xy )El sistema

f = 1g1 + 2 g 2 g 1 ( x, y , z ) = 0 g 2 ( x, y , z ) = 0

es un sistema de 5 ecuaciones con 5 incgnitas de solucin dispendiosa. Sin embargo, empleando un paquete matemtico (en este caso Derive) se obtiene la solucin:

25

1

1

1

3 * 60 3 3 * 60 3 2 * 60 3 x= , y= y z= 2 5 9Al no contarse con un paquete matemtico este problema puede simplificarse despejando x en la primera restriccin y reemplazndola en la funcin objetivo y en la segunda restriccin, con lo cual se obtiene un problema en dos variables con una restriccin. An ms, este nuevo problema puede a su vez simplificarse despejando z y se tiene un problema en una sola variable sin restricciones. Sin embargo, el mtodo de los multiplicadores de Lagrange est concebido para resolver problemas en los cuales es imposible hacer tales simplificaciones.

Optimizacin no clsica variable multidimensionalHasta el momento los mtodos empleados han sido fruto de la aplicacin de resultados tericos como, por ejemplo, igualar el gradiente a cero o emplear el mtodo de los multiplicadores de Lagrange, las dificultades han aparecido al momento de atacar el problema de resolver los sistemas de ecuaciones no lineales que aparecen al aplicar los resultados tericos. Para ello se ha acudido al mtodo de Newton, el cual es un mtodo iterativo de aproximaciones sucesivas a partir de un punto inicial. Lo que se har ahora es emplear una idea similar para encontrar directamente el ptimo: comenzando con un punto inicial, adecuado segn algn criterio, iterar hasta estar lo suficientemente cerca del ptimo.

Mtodo del gradienteExiste una relacin fundamental entre la derivada direccional y el gradiente la cual es expresada en la siguiente frmula

f ' (D; \ ) = f (D ) \ = f (D ) \ cos = f (D ) cos donde es el ngulo formado por f (a) e y. La figura 13 proporciona una ilustracin grfica del hecho

Figura 13

26

Al tener la derivada direccional la forma f (D ) cos es claro que esta asume un valor mximo cuando = 0 y un valor mnimo cuando = . O sea que, el valor mximo de la derivada direccional es f (D ) y ocurre cuando y tiene la misma direccin del gradiente y el valor mnimo es - f (D ) que ocurre cuando y tiene direccin opuesta al gradiente. En otras palabras, el gradiente de f en a apunta en la direccin de mximo crecimiento de f a partir de a, en tanto que f (D ) apunta en la direccin del mximo decrecimiento de f. Este importante hecho constituye la base del mtodo del gradiente el cual consiste en comenzar a partir de un punto inicial, y avanzar en la direccin del gradiente, en el caso de maximizacin, o en la direccin contraria, en el caso de minimizacin. Una vez determinada la direccin de avance es necesario escoger la longitud de dicho avance (o tamao del paso) lo cual constituye, a su vez, un problema de optimizacin de variable unidimensional. El siguiente ejemplo ilustra el procedimiento.

Ejemplo 17: Maximice la funcinf(x, y) = 4x + 6y 2x -2xy 2y

Solucin: comenzando en el punto inicial (0, 0) y considerando quef (x, y) = (4 4x 2y, 6 2x 4y)entonces el vector f (0,0) = (4, 6) determina la direccin que debe tomarse a partir de (0, 0). Si p controla la longitud del paso, el punto de llegada ser (0, 0) + p(4, 6) = (4p, 6p) para determinar el mejor p se optimiza f (4p, 6p), se tiene entonces

f (4p, 6p) = 16p + 36p 32p - 48p - 72p = 52p 152pderivando e igualando a cero 52 304p = 0 entonces p = 52/304 = 13/76 con lo que el nuevo punto es (13/19, 39/38). Evaluando f (13/19, 39/38) = 169/38 = 4.447368421que representa una mejora frente a f (0,0) = 0. Se hacen los clculos para dar el siguiente paso. f (13/19, 39/38) = (-15/19, 10/19) con lo que el nuevo punto es (13/19, 39/38) + p(-15/19, 10/19) = (13/19 - 15p/19, 39/38 + 10p/19) entonces

f (13/19 - 15p/19, 39/38 + 10p/19) = -( 700p - 650p 3211) / 722derivando, igualando a cero y despejando se obtiene p = 13/28 con lo que el nuevo punto es (169/532, 169/133) con f (169/532, 169/133) = 169/38 = 4.656361297. 27

Este proceso es engorroso, sin embargo, como en este caso en el proceso de optimizacin la p se obtiene de manera explcita, pueden hacerse los clculos para cualquier punto genrico (a, b), con lo cual se obtiene

f (a, b) = (4 4a 2b, 6 2a 4b)entonces el nuevo punto es (a, b) + p(4 4a 2b, 6 2a 4b) = (4 p +(1 4 p)a 2pb, 6p 2pa + (1 4 p)b) evaluando f (4 p +(1 4 p)a 2pb, 6p 2pa + (1 4 p)b), derivando, igualando a cero y despejando p se obtiene

p=

5a 2 + 2a (4b 7) + 5b 2 16b + 13 4(7 a 2 + a (13b 22) + 7b 2 23b + 19)

con lo cual el procedimiento se puede automatizar mediante una hoja de clculo para obtener la tabla Iteracin0 1 2 3 4 5 6 7 8 9 10 11 12 32 33 0 0.68421053 0.54916898 0.47572532 0.42700188 0.39495765 0.37387564 0.3600059 0.35088108 0.3448779 0.34092844 0.33833012 0.33662069

X 0 1.02631579 1.11634349 1.19097172 1.23966398 1.27170903 1.29279102 1.30666076 1.31578559 1.32178876 1.32573822 1.32833655 1.33004598

f(X)0 4.44736842 4.57299572 4.62612436 4.64911892 4.65907156 4.66337931 4.66524381 4.66605082 4.66640011 4.6665513 4.66661673 4.66664505

f(X)4 -0.78947368 -0.42936288 -0.28484473 -0.1873355 -0.12324868 -0.08108462 -0.05334514 -0.03509549 -0.02308914 -0.01519022 -0.00999357 -0.00657472 -1.52E-06 -9.98E-07 6 0.52631579 0.43628809 0.28466249 0.1873403 0.12324856 0.08108462 0.05334514 0.03509549 0.02308914 0.01519022 0.00999357 0.00657472 1.52E-06 9.98E-07

0.1710526 0.4642857 0.499936 0.4999999 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5

p

0.33333409 1.33333257 4.66666667 0.33333383 1.33333283 4.66666667

Tabla 3

En la tabla 3 se ve que el algoritmo converge efectivamente hacia la solucin (1/3, 4/3) la cual puede encontrarse de forma analtica- mientras que el gradiente tiende a cero como es de esperarse que ocurra en un punto ptimo.

28

Programacin separableLa idea de la programacin separable para resolver un problema de P.N.L. es construir una aproximacin lineal del problema, esto es, un problema de programacin lineal, y resolver este para encontrar una aproximacin a la solucin de aquel.

Definicin 10: Una funcin f (x) donde [ = ( x1 , x 2 ,..., x n ) se dice separable si cumplela condicin:

f ([ ) =

n i =1

f i ( xi )

(4)

Ejemplo 18:escribirse donde

La funcin

f ( x1 , x 2 ) = 2 x12 + 3 x1 + 4 x 2 es separable pues puede

f ( x1 , x 2 ) = f 1 ( x1 ) + f 2 ( x 2 )f 1 ( x1 ) = 2 x12 + 3 x1 y f 2 ( x 2 ) = 4 x 2

Supongamos que en el problema de optimizacin Maximizar z = f (x) Sujeto a < g j ( [ ) b j j = 1,..., m > xi 0 i = 1,2,..., n

(5)

la funcin objetivo y las restricciones son separables. El problema adquiere entonces la forma Maximizar z = Sujeto an i =1 n i =1

f i ( xi )

< g ji ( xi ) b j j = 1,..., m > xi 0 i = 1,2,..., nn i =1

(6)

Al hacer la descomposicin f ( [ ) =

f i ( xi ) cada f i puede ser lineal o no. En caso de

no serlo se le hace una aproximacin lineal de la siguiente manera: sea f (x), definida en [a, b], como aparece en la figura 14

29

Figura 14Se toma la particin a = x0 < x1 < x 2