Programacion Convexa Presentacion Definitivo

Post on 02-Jul-2015

9.078 views 1 download

Transcript of Programacion Convexa Presentacion Definitivo

Investigación de Operaciones

Rama de la programación matemática (para diferenciarlo

de la programación en computadoras) que trabaja con la

teoría y los métodos de minimización de funciones

convexas sobre conjuntos convexos definidas mediante

sistemas de igualdades y desigualdades. La programación

cuadrática es una rama dentro de la programación convexa.

Springer Online Reference Works

http://eom.springer.de/c/c026320.htm

Sean x1 ≠ x2 dos puntos en Rn. Considérese todos los puntos de la forma

donde t es algún número real entre 0 y 1, i.e, 0 ≤ t ≤ 1.

Nótese que esta ecuación describe simplemente la“línea” en Rn que contiene todos los puntos entre x1

y x2.

De hecho, cuando t =0, y = x2 y cuando t = 1, y = x1.

O sea, esto no es otra cosa que la parametrización dela línea en Rn donde el parámetro es t. Además debequedar claro que x1 y x2 son esencialmente vectorescon n coordenadas.

Se dice que C es un conjunto convexo si paracualesquiera dos elementos que pertenezcan a C, lalínea que los une es también un subconjunto de C. Osea, C es convexo si para todo x1, x2 en C y paracualquier número real t, 0 ≤ t ≤ 1, se satisface que

En el plano, R2, es claro que un conjunto convexocoincide con lo que llamamos un polígono convexo.De hecho, la noción en sí misma es una extensión aRn del concepto euclidiano.

Es por lo tanto útil pensar en un conjunto convexocomo uno que no tiene indentaciones.

convexo convexo

No es convexo No es convexo

Nótese que en el último hexágono, la frontera nopertenece enteramente a este, i.e., existen puntos x1

y x2 en la frontera tales que la línea que los une nopertenece enteramente al conjunto.

Sea f : Rn → R. Decimos que f es convexa si dom fes un conjunto convexo y si para toda x1, x2 quepertenecen al dominio de f y para todo número realt entre 0 y 1, se satisface que

f (tx1 + (1 – t)x2) < t∙f (x1) + (1 – t)∙f (x2)

Nota:Una función f es cóncava si – f esconvexa.

Geométricamente esto significa que el segmento queune (x1, f (x1)) y (x2, f (x2)), o sea, la cuerda que vade x1 a x2, se encuentra sobre la gráfica de f.

(x1, f (x1))(x2, f (x2))

Ejemplos

Convexa Cóncava

Ejemplos

Ni convexa ni cóncava

Hiperplano

S = {x : ptx = α}

donde p es un vector distinto de cero en Rn

y α es un escalar.

Semiespacio

S = {x : ptx ≤ α}

donde p es un vector distinto de cero en Rn

y α es un escalar.

Conjunto Poliedral

S = {x : Ax ≤ b}

donde A es una matrix m × n y b es un

vector con m coordenadas.

Cono Poliedral

S = {x : Ax ≤ 0}

donde A es una matrix m × n y 0 es el

vector cero con m coordenadas.

“Vecindario”

S = {x : ||x-x0|| ≤ ε}

donde x0 es un vector fijo en Rn y ε > 0.

1. f(x) = 3x + 42. f (x) = |x|3. f (x) = x2

4. f (x1, x2) = 2x12 + x2

2 – 2x1x2

En todos estos casos, es de notar que – f esnecesariamente cóncava.

Nonlinear Programming: Theory and Algorithms-

Bazaraa and Shetty (1979)

FUNCIONES LINEALES

Para profundizar sobre uno de estos ejemplos,

considérese el primero, es decir

f (x) = 3x + 4

En general, cualquier función lineal

f : Rn → R definida por f(x) = mx + b

es una función convexa.

i) Su dominio es el conjunto de los números realesR, el cual es convexo.

ii) Sea 0 ≤ t ≤ 1, . Entonces veamos que ladesigualdad requerida se satisface.

La desigualdad que se quiere demostrar es

Al expandir el lado izquierdo se tiene

y al expandir el derecho

Por lo tanto, en este caso se satisface la igualdad. Enla gran mayoría de los casos esto no será así. Por logeneral, ver que una función es convexa (o sea, quesatisface dicha desigualdad) no es tan sencillo, razónpor la cual se ha desarrollado toda una teoría alrespecto, la cual no intentaremos seguir en estapresentación.

Ahora se ofrecerán una serie de resultados sindemostración, pero que proporcionarán una ideamás clara respecto al nivel geométrico del concepto,a la vez que aportan alguna luz sobre su relación conmáximos y mínimos y por lo tanto con temas yaaprendidos en un curso de Cálculo. Para estepropósito nos ceñimos nuevamente a funcionessobre R.

TEOREMAS

An Introduction to AnalysisWade (1995)

Teorema

Sea I un intervalo en R, y f : I → R. Entonces f esconvexa sobre I si y solo si dado un intervalo [c, d]contenido en I , la cuerda que pasa a través de lospuntos (c, f (c)), (d, f (d)) se halla en o sobre lagráfica de y = f(x) para toda x que pertenece a [c,d].

c x0 d

f(x0)

y0

y = f(x)

0

5

10

15

20

25

30

35

40

45

0 2 4 6 8 10 12 14

Este resultado solo formaliza lo dichoanteriormente. Notar que en el caso estudiadoantes, el de una función lineal, la cuerda se halla enla gráfica y no sobre ella.

Teorema

Una función f es convexa sobre un intervalo abierto(a, b) si y solo si la pendiente de la cuerda essiempre creciente, i.e.,

si a < c < x < d < b implica que

Teorema

Si f es diferenciable sobre (a, b), entonces f es convexasobre (a, b) si y solo si f ’ es creciente en (a, b).

Este último resultado combinado con un poco de cálculo(que no se menciona en honor a la brevedad; ver elTeroema 2.19 en An Introduction to Analysis - Wade(1995)) nos permite ver que el concepto de convexidades lo que en un cursos de cálculo se conoce comocóncavo hacia arriba y el de concavidad lo que se conocecomo cóncavo hacia abajo.

Teorema

i) Si f es convexa sobre un intervalo abierto(a, b), entonces f no tiene máximos locales.

ii) Si f es convexa en [0, ∞) y tiene un mínimolocal, entonces f (x) → ∞ a medida que x → ∞.

De esta forma podemos comprender que lasfunciones convexas pueden (y de hecho) juegan unpapel determinante en la optimización (yminimización) de funciones objetivos.

Volvamos a considerar el caso más general ennuestro desarrollo, esto es, cuando las funcionesestán definidas sobre Rn.

En general un problema de optimización se puederesumir como sigue:

Minimice f0(x) (esta es la función objetivo)

Sujeto a fi(x) ≤ 0 (funciones restricción)

Se asume que f0 : Rn → R

fi : Rn → R, i = 1, 2, 3, …, m

x es algún vector en Rn, o sea, x = (x1, …, xn).

A x se llama la variable de optimización.

Al conjunto de puntos que satisface las restriccionesse le conoce como Conjunto Restricción. Todopunto que pertenece al conjunto restricción se llamauna solución factible (“feasible solution”).

El problema consiste en hallar el punto o puntos (lassoluciones óptimas x*) en el conjunto restricción enlos cuales la solución objetivo alcanza un mínimo (omáximo según se desee).

Convex Optimization with Engineering Applications

Johansson y Forsgren

Aplicaciones de Algebra Lineal-Grossman

Optimizacion de Portafolio

Variables: cantidades invertidas en diferentesactivos

Las restricciones: presupuesto, ingreso máximo(mínimo) por activo, retorno mínimo

Objetivo: Riesgo Total

Diseño de partes en circuitos electrónicos

• Variables: largo y ancho de las partes

• Las restricciones: límites demanufacturas, requerimientos de tiempo

• Objetivo: Consumo de poder (energía)

Cuando la función objetivo y las funciones restricción son

todas ellas funciones afines, el problema se conoce como

uno de programación lineal.

Tiene la forma

Minimice cT x + d

Sujeto a Gx < h

Ax = b

donde G es una matriz m × n y A una matriz p × n.

Cuando la función objetivo es convexa y cuadrática y lasfunciones restricción son afines, entonces el problema seconoce como uno de Programación Cuadrática.

Tiene la forma

Minimice (1/2)xTPx + qT x + rSujeto a Gx < h

Ax = b

donde G es una matriz m × n y A una matriz p × n y P esunamatriz simétrica n × n.

MOSEK puede resolver

Problemas Lineales.

Problemas Cónico Cuadraticos.

Problemas Convexos Cuadraticos.

Problemas Convexos generales

Lo pueden usar las universidades y los profesores sin cargo.

Este paquete se puede usar en combinación con MATLAB y JAVA.

Si se entra en http://www.mosek.com/index sepuede incluso acceder a un reporte de un trabajo enFinanzas que se preparó para demostrar la utilidaddel paquete. Es una especie de tutorial que inclusorepasa la programación cónica que es un área de laoptimización convexa que tiene fuertes similitudescon programación lineal.

Hay m lámparas (pequeñas) iluminando n parchos. La intensidad de Ik sobre el parcho k depende linealmente en la potencia pj de las lámparas.

Ik = ∑akjpj donde j va de 1 a m y

akj = rkj-2max{cos θkj, 0}.

El problema es alcanzar la iluminación deseada con

potencias acotadas para las lámparas.