Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

97
UNIVERSIDAD NACIONAL DE TRUJILLO FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS ESCUELA ACADÉMICO PROFESIONAL DE MATEMÁTICAS UN PROBLEMA DE OPTIMIZACIÓN CONVEXA Y SU APLICACIÓN INFORME FINAL DE PRÁCTICA PRE-PROFESIONAL PARA OPTAR EL TÍTULO DE LICENCIADO EN MATEMÁTICAS AUTOR: LUIS ALBERTO BLAS BALTODANO ASESOR: Dr. MILTÓN CORTÉZ GUTIÉRREZ TRUJILLO - PERÚ 2015 Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/ BIBLIOTECA DE CIENCIAS FÍSICAS Y MATEMÁTICAS

Transcript of Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

Page 1: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

UNIVERSIDAD NACIONAL DE TRUJILLO

FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS

ESCUELA ACADÉMICO PROFESIONAL DE MATEMÁTICAS

UN PROBLEMA DE OPTIMIZACIÓN CONVEXA Y SU APLICACIÓN

INFORME FINAL DE PRÁCTICA PRE-PROFESIONAL

PARA OPTAR EL TÍTULO DE LICENCIADO EN MATEMÁTICAS

AUTOR:

LUIS ALBERTO BLAS BALTODANO

ASESOR:

Dr. MILTÓN CORTÉZ GUTIÉRREZ

TRUJILLO - PERÚ

2015

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 2: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

UNIVERSIDAD NACIONAL DE TRUJILLO

FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS

ESCUELA ACADÉMICO PROFESIONAL DE MATEMÁTICAS

UN PROBLEMA DE OPTIMIZACIÓN CONVEXA Y SU APLICACIÓN

INFORME FINAL DE PRÁCTICA PRE-PROFESIONAL

PARA OPTAR EL TÍTULO DE LICENCIADO EN MATEMÁTICAS

AUTOR:

LUIS ALBERTO BLAS BALTODANO

ASESOR:

Dr. MILTÓN CORTÉZ GUTIÉRREZ

TRUJILLO - PERÚ

2015

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 3: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

Jurado

Dr. ULISES ZAVALETA CALDERÓN

Presidente

Dr. NELSON OMAR ARAGONÉS SALAZAR

Secretario

Ms. JORGE LUIS HORNA MERCEDES

Vocal

iii

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 4: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

Dedicatoria

A mi madre:YOLANDA BALTODANO Y.

que con mucho amor y constante apoyo

y sacrificio supo guiarme

para lograr alcanzar mi sueño.

A mis Abuelitos: Segundo y Angelica

Que ya no están conmigo, pero que

este sueño era compartido por ellos

mi profundo agradecimiento

por su constante apoyo

y cariño que me supieron dar

en los momentos adversos.

iv

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 5: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

Agradecimiento

Es propicia la oportunidad para expresar mi agradecimiento a todos los profesores

de la Escuela de Matemáticas que con su aporte intelectual me guiarón por el camino

del estudio y superación, en especial a la Dra. Jenny Rojas, por su valiosa orientación

y apoyo en la culminación del presente trabajo.

v

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 6: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

Presentación

Señores miembros del jurado:

En cumplimiento a lo prescrito por el reglamento de grados de la Facultad de Ciencias

Físicas y Matemáticas de la Escuela de Matemáticas de la Universidad Nacional de

Trujillo, me es honroso presentar a vuestra consideración el presente trabajo titulado:

UN PROBLEMA DE OPTIMIZACIÓN CONVEXA Y SU APLICACIÓN;

para optar el Título de Licenciado en Ciencias Matemáticas. Con la consideración de

que el presente trabajo pueda estar incompleto, acepto muy honestamente todas sus

apreciaciones y sugerencias que tengan a bien formular, lo cual me servirá para mejorarlo

en el futuro.

El Autor

vi

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 7: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

Lista de Símbolos

conv(S) — Envolvente convexa de S.

epi(f) — Epígrafo de la función convexa f .

vii

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 8: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

Resumen

En este trabajo identificamos las técnicas que estudia la optimización convexa y su

importancia en aplicaciones de ingeniería, en telecomunicaciones, proceso de señales,

economía, etc. pues permite identificar la estructura de la solución óptima, debido a

que cualquier solución local es también una solución global y además existe una teoría

de dualidad asociada al problema de optimización convexa y unas condiciones de punto

optimal que permiten verificar si la solución hallada es la exacta o la mejor aproximación

a ella.

En los últimos años se han producido avances significativos en la utilización de técnicas

de optimización convexa en las diversas áreas de aplicación, como las mencionadas en el

párrafo anterior y en problemas como: localización de sensores; optimización de potencia

en redes de tipo malla; tratamiento de imágenes, producción, etc. sobre todo hallando

la solución de manera eficiente a problemas que originalmente eran intratables.

Por lo tanto en este trabajo se presenta las diferentes técnicas matemáticas para la res-

olución de problemas de optimización convexa y donde se encuentra la solución óptima

del problema.

Debido a las diversas aplicaciones de la optimización convexa, aqui tambien resolvemos

el problema de optimizar una función convexa f : Rn → R, bajo restricciones de regiones

también convexas planteándonos como objetivos principales, el análisis de la solución del

problema, la caracterización de la solución de un problema convexo, y la aplicación de

esta teoría en problemas de economía o ingeniería.

viii

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 9: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

Abstract

In this paper we identify techniques that studies the convex optimization and its im-

portance in engineering applications, telecommunications, signal processing, economics,

etc. then identifies the structure of the optimal solution, because any local solution is

also a global solution and also there is associated duality theory of convex optimization

problem and optimal conditions point that show whether the exact solution is found or

best approximation to it.

In recent years there have been significant advances in the use of convex optimiza-

tion techniques in various application areas, such as those mentioned in the preceding

paragraph and problems such as: location of sensors; Power optimization in mesh-like

networks; image processing, production, etc. especially finding efficient solution to in-

tractable problems that were originally manner.

Therefore in this paper the mathematical models for solving convex optimization prob-

lems and where the optimal solution is found techniques is presented. In this paper the

mathematical models for solving convex optimization problems and where the optimal

solution is presented techniques.

Due to the various applications of convex optimization, in this paper we solve the prob-

lem of optimizing a convex function f : Rn → R, under restrictions by posing convex

regions also main objectives, analysis of the solution of the problem, the characterization

of the solution of a convex problem and the application of this theory in economics or

engineering problems.

ix

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 10: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

Introducción

La optimización es una herramienta esencial para la formulación de muchos proble-

mas, estudia el cómo hacer la mejor elección cuando se tiene un conjunto limitado de re-

querimientos y una función definida sobre ellos, la cual debe minimizarse o maximizarse.

La Optimización, como línea de investigación, surgió a mediados del siglo anterior y en

todo este tiempo se ha usado en diversas aplicaciones de diferentes áreas. En un inicio, el

trabajo de Lions y Stampacchia[6] sobre desigualdades variacionales, motivaron el estu-

dio de la convergencia de la solución del problema de aproximación, que posteriormente

fue usada por Attouch[1], para establecer la convergencia de la aproximación de Yoshida

para la solución de la resolvente de ecuaciones tipo evolución. Similares interrogantes sur-

gen en problemas de optimización, Wysman[15] fue el primero en aplicar estos resultados

a problemas de la teoría de Decisión y Van Cutsem aplicó estos resultados a problemas

de optimización estocástica. En el presente trabajo revisamos las características sobre-

salientes de la teoría de convergencia de funciones convexas. La optimización convexa

estudia de manera concreta la minimización de funciones convexas reales definidas para

variables que se encuentran en un subconjunto convexo de un espacio vectorial.

El problema de optimización puede ser expresado, sin perder generalidad, como:

Min{f(x) : g(x) = 0},

donde f : Rn → R y g : Rm → Rn, donde x es la variable a determinar. Las técnicas

que estudia la optimización convexa son importantes en aplicaciones de ingeniería, en

telecomunicaciones, proceso de señales, economía, etc. pues permite identificar la estruc-

tura de la solución óptima, debido a que cualquier solución local es también una solución

global y además existe una teoría de dualidad asociada al problema de optimización con-

x

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 11: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

vexa y unas condiciones de punto optimal que permiten verificar si la solución hallada

es la exacta o la mejor aproximación a ella. Por otro lado esta teoría también permite el

diseño de algoritmos numéricos muy potentes que resuelven este tipo de problemas de

forma bastante eficiente[2]. En los últimos años se han producido avances significativos

en la utilización de técnicas de optimización convexa en las diversas áreas de aplicación,

como las mencionadas en el párrafo anterior y en problemas como: localización de sen-

sores; optimización de potencia en redes de tipo malla; tratamiento de imágenes[12],

producción, etc. sobre todo hallando la solución de manera eficiente a problemas que

originalmente eran intratables.

Debido a las diversas aplicaciones de la optimización convexa, en el presente trabajo

resolvemos el problema de ¿Cómo utilizar una función convexa f : Rn → R, bajo re-

stricciones de regiones también convexas?, planteándonos como objetivos principales, el

análisis de la solución del problema, la caracterización de la solución de un problema

convexo, y la aplicación de esta teoría en problemas de economía.

El trabajo se ha organizado en los siguientes capítulos: En el primer capítulo, presen-

tamos los conceptos y propiedades básicas de conjuntos, funciones convexas y convergen-

cia de funciones convexas así como también los principios básicos de dualidad necesarios

en el estudio de las condiciones de optimalidad en los problemas de optimización y se

definen algunos símbolos y notaciones necesarios para un buen entendimiento del tra-

bajo. En el segundo capítulo presentamos el problema de optimización convexa, sus

propiedades, equivalencias y algunos métodos de resolución para este tipo de problemas

de optimización. En el tercer capítulo, presentamos la formulación y resolución de prob-

lemas de optimización convexa, relacionados a la economía. Finalmente presentamos las

conclusiones del trabajo.

xi

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 12: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

Índice general

Jurado iii

Dedicatoria iv

Agradecimiento v

Lista de Símbolos vii

Resumen viii

Abstract ix

Introducción x

1. Preliminares 2

1.1. Conjuntos y Funciones Convexas . . . . . . . . . . . . . . . . . . . . . . 2

1.1.1. Separación y Soporte de Conjuntos . . . . . . . . . . . . . . . . . 3

1.1.2. Conjuntos Poliédricos - Puntos Extremos . . . . . . . . . . . . . . 9

1.1.3. Funciones Convexas. . . . . . . . . . . . . . . . . . . . . . . . . . 13

1.2. Generalización de una Función Convexa . . . . . . . . . . . . . . . . . . 14

1.2.1. Función Cuasi-Convexa . . . . . . . . . . . . . . . . . . . . . . . . 14

1.2.2. Funciones Cuasi-Convexas Diferenciables . . . . . . . . . . . . . . 16

1.2.3. Funciones Estrictamente Cuasi - Convexas . . . . . . . . . . . . . 19

1.3. Convergencia de Funciones Convexas . . . . . . . . . . . . . . . . . . . . 20

1.4. Dualidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

1.4.1. Función Dual de Lagrange . . . . . . . . . . . . . . . . . . . . . . 23

1

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 13: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

1.4.2. Problema Dual Lagrangiano . . . . . . . . . . . . . . . . . . . . . 25

1.4.3. Interpretación Geométrica del Problema Dual Lagrangiano . . . . 25

1.4.4. Condición de Slater . . . . . . . . . . . . . . . . . . . . . . . . . . 28

1.4.5. Condiciones de Optimalidad . . . . . . . . . . . . . . . . . . . . . 29

2. Optimización Convexa 33

2.1. Formulación Estándar . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

2.2. Óptimo Local y Global . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

2.3. Problemas Convexos Equivalentes . . . . . . . . . . . . . . . . . . . . . . 40

2.3.1. Eliminando las Restricciones de Igualdad. . . . . . . . . . . . . . 40

2.3.2. Agregando Restricciones de Igualdad. . . . . . . . . . . . . . . . . 40

2.3.3. Variables de Holgura. . . . . . . . . . . . . . . . . . . . . . . . . . 41

2.3.4. Problema de la Forma Epígrafo. . . . . . . . . . . . . . . . . . . . 41

2.3.5. Minimización Sobre Algunas Variables. . . . . . . . . . . . . . . . 41

2.4. Optimización Cuasi-Convexa. . . . . . . . . . . . . . . . . . . . . . . . . 42

2.4.1. Condiciones de Optimalidad y Solución Óptima Local . . . . . . . 42

2.4.2. Optimización Cuasi-Convexa vía Problemas de Factibilidad Con-

vexos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

2.4.3. Método de Bisección para Optimización Cuasi-Convexa . . . . . . 45

2.5. Clasificación de Problemas de Optimización Convexa . . . . . . . . . . . 46

2.5.1. Problemas de Optimización Lineal . . . . . . . . . . . . . . . . . 46

2.5.2. Problemas de Optimización Cuadráticas . . . . . . . . . . . . . . 50

2.5.3. Programación Cónica de Segundo Orden . . . . . . . . . . . . . . 51

2.5.4. Programación con Desigualdades Generalizadas . . . . . . . . . . 51

2.5.5. Programación Geométrica . . . . . . . . . . . . . . . . . . . . . . 53

3. Aplicación de Optimización Convexa: Aproximación y Ajuste 56

3.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

3.2. Aproximación de Norma . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

3.2.1. Problema Básico de Aproximación de Norma . . . . . . . . . . . . 57

3.2.2. Aproximación mediante una función de Penalización . . . . . . . . 78

2

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 14: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

Conclusiones 82

Bibliografía 83

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 15: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

Capítulo 1

Preliminares

1.1. Conjuntos y Funciones Convexas

En esta sección se presentan definiciones y propiedades básicas sobre conjuntos y

funciones convexas.

Definición 1.1. Un conjunto S ⊂ Rn se dice que es convexo si para cada x1, x2 ∈ S,

entonces λx1 + (1− λ)x2 ∈ S, ∀ λ ∈ [0, 1].

La forma λx1 + (1− λ)x2, λ ∈ [0, 1] se llama combinación convexa de x1 y x2.

Por inducción se prueba la generalización

λ1x1 + λ2x2 + . . .+ λnxn =k∑

j=1

λjxj . . .

l∑j=1

λjxj

Definición 1.2. Sea S ⊂ Rn, la envolvente convexa de S, denotado por conv(S) es

el conjunto de todas las combinaciones convexas de S.

Es decir:

x ∈ conv(S) =⇒ x =k∑

j=1

λjxj ;k∑

j=1

λj = 1

Definición 1.3. S se llama cono convexo ⇔ ∀x1, x2 ∈ S, ∀λ ∈ (0, 1) se tiene

λx1 + (1− λ)x2 ∈ S.

Definición 1.4. S se llama cono con vértice en 0 ⇔ ∀x ∈ S, ∀λ > 0 se tiene λx ∈ S

2

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 16: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

1.1. CONJUNTOS Y FUNCIONES CONVEXAS

1.1.1. Separación y Soporte de Conjuntos

En optimización, las nociones de hiperplanos soporte y separación de conjuntos con-

vexos disjuntos, son muy importantes. Casi todas las condiciones de optimalidad y las

relaciones de dualidad usan los conceptos y propiedades de separación y soporte de con-

juntos convexos.

Los resultados de esta sección se basan en el siguiente hecho geométrico: dado S un

conjunto convexo y cerrado y un punto y /∈ S existe un único punto x ∈ S con distancia

minima a y y un hiperplano que separa y y S.

Teorema 1.5. Sea S un conjunto convexo cerrado no vacío en Rn y sea y /∈ S. Entonces

existe un único x ∈ S con distancia minima a y. Además, x es el punto minimizante si

y solo si (y − x)t(x− x) ≤ 0 ∀x ∈ S.

Prueba. ver [Bazaraa]

Observación.

S

αt

( x − x ) = 0

y

xx

Figura 1.1:

El ángulo entre los vectores (y−x) y (x−x) para cualquier x ∈ S es mayor o igual a 90◦,

por lo tanto (y− x)t.(x− x) ≤ 0, ∀x ∈ S los que nos dice que el conjunto S queda en el

semi espacio αt(x− x) = 0 que pasa a través de x y tiene una normal α = (y− x). Esta

característica no necesariamente se cumple en conjuntos no-convexos, como se observa

en el siguiente gráfico:

3 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 17: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

1.1. CONJUNTOS Y FUNCIONES CONVEXAS

S

x

y

Figura 1.2:

Definición 1.6. Un hiperplano H en Rn esta formado por:

H = {x ∈ Rn : ptx = α}

donde p ∈ Rn no-nulo y α es un escalar.

El vector p se llama normal del hiperplano H. Un hiperplano H define dos semi espacios

cerrados

H+ = {x ∈ Rn : ptx ≥ α}

y

H− = {x ∈ Rn : ptx ≤ α}

Y dos semi espacios abiertos

H+ = {x ∈ Rn : ptx > α}

y

H− = {x ∈ Rn : ptx < α}

Observación.

◦ Cualquier punto en Rn cae en H+, en H− o en ambos.

◦ Un hiperplano H y el correspondiente semiespacio pueden escribirse en referencia

a un punto fijo.

4 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 18: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

1.1. CONJUNTOS Y FUNCIONES CONVEXAS

◦ Si x ∈ H, entonces ptx = α y cualquier x ∈ H debe satisfacer

ptx− ptx = α− α

ptx− ptx = 0

pt(x− x) = 0

Ejemplo.

Sea H = {x ∈ R4 : x1 + x2 − x3 + 2x4 = 4}, el vector normal p =

1

1

−1

2

. Luego

el hiperplano H puede escribirse tomando como referencia cualquier punto x ∈ H, por

ejemplo x =(

0, 6, 0, −1)t

,

en este caso

H = {x ∈ R4 : pt(x− x) = 0}

= {x ∈ R4 : (1, 1,−1, 2).(x1, x2 − 6, x3, x4 + 1) = 0}

= {x ∈ R4 : x1 + x2 − 6− x3 + 2(x4 + 1) = 0}

Geométricamente:

H+

−Η

p

x

Figura 1.3:

5 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 19: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

1.1. CONJUNTOS Y FUNCIONES CONVEXAS

Definición 1.7. Sean S1 y S2 conjuntos no vacíos en Rn. Un hiperplano

H = {x ∈ Rn : ptx = α} se dice que separa S1 y S2 si ptx ≥ α, ∀x ∈ S1 y ptx ≤

α, ∀x ∈ S2.

Si además S1 ∪ S2 ⊂ H entonces H separa de manera propia a S1 y S2.

Si ptx > α ∀x ∈ S1 y ptx < α, ∀x ∈ S2 se dice que H separa de manera estricta S1 y

S2.

Si ptx ≥ α + ϵ ∀x ∈ S1 y ptx ≤ α ∀x ∈ S2 para ϵ > 0 escalar, se dice que H separa

fuertemente S1 y S2.

En la siguiente gráfica se muestra las diferentes tipos de separaciones:

S

S

2

1

S

S

1

2

S

S

H

1

2

H

S

S

1

2

Figura 1.4:

El siguiente teorema es uno de los mas importantes teoremas de separación, que es

la base de condiciones de optimalidad en optimización.

Teorema 1.8. Sea S un conjunto convexo cerrado y no vacío en Rn y sea y ∈ S entonces

existe un vector p ∈ Rn no nulo y un escalar α tal que pty > α y ptx ≤ α, ∀x ∈ S.

Prueba.

Sea S ⊂ Rn no vacío cerrado y convexo, sea y ∈ S, luego por el teorema (1.5), existe

x ∈ S único tal que (x − x)t(y − x) ≤ 0 ∀x ∈ S. como y ∈ S y − x = 0 entonces

considerando p = (y − x) y α = xtp = ptx se tiene que

(x− x)tp ≤ 0 ∀x ∈ S

pt(x− x) ≤ 0

ptx− ptx ≤ 0

6 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 20: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

1.1. CONJUNTOS Y FUNCIONES CONVEXAS

ptx ≤ ptx

ptx ≤ α ∀x ∈ S

mientras que

pty − α = pty − ptx

= pt(y − x)

= (y − x)t(y − x) > 0

= ∥y − x∥2 > 0. �

Una consecuencia conocida de este teorema que se usa para tener condiciones de

optimalidad tanto de problemas de optimización lineal como no lineal como el teorema

de Farkas que establece lo siguiente: Sea Am×n y c un n-vector, entonces exactamente

uno de los siguientes sistemas tiene solución:

Sistema 1:

Ax ≤ 0 y ctx > 0 , x ∈ Rn

Sistema 2:

Aty = c y y ≥ 0 , y ∈ Rm

Prueba.(ver Bazaraa)

Definición 1.9. Sea S ⊂ Rn no vacio y sea x ∈ ∂S(frontera de S).Un hiperplano

H = {x ∈ Rn : pt(x − x) = 0} se llama hiperplano soporte de S en x si S ⊆ H+, es

decir que pt(x− x) ≥ 0 ∀x ∈ S o S ⊆ H−, es decir pt(x− x) ≤ 0 ∀x ∈ S.

Si además S ⊂ H, H es un hiperplano de separación propio de S en x.

Observación.

La definición es equivalente a decir que H = {x ∈ Rn : pt(x− x) = 0} es un hiperplano

soporte de S en x ∈ ∂S si

ptx = ınf{ptx : x ∈ S}

7 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 21: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

1.1. CONJUNTOS Y FUNCIONES CONVEXAS

de lo contrario

ptx = sup{ptx : x ∈ S}

Geométricamente, se tiene:

S

x

H

Hiperplano soporte Único

S

x−

H

Infinitos hiperplanos soporte

H

x

x

1

2

Hiperplano soporte

en más de un punto

H

S

x−

Hiperplano soporte impropio

Figura 1.5:

En el siguiente teorema se establece que un conjunto convexo en cada punto frontera

tiene un hiperplano soporte.

Teorema 1.10. Sea S ⊂ Rn convexo y no-vacío y sea x ∈ ∂S, entonces existe un

hiperplano soporte de S en x.Es decir existe p ∈ Rn tal que pt(x − x) ≤ 0 ∀x ∈ S

(clausura de S).

Prueba.ver(Bazaraa).

La minimización de una función convexa sobre alguna de las variables preserva la

convexidad del problema.

Definición 1.11. (Epígrafo de una función convexa)

Sea S ⊂ Rn no-vacío y sea f : S → R. El epígrafo de f denotado por epi(f) es un

subconjunto de Rn+1 definido como

epi(f) = {(x, y) : x ∈ S, y ∈ Rn y ≥ f(x)}

Definición 1.12. (Hipógrafo de una función convexa)

Sea S ⊂ Rn no-vacío y sea f : S → R. El Hipógrafo denotado por hyp(f) es un subcon-

junto de Rn+1 tal que

hyp(f) = {(x, y), x ∈ S, y ∈ Rn; y ≤ f(x)}.

8 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 22: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

1.1. CONJUNTOS Y FUNCIONES CONVEXAS

hyp ( f )hyp ( f )

hyp ( f )

epi ( f )epi ( f )

epi ( f )f

f

f

Figura 1.6:

Geométricamente

Teorema 1.13. Sea S ⊂ Rn no-vacío y convexo y sea f : S → R.Entonces f es convexa

si y sólo si epi(f) es un conjunto convexo.

Prueba.

⇒] Supongamos que f es convexa, demostraremos que epi(f) es un conjunto convexo.

Sea (x1, y1), (x2, y2) ∈ epi(f), es decir x1, x2 ∈ S tal que y1 ≥ f(x1) y tal que y2 ≥ f(x2).

Sea λ ∈ (0, 1), entonces λy1 + (1− λ)y2 ≥ λf(x1) + (1− λ)f(x2) ≥ f(λx1 + (1− λ)x2)

pues f es convexa. Además λx1+(1−λ)x2 ∈ S, [λx1+(1−λ)x2, λy1+(1−λ)y2] ∈ epi(f)

y por lo tanto epi(f) es convexo.

⇐] Supongamos que epi(f) es convexa, y sean x1, x2 ∈ S entonces [x1, f(x1)] y [x2, f(x2)] ∈

epi(f) es convexo se tiene [λx1+(1−λ)x2, λf(x1)+(1−λ)f(x2)] ∈ epi(f), para λ ∈ (0, 1)

es decir λf(x1) + (1− λ)f(x2) ≥ f(λx1 + (1− λ)x2) para λ ∈< 0, 1 > por lo tanto f

es convexa. �

1.1.2. Conjuntos Poliédricos - Puntos Extremos

Los conjuntos poliédricos representan un caso especial de conjuntos convexos.

Definición 1.14. S ⊂ Rn se llama conjunto poliédrico si es la intersección de un numero

finito de semi espacios cerrados. Es decir

S = {x : ptix ≤ αi , i = 1, 2 . . .m}

9 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 23: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

1.1. CONJUNTOS Y FUNCIONES CONVEXAS

donde pi ∈ Rn, αi es un escalar para i = 1 . . .m.

Observación.

Un conjunto poliédrico es un conjunto convexo.

Como una función puede ser representada por dos inecuaciones, un conjunto polié-

drico puede ser representado por un numero finito de inecuaciones y/o ecuaciones.

Ejemplos.

S = {x ∈ R2 : −x1 + x2 ≤ 2 , x2 ≤ 4 , x1 ≥ 0 , x2 ≥ 0} es un conjunto poliédrico.

x

x

2

4 )(

2)( 0

2

S

1

Figura 1.7:

Definición 1.15. Sea S ⊂ Rn un conjunto convexo no- vacío. Un punto x ∈ S se llama

"punto extremo"de S si x = λx1 + (1 − λ)x2 con x1, x2 ∈ S y λ ∈< 0, 1 > implica que

x = x1 = x2.

Ejemplos.

1. S = {(x1, x2) : x21 + x2

2 ≤ 1} sus puntos extremos es el conjunto

E = {(x1, x2) : x21 + x2

2 = 1}

2. S = {(x1, x2) ∈ R2 : x21+x2

2 ≤ 2 ; −x21+2x2

2 ≤ 1 , x1, x2 ≥ 0} sus puntos extremos

son:

E = {(0, 0), (0, 1)(23, 43), (2, 0)}

10 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 24: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

1.1. CONJUNTOS Y FUNCIONES CONVEXAS

E

Figura 1.8:

(

(

(

(

)

)

)

)

0

,

,

,

,

1

2

2

4 33 //

00

0

Figura 1.9:

3. S = gen{(0, 0), (1, 1), (1, 3), (−2, 4), (0, 2)}, sus puntos extremos son:

E = {(0, 0), (1, 1), (1, 3), (−2, 4)}

(

(

(

)

)

)

(

(

)

)

− 2 4

0

00

3

1

1

1

,

,

,

2

Figura 1.10:

Observación.

Cualquier punto del poliedro S puede representarse como una combinación convexa

de sus puntos extremos.

En conjuntos convexos no acotados no es posible la representación de cada punto

del conjunto como combinación convexa de sus puntos extremos, por ejemplo

11 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 25: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

1.1. CONJUNTOS Y FUNCIONES CONVEXAS

S = {(x1, x2) : x2 ≥ |x1|} es convexo y cerrado pero no es acotado, tiene un solo

punto extremo, el origen y obviamente S no es la combinación convexa de sus

puntos extremos. Esto hace necesario el concepto de dirección extrema.

Definición 1.16. Sea S conjunto convexo cerrado, no vacío en Rn, un vector no nulo

d en Rn se llama una dirección de S si para cada x ∈ S , x+ λd ∈ S , ∀λ ≥ 0. d1 y d2

son direcciones distintas de S si d1 = αd2 para α > 0.

Una dirección d de S se llama "dirección de extremo"si no puede ser escrita como

combinación lineal positiva de dos direcciones distintas, es decir:

Si d = λ1d1 + λ2d2 , λ1, λ2 > 0 entonces d1 = αd2 para algún α > 0.

Ejemplo.

S = {(x1, x2) : x2 ≥ |x1|} Las direcciones de S son los vectores no nulos que forman un

S

d d2 1

Figura 1.11:

ángulo menor o igual a 45◦ con el vector (0, 1). Por ejemplo d1 = (1, 1) y d2 = (−1, 1)

son dos direcciones extremas de S, cualquier otra dirección de S puede ser representada

como combinación lineal positiva de d1 y d2.

Teorema de Representación.

Sea S = {x ∈ Rn : Ax = b , x ≥ 0} un conjunto poliedrico no-vacio en Rn, donde Am×n

es una matriz de rango m. Sean x1, x2, . . . , xk los puntos extremos de S y d1, d2, . . . , dl

las direcciones extremas de S, entonces x ∈ S si y sólo si

x =k∑

j=1

λjxj +l∑

j=1

µjdj

12 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 26: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

1.1. CONJUNTOS Y FUNCIONES CONVEXAS

k∑j=1

λj = 1

λj ≥ 0 ; j = 1, 2, . . . , k

µj ≥ 0 ; j = 1, 2, . . . , l

Este teorema permite representar a cada punto de un poliedro como la combinación

lineal no negativa de sus direcciones extremas mas una combinación convexa de sus

puntos extremos. Si el poliedro es acotado no tiene direcciones extremas, por lo tanto

cada punto del poliedro se representara como la combinación convexa de sus puntos

extremos.

1.1.3. Funciones Convexas.

Definición 1.17. Sea f : S → R, S ⊆ Rn no-vacío y convexo. La función f se dice que

es convexa sobre S si

f(λx1 + (1− λ)x2) ≤ λf(x1) + (1− λ)f(x2) ∀x1, x2 ∈ S y λ ∈< 0, 1 >

f se llama ”estrictamente convexa” en S si

(λx1 + (1− λ)x2) < λf(x1) + (1− λ)f(x2) ∀x1, x2 ∈ S y λ ∈< 0, 1 >

f se llama cóncava (estrictamente cóncava) sobre S si −f es convexa(estrictamente

convexa) sobre S.

Ejemplos.

f : R2 → R : f(x1, x2) = 2x21+x2

2−2x1x2, es una función convexa pues, sea x = (x1, x1),

y = (y1, y2) entonces:

λx+ (1− λ)y = λ(x1, x2) + (1− λ(y1, y2))

= (λx1, λx2) + ((1− λ)y1, (1− λ)y2)

= (λx1 + (1− λ)y1, λx2 + (1− λ)y2)

13 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 27: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

1.2. GENERALIZACIÓN DE UNA FUNCIÓN CONVEXA

luego

f(λx+ (1− λ)y) = f(λx1 + (1− λ)y1, λx2 + (1− λ)y2)

= 2f(λx1 + (1− λ)y1)2 + (λx2 + (1− λ)y2)

2−

2(λx1 + (1− λ)y1)(λx2 + (1− λ)y2)

1.2. Generalización de una Función Convexa

Existen varios tipos de funciones similares a las funciones convexas de las cuales se

usan solamente algunas de sus propiedades. En esta sección presentamos algunas de

estos tipos de funciones.

1.2.1. Función Cuasi-Convexa

Definición 1.18. Sea f : S ⊂ Rn → R, S conjunto convexo no-vacío de Rn, f es una

función cuasi-convexa, si para cada x1 , x2 ∈ S se cumple que

f [λx1 + (1− λ)x2] ≤ max{f(x1), f(x2))}.

f se dice que es cuasi-convexa si −f es cuasi-cóncava.

Observación.

De la definición de la función cuasi-convexa, toda función convexa es también cuasi-

convexa.

El siguiente teorema caracteriza una función cuasi-convexa por la convexidad de sus

curvas de nivel.

Teorema 1.19. Sea f : S → R, S un conjunto convexo no vacío de Rn, f es una función

cuasi-convexa si y sólo si

Sα = {x ∈ S : f(x) ≤ α}

es convexo ∀α ∈ R

14 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 28: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

1.2. GENERALIZACIÓN DE UNA FUNCIÓN CONVEXA

Prueba.

⇒] f es cuasi-convexa y sean x1, x2 ∈ Sα. Luego x1, x2 ∈ S y max{f(x1), f(x2)} ≤ α y

sea x = λx1+(1−λ)x2. Por la convexidad de S, x ∈ S. Además por la cuasi-convexidad

de f , f(x) ≤ max{f(x1), f(x2)} ≤ α por lo tanto x ∈ Sα y además Sα es convexo.

⇐] Supongamos que Sα es convexa para cada α ∈ R. Sean x1, x2 ∈ S. Además , sea

λ ∈ (0, 1) y x = λx1 + (1 − λ)x2 luego para x1, x2 ∈ Sα para α = max{f(x1), f(x2)}.

Como Sα es convexo x ∈ Sα. Además

f(x) = f(λx1 + (1− λ)x2) ≤ α = max{f(x1), f(x2)}

por lo tanto f es cuasi-convexa. �

Observación.

◦ Sα definida como en el teorema se llama “ Conjunto nivel inferior” de f .

◦ El “conjunto nivel superior” de f es {x ∈ S : f(x) ≥ α} el cual es convexo ∀ α ∈ R

si y sólo si f es cuasi-convexa.

◦ La superficie de nivel: {x ∈ S : f(x) ≥ α} caracteriza a una función f cuasi-

monótona si y solo si este conjunto es convexo ∀ α ∈ Rn.

El siguiente teorema, nos permite analizar el máximo de una función cuasi-convexa

sobre un conjunto poliédrico compacto.

Teorema 1.20. Sea S un conjunto poliédrico y compacto en Rn, sea f : S → R cuasi-

convexa y continua sobre S. si se considera el problema de max f(x) tal que x ∈ S,

entonces existe una solución óptima x para el problema, donde x es un punto extremo

de S.

Prueba.

Sea f continua sobre S y, por lo tanto tiene máximo x′, pues S es un conjunto acotado.

Si hay un punto extremo xe tal que f(xe) = f(x′) entonces se cumple el teorema.

En otro caso, sean x1 . . . xk puntos extremos de S y considerando que f(x′) > f(xj);

15 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 29: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

1.2. GENERALIZACIÓN DE UNA FUNCIÓN CONVEXA

j = 1, 2 . . . k y como el punto x′ puede representarse en términos de los puntos extremos

xj, j = 1, 2 . . . k

x′ =k∑

j=1

λjxj

k∑j=1

λj = 1

λj > 0; j = 1, 2 . . . k

Como f(x′) > f(xj) para cada j = 1 . . .m; entonces

f(x′) > max1≤j≤k

f(xj) = α (1.1)

Luego sea Sα = {x : f(x) ≤ α}. xj ∈ xα para j = 1 . . . n y como f es cuasi-convexa,

Sα es convexa. Por lo tanto x′ =k∑

j=1

λjxj ∈ Sα. Esto significa que f(x′) ≤ α lo que

contradice (1.1). Por lo tanto f(x′) = f(xj) para algún xj punto extremo.

1.2.2. Funciones Cuasi-Convexas Diferenciables

El siguiente teorema proporciona una caracterización necesaria y suficiente de una

función cuasi-convexa diferenciable.

Teorema 1.21. Sea S ⊂ Rn un conjunto abierto convexo y no-vacío y sea f : S → R

una función diferenciable sobre S, entonces f es cuasi-convexa si y solo si una de las

siguientes afirmaciones se cumple:

1. Si x1, x2 ∈ S y f(x1) ≤ f(x2) entonces ∇f(x2)T (x1 − x2) ≤ 0.

2. Si x1, x2 ∈ S y ∇f(x2)T (x1 − x2) > 0, entonces f(x1) > f(x2).

Prueba.

Las afirmaciones (1) y (2) son equivalentes, se probará la afirmación (1).

⇒] Sea f cuasi-convexa y x1, x2 ∈ S tal que

f(x1) ≤ f(x2).

Como f es diferenciable en x2 y para λ ∈ (0, 1)

f(λx1 + (1− λ)x2)− f(x2) = λ∇f(x2)T (x1 − x2) + λ∥x1 − x2∥α(x2 : λ(x1 − x2))

16 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 30: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

1.2. GENERALIZACIÓN DE UNA FUNCIÓN CONVEXA

donde α(x2;λ(x1 − x2)) → 0 cuando λ → 0. Por la cuasi-convexidad de f , se tiene

f(λx1 + (1− λ)x2) ≤ f(x2) y por lo tanto la ecuación anterior implica que

λ∇f(x2)T (x1 − x2) + λ∥x1 − x2∥α(x2 : λ(x1 − x2)) ≤ 0

dividiendo entre λ

∇f(x2)T (x1 − x2) + ∥x1 − x2∥α(x2 : λ(x1 − x2)) ≤ 0

Si λ → 0 se tiene

∇f(x2)T (x1 − x2) ≤ 0

⇐] Suponga que x1, x2 ∈ S y que f(x1) ≤ f(x2), se necesita demostrar que dado (1),

se tiene f(λx1+(1−λ)x2) ≤ f(x2) , ∀λ ∈ (0, 1) esto se hará mostrando que el conjunto

L = {x : x = λx1 + (1− λ)x2, λ ∈ (0, 1), f(x1) > f(x2)}

es vacío. Por contradicción, supongamos que L no es vacío y que x′ ∈ L, por lo tanto

x′ = λx1 + (1− λ)x2 para algún λ ∈ (0, 1) y f(x′) > f(x2), como f es diferenciable f es

continua y existe un δ ∈ (0, 1) tal que

f(µx′ + (1− µ)x2) > f(x2) ∀µ ∈ [δ, 1] (1.2)

y f(x′) > f [δx′ + (1− δ)x2], luego de esta desigualdad y del teorema del valor medio

se tiene:

0 < f(x′)− f [δx′ + (1− δ)x2] = (1− δ)∇f(x)T (x′ − x2) (1.3)

donde x = µx′ + (1− µ)x2 para µ ∈ (δ, 1). De 1.2 se tiene

f(x) > f(x2)

dividiendo (1.3) entre 1− δ > 0 se tiene

∇f(x)T (x′ − x2) > 0

y a su vez implica que:

∇f(x)T (x1 − x2) > 0 (1.4)

17 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 31: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

1.2. GENERALIZACIÓN DE UNA FUNCIÓN CONVEXA

pero por otro lado, f(x) > f(x2) ≥ f(x1) y x es una combinación convexa de x1 y x2,

es decir

x = λx1 + (1− λ)x2 , λ ∈ (0, 1)

por hipótesis del teorema se tiene ∇f(x)T (x1 − x) ≤ 0 y tenemos que

∇f(x)T (x1 − λx1 − (1− λ)x2) ≤ 0

⇒ ∇f(x)T ((1− λ)x1 − (1− λ)x2) ≤ 0

⇒ (1− λ)∇f(x)T (x1 − x2) ≤ 0

que dividiendo entre 1− λ se tiene

∇f(x)T (x1 − x2) ≤ 0 (1.5)

lo que contradice (1.4). Por lo tanto, L es un conjunto vacío.

Ejemplo.

Para ilustrar el teorema:

Sea f : R2 → R : f(x, y) = x3 + y3. y

Sea x =

(2

−2

)y y =

(1

0

)Luego f(x) = 0 y f(y) = 1,luego f(x) < f(y). Por otro lado:

∇f(x, y) = 3x2 + 3y2

luego

∇f(y)(x− y) = (3, 0).(1,−2) = 3,

por la parte necesaria del teorema f no es cuasi-convexa.

Con este ejemplo también se muestra que la suma de dos funciones cuasi-convexas no

necesariamente es cuasi-convexa.

18 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 32: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

1.2. GENERALIZACIÓN DE UNA FUNCIÓN CONVEXA

1.2.3. Funciones Estrictamente Cuasi - Convexas

Estas funciones son importantes en la programación no-lineal, aseguran que el mínimo

local sobre un conjunto convexo son mínimo y máximo global respectivamente.

Definición 1.22. Sea f : S ⊂ Rn → R, donde S es un conjunto no-vacío convexo en Rn,

f se dice que es estrictamente cuasi convexa, si para cada x1, x2 ∈ S con f(x1) = f(x2),

se tiene

f(λx1 + (1− λ)x2) < max{f(x1), f(x2)} , λ ∈ (0, 1).

f se llama estrictamente cuasi cóncava si −f es estrictamente cuasi convexa.

ESTRICTAMENTE CUASI CONVEXASESTRICTA

CUASI−CÓNCAVANI UNO NI OTRO

Figura 1.12:

Observación.

Toda función convexa es estrictamente cuasi convexa.

Teorema 1.23. Sea f : Rn → R estrictamente cuasi-convexa. Sea el problema de

mın f(x) donde S conjunto convexo no-vacío en Rn. Sujeto a x ∈ S.

Si x es una solución optimal. Entonces x es también un óptimo global.

Prueba.

Por contradicción, suponga que f(x) < f(x) por la convexidad de S, λx+(1−λ)x ∈ S,

λ ∈ (0, 1). Como x es un mínimo local, entonces f(x) ≤ f(λx+ (1− λ)x) , ∀λ ∈ (0, δ)

para algun δ ∈ (0, 1). Como f es estrictamente cuasi-convexa y f(x) < f(x) luego

f(x) ≤ f(λx + (1 − λ)x) < f(x) , λ ∈ (0, 1) ⇒⇐ esto contradice la hipótesis de

optimalidad local de x por lo tanto x es una solución optima global.

19 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 33: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

1.3. CONVERGENCIA DE FUNCIONES CONVEXAS

Observación.

Toda función estrictamente cuasi convexa no es una función cuasi convexa, por ejemplo

f(x) =

1, si x = 0

0, si x = 0

f es estrictamente cuasi convexa pero no es cuasi-convexa pues para x1 = 1 y x2 = −1

f(x1) = f(x2) = 0 pero f(12x1 +

12x2) = f(0) = 1 > f(x2).

Lema 1.24. Sea S un conjunto convexo no-vacío en Rn y sea f : S → R estrictamente

cuasi-convexa y semi continua inferior, entonces f es cuasi-convexa.

Definición 1.25. Sea S un conjunto convexo no-vacio en Rn y sea f : S → R se dice

que es suedo-convexa si ∀x, y ∈ S : ∇f(x)(y − x) ≥ se tiene f(y) ≥ f(x).

1.3. Convergencia de Funciones Convexas

En esta sección presentamos algunas generalizaciones sobre la convergencia de las

soluciones de problemas de aproximación, especialmente en problemas de optimización,

en particular cuando se busca las soluciones numéricas de problemas de dimension in-

finita.

Se presenta las características sobresalientes de la teoría de la convergencia de funciones

convexas. Los resultados se muestran para funciones convexas sobre Rn.

Sean f , fv , v ∈ N funciones convexas cerradas con dominio en Rn y rango en Rn∪+∞,

el domino efectivo de una función convexa f denotado por D(f) es:

D(f) = {x ∈ Rn ; f(x) < +∞}

el epígrafo de f es:

E(f) = {(x, α) ∈ Rn × R ; f(x) < α}

20 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 34: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

1.3. CONVERGENCIA DE FUNCIONES CONVEXAS

Definición 1.26. Una función convexa f se dice que es cerrada si es semicontinua

inferior (l.s.c) y D(f) = ϕ.

En particular, esto implica que el epígrafo, E(f) de f es un sub conjunto cerrado

propio de Rn × R que no contiene ninguna recta paralela a la recta x = 0.

Las sucesiones de funciones convexas cerradas presentan dos tipos de convergencia

que son muy importantes en la convergencia de las soluciones para problemas de opti-

mización: convergencia puntual llamado ρ-convergencia Y la convergencia en términos

de los epígrafo llamada e-convergencia.

Definición 1.27. La sucesión {fv(x)}v∈N se dice que converge según la convergencia

ρ-convergencia, denotado por

fv−→ρ f

si ∀x ∈ Rn

lımv

fv(x) = f(x)

donde se permite como valor de limite a +∞ y también como elemento de la sucesión.

Este tipo de convergencia se presenta en la mayoría de los esquemas que involucran

aproximaciones directas de la función f .

Una sucesión de subconjuntos cerrados {Cv}, v ∈ N de Rn se dice que converge al

conjunto cerrado C si

lım supv

Cv = C = lım infv

Cv

y se escribe

Cv = C

donde

lım supv

Cv = {x = lımxµ : xµ ∈ Cµ , µ ∈ M ⊂ N}

lım infv

Cv = {x = lımxv : xv ∈ Cv , v ∈ N ⊂ N}

21 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 35: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

1.4. DUALIDAD

Definición 1.28. Una sucesión de funciones convexas se dice que es ϵ-convergente y se

escribe como

fv−→ϵ f

Si el epígrafo de fv converge al epígrafo de f , esto significa :

lım supE(fv) = E(f) = lım inf E(fv)

Este tipo de convergencia se necesita para tener la convergencia de la solución de prob-

lemas de optimización.

Observación.

La convergencia de una sucesión de conjuntos convexos y cerrados en Rn se obtiene

considerando la distancia de un punto x aun conjunto D tal que d(x, y) es una métrica

definida en Rn(métrica euclidiana).

1.4. Dualidad

En esta sección se verá una formulación que permite resolver problemas convexos.

Se verá la forma de conseguir problemas de optimización convexa a partir de cualquier

problema de optimización. Para esto es necesario definir la función lagrangiana y los

multiplicadores de Lagrange, que permiten reincorporar las restricciones a las función

objetivo para luego generar un nuevo problema de optimización conocido como el prob-

lema dual lagrangiano. Si el problema inicial también llamado problema primal, es no-

convexo el problema dual Lagrangiano asociado, si es convexo y por lo tanto es posible

resolverlo generando un límite (o cota) inferior para el valor óptimo del problema primal

de la forma (2.1).

Si el problema inicial es convexo y bajo algunas condiciones, entonces el límite se

ajusta al valor óptimo del problema original y para que esto ocurra se estudian las

condiciones de Karush-Khun-Tucker (KKT) que sirven de base a los algoritmos de res-

olución.

En algunos casos hay aplicaciones en que la solución es más eficiente resolviendo el

problema dual lagrangiano.

22 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 36: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

1.4. DUALIDAD

1.4.1. Función Dual de Lagrange

Sea el problema de optimización en forma estándar

mın f(x)

s.a : gi(x) ≤ 0, i = 1, 2 . . . ,m (1.6)

hj(x) = 0, j = 1, 2 . . . , p

x ∈ D ⊆ Rn

donde D = dom f∩ m∩

i=1

dom gi∩ p∩

j=1

dom hj.

Se define la función lagrangiana.

L : Rn × Rm × Rp → R (1.7)

asociada como

L(x, λ, µ) = f(x) +m∑i=1

λigi(x) +

p∑j=1

µjhj(x)

λi es el i-ésimo multiplicador de Lagrange asociado a la desigualdad gi(x) ≤ 0. µj es el

j-ésimo multiplicador de Lagrange asociado a la ecuación hj(x) = 0 de forma vectorial se

considera a λ y µ las variables duales o vectores multiplicadores de Lagrange, la función

dual de Lagrange es:

θ(λ, µ) = ınfx∈D

L(x, λ, µ)

La función θ puede tomar o asumir −∞ para algún vector (λ, µ). La función L es afín

respecto a λ y µ y por tanto la función dual será el ínfimo puntual de una familia de

funciones afines de (λ, µ) es decir θ es una función cóncava independientemente de si el

problema primal (2.5) es o no convexo.

Teorema 1.29. Dualidad Débil. Sea x un punto factible de (2.5), es decir g(x) ≤ 0

y h(x) = 0 , x ∈ D y sea (λ, µ) tal que λ ≥ 0, entonces

θ(λ, µ) ≤ L(x, λ, µ) ≤ f(x)

Prueba.

Como gi ≤ 0, λi ≥ 0, i = 1 . . .m entonces λi.gi(x) ≤ 0, ∀i = 1 . . .m, es decirm∑i=1

λigi(x) ≤ 0

23 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 37: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

1.4. DUALIDAD

análogamente hj(x) = 0 y µj es libre de signo, luego

µjhj(x) = 0 ∀i = 1 . . . p

es decirm∑j=1

µjhj(x) = 0

luego se cumple que

m∑λigi(x) +

m∑µjhj(x) ≤ 0 siλ ≥ 0

sumando f(x):

f(x) +m∑

λigi(x) +m∑

µjhj(x)︸ ︷︷ ︸ ≤ f(x)

L(x, λ, µ) ≤ f(x) (1.8)

como

θ(λ, µ) = ınfx∈D

L(x, λ, µ) ≤ L(x, λ, µ) (1.9)

de (1.8) y (1.9) se tiene

θ(λ, µ) ≤ L(x, λ, µ) ≤ f(x) �

Observación.

Del teorema anterior, como θ(λ, µ) ≤ f(x) para cualquier x factible, también se cumplirá

en el punto óptimo x∗ es decir

θ(λ, µ) ≤ f(x∗) = z∗

lo que significa que la función dual genera una cota inferior para el valor óptimo z∗.

Este límite no será útil si θ(λ, µ) = −∞, por lo que se dirá de (λ, µ) el par dual factible

cuando λ ≥ 0 y (λ, µ) ∈ dom(θ).

24 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 38: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

1.4. DUALIDAD

1.4.2. Problema Dual Lagrangiano

Como se ha visto que si λ ≥ 0, el par (λ, µ) genera una cota inferior para el valor

óptimo z∗ del problema primal. El problema dual Lagrangiano consiste en buscar la

mejor de estas cotas, es decir:

(DP ) max θ(λ, µ) (1.10)

λ ≥ 0

1.4.3. Interpretación Geométrica del Problema Dual Lagrangiano

Por efectos de simplicidad consideraremos el problema de optimización con solo una

restricción de desigualdad y sin restricciones de igualdad, es decir el problema primal es:

mın f(x)

g(x) ≤ 0 (1.11)

x ∈ D ⊂ Rn

En el plano (y, z) sea el conjunto G = {(y, z) : y = g(x), z = f(x), x ∈ D}, entonces G

es la imagen de D bajo la aplicación (g, f). El problema primal consiste en encontrar un

punto en G tal que y ≤ 0 con valor mínimo en la ordenada. Este punto obviamente es

(y, z) en la figura.

.

Z

B

Y

D

x

G

(g(x),f(x)).

(y,z)− −

ϕ ( λλ λ) αz+ =m=− λ

(g, γ )

y

Figura 1.13:

25 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 39: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

1.4. DUALIDAD

El problema dual Lagrangiano es:

max φ(λ)

λ ≥ 0

Supongamos que λ ≥ 0 es dado. Para determinar φ(λ) es necesario minimizar f(x) +

λg(x), para x ∈ D. Considerando y = g(x) y z = f(x) para x ∈ D, es necesario

minimizar z + λy sobre los puntos de G. Se observa que z + λy = α es la ecuación de

una recta con pendiente −λ y con intersección en α en el eje z. Para minimizar z + λy

sobre G es necesario reemplazar la recta z+λy = α en movimientos paralelos así mismo

tanto como sea posible manteniéndola en contacto con G y en dirección de su gradiente

negativo. Es decir la recta z + λy = α se desplaza hasta que sea soporte inferior de G,

entonces el intercepto de dicha recta soporte con el eje Z genera a φ(λ) como se observa

en la figura (1.13).

Por lo tanto el problema dual Lagrangiano equivale ha hallar la pendiente del hiperplano

soporte tal que su intercepto con el eje Z sea maximal.

En la gráfica se observa que la solución del problema dual se obtiene en el hiperplano

soporte de pendiente m = −λ (cualquier otro hiperplano soporte de pendiente negativa

genera cotas inferiores para el valor óptimo del problema primal), la solución del proble-

ma dual es λ y el valor objetivo óptimo del problema dual es z. Pero como z = f(x) en

este caso se tiene que z también es el valor óptimo de la función objetivo del problema

primal.

Ejemplo.

Sea el problema primal:

mın x21 + x2

2

s.a −x1 − x2 + 4 ≤ 0

x1, x2 ≥ 0

Se observa que el óptimo se encuentra en (2, 2) y f ∗(2, 2) = 8.

Considerando g(x) = −x1 − x2 + 4 y D = {(x1, x2) : x1, x2 ≥ 0} la función dual de

26 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 40: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

1.4. DUALIDAD

lagrange es

φ(λ) = ınf{x21 + x2

2 + λ(−x1 − x2 + 4);x1, x2 ≥ 0}

= ınf{x21 − λx1 : x1 ≥ 0}+ ınf{x2

2 − λx2 : x2 ≥ 0 + 4λ}

luego el ínfimo de φ(λ) cuando λ ≥ 0 es alcanzado en x1 = x2 = λ/2 y cuando λ < 0 el

ínfimo es alcanzado en x1 = x2 = 0 por lo tanto:

φ(λ) =

−1

2λ2 + 4λ ; λ ≥ 0

4λ ; λ < 0

x2

x1

(4,0)

1 2( x , x ) = ( 2,2 )

(4 , 0)

Figura 1.14:

es la función dual lagrangiana. φ es una función cóncava y el problema dual la-

grangiano es (D)

max φ(λ)

s.a λ ≥ 0

La solución del problema dual lagrangiano es en λ = 4 con φ(4) = 8. Observe que

d∗ = φ(λ) = 8 = f((2, 2)) = 8 es decir los valores óptimos de las funciones objetivos

primal y dual son iguales.

27 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 41: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

1.4. DUALIDAD

ϕ λλ

λ

( )

4 , 8( )

4321

Figura 1.15:

Observación.

La diferencia z∗ − d∗ es la distancia óptima de dualidades o “hueco de dualidad”. En

algunos casos se utiliza este valor como cota inferior para el valor óptimo del problema

primal cuando este es difícil de resolver, ya que el problema dual siempre es convexo.

1.4.4. Condición de Slater

Cuando la distancia óptima de dualidad es cero se dice que hay “dualidad fuerte” y

significa que

d∗ = z∗,

para esto se cumpla se debe tener ciertas condiciones conocidas como condiciones de

cualificación. Unas de estas condiciones es la condición de Slater:

∃ x ∈ int(D) : gi(x) < 0; i = 1 . . .m

Ax = b

es decir que tiene que existir un punto x estrictamente factible, es decir que las restric-

ciones de desigualdades se cumplen de forma estricta. Sin embargo si algunas de las

restricciones de desigualdad son afines no es necesario que la desigualdad sea estricta

puede ser (≤).

Además, la condición de Slater también garantiza que si se cumple se puede encontrar

una solución para el problema dual.

28 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 42: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

1.4. DUALIDAD

1.4.5. Condiciones de Optimalidad

Si es posible hallar un punto dual factible (λ, µ), servirá como prueba para garantizar

que z∗ ≥ φ(λ, µ).

Estos puntos permiten conocer en que medida es sub óptimo un punto x que sea factible,

sin necesidad de conocer el valor exacto de z∗

f(x)− z∗ ≤ f(x)− φ(λ, µ)

1.4.5.1. Holgura Complementaria

Supongamos que el problema primal y dual presentan dualidad fuerte es decir que

los valores objetivos de ambos problemas son iguales. Si x∗ es el óptimo del problema

primal y (λ∗, µ∗) del problema dual,

f(x∗) = φ(λ∗, µ∗)

= ınfx(f(x) +

m∑i

λ∗i gi(x) +

m∑i

µ∗ihi(x))

≤ f(x∗) +m∑i=1

λ∗i gi(x

∗)︸ ︷︷ ︸+m∑i

µ∗i hi(x

∗)︸ ︷︷ ︸≤ 0 = 0

≤ f(x∗)

esto indica que las desigualdades se tienen que cumplir como igualdades. Es decirm∑i=1

λ∗i gi(x) = 0

como los términos de esta sumatoria son negativos o cero, se llega a la condición de

holgura complementaria

λ∗i gi(x

∗) = 0 i = 1 . . .m

que se cumple siempre que hay dualidad fuerte.

Equivalentemente

λ∗i > 0 ⇒ gi(x

∗) = 0 i = 1 . . .m

gi(x∗) < 0 ⇒ λ∗

i = 0

cuando una restricción de desigualdad i, se cumple como igualdad se dice que es “activa”

y esto ocurre cuando λi > 0. En otro caso no está activa y el multiplicador es cero.

29 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 43: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

1.4. DUALIDAD

1.4.5.2. Condiciones de Karush-Khun-Tucker (KKT)

Supongamos que las funciones f , gi, hi son diferenciables y no requerimos ninguna

condición en cuanto a convexidad. Supongamos también que en los puntos x∗ y (λ∗, µ∗) la

distancia de dualidad es cero. Como x∗ minimiza la función dual lagrangiana L(x, λ∗, µ∗)

su gradiente en x∗ tiene que hacerse cero, es decir:

∇f(x∗) +m∑i=1

λ∗∇gi(x) +

p∑i=1

µ∗∇hi(x) = 0

Por lo tanto para que un problema con funciones objetivo y restricciones diferenciables

tenga dualidad fuerte x∗ y (λ∗, µ∗) tienen que cumplir las siguientes condiciones llamadas

de Karush-Kuhun-Tucker (KKT)

gi(x∗) ≤ 0 , i = 1 . . .m

hi(x∗) = 0 , i = 1 . . . p

λi ≥ 0 , i = 1 . . .m

λ∗i gi(x

∗) ≤ 0 , i = 1 . . .m

∇f(x∗) +m∑i=1

λ∗∇gi(x) +

p∑i=1

µ∗∇hi(x) = 0

En el siguiente teorema se da las condiciones suficientes para optimalidad según Karush-

Kuhun-Tucker.

Teorema 1.30. Sea D ⊂ Rn abierto y no-vacío y sea f : Rn → R, gi : Rn → R para

i = 1 . . .m y hi : Rn → R para i = 1 . . . p sea el problema

(P ) mın f(x)

s.a gi(x) ≤ 0 i = 1 . . .m

hi(x) = 0 i = 1 . . . p

x ∈ D

Sea x una solución factible y sea I = {i : gi(x) = 0} suponga x es un punto KKT, es

decir que ∃λi ≥ 0 para i ∈ I y µi para i = 1 . . . p tal que

30 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 44: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

1.4. DUALIDAD

∇f(x) +∑i∈I

λi∇gi(x) +

p∑i=1

µi∇hi(x) = 0 (1.12)

Sea J = {i : µi > 0} y K = {i : µi < 0}, además suponga que f es seudo convexa en

x, gi es cuasi convexa en i ∈ I, hi es cuasi convexa en x para i ∈ J , y hi cuasi cóncava

en x para i ∈ K. Entonces x es una solución óptima global para el problema (P).

En particular si las suposiciones de convexidad generalizada sobre la función objetivo

y las restricciones se restringen al dominio Nϵ(x) para algún ϵ > 0, entonces x es un

mínimo local para el problema (P).

Prueba.

Sea x una solución factible para (P), entonces para i ∈ I, gi(x) ≤ gi(x) pues gi(x) ≤ 0

y gi(x) = 0.

Por la cuasi convexidad de gi en x se tiene que

gi(x+ α(x− x)) = gi(αx+ (1− α)x) ≤ max{gi(x), gi(x)} ≤ gi(x)

para α ∈ (0, 1). Esto implica que gi no crece cuando x se mueve a lo largo de la dirección

x− x.

Además se tiene

∇gi(x)T (x− x) ≤ 0 i ∈ I (1.13)

Similarmente, como hi es cuasi convexa en x para i ∈ J y hi es cuasi cóncava en x para

i ∈ K, se tiene

∇hi(x)T (x− x) ≤ 0 i ∈ J (1.14)

∇hi(x)(x− x) ≥ 0 i ∈ K (1.15)

multiplicando (1.13), (1.14) y (1.15) por λi ≥ 0 , µi > 0 y µi < 0 respectivamente y

sumando las expresiones se tiene

31 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 45: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

1.4. DUALIDAD

[∑i∈I

λi∇gi(x) +∑

i∈J∪K

µi∇hi(x) = 0

]T(x− x) ≤ 0 (1.16)

multiplicando (1.12) por (x− x) y considerando que µi = 0 para i ∈ J ∪K entonces

(1.16) implica que

∇f(x)T (x− x) ≥ 0

como f es seudo convexa en x, se tiene que

f(x) ≥ f(x) , x ∈ D

con lo que queda demostrado que x es un óptimo global para (P). �

Observaciones.

Cuando se produce dualidad fuerte, las variables duales óptimas proporcionan informa-

ción útil sobre la sensibilidad que tiene el valor óptimo frente a perturbaciones en las

restricciones, es decir si:

mın f(x)

gi(x) ≤ bi i = 1 . . .m

hi(x) = di i = 1 . . . p

es el problema perturbado. Sea p∗(b, d) el valor óptimo del problema perturbado en

función de (b, d), si p∗(b, d) es diferenciable en b = 0 , d = 0 y hay dualidad fuerte,

entonces las variables duales óptimas λ∗ y µ∗ se relacionan con el gradiente de p∗(b, d)

en b = 0 y d = 0 como

λ∗i =

∂p∗(0, 0)

∂bi, µ∗

i =∂p∗(0, 0)

∂di

es decir los multiplicadores óptimos de Lagrange son exactamente las sensibilidades del

valor óptimo con respecto a las perturbaciones. Estas medidas valen cerca al punto

óptimo y dan una idea cuantitativa de lo activo que es una restricción en el punto

óptimo.

32 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 46: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

Capítulo 2

Optimización Convexa

En este capítulo presentamos la formulación de un problema de optimización convexa,

sus características, criterios de optimalidad, equivalencia entre problemas convexos, así

como también presentamos algunos problemas de optimización que pueden transformarse

en problemas de optimización convexa y aprovechar así las características de un problema

de optimización convexa para su resolución.

2.1. Formulación Estándar

La formulación estándar de un problema de optimización convexa es de la forma

mın f(x)

s.a : gi(x) ≤ 0, i = 1, 2 . . . ,m (2.1)

hj(x) = 0, j = 1, 2 . . . , p

donde f y g para i = 1 . . .m son funciones convexas definidas de Rn → R y

hj(x) = atjx− bj, j = 1, . . . p, es decir son funciones afines.

Observación.

◦ De la formulación se tiene que el conjunto factible de un problema convexo es un

conjunto convexo.

◦ Si atj = 0 y bj = 0 para algún j, entonces la j-ésima restricción puede eliminarse del

33

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 47: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

2.1. FORMULACIÓN ESTÁNDAR

conjunto de restricciones. Si atj = 0 y bj = 0 la j-ésima restricción es inconsistente

y por tanto este problema es infactible.

◦ Se busca minimizar una función convexa sobre un conjunto convexo.

◦ Como los conjuntos de subniveles de una función convexa son convexos,se tiene

que para un problema de optimización convexa o cuasi-convexa los conjuntos ε-sub

optimales son convexos.

Ejemplo 2.1.

mın x21 + x2

2

x1

1 + x22

≤ 0

(x1 + x2)2 = 0

Este problema no es uno de optimización convexa en forma estándar, pues la función de

la restricción de igualdad no es afín y la función de restricción de la desigualdad no es

convexo.

Ejemplo 2.2.

mın f(x) = x21 + x2

2

x1 ≤ 0

x1 + x2 = 0

Este problema si es un problema de optimización convexa en forma estándar.

Observar que en los ejemplos (2.1) y (2.2) la región factible es

{x ∈ R2 : x1 ≤ 0; x1+x2 = 0} que es un conjunto convexo, es decir en ambos problemas

se tiene que minimizar una función convexa f(x1, x2) = x21 + x2

2 sobre un conjunto

factible convexo. En el presente trabajo solo consideraremos problemas de optimización

convexa formulados en forma estándar como el ejemplo (2.2). La minimización de una

función convexa sobre un conjunto convexo, como la del ejemplo (2.1), se conoce como

“problemas de optimización convexa abstractas”.

34 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 48: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

2.2. ÓPTIMO LOCAL Y GLOBAL

2.2. Óptimo Local y Global

Teorema 2.3. En un problema de optimización convexa, cualquier punto óptimo local,

también es óptimo global.

Prueba.

Supongamos que, x es un óptimo local de un problema de optimización convexa (2.1),

es decir x es factible en

f(x) = ınf{f(y) : y factible, ∥y − x∥2 ≤ ϵ} para algún ϵ > 0 (2.2)

Por contradicción, supongamos ahora que x no es óptimo global de 2.1, es decir existe

un z factible tal que f(z) < f(x), evidentemente ∥z − x∥2 > ϵ.

Sea y tal que

y = (1− λ)x+ λz , λ =ϵ

2∥z − x∥2luego

∥y − x∥2 = ∥(1− λ)x+ λz − x∥2

= ∥ − λx+ λz∥2

= |λ|∥z − x∥2

= | ϵ

2∥z − x∥2|∥z − x∥2

2< ϵ

y por la convexidad del conjunto factible y es un punto factible.

Por la convexidad de f se tiene

f(y) ≤ (1− λ)f(x) + λf(z) < (1− λ)f(x) + λf(x) = f(x)

es decir f(y) < f(x), lo que contradice (2.2).

Por lo tanto x es un óptimo global. �

En los problemas de optimización cuasi-convexas el teorema no se cumple.

35 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 49: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

2.2. ÓPTIMO LOCAL Y GLOBAL

En el siguiente teorema se presenta un criterio de optimalidad cuando la función f

de un problema de optimización convexa es diferenciable.

Teorema 2.4. Consideramos que en el problema 2.1 f es diferenciable, entonces x es

optimal si y solo si x ∈ X = {x : gi(x) ≤ 0 i = 1, . . . ,m; hj(0) = 0; j = 1 . . . p} y

∇f(x)t(y − x) ≥ 0 ∀y ∈ X (2.3)

Prueba.

⇐] Supongamos que x ∈ X y satisface (2.3). Luego si y ∈ X es decir es un punto factible

y f diferenciable se tiene:

f(y) ≥ f(x) +∇f(x)T (y − x) ≥ f(x)

pues x satisface (2.3) por lo tanto x es un óptimo de (2.1).

⇒] Supongamos que x es un óptimo de (2.1) pero que (2.3) no se cumple, es decir, para

algun y ∈ X se tiene ∇f(x)T (y − x) < 0.

Sea el punto z(t) = ty + (1 − t)x, t ∈ [0, 1] como z(t) es el segmento que une x e y y

el conjunto factible es convexo, entonces z(t) es factible. Luego para t > 0 pequeño se

tiened

dtf(z(t))|t=0 =

d

dtf(ty + (1− t)x)|t=0

= ∇f(x)T (y − x) < 0

por la diferenciabilidad de f : f(z(t)) ≥ f(x) +∇f(x)T (y − x) por lo tanto para t > 0

pequeño, f(z(t)) < f(x). �

Geométricamente

La condición de optimalidad se puede interpretar como:

36 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 50: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

2.2. ÓPTIMO LOCAL Y GLOBAL

H

X

x

f (x)

Figura 2.1:

X es el conjunto factible, las curvas punteadas son algunas curvas de nivel de la

función f . x es el punto optimal y −∇f(x) define un hiperplano soporte de X en x.

Observación.

1) Para un Problema de Optimización sin Restricciones.

(m = p = 0) la condición (2.3) se reduce a la conocida condición necesaria y

suficiente de optimalidad de una función diferenciable

∇f(x) = 0

para x óptimo.

Ejemplo.

Problema de optimización cuadrática sin restricciones:

mın1

2xtQx+ qtx+ r

donde Qn×m semi-definida positiva.

La condición necesaria y suficiente para que x sea un mínimo de f es

∇f(x) = Qx+ q = 0

De esta ecuación lineal se tiene los siguientes casos:

◦ Si q ∈ ran(Q) entonces la ecuación no tiene solución y f es no acotada

inferiormente.

◦ Si Q no es nula,existe minimizador único x∗ = −Q−1q.

37 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 51: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

2.2. ÓPTIMO LOCAL Y GLOBAL

◦ Si Q es singular pero q ∈ ran(Q) entonces el conjunto de puntos optimales es

el conjunto afín Xopt = −Qt(q) + ker(Q) donde Qt es la seudo-convergencia

de Q.

Ejemplo.

Sea f : Rn → R con f(x) = −m∑i=1

log(bi − aTi x), y Dom(f) = {x : Ax < b} donde

aTi . . . aTm son las filas de A. Se busca:

mınx∈Rn

f(x)

como f es diferenciable, las condiciones necesarias y suficientes para que x sea

óptimo son: Ax < b y ∇f(x) = 0

m∑i=1

1

bi − aia1 = 0 (2.4)

Con la condición Ax < b garantiza a x ∈ dom(f).

Si Ax < b es no-factible, entonces el dom(f) está vacío. Asumiendo Ax < b es

factible, aun así se tiene los siguientes casos:

◦ f es no acotado inferiormente.

◦ No hay soluciones para (2.4) y por tanto no hay puntos óptimos para el

problema.

◦ Existen muchas soluciones de (2.4) ,cuando las soluciones forman un conjunto

afín.

◦ Existe solución única de (2.4),es decir existe un único minimizador de f , esto

es cuando {x ∈ Rn : Ax < b} es no vacío y acotado.

2) Problemas sólo con Restricciones de Igualdad.

Sea

mın f(x)

s.a : Ax = b

38 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 52: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

2.2. ÓPTIMO LOCAL Y GLOBAL

El conjunto factible es un espacio afín y consideramos que es no-vacío,de otra forma

el problema sería no-factible, la condición de optimalidad para un x factible es:

∇f(x)T (y − x) ≥ 0

debe cumplirse ∀ y que satisface la región factible Ax = b. Como x es factible,

cada y factible es de la forma

y = x+ v para algún v ∈ Nucleo (A)

Por lo tanto, la condición de optimalidad puede expresarse como

∇f(x)Tv ≥ 0 ∀v ∈ N(A).

Si una función lineal es no-negativa sobre un subespacio, es porque ∇f(x)T .v = 0

∀v ∈ N(A), es decir

∇f(x)⊥N(A)

Como N(A)⊥ = R(AT ),esta condición de optimalidad puede expresarse como:

∇fT (x) ∈ R(AT )

es decir existe v ∈ Rn tal que

∇f(x0) + ATv = 0

junto con x tal que Ax = b, se tiene las clásicas condiciones de los multiplicadores

de lagrange.

39 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 53: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

2.3. PROBLEMAS CONVEXOS EQUIVALENTES

2.3. Problemas Convexos Equivalentes

En esta sección se muestra cual de las transformaciones descritas en el capítulo 1,

preservan la convexidad.

2.3.1. Eliminando las Restricciones de Igualdad.

En un problema de optimización convexa las restricciones de igualdad son de la forma

Ax = b, estas pueden eliminarse hallando una solución particular x0 de Ax = b y una

matriz F cuyo rango es el del espacio nulo de A, que resulta en el problema de variable

z:

mın f(Fz + x0)

s.a : gi(Fz + x0) ≤ 0 , i = 1, . . .m

con variable z.

Como la composición de una función convexa con una afín es una función convexa, elim-

inando las restricciones de igualdad se preserva la convexidad del problema. Además el

proceso de eliminación de las restricciones de igualdad involucran operaciones elemen-

tales de algebra lineal. Todo esto significa, que debemos de preocuparnos por analizar

problemas de optimización convexa que no tienen restricciones de igualdad. Sin embargo

en muchos casos es mejor mantener estas restricciones pues eliminarlas podría hacer mas

duro su analisis y solución e incluso hasta puede arruinar la eficiencia de algún algoritmo

que resuelva el problema.

2.3.2. Agregando Restricciones de Igualdad.

En un problema de optimización convexa es posible introducir restricciones de igual-

dad y nuevas variables lineales y el problema resultante sigue siendo convexo. Por ejem-

plo si se tiene en la función objetivo o en alguna restricción una función de la forma

fi(Aix + bi) donde Ai ∈ Rki×n, introduciendo una nueva variable yi ∈ Rki y reem-

plazando fi(Aix+ bi) por fi(yi) y agregando en el conjunto de restricciones la restricción

yi = Aix+ bi, se tienen problemas convexos equivalentes.

40 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 54: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

2.3. PROBLEMAS CONVEXOS EQUIVALENTES

2.3.3. Variables de Holgura.

En un problema de optimización convexa con restricciones de desigualdades lineales

de la forma gi(x) ≤ 0 , i = 1 . . .m, es posible introducir variables si ≥ 0 ; i = 1 . . .m tal

que gi(x)+si = 0 y se mantiene la convexidad del problema, además de tener problemas

de optimización equivalentes.

2.3.4. Problema de la Forma Epígrafo.

Este problema es de la forma:

min t

s.a : f(x)− t ≤ 0

gi(x) ≤ 0 i = 1 . . .m (2.5)

aTj x = bj j = 1 . . . p

Como la función objetivo f es convexa la nueva función restricción f(x)− t también

lo es en (x, t) por tanto el problema (2.5) conocido como problema en la forma epígrafo

también es convexo.

Observación.

Este problema equivalente en muchos casos resulta de gran utilidad, por ejemplo en el

caso de P.L los algoritmos de resolución son mas simples.

2.3.5. Minimización Sobre Algunas Variables.

Minimizar una función convexa sobre algunas de sus variables preserva la convexidad.

Por ejemplo si

min fo(x1, x2)

fi(x1) ≤ 0, i = 1 . . .m1

fi(x2) ≤ 0, i = 1 . . .m2

41 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 55: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

2.4. OPTIMIZACIÓN CUASI-CONVEXA.

Es el problema que se obtiene de particionar x = (x1, x2) con x1 ∈ Rn1 , x2 ∈ Rn2

con n1 + n2 = n y donde las restricciones son independientes para x1 y x2 si primero se

minimiza sobre x2. Se define la función fo como:

fo(x1) = ınf{fo(x− 1, z)/fi(z) ≤ 0, i = 1 . . .m2}

luego si fi i = 1 . . .m y fi i = 1 . . .m2 son convexas entonces el problema

min fo(x1)

fi(x1) ≤ 0, i = 1 . . .m

es convexo.

2.4. Optimización Cuasi-Convexa.

En esta sección se mostrará algunas diferencias básicas entre la optimización convexa

y los problemas de optimización cuasi-convexa.Se mostrará también que la solución de

un problema de optimización cuasi-convexa puede reducirse a la solución de una sucesión

de problemas de optimización convexa.

un problema de optimización cuasi-convexo en forma estándar es:

min f(x)

gi(x) ≤ 0 gi = 1 . . .m (2.6)

Ax = b

donde las gi, i = 1 . . .m son funciones convexas y f es cuasi-convexa.

2.4.1. Condiciones de Optimalidad y Solución Óptima Local

La diferencia mas importante entre un problema de optimización cuasi-convexo con

uno convexo es que en el problema de optimización cuasi-convexo se puede tener solu-

ciones óptimas locales que no son óptimos globales.

Este hecho se puede ver en el caso simple de f : R → R (ver figura 2.2) cuasi-convexa

42 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 56: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

2.4. OPTIMIZACIÓN CUASI-CONVEXA.

con un punto óptimo local que no es óptimo global.

(x,f(x))

Figura 2.2:

Sin embargo una variación de la condición de optimalidad para un problema convexo

con f diferenciable en el siguiente sentido:

∇f(x)T (y − x) ≥ 0 ∀y ∈ X (2.7)

considerando X = {x ∈ Rn : gi ≤ 0, i = 1 . . .m,Ax = b} el conjunto factible de (2.6) y

f diferenciable, x es óptimo si x ∈ X y

∇f(x)T (y − x) > 0 ∀y ∈ X − {x} (2.8)

(ver teorema en preliminares).

Las diferencias mas importantes son:

1. La condición (2.8) es sólo una condición de optimalidad suficiente para el prob-

lema (2.6). Mientras que (2.7) es una condición necesaria para el problema de

optimización convexo.

2. La condición (2.8) requiere que el gradiente de f sea no-nulo, mientras que (2.7) no.

Realmente cuando ∇(f(x)) = 0 en el caso convexo. La condición (2.7) se cumple

y x es óptimo.

43 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 57: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

2.4. OPTIMIZACIÓN CUASI-CONVEXA.

2.4.2. Optimización Cuasi-Convexa vía Problemas de Factibili-

dad Convexos

Una aproximación a problemas de optimización cuasi-convexa es mediante la repre-

sentación de los conjuntos subniveles de una función cuasi-convexa mediante una familia

de desigualdades convexas.

Sea φt : Rn → R, t ∈ R, una familia de funciones convexas que satisfacen

f(x) ≤ t ⇔ φt(x) ≤ 0

y también para cada x, φt(x) es una función no creciente es decir φs(x) ≤ φt(x) para

s ≥ t

Sea p∗ el valor óptimo del problema cuasi convexo (2.6), si el problema de factibilidad

convexo:

hallar x

s.a φt(x) ≤ 0

gi(x) ≤ 0 i = 1 . . .m (2.9)

Ax = b

es factible, entonces p∗ ≤ t. Si (2.9) es no factible entonces p∗ ≥ t se llama problema

de factibilidad convexo, debido a que todas las restricciones de inecuaciones son todas

funciones convexas y las de igualdad son lineales.

Del hecho, de que si el problema de factibilidad convexo (2.9) es factible, entonces p∗ ≤ t

y cualquier x factible para el problema cuasi-convexo satisface f(x) ≤ t. Si, el problema

de factibilidad convexa es no factible, entonces p∗ ≥ t.

Esto puede ser usado como base de un algoritmo simple para resolver el problema de

optimización cuasi-convexo usando bisección, procedimiento que en cada paso resuelve

un problema de optimización convexa.

44 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 58: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

2.4. OPTIMIZACIÓN CUASI-CONVEXA.

2.4.3. Método de Bisección para Optimización Cuasi-Convexa

Supongamos que el problema cuasi-convexo es factible y sea el intervalo inicial [l, u]

que contiene p∗ luego se resuelve el problema de factibilidad (2.9) en su punto medio

t = (l+u)2

para determinar el valor óptimo, el cual es una cota media superior o inferior

del intervalo se actualiza el intervalo.

Esto produce un nuevo intervalo que sigue conteniendo el valor óptimo pero ya es la

mitad que el inicial.Este proceso se repite hasta que el intervalo sea lo suficientemente

pequeño.

Algoritmo

Inicio: l ≤ p∗ u ≥ p∗, definir ϵ > 0 tolerancia para el criterio de parada.

paso Iterativo

1. t =(l + u)

2

2. Resolver el problema de factibilidad convexa (2.9)

3. Si (2.9) es factible u = t, si no l = t

Ir a (1) y repetir hasta que u− l ≤ ϵ.

El proceso del algoritmo descrito garantiza que l ≤ p∗ ≤ µ despues de k iteraciones la

longitud del intervalo es 2−k(µ− l) donde µ− l es la longitud del intervalo inicial. Luego

para que el algoritmo finalice son necesarias [log2((µ− l)

ϵ)] iteraciones, en cada paso se

resuelve el problema de factibilidad convexo (2.9).

45 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 59: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

2.5. CLASIFICACIÓN DE PROBLEMAS DE OPTIMIZACIÓN CONVEXA

2.5. Clasificación de Problemas de Optimización Con-

vexa

En las siguientes secciones se verá distintos tipos de problemas convexos que se

pueden agrupar considerando el siguiente esquema

OPTIMIZACIÓN CONVEXA

PROGRAMACIÓN GEOMÉTRICA PROBLEMA CON DESIGUALDADES

GENERALIZADAS(GP)

PROGRAMACIÓN CÓNICA (CP)

P.C de 2 Ordeno−

(SOCP)

PROGRAMACIÓN

SEMI DEFINIDA

(PSDP)

P. CUADRÁTICA CON RESTRICCIONES

P. CUADRÁTICA (RP)

PROGRAMACIÓN LINEAL (LP)

Figura 2.3:

2.5.1. Problemas de Optimización Lineal

Cuando todas las funciones del problema son afines tanto de la función objetivo como

las restricciones, el problema de optimización se llama lineal (LP)

mın ctx+ d

Gx ≤ h G ∈ Rmxn (2.10)

Ax = b A ∈ Rpxn

46 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 60: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

2.5. CLASIFICACIÓN DE PROBLEMAS DE OPTIMIZACIÓN CONVEXA

El conjunto factible es un poliedro. Normalmente se omite la constante d porque

no afecta al resultado. Como las funciones afines son convexas y cóncavas, se puede

considerar también al problema de maximización como convexo.

Geométricamente

P *

− c

x

Figura 2.4:

La región factible es un poliedro P y busca minimizar la función afín ct + d sobre P .

Forma Estándar y de Desigualdades de un Problema Lineal:

El formato estándar del problema LP (2.10) es:

mın ctx

Ax = b (2.11)

x ≥ 0

es decir las únicas restricciones de desigualdad son las de no-negatividad de las vari-

ables.

Mientras que el formato de desigualdades de un PL es

mın ctx

Ax ≤ b (2.12)

es decir no tiene restricciones de ecuaciones.

47 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 61: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

2.5. CLASIFICACIÓN DE PROBLEMAS DE OPTIMIZACIÓN CONVEXA

Observación.

Para pasar un PL (2.10) a la forma estándar se usan variables de holgura si para las

restricciones de desigualdad y la variable x se escribe como la diferencia de 2-variables

no-negativas x+ y x− es decir x = x+ − x− , x+ ≥ 0 x− ≥ 0, con esto se tiene

mın ctx+ − ctx− + d

Gx+ −Gx− + s = h

Ax+ − Ax− = b

x+ ≥ 0 , x− ≥ 0 , s ≥ 0

que es un LP en forma estándar

Ejemplos.

1. Centro de Chebychev de un Poliedro

Se desea hallar la bola euclidiana más grande que queda dentro de un poliedro

descrito por inecuaciones lineales

P = {x ∈ Rn : atix ≤ bi, i = 1 . . .m}

el centro de la bola optimal es llamado centro de chebyshev del poliedro. Sea

B = {xc + µ : ∥µ∥2 ≤ r}

la representación de la bola. La variable del problema es xc ∈ Rn y r ∈ R. Se desea

maximizar r sujeto a que B ⊂ P . Por lo tanto el PL es

max r

atixc + r∥ai∥2 ≤ bi i = 1 . . .m

en las variables r y xc.

2. Función Lineal por Partes

Sea f(x) = maxi

{(atix + b)} una función convexa lineal por partes,se minimiza f .

Este problema puede transformarse en uno de PL

mın t

atix+ rbi ≤ t i = 1 . . .m

48 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 62: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

2.5. CLASIFICACIÓN DE PROBLEMAS DE OPTIMIZACIÓN CONVEXA

3. Planificación de una Actividad Dinámica

Se desea planificar los niveles de actividad de n actividades o sectores de una

economía, sobre N periodos de tiempo. Sea xj(t) ≥ 0 , t = 1 . . . N , el nivel de

actividad del sector j en el periodo t.

Cada actividad consume y produce bienes o productos en proporción a su nivel de

actividad.

La cantidad del bien i producido por cada unidad de actividad j es aij. Simi-

larmente la cantidad del bien i consumido por unidad de actividad j es bij. La

cantidad total de bienes producidos en un periodo t es Ax(t) ∈ Rm y la cantidad

de bienes consumidos es Bx(t) ∈ Rm.

Los bienes consumidos en su periodo no pueden excederse a aquellos producidos

en el periodo anterior se busca tener Bx(t+1) ≤ Ax(t) para t = 1 . . . N . Se conoce

el vector go ∈ Rm de bienes iniciales tal que las restricciones en el primer periodo

de los niveles de actividad es Bx(1) ≤ go, los excesos de los bienes no consumidos

por las actividades son:

s(0) = go −Bx(1)

s(t) = Ax(t)−Bx(t+ 1) , t = 1 . . . N − 1

s(N) = Ax(N)

el objetivo es maximizar un descuento total de los bienes en exceso

cts(0) + δcts(1) + . . .+ δNcts(N)

donde c ∈ Rm contiene el valor de los bienes y δ > 0 es un factor de descuento.

Luego el PL es:

max cts(0) + δcts(1) + . . .+ δNcts(N)

s.a : x(t) ≥ 0 , t = 1 . . . N

s(t) ≥ 0 , t = 0 . . . N

s(0) = go −Bx(1)

s(t) = Ax(t)−Bx(t+ 1) , t = 1 . . . N − 1

s(N) = Ax(N)

49 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 63: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

2.5. CLASIFICACIÓN DE PROBLEMAS DE OPTIMIZACIÓN CONVEXA

con variables x(1) . . . x(N) , s(0) . . . s(N).

2.5.2. Problemas de Optimización Cuadráticas

Un problema de optimización convexo se llama de optimización cuadrática (QP) si

la función objetivo es cuadrática y las funciones restricción son afines. Matemáticamente

es de la forma

mın1

2xtQx+ qtx+ r

s.a : Gx ≤ h

Ax = b

donde Q ∈ Rn×m simétrica semi definida positiva G ∈ Rn×m, A ∈ Rp×n.

Observaciones.

Si la función objetivo y las restricciones de desigualdades son funciones cuadráticas, se

tiene un problema cuadrático con restricciones cuadráticas por ejemplo:

mın1

2xtQx+ qtx+ ro

s.a :1

2xtPix+ qtix+ ri ≤ 0 i = 1 . . .m

Ax = b

Q ∈ Rn×n simétrica semi definida positiva P ∈ Rm×n , A ∈ Rp×n

Ejemplo.

Mínimos cuadrados y regresión:

Surge en muchos campos y también se conocen con los nombres : “Análisis de Regresión”

o “Aproximación por mínimos cuadrados”.

El problema consiste en minimizar una función cuadrática convexa, es decir:

mın ∥Ax− b∥2

s.a : l ≤ xc ≤ µ2i i = 1, 2, . . . n

50 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 64: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

2.5. CLASIFICACIÓN DE PROBLEMAS DE OPTIMIZACIÓN CONVEXA

2.5.3. Programación Cónica de Segundo Orden

Se conoce como programa cónico de 2o orden a un tipo de problema en que cada

desigualdad describe un cono asociado a la norma ∥.∥2, es de la forma

mın fTx

∥Aix+ bi∥ ≤ cTi x+ di Ai ∈ Rni×n

Fx = g F ∈ Rp×n

Las desigualdades ∥Aix + bi∥2 ≤ cTi x + di se llaman restricciones cónicas de 2o orden

porque equivale a que los puntos (Aih+ bi, ctix+ di) pertenezcan al cono definido por la

norma euclidiana l2 cuando ci = 0 i = 1 . . .m el problema de programación cónica de

2o orden equivale al problema de programación cuadrática, lo que justifica la relación

de la fig. 2 · 1

2.5.4. Programación con Desigualdades Generalizadas

Es una generalización de los problemas convexos y se describen del siguiente modo:

mın f(x)

s.a : gi(x) ≤ Oki i = 1 . . .m (2.13)

Ax = b

donde f : Rn → R , Ki ⊆ Rki son conos con vértice en 0 y gi : Rn → Rk−i son ki conos

convexos.

Esta formulación se dice que es de la forma estándar de un problema de optimización

convexa con restricciones de inecuaciones generalizadas. El problema (2.1) es un caso

particular de (2.13) cuando ki = R+ i = 1 . . .m.

Muchos resultados para problemas de optimización convexa se siguen cumpliendo para

problemas de optimización convexa generalizada como por ejemplo:

◦ El conjunto factible, los conjuntos de curvas de nivel, el conjunto optimal siguen

siendo convexos.

51 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 65: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

2.5. CLASIFICACIÓN DE PROBLEMAS DE OPTIMIZACIÓN CONVEXA

◦ Cualquier punto óptimo local para el problema (2.13) es también óptimo global.

◦ La condición de optimalidad para f diferenciable para un problema convexo tam-

bién se sigue manteniendo.

Problemas en forma cónica.

Un caso sencillo de problema con desigualdades generalizadas son los “problemas de

forma cónica” que tienen una función objetivo lineal y las funciones restricciones afines:

mın ctx

Fx+ g ≤ Ok (2.14)

Ax = b

Cuando k es el octante no negativo el problema (2.14) se reduce a un problema lineal y

también tienen su equivalente en el formato estándar y en el formato de desigualdades.

Programación semidefinida.

Cuando el cono K es el cono de matrices k×k semidefinidas positivas, si Sk+, el problema

de forma cónica es llamado “programas semidefinidos” o SDP y tienen la siguiente forma:

mın ctx

s.a : x1F1 + . . .+ xnFn +G ≤ 0

Ax = b

donde G, F1 . . . Fn ∈ Sk conjunto de matrices simétricas de orden k×k. Y A ∈ Rp×n. La

restricción de desigualdad en este caso se conoce como desigualdades matriciales lineales

(LMI).

Cuando todas las matrices G, F1 . . . Fn son diagonales, el problema se reduce a un

problema lineal (LP) y también se encuentran estos problemas en forma estándar y en

formato de desigualdades.

52 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 66: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

2.5. CLASIFICACIÓN DE PROBLEMAS DE OPTIMIZACIÓN CONVEXA

2.5.5. Programación Geométrica

En esta sección se describe una familia de problemas de optimización que en su forma

natural no son convexos, pero se pueden convertir a problemas convexos con un cambio

de variable y una transformación en las funciones que lo componen.

Definición 2.5. Sea f : Rn → R con dom(f) = Rn++ tal que

f(x) = cxa11 .xa2

2 .xa33 . . . xan

n c > 0 , ai ∈ R

se llama función monómico o monomial.

Observación.

La suma de funciones monomiales forman una función llamada posinomio o posinomial

y es

f(x) =k∑

k=1

ckxa1k1 .xa2k

2 .xa3k3 . . . xank

n

donde ck > 0.

Las funciones posinomiales son cerradas bajo la adición, multiplicación y el escalamiento

no-negativo. Las monomiales son cerradas bajo la multiplicación y división.

Un problema de programación geométrica (GP) es un problema de optimización de la

forma:

mın f(x)

gi(x) ≤ 1 i = 1 . . .m (2.15)

hj(x) ≤ 1 j = 1 . . . p

donde f, gi i = 1 . . .m son funciones posinomiales y hj j = 1 . . . p son monomiales.

El dominio del problema es D = Rn++, la restricción x ≥ 0 es implícita.

Programación Geométrica en forma Convexa:

Los problemas de programación geométrica no son generalmente problemas de op-

timización convexa, para transformarlos en convexos se hace el cambio de variables

yi = log xi, por lo que xi = eyi . Si f es una función monomial de x es decir:

53 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 67: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

2.5. CLASIFICACIÓN DE PROBLEMAS DE OPTIMIZACIÓN CONVEXA

f(x) = cxa11 xa2

2 . . . xann

entonces

f(x) = f(ey1 . . . eyn)

= c(ey1)1 . . . (eyn)n

= eaT y+b

donde b = log c. El cambio de variable yi = log xi vuelve a una función monomial en la

exponencial de una función afín.

Similarmente, si f es una función posinomial dada por

f(x) =k∑

k=1

ckxa1k1 .xa2k

2 .xa3k3 . . . xank

n

entonces

f(x) =k∑

k=1

eaTk y+bk

donde ak = (a1k, . . . , ank) y bk = log ck. El cambio de variables hace a la función posino-

mial una función exponencial de funciones afines.

El problema de programación geométrica (2.15) expresados en términos de las nuevas

variables y es:

mınk∑

k=1

eaTk y+bk

s.a :

ji∑j=1

eaTiky+bik ≤ 1 i = 1 . . .m (2.16)

eaTgiy+hi = 1 i = 1 . . . p

donde aik ∈ Rn , i = 0 . . .m contiene los exponentes de la restricción de desigualdad

posinomial y gi ∈ Rn , i = 1 . . . p contiene los exponentes de la restricción de igualdad

monomial.

Ahora considerando el logaritmo de todas las funciones se obtiene el problema geométrico

54 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 68: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

2.5. CLASIFICACIÓN DE PROBLEMAS DE OPTIMIZACIÓN CONVEXA

en forma convexa es:

mın log

(k∑

k=1

eaTk y+bk

)

s.a : log

(j∑

j=1

eaTiky+bik

)≤ 0 i = 1 . . .m (2.17)

gTi + hi = 0 i = 1 . . . p

Observación.

La transformación entre el problema de programación geométrica en forma posino-

mial y el problema de programación geométrica en forma convexa no involucra ningún

cálculo, son simples cambios de formas de las funciones objetivo y restricciones.

55 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 69: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

Capítulo 3

Aplicación de Optimización Convexa:

Aproximación y Ajuste

3.1. Introducción

En el presente capítulo describiremos la aplicación de problemas de optimización

convexa relacionados a la teoría de aproximación y ajuste como son los problemas de

aproximación de normas, problemas de norma minima , interpolación y función de ajuste.

En las siguientes secciones se describe cada uno de los problemas mencionados y se

formulan como uno de optimización convexa.

3.2. Aproximación de Norma

Este tipo de aplicaciones se basa en obtener un elemento aproximado a la solución

óptima deseada usando como elemento de medida una Norma (∥.∥) de Rn y asegura la

mejor aproximación posible.

56

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 70: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

3.2. APROXIMACIÓN DE NORMA

3.2.1. Problema Básico de Aproximación de Norma

El problema de aproximación de norma mas simple es un problema de optimización

no-restringido formulado como:

mınx∈Rn

∥Ax− b∥ (3.1)

donde A ∈ Rm×n y b ∈ Rn son los datos del problema y x ∈ Rn es la variable y ∥.∥ es una

norma de Rm. Una solución de este problema se dice que es una solución aproximada de

Ax ≈ b en la norma ∥.∥ de Rm.

El vector

r = Ax− b

se llama vector residual del problema, sus componentes son los residuales individuales

asociados a x.

El problema (3.1) es un problema convexo y siempre tiene una solución optimal. Cuando

el vector b ∈ R(A) el valor óptimo del problema es cero, sin embargo la utilidad de este

problema se presenta cuando b ∈ R(A) y es la razón de su estudio. Además se considera

el caso cuando las columnas de A son L.I y m > n, pues si las columnas de A son L.I

y m = n la solución optimal es dada por x = A−1b.

Interpretación del Problema de Aproximación.

Expresando a Ax como

Ax = x1a1 + . . .+ xnan

donde a1, . . . , an ∈ Rm son las columnas de A, el objetivo del problema de aproximación

mediante una norma es representar al vector b mediante una combinación lineal de las

columnas de la matriz A lo mas proximo posible con una desviación o medida en la

norma ∥.∥.

Observación.

Este problema también se conoce como el "problema de regresión”. En este contex-

to a1, . . . , an se llaman vectores regresores y el vector x1a1 + . . . + xnan donde x =

(x1, . . . , xn) es una solución optimal, se llama regresión de b.

57 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 71: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

3.2. APROXIMACIÓN DE NORMA

Estimación.

Esta interpretación surge en el problema de calcular un parámetro vectorial basado en

una medida lineal. Sea el modelo de medida lineal

y = Ax+ v

donde y ∈ Rm es un vector de medida, x ∈ Rn es un vector de parámetros que serán

calculados y v ∈ Rm es una medida de error que es desconocida pero se supone es

pequeño en términos de ∥.∥.

Este problema consiste en hacer una conjetura de que tan sensible es x dado y.

Supongamos que x tiene el valor de x, entonces

v = y − Ax

considerando que los valores de v (medidas según ∥.∥) son pequeños, lo mas evidente

para x es

x = argmınz

∥Az − y∥ , z ∈ ran(A)

Geométrico:

Sea A = R(A) ⊂ Rm el subespacio generado por el rango de A y sea b ∈ Rm. Una

proyección de b sobre A en la norma ∥.∥, es cualquier punto en A tal que es lo mas

próximo a b. Es decir es el punto que resuelve el problema

mın ∥u− b∥

s.a : u ∈ A

Parametrizando un elemento arbitrario de R(A) como u = Ax, entonces resolver el

problema de aproximación de norma (3.1) es equivalente a calcular una proyección de b

sobre A.

Observación.

El problema (3.1) también puede interpretarse como un problema de diseño óptimo,

considerando x1, . . . , xn como variables de diseño que serán halladas. El vector y = Ax

es el vector de m-resultados que se supone una función lineal de x; b es un vector de

58 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 72: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

3.2. APROXIMACIÓN DE NORMA

marcas o resultados deseados. El objetivo es hallar un vector de diseño que sea tan

proximo como sea posible, al resultado deseado, es decir Ax ≈ b. Considerando el vector

residual r como la desviación del resultado actual (Ax) al resultado deseado (b). Si se

mide la calidad del diseño por la norma de la desviación entre el resultado y el resultado

deseado, entonces el problema (3.1) es el problema de hallar el mejor diseño.

Una extension del problema de aproximación de la norma es el problema:

mın ∥W (Ax− b)∥

llamado "problema de aproximación de la norma parametrizado”, donde W es una ma-

triz m×m, llamada "matriz de parametrización”.

Generalmente W es una matriz diagonal con diferentes parámetros para cada compo-

nente del vector residual r = Ax − b. Considerando A = WA y b = Wb este problema

puede ser resuelto como un problema de aproximación de la norma básica (3.1).

Los problemas mas comunes de aproximación de la norma son:

a. Problema de Mínimos Cuadrados

El sistema Ax = b ; Am×n es inconsistente si y sólo si b ∈ gen{CA}.

Los sistemas inconsistentes aparecen en muchas situaciones.

Se busca modificar el problema tal que no se exiga que la igualdad Ax = b se

satisfaga, se busca x ∈ Rn tal que Ax sea muy cercano a b tanto como sea posible.

Si W = gen{CA} entonces el vector en W más cercano a b es proyW b. Es decir

mın ∥b− w∥ , w ∈ W

se consigue cuando w = proyW b. Luego si hallamos x tal que Ax = proyW b entonces

es seguro que ∥b− w∥ es lo mas pequeña posible.

b− proywb = b−Ax es ortogonal a todo vector de W . Esto implica que b−Ax es

ortogonal a cada columna de A. Es decir que

AT (Ax− b) = 0

equivalentemente

ATAx = AT b (3.2)

59 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 73: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

3.2. APROXIMACIÓN DE NORMA

cualquier solución de (3.2) se llama solución por mínimos cuadrados del sistema

Ax = b (en general Ax = b).

(3.2) se llama sistema normal, asociado a Ax = b.

Observación.

Para calcular una solución x por mínimos cuadrados del sistema Ax = b, se procede

de la siguiente forma: si {w1 . . . wm} es una base ortonormal para W ≡ CA entonces

proyW b = (b.w1)w1 + (b.w2)w2 + . . .+ (b.wm)wm

Teorema 3.1. Sea Am×n tal que ran(A) = n, entonces ATA es no singular y el

sistema Ax = b tiene solución única por mínimos cuadrados y es x = (ATA)−1AT b

es decir, el sistema normal tiene solución única.

60 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 74: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

3.2. APROXIMACIÓN DE NORMA

Procedimiento. Para hallar por mínimos cuadrados x de Ax = b :

a) Formar ATA y AT b

b) Resolver ATAx = AT b en términos de x mediante reducción de Gauss-Jordan.

Ejemplo.

Resolver : Ax = b , donde

A=

1 2 −1 3

2 1 1 2

−2 3 4 1

4 2 1 0

0 2 1 3

1 −1 2 0

; b =

1

5

−2

1

3

5

Solución.

ran(A)

1 2 −1 3

2 1 1 2

−2 3 4 1

4 2 1 0

0 2 1 3

1 −1 2 0

1 2 −1 3

0 −3 3 −4

0 7 2 7

0 −6 5 −12

0 2 1 3

0 −3 3 −3

1 2 −1 3

0 −3 3 −4

0 0 9 −73

0 0 −1 −4

0 0 3 13

0 0 0 1

1 2 −1 3

0 −3 3 −4

0 0 −1 −4

0 0 0 1

0 0 9 −73

0 0 3 13

1 2 −1 3

0 −3 3 −4

0 0 −1 −4

0 0 0 1

0 0 0 −1153

0 0 0 −353

ran(A) = 4, se puede aplicar mínimos cuadrados

61 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 75: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

3.2. APROXIMACIÓN DE NORMA

luego se forma el sistema

AtAx = Atb26 5 −1 5

5 23 13 17

−1 13 24 6

5 17 r6 23

x1

x2

x3

x4

=

24

4

10

20

este sistema es cuadrado 4× 4 y tiene solución única por mínimos cuadrados

x =

0,9990

−2,0643

1,1039

1,8902

Si W = gen{CA} entonces proyW b = Ax =

1,4371

4,8181

1,8852

0,9713

2,6459

5,2712

Ajuste por mínimos cuadrados.

En muchas aplicaciones no es fácil llegar a fórmulas que expresen la relación de los

datos del problema como por ejemplo, la relación entre la aceleración debida a la

gravedad, el tiempo que un objeto ha estado cayendo y la altura del objeto, que

es dada por la ley física

s(t) = s0 − v0t−1

2gt2

donde s0 es la altura inicial; v0 es velocidad inicial y g es la gravedad, t es el tiempo.

En muchos casos se tiene datos, que deben ser representados por una curva

que "mejor” se ajusta a ellos.Por ejemplo si:

se tiene n puntos de R2 como datos (x1, y1), (x2, y2), . . . (xn, yn) de algun prob-

lema, estos pueden ser aproximados por diferentes curvas como se muestran

en la siguiente figura:

62 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 76: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

3.2. APROXIMACIÓN DE NORMA

Figura 3.1:

Aproximación de una Recta.

Se desea hallar una recta de la forma

y = mx+ b

que mejor represente a los n puntos (x1, y1), (x2, y2), . . . (xn, yn) Para hallar y =

y = mx + b

(x , y )1 1

2(x , mx

2 + b )

(x1

, b+mx )

(x2

, x2

)

(x3

, y3

)

(x3

, mx3 + b )

Figura 3.2:

mx+ b que mejor ajuste a los datos, se debe encontrar m y b tal que sea minima

la suma [y1 − (b+mx1)]2 + [y2 − (b+mx2)]

2 + . . .+ [yn − (b+mxn)]2 es decir la

distancia de los datos a los puntos de la recta se minimiza en (m, b).

Esta selección de m y b se llama aproximación lineal de mínimos cuadrados a

los puntos dados.

Para resolver el problema se usa la forma matricial

63 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 77: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

3.2. APROXIMACIÓN DE NORMA

Si los puntos (x1, x2), . . . , (x1, x2) están todos en la recta y = mx+ b se tiene

y1 = b+mx1

y2 = b+mx2

...

yn = b+mxn

equivalentemente

y = Au ; donde y =

y1

y2...

yn

; A =

1 x1

1 x2

......

1 xn

; u=

b

m

si los puntos no son

colineales, entonces y = Au o y − Au = 0 y entonces se busca un vector u que

minimice

∥y − Au∥

es decir

mınu

∥y − Au∥

Hallar u que minimice a ∥y−Au∥ no se difícil, como An×2 y u2×1, el vector Au ∈ Rn

y además pertenece a la imagen de A. La imagen de A es un subespacio de Rn de

dim ≤ 2.

Sea u el vector minimizante, entonces se ve que y − Au se minimiza cuando es

ortogonal a Im(A). Es decir

Au ⊥ (y − Au)

Au.(y − Au) = 0

(Au)T (y − Au) = 0

ATuT (y − Au) = 0

uT (ATy − ATAu) = 0

64 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 78: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

3.2. APROXIMACIÓN DE NORMA

Au

y−Au

Figura 3.3:

ATy − ATAu = 0

ATy = ATAu

u = (ATA)−1ATy

Observación.

ATA es no-singular siempre que los n- puntos sean no-colineales.

Ejemplo.

a) Sea los datos (1, 4), (−2, 5), (3,−1) y (4, 1). Hallar la recta que mejor ajuste

los datos dados.

Solución:

A =

1 1

1 −2

1 3

1 4

; y =

4

5

−1

1

;

1 1 1 1

1 −2 3 4

ATA =

1 1 1 1

1 −2 3 4

1 1

1 −2

1 3

1 4

=

4 6

6 30

(ATA)−1 =1

84

30 −6

−6 4

65 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 79: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

3.2. APROXIMACIÓN DE NORMA

u = (ATA)−1Aty

=1

84

30 −6

−6 4

1 1 1 1

1 −2 3 4

4

5

−1

1

=1

84

30 −6

−6 4

=

3,57

−0,80

∴ y = 3,57− 0,88x mejor ajuste

b) En la fabricación del producto A, la cantidad de compuesto C1, es controlada

´por la cantidad del compuesto C2 utilizada en el proceso. Se fabrica 1 galón

de A, se registra la cantidad de C1 usada y la cantidad de C2 presente, en la

siguiente tabla:

C1(onzas/galon) 3 4 5 6 7 8 9 10 11 12

C2(onzas/galon) 4.5 5.5 5.7 6.6 7.0 7.7 8.5 8.7 9.5 9.7

Suponga que la relación de C1 usada y la cantidad de C2 presente es da-

da por una ecuación lineal.

a. Determine una ecuación para que la recta de mínimos cuadrados que

mejor ajuste los datos tomados. (estos datos son de naturaleza proba-

bilística, en el sentido que si se repite el experimento se encontrarían

valores de C2 distintos ligeramente para los mismos valores de C1, pues

toda medición esta sujeta a errores experimentales).

b. ¿Cuantas onzas de C2 hay en un galón de A si se usan 30 onzas de C1?

66 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 80: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

3.2. APROXIMACIÓN DE NORMA

Solución.

1

1 2

2

3

3

4

4

5

5

6

6

7

7

8

8

9

9

10

10

11 12

Figura 3.4:

b =

4,5

5,5

5,7

6,7

7,0

7,7

8,5

8,7

9,5

9,7

, A =

1 3

1 4

1 5

1 6

1 7

1 8

1 9

1 10

1 11

1 12

, x =

b

m

Luego

AT =

1 1 1 1 1 1 1 1 1 1

3 4 5 6 7 8 9 10 11 12

, ATA =

10 75

75 645

,

AT b =

73,4

598,6

67 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 81: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

3.2. APROXIMACIÓN DE NORMA

Luego se forma el sistema

ATAx = AT b sistema normal.

como este sistema es consistente de solución única se tiene que

x = (ATA)−1AT b

x =1

825

645 −75

−75 10

1 1 1 1 1 1 1 1 1 1

3 4 5 6 7 8 9 10 11 12

4,5

5,5

5,7

6,7

7,0

7,7

8,5

8,7

9,5

9,7

x =

1

825

645 −75

−75 10

73,4

598,6

x =

1

825

47343− 44895

−5505 + 5986

x =

1

825

2448

481

x =

2,967

0,583

∴ y = 0,583x+ 2,967

mejor aproximación a los datos.

Ajuste Polinomial por Mínimos Cuadrados.

Dado un conjunto de n-datos en R2, el mejor ajuste de ellos aun polinomio de

grado m tal que

y = a0 + a1x+ a2x2 + . . .+ am−1x

m−1 + amxm

68 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 82: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

3.2. APROXIMACIÓN DE NORMA

como no todos los n-datos están exactamente sobre la gráfica del polinomio desea-

do, se tiene que

y ≈ a0di + a1xi + a2xi + . . .+ amxmi , i = 1, 2, . . . n

Procedimiento.

Dados (x1, y1), (x2, y2), . . . , (xn, yn) y m ≤ n − 1 con al menos m + 1 de los xi

distintos, el ajuste de los datos del polinomio por mínimos cuadrados

y = a0 + a1x+ a2x2 + . . .+ am−1x

m−1 + amxm

a) Formar

b =

y1

y1...

yn

A =

1 x1 x21 . . . xm

1

1 x2 x22 . . . xm

2

1 x3 x23 . . . xm

3

......

......

1 xn x2n . . . xm

n

y x =

a0

a1

a2...

am

b) Resolver en términos de x

ATAx = AT b

sistema normal

Ejemplo.

Hallar el mejor ajuste cuadrático para :

A =

1 1 1

1 −2 4

1 3 9

1 4 16

y b =

4

5

−1

1

69 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 83: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

3.2. APROXIMACIÓN DE NORMA

Solución.

At =

1 1 1 1

1 −2 3 4

1 4 9 16

⇒ AtA =

4 6 30

6 30 84

30 84 354

y Atb =

9

−5

31

resolver :

ATAx = AT b

x = (ATA)−1AT b =1

4752

3564 396 −396

396 516 −516

−396 −156 84

9

−5

31

=1

4752

17820

−3852

−180

=

3,75

−0,81

−0,04

Figura 3.5:

∴ y = 3,75− 0,81x− 0,04x2 es la mejor aproximación.

70 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 84: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

3.2. APROXIMACIÓN DE NORMA

Factorización QR

A = QR

Usada en programas para calcular valores propios de una matriz; resolver

sistemas de ecuaciones lineales; determinar aproximaciones para mínimos

cuadrados.

Teorema 3.2. Si Am×n con columnas L.I, entonces A se puede factorizar como

A = QR. donde Q es m × n cuyas columnas forman una base ortonormal para

W = gen{CA} y R es n× n triangular superior no-singular.

Procedimiento.

Para factorizar A en forma QR

a) Sean v1, v2, . . . vn las columnas de A y sea W = gen{v1, v2, . . . vn} ⊂ Rn y con

v1, v2, . . . vn como base.

b) Transforma la base v1, v2, . . . vn en una base ortonormal w1, w2, . . . wn (utilizar

el procedimiento de Gram- Schmidt) y Q = [w1, w2, . . . wn].

c) Calcular R = [rij] y Q = [w1, w2, . . . wn], donde

rij =

vjwi , i ≤ j

0 , i>j.

Ejemplo :

Sea A =

1 −1 −1

1 0 0

1 −1 0

0 1 −1

Hallar su factorización QR

71 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 85: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

3.2. APROXIMACIÓN DE NORMA

Solución. considerando el procedimiento anterior se tiene:

a)

v1 =

1

1

1

0

, v2 =

−1

0

−1

1

, v3 =

−1

0

0

−1

entonces W = gen{v1, v2, v3} ⊂ R4. Si v1, v2 y v3 son L.I. entonces se tiene una

base de W .

b) Se ortonormaliza la base obtenida con el proceso de Gram-Schmidt

w1 =

1√3

1√3

1√3

0

, w2 =

−1√15

2√15

−1√15

3√15

, w3 =

−4√35

3√35

1√35

−3√35

c) luego

Q =(

w1, w2, w3

), R =

r11 r12 r13

0 r22 r23

0 0 r33

donde :

r11 = u1.w1

=

1

1

1

0

1√3

1√3

1√3

0

=

3√3

r12 = u2.w1

72 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 86: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

3.2. APROXIMACIÓN DE NORMA

=

−1

0

−1

0

1√3

1√3

1√3

0

=

−2√3

r13 = u3.w1

=

−1

0

0

1

1√3

1√3

1√3

0

=

−1√3

r21 = u1.w2

=

1

1

1

0

−1√15

2√15

−1√15

3√15

= 0

r22 = u2.w2

=

−1

0

−1

1

−1√15

2√15

−1√15

3√15

=

5√15

r23 = u3.w2

=

−1

0

0

−1

−1√15

2√15

−1√15

3√15

=

−2√15

r31 = u1.w3 = 0

r32 = u2.w3 = 0

73 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 87: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

3.2. APROXIMACIÓN DE NORMA

r33 = u3.w3

=

−1

0

0

−1

−4√35

3√35

1√35

−3√35

=

7√35

R =

3√3

−2√3

−1√3

0 5√15

−2√15

0 0 7√35

Observación.(Mínimos Cuadrados)

Sea Ax = b una solución por mínimos cuadrados en x tal que

ATAx = AT b

si A = QR ⇒ AT = (QR)T = RTQT

luego

RTQTQRx = RTQT b

como Q es ortonormal⇒ QTQ = Im, luego

RTRx = RTQT b

como RT es no-singular, pues R lo es, entonces

(RT )−1RT︸ ︷︷ ︸I

Rx = (RT )−1RT︸ ︷︷ ︸I

QT b

Rx = QT b

Como R es triangular superior la solución del sistema se obtiene por sustitución

regresiva.

74 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 88: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

3.2. APROXIMACIÓN DE NORMA

ejemplo:

Resuelva

1 2

−1 −2

1 1

x

y

=

1

3

5

solución.

v1 =

1

−1

1

, v2 =

2

−2

1

u1 = v1 =

1

−1

1

u2 = v2 −v2.v1v1.v1

v1 =

2

−2

1

− 5

3

1

−1

1

=

13

−13

−23

luego :

w1 =u1

∥u1∥=

1√3

−1√3

1√3

y w2 =u2

∥u2∥=

√3

3√2

−√3

3√2

−2√3

3√2

Q =

1√3

√3

3√2

−1√3

−√3

3√2

1√3

−2√3

3√2

75 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 89: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

3.2. APROXIMACIÓN DE NORMA

r11 = v1.w1 =

1

−1

1

.

1√3

−1√3

1√3

= 3√3

, r12 = v2.w1 =

2

−2

1

.

1√3

−1√3

1√3

=

5√3

r21 = 0

r22 = v2.w2 =

2

−2

1

.

√3

3√2

−√3

3√2

−2√3

3√2

= 2√3

3√2

3√3

5√3

0 2√3

3√2

Ax = b

QRx = b

Rx = Qtb

3√3

5√3

0 2√3

3√2

x1

x2

=

1√3

−1√3

1√3

√3

3√2

−√3

3√2

−2√3

3√2

1

3

−5

3√

35√3

0 2√3

3√2

x1

x2

=

−7√3

8√3

3√2

x2 =

8√3

3√2

2√3

3√2

= 4

x1 =

−7√3− 5√

3(4)

3√3

x1 =−27

3

x1 = −9

76 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 90: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

3.2. APROXIMACIÓN DE NORMA

∴ x =

−9

4

b. Problema de Aproximación de chebychev o Minimax

cuando se usa la norma l∞, el problema de aproximación de la norma es:

mın ∥Ax− b∥∞ ≈ mın{max{|r1|, |r2|, . . . , |rm|}}

y recibe el nombre de "problema de aproximación de Chebychev” o "problema

de aproximación minimax”, este ultimo nombre es debido a que se minimiza el

máximo del valor absoluto del vector residual.

Observación:

Este problema puede ser formulado como uno de programación lineal (LP) como

mın t

s.a : −t1 ≤ Ax− b ≤ t1

con x ∈ Rn y t ∈ R variables.

Ejemplo:

Hallar la función lineal que sea la mejor aproximación de la función exponencial

et en [0, 1] respecto a la norma del max.

Este problema es equivalente a:

mına,b,η

η

s.a : −η ≤ et − a− bt ≤ η,

t ∈ [0, 1]

que es un problema de programación lineal convexo.

c. Aproximación de la Suma Absoluta de Residuales

cuando se usa la norma l1 el problema de aproximación de la norma es:

mın ∥Ax− b∥1 ≈ mın{max{|r1|, |r2|, . . . , |rm|}}

77 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 91: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

3.2. APROXIMACIÓN DE NORMA

y se llama "problema de aproximación de la suma absoluta de residuales”. Este

problema puede ser formulado como uno de programación lineal(LP) como:

mın lT t

s.a : −t ≤ Ax− b ≤ t

como x ∈ Rn y t ∈ Rm variables.

3.2.2. Aproximación mediante una función de Penalización

En el problema de aproximación de norma lp, para 1 ≤ p ≤ ∞ la función objetivo

es:

(|r1|p, |r2|p, . . . , |rm|p)1/p

análogo al caso del problema de mínimos cuadrados es posible considerar el problema

equivalente con función objetivo:

|r1|p, |r2|p, . . . , |rm|p

que es una función simétrica y separable de los residuales. En particular, la función

objetivo depende solamente de "la amplitud de la distribución de los residuales”.

El problema de aproximación mediante una función de penalización tiene la forma :

mın ϕ(r1) + . . .+ ϕ(rm) (3.3)

s.a : r = Ax− b

donde ϕ : R → R, llamada función de penalización.

considerando a ϕ una función convexa, el problema (3.3) es un problema de optimización

convexa.

Observación:

En muchos casos ϕ es además una función simétrica, no negativa y que satisface ϕ(0) = 0.

Interpretación del Problema:

Para elegir al vector variable x, se obtiene la aproximación Ax de b que tiene asociado

78 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 92: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

3.2. APROXIMACIÓN DE NORMA

un vector residual r.

Una función de penalización aplica un costo o penalidad a cada componente del vector

residual dada por: ϕ(ri) , i = 1 . . .m, la penalidad total es la suma de las penalidades

para cada residual, es decir

ϕ(r1) + ϕ(r2) . . .+ ϕ(rm)

Elecciones diferentes de x generan diferentes resultados residuales y por tanto diferente

penalidad total. El problema de aproximación mediante una función de penalización

minimiza la penalidad total causada por los residuales.

Ejemplo:

Entre las funciones de penalización mas comunes asociadas a problemas de aproximación

son:

a. La función

φ(µ) = |µ|p ; p ≥ 1

asociada al problema de aproximación de norma lp.

En particular la función de penalización cuadrática

φ(µ) = µ2

que genera el problema de aproximación de norma euclidiana.

b. la función de penalización

φ(µ) =

0 ; |µ| ≤ a

|µ| − a ; |µ| > a, a ∈ R

Llamada también “ deadzone-linear ” o “ zona muerta-lineal ” determina el rango

de la penalización, es decir para valores menores o iguales a a no es necesario

penalizar.

79 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 93: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

3.2. APROXIMACIÓN DE NORMA

c. La función de penalización

φ(µ) =

−a2 log(1− (

µ

a)2) ; |µ| < a

∞ ; |µ| ≥ a

llamado la función “ log-barrier ” o función “ barrera logarítmica ”. Determina una

penalización infinita para residuales mucho mayores o iguales que a.

En la siguiente figura se muestra geométricamente estas tres funciones de penalización,

considerando el caso particular de la función de penalización cuadrática para la primera

función de penalización. a =1

4para la segunda función a = 1 para la función “ log-

barrier”.

ϕ

µ

µ( )

0.5

0.5

1

11

1.5

1.5

2

−0.5−1.5 −1/4 1/4−

log−barriercuadrática

deadzone−linear

Figura 3.6:

80 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 94: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

3.2. APROXIMACIÓN DE NORMA

Observación:

El escalamiento de la función penalización por un numero positivo no afecta la

solución del problema de aproximación con función penalizada pues simplemente

escala la función objetivo.

La “ forma ” de la función penalización tiene un gran efecto sobre la solución del

problema de aproximación de la función penalizada. φ(µ) mide la diferencia de un

residual de valor µ. Si φ es muy pequeño( o casi cero) para valores pequeños de µ,

significa que la solución del problema penalizado es “ casi ” igual a la solución del

problema sin penalizar.

Si φ(µ) crece rápido cuando µ crece, significa que hay fuertes diferencias para

residuales grandes; si φ se hace infinito fuera de algún intervalo, esto significa que

los residuales fuera del intervalo son inaceptables.

81 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 95: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

3.2. APROXIMACIÓN DE NORMA

Conclusiones

Considerando que existen diversos fenómenos naturales que son estudiados mediante

modelos de optimización convexa formulados de la forma:

mın f(x)

S.a : gi(x) ≤ 0 i = 1, 2, · · · ,m

hj(x) = 0 j = 1, 2, · · · , p

donde f : Rn → R , gi, hj : Rn → R son convexas, llegando a las siguientes conclusiones:

Estos modelos proporcionan grandes ventajas frente a problemas de optimización

no convexos, debido a las propiedades de convergencia que presentan las funciones

convexas sobre conjuntos cerrados.

En un problema de optimización convexa, cualquier punto que es óptimo local,

también el óptimo global.

La región factible de un problema de optimización convexa es un conjunto cerrado

y acotado, en el que queda garantizada la convergencia.

La convergencia puntual o ρ -convergencia en los problemas de optimización con-

vexa permiten hallar la mejor aproximación al punto optimal.

Los métodos para hallar la solución de los problemas de optimización convexa

todos son convergentes, gracias a la convexidad de las funciones.

82 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 96: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

Bibliografía

[1] Attouch, H.“Convergence to Functions Convexes.” París (1977)

[2] Boy, Stephen, Vandenberghe, Lieven.“Convex Optimization”. Cambrige Univer-

sity Press(2004)

[3] Di Giorgi E.“Sulla Convergenza di alcune Successioni dÍntegrali dell Tipo Area”.

Italia (1975)

[4] Joly J. L.“Une Famille de Topologies et de Convergences sur. Ensemble des Fonc-

tionelles Convexes”. France (1970)

[5] Kuratowski C.“Topologie”. Warszawa-Japan (1958)

[6] Lions, J.L.; Stampacchia, G.“Variational Inequalities”. Italia (1967)

[7] Mosco U.“Aproximation of Solutions of some Variational Inequalities”. (1967)

[8] Rockafellar, R.T.“Conjugate Dualite And Optimization”. Philadelphia (1974)

[9] Rockafellar, R.T.“Convex Analysis ”. University Princeton N.J. (1969)

[10] Salinetti G. and Wets R.“On the Convergence of Sequences of Convex Sets in Fi-

nite Dimensions ”. (1979)

[11] Salinetti G. and Wets R.“Convergence of Sequences of Closed Sets”. (1978)

[12] Wets R.“Convex Analysis and applications”. Berlin (1977)

[13] Walkup W. D.“Continuity of some Convex-Cone valued Mappings”. (1967)

[14] Wets, R.“On inf-compact Mathematical Program”. Berlin(1974)

[15] Wysman R. A.“Convergence of Sequences of Convex Sets,Cones and Function”.

(1966)

83

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS

Page 97: Y MATEMÁTICAS CIENCIAS DE BIBLIOTECA

BIBLIOGRAFÍA

[16] Zolezzi T.“Characterizations of some Variational Perturbations of the Abstract

Linear-Cuadratic Problem”. Italia (1978)

84 Bach. Luis A. Blas Baltodano

Biblioteca Digital - Dirección de Sistemas de Informática y Comunicación - UNT

Esta obra ha sido publicada bajo la licencia Creative Commons Reconocimiento-No Comercial-Compartir bajola misma licencia 2.5 Perú. Para ver una copia de dicha licencia, visite http://creativecommons.org/licences/by-nc-sa/2.5/pe/

BIBLIO

TECA DE C

IENCIAS FÍSIC

AS

Y MATEMÁTIC

AS