Tema 8: Introducción al Control Óptimo (Parte I)€¦ · Virginia Mazzone: Tema 8: Introducción...

22
Introducción El Principio de Optamalidad Tema 8: Introducción al Control Óptimo (Parte I) Virginia Mazzone Contenidos Introducción El Principio de Optamalidad Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I)

Transcript of Tema 8: Introducción al Control Óptimo (Parte I)€¦ · Virginia Mazzone: Tema 8: Introducción...

Page 1: Tema 8: Introducción al Control Óptimo (Parte I)€¦ · Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I) Introducción El Principio de Optamalidad Los métodos

Introducción El Principio de Optamalidad

Tema 8: Introducción al ControlÓptimo (Parte I)

Virginia Mazzone

Contenidos

IntroducciónEl Principio de Optamalidad

Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I)

Page 2: Tema 8: Introducción al Control Óptimo (Parte I)€¦ · Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I) Introducción El Principio de Optamalidad Los métodos

Introducción El Principio de Optamalidad

IntroducciónEl método de diseño combinado de realimentación de estadosy observador que vimos es una herramienta fundamental en elcontrol de sistemas en variable de estados. Sin embargo, no essiempre el método más útil; tres dificultades obvias:

1. La traducción de especificaciones de diseño a ubicaciónde polos no es directa, especialmente en sistemascomplejos; ¿cuál es la mejor configuración de polos paraespecificaciones dadas?

2. Las ganancias de realimentación en sistemas MIMO noson únicas; ¿cuál es la mejor ganancia para unaconfiguración de polos dada?

3. Los autovalores del observador deben elegirse másrápidos que los del controlador, pero, ¿tenemos algúncriterio adicional para preferir una configuración a otra?

Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I)

Page 3: Tema 8: Introducción al Control Óptimo (Parte I)€¦ · Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I) Introducción El Principio de Optamalidad Los métodos

Introducción El Principio de Optamalidad

IntroducciónEl método de diseño combinado de realimentación de estadosy observador que vimos es una herramienta fundamental en elcontrol de sistemas en variable de estados. Sin embargo, no essiempre el método más útil; tres dificultades obvias:

1. La traducción de especificaciones de diseño a ubicaciónde polos no es directa, especialmente en sistemascomplejos; ¿cuál es la mejor configuración de polos paraespecificaciones dadas?

2. Las ganancias de realimentación en sistemas MIMO noson únicas; ¿cuál es la mejor ganancia para unaconfiguración de polos dada?

3. Los autovalores del observador deben elegirse másrápidos que los del controlador, pero, ¿tenemos algúncriterio adicional para preferir una configuración a otra?

Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I)

Page 4: Tema 8: Introducción al Control Óptimo (Parte I)€¦ · Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I) Introducción El Principio de Optamalidad Los métodos

Introducción El Principio de Optamalidad

IntroducciónEl método de diseño combinado de realimentación de estadosy observador que vimos es una herramienta fundamental en elcontrol de sistemas en variable de estados. Sin embargo, no essiempre el método más útil; tres dificultades obvias:

1. La traducción de especificaciones de diseño a ubicaciónde polos no es directa, especialmente en sistemascomplejos; ¿cuál es la mejor configuración de polos paraespecificaciones dadas?

2. Las ganancias de realimentación en sistemas MIMO noson únicas; ¿cuál es la mejor ganancia para unaconfiguración de polos dada?

3. Los autovalores del observador deben elegirse másrápidos que los del controlador, pero, ¿tenemos algúncriterio adicional para preferir una configuración a otra?

Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I)

Page 5: Tema 8: Introducción al Control Óptimo (Parte I)€¦ · Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I) Introducción El Principio de Optamalidad Los métodos

Introducción El Principio de Optamalidad

IntroducciónEl método de diseño combinado de realimentación de estadosy observador que vimos es una herramienta fundamental en elcontrol de sistemas en variable de estados. Sin embargo, no essiempre el método más útil; tres dificultades obvias:

1. La traducción de especificaciones de diseño a ubicaciónde polos no es directa, especialmente en sistemascomplejos; ¿cuál es la mejor configuración de polos paraespecificaciones dadas?

2. Las ganancias de realimentación en sistemas MIMO noson únicas; ¿cuál es la mejor ganancia para unaconfiguración de polos dada?

3. Los autovalores del observador deben elegirse másrápidos que los del controlador, pero, ¿tenemos algúncriterio adicional para preferir una configuración a otra?

Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I)

Page 6: Tema 8: Introducción al Control Óptimo (Parte I)€¦ · Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I) Introducción El Principio de Optamalidad Los métodos

Introducción El Principio de Optamalidad

Los métodos que introduciremos dan respuestas a éstaspreguntas. Veremos que las ganancias de realimentación deestados, y del observador pueden elegirse de forma queminimicen un criterio de optimización dado.

Qué significa óptimo?

Óptimo significa hacer algo de la mejormanera posible. Por eso antes de buscar la solución óptimadebemosI definir qué es lo que tenemos que hacer,I establecer una escala matemática que cuantifique qué

queremos decir con el mejorI enunciar las posibles alternativas

Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I)

Page 7: Tema 8: Introducción al Control Óptimo (Parte I)€¦ · Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I) Introducción El Principio de Optamalidad Los métodos

Introducción El Principio de Optamalidad

Los métodos que introduciremos dan respuestas a éstaspreguntas. Veremos que las ganancias de realimentación deestados, y del observador pueden elegirse de forma queminimicen un criterio de optimización dado.

Qué significa óptimo? Óptimo significa hacer algo de la mejormanera posible. Por eso antes de buscar la solución óptimadebemosI definir qué es lo que tenemos que hacer,I establecer una escala matemática que cuantifique qué

queremos decir con el mejorI enunciar las posibles alternativas

Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I)

Page 8: Tema 8: Introducción al Control Óptimo (Parte I)€¦ · Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I) Introducción El Principio de Optamalidad Los métodos

Introducción El Principio de Optamalidad

Enunciar el problema de control óptimo consiste en1. una descripción del sistema a controlar2. una descripción de las limitaciones del sistema y las

posibles alternativas3. una descripción de la tarea a llevar a cabo4. una declaración del criterio para juzgar el desempeño

óptimo

Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I)

Page 9: Tema 8: Introducción al Control Óptimo (Parte I)€¦ · Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I) Introducción El Principio de Optamalidad Los métodos

Introducción El Principio de Optamalidad

El sistema dinámico a ser controlado es descripto en variablede estado, en tiempo continuo

x(t) = Ax(t) + Bu(t); x(0) = x0y(t) = Cx(t)

o en en tiempo discreto

x [k + 1] = Ax [k ] + Bu[k ]; x [0] = x0y [k ] = Cx [k ]

Por ahora supondremos que las variables de estado estánaccesibles, o que el sistema es observable de forma tal quepuede construirse un estimador de estado.

Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I)

Page 10: Tema 8: Introducción al Control Óptimo (Parte I)€¦ · Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I) Introducción El Principio de Optamalidad Los métodos

Introducción El Principio de Optamalidad

Las imitaciones del sistema a veces existe en los valoresadmisibles de la variables de estado, o las entradas de control.Por ejemplo, la acción de control puede ser admisible en elconjunto de vectores continuos a trozos u(t) ∈ U tal que

U = {u(t) : u(t) < M} para todo t.

Esta limitación es muy común en la práctica, y puederepresentar saturación en los actuadores.

Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I)

Page 11: Tema 8: Introducción al Control Óptimo (Parte I)€¦ · Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I) Introducción El Principio de Optamalidad Los métodos

Introducción El Principio de Optamalidad

La tarea a realizar por lo general toma la forma de agregarcondiciones de contorno en las ecuaciones de estado delsistema.Por ejemplo, podríamos desear de transferir el estado x(t) deun conoce el estado inicial x(0) = x0 a un xf estadoespecificado final xf (tf ) = xf en un tiempo tf específico, o enel tf mínimo posible.

x0

xf

x(t)

Generalmente, la tarea a realizar viene implícita en el criteriode desempeño.

Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I)

Page 12: Tema 8: Introducción al Control Óptimo (Parte I)€¦ · Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I) Introducción El Principio de Optamalidad Los métodos

Introducción El Principio de Optamalidad

El criterio de desempeño, que se denota J, es una medida dela calidad del comportamiento del sistema. Por lo general,tratamos de minimizar o maximizar el criterio de desempeñomediante la selección de la entrada de control. Por cada u(t)que lleva a cabo la tarea para que se cumplan las restriccionesdel sistema, existe una trayectoria x(t).

tT tT

u(t)

x0

x(t)

La entrada u(t) genera la trayectoria x(t).

Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I)

Page 13: Tema 8: Introducción al Control Óptimo (Parte I)€¦ · Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I) Introducción El Principio de Optamalidad Los métodos

Introducción El Principio de Optamalidad

El criterio de desempeño, que se denota J, es una medida dela calidad del comportamiento del sistema. Por lo general,tratamos de minimizar o maximizar el criterio de desempeñomediante la selección de la entrada de control. Por cada u(t)que lleva a cabo la tarea para que se cumplan las restriccionesdel sistema, existe una trayectoria x(t).

tTtT

u(t)

x0

x(t)

v(t)

x(t) + δx(t)

La entrada u(t) genera la trayectoria x(t).Una variación v(t)en u(t) genera una trayectoria diferente x(t) + δx(t).

Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I)

Page 14: Tema 8: Introducción al Control Óptimo (Parte I)€¦ · Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I) Introducción El Principio de Optamalidad Los métodos

Introducción El Principio de Optamalidad

Uno de los criterios de desempeño utilizado es el de tiempomínimo, es decir, buscamos la acción de control u(t) queproduzca la trayectoria tal que el tiempo en alcanzar xf sea elmínimo posible.

T t

x0

xf

TT

En este caso, el criterio de desempeño para reducir al mínimopuede expresarse matemáticamente como

J = T

Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I)

Page 15: Tema 8: Introducción al Control Óptimo (Parte I)€¦ · Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I) Introducción El Principio de Optamalidad Los métodos

Introducción El Principio de Optamalidad

Otro criterio de desempeño podría ser el error final en alcanzarel estado final deseado en un tiempo T , por ejemplo,

J = ||x(T )||2

T t

x0

xf

x(T )

Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I)

Page 16: Tema 8: Introducción al Control Óptimo (Parte I)€¦ · Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I) Introducción El Principio de Optamalidad Los métodos

Introducción El Principio de Optamalidad

Otro criterio de desempeño podría ser reducir al mínimo elárea debbajo de ||x(t)||2, como una forma de seleccionar elcontrol que produce transitorios pequeños en la trayectoriagenerada entre x0 y el estado final.

Sin embargo, otro criterio de desempeño posible podría serreducir al mínimo el área debajo de ||u(t)||2, como una formade seleccionar el control que utiliza el menor esfuerzo decontrol.

Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I)

Page 17: Tema 8: Introducción al Control Óptimo (Parte I)€¦ · Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I) Introducción El Principio de Optamalidad Los métodos

Introducción El Principio de Optamalidad

El criterio particular que veremos es un funcional cuadráticodel estado y la entrada de control,

J(x(t), u(t)) =

∫ T

t

[xT (τ)Qx(τ) + uT (τ)Ru(τ)

]dτ,

donde Q y R son matrices constantes (aunque nonecesariamente) semi-definida y definida positivasrespectivamente.

El control que se obtiene de minimizar este criterio es lineal.Como el criterio se basa en funcionales cuadráticos, el métodose conoce como lineal-cuadrático (LQ: linear-quadratic), delque se obtiene el regulador lineal cuadrático (LQR).

Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I)

Page 18: Tema 8: Introducción al Control Óptimo (Parte I)€¦ · Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I) Introducción El Principio de Optamalidad Los métodos

Introducción El Principio de Optamalidad

Criterios similares de optimización se siguen para el diseño deobservadores, sólo que el funcional depende del error deestimación, y se basa en una caracterización estadística de losruidos que afectan al sistema. Este estimador óptimolineal-cuadrático se conoce como el filtro de Kalman.

Cuando se combinan la ganancia de realimentación deestados LQ con el filtro de Kalman, obtenemos lo que seconoce como un controlador lineal-cuadrático-gaussiano(LQG). (Lo de gaussiano viene de la caracterizaciónestadística del ruido empleada.)

Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I)

Page 19: Tema 8: Introducción al Control Óptimo (Parte I)€¦ · Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I) Introducción El Principio de Optamalidad Los métodos

Introducción El Principio de Optamalidad

El Principio de OptimalidadPara entender la idea de criterio de optimización en variable deestados, la introduciremos con sistemas de tiempo discreto,que son más simples.

El estado de un sistema discreto describe una trayectoriahaciendo transiciones discretas de un estado a otro bajo elefecto de una entrada también aplicada en tiempo discreto.

Cuando se asocia un criterio de optimización al sistema, cadatransición de estado tiene asociado un costo o penalidad. Porejemplo, pueden penalizarse las transiciones de estado que sealejan demasiado del estado final deseado, o las acciones decontrol de valores demasiado elevados. A medida que elsistema evoluciona de estado en estado, los costos se sumanhasta acumular un costo total asociado a la trayectoria.

Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I)

Page 20: Tema 8: Introducción al Control Óptimo (Parte I)€¦ · Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I) Introducción El Principio de Optamalidad Los métodos

Introducción El Principio de Optamalidad

Ilustramos el concepto con el grafo de la Figura 1, querepresenta 8 estados de un sistema discreto con sustransiciones posibles. El estado inicial es el 1, y el final el 8. Elsistema pasa de un estado a otro en cada tiempo kdeterminado por la entrada u[k ] y las ecuacionesx [k + 1] = Ax [k ] + Bu[k ].

1

2

3

4

5

78

6J56

J13 J68J35

Figura: Posibles trayectorias de 1 al 8.

Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I)

Page 21: Tema 8: Introducción al Control Óptimo (Parte I)€¦ · Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I) Introducción El Principio de Optamalidad Los métodos

Introducción El Principio de Optamalidad

Las transiciones posibles se representan por los arcos queconectan el estado inicial al final a través de los estadosintermedios. El costo asociado a cada transición se representacon la letra J; por ejemplo, el costo de moverse del estado 3 al5 es J35.

Asumiendo que los costos se acumulan en forma aditiva,vemos que la trayectoria marcada en rojo, por ejemplo, tiene uncosto total J13 + J35 + J56 + J68.

Como hay varias rutas alternativas del estado 1 al 8, el costototal dependerá de la trayectoria elegida. La señal de controlu∗[k ] que determina la trayectoria de menor costo es laestrategia óptima. Como ya veremos, en sistemas de tiempocontinuo, la acumulación de costos se representa medianteintegración, en vez de suma.

Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I)

Page 22: Tema 8: Introducción al Control Óptimo (Parte I)€¦ · Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I) Introducción El Principio de Optamalidad Los métodos

Introducción El Principio de Optamalidad

La herramienta matemática que usaremos para determinar laestrategia óptima es el principio de optimalidad de Bellman.

En cualquier punto intermedio xi en una tra-yectoria óptima entre x0 y xf , la estrategiadesde xi al punto final xf debe ser en sí unaestrategia óptima.

Este obvio principio nos permitirá resolver en forma cerradanuestros problemas de control óptimo. También se usa en elcómputo recursivo de las soluciones óptimas en unprocedimiento llamado programación dinámica.

Virginia Mazzone: Tema 8: Introducción al Control Óptimo (Parte I)