bionanouni.wdfiles.combionanouni.wdfiles.com/local--files/teaching-mt227b...Indice general 1....

Elizabeth Villota

Control Moderno y Optimo

– Notas de Clase MT227 –

14 de abril de 2013

Springer

Indice general

1. Modelado de sistemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.1. Conceptos en modelado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.1.1. Contribucion al modelado de la mecanica y de la ingenierıa electrica . . . . . . . . . . . . . . . . . . . . . . 1

1.2. Modelos espacio de estados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.2.1. Ecuacion diferencial ordinaria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.2.2. Ecuacion en diferencias finitas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.3. Ejemplo: Control de rapidez (control crucero) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.4. Mas sobre modelado de sistemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.5. Mas ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

1.5.1. Ejemplo: Circuito RLC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

1.5.2. Ejemplo: Motor DC y acoplamiento flexible . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.5.3. Ejemplo: Diagrama de bloques del motor DC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

1.5.4. Ejemplo: Doble filtro pasa-baja RC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

1.5.5. Ejemplo: Horno electrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2. Linealizacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

2.1. Linealizando ecuaciones diferenciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2.2. Ejemplo: Vehıculo aereo con impulsadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

2.2.1. Modelo lineal del vehıculo aereo con impulsadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

2.3. Ejemplo: manipulador robotico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

2.3.1. Ecuaciones de movimiento usando Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

2.3.2. Representacion espacio de estados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

2.3.3. Linealizacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

2.3.4. Ideas adicionales acerca del modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

2.4. Ejemplo: manipulador robotico - incluyendo la dinamica del cuerpo rıgido . . . . . . . . . . . . . . . . . . . . . . . 27

2.4.1. Ecuaciones de movimiento usando Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

2.4.2. Representacion espacio de estados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

3. Sistemas Lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

3.1. Definiciones basicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

3.1.1. Linealidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

3.1.2. Invariancia en el tiempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

3.2. Respuesta a la condicion inicial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

3.2.1. Ejemplo: Integrador doble . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

3.2.2. Ejemplo: Oscilador sin amortiguamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

3.3. Respuesta entrada/salida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

3.3.1. Ecuacion de convolucion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

3.3.2. Respuesta en estado estacionario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

3.4. Polos, ceros y ganancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

3.5. Otros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

V

VI Indice general

4. Formas canonicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

4.1. Definiciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

4.1.1. Invariancia de coordenadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

4.1.2. Autovalores/autovectores de una matriz y modos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

4.1.3. Teorema de Cayley-Hamilton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

4.2. Forma canonica modal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

4.2.1. Ejemplo: Sistema de multiples entradas y multiples salidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

4.3. Forma canonica controlable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

4.3.1. Caso, sistema de una entrada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

4.3.2. Caso, sistema de multiples entradas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

4.4. Forma canonica observable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

4.4.1. Caso, sistema de multiples salidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

4.5. Representaciones espacio de estados en formas canonicas a partir de funciones de transferencia del

sistema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

4.5.1. Forma canonica controlable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

4.5.2. Forma canonica observable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

4.5.3. Forma canonica modal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

5. Control por realimentacion de estados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

5.1. Controlabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

5.1.1. Ejemplo: Motor DC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

5.1.2. Sistema no controlable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

5.1.3. Estabilizabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

5.2. Control por realimentacion de estados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

5.2.1. Estructura del controlador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

5.2.2. Estabilizacion por realimentacion de estados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

5.2.3. Desempeno. Control para la solucion en estado estacionario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

5.2.4. Especificaciones del diseno del control por realimentacion de estados . . . . . . . . . . . . . . . . . . . . . 71

5.2.5. Ejemplo, sistema de balance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

5.3. Control integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

5.3.1. Ejemplo, control de rapidez con control integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

6. Control por realimentacion de salidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

6.1. Observabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

6.1.1. Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

6.1.2. Teorema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

6.2. Observador de orden completo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

6.2.1. Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

6.2.2. Control usando estados estimados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

6.3. Observador de orden reducido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

6.3.1. Compensador controlador/estimador orden-reducido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

6.3.2. Ejemplo: Motor DC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

7. Estabilidad y desempeno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

7.1. Estabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

7.1.1. Definiciones basicas de estabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

7.1.2. Estabilidad segun Lyapunov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

7.2. Indices de desempeno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108

8. Control Optimo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

8.1. Problema del Control Optimo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

8.1.1. Calculo Variacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

8.1.2. Solucion del problema de optimizacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112

8.2. Regulador cuadratico lineal, (LQR por sus siglas en ingles) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

8.2.1. Ecuacion de Riccati Diferencial (DRE, por sus siglas en ingles) . . . . . . . . . . . . . . . . . . . . . . . . . . 118

Indice general VII

8.2.2. Valor del ındice de desempeno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

8.2.3. Ejemplo integrador doble . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120

8.3. Regulador cuadratico lineal en estado estacionario - Horizonte infinito . . . . . . . . . . . . . . . . . . . . . . . . . . . 120

8.3.1. Ecuacion de Riccati Algebraica (ARE, por sus siglas en ingles) . . . . . . . . . . . . . . . . . . . . . . . . . . . 121

8.3.2. Resolviendo la ARE usando el metodo del autovector . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125

8.3.3. Propiedades de robustez del diseno LQR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133

8.3.4. Regla de Bryson para seleccion de matrices Q y R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133

9. Estimacion Optima . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135

9.1. Filtro de Kalman-Bucy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135

9.1.1. Teorıa de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136

9.1.2. Problema del observador optimo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138

9.2. Control LQG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140

9.2.1. Ejemplo: Aeronave de impulsion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141

9.2.2. Compensador optimo LQG podrıa resultar en un sistema en lazo cerrado inestable . . . . . . . . . . 144

10. Topicos especiales de control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147

10.1. Problema de Generacion de Trayectoria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147

10.1.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147

10.1.2. Formulacion alternativa: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148

10.1.3. Programacion de ganancias (GAIN SCHEDULING) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150

10.2. Filtro de Kalman Extendido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153

10.2.1. Idea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154

10.2.2. Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154

11. Problemas propuestos y resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157

11.1. Problemas Capıtulo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157









A. Ecuaciones de Euler Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203

A.1. Problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204

A.2. Solucion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204

B. Optimizacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207

B.1. Optimizacion sin restricciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207

B.1.1. Ejemplo: Superficies cuadraticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207

B.2. Optimizacion con restricciones de igualdad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209

B.2.1. Multiplicadores de Lagrange y el Hamiltoniano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209

B.2.2. Ejemplo: Superficie cuadratica con restriccion lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210

C. Calculo Variacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213

C.1. Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213

Capıtulo 1

Modelado de sistemas

Un modelo es una representacion puntual de la dinamica del sistema y es usada con la finalidad de responder

preguntas mediante analisis y simulacion. El modelo que se elige depende del tipo de preguntas que se desee responder,

y como tal, existe mas de un tipo de modelo para un mismo sistema dinamico, con diferentes niveles de fidelidad

dependiendo del fenomeno de interes.

1.1. Conceptos en modelado

Un modelo es una representacion matematica de un sistema fısico, biologico o de informacion. El modelo permite

razonar en relacion al sistema y hacer predicciones con respecto a como se comportara un sistema. En esta parte nuestro

interes es emplear modelos de sistemas dinamicos que describan el comportamiento entrada/salida de un sistema y para

esto adoptaremos la representacion en la forma espacio de estados.

En su forma mas elemental, un sistema dinamico es aquel donde los efectos de las acciones (entradas) no se presen-

tan inmediatamente. Por ejemplo, la rapidez de un vehıculo no cambia inmediatamente despues de presionado el pedal

del freno, asi como tampoco un dolor de cabeza desaparece justo despues de haber tomado una aspirina. Un ejemplo

en el ambito financiero serıa que los beneficios de una inversion no se perciben a corto plazo, estos se presentan solo a

largo plazo (si fue una buena inversion). Como caracterıstica fundamental todos estos ejemplos de sistemas dinamicos

presentan un comportamiento que evoluciona en el tiempo.

1.1.1. Contribucion al modelado de la mecanica y de la ingenierıa electrica

En mecanica, el estudio de la dinamica surgio al intentar describir el movimiento planetario1. Uno de los triunfos

de la mecanica Newtoniana fue la observacion de que el movimiento de los planetas podıa ser predecida en base a las

posiciones y velocidades actuales de todos los planetas. El estado de un sistema dinamico es la coleccion de variables

que caracteriza completamente el movimiento de un sistema con el proposito de predecir el movimiento futuro. Al

conjunto de todos los estados posibles se le denomina espacio de estados.

Un clase comun de modelos matematicos para sistemas dinamicos es representado por ecuaciones diferenciales

ordinarias (ODE, por sus siglas en ingles). En mecanica una de esas ecuaciones diferenciales es:

mq+ c(q)+ kq = u, (1.1)

donde u representa el efecto de entradas externas. El modelo (1.1) es llamado ecuacion diferencial controlada o forza-

da. Cuando u = 0, el modelo se denomina ecuacion diferencial libre. Este modelo puede facilmente representar un

sistema dinamico tal como el sistema masa-resorte con amortiguamiento, ver Fig. 1.1. La variable q ∈ R representa la

posicion de la masa m con respecto a su posicion de reposo. Se emplea q para referirse a la derivada con respecto al

1 En base a la observacion detallada de los planetas realizada por Tycho Brahe y los resultados de Kepler, se encontro empiricamente quelas orbitas de los planetas podıan ser descritas por elipses.

1

2 1 Modelado de sistemas

tiempo de q (velocidad de la masa) y q para representar a la segunda derivada (aceleracion). Decimos que el sistema es

de segunda orden dado que la dinamica depende de las dos primeras derivadas de q.

c (q)

q

m

k

Figura 1.1 Masa-resorte con amortiguamiento

La evolucion de la posicion y la velocidad pueden ser descritos usando ya sea una grafica en el tiempo o un diagrama

del plano de fase, ambos mostrados en Fig. 1.2. La grafica en el tiempo muestra los valores de los estados individual-

mente como funcion del tiempo. El diagrama del plano de fase muestra la evolucion de la velocidad en relacion a la

posicion, permitiendo asi visualizar el campo vectorial del sistema (velocidad denotada por las flechas).

0 5 10 15−2

−1

0

1

2

Time t [s]

Positionq[m],velocityq[m/s]

Position

Velocity

−1 −0.5 0 0.5 1−1

−0.5

0

0.5

1

Position q [m]

Velocityq[m/s]

Figura 1.2 Ilustracion de un modelo de estados

El adicionar la entrada u al sistema enriquece al sistema y permite que podamos respondar otras preguntas. Por

ejemplo, el efecto que los disturbios externos tienen en la trayectoria del sistema. En el caso de que se pueda manipular

la variable de entrada u de una forma controlada, es posible analizar si se puede llevar o no el sistema de un punto a

otro en el espacio de estados a traves de una apropiada seleccion de la entrada.

La ingenierıa electrica presento una vision diferente del modelado, donde el diseno de amplificadores electronicos

llevo a un enfoque tipo entrada/salida. Un sistema era un dispositivo que transformaba entradas en salidas, como

mostrado en Fig. 1.3. La estructura entrada/salida se usa en muchas disciplinas de la ingenierıa puesto que permite

descomponer un sistema en sus componentes individuales y conectarlos a traves de sus entradas y salidas. Ası se

puede tomar un sistema complicado como una radio o television y se descompone en piezas tales como el receptor,

demodulador, amplificador, parlantes, etc. Cada una de estas piezas tiene un conjunto de entradas y salidas y, a traves

de un diseno apropiado, se pueden interconectar para formar el sistema completo.

Cuando la teorıa de control emergio como una disciplina en los 1940s, el abordaje adoptado estaba fuertemente

influenciado por la vision de la ingenierıa electrica (entrada/salida). La segunda ola de desarrollo en control se vio in-

fluenciada por la mecanica, donde se uso la perspectiva espacio de estados. El afan por realizar vuelos espaciales es un

ejemplo tıpico de como comenzaron a fusionarse estos dos puntos de vista hasta llegar a ser lo que hoy en dia se conoce

como la representacion espacio de estados de sistemas de entrada/salida. Especıficamente, uno de los problemas que se

presento fue el de controlar la orbita de un nave espacial. Ası, el desarrollo de modelos espacio de estados involucraba

modificar los modelos mecanicos para incluir sensores y actuadores y utilizar ecuaciones con formas mas generales.

Luego el modelo dado por la ecuacion (1.1) fue reemplazado por:

1.2 Modelos espacio de estados 3

7+v

–v

vos adj

(+)

(–)

InputsOutput3

2

6

4

Q9

Q1 Q2

Q3 Q4

Q7

Q5

R1 R12

R8

R7 R9

R10

R11R2

Q6Q22

Q17

Q16

Q1830pF

Q15

Q14

Q20

Q8

SystemInput Output

Figura 1.3 Diagrama entrada/salida

dx

dt= f (x,u),

y = h(x,u),(1.2)

donde x es el vector de variables de estado, u es el vector de senales de control y y es un vector de (senales) medidas.

El termino dxdt

representa la derivada de x con respecto al tiempo, ahora considerado un vector, y f y h son mapeamien-

tos (posiblemente no lineales) de sus argumentos a vectores de dimension apropiada. Para sistemas mecanicos, caso

sistema masa resorte con amortiguamiento, el estado consiste en la posicion y velocidad de la masa.

Para complementar la idea de modelado, cabe destacar que un desarrollo final en la construccion del problema con

una vision de la teorıa de control viene dado por la inclusion de disturbios e incertezas del modelo2.

Una observacion a destacar en el modelado para diseno de sistemas de control es que el sistema por realimentacion

puede ser a menudo analizado y disenado en base a modelos relativamente simples. La justificacion se encuentra en la

robustez inherente que presentan los sistemas de control por realimentacion. Sin embargo, otro tipo de uso de modelos

requiere de mas complejidad y precision. Un ejemplo son las estrategias de control por alimentacion anticipada, donde

uno usa el modelo para precalcular las entradas que haran que el sistema responda de cierta forma. Otra area es la de

validacion de sistemas.

1.2. Modelos espacio de estados

Esta seccion presentara dos formas principales de modelos a ser usadas en clase. Ambas hacen uso de nociones de

estado, entrada, salida y dinamica para describir el comportamiento de un sistema.

1.2.1. Ecuacion diferencial ordinaria

El estado de un sistema es la coleccion de variable que resume el pasado de un sistema con el proposito de predecir

el futuro. Para un sistema fısico el estado esta compuesto de las variables necesarias para el almacenamiento de masa,

momento y energia. Una cuestion importante en el del modelado es el decidir cuan exacta debe ser la representacion

de este almacenamiento. Las variables de estado son representadas por un vector x ∈ Rn llamado el vector de estados.

Las variables de control son representadas por otro vector u ∈ Rp, y la senal medida por el vector y ∈ R

q. Un sistema

se puede representar entonces por la ecuacion diferencial:

dx

dt= f (x,u),

y = h(x,u),(1.3)

2 Disturbios e incertezas del modelo son considerados elementos crticos en la teorıa de control.


donde f : Rn×Rp 7→ R

n y h : Rn×Rp 7→ R

q son mapeamientos suaves. Un modelo de esta forma se llama modelo

espacio de estados.

La dimension del vector de estados es llamada orden del sistema. El sistema (1.4) es llamado invariante en el tiempo

porque f y h no dependen explicitamente del tiempo t; existen sistemas variantes en el tiempo mas generales donde las

funciones si dependen del tiempo. El modelo consiste en dos funciones: la funcion f que provee la variacion del vector

de estados con respecto al tiempo en funcion del estado x y el control u, y la funcion h que provee los valores medido

como funcion del estado x y del control u.

Un sistema se denomina sistema de espacio de estados lineal si las funciones f y h son lineales en x y u. Un sistema

espacio de estados lineal puede ser representado por:

dx

dt= Ax+Bu,

y =Cx+Du,(1.4)

donde A, B,C y D son matrices. Si estas matrices son constantes, entonces se dice que tal sistema es lineal e invariante

en el tiempo, LTI por sus siglas en ingles. La matriz A es llamada matriz dinamica o matriz de estados, la matriz B es

llamada la matriz de control o matriz de entradas, la matriz C es llamada matriz del sensor o matriz de salidas, y la

matriz D es llamada la matriz del termino directo.

Generalizando la ecuacion dinamica de segundo orden estudiada en mecanica, resulta una ecuacion de la forma:

dny

dtn+an−1

dn−1y

dtn−1+ ...+aoy = u, (1.5)

donde t es la variable independiente, y(t) es la variable de (salida) dependiente y u(t) es la entrada. La notaciondky

dtk

denota la k-esima derivada con respecto a tiempo t, a veces denotada por y(k). La ecuacion diferencial controlada (1.5)

se dice que es un sistema de n-esima orden. Este sistema se puede convertir en la forma espacio estado definiendo:

x =

x1

x2

...

xn−1

xn

=

y

dy/dt...

dn−2y/dtn−2

dn−1y/dtn−1

, (1.6)

y la ecuacion espacio de estados resulta:

d

dt

x1

x2

...

xn−1

xn

=

x2

x3

...

xn

−aox1− ...−an−1xn

+

0

0...

0

u

, y = x1. (1.7)

Con la definicion apropiada de A, B, C y D, esta ecuacion se puede definir en la forma espacio de estados lineal.

Una forma aun mas general se obtiene dejando que la salida sea una combinacion lineal de los estados del sistema,

por ejemplo:

y = b1x1 +b2x2 + ...+bnxn +du. (1.8)

Este sistema puede ser modelado en espacio de estados como:

1.2 Modelos espacio de estados 5

d

dt

x1

x2

x3

...

xn

=

0 1 ... 0 0...

...

0 0 1 0

0 0 ... 0 1

−a0 −a1 ... −an−2 −an−1

x+

0

0...

0

1

u,

y =[b1 b2 ... bn

]x+du.

(1.9)

Esta forma particular de un sistema lineal en espacio de estados se llama forma canonica controlable.

La ecuacion (1.4) puede ser dibujada como un diagrama de bloques en la Fig. 1.4. Las dobles lineas indican que

cantidades vectoriales (multiples variables) son pasadas entre los bloques.

+

+

A

CB ∫x(t)u(t) x(t)· y(t)

D

++

Block diagram of a

general continuous linear

Figura 1.4 Diagrama de bloques de un modelo espacio de estados lineal contınuo general

1.2.2. Ecuacion en diferencias finitas

Muchas veces resulta mas natural describir la evolucion de un sistema en instantes de tiempo discretos en vez de

continuamente en el tiempo. Si uno se refiere a cada uno de estos tiempos usando un numero entero k = 0,1,2...,entonces se puede hacer la pregunta de como cambia el estado para cada k. Como se hizo en el caso de ecuaciones

diferenciales ordinarias, se define como estado a los conjuntos de variable que resumen el pasado del sistema para

propositos de prediccion de su futuro. Los sistemas que se describen de esa manera se denominan sistemas de tiempo

discreto o sistemas discretos.

La evolucion de un sistema discreto se puede escribir de la forma:

x[k+1] = f (x[k],u[k]),y[k] = h(x[k],u[k]),

(1.10)

donde x[k] ∈Rn es el estado del sistema en el tiempo k, u[k] ∈Rp es la entrada y y[k] ∈Rq es la salida. Como antes, f y

h son mapeamientos suaves de dimension apropiada. La ecuacion (1.10) se denomina ecuacion en diferencias porque

nos dice como x[k+1] difiere de x[k]. El estado x[k] puede ser una cantidad escalar o un vector; en caso de ser un vector

usaremos x j[k] para denotar al j-esimo elemento del vector x (o j-esimo estado) en el instante de tiempo k.

Como en el caso de ecuaciones diferenciales, a menudo las ecuaciones son lineales en el estado y la entrada, en

cuyo caso el sistema puede ser descrito por:

x[k+1] = Ax[k]+Bu[k],y[k] =Cx[k]+Du[k],

(1.11)

Como en el caso anterior, nos referimos a las matrices A, B, C y D como matriz de la dinamica, la matriz de control,

matriz del sensor y matriz del termino directo.


1.3. Ejemplo: Control de rapidez (control crucero)

El control de rapidez de un vehıculo es un problema comun de sistema por realimentacion que encontramos en

nuestro quehacer diario. El sistema intenta mantener una rapidez constante en la presencia de disturbios. El control

compensa el efecto de los disturbios midiendo la rapidez del vehıculo y ajustando la valvula de alimentacion de com-

bustible apropiadamente (para acelerar o desacelerar).

Para modelar el sistema tenemos el diagrama de bloques de la Fig. 1.5. Sea v la rapidez del carro y vr la rapidez

(deseada) referencia. El controlador recibe las senales v y vr y genera la senal de control u que es enviada al actuador

que controla la posicion de la valvula de alimentacion. La posicion de la valvula de alimentacion a su vez controla el

torque desarrollado por el motor, que es transmitido a traves de los engranajes y las ruedas, generando una fuerza F que

mueve el carro. Existen duerzas de disturbios Fd debido a las variaciones en la pendiente de la superficie, la resistencia

al deslizamiento de las ruedas y fuerzas aerodinamicas. El control de rapidez tambien tiene una interface humano-

maquina que permite que el conductor establezca y modifique la rapidez de referencia. Tambien existen funciones que

desconectan el control de rapidez cuando se presiona el freno.

Gears &

Actuator

vr

Controller

BodyThrottle &

Engine

Fd

v

cancel

resume/accel

set/decel

on/off

Driver

Interface

T F

u

Wheels

Figura 1.5 Diagrama de bloques del control de rapidez

Para comenzar a desarrollar un modelo matematico comenzamos con un balance de fuerzas para el cuerpo del

vehiculo. Sea v la rapidez del vehiculo, m es la masa total (incluyendo pasajeros), F es la fuerza generada por el motor

y Fd es la fuerza de disturbio debido a la aceleracion de la gravedad, friccion y arrastre aerodinamico. La ecuacion de

movimiento del carro es:

mdv

dt= F−Fd . (1.12)

La fuerza F es generada por el motor, cuyo torque T es proporcional a la razon de inyeccion de combustible, que es a

su vez proporcional a la senal de control 0 ≤ u ≤ 1 que controla la posicion de la valvula de alimentacion. El torque

depende de la velocidad angular del motor ω . El torque puede ser representado por la siguiente expresion:

T (ω) = Tm(1−β (ω

ωm

−1)2), (1.13)

donde Tm es el torque maximo obtenido a la velocidad angular del motor ωm. Parametros tipicos son Tm = 190Nm,

ωm = 420rad/s (para 4000 rpm) y β = 0,4. Sea n la razon de los engranajes y r el radio de la rueda.La velocidad del

motor es relacionada a la rapidez a trav’es de:

ω =n

rv = αnv, (1.14)

y la fuerza F se puede escribir como:

F =nu

rT (ω) = αnuT (αnv). (1.15)

Valores tıpicos de αn para engranajes del 1 al 5 son α1 = 40, α2 = 25, α3 = 16, α4 = 12 y α5 = 10.

La fuerza de disturbio tiene tres componentes principales: Fg, fuerzas debido a la accion de la gravedad; Fr, fuerza

debido a la resistencia al deslizamiento; y Fa, fuerza del arrastre aerodinamico. Si asumimos una pendiente de la

superficie θ , la gravedad dota de la fuerza Fg = mgsinθ , como mostrado en la Fig. 1.6, donde g = 9,8m/s2. Un modelo

simple de friccion es:

1.4 Mas sobre modelado de sistemas 7

Fr = mgCrsgn(v),

Cr = 0,01 es coeficiente de friccion, sgn es la funcion signo de v (±1) o cero si v = 0. Un valor tipico de Cr es 0.01.

Finalmente, el arrastre aerodinamico es proporcional al cuadrado de la rapidez:

Fa =1

2ρCdAv2,

donde ρ = 1,3 kg/m3 es la densidad del aire, Cd = 0,32 es el coeficiente de arrastre aerodinamico que depende de la

forma del vehiculo, A = 2,4m2 es el area frontal del carro.

Resumiendo, encontramso que el carro puede ser modelado por:

mdv

dt= αnuT (αnv)+−mgCrsgn(v)− 1

2ρCdAv2−mgsinθ .

El modelo es un sistema dinamico de primer orden. El estado es la rapidez del vehiculo, que tambien es la salida. La

entrada es la senal u que controla la posicion de la valvula de alimentacion, y el disturbio e sla fuerza Fd , que pedende

de la pendiente de la superficie. El sistema es no lineal puesto que el torque se define como en (1.13), el termino

relacionado a la fuerza gravitacional y el caracter no lineal de la friccion y arrastre aerodinamico.

gF

mg

F

θ

Figura 1.6 Efecto de las fuerzas gravitacionales

1.4. Mas sobre modelado de sistemas

El principal objetivo del analisis de sistemas es la prediccion de la forma en la que el sistema respondera a varias

entradas y como estas respuestas cambian para diferentes valores de los parametros del sistema. En la ausencia del

modelado de sistemas, los ingenieros se ven forzados a construir prototipos del sistema para poder probarlos. Los

datos obtenidos en las pruebas de los prototipos fısicos son muy valiosos, sin embargo los costos en tiempo y dinero

para obtener estos datos muchas veces no permiten su realizacion. Adicionalmente, los modelos matematicos son

inherentemente mas flexibles que los prototipos fısicos y permiten un rapido refinamiento de los disenos del sistema

para optimizar varias medidas de desempeno. En consecuencia, uno de los objetivos del analisis de sistemas es el

establecer un modelo matematico adecuado que pueda ser usado para obtener informacion equivalente a la que se

podra conseguir de varios prototipos fısicos diferentes. De esta forma, aun si un prototipo final es construido para

verificar el modelo matematico, el modelador se ha ahorrado un tiempo y dinero significativos.

Un modelo matematico es un conjunto de ecuaciones que describe completamente las relaciones entre las variables

del sistema. Es usado como una herramienta para desarrollar disenos y algoritmos de control, y la tarea principal para la

que sera usado tiene implicaciones basicas para la eleccion del modelo del sistema. De ahi que los modelos del sistema

deben ser lo mas simples posible, y cada modelo debe ser desarrollado con alguna aplicacion especıfica en mente. De

hecho, de esta forma se tendra diferentes modelos construidos para diferentes usos del mismo sistema. En el caso de

modelos matematicos, diferentes tipos de ecuaciones seran usadas para describir al sistema en sus varias aplicaciones.

La Tabla 1 clasifica a los modelos del sistema de acuerdo a los cuatro criterios mas comunes: aplicacion del principio

de superposicion, dependencia en coordenadas espaciales ası como en el tiempo, variacion de los parametros en el

tiempo, y continuidad de las variables independientes. En base a estos criterios, los modelos de sistemas dinamicos son

clasificados como lineales y no lineales, concentrados y distribuidos, estacionarios invariantes en el tiempo o variantes


en el tiempo, contınuos o discretos, respectivamente. Cada clase de modelo es tambien caracterizada por el tipo de

ecuacion matematica empleada en la descripcion del sistema.

Tipo de modelo Criterio de clasificacion Tipo de ecuacion de modelo

Nolineal Principio de superposicion no aplica Ecuaciones diferenciales no linealesLineal Principio de superposicion aplica Ecuaciones diferenciales linealesDistribuido Variables dependientes son funcion de co-

ordenadas espaciales y el tiempoEcuaciones diferenciales parciales

Concentrado Variables dependientes son independi-entes de las coordenadas espaciales

Ecuaciones diferenciales ordinarias

Variantes en el tiempo Parametros del modelo varian en el tiem-po

Ecuaciones diferenciales con coeficientesque varian tiempo

Estacionario Parametros del modelo son constantes enel tiempo

Ecuaciones diferenciales con coeficientesconstantes

Contınuo Variables dependientes definidas sobrerango contınuo de variables independi-entes

Ecuaciones diferenciales

Discreto Variables dependientes definidas solo paradistintos valores de variables independi-entes

Ecuaciones por diferencias finitas

Cuadro 1.1 Clasificacion de modelos del sistema

1.5. Mas ejemplos

1.5.1. Ejemplo: Circuito RLC

Se desea formular un modelo donde el voltaje terminal v sea la entrada y el voltaje en el capacitor vC sea la salida.

Las leyes de Ohm y Kirchoff permiten obtener la siguiente relacion para los voltajes:

Ri(t)+Ldi(t)

dt+ vC(t) = v(t). (1.16)

Para el capacitor se sabe que:

CvC(t) = q(t)→CdvC(t)

dt=

dq(t)

dt= i(t). (1.17)

De estas ecuaciones se puede ver inmediatamente que:

i =−R

Li− 1

LvC +

1

Lv,

vC =1

Ci.

(1.18)

La dependencia del tiempo se ha omitido por simplicidad.

R L

C

vC

i

v

Figura 1.7 Circuito RLC

1.5 Mas ejemplos 9

El sistema puede ser descrito por las dos ecuaciones diferenciales de primer orden acopladas mostradas en (1.18).

Reescribiendo las ecuaciones en la forma de espacio de estados:

[i

vC

]

=

−R

L−1

L1

C0

[i

vC

]

+

[1

L0

]

v. (1.19)

Si las variables de estado y las matrices del sistema son definidas como:

x =

[i

vC

]

, x =

[i

vC

]

,A =

−R

L−1

L1

C0

,B =

[1

L0

]

,u = v,

la ecuacion (1.19) puede ser reescrita en forma compacta como:

x = Ax+Bu.

Un diagrama de bloques del sistema es mostrado en la Fig. 1.8. Notar que los elementos del vector de estados x, i(t) y

∫R

L---

1

L---

1

C----

1

L--- ∫

v t( ) i t( ) i t( ) v·c t( ) vc t( )+

__

Figura 1.8 Diagrama de bloques del circuito RLC

vC(t), son salidas de los dos integradores en el diagrama de bloques.

Dado que el voltaje del capacitor es la salida. Una segunda ecuacion debe ser aumentada a la descripcion del

problema, la ecuacion de salida:

y = vC =[

0 1]

x. (1.20)

La combinacion de (1.19) y (1.20) es llamada el modelo espacio de estados del sistema.

La transformada de Laplace de (1.18) lleva al modelo a la forma de funcion de transferencia del sistema:

G(s) =Vc(s)

V (s)=

1

LCs2 +RCs+1. (1.21)

1.5.2. Ejemplo: Motor DC y acoplamiento flexible

La Fig. 1.9 muestra un motor DC con acoplamiento flexible en el eje entre la inercia de la armadura del motor y la

inercia de la carga. R y L son la resistencia y la inductancia del bobinado de la armadura respectivamente, k y b son

la constante de rigidez y el coeficiente de amortiguamiento (lineal) del acoplamiento flexible respectivamente y, Jm y

Jl son los momentos de inercia de la armadura del motor y carga respectivamente. El voltaje en la armadura u es la

entrada del sistema y la posicion angular de la carga θl es la salida.

Si las dos inercias son separadas una de la otra y los torques apropiados (Tk,Tb,Ta) aumentados como mostrado en

la Fig. 1.10 (diagramas de cuerpo libre), usando la Segunda Ley de Newton (Momentos de Euler) en ambas inercias se

tiene:

Jmθm = Kai+ k(θl−θm)+b(θl− θm)−bmθm, (1.22)

Jl θl =−k(θl−θm)−b(θl− θm)−bl θl , (1.23)


θm θl

k,b

R L

i

JlJm

u

Figura 1.9 Motor DC con acoplamiento flexible

donde Ka es la constante de torque, bm y bl son los factores de friccion de los rodamientos viscosos del motor y la carga

respectivamente.

θm θl

Jm Jl

State convention: θm < θl

θm < θl

· ·

Ta Tk , Tb Tk , Tb

Figura 1.10 Senal y convencion de estados para el sistema en Fig. 1.9

Las leyes de Ohm y Kirchhoff aplicadas al circuito electrico resulta en:

u = Ri+Ldi

dt+ keθm (1.24)

o

i =1

L(u− keθm−Ri), (1.25)

donde ke es el coeficiente de induccion del bobinado de la armadura del motor.

Un diagrama de bloques puede ser dibujado directamente de las ecuaciones (1.22), (1.23) y (1.25) como mostrado

en la Fig. 1.12.

1

L---

1

Jm

------

1

Jl

---- ∫∫

∫∫∫

R

b

ke

bm

Ka

k

+

_

_

+

++

_

+

_+

_

_ _

θ·

mu i·

i θm

··

θl

··θl

·

θm

θl

bl

_ x5

x1 x2x3

x4y

Figura 1.11 Diagrama de bloques del sistema motor DC con acoplamiento flexible

1.5 Mas ejemplos 11

Si se define el vector de estados de orden 5 como:

x =[

x1 x2 x3 x4 x5

]T=[

i θm θm θl θl

]T, (1.26)

y la ecuaciones de estado pueden ser escritas por inspeccion del diagrama de bloques:

x1 =−R

Lx1−

ke

Lx3 +

1

Lu,

x2 = x3,

x3 =Ka

Jm

x1−k

Jm

x2−b+bm

Jm

x3 +k

Jm

x4−b

Jm

x5,

x4 = x5,

x5 =k

Jl

x2 +b

Jl

x3−k

Jl

x4−b+bl

Jl

x5.

(1.27)

En forma matricial la ecuacion se puede escribir como:

x =

−R

L0 −ke

L0 0

0 0 1 0 0,Ka

Jm

− k

Jm

−b+bm

Jm

k

Jm

b

Jm

0 0 0 0 1

0k

Jl

b

Jl

− k

Jl

−b+bl

Jl

x+

1

L0

0

0

0

u. (1.28)

La ecuacion de salida es entonces:

y =[

0 0 0 1 0]

x. (1.29)

Se puede observar que el sistema motor DC con acoplamiento flexible es un sistema de orden 5: tiene 5 estados.

1

L---

1

Jm

------

1

Jl

---- ∫∫

∫∫∫

R

b

ke

bm

Ka

k

+

_

_

+

++

_

+

_+

_

_ _

θ·

mu i·

i θm

··

θl

··θl

·

θm

θl

bl

_ x5

x1 x2x3

x4y

Figura 1.12 Diagrama de bloques del sistema motor DC con acoplamiento flexible


1.5.3. Ejemplo: Diagrama de bloques del motor DC

El sistema electromecanico anterior tiene un acoplamiento flexible entre las dos inercias rotacionales. Si se omite la

flexibilidad, esto significa que el acoplamiento es completamente rıgido, luego las ecuaciones del sistema tendran una

apariencia diferente al caso anterior.

Un acoplamiento rıgido significa que la constante de rigidez del resorte es infinita: k ≈ ∞. No se puede modificar

los elementos de las matrices (1.27, 1.28) directamente debido a que algunos de ellos serian muy grande y esto no

puede ser posible. Luego, se debe retornar al conjunto de ecuaciones en (1.22) y (1.23) y modicarlas. Es obvio que las

dos posiciones angulares ahora seran iguales θm = θl = θ y el momento de inercia y los factores de friccion de los

rodamientos seran la suma: J = Jm + Jl y bb = bm +bl . Las dos ecuaciones se reducen a una sola ecuacion diferencial

de segundo orden:

Jθ = Kai−bnθ . (1.30)

Las ecuaciones de la parte electrica seran las mismas que antes y el nuevo diagrama de bloques es mostrado en la Fig.

1.13.

1

L---

1

J-- ∫∫∫

R

ke

bb

Ka+

_

_ + +

_

θ·

u i· i θ

··θ

x1 x2x3

y

Figura 1.13 Diagrama de bloques del sistema reducido

El numero de estados del sistema reducido es 3 y el vector de estados es como sigue:

x =[

x1 x2 x3

]T=[

i θ θ]T

, (1.31)

y las ecuaciones de estado y salida resultan:

x =

−R

L0 −ke

L0 0 1,

Ka

J0 −bb

J

x+

1

L0

0

u

y =[

0 1 0]

x.

(1.32)

1.5.4. Ejemplo: Doble filtro pasa-baja RC

A continuacion se mostrara como derivar un modelo espacio de estados de un la red electrica pasiva mostrada en la

Fig. 1.14. Usando la leyes de Ohm y Kirchhoff en los tres lazos de corriente resulta:

ei = R1i1 +1

C1

∫

(i1− i2)dt,

0 =1

C1

∫

(i2− i1)dt +1

C2

∫

i2dt +R2i2

−eo =− 1

C2

∫

i2dt

. (1.33)

1.5 Mas ejemplos 13

Arreglando las ecuaciones,

R1i1 = ei−1

C1

∫

(i1− i2)dt,

R2i2 =1

C1

∫

(i1− i2)dt− 1

C2

∫

i2dt+

eo =1

C2

∫

i2dt

, (1.34)

se llega al diagrama de bloques de la Fig. 1.15.

C1 C2

R1 R2

ei eo

i3 = 0i2i1

Figura 1.14 Red electrica simple

Luego, derivando las ecuaciones de estado directamente del diagrama:

x1 =1

C1

(1

R1(u− x1)−

1

R2(x1− x2)

)

,

x2 =1

C2

(1

R2(x1− x2)

) , (1.35)

Acomodando el modelo espacio de estados es:

x =

R1 +R2

C1R1R2

1

C1R21

C2R2− 1

R2C2

x+

1

C1R10

u,

y =[

0 1]

x

(1.36)

1

R1

------

1

R2

------

∫

∫

1

C1

------

1

C2

------

+

_

+

_

+

_

eo = y

ei = u

i1

i2

x1

x2

Figura 1.15 Diagrama de bloques del sistema en Fig. 1.14


1.5.5. Ejemplo: Horno electrico

La Fig. 1.16 muestra un horno aislado con calentamiento electrico que contiene un producto a ser calentado. La

temperatura del aire en el horno es Ts, las temperaturas del producto, material de aislamiento y aire del ambiente son

Tg, Tr y Ta respectivamente. Se asume que todas las temperaturas son uniformes. La potencia para calentamiento que

provee el elemento electrico es q, y las potencias que entran al producto y aislamiento son qg y qr. El calor perdido en

el aire del ambiente es qa.

q

qg

qr

qa

Ts

Tg

Ta

Tr

Controlled

power supply

Insulation

Product u

Figura 1.16 Horno calentado electricamente

La potencia del elemento electrico es controlada de forma lineal tal que:

q = ku, (1.37)

donde k es una constante de proporcionalidad.

Se asume que el intercambio de energıa de calor es debido a conveccion y por lo tanto las potencias y las temperat-

uras estan relacionadas por:qg = kg(Ts−Tg),qr = kr(Ts−Tr),qa = ka(Tr−Ta),

(1.38)

donde los coeficientes-k son parametros de conveccion dependiendo del area y la naturaleza fısica de las superficies.

Si la capacidad de calentamiento total del aire en el horno, del producto y del aislamiento se denota por Cs, Cg y Cr,

se pueden formular las expresiones para la razon de variacion de la temperatura de las diferentes partes del sistema.

Luego se tiene que:

Cs

dTs

dt= q−qg−qr,

Cg

dTg

dt= qg,

Cr

dTr

dt= qr−qa.

(1.39)

Un diagrama de bloques del modelo se puede ver en la Fig.1.17.

De la ecuacion diferencial (1.39) se puede determinar la siguiente eleccion de variables de estado:

x =

x1

x2

x3

=

Ts

Tg

Tr

(1.40)

Con entrada u, el disturbio v = Ta y la salida y = Tg, se puede obtener el conjunto de ecuaciones del modelo espacio de

estados. Realizando la sustotucion apropiada en (1.39). El resultado es:

1.5 Mas ejemplos 15

x1 =1

Cs

(ku− kg(x1− x2)− kr(x1− x3)) ,

x2 =1

Cg

kg(x1− x2),

x3 =1

Cr

(kr(x1− x3)− ka(x3− v)) ,

(1.41)

o en la forma vectorial-matricial:

x =

−kg + kr

Cs

kg

Cs

kr

Cskg

Cg

− kg

Cg

0

kr

Cr

0 −kr + ka

Cr

x+

k

Cs

0

0

u+

0

0ka

Cr

v,

y =[

0 1 0]

x

(1.42)

∫

∫

kg

kr

ka

∫

1

Cs

-----

1

Cr

-----

1

Cg

------

k

+

_

+

_

+

_

+

_ _

+

_

Ts

Tg

Tr

Ta

u

y

qg

qr

qa

Block diagram of

the oven production system

Figura 1.17 Diagrama de bloques del sistema en Fig. 1.16

Fuente: Capıtulos 2 y 3 del libro Feedback Systems: An Introduction for Scientists and Engineers, de Karl J. Astrom

y Richard M. Murray.

Fuente: Capıtulo 1 del libro Dynamic Modeling and Control of Engineering Systems, de B. Kulakowski, J. Gardner

y L. Shearer.

Fuente: Capıtulo 2 del libro Linear Systems Control: Deterministic and Stochastic Methods, de E. Hendricks, O.

Jannerup y P. Sorensen.

Capıtulo 2

Linealizacion

El reemplazar un sistema no lineal por su aproximacion lineal se denomina linealizacion. Una motivacion para

la linealizacion es que el comportamiento dinamico de muchos sistemas no lineales dentro de un rango de variables

puede ser aproximado a modelos de sistemas lineales. Siendo ese el caso, podemos usar tecnicas bien desarrolladas

de analisis y sıntesis de sistemas lineales para analizar un sistema no lineal. Cabe destacar que se debe tener mucho

cuidado cuando se realiza el analisis de sistemas linealizados ya que la intencion no es introducir errores al analizar

sistemas no lineales.

Consideremos el caso de un sistema (elemento no lineal) con una variable de estado x y una variable de salida y que

estan relacionadas por la siguiente ecuacion:

y = h(x), (2.1)

donde la funcion h : R 7→R es contınua y diferenciable; esto es h ∈ C 1. Consideremos xo como el punto de operacion.

Si expandemos h en la serie de Taylor alrededor del punto xo se obtiene:

y = h(x),

= h(xo)+dh(xo)

dx(x− xo)+ terminos de alto orden.

(2.2)

La linealizacion de h(x) alrededor del punto xo consiste en reemplazar h por una aproximacion lineal de la forma:

y = h(xo)+dh(xo)

dx(x− xo)

y = yo +dh(xo)

dx(x− xo),

(2.3)

donde yo = h(xo). Si y = y− yo y x = x− xo. Luego, podemos reescribir (2.3) como:

y =dh(xo)

dxx, (2.4)

y sobre un rango pequeno de x, la linea (2.3) es una buena aproximacion de la curva y = h(x) en la vecindad del punto

de operacion xo, ver Fig. 2.1 para una ilustracion de la aproximacion.

Si h : Rn 7→ R, esto es, y = h(x1,x2, ...,xn), que significa que la variable dependiente depende de varias variables -

se puede aplicar el mismo principio. Sea:

xo =[x1o x2o ... xno

]T(2.5)

el punto de operacion. La expansion de la serie de Taylor de h alrededor del punto de operacion xo resulta en:

y−h(xo) = ∇h(xo)T (x− xo)+ terminos de alto orden, (2.6)

donde:

∇h(xo)T =

[∂h

∂x1

∣∣∣∣x=xo

∂h

∂x2

∣∣∣∣x=xo

...∂h

∂xn

∣∣∣∣x=xo

]

. (2.7)

17

18 2 Linealizacion

y

y0

x0

y h(x)

x

y y0 (x x0)dh(x0)

dx

Figura 2.1 Aproximacion lineal de la funcion y = h(x)

Geometricamente, la linealizacion de h alrededor de xo se puede pensar como el localizar un plano tangente sobre una

superficie no lineal en el punto de operacion xo, como mostrado en la Fig. 2.2.

Tangent

plane

h(x0)

x0

x2

x1

y h(x)

Figura 2.2 Plano tangente como aproximacion lineal de una funcion de dos variables.

2.1. Linealizando ecuaciones diferenciales

Consideremos ahora un sistema dinamico modelado por un conjunto de ecuaciones diferenciales no lineales:

dx1

dt= f1(x1,x2, ...,xn,u1,u2, ...,um),

dx2

dt= f2(x1,x2, ...,xn,u1,u2, ...,um),

......

dxn

dt= fn(x1,x2, ...,xn,u1,u2, ...,um).

. (2.8)

Asumiendo que las funciones fi, i = 1,2, ...,n, son contınuas y diferenciables. El conjunto de las ecuaciones arriba

mostradas se puede representar en la forma vectorial por:

dx

dt= f (x,u). (2.9)

2.1 Linealizando ecuaciones diferenciales 19

Sea ue =[u1e u2e ... une

]Tuna entrada constante que fuerza al sistema (2.9) a que se asiente en un estado de equilibrio

xe =[x1e x2e ... xne

]T; esto es, ue y xe satisfacen:

f (xe,ue) = 0. (2.10)

Los estados de equilibrio son llamados tambien puntos estacionarios, puntos constantes o puntos de reposo, ya que si

el sistema se ubica inicialmente en x = xe, luego permanecera en x(t) = xe para todo tiempo t ≥ 0.

Por lo general cuando hablamos de la existencia de un ue 6= 0 nos referimos a condiciones de operacion puesto que

el sistema necesitarıa de esa inyeccion ya sea de fuerza (torque, etc.) para mantenerse en el punto de equilibrio.

Cuando analizamos la dinamica de un sistema no forzado, hacemos ue = 0 y luego buscamos el punto de equilibrio

xe para el sistema dinamicodx

dt= f (x), es decir la solucion de f (xe) = 0. En el caso de un sistema dinamico no forzado,

este puede presentar cero, uno o mas puntos de equilibrio.

Para estudiar y analizar el comportamiento local del sistema alrededor del punto de equilibrio (xe,ue), se supone que

tanto x− xe como u−ue son pequenos, tal que perturbaciones no lineales pueden ser ignoradas en comparacion a los

terminos lineales (de orden bajo). Este argumento es similar a cuando usamos aproximaciones de angulos pequenos,

reemplazando sinθ con θ y cosθ con 1 para θ cerca a cero.

Si ahora perturbamos el estado de equilibrio haciendo:

x = xe + x, u = ue + u. (2.11)

La expansion de la serie de Taylor resulta en:

d

dtx = f (xe + x,ue + u),

= f (xe,ue)+∂ f

∂x(xe,ue)x+

∂ f

∂u(xe,ue)u+ terminos de alto orden,

(2.12)

donde:

∂ f

∂x(xe,ue) =

∂ f1

∂x1...

∂ f1

∂xn...

...∂ fn

∂x1...

∂ fn

∂xn

∣∣∣∣∣∣∣∣∣∣ x = xe,u = ue

y∂ f

∂u(xe,ue) =

∂ f1

∂u1...

∂ f1

∂um...

...∂ fn

∂u1...

∂ fn

∂um

∣∣∣∣∣∣∣∣∣∣ x = xe,u = ue

(2.13)

son las matrices Jacobianas de f con respecto a x y u, evaluadas en el punto de equilibrio, (xe,ue). Notese que:

d

dtx =

d

dtxe +

d

dtx =

d

dtx, (2.14)

porque xe es una constante. Adicionalmente, f (xe,ue) = 0, luego definiendo A ∈ Rn×n y B ∈ R

n×m de la siguiente

forma:

A =∂ f

∂x(xe,ue) y B =

∂ f

∂u(xe,ue). (2.15)

Finalmente, eliminando los terminos de orden alto, se llega a la siguiente aproximacion lineal:

d

dtx = Ax+Bu. (2.16)

De forma similar, si las salidas del modelo del sistema no lineal son de la forma:

y1 = h1(x1,x2, ...,xn,u1,u2, ...,um),y2 = h2(x1,x2, ...,xn,u1,u2, ...,um),

...

yp = hp(x1,x2, ...,xn,u1,u2, ...,um).

. (2.17)

20 2 Linealizacion

o en notacion vectorial:

y = h(x,u), (2.18)

entonces la expansion de la serie de Taylor puede ser usada nuevamente para llevar a la aproximacion lineal de la

ecuacion de salida del sistema. Sea:

y = ye + y, (2.19)

luego obtenemos:

y =Cx+Du, (2.20)

donde:

C =∂h

∂x(xe,ue) =

∂h1

∂x1...

∂h1

∂xn...

...∂hp

∂x1...

∂hp

∂xn

∣∣∣∣∣∣∣∣∣∣ x = xe,u = ue

∈ Rp×n, (2.21)

y,

D =∂h

∂u(xe,ue) =

∂h1

∂u1...

∂h1

∂um...

...∂hp

∂u1...

∂hp

∂um

∣∣∣∣∣∣∣∣∣∣ x = xe,u = ue

∈ Rp×m (2.22)

son las matrices Jacobianas de h con respecto a x y u, evaluadas en el punto de operacion (xe,ue).El hecho de que modelos lineales puedan ser usados para estudiar el comportamiento de un sistema no lineal cerca

a los puntos de operacion es bien importante. De hecho, lo que haremos en las proximas secciones es aprovechar esta

aproximacion local lineal de un sistema no lineal para disenar leyes de control por realimentacion que mantengan

al sistema cerca al punto de equilibrio (diseno de dinamica). Entonces la realimentacion se usara para hacer que las

soluciones del sistema controlado permanezcan cerca al punto de operacion, ver Fig. 2.3.

−2

−1

0

1

2

x1

x2

0 π/2 π 2π3π/2−2

−1

0

1

2

z1

z2

−π −π/2 0 π/2 π

Figura 2.3 Comparacion entre los planos de fase de un sistema no lineal (a) y su aproximacion lineal alrededor del origen (b). Notese quecerca al punto de equilibrio en el centro de las graficas , los planos de fase (y como consecuencia la dinamica) es practicamente identica.

2.2. Ejemplo: Vehıculo aereo con impulsadores

Considere el movimiento de el vehıculo aereo, tal como el Harrier jump jet mostrado en la Fig. 2.4. El Harrier

es capaz de despegar verticalmente al redireccionar los impulsadores principales hacia abajo y a traves del uso de

2.2 Ejemplo: Vehıculo aereo con impulsadores 21

impulsadores pequenos de maniobra que estan localizados en sus alas. Un modelo simplificado es mostrado en la

Fig. 2.4(b) donde el enfoque del movimiento del vehıculo es en un plano vertical que corta las alas del vehıculo.

Las ecuaciones de movimiento seran calculadas representando las fuerzas generadas por el impulsador principal y los

impulsadores de maniobra como F1 y F2 (actuando a una distancia r por debajo del vehıculo).

(a) Harrier “jump jet”

r

x

y

θ

F1

F2

(b) Simplified model

Figura 2.4 (a) Vehıculo aereo con impulsadores y su (b) modelo simplificado donde el impulso neto ha sido descompuesto entre la fuerzahorizontal F1 y la fuerza vertical F2 actuando a una distancia r del centro de masa.

Sea (x,y,θ) la posicion y la orientacion del centro de masa del vehıculo. Sea m la masa del vehıculo, J el momento

de inercia, g la constante graviatacional y c el coeficiente de amortiguamiento. Luego las ecuaciones de movimiento

son:mx = F1cosθ −F2sinθ − cx,my = F1sinθ +F2cosθ +mg− cy,Jθ = rF1.

(2.23)

Se cree conveniente redefinir las entradas tal que el origen sea considerado el punto de equilibrio del sistema con

entrada cero. Haciendo u1 = F1 y u2 = F2−mg, las ecuaciones resultan:

mx =−mgsinθ − cx+u1cosθ −u2sinθ ,my = mg(cosθ −1)− cy+u1sinθ +u2cosθ ,Jθ = ru1.

(2.24)

Estas ecuaciones definen el movimiento del vehıculo como un conjunto de tres ecuaciones diferenciales acopladas.

Describiendo la dinamica del vehıculo en la forma de espacio de estados:

dz

dt=

z4

z5

z6

−gsinz3−c

mz4 +

u1

mcosz3−

u2

msinz3

−g(cosz3−1)− c

mz5 +

u1

msinz3 +

u2

mcosz3

u1

Jr

, (2.25)

donde z =[x y θ x y θ

]T.

22 2 Linealizacion

2.2.1. Modelo lineal del vehıculo aereo con impulsadores

Suponiendo que u1 = 0 y u2 = 0, la dinamica del sistema se simplica a:

dz

dt=

z4

z5

z6

−gsinz3− cm

z4

−g(cosz3−1)− cm

z5

0

. (2.26)

Los puntos de equilibrio del sistema estan dados cuando se hacen cero las velocidades x, y y θ y escogiendo las

siguientes variables que satisfagan la siguiente ecuacion:

[0

0

]

=

[−gsinz3e

−g(cosz3e−1)

]

,→ z3e = θe = 0. (2.27)

Entonces, el punto de equilibrio corresponde a la posicion vertical del vehıculo. Notese que xe y ye no estan especifi-

cados. Esto ocurre porque nosotros podriamos trasladar el sistema a una nueva posicion (mas arriba) y todavia obtener

un punto de equilibrio.

Calculando la matriz de estados A y la matriz de entrada B:

A =∂ f

∂ z

∣∣∣∣ze

=

0 0 0 1 0 0

0 0 0 0 1 0

0 0 0 0 0 1

0 0 −g −c/m 0 0

0 0 0 0 −c/m 0

0 0 0 0 0 0

, (2.28)

B =∂ f

∂u

∣∣∣∣ze

=

0 0

0 0

0 0

1/m 0

0 1/m

r/J 0

. (2.29)

Luego el sistema linealizado del vehıculo aereo con impulsores puede ser escrito como:

d

dtx =

0 0 0 1 0 0

0 0 0 0 1 0

0 0 0 0 0 1

0 0 −g −c/m 0 0

0 0 0 0 −c/m 0

0 0 0 0 0 0

x+

0 0

0 0

0 0

1/m 0

0 1/m

r/J 0

u (2.30)

2.3. Ejemplo: manipulador robotico

(El siguiente problema ha sido adaptado de Snyder, W.E., Industrial Robots: Computer interfacing and control) En

la Fig. 2.5 se muestra el manipulador robotico θ − r. Un representacion esquematica del robot es presentada en la Fig.

2.7 donde se asume una configuracion de masas concentradas. La masa m1 = 10kg representa la masa del cilindro

exterior y se ubica en el centro de masa del mismo. La constante r1 = 1m designa la distancia fija entre el centro

de masa del cilindro exterior y el centro de rotacion. La masa de la carga es representada por m2 = 3kg y se asume

que esta localizada al final de un piston de un brazo telescopico cuya distancia radial r es medida a partir del centro

2.3 Ejemplo: manipulador robotico 23

de rotacion. El angulo de rotacion del brazo manipulador es θ . Se asume que las entradas al sistema son el torque Tθ

aplicado en el centro de rotacion en la direccion del angulo θ y la fuerza traslacional (radial) Fr aplicada en la direccion

r. Despreciar la masa del cilindro interior. Usar g = 10m/sec2 como aceleracion de la gravedad.

Figura 2.5 Manipulador robotico θ − r Figura 2.6 Representacion esquematica manipulador θ − r

Construiremos las ecuaciones de movimiento del sistema en base a las ecuaciones de Lagrange y luego las repre-

sentaremos en la forma espacio de estados.

2.3.1. Ecuaciones de movimiento usando Lagrange

Energıa cinetica (T ) Primero encontramos la energia cinetica total del sistema. Para esto definimos las posiciones de

la masa m1:x1 = r1cosθ ,

y1 = r1sinθ .

Notese que r1 es una constante y que las posiciones de la masa m1 hacen referencia al movimiento traslacional que

experimenta el centro de masa del cilindro externo (masa concentrada). Diferenciando x1 y y1 con respecto al tiempo

se obtiene:x1 =−r1θsinθ ,

y1 = r1θcosθ .

La magnitud del cuadrado del vector velocidad de la masa m1 es:

v21 = x1

2 + y12 = r2

1θ 2sin2θ + r21θ 2cos2θ = r2

1θ 2.

Entonces, la energia cinetica de la masa m1 es: T1 =12 m1v2

1 =12 m1r2

1θ 2.Ahora derivaremos una expresion para la energia cinetica de la segunda masa. La posicion de la masa m2 es:

x2 = rcosθ ,

y2 = rsinθ .

Notese que r no es una constante y que la posiciones de la masa m2 hacen referencia al movimiento traslacional que

experimenta la masa de carga (masa concentrada). Diferenciando x2 y y2 con respecto al tiempo se obtiene:

x2 = rcosθ − rθsinθ ,

y2 = rsinθ + rθcosθ .

La magnitud del cuadrado del vector velocidad de la masa m2 es:

v22 = x2

2 + y22 = (rcosθ − rθsinθ)2 +(rsinθ + rθcosθ)2 = r2 + r2θ 2.

24 2 Linealizacion

Entonces, la energıa cinetica de la masa m2 es: T2 =12 m2v2

2 =12 m2(r

2 + r2θ 2).Energıa potencial (V ) Ahora encontraremos la energıa potencial del sistema. La energıa potencial de la masa m1 es:

V1 = m1gr1sinθ .

La energıa potencial de la masa m2 es:

V2 = m2grsinθ .

Ecuaciones de movimiento La funcion Lagrangiana (o Lagrangiano) para el sistema es:

L = T −V =1

2m1r2

1θ 2 +1

2m2(r

2 + r2θ 2)−m1gr1sinθ −m2grsinθ .

El manipulador posee dos grados de libertad (r y θ ). Luego, tenemos dos ecuaciones de movimiento para el sistema:

d

dt

(∂L

∂ θ

)

− ∂L

∂θ= Tθ

d

dt

(∂L

∂ r

)

− ∂L

∂ r= Fr

La primera ecuacion de movimiento resulta en:

m1r21θ +m2r2θ +2m2rrθ +gcosθ(m1r1 +m2r) = Tθ .

La segunda ecuacion de movimiento viene a ser:

m2r−m2rθ 2 +m2gsinθ = Fr.

2.3.2. Representacion espacio de estados

Definiendo las siguientes variables:

z1 = θ , z2 = θ , z3 = r, z4 = r.

Luego podemos escribir:

d

dt

z1

z2

z3

z4

︸︷︷︸

dz

dt

=

z2

−2m2z2z3z4−gcosz1(m1r1 +m2z3)+u1

m1r21 +m2z2

3z4

z22z3−gsinz1 +

u2

m2

︸︷︷︸

f (z,u)

, (2.31)

donde u1 = Tθ y u2 = Fr. Asumiendo que la salida esta dada por la posicion de la masa de carga, v1 = x2 = rcosθ y

v2 = y2 = rsinθ se tiene:[

v1

v2

]

︸︷︷︸

v

=

[z3cosz1

z3sinz1

]

︸︷︷︸

h(z,u)

, (2.32)

2.3 Ejemplo: manipulador robotico 25

2.3.3. Linealizacion

Para encontrar el modelo linealizado del manipulador robotico debemos calcular primero los puntos (estados) de

equilibrio.

Puntos de equilibrio para entradas nulas Considerando entradas nulas (u1 = 0 y u2 = 0), el modelo del sistema

resulta en:

dz

dt=

z2

−gcosz1(m1r1 +m2z3)

m1r21 +m2z2

3z4

−gsinz1

, (2.33)

e igualando las derivadas a cero, la ecuacion que debemos resolver es la siguiente:

[0

0

]

=

−gcosz1(m1r1 +m2z3)

m1r21 +m2z2

3−gsinz1

, (2.34)

como no existe un z1 tal que cosz1 = 0 y sinz1 = 0 simultaneamente, esto significa que el modelo no forzado que hemos

considerado para el manipulador robotico no presenta puntos de equilibrio ze; es decir, el sistema dinamico analizado

no presenta condiciones iniciales z(0) que tal que el sistema permanecera en ese punto z(0) indefinidamente (¿coincide

esto con lo que te dice tu intuicion?).

Punto de operacion (entradas constantes) Considerando entradas constantes (u1 = u1e y u2 = u2e) e igualando las

derivadas a cero resulta:

0

0

0

0

=

z2e

−gcosz1e(m1r1 +m2z3e)+u1e

m1r21 +m2z2

3z4e

−gsinz1e +u2e

m2

, (2.35)

Luego, el modelo del sistema sera linealizado alrededor del punto de equilibrio:

ze =[

z1e 0 z3e 0]T

,

donde z1e y z3e satisfacen las siguientes ecuaciones:

cosz1e =u1e

g(m1r1 +m2z3e)

sinz1e =u2e

gm2

.

Calculando los elementos de las matrices Jacobianas del sistema no lineal definido en (2.31) tenemos:

∂ f1

∂ z1= 0

∂ f1

∂ z2= 1

∂ f1

∂ z3= 0

∂ f1

∂ z4= 0

∂ f2

∂ z1=

gsinz1(m1r1 +m2z3)

m1r21 +m2z2

3

∂ f2

∂ z2=−2m2z3z4

m1r21 +m2z2

3

∂ f2

∂ z3=−m2(2z2z4 +gcosz1)(m1r2

1 +m2z23)− (−2m2z2z3z4−gcosz1(m1r1 +m2z3)+u1)(2m2z3)

(m1r21 +m2z2

3)2

∂ f2

∂ z4=−2m2z2z3

m1r21 +m2z2

3∂ f3

∂ z1= 0

∂ f3

∂ z2= 0

∂ f3

∂ z3= 0

∂ f3

∂ z4= 1

∂ f4

∂ z1=−gcosz1

∂ f4∂ z2

= 2z3

∂ f4

∂ z3= z2

2

∂ f4

∂ z4= 0

(2.36)

26 2 Linealizacion

y,∂ f1

∂u1= 0

∂ f1

∂u2= 0

∂ f2

∂u1=

1

m1r21 +m2z2

3

∂ f2

∂u2= 0

∂ f3

∂u1= 0

∂ f3

∂u2= 0

∂ f4

∂u1= 0

∂ f4

∂u2=

1

m2

(2.37)

Adicionalmente, para la matriz de salida (2.32):

∂h1

∂ z1=−z3sinz1

∂h1

∂ z2= 0

∂h1

∂ z3= cosz1

∂h1

∂ z4= 0

∂h2

∂ z1= z3cosz1

∂h2

∂ z2= 0

∂h2

∂ z3= sinz1

∂h2

∂ z4= 0

, (2.38)

y,∂h1

∂u1= 0

∂h1

∂u2= 0

∂h2

∂u1= 0

∂h2

∂u2= 0

, (2.39)

Evaluando las matrices Jacobianas en (ze,ue) tenemos:

∂ f

∂x(ze,ue) =

0 1 0 0ue2(m1r1 +m2z3e)

m2(m1r21 +m2z2

3e)0

−m2u1e

(m1r21 +m2z2

3e)(m1r1 +m2z3e)0

0 0 0 1

− u1e

m1r1 +m2z3e

2z3e 0 0

, (2.40)

∂ f

∂u(ze,ue) =

0 11

m1r21 +m2z2

3e

0

0 0

01

m2

, (2.41)

∂h

∂x(ze,ue) =

−z3ue2

gm20

u1e

g(m1r1 +m2z3e)0

z3e

u1e

g(m1r1 +m2z3e)0

ue2

gm20

, (2.42)

y∂h

∂u(ze,ue) =

[0 0

0 0

]

. (2.43)

Modelo lineal en la forma espacio de estados Usando las matrices Jacobianas arriba mencionadas y definiedo:

∂ f

∂ z(ze,ue) = A y

∂ f

∂u(ze,ue) = B

∂h

∂ z(ze,ue) =C y

∂h

∂u(ze,ue) = D

Luego las matrices correspondientes para la representacion espacio de estados lineal alrededor del punto de operacion

(ze,ue) son:

2.4 Ejemplo: manipulador robotico - incluyendo la dinamica del cuerpo rıgido 27

A =

0 1 0 0ue2(m1r1 +m2z3e)

m2(m1r21 +m2z2

3e)0

−m2u1e

(m1r21 +m2z2

3e)(m1r1 +m2z3e)0

0 0 0 1

− u1e

m1r1 +m2z3e

2z3e 0 0

, B =

0 11

m1r21 +m2z2

3e

0

0 0

01

m2

, (2.44)

y:

C =

−z3ue2

gm20

u1e

g(m1r1 +m2z3e)0

z3e

u1e

g(m1r1 +m2z3e)0

ue2

gm20

, D =

[0 0

0 0

]

, (2.45)

La representacion espacio de estados lineal queda de la siguiente forma:

dz

dt=

0 1 0 0ue2(m1r1 +m2z3e)

m2(m1r21 +m2z2

3e)0

−m2u1e

(m1r21 +m2z2

3e)(m1r1 +m2z3e)0

0 0 0 1

− u1e

m1r1 +m2z3e

2z3e 0 0

z+

0 11

m1r21 +m2z2

3e

0

0 0

01

m2

u (2.46)

v =

−z3ue2

gm20

u1e

g(m1r1 +m2z3e)0

z3e

u1e

g(m1r1 +m2z3e)0

ue2

gm20

z+

[0 00 0

]

u. (2.47)

2.3.4. Ideas adicionales acerca del modelo

Si asumimos que r = cte = r1 y que el objetivo es mantener θ = π/2, entonces el problema del manipulador

robotico se puede interpretar como un pendulo invertido con masa m1+m2. ¿Que pasa cuando θ = π/2 y r = cte > r1,

que sistema tenemos?.

Otra simplificacion del modelo se puede dar cuando se considera θ = 0 y r variable, en ese caso podemos hablar de

traslacion de la masa de carga en la direccion horizontal.

2.4. Ejemplo: manipulador robotico - incluyendo la dinamica del cuerpo rıgido

(El siguiente problema ha sido adaptado de Snyder, W.E., Industrial Robots: Computer interfacing and control) En

la Fig. 2.7 se muestra el manipulador robotico θ − r. Un representacion esquematica del robot es presentada en la Fig.

2.8. La masa mo = 10kg representa la masa del cilindro exterior y se ubica en el centro de masa del cilindro exterior, Io

representa el momento de inercia del cilindro exterior con respecto a su centro de masa. La constante ro2 = 1m designa

la distancia fija entre el centro de masa del cilindro exterior y el centro de rotacion. La masa de la carga es representada

por ml = 3kg y se asume que esta localizada al final de un piston de un brazo telescopico cuya distancia radial r es

media a partir del centro de rotacion. El angulo de rotacion del brazo manipulador es θ . El cilindro interno del brazo

telescopico tiene masa mi = 2kg y momento de inercia igual a Ii. Asuma que las entradas al sistema son el torque Tθ

aplicado en el centro de rotacion en la direccion del angulo θ y la fuerza traslacional (radial) Fr aplicada en la direccion

r. Usar g = 9,8m/sec2 como aceleracion de la gravedad.

Construiremos las ecuaciones de movimiento del sistema en base a las ecuaciones de Lagrange y luego las repre-

sentaremos en la forma espacio de estados.

28 2 Linealizacion

Figura 2.7 Manipulador robotico θ − r

Io , mo , ro

Ii , mi , ro

ml

Figura 2.8 Representacion esquematica manipulador θ − r

2.4.1. Ecuaciones de movimiento usando Lagrange

Energıa cinetica Primero encontramos la energia cinetica total del sistema. La energia cinetica traslacional es obtenida

definiendo las posiciones de los centros de masa de los cilindros externo e interno con masas mo y mi, y la posicion de

la masa de carga ml :

xo =12 rocosθ ,

yo =12 rosinθ .

xi = (r− 12 ro)cosθ ,

yi = (r− 12 ro)sinθ .

xl = rcosθ ,

yl = rsinθ .

Notese que ro es una constante, mientras que r no lo es. Diferenciando x e y con respecto al tiempo se obtiene:

xo =−ro12 θsinθ ,

yo = ro12 θcosθ .

xi =12 rcosθ − 1

2 rθsinθ + 12 roθsinθ ,

yi =12 rsinθ + 1

2 rθcosθ − 12 roθcosθ .

xl = rcosθ − rθsinθ ,

yl = rsinθ + rθcosθ .

La magnitud del cuadrado del vector velocidad de los centros de masa de los cilindros exterior e interior, y de la

masa de la carga es:

v2o = xo

2 + yo2 =

r2o

4θ 2sin2θ +

r2o

4θ 2cos2θ = r2

o

1

4θ 2.

v2i = x2

i + y2i =

1

4(rcosθ +(ro− r)θsinθ)2 +

1

4(rsinθ − (ro− r)θcosθ)2 =

1

4r2 +

1

4(ro− r)2θ 2.

v2l = xl

2 + yl2 = (rcosθ − rθsinθ)2 +(rsinθ + rθcosθ)2 = r2 + r2θ 2.

Entonces, la energia cinetica traslacional de los cilindros y masa de carga respectivamente es:

Tto =1

2mov2

o =1

2

1

4mo(r

2oθ 2).

Tti =1

2miv

2i =

1

2

1

4mi(r

2 +(ro− r)2θ 2).

2.4 Ejemplo: manipulador robotico - incluyendo la dinamica del cuerpo rıgido 29

Ttl =1

2mlv

2l =

1

2ml(r

2 + r2θ 2).

Considerando que los cilindros son cuerpos rıgidos, debemos adicionar su energıa cinetica rotacional a la energia

cinetica total del sistema. Este no es el caso para la masa de carga, que es considerada como una masa concentrada

(partıcula). La energia cinetica rotacional de los cilindros se obtiene usando:

Tro =1

2Ioω2

Tri =1

2Iiω

2

Asumiendo que el cilindro interno es una varilla, su momento de inercia con respecto al centro de gravedad es Ii =1

12 mir2. Para el caso del cilindro externo hueco se puede considerar que Io =

112 mo(3t2 + r2

o), donde t depende de los

radios internos y externos del cilindro hueco. Sabiendo que ω = θ , se obtiene:

Tro =1

2

1

12mo(3t2 + r2

o)θ2

Tri =1

2

1

12mir

2oθ 2

Sumando las energıas cineticas resulta:

T = Tt +Tr

T =1

2

(1

4mo(r

2oθ 2)+

1

4mi(r

2 +(ro− r)2θ 2)+ml(r2 + r2θ 2)+

1

12mir

2oθ 2 +

1

12mo(3t2 + r2

o)θ2

)

T =1

2

(

mo(1

3r2

oθ 2 +1

4t2)+mi(

1

4r2 +

1

3r2θ 2 +

1

4r2

oθ 2− 1

2rorθ 2)+ml(r

2 + r2θ 2).

)

Energıa potencial Ahora encontraremos la energıa potencial del sistema. La energıa potencial de los centros de masa

de los cilindros (mo y mi) y la masa de carga ml :

Vo =1

2mogrosinθ .

Vi =1

2mig(r−

1

2ro)sinθ .

Vl = mlgrsinθ .

Luego la energia potencial total es:

V =

(1

2(moro +mi(r−

1

2ro))+ml

)

gsinθ .

Ecuaciones de movimiento La funcion Lagrangiana (o Lagrangiano) para el sistema es:

L = T −V = 12

(mo(

13 r2

oθ 2 + 14 t2)+mi(

14 r2 + 1

3 r2θ 2 + 14 r2

oθ 2− 12 rorθ 2)+ml(r

2 + r2θ 2))

−(

12 (moro +mi(r− 1

2 ro))+mlr)

gsinθ .

El manipulador posee dos grados de libertad (r y θ ). Luego, tenemos dos ecuaciones de movimiento para el sistema:

d

dt

(∂L

∂ θ

)

− ∂L

∂θ= Tθ

d

dt

(∂L

∂ r

)

− ∂L

∂ r= Fr

La primera ecuacion de movimiento resulta en:

30 2 Linealizacion

13 mor2

oθ + 13 mir

2θ + 14 mir

2oθ − 1

2 mirroθ − 12 mirorθ + 2

3 mirrθ +mlr2θ +2mlrrθ

+gcosθ(

12 (moro +mi(r− 1

2 ro))+mlr)= Tθ .

La segunda ecuacion de movimiento viene a ser:

1

4mir+ml r−

1

3mirθ 2 +

1

4miroθ 2−mlrθ 2 +(

1

2mi +ml)gsinθ = Fr.

2.4.2. Representacion espacio de estados

Definiendo las siguientes variables:

z1 = θ , z2 = θ , z3 = r, z4 = r,

se puede escribir:

d

dt

z1

z2

z3

z4

︸︷︷︸

dz

dt

=

z2

− 23 miz2z3z4−2mlz2z3z4 +

12 miroz2z4−gcosz1(

12 moro +

12 mi(z3− ro

2 )+mlz3)+u1

13 mor2

o +13 miz

23 +

14 mir2

o− 12 miz3ro +mlz

23

z413 miz

22z3 +mlz

22z3− ( 1

2 mi +ml)gsinz1 +u2

ml +14 mi

︸︷︷︸

f (z,u)

, (2.48)

donde u1 = Tθ y u2 = Fr. Asumiendo que la salida esta dada por la posicion de la masa de carga, v1 = xl = rcosθ y

v2 = yl = rsinθ se tiene:[

v1

v2

]

︸︷︷︸

v

=

[z3sinz1

z3cosz1

]

︸︷︷︸

h(z,u)

, (2.49)

Fuente: Capıtulos 1 del libro Systems and Control de Stanislaw H. Zak (2002).



Fuente: Capıtulos 1 del libro Systems and Control de Stanislaw H. Zak (2002).



Capıtulo 3

Sistemas Lineales

En esta parte del curso nos centraremos en el caso de sistemas lineales invariantes en el tiempo y analizaremos el

efecto de las condiciones iniciales y las entradas en las salidas. Los conceptos centrales de matriz exponencial y la

ecuacion convolucion nos permitiran caracterizar completamente el sistema.

Durante las clases anteriores hemos visto varios ejemplos donde los sistemas son modelados usando ecuaciones

diferenciales lineales. En general, varios sistemas dinamicos pueden ser modelados de forma precisa usando ecuaciones

diferenciales lineales. Ası, sistemas mecanicos y circuitos electricos son ejemplos donde los modelos lineales pueden

ser usados efectivamente. En muchos casos, nosotros creamos sistemas con una respuesta de entrada/salida lineal.

Por ejemplo, casi todos los sistemas modernos de procesamiento de senales, ya sean analogicos o digitales, usan

realimentacion para producir caracterısticas de entrada/salida lineales o casi-lineales. Para estos sistemas, a menudo

es util representar las caracterısticas de entrada/salida como lineales, ignorando los detalles internos requeridos para

obtener la respuesta lineal. Para otros sistemas, sin embargo, las no linealidades no pueden ser ignoradas, especialmente

si uno se importa en el comportamiento global del sistema. Sin embargo, si solo nos importa lo que pasa cerca del punto

de equilibrio, es suficiente aproximar la dinamica no lineal por su linealizacion local.

3.1. Definiciones basicas

3.1.1. Linealidad

Considerando el sistema en la forma espacio de estados y su correspondiente ecuacion de salida:

dx

dt= f (x,u), y = h(x,u), (3.1)

donde x ∈ Rn, u ∈ R

p y y ∈ Rq. Sean (xe,ue) 6= 0 las condiciones de operacion, y definiendo:

x = x− xe, u = u−ue, y = y− ye. (3.2)

podemos reescribir las ecuaciones de movimiento usando como punto de equilibrio del sistema al origen x = 0 y u = 0.

Luego tenemos:d

dtx = f (xe + x,ue + u) = f (x, u),

y = h(xe + x,ue + u)− ye = h(x, u).(3.3)

En el nuevo conjunto de variables, el origen es un punto de equilibrio con salida cero. Una vez realizado el analisis

en este nuevo conjunto de variables, las respuestas obtenidas seran trasladadas de vuelta a las coordinadas iniciales

usando x = xe + x, u = ue + u y y = ye + y.

Para el sistema (3.1), asumiendo, sin perdida de generalidad, que el origen es el punto de equilibrio de interes,

escribiremos la salida y(t) correspondiente a la condicion inicial x(0) = xo y entrada u(t) como y(t;xo,u). Usando esta

notacion, un sistema de entrada/salida es lineal si las siguientes condiciones son satisfechas:

31

32 3 Sistemas Lineales

i) y(t;αx1 +βx2,0) = αy(t;x1,0)+βy(t;x2,0)ii) y(t;αxo,δu) = αy(t;xo,0)+δy(t;0,u)iii) y(t;0,δu1 + γu2) = δy(t;0,u1)+ γy(t;0,u2).

(3.4)

Luego definimos que un sistema es lineal si las salidas son conjuntamente lineales en la respuesta a las condiciones

iniciales (u = 0) y la respuesta forzada (x(0) = 0). La propiedad iii) esta relacionada al principio de superposicion: la

respuesta de un sistema lineal a la suma de dos entradas u1 y u2 es la suma de las salidas y1 y y2 correspondientes a

cada entrada.

La forma general del sistema lineal en la forma de espacio de estados, con correspondiente ecuacion de salida, es:

dx

dt= Ax+Bu, x(0) = xo

y =Cx+Du,(3.5)

donde A∈Rn×n, B∈Rn×p, C ∈Rq×n y D∈Rq×p. La ecuacion (3.5) es un sistema de ecuaciones diferenciales lineales

de primer orden con entrada u, estado x y salida y. Es facil mostrar que dos soluciones dadas x1(t) y x2(t) para este

sistema de ecuaciones, satisfacen las condiciones de linealidad.

Definiendo xh(t) como la solucion con entrada cero (solucion homogenea) y la solucion xp(t) como la solucion con

condiciones iniciales igual a cero (solucion particular). La Fig. 3.1 ilustra como dos soluciones individuales se pueden

superponer para formar la solucion completa.

0 20 40 60−2

0

2

Homogeneous

Input u

0 20 40 60−2

0

2

0 20 40 60−2

0

2Output y

0 20 40 60−2

0

2

Particular

0 20 40 60−2

0

2

0 20 40 60−2

0

2

0 20 40 60−2

0

2

Complete

Time t [sec]0 20 40 60

−2

0

2

Time t [sec]0 20 40 60

−2

0

2

Time t [sec]

State x1, x2

Figura 3.1 Superposicion de soluciones particulares y homogeneas.

Respuesta total = respuesta a entrada cero + respuesta a condiciones iniciales cero

3.1.2. Invariancia en el tiempo

Invariancia en el tiempo es un concepto importante que se usa para describir un sistema cuyas propiedades no

cambian en el tiempo. Mas precisamente, para un sistema invariante en el tiempo, si la entrada u(t) resulta en y(t), luego

moviendo el tiempo en el que se aplica la entrada por una constante a, u(t+a), la salida resulta en y(t+a). Los sistemas

que son lineales e invariantes en el tiempo a menudo se denominan sistemas LTI (linear time invariant, por sus siglas

en ingles) y poseen una propiedad interesante: su respuesta a una entrada arbitraria esta completamente caracterizada

por sus respuesta a entradas del tipo escalon o sus respuestas a impulsos cortos. Ver mas detalle a continuacion.

3.2 Respuesta a la condicion inicial 33

Descripcion entrada-salida, sistema LTI

Suponiendo que el sistema se encuentra inicialmente en el punto de equilibrio (respuesta a las condiciones iniciales

es cero), la respuesta a una entrada se puede obtener al superponer las respuestas a una combinacion de entradas tipo

escalon. Un ejemplo de este calculo esta dado en la Fig. ??. La Fig. ??(a) muestra una entrada u(t) lineal por partes

(suma de funciones escalon). Sea H(t) la respuesta a un escalon unitario aplicado en el tiempo 0. La respuesta al primer

escalon es entonces H(t − to)u(to), la respuesta al segundo escalon es H(t − t1)(u(t1)− u(to)), y ası sucesivamente.

Luego, podemos encontrar la respuesta completa del sistema siendo dada por:

y(t) = H(t− to)u(to)+H(t− t1)(u(t1)−u(to))+ ...= (H(t− to)−H(t− t1))u(to)+(H(t− t1)−H(t− t2))u(t1)+ ...

=∞

∑n=0

(H(t− tn)−H(t− tn+1))u(tn)

=∞

∑n=0

(H(t− tn)−H(t− tn+1))

tn+1− tnu(tn)(tn+1− tn),

(3.6)

como mostrado en la Fig. ??(b). La respuesta a una senal contınua se obtiene tomando el lımite cuando tn+1− tn→ 0,

que resulta en:

y(t) =∫ ∞

0H ′(t− τ)u(τ)dτ , (3.7)

donde H ′ es la derivada de la respuesta al escalon, tambien llamada respuesta impulsiva h. Luego, la respuesta de

un sistema LTI a cualquier entrada puede ser calculada a partir de la respuesta al escalon. Notese que la salida solo

depende de la entrada pues consideramos que el sistema esta en reposo al inicio,x(0) = 0).

Siendo el sistema causal (sistema donde la salida depende de las entradas pasadas o actuales pero no de entradas

futuras), se tiene que la salida para todo sistema LTI causal en reposo al inicio esta descrita por:

y(t) =∫ t

0h(t− τ)u(τ)dτ =

∫ t

0h(τ)u(t− τ)dτ , (3.8)

La segunda igualdad puede ser facilmente verificada haciendo un cambio de variable (t− τ = σ ). La integracion en

(3.8) es llamada una integracion convolucion.

0 2 4 6 80

0.2

0.4

0.6

0.8

1

Time (sec)

Input

(u)

u(t0)

u(t1)

u(t1)−u(t0)

0 5 10 15

−0.5

0

0.5

1

Time (sec)

Outp

ut

(y)

Complete

Steps

Figura 3.2 (a) Respuesta a entradas contınuas por partes y (b) salida resultante de la suma de entradas individuales.

3.2. Respuesta a la condicion inicial

La ecuacion (3.7) muestra que la salida de un sistema lineal se puede expresar como un integral sobre todas las

entradas u(t). En esta seccion derivaremos una formula mas general, que incluye las condiciones iniciales diferentes

de cero.

En esta seccion calcularemos la solucion de un sistema de la forma:


dx

dt= Ax, x(0) = xo. (3.9)

Para la ecuacion diferencial escalar se tiene:

dx

dt= ax, x ∈ R,a ∈ R (3.10)

y la solucion esta dada por:

x(t) = eatx(0). (3.11)

Generalizando para cuando A se convierte en una matriz. Definimos el exponencial de matrices como una serie infinita:

eX = I +X +1

2X2 +

1

3!X3 + ...=

∞

∑k=0

1

k!Xk, (3.12)

donde X ∈ Rn×n es una matriz cuadrada y I es la matriz identidad n×n.

Reemplazando X en (3.9) por At, donde t ∈ R, tenemos que:

eAt = I +At +1

2A2t2 +

1

3!A3t3 + ...=

∞

∑k=0

1

k!Aktk, (3.13)

luego diferenciando la expresion en (3.13) con respecto al tiempo resulta en:

d

dteAt = A+A2t +

1

2A3t2 + ...= A

∞

∑k=0

1

k!Aktk = AeAt . (3.14)

Multiplicando por x(0) por la derecha, encontramos que x(t) = eAtx(0) es la solucion a la ecuacion diferencial (9.8)

con condiciones iniciales x(0). La matriz Φ(t) = eAt es denominada matriz de transicion.

Tomando la transformada de Laplace en (3.14), sabiendo que L [dh(t)/dt] = sL [h(t)]−h(0), tenemos:

sL (eAt)− e0 = AL (eAt)

(sI−A)L (eAt) = I.

Entonces, si A no tiene autovalores en el eje imaginario, obtenemos:

L (eAt) = (sI−A)−1. (3.15)

3.2.1. Ejemplo: Integrador doble

Un sistema lineal muy simple que puede ser usado para enteubnder conceptos basicos es la ecuacion diferencial de

segunda orden dada por:

q = u, y = q.

El sistema es llamado de integrador doble porque su entrada u es integrada dos veces para determinar la salida y. En la

forma espacio de estados, escribimos x =[

q q]T

y:

dx

dt=

[0 1

0 0

]

x+

[0

1

]

u.

La matriz dinamica de un integrador doble es:

A =

[0 1

0 0

]

,

y por calculo directo encontramos que A2 = 0 y entonces:

3.3 Respuesta entrada/salida 35

Φ(t) = eAt =

[1 t

0 1

]

.

Entonces, la solucion homogenea (u = 0) para un integrador doble es dada por:

x(t) =

[1 t

0 1

][x1(0)x2(0)

]

=

[x1(0)+ tx2(0)

x2(0)

]

.

3.2.2. Ejemplo: Oscilador sin amortiguamiento

Un modelo simple de oscilador, tal como el sistema masa-resorte sin amortiguamiento es:

q+ω2o q = u.

Poniendo el sistema en la forma de espacio de estados, la matriz dinamica del sistema puede ser escrita como:

A =

[0 ωo

−ωo 0

]

y eAt =

[cosωot sinωot

−sinωot cosωot

]

.

Esta expresion para Φ(t) = eAt se puede verificar por diferenciacion:

d

dteAt =

[−ωosinωot ωocosωot

−ωocosωot −ωosinωot

]

,

=

[0 ωo

−ωo 0

][cosωot sinωot

−sinωot cosωot

]

= AeAt .

Luego la solucion esta dada por:

x(t) = eAtx(0) =

[cosωot sinωot

−sinωot cosωot

][x1(0)x2(0)

]

.

Si el sistema tiene amortiguamiento:

q+2ζ ωoq+ω2o q = u,

la solucion es mas complicada, pero se puede mostrar que la matriz exponencial es de la forma:

e−ωoζ t

ζ eiωd t −ζ e−iωdt

2√

ζ 2−1+

eiωd t + e−iωdt

2

eiωd t − e−iωdt

2√

ζ 2−1e−iωd t − eiωd t

2√

ζ 2−1

ζ e−iωd t −ζ eiωd t

2√

ζ 2−1+

eiωd t + e−iωdt

2

,

donde ωd = ωo

√

ζ 2−1. Notese que ωd y√

ζ 2−1 pueden ser real o complejo, pero la combinacion de terminos

siempre proveera un valor real para los elementos del exponencial de la matriz.

3.3. Respuesta entrada/salida

En esta seccion derivaremos la ecuacion convolucion, que incluye entradas y salidas.


3.3.1. Ecuacion de convolucion

Volviendo al sistema general de entrada/salida en la ecuacion (3.5). Usando la matriz exponencial , la solucion de la

ecuacion (3.5) se puede escribir como:

Teorema 1 La solucion de la ecuacion diferencial lineal:

dx


y =Cx+Du.(3.16)

esta dada por:

x(t) = eAtx(0)+∫ t

0eA(t−τ)Bu(τ)dτ (3.17)

⋄Demostracion: Diferenciando ambos lados en (3.17) y usando la propiedad (3.13) de la matriz exponencial. Luego,

por sustitucion directa1, tenemos:

dx

dt= AeAtx(0)+

∫ t

0AeA(t−τ)Bu(τ)dτ +Bu(t) = Ax+Bu, (3.18)

que prueba el resultado. ⋄De las ecuaciones en (3.16) y (3.17) la relacion entrada/salida para un sistema lineal esta dado por:

y(t) =CeAtx(0)+∫ t

0CeA(t−τ)Bu(τ)dτ +Du(t). (3.19)

La ecuacion (3.19) se denomina ecuacion de convolucion y representa la forma general de solucion de un sistema

de ecuaciones diferenciales lineales acopladas. Esta ecuacion y la ecuacion (14) han sido directamente calculadas en el

dominio del tiempo. Tambien podemos calcular las soluciones en el dominio de la frecuencia usando la transformada

de Laplace. Aplicando la transformada de Laplace a la ecuacion (3.18) resulta:

X(s) = (sI−A)−1[x(0)+BU(s)]

Y (s) =C(sI−A)−1x(0)+ [C(sI−A)−1B+D]U(s)(3.20)

Respuesta impulsiva

La respuesta impulsiva de un sistema vendrıa a ser la salida correspondiente a tener un impulso como entrada en

(3.19):

y(t) =∫ t

0CeA(t−τ)Bδ (τ)dτ +Dδ (t) =CeAtB+Dδ (t), (3.21)

donde la segunda igualdad sigue del hecho que δ (t) es cero en cualquier lugar excepto el origen y su integral es

identicamente igual a 1. Notese que existe una limitacion en el calculo de la respuesta impulsiva cuando D 6= 0 ya que

Dδ (t) se hace infinito en t = 0. En la practica, se ignora la matriz D y la respuesta impulsiva viene dada por:

y(t) = h(t) =

∫ t

0CeA(t−τ)Bδ (τ)dτ =CeAtB. (3.22)

Escribiendo la ecuacion de convolucion en terminos de la respuesta a las condiciones iniciales y la integral convolucion

(3.8) de la respuesta impulsiva h(t) y la senal de entrada u(t), se tiene:


0h(t− τ)u(τ)dτ , (3.23)

1 ∂∂ t

∫ tto

f (t,τ)dτ = f (t,τ)|τ=t +∫ t

to∂∂ t

f (t,τ)dτ .

3.3 Respuesta entrada/salida 37

ası la respuesta de un sistema lineal es la superposisicion de la respuesta a un conjunto infinito de impulsos cuyas

magnitudes estan dadas por la entrada u(t).El uso de pulsos como aproximaciones de la funcion impulso se puede visualizar en la Fig. 3.3.

0 2 4 6 8 100

0.5

1

1.5

u

Time t

(a) Pulse and impulse functions

0 10 20 30 400

0.5

1

t

y

Pulse responses

Impulse response

(b) Pulse and impulse responses

Figura 3.3 Respuesta de un sistema a entradas del tipo impulso representado como la suma de diferentes anchos de pulso. (a) Funcionespulso e impulso. b) Respuestas a los pulsos e impulso.

3.3.2. Respuesta en estado estacionario

Dada el sistema lineal de entrada/salida:

dx


y =Cx+Du.

la forma general de su solucion esta dada por (3.19), reescrita aqui por conveniencia:


0CeA(t−τ)Bu(τ)dτ +Du(t),

que muestra que la respuesta total del sistema consta de la respuesta a las condiciones iniciales y la respuesta a la

entrada. La respuesta a la entrada esta compuesta por los dos ultimos terminos de (3.19)- esta respuesta a su vez tiene

dos componentes - la respuesta transiente y la respuesta en estado estacionario, ver Fig 3.4. La respuesta transiente

ocurre en el primer periodo de tiempo despues de que la entrada ha sido aplicada y refleja la diferencia entre las

condiciones iniciales y la solucion en estado estacionario. La respuesta en estado estacionario es la porcion de la

respuesta en la salida que refleja el comportamiento del sistema a largo plazo bajo la accion de ciertas entradas. Para

entradas periodicas la respuesta en estado estacionario tambien sera periodica, y para entradas constantes la respuesta

sera a menudo constante.

0 20 40 60 80−1

0

1

Time t [sec]

Inputu

(a) Input

0 20 40 60 80−0.1

0

0.1

Transient Steady State

Time t [sec]

Outputy

(b) Output

Figura 3.4 Respuesta transiente versus respuesta en estado estacionario.


Respuesta al escalon unitario

La funcion escalon unitario esta definida como:

u = S(t) =

0 t = 0,1 t > 0,

y representa un cambio abrupto de un valor a otro valor.

La respuesta a un escalon unitario del sistema (3.5) esta definido como la salida y(t) comenzando de las condiciones

iniciales cero (o el punto de equilibrio apropiado) y dada una entrada del tipo escalon. Calculando la respuesta a un

escalon unitario de un sistema lineal usando la ecuacion convolucion, para x(0) = 0, tenemos:

y(t) =∫ t

0CeA(t−τ)Bu(τ)dτ +Du(t) =C

∫ t

0eA(t−τ)Bdτ +D

=C

∫ t

0eAσ Bdσ +D = C(A−1eAσ B)

∣∣σ=t

σ=0+D

=CA−1eAtB−CA−1B+D.

(3.24)

Luego, reescribiendo la solucion tenemos:

y(t) =CA−1eAtB︸︷︷︸

transiente

+ D−CA−1B︸︷︷︸

estado estacionario

. (3.25)

El primer termino es la respuesta transiente que decae a cero a medida que t→ ∞. El segundo termino es la respuesta

al estado estacionario y representa el valor de la salida para despues de transcurrido un tiempo grande.

Respuesta a una entrada senoidal. Respuesta en la frecuencia

Una senal de entrada comun es del tipo senoidal (o combinacion de senos). La respuesta en la frecuencia de un

sistema de entrada/salida mide la forma en la que el sistema responde a una excitacion senoidal. Dado que la solucion

asociada a una excitacion senoidal es a su vez un senoide a la misma frecuencia, luego nos limitamos a comparar la

magnitud y la fase de la salida senoidal.

Evaluando al ecuacion convolucion (3.19) para u = cosωt. En particular notando que:

cosωt =1

2(eiωt + e−iωt).

Dado que el sistema es lineal, es suficiente calcular la respuesta del sistema a una entrada compleja de la forma

u(t) = est y luego podemos reconstruir la salida a un senoide mediante el promedio de las respuestas correspondiente

a s = iωt y s =−iωt.

Aplicando la ecuacion convolucion a la entrada u = est tenemos:


0CeA(t−τ)Besτ dτ +Dest

=CeAtx(0)+CeAt

∫ t

0Ce(sI−A)τ Bdτ +Dest

(3.26)

Asumiendo que ninguno de los autovectores de A es igual a s = ±iω , luego la matriz sI−A es invertible y podemos

escribir:

y(t) =CeAtx(0)+ CeAt(

(sI−A)−1e(sI−A)τ B)∣∣∣

t

0+Dest

=CeAtx(0)+CeAt(sI−A)−1(

e(sI−A)t − I)

B+Dest

=CeAtx(0)+C(sI−A)−1estB−CeAt(sI−A)−1B+Dest ,

(3.27)

y obtenemos:

3.4 Polos, ceros y ganancia 39

y(t) =CeAt(x(0)− (sI−A)−1B

)

︸︷︷︸

transiente

+(C(sI−A)−1B+D

)est

︸︷︷︸

estado estacionario

, (3.28)

Nuevamente tenemos una solucion que consiste de un componente transiente y uno estado estacionario. El componente

transiente decae a cero si el sistema es asintoticamente estable y el componente estado estacionario es proporcional a

la entrada (compleja) u = est .

La respuesta en estado estacionario se puede reescribir como:

yss(t) = Meiθ est = Mest+iθ ,

donde:

Meiθ =C(sI−A)−1B+D, (3.29)

con M y θ representando la magnitud y la fase de un numero complejo C(sI − A)−1B + D. El numero complejo

C(sI−A)−1B+D se denomina funcion de transferencia. Cuandon s = iω , decimos que M es la ganancia y θ es la

fase del sistema para cierta frecuencia de excitacion ω . Usando linealidad y combinando las soluciones de s =+iω y

s =−iω , podemos mostrar que si tenemos una entrada u = Ausin(ωt +ψ) y una salida y = Aysin(ωt +ϕ), entonces:

ganancia(ω) =Ay

Au

= M, fase(ω) = ϕ−ψ = θ .

La solucion en estado estacionario para un senoide u = cosωt esta dada por:

yss(t) = Mcos(ωt +θ),

como presentado en la Fig. 3.5. Si la fase θ es positiva se dice la salida esta adelantada a la entrada, de otra forma

decimos que la salida esta atrasada a la entrada.

0 5 10 15 20−2

−1

0

1

2

Time [sec]

Input, output

∆T

T

Input Output

Au

Ay

(a) Input/output response

10−3

10−1

101

Gain

0.5 5−270

−180

−90

0

Phase [deg]

Frequency [rad/s]

(b) Frequency response

Figura 3.5 Respuesta de un sistema lineal a un senoide. a) Respuesta entrada/salida. b) Respuesta en frecuencia.

Una propiedad de la respuesta en frecuencia es que la ganancia del sistema cuando ω = 0 se denomina ganancia en

la frecuencia cero y corresponde a la relacion entre una entrada constante y la salida estacionaria:

Mo =−CA−1B+D.

En Ingenierıa Electrica la ganancia de frecuencia cero es denominada DC gain.

3.4. Polos, ceros y ganancia

La funcion de transferencia G(s) = C(sI−A)−1B+D tiene interpretaciones muy utiles y sus caracterısticas son a

menudo asociadas a propiedades importantes del sistema. Tres de las caracterısticas mas importantes son la ganancia

y la ubicacion de polos y ceros.


La ganancia en la frecuencia cero (o ganancia DC) esta dada por la magnitud de la funcion de transferencia en s= 0.

Representa la relacion del estado estacionario a la salida del sistema con respecto a una entrada del tipo escalon (que

puede ser representado por u = est con s = 0). Para una representacion de espacio de estados, calculamos la ganancia

en la frecuencia cero usando la siguiente ecuacion:

G(0) =−CA−1B+D. (3.30)

Para un sistema escrito como una ecuacion diferencial lineal:

dny

dtn+a1

dn−1y

dtn−1+ ...+any = bo

dmu

dtm+b1

dm−1u

dtm−1+ ...+bmu,

si asumimos que la entrada y la salida del sistema (en estado estacionario) son constantes yo y uo, luego encontramos

que anyo = bmuo. Luego la ganancia en la frecuencia cero es:

G(0) =yo

uo

=bm

an

. (3.31)

Considerando el sistema lineal con la siguiente funcion de transferencia racional:

G(s) =b(s)

a(s). (3.32)

las raices del polinomio a(s) son llamados polos del sistema, y las raices del polinomio b(s) son llamados los ceros del

sistema. Si los polos del sistema pertenecen al semiplano complejo izquierdo abierto (Co−) se dice que la funcion de

transferencia es estable. Si los ceros del sistema pertenecen al semiplano complejo izquierdo abierto (Co−) se dice que

el sistema es de fase mınima, en caso contrario los ceros son de fase no mınima2.

Para un sistema espacio de estados con funcion de transferencia G(s) =C(sI−A)−1B+D, los polos de la funcion

de transferencia son los autovalores de la matriz dinamica A (sistema con realizacion mınima). Una forma de ver esto

es notando que el valor de G(s) tiende a infinito cuando s es un autovalor de la matriz dinamica del sistema puesto que

s es precisamente el conjunto de puntos donde el polinomio caracterıstico λ (s) = det(sI−A) = 0 (y luego (sI−A) no

es invertible). Se puede destacar que los polos del sistema en la forma de espacio de estados solo depende de la matriz

A, que representa la dinamica intrınseca del sistema. Decimos que una funcion de transferencia es estable si todos sus

polos tienen parte real negativa.

Para encontrar los ceros de un sistema en la forma de espacio de estados, observamos que los ceros son numeros

complejos s tal que la entrada u(t) = uoest resulta en salida igual a cero. Insertando una respuesta puramente exponen-

cial x(t) = xoest y y(t) = 0 en:

x = Ax+Bu, y =Cx+Du,

resulta:

sestxo = Axoest +Buoest , 0 =Cestxo +Destuo

que puede ser escrito como:[−sI +A B

C D

][xo

uo

]

= 0. (3.33)

Esta ecuacion tiene una solucion con xo 6= 0, uo 6= 0 solo si la matriz a la izquierda no tiene rango completo. Los ceros

del sistema (llamados tambien ceros de transmision, en caso de una realizacion mınima) son entonces aquellos valores

de s tal que la matriz.[−sI +A B

C D

]

, (3.34)

pierde rango o det

([−sI +A B

C D

])

=0.

Siendo que los ceros dependen de A, B, C y D, ellos dependen de como las entradas y salidas son acopladas con los

estados. Notese que en particular si la matriz B tiene rango completo, luego la matriz en (3.34) tiene n filas linealmente

2 Por ejemplo, el sistema g(s) = −s+as+a

con cero en el semiplano derecho en s = a tiene una ganancia constante de 1, pero su fase es−2arctan(ω/a) rad y no 0 rad como serıa para el sistema de fase mınima g(s) = 1 con ganancia similar.

3.5 Otros 41

independientes para todos los valores de s. Similarmente hay n columnas linealmente independientes si la matriz C

tiene rango completo. Eso significa que los sistemas donde B y C son de rango completo no tienen ceros. En particular

esto significa que un sistema no tiene ceros si es totalmente posible actuar en el (cada estado puede ser controlado

independientemente) o si todos los estados son medidos. Para cuando consideramos sistemas sin igual numero de

entradas y salidas, el calculo de los ceros usando (3.34) se hace inadecuado. Para este caso se trabaja directamente con

la matriz de funciones de transferencia, como descrito a continuacion.

POR COMPLETAR

3.5. Otros

Ancho de banda El concepto de ancho de banda es importante en el entendimiento de los beneficios y desventajas al

aplicar control por realimentacion. El ancho de banda esta relacionado a la velocidad de respuesta. En general, un ancho

de banda grande corresponde a un tiempo de levantamiento pequeno, esto debido a que las senales de alta frecuencia

son pasadas mas facilmente hacia las salidas. Un ancho de banda grande tambien indica que el sistema es mas sensible

al ruido y a las perturbaciones parametricas. Por otro lado, si el ancho de banda es pequeno, el tiempo de respuesta

sera por lo general grande, y el sistema usualmente sera mas robusto.

POR COMPLETAR


y Richard M. Murray (2008).

Fuente: Capıtulo 4 del libro Multivariable Feedback Control de S. Skogestad y I. Postlethwaite (2006).

Capıtulo 4

Formas canonicas

En esta parte discutiremos tres tipos de modelos de sistemas dinamicos lineales que presentan formas especiales de

sus correspondientes (A, B y C). Estas formas se obtienen mediante un cambio de variable, el cual finalmente revela

ciertas propiedades estructurales del modelo. Estas formas seran de utilidad en las siguientes secciones cuando se

construyan algoritmos para la ubicacion de polos. Los algoritmos de ubicacion de polos seran usados para disenar

controladores por realimentacion de estados, asi como estimadores de estado.

4.1. Definiciones

4.1.1. Invariancia de coordenadas

La forma general del sistema lineal en su representacion espacio de estados, con correspondiente ecuacion de salida,

es:dx

dt= Ax+Bu, y =Cx+Du, (4.1)

donde A∈Rn×n, B∈Rn×m, C ∈Rp×n y D∈Rp×m. Los componentes del vector de entrada u y el vector de salida y son

dados por las entradas y salidas de un modelo, mientras que las variables de estado dependen del sistema coordenado

usado para representar los estados. La eleccion de coordenadas afecta los valores de las matrices A, B y C (D no

esta afecta dado que mapea entradas a salidas). A continuacion investigaremos las consecuencias de cambiar el sistema

coordenado.

Si elegimos el conjunto de coordenadas z = T x, donde T es una matriz invertible. De (4.1) se tiene:

dz

dt= T

dx

dt= T (Ax+Bu) = TAx+T Bu = TAT−1z+T Bu = Az+ Bu,

y =Cx+Du =CT−1z+Du = Cz+Du.(4.2)

El sistema transformado tiene la misma forma que (4.1) pero con matrices A, B y C diferentes:

A = TAT−1, B = T B, C =CT−1 (4.3)

Existen sistemas de coordenadas que permiten visualizar una propiedad particular del sistema, luego las transfor-

macions de coordenadas se pueden usar para ganar nuevo entendimiento de la dinamica del sistema.

Es posible comparar las soluciones del sistema en las coordenadas transformadas y en las coordenadas originales

usando la siguiente propiedad del mapeamiento exponencial:

eT ST−1= TeST−1. (4.4)

Esta propiedad se puede verificar usando la definicion de exponencial de matrices. Ası se puede mostrar que:

43

44 4 Formas canonicas

m m

k k

u(t) = sin tωk

c c

q1 q2

Figura 4.1 Sistema masa resorte acoplado.

x(t) = T−1z = T−1eAtT x(0)+T−1∫ t

0eA(t−τ)Bu(τ)dτ . (4.5)

El transformar A a A es factible, siendo que el exponencial de matrice con A puede ser mas facil de calcular.

Ejemplo: Sistema masa-resorte acoplado

Considere el sistema mostrado en la Fig. ??. La entrada al sistema es del tipo senoidal y es aplicada en el resorte

que se ubica en el extremo derecho, y la salida es la posicion de cada masa, q1 y q2. Las ecuaciones de movimiento

estan dadas por:

m1q1 =−2kq1− cq1 + kq2, m2q2 = kq1− cq2−2kq2 +Ku

En la forma espacio de estados, definiendo el estado x = (q1,q2, q1, q2), se puede escribir la ecuacion como:

dx

dt=

0 0 1 0

0 0 0 1

− 2km

km− c

m0

km− 2k

m0 − c

m

x+

0

0

0km

u.

Este es un sistema acoplado de 4 ecuaciones diferenciales y es bastante complicado resolverlo en la forma analıtica.

Usando la transformacion z = T x pondremos al sistema en una forma mas simple. Sea z1 = 12 (q1 + q2), z2 = z1,

z3 =12 (q1−q2) y z4 = z3, tal que:

z = T x =1

2

1 1 0 0

0 0 1 1

1 −1 0 0

0 0 1 −1

x.

Y en el nuevo sistema coordenado, la dinamica es:

dz

dt=

0 1 0 0

− km− c

m0 0

0 0 0 1

0 0 − 3km− c

m

z+

0k

2m

0

− k2m

u.

Notese que la matriz resultante es diagonal por bloques y, como consecuencia, desacoplada. Luego las soluciones

pueden ser calculadas mediante solucion de dos sistemas de segunda orden representados por los estados (z1,z2) y

(z3,z4). De hecho, la forma de cada grupo de ecuaciones es identica al de un sistema masa-resorte individual.

Una vez resueltos los grupos de ecuaciones, se puede recuperar la dinamica del sistema en las coordenadas originales

mediante inversion de la transformacion de estados y escribiendo x = T−1z.

4.1 Definiciones 45

4.1.2. Autovalores/autovectores de una matriz y modos

Los autovalores y autovectores de un sistema proveen una descripcion del tipo de comportamiento que exhibe un

sistema. Para sistemas oscilatorios, el termino modo se usa a menudo para definir ciertas configuraciones de vibracion

que pueden ocurrir, ver Figs. 4.2 y 4.3.

(a) Mode 1

Figura 4.2 Sistema de masa conectadas por un resorte. Las masas se mueven hacia la derecha sincronizadas.

(b) Mode 2

Figura 4.3 Sistema de masa conectadas por un resorte. Las masas se mueven en direcciones separadas.

La respuesta a las condiciones iniciales de un sistema lineal se puede escribir en terminos del exponencial de una

matriz, la denominada matriz de estados A. Luego, las propiedades de la matriz A determinan el comportamiento del

sistema. Si A ∈ Rn×n, asumamos que existen n vectores linealmente independientes (autovectores) vi y n escalares λi

(autovalores) que satisfacen:

Avi = λivi.

Escribiendo los vectores vi como una matriz:

M ≡[

v1 v2 ... vn

],

y definiendo la matriz Λ de acuerdo a:

Λ ≡

λ1 0 ... ... 0

0 λ2 0 ... 0...

0 ... 0 λn−1 0

0 ... ... 0 λn

,

tenemos que:

AM = MΛ .

Luego se tiene que:I = MM−1

A = MΛM−1

A2 = MΛM−1MΛM−1

= MΛ 2M−1

......

An = MΛ nM−1

Si consideramos el exponencial de matrices eAt , asumiendo que A tiene n vectores independientes:


eAt = I +At +A2t2

2+ ...+

Antn

n!+ ...

= MM−1 +MΛ tM−1 +MΛ 2t2M−1

2!+ ...

= MeΛ tM−1

= M

eλ1t 0 ... ... 0

0 eλ2t 0 ... 0...

0 ... 0 eλn−1t 0

0 ... ... 0 eλnt

M−1

Suponiendo primero que v y λ son autovector y autovalor de valor real. Luego, observamos que la solucion de la

ecuacion diferencial para x(0) = v, de la definicion de exponencial de matrices arriba:

eAtv = MeΛ tM−1v = eλ tv.

Entonces, el autovalor describe como la solucion varıa en el tiempo, esta solucion a menudo se denomina modo. El

autovector define la forma de la solucion y a menudo se denomina forma del modo del sistema (ver Fig. 4.4). El

autovalor a menudo se denomina como frecuencia modal.

0 2 4 6 8 100

0.5

1

1.5

u

Time t

(a) Pulse and impulse functions

0 10 20 30 400

0.5

1

t

y

Pulse responses

Impulse response

(b) Pulse and impulse responses

Figura 4.4 La nocion de modos para un sistema de segundo orden con autovalores reales. La figura en la izquierda muestra el plano defase y las de la derecha las respuestas en el tiempo. Ambas figuras muestran los modos correspondientes a soluciones que comienzan en losautovectores.

El caso de los autovalores complejos es mas complicado. Siendo A una matriz con elementos reales, los autovalores

y autovectores son complejos conjugados λ = σ ± iω y v = u± iw, que implica que:

u =v+ v∗

2, ,w =

v− v∗

2i.

Usando el exponencial de matrices tenemos que:

eAtv = eλ t(u+ iw) = eσt ((ucosωt−ω sinωt)+ i(usinωt +ω cosωt)) ,

luego sigue que:

eAtu =1

2(eAtv+ eAtv∗) = ueσt cosωt−ωeσt sinωt,

eAtw =1

2(eAtv− eAtv∗) = ueσt sinωt +ωeσt cosωt.

Nuevamente llamamos a la solucion correspondiente a λ de modo del sistema, y v es la forma del modo.

Algunas matrices con autovalores iguales no pueden ser transformadas a una forma diagonal. Ellos, entonces, pueden

ser transformados a una forma relacionada, denominada forma de Jordan. En este caso, la matriz de estados posee los

autovalores en la diagonal. Cuando hay autovalores iguales, pueden haber 1’s apareciendo en la superdiagonal, indi-

cando el acoplamiento entre estados. Especıficamente decimos que una matriz esta en la forma de Jordan cuando:

4.1 Definiciones 47

J1 0 .. 0 0

0 J2 0 0 0...

. . ....

0 0 Jk−1 0

0 0 ... 0 Jk

, donde Ji =

λi 1 .. 0 0

0 λi 1 0 0...

. . ....

0 0 λi 1

0 0 ... 0 λ1

, (4.6)

donde Ji es un bloque de Jordan, y λi para ese bloque corresponde al autovalor de J. Un bloque de Jordan puede ser

representado por un sistema que consiste en un integrador con realimentacion λ , ver Fig. 4.5.

∫

λ

x1

6

∫

λ

x1 ∫

λ

x2

Figura 4.5 Representacion de sistemas lineales donde las matrices dinamicas son bloques de Jordan. Un bloque de Jordan de primer ordense puede representar como un integrador con realimentacion λ , como mostrado a la izquierda. Un bloque de Jordan de orden dos es mostradoa la derecha.

Una vez que una matriz esta en la forma de Jordan, el exponencial de la matriz puede ser calculado en terminos de

los bloques de Jordan, usando la forma diagonal por bloques de J:

eJ =

eJ1 0 ... 0 0

0 eJ2 0 0 0...

. . ....

0 0 eJk−1 0

0 0 ... 0 eJk

. (4.7)

Los exponenciales de los bloques de Jordan pueden a su vez ser escritos como:

eJit =

1 t t2

2! ... tn−1

(n−1)!

0 1 t ... tn−2

(n−2)!... 1

. . ....

. . . t

0 ... 0 1

eλit . (4.8)

4.1.3. Teorema de Cayley-Hamilton

El teorema de Cayley-Hamilton establece que una matriz A satisface su propia ecuacion caracterıstica. La ecuacion

caracterıstica de una matriz es la ecuacion:

α(λ )≡ det(λ I−A) = λ n + ...+a1λ +aoλ 0

El teorema de Cayley-Hamilton establece que:

α(A) = 0. (4.9)

Probaremos el teorema de Cayley-Hamilton para el caso de A siendo diagonalizable. Considerando α(A), siendo

que A se puede escribir como A = MΛM−1, encontramos que:

α(A) = Mα(Λ)M−1.


Pero α(Λ) actua separadamente en cada uno de los elementos de la matriz diagonal. Como cada uno de los elementos

satisface α(λ ) = 0, encontramos que α(Λ) = 0. De aqui concluimos que α(A) = 0. ⋄Una consecuencia simple del teorema de Cayley-Hamilton es que cualquier potencia de A se puede expresar en

terminos de I,A, ...,An−1. Considerese, por ejemplo, An. De (??) vemos que:

An =−(an−1An−1 + ...+a1A+aoI)

4.2. Forma canonica modal

Considerando un sistema de multiples entradas y salidas, contınuo en el tiempo, representado por:

x(t) = Ax(t)+Bu(t),y(t) =Cx(t),

(4.10)

donde A ∈ Rn×n, B ∈ R

n×m y C ∈ Rp×n. Observamos que la descomposicion modal (en modos) de A lleva a una

representacion espacio de estados muy util. Dado que A = MΛM−1, la transformacion de estados se puede hacer por

medio de z = T x, T = M−1, resultando en:

z(t) = Λz(t)+M−1Bu(t),y(t) =CMz(t).

(4.11)

Esta representacion es denominada de forma canonica modal, dado que los estados son simplemente las amplitudes

modales. Los estados son desacoplados en Λ pero pueden estar acoplados a traves de los mapeamientos de entrada

M−1B y salida CM. La forma modal es robusta en cuestiones de calculo numerico.

4.2.1. Ejemplo: Sistema de multiples entradas y multiples salidas

Considere el modelo del sistema dinamico como sigue:

x =

5 4 2

4 5 2

2 2 2

x+

0 1

1 1

1 0

u,

y =

[1 4 2

1 1 2

]

x+

[1 0

0 1

]

u

Luego, el calculando los autovalores de A tenemos:

det(A−λ I3) = det

5−λ 4 2

4 5−λ 2

2 2 2−λ

=−λ 3 +12λ 2−21λ +10

=−(λ −1)2(λ −10)

,

y vemos que los autovalores asociados de A son λ = 1 y λ = 10. Buscando los autovectores correspondientes:

5−λ 4 2

4 5−λ 2

2 2 2−λ

∣∣∣∣∣∣λ=1

v =

4 4 2

4 4 2

2 2 1

v = λv = v,

entonces:

v1 =

−1

0

2

,v2 =

−1

1

0

,

4.3 Forma canonica controlable 49

y:

5−λ 4 2

4 5−λ 2

2 2 2−λ

∣∣∣∣∣∣λ=10

v =

−5 4 2

4 −5 2

2 2 −8

v = λv = v,

entonces:

v3 =

2

2

1

.

Con los tres autovectores v1, v2 y v3 siendo linealmente independientes podemos definir M tal que la matriz de estados

se pueda diagonalizar: M =

−1 −1 2

0 1 2

2 0 1

. Entonces:

Λ =

−1 −1 2

0 1 2

2 0 1

−1

5 4 2

4 5 2

2 2 2

−1 −1 2

0 1 2

2 0 1

=

1 0 0

0 1 0

0 0 10

,

M−1B =

−1 −1 2

0 1 2

2 0 1

−1

0 1

1 1

1 0

CM =

[1 4 2

1 1 2

]

−1 −1 2

0 1 2

2 0 1

4.3. Forma canonica controlable

4.3.1. Caso, sistema de una entrada

Considerando un sistema de una entrada una salida, un sistema contınuo en el tiempo es representado por:

x(t) = Ax(t)+bu(t), (4.12)

donde A ∈ Rn×n y b ∈ R

n. Si se asume que el sistema es alcanzable, o, equivalentemente, controlable1, significa que:

rango([

b Ab ... An−1b]) = n. (4.13)

y a la matriz Wc =[

b Ab ... An−1b]

se le denomina matriz de controlabilidad.

Eligiendo la ultima fila de la inversa de la matriz controlabilidad, sea q1 tal fila, definimos la matriz de transforma-

cion T como:

T =

q1

q1A...

q1An−1

. (4.14)

Notese que T es invertible, dado que:

1 Esta distincion solo existe en el caso de sistemas no lineales.


T[

b Ab ... An−1b]=

0 0 ... 0 1

0 0 ... 1 x...

......

...

1 x ... x x

. (4.15)

Los elementos x en la matriz son elementos que existen pero no son de nuestro interes. Considerando la transformacion

z = T x, en el nuevo sistema coordenado, el modelo del sistema es:

z(t) = TAT−1x(t)+T bu(t)= Az(t)+ bu(t).

(4.16)

Las matrices A y b tienen estructuras particulares que definiremos a continuacion. Analizando primero la estructura de

b, con q1 siendo la ultima fila de la inversa de la matriz de controlabilidad, tenemos:

q1b = q1Ab = ...= q1An−2b = 0, (4.17)

y,

q1An−1b = 1. (4.18)

Entonces:

b = T b =

q1

q1Ab...

q1An−2b

q1An−1b

=

0

0...

0

1

. (4.19)

La estructura de A es revelada considerando la relacion TAT−1 = A representada por:

TA = AT. (4.20)

El lado izquierdo de la matriz esta dado por:

TA =

q1A

q1A2

...

q1An−1

q1An

. (4.21)

Por el teorema de Cayley-Hamilton, tenemos:

An =−aoIn−a1A− ...−an−1An−1, (4.22)

y luego

q1An =−aoq1−a1q1A− ...−an−1q1An−1. (4.23)

Comparando ambos lados de la ecuacion TA = AT y usando el teorema de Cayley-Hamilton obtenemos que A debe

ser como descrito a continuacion:

A =

0 1 0 ... 0 0

0 0 1 ... 0 0...

......

0 0 0 ... 0 1

−ao −a1 −a2 ... −an−2 −an−1

. (4.24)

Notese que los coeficientes del polinomio caracterıstico de A son inmediatamente aparentes inspeccionando la ultima

fila de A.


Ejemplo, sistema de una entrada


x =

0 0 1 0

0 0 0 1

−2 1 0 0

1 −1 0 0

x+

0

0

1

0

u.

La matriz de controlabilidad es: Wc =[

b Ab A2b A3b]=

0 1 0 −2

0 0 0 1

1 0 −2 0

0 0 1 0

, luego el sistema es controlable dado que Wc

es no singular. Calculando la ultima fila de la inversa de la matriz de controlabilidad encontramos que es[

0 1 0 0].

Luego la matriz de transformacion T es definida como:

T =

q1

q1A

q1A2

q1A3

=

0 1 0 0

0 0 0 1

1 −1 0 0

0 0 1 −1

.

Las matrices A y b en el nuevo sistema coordenado tienen la forma:

A = TAT−1 =

0 1 0 0

0 0 0 1

1 −1 0 0

0 0 1 −1

0 0 1 0

0 0 0 1

−2 1 0 0

1 −1 0 0

1 0 1 0

1 0 0 0

0 1 0 1

0 1 1 0

=

0 1 0 0

0 0 1 0

0 0 0 1

−1 0 −3 0

,

y:

b = T b =

0

0

0

1

4.3.2. Caso, sistema de multiples entradas

A continuacion, generalizaremos el metodo que transforma sistemas a su forma canonica controlable para el caso

de sistemas de mas de una entrada. Sea el sistema dinamico:

x(t) = Ax(t)+Bu(t), (4.25)

donde A ∈ Rn×n y B ∈ R

n×m, m ≤ n, y rango columna(B)=m por simplicidad2. La matriz de controlabilidad se puede

representar como:

Wc =[

b1 b2 ... bm Ab1 Ab2 ... Abm ... An−1b1 ... An−1bm

]. (4.26)

donde bi, i = 1,2, ...,m, es la i-esima columna de B. Asumiendo que la matriz presentada en (4.26) es de rango fila

completo (n filas linealmente independientes), luego, podemos seleccionar n columnas linealmente independientes en

(4.26). Elegimos estas columnas de la derecha a la izquierda, luego rearreglando las columnas seleccionadas formarmos

la siguiente matriz no singular L:

L =[

b1 Ab1 ... Ad1−1b1 b2 ... Ad2−1b2 ... bm ... Adm−1bm

]. (4.27)

2 Esta suposicion es hecha por conveniencia, para simplificar el calculo. Esta suposicion implica que todas las entradas son mutualmenteindependientes, que viene a ser el caso en aplicaciones practicas.


Los m enteros di son denominados ındices de controlabilidad y satisfacen:

m

∑i=1

di = n. (4.28)

Observese que las m columnas de B estan presentes en L ya que hemos asumido que B es de rango columna completo

(m columnas linealmente independientes). Sea:

σk =k

∑i=1

di, for k = 1,2, ...,m. (4.29)

Notese que σ1 = d1, σ2 = d1 + d2, ..., σm = n. Seleccionando las m filas correspondientes de L−1 y denotandolas por

qk, donde qk es la σ -esima fila de L−1, formamos la siguiente matriz n×n:

T =

q1

q1A...

q1Ad1−1

q2

...

q2Ad2−1

...

qm

...

qmAdm−1

. (4.30)

Se puede probar que T es no singular calculando el producto T L y observando que det(T L) = ±1. Definiendo la

transformacion de variables de estado z = T x; y usando el mismo argumento que en el caso de un sistema de una

entrada, obtenemos que A = TAT−1 y B = T B, donde:

A =

0 1 0 ... 0 0 0 ... 0 ... 0 0 ... 0

0 0 1 ... 0 0 0 ... 0 ... 0 0 ... 0. . .

......

......

x x x ... x x x ... x ... x x ... x

0 0 0 ... 0 0 1 ... 0 ... 0 0 ... 0...

......

. . ....

......

0 0 0 ... 0 0 0 ... 1 ... 0 0 ... 0

x x x ... x x x ... x ... x x ... x...

.... . .

...

0 0 0 ... 0 0 0 ... 0 ... 0 1 ... 0...

......

. . ....

......

0 0 0 ... 0 0 0 ... 0 ... 0 0 ... 1

x x x ... x x x ... x ... x x ... x

. (4.31)

Notese que los m bloques diagonales en A tiene la estructura de la forma canonica controlable para el caso de una

entrada. Las dimensiones de cada bloque son di×di, i = 1,2, ...,m. Los bloques fuera de la diagonal tienen elemento

que son ceros, excepto por la ultimas filas. Luego, toda la informacion de A y A se puede calcular conociendo los

ındices de controlabilidad. La matriz B tiene la forma:


B =

0 0 ... 0 0

0 0 ... 0 0...

...

1 x x x x

0 0 ... 0 0

0 0 ... 0 0...

...

0 1 x x x...

...

0 0 ... 0 0

0 0 ... 0 0...

...

0 0 0 0 1

. (4.32)

Ejemplo, sistema de mutiples entradas


x =

−1 1 0 1

1 1 0 0

0 0 4 0

1 1 −1 2

x+

1 1

2 0

1 0

0 1

u.

Siguiendo el algoritmo para obtener la forma canonica controlable del sistema, obtenemos que:

rango([

b1 b2 Ab1 Ab2 A2b1 A2b2 A3b1 A3b2

]) = 4.

Luego, d1 = d2 = 2. A continuacion formamos L:

L =[

b1 Ab1 b2 Ab2

]=

1 1 1 0

2 3 0 1

1 4 0 0

0 2 1 3

,

y:

L−1 =

0,20 0,60 0,40 −0,20

−0,05 −0,15 0,35 0,05

0,85 −0,45 0,05 0,15

−0,25 0,25 −0,25 0,25

.

Entonces:

q1 =[−0,05 −0,15 0,35 0,05

],

y:

q2 =[−0,25 0,25 −0,25 0,25

].

La matriz de transformacion es:

T =

q1

q1A

q2

q2A

=

−0,05 −0,15 0,35 0,05

−0,05 −0,15 1,35 0,05

0,85 −0,45 0,05 0,15

−0,25 0,25 −0,25 0,25

.


Las matrices A y B tienen la siguiente forma:

TAT−1 =

0 1 0 0

−4 5 0 0

0 0 0 1

3 −3 4 1

y T B =

0 0

1 0

0 0

0 1

.

4.4. Forma canonica observable

En esta parte usaremos el concepto de dualidad y, en base a los algoritmos antes presentados para transformar

sistemas alcanzables a su forma controlable, derivaremos resultados analogos para sistemas observables.

4.4.1. Caso, sistema de multiples salidas

Considerando el modelo de un sistema dinamico observable:

x(t) = Ax(t)y(t) =Cu(t),

(4.33)

donde A ∈Rn×n, C ∈R

p×n, p≤ n, y rango(C)=p. Se omite la entrada u por conveniencia. Considerando el modelo del

sistema dual asociado con el sistema (4.33).

w(t) = AT w(t)+CT v(t). (4.34)

Siendo que el sistema (4.33) es observable, el sistema dual (4.34) es alcanzable. Luego podemos transformar el sis-

tem dual (4.34) en su forma canonica controlable usando los algoritmos descritos en la seccion anterior. Finalmente,

tomamos el resultado dual para obtener:˙x(t) = Ax(t),

y(t) = Cx(t),(4.35)

donde:

A =

A11 A12 ... A1p

A21 A22 ... A2p

......

Ap1 Ap2 ... App

, (4.36)

donde cada matriz diagonal Aii ∈ Rdi×di tiene la forma:

Aii =

0 0 ... 0 x

1 0 ... 0 x...

. . ....

0 0 ... 1 x

, (4.37)

que es justamente la transpuesta de la forma canonica controlable para el caso de una entrada. Los enteros di, i= 1,2, ..pson los ındices de controlabilidad del sistema en (4.35). Las matrices fuera de la diagonal A ji, j 6= i de A tienen la forma:

A ji =

0 0 ... 0 x

0 0 ... 0 x...

. . ....

0 0 ... 0 x

. (4.38)

4.4 Forma canonica observable 55

La matriz C consiste de p bloques y tiene la forma:

C =

0 0 ... 1 0 0 ... 0 ... 0 0 ... 0

0 0 ... x 0 0 ... 1 ... 0 0 ... 0...

. . ....

......

...

0 0 ... x 0 0 ... x ... 0 0 ... 1

. (4.39)

Los p ındices de controlabilidad de (4.35) son los llamados ındices de observabilidad del sistema en (4.34). Notese

que:p

∑i=1

di = n. (4.40)

Ejemplo, sistema de multiples salidas

Dado el modelo del sistema observable como sigue:

x =

0 0 1 0

1 0 2 0

0 1 3 0

0 0 −21 5

x

y(t) =

[1 0 0 0

0 0 0 1

]

x

.

Trabajando con el sistema dual para obtener la forma controlable: primero formamos la matriz de controlabilidad; luego

procedemos a seleccionar de izquierda a derecha las primeras 4 columnas linealmente independientes. Ellas tienen la

forma:

cT1 ,c

T2 ,A

T cT1 ,(A

T )2cT1 .

Luego, los indices de observabilidad son d1 = 3 y d2 = 1. Luego, formando L:

L =[

cT1 AT cT

1 (AT )2cT1 cT

2

]=

1 0 0 0

0 0 1 0

0 1 3 0

0 0 0 1

,

y:

L−1 =

1 0 0 0

0 −3 1 0

0 1 0 0

0 0 0 1

.

Entonces los dos vectores necesarios para obtener la transformacion deseada son:

q1 =[

0 1 0 0],

y:

q2 =[

0 0 0 1].


T =

q1

q1A

q2

q2A

=

0 1 0 0

0 0 1 0

1 2 3 −21

0 0 0 1

.

Las matrices A y C tienen la siguiente forma:


A = T−T AT T =

0 0 1 0

1 0 2 0

0 1 3 0

0 0 −105 5

y C =CT T =

[0 0 1 0

0 0 −21 1

]

.

4.5. Representaciones espacio de estados en formas canonicas a partir de funciones de

transferencia del sistema

En las secciones anteriores se ha descrito la forma de obtener ciertas formas canonicas partiendo de una repre-

sentacion espacio de estados dada, en esta parte nos centraremos en obtener representaciones espacio de estados en sus

formas canonicas partiendo de la funcion de transferencia del sistema.

Considere un sistema definido por:

dny

dtn+an−1

dn−1y

dtn−1+ ...+a1

dy

dt+aoy = bn

dnu

dtn+bn−1

dn−1u

dtn−1+ ...+b1

du

dt+bou (4.41)

donde u es la entrada y y es la salida. Esta ecuacion tambien puede ser escrita como:

Y (s)

U(s)= g(s) =

bnsn +bn−1sn−1 + ...+b1s+bo

sn +an−1sn−1 + ...+a1s+ao

=n(s)

d(s)(4.42)

A continuacion se presentaran las representaciones espacio de estados correspondientes en su forma canonica contro-

lable, observable y modal.

4.5.1. Forma canonica controlable

La siguiente representacion es la forma canonica controlable:

x1

x2

...

xn−1

xn

=

0 1 0 ... 0 0

0 0 1 ... 0 0...

......

...

0 0 0 ... 0 1

−ao −a1 −a2 ... −an−2 −an−1

x1

x2

...

xn−1

xn

+

0

0...

0

1

u. (4.43)

y =[

bo−aobn b1−a1bn ... bn−1−an−1bn

]

x1

x2

...

xn−1

xn

+bnu (4.44)

La forma canonica controlable es importante en el diseno de sistemas de control por ubicacion de polos. Las ecuaciones

(4.43) y (4.44) son derivadas de la siguiente forma. Si bn 6= 0 entonces:

4.5 Representaciones espacio de estados en formas canonicas a partir de funciones de transferencia del sistema 57

g(s) =bn

[

sn +bn−1

bnsn−1 + ...+ b1

bns+ bo

bn

]

d(s)

=bn

[

sn +bn−1

bnsn−1 + ...+ b1

bns+ bo

bn−d(s)+d(s)

]

d(s)

=bn

[

sn +bn−1

bnsn−1 + ...+ b1

bns+ bo

bn−d(s)

]

d(s)︸︷︷︸

estrictamente propia

+bn

entonces funcion de transferencia propia = funcion de transferencia estrictamente propia + constante, en otras palabras,

g(s) = h(s)+bn y bn es simplemente la matriz D. Ahora suponiendo que:

h(s) =cn−1sn−1 + ...+ cn

sn +an−1sn−1 + ...+a1s+ao

=[cn−1sn−1 + ...+ cn

] 1

d(s)

y (4.43) y (4.44) siguen por construccion.

4.5.2. Forma canonica observable

La siguiente representacion es la forma canonica observable:

x1

x2

...

xn−1

xn

=

0 0 0 ... 0 −ao

0 0 0 ... 0 −a1

......

......

0 0 0 ... 0 −an−2

0 0 0 ... 1 −an−1

x1

x2

...

xn−1

xn

+

bo−aobn

b1−a1bn

...

0

bn−1−an−1bn

u. (4.45)

y =[

0 0 ... 0 1]

x1

x2

...

xn−1

xn

+bnu (4.46)

Notar que la matriz de estados n× n de la ecuacion (4.45) es la transpuesta de la matriz de estados de la ecuacion

(4.43).

4.5.3. Forma canonica modal

Considere la funcion de transferencia definida por (??). Aqui consideramos el caso donde el polinomio del denom-

inador posee raices distintas. Para el caso de raices distintas, (??) puede ser escrita como:

Y (s)U(s) =

bnsn +bn−1sn−1 + ...+b1s+bo

(s+ p1)(s+ p2)...(s+ pn)

= bn +c1

s+ p1+

c2

s+ p2+ ...+

cn

s+ pn

(4.47)

La forma canonica diagonal esta dada por:


x1

x2

...

xn−1

xn

=

−p1 0 0 ... 0 0

0 −p2 0 ... 0 0...

......

...

0 0 0 ... −pn−1 0

0 0 0 ... 0 −pn

x1

x2

...

xn−1

xn

+

1

1...

1

1

u. (4.48)

y =[

c1 c2 ... cn−1 cn

]

x1

x2

...

xn−1

xn

+bnu (4.49)



Fuente: Capıtulo 2 del libro Systems and Control de Stanislaw H. Zak (2002).

Fuente: Capıtulo 4 del libro Multivariable Feedback Control de S. Skogestad y I. Postlethwaite (2006).

Capıtulo 5

Control por realimentacion de estados

El mundo real es no lineal, sin embargo existen un numero de razones para investigar sistemas lineales. Los sistemas

lineales se usan a menudo para aproximar sistemas no lineales. Muchas veces, esta aproximacion es suficiente para el

diseno del controlador. El conocimiento de la teorıa de sistemas lineales ayuda tambien a entender la complicada teorıa

de sistemas no lineales.

En esta parte, analizaremos mas conceptos basicos de sistemas lineales. La forma general del sistema lineal en la

forma de espacio de estados, con correspondiente ecuacion de salida, es:

dx

dt= Ax+Bu,

y =Cx+Du,(5.1)

donde A ∈ Rn×n, B ∈ R

n×m, C ∈ Rp×n y D ∈ R

p×m.

5.1. Controlabilidad

Decimos que el sistema dinamico descrito por la ecuacion (5.1) o el par n-dimensional (A,B) es controlable si

existe una ley de control u(t) que transfiere cualquier estado inicial xo = x(to) en cualquier tiempo to a un estado final

x f = x(t f ) del espacio de estados en un tiempo t f > to. De otra forma, el sistema o par (A,B) en no controlable.

Teorema 1 Las siguientes condiciones son equivalentes:

1. El par n-dimensional (A,B) es controlable.

2. La matriz de controlabilidad n×nm

Wc =[

B AB ... An−1B]= n

tiene rango de fila completo.

3. Las n filas de la matriz e−AtB son linealmente independientes para todo t ∈ [0,∞).4. La matriz

Vc(t) =∫ t

0e−Aτ BBT e−AT τ dτ =

∫ t

0e−A(t−τ)BBT e−AT (t−τ)dτ

es no singular para todo t > 0.

⋄Demostracion Probando la implicacion 1→ 2; esto es, si el par (A,B) es controlable entonces la llamada matriz de

controlabilidad[

B AB ... An−1B]∈ R

n×mn

es de rango de fila completo. Probaremos este enunciado por contradiccion (∼ 2→∼ 1). Entonces, asumimos que:

rango[

B AB ... An−1B]< n; entonces, existe una vector constante de orden n, q 6= 0 tal que:

qT B = 0T , qT AB = 0T , ...qT An−1B = 0T .

59

60 5 Control por realimentacion de estados

Por el teorema de Cayley-Hamilton, la matriz A satisface su propia ecuacion caracterıstica. Entonces:

An =−an−1An−1− ...−a1A−aoIn.

Luego:

qT AnB = 0T = qT (−an−1An−1B− ...−a1AB−aoB) = 0T .

Por induccion obtenemos:

qT AiB = 0T , para i = n+1,n+2, ...

Ahora sea x(0) = 0 y x(t f ) = q. Ahora mostraremos que no existe ley de control que transfiera al sistema de x(0) = 0

a x(t f ) = q. De la solucion de la ecuacion espacio de estados obtenemos:

q = eA(t f−to)x(0)+

∫ t f

to

eA(t f−τ)Bu(τ)dτ

q =∫ t f

0eA(t f−τ)Bu(τ)dτ .

Ahora premultiplicamos la ecuacion resultante por qT para obtener:

0 6= ‖q‖2 =

∫ t f

0qT eA(t f−τ)Bu(τ)dτ = 0

porque

qT eA(t f−τ)B = qT

(

B+(t f − τ)AB+(t f − τ2)

2!A2B− ...

)

= 0T .

Luego el sistema no puede ser transferido desde x(0) = 0 hasta x(t f ) = q, y luego el sistema x = Ax + Bu es no

controlable. ⋄

5.1.1. Ejemplo: Motor DC

Maquinas de corriente contınua son bastante usadas en sistemas de control en lazo cerrado, en particular para el

control de velocidad y torque. Existen de diversos tamanos comenzando a partir de unos cuantos watts, accionados por

amplificadores electronicos, a varios cientos de kilowatss, accionados por generadores Ward-Leonard. Servomotores

de bajo consumo de potencia se usan a menudo en instrumentacion, particularmente en sistemas de control de aviones,

donde limitaciones de peso y espacio requieren de motores que provean el maximo de potencia por unidad de volumen.

Un cuerpo conductor que transporta corriente, cuando inmerso en un campo magnetico, experimenta una fuerza

proporcional a la magnitud del flujo, la corriente y la longitud del conductor, y el angulo entre el conductor y la

direccion del flujo. Cuando el conductor se localiza a una distancia fija de un eje, con respecto al cual puede rotar, se

genera un torque proporcional al producto de la fuerza y el radio. En un motor, el torque resultante es la suma de torques

producidos por conductores individualmente. Para un rotor dado las unicas dos cantidades que se pueden manipular

son la corriente de armadura y el flujo. Luego, existen dos modos de operacion de un servomotor DC: a)modo por

armadura controlada y b) modo por campo controlado.

Control de armadura

En el motor DC de armadura controlada el campo es excitado de forma separada por una corriente constante i f a

partir de una fuente DC fija. El flujo puede ser escrito como φ = K f i f , K f constante. El torque desarrollado por el

motor es proporcional al producto de φ y la corriente en la armadura y la longitud de los conductores. Dado que el

campo es asumido constante, el torque desarrollado por el motor se puede expresar como:

τm = Kiia.

5.1 Controlabilidad 61

Ra

Ieq

ea

if constant

La (negligible)

Figura 5.1 Modelo de un motor DC de armadura.

El torque del motor es usado para accionar el sistema que posee una inercia total Ieq. Asumiendo el caso ideal donde

el torque entregado es igual a la carga (en la practica no hay 100% de eficiencia). Entonces:

Ieqθ = Kiia. (5.2)

donde θ es la position angular del eje del motor.

A medida que la armadura rota en un campo, esta desarrolla un voltaje inducido eb en direccion opuesta al suministro

de armadura. Este voltaje se llama fuerza contra-electromotriz y es proporcional a la velocidad de rotacion θ y el flujo

creado por el campo. Dado que el campo es constante, la fuerza contra-electromotriz puede ser expresada como:

eb = Kbθ . (5.3)

donde Kb es la constante de voltaje del motor.

El control de la velocidad del motor se obtiene ajustando el voltaje aplicado a la armadura. Su polaridad determina

la direccion de rotacion del motor. El diagrama esquematico del sistema motor DC de armadura se presenta en la Fig.

5.1, donde Ra = 1Ω , La ∼ 0H, Kb = 5V/rad/sec, Ki = 5Nm/A, y el momento de inercia efectivo es Ieq = 0,1kgm2. La

friccion y la inercia del engranaje son despreciables.

Aplicando la ley del voltaje de Kirchoff al circuito de la armadura resulta:

Raia +Kbθ = ea. (5.4)

Sustituyendo ia de (5.1) en la ecuacion arriba mostrada y dividiendo ambos lados por Ieq resulta:

θ =Ki

Ieq

(ea−Kbθ

Ra

)

=KiKb

IeqRa

θ +Ki

IeqRa

ea.

Sea x1 = θ , x2 = θ y u = ea. Luego tomando en cuenta los parametros del sistema, representamos la ecuacion arriba

mostrada en la forma de espacio de estados.

[x1

x2

]

=

[0 1

0 −250

][x1

x2

]

+

[0

50

]

u.

Primero formamos la matriz de controlabilidad del sistema:

Wc =[

B AB]=

[0 50

50 −12500

]

,

y verificamos que el sistema es controlable.

Ahora encontraremos un control u que transfiere el sistema desde un estado inicial x(to) =[

10 1]T

al estado final

x(2) =[

0 0]T

. Recuerde que la solucion del sistema controlado tiene la forma:


x(t) = eA(t−to)x(to)+∫ t

to

eA(t−τ)Bu(τ)dτ .

Nuestro objetivo es encontrar u tal que:

0 = x(2) = e2Ax(0)+∫ 2

0eA(2−τ)Bu(τ)dτ .

Se puede verificar que u tiene la forma:

u(t) =−BT eA(2−t)

(∫ 2

0eA(2−τ)BBT eAT (2−τ)dτ

)−1

e2Ax(0),

donde:

eAt = L−1(sI−A)−1=

[1 1

250 (1− e−250t)0 e−250t

]

.

Entonces:(∫ 2

0eA(2−τ)BBT eAT (2−τ)dτ

)−1

=

∫ 2

0

[1 1

250 (1− e−250(2−τ))

0 e−250(2−τ)

][0

50

][

0 50][

1 01

250 (1− e−250(2−τ)) e−250(2−τ)

]

dτ

=

[0,07976 0,02

0,02 5

]

La inversa de la matriz arriba es:

=

[12,5502 −0,0502

−0,0502 0,2002

]

.

Entonces:

u(t) =−[

0 50][

1 01

250 (1− e−250(2−τ)) e−250(2−τ)

][12,5502 −0,0502

−0,0502 0,2002

]

e2A

[10

1

]

u(t) = 50,22e250t−500−25,11.

La estrategia de control arriba mostrada transfiere el sistema de x(0) =[

10 1]T

a x(2) =[

0 0]T

.

Graficas de x1 y x2 versus tiempo son mostradas en la Fig. 5.2. Una grafica de u versus tiempo esta dada en la Fig.

5.3.

x1

x2

12

10

8

6

4

2

0

0 0.5

2

4

61

Time (sec)

1.5 2

Figura 5.2 Variables de estado versus tiempo.

30

20

0 0.530

1

Time (sec)

u

1.5 2

10

0

10

20

Figura 5.3 Accion de control versus tiempo.

5.1 Controlabilidad 63

Control de campo

La Fig. 5.4 muestra el diagram esquematico del motor DC de campo controlado donde la corriente de la armadura

es mantenida constante y el campo es suministrado a partir de un voltaje ajustable e f .

540 INTRODUCTION TO CONTROL ENGINEERING

+

efif Lf

Rf

Ia = Const.

m

JB

Fig. A.19 Field controlled DC motorFigura 5.4 Motor DC de campo controlado.

El torque τ desarrollado por el motor es proporcional al flujo creado por la corriente de armadura, la corriente del

campo y la longitud de los conductores. Para un motor dado, y dado que la corriente de armadura es constante, el torque

puede ser expresado como:

τ = KT i f , (5.5)

donde KT es la constante de torque. Este torque es usado para mover yba carda de inercia total J y para vencer la

friccion viscosa. Eso puede ser expresado, despreciando la constante de rigidez K, como:

τ = Jθm +Bθm. (5.6)

Aplicando la ley de voltaje de Kirchoff en el circuito del campo se obtiene:

e f = R f i f +L f i f . (5.7)

La representacion espacio de estados se obtiene considerando a la posicion angular y su derivada como los primeros

estados, x1 = θm, x2 = θm, la corriente de campo como el tercer estado, x3 = i f , y al voltaje del campo como la entrada

u = e f donde la posicion angular se considera como la salida y = θm = x1. Luego las matrices correspondientes son:

A =

0 1 0

0 −B/J KT/J

0 0 −R f /L f

, b =

0

0

1/L f

, c =[

1 0 0].

5.1.2. Sistema no controlable

Teorema 2 El sistema x = Ax+Bu es no controlable si y solo si existe una transformacion de similaridad z = T x tal

que:

A = TAT−1 =

[A1 A2

0 A4

]

, , B = T B =

[B1

0

]

donde el sistema xr = A1xr +B1u es controlable, A1 ∈ Rr×r, B1 ∈ R

r×m, y el rango de la matriz de controlabilidad del

sistema x = Ax+Bu es igual a r.


Ejemplo de sistema no controlable

Para el modelo del sistema:

x =

−1 1 0 1

1 1 0 0

0 0 4 0

1 1 −1 2

x+

1 1

0 0

0 0

0 1

u,

construir la transformacion de las variables de estado tal que en el nuevo sistema coordenado la parte controlable sea

separada de la parte no controlable.

Primero formamos la matriz de controlabilidad del sistema:

Wc =[

B AB A2B A3B]=

1 1 −1 0 3 4 −1 4

0 0 1 1 0 1 3 5

0 0 0 0 0 0 0 0

0 1 1 3 2 7 7 19

.

Usando el comando del MATLAB [Q,R]=qr(W_c) para obtener:

Q =

−1 0 0 0

0 0 −1 0

0 0 0 1

0 −1 0 0

, R =

−1 −1 1 0 −3 −4 1 −4

0 −1 −1 −3 −2 −7 −7 −19

0 0 −1 −1 0 −1 −3 −5

0 0 0 0 0 0 0 0

.

donde las matrices Q y R satisfacen Wc = QR, donde Q es una matriz ortogonal y R es una matriz triangular superior

tal que el rango R=rango Wc. Entonces, premultiplicando la matriz de controlabilidad, Wc, por Q−1 reduce esta matriz a

una matriz de filas triangular superior R porque Q−1Wc = R. Sea z = Q−1x la transformacion de las variables de estado.

Entonces en el nuevo sistema coordenado las matrices A y B toman la forma:

Q−1AQ =

−1 1 1 0

1 2 1 1

1 0 1 0

0 0 0 4

, and Q−1B =

−1 −1

0 −1

0 0

0 0

.

La dimension de la parte no controlable es 1.

5.1.3. Estabilizabilidad

Si los autovalores de la parte no controlada de un sistema x= Ax+Bu estan todo en el semiplano complejo izquierdo

abierto- esto es, que la parte no controlada es asintoticamente estable- luego el sistema x = Ax+Bu es estabilizable.

En lo que sigue discutiremos metodos para el diseno de controladores por realimentacion para el caso de sistemas

lineales. El proceso de diseno involucra tres pasos. En el primer paso asumimos que todos los estados estan disponibles

y procedemos con el diseno de leyes de control por realimentacion de estados. Luego procedemos con el segundo

paso; que corresponde al diseno del estimador, tambien denominado como el observador del vector de estados. El

ultimo paso consiste en combinar los dos pasos anteriores tal que la ley de control, disenada en el primer paso, usa

el estimador de estados en vez de el vector de estados real. El resultado de este paso es un compensador combinado

controlador-estimador. A continuacion discutiremos el controlador por realimentacion de estados.

5.2. Control por realimentacion de estados

El estado de un sistema dinamico es una coleccion de variables que permiten la prediccion del desarrollo de un

sistema a futuro. A continuacion exploraremos la idea de disenar la dinamica de un sistema a traves de realimentacion

5.2 Control por realimentacion de estados 65

de estados. La ley de control por realimentacion sera desarrollada paso a paso usando una unica idea: la ubicacion de

los autovalores del sistema en lazo cerrado en posiciones deseadas.

5.2.1. Estructura del controlador

La Fig. 5.5 muestra un diagrama de un sistema de control por realimentacion de estados tıpico. El sistema completo

consiste del proceso dinamico (planta), que es considerado lineal, los elementos del controlador K y kr, la entrada de

referencia (o senal de comando) r y procesos de disturbio d. El objetivo del controlador por realimentacion es regular

la salida del sistema z tal que rastree la senal de referencia aun en la presencia de disturbios y tambien incerteza en el

proceso.

Figura 5.5 Sistema de control por realimentacion de estados. El controlador usa el estado del sistema x y la entrada de referencia r paracomandar el proceso (planta) a traves de su entrada u. El disturbio es modelado a traves de una entrada aditiva d.

Un elemento importante del dise no de control es la especificacion de desempeno. La especificacion mas simple de

desempeno es la de estabilidad: en la ausencia de disturbios, nuestro objetivo es hacer que el punto de equilibrio del

sistema sea asintoticamente estable. A menudo, especificaciones de desempeno mas sofisticadas dotan de propiedades

deseadas a una respuesta al escalon o a la respuesta en frecuencia del sistema, tales como tiempo de levantamiento,

sobreimpulso y tiempo de establecimiento de la respuesta al escalon. Adicionalmente, una preocupacion frecuente

es que el sistema posea propiedades de atenuacion de disturbios. Considerando un sistema descrito por la ecuacion

diferencial lineal:x(t) = Ax(t)+Bu(t), x(0) = xo

z(t) =Cx(t)+Du(t),y(t) = Inx(t)

,

donde hemos ignorado el disturbio d por ahora. Nuestro objetivo es llevar la salida z a una referencia deseada r y

mantenerla alli.

5.2.2. Estabilizacion por realimentacion de estados

Asumiendo que todos los componentes del vector de estados pueden ser medidos. Dado que el estado en el tiempo t

contiene toda la informacion necesaria para predecir el comportamiento futuro del sistema, la ley de control invariante

en el tiempo mas general es una funcion del estado y de la entrada de referencia:

u = α(x,r).

Si la ley de control por realimentacion de estados es asumida lineal, entonces la realimentacion se puede escribir como

una combinacion lineal de todas las variables de estado, incluyendo la referencia:

u =−Kx+ krr,


donde K ∈ Rm×n es una matriz constante y r es el valor de referencia, asumido por ahora constante. El sistema en lazo

cerrado es entonces:

x = Ax+B(−Kx+ krr), x(0) = xo

x = (A−BK)x+Bkrr, x(0) = xo

Los polos del sistema en lazo cerrado son las raices de la ecuacion caracterıstica:

det(sIn−A+BK) = 0.

La ley de control por realimentacion de estados consiste en seleccionar ganancias:

ki j, i = 1,2, ...,m, j = 1,2, ..,n,

tal que las raices de la ecuacion caracterıstica del sistema en lazo cerrado:

det(sIn−A+BK) = 0,

esten en las ubicaciones deseadas en el plano complejo. Si asumimos que el disenador ha hecho una seleccion de los

polos deseados del sistema en lazo cerrado, y ellos son: p1, p2, ..., pn. Los polos (del sistema en lazo cerrado) deseados

pueden ser reales o complejos. Si son complejos, ellos deben estar en pares complejos conjugados. Esto es debido al

uso de ganancias reales ki j. Una vez que definimos los polos deseados, podemos formar el polinomio caracterıstico en

lazo cerrado deseado,

αc(s) = (s− p1)(s− p2)...(s− pn)

αc(s) = sn +αn−1sn−1 + ...+α1s+αo.

Nuestro objetivo es seleccionar una matriz de realimentacion K tal que:

det(sIn−A+BK) = sn +αn−1sn−1 + ...+α1s+αo.

El problema arriba presentado es tambien llamado problema de ubicacion de polos o problema de asignacion de

autovalores. Primero discutiremos el problema de ubicacion de polos para una planta con una entrada.

Ubicacion de polos para sistemas de una entrada

En este caso, K = k ∈ R1×n. La solucion de este problema se obtiene facilmente si el sistema x(t) = Ax(t)+ bu(t)

ya esta en la forma canonica controlable. En tal caso tenemos:

A−bk =

0 1 0 ... 0 0

0 0 1 ... 0 0...

...

0 0 0 ... 0 1

−ao− k1 −a1− k2 −a2− k3 ... −an−2− kn−1 −an−1− kn

.

Entonces, las ganancias deseadas son:k1 = αo−ao,k2 = α1−a1,

...

kn = αn−1−an−1

.

Si el sistema x(t) = Ax(t)+ bu(t) no esta en la forma canonica controlable, primero transformamos el sistema en la

forma canonica y luego calculamos el vector de ganancias k tal que:

det(sIn− A+ bk) = sn +αn−1sn−1 + ...+α1s+αo.


Entonces,

k =[

αo−ao α1−a1 ... αn−1−an−1

].

Luego:

k = kT,

donde T es la transformacion que lleva al sistema x(t) = Ax(t)+bu(t) a la forma canonica controlable.

Podemos representar la formula de arriba para la matriz de ganancias en una forma alternativa. Para esto, notese

que:

kT =[

αo−ao α1−a1 ... αn−1−an−1

]

q1

q1A...

q1An−1

.

kT = q1(αoIn +α1A+ ...+αn−1An−1)−q1(aoIn +a1A+ ...+an−1An−1).

Por el teorema de Cayley-Hamilton, tenemos:

An =−(aoIn +a1A+ ...+an−1An−1).

Entonces:

k = q1αc(A).

La expresion para el vector fila de ganancias fue propuesto por Ackerman en 1972 y ahora se conoce como Formula

de Ackerman para ubicacion de polos.

Ejemplo, sistema de una entrada

Para el sistema dinamico lineal:

x =

[1 −1

1 −2

]

x+

[2

1

]

u,

usaremos la formula de Ackerman para disenar el controlador por realimentacion de estados, u = −Kx, tal que los

polos en lazo cerrado esten localizados en −1,−2.Para usar la formula de Ackerman, primero formamos la matriz de controlabilidad del sistema x(t) = Ax(t)+bu(t)

y luego encontramos la ultima fila de su inversa, denotada por q1. La matriz de controlabilidad es:

[b Ab

]=

[2 1

1 0

]

.

La inversa de la matriz arriba es: [0 1

1 −2

]

.

Entonces, q1 =[

1 −2]. El polinomio caracterıstico del sistema en lazo cerrado deseado es:

αc(s) = (s+1)(s+2) = s2 +3s+2.

Luego,


k = q1αc(A)= q1(A

2 +3A+2I2)

= q1

([1 −1

1 −2

][1 −1

1 −2

]

+3

[1 −1

1 −2

]

+2

[1 0

0 1

])

= q1

([0 1

−1 3

]

+

[3 −3

3 −6

]

+

[2 0

0 2

])

=[

1 −2][

5 −2

2 −1

]

=[

1 0]

Ubicacion de polos para sistemas de multiples entrada

Si el sistema x(t) = Ax(t)+Bu(t) ya se encuentra en la forma canonica controlable, procedemos como a contin-

uacion. Primero representamos la matriz B como:

B =

0 0 ... 0 0

0 0 ... 0 0...

...

1 x x x x

0 0 ... 0 0

0 0 ... 0 0...

...

0 1 x x x...

...

0 0 ... 0 0

0 0 ... 0 0...

...

0 0 0 0 1

=

0 0 ... 0 0

0 0 ... 0 0...

...

1 0 0 0 0

0 0 ... 0 0

0 0 ... 0 0...

...

0 1 0 0 0...

...

0 0 ... 0 0

0 0 ... 0 0...

...

0 0 0 0 1

1 x x x x

0 1 x x x...

. . ....

0 0 ... 1 x

0 0 0 0 1

= BΓ

donde la matriz Γ es no singular y cuadrada que consiste de filas de B diferentes de cero. Luego, sea:

K = Γ K.

Notese que:

BK =

0 0 ... 0 0

0 0 ... 0 0...

...

k11 k12 ... k1n−1 k1n

0 0 ... 0 0

0 0 ... 0 0...

...

k21 k22 ... k2n−1 k2n

......

0 0 ... 0 0

0 0 ... 0 0...

...

km1 km2 ... kmn−1 kmn

;


esto es, las filas no ceros en el producto BK coinciden con las filas no ceros de la matriz A en su forma canonica

controlable. Si seleccionamos, por ejemplo, las ganancias ki j, i = 1,2, ...,m y j = 1,2, ...,n, tal que:

A−BK = A− BK =

0 1 0 ... 0 0

0 0 1 ... 0 0...

...

0 0 0 ... 0 1

−αo −α1 α2 ... αn−2 αn−1

;

donde:

K = Γ−1K.

Si el sistema x(t) = Ax(t)+Bu(t) no esta en la forma canonica controlable, primero lo llevaremos a esa forma y luego

calcularemos la matriz de ganancias que ubica los polos del sistema en lazo cerrado en las posiciones deseada para el

sistema x(t) = Ax(t)+Bu(t) en la forma canonica controlable. la matriz de ganancias que ubica los polos del sistema

en lazo cerrado en las posiciones pre-especificadas para el sistema x(t) = Ax(t)+Bu(t) en sus coordinadas originales

es entonces dado por:

K = Γ−1KT.

donde T es la matriz de transformacion que lleva al sistema x(t) = Ax(t)+Bu(t) a la forma canonica controlable.

Ejemplo, multiples entradas

Para el sistema dinamico lineal:

x =

0 0 1 0

1 0 2 0

0 1 3 0

0 0 −21 5

x+

1 0

0 0

0 0

0 1

u,

usaremos su forma canonica controlable para encontrar la matriz K ∈ R2×4 tal que los polos en lazo cerrado esten

ubicados en:

−2,−3+−3+ i,−3− i,−4.

Primero transformamos x(t) = Ax(t)+Bu(t) a la forma canonica controlable. Para eso, formamos la matriz de contro-

labilidad:

[b1 b2 Ab1 Ab2 A2b1 ...

]=

1 0 0 0 0 ...0 0 1 0 0 ...0 0 0 0 1 ...0 1 0 5 0 ...

.

Entonces seleccionamos, procediendo de izquierda a derecha, las primeras cuatro columnas linealmente independientes

de la matriz de controlabilidad. Obtenemos:[

b1 b2 Ab1 A2b1

].

Entonces, los ındices de controlabilidad son d1 = 3 y d2 = 1. Rearreglamos las columnas y formamos la matriz L

de la forma:

L =[

b1 Ab1 A2b1 b2

]= I4 = L−1.

Las ultimas filas que necesitamos para la construccion de la matriz de transformacion son:

q1 =[

0 0 1 0]

and q2 =[

0 0 0 1].



T =[

q1 q1A q1A2 q2

]=

0 0 1 0

0 1 3 0

1 3 11 0

0 0 0 1

.

Y el sistema x(t) = Ax(t)+Bu(t) en el nuevo sistema coordenado tiene la forma:

A = TAT−1 =

0 1 0 0

0 0 1 0

1 2 3 0

−21 0 0 5

and B = T B =

0 0

0 0

1 0

0 1

.

El polinomio caracterıstico del sistema en lazo cerrado es:

αc(s) = (s+2)(s+3− i)(s+3+ i)(s+4) = s4 +12s3 +54s2 +108s+80.

Una posible eleccion de la matriz de ganancias K, dentro de tantas, que funciona para el caso es K tal que:

A− BK =

0 1 0 0

0 0 1 0

0 0 0 1

−80 −108 −54 −12

.

Notese que Γ = I2. Entonces:

K =

[1 2 3 −1

59 108 54 17

]

,

y luego:

K = KT =

[3 11 40 −1

54 270 977 17

]

.

El algoritmo aqui presentado para ubicacion de polos para sistemas de multiples entradas presenta mas un valor

teorico antes que practico. EL algoritmo presenta problemas de implementacion numerica porque la transformacion

del sistema x(t) = Ax(t)+Bu(t) a la forma canonica controlable sufre de propiedades numericas pobres. Existen otros

algoritmos mas robustos, como los implementados en MATLAB, especificamente en la funcion place.

La solucion del problema de ubicacion de polos para un sistema de multiples entradas no es unica. Entonces, los

grados de libertad restantes pueden ser usados para alcanzar objetivos secundarios. En la semanas siguientes discutire-

mos un metodo para construir una ley de control lineal por realimentacion de estados que ubica los polos del sistema

en lazo cerrado en posiciones pre-especificadas y al mismo tiempo minimiza un ındice de desempeno cuadratico.

Como resultado de la discusion en esta parte, enunciaremos un teorema fundamental de sistemas lineales:

Teorema El problema de ubicacion de polos tiene solucion para todas las elecciones de los n polos en lazo cerrado,

simetricos con respecto al eje real, si y solo si el sistema x(t) = Ax(t)+Bu(t) es controlable. ⋄

5.2.3. Desempeno. Control para la solucion en estado estacionario

Notese que kr no afecta la estabilidad del sistema (que es determinado por los autovalores de A−BK) pero si afecta

la solucion en estado estacionario. En particular, el punto de equilibrio y la salida del sistema en lazo cerrado estan

dados por:

xe = 0 = (A−BK)xe +Bkrr,

xe =−(A−BK)−1Bkrr,ze =Cxe +Due

entonces kr debe ser elegido tal que ze = r (el valor deseado de la salida). Asumiendo que D = 0 (el caso mas comun),

entonces:

ze = r =−C(A−BK)−1Bkrr,


luego para cuando kr sea un escalar (sistema de una entrada y una salida) tenemos:

kr =−1/(C(A−BK)−1B).

Notese que kr es exactamente la inversa de la ganancia en la frecuencia cero del sistema en lazo cerrado.

5.2.4. Especificaciones del diseno del control por realimentacion de estados

La ubicacion de los autovalores determina el comportamiento de la dinamica en lazo cerrado, y como consecuencia,

la decision mas importante es donde ubicaremos los autovalores. Como en todos los casos de diseno de sistemas de

control, existe una concesion mutua entre la magnitud de la entrada de control, la robustez del sistema a las perturba-

ciones y el desempeno del sistema en lazo cerrado. En esta seccion revisaremos brevemente estas concesiones mutuas

con el caso especial de sistemas de segunda orden.

Sistema de segunda orden

El sistema de segunda orden es una clase de sistema que ocurre frecuentemente en el analisis y diseno de sistemas

de relimentacion.

Un sistema de segunda orden se puede escribir como:

q+2ζ ωoq+ω2o q = kω2

o u, y = q.

En la forma de espacio de estados, el sistema se escribe como:

dx

dt=

[0 ωo

−ωo −2ζ ωo

]

x+

[0

kωo

]

u, y =[

1 0]

x.

Los autovalores del sistema estan dados por:

λ =−ζ ωo±√

ω2o (ζ

2−1),

y observamos que el origen es un punto de equilibrio estable si ωo > 0 y ζ > 0. Notese que los autovalores son

complejos si ζ < 1 y reales en caso contrario.

La forma de la solucion depende del valor de ζ , el cual se denomina factor de amortiguamiento del sistema. Si

ζ > 1, decimos que el sistema es sobreamortiguado, y la respuesta natural (u = 0) del sistema esta dado por:

y(t) =βx1o + x2o

β −αe−αt − αx1o + x2o

β −αe−β t ,

donde α = ωo(ζ +√

ζ 2−1) y β = ωo(ζ −√

ζ 2−1). Vemos que la respuesta consiste en la suma de dos senales que

decaen exponencialmente. Si ζ = 1, entonces el sistema es criticamente amortiguado y la solucion resulta:

y(t) = e−ζ ωot(x1o +(x2o +ζ ωox1o)t).

Notese que la respuesta es aun asintoticamente estable mientras que ωo > 0, a pesar que el segundo termino en la

solucion este creciendo con el tiempo (pero mas lento que el termino exponencial decayente que lo multiplica).

Finalmente, si 0 < ζ < 1, entonces la solucion es oscilatoria y se dice que el sistema es subamortiguado. El

parametro ωo es conocido como la frecuencia natural del sistema. La respuesta natural del sistema esta dado por:

y(t) = e−ζ ωot(x1o cosωdt +

(ζ ωo

ωd

x1o +1

ωd

x2o

)

sinωdt),


donde ωd = ωo

√

1−ζ 2 es llamada la frecuencia amortiguada.

Debido a la forma simple de un sistema de segunda orden, es posible resolver el sistema en forma analıtica para una

entrada del tipo escalon. Para este caso, la solucion depende de ζ :

y(t) = k

(

1− e−ζ ωot cosωdt +ζ

√

1−ζ 2e−ζ ωot sinωdt

)

, ζ < 1

y(t) = k(

1− e−ζ ωot(1+ωot))

, ζ = 1

y(t) = k

(

1− 1

2(

ζ√

1−ζ 2+1)e−ζ ωot(ζ−

√ζ 2−1)+

1

2(

ζ√

1−ζ 2−1)e−ζ ωot(ζ+

√ζ 2−1)

)

, ζ > 1,

donde hemos tomado x(0) = 0.

La Fig. 5.6 muestra respuestas de un sistema de 2da orden a una entrada del tipo escalon con k = 1 y para diferentes

valores de ζ . La forma de la respuesta es determinado por ζ , y la velocidad de la respuesta es determinada por ωo: la

respuesta es mas rapida si ωo es grande.6.3. STATE FEEDBACK DESIGN 185

Re

Im

ζ = 0ζ = 0.4ζ = 0.7

ζ = 1

ζ = 1.2

(a) Eigenvalues

0 5 10 150

0.5

1

1.5

2

Normalized timeω0t

y

ζ

(b) Step responses

Figure 6.8: Step response for a second-order system. Normalized step responsesh for theFigura 5.6 Respuestas de un sistema de 2da orden a una entrada del tipo escalon unitario

Adicionalmente tambien podemos calcular las propiedades de la respuesta al escalon. Por ejemplo, para un sistema

subamortiguado:

y(t) = k

(

1− ζ√

1−ζ 2e−ζ ωot sin(ωdt +ϕ)

)

,

donde ϕ = arccosζ . El sobreimpulso maximo ocurrira por primera vez cuando la derivada de y sea cero, que se puede

mostrar que es:

Mp = eπζ/√

1−ζ 2.

De la misma forma se pueden calcular otras caracterısticas de la respuesta al escalon, Cuadro 5.7.

6.3. STATE FEEDBACK DESIGN 185

Property Value ζ = 0.5 ζ = 1/√

2 ζ = 1

Steady-state value k k k k

Rise time Tr = 1/ω0 ·eϕ/ tanϕ 1.8/ω0 2.2/ω0 2.7/ω0

Overshoot Mp = e−πζ/√

1−ζ2 16% 4% 0%

Settling time (2%) Ts ≈ 4/ζω0 8.0/ω0 5.9/ω0 5.8/ω0

Figura 5.7 Propiedades de la respuesta al escalon para un sistema de 2do orden con 0 < ζ < 1.


La respuesta en la frecuencia tambien puede ser calculada explıcitamente y esta dada por:

Meiθ =kω2

o

(iω)2 +2ζ ωo(iω)+ω2o

=kω2

o

ω2o +2iζ ωoω +−ω2

Una ilustracion grafica de la respuesta en frecuencia esta dada en la Fig. 5.8. Notese que el pico de la resonancia

aumenta a medida que crece ζ .

186 CHAPTER 6. STATE FEEDBACK

Re

Im ζ ≈ 0ζ = 0.08

ζ = 0.2ζ = 0.5

ζ = 1

(a) Eigenvalues

10−2

100

102

Gai

n

10−1

100

101

−180

−90

0

Pha

se [d

eg]

Normalized frequencyω/ω0

ζ

ζ

(b) Frequency responses

Figura 5.8 Respuesta en frecuencia de un sistema de 2do orden.

Sistema de orden alto

Para sistemas de orden alto, la ubicacion de polos es considerablemente mas dificil, especialmente cuando tratamos

de considerar las multiples concesiones mutuas presentes en el diseno de control por realimentacion.

Una de las razones por las que los sistemas de segundo orden son tan importantes en los sistemas de realimentacion

es que aun para sistemas complicados la respuesta es a menudo caracterizada por los autovalores dominantes. Para

definir los autovalores dominantes, consideremos el sistema con autovalores λ j j = 1, ...,n. Definimos el factor de

amortiguamiento para el autovalor complejo como:

ζ =−Reλ

‖λ‖ .

Decimos que el par de autovalores complejos conjugados λ , λ ∗ es un par dominante si tiene el menor factor de amor-

tiguamiento comparado con los otros autovalores del sistema. Por consiguiente, se puede decir que el par dominante de

autovalores sera el factor principal en la respuesta del sistema despues que los transientes debido a otros terminos (au-

tovalores) hayan desaparecido. A pesar de que esto ultimo no siempre se cumple, a menudo el caso de los autovalores

dominantes determinana la respuesta (al escalon) del sistema.

El unico requerimiento formal en la asignacion de autovalores es que el sistema sea controlable. En la practia existen

otras restricciones porque la seleccion de autovalores tiene un gran efecto en la magnitud y la variacion del cambio

de la senal de control. Autovalores grandes requeriran por lo general grandes senales de actuacion ası como tambien

rapidos cambios de estas senales. La capacidad de los actuadores impondra restricciones en la posible ubicacion de los

autovalores del sistema en lazo cerrado.

A continuacion, usaremos las ganancias K y kr para disenar la dinamica del sistema en lazo cerrado y satisfacer

nuestro objetivo. Los ejemplos a seguir pretender ilustrar y proveer mayor intuicion en como construir tal ley de

control por realimentacion de estados.


5.2.5. Ejemplo, sistema de balance

Considerando el sistema de la Fig. 5.9, recordemos que este sistema es un modelo para una clase de sistemas en los

que el centro de masa es balanceado sobre un punto pivote.

MODELO DEL SISTEMA - puede ser NO LINEAL

Las ecuaciones (no lineales) de movimiento del sistema estan dados por:

[(M+m) −ml cosθ−ml cosθ (J+ml2)

][p

θ

]

+

[cp+ml sinθθ 2

γθ −mgl sinθ

]

=

[F

0

]

.

Por simplicidad tomamos c = γ = 0.

PUNTO DE EQUILIBRIO PARA LINEALIZACION - LINEALIZACION

Linealizando en torno al punto de equilibrio xe = (p,0,0,0), la matriz dinamica y la matriz de control son:

A =

0 0 1 0

0 0 0 1

0 m2l2g/µ 0 0

0 Mtmgl/µ 0 0

, B =

0

0

Jt/µlm/µ

,

donde µ = MtJt −m2l2, Mt = M+m y Jt = J+ml2.

ANALISIS DE SISTEMA

Controlabilidad:

La matriz de controlabilidad es:

Wc =[

B AB A2B A3B]=

0 Jt/µ 0 gl3m3/µ2

0 lm/µ 0 gl2m2(M+m)/µ2

Jt/µ 0 gl3m3g/µ2 0

lm/µ 0 g2l2m2(M+m)/µ2 0

.

El determinante de la matriz es:

det(Wc) =g2l4m4

µ46= 0,

y concluimos que el sistema es controlable. Esto significa que podemos mover el sistema desde una condicion inicial

hasta un estado final y, en particular, que siempre podemos encontrar una entrada que lleve el sistema desde una

condicion inicial hasta el punto de equilibrio.

5.2 Control por realimentacion de estados 756.1. REACHABILITY 171

(a) Segway

MF

p

θ

m

l

(b) Cart-pendulum system

Figura 5.9 Sistema de balance.

Polos en lazo abierto:

Usando los siguiente parametos para el sistema (correspondiente, a groso modo, a un humano siendo balanceado

por un carro de estabilizacion): M = 10 kg, m = 80kg, c = 0,1N/m/s, γ = 0,01N/rad/sec, l = 1m y J = 100kgm2,

g = 9,8m/m2.

Los autovalores de la dinamica del sistema en lazo abierto estan dados por λ=0, 2.6842, 2.6851,-0.0011.

DISENO DEL CONTROL

Polos en lazo cerrado:

Para decidir donde ubicar los autovalores del sistema en lazo cerrado, primero notamos que, a groso modo, la

dinamica del sistema en lazo cerrado tendra dos componentes: la dinamica rapida que estabiliza el pendulo en la

posicion invertida y la dinamica lenta que controla la posicion del carrito. Para la dinamica rapida, la dinamica natural

del pendulo (cuando cuelga hacia abajo) esta dada por ωo =√

mgl/(J+ml2) ∼ 2,1rad/s. Para proveer una respuesta

rapida escogemos un factor de amortiguamiento de ζ = 0,5, luego tratamos de ubicar el primer par de autovalores en

λ1,2 ∼ −ζ ωo±ωo ∼ −1± 2i, donde hemos usado la aproximacion√

ζ 2−1 ∼ 1. Para la dinamica lenta, escogemos

una factor de amortiguamiento igual a 0.5 para obtener un tiempo de subida de aproximadamente 5s. Esto resulta en

autovalores λ3,4 =−0,35±0,35i.

Luego el polinomio caracterıstico del sistema en lazo cerrado serıa:

αc(s) = (s+1−2i)(s+1+2i)(s+0,35−0,35i)(s+0,35+0,35i)

Estabilizacion por realimentacion de estados:

Calculando la inversa de la matriz de controlabilidad para encontrar q1. Luego, usando la formula de Ackerman:

K = q1αc(A),

obtenemos:

K =[−15,3 1731,3 −49,9 422,8

].

Esta matriz de ganancias K tambien se puede obtener usando la funcion place en MATLAB.

Controlador por alimentacion directa:

La ganancia por alimentacion directa kr es:

kr =−1/(C(A−BK)−1B) =[−15,29 0

]


SIMULACIONES

La respuesta a una entrada escalon para el controlador aplicado en el sistema linealizado esta dado en la Fig. 5.10

(parte izquierda). Observamos que la fuerza de entrada es excesivamente grande, casi tres veces la fuerza de gravedad

en su pico.

Para proveer una fuerza mas realista redisenamos el controlador para que presenta una dinamica controlada un poco

mas lenta. Para la dinamica del pendulo variamos la frecuencia natural por un factor de tres y mantenemos el factor

de amortiguamiento. La dinamica del carrito tambien la desaceleramos, el factor de amortiguamiento permanece en

0.7 pero la frecuencia natural cambia a 1 (correspondiente a un tiempo de subida de 10s). Luego, los polos deseados

resultan:

λ = −0,33±0,66i,−0,18±0,18i.El desempeno del controlador es mostrado en la Fig. 5.10.

190 CHAPTER 6. STATE FEEDBACK

0 5 10 15

0

1

2

0 5 10 15−10

0

10

20

30

Pos

ition

p[m

]

Time t [s]

Inpu

tfor

ceF

[N]

(a)λ1,2 = −1± 2i

0 10 20 30 40

0

1

2

0 10 20 30 40−10

0

10

20

30P

ositi

onp

[m]

Time t [s]

Inpu

tfor

ceF

[N]

(b) λ1,2 = −0.33± 0.66i

Linear Quadratic Regulators

Figura 5.10 Control por realimentacion de estados para un sistema de balance.

5.3. Control integral

Los controladores basados en realimentacion de estados alcanzan la respuesta correcta en estado estacionario a una

entrada de referencia mediante una calibracion cuidadosa de la ganancia kr. Sin embargo, siendo uno de los principales

usos de la realimentacion el permitir buen desempeno en la presencia de incerteza, requerir tener un modelo exacto de

la planta es indeseable. Una alternativa a la calibracion es el uso de realimentacion integral, en el cual el controlador

usa un integrador para proveer error en estado estacionario cero.

Considerando un sistema descrito por la ecuacion diferencial lineal:

x(t) = Ax(t)+Bu(t), x(0) = xo

z(t) =Cx(t),y(t) = Inx(t)

,

el objetivo es llevar la salida z a una referencia deseada r y mantenerla alli.

La Fig. 5.11 muestra que el abordaje basico de la accion integral en la realimentacion es el crear un controlador que

calcula la integral de la senal de error, que luego se usa como un termino de realimentacion. Esto se usa mediante el

siguiente aumento en la descripcion del sistema con el nuevo estado e:

d

dt

[x

e

]

=

[Ax+Bu

z− r

]

=

[Ax+Bu

Cx− r

]

.

5.3 Control integral 77

El estado e es visto como la integral de la diferencia entre la salida real z y la salida deseada r. Notese que si encon-

tramos un controlador que estabilice el sistema, entonces necesariamente tendremos e = 0 en estado estacionario y por

consiguiente z = r en estado estacionario.

Figura 5.11 Sistema de control por realimentacion de estados con aumento de la accion integral. El controlador usa el estado del sistemax, la entrada de referencia r y la integral del error de salida e para comandar el proceso (planta) a traves de su entrada u.

Dado el sistema aumentado, disenamos un controlador por realimentacion de estados de la forma usual, con una ley

de control de la forma:

u =−Kx− kie+ krr,

donde K es el termino usual de control por realimentacion de estados, ki es el termino integral y kr es usado para

fijar la entrada nominal para alcanzar el estado estacionario deseado. El punto de equilibrio resultante para el sistema

esta dado por:

xe =−(A−BK)−1B(krr− kiee).

Notese que el valor de ee no es especificado pero automaticamente se asentara en el valor que haga e = z−r = 0, lo que

implica que en equilibrio la salida sera igual a la referencia. Cabe resaltar que esto se mantiene independientemente de

los valores especificos de A, B, C y K mientras que el sistema sea estable (que se puede hacer a traves de la eleccion

apropiada de K y ki).

El compensador final esta dado por:de

dt= z− r,

u =−kie−Kx+ krr,

donde hemos incluido la dinamica del integrador como parte de la especificacion del controlador. Este tipo de com-

pensador es llamado compensador dinamico puesto que tiene su propia dinamica interna. El siguiente ejemplo ilustra

el abordaje basico.

5.3.1. Ejemplo, control de rapidez con control integral

Considere el ejemplo de control de rapidez estudiado previamente.

MODELO LINEALIZADO CON INTEGRADOR

La dinamica linealizada de la planta en torno al punto de equilibrio ve, ue esta dada por:


Figura 5.12 Sistema de control por realimentacion de estados con aumento de la accion integral. Implementacion. El compensador finalposee el estado e (la integral del error de salida), la entrada de estados del sistema x, la entrada de referencia r, la entrada de la salidacontrolada del proceso (planta) z y comanda la planta a traves de su salida u.

dx

dt= ax−bgθ +bw,

z = v = x+ ve,,

donde x = v−ve, w = u−ue, m es la masa del carro y θ es el angulo de inclinacion del terreno. La constante a depende

de las caracterısticas de aceleracion.

Si aumentamos el sistema con un integrador, la dinamica de la planta resulta:

dx

dt= ax−bgθ +bw,

de

dt= z− vr = ve + x− vr,

,

o, en la forma de espacio de estados:

d

dt

[x

e

]

=

[a 0

1 0

]

︸︷︷︸

A

[x

e

]

+

[b

0

]

︸︷︷︸

B

u+

[−bg

0

]

θ +

[0

ve− vr

]

.

Notese que cuando el sistema esta en equilibrio, tenemos e = 0, que implica que la rapidez del vehıculo v = ve+x debe

ser igual a la rapidez de la referencia deseada vr.

ANALISIS DEL SISTEMA

Controlabilidad:


Wc =[

B AB]=

[b ab

0 b

]

.

El determinante de la matriz es:

det(Wc) = b2 6= 0,

5.3 Control integral 79

y concluimos que el sistema es controlable. Esto significa que podemos mover el sistema desde una condicion inicial

hasta un estado final y, en particular, que siempre podemos encontrar una entrada que lleve el sistema desde una

condicion inicial hasta el punto de equilibrio.

Polos en lazo abierto:

Los autovalores de la dinamica del sistema en lazo abierto estan dados por λ = 0,−a

DISENO DEL CONTROL

El controlador para el modelo linealizado con integrador tiene la forma: Nuestro controlador tendra la forma:

u =−[

kx ki

]

︸︷︷︸

K

[x

e

]

+ krvr, ,

y las ganancias kx, ki y kr seran elegidos para estabilizar el sistema y proveer la entrada correcta para la rapidez deseada.

Polos en lazo cerrado:

Asumamos que deseamos disenar el sistema en lazo cerrado para que tenga el siguiente polinomio caracterıstico:

αc(s) = s2 +a1s+a2.

Estabilizacion por realimentacion de estados:

Fijando el disturbio θ = 0, el polinomio caracterıstico del sistema en lazo cerrado esta dado por:

det(sI− (A−BK)) = det

(

s

[1 0

0 1

]

−[

a 0

1 0

][

kx ki

])

= s2 +(bkx−a)s+bki,

entonces elegimos:

kx =a1 +a

b, ki =

a2

b, kr =−1/(C(A−BK)−1B) =

a

b

Controlador con integrador: Nuestro controlador tendra la forma:

de

dt= z− vr,

u =−[

kx ki

][

x

e

]

+ krvr,.

SIMULACIONES

El controlador con integrador resultante estabiliza el sistema y como consecuencia lleva e = z−vr a cero, resultando

en rastreamiento perfecto. Notese que aun teniendo un pequeno error en los valores de los parametros que definen el

sistema, mientras los autovalores del sistema en lazo cerrado sean estables, el error de rastreamiento se aproximara a

cero. Luego, la calibracion exacta de kr ya no serıa necesaria. De hecho podriamos fijar kr = 0 y dejar que el controlador

por realimentacion haga su trabajo.

Control integral por realimentacion tambien se puede usar para compensar por disturbios constantes. La Fig. 5.12

muestra el resultado de una simulacion en la que el carro encuentra una pendiente con angulo θ = 4o a los t = 8s. La

estabilidad del sistema no se ve afectada por este disturbio externo, y una vez mas vemos que la rapidez del vehıculo

converge a la rapidez deseada. Esta habilidad de manejar disturbios constante es en general una propiedad de los

controladores con realimentacion integral.


0 10 20 30 4018

19

20

0 10 20 30 400

0.5

1

Proportional

PI control

Time t [s]Time t [s]

Vel

oci

tyv

[m/s

]

Th

rott

leu

Figure 6.15:Velocity and throttle for a car with cruise control based on proportional (dashed)

and PI control (solid). The PI controller is able to adjust the throttle to compensate for theFigura 5.13 Rapidez y apertura de la valvula de alimentacion de combustible basadas en control proporcional (linea punteada) y controlproporcional integral (linea solida). Disturbio: pendiente con angulo constante.

Fuente: Capıtulo 6 del libro Feedback Systems: An Introduction for Scientists and Engineers, de Karl J. Astrom y

Richard M. Murray.


Fuente: Capıtulo 6 del libro Linear System Theory and Design, de C.T.Chen.

Capıtulo 6

Control por realimentacion de salidas

En esta parte mostramos como usar control por realimentacion de estados para modificar la dinamica del sistema

a traves de observadores. Introducimos el concepto de observabilidad y mostramos que si un sistema es observable

es posible recuperar los estados en base a las medidas de las entradas y salidas del sistema. Luego mostramos como

disenar un controlador con realimentacion partiendo de los estados observados. Un concepto importante es el principio

de separacion, que sera probado. La estructura del controlador que se deriva es bastante general y se puede obtener en

otros metodos de diseno.

6.1. Observabilidad

Como hemos observado en las secciones anteriores, la controlabilidad del sistema implica la habilidad para con-

trolar completamente el vector de estado. Supongamos ahora que no podemos acceder a los estados del sistema o que

conocer todos los estados del sistema requerirıa un numero excesivo de sensores, lo que es mas realista. En esta parte

investigamos como podemos estimar los estados usando un modelo matematico y algunas medidas. Mostraremos que

el calculo de los estados sera realizado por un sistema dinamico llamado observador.

Consideremos el sistema descrito por la ecuacion diferencial lineal:

x(t) = Ax(t)+Bu(t), x(0) = xo

y(t) =Cx(t)+Du(t),,

donde C ∈ Rp×n, p ≤ n, y D ∈ R

p×m. Nuestra intencion es conocer el comportamiento dinamico de todos los estados

a partir de sus entradas y salidas (senal medida), ver Fig. 6.1. La senal medida puede estar contaminada con ruido

n, sin embargo comenzaremos analizando el caso sin ruido. Escribimos x para el estado estimado que resultado del

observador.202 CHAPTER 7. OUTPUT FEEDBACK

u6

n

Observerx

Process

x = Ax + Bu

y = Cx + Du

y

Testing for Observability

Figura 6.1 Diagrama de bloques del observador. El observador usa las medidas del proceso y (posiblemente contaminada con ruido n) ylas entradas u para estimar el estado actual del proceso.

Observabilidad Un sistema lineal es observable si existe un tiempo finito t f > to tal que para cualquier u(t) y

resultante y(t) en el tiempo [to, t f ] podemos determinar x(t), to < t < t f , conociendo completamente la entrada u y la

salida y. ⋄

81

82 6 Control por realimentacion de salidas

Notese que podemos decir que nuestro objetivo es determinar x(to) ya que una vez x(to) es obtenido, x(t) se puede

determinar conociendo u(t) y y(t) en el intervalo de tiempo [to, t f ]. A continuacion mostraremos como podemos deter-

minar constructivamente x(to), dados u(t) y y(t). Primero notamos que la solucion y(t) esta dada por:

y(t) =CeA(t−to)x(to)+∫ t

to

CeA(t−τ)Bu(τ)dτ +Du(t).

Definiendo:

g(t) =CeA(t−to)x(to) = y(t)−∫ t

to

CeA(t−τ)Bu(τ)dτ−Du(t),

donde la parte derecha de la igualdad es conocida. Nuestro objetivo es determinar x(to). Teniendo x(to), podemos

determinar enteramente x(t) para todo t ∈ [t f , to] de la formula:

x(t) = eA(t−to)x(to)+∫ t

to

eA(t−τ)Bu(τ)dτ .

Premultiplicando ambos lados de g(t) por eAT (t−to)CT e integrando la expresion resultante entre los limites to y t f ,

obtenemos: ∫ t

to

eAT (t−to)CTCeA(t−to)dtxo =∫ t

to

eAT (t−to)CT g(t)dt.

Sea

Vo(to, t f ) =

∫ t f

to

eAT tCTCeAtdt.

Entonces, despues de algunas manipulaciones y asumiendo que la matriz Vo(to, t f ) es invertible, obtenemos:

xo = eAtoV−1o (to, t f )e

AT to

∫ t f

to

eAT (t−to)CT g(t)dt.

El conocimiento de xo nos permitira reconstruir totalmente el estado x(t) sobre todo el intervalo [to, t f ]. Concluimos

que si la matriz Vo(to, t f ) es invertible, entonces el sistema es observable.

6.1.1. Ejemplo

Para un sistema dinamico modelado por:

x =

[−1/2 1/2

−1/2 1/2

]

x+

[−1

1

]

u = Ax+bu,

y =[

1 1]

x = cx,

determinaremos x(t) sobre el intervalo [0,10] sabiendo que u(t) = 1 para t ≥ 0 y y(t) = t2 +2t para t ≥ 0.

Primero calcularemos x(0). Tenemos que to = 0 y t f = 10. Entonces:

x(to) = x(0) = eAtoV−1o (to, t f )e

AT to

∫ t f

to

eAT (t−to)cT g(t)dt

=V−1o (0,10)

∫ 10

0eAT tcT g(t)dt,

donde:

g(t) = y(t)− c

∫ 10

0eA(t−τ)bu(τ)dτ.

Para evaluar la expresion arriba, primero calcularemos eAt :

6.1 Observabilidad 83

eAt = L−1([sI2−A]−1) = L

−1

([ 1s− 1

21s2

12

1s2

− 12

1s2

1s+ 1

21s2

])

=

[1− 1

2 t 12 t

− 12 t 1+ 1

2 t

]

.

Calculando:

Vo(0,10) =

∫ 10

0eAT tcT ceAtdt,

=∫ 10

0

([1− t

1+ t

][

1− t 1+ t])

dt =∫ 10

0

[1−2t + t2 1− t2

1− t2 1+2t + t2

]

dt

=

[

t− t2 + t3

3 t− t3

3

t− t3

3 t + t2 + t3

3

]∣∣∣∣∣

10

0

=

[243,333 −323,333

−323,333 443,333

]

.

La inversa de Vo(0,10) es:

V−1o (0,10) =

[0,133 0,097

0,097 0,073

]

.

Calculando g(t) obtenemos:

g(t) = y(t)− c

∫ t

0eA(t−τ)bu(τ)dτ

= t2 +2t−[

1 1]∫ t

0

[−1+ t− τ1+ t + τ

]

dτ = t2 +2t−∫ t

0(2t−2τ)dτ

t2 +2t−2t(τ)∣∣t

0+ τ2

∣∣t

0= t2 +2t− t2 = 2t.

Entonces:∫ 10

0eAT tcT g(t)dt =

∫ 10

0

[(1− t)2t

(1+ t)2t

]

dt =

[t2− 2

3 t3

t2 + 23 t3

]∣∣∣∣

10

0

=

[−566,667

766,667

]

.

Luego calculando la condicion inicial xo:

x(0) =V−1o (0,10)

∫ t

0eAT tctg(t)dt =

[−1

1

]

.

Conociendo x(0), podemos encontrar x(t) para t ≥ 0,

x(0) = eAtx(0)+

∫ t

0eA(t−τ)bu(τ)dτ .

=

[−1+ t

1+ t

]

+

[

(−1+ t)t− t2

2

(1+ t)t− t2

2

]

=

[t2

2 −1t2

2 +2t +1

]

6.1.2. Teorema

Las siguientes condiciones son equivalentes:

1. El sistema x = Ax+Bu, y =Cx+Du es observable.

2. La matriz Vo(to, t f ) es no singular para todo t f > to.

3. Las n columnas de CeAt son linealmente independientes para todo t ∈ [0,∞) sobre los numeros reales.

4. La matriz de observabilidad Wo:


Wo =

C

CA...

CAn−1

∈ R

pn×n

es de rango completo (n).

5. rango

[sIn−A

C

]

= n, para todo s = λ (A).

⋄Al igual que en el caso de controlabilidad, usando una transformacion de similaridad podemos separar la parte

observable de la no observable. Si los autovalores de la parte no observable son asintoticamente estables, entonces

decimos que el sistema es detectable.

Una vez definido el concepto de observabilidad, volveremos a responder la pregunta de como construir un obser-

vador para un sistema. Buscamos observadores que sean representados como sistemas lineales y tomen las entradas

y salidas del sistema para producir un estimado de los estados del sistema. Esto es, deseamos contruir un sistema

dinamico de la forma:dx

dt= Fx+Gu+Hy,

donde u y y son la entrada y salida del sistema original y x ∈ Rn es un estimado del estado con la propiedad que

x(t)→ x(t) a medida que t→ ∞.

6.2. Observador de orden completo

Considerando el sistema lineal con D = 0 para simplificar la exposicion:

x(t) = Ax(t)+Bu(t), x(0) = xo

y(t) =Cx(t),,

donde C ∈Rp×n, p≤ n. Asumiendo que el sistema es observable. Nuestro objetivo es determinar un sistema dinamico

que estime el vector de estados x basado en las entradas u y salidas y.

A continuacion intentamos determinar los estados simplemente simulando las ecuaciones del sistema con las en-

tradas u, estimador en lazo abierto:dx

dt= Ax+Bu.

Para encontrar las propiedades del sistema, introducimos el error de estimacion:

x = x− x.

Entonces, la dinamica del error de estimacion esta descrito por:

˙x = x− ˙x = Ax,

con el error inicial de estimacion siendo:

x(0) = x(0)− x(0).

Si los autovalores de la matriz A estan en el semiplano complejo izquierdo abierto, entonces el error converge a cero.

Sin embargo, no tenemos ningun control sobre la variacion de la convergencia o sobre el valor adonde convergen los

estados reales y estimados (independientemente, los estados x y x tambien convergen a cero). Por otro lado, la matriz

A no necesariamente tendra sus autovalores en el semiplano complejo izquierdo abierto. Luego este estimador en lazo

abierto no es practico ya que queremos que nuestra estimacion converja rapidamente a un estado diferente de cero para

asi poder usarlo en nuestro controlador, y esto independiente de las caracterısticas del sistema. Ahora analicemos el

caso incluyendo la salida y. Este ultimo caso se denomina estimador en lazo cerrado, el observador Luenberger o el

estimador de orden completo asintotico.

La dinamica del estimador en lazo cerrado esta descrita por:

6.2 Observador de orden completo 85

dx

dt= Ax+Bu+L(y−Cx),

la realimentacion de la senal medida es proveida por el termino L(y−Cx), que es proporcional a la diferencia entre la

salida observada y la salida estimada por el observador.

La dinamica del error de estimacion viene siendo gobernada por:

˙x = x− ˙x

= (A−LC)x, x(0) = x(0)− x(0)..

La matriz L puede ser elegida del tal forma que A− LC tenga sus autovalores con partes reales negativas, y como

consecuencia, el error x tienda a cero. La variacion de la convergencia es determinada por una seleccion apropiada de

autovalores. Es importante destacar que las propiedades de convergencia pueden ser disenadas para ser mas rapidas

con relacion a la dinamica del sistema. Adicionalmente, esta version de observador trabaja aun en el caso de sistemas

inestables.

Notese la similaridad entre los problemas de encontrar un realimentador de estados y encontrar un observador.

Realimentacion de estados por ubicacion de polos es equivalente a encontrar una matriz K tal que A−BK tenga ciertos

autovalores. Disenar un observador con autovalores prescritos es equivalente a encontrar una matriz L tal que A−LC

tenga ciertos autovalores. Dado que los autovalores de una matriz y su transpuesta son los mismos podemos establecer

las siguientes equivalencias:

A ⇐⇒ AT , B ⇐⇒ CT , K ⇐⇒ LT , Wc ⇐⇒ W To .

El problema de diseno del observador es el dual del problema de diseno del realimentador de estados. Luego podemos

valernos de las herramientas aprendidas en la teorıa de realimentacion de estados. Ilustraremos este ultimo punto con

un ejemplo.

6.2.1. Ejemplo

Dadas las matrices del siguiente sistema observable:

A =

0 0 1 0

1 0 2 0

0 1 3 0

0 0 −21 5

, C =

[1 0 0 0

0 0 0 1

]

,

construir la matriz L ∈ R4×2 tal que los autovalores de A−LC estan localizados en:

−2,−3+ i,−3− i,−4.

En nuestra construccion de la matriz de ganancias L usamos la forma canonica observable del sistema mostrada en

Clase04-01. Nuestro objetivo es entonces contruir la matriz L tal que el polinomio caracterıstico de la matriz A−LC

es:

det(sI4−A+LC) = s4 +12s3 +54s2 +108s+80.

Usando la forma canonica observable del sistema, seleccionamos L tal que:

A− LC =

0 0 0 −80

1 0 0 −180

0 1 0 −54

0 0 1 −12

.

Luego tenemos que:


L =

1681 80

2270 108

1137 54

251 17

,

finalmente:

L = T T L =

1137 54

3955 188

5681 270

−23626 −1117

.

6.2.2. Control usando estados estimados

En esta seccion consideraremos la planta representado por el sistema espacio de estados de la forma:

d

dtx(t) = Ax(t)+Bu(t), x(0) = xo

y(t) =Cx(t),. (6.1)

Notese que hemos asumido que no hay termino directo en el sistema (D = 0). A menudo esta es una suposicion realista.

En esta parte nuestra intencion es disenar un controlador por realimentacion de estados para el caso donde solo la

salida es medida. Ademas asumimos que el sistema es controlable y observable. En el capıtulo anterior encontramos

una realimentacion de la forma:

u =−Kx+ krr,

para el caso en que todos los estados eran medidos, y en la seccion anterior desarrollamos un observador que genera

estimados del estado x basado en entradas y salidas. En esta parte combinaremos ambas ideas para encontrar una

realimentacion que dote de autovalores deseados al sistema en lazo cerrado para el caso de sistemas donde solo salidas

son disponibles para realimentacion.

Si todos los estados no se pueden medir, parece razonable intentar la siguiente realimentacion:

u =−Kx+ krr, (6.2)

donde x es la salida del observador de estados, en otras palabras:

dx

dt= Ax+Bu+L(y−Cx). (6.3)

Dado que el sistema (6.1) y el observador (6.3) son ambos de dimension n, el sistema en lazo cerrado es de dimension

2n con los estados (x, x). La evolucion de los estados esta descrita por (6.1)-(6.3). Para analizar el sistema en lazo

cerrado la variable de estado x es reemplazada por:

x = x− x. (6.4)

Sustrayendo (6.3) de (6.1) resulta:

˙x = x− ˙x

= Ax−Ax−L(Cx−Cx) = Ax−LCx = (A−LC)x..

Retornando a la dinamica del sistema, introduciendo u de (6.2) en (6.1) y usando (6.4) para eliminar x resulta:

dx

dt= Ax+Bu = Ax−BKx+Bkrr = Ax−BK(x− x)+BKrr

= (A−BK)x+BKx+Bkrr.(6.5)

El sistema en lazo cerrado es entonces gobernado por:


d

dt

[x

x

]

=

[A−BK BK

0 A−LC

][x

x

]

+

[Bkr

0

]

r,

y =[

C 0][

x

x

]

.(6.6)

Notese que el estado x, que representa el error del observador, no se ve afectado por la senal de referencia r. Esto es

deseable dado que no queremos que la senal de referencia genere errores en el observador.

Con la dinamica del sistema siendo diagonal por bloques, encontramos que el polinomio caracterıstico del sistema

en lazo cerrado es:

αc(s) = det(sI−A+BK)det(sI−A+LC),

lo que significa que el diseno de la ley de control es separado de la construccion del estimador. Esto es lo que conocemos

como el principio de separacion. El resultado es resumido a continuacion.

Teorema: (Ubicacion de polos por realimentacion de salidas). Considere el sistema:

d

dtx(t) = Ax(t)+Bu(t), x(0) = xo

y(t) =Cx(t).

El controlador descrito por:dx

dt= Ax+Bu+L(y−Cx) = (A−BK−LC)x+Ly,

u =−Kx+ krr,

da un sistema en lazo cerrado con el polinomio caracterıstico:

αc(s) = det(sI−A+BK)det(sI−A+LC).

Este polinomio puede tener sus raıces arbitrariamente asignadas si el sistema es controlable y observable. ⋄El controlador tiene un atractivo especial: puede ser considerado como compuesto por dos partes, one la reali-

mentacion de estados y la otra el observador. La ganancia de realimentacion K puede ser calculada como si todos los

estados pudiesen ser medidos, y solo depende de A y B. La ganancia del observador L depende solo de A y C. La

propiedad de que la ubicacion de autovalores para sistemas con realimentacion de salidas puede ser separada en la

ubicacion de autovalores una realimentacion de estados y un observador es llamada principio de separacion.

Un diagrama de bloques del controlador es mostrado en la Fig. 6.2. Notese que el controlador contiene un modelo

dinamico de la planta. Esto se conoce como principio del modelo interno; el controlador posee un modelo de la planta

que debe ser controlada.

La funcion de transferencia del sistema en lazo cerrado relacionando Y (s) y R(s), para condiciones iniciales cero,

es:

Y (s) =[

C 0][

sI−A+BK −BK

0 sI−A+LC

]−1 [B

0

]

krR(s)

=C(s−A+BK)−1BkrR(s).

La expresion arriba es identica a la del sistema en lazo cerrado si aplicaramos la ley de control por realimentacion

de estados u = −Kx+Krr. Entonces, el compensador combinado estimador-observador genera la misma funcion de

transferencia en lazo cerrado que la ley de control por realimentacion de estados.

6.2.2.1. Seleccion de polos del estimador

Algunos autores recomiendan que la parte real de los polos del estimador -esto es, la parte real de los autovalores de

la matriz A−LC - esten de 2 a 6 veces mas hacia la izquierda en el semiplano complejo izquierdo que la parte real de

los polos del controlador, que son los autovalores de la matriz A−BK. Tal eleccion asegura un decaimiento rapido del

error de estimacion x = x− x comparado con la dinamica deseada del controlador. Esto, a su vez, hace que los polos

del controlador dominen la respuesta del sistema en lazo cerrado. Dado que los polos del estimador representan una

medida de la rapidez con la que el error x = x− x decae a cero, uno debe tender a asignar los polos del estimador bien

hacia adentro del semiplano complejo izquierdo. Sin embargo, decaimiento rapido requiere de largas ganancias que

88 6 Control por realimentacion de salidas7.3. CONTROL USING ESTIMATED STATE 213

−y

6

x

6

6

6

y

Process

Observer

x

B

A

∫C

L

B∫

−C

A

Controller

ukr

−K

r

e

x

˙x

Figura 6.2 Diagrama de bloques sistema de control basado en un observador. El observador usa las medidas del proceso y y las entradasu para estimar el estado actual del proceso. El estimado es usado por el controlador por realimentacion de estados para generar la entradacorrectiva. El controlador esta formado por el observador y la realimentacion de estados.

pueden llevar a la saturacion de algunas senales y efectos no lineales impredecibles. Si los polos del estimador fuesen

mas lentos que los polos del controlador, la respuesta del sistema en lazo cerrado estarıa dominada por el estimador, lo

cual es indeseable. Como es usual en la practica de ingenierıa, el termino compromiso puede ser usado para describir

el proceso de construccion de la estructura final del compensador.

6.2.2.2. Ejemplo: Motor DC

MODELO DEL SISTEMA

Considere el sistema motor DC de armadura que presenta la esquematica de la Fig. 6.3, donde Ra = 5Ω ,

La = 200mH, Kb = 0,1V/rad/sec, Ki = 0,1Nm/A, la razon del engranaje N1/N2 = 1/50. La inercia de la armadura

es Iarmadura = 2×10−3kgm2. La carga de 10 kg esta localizada a un radio efectivo de 0.2 m. La inercia del engranaje

y friccion son despreciables.

Primero construimos un modelo espacio de estados del motor DC. Empezamos escribiendo la ecuacion que relaciona

el torque a la aceleracion angular:

τm = Ieqθ , (6.7)

donde:Ieq = Iarmadura +(N1/N2)

2Icarga

= 2×10−3kgm2 +(1/50)2×10× (0,2)2kgm2

= 2,16×10−3kgm2.

Aplicando la ley del voltaje de Kirchoff al circuito de la armadura resulta:

Raia +La

dia

dt+ eb = ea,

donde eb = Kbdθdt

. La ecuacion para el torque desarrollado es:

τm = Kiia. (6.8)

El torque del motor es igual al torque entregado a la carga (caso ideal, en la practica no hay 100% de eficiencia).

Entonces, combinando (6.7) y (6.8) resulta:


θ =Ki

Ieq

ia

Ra

Il

if constant

La

Gear

Output

Potentiometer

ea

eb

ia

l

Figure 3.8Figura 6.3 Modelo de un motor DC de armadura.

Sea x1 = ia, x2 = θ , x3 = θ = ω , u = ea, y y = θl . Luego tomando en cuenta la definicion de las variables de estado,

representamos la ecuaciones del modelo en la forma de espacio de estados:

x1

x2

x3

=

−RaLa

0 −KbLa

0 0 1KiIeq

0 0

x1

x2

x3

+

1La

0

0

u

y =[

0 N1N2

0]

x1

x2

x3

.

Sustituyendo los parametros del sistema dados, obtenemos de la ecuacion mostrada arriba:

x1

x2

x3

=

−25 0 −0,50 0 1

46,296 0 0

x1

x2

x3

+

5

0

0

u = Ax+bu

y =[

0 0,02 0]

x1

x2

x3

= cx.

ANALISIS DEL SISTEMA

Polos en lazo abierto

Los autovalores de la dinamica del sistema en lazo abierto estan dados por:

0,−24,0307,−0,9630

Controlabilidad


Wc =[

b Ab A2b]=

5 −125 3009,30 0 231,50 231,5 −5787

.

El determinante de la matriz es det(Wc) 6= 0, y concluimos que el sistema es controlable.


Observabilidad

La matriz de observabilidad, usando el sistema dual w = AT w+ cT n es:

W To =

[cT AT cT (AT )2CT

]=

0 0 0,9259

0,02 0 0

0 0,02 0

.

El determinante de la matriz es det(W To ) 6= 0, y concluimos que el sistema es observable.

6.2.2.3. DISENO DEL CONTROL POR REALIMENTACION DE ESTADOS

Polos deseados

Nuestro siguiente paso es disenar el controlador por realimentacion de estados u =−Kx+Krr, tal que los autoval-

ores de A−bK son:

−1+ i,−1− i,−10.El polinomio caracterıstico del sistema en lazo cerrado es:

αc(s) = (s+1− i)(s+1+ i)(s+10) = s3 +12s2 +22s+20.

Ganancia de realimentacion K

Para ubicar los polos en las posiciones deseadas, primero transformamos el sistema en la forma canonica controlable.

La ultima fila de la matriz de controlabilidad es:

q1 =[

0 0,0043 0],

y entonces la matriz de transformacion que buscamos tiene la forma:

T =

q1

q1A

q1A2

=

0 0,0043 0

0 0 0,0043

0,2 0 0

.

El sistema de matrices en las nuevas coordenadas es:

A = TAT−1 =

0 1 0

0 0 1

0 −23,15 −25

,

b = T b =

0

0

1

,

y,

c = cT−1 =[

4,63 0 0].

Ahora encontramos K tal que:

A− bc =

0 1 0

0 0 1

−20 −22 −12

.

Luego tenemos:

K =[

20 −1,148 −13],

y,


K = KT =[−2,60 0,0864 −0,005

].

Entonces:

A−bK =

−12 −0,432 −0,4752

0 0 1

46,294 0 0

.

O, usando la formula de Ackerman (solo funciona para sistemas una entrada - una salida):

K = q1αc(A).

K =[−2,5879 0,0860 −0,0049

]..

La funcion de transferencia del sistema en lazo cerrado es:

L (y(t))

L (r(t))=

Y (s)

R(s)= c(sI−A+bK)−1bKr =

4,6296kr

s3 +12s2 +22s+20.

La respuesta del sistema en lazo cerrado al escalon de magnitud igual a 1/kr es presentado en la Fig. 6.4.

0.25

0.2

0.15

0.1

0.05

00 2 4

Time (sec)

y(t)

6 8 10

Figura 6.4 Respuesta del sistema en lazo cerrado del motor para un escalon de magnitud 1/kr .

6.2.2.4. DISENO DEL ESTIMADOR DE ESTADOS

Polos deseados

Nuestro siguiente paso es disenar el estimador de orden completo ubicando los polos del estimador en:

−4,−5+2i,−5−2i.

El polinomio caracterıstico del estimador es:

det(sI3−A+Lc) = (s+4)(s+5−2i)(s+5+2i) = s3 +14s2 +69s+116.


Ganancia de estimador L

Para ubicar los polos en las posiciones deseadas, primero transformamos el sistema a la forma canonica observable.

O, equivalentemente al sistema dual w = AT w+ cT n a su forma canonica controlable.

La ultima fila de la inversa de W To , q1 es:

q1 =[

1,0800 0 0].

La matriz de transformacion que lleva al sistema a su forma canonica controlable es:

T =

q1

q1AT

q1(AT )2

=

1,1 0 0

−27 0 50

650 50 −1250

.

Las matrices A y c en las nuevas coordenadas son:

AT = T AT T−1 =

0 1 0

0 0 1

0 −23,1481 −25

y cT = cT T−1 =

0

0

1

.

Ahora encontramos LT tal que:

AT − cT LT =

0 1 0

0 0 1

−116 −69 −14

.

Luego tenemos:

LT =[

116 45,8519 −11],

y como consecuencia:

LT = LT T =[−8263 −550 16042

]

o,

L =

−8263

−550

16042

.

La dinamica del estimador de estados de orden completo es descrita por:

˙x = (A−Lc)x+bu+Ly,

esto es:

˙x =

−25 165,2544 −0,50 11 1

46,2963 −320,8519 0

x+

5

0

0

u+

−8263

−550

16042

y.

Conectamos el estimador de orden completo del motor DC, junto con la realimentacion de estados, entonces

obtenemos el sistema en lazo cerrado con el compensador controlador-estimador-orden-completo combinado. La Fig.

6.5 muestra la grafica de x1 y su estimado para el sistema en lazo cerrado con estimador en el lazo, donde r = 0,

x(0) =[

1 2 −0,1]T

, y x(0) = 0.

El diseno del estimador de orden reducido sera presentado junto con la teorıa de estimadores de orden reducido.

Siguiendo con la respuesta a la pregunta de como construir un observador para un sistema, al igual que en el caso del

observador de orden completo, consideraremos observadores que sean representados como sistemas lineales y tomen

las entradas y salidas del sistema para producir un estimado de los estados del sistema. La diferencia con respecto al

observador anterior radica en que se aprovechara el hecho de que ciertos estados se pueden definir directamente usando

la salida del sistema, y asi, el observador solo debe concentrarse en estimar los estados no conocidos.

6.3 Observador de orden reducido 93

3

70

6

5

4

3

2

1

0

1

2

Time (sec)

32.521.510.5

x1

x1 estimate

Figure 3.10Figura 6.5 Grafica de x1 y su estimado versus el tiempo para el sistema en lazo cerrado con un estimador de orden completo en el lazo.

6.3. Observador de orden reducido

Considerando el sistema lineal n− dimensional con D = 0 para simplificar la exposicion:

x(t) = Ax(t)+Bu(t), x(0) = xo

y(t) =Cx(t), (6.9)

donde A, B, C son, respectivamente, matrices reales constantes n×n, n× p y q×n (q≤ n). Asumiendo que el sistema

es observable. Nuestro objetivo es determinar un sistema dinamico que estime el vector de estados x basado en las

entradas u y salidas y.

Asumiendo que C tiene rango de columna completa, esto es rangoC = q. Definir

P =

[C

R

]

, (6.10)

donde R es una matriz real constante (n− q)× n y es enteramente arbitraria siempre y cuando P sea no singular.

Calculando la inversa de P como

Q = P−1 =[

Q1

... Q2

]

, (6.11)

donde Q1 y Q2 son matrices n×q y n× (n−q). Claramente se tiene que

In = PQ =

[C

R

][

Q1 Q2

]=

[CQ1 CQ2

RQ1 RQ2

]

=

[Iq 0

0 In−q

]

. (6.12)

Ahora transformaremos (6.9) usando x = Px,

˙x = PAP−1x+PBu

y =CP−1x =CQ =[

Iq 0]

x,

que puede ser particionado como,[

˙x1

˙x2

]

=

[A11 A12

A21 A22

][x1

x2

]

+

[B1

B2

]

u,

y =[

Iq 0]

x = x1

, (6.13)

donde x1 consiste en los primeros q elementos de x y x2 es lo que queda de x; A11, A12, A21 y A22 son, respectivamente,

matrices q×q, q× (n−q), (n−q)×q y (n−q)× (n−q); B1 y B2 son particionadas apropiadamente. De (6.13) vemos

que y = x1. Entonces solo necesitaremos estimar los n− q elementos de x. Consecuentemente solo necesitamos un


estimador de estados de dimension n− q en lugar de un estimador de estados de dimension n que presentamos en la

clase anterior.

Usando x1 = y, reescribimos (6.13) como

y = A11y+ A12x2 + B1u,˙x2 = A21y+ A22x2 + B2u,

(6.14)

y de forma mas sucinta aun usando

u = A21y+ B2u,

w = y− A11y− B1u,

que son funciones de senales conocidas y y u, luego (6.14) se pueden reescribir como,

SINTESIS:

˙x2 = A22x2 + u,w = A12x2.

(6.15)

Notese que si la ecuacion dinamica en (6.15) es observable, se puede construir un estimador de x2.

Teorema El sistema x=Ax+Bu, y=Cx en (6.9) es observable o, equivalentemente, el sistema ˙x= Ax+ Bu, y= Cx

en (6.13) es observable si y solo si el sistema ˙x2 = A22x2 + u, w = A12x2 en (6.15) es observable.

Asimismo, se puede probar la controlabilidad de los sistemas involucrados arriba.

Luego, x = Ax+Bu, y =Cx es observable, entonces ˙x2 = A22x2 + u, w = A12x2 es observable. Consecuentemente,

existe un estimador de estados de x2 de dimension n−q de la forma

˙x2 = (A22− LA12) ˆx2 + Lw+ u, (6.16)

tal que los autovalores de (A22− LA12) pueden ser arbitrariamente asignados mediante una eleccion apropiada de L. La

sustitucion de u y w en (6.16) resulta en

˙x2 = (A22− LA12) ˆx2 + L(y− A11y− B1u)+ A21y+ B2u. (6.17)

Esta ecuacion contiene la derivada de y. Esta derivada se puede eliminar definiendo

z = ˆx2− Ly. (6.18)

Luego (6.18) resulta

IMPLEMENTACION:

z = (A22− LA12)(z+ Ly)+(A21− LA11)y+(B2− LB1)u

= (A22− LA12)z+[(A22− LA12)L+(A21− LA11)]y+(B2− LB1)u

(6.19)

Esta es una ecuacion dinamica de dimension n−q con y y u como entradas que se puede construir facilmente usando,

por ejemplo, con circuitos de ampificadores operacionales. De (6.18) vemos que z+ Ly es un estimado de x2. De hecho,

si definimos e = x2− (z+ Ly), luego tenemos

e = ˙x2− (z+ L ˙x1) = A21x1 + A22x2 + B2u− (A22− LA12)(z+ Lx1)−(A21− LA11)x1− (B2− LB1)u− LA11x1− LA12x2− LB1u

= (A22− LA12)(x2− z− Lx1)e = (A22− LA12)e.

(6.20)

Dado que los autovalores de (A22− LA12) pueden ser arbitrariamente asignados, la razon con la que e(t) se aproxima

a cero o, equivalentemente, la razon con la que (z+ Ly) se aproxima a x2 se puede determinar por el disenador. Luego

z+ Ly provee un estimado de x2.

Combinando x1 = y = ˆx1 con ˆx2 = z+ Ly para formar


ˆx =

[ˆx1

ˆx2

]

=

[y

Ly+ z

]

Dado que x = Px, tenemos x = P−1x = Qx, o

x = Q ˆx =[

Q1 Q2

][

y

Ly+ z

]

=[

Q1 Q2

][

Iq 0

L In−q

][y

z

]

(6.21)

Esta expresion provee un estimado del vector de estados n−dimensional original x.

Una comparacion entre los estimadores de estado de orden n−q y n esta dada en funcion del orden. El observador

de orden reducido requiere de la transformacion presentada en (6.10). Excluyendo este paso, la computacion requerida

en el caso del observador de orden reducido es claramente menor en comparacion al observador de orden completo.

En la implementacion, el observador de orden reducido tambien requiere de un menor numero de integradores. En el

caso del observador de orden reducido, la senal y es realimentada atraves de la matriz constante Q1 hacia la salida

del estimador. Entonces, si y es contaminada con ruido, estos ruidos apareceran a la salida del estimador. En el caso

del observador de orden completo, la senal y es integrada o filtrada; de ahi que ruidos de alta frecuencia en y seran

suprimidos con un observador de orden completo.

6.3.1. Compensador controlador/estimador orden-reducido

Se puede probar que el principio de Separacion tambien se cumple en el caso del estimador de orden reducido.

COMPLETAR...

6.3.2. Ejemplo: Motor DC

Usando el modelo del motor DC, como descrito a continuacion

x1

x2

x3

=

−25 0 −0,50 0 1

46,296 0 0

x1

x2

x3

+

5

0

0

u = Ax+bu

y =[

0 0,02 0]

x1

x2

x3

= cx,

en esta parte nos centraremos en el diseno de un estimador de orden reducido. Escogiendo los polos del estimador de

orden reducido en −5+2i,−5−2i.Definiendo la matriz de transformacion P a continuacion:

P =

0 0,02 0

1 0 0

0 0 1

,

luego Q = P−1 queda definida como

P =

0 1 0

50 0 0

0 0 1

,

y el sistema transformado resulta,


[˙x1

˙x2

]

=

0 0 0,02

0 −25 −0,50 46,296 0

[x1

x2

]

+

0

5

0

u,

y =[

1 0 0]

x = x1

.

La sıntesis del estimador se hace en base al siguiente sistema:

˙x2 =

[−25 −0,5

46,296 0

]

x2 + u,

w =[

0 0,02]

x2

.

El polinomio caracterıstico del estimador de orden reducido es:

det(sI2− A22 + LA12) = (s+5−2i)(s+5+2i) = s2 +10s+29.

Sea L =

[l1l2

]

, entonces la siguiente ecuacion debe ser satisfecha:

∣∣∣∣s

[1 0

0 1

]

−[−25 −0,5

46,296 0

]

+

[l1l2

][

0 0,02]∣∣∣∣=

∣∣∣∣

[s+25 0,02l1 +0,5−46,296 s+0,02l2

]∣∣∣∣= s2 +10s+29.

s2 +(25+0,02l2)s+46,296(0,02l1 +0,5)+25(0,02l2) = s2 +10s+29.

Finalmente, se obtiene que: L =

[411,3228

−750

]

La dinamica del estimador de estados de orden reducido es descrita por:

z = (A22− LA12)z+[(A22− LA12)L+(A21− LA11)]y+(B2− LB1)u,

x =[

Q1 Q2

][

Iq 0

L In−q

][y

z

]

esto es:

z =

[−25 −8,7265

46,296 15

]

z+

[5

0

]

u+

[−3738,27792,6

]

y,

x =

1 0

0 0

0 1

z+

411,3228

50

−750

y

Si conectamos el estimador de orden reducido del motor DC, junto con la realimentacion de estados antes calculada,

entonces obtenemos el sistema en lazo cerrado con el compensador controlador-estimador-orden-reducido combinado.

La Fig. 6.6 muestra la grafica de x1 y su estimado para el sistema en lazo cerrado con estimador en el lazo, donde r = 0,

x(0) =[

1 0,2 −0,1]T

, y z(0) = 0.



Richard M. Murray.


10

5

0

10

5

15

20

250 2 4

Time (sec)

6 8 10

x1

x1 estimate

Figura 6.6 Graficas de x1 y su estimado versus tiempo para el sistema no lineal en lazo cerrado con estimador de orden reducido en el lazo.

Capıtulo 7

Estabilidad y desempeno

7.1. Estabilidad

En general, puede ser difıcil obtener una solucion explıcita de las ecuaciones diferenciales no lineales que modelan

un sistema dinamico. Sin embargo, a menudo no necesitamos conocer las soluciones explıcitas de las ecuaciones del

modelo. En su lugar, estamos interesados en el comportamiento de las soluciones a medida que el tiempo tiende a

infinito. Adicionalmente, en muchos sistemas fısicos un “pequeno” cambio en las condiciones iniciales resulta en un

“pequeno” cambio en la solucion. Especıficamente si un sistema es perturbado de la posicion de reposo, o de la posicion

de equilibrio, luego comienza a moverse. A grosso modo, podemos decir que una posicion de equilibrio es estable si

para pequenas perturbaciones el sistema no se va muy lejos de esta posicion. Este concepto es ilustrado mediante

una bola que descansa en equilibrio en una hoja de metal doblada en varias formas con secciones transversales como

mostrado en la Fig. 7.1. Esta figura presenta 4 escenarios posibles. Despreciando las fuerzas de friccion, una pequena

perturbacion del equilibrio lleva a:

1. Movimiento oscilatorio alrededor del punto de eequilibrio independientemente de la magnitud de las perturbaciones

iniciales. Es este caso la posicion de equilibrio es globalmente estable.

2. La nueva posicion es tambien un equilibrio, y la bola permanecera en esta posicion. Aqui la posicion de equilibrio

es estable.

3. La bola se aleja y no retorna a la posicion de equilibrio. La posicion de equilibrio es inestable.

4. Movimiento oscilatorio en torno al equilibrio, a menos que la perturbacion sea demasiado grande y la bola se ve

forzada a oscilar en una nueva posicion de equilibrio. La posicion de equilibrio es localmente estable.

(1) (2)

(3) (4)

Figura 7.1 Ilustracion de posiciones de equilibrio estables e inestables.

Si se toma en cuenta la friccion, el movimiento oscilatorio decrecera permanentemente hasta que la bola retorne

al punto de equilibrio como eb los puntos 1 y 4 arriba. Nos referimos a tales posiciones de equilibrio como siendo

asintoticamente estables. En la discusion de conceptos de estabilidad, implıcitamente, se asume, como en el punto 4,

que existe una region pequena para las perturbaciones iniciales permitidas para la cual los movimientos subsecuentes

99

100 7 Estabilidad y desempeno

convergen a la posicion de equilibrio. Sin embargo, si, como en el punto 1, cualquier perturbacion inicial conlleva a un

movimiento que converge a la posicion de equilibrio, entonces tenemos estabilidad asintotica global, que tambien se

refiere como estabilidad asintotica en la grande.

7.1.1. Definiciones basicas de estabilidad

Consideramos una clase de sistemas dinamicos modelados por la ecuacion:

x(t) = f (t,x(t)), x(to) = xo, (7.1)

donde x ∈ Rn es el vector de estados y f : R×R

n→ Rn es una funcion vectorial con los componentes:

fi(t,x1,x2, ...,xn) : R×Rn→ R, i = 1,2, ...,n.

Asumiendo que los fi’s son contınuos y que tienen derivadas parciales de primer orden contınuas. Bajo estas suposi-

ciones , la solucion de x(t) = f (t,x(t)), x(to) = xo, existe y es unica. Denotamos la solucion como x(t) = x(t; to,xo). Si

los fi’s no dependen explıcitamente de t, luego el sistema es representado como x(t) = f (t,x(t)) = f (x(t)) y es llamado

autonomo; de otra forma es llamado no autonomo. Un punto de equilibrio o estado es un vector constante, digamos xe,

tal que:

f (t,xe) = 0, para todo t.

Observese que un estado de equilibrio xe es una solucion constante de (7.1).

Si xe es un punto de equilibrio, siempre se puede transferir este punto de equilibrio al origen de Rn mediante la

definicion de la siguiente variable:

x = x− xe.

Asumamos que esto ya ha sido hecho para un punto de equilibrio en consideracion. Entonces, tenemos:

f (t,0) = 0 para todo t.

A continuacion introducimos definiciones basicas de estabilidad segun Lyapunov (1857-1918). En las siguientes

consideraciones usaremos la norma Euclidiana estandar de un vector. Entonces, si x ∈ Rn, luego:

‖x‖= ‖x‖2 = (xT x)1/2.

Definicion 1. Se dice que un estado de equilibrio xe es estable si para cualquier to dado y cualquier escalar positivo

ε , existe un escalar positivo δ = δ (to,ε) tal que si ‖x(to)− xe‖< δ , luego ‖x(t; to,xo)− xe‖< ε para todo t ≥ to.

Friedland (ver referencias al final) realiza el siguiente comentario sobre la definicion de estabilidad: “Si esta defini-

cion ‘epsilonica’ los deja frios, piensen en una competencia entre Ud, el disenador del sistema, y un adversario (nat-

uraleza?). El adversario escoge una region en el espacio de estados de radio ε y lo desafia a encontrar otra region, de

radio δ , tal que si el estado inicial comienza dentro de tu region, luego permanecera dentro de la region escogida por

el adversario. Si Ud puede hacerlo, el sistema es estable.”

Definicion 2. Un estado de equilibrio xe se dice que convergente, o atrayente, si para cualquier to dado existe un

escalar positivo δ1 = δ1(to) tal que si ‖x(to)− xe‖< δ1, entonces

lımt→∞

x(t; to,xo) = xe.

Reescribiremos la Definicion 2 como sigue. Un estado de equilibrio xe es convergente si para cualquier to existe un

escalar positivo δ1 = δ1(to) tal que si ‖x(to)−xe‖< δ1, entonces para cualquier ε1 > 0 dado existe T = T (ε1, to,xo) tal

que ‖x(t; to,xo)− xe‖< ε1 para todo t > to +T .

Definicion 3. Un estado de equilibrio xe es asintoticamente estable si es estable y convergente.

Definicion 4. Un estado de equilibrio xe se dice que es uniformemente estable si el escalar positivo δ = δ (to,ε)introducido en la Definicion 1 puede ser tomado independientemente del tiempo inicial to.

7.1 Estabilidad 101

Definicion 5. Un estado de equilibrio xe se dice que es uniformemente convergente, o uniformente atrayente, si el

escalar positivo δ1 = δ1(to) y T = T (ε1, to,xo) introducido en la Definicion 2 son independientes del tiempo inicial to.

Las dos ultimas definiciones permiten introducir la nocion de estabilidad asintotica uniforme.

Definicion 6. Un estado de equilibrio xe se dice que es uniformemente asintoticamente estable si es uniformemente

estable y uniformemente convergente.

Notese que la solucion x(t) = xe debe primero ser estable para luego calificar como asintoticamente estable. Esto

para prevenir que la trayectoria del sistema se aleje arbitrariamente del estado de equilibrio antes de que converja al

mismo. Notese tambien que el concepto de estabilidad y estabilidad asintotica segun Lyapunov son conceptos locales.

Ellos se aplican al comportamiento del sistema en una pequena vecindad del punto de equilibrio.

Un caso especial de estabilidad asintotica uniforme es estabilidad exponencial uniforme que implica estabilidad

uniforme e impone un requerimiento adicional que todas las soluciones que se originan “cerca” al punto de equilibrio

dado, xe = 0, se acercan al equilibrio exponencialmente a medida que t→ ∞. Mas rigurosamente, decimos que xe = 0

es exponencialmente uniformemente estable si es estable y existen dos constantes positivas finitas γ y λ tal que para

cualquier to y xo, cualquier solucion comenzando en la vecindad de cero satisface:

‖x(t)‖ ≤ γe−λ (t−to)‖xo‖.

Notese que γ no es menos que la unidad, y uniformidad implica que γ y λ son independientes de to (ver Fig. 7.2).

x0

x0

x(t)

x(t)

t0 tt^0

Figura 7.2 Ilustracion de estabilidad exponencial uniforme: un lımite de decaimiento exponencial es independiente del tiempo inicial to.

Un estado de equilibrio es inestable si no es estable. Una definicion ε−δ de inestabilidad es dada a continuacion.

Definicion 7. Un estado de equilibrio xe se dice que es inestable si existe un ε > 0 tal que para cualquier δ > 0

existe x(to) tal que si ‖x(to)− xe‖< δ , entonces ‖x(t1)− xe‖ ≥ 0 para algun t1 > to.

Una interpretacion geometrica en dos dimensiones de las definiciones arriba esta mostrada en la Fig. 7.3. Asumiendo

que xe = 0 es el estado de equilibrio. Si el estado de equilibrio es estable, como en la Fig. 7.3(a), entonces dado un

circulo externo de radio ε , entonces existe un circulo interno de radio δ tal que las trayectorias comenzando dentro

del circulo-δ nunca dejen el circulo-ε . Si el estado de equilibrio es asintoticamente estable, entonces las trayectorias

tienden al estado de equilibrio a medida que t tiende al ∞. Esta situacion es descrita en la Fig. 7.3(b). Finalmente, si el

estado de equilibrio es inestable, como en la Fig. 7.3(c), entonces existe un circulo-ε tal que para cualquier circulo-δexiste una trayectoria comenzando dentro del mismo que deja el circulo-ε en algun tiempo posterior. Una interpretacion

geometrica del escenario descrito arriba en una dimension esta dada en la Fig. 7.4.

7.1.2. Estabilidad segun Lyapunov

Sea V (x) =V (x1,x2, ...,xn) : Rn→R una funcion de valor real y sea S ⊂Rn sea una region compacta conteniendo

el origen x = 0 en su interior.

Definicion 8. Decimos que una funcion V =V (x) es semi definida positiva en S , con respecto a x = 0, si:

1. V es continuamente diferenciable, esto es, V ∈ C 1.

2. V (0) = 0.

3. V (x)≥ 0 para todo x ∈S .


x1

x2

x(t0)

!

(a) (c)

x1

x2

x(t0)

!

(b)

x(t0)

!

x1

x2

Figura 7.3 Ilustracion de conceptos de estabilidad en dos dimensiones. (a) Estado de equilibrio estable en el sentido de Lyapunov. (b)Estado de equilibrio asintoticamente estable. (c) Estado de equilibrio inestable.

!

!

0 t

x(t)

(a)

!

!

0 t

x(t)

(b)

!

!

0 t

x(t)

(c)

Figura 7.4 Ilustracion de conceptos de estabilidad en una dimension. (a) Estado de equilibrio estable en el sentido de Lyapunov. (b) Estadode equilibrio asintoticamente estable. (c) Estado de equilibrio inestable.

Definicion 9. Decimos que una funcion V =V (x) es definida positiva en S , con respecto a x = 0, si:

1. V es continuamente diferenciable, esto es, V ∈ C 1.

2. V (0) = 0.

3. V (x)> 0 para todo x ∈S \0.El simbolo S \0 en el punto 3 arriba denota el conjunto x : x ∈S ,x 6= 0.Definicion 10. Decimos que una funcion V =V (x) es (semi)definida positiva globalmente si las definiciones arriba

se cumplen para todo x ∈ Rn; de otra forma se dice que V =V (x) es (semi) definida positiva localmente.

Las funciones semi definida negativa y definida negativa son definidas de la misma forma pero revertiendo los signos

de desigualdad en el punto 3 de las dos definiciones de arriba.

Notas:

1. Para observar la diferencia entre funciones definida positiva y semi definida positiva, suponga que x ∈ R2 y sea:

V1(x) = x21 V2(x) = x2

1 + x22.

Ambas funciones V1 y V2 son siempre no negativas. Sin embargo, es posible que V1 sea cero aun en el caso de que

x 6= 0. Especificamente, si fijamos x = (0,c), donde c∈R es cualquier numero diferente de cero, entonces V1(x) = 0.

Por otro lado, V2(x) = 0 si y solo si x = (0,0). Entonces V1(x) es semi definida positiva y V2(x) es definida positiva.

Teorema 1. Sea V una funcion no negativa en Rn y sea V la derivada en funcion del tiempo de V a lo largo de las

trayectorias de la dinamica del sistema (7.1):

7.1 Estabilidad 103

V =∂V

∂x

dx

dt=

∂V

∂xf (t,x(t)).

Sea Sr = Sr(0) una bola de radio r alrededor del origen. Si existe r > 0 tal que V es definida positiva y V es semi

definida negativa para todo x ∈Sr, luego x = 0 es localmente estable segun Lyapunov. Si V es definida positiva y V es

definida negativa para todo x ∈Sr, luego x = 0 es localmente asintoticamente estable.

Demostracion. Ver demostracion del Teorema 3.1 en Nonlinear Systems, de H.K. Khalil, 1992.

Notas:

1. Una funcion V que satisface las condiciones del teorema es llamada funcion de Lyapunov.

2. V (x) se puede definir como una funcion de energia que limita el tamano de x.

A continuacion damos una interpretacion geometrica del teorema de Lyapunov. Primero, notese que la funcion:

V =dV (x(t))

dt,

puede ser expresada, usando la regla de la cadena como:

V = ∇V T x = ‖∇V‖‖x‖cosθ ,

donde θ es el angulo entre los vectores ∇V y x. Si ‖x‖ = 1, entonces ∇V T x puede ser entendida como el incremento

de V , evaluado en el punto x, en la direccion x. Entonces, V < 0 si y solo si 90o < θ < 270o. En ese caso, el vector

velocidad x(t) apunta en la direccion de decrecimiento de V . Ilustramos la discusion presentando Fig. 7.5. =

V

V c1

V c2 " c1

x·

Figura 7.5 Interpretacion geometrica del teorema de Lyapunov.

7.1.2.1. Ejemplos

Ejemplo 1

Sea el sistema:x1 =−x1− x2

x2 =−x2, determinar la estabilidad del punto de equilibrio x = 0.

UsandoV (x) = x2

1 + x22 > 0,∀x 6= 0

V (x) = 2x1x1 +2x2x2

=−2x21−2x1x2−2x2

2

=−(x1 + x2)2− x2

1− x22 < 0,∀x 6= 0

Luego x = 0 es globalmente asintoticamente estable.


Ejemplo 2. Funciones de Lyapunov motivadas por la fisica del problema: pendulo

Considere el pendulo, de masa unitaria, longitud unitaria, donde x1 es el angulo del pendulo con la vertical, y x2 es

la velocidad angular del pendulo.x1 = x2

x2 =−gsenx1

Para demostrar que xe = 0 (pendulo apuntando hacia abajo) es un punto de equilibrio estable, considere la siguiente

funcion como candidata a funcion de Lyapunov:

V (x) = g(1− cosx1)+x2

2

2,

definida sobre el conjunto x ∈ Rn :−π < x1 < π 0. Luego,

V (x) =[

gsenx1 x2

][

x2

−gsenx1

]

= 0,

entonces el punto de equilibrio xe = 0 es estable. ¿ Es el punto xe = 0 asintoticamente estable?

Ejemplo 3. Funciones de Lyapunov motivadas por la fisica del problema: pendulo con friccion

Considere el pendulo del ejemplo anterior pero esta vez incluya friccion unitaria:

x1 = x2

x2 =−gsenx1− x2

Sea la funcion de Lyapunov candidata:

V (x) = g(1− cosx1)+x2

2

2,

definida sobre el conjunto x ∈ Rn :−π < x1 < π 0. Luego,

V (x) =[

gsenx1 x2

][

x2

−gsenx1− x2

]

=−x22,

entonces V (x) es semidefinida negativa. No es definida negativa porque V (x) = 0 para x2 = 0 independientemente del

valor de x1; esto es V (x) = 0 a lo largo del eje x1. De ahı que solo podamos concluir que el origen es estable. Sin

embargo, si graficaramos el diagrama de plano de fase de la ecuacion del pendulo se podrıa observar que el origen

es asintoticamente estable. La funcion de Lyapunov no demuestra este ultimo hecho. A continuacion se presenta un

teorema (corolario) enunciado por LaSalle que nos permitira extender las conclusiones de estabilidad del origen usando

funciones de Lyapunov.

Corolario 1 Sea x = 0 un punto de equilibrio para el sistema (??). Sea V : S → R una funcion definida pos-

itiva contınuamente diferenciable en el dominio S que contiene al origen x = 0, tal que V (x) ≤ 0 en S . Sea

M = x ∈ S |V (x) = 0 y suponer que ninguna solucion puede estar en M, excepto la solucion trivial. Luego el

origen es asintoticamente estable. ⋄Demostracion Ver Khalil, Seccion 3.2 - Principio de Invariancia. ⋄

Ejemplo 4. Funciones de Lyapunov motivadas por la fisica del problema: control de posicion de un robot

Una tarea fundamental en robotica para los manipuladores es transferir objetos de un punto a otro, el problema

de control de posicion de un robot. Muchas de las aplicaciones venıan haciendo uso de controladores proporcionales

derivativos; sin embargo, no se presentaba una justificacion teorica para la estabilidad de tales sistemas de control

debido a la dinamica altamente no lineal del robot.

7.1 Estabilidad 105

Un robot consiste en un numero de eslabones conectadas por juntas translacionales o rotacionales, siendo que el

ultimo eslabon posee una especie de efector (actuador final). La dinamica de un brazo robotico de n-eslabones puede

ser representado por:

H(q)q+b(q, q)+g(q) = τ ,

donde q es el vector n-dimensional que describe la posicion de las juntas, τ es el vector de torques de entrada, g es el

vector de torques gravitacionales, b representa las fuerzas de Coriolis y fuerzas centripetas causadas por el movimiento

de los eslabones, y H es la matriz de inercias n×n del brazo robotico.

Considere un controlador compuesto por un termino proporcional derivativo y un termino de compensacion de

gravedad.

τ =−KDq−KPq+g(q),

donde KD y KP son matrices constantes definidas negativas.

Con la ayuda de un entendimiento fısico del problema, se puede encontrar una funcion de Lyapunov para un sistema

robotico complejo. Primero, notese que la matriz de inercia H(q) es definida positiva para cualquier q. Segundo,

el termino de control PD puede ser interpretado como una combinacion de resortes y amortiguadores. Este analisis

sugiere la siguiente funcion de Lyapunov candidata:

V =1

2[qT Hq+qT Kpq],

donde el primer termino representa la energia cinetica del manipulador, y el segundo termino denota la “energia poten-

cial artificial” asociada al resorte virtual en la ley de control.

Para calcular la derivada de la funcion V se puede usar el teorema de energia en mecanica que estipula que la

variacion en la energia cinetica es igual a la potencia dotada por las fuerzas externas. Entonces:

V = qT (τ−g)+ qT KPq.

Substituyendo la ley de control en la ecuacion arriba se tiene:

V =−qT KDq≤ 0.

Y del Teorema 1, el origen es estable. Analizando el caso cuando V (q, q) = 0: q = 0 y siendo que el brazo no puede

“atorarse” en una posicion tal que q 6= 0 (que puede mostrarse facilmente notando que la aceleracion es diferente de

cero en tales situaciones), el brazo robotico debe establecerse en q = 0. Luego, usando el Corolario 1, el origen es en

realidad globalmente asintoticamente estable.

Dos lecciones se pueden sacar de este ejemplo pratico: 1) usar las propiedades fısicas como sea posible cuando

se analice el comportamiento del sistema, y 2) conceptos fısicos como energia nos llevan a elecciones acertadas de

funciones de Lyapunov.

Figura 7.6 Un manipulador robotico.


Notas:

1. P: ¿Como encontramos la funcion de Lyapunov?

R (antes del 2000): adivinar

R (despues del 2000): SOSTOOLS (MATLAB Toolbox), para sistemas polinomiales con coeficientes conocidos

2. Teorema inverso: si xe = 0 es asintoticamente estable entonces existe V definida positiva y V definida negativa. Esto

implica, que si uno busca, uno puede encontrar una funcion de Lyapunov.

3. A menudo el caso de V (x) = xT Px funciona, donde P ∈ Rn×n es una matriz simetrica (P = PT ). La condicion que

V es definida positiva es equivalente a la condicion que P una matriz definida positiva:

xT Px > 0 para todo x 6= 0,

que se puede escribir como P > 0. Se puede mostrar que si P es simetrica y definida positiva entonces todos sus

autovalores son reales y positivos. Los conjuntos nivel de xT Px son elipsoides.

7.1.2.2. Funciones de Lyapunov para sistemas lineales

Considere un sistema dinamico lineal invariante en el tiempo modelado por la ecuacion:

x = Ax, x(to) = xo.

Consideramos la funcion de Lyapunov cuadratica:

V (x) = xT Px,

donde P es una matriz n× n real simetrica. La derivada en funcion del tiempo de V (x(t)) evaluada en la solucion de

x = Ax es:dV (x(t))

dt= V (t)

= xT (t)Px(t)+ xT (t)Px(t).

Sustituyendo x = Ax y xT = xT AT en la ecuacion arriba resulta en:

V = xT AT Px+ xT PAx

= xT (AT P+PA)x.

El requerimiento que la funcion V sea definida positiva es equivalente a que la matriz P sea definida positiva (P > 0);

y el requerimiento que V sea definida negativa es equivalente a la condicion:

Q = AT P+PA < 0, (7.2)

(como matriz). Luego el problema se centra en determinar si la matriz simetrica Q definida por la denominada ecuacion

de Lyapunoven (7.2) es definida negativa. Si este es el caso luego V satisface las condiciones del Teorema 1, y el origen

es globalmente asintoticamente estable.

Ejemplo 1

Sea un sistema lineal donde:

A =

[−1 3

0 −1

]

,

es asintoticamente estable. Eligiendo P como:

P =

[1 0

0 1

]

= I2 > 0.

7.1 Estabilidad 107

Luego,

Q = AT P+PA =

[−2 3

3 −2

]

,

que es indefinida. Entonces, a menos que Q resultase definida negativa, nada se puede inferir acerca de la estabilidad

asintotica, usando el teorema de Lyapunov, para cuando comenzamos con P y luego calculamos Q.

Una forma mas util de estudiar la estabilidad de sistemas lineales usando funciones cuadraticas es encontrando una

matriz P para una funcion Q definida negativa dada; ası:

elegir una matriz Q definida negativa

resolver para P de la ecuacion de Lyapunov en (7.2)

verficar si P es definida positiva

Si P es definida positiva, luego xT Px es una funcion de Lyapunov para el sistema lineal y la estabilidad asintotica global

esta garantizada.

Ejemplo 2Considere el sistema lineal:

dx1

dt=−ax1

dx2

dt=−bx1− cx2.

con a,b,c > 0, para el cual tenemos:

A =

[−a 0

−b −c

]

P =

[p11 p12

p21 p22

]

.

Elegimos Q =−I ∈ R2×2 y la ecuacion de Lyapunov correspondiente es:

[−a −b

0 −c

][p11 p12

p21 p22

]

+

[p11 p12

p21 p22

][−a 0

−b −c

]

=

[−1 0

0 −1

]

y resolviendo para los elementos de P tenemos:

P =

[b2+ac+c2

2a2c+2ac2−b

2c(a+c)−b

2c(a+c)12

]

o la correspondiente funcion de Lyapunov:

V (x) =b2 +ac+ c2

2a2c+2ac2x2

1−−b

2c(a+ c)x1x2 +

1

2x2

2.

Es facil verificar que P (verificar los autovalores) y por construccion V = −I < 0. Entonces el origen es globalmente

asintoticamente estable.

Uno de los elementos esenciales en el problema de control es buscar la forma de probar el desempeno de cualquier

ley de control propuesta. Cuando sea que usamos el termino “mejor” u “optimo” para describir la efectividad de una

estrategia de control dada, lo hacemos con respecto a un ındice numerico de desempeno llamado ındice de desempeno.

Asumimos que el valor del ındice de desempeno disminuye a medida que la calidad de una ley de control admisible

aumenta. El controlador admisible que asegura el cumplimiento de un objetivo del sistema y que al mismo tiempo

minimiza el ındice de desempeno es llamado de controlador optimo del sistema.


7.2. Indices de desempeno

Construir un ındice de desempeno -esto es, escoger una forma de medir el desempeno - puede ser considerado parte

del modelado del sistema. Aquı, discutiremos alguna elecciones tıpicas de ındices de desempeno.

Primero, suponemos que el objetivo es controlar un sistema modelado por las ecuaciones a continuacion:

x(t) = Ax(t)+Bu(t), x(to) = xo,y =Cx(t)

(7.3)

en un intervalo fijo [to, t f ] tal que los componentes del vector de estado sean “pequenos”. Un ındice de desempeno

apropiado de la minimizacion serıa:

J1 =∫ t f

to

xT (t)x(t)dt. (7.4)

Obviamente, si J1 es pequeno, entonces la norma del vector de estados, ‖x(t)‖, es pequena en el sentido del ındice de

desempeno descrito arriba.

Si el objetivo es controlar el sistema tal que los componentes de la salida, y(t), sean pequenos, entonces podriamos

usar el siguiente ındice de desempeno:

J2 =∫ t f

to

yT (t)y(t)dt

=∫ t f

to

xT (t)CTCx(t)dt

J2 =∫ t f

to

xT (t)Qx(t)dt, (7.5)

donde la matriz de ponderacion Q =CTC es simetrica semi definida positiva.

En el caso cuando deseamos controlar el sistema de tal forma que los componentes de la entrada, u(t), sean “no

muy grandes”, un ındice de desempeno (esfuerzo de control mınimo) apropiado a ser minimizado es:

J3 =∫ t f

to

uT (t)u(t)dt, (7.6)

o,

J4 =∫ t f

to

uT (t)Ru(t)dt, (7.7)

donde la matriz de ponderacion R es simetrica definida positiva. No hay perdida de generalidad si asumimos que

la matriz de ponderacion R es simetrica. Si R no fuese simetrica, podriamos representar el termino cuadratico uT Ru

equivalentemente como

uT Ru = uT

(R+RT

2

)

u,

donde la matriz 12 (R+RT ) es simetrica.

Como mencionado por Owens (ver referencias al final), no se puede minimizar simultaneamente los ındices de

desempeno (7.4) y (7.6) porque la minimizacion de (7.4) requiere de senales de control grandes, mientras que la mini-

mizacion de (7.6) requiere de senales de control pequenas. Para resolver el dilema podemos establecer un compromiso

entre estos dos objetivos conflictivos mediante la minimizacion de un ındice de desempeno que sea una combinacion

convexa de J1 y J3,

J = λJ1 +(1−λ )J3

=

∫ t f

to

(λxT (t)x(t)+(1−λ )uT (t)u(t))dt, (7.8)

donde λ es un parametro en el rango [0,1]. Si λ = 1, luego J = J1; y si λ = 0, luego J = J3. Mediante tentativa y error,

podemos seleccionar λ del intervalo [0,1] para establecer un compromiso entre los dos extremos. Una generalizacion

del ındice de desempeno (7.8) es:

7.2 Indices de desempeno 109

J =∫ t f

to

(xT (t)Qx(t)+uT (t)Ru(t))dt.

En algunas aplicaciones, podemos desear que el estado final x(t f ) este los mas cerca posible a cero. Entonces una

posible medida del desempeno (control terminal) a ser minimizada serıa:

J = xT (t f )Fx(t f ), (7.9)

donde F es una matriz simetrica definida positiva.

Combinando las medidas de desempeno (7.5), (7.7) y (7.9) cuando nuestro objetivo de control es mantener los

estados “pequenos”, la entrada de control “no muy grande”, y el estado final lo mas cerca de cero como sea posible. El

ındice de desempeno resultante es:

J =1

2xT (t f )Fx(t f )+

1

2

∫ t f

to

(xT (t)Qx(t)+uT (t)Ru(t))dt, (7.10)

donde el factor 12 es usado para simplicar las operaciones algebraicas siguientes. Minimizar (7.10) sujeto a (7.3) es

llamado de el problema del regulador cuadratico lineal , o el problema LQR en siglas.

En algunos casos, el objetivo del controlador es forzar que los estados del sistema sigan una trayectoria deseada,

xd(t), a lo largo del intervalo [to, t f ] a la vez que mantienen las desviaciones del estado actual x(t) “pequenas” con re-

specto a las trayectorias deseadas con un esfuerzo de control u(t) “no muy grande”, en este caso el ındice de desempeno

(seguimiento de trayectorias con esfuerzo de control mınimo) serıa:

J =1

2

∫ t f

to

((x(t)− xd(t))T Q(x(t)− xd(t))+uT (t)Ru(t))dt. (7.11)

Si el objetivo de control consiste en seguimiento de trayectorias con esfuerzo de control mınimo ademas de poseer

un estado final x(t f ) tan cerca como sea posible del estado deseado xd(t f ), el ındice de desempeno apropiado a ser

minimizado en este caso podrıa ser:

J =1

2(x(t f )− xd(t f ))

T F(x(t f )− xd(t f ))+1

2

∫ t f

to

((x(t)− xd(t))T Q(x(t)− xd(t))+uT (t)Ru(t))dt. (7.12)

Para llevar un sistema de una condicion inicial x(to) = xo a un conjunto objetivo especıfico S en tiempo mınimo, el

ındice de desempeno tiempo mınimo a ser minimizado es:

J = t f − to =∫ t f

to

dt, (7.13)

cpn t f siendo el primer instante de tiempo en que x(t) y S se intersectan.

En esta parte presentaremos el problema de optimizacion cuando no hay dependencia del tiempo. La discusion

preparara las bases para el tema que viene a continuacion que involucra optimizacion con sistemas variantes en el

tiempo.

Fuente: Capıtulos 4 y 5 del libro Systems and Control de Stanislaw H. Zak, Oxford University Press, 2003.


Richard M. Murray.

Fuente: Nonlinear Systems, de H.K. Khalil, Macmillan Publishing Company, 1992.

Fuente: Nonlinear Systems Analysis, de M. Vidyasagar, Prentice-Hall, Second Edition, 1993.

Fuente: Advanced Control System Design, de B. Friedland, Prentice-Hall, 1996.

Capıtulo 8

Control Optimo

Una vez que se ha elegido el ındice de desempeno, el siguiente paso es determinar la ley de control que minimice

ese criterio. Dos metodos que pueden ser usados para la minimizacion son el principio de maximalidad de Pontryagin

y el metodo de programacion dinamica desarrollado por R. Bellman. El abordaje variacional de Pontryagin conlleva a

un problema de condiciones de frontera en dos puntos que debe ser resuelto para obtener el control optimo. El metodo

de programacion dinamica conduce a un ecuacion funcional que puede ser resuelta usando una computadora digital.

8.1. Problema del Control Optimo

En lo que queda del curso discutiremos el como disenar controladores optimos y observadores optimos. Los resul-

tados de control optimo seran derivados usando calculo variacional. El resultado sera aplicado al caso de un ındice de

desempeno cuadratico para un sistema lineal. Ası, la ecuacion de Riccati, dependiente y no del tiempo, sera derivada

para resolver el problema del regulador cuadratico lineal. La ecuacion de Riccati puede ser resuelta si el sistema es

estabilizable. Luego, la solucion del problema del regulador cuadratico lineal existe siempre que el sistema sea estabi-

lizable. El problema de observacion optima es dual al problema del regulador cuadratico lineal. Un observador optimo

a menudo se denomina filtro de Kalman o filtro de Kalman-Bucy.

Para comenzar, seran presentadas algunas ideas de calculo variacional, necesarias para la derivacion del control

optimo.

8.1.1. Calculo Variacional

En esta seccion estaremos preocupados en minimizar un ındice de desempeno aumentado J′ = J′(x(t), t) (eliminare-

mos por ahora la dependencia en u(t)). Para llevar a cabo la minimizacion, necesitaremos encontrar el cambio inducido

en J′ por los cambios independientes de todos sus argumentos. Sin embargo, el cambio en J′ dependera del tiempo y

de los diferenciales dt y dx, siendo que las ultimas cantidades no son independientes. En esta parte derivaremos una

relacion de utilidad trabajar esta observacion.

Si x(t) es una funcion contınua del tiempo t, luego los diferenciales dx(t) y dt no son independientes del tiempo. A

continuacion definiremos un pequeno cambio en x(t) que es independiente de dt. Sea la variacion en x(t), δx(t), como

un cambio incremental en x(t) cuando el tiempo t es mantenido fijo.

Para encontrar las relaciones entre dx, δx, y dt, examinemos la Fig. 11.8. La figura muestra la funcion original

x(t) y una funcion vecina x(t)+ dx(t) sobre un intervalo especificado por un tiempo inicial to y un tiempo final T .

En adicion al incremento dx(t) a cada tiempo t, el tiempo final ha sido incrementado por dT . Es claro de la figura

que el incremento total en x al tiempo T , dx(T ), depende de dT . De acuerdo a nuestra definicion la variacion δx(T )ocurre para un valor fijo de t = T como mostrado y es independiente de dT . Siendo que x(t) y x(t)+ dx(t) tienen

aproximadamente la misma pendiente x(T ) en el tiemp t = T , y siendo que dT es pequeno, se tiene:

dx(T ) = δx(T )+ x(T )dT. (8.1)

111

112 8 Control Optimo

Esta relacion es la que usaremos mas adelante.

Figura 8.1 Relacion entre la variacion δx y el diferencial dx

Otra relacion que usaremos es la regla de Leibniz para funcionales: si x(t) ∈ Rn es una funcion de t y,

J(x) =∫ T

to

h(x(t), t)dt, (8.2)

donde J(·) y h(·) son dos funcionales escalares reales (en otras palabras, funciones de la funcion x(t)), luego:

dJ = h(x(T ),T )dT −h(x(to), to)dto +∫ T

to

[hT

x (x(t), t)δx]

dt. (8.3)

Nuestra notacion es:

hx =∂h

∂x.

8.1.2. Solucion del problema de optimizacion

La filosofia de este capitulo es derivar la solucion del problema de control optimo de la forma mas general.

8.1.2.1. Formulacion del problema

Suponiendo que la planta es descrita por un sistema no lineales variantes en el tiempo de la forma:

x = f (x(t),u(t), t), (8.4)

donde x ∈ Rn y u ∈ R

m son las variables de estado y entradas de control, respectivamente, y f (·, ·) es una funcion no

lineal que satisface la condicion usual para existencia de la solucion de la ecuacion diferencial.

Con este sistema se puede asociar el siguiente ındice de desempeno o funcional de costo:

J(x(t),u(t), t) = F(x(T ),T )+∫ T

to

L(x(t),u(t), t)dt, (8.5)

8.1 Problema del Control Optimo 113

donde [to,T ] es el intervalo de tiempo de interes. La funcion de ponderacion final F(x(T ),T ) depende del estado final y

el tiempo final, y la funcion de ponderacion L(x,u, t) depende del estado y entrada en los tiempo intermedios en [to,T ].El ındice de desempeno arriba presentado es bastante general y puede cubrir la clase de problemas practicos

definidos en la seccion anterior.

El problema de control optimo consiste en encontrar la entrada u∗(t) en el intervalo de tiempo [to,T ] que lleva la

planta (8.4) a lo largo de la trayectoria x∗(t) tal que la funcion de costo (8.5) sea minimizada, y tal que:

ψ(x(T ),T ) = 0, (8.6)

para una funcion ψ ∈ Rp. Esta ultima condicion corresponde al problema con funcion del estado final fijo.

Los roles de la funcion de ponderacion final F y la funcion del estado final fijo ψ no deben ser confundidos.

F(x(T ),T ) es una funcion del estado final que queremos hacer pequena. Una ilustracion debe ser la energıa, que es

[xT (T )S(T )x(T )]/2 donde S(T ) es una matriz de ponderacion dada. Por otro lado, F(x(T ),T ) es una funcion del estado

final que nosotros queremos fijo e igual a cero. Como ilustracion considere un satelite con estado x=[

r r θ θ]T

, donde

r y θ es el radio y posicion angular. Si queremos que el satelite se ubique en una orbita polar con radio R, luego la

funcion del estado final a ser igualada a cero debe ser:

ψ(x(T ),T ) =

r(T )−R

r(T )

θ(T )−√

µ

R3

,

con µ = GM, la constante gravitacional que atrae a la masa M.

8.1.2.2. Solucion del problema

Para resolver el problema de control optimo, usaremos multiplicadores de Lagrange para sumar las restricciones

(8.4) y (8.6) al ındice de desempeno (8.5). Dado que (8.4) se debe mantener para cada t ∈ [to,T ], se requiere un

multiplicador asociado λ (t) ∈ Rn, que es funcion del tiempo. Dado que (8.6) debe mantenerse solo en un tiempo,

requerimos de un multiplicador asociado constante ν ∈ Rp. El ındice de desempeno asociado es entonces:

J′ = F(x(T ),T )+νT ψ(x(T ),T )+∫ T

to

L(x,u, t)+λ T (t) [ f (x,u, t)− x]

dt. (8.7)

Si definimos la funcion Hamiltoniana como:

H(x,u, t) = L(x,u, t)+λ T f (x,u, t), (8.8)

podemos escribir (8.7) como:

J′ = F(x(T ),T )+νT ψ(x(T ),T )+

∫ T

to

H(x,u, t)−λ T x

dt. (8.9)

Usando la regla de Leibniz, el incremento en J′ como funcion de los incrementos en x, λ , ν , u y t es:

dJ′ = (Fx +ψTx ν)T dx|T +(Ft +ψT

t ν)dt|T +ψT |T dν +(H−λ T x)dt|T − (H−λ T x)dt|to+∫ T

to

[HT

x δx+HTu δu−λ T δ x+(Hλ − x)T δλ

]dt.

(8.10)

Para eliminar la variacion en x, integrando por partes para ver que:

−∫ T

to

λ T δ xdt =−λ T δx|T +λ T δx|to +∫ T

to

λ T δxdt. (8.11)

Sustituyendo (8.11) en (8.10) y expresando δx(T ) en terminos de dx(t) y dT usando (??), se tiene:


dJ′ = (Fx +ψTx ν−λ )T dx|T +(Ft +ψT

t ν +H−λ T x+λ T x)dt|T +ψT |T dν +(H−λ T x+λ T x)dt|to+λ T dx|to +

∫ T

to

[

(Hx + λ )T δx+HTu δu+(Hλ − x)T δλ

]

dt.(8.12)

De acuerdo a la teoria de Lagrange, el mınimo con restricciones de J es obtenido en el mınimo sin restricciones de

J′. Este mınimo se alcanza cuando dJ′ = 0 para todos los incrementos independientes en sus argumentos. Fijando en

cero los coeficientes de los incrementos independientes dν , δx, δu, y δλ se obtienen las condiciones para un mınimo

como mostrado en la Tabla 1. Para nuestras aplicaciones, to y x(to) son ambos fijos y conocidos, tal que dto y dx(to)son ambos cero. Los dos terminos evaluados en t = to en (8.12) son automaticamente igual a cero.

La condicion final en (8.13) necesita mas discusion. Hemos visto que dx(T ) y dT no son independientes (Fig.

8.1). Entonces, no podemos fijar los coeficientes de los dos primeros terminos de (8.12) igual a cero en t = T . La

complejidad de (8.13) se debe a que las ecuaciones como dadas permiten posibles variaciones en el tiempo final T .

Notese que la ecuacion de coestado es una ecuacion dinamica que debe ser desarrollada retrocediendo en el tiempo.

Esta ecuacion de coestado es tambien llamada la adjunta de la ecuacion de estado.

Modelo del sistema:

x = f (x,u, t) t ≥ to, to fixed

Indice de desempeno:

J = F(x(T ),T )+∫ T

toL(x,u, t)dt

Restriccion estado final:

ψ(x(T ),T ) = 0

Controlador optimo:

Hamiltoniano:

H(x,u, t) = L(x,u, t)+λ T f (x,u, t)Ecuacion de estado:

x =∂H

∂λ= f , t ≥ to

Ecuacion de coestados:

-λ =∂H

∂x=

∂ f T

∂xλ +

∂L

∂x, t ≤ T

Condicion estacionaria:

0 =∂H

∂u=

∂L

∂u+

∂ f T

∂uλ

Condicion de frontera:

x(to) dado

(Fx +ψTx ν−λ )T |T dx(T )+(Ft +ψT

t ν +H)|T dT = 0 (8.13)

Tabla 1. Controlador optimo no lineal contınuo con funcion de estado final fijo

La Tabla 1 muestra que el problema de control depende de la solucion de un problema de valor de frontera en dos

puntos, esto porque x(to) es dado y λ (T ) es determinado por (8.13). En general este es un problema difıcil de resolver.

En realidad no nos interesa el valor de λ (t), pero este debe ser evidentemente determinado como un paso intermedio

para encontrar la ley de control optima u∗(t), que depende de λ (t) a traves de la condicion estacionaria.

Es importante destacar lo siguiente. La derivada en el tiempo del Hamiltoniano es:

H = Ht +HTx x+HT

u u+ λ T f = Ht +HTu u+(Hx + λ )T f . (8.14)

Si u(t) es el control optimo, luego:

H = Ht . (8.15)

Ahora, en el caso de sistemas invariantes en el tiempo, f y L no son funciones explıcitas del tiempo t, y tampoco lo es

H. En esta situacion:

H = 0. (8.16)

Luego para sistemas y funcionales de costo invariantes en el tiempo, el Hamiltoniano es una constante en la trayectoria

optima.

8.1 Problema del Control Optimo 115

8.1.2.3. Ejemplos

Los primeros ejemplos establecen que la solucion al problema de optimizacion dado en la Tabla 1 es bastante

general. Los siguientes ejemplos ilustran el calculo del controlador optimo

Control de temperatura en un cuarto

Se desea calentar un cuarto usando la menor energıa posible. Si θ(t) es la temperatura del ambiente, θa la temperatura

del aire fuera del ambiente (una constante), y u(t) la tasa de provision de calor hacia el ambiente, luego la dinamica

esta dada por:

θ =−a(θ −θa)+bu,

para algunas constantes a y b, que dependen del aislamiento del ambiente entre otros. Si definimos el estado como:

x(t) = θ(t)−θa,

la ecuacion espacio de estados se puede escribir como:

x =−ax = bu.

Para poder controlar la temperatura en un intervalo fijo de tiempo [0,T ] con la menor provision posible de energıa,

definimos el ındice de desempeno como:

J =1

2

∫ T

0u2(t)dt.

A continuacion discutiremos dos objetivos de control posibles. El Hamiltoniano es:

H =u2

2+λ (−ax+bu).

De acuerdo a la Tabla 1, el control optimo u(t) es determinado resolviendo:

x = Hλ =−ax+bu,

λ = −Hx = aλ ,0 = Hu = u+bλ .

La condicion estacionaria dice que la ley de control esta dada por:

u(t) =−bλ (t),

entonces para determinar u∗(t) solo necesitamos encontrar el coestado optimo λ ∗(t).Reemplazando en las ecuaciones de estado y coestado, se tiene:

x = −ax−b2λ ,

λ = aλ ,

que deben ser resueltas para λ ∗(t) y el estado optimo x∗(t).Aun no conocemos cual es el coestado final λ (T ), pero supongamos que si lo conocemos y resolvamos el conjunto

de ecuaciones anterior. Luego se tiene:

λ (t) = e−a(T−t)λ (T ).

y:

x =−ax−b2λ (T )e−a(T−t).

Usando transformada de Laplace para resolver esta ecuacion se tiene:

X(s) =x(0)

s+a− b2λ (T )e−aT

(s+a)(s−a),

=x(0)

s+a− b2

aλ (T )e−aT

( −1/2

(s+a)+

1/2

(s−a)

)

,


tal que:

x(t) = x(0)e−at − b2

aλ (T )e−aT sinhat.

Para encontral λ (T ), consideremos dos objetivos de control, los mismos que daran dos formas de obtener λ (T ).a. Estado final fijo

Suponga que la temperatura inicial de ambiente es igual a θa = 60o. Luego:

x(0) = 0o.

Sea nuestro objetivo de control aquel que lleve la temperatura final θ(T ) a exactamente 70o en un tiempo final de T

segundos. Luego el estado final requerido es de:

x(T ) = 10o.

Note que dado que el tiempo final y el estado final estan ambos fijos, dT y dx(T ) son ambos ceros, tal que (8.13) es

satisfecha.

Usando las condiciones para x(0) y x(T ), se puede encontrar λ (T ) y el control optimo. Para encontrar λ (T ), se

tiene:

x(T ) = x(0)e−at − b2

2aλ (T )(1− e−2aT ).

Luego el coestado final sera:

λ (T ) =20a

b2(1− e−2aT ),

tal que la trayectoria optima del coestado es:

λ ∗(t) =− 10eat

b2 sinhaT.

Finalmente la tasa optima de provision de calor hacia el ambiente esta dada por:

u∗(t) =10eat

bsinhaT, 0≤ t ≤ T.

Usando la ley de control optima, la trayectoria optima pra el estado resulta:

x∗(t) = 10sinhat

sinhaT.

Que resulta en x∗(T ) = 10, como deseado.

b. Estado final libre

Suponga que no estamos preocupados con que el estado final x(T ) sea exactamente 10o, la demanda es que la ley de

control minimice:

J =1

2s(x(T )−10)2 +

1

2

∫ T

0u2(t)dt,

para algun peso s ∈ R. Si s es grande luegi la solucion optima estara cerca a 10o, dado que solo el primer termino

contribuira mas en el costo.

De acuerdo a la Tabla 1, las ecuaciones de estado y coestado todavıa son las mismas del caso a.:

λ (t) = e−a(T−t)λ (T ).

x(t) = x(0)e−at − b2

aλ (T )e−aT sinhat.

La condicion inicial todavıa es:

x(0) = 0o,

pero la condicion dinal debe ser determinada usando (8.13). El tiempo final T es fijo, tal que dT = 0 y el segundo

termino de (8.13) es automaticamente igual a cero. Dado que x(T ) no es fijo, dx(T ) no es cero (como en la parte a.).

8.2 Regulador cuadratico lineal, (LQR por sus siglas en ingles) 117

Luego se requiere que:

λ (T ) =∂F

∂x

∣∣∣∣T

= s(x(T )−10).

Reemplazar apropiadamente...

8.2. Regulador cuadratico lineal, (LQR por sus siglas en ingles)

La planta a ser investigada es una planta lineal (o linealizada) pero puede ser variante en el tiempo:

x(t) = A(t)x(t)+B(t)u(t), x(to) = xo. (8.17)

El controlador es requerido para minimizar una funcion de costo1 con forma particular, ındice de desempeno

cuadratico:

J(u) =1

2xT (T )F(T )x(T )+

1

2

∫ T

to

[xT (t)Q(t)x(t)+uT (t)R(t)u(t)

]dt. (8.18)

El tiempo final es fijo pero el estado final se puede desviar de cero, como requerido por F(T ) ≥ 0. Las matrices de

ponderacion de las senales de estado y control son semidefinida positiva y definida positiva, respectivamente, Q(t)≥ 0

y R(t)> 0, ∀t.La condicion de frontera esta dada por:

λ (T ) = F(T )x(T ), (8.19)

puesto que F(x(T ),T ) = 12 xT (T )F(T )x(T ) y se debe cumplir Fx−λ = 0.

El Hamiltoniano del sistema es:

H =1

2xT (t)Q(t)x(t)+

1

2uT (t)R(t)u(t)+λ T (t) [A(t)x(t)+B(t)u(t)] . (8.20)

La ecuacion de coestado es:

λ (t) =− ∂H

∂x(t)=−Q(t)x(t)−AT (t)λ (t), (8.21)

y la ecuacion estacionaria es:

0 =− ∂H

∂u(t)= R(t)u(t)+BT (t)λ (t)→ u(t) =−R−1(t)BT (t)λ (t). (8.22)

La ecuacion de estado y la de coestado son dos ecuaciones diferenciales en las variables de estado y coestado con la

condicion inicial de que el vector de estado comienza en x(to) = xo y que en el tiempo final T el coestado obedece

a (8.19). En general, resolver estas ecuaciones es bastante difıcil debido al problema de contorno en dos puntos. Sin

embargo en el caso lineal cuadratico es posible emplear un truco para poder resolver el problema.

Si (8.22) es insertada en la ecuacion de estados (8.17) entonces esta ecuacion y (8.21) pueden ser expresados como:

[x(t)

λ (t)

]

=

[A(t) −B(t)R−1(t)BT (t)−Q(t) −AT (t)

][x(t)λ (t)

]

= H(t)

[x(t)λ (t)

]

. (8.23)

Esta es llamada la ecuacion de Hamilton y la matriz H(t) es llamada matriz Hamiltoniana.

1 Las matrices F(T ), Q(t) y R(t) son llamadas matrices de ponderacion y determinan cuanto aumentara a la funcion de costo total ladesviacion de x(T ), x(t) y u(t) a partir de sus ceros. La restriccion de que J tenga un mınimo supone que esta limitado por abajo, luegotodos los terminos del ındice deben ser no negativos para todo valor de x y u, entonces se debe cumplir que F(T )≥ 0, Q(t)≥ 0, y R(t)> 0,∀t.


8.2.1. Ecuacion de Riccati Diferencial (DRE, por sus siglas en ingles)

La solucion de esta ecuacion de estado de dimension-2n, es:

[x(t)λ (t)

]

= φ(t, to)

[x(to)λ (to)

]

=

[φ1(t, to) φ2(t, to)φ3(t, to) φ4(t, to)

][x(to)λ (to)

]

. (8.24)

Aplicando la propiedad de matriz de transicion, la solucion tambien puede ser escrita como:

[x(t)λ (t)

]

=−[

φ1(t,T ) φ2(t,T )φ3(t,T ) φ4(t,T )

][x(T )λ (T )

]

. (8.25)

Usando (8.19) y eliminando x(T ) de las dos ecuaciones en (8.25) lleva a:

λ (t) = (φ3(t,T )+φ4(t,T )F(T )) [φ1(t,T )+φ2(t,T )F(T )]−1x(t), (8.26)

que puede ser escrito como:

λ (t) = P(t)x(t). (8.27)

La matriz P(t) es una funcion del tiempo final constante T asi como de t, tal que serıa mas correcto escribir P como

P(t,T ). Sin embargo la practica mas comun es omitir la dependencia de T .

De (8.19) se tiene que:

P(T ) = F(T ). (8.28)

La senal de control esta luego dada por la ecuacion:

u(t) =−R−1(t)BT (t)P(t)x(t). (8.29)

Esta ecuacion muestra que el vector de control es derivado a partir del vector de estados.

El problema que queda por resolver es determinar la matriz P(t). Esta matriz debe obedecer una ecuacion diferencial

que resulta de derivar (8.27) con respecto al tiempo:

λ (t) = P(t)x(t)+P(t)x(t). (8.30)

Insertando las ecuaciones de estado y coestado resulta:

−Q(t)x(t)−AT (t)P(t)x(t) = P(t)x(t)+P(t)[A(t)x(t)−B(t)R−1(t)BT (t)P(t)x(t)

]. (8.31)

Esta ecuacion tiene solucion para todo x(t) si P(t) obedece la ecuacion diferencial:

0 = P(t)+Q(t)−P(t)B(t)R−1(t)BT (t)P(t)+P(t)A(t)+AT (t)P(t), (8.32)

Esta importante ecuacion diferencial es conocida como ecuacion de Riccati diferencial. La condicion de frontera rele-

vante esta dada por (8.28):

P(T ) = F(T ) (8.33)

A continuacion consideremos las implicancias del resultado obtenido: primero, la solucion del problema del regu-

lador cuadratico lineal se reduce a un conjunto de ecuaciones diferenciales no lineales ordinarias. Segundo, la matriz

P(t) puede ser determinada por integracion numerica de (8.32) retrocediendo en el tiempo - a partir de t = T hacia

t = to - usando la condicion de frontera P(T ) = F(T ). En realidad dado que la matriz P(t) es simetrica, necesitamos

integrar solo n(n+1)/2 ecuaciones diferenciales.

Una vez que P(t) ha sido determinado, la ley de control optima puede ser escrita como una senal de la forma:

u(t) =−K(t)x(t). (8.34)

La ganancia de realimentacion dependiente del tiempo K(t) es denominada ganancia LQR (ganancia del regulador

cuadratico lineal) o ganancia del regulador optimo y puede ser inferida de (8.29) como:

8.2 Regulador cuadratico lineal, (LQR por sus siglas en ingles) 119

K(t) = R−1(t)BT (t)P(t). (8.35)

La Fig. 8.2 muestra el diagrama de bloques de la realimentacion de estados para el regulador cuadratico lineal. Se

observa que en general la ganancia LQR sera dependiente del tiempo aun cuando el sistema sea LTI y la funcion de

costo tenga matrices de ponderacion Q y R constantes. Notese que la ganancia del controlador LQR es un contro-

lador lineal por realimentacion de estados y que la ganancia LQR solo depende de parametros que se conocen con

anticipacion y luego podrıa ser calculado facilmente offline.

Figura 8.2 Sistema en lazo cerrado con LQR.

Una vez obtenida la ley de control optima, el sistema en lazo cerrado esta dado por:

x(t) = Ac(t)x(t) = [A(t)−B(t)K(t)]x(t) (8.36)

8.2.2. Valor del ındice de desempeno

El valor del ındice de desempeno puede ser evaluado en base a la solucion de la ecuacion de Riccati. Primero, notar

que:d

dt(xT Px) = xT Px+ xT Px+ xT Px.

Usando las ecuaciones (8.17), (8.29) y (8.32), se encuentra que:

d

dt(xT Px) =−xT Qx−uT Ru.

Luego en el ındice de desempeno (8.18) se obtiene:

J(u∗) =1

2xT (T )F(T )x(T )− 1

2

∫ T

to

[d

dtxT (t)P(t)x(t)

]

dt,

=1

2xT (T )F(T )x(T )− 1

2xT (T )P(T )x(T )+

1

2xT (to)P(to)x(to)

Usando (8.33) los dos primeros terminos desaparecen y el valor optimo (mınimo) del ındice de desempeno es:

Jmın =12 xT (to)P(to)x(to) (8.37)


8.2.3. Ejemplo integrador doble

Considere un integrador doble descrito por la ecuacion espacio de estado:

x(t) = Ax(t)+Bu(t) =

[0 1

0 0

][p(t)v(t)

]

+

[0

1

]

u(t)

El vector de estados esta formado por la posicion p(t) y la velocidad v(t) y la entrada de control es la aceleracion u(t).El ındice de desempeno a ser minimizado es:

J =1

2xT (t f )Fx(t f )+

1

2

∫ t f

to

[xT (t)Qx(t)+ρu2(t)

]dt

Aqui las matrices han sido seleccionadas como:

F =

[f11 f12

f12 f22

]

,

Q =

[rp 0

0 rv

]

,

ρ > 0.

Para que F y Q sean semidefinidas positivas, los parametros rp, rv y ρ y los autovalores de F deben ser no negativos.

Introduciendo las matrices de ponderacion en la ecuacion de Riccati diferencial resulta:

−P(t) = Q(t)−P(t)B(t)R−1(t)BT (t)P(t)+P(t)A(t)+AT (t)P(t)

=

[rp 0

0 rv

]

−P(t)

[0

1

]1

ρ

[0 1]

P(t)+P(t)

[0 0

1 0

]

+

[0 0

1 0

]

P(t)

Como P(t) es simetrico tenemos que resolver tres ecuaciones para los elementos de P(t) =

[p11 p12

p12 p22

]

:

− p11 = rp− 1ρ p2

12

− p12 = p11− 1ρ p12 p22

− p22 = rv +2p12− 1ρ p2

22

Estas ecuaciones tienen que ser resueltas retrocediendo en el tiempo desde el valor inicial en el tiempo t f donde

P(t f ) = F . Integracion numerica con los valores f11 = f12 = f22 = 1, rp = 3, rv = 4 y ρ = 1 resulta en la solucion

mostrada en la Fig. 8.3. Se observa de la figura que los tres valores de los elementos de la matriz P(t) se aproximan a

una constante cuando t f − t comienza a crecer.

La Fig. 8.4 muestra la respuesta del control optimo para diversos valores de la matriz Q. Se observa que para grandes

valores de los elementos de la matriz Q, la respuesta es mas rapida pero con un mayor esfuerzo de control (senal de

control mas grande).

8.3. Regulador cuadratico lineal en estado estacionario - Horizonte infinito

El control LQR antes mostrado es el control optimo que minimiza el ındice de desempeno sobre un intervalo de

tiempo finito [to,T ]. Se demuestra que lleva a una ganancia de control variante en el tiempo que puede ser calculada

offline. En la mayoria de los casos es mas conveniente tener una matriz de ganancia constante. Es preferible entonces

analizar el problema de control optimo con un ındice de desempeno extendido hasta el infinito:

8.3 Regulador cuadratico lineal en estado estacionario - Horizonte infinito 121

0 4 8 10

1

2

3

4

5

time [sec]

p22

p12

p11

P(t)

Figura 8.3 Solucion de la ecuacion de Ricatti para el integradordoble.

0 1 2 3–1

0

1

0 1 2 3

–8

–4

0

NB. The dotted signal has a minimum at –60.

Control signal

position

velocity

time [sec]

rp = 3 , rv = 4rp = rv = 100rp = rv = 10000

Figura 8.4 Respuesta del sistema integrador doble con LQR.

J(u) = lımt→∞

[∫ t

to

[xT (t)QxT (t)+uT (t)Ru(t)

]

dt. (8.38)

Adicionalmente asumiremos que el sistema es invariante en el tiempo:

x(t) = Ax(t)+Bu(t), (8.39)

tal que todas las matrices son consideradas constantes y Q = QT ≥ 0 y R = RT > 0.

Siendo que el problema de control LQR estandar consiste en mover los estados del sistema hacia cero de forma

optima, el vector de estados x(t) se aproximara al vector cero a medida que T → ∞ si el sistema en lazo cerrado es

estable. Luego no es relevante incluir el termino del estado final en el ındice de desempeno, que es lo mismo que

considerar F = 0 en (8.18).

8.3.1. Ecuacion de Riccati Algebraica (ARE, por sus siglas en ingles)

El valor optimo del ındice esta dado por (8.37). Siendo que el sistema es LTI, el valor de Jmın es independiente del

tiempo, lo que significa que la matriz P debe ser constante. Esto implica que P = 0 y la ecuacion de Riccati se reduce

a:

0 = Q−PBR−1BT P+PA+AT P. (8.40)

Este es un conjunto de ecuaciones algebraicas no lineales acopladas cuadraticas. En la practica se le llama ecuacion de

Riccati algebraica.


La ecuacion (8.40) pueda tener multiples soluciones pero solo una de ellas provee una matriz P semidefinida positiva

(siempre y cuando el sistema sea estabilizable) y la solucion particular lleva a:

Jmın =12 xT

o P∞xo. (8.41)

donde P∞ es la solucion constante de (8.40).

La matriz de ganancias optima para el control LQR en estado estacionario queda definida por:

K∞ = R−1BT P∞, (8.42)

y la senal de control resulta:

u(t) =−K∞x(t). (8.43)

En conclusion, el controlador lineal por realimentacion de estados optimo que minimiza el ındice de desempeno:

J(u) = lımt→∞

[∫ t

0[xT (t)QxT (t)+uT (t)Ru(t)

]

dt.

sujeto a

x(t) = Ax(t)+Bu(t), x(0) = xo

satisface el teorema mas abajo.

El objetivo es construir un controlador lineal por realimentacion de estados de la forma u = −Kx que estabiliza al

sistema y minimiza el ındice de desempeno J(u). Denotar dicha ley de control lineal como u∗. Primero, asumimos que

el controlador lineal por realimentacion de estados optimo existe tal que el sistema en lazo cerrado optimo

x = (A−BK)x

es asintoticamente estable. Esta suposicion implica que existe una funcion de Lyapunov V = xT Px para el sistema

en lazo cerrado; esto es, para alguna matriz definida positiva P la derivada en funcion del tiempo dVdt

evaluada en las

trayectorias del sistema en lazo cerrado es definida negativa.

Teorema 1. Si el controlador por realimentacion de estados u∗ =−Kx es tal que

minu

(dV

dt+ xT Qx+uT Ru

)

= 0, (8.44)

para algun V = xT Px, entonces el controlador es optimo. ⋄Demostracion Teorema 1 Podemos escribir la condicion del teorema como:

dV

dt

∣∣∣∣u=u∗

+ xT Qx+u∗T Ru∗ = 0.

Luego,dV

dt

∣∣∣∣u=u∗

=−xT Qx−u∗T Ru∗.

Integrando ambos lados de la ecuacion resultante con respecto al tiempo desde 0 hasta ∞, obtenemos

V (x(∞))−V (x(0) =−∫ ∞

0(xT Qx+u∗T Ru∗)dt.

Debido a la suposicion de que el sistema en lazo cerrado es asintoticamente estable, x(∞) = 0, y luego

V (x(0) = xTo Pxo =

∫ ∞

0(xT Qx+u∗T Ru∗)dt.

Entonces, hemos demostrado que si un controlador lineal por realimentacion de estados satisface la suposicion del

teorema, entonces el valor del ındice de desempeno para tal controlador es


J(u∗) = xTo Pxo.

Para demostrar que tal controlador es de hecho optimo, usamos una prueba por contradiccion. Asumimos que (8.44) se

cumple y que u∗ no es optima. Supongase que u resulta en un menor valor de J, esto es,

J(u)< J(u∗).

De (8.44) tenemos quedV

dt

∣∣∣∣u=u

+ xT Qx+ uT Ru≥ 0,

esto es,dV

dt

∣∣∣∣u=u

≥−xT Qx− uT Ru.

Integrando la expresion arriba con respecto al tiempo de 0 a ∞ resulta

V (x(0))≤∫ ∞

0(xT Qx+ uT Ru)dt

lo que implica que

J(u∗)≤ J(u),

lo que es una contradiccion, y la demostracion se ha completado. ⋄

Ejemplo 1

Considere el siguiente modelo de un sistema dinamico:

x = 2u1 +2u2, x(0) = 3,

asi como el ındice de desempeno asociado

J =∫ ∞

0(x2 + ru2

1 + ru22)dt,

donde r > 0 es un parametro.

1. Primero encontramos las solucion de ARE correspondiente al controlador lineal por realimentacion de estados

optimo. Tenemos

A = 0, B =[

2 2], Q = 1, R = rI2.

La ARE para este problema es

0 = AT P+PA+Q−PBR−1BT P = 1− 8

rp2,

cuya solucion es

p =

√r

8.

2. Ahora escribimos el sistema en lazo cerrado que se obtiene usando el controlador optimo. El controlador optimo

tienen la forma

u =−R−1BT Px =− 1√2r

[1

1

]

x.

Entonces, el sistema en lazo cerrado optimo es descrito por

x =[

2 2]

u =− 4√2r

x.


3. Finalmente, encontramos el valor de J para el sistema en lazo cerrado optimo. Tenemos que

J = x(0)T Px(0) =9

2

√r

2.

Ejemplo integrador doble con LQR en estado estacionario

Considere un integrador doble descrito por la ecuacion espacio de estado:

x(t) =

[0 1

0 0

]

x(t)+

[0

1

]

u(t)

El controlador tiene que minimizar el siguiente ındice de desempeno:

J =∫ ∞

0

[xT (t)Qx(t)+ρu2(t)

]dt

Aqui las matrices han sido seleccionadas como:

Q =

[rp 0

0 rv

]

,

ρ > 0,

donde rp y rv son los pesos de posicion y velocidad respectivamente. Con los valores dados la ecuacion de Riccati

algebraica resulta en las siguientes ecuaciones acopladas:

0 = rp− 1ρ p2

12

0 = p11− 1ρ p12 p22

0 = rv +2p12− 1ρ p2

22

Aqui, P =

[p11 p12

p12 p22

]

, es la solucion de la ARE. Resolviendo estas ecuaciones algebraicas se obtiene la solucion

definida positiva unica:p11 =

√rp

√2ρ√

rpρ + rvρp12 =

√rpρ

p22 =√

2ρ√

rpρ + rvρ

El controlador resulta en el control por realimentacion de estados con la senal de control:

u(t) =−K∞x(t) =−(R−1BT P∞)x(t)

=−[√

rp

ρ

√

2

√rp

ρ+

rv

ρ

]

x(t)

Se observa que la ganancia de control se incrementa a medida que los pesos de los estados se incrementan, en otras

palabras, rp y rv se incrementan en comparacion al peso de la senal de control. La ecuacion caracterıstic del sistema en

lazo cerrado puede ser encontrada como:

s2 +

√

2

√rp

ρ+

rv

ρs+

rp

ρ= 0

La frecuencia natural correspondiente al sistema en lazo cerrado ω y el factor de amortiguamiento ζ son calculados

como:

ω = 4

√rp

ρ


ζ =1√2

√

1+rv

2√

ρ√

rp

Para ρ = 1, si rv = 0 los polos en lazo cerrado tienen un factor de amortiguamiento de 1/√

2≈ 0,71. El “root locus”

como funcion de las ponderaciones se observa en la Fig. (8.5), donde rp varia desde 0 hasta 10. Para este sistema en

particular se observa que el factor de amortiguamiento de los polos en lazo cerrado siempre seran mayores que 0.71

para elementos de la matriz de ponderacion positivos.

8.3.2. Resolviendo la ARE usando el metodo del autovector

A continuacion presentamos un metodo para resolver la ARE referido como el metodo del autovector. Comenzamos

representando la ARE de la forma[

P −In

][

A −BR−1BT

−Q −AT

][In

P

]

= 0. (8.45)

La matriz 2n× 2n en la mitad es denominada de matriz Hamiltoniana. usamos el sımbolo H para denotar a la matriz

Hamiltoniana, esto es,

H =

[A −BR−1BT

−Q −AT

]

.

Entonces, la ARE puede ser representada como

[P −In

]H

[In

P

]

= 0

Si premultiplicamos la ecuacion arriba por X−1 y luego postmultiplicamos esta por X , donde X es una matriz no

singular n×n,[

X−1P −X−1]

H

[X

PX

]

= 0. (8.46)

Observar que si pudiesemos encontrar matrices X y PX tal que

H

[X

PX

]

=

[X

PX

]

Λ ,

luego la ecuacion (8.46) resulta en[

X−1P −X−1][

X

PX

]

Λ = 0.

–2 –1.5 –1 –0.5 0 0.5 1–1.5

–1

–0.5

0

1

1.5

0.5

2 1 0.5rv

= 5 0.1 0

Figura 8.5 Root-locus del sistema integrador doble con LQR en estado estacionario para una variacion de rp.


Luego hemos reducido el problema de resolver la ARE a aquel en el que construimos matrices X y PX apropiadas.

Continuando, sea vi el autovector de H y sea si el autovalor correspondiente; entonces

Hvi = sivi.

Si asumimos que H tiene al menos n autovalores reales distintos entre sus 2n autovalores. (Los resultados obtenidos

pueden ser generalizados para cuando los autovalores de H son complejos o iguales.) Entonces, podemos escribir

H[

v1 v2 ... vn

]=[

v1 v2 ... vn

]

s1 0 ... 0

0 s2 ... 0...

......

0 0 ... sn

.

Sea [X

PX

]

=[

v1 v2 ... vn

]

y

Λ =

s1 0 ... 0

0 s2 ... 0...

......

0 0 ... sn

.

La seleccion de X y PX constituye una posible solucion de la ecuacion

[X−1P −X−1

][

X

PX

]

Λ = 0.

Para construir P, particionamos la matriz de autovectores[

v1 v2 ... vn

]de orden 2n×n en dos submatrices de orden

n×n como sigue[

v1 v2 ... vn

]=

[W

Z

]

.

Luego,[

X

PX

]

=

[W

Z

]

.

Tomando X =W y PX = Z y asumiendo que W es invertible, obtenemos

P = ZW−1. (8.47)

Ahora tenemos que elegir que conjunto de n autovalores elegir, dentro de todos los autovalores de H, para poder

contruir P. En el caso en que los 2n autovalores de H son diferentes, el numero de matrices P generadas con el metodo

descrito arriba son(2n)!

(n!)2.

Sea Q = CTC una factorizacion de rango completo de Q. Del Teorema 3 de Kucera (ver referencias al final) se

concluye que la matriz Hamiltoniana H tiene n autovalores en el semiplano complejo izquierdo y n en el semiplano

complejo derecho si y solo si el sistema como definido en (1) es estabilizable y detectable. La matriz P que nosotros

buscamos corresponde a los autovalores asintoticamente estables de H. Con P construido como deseado, tenemos el

siguiente resultado.

Teorema 2. Los polos del sistema en lazo cerrado

x(t) = (A−BR−1BT P)x(t)

son aquellos autovalores de H que tienen parte real negativa. ⋄


Demostracion Siendo que[

v1 v2 ... vn

]=

[W

Z

]

, podemos escribir

[A −BR−1BT

−Q −AT

][W

Z

]

=

[W

Z

]

Λ .

Realizando las multiplicaciones apropiadas de bloques de matrices n×n resulta

AW −BR−1BT Z =WΛ ,

o

A−BR−1BT ZW−1 = A−BR−1BT P =WΛW−1,

dado que P = ZW−1. Entonces, la matriz A−BR−1BT P es similar a la matriz Λ cuyos autovalores son los autovalores

asintoticamente estables de H. Luego, la demostracion ha sido completada. ⋄

Ejemplo 1

Considere el siguiente modelo de un sistema dinamico

x = 2x+u,

asi como el ındice de desempeno asociado

J =∫ ∞

0(x2 + ru2)dt.

Encuentre el valor de r tal que el sistema en lazo cerrado optimo tenga un polo en −3.

1. Formamos la matriz Hamiltoniana asociada

H =

[A −BR−1BT

−Q −AT

]

=

[2 − 1

r

−1 −2

]

.

2. La ecuacion caracterıstica de H es

det(sI2−H) = s2−4− 1

r= 0.

Luego,

r =1

5

resulta en el sistema en lazo cerrado optimo teniendo su polo localizado en −3.

Ejemplo 2

Considere un modelo simple de un robot manipulador como mostrado en la Fig. ??. El movimiento del brazo

del robot es controlado por un motor DC a traves de un engranaje. El motor DC es controlado por armadura y su

figura esquematica es presentada en la Fig. 8.7. Asumimos que el momento de inercia del motor es despreciable en

comparacion con el del brazo del robot. Modelamos el brazo como una masa puntual m ubicada en el extremo final

de la barra (sin masa) de longitud l. Entonces el momento de inercia del brazo Ib = ml2. Asumimos que el tren de

engranajes no tiene juego, y que todos los ejes conectores son rıgidos. Como podemos ver de la Fig. 8.6, la rotacion

del brazo en sentido contrario a las agujas del reloj es definida como positiva, y la rotacion siguiendo las agujas del

reloj es considerada como negativa; mientras que la rotacion del eje del motor en sentido contrario a las agujas del

reloj es definida como negativa, y la rotacion del eje siguiendo las agujas del reloj es definida como positiva. El torque

entregado por el motor es

Tm = Kmia,


donde Km es la constante del torque del motor, y ia es la corriente de armadura. Sea N la razon de los engranajes. Luego

tenemos:θp

θm

=radio del engranaje del motor

radio del engranaje del brazo=

numero de dientes del engranaje del motor

numero de dientes del engranaje del brazo=

1

N.

Gear

1:N

Massless rod of length l

p

Mass m

DC motor

Control voltage

u

Figura 8.6 Robot manipulador controlador por un motor DC via un en-granaje.

RaLa

if constant

eb back emf

m motor shaft

position

Field circuit

Armature circuit

u

ia

Figura 8.7 Figura esquematica de un motor DC controladopor armadura.

Esto ocurre puesto que los engranajes estan en contacto y luego:

θp× radio del engranaje del brazo = θm× radio del engranaje del motor,

y los radios de los engranajes son proporcionales a sus numeros de dientes. El trabajo realizado por cada engranaje

debe ser igual. Sea Tp que denota el torque aplicado al brazo del robot. Entonces,

Tpθp = Tmθm.

Entonces, el torque aplicado al pendulo es

Tp = NTm = NKmia.

Usando la segunda Ley de Newton para escribir la ecuacion que modela la dinamica del brazo,

Ib

d2θp

dt2= mgl sinθp +Tp.

Sustituyendo las expresiones para Ib y Tp y luego rearreglando tenemos

ml2 d2θp

dt2= mgl sinθp +NKmia,

donde g = 9,8m/s2 es la aceleracion de la gravedad. Aplicado la Ley de Kirchhoff (voltaje) al circuito de armadura

resulta en

La

dia

dt+Raia +KbN

dθp

dt= u,

donde Kb es la constante emf. Asumiendo que La ≈ 0. Entonces,

u = Raia +KbNdθp

dt,


A continuacion calculamos ia de la expresion anterior y sustituimos el resultado en la ecuacion de movimiento para

obtener:

ml2 d2θp

dt2= mgl sinθp +NKm

(

u

Ra

− KbNdθp

dt

Ra

)

.

Ahora podemos construir el modelo de espacio de estados para el robot de un brazo. Escogiendo los siguientes estados

y variables de salida:

x1 = θp, x2 =dθp

dt= ωp, y y = x1.

Entonces, obtenemos el siguiente modelo de espacio de estados simple del robot manipulador:

[x1

x2

]

=

[

x2

gl

sinx1− KbKmN2

ml2Rax2 +

NKm

ml2Rau

]

y = x1.

Parametros razonables para el robot son: l = 1m, m = 1kg, N = 10, Km = 0,1Nm/A, Kb = 0,1Vsec/rad, Ra = 1Ω .

Usando los valores de los parametros el modelo del robot toma la siguiente forma:

[x1

x2

]

=

[x2

9,8sinx1− x2 +u

]

y = x1.

Respuestas en el tiempo para las trayectorias de estado del sistema no lineal sin control, u = 0, son mostrados en

la Fig. 8.8 para las condiciones iniciales x1(0) = 1 y x2(0) = 0. Un plano de fase del sistema no lineal sin control es

mostrado en la Fig. 8.9. El modelo linealizado alrededor de x = 0, u = 0 tiene la forma

d

dt∆x =

[0 1

9,8 −1

]

∆x+

[0

1

]

∆u,

∆y =[

1 0]

∆x.

0 2 4 6 8 10

Time (sec)

5

4

3

2

1

0

1

2

3

x1,x

2

x1

x2

Figure 5.13Figura 8.8 Graficas de y= x1 y x2 versus tiempo para el sistema no linealsin control.

10

8

6

4

2

0

2

4

6

8

5 0 5 101010

x1

x2

Figura 8.9 Un plano de fase del sistema no lineal sin control.

En la Fig. 8.10 son mostradas las graficas de y = x1 y x2 versus tiempo para el sistema lineal sin control. Un plano

de fase del sistema linealizado es mostrado en la Fig. 8.11. Sea

J =∫ ∞

0(y2 +u2)dt.


Encontraremos una ley de control lineal por realimentacion de estados u =−kx que minimice J sujeto a las ecuaciones

dadas por la representacion espacio de estados lineal. Tenemos

Q = cT c =

[1 0

0 0

]

y R = [1].

25

20

15

10

5

00 10.2 0.4 0.6 0.8

x1,x

2

Time (sec)

x1

x2

Figura 8.10 Graficas de y = x1 y x2 versus tiempo para el sistema lineal-izado sin control.

10

x2

x1

8

6

4

2

0

2

4

6

8

1010 5 0 5 10

Figura 8.11 Un plano de fase del sistema linealizado sin con-trol.

Resolviendo la ecuacion de Riccati, se define la matriz Hamiltoniana asociada como

H =

[A −BR−1BT

−Q −AT

]

=

0 1 0 0

9,8 −1 0 −1

−1 0 0 −9,80 0 −1 1

,

y calculando los autovalores y autovectores de H tenemos que

H

−0,3443 −0,0485 0,2604 0,0496

−0,9298 −0,1770 −0,9499 −0,1339

−0,1124 −0,9196 0,1691 0,9555

0,0661 0,3473 0,0364 0,2582

=

−0,3443 −0,0485 0,2604 0,0496

−0,9298 −0,1770 −0,9499 −0,1339

−0,1124 −0,9196 0,1691 0,9555

0,0661 0,3473 0,0364 0,2582

2,7003 0 0 0

0 3,6481 0 0

0 0 −3,6481 0

0 0 0 −2,7003

.

Identificando los autovectores correspondientes a los autovalores con parte real negativa se puede definir

W =

[0,2604 0,0496

−0,9499 −0,1339

]

y Z =

[0,1691 0,9555

0,0364 0,2582

]

,

luego sabiendo que P = ZW−1 se obtiene

P =

[72,3371 19,6509

19,6509 5,3484

]

.

Entonces:

k =[

19,6509 5,3484],

y


Ac =

[0 1

−9,8509 −6,3484

]

∆x.

Las graficas de x1 y x2 versus tiempo del sistema en lazo cerrado

x = (A−bk)x = Acx

y = x1,

cuando las condiciones iniciales son x1(0) = 1 y x2(0) = 0, son mostradas en la Fig. 8.12. Un plano de fase del sistema

linealizado en lazo cerrado es mostrado en la Fig. 8.13. Aplicando el controlador optimo al modelo no lineal, las

graficas de x1 y x2 versus tiempo para el sistema no lineal en lazo cerrado son mostradas en la Fig. 8.14. Un plano de

fase del sistema no lineal en lazo cerrado es mostrado en la Fig. 8.15. Los polos del sistema linealizado en lazo cerrado

-esto es, los autovalores de Ac- son λ1 =−2,7003 y λ2 =−3,6481.

1

0.5

0

0 1 2

Time (sec)

x1,x 2

x1

x2

3 4

0.5

1

1.55

Figura 8.12 Graficas de x1 y x2 versus tiempo para el sistema linealizadoen lazo cerrado.

10

x2

x1

8

6

4

2

0

2

4

6

8

1010 105 0 5

A phase portrait of the linear closedloop system of Example 5.13.

Figura 8.13 Un plano de fase del sistema linealizado en lazocerrado.

x1,x 2

x1

x2

0

1

0.5

0.5

1

1.50 1 2

Time (sec)

3 4 5

Figura 8.14 Graficas de x1 y x2 versus tiempo para el sistema no linealen lazo cerrado.

x2

x1

10

8

6

4

2

0

2

4

6

8

1010 105 0 5

Figura 8.15 Un plano de fase del sistema no lineal en lazocerrado.

Ejemplo Aeronave de Impulsion

Considere la dinamica original de la aeronave de impulsion presentada en clases anteriores:


dz

dt=

z4

z5

z6

−gsinθ − cm

z4

−gcosθ − cm

z5

0

+

0

0

01m

cosθF1− 1m

sinθF21m

sinθF1 +1m

cosθF2rJF1

.

Los parametros del sistema son m = 4kg, J = 0,0475kgm2, r = 0,25m, g = 9,8m/s2, c = 0,05Ns/m, que corresponden

a un modelo escalado del sistema. El punto de equilibrio para el sistema esta dado por F1 = 0, F2 = mg y ze =(xe,ye,0,0,0,0). Calculamos el sistema linealizado:

A =

0 0 0 1 0 0

0 0 0 0 1 0

0 0 0 0 0 1

0 0 −g −c/m 0 0

0 0 0 0 −c/m 0

0 0 0 0 0 0

, B =

0 0

0 0

0 01m

0

0 1m

rJ

0

, C =

[1 0 0 0 0 0

0 1 0 0 0 0

]

, D =

[0 0

0 0

]

.

Haciendo z = z− ze y v = u−ue, el sistema linealizado esta dado por:

dz

dt= Az+Bv,

y =Cz.

Se puede verificar que el sistema es alcanzable.

Para calcular el regulador cuadratico lineal para el sistema, escribimos la funcion costo como:

J =∫ ∞

0(zT Qz+ vT Rv)dt,

donde z = z− ze y v = u−ue representan las coordenadas locales en torno al punto de equilibrio (ze,ue). Comenzamos

con matrices diagonales para los costos del estado y la entrada:

Q = I6×6, R = I2×2.

Luego la ley de control de la forma v = −Kz sera usada para derivar la ley de control en terminos de las variables

originales:

u = v+ue =−K(z− ze)+ue.

Como especificado en clases anteriores, los puntos de equilibrio corresponden a ue = (0,mg) y ze = (xe,ye,0,0,0,0).La respuesta del controlador a un cambio de la funcion escalon para la posicion deseada es mostrada en la Fig. 8.16a.

La respuesta puede ser afinada cambiando los pesos en la funcion de costo. La Fig. 8.16b muestra la respuesta en la

direccion x para diferentes selecciones del peso ρ , siendo que R = ρI2.

6.3. STATE FEEDBACK DESIGN 193

0 2 4 6 8 100

0.5

1

Time t [s]

Positionx,

y[m

]

xy

(a) Step response in x and y

0 2 4 6 8 100

0.5

1

Time t [s]

Positionx[m

]

ρ

(b) Effect of control weight ρ

Figure 6.12: Step response for a vectored thrust aircraft. The plot in (a) shows the x and ypositions of the aircraft when it is commanded to move 1 m in each direction. In (b) the xmotion is shown for control weights 1, 102, 104. A higher weight of the input term inthe cost function causes a more sluggish response.

level. Since other processes may be running on the server, the web server mustadjust its parameters in response to changes in the load.

A block diagram for the control system is shown in Figure 6.13. We focus onthe special case where we wish to control only the processor load using both the

and parameters. We also include a “disturbance” onthemeasured load that represents the use of the processing cycles by other processesrunning on the server. The system has the same basic structure as the generic controlsystem in Figure 6.5, with the variation that the disturbance enters after the processdynamics.

The dynamics of the system are given by a set of difference equations of theform

x[k 1] Ax[k] Bu[k] ycpu[k] Ccpux[k] dcpu[k]

where x xcpu xmem is the state, u uka umc is the input, dcpu is the processingload from other processes on the computer and ycpu is the total processor load.

We choose our controller to be a state feedback controller of the form

u K ycpuxmem

krrcpu

Feedback

rcpu u

d

yPrecompensation Controller

kre

C

1

Server

P

Figure 6.13: Feedback control of a web server. The controller sets the values of the webserver parameters based on the difference between the nominal parameters (determined bykrr ) and the current load ycpu. The disturbance d represents the load due to other processesrunning on the server. Note that the measurement is taken after the disturbance so that wemeasure the total load on the server.

Figura 8.16 Respuesta al escalon de una aeronave de impulsion. La Fig. a muestra las posiciones “x” e “y” de la aeronave cuando se lecomanda moverse 1m en cada direccion. En Fig. b se muestra el movimiento x variando los pesos de control ρ = 1,102,104. Un peso masgrande en el termino de control de la funcion costo causa una respuesa mas lenta.


8.3.3. Propiedades de robustez del diseno LQR

Un sistema de control que usa el regulador cuadratico lineal presenta las siguientes caracterısticas de robustez. Esto

es, los margenes de estabilidad de la matriz de funciones de transferencia en lazo L(s) = K(sI−A)−1B (equivalente-

mente, las condiciones para que |1+L(iω)|> 1) estan dados por:

Margen de ganancia (GM): 12 < GM < 1.

Margen de fase (PM): PM > 60o.

La Fig. 8.17 presenta el diagrama de Nyquist de la funcion de transferencia de lazo, L(s), para un modelo simplifi-

cado de un satelite.

A =

[0 1

0 0

]

, B =

[0

1

]

, C =[

1 0], D = 0.

Figura 8.17 Diagram de Nyquist mostrando margenes de estabilidad del LQR.

8.3.4. Regla de Bryson para seleccion de matrices Q y R

Si se conocen los valores maximos de los estados finales, estados contınuos y entradas contınuas, luego se puede

aplicar la siguiente regla para la seleccion de matrices de ponderacion F , Q y R:

Fii =1

max([xi(T )]2)

Qii =1

(T − to)max([xi(t)]2)

R j j =1

(T − to)max([ui(t)]2)

donde i= 1,2, ...,n y j = 1,2, ...,m. Si el tiempo no es importante en la aplicacion evaluada luego el intervalo de tiempo

entre parentesis, (T − to), puede elegirse igual a 1. Los terminos fuera de la diagonal de las matrices de ponderacion

pueden ser usados si existe interaccion entre los componentes de las entradas o estados.

Fuente: Capıtulo 5 del libro Linear Systems Control de Elbert Hendricks et al, Springer, 2008.

Fuente: Capıtulo 3 del libro Optimal Control de Lewis y Syrmos, Wiley, 1995.

Fuente: Capıtulo 5 del libro Systems and Control de Stanislaw H. Zak, Oxford University Press, 2003.


Fuente: Capıtulo 5 del libro Linear Systems Control - Deterministic and Stochastic Methods de Elbert Hendricks,

Ole Jannerup y Paul Sorensen, Springer, 2008.


Richard M. Murray.

Capıtulo 9

Estimacion Optima

9.1. Filtro de Kalman-Bucy

El regulador cuadratico lineal (con horizonte infinito) es una ley de control lineal por realimentacion de estados

u =−Kx para el sistema:

x = Ax+Bu, x(0) = xo

que minimiza la funcion de costo cuadratica:

J =∫ ∞

0(x(t)T Qx(t)+u(t)T Ru(t))dt.

La ley de control es llamada “optima” con respecto a la funcion de costo J.

Uno se podrıa preguntar si existe una tecnica de diseno optimo para un estimador de estados. Esto es, ¿sera que

existe un abordaje para disenar observadores que sea equivalente, en algun sentido, al regulador cuadratico lineal? Ası,

dado el sistema observable:x = Ax

y =Cx,

se podrıa definir el sistema dual:

Θ = ATΘ +CT Γ ,

y disenar un controlador LQR para minimizar la funcion de costo cuadratica:

∫ ∞

0(Θ(t)T QΘ(t)+Γ (t)T RΓ (t))dt.

Sin embargo, aun no queda claro como se podrıa penalizar Θ y Γ en la funcion de costo.

A continuacion consideraremos un sistema lineal observable:

x = Ax+Bu+Gw

y =Cx+ v,(9.1)

en el que la dinamica esta sujeta a disturbios aleatorios w y medidas aleatorias v. En paralelo al desarrollo del regulador

cuadratico lineal, Kalman examino el siguiente problema del estimador optimo: construir un observador de orden

completo que minimice el efecto combinado de los disturbios y el ruido, de tal forma que provea un estado “mas

probable” del estado del sistema1. Resolver este problema requiere de algo de informacion acerca de los procesos

aleatorios. Si los procesos son de media cero, procesos de ruido blanco Gaussiano, luego el problema de diseno del

estimador optimo se convierte en el analogo perfecto del problema de diseno del control LQR.

Primero revisaremos algo de teorıa de probabilidad.

1 De hecho, Kalman enuncio el problema original para sistemas discretos. La version contınua es atribuida a Kalman y a Bucy.

135

136 9 Estimacion Optima

9.1.1. Teorıa de probabilidad

9.1.1.1. Escalares y vectores aleatorios

Considere un variable aleatoria escalar z con fz(ζ ) representando su funcion de densidad de probabilidad, definida

tal que:∫ ∞

−∞fz(ζ )dζ = 1.

Entonces, fz(ζ ) provee la probabilidad de que el valor de z este en alguna region diferencial dζ centrada en ζ . Una de

las funciones de densidad de probabilidad es la funcion de densidad de probabilidad Gaussiana, ver Fig. 9.1:

fz(ζ ) =1

σ√

2πexp

(

− (ζ − ζ )

2σ2

)

, (9.2)

donde σ > 0 es llamada la desviacion estandar.

Figura 9.1 Funcion densidad de probabiliadd Gaussiana

Dada una funcion de densidad de probabilidad, la media o valor esperado de una funcion g(z) es:

Eg(z)=∫ ∞

∞g(ζ ) fz(ζ )dζ .

Por ejemplo, el valor medio de z es:

z = Ez=∫ ∞

∞ζ fz(ζ )dζ .

La varianza de z es

E(z− z)2.La varianza indica la probabilidad de que el numero aleatorio esta cerca del valor medio. Una pequena varianza indica

que la media es un buen estimado del numero, mientras que una varianza grande indica que el valor real puede ser

bastante diferente de la media. Para la funcion de densidad de probabilidad Gaussiana (9.2), uno puede calcular que

la media es ζ y la varianza es σ2. Notese que, a medida que σ → 0, la funcion de densidad Gaussiana se aproxima al

impulso unitario en la media; luego se tiene que z = z = ζ .

Uno puede extender el concepto de variable escalar aleatoria a un vector de variables aleatorias, digamos z ∈ Rn.

En este caso, existe una funcion de densidad de probabilidad escalar fz(ζ ) de n variables aleatorias ζ = [ζ1, ...,ζn]T tal

que:∫ ∞

−∞...∫ ∞

−∞fz(ζ )dζ1...dζn = 1.

La funcion fz(ζ ) provee la probabilidad de que z se encuentra es algun hipercubo diferencial dζ1...dζn con centro en

ζ . La funcion de densidad de probabilidad Gaussiana para un vector de variables aleatorias es:

fz(ζ ) =1

√

(2π)n|Pζ |exp

(

−1

2(ζ − ζ )T P−1

ζ(ζ − ζ )

)

9.1 Filtro de Kalman-Bucy 137

donde Pζ ≥ 0. El valor esperado de cualquier vector o matriz de funciones g(z) es

Eg(z)=∫ ∞

−∞...∫ ∞

−∞g(ζ ) fz(ζ )dζ1...dζn.

Por ejemplo, la media de z es

z = Ez=∫ ∞

−∞...∫ ∞

−∞ζ fz(ζ )dζ1...dζn.

La covarianza de z es la matriz n×n

E(z− z)(z− z)T.Para la funcion de densidad Gaussiana, la media es z = ζ y la covarianza es Pζ .

9.1.1.2. Procesos aleatorios

Si la variable aleatoria depende del tiempo, esto es z(t), entonces es llamada proceso aleatorio. En general, la funcion

de densidad de probabilidad podrıa tambien depender del tiempo, fz(ζ , t), tal que la media y covarianza cambian

a medida que el proceso evoluciona. Si la funcion de densidad de probabilidad es constante; esto es, la media y

covarianza permanecen constantes, el proceso es llamado estacionario. Notese que el termino “estacionario” se refiere

solo a la funcion de densidad de probabilidad, y de ahı a los parametros probabilısticos tales como media y covarianza.

El estado z, por otro lado, puede y generalmente si cambia en funcion del tiempo.

Dado que la variable aleatoria z(t) cambia en el tiempo, uno puede cuestionar si su valor en un instante dado del

tiempo se correlaciona con su valor en otro instante. Para cuantificar la pregunta, se define la autocorrelacion de z(t)en el tiempo τ como

Rz(τ) = Ez(t + τ)zT (t).La funcion de autocorrelacion resulta de gran utilidad para encontrar patrones repetitivos dentro de una senal, como

por ejemplo, la periodicidad de una senal enmascarada bajo el ruido.

Si

Rz(τ) = Pδ (τ),

donde P es una matriz constante y δ (·) es la funcion delta de Dirac, entonces el valor de z(t) no esta correlacionado

con el valor de z(t + τ) para cualquier tiempo τ 6= 0. Tal proceso aleatorio es llamado ruido blanco. La razon de

este nombre es en referencia al contenido de energia del proceso siendo uniformemente distribuido sobre todas las

frecuencias. (Recuerde que el color blanco corresponde a la luz reflejada en todas las longitudes de onda). Si z(t) es

un proceso de media cero, entonces Pδ (0) es la covarianza del proceso; la matriz P es llamada matriz de densidad

espectral o simplemente matriz de covarianza.

9.1.1.3. Procesos aleatorios conjuntos

Ahora supongamos que existen dos procesos de vectores aleatorios z1(t) y z2(t). Adicionalmente a sus propias

funciones de densidad de probabilidad, estos dos procesos tienen una funcion de densidad de probabilidad conjunta

denotada por f12(ζ1,ζ2, t1, t2). Si f12 depende de t1 y t2 solo a traves de su diferencia, t1− t2, entonces los procesos son

llamados de estacionarios conjuntos y escribimos f12(ζ1,ζ2, t1− t2).El valor esperado de una funcion (vector o matriz) g(z1,z2) es

Eg(z1(t1),z2(t2))=∫ ∞

−∞...∫ ∞

−∞

(∫ ∞

−∞...∫ ∞

−∞g(ζ1,ζ2) f12(ζ1,ζ2, t1− t2)dζ11

...dζ1n

)

dζ21...dζ2n .

Un ejemplo de matriz de correlacion cruzada es

Rz1z2(τ) = Ez1(t + τ)zT

2 (t).

Los dos procesos se dice que son ortogonales o no correlacionados si Rz1z2(τ) = 0 para todo τ .


9.1.2. Problema del observador optimo

Deseamos construir un termino de inyeccion Φ(y− y, t), tal que el estado estimado generado por el siguiente sistema

ficticio:˙x = Ax+Bu+Φ(y− y, t), (9.3)

converge al valor “mas probable” del estado verdadero x en el sentido que la siguiente medida de la covarianza del

error del estimacion sea minimizada:

J = tr(E(xxT )) = tr(P(t)),

donde P(t) = ExxT es la matriz de covarianza de x. Aqui, x = x− x es el estimado del error y el operador tr(·) rep-

resenta la “traza” de una matriz (la suma de los elementos de la diagonal). Asumiremos que la dinamica del estimador

(9.3) es inicializada mediante la eleccion x(0) = Ex(0); se asume que la media es conocida.

Resulta que cuando la eleccion de Φ es lineal e invariante en el tiempo:

Φ(y− y, t) = L(y− y).

La dinamica del error de observacion resulta:

˙x = x− ˙x = (Ax+Bu+Gw)− (Ax+Bu+L(y− y))= (A−LC)x+Gw−Lv.

Note que el error de estimacion x en cualquier instante es debido solo al disturbio aleatorio w(t) y el ruido aleatorio

v(t). Si estas dos senales aleatorias se desvanecen (y si x(0) = x(0)), luego el error permanecerıa en cero por todo el

tiempo.

Resolviendo la dinamica del error, siendo que el sistema es lineal, se encuentra que la solucion de x es:

x(t) = e(A−LC)t x(0)+

∫ t

0e(A−LC)(t−τ)(Gw−Lv)dτ .

El primer termino e(A−LC)t x(0) depende del estimado inicial de los estados y no es aleatorio. Tambien sabemos que

si A− LC es estable, luego e(A−LC)t x(0)→ 0. Luego, para minimizar el error de estimacion esperado, necesitamos

minimizar el error debido al segundo termino. Descomponiendo el estimado del error en dos terminos, uno que resulta

del disturbio y otro del ruido:

x(t) =∫ t

0e(A−LC)(t−τ)(Gw−Lv)dτ

=∫ t

0e(A−LC)(t−τ)Gwdτ−

∫ t

0e(A−LC)(t−τ)Lvdτ = xw + xv.

La funcion de costo usando x = xv + xw resulta

J = tr(E(xw + xv)(xw + xv)T).

Retornando con la definicion del problema del observador optimo, dada en la primera parte de esta clase, los procesos

de disturbio y ruido son de media cero y Gaussianos (pero no necesariamente estacionarios):

Ev(t)= 0,

Ew(t)= 0,

Ev(t + τ)vT (t)=V δ (τ),

Ew(t + τ)wT (t)=Wδ (τ),

que corresponden a las siguientes funciones de densidad de probabilidad,

f (v) =1

√

(2π)n|V |exp

(

−1

2vTV−1v

)

,

9.1 Filtro de Kalman-Bucy 139

f (w) =1

√

(2π)n|W |exp

(

−1

2vTW−1v

)

,

donde V y W son las matrices de covarianza de v(t) y w(t) respectivamente. Si adicionalmente asumimos que v(t) y

w(t) no son correlacionados; esto es:

Ev(t + τ)wT (t)= Ew(t + τ)vT (t)= 0.

Luego la funcion de costo en funcion de los componentes resultantes xv y xw de x esta dada por:

J = tr(ExwxT

w + xvxTv )= tr

(ExwxT

w)+ExvxTv )=

tr

(

E∫ t

0

∫ t

0e(A−LC)α Gw(t−α)wT GT (t−β )e(A−LC)T β dαdβ+E

∫ t

0

∫ t

0e(A−LC)α Lv(t−α)vT LT (t−β )e(A−LC)T β dαdβ

)

J = tr

(∫ t

0

∫ t

0e(A−LC)α(GWGT +LV LT )e(A−LC)T β δ (β −α)dαdβ

)

= tr

(∫ t

0e(A−LC)β (GWGT +LV LT )e(A−LC)T β dβ

)

Recordando el caso del LQR, la funcion objetivo es:

J =∫ t

0(xT Qx+uT Ru)dτ,

el sistema en lazo cerrado es descrito como:

x = Ax+Bu = (A−BK)x.

La respuesta en el tiempo es:

x(t) = e(A−BK)tx(0).

Entonces el costo puede ser calculado como:

J =∫ t

0(xT Qx+(−Kx)T R(Kx))dτ

=∫ t

0xT (Q+KT RK)xdτ

=∫ t

0(e(A−BK)τ x(0))T (Q+KT RK)e(A−BK)τ x(0)dτ

= x(0)T

(∫ t

0e(A−BK)T τ(Q+KT RK)e(A−BK)τ dτ

)

x(0).

Y minimizar J es equivalente al problema de minimizar:

∫ t

0e(A−BK)T τ(Q+KT RK)e(A−BK)τ dτ .

Luego, minimizar J para el observador optimo es equivalente al problema de minimizar:

J =∫ ∞

0(Θ T GWGTΘ +Γ TVΓ )dt,

sujeto a la dinamica:

Θ = ATΘ +CT Γ .

Aqui, la matriz W representa la matriz de covarianza de w(t) y la matriz V representa la matriz de covarianza de v(t).Por definicion, W y V son definidas positiva.

Como ya sabemos de la teorıa LQR, la entrada de minimizacion hacia el sistema dual es

Γ =−LTΘ ,


donde

LT =V−1CPT ,

y PT es la solucion unica semidefinida positiva de la ecuacion de Riccati algebraica:

AP+PAT −PCTV−1CP+GWGT = 0.

La ganancia del observador, definido arriba, minimiza la covarianza del error de estimacion. En un sentido cuantificable,

la ganancia balancea entre el error de estimacion debido a la incertezas en la planta (representadas por el disturbio

w(t)) y la incerteza de medida (representada por el ruido desconocido v(t)). Si la covarianza del disturbio es grande

en relacion a la covarianza del ruido, entonces la ganancia resultante del observador L sera grande. Esto significa que

el estado estimado dependera mas fuertemente del error de medida y− y. Por otro lado, si la covarianza del disturbio

es pequena en relacion a la covarianza del ruido, entonces la ganancia del observador G sera pequena. Notese, sin

embargo, que L garantiza que A−LC sea Hurwitz.

El filtro de Kalman aplicado a procesos estocasticos contınuos en el tiempo se puede resumir en el siguiente teorema:

Teorema 3. (Kalman-Bucy, 1961). El estimador optimo tiene la forma de un observador lineal:

dx

dt= Ax+Bu+L(y−Cx),

donde L(t) = P(t)CTV−1 y P(t) = E(x(t)− x(t))(x(t)− x(t))T y satisface:

dP

dt= AP+PAT −PCTV−1CP+GWGT , P(0) = Ex(0)xT (0).

Cuando el sistema es estacionario y si P(t) converge, la ganancia del observador es constante:

L = PCTV−1 donde AP+PAT −PCTV−1CP+GWGT = 0.

⋄Nota: El filtro de Kalman fue originalmente elaborado para sistemas discretos, ver Optimal Estimation of Dynamic

Systems de John Crassidis y John Junkins, Capıtulo 5.

9.2. Control LQG

Regreso a los origenes del problema de control H2:

x = Ax+Bu+w

y =Cx+ v,

donde w y v son procesos aleatorios Gaussianos con media cero y covarianzas W y V .

El problema de control estocastico LQG consiste en:

encontrar el compensador C(s) que minimiza

J = E∫ ∞

0[(y− r)T Qy(y− r)+uT Ru]dt.

Asumir por simplicidad que la referencia es cero, r = 0 (de otra forma, se traslada el estado apropiadamente).

Teorema El compensador optimo tiene la forma

˙x = Ax+Bu+L(y−Cx)u = K(x− xd),

9.2 Control LQG 141

donde L es la ganancia del observador optimo ignorando el controlador por realimentacion de estados y K es la ganancia

del controlador por realimentacion de estados ignorando el disturbio w y ruido v.

Esto es llamado el principio de separacion (para control H2). ⋄Nota: El compensador optimo simplificado viene a ser:

˙x = (A−LC)x+Bu+Ly

u =−K(x− xd),

9.2.1. Ejemplo: Aeronave de impulsion

Considere la dinamica original de la aeronave de impulsion presentada en clases anteriores, escrita en la forma

espacio de estados como:

dz

dt=

z4

z5

z6

−gsinθ − cm

z4

−gcosθ − cm

z5

0

+

0

0

01m

cosθF1− 1m

sinθF21m

sinθF1 +1m

cosθF2rJF1

.

Los parametros del sistema son m = 4kg, J = 0,0475kgm2, r = 0,25m, g = 9,8m/s2, c = 0,05Ns/m, que corresponde

a un modelo escalado del sistema. El punto de equilibrio para el sistema esta dado por F1 = 0, F2 = mg y ze =(xe,ye,0,0,0,0). Para derivar el sistema linealizado cerca del punto de equilibrio, calculamos el sistema linealizado:

A =

0 0 0 1 0 0

0 0 0 0 1 0

0 0 0 0 0 1

0 0 −g −c/m 0 0

0 0 0 0 −c/m 0

0 0 0 0 0 0

, B =

0 0

0 0

0 01m

0

0 1m

rJ

0

.

Haciendo z = z− ze y s = u−ue, el sistema linealizado esta dado por:

dz

dt= Az+Bs.

9.2.1.1. Observador optimo (Filtro de Kalman-Bucy)

Considerando solo la dinamica lateral del sistema, esto es, solo los subsistemas cuyos estados estan dados por

z = (x,θ , x, θ). Para disenar el filtro de Kalman debemos incluir la descripcion de los procesos aleatorios de disturbio

y ruido de medida. Entonces, aumentando el sistema para que tenga la forma

z = Az+Bs+w,y =Cz+ v,

donde w representa la fuente de disturbio (modelada como un proceso Gaussiano de media igual a cero) y v representa

el ruido de media (modelado como un proceso Gaussiano de media igual a cero). La matriz de salida C corresponde a

una sola senal medida x.

Para este ejemplo, escogemos que los disturbios de proceso wi, i = 1, ...,n, son disturbios independientes con covar-

ianza dada por Wii = 0,1, Wi j = 0, i 6= j. El ruido de medida para x− xe es una variable aleatoria que modelamos con

una covarianza V = 10−4.

Sea

JF =∫ ∞

0(Θ TWΘ +Γ TVΓ )dt.


Encontraremos una (pseudo) ley de control lineal por realimentacion de estados Γ =−LTΘ que minimice JF sujeto al

sistema dual

Θ = ATΘ +CT Γ .

Usando los parametros mencionados como indicado arriba, se puede calcular la ganancia de Kalman resultante.

Resolviendo la ecuacion de Riccati, se define la matriz Hamiltoniana asociada como

H =

[AT −CTV−1C

−W −A

]

=

0 0 0 0 −104 0 0 0

0 0 −9,8 0 0 0 0 0

1 0 −0,0125 0 0 0 0 0

0 1 0 0 0 0 0 0

−0,1 0 0 0 0 0 −1 0

0 −0,1 0 0 0 0 0 −1

0 0 −0,1 0 0 9,8 0,0125 0

0 0 0 −0,1 0 0 0 0

.

Calculando los autovalores y autovectores de H, posteriormente identificando los autovectores correspondientes a los

autovalores con parte real negativa, definiendo WF y ZF , y sabiendo que PF = ZFW−1F se obtiene

P =

0,0037 −0,0047 0,0185 −0,0032

−0,0047 0,0768 −0,1703 0,0598

0,0185 −0,1703 0,6390 −0,1170

−0,0032 0,0598 −0,1170 0,1482

. (9.4)

Entonces

L =

37,0−46,9

185

−31,6

. (9.5)

El desempeno del estimador es mostrado en la Fig. 9.2(a). Observamos que a pesar de que el estimador converge

a los estados del sistema, se presenta bastante sobreimpulso en los estados estimados, lo que puede llevar a un bajo

desempeno en un sistema en lazo cerrado.

Para mejorar el desempeno del estimador, exploramos el impacto de aumentar una nueva senal medida. Suponiendo

que en lugar de solo medir la posicion de salida x, tambien medimos la orientacion de la aeronave θ . La matriz de

salida resulta

y =

[1 0 0 0

0 1 0 0

]

z+

[v1

v2

]

,

y si asumimos que v1 y v2 son independientes fuentes de ruido, cada uno con covarianza Vi = 10−4, luego la matriz de

ganancias del estimador optimo resulta

L =

32,6 −0,150

−0,150 32,632,7 −9,79

0,0033 31,6

. (9.6)

Estas ganancias proveen buena inmunidad al ruido y alto desempeno, como mostrado en la Fig. 9.2(b).

9.2.1.2. Regulador cuadratico lineal

Se puede verificar que el sistema es alcanzable. Luego, para calcular el regulador cuadratico lineal para el sistema,

escribimos la funcion costo como:

J =∫ ∞

0(zT Qz+ sT Rs)dt.

Comenzamos con matrices diagonales para los costos del estado y la entrada:

9.2 Control LQG 143218 CHAPTER 7. OUTPUT FEEDBACK

0 0.5 1 1.5 2−0.4

−0.3

−0.2

−0.1

0

0.1

Time t [s]

States

z i[m

ixed

units]

xθ

xdθd

(a) Position measurement only

0 0.5 1 1.5 2−0.4

−0.3

−0.2

−0.1

0

0.1

Time t [s]

States

z i[m

ixed

units]

xθ

xdθd

(b) Position and orientation

Figure 7.9: Kalman filter design for a vectored thrust aircraft. In the first design (a) onlythe lateral position of the aircraft is measured. Adding a direct measurement of the rollangle produces a much better observer (b). The initial condition for both simulations is0 1 0 0175 0 01 0 .

having covariance R 10 4. Using the same parameters as before, the resultingKalman gain is given by

L

37 046 918531 6

The performance of the estimator is shown in Figure 7.9a. We see that while theestimator converges to the system state, it contains significant overshoot in the stateestimate, which can lead to poor performance in a closed loop setting.

To improve the performance of the estimator, we explore the impact of adding anewoutputmeasurement. Suppose that instead ofmeasuring just the output positionx , we also measure the orientation of the aircraft . The output becomes

y 1 0 0 00 1 0 0 z 1

2

and ifwe assume that 1 and 2 are independent noise sources eachwith covarianceR i 10 4, then the optimal estimator gain matrix becomes

L

32 6 0 1500 150 32 632 7 9 790 0033 31 6

These gains provide good immunity to noise and high performance, as illustratedin Figure 7.9b.

Figura 9.2 Diseno del filtro de Kalman para la aeronave de impulsion. En el primer diseno (a) solo se mide la posicion lateral de laaeronave. Aumentando una medida directa del angulo de rotacion produce un mejor observador (b). Las condiciones iniciales para ambassimulaciones son (0,1,0,0175,0,01,0)

Q =

1 0 0 0

0 1 0 0

0 0 1 0

0 0 0 1

, R = 100.

Usando estas matrices, se puede calcular la ganancia del regulador por realimentacion de estados resultante. Resolvien-

do la ecuacion de Riccati, se define la matriz Hamiltoniana asociada como

H =

[A −BR−1BT

−Q −AT

]

=

0 0 1 0 0 0 0 0

0 0 0 1 0 0 0 0

0 −9,8 −0,0125 0 0 0 −0,00006 −0,0013

0 0 0 0 0 0 −0,0013 −0,0277

−1 0 0 0 0 0 0 0

0 −1 0 0 0 0 9,8 0

0 0 −1 0 −1 0 0,0125 0

0 0 0 −1 0 −1 0 0

.

Calculando los autovalores y autovectores de H, posteriormente identificando los autovectores correspondientes a los

autovalores con parte real negativa, definiendo WK y ZK , y sabiendo que PK = ZKW−1K se obtiene

K =[−0,316 9,198 −0,824 5,955

]. (9.7)

Luego la ley de control de la forma s = −Kz sera usada para derivar la ley de control en terminos de las variables

originales:

u = s+ue =−K(z− ze)+ue.

Como especificado en clases anteriores, los puntos de equilibrio corresponden a ue = 0 y ze = (xe,0,0,0).

9.2.1.3. Control LQG

El compensador optimo LQG resulta:

˙z =

32,6 0,15 1 0

0,15 −32,6 0 1

−32,7 −0,01 −0,0125 0

−0,0033 −31,6 0 0

z+

0

0

0,25

5,263

u+

32,6 −0,150

−0,150 32,632,7 −9,79

0,0033 31,6

y

u =−[−0,316 9,198 −0,824 5,955

]z+Kze,

09.


9.2.2. Compensador optimo LQG podrıa resultar en un sistema en lazo cerrado inestable

Considere el problema LQG con la siguiente dinamica:

[x1

x2

]

=

[1 1

0 1

][x1

x2

]

+

[0

1

]

u+

[1

1

]

w

y =

[1

0

][x1

x2

]

+ v

(9.8)

El vector x =[

x1 x2

]Tes el vector de estados, u es la entrada de control, y es la salida medida y w y v son los ruidos

blancos Gaussianos independientes con intensidades σ ≤ 0 y 1 respectivamente. El ındice de desempeno asociado

esta dado por:

J = E

lımT→∞

1

T

∫ T

0(ρ(x1 + x2)

2 +u2)dt

donde E(·) es el operador valor esperado y ρ es un parametro real no negativo.

Extrayendo las siguientes matrices del problema con el fin de simplificar calculos posteriores:

A =

[1 1

0 1

]

, B1 =

[0

1

]

, B2 =

[1

1

]

, B3 = 0

C1 =[

1 0], D11 = 0, D12 = 0, D13 = 1

9.2.2.1. LQR

El problema de control LQR queda definido por la minimizacion del siguiente funcional de desempeno:

JLQR =∫ ∞

0(ρ(x1 + x2)

2 +u2)dt

siendo que:[

x1

x2

]

= A

[x1

x2

]

+B1u

La ecuacion de Riccati que resuelve el problema de control LQR esta dada por:

PA+AT P−PBR−1BT P+Q = 0

PA+AT P−PB1

[1 0

0 1

]

BT1 P+ρ

[1 1

1 1

]

= 0

[p11 p12

p12 p22

][1 1

0 1

]

+

[1 0

1 1

][p11 p12

p12 p22

]

−[

p11 p12

p12 p22

][0

1

][

0 1][

p11 p12

p12 p22

]

+ρ

[1 1

1 1

]

= 0

[2p11− p2

12 +ρ p11 +2p12− p12 p22 +ρp11 +2p12− p12 p22 +ρ 2p12 +2p22− p2

22 +ρ

]

=

[0 0

0 0

]

Resolviendo para cada elemento de la matriz P se obtiene:

P = α

[2 1

1 1

]

donde α = 2+√

4+ρ . Luego la ganancia del LQR es:

K = R−1BT1 P = α

[1 1]

9.2 Control LQG 145

9.2.2.2. Filtro de Kalman

El problema del observador optimo queda definido por la minimizacion del siguiente funcional de desempeno:

JFK =∫ ∞

0(θ T B2σBT

2 θ + γT 1γ)dt

siendo que:[

θ1

θ2

]

= AT

[θ1

θ2

]

+CT1 γ

La ecuacion de Riccati que resuelve el problema del observador optimo esta dada por:

PF AT +APF −PFCTV−1CPF +B2WBT2 = 0

PF AT +APF −PFCT1 ∗1∗C1PF +σB2BT

2 = 0[

p11 p12

p12 p22

][1 0

1 1

]

+

[1 1

0 1

][p11 p12

p12 p22

]

−[

p11 p12

p12 p22

][1

0

][

1 0][

p11 p12

p12 p22

]

+σ

[1

1

][1

1

]T

= 0

[2p11 +2p12− p2

11 +σ p22 +2p12− p12 p11 +σp22 +2p12− p12 p11 +σ 2p22− p2

12 +σ

]

=

[0 0

0 0

]

Resolviendo para cada elemento de la matriz P se obtiene:

PF = β

[1 1

1 2

]

donde β = 2+√

4+σ . Luego la ganancia del filtro de Kalman es:

L =V−1PCT1 = β

[1

1

]

9.2.2.3. LQG

Luego, el compensador optimo esta dado por:

˙x = Ax+B1u+L(y−C1x)u =−Kx

Reescribiendo lo anterior se tiene:

k(s) =

[A−B1K−LC1 L

−K 0

]

,

donde

A−B1K−LC1 =

[1−β 1

−(α +β ) 1−α

]

Evaluando −K(sI− (A−B1K−LC1))−1

L, se obtiene:

k(s) =αβ (1−2s)

s2 +(α +β −2)s+1+αβ

9.2.2.4. Estabilidad del sistema en lazo cerrado

Considerando el sistema en lazo cerrado mostrado en la Fig. 9.3, en donde la ganancia κ posee valor nominal igual

a +1.


Realizando los calculos se muestra que solo los terminos lineal y constantes del polinomio caracterıstico del sistema

en lazo cerrado son funciones de κ y que esos terminos estan dados por:

β +α−4+2(κ−1)αβ y1+(1−κ)αβ

respectivamente. Una condicion necesaria para estabilidad es que ambos terminos sean positivos (criterio de estabilidad

de Routh-Hurwitz?) Esta condicion es satisfecha para el caso del lazo nominal κ = 1. Sin embargo, para α,β = 4 (en

otras palabras, ρ = 0 y σ = 0), la condicion necesaria de estabilidad es

a− 1

8< κ < 1+

1

16.

Esta situacion empeora si α y β son grandes. Para el caso de β = α , la condicion necesaria de estabilidad se torna en:

1+2

α2− 1

α< κ < 1+

1

α2.

Luego, el margen de ganancia puede ser arbitrariamente pequeno si se selecciona α y β (equivalentemente, ρ y σ ) lo

suficientemente grandes. Asi, concluimos que la optimalidad del LQG no garantiza robustez en estabilidad!

La robustez en estabilidad de un sistema en lazo cerrado LQG debe ser chequeada a posteriori. Este inconveniente es

una propiedad fundamental de los metodos asociados a minimizacion de normas cuadraticas y fue una de las razones

principales por las que se inicia la investigacion en abordajes que minimizan la norma infinita. La robustez es un

objetivo clave de la realimentacion que siempre debe ser analizado.

s

plant

k

κ

w v

y

u

Figura 9.3 Sistema en lazo cerrado LQG con ganancia variable

Fuente: Applied Optimal Control, de A.E. Bryson, Jr. y Y.-C.Ho, Hemisphere Publishing, 1975.

Fuente: Aircraft Control and Simulation, de B.L. Stevens y F.L. Lewis, John Wiley & Sons, NJ, Second Edition,

2003.

Fuente: Advanced Control System Design, de B. Friedland, Prentice-Hall, 1996.


Richard M. Murray.

Fuente: Linear Robust Control, de M. Green y D. Limebeer, Pearson Education, Inc.

Capıtulo 10

Topicos especiales de control

10.1. Problema de Generacion de Trayectoria

10.1.1. Introduccion

Dado un sistema de control no lineal:

x = f (x,u) x ∈ Rn,u ∈ R

p

y = h(x) y ∈ Rq

y una trayectoria de referencia r(t) ∈ Rq, encontrar una ley de control u = α(x,r) tal que:

limt→∞(y(t)− r(t)) = 0.

10.1.1.1. Abordaje:

Diseno de dos grados de libertad

Lecture 1-1: Trajectory Tracking and Gain SchedulingCDS 110b, 7 Jan 08

Figura 10.1 Generacion de trayectoria

10.1.1.2. Generacion de trayectoria:

Encontrar una trayectoria posible (satisface dinamica)

xd = f (xd ,ud)r = h(xd)

→ xd(r),ud(r)

147

148 10 Topicos especiales de control

10.1.1.3. Seguimiento de trayectoria:

Encontrar u = α(x,xd ,ud) tal que el sistema en lazo cerrado sea estable, con desempeno deseado.

10.1.1.4. Estimacion:

Determinar x a partir de y,u.

10.1.1.5. Revision:

Seguimiento de trayectoria para sistemas lineales:

x = Ax+Bu

y =Cx

u =−Kx+ krr

r = constante

1. Escoger K para la dinamica en lazo cerrado deseada (ubicacion de autovalores, LQR, etc).

2. Escoger kr que provee el valor deseado a la salida.

x = Ax+Bu = (A−BK)x+Bkrr

Puntodeequilibrio xe =−(A−BK)−1Bkrr

ye =−C(A−BK)−1Bkrr = r︸︷︷︸

deseado

→ kr =−1

C(A−BK)−1B

Este abordaje trabaja mediante estabilizacion del origen y luego usando krr para “empujar” el sistema hacia xe.

Funciona porque el sistema es lineal.

10.1.2. Formulacion alternativa:

Resolver directamente para el punto de equilibrio. El objetivo es encontrar una ley de control tal que la salida

limt→∞y(t) = yd = para alguna salida deseada r. Para resolver este problema, primero definimos el estado deseado

correspondiente limt→∞x(t) = xd y entrada limt→∞u(t) = ud para alcanzar r. Obviamente, xd , ud y yd deben satisfacer

las ecuaciones de estado y salida; esto esxd = Axd +Bud

yd =Cxd +Dud

Siendo que xd es una constante, xd = 0, tenemos:

0 = Axd +Bud

yd =Cxd +Dud

Dado yd , resolvemos las ecuaciones arriba para xd y ud . Si no hay solucion para xd y ud , entonces el objetivo de

limt→∞y(t) = yd no se puede alcanzar. Entonces, asumamos que la solucion existe; esto es, la ecuacion lineal:

[0

yd

]

=

[A B

C 0

][xd

ud

]

tiene solucion. Para un sistema de una entrada una salida, xd y ud puede ser resuelto como

10.1 Problema de Generacion de Trayectoria 149

[xd

ud

]

=

[A B

C 0

]−1 [0

yd

]

→ u = −K(−x− xd)︸︷︷︸

estabilizaptoequilibrio

+ ud︸︷︷︸

entradanominal

A seguir definimos las nuevas variables como:

∆x(t) = x(t)− xd

∆u(t) = u(t)−ud

∆y(t) = y(t)− yd

Derivar las ecuaciones espacio de estado para ∆x(t), ∆u(t) y ∆y(t) como sigue:

∆ x = x− xd = x = Ax+Bu = A∆x+B∆ +Axd +Bud = A∆x+B∆u

∆y = y− yd =Cx+Du−Cxd−Dud =C∆x+D∆u

Luego, las ecuaciones de estado y salida para ∆x, ∆u, y ∆y son dadas por los mismas matrices A, B, C y D.

∆ x = A∆x+B∆u

∆y =C∆x+D∆u

Suposicion fundamental: (xd ,ud) es un punto de equilibrio para r constante.

10.1.2.1. Ejemplo

Considerar el siguiente sistema modelado como un motor DC.

θωi

=

0 1 0

0 0 4,438

0 −12 −24

θωi

+

0

0

20

v

donde los estados θ ,ω, i son la posicion del angulo, la velocidad angular y la corriente, respectivamente; la entrada v

es el voltaje aplicado y la salida y es la posicion del angulo. Nuestro objetivo es llevar el motor a θd = 10 y a la vez

minimizar

J(x) =

∫ ∞

0(9(θ −θd)

2 + v2)dτ .

Primero encontramos xd y ud como:

θd

ωd

idvd

=

[A B

C D

]−1

0

0

0

10

=

0 1 0 0

0 0 4,438 0

0 −12 −24 20

1 0 0 0

−1

0

0

0

10

=

10

0

0

0

El problema del LQR resulta:

∆θ∆ω∆ i

=

0 1 0

0 0 4,438

0 −12 −24

∆θ∆ω∆ i

+

0

0

20

∆v

Q =

9 0 0

0 0 0

0 0 0

R = 1

La solucion usando el metodo del autovector es:


P =

4,438 0,9145 0,1500

0,9145 0,2550 0,0440

0,1500 0,0440 0,0076

∆v∗ =[−3,00 −0,8796 −0,1529

]

∆θ∆ω∆ i

Luego el control optimo del problema original es:

v∗ = ∆v∗+ vd

=[−3,00 −0,8796 −0,1529

]

∆θ∆ω∆ i

=[−3,00 −0,8796 −0,1529

]

θ −θd

ω−ωd

i− id

=[−3,00 −0,8796 −0,1529

]

θωi

−[−3,00 −0,8796 −0,1529

]

θd

ωd

id

=[−3,00 −0,8796 −0,1529

]

θωi

−[−3,00 −0,8796 −0,1529

]

10

0

0

= 30+[−3,00 −0,8796 −0,1529

]

θωi

10.1.3. Programacion de ganancias (GAIN SCHEDULING)

Sea el sistema no lineal con trayectoria posible:

x = f (x,u)y = h(x)

xd = f (xd ,ud)r(t) = h(xd)

Para estabilizar la trayectoria de referencia, observar el error e = x− xd , luego:

x = f (x,u)xd = f (xd ,ud)

e = f (x,u)− f (xd ,ud) = f (e+ xd ,v+ud)− f (xd ,ud) = F(e,v,xd ,ud)︸︷︷︸

terminonolinealquevariaenel tiempo

A continuacion trataremos a xd ,ud como si fuesen parametros en el controlador y linealizaremos en torno a (e,v) =(0,0).

e = Ade+Bdv Ad =∂F

∂e

∣∣∣∣(0,0)

=∂ f

∂x

∣∣∣∣(xd ,ud)

Bd =∂F

∂v

∣∣∣∣(0,0)

=∂ f

∂u

∣∣∣∣(xd ,ud)

Ahora estabilizar e = 0 mediante eleccion de Kd tal que (Ad−BdKd) sea Hurwitz.

u =−Kd(xd ,ud)(x− xd)+ud

10.1 Problema de Generacion de Trayectoria 151

10.1.3.1. Observaciones

1. No asumir que (xd ,ud) son valores de equilibrio, solo que son valores que satisfacen la dinamica. Punto de equilibrio

resulta en el caso especial de r =constante.

2. De forma mas general se puede programar las ganancias obtenidas para cualquier parametro, o aun el estado:

u = Kd(xd ,ud)(x− xd)+ud Usarconcuidado (NL!)

3. Problema: Linealizar en torno al punto de equilibrio deseado, luego linealizacion no trabajara muy bien lejos de este

punto.

4. En la practica, implementar la programacion de ganancias (gain scheduling) a traves de interpolacion:

Figura 10.2 Muestra de implementacion

5. En teorıa, no se puede decir mucho en relacion a como este metodo trabaja. Trabaja bien si (xd ,ud) varian lo

suficientemente despacio. Trabaja bien en practica, aun si la variacion de (xd ,ud) es rapida.

10.1.3.2. Ejemplo: Control de direccion con programacion de la velocidad - modelo de bicicleta

Considerar el vehiculo con dos ruedas mostrado en la Fig. 10.3. Para propositos de direccionamiento estamos in-

teresados en un modelo que describe como la velocidad del vehiculo depende del angulo de direccion δ . Para ser

especıficos, considerar la velocidad v del centro de masa, una distancia a a partir de la rueda trasera, y sea b la distancia

entre ruedas. Sean x e y las coordenadas del centro de masa, θ es el angulo de orientacion y α es el angulo entre la

velocidad v y la linea de centros del vehiculo. Dado que b = ρ tanδ y α = 0 (punto de referencia esta en la rueda

trasera), asumiendo que las ruedas ruedan sin resbalarse, encontramos que el movimiento del centro de masa esta dado

por:dx

dt= vcosθ

dy

dt= vsenθ

(10.1)

Para ver como el angulo θ es influenciado por el angulo de direccion, observamos, de la Fig. 10.3, que el vehiculo rota

con la velocidad angular v/ra en torno al punto O. Entonces:

dθ

dt=

v

ra

=v

btanδ (10.2)

Las ecuaciones (10.1) y (10.2) pueden ser usadas para modelar la bicicleta bajo la suposicion que no hay resbalamiento

entre ruedas y el piso. La suposicion de no resbalamiento puede ser relajada adicionando una variable de estado extra,

dando asi un modelo mas realista. Tal modelo tambien describe la dinamica de direccionamiento de barcos asi como la

dinamica de alabeo de aeronaves y misiles.

Las ecuaciones de movimiento no lineales del sistema pueden ser descritas como:

d

dt

x

y

θ

=

vcosθvsenθv

btanδ

= f (x,y,θ

︸︷︷︸

x

, v,δ︸︷︷︸

u

)


donde x, y y θ son la posicion y la orientacion del centro de masa del vehiculo, v es la velocidad de la llanta trasera, b

es la distancia entre la rueda delantera y trasera y δ es el angulo de la rueda delantera.

y

x

α

α

δ

δ

θ

Figura 10.3 Dinamica de la direccion de la bicicleta. El angulo direccional es δ y la velocidad del centro de masa tiene un angulo α relativoal eje longitudinal del vehiculo igual a cero. La posicion de la bicicleta esta dada por (x,y) y la orientacion por θ . La distancia entre ruedases b, el centro de masa esta ubicado a una distancia a hacia adelante de la rueda trasera.

Estamos interesados en el movimiento del vehiculo en linea recta horizontal con velocidad fija v = vr 6= 0, entonces:

xd = vrt

yd = yr

θd = 0

xd

vd = vr

δd = 0

ud

Notar que (xd ,yd ,θd ,vd ,δd) no son un punto de equilibrio, pero si satisfacen las ecuaciones de movimiento.

Definiendo el error, se tiene lo siguiente para la dinamica del error:

ex = x− vrt ex = vcosθ − vr ex = (ev + vr)coseθ − vr = F1(ex,ey,eθ ,ev,eδ )ey = y− yr ey = vsenθ ey = (ev + vr)seneθ = F2(ex,ey,eθ ,ev,eδ )

eθ = θ eθ =v

btanδ eθ =

ev + vr

btaneδ = F3(ex,ey,eθ ,ev,eδ )

ev = v− vr

eδ = δ

Linealizando con respecto a (ex,ey,eθ ,ev,eδ ) = (0,0,0,0,0), se tiene:

Ad =

∂F1

∂ex

∂F1

∂ey

∂F1

∂eθ∂F2

∂ex

∂F2

∂ey

∂F2

∂eθ∂F3

∂ex

∂F3

∂ey

∂F3

∂eθ

∣∣∣∣∣∣∣∣∣∣∣∣ ex = 0,ey = 0,eθ = 0

ev = 0,eδ = 0

=

0 0 −(ev + vr)seneθ

0 0 (ev + vr)coseθ

0 0 0

∣∣∣∣∣∣ ex = 0,ey = 0,eθ = 0

ev = 0,eδ = 0

Bd =

∂F1

∂ev

∂F1

∂eδ∂F2

∂ev

∂F2

∂eδ∂F3

∂ev

∂F3

∂eδ

∣∣∣∣∣∣∣∣∣∣∣ ex = 0,ey = 0,eθ = 0

ev = 0,eδ = 0

=

coseθ 0

seneθ 01

btaneδ

ev + vr

b

1

sec2 eδ

∣∣∣∣∣∣∣ ex = 0,ey = 0,eθ = 0

ev = 0,eδ = 0

Luego, se obtiene que:

10.2 Filtro de Kalman Extendido 153

Ad =

0 0 0

0 0 vr

0 0 0

, Bd =

1 0

0 0

0vr

b

o, mas especıficamente:

ex

ey

eθ

=

0 0 0

0 0 vr

0 0 0

ex

ey

eθ

+

1 0

0 0

0vr

b

[ev

eδ

]

Resolviendo el problema de control para este sistema (ubicacion de polo, LQR), se tiene que:

[ev

eδ

]

=−Kd

ex

ey

eθ

[v

δ

]

=−Kd

x− vrt

y− yr

θ

+

[vr

0

]

Una opcion para el calculo de Kd puede ser:

ex = ev ev =−λ1ex

ey = vreθ eδ =− b

vr

(a1ey +a2eθ )

eθ =vr

beδ

,

que posiciona los polos del sistema en lazo cerrado en λ1 y las raices de s2 + a1s+ a2 = 0. Luego el controlador en

coordenadas originales queda como:la posicion del angulo

[v

δ

]

=−

λ1 0 0

0a1b

vr

a2b

vr

︸︷︷︸

Kd

x− vrt

y− yr

θ

︸︷︷︸

e

+

[vr

0

]

︸︷︷︸

ud

10.2. Filtro de Kalman Extendido

Una amplia clase de problemas de estimacion involucra modelos no lineales. Por muchas razones, estimacion de

estados para sistemas no lineales es considerablemente mas difıcil y admite una gran variedad de soluciones en com-

paracion al problema lineal. Considerando el siguiente modelo no lineal real con medidas de tiempo contınuas:

x(t) = f (x(t),u(t))+G(t)w(t),y(t) = h(x(t))+ v(t)

(10.3)

donde f (x(t),u(t), t) y h(x(t), t) son asumidas contınuas y diferenciables, y w(t) y v(t) son procesos de ruido Gausiano

de media cero con covarianzas dadas por:

Ew(t)wT (τ)=Wδ (t− τ) (10.4)

Ev(t)vT (τ)=V δ (t− τ) (10.5)

Ev(t)wT (τ)= 0 (10.6)

La ecuacion (10.6) implica que v(t) y w(t) no estan corelacionados. Ademas, la entrada de control u(t) es una cantidad

determinıstica. El problema con un modelo no lineal es que una entrada Gausiana no necesariamente produce una

salida Gausiana (como en el caso lineal).


Existen muchas formas de producir una version linealizada del filtro de Kalman. A continuacion consideraremos el

abordaje mas comun, llamado filtro de Kalman Extendido. El filtro de Kalman extendido, a pesar de no ser precisamente

“optimo”, ha sido satisfactoriamente aplicado a varios sistemas no lineales en el transcurso de los anos. El concepto

fundamental de este filtro involucra la nocion de que el estado real esta lo suficientemente cerca del estado estimado.

Luego, la dinamica del error puede ser representado de forma bastante exacta mediante una expansion en series de

Taylor linealizada de primer orden.

A continuacion omitiremos la dependencia con respecto al tiempo de las senales para simplicar la notacion. Con-

siderando el observador no lineal como descrito a seguir:

˙x = f (x,u)+L(y−h(x)) (10.7)

La dinamica del error de estimacion, e = x− x, esta definida por:

˙e = f (x,u)− f (x,u)+Gw−L(h(x)−h(x))−Lv

= F(e, x,u)+Gw−LH(e, x)−Lv︸︷︷︸

E(e, x,u,w,v)

(10.8)

donde:F(e, x,u) = f (e+ x,u)− f (x,u)

H(e, x) = h(e+ x)−h(x)

Linealizando ahora en torno al estimado actual x, e = 0, y los ruidos de proceso y medida, w = 0 y v = 0:

e =∂E

∂e

∣∣∣∣(0,x,u,0,0)

e+∂E

∂w

∣∣∣∣(0,x,u,0,0)

w+∂E

∂v

∣∣∣∣(0,x,u,0,0)

v

e =

(

∂F

∂e

∣∣∣∣(0,x,u)

−L∂H

∂e

∣∣∣∣(0,x)

)

e+Gw−Lv

e = (A(x)−LC(x))e+Gw−Lv

(10.9)

donde:

A(x) =∂F

∂e

∣∣∣∣(0,x,u)

=∂ f

∂x

∣∣∣∣(x,u)

C(x) =∂H

∂e

∣∣∣∣(0,x)

=∂h

∂x

∣∣∣∣(x)

dependendelestadoactual x

10.2.1. Idea

Disenar el observador para el sistema linealizado en torno al estimado actual

Observador:

x = f (x,u)+L(y−h(x))

donde:

L = PCT (x)V−1

P = A(x)P+PAT (x)+GWGT +PCT (x)V−1C(x)P, P(to) = Ee(to)eT (to).Este viene a ser el Filtro de Kalman Extendido (EKF) (Schmidt).

10.2.2. Ejemplo

En este ejemplo demostraremos la utilidad del filtro de Kalman extendido para estimar los estados de la ecuacion

de Van der Pol, dada por:

10.2 Filtro de Kalman Extendido 155

mx+2c(x2−1)x+Kx = 0,

donde m, c y k poseen valores positivos. Esta ecuacion induce un ciclo limite que es sostenido periodicamente mediante

liberacion de energıa hacia y absorcion de energıa del ambiente, a traves del termino de amortiguamiento. El sistema

puede ser representado en su representacion espacio de estados como descrito a continuacion:

x1 = x2

x2 =−2(c/m)(x21−1)x2− (k/m)x1

.

Las senales medidas son posicion tal que C = [1 0]. Para efectos del ejemplo hemos generado los estados usando

m = c = k = 1 y con condicion inicial igual a xo = [1 0]T . Las medidas son muestreadas con intervalos de ∆ t = 0,01s

con un error de medida con desviacion estandar de σ = 0,01. El modelo linealizado A y la matriz G usados en el filtro

de Kalman extendido son:

A =

[0 1

−4(c/m)x1x2− (k/m) −2(c/m)(x21−1)

]

, G =

[0

1

]

.

Notese que no se ha incluido ruido de proceso (en otras palabras, no hay error) en el primer estado. Esto es debido al

hecho que el primer estado es una relacion cinematica que es correcta tanto en teorıa como en la practica (velocidad

siempre es derivada de la posicion).

En el filtro de Kalman extendido los parametro del modelo son asumidos como m = 1, c = 1,5 y k = 1,2, lo cual

introduce errores en los parametros asumidos, comparados al sistema real. La covarianza inicial es escogida como

Po = 1000I. El escalar W en el filtro de Kalman extendido es luego variado hasta que se obtengan estados estimados

razonables (este afinamiento de la matriz de covarianza es bastante comun en el diseno del filtro de Kalman tambien).

La respuesta a la pregunta ¿cuales son los estimados razonables? es a menudo dejado al ingeniero de diseno. Dado

que para simulacion los valores verdaderos son conocidos, podemos comparar nuestros estimados con los verdaderos

valores para afinar W . Encontramos que q = 0,2 provee un buen estimado.

0 2 4 6 8 10−5

−2.5

0

2.5

5

0 2 4 6 8 10−5

−2.5

0

2.5

5

0 2 4 6 8 10−0.03

−0.02

−0.01

0

0.01

0.02

0.03

0 2 4 6 8 10−0.5

−0.25

0

0.25

0.5

Time (Sec)Time (Sec)

Time (Sec)Time (Sec)

Est

imat

eV

elo

city

Err

ors

Po

siti

on

Err

ors

Dif

fere

nce

dM

easu

rem

ent

© 2004 by CRC Press LLC

Figura 10.4 Resultados del filtro de Kalman extendido para la ecuacion de Van der Pol

Fuente: Lecture 1-1, CDS 110b, de Richard Murray.


Richard M. Murray.

Fuente: Optimal Estimation of Dynamical Systems, de J.L. Crassidis y J.L. Junkins, 2004.

Capıtulo 11

Problemas propuestos y resueltos

11.1. Problemas Capıtulo 1

Problema 1.1: Velero

Un velero de masa m y velocidad v(t) (el viento con una velocidad constante vw

empuja al velero desde la parte trasera), desarrolla una fuerza impulsora igual a:

Fa(t) = k1(vw− v(t))2A(t),

donde A(t) es el area de la vela. La fuerza de resistencia que el velero debe superarcuando viaja en el agua se puede aproximar por:

Fw(t) = k2v2(t).

v(t)w

A(t)v

(1.1) Velero

1. Derivar las ecuaciones de movimiento para el velero. Escribir la representacion espacio de estados para la entrada

A(t) y la salida v(t).Usando la 2da Ley de Newton se obtiene la ecuacion de movimiento del velero:

→∑F = mdv

dt

Fa(t)−Fw(t) = mdv

dt

k1(vw− v(t))2A(t)− k2v2(t) = mdv

dt

Ecuacion de movimiento: mdv

dt−k1(vw−v(t))2A(t)+k2v2(t) = 0. Escribiendo la ecuacion de movimiento en la

forma de espacio de estados, siendo que v(t) es la variable de estado, A(t) es la variable de entrada y v(t) es tambien

la variable de salida.d

dtv =

k2

mv2(t)− k1

m(vw− v(t))2A(t)

y = v.

La dinamica del sistema presenta una representacion espacio estados de la forma x= f (x,u) ya que estamos lidiando

con un sistema no lineal.

2. ¿Que tan grande debe ser el area de la vela A(t) para mantener la nave a una velocidad constante vo < vw?

Si la velocidad del velero es constante, se debe cumplirdv

dt= 0. Luego de la representacion espacio de estados se

tiene que:

157

158 11 Problemas propuestos y resueltos

d

dtv = 0 =

k2

mv2

o−k1

m(vw− vo)

2A(t).

Entonces:

Ao =k2v2

o

k1(vw− vo)2.

3. ¿Cual deberıa ser el area de la vela para llegar a un velocidad constante vo = vw?

Si la velocidad v es constante e igual a vw, entonces de la expresion anterior se tiene que:

A(t)vo→vw = lımvo→vw

k2v2o

k1(vw− vo)2→ ∞.

Problema 1.2: Oscilador Van der Pol

Considere el circuito simple R,L,C de la Fig.(1.2) con L y C siendo elementos lineales y R

siendo un resistor no lineal (no cumple la ley deOhm VC = iRR, en su lugar iR = f (vC)). La figuraa la derecha muestra la caracterıstica del resistor.

(1.2) Circuito de oscilacion Van der Pol

1. Elegir como estados a la corriente en el inductor iL y el voltaje del capacitor vC y calcular la representacion espacio

de estados del sistema.

Para modelar el circuito electrico usamos la ley de Kirchhoff para corrientes:

iC = iR + iL.

CdvC

dt=−vC + v3

C + iL.

Despejando en funcion de la variable de estado vC:

dvC

dt=− 1

CvC +

1

Cv3

C +1

CiL.

Tambien sabemos que en un circuito que tiene elementos conectados en paralelo se cumple que:

vC = LdiL

dt.

Despejando en funcion de la variable de estado iL:

diL

dt=

1

LvC.

Siendo los estados iL y vC, la representacion espacio de estado del sistema es:

d

dt

[ilvC

]

=

1

LvC

− 1

CvC +

1

Cv3

C +1

CiL

.

La dinamica del sistema presenta una representacion espacio estados de la forma x= f (x,0) ya que estamos lidiando

con un sistema no lineal.

11.1 Problemas Capıtulo 1 159

Problema 1.3: Preguntas varias

Responder segun se pida.

1. Control feedforward La Fig. (1.3) muestra una aplicacion tıpica de control feedforward.

El tanque de mezcla contınua posee una temperaturacontrolada por realimentacion. Control feedforward esempleado para suprimir rapidamente los disturbios enel flujo de alimentacion.

a) Destacar en la figura que lazos corresponden a re-alimentacion y feedforward, respectivamente. Justi-ficar.

b) Presentar el diagrama de bloques del sistema. (1.3) Control de temperatura.

2. Elementos basicos del sistema de control La Fig. (1.4) muestra un vehıculo de exploracion espacial (rover), ejemplo

de un sistema de control embebido. Los sistemas de control embebido emplean computadoras digitales de uso-

especıfico abordo como componente fundamental en el lazo de control por realimentacion.

(1.4) Un rover usando un sistema de control embebido en el lazo de control.

a) Identificar cada uno de los elementos basicos del sistema de control. Presentar el diagrama de bloques del sistema

incluyendo cada componente destacado en la figura.

b) ¿Cree Ud que una unica ley de control sera responsable del movimiento del rover? Justifique.

3. Puntos de equilibrio La Fig. (1.5) presenta al pendulo incluyendo dos magnetos de igual fuerza han sido adicionados

cerca a la la parte inferior del arco de oscilacion del pendulo.

Ayuda: La ecuacion del pendulo simple es:

ml2θ +bθ +mgl sinθ = 0,


a) Bosqueje el diagrama de plano de fase del sistema del sistemapendulo sin considerar los magnetos. Considere θ ∈ [−2π,2π].Explique el grafico realizado.

b) Si bien la ecuacion de movimiento del sistema incluyendo losmagnetos es compleja en su calculo, bosqueje como lucirıa el di-agrama de plano de fase del sistema. Considere θ ∈ [−π/2,π/2].¿Cuales son los puntos de equilibrio de este sistema? (1.5) Pendulo con dos magnetos.

donde θ es el angulo hecho por el pendulo con la vertical, g es la aceleracion de la gravedad y b > 0 el amor-

tiguamiento del sistema. Las variables de estado son θ y θ .

Problema 1.4: Modelado de sistemas

Encontrar formas de realizar operaciones de manipu-lacion/reparacion en el espacio es un problema que recibe bas-tante atencion - por ejemplo, para el ensamblaje de la estacionespacial internacional y para la recuperacion de satelites. En laactualidad el trabajo lo vienen realizando sistemas de manip-ulacion remota; sin embargo, un nuevo metodo considerandopartes inflables del manipulador viene siendo estudiado debidoa la gran reduccion en peso. La Fig. (1.6a) muestra la construc-cion de una estructura espacial desde un transbordador y la Fig.(1.6b) muestra un modelo del manipulador flexible donde J esla inercia del motor conductor, I es la inercia de la carga medi-da en su centro de masa, u es el torque generado el motor, m esla masa de la carga, l es la distancia al centro de gravedad dela carga, φ y θ son los angulos de rotacion del motor y la car-ga respectivamente, y k es la rigidez torsional del eje flexible.Considerar w como un torque externo que afecta a la carga.

(1.6) Sistema de manipulacion remota

1. Presentar un modelo mecanico traslacional, analogo al modelo mecanico torsional presentado en la Fig. (3b).

2. Calcular las ecuaciones de movimiento del sistema. Considerar el efecto de la fuerza gravitatoria (aun siendo esta

pequena).

3. Derivar la representacion espacio de estados del sistema introduciendo las variables de estado (normalizadas) x1 =

θ − φ ,x2 =θ − φ

ωo

, donde ωo =

√

k(J+ I +ml2)

J(I +ml2). Considerar aceleracion de la gravedad g = 0, solo para esta

pregunta.


Problema 1.5: Suspension de un vehıculo

Los vehıculos usan suspension activa y/o pasiva para permitir un paseo confortable en caso se presenten desniveles en

las carreteras. La Fig. (1.7) -derecha- muestra un diagrama esquematico del vehıculo con un sistema de suspension.

El modelo representa un cuarto del modelo del vehıculo; el vehıculo es aproximado por dos masas, una representa un

(1.7) Suspension del vehıculo

cuarto del cuerpo del vehıculo y la otra una rueda (incluyendo frenos y parte del sistema de suspension). El actuador

ejerce una fuerza F entre la rueda y el cuerpo que es calculada en base a la realimentacion de la distancia entre el

cuerpo y la rueda. Sean xb, xw y xr las alturas del cuerpo, rueda y superficie de la carretera medidas todas desde el

equilibrio. Representar la masa del cuerpo, masa de la rueda y rigidez de la rueda por mb, mw y kt , respectivamente.

Calcular lo que se pide:

1. Determinar las ecuaciones de movimiento. Incluir diagramas de cuerpo libre.

Nota: Las ecuaciones de movimiento deben de quedar en funcion de la fuerza F .

2. Un sistema de suspension convencional consiste en un resorte y un amortiguador, de rigidez k y coeficiente de amor-

tiguamiento c respectivamente, luego se tiene F = k(xw− xb)+ c(xw− xb). Escribir las ecuaciones de movimiento

para el sistema de suspension convencional en la forma espacio de estados. Detallar cual es el vector de estados, la

matriz dinamica, la matriz de entrada y la entrada.

3. ¿Cual seria la(s) salida(s) de interes del sistema? ¿Por que? Escribir la ecuacion de salida en su representacion

espacio de estados.

4. Presente el diagrama de bloques (diagrama de simulacion)correspondiente al sistema de suspension convencional.

Problema 1.6: Paseo dominguero en bicicleta

Una pareja sale a pasear en bicicleta un dia domingo. El muchacho (que pesa 200 libras) maneja una bicicleta vieja y

pesada, y la esposa (que pesa 100 libras) maneja una bicicleta de carrera, ligera, con ruedas de alta presion, rayos de

aluminio, etc. Ambos van paseando juntos cuando de pronto alcanzan una pendiente y deciden no pedalear ni frenar

en esta pendiente. Al final, el muchacho llega bien adelante de la esposa. Ambos quedan confundidos; ¡para que gastar

$1000 en una bicicleta tan lujosa si esto es lo que va a pasar!

Usted debe explicar este hecho analizando la dinamica del sistema como se pide a continuacion.

1. Obtenga un modelo para la bicicleta + conductor pendiente abajo. En otras palabras, grafique la bicicleta + conductor

bajando la pendiente. Su grafica debe incluir los parametros del sistema: masas, momentos de inercia, dimensiones,

angulos, etc.

2. Dibujar el diagrama de cuerpo libre para la bicicleta + conductor que muestre todas las fuerzas que actuan en el

sistema.

3. Escribir una ecuacion de movimiento del sistema de primer orden. Considere la inercia de las ruedas, estructura y

conductor como una sola inercia de masa.

4. Escribir la representacion espacio de estados del sistema descrito en el paso anterior. Senalar el/los estados y la/las

entradas. Adicionar la ecuacion de salida, especificando la/las salidas (Ud define las salidas).

5. Calcular el velocidad de equilibrio ve del sistema para el caso cuando la bicicleta es manejada en una pendiente con

inclinacion θ (θe = θ ).


6. (2 ptos) Escriba la aproximacion lineal del sistema en torno al punto de equilibrio (ve,θe).

7. En base a la descripcion de las bicicletas y de los conductores, usar el modelo linealizado para mostrar por que el

muchacho, de mayor peso y conduciendo la bicicleta vieja, termina llegando primero al final de la pendiente.

Sugerencia : Resolver la ecuacion diferencial para el caso v(0) = 0.

Despues de todo este analisis, ¿cual serıa la ventaja de poseer una bicicleta mas ligera? Respuesta: la ventaja se

manifiesta cuando se maneja cuesta arriba!

Problema 1.7: Microscopio de fuerza atomica (AFM, por sus siglas en Ingles)

El AFM es una de las principales herramientas en generacion de imagenes, medidas y manipulacion de materia en

la nanoescala. La informacion es colectada “palpando” la superficie de la muestra (sample) con una sonda mecanica

(viga voladiza - cantilever). Elementos piezoelectricos ejecutan pequenos y precisos movimientos generados por un

comando electronico.

Una diagrama esquematico del AFM se muestra en la figura de la izquierda. Una viga voladiza (cuya longitud

usualmente varia entre 50-200 µm) con una punta conica es colocada cerca de la muestra. La muestra puede ser movida

vertical y horizontalmente usando un elemento piezoelectrico. Cuando la muestra se acerca a la punta de la viga, fuerzas

de interaccion entre la muestra y la punta conllevan a una deflexion de la viga voladiza. La deflexion es medida usando

un rayo laser reflejado desde la parte superior de la viga voladiza hacia un arreglo de fotodiodos. La deflexion de la

viga es controlada por realimentacion usando un actuador piezolectrico que controla la posicion vertical de la muestra.

En base a experimentos se captura la dinamica del sistema piezoelectrico-viga voladiza y se obtiene un modelo

mecanico simple del sistema (figura de la derecha). El sistema puede ser modelado como dos masas separadas por

un piezoelectrico ideal. La masa m1 es la mitad del sistema piezoelectrico, y la masa m2 es la otra mitad del sistema

piezoelectrico mas la masa del apoyo. Se asume que el piezoelectrico genera una fuerza F entre las masas y que hay

amortiguamientos c1 y c2 en los resortes. Sean las posiciones de los centros de masa z1 y z2.82

Amplifier Amplifier

Sample

Cantilever

x,y z

LaserPhotodiode

Controller

Piezodrive

Deflection reference

Sweepgenerator

(a) Schematic diagram(1.8a) Diagrama esquematico del AFM

m1

k1

m2

c1

k2c2

F

F

Show that the dynamics can be written as(1.8b) Modelo mecanico del AFM con piezoelectrico

pre-cargado (F)

1. Determinar las ecuaciones de movimiento del sistema piezoelectrico - viga voladiza. Asumir que el sistema parte

del equilibrio estatico (no incluir fuerza gravitacional). Presentar diagramas de cuerpo libre

2. Sea la elongacion del elemento piezoelectrico l = z1− z2 la variable de control y sea la deflexion de la viga voladiza

z1 la variable de salida, eliminar la variable F en las ecuaciones anteriores y reescribir las ecuaciones en funcion de

las variables l y z1

3. Usando las ecuaciones lineales l = k3u y y = k4z1, escribir el modelo del sistema relacionando la salida y con su

senal de control u. La salida y corresponde a la deflexion amplificada y la senal de control u corresponde al voltaje

aplicado al piezoelectrico

4. Calcular la representacion espacio de estados del sistema anterior. ¿Cuales son los estados, la/las entrada/as y salida

del sistema?

5. Obtener la funcion de transferencia del sistema piezoelectrico-viga voladiza, G(s) = Y (s)U(s) .

6. Calcular la dinamica normalizada del sistema y su correspondiente representacion espacio de estados. Sugerencia:

Definir las variables adimensionales x = yL

y τ = ωt, donde ω =√

km

, y seleccionar la entrada de control v de la

forma mas conveniente

Problema 1.8: Preguntas variadas

Responda segun sea el caso. Argumente en las respuestas.


1. La Fig. (1.9) muestra la respuesta en el tiempo de un sistema con control crucero a un cambio en la rapidez de 25m/s a 30 m/s. Las 3 curvas corresponden a masas del vehıculo diferentes, entre 1000 y 3000 kg, ¿que propiedad delsistema controlado se demuestra en esta grafica?

a) Realimentacion.b) Robustez.c) Estabilidad.d) Desempeno.

Compute

Actuate

Throttle

Sense

Speed

0 5 10

25

30

Speed[m/s]

Time [s]

m

(1.9) Sistema de control por realimentacion para controlar la rapidez del vehıculo.

2. Demostrar que el sistema masa-resorte mq+kq= u posee la representacion espacio de estados descrita abajo cuandose consideran las variables adimensionales x = q/l y τ = ωot,

d

dτ

[x

dx/dτ

]

=

[0 1

−1 0

][x

dx/dτ

]

+

[0

1

]

v,

donde l es la amplitud de oscilacion de q y ω2o = k/m. ¿Cual es el valor de v?

3. Usando las respuestas en el tiempo de la Fig. (1.10b), explicar que es lo fısicamente esta sucediendo con el vehıculo.

Fundamente con ecuaciones, diagramas de cuerpo libre, etc.

gF

mg

F

θ

(a) Effect of gravitational forces

0 10 20 30

19

20

Time t [s]

Vel

oci

ty v

[m

/s]

0 10 20 300

1

Time t [s]

Th

rott

le u

(b) Closed loop response

(1.10a) En t = 5s el vehıculo con control crucero encuentra una pendiente. (1.10b) Respuesta en lazo cerrado.

4. La representacion en lazo cerrado del sistema de control de vuelo de una mosca se puede dividir en varios bloques:

la dinamica del cuerpo y aerodinamica del cuerpo como la planta, a la aerodinamica del ala como el actuador, al

giroscopio neuromecanico como el saturador, al sistema de vision como el sensor y el sistema sensoriomotor como

el controlador. Ubicar estos componentes del sistema de control en el diagrama de bloques de la Fig. (1.11).

Problema 1.9: Modelado1. Calcular la ecuacion de movimiento de la bola de poliestireno a lo largo del eje x de la region de entrampamiento.

Usar la 2da Ley de Newton.

2. Si se trabaja con una bola de poliestireno de 1µm de diametro, la masa resultante serıa m≈5.5 10−10mg, la misma

que se puede considerar despreciable. Para el caso de masa despreciable, representar la ecuacion de movimiento de

la bola en la forma espacio de estados. Asumir que se puede medir el desplazamiento x de la bola mas un ruido n.

3. Determinar el (los) punto(s) de equilibrio para cuando la posicion central del laser es u. ¿Sera que todos los puntos

de equilibrio calculados son puntos validos?


(1.11) Vision como mecanismo compensatorio para atenuacion de disturbios tipo viento vw.

Un microscopio de pinzas opticas es un instrumento cientıfico capaz de manipularpartıculas dielectricas (dimensiones en nm o µm) mediante la aplicacion de fuerzas(en el orden de pN) via un rayo laser focalizado. Este microscopio es muy usadoen el estudio de sistemas biologicos, ver Fig.1 donde se realiza un estiramiento dela molecula de ADN para determinar sus propiedades fısicas; los extremos de lamolecula de ADN estan pegados a unas bolas de poliestireno.La Fig.(1.12) muestra el punto mas estrecho del haz de laser, el cual posee ungradiente de campo electrico muy fuerte que atrae a las partıculas dielectricas,formandose una especie de trampa. Cuando la bola es movida del centro de la tram-pa debido a una fuerza externa, el haz de laser es deflectado; esta deflexion se midecon un fotodiodo detector de posicion. El objetivo de control consiste en reducir lasvariaciones en la posicion de la bola debido a la accion de fuerzas externas.La bola de poliestireno posee masa m y su desplazamiento en la direccion +x esdebido a las siguientes fuerzas:

Fo: fuerza de entrampamiento optico (fuerza restauradora), donde u es la posi-cion central del laser focalizado y viene a ser la entrada de control, y α1,α3 > 0.

Fo =

α3(x−u)3−α1(x−u), para |x−u|< R =

√α1

α3

0, otro caso

,

Fd : fuerza de arrastre viscoso. Fd =−β x, β > 0.Ft : fuerza termica.Fe: otras fuerzas externas que dependen de las condiciones del experimento.

Fig.(1.12) Diagrama esquematico de un experimentode estiramiento de una molecula de ADN.

Fig.(1.13) Desplazamiento en el eje x de la bola depoliestireno atrapada por el rayo laser.

4. Escribir la representacion lineal del sistema en torno a un punto de equilibrio apropiadamente elegido.

5. ¿Es el sistema estable, controlable, observable?

Problema 1.10: Modelado

1. (2 ptos) Deducir las ecuaciones de movimiento del sistema para el caso sin friccion. Suponer que la velocidad de la

carrera del piston h(t) es directamente proporcional al flujo de volumen ingresando al cilindro hidraulico. Escribir

las ecuaciones en su representacion espacio de estados. Considerar que los estados son: x1(t) = p(t), x2(t) = p(t) y

x3(t) = h(t).

Ayuda: sinϕ(t) =

√

h(t)2− h(t)4

4


p t( )

v t( )

1

1

u t( )

h t( )

ϕ t( )

m

u t( )

p t( )·

·

x p=

Fig.(1.14) Elevador hidraulico

La Fig.(1.14) muestra un sistema mecanico de incli-nacion de una pendiente. El nivel puede ser cambiadohidraulicamente (el vehıculo no puede detenerse). Lavariable de control de este sistema u(t) es el flujo de vol-umen del fluido entrando al cilindro hidraulico, y la vari-able de salida es la posicion p(t) del vehıculo con masam. La velocidad angular ϕ(t) es muy pequena (ϕ(t) ≈0), de modo que las fuerzas centrıfugas se pueden des-preciar.

2. (2 ptos) Calcular la representacion lineal del sistema en torno al punto de operacion ho = 0 (suponer que se puede

lograr este punto con el dispositivo). Ayuda:∂

∂h

√

h(t)2− h(t)4

4

∣∣∣∣∣∣h=0

= 1.

3. (1 pto) Analizar la estabilidad del sistema lineal. ¿Es el sistema controlable?



Problema 2.1: Oscilador Van der Pol

Considere el circuito simple R,L,C de laFig.(2.1) con L y C siendo elementos lineales y R

siendo un resistor no lineal (no cumple la ley deOhm VC = iRR, en su lugar iR = f (vC)). La figuraa la derecha muestra la caracterıstica del resistor.

(2.1) Circuito de oscilacion Van der Pol

1. Elegir como estados a la corriente en el inductor iL y el voltaje del capacitor vC y calcular la representacion espacio

de estados del sistema.

Siendo los estados iL y vC, la representacion espacio de estado del sistema es:

d

dt

[iLvC

]

=

1

LvC

− 1

CvC +

1

Cv3

C +1

CiL

.

2. Encontrar el(los) punto(s) de equilibrio del sistema

Los puntos de equilibrio se encuentran al igual a cero las derivadas con respecto al tiempo en la representacion

espacio de estados. Entonces:

d

dt

[iLe

vCe

]

=

[0

0

]

=

1

LvCe

− 1

CvCe +

1

Cv3

Ce +1

CiLe

.

Las ecuaciones que se deben resolver para calcular los puntos de equilibrio son:

vCe = 0 y − 1

CvCe +

1

Cv3

Ce +1

CiLe = 0

Luego el punto de equilibrio es: (iLe,vCe) = (0,0).3. Seleccionar un punto de equilibrio y calcular la representacion lineal del sistema en torno al punto de equilibrio

seleccionado.

La dinamica linealizada del sistema en torno al punto de equilibrio antes calculado:

d

dt

[iLvC

]

=

1

LvC

− 1

CvC +

1

Cv3

C +1

CiL

=

[f1(iL,vC)f2(iL,vC)

]

.

d

dt

[iLvC

]

=

∂ f1

∂ iL

∂ f1

∂vC∂ f2

∂ iL

∂ f2

∂vC

∣∣∣∣∣∣∣ iL = iLe

vC = vCe

[iLvC

]

[iLvC

]

=

01

L1

C− 1

C+3

1

Cv2

C

∣∣∣∣∣∣∣ iL = iLe

vC = vCe

[iLvC

]

.


[iLvC

]

=

01

L1

C− 1

C

[iLvC

]

.

4. ¿Que puede decir sobre la estabilidad del sistema en torno al punto de equilibrio seleccionado?

La estabilidad del sistema lineal se calcula resolviendo para los autovalores del sistema:

λ (A) = λ

01

L1

C− 1

C

=− 1

2C± 1

2C

√

1+4C

L

Como√

1+4CL> 1, entonces existe un autovalor de A con parte real negativa, esto significa que el punto de

equilibrio (0,0) es inestable.

Problema 2.2: Aeronave PVTOL

Considere una aeronave de despegue y aterrizaje vertical (PVTOL), como mostrado en laFig.(2.2). Los estados son las posiciones y,z del centro de masa, el angulo de alabeo φ , ylas velocidades correspondientes, y, z, φ . Las entradas de control, ut y um, son el empujeaplicado en el centro de masa y el momento de alabeo en torno al centro de masa de laaeronave, respectivamente. Adicionalmente, ε > 0 es un coeficiente pequeno relacionadoal acoplamiento entre el momento de alabeo y la aceleracion lateral de la aeronave. Final-mente, g denota la fuerza gravitacional.En el modelo de la aeronave PVTOL, desprecie el efecto de flexion en las alas o fuselaje yconsidere a la aeronave como un cuerpo rıgido.

(2.2) Aeronave PVTOL

1. Calcular las ecuaciones de movimiento del PVTOL. Masa de la aeronave, m, y momento de inercia con respecto al

centro de masa de la aeronave y a lo largo del fuselaje es J.

Las ecuaciones de movimiento para un prototipo PVTOL son:

my = sinφut − cosφεum

mz = −cosφut − sinφεum +mg

Jφ = um

2. Escribir las ecuaciones de movimiento usando las siguientes variable normalizadas: Y =y

g,Z =

z

g,Um =

um

J,Ut =

ut

mg,Ξ =

εJ

mg.

Usando las variables normalizadas se obtiene:

Y = sinφUt − cosφΞUm

Z = −cosφUt − sinφΞUm +1

φ = Um

Luego, el sistema en su representacion espacio de estados es:

d

dt

Y

Z

φY

Z

φ

=

Y

Z

φsinφUt − cosφΞUm

−cosφUt − sinφΞUm +1

Um


donde

Y

Z

φY

Z

φ

es el vector de estados y

[Ut

Um

]

es el vector de entradas de control.

3. Determinar el/los punto/s de operacion del PTVOL. ¿Cual es la implicancia del punto de operacion?

Para calcular los puntos de equilibrio igualamos a cero las derivadas, asi:

d

dt

Y

Z

φY

Z

φ

= 0 =

Ye

Ze

φe

sinφeUte− cosφeΞUme

−cosφeUte− sinφeΞUme +1

Ume

.

Lo que resulta en:Ye = 0

Ze = 0

φe = 0

Ume = 0→Ume = 0

sinφeUte− cosφeΞUme = 0→ sinφeUte = 0

−cosφeUte− sinφeΞUme +1 = 0→ cosφeUte = 1

Si elegimos Ute = 0→ de cosφeUte = 1→ 0 = 1? (inconsistente!). Luego la unica opcion es que cosφe = 1, lo cual

se cumple para φe = kπ, k ∈ Z.

4. Elija un punto de operacion para la linealizacion del sistema. Represente el sistema linealizado en su forma espacio

de estados.

Elegimos el punto de operacion (Ye,Ze,φe,Ye, Ze, φe,Ute,Ume) = (Ye,Ze,0,0,0,0,0,1).Identificamos apropiadamente a las funciones que usaremos para las derivadas:

d

dt

Y

Z

φY

Z

φ

=

Y

Z

φsinφUt − cosφΞUm

−cosφUt − sinφΞUm +1

Um

=

f1(Y,Z,φ ,Y , Z, φ)f2(Y,Z,φ ,Y , Z, φ)f3(Y,Z,φ ,Y , Z, φ)f4(Y,Z,φ ,Y , Z, φ)f5(Y,Z,φ ,Y , Z, φ)f6(Y,Z,φ ,Y , Z, φ)

Derivando apropiadamente para formar las matrices A y B:

d

dt

Y

Z

φ˜Y˜Z˜φ

=

∂ f1

∂Y

∂ f1

∂Z

∂ f1

∂φ

∂ f1

∂Y

∂ f1

∂ Z

∂ f1

∂ φ∂ f2

∂Y

∂ f2

∂Z

∂ f2

∂φ

∂ f2

∂Y

∂ f2

∂ Z

∂ f2

∂ φ∂ f3

∂Y

∂ f3

∂Z

∂ f3

∂φ

∂ f3

∂Y

∂ f3

∂ Z

∂ f3

∂ φ∂ f4

∂Y

∂ f4

∂Z

∂ f4

∂φ

∂ f4

∂Y

∂ f4

∂ Z

∂ f4

∂ φ∂ f5

∂Y

∂ f5

∂Z

∂ f5

∂φ

∂ f5

∂Y

∂ f5

∂ Z

∂ f5

∂ φ∂ f6

∂Y

∂ f6

∂Z

∂ f6

∂φ

∂ f6

∂Y

∂ f6

∂ Z

∂ f6

∂ φ

∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣

Y = Ye

Z = Ze

φ = φe

Y = Ye

Z = Ze

φ = φe

Ut =Ute

Um =Ume

Y

Z

φ˜Y˜Z˜φ

+

∂ f1

∂Ut

∂ f1

∂Um∂ f2

∂Ut

∂ f2

∂Um∂ f3

∂Ut

∂ f3

∂Um∂ f4

∂Ut

∂ f4

∂Um∂ f5

∂Ut

∂ f5

∂Um∂ f6

∂Ut

∂ f6

∂Um

∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣

Y = Ye

Z = Ze

φ = φe

Y = Ye

Z = Ze

φ = φe

Ut =Ute

Um =Ume

[Ut

Um

]


Luego:

d

dt

Y

Z

φ˜Y˜Z˜φ

=

0 0 0 1 0 00 0 0 0 1 00 0 0 0 0 10 0 cosφUt + sinφΞUm 0 0 00 0 sinφUt − cosφΞUm 0 0 00 0 0 0 0 0

∣∣∣∣∣∣∣∣∣∣

Y = Ye

Z = Ze

φ = φe

Y = Ye

Z = Ze

φ = φe

Ut =Ute

Um =Ume

Y

Z

φ˜Y˜Z˜φ

+

0 00 00 0

sinφ −cosφΞ−cosφ −sinφΞ

0 1

∣∣∣∣∣∣∣∣∣∣

Y = Ye

Z = Ze

φ = φe

Y = Ye

Z = Ze

φ = φe

Ut =Ute

Um =Ume

[

Ut

Um

]

y:

d

dt

Y

Z

φ˜Y˜Z˜φ

=

0 0 0 1 0 0

0 0 0 0 1 0

0 0 0 0 0 1

0 0 0 0 0 0

0 0 −Ξ 0 0 0

0 0 0 0 0 0

Y

Z

φ˜Y˜Z˜φ

+

0 0

0 0

0 0

0 −Ξ−1 0

0 1

[Ut

Um

]

Problema 2.3: masa-resorte-amortiguador

Para el sistema masa-resorte no lineal-amortiguador nolineal mostrado en la Fig.(2.3) se pide:

1. Calcular el punto de equilibrio del sistema para fe =16.

2. Escribir la representacion lineal del sistema con re-specto al punto de equilibrio antes calculado.

LINEARIZATION EXAMPLE

(2.3) masa-resorte no lineal-amortiguador

La ecuacion de movimiento del sistema es:

Mx+B(x3 + x)+K|x|x = 16+ cosωt

La correspondiente representacion espacio de estados es:

d

dt

[x

x

]

=

[x

− B

M(x3 + x)− K

M|x|x+ 16

M+

1

Mcosωt

]

Representacion lineal del sistema en relacion a una excitacion promedio f (t) = 16:

En el punto de equilibrio se cumple: ue = 16, |xe|xe =16

K→ xe =

4√K

d

dt

[x˙x

]

=

[0 1

−2K

M|x| − B

M(3x2 +1)

]∣∣∣∣∣pto equilibrio

[x˙x

]

+

[01

M

]

cosωt

Luego:

d

dt

[x˙x

]

=

0 1

−8√

K

M− B

M

[x˙x

]

+

[01

M

]

cosωt


con: ˙x(0) = 0 y x(0) = x(0)− xe(0) = 0− 4√K

=− 4√K

Problema 2.4: circuito no lineal

Para el sistema mostrado en la Fig.(2.4) sepide:

1. Calcular el punto de equilibrio del sis-tema para Ve = 2.

2. Escribir la representacion lineal delsistema con respecto al punto de equi-librio antes calculado.

STATE-SPACE LINEARIZATION EXAMPLE (Close, Frederick & Newell, Example 9.9)

(2.4) circuito no lineal

Problema 2.5: Control de rapidez

La dinamica del sistema de control es:

mdv

dt= αnuT (αnv)︸︷︷︸

F

+−mgCrsgn(v)− 1

2ρCdAv2−mgsinθ

︸︷︷︸

Fd

,

donde F representa la fuerza generada por el motor y Fd representa la friccion alrodamiento, el arrastre aerodinamico y la fuerza gravitacional, ver Fig.(5). El torqueT (αnv) = T (ω) = Tm(1− β ( ω

ωm− 1)2), donde Tm es el torque maximo obtenido

a la velocidad angular del motor ωm. Parametros tipicos son Tm = 190Nm, ωm =420rad/s (para 4000 rpm) y β = 0,4. Otros valores tıpicos: α4 = 12, ρ = 1,3 kg/m3,Cr = 0,01, Cd = 0,32, A = 2,4m2, m = 1000kg.

gF

mg

F

θ

(2.5) Vehıculo sobre una pendiente, modelo paracontrol crucero

1. Existe un punto de equilibrio (ve,ue,θe) donde la fuerza aplicada por el motor balancea las fuerzas de disturbio.

Calcular la entrada ue para un viaje en cuarta con ve = 25m/s, θe = 0. Rpta: ue = 0,1687.

2. Para el punto (ve,ue,θe), verificar que el modelo lineal esta resulta:dv

dt=−0,0101v+1,32u−9,8θ .

3. Definir la salida v para el sistema lineal antes calculado.

4. Si se cierra el lazo de control con u =−0,5v−0,1z, donde z = v. Mostrar el diagrama de bloques del sistema (como

representarıa esta ley de control en Matlab/Simulink).

5. Escribir la representacion espacio de estados del sistema controlado, con estados v y z. Incluir la ecuacion de salida.

Problema 2.6: Linealizacion

Se cumple 0 =Cm(0,0, δe), δe =cte. Responder segun corresponda:

1. Presentar el diagrama de bloques del sistema autopiloto destacando los elementos basicos del sistema de control.

Incluir todas las variables dadas.

A continuacion el diagrama de bloques del sistema.

2. Escribir la ecuacion de movimiento rotacional (cabeceo) de la aeronave en su forma espacio de estados. Incluir la

ecuacion de salida.

Escribiendo la dinamica rotacional del sistema:

Jθ = M

Jθ = 12CmρV 2Sc

Jθ = 12Cm(θ , θ ,δe)ρV 2Sc

Representacion espacio de estados:

d

dt

[θθ

]

=

[θ

1

2JCm(θ , θ ,δe)ρV 2Sc

]

y = f (θ)


La Fig. (2.6) muestra el lazo de control del cabeceo (pitch) de un sistemaautopiloto. El sistema de control recibe una senal y del giroscopio. La senaly es una funcion f (θ), donde θ es la desviacion de la aeronave a partir de lacondicion predefinida del cabeceo. La presencia de una senal y produce unarotacion δe en el elevador (actuador) de la aeronave. La rotacion del elevadorproduce una tasa de variacion en el cabeceo de la aeronave igual a e, la mismaque es retornada como mostrado en la figura.Sea J el momento de inercia de la aeronave respecto al eje de rotacion quepasa por O y sea M = 1

2CmρV 2Sc el momento neto del cabeceo, con Cm =

Cm(θ , θ ,δe) el coeficiente de momento del cabeceo, V la velocidad de laaeronave, S la superficie del ala, c la longitud de la cuerda aerodinamica y αel angulo de ataque. (2.6) Sistema autopiloto (cabeceo).

(2.7) Diagrama de bloques sistema autopiloto (cabeceo).

3. Calcular la representacion lineal del movimiento rotacional de la aeronave. ¿Que punto de equilibrio empleo para la

linealizacion?.

Calculo de los ptos de equilibrio:[

0

0

]

=

[θ

1

2JCm(θ , θ ,δe)ρV 2Sc

]

Se sabe que Cm(0,0, δe) = 0. Luego un punto de equilibrio es xe =

[0

0

]

, ue = δe.

La representacion lineal del sistema para el punto de equilibrio elegido es:

d

dt

[θ˙θ

]

=

0 1

αo

∂Cm(0,0, δe)

∂θαo

∂Cm(0,0, δe)

∂ θ

[θ˙θ

]

+

0

αo

∂Cm(0,0, δe)

∂δe

δe

y =

[

∂ f (0)

∂θ0

][θ˙θ

]

donde αo =1

2JρV 2Sc.



Problema 3.1: Analisis sistemas lineales

Responder segun corresponda:

1. Sea el sistema:

dx

dt=

[0 1

0 0

]

x+

[1

0

]

u

y =[

1 0]

x

, con ley de control: u =−Kx+ krr.

Demostrar que los polos del sistema en lazo cerrado no pueden ser asignados arbitrariamente.

2. Considerar el sistema mostrado en la Fig. (3.1).

La dinamica de cada uno de los subsistemas se puede escribir como:

dx

dt= Ax+Bu1

y1 =Cx,

dz

dt= Az+Bu2

y2 =Cz.

Demostrar que el sistema formado por los dos subsistemas identicos, con entrada

u =[

u1 u2

]Ty salida igual a y = y1 + y2, no es observable. (3.1) Salida formada por la suma de salidas y1 y y2

Problema 3.2: Control de posicion de cuchilla

Maquinas tipo torno son controladas automaticamente(ver Fig.(3.2)). Considerando un eje, la posicion desea-da de la cuchilla se compara con la posicion actual yesta informacion es usada para activar una bobina, lacual controla la presion dentro del actuador hidraulico.

El sistema actuador-cuchilla esta descrito por:

Gxy(s) =X(s)

Y (s)=

1

s(0,5s+1).

El voltaje de salida del amplificador es:

Eo(s) = AE(s) = A[Rd(s)−X(s)]

128 INTRODUCTION TO CONTROL ENGINEERING

Eo i

RL

Differenceamplifier

A

Spring, K

rd

yFluid supply

Position feedback x

Cutting tool

Work piece

(a)

G(s)+– Tool position

R (s)d A 1R + sL

E (s)o I(s)– KK2

F(s) Y(s) X(s)

(b)

Fig. P4.7 (a) Tool position control, (b) Block diagram

(3.2) Control de posicion de la cuchilla

donde rd(t) es la posicion deseada de la cuchilla y e(t) es el error entre la posicion deseada y la posicion medida. La

fuerza en el eje actuador es proporcional a la corriente i(t) tal que F = K2i(t) donde K2 = 2,0. La fuerza es balanceada

contra el resorte, F =−Ky(t), donde K = 1,2 es la constante del resorte, y R = 10 Ω y L = 0,5 H. Sea A = 6,95.

1. Graficar el diagrama de bloques del sistema de control de posicion de cuchilla.

2. Expresar la funcion de transferencia actuador-cuchilla en su forma canonica modal.

3. Calcular la matriz de transicion eAt = L −1(sI−A)−1 para la representacion espacio de estados antes calculada.

4. Para el sistema en lazo cerrado (entrada rd(t), salida x(t)), determinar la correspondiente forma canonica contro-

lable.


Problema 3.3: Efecto integral

Un velero de masa m se encuentra inicialmente en reposo, v(0) = 0. En el tiempo t = 0, se presentaun fuerte viento de magnitud Vo = 10 m/s.Asumir que la fuerza del viento sobre las velas es en la direccion del viaje y esta dado por Fw(t) =bw[Vo−v(t)]. Asumir que el arrastre viscoso del agua sobre el velero esta dado por Fd(t) = bdv(t). (3.3) Diagrama del velero

1. Escribir la ecuacion de movimiento del velero en la forma de espacio de estados. Usar como variable de estado a la

velocidad v(t). Asumir que se puede medir v(t).2. Para las condiciones dadas en el enunciado del problema, calcular la velocidad del velero en estado estacionario.

¿Es la velocidad del velero menor que 10 m/s?

Ayuda. Sea el sistema:


y =Cx+Du, si u(t) =

0 t = 0,

u = cte t > 0,, la salida del sistema esta dada por:

y(t) =CeAtx(0)+CA−1eAtBu+D−CA−1Bu.

3. Si el objetivo es mover el velero a una velocidad vr(t), ¿que modificacion debemos realizar a la ecuacion de

movimiento? Mostrar que con control integral es posible seguir una velocidad de referencia vr(t) =cte.


1. ¿Cual es la principal ventaja de un diseno de control por realimentacion de estados en relacion a un diseno de control

proporcional o proporcional derivativo (PD) usado en control clasico?

2. Defina cada termino en las expresiones dadas abajo.

Sea el sistema:


y =Cx+Du, la solucion y la salida estan dadas por:

x(t) = eAtx(0)︸︷︷︸

?

+∫ t

0eA(t−τ)Bu(τ)dτ

︸︷︷︸

?


0CeA(t−τ)B︸︷︷︸

?

u(τ)dτ

3. Mencione dos formas de obtener la matriz de funciones de transferencia del sistema


y =Cx+Du.

Explique que representa la funcion de transferencia.

4. Pruebe que, para el sistema


y =Cx+Du, los autovalores de la matriz A son los polos del sistema.

5. Pruebe que, para una realizacion espacio de estados de orden n en la forma canonica modal, la matriz de controla-

bilidad es de la forma:

Wc =

. . ....

......

0 0 1 . . .0 1 −an−1 . . .1 −an−1 −a2

n−1−an−2 . . .


donde a1,a2, . . . son los coeficientes del polinomio caracterıstico sn + an−1sn−1 + an−2sn−2 + . . . . Asuma que el

sistema solo tiene una entrada.

6. ¿Existe alguna limitacion practica en los valores seleccionados para las ganancias K del control por realimentacion

de estados u =−Kx? En otras palabras, analice que pasa con la senal de control u si se eligen polos en lazo cerrado

muy alejados del eje imaginario.



Problema 4.1: Controlabilidad y observabilidad, formas canonicas

Responda lo que se pide:

1. Para el sistema dado en el diagrama de simulacion de la Fig. (4.1), encontrar las condiciones necesarias y suficientes

para los valores de α , β , k1 y k2 tal que el sistema sea tanto controlable como observable.

(4.1) Diagrama de simulacion

2. Para el sistema descrito por la funcion de transferencia abajo:

Y (s)

U(s)=

s2−2

s(s2−1)

escribir la representacion espacio de estados tanto en la forma canonica controlable como en la forma canonica

modal. Sugerencia: Comience calculando la forma canonica controlable.

Problema 4.2: Solucion ecuacion espacio de estados

Un sistema en lazo cerrado para controlar la concentracion quımica se muestra en la Fig. (4.2). La alimentacion es

granular y de composicion variable. Se desea mantener una composicion constante de la mezcla a la salida mediante

ajuste de la valvula de flujo. La funcion de transferencia del tanque y la valvula de salida esta dada por:

G(s) =4

4s+1

y el controlador es representado por:

Gs(s) = k1 +k2

s

El transporte de la alimentacion a lo largo de la faja transportadora introducirıa un retraso de 2 segundos, que para

efectos de este problema sera ignorado. Considerar k1 = 0,1 y k2 = 0,02. Calcular lo que se pide:

(4.2a) Control de concentracion quımica (4.2b) Diagrama de bloques del sistema de control


1. ¿En que punto del diagrama de bloques (Fig. 4.2a) se debe incluir el retraso?

2. Cerrar el lazo de control y expresar la funcion de transferencia en lazo cerrado en su forma canonica modal. ¿Es el

sistema estable?

3. Obtener la expresion para la salida y(t) asumiendo que la entrada (set point) es un escalon de magnitud unitaria y

que el vector de estados inicial es qo = [0,5,0,0]T .

4. Expresar la funcion de transferencia en lazo cerrado en su forma canonica observable.



Problema 5.1: Control por realimentacion de estados

La representacion espacio de estados normalizada que describe la desviacion lateral de un vehıculo (manejado en el

eje x) esta dada por:

[y

θ

]

=

[0 10 0

][y

θ

]

+

[γ1

]

δ

z =[

1 0][

y

θ

]

donde y y θ son la posicion lateral y orientacion del centrode masa del vehıculo, respectivamente, y δ es el angulo de lallanta delantera. Sea γ = a/b = 0,5.

ab

α δv

y

x

α

α

δ

δ

θ

(5.1) Control de la direccion de un vehıculo. Derecha: modelo simplificadode una bicicleta.

1. ¿Es el sistema inestable, asintoticamente estable o marginalmente estable?

2. Si se desea disenar un controlador por realimentacion de estados para estabilizar la dinamica y seguir una referencia

dada r de la posicion lateral del vehıculo, calcular las ganancias de la ley de control u =−Kx+ krr para un tiempo

de asentamiento de la respuesta igual a 4 s. Considere una razon de amortiguamiento ζ = 0,707 para los polos en

lazo cerrado.

Ayuda: Tiempo de asentamiento ts ≈ 4/ζ ωo.

3. (2 ptos) Para la ley de control antes usada, calcular la salida controlada z(t) a una entrada r(t) del tipo escalon

unitario con y(0) = 0 y θ(0) = 0. Resolver tambien para la entrada de control δ (t). Bosquejar la posicion lateral y

y el angulo de la llanta delantera δ .

4. ¿Cual es el valor inicial de la senal de actuacion? ¿Habrıa algun problema con la actuacion? ¿Que recomienda para

solucionar el problema?

5. Disene el observador de estados con una seleccion de polos apropiada. Senale que polos eligio.

6. Calcule la funcion de transferencia del sistema en lazo cerrado. ¿Por que no aparece la informacion del observador?


1. Calcule la matriz de funciones de transferencia del diagrama de bloques de la Fig. (5.2), en otras palabras G(s) en

la siguiente expresion:[

y1

y2

]

= G(s)

[u1

u2

]

(5.2) Diagrama de bloques

De la figura se tiene:


y1 =−1

(s−1)(s+1)u1 +

1,5

(s−1)(s+2)u2

y2 =−1

(s+3)(s+1)u1 +

1,5

(s+3)(s+2)u2

Agrupando terminos:

[y1

y2

]

=

−1

(s−1)(s+1)

1,5

(s−1)(s+2)−1

(s+3)(s+1)

1,5

(s+3)(s+2)

[u1

u2

]

¿Como seria llevar G(s) a su forma espacio de estados?

Idea: Ver el problema a continuacion.

2. Un sistema compuesto por dos subsistemas conectados en cascada es mostrado en la Fig. (5.3). Sean las variables de

estado del sistema x1 = y1−u1 y x2 = y2. Asumir que la entrada al sistema es u= u1 y que la salida es y= y2. Obtener

el modelo de espacio de estados del sistema interconectado. ¿Cuando es el sistema no controlable? Encontrar la

funcion de transferencia del sistema no controlable.

Sugerencia: Usar transformada de Laplace inversa en cada uno de los bloques.

u1 y1 u2 y2

yu

s a

s b

1

s c

(5.3) Diagrama de bloques

Del diagrama de bloques se tienen las siguientes funciones de transferencia:

y1 =s+a

s+bu1

y2 =1

s+ cu2 =

1

s+ cy1

Usando transformada de Laplace inversa:

y1 +by1 = u1 +au1

y2 + cy2 = y1

Reescribiendo las ecuaciones para x1 = y1−u1 y x2 = y2:

y1− u =−by1 +au1

y2 = y1− cy2

x1 =−b(x1 +u1)+au1

x2 = x1 +u1− cx2

En la forma espacio de estados el sistema interconectado queda como:

[x1

x2

]

=

[−b 0

1 −c

][x1

x2

]

+

[a−b

1

]

u

y =[

0 1][

x1

x2

]

Analizando la controlabilidad del sistema:

Wc =[

B AB]=

[a−b −b(a−b)

1 a−b− c

]

El sistema es no controlable si det(Wc) = (a− c)(a−b) = 0.


3. Considere la planta con la siguiente representacion espacio de estados:

x =

[−2 −1

1 0

]

x+

[1

0

]

u

y =[

0 1]

x+Du

Usar la formula de Ackerman para para disenar un control por realimentacion de estados u =−Kx+ krr tal que los

polos en lazo cerrado se ubiquen en s = −2,−2. (Encontrar K y kr)

Usando la formula de Ackerman:

K = q1αc(A)

donde q1 es la ultima fila de la inversa de la matriz de controlabilidad y αc(s) es la ecuacion caracterıstica del

sistema en lazo cerrado.


Wc =

[1 −2

0 1

]

W−1c =

[1 2

0 1

]

luego: q1 =[

0 1]

La ecuacion caracterıstica:

αc(s) = (s+2)(s+2) = s2 +4s+4

Entonces:

K =[

0 1]

([−2 −1

1 0

]2

+4

[−2 −1

1 0

]

+4

[1 0

0 1

])

La ganancia de alimentacion directa o prefiltro Kr:

kr =−1/(C(A−BK)−1B)← revisar!

4. Considere la planta del problema anterior, calcular los ceros de transmision del sistema:

x =

[−2 −1

1 0

]

x+

[1

0

]

u

y =[

0 1]

x+u

Los ceros de transmision del sistema se calculan resolviendo para s en la siguiente ecuacion:

det

([−sI +A B

C D

])

= 0

det

−s−2 −1 1

1 −s 0

0 1 1

= 0

Algunas definiciones:

Sistema de fase mınima: ceros de la funcion de transferencia a la izquierda del semiplano complejo abierto.

Problema 5.3: Controlabilidad

1. ¿Es el sistema completamente controlable? Fundamente su respuesta sin calcular la matriz de controlabilidad.

2. ¿Para que valores de a se garantiza la estabilidad asintotica del sistema? ¿Para que valores de a y b es el sistema

estabilizable?

3. ¿Para que valor de a el sistema no es completamente observable?

Problema 5.4: Control por realimentacion de estados, entradas constantes

Responda lo que se pide:


Considerar el sistema lineal:

x(t) =

1 0 a

0 −5 0−1 0 −2

x(t)+

b

01

u(t)

y =[

1 1 0]

x(t)

(5.4) Estructura del sistema

1. Describir dos formas en que la entrada de referencia puede ser introducida en un sistema de control por reali-

mentacion de estados de tal forma que la respuesta tenga error cero en estado estacionario para cambios del tipo

escalon en la senal de referencia. Fundamente su respuesta. Nota: No incluir control integral en esta parte. Una ley

de control serıa la presentada en clase u =−Kx+ krr, la otra queda a su criterio!

2. Describir como control integral puede ser introducido en un sistema de control por realimentacion de estados de

tal forma que se tenga la respuesta en estado estacionario con error cero tanto para senales de referencia como

disturbios en la planta del tipo escalon.

Problema 5.5: Control por realimentacion de estados - unidad de cinta)

Las ecuaciones de movimiento de un mecanismo de unidad de cinta mostrado en la Fig. (6.4) estan dadas por:

x =

0 2 0 0 0

−0,1 −0,35 0,1 0,1 0,75

0 0 0 2 0

0,4 0,4 −0,4 −1,4 0

0 −0,03 0 0 −1

x+

0

0

0

0

1

u

y =[

0,5 0 0,5 0 0]

x

donde los elementos del vector de estados x son x1 (posicion de la cinta en el cabrestante), ω1 (velocidad de la rueda

de conduccion), x2 (posicion de la cinta en el codificador), ω2 (velocidad de salida), y i (corriente en el motor del

cabrestante). La entrada de control u es el voltaje aplicado e, y la salida y es la posicion del cabezal de lectura/escritura

x3.

Se ha decidido implementar un controlador por realimentacion de estados, con una ley de control de la forma

u =−Kx+ krr, donde K es la ganancia de control y kr es una ganancia de alimentacion directa. La respuesta deseada

a una referencia del tipo escalon debe tener un sobreimpulso pequeno y un tiempo se establecimiento de 1 segundo.

Esto puede ser alcanzado usando una ecuacion caracterıstica de la forma:

αc(λ ) = (λ 2 +2ζ ωo1λ +ω2o1)(λ

2 +2ζ ωo2λ +ω2o2)(λ +ζ ωo1)

con ζ = 0,8, ωo1 = 6 y ωo2 = 8. Se pide:

1. Calcular la funcion de transferencia de u hasta y.

2. Determinar la estabilidad del sistema.

3. Antes de calcular el controlador, verificar la controlabilidad del sistema.

4. Determinar la ganancia de control K del sistema. Muestre los detalles de calculo.

5. Determinar el valor de la ganancia kr

6. Incluir control integral en el diseno del controlador, ¿cuales serıan las ganancias de control (K, ki) y de alimentacion

directa (kr)?

Problema 5.6: Microscopio de fuerza atomica (AFM, por sus siglas en ingles)

El AFM es una de las principales herramientas en generacion de imagenes, medidas y manipulacion de materia en la

nanoescala. La informacion es colectada “palpando” la superficie de la muestra (sample) con una sonda mecanica (viga

voladiza con punta conica). La muestra se puede mover vertical y horizontalmente usando un elemento piezoelectrico.


(5.5) Unidad de cinta

Cuando la muestra se acerca a la punta de la viga, fuerzas de interaccion entre la muestra y la punta conllevan a una

deflexion de la viga voladiza. La deflexion es medida usando un rayo laser reflejado desde la parte superior de la viga

voladiza que va hacia un arreglo de fotodiodos. La deflexion de la viga es controlada por realimentacion usando un

actuador piezolectrico que controla la posicion vertical de la muestra. Un diagrama esquematico del AFM se muestra

en la figura (a) abajo.

Una representacion esquematica del movimiento vertical del piezoelectrico se presenta en la figura (b) abajo. El

modelo muestra dos masas separadas por un piezoelectrico ideal. La masa m1 es la mitad del sistema piezoelectrico, y

la masa m2 es la otra mitad del sistema piezoelectrico mas la masa del apoyo. Este modelo asume que el piezoelectrico

genera una fuerza F entre las masas y que existe cierto amortiguamiento viscoso c2 junto al resorte de rigidez k2. Sean

las posiciones de los centros de masa z1 y z2.

Considere el modelo de la dinamica vertical del AFM. La dinamica basica esta dada por la ecuacion:

(m1 +m2)d2z1

dt2+ c2

dz1

dt+ k2z1 = m2

d2l

dt2+ c2

dl

dt+ k2l,

donde l = z1− z2 es la elongacion del elemento piezoelectrico. El piezoelectrico puede ser modelado como un sistema

de segunda orden con una frecuencia natural ω3 y razon de amortiguamiento ζ3. La dinamica acoplada es luego descrita

por el sistema lineal:

dx

dt=

0 1 0 0

−k2/(m1 +m2) −c2/(m1 +m2) 1/m2 0

0 0 0 ω3

0 0 −ω3 −2ζ3ω3

x+

0

0

0

ω23

u

y =m2

m2 +m1

[m1k2

m1 +m2

m1c2m1+m2

1 0

]

x

donde la senal de entrada u es la senal que llega del amplificador y la salida y es la elongacion del piezoelectrico. Los

parametros del sistema: m1 = 0,1510−3kg, m2 = 110−3kg, k2 = 6,832107N/m, ω3 = 7,5398105rad/s, ζ3 = 0,1.


Amplifier Amplifier

Sample

Cantilever

x,y z

LaserPhotodiode

Controller

Piezodrive

Deflection reference

Sweepgenerator

(5.6a) Diagrama esquematico del AFM

Piezo crystal

z1 z2

m1

m2

(b) Mechanical model(5.6b) Modelo mecanico del AFM conpiezoelectrico pre-cargado (F)

1. ¿Es el sistema estable?

2. Calcular la matriz de controlabilidad del sistema y determinar su rango. ¿Es el sistema controlable?

3. Explique que se pretende conseguir usando control.

4. Encontrar el controlador por realimentacion de estados que provee un sistema en lazo cerrado con polos complejos

que tengan razon de amortiguamiento igual a 0.707. ¿Como seleccionarıa la frecuencia natural del sistema en lazo

cerrado? Recuerde que el polinomio caracterıstico para un sistema en lazo cerrado de cuarta orden esta dado por:

αc(λ ) = (λ 2 +2ζo1ωo1λ +ω2o1)(λ

2 +2ζo2ωo2λ +ω2o2)

Detalle sus calculos.

5. ¿Serıa necesario aumentar un control proalimentacion kr?, ¿por que? En caso de ser necesario, obtenga kr.

6. Matlab-Simulink Usar el archivo-m afm_data.m para generar las matrices del sistema.

a) Crear un archivo en Simulink usando la dinamica lineal del AFM. Aumentar al modelo el Simulink el controlador

disenado en los puntos anteriores.

b) En Simulink, calcule la respuesta del sistema a condiciones iniciales xo =[

110−9,0,0,0].

c) En Matlab, calcule la respuesta a las condicione iniciales antes detalladas.

d) En una grafica, superponga los resultados obtenidos en Simulink y en Matlab. Compare.

Problema 5.7: Modelo de robot movil monociclo

La mayoria de robots moviles de interior no se mueven como un carro, los robots poseen dos ruedas direccionales

controladas activamente y una rueda giratoria, ver Fig. 1a. En relacion a la Fig. 1b, que presenta un modelo del robot

monociclo, las entradas de control son las velocidades longitudinal υ y angular ω del robot. Para caracterizar comple-

tamente el estado del robot se necesitan tres variables de estado: x, y y ϕ . El punto (x,y) denota un punto de localizacion

de la plataforma (en este caso, punto medio del eje trasero), mientras que ϕ denota la orientacion del robot.

1. Representar el movimiento (cinematica) de la plataforma movil como un conjunto de ecuaciones diferenciales

(forma espacio de estados). Suponer que las ruedas del robot ruedan sin deslizar.

2. Si nuestro objetivo es analizar el movimiento del movil a lo largo de una linea recta (ϕ = ϕo) con velocidad lineal

fija υo 6= 0, ¿es posible encontrar algun punto de equilibrio para estas condiciones?

3. Suponiendo que nuestro objetivo sea minimizar la desviacion lateral del movil que se mueve a lo largo o paralelo al

eje x (ϕo = 0) con velocidad lineal fija υo 6= 0, considerar las ecuaciones de movimiento para z =[

y ϕ]T

y calcular

la dinamica lineal aproximada.

4. Considerando la dinamica linealizada del caso anterior, ¿es el sistema controlable?

Problema 5.8: Control por realimentacion de estados - control integral

El transporte en alta mar usa gruas para descargar contenedores entre barcos cargueros. La Fig. (5.8)-derecha muestra

la dinamica de la grua en el plano vertical, este plano presenta el alabeo (movimiento dominante en un barco anclado en

alta mar). El modelo pendulo en carrito, Fig.3-izquierda, permite caracterizar el efecto del alabeo en la carga. La Fig.

3b muestra el detalle del modelo pendulo en carrito. El pendulo representa la carga, la posicion x(t) es la posicion-x del

carrito y representa el movimiento de alabeo del barco, el control de posicion u(t) reacciona al cambio de la posicion-x

del carrito y es aplicado en la punta de la pluma, θ(t) es el angulo de balanceo. La aproximacion lineal del sistema en

su forma espacio de estados es:


Fig. (5.7a) Robot del tipo monociclo Fig. (5.7b) Modelo robot movil monociclo

Fig.(5.8a) Pendulo en carrito para modelar alabeo del barco carguero Fig. (5.8b) Modelo pendulo en carrito

d

dt

[θθ

]

=

[0 1

−0,280 0

][θθ

]

+

[0

−0,0286

]

u+

[0

−0,0286

]

x

1. ¿Es el sistema estable? ¿Es el sistema controlable?

2. Disenar el controlador por realimentacion de estados tal que las oscilaciones del pendulo sean neutralizadas. Para

esto usar una ley de control de la forma:

u(t) =−x(t)+δu(t).

Esta ley se puede seleccionar debido a que se cuenta con la informacion de los acelerometros x. Luego es posible

centrarse solo en el calculo de δ u, que puede tomarse como:

δ u(t) =−K

[θθ

]

,

y que permitira incrementar el amortiguamiento del sistema a ζ = 0,707 (ωn = |λ (A)|).Presentar el diagrama de bloques del sistema en lazo cerrado correspondiente a usar las leyes de control antes

descritas.

3. Suponiendo que no se pudiese cancelar el efecto de la aceleracion inducida por el mar (que es la que causa el

alabeo), ¿que ley de control elegirıa para resolver el problema cuando x = ao =cte? Fundamente por que la ley

de control elegida cumplirıa el objetivo de neutralizar las oscilaciones. Use diagrama de bloques para indicar que

modificaciones se le haria a la planta y/o controlador del caso anterior.

Problema 5.9: Control por ubicacion de polos

1. Escribir la ecuacion espacio de estados del sistema carro cohete. Usar las variables de estado x1 = y (posicion) y

x2 = y (velocidad). ¿Es el sistema controlable y observable? ¿Por que?

2. Cuando los polos del sistema controlado son seleccionados como −√

2±√

2 j, encontrar el control por reali-

mentacion de estados u(t) =−kx(t) que asigna dichos polos al sistema controlado.

3. Cuando el polo deseado del observador de orden reducido es elegido como −2, calcular el observador de orden

reducido que asigna este polo deseado al error de estimacion x2 = x2− x2. Considerar que x2 es el estimado de x2.

4. Combinando el controlador y observador de orden reducido antes calculados, encontrar el correspondiente compen-

sador C(s).



El sistema carro cohete puede ser representado por la siguiente funcion de transfer-encia:

G(s) =1

s2,

con Y (s) = G(s)U(s).

(5.9) Carro cohete.

1. (1 pto) Determinar los valores de los parametros a, b y c del sistema.

La Fig. (5.10) corresponde a la respuesta impulsiva de un sistemalineal invariante en el tiempo de 1er orden:

x(t) = ax(t)+bu(t), x(0) = 0y(t) = cx(t)

donde a,b,c ∈ R.

Dato:y(t) = ceatx(0)+

∫ t0 cea(t−τ)bu(τ)dτ . 0 2 4 6 8 10

0

1

2

3

4

5

6

t (sec)

y(t)

(5.10) Respuesta impulsiva sistema de 1er orden.

2. Considerar el sistema lineal invariante en el tiempo:

[x1

x2

]

=

[0 1

6 0

][x1

x2

]

+

[0

1

]

U(t)

y(t) =[

50 2][

x1

x2

]

,

describiendo la dinamica de la inclinacion vertical de una bicicleta en movimiento y(t) donde la entrada u(t) es el

angulo de actuacion.

u(t)

y(t)

»1

»2

»2

»3

g

(5.11) Vistas esquematicas de una bicicleta.

a) (1 pto) ¿Puede el conductor evitar que la bicicleta se incline unicamente inclinando el timon?

b) (1 pto) ¿Sera necesaria la intervencion de un conductor para evitar que la bicicleta se incline?



Problema 6.1: Diseno de observadores

Para el siguiente modelo de un sistema dinamico, responder lo que se pide:

x =

[0 1

2 0

]

x+

[1

0

]

u,

y =[

1 0]

x+2u.

1. Disenar un estimador de estados de orden completo tal que los polos del estimador esten localizados en -3 y -4.

Escribir la representacion espacio de estados de la dinamica del estimador. Denotar el vector de estados estimado

por x.

2. En el diagrama de bloques presentado en la Fig.(6.1), encontrar las funciones de transferencia Gxu y Gxy.

(6.1) Diagrama de bloques sistema de control


Problema 6.2: Diseno de compensadores

Considere un mototaxi de tres ruedas, ver Fig. (6.2) (dos ruedas delanterasy una rueda posterior). La trayectoria deseada durante el manejo se debemantener con un autopiloto (compensador).La informacion del modelo del vehıculo con control del eje frontal esta dadaen la Tabla 1. (6.2) Eje delantero, vista de planta.

Modelo Pyu(s) =y(s)

u(s)=

vas+ v2

Ls2

Entrada Angulo de la rueda delantera u

Salida medida Trayectoria de la desviacion lateral y

Salida controlada Trayectoria de la desviacion lateral y

Parametros constantes conocidos Velocidad del vehıculo v > 0Cantidades geometricas a > 0,b > 0 y L > 0

Cuadro 11.1 Detalles de la descripcion del sistema

Sea va/L = 0,5 y v2/L = 1.

1. Presente la planta en su forma canonica controlable.

El modelo de la planta en su forma canonica controlable es:

x(t) =

[0 1

0 0

]

x(t)+

[0

1

]

u(t)

y =[

1 0,5]

x(t)

2. Calcular la ganancia K de la ley de control de estabilizacion u(t) = −Kx(t), para un tiempo de asentamiento de la

respuesta igual a 4 s. Considere una razon de amortiguamiento ζ = 0,707 para los polos en lazo cerrado.

Ayuda: Tiempo de asentamiento ts ≈ 4/ζ ωo.

Para el calculo de u elegimos los polos del sistema en lazo cerrado con ζ = 0,707 y ω =√

2:

αc(s) = s2 +2ζ ωs+ω2 = s2 +2s+2

Usando la formula de Ackerman:

K = q1αc(A) =[

0 1]Wc−1αc(A) =

[1 0]

([0 1

0 0

]2

+2

[0 1

0 0

]

+2

[1 0

0 1

])

K =[

2 2]

3. Usando los polos en lazo cerrado del caso anterior, ¿sera posible calcular la ganancia KP de la ley de control

u(t) =−KPy(t)? ¿Si, no, por que?

4. Calcular el observador de orden completo que estime los estados del sistema. Escribir dicho observador en la forma

espacio de estados. Considerar que los polos de la dinamica del error de estimacion estan ubicados en −2,−2.La dinamica del estimador esta dada por:

˙x = (A−LC)x+Bu+Ly.

Sea la ganancia del estimador de estados L =

[l1l2

]

. Siendo que los polos del estimador son −2 y −2, se debe

cumplir:


|sI−A+LC|=∣∣∣∣

s+ l1 −1+0,5l1l2 s+0,5l2

∣∣∣∣= s2 +(0,5l2 + l1)s+ l2 = s2 +4s+4.

Luego: L =

[2

4

]

.

El estimador de estados resulta:

˙x =

[−2 0

−4 −2

]

x+

[0

1

]

u+

[2

4

]

y.

5. Presentar el compensador (controlador del item b. + observador del item d.) en su forma funcion de transferencia

Kuy(s) y completar en el diagrama de bloques presentado abajo para Pyu(s) y Pzu(s).

(6.3) Diagrama de bloques sistema controlado

La dinamica del compensador esta dada por:

˙x = (A−LC−BK)x+Ly

u =−Kx.

Reemplazando los valores obtenidos se tiene:

˙x =

[−2 0

−6 −4

]

x+

[2

4

]

y

u =[

2 2]

x

.

Luego: Kuy(s) =12s+8

s2 +6s+8y Pyu(s) = Pzu(s).

Problema 6.3: Control por ubicacion de polos

1. El modelo para movimiento rotacional yaw de un buque de carga esta dado por:

ψ = r,α r =−r3 + r− c+βu,

donde ψ es el angulo yaw, r es la tasa de cambio de ψ , u es la entrada de control; α,β son constantes conocidas

positivas y diferentes de cero y c≥ 0. El buque se esta moviendo en linea recta (ψ,r) = (ψo,0) cuando el controlador

deja de funcionar, u = 0, ¿seguira el buque desplazando en lınea recta?

2. Si la dinamica linealizada del movimiento yaw esta dada por:

ψ = r

α r− r = βu+ rb,rb = 0


donde rb es un bias de sensado constante. Si ψ y r son medidos, calcular el observador de orden reducido que

permita estimar el bias rb desconocido. Usar α = β = 1 y ubicar el polo del estimador en s = −5. Escribir el

representacion espacio de estados del estimador de orden reducido para implementacion.

3. Para la dinamica linealizada del caso anterior, calcular el controlador para control de cabeceo para cuando se asume

sensado perfecto (no hay bias rb). Ubicar los polos del sistema controlado con ωn = 4 rad/s y ζ = 0,65.

Presentar el diagrama de bloques indicando el controlador y el observador de orden reducido (incluir el detalle de

entradas, salidas y dinamicas).

Problema 6.4: Diseno de observadores

Si consideramos que un brazo robotico de una union puede ser modelado como un pendulo invertido, el modelo no

lineal para un brazo robotico especıfico posee la siguiente representacion espacio de estados:

[x1(t)x2(t)

]

=

[x2

−0,5x2−10senx1 +0,1u

]

y(t) = x1(t)

donde y(t) es la posicion angular del brazo robotico, u(t) es el torque de control, x1 = y y x2 = y.

Como parte de un trabajo de tesis Juan debe disenar un controlador para el brazo robotico. Juan calcula que el punto

de equilibrio del sistema es xe = (0,0) para ue = 0. Acto seguido, el obtiene el siguiente modelo lineal:

˙x(t) =

[0 1

−10 −0,5

]

x(t)+

[0

0,1

]

u(t)

y(t) =[

1 0]

x(t)

donde y(t) = y− ye, x = x− xe y u(t) = u−ue.

1. ¿Cometio Juan algun error en el calculo del sistema linealizado?

2. Juan desea disenar un controlador por realimentacion de estados tal que el sistema en lazo cerrado tenga los polos

en -2. Para poder implementar el controlador calculado, Juan debe antes disenar un observador para el sistema lineal

puesto que solo el angulo y puede ser medido. Disenar dicho observador tal que el error de observacion tienda a

cero lo suficientemente rapido.

Problema 6.5: Diseno de compensadores

La dinamica describiendo la desviacion lateral de un vehıculo (manejando en el eje x) esa dada por:

[y

θ

]

=

[0 10 0

][y

θ

]

+

[γ1

]

δ

y =[

1 0][

y

θ

]

donde y y θ son la posicion vertical normalizada y orientaciondel centro de masa del vehıculo. Ademas γ = a/b = 0,5.Responder lo que se pide:

ab

α δv

y

x

α

α

δ

δ

θ

(6.4) Control de la direccion de un vehıculo. Modelo simplificado de unabicicleta

1. Si se desea disenar un controlador para estabilizar la dinamica y seguir una referencia dada r de la posicion lateral

del vehıculo. Calcular las ganancias de la ley de control u =−Kx+ krr para un tiempo de asentamiento igual a 6 s

(normalizados) y razon de amortiguamiento ζ = 0,707 para los polos en lazo cerrado.

Ayuda Tiempo de asentamiento ts ≈ 4/ζ ωo.

2. Para la ley de control antes usada, ¿cual es el valor inicial de la senal de actuacion? ¿Habrıa algun problema con la

actuacion?

3. Disene el observador de estados con una seleccion de polos apropiada. Senale que polos eligio.

4. Calcule la funcion de transferencia del sistema en lazo cerrado. ¿Por que no aparece la informacion del observador?




Para obtener todo el puntaje, muestre todos sus calculos.

1. Considerar el sistema a continuacion:

x1 = x2

x2 =−p(t)x2− e−tx1, x ∈ R

2, to = 0.

Se pide encontrar las condiciones que la funcion p(·) debe cumplir para asegurar la estabilidad del equilibrio (0,0).

Usar V (x, t) = x21 + etx2

2 como funcion de Lyapunov tentativa.

2. Sea el sistema dinamico modelado por:

x = 2x+u,

y el ındice de desempeno:

J =1

2

∫ ∞

0(qx2 +u2)dt.

Encontrar el valor de q tal que el sistema en lazo cerrado tiene un polo en -3.

Ayuda: Recuerde que la solucion de la ecuacion de Riccati P, P = PT > 0 (eig(P)> 0).

Problema 7.2: Estabilidad segun Lyapunov

La siguiente ecuacion describe el movimiento de la posicion surge u(t) de un buquede carga:

(m−Xu)u−Xu|u|u|u|= τ.

1. Si el objetivo de control es que u(t)→ ud(t), donde ud(t) representa la trayec-toria deseada, calcular la dinamica del error de seguimiento de trayectoria e(t),siendo que e(t) = u(t)−ud(t).

2. Usando la funcion de Lyapunov V (e) =1

2e2, probar que la ley de control:

τ =−X|u|u|u|u+(m−Xu)(ud − ke), k > 0,

resulta en estabilidad asintotica global para e = 0.

(7.1) Buque de carga.


Considere el sistema no lineal:x1(t) = x2(t)x2(t) = −x1(t)− (α + x2

1(t))x2(t)

donde α ∈ R es un parametro.

1. Determinar los puntos de equilibrio del sistema.

2. Linealizar el sistema con respecto al punto (0,0). Investigar la estabilidad de (0,0) usando el sistema linealizado,

considerar los casos α > 0 y α < 0.

3. Analizar la estabilidad del punto (0,0) en el sentido de Lyapunov. Considerar α > 0.

Problema 7.4: Analisis de estabilidad e ındices de desempeno Contestar lo que se pide:

1. (1 pto) El sistema:x1 = x1(2− x2)x2 = 2x2

1− x2


tiene tres puntos de equilibrio en (0,0), (1,2), (-1,2). Analizar la estabilidad de cada uno de estos puntos usando la

figura abajo.

(7.2) Diagrama de fase del sistema en el Problema 7.3

2. Considere el siguiente sistema:x1 = x2−3x1

x2 =−x32−2x1

Probar que el punto de equilibrio (0,0) es asintoticamente estable. ¿Es el sistema globalmente o localmente

asintoticamente estable?

Ayuda: Use la siguiente funcion de Lyapunov candidata, V (x) = 2x21 + x2

2.

3. Problema del mınimo esfuerzo de control. Sea el sistema x = Ax+Bu, determinar el ındice de desempeno que

corresponde al problema de transferir un sistema de un estado inicial arbitrario x(to) = xo hacia un estado final

x(t f ) = x f ∈S con el mınimo esfuerzo de control.

4. Problema del tiempo mınimo. Sea el sistema x = Ax+Bu, determinar el ındice de desempeno que corresponde al

problema de transferir un sistema de un estado inicial arbitrario x(to) = xo hacia un estado final x(t f ) = x f ∈S en

un tiempo mınimo.

Problema 7.5: Responda verdadero/falso

Demuestre la veracidad o falsedad de los siguientes enunciados. Para obtener todo el puntaje, muestre todos sus calculos.

1. Las Figs. (7.3a) y (7.3b) representan estados de equilibrio asintoticamente estables. ( )

!

!

0 t

x(t)

(a)

!

!

0 t

x(t)

(b)

(7.3) Estabilidad

2. La funcion V (x, t) = x21 +2x2

2(1+ e−t), to = 0, x ∈ R2, es definida positiva. ( )

3. Para el sistema a continuacion, el estado de equilibrio xe es estable, ( )

x1 = x2

x2 =−x1, x ∈ R

2, xe = 0, to = 0.

Nota: Use V (x) = ‖x‖2 como funcion de Lyapunov tentativa para probar la estabilidad.

4. El siguiente problema de control optimo: ( )


mınu

∫ t f

to

uT udt

tal que x = Ax+Bu

x(to) = xo,x(t f ) = x f ,

consiste en determinar una ley de control admisible u∗ que, en el menor tiempo posible, lleve la trajectoria del

sistema desde el estado inicial x(to) = xo a un estado final x f especificado.


Para obtener todo el puntaje, muestre todos sus calculos.

1. Las figuras abajo representan los diagramas de plano de fase de dos sistemas, senalar cuantos y cuales son los puntos

de equilibrio. ¿Que puede decir de la estabilidad de dichos puntos de equilibrio?

1 0 1 1.5

1

0.5

0

0.5

1

1.5

x1

x2

(a)(7.4) Sistema oscilador electronico

−2

−1

0

1

2

x1

x2

−2π −π 0 π 2π

(c)(7.5) Sistema pendulo invertido

2. El sistema a continuacion representa un pendulo invertido con longitud variable:

x1 = x2

x2 =−x2− (2+ sen t)x1, x ∈ R

2, to = 0.

Analizar la estabilidad del punto de equilibrio xe = 0. Usar V (x, t) = x21 +

x22

2+ sen tcomo funcion de Lyapunov

tentativa.


1. Representar el movimiento rotacional (dinamica/cinematica) del satelite en la forma espacio de estados. Considerar

que el lazo de control ha sido cerrado con:

τ =−αω +do×bo, α ∈ R,α > 0.

2. Calcular el (los) puntos de equilibrio del sistema en lazo cerrado.

3. Demostrar que la ley de control antes descrita alinea bo con −do. Usar la funcion de Lyapunov candidata:

V (ω,do) =1

2ωT Iω +

1

2(do +bo)

T (do +bo).

Formulas utiles:

a ·b = aT b,

a · (b× c) = b · (c×a) = c · (a×b)


Un satelite B (cuerpo rıgido) con un sistema de referencia solidario al cuerpo - origen en el centrode masa y alineado con respecto a los principales ejes de inercia - es mostrado en la Fig. 1. Seabo ∈ R

3 un vector unitario representando la direccion de una antena en el satelite y do ∈ R3 un

vector unitario fijo (sistema de referencia inercial) representando la direccion de la antena en laestacion terrena.La ecuacion del movimiento de Euler resulta en:

Iω +ω× Iω = τ,

donde ω ∈ R3 es el vector velocidad angular del satelite con respecto a los ejes solidarios al

cuerpo, I = diag(I1, I2, I3) y τ es el torque de control.En el sistema de referencia solidario al cuerpo, do no esta fijo, esta rotando con velocidad angular−ω , entonces:

do =−ω×do.

(7.6) Satelite y estacion terrena


Problema 8.1: Control optimo con valor final y tiempo final fijos

u(t) x(t)

R 100 k!

C 10 F

i(t)

(8.1) Circuito cargador de capacitor

El voltaje de entrada u(t) que carga al capacitor en la Fig. 2, partiendo dex(0) = 2V en t = 0 hasta x(10) = 12V en t = 10, debe ser calculado parauna energıa disipada por el resistor mınima. No hay restricciones en la ley decontrol u(t). Notar que, de la ley de voltajes de Kirchhoff:

Ri(t)+ x(t) = u(t),

donde i(t) =Cdx(t)

dt, y la energıa disipada es:

J =1

2

∫ 10

0Ri2(t)dt.

1. Definir la funcion Hamiltoniano y correspondientes ecuaciones de estado y coestado, condicion estacionaria y condi-

ciones de frontera.

2. Resolver las ecuaciones anteriores y calcular el voltaje de entrada u(t) optimo.

3. Calcular el valor mımimo de J.

Problema 8.2: LQR con horizonte infinito

Dada la matriz Hamiltoniana correspondiente a un sistema dinamico y su ındice de desempeno asociado. La matriz

Hamiltoniana es:

H =

[2 −5

−1 −2

]

La funcion del Matlab [V,D]=eig(H) resulto en lo siguiente:

V =

[0,9806 0,7071

−0,1961 0,7071

]

, D =

[3 0

0 −3

]

Se pide:

1. Escribir la ecuacion del sistema en lazo cerrado gobernado por la ley de control u =−kx.

2. Encontrar la solucion de la ecuacion de Riccati correspondiente al controlador optimo.

Problema 8.3: Balanceando una bola sobre una viga

La Fig. (8.2) muestra una bola que rueda a lo largo de una vıa acondicionada en la viga. La bola debe ser llevada al


punto medio de la viga (el origen) mediante manipulacion del angulo de la viga a traves de un motor electrico. La

distancia entre la posicion de la bola y el origen se denota como y y satisface la siguiente ecuacion diferencial:

y = bsin(θ)≈ bθ ,

donde b es una constante que depende de varios parametros del sistema. Se asume que el valor normalizado de b

es 1. Para poder usar control optimo, se necesita tener una aproximacion de la dinamica. Ası, se define la siguiente

realizacion espacio de estados del sistema:z = Az+Bu

y =[

1 0]

z.

El proposito del problema de optimizacion es llevar la bola al origen sin requerir demasiada energia. Un criterio

natural de desempeno es el siguiente problema cuadratico:

mınu

∫ ∞

0(qy2 + ru2)dt

tal que z = Az+Bu,z(0) = [ 0,5 1 ]T

donde q y r son parametros positivos.

θ

y

(8.2) La bola rodando en la vıa de la viga y podrıa caer en cualquiera de los puntos extremos

Obtener lo que se pide:

1. Sea:

P =

[p11 p12

p21 p22

]

,

siendo p12 = p21 y P > 0 (definida positiva). Escribir la ecuacion de Riccati como un sistema de cuatro ecuaciones

explıcitas en terminos de los elementos de P y de las constantes q y r. Resolver para los elementos de P.

2. Encontrar las ganancias del controlador optimo asumiendo que todos los estados son conocidos por la reali-

mentacion. Asumir que r = 1 y q = 5.

3. Encontrar la frecuencia natural y la razon de amortiguamiento del sistema en lazo cerrado.

4. Siendo que la viga tiene longitud finita, se hace necesario introducir restricciones en el problema de optimizacion

para asegurar que la bola no se caiga de la viga. Adicionalmente, a menudo debemos disenar el controlador asum-

iendo que existen limitaciones en la magnitud de la senal de control. En base a lo expuesto, ¿como se formularıa el

problema de control optimo resultante?

Problema 8.4: LQR con horizonte finito

Calcular la ley de control por realimentacion de estados u tal que minimice

J =

int10 (x

2 +u2)dt

sujeto ax =−x+u,x(0) = 2

Asumir J∗ = p(t)x2(t).Ayuda: Los puntos a continuacion deben ser completados analıticamente.

En general, la ecuacion Hamilton-Jacobi-Bellman esta dada por:


0 =∂J∗

∂ t+minu(t)∈R

L(x,u)+

(∂J∗

∂x

)T

f (x,u)

︸︷︷︸

H

Dado que no hay restricciones en la senal de control u, la forma del control optimo se puede determinar aplicando

las condiciones (necesaria de primer orden y suficiente de segundo orden) de optimizacion a la funcion H. Aquı se

debe obtener u∗ en funcion de p(t) y otras variables.

El resultado del punto anterior debe ser reemplazado en la ecuacion HJB del primer punto. La ecuacion resultante

vendrıa a ser la ecuacion de Riccati diferencial. ¿Cual es la condicion inicial de esta ecuacion?

Redefina la ecuacion diferencial de Riccati en funcion de su matriz Hamiltoniana (misma matriz que en el caso de

control optimo con horizonte infinito). No se olvide de detallar las condiciones iniciales.

Problema 8.5: LQR con horizonte infinito

Dada la matriz Hamiltoniana correspondiente a un sistema dinamico y su ındice de desempeno asociado. Sea la matriz

Hamiltoniana:

H =

[2 −5

−1 −2

]

La funcion del Matlab [V,D]=eig(H) resulto en lo siguiente:

V =

[0,9806 0,7071

−0,1961 0,7071

]

, D =

[3 0

0 −3

]

Se pide:

1. Escribir la ecuacion del sistema en lazo cerrado gobernado por la ley de control u =−kx.

2. Encontrar la solucion de la ecuacion de Riccati correspondiente al controlador optimo.

Problema 8.6: Control de posicion motor DC

Un sistema de control de posicion de un motor DC para el control de una valvula electronica es descrito por la ecuacion

diferencial: [θω

]

=

[0 1

0 −α

][θω

]

+

[0

β

]

Va. ,

donde θ es la posicion angular, ω es la velocidad angular, α es el coeficiente de amortiguamiento viscoso, β es el

constante de velocidad del motor DC y Va es el voltaje de actuacion.

Considerar el problema de regular el motor en torno a su estado cero donde la variable controlada es la posicion, es

decir:

y =[

1 0][

θω

]

,

1. Encontrar el control por realimentacion de estados optimo que minimice el ındice de desempeno:

J = lımt→∞

∫ t

0(y2 +ρV 2

a )dt

Usar los valores numericos α = 7,14 rad/s, β = 238,3 rad/(Vs2) y ρ=1.

2. ¿Cual es el tiempo de subida de la respuesta del sistema en lazo cerrado? ¿Como se podrıa disminuir el tiempo de

subida?

Nota: ts =2,230ζ 2−0,078ζ +1,12

ωo

Problema 8.7: Control LQR

Considere la representacion espacio de estados de una planta de primer orden inestable:

x(t) = ax(t)−au(t), a ∈ R,a > 0,

y el nuevo ındice de desempeno:


J =∫ ∞

0e2bt [x2(t)+ρu2(t)]dt, ρ ,b ∈ R,ρ > 0,b≥ 0.

1. Demostrar que, con un cambio de variables ebtx(t)→ x(t) y ebtu(t)→ u(t), la unica modificacion requerida para

calcular el control LQR con el nuevo ındice de desempeno es usar A+ bI en la ecuacion de Riccati algebraica en

vez de A.

2. Para el sistema con variable de estado x(t) y senal de control u(t), determinar la ganancia K del control LQR en

funcion de ρ ,a,b.

3. Para el sistema con variable de estado x y senal de control u, mostrar la posicion de los polos en lazo cerrado en el

plano complejo con 0 < ρ < ∞.

4. Usar el resultado anterior para explicar cual es el efecto de b en el diseno del control.



Problema 9.1: Filtro de Kalman

Considere un cohete en el espacio, el cual se puede modelar como un integrador doble que se mueve en una direccion.

La aceleracion es debido al ruido de proceso. Con las variables de estado x1 = z y x2 = z, la representacion espacio de

estados del sistema es:

x =

[0 1

0 0

]

x+

[0

1

]

w

y =[

1 0]

x+ v

, x ∈ R2.

Por el momento, asumir que la posicion z es medida con algun error v.

Considerar que w y v son procesos de ruido blanco con media cero y densidades espectrales (covarianzas) como

sigue:

W = γ4, V = 1.

1. Determinar el filtro de Kalman. Escribir el observador en su forma espacio de estados.

2. Suponer que un segundo sensor es usado, tal que la velocidad z tambien es medida. La ecuacion de salida es luego

cambiada a:

y = x+ v,

donde ahora v es un vector de dimension dos (ruido blanco de media cero) con matriz de covarianza:

V =

[1 0

0 γ2

]

.

Demuestre que la matriz de covarianza del error de estimacion (solucion de la ecuacion de Riccati) es:

P = ExT (t)x(t)= 1

2

[√3γ γ2

γ2√

3γ3

]

.

¿Cual es la ganancia del filtro de Kalman?

Problema 9.2: Control LQG

Considere el sistema inestable de segundo orden:

x1 = x2

x2 = x2 +u+w,

con medidas contınuas:

y = x1 + x2 + v,

donde w y v son procesos de ruido blanco con densidades espectrales (covarianzas) W y V , respectivamente.

1. (2 ptos) Sea el ındice de desempeno:

J =∫ ∞

0(x2

1 + x22 +Ru2)dt.

Encontrar los polos del sistema controlado. Graficar en el plano complejo como varıan los polos en funcion de R.

2. Mostrar que para R = 1 y W =V = 1, las ganancias del control LQR y del filtro de Kalman resultan en:

K =[

1 3], L =

[1

2

]

,

siendo que los polos del sistema controlado estan ambos en s =−1.

3. Encontrar la funcion de transferencia del compensador LQG resultante G(s).4. Para la dinamica del compensador G(s), bosquejar en el plano complejo como varıan los polos del sistema contro-

lado al ir variando la ganancia de la planta α (tal que αPy(s)→ Py(s), para α = 1).

5. Para el controlador LQR, u = −Kx, bosquejar en el plano complejo como varıan los polos del sistema controlado

al ir variando la ganancia de la planta α (tal que αPx(s)→ Px(s), para α = 1). Asumir en este caso que se conocen

todos los estados.



Considere el sistema de primer orden:x = αx+u+w

y = x+ v,

donde w y v son procesos de ruido blanco con varianzas σw y σv, respectivamente, y el ındice de desempeno es:

J = E1

2

∫ ∞

0(qx2 +u2)dt,

1. Calcular el control LQR correspondiente. Notar que la ganancia de control K sera funcion de q. Presentar la dinamica

del sistema controlado.

2. Si σw/σv = 1, calcular la ganancia del filtro de Kalman. Presentar el filtro de Kalman en su forma de espacio de

estados.

3. Encontrar el rango de q que permita que el estimador posea una dinamica rapida en comparacion a la dinamica del

sistema controlado.


Responda segun corresponda.

1. Una forma comun del ındice de desempeno cuadratico es:

J =1

2eT

f Q f e f +1

2

∫ t f

to

y(t)T Qyy(t)+u(t)T Ryu(t)dt

donde y(t) =Cx(t)+Du(t). Mostrar que J puede ser reescrito como:

J =1

2eT

f Q f e f +1

2

∫ t f

to

x(t)T Qx(t)+ x(t)T Nu(t)+u(t)T Ru(t)dt,

donde: Q =CT QyC, N =CT QyD, R = Ry +DT QyD.

2. Considere el siguiente sistema para el calculo del observador optimo:

x =

[2 −4

1 −3

]

x+

[1

−3

]

u+w,

y =[

1 3]

x+ v

donde W =

[3 2

2 7

]

y V = 17 son las matrices de covarianza del ruido blanco Gausiano w y v, respectivamente.

a) Escribir la ecuacion de Riccati correspondiente.

b) Resolver la ecuacion de Ricati algebraica.

c) Escribir la representacion espacio de estados del Filtro de Kalman (FK).


Considere el problema LQG con la siguiente dinamica:

x =

[1 1

0 1

]

x+

[0

1

]

u+

[1

1

]

w,

y =[

1 0]

x+ v

donde x =[

x1 x2

]Tes el vector de estados, u es la entrada de control, y es la salida medida y w y v son los ruidos

blancos Gausianos independientes con intensidades σ ≥ 0 y 1 respectivamente.

El ındice de desempeno asociado esta dado por:

J = E

lımT→∞

1

T

∫ T

0(ρ(x1 + x2)

2 +u2)dt

donde E(·) es el valor esperado y ρ es un parametro real no negativo.


Obtener lo que se pide:

1. Encontrar la ganancia del controlador optimo (LQR) asumiendo que todos los estados son conocidos por la reali-

mentacion.

2. Encontrar la ganancia del observador optimo (FK).

3. Describir el compensador optimo (LQR+FK) usando una representacion espacio de estados.

4. Describir el sistema con control LQG usando una representacion espacio de estados.

5. Completar en el diagrama de bloques de la figura abajo usando las correspondientes funciones de transferencia.

s

plant

k

κ

w v

y

u

(9.1) Sistema en lazo cerrado con control LQG


Un ingeniero intenta usar la teorıa del filtro de Kalman como una metodologıa para filtrar senales de medida ruidosas.

Considere el diagrama de bloques mostrado en la figura donde y(t) es la senal util, v(t) el ruido de medida y z(t) las

medidas ruidosas. El filtro a ser disenado es denotado por L(s), cuya salida y(t) debe ser un buen estimado de la entrada

util y(t).

(9.2) Filtrado de ruido

Se desea que L(s) sea un filtro pasa-baja con las siguientes caracterısticas:

L(0) = 1

L(s) decayendo como 1/s para grandes valores de s

El ingeniero comienza modelando la senal y(t) como una senal filtrada por el sistema de primer orden G(s):

G(s) =b

s+a,

la senal filtrada es el ruido blanco w(t) con covarianza W . El ruido de medida v(t) tambien se asume como ruido blanco,

y con covarianza V . La forma espacio de estados resulta:

x = −ax+βw

z = (b/β )x+ v

para valores del parametro β 6= 0 .

1. Considerando el observador de la forma:

˙x = −ax+ l[z− (b/β )x] ,

derivar la funcion de transferencia correspondiente al filtro.


2. Derivar el filtro de Kalman ¿Cual es la influencia del parametro β en el filtro L(s)?3. ¿Que restricciones se necesitan en los parametros del modelo G(s) para hacer que se satisfagan las propiedades del

filtro L(s) antes especificadas?

4. Asumiendo que el modelo de la senal y(t) es tomado como un sistema de segundo orden:

G(s) =b

s(s+a), (a > 0,b > 0)

¿Se puede satisfacer la restriccion L(0) = 1?


Considere el problema del LQG con la siguiente dinamica:

x = u+w

y = x+ v

donde x es la variable de estado, u es la entrada de control, y es la salida medida y w y v son ruidos blancos Gaussianos

independientes con covarianzas β 2r y r respectivamente.

El control LQG usa el siguiente ındice de desempeno:

J = E lımT→∞

1

T

∫ T

0(α2x2 +u2)dt,

donde E· es el valor esperado y α , β son parametros reales no negativos.

1. Demuestre que el compensador optimo (LQR + filtro de Kalman) esta dado por:

u =−k(s)y,

donde:

k(s) =αβ

s+α +β

2. Determine la representacion espacio de estados del sistema en lazo cerrado, con w y v como entradas, y las variables

de estados x y x. Demuestre paso a paso sus calculos ¿Cuales son los autovalores del sistema en lazo cerrado?

3. En el diagrama de bloques mostrado, ¿que valores podrıa alcanzar el escalar θ sin desestabilizar el sistema en lazo

cerrado?

(9.3) Sistema en lazo cerrado LQG con ganancia variable


1. (2 ptos) Considere que no se conoce exactamente la tasa constante f y se quiere usar el filtro de Kalman para estimar

su valor, escribir el modelo de la planta y la ecuacion de salida para cuando el vector de estados es x =[

h f]T

.


Considerar el caso donde se pretende estimar el nivel de agua h enel tanque usando un sensor del tipo flotador, ver Fig. 1. La medidaobtenida por el sensor es proporcional al nivel de agua en el tanque,ası y = αh, con α = 0,1.Si el tanque se esta llenando a una tasa constante igual a f , la variaciondel nivel de agua esta dada por h = f .

(9.4) Estimacion del nivel del tanque de agua y mas

2. (2 ptos) Incorporando los ruidos en los modelos se tiene:

x = Ax+

[0

1

]

w(t),

y =Cx+ v(t),

donde se asume que el ruido de proceso solo afecta a la parte del llenado. Se sabe que Ev(t)vT (t + τ) = σvδ (τ)y Ew(t)wT (t + τ)= σwδ (τ)), con σw = 0,001 y σv = 0,1. Calcular la ganancia del filtro de Kalman.

3. (1 pto) Escribir el filtro de Kalman en su forma funcion de transferencia, siendo que las salidas son los dos estados

estimadosA.

4. (1 pto) Si f = 0,1 y h(0) = 0 usar la relacion f (s)/Ey(s) para probar que f (t→∞) = fss = 0,1. Asumir h(0) = 0

y f (0) = 0. (Ayuda: usar el teorema del valor final, yss = y(t→ ∞) = lıms→0 sy(s).


Un problema de atenuacion de disturbios se encuentraen el problema de control de nivel del molde de unamaquina de fundicion contınua. Regular el nivel delmolde de agua frıa es de suma importancia dado queafecta la calidad de las planchas de acero. Sin embargo,el molde debe ser afectado por un movimiento periodi-co para prevenir que el metal se adhiera a las paredes.Tal movimiento induce un disturbio periodico lento.

Fig.(9.5) Produccion planchas de acero por fundicion

La salida esta afectada por un ruido blanco de media cero y covarianza σv = 0,005. Se incorpora el disturbio

periodico d(t) en el tanque considerando que este afecta al vector de estados como una senal ruidosa de banda estrecha

de 1 Hz, ver Fig. (3). El objetivo del problema de control es atenuar el efecto de este disturbio de 1 Hz.

1. (2 ptos) Recordando la accion de un integrador en el control por realimentacion de estados para seguimiento de

referencias constantes, se planea usar un modelo del disturbio para asi atenuar su efecto en la planta. Si el disturbio

de 1 Hz es modelado como:


La planta linealizada con respecto al nivel constante de-seado hd que describe la relacion salida (nivel del moldecon respecto a hd) y entrada actuador (valvula) esta dadapor:

x =

[−10 −50

1 0

]

x+

[10

]

u

y =[

20 0]

x

y(t)

v(t)d(t)

20s2+10s+50

Fig.(9.6) Planta afectada por ruidos

xd =

[0 2π−2π 0

]

︸︷︷︸

Ad

xd +

[1

0

]

Bd

w

d =[

100 0]

Cd

xd

,

donde w es un ruido blanco de media cero y covarianza σw = 0,01. Calcular la dinamica de la planta aumentada con

el ruido de medida y la dinamica del disturbio. Ayuda: Los estados de la planta aumentada son xa =[

x xd

]T.

Escribir la ecuacion algebraica de Riccati que permitirıa el filtro de Kalman para la planta aumentada. Identificar

las matrices necesarias para resolver dicha ecuacion.

2. (1 pto) La ganancia del controlador por realimentacion de estados para este problema se calcula minimizando el

siguiente criterio de desempeno:

J =1

2

∫ ∞

0

xTa (t)

1 0 0 0

0 0 0 0

0 0 0 0

0 0 0 0

xa(t)+uT (t)10−4u(t)

dt.

Fundamentar la eleccion de la matriz de ponderacion Q asumida.

3. (2 ptos) Completar el diagrama de bloques dado - incluir el filtro de Kalman y control LQR disenados para la planta

aumentada. Explicar por que funcionarıa el compensador disenado.

Fig.(9.7) Control LQG para atenuacion de disturbios

Apendice A

Ecuaciones de Euler Lagrange

Las ecuaciones de Lagrange son una de las tecnicas mas comunes para derivar las ecuaciones de movimiento se

sistemas con multiples grados de libertad (GDL).

d

dt

∂L

∂ qi

− ∂L

∂qi

= Qi, i = 1,2, ..n.

Siendo L = T −V , con T siendo la energıa cinetica y V la energıa potencial, qi son las coordenadas generalizadas y

Qi son las fuerzas generalizada. Ciertas restricciones se aplican a la eleccion de estas cantidades generalizadas:

Las coordenadas generalizadas deben ser linealmente independientes.

Las fuerzas generalizadas Qi deben realizar el mismo trabajo que las fuerzas no conservativas considerando un

desplazamiento virtual δqi, ası:

δW =n

∑i=1

Qiδqi.

En la figura abajo, los requerimientos antes mencionados son satisfechos cuando: q1 = z1, q2 = z2, Q1 = F1 y

Q2 = F2.

Figura A.1 Sistema masa-resorte con dos GDL

Las energıas cinetica T y potencial V respectivas seran:

T =1

2m1z2

1 +1

2m2z2

2

203

204 A Ecuaciones de Euler Lagrange

V =1

2k1z2

1 +1

2k2(z2− z1)

2.

Y el Lagrangiano sera:

L =1

2m1z2

1 +1

2m2z2

2−1

2k1z2

1−1

2k2(z2− z1)

2

Luego, realizando las correspondientes sustituciones en las ecuaciones de Lagrange:

d

dt(

∂L

∂ z1) =

d

dt(m1z1) = m1z1

∂L

∂ z1= k1z1− k2(z2− z1) = (k1 + k2)z1− k2z2

d

dt(

∂L

∂ z1)− ∂L

∂ z1= F1

m1z1 +(k1 + k2)z1− k2z2 = F1

d

dt(

∂L

∂ z2) = d

dt(m2z2) = m2z2

∂L

∂ z2= k2(z2− z1) =−k2z1 + k2z2

d

dt(

∂L

∂ z2)− ∂L

∂ z2= F2

m1z2− k2z1 + k2z2 = F2

En forma matricial:[

m1 0

0 m2

]z1

z2

+

[k1 + k2 −k2

−k2 k2

]z1

z2

=

F1

F2

A.1. Problema

El deslizador (1) de masa m1 se puede mover horizontalmente y esta en contacto con dos resortes (3) de rigidez k.

La esfera (2) de masa m2 y radio r forma un cuerpo rıgido con la masa despreciable (4). Todo el movimiento esta en el

plano vertical. El momento de la esfera con respecto a un eje que pasa por su centro de gravedad es I = 25 m2r2.

Figura A.2 Sistema deslizador-pendulo con dos GDL

En el instante t = 0, el sistema es posicionado tal que:

Hallar las ecuaciones diferenciales de movimiento.

A.2. Solucion

El sistema tiene dos grados de libertad, por tanto dos coordenadas generalizadas x y ϕ . La energıa cinetica T sera:

A.2 Solucion 205

T = T1 +T2 =1

2m1x2 +

1

2m2v2

G +1

2Iϕ2

La velocidad y la posicion absoluta del centro de masa de la esfera seran:

rG= (x+Rsenϕ)i+(−Rcosϕ)j

vG= rG= (x+Rϕ cosϕ)i+(Rϕ senϕ)j

El cuadrado de la velocidad sera:

v2G = (x+Rϕ cosϕ)2 +(Rϕ senϕ)2 = x2 +2xRϕ cosϕ +R2ϕ2

La energıa cinetica total sera:

T =1

2m1x2 +

1

2m2(x

2 +2xRϕ cosϕ +R2ϕ2)+1

2Iϕ2

= 12 (m1 +m2)x

2 +m2xRϕ cosϕ + 12 (m2R2 + I)ϕ2

La energıa potencial total sera debido a la energıa almacenada en los resortes y a la energıa gravitacional:

V = 21

2kx2−m2gRcosϕ

Luego el Lagrangiano resulta:

L =1

2(m1 +m2)x

2 +m2xRϕ cosϕ +1

2(m2R2 + I)ϕ2− kx2 +m2gRcosϕ

Aplicando las ecuaciones de Lagrange:d

dt(

∂L

∂ x)− ∂L

∂x= 0

d

dt(

∂L

∂ ϕ)− ∂L

∂ϕ= 0

donde:d

dt(

∂L

∂ x) =

d

dt((m1 +m2)x+m2Rϕ cosϕ)

= (m1 +m2)x+m2Rϕ cosϕ−m2Rϕ2 senϕ

∂L

∂x= 2kx

Figura A.3 m1 =2kg, m2 =1kg, R = 0,1m, r = 0,05m, k =1000N/m, a = 0,01m

206 A Ecuaciones de Euler Lagrange

El sistema tiene 2 grados de libertad, por tanto 2 coordenadas generalizadas x y φ. LFigura A.4 Sistema deslizador-pendulo con dos GDL

d

dt(

∂L

∂ ϕ) =

d

dt(m2Rxcosϕ +(m2R2 + I)ϕ)

= (m2R2 + I)ϕ +m2Rxcosϕ−m2Rxϕ senϕ

∂L

∂ϕ=−m2Rxϕ senϕ−m2gRsenϕ

Usando las ecuaciones de Lagrange:

(m1 +m2)x+m2Rϕ cosϕ−m2Rϕ2 senϕ +2kx = 0

(m2R2 + I)ϕ +m2Rxcosϕ +m2gRsenϕ = 0

Apendice B

Optimizacion

B.1. Optimizacion sin restricciones

Un ındice de desempeno escalar L(u) esta dado en funcion de un vector de control u ∈ Rm. Queremos obtener el

valor de u que resulte en el mınimo valor de L(u).Para resolver el problema de optimizacion, escribimos la expansion en serie de Taylor de un incremento en L, ası:

dL = LTu du+

1

2duT Luudu+O(3), (B.1)

donde O(3) representa los terminos de orden tres. El gradiente de L con respecto a u es el vector columna:

Lu =∂L

∂u, (B.2)

y la matriz Hessiana es:

Luu =∂ 2L

∂u2, (B.3)

y Luu es denominada la matriz curvatura.

Un punto estacionario o crıtico ocurre cuando un incremento dL es cero en su primera orden para todos los incre-

mentos du. Luego:

Lu = 0, (B.4)

para un punto crıtico.

Suponiendo que estamos en el punto crıtico, tal que Lu = 0 en (B.1), para que el punto crıtico sea un mınimo local,

se requiere que:

dL =1

2duT Luudu+O(3), (B.5)

sea positivo para todos los incrementos du. Esto se garantiza si la matriz de curvatura Luu es definida positiva:

Luu > 0. (B.6)

Si Luu es definida negativa, el punto crıtico es un maximo local.

B.1.1. Ejemplo: Superficies cuadraticas

Sea u ∈ R2 y:

L(u) =1

2uT

[q11 q12

q12 q22

]

+[

s1 s2

]u =

1

2uT Qu+ST u

El punto crıtico esta dado por:

207

208 B Optimizacion

Lu = Qu+S.

Luego:

u∗ =−Q−1S,

donde u∗ denota el control optimo.

El tipo de punto crıtico se obtiene examinando la matriz Hessiana:

Luu = Q.

El punto u∗ es mınimo si Luu > 0, o q11 > 0,q11q22−q212 > 0. Es un maximo si Luu < 0, o q11 < 0,q11q22−q2

12 < 0.

Sustitiuendo u∗ se puede encontrar el valor extremo del ındice de desempeno:

L∗ = L(u∗) =1

2ST Q−1QQ−1S−ST Q−1S =−1

2ST QS.

Sea:

L(u) =1

2uT

[1 1

1 2

]

+[

0 1]

u.

Luego:

u∗ =−[

2 −1

1 1

][0

1

]

=

[1

−1

]

,

es un mınimo, dado que Luu > 0. El mınimo valor de L es L∗ =− 12 .

Los contornos de L(u) son dibujados en la Fig. A.1, donde u =

[u1

u2

]T

. Las flechas representan el gradiente:

Lu = Qu+S =

[u1 +u2

u1 +2u2 +1

]

Notese que el gradiente es siempre perpendicular a los contornos y apuntando en la direccion de incremento de L(u).

Figura B.1 Contorno y vector gradiente

B.2 Optimizacion con restricciones de igualdad 209

B.2. Optimizacion con restricciones de igualdad

Sea el ındice de desempeno escalar dado por L(x,u), una funcion del vector de control u∈Rm y del vector de estados

x ∈ Rn. El problema consiste en seleccionar u tal que minimice a L(x,u) y simultaneamente satisfaga la ecuacion de

restriccion:

f (x,u) = 0. (B.7)

EL vector x es determinado para un u dado de la relacion (B.7), tal que f es un conjunto de ecuaciones escalares,

f ∈ Rn.

Para encontrar las condiciones necesarias y suficiente para un mınimo local que tambien satisfaga f (x,u) = 0,

procederemos de forma similar a la seccion anterior.

B.2.1. Multiplicadores de Lagrange y el Hamiltoniano

En un punto estacionario, dL es igual a cero al primer orden para todos los incrementos du cuando d f es cero. Esto

requiere que:

dL = LTu du+LT

x dx = 0, (B.8)

y,

d f = fudu+ fxdx = 0. (B.9)

Dado que (B.7) determina x para un u dado, el incremento dx puede ser determinado de (B.9) para un incremento

dado du. Luego la matriz Jacobiana fx es no singular y:

dx =− f−1x fudu. (B.10)

Y sustituyeno (B.10) en (B.8), resulta:

dL = (LTu −LT

x f−1x fu)du. (B.11)

La derivada de L con respecto a u manteniendo f constante esta entonces dada por:

∂L

∂u

∣∣∣∣d f=0

= (LTu −LT

x f−1x fu)

T = Lu− f Tu f−T

x Lx, (B.12)

donde f−Tx significa ( f−1

x )T . Notar que:∂L

∂u

∣∣∣∣dx=0

= Lu. (B.13)

Para conseguir dL igual a cero al primer orden para incrementos arbitrarios du cuando d f = 0, se debe tener:

Lu− f Tu f−T

x Lx = 0. (B.14)

Esta es una condicion necesaria para un mınimo.

Antes de derivar una condicion suficiente, escribir (B.8) y (B.9) como:

[dL

d f

]

=

[LT

x LTu

fx fu

][dx

du

]

(B.15)

Este conjunto de ecuaciones lineales define un punto estacionario, y debe tener una solucion[

dxT duT]T

. LA unica

forma de que esto pueda ocurrir es si la matriz de coeficientes de dimension (n+1)× (n+m) tiene rango menor que

n+1. Esto es sus filas deben ser linealmente dependientes tal que exista un vector λ ∈ Rn tal que:

[1 λ T

][

LTx LT

u

fx fu

]

= 0 (B.16)

Entonces:

210 B Optimizacion

LTx +λ T fx = 0 (B.17)

LTu +λ T fu = 0 (B.18)

Resolviendo este ultimo sistema de ecuaciones se tiene:

λ T =−LTx f−1

x . (B.19)

Y sustituyendo (B.19) en (B.18) de nuevo resulta en la condicion (B.14) para puntos estacionarios.

Definiendo el Hamiltoniano como:

H = L+λ T f , (B.20)

donde λ es denominado multiplicador de Lagrange.

En un punto estacionario, dH = dL es igual a cero al primer orden para los incrementos de primer orden de du y dλcuando d f es cero.

dH = HTu du+HT

x dx+Hλ dλ = 0, (B.21)

Incrementos dx no contribuyen a dH:∂H

∂x= Lx + f T

x λ = 0, (B.22)

que es igual a (B.19). Incrementos dλ tampoco contribuyen a dH:

∂H

∂λ= f = 0. (B.23)

Si (B.22) y (B.23) se cumplen, entonces:

dL = dH = HTu du, (B.24)

dado que H = L en esta situacion. ENtonces, para alcanzar un punto estacionario debemos imponer la siguiente condi-

cion estacionaria:

Hu = 0. (B.25)

Luego las condiciones necesarias para un punto mınimo de L(x,u) que satisface la restriccion f (x,u) = 0 son:

∂H

∂λ= f = 0, (B.26)

∂H

∂x= Lx + f T

x λ = 0, (B.27)

∂H

∂u= Lu + f T

u λ = 0, (B.28)

con H(x,u,λ ) definida por (B.20).

Mediante la introduccion de multiplicadores de Lagrange, ha sido posible reemplazar el problema de minimizar

L(x,u) sujeto a la restriccion f (x,u) = 0 con el problema de minimizar el Hamiltoniano H(x,u,λ ) sin restricciones.

B.2.2. Ejemplo: Superficie cuadratica con restriccion lineal

Suponer que el ındice de desempeno esta dado como en el ejemplo anterior:

L(x,u) =1

2

[x u][

1 1

1 2

][x

u

]

+[

0 1][

x

u

]

.

Sea la restriccion:

f (x,u) = x−3 = 0.

El Hamiltoniano es:

B.2 Optimizacion con restricciones de igualdad 211

H = L+λ T f =1

2x2 + xu+u2 +u+λ (x−3),

donde λ es un escalar. Las condiciones para un punto estacionario son:

Hλ = x−3 = 0,

Hx = x+u+λ = 0,

Hu = x+2u+1 = 0.

Resolviendo el sistema de ecuaciones se obtiene: x = 3, u =−2 y λ =−1. Luego el punto estacionario es:

(x,u)∗ = (3,−2).

La Fig. B.2 muestra los contornos de L(x,u y la restriccion f (x,u) para este problema.

Figura B.2 Contorno y vector gradiente

Apendice C

Calculo Variacional

Calculo variacional es una rama de la matematica que es bastante util en la solucion de problemas de optimizacion.

Un problema historico resuelto usando calculo variacional es el problema del la curva braquistocrona. El problema

fue propuesto en 1696 por Johann Bernoulli. Bajo la influencia de la gravedad una bola se desplaza a lo largo de una

cuerda (sin friccion) con extremos fijos A y B. El problema consiste en encontrar la forma de la cuerda que haga que

la bola se mueva de A hacia B en el menor tiempo posible. La solucion es un cicloide y se le atribuye a Johann y Jacob

Bernoulli, Newton y L’Hospital. La conexion con el problema de control optimo es aparente, encontrar la funcion de

control que minimice la medida de desempeno.

En control optimo el objetivo es determinar una funcion que minimice un funcional especıfico - el ındice de de-

sempeno. Un problema analogo en calculo es determinar un punto que lleve a un valor mınimo de una funcion. En

esta seccion introduciremos conceptos concernientes a funcionales apelando a resultados conocidos de la teoria de

funciones.

C.1. Conceptos

Funcion: Una funcion es una regla de correspondencia que asigna a cada elemento de un cierto conjunto D un

unico elemento en el conjunto R. D es denominado dominio y R es denominado rango.

Funcional Un funcional J es una regla de correspondencia que asigna a cada funcion x en una cierta clase Ω un

unico valor real. Ω es denominado dominio del funcional, y el conjunto de numeros reales asociados con las funciones

en Ω es denominado rango del funcional.

Notar que el dominio de un funcional es una clase de funciones; intuitivamente, podriamos decir que un funcional

es una “funcion de una funcion”.

Incremento de un funcion Si q y q+∆q son elementos para los cuales la funcion f es definida, luego el incremento

de f , denotado por ∆ f , es:

∆ f = f (q+∆q)− f (q). (C.1)

Notar que ∆ f depende de tanto q como ∆q, en general, para ser mas explıcitos, ∆ f (q,∆q).Ejemplo Considere la funcion: f (q) = q2

1 = 2q1q2,∀q1,q2 ∈ R. El incremento de f es:

∆ f = f (q+∆q)− f (q) = [q1 +∆q1]2 +2[q1 +∆q1][q2 +∆q2]− [q2

1 +2q1q2].

Incremento de un funcional Si x y x+δx son funciones para las cuales el funcional J es definido, luego el incre-

mento de J, denotado por ∆J, es:

∆J = J(x+δx)− J(x). (C.2)

De nuevo, se puede enfatizar que ∆J(x,δx) depende tanto de x como de δx. δx es la variacion de la funcion x.

Ejemplo Considere el funcional:

J(x) =∫ t f

to

x2(t)dt,

donde x es una funcion contınua del x. El incremento de J es:

213

214 C Calculo Variacional

∆J = J(x+δx)− J(x) =∫ t f

to

[x+δx]2dt−∫ t f

to

x2(t)dt =∫ t f

to

[2x(t)δx(t)+ [δx(t)]2]dt.

La variacion de un funcional La variacion juega el mismo rol que el diferencial en determinar los valores entremos,

en el caso de la variacion se aplica al caso de un funcional y en el caso del diferencial se aplica al caso de una funcion.

POR COMPLETAR...

Fuente: Capıtulo 4 del libro Optimal Control de Donald Kirk, Springer, 1970.

Fuente: Capıtulo 3 del libro Optimal Control de Lewis y Syrmos, Wiley, 1995.

bionanouni.wdfiles.combionanouni.wdfiles.com/local--files/teaching-mt227b...Indice general 1....

Documents

Transcript of bionanouni.wdfiles.combionanouni.wdfiles.com/local--files/teaching-mt227b...Indice general 1....