Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control...

132
SEMINARIO “Lógica difusa, redes neuronales y control predictivo. Técnicas modernas de control” Profesora: Dra. Doris Sáez OBJETIVOS Presentar un panorama de los conceptos y herramientas fundamentales de la teoría de control basada en lógica difusa, redes neuronales y control predictivo. Destinado a estudiantes de ingeniería de los últimos años, ingenieros y técnicos con conocimientos generales de control automático. CONTENIDOS I. Introducción II. Control basado en modelos difusos (2.5 horas) 2.1 Fundamentos de lógica difusa 2.2 Modelos difusos 2.3 Identificación de modelos difusos 2.4 Estrategias de control difuso 2.5 Ejemplos III. Control basado en redes neuronales (2.5 horas) 3.1 Fundamentos de redes neuronales 3.2 Modelos basados en redes neuronales 3.3 Entrenamiento de redes neuronales 3.4 Estrategias de control basadas en redes neuronales 3.5 Ejemplos

Transcript of Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control...

Page 1: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

SEMINARIO “Lógica difusa, redes neuronales

y control predictivo. Técnicas modernas de control”

Profesora: Dra. Doris Sáez

OBJETIVOS Presentar un panorama de los conceptos y herramientas fundamentales de la teoría de control basada en lógica difusa, redes neuronales y control predictivo. Destinado a estudiantes de ingeniería de los últimos años, ingenieros y técnicos con conocimientos generales de control automático. CONTENIDOS I. Introducción II. Control basado en modelos difusos (2.5 horas)

2.1 Fundamentos de lógica difusa 2.2 Modelos difusos 2.3 Identificación de modelos difusos 2.4 Estrategias de control difuso 2.5 Ejemplos

III. Control basado en redes neuronales (2.5 horas)

3.1 Fundamentos de redes neuronales 3.2 Modelos basados en redes neuronales 3.3 Entrenamiento de redes neuronales 3.4 Estrategias de control basadas en redes neuronales 3.5 Ejemplos

Page 2: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

IV. Fundamentos de control predictivo (2.5 horas) 4.1 Modelos predictivos 4.2 Control por matriz dinámica 4.3 Control predictivo generalizado

4.4 Control predictivo con restricciones 4.5 Ejemplos

V. Control predictivo no lineal (2.5 horas)

5.1 Formulación general del problema 5.2 Control predictivo basado en modelos difusos 5.3 Control predictivo basado en redes neuronales 5.4 Ejemplos

Page 3: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos Aires.

SEMINARIO AADECA-UBA

“Lógica difusa, redes neuronales y control predictivo.

Técnicas modernas de control”

Profesora: Dra. Doris Sáez

Page 4: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos Aires.

FUNDAMENTOS DE LA LÓGICA DIFUSA

La lógica difusa asocia incertidumbre a la estructura de un conjunto de datos (Zadeh, 1965). Los elementos de un conjunto difuso son pares ordenados que indican el valor del elemento y su grado de pertenencia. Para un conjunto difuso { }A x u x x XA= ∈( , ( )) / , se tiene que el elemento x pertenece al conjunto A con un grado de pertenencia uA (x), que puede variar entre 0 y 1. Por lo tanto, una variable puede ser caracterizada por diferentes valores lingüísticos, cada uno de los cuales representa un conjunto difuso. Por ejemplo, la velocidad puede ser caracterizada por valores lingüísticos como "Bajo", "Medio" y "Alto", que representan "una velocidad aproximadamente menor que 40 km/h", "una velocidad cercana a 55 km/h" y "una velocidad sobre 70 km/h aprox." respectivamente. Estos términos se asocian a conjuntos difusos con funciones de pertenencia como las mostradas en la siguiente figura.

Medio

40 55 70

u

1Bajo Alto

45

0.33

0.66

Velocidad (km/h)

Por lo tanto, si la velocidad es 45 km/h, existen grados de pertenencia 0.6, 0.3 y 0 a los conjuntos difusos "Bajo", "Medio" y "Alto" respectivamente.

Page 5: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos Aires.

Operaciones básicas de lógica difusa Dados dos conjuntos difusos A y B en el mismo universo X, con funciones de pertenencia uA y uB respectivamente, se pueden definir las siguientes operaciones básicas: Unión. La función de pertenencia de la unión de A y B se define como: { }u max (u (x), u (x))A B A B∪ = Intersección. La función de pertenencia de la intersección de A y B es:

{ }u min (u (x), u (x))A B A B∩ = Complemento. La función de pertenencia del complemento de A se define como: u (x) 1 u (x)

A A= − Producto cartesiano. Dados los conjuntos difusos A1, ..., An con universos X1, ..., Xn respectivamente, se define el producto cartesiano como un conjunto difuso en X1×...×Xn con la siguiente función de pertenencia: u (x ,..., x ) min{u (x ),..., u (x )}A1x..xAn 1 n A1 1 An n= según Mamdani (1974) u (x ,..., x ) u (x ) u (x ) u (x )A1x..xAn 1 n A1 1 A2 2 An n= ⋅ ⋅⋅ ⋅ según Larsen (1980).

Page 6: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos Aires.

MODELOS BASADOS EN LÓGICA DIFUSA

• Modelos difusos lingüísticos • Modelos difusos de Takagi y Sugeno

MODELOS DIFUSOS LINGÜÍSTICOS Estos modelos se basan en un conjunto de reglas heurísticas donde las variables lingüísticas de las entradas y salidas se representan por conjuntos difusos. La siguiente figura muestra las principales componentes de un modelo difuso lingüístico: interfaz de fusificación, base de conocimiento, motor de inferencia e interfaz de defusificación (Lee, 1990).

Base de conocimientos

Interfaz defusificación defusificación

Interfaz de

inferenciaMotor

u y

Interfaz de fusificación. Este elemento transforma las variables de entrada del modelo (u) en variables difusas. Para esta interfaz se deben

Page 7: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos Aires.

tener definidos los rangos de variación de las variables de entrada y los conjuntos difusos asociados con sus respectivas funciones de pertenencia. Base de conocimientos. Contiene las reglas lingüísticas del control y la información referente a las funciones de pertenencia de los conjuntos difusos. Estas reglas lingüísticas, tienen típicamente la siguiente forma: Si u1 es A y u2 es B entonces y es C donde A, B y C son los conjuntos difusos de las variables de entrada u1 y u2, y de la variable de salida y respectivamente. Existen varias formas de derivar las reglas (Lee, 1990), entre las que destacan las basadas en: - La experiencia de expertos y el conocimiento de ingeniería de control. La base de reglas se determina a partir de entrevistas con el operador o a través del conocimiento de la dinámica del proceso. - La modelación del proceso. Los parámetros de la base de conocimiento se obtienen a partir de datos de entrada y salida del proceso. Motor de inferencia. Realiza la tarea de calcular las variables de salida a partir de las variables de entrada, mediante las reglas del controlador y la inferencia difusa, entregando conjuntos difusos de salida. Por ejemplo, dada una base de conocimiento con n reglas del tipo: Si u1 es Ai y u2 es Bi entonces y es Ci

Page 8: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos Aires.

la secuencia de cálculos que realiza el motor de inferencia incluye: - Determinar el grado de cumplimiento Wi de cada regla a partir de los grados de pertenencia de las variables de entrada obtenidos en la etapa de fusificación, es decir, Wi = min(uAi,uBi) debido a que las premisas de la reglas están unidos por operadores AND, definidos como la intersección de conjuntos difusos. - Para cada regla se tiene una consecuencia "y es Ci", que tiene asociado una función de pertenencia uCi. Por lo tanto, se tiene un conjunto de salida C'i, cuya función de pertenencia es: uC'i = min (Wi,uCi) donde Wi es el grado de cumplimiento para la regla i. - Para evaluar el conjunto total de reglas, se unen los conjuntos difusos C'i resultantes de cada regla, generándose un conjunto de salida con la siguiente función de pertenencia: u u i = 1,..., nC' C'i

= max( ) De esta forma, se obtiene una salida difusa del controlador, con una función de pertenencia uC'.⋅

Page 9: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos Aires.

Interfaz de defusificación. Este elemento provee salidas discretas y determinísticas a partir de los conjuntos difusos C' obtenidos como resultado de la inferencia. Existen diferentes métodos de defusificación, algunos de los cuales se describen a continuación: - Método del máximo. La salida corresponde al valor para el cual la función de pertenencia uC' alcanza su máximo. - Media del máximo. La salida es el promedio entre los elementos del conjunto C' que tienen un grado de pertenencia máximo. - Centro de área. Genera como salida el valor correspondiente al centro de gravedad de la función de pertenencia del conjunto de salida C'.

Page 10: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos Aires.

Ejemplo Reglas Si x es A e y es B entonces z es C R1 Si x es A1 e y es B2 entonces z es C2 R2 x = 20 y = 26 z?

0 100 -50 50 0 10x y z

0 10 z

0 10 z40

.

A1 A2 B1 B2 C1 C2

C1 C2

C’

10 26

Page 11: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos Aires.

Ejemplo 2 Modelación de las acciones de control de un operador de un horno cementero. En la siguiente figura se presenta un diagrama del proceso, donde el carbón proveniente de un molino, alimenta una tolva y es transportado hacia el horno. El ventilador primario sirve para mantener la llama en la zona de cocción.

La mezcla, que permite la formación de los compuestos del cemento, se desplaza desde la parte posterior del horno (derecha de la figura) en contracorriente al flujo de calor, calcinándose y cociéndose, hasta obtenerse el clinker o producto final del horno que pasa posteriormente al enfriador. El ventilador de inducción sirve para succionar los gases producidos en la combustión.

CORTO2

BTHorno

Cementero

CS

BF

KSNOx

El diagrama muestra las variables de entrada y de salida del proceso: - el flujo de alimentación del carbón (CS), - la velocidad del ventilador de inducción (BF) y - la velocidad del horno (KS).

Page 12: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos Aires.

- el porcentaje de monóxido de carbono en los gases (CO), - la temperatura de los gases en la zona intermedia (RT), - el porcentaje de oxígeno en los gases (O2), - la temperatura de los gases en la zona posterior (BT) y - el porcentaje de óxido nitroso en los gases (NOx). Experimentalmente, se ha comprobado que la dinámica de este sistema es no lineal, con retardos, fuertes interacciones y muy dependiente de las condiciones iniciales. A partir de la experiencia de operadores para hornos cementeros, se puede deducir, en términos generales, que el flujo de carbón es la variable manipulada que produce el mayor efecto. Por ejemplo, un aumento de CS genera: - una disminución de O2 y CO, y - un aumento de las temperaturas RT y BT, y del NOx. Por su parte, un aumento en BF - aumenta el O2, CO y BT, y - disminuye RT y NOx. Al aumentar KS, aumentan RT y BT. A partir de estas afirmaciones, una regla que representa las acciones de control del operador puede ser: Si CO es alto entonces CS aumenta y BF disminuye

Page 13: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos Aires.

MODELOS DIFUSOS DE TAKAGI Y SUGENO

Estos modelos se caracterizan por relaciones basadas en reglas difusas, donde las premisas de cada regla representan subespacios difusos y las consecuencias son una relación lineal de entrada-salida (Takagi y Sugeno, 1995).

Las variables de entrada en las premisas de cada regla son relacionadas por operadores "y" y la variable de salida es una combinación lineal de las variables de estado. Por lo tanto, las reglas del modelo tienen la siguiente forma:

R

p p pi

i iki

: Si X1 es Al y y Xk es Ak

entonces Y X Xki i

i

……= + + +0 1 1

donde X1, ..., Xk son las variables de entrada o premisas de las reglas, A1i, ..., Aki son los conjuntos difusos asociados a las variables de

entrada, p0

1 , , pki… son los parámetros de la regla i, e

Yi es la salida de la regla i. Por lo tanto, la salida del modelo, Y, se obtiene ponderando la salida de cada regla por su respectivo grado de cumplimiento Wi, es decir:

Y = (W Y ) / ( W )i ii=1

M

ii 1

M

∑ ∑=

donde M es el número de reglas del modelo y Wi se calcula según el operador intersección.

Page 14: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos Aires.

Ejemplo Modelo difuso de Takagi y Sugeno para un fermentador batch de alimentación. La presión en el estanque de fermentación puede ser controlada a través del cambio de flujo de aire de salida manteniendo constante el flujo de aire de entrada.

A continuación se presentan la base de reglas del modelo de Takagi y Sugeno que caracterizan al fermentador.

Page 15: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos Aires.

Funciones de pertenencia del modelo de Takagi y Sugeno que caracterizan al fermentador

Page 16: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos Aires.

Método de identificación Los conjuntos difusos y las funciones de pertenencia se definen a partir de un conocimiento previo del proceso y los parámetros de las consecuencias se obtienen por un algoritmo de mínimos cuadrados. En la siguiente figura se presenta un diagrama del método de identificación:

Identificación de los parámetros de las premisas

¿Es bueno el modelo?

no

parámetros de las consecuenciasIdentificación de los

Elección de laestructura del modelo

Page 17: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos Aires.

Identificación de los parámetros de las premisas En esta estructura los conjuntos difusos A1i, ..., Aki y sus respectivas funciones de pertenencia pueden ser determinadas basándose en un conocimiento previo del proceso o por métodos más complejos como “clustering” difuso.

“Clustering” difuso El número óptimo de reglas y conjuntos difusos del modelo se determina haciendo una partición del universo de la variable de salida y luego proyectándolo al espacio de entrada (Sugeno, 1993). Para obtener los conjuntos difusos de la salida, el criterio utilizado es minimizar la distancia entre el dato de salida y el centro de cada conglomerado (“cluster”) difuso. Luego de un procedimiento iterativo de optimización de las distancias, se obtiene el número de conjuntos o conglomerados difusos y sus grados de pertenencia de los datos de salida a cada conjunto. A continuación, para determinar los parámetros de las funciones de pertenencia de las premisas, los conjuntos difusos de las variables de salida son proyectados al espacio de entrada para definir esos conjuntos difusos, como se muestra en la siguiente figura.

Page 18: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos Aires.

X1

X2

YB

A1

A2A

Espacio de salida

Espacio de entrada

Page 19: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos Aires.

Identificación de los parámetros de las consecuencias En general, los parámetros p pi

ki

0 , , … de las consecuencias se obtienen por el método de mínimos cuadrados, es decir, se minimiza el índice de error dado por:

e y ypp

N

p2

1

2= −=

∑ ( $ )

donde yp es la salida real del proceso, $yp es la salida del modelo difuso, considerando las mismas

entradas del proceso, y N es el número de muestras. Finalmente, con los parámetros óptimos de las consecuencias ya determinados se puede alterar la estructura del modelo o las funciones de pertenencia obtenidas, de manera de reducir el índice de error.

Page 20: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos Aires.

ESTRUCTURA BÁSICA DE UN CONTROLADOR DIFUSO Estos controladores se basan en un conjunto de reglas heurísticas donde las variables lingüísticas de las entradas y salidas se representan por conjuntos difusos La siguiente figura muestra las principales componentes de un controlador difuso: interfaz de fusificación, base de conocimiento, motor de inferencia e interfaz de defusificación (Lee, 1990).

Base de conocimientos

Interfaz defusificación defusificación

Interfaz de

inferencia

ProcesoVariables Variablesmanipuladascontroladas

Motor

Page 21: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos Aires.

EJEMPLO: CONTROLADOR DIFUSO PARA UNA LAVADORA. Objetivo Seleccionar el tiempo del lavado basándose en la cantidad, tipo y grado de suciedad de la ropa. Controlador difuso

ControladorDifuso

Suciedad

Tipo de ropaTiempo de

Lavado

El grado de suciedad de la ropa es determinado por la transparencia del agua. El tipo de ropa se determina a partir del tiempo de saturación. En este caso, el tiempo de saturación se define como el tiempo en que la transparencia del agua tiende a cero. Por ejemplo, la ropa grasienta toma mayor tiempo en llegar al tiempo de saturación pues la grasa es menos soluble.

Page 22: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos Aires.

Funciones de pertenencia

Funciones de pertenencia para la variable “Suciedad”

Funciones de pertenencia para la variable “Tipo de ropa”

Page 23: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos Aires.

Funciones de pertenencia para la variable “Tiempo de lavado”

Base de reglas

Las reglas del controlador difuso para la lavadora se definen intuitivamente. Por ejemplo, una regla típica sería: Si la suciedad es alta y el tipo de ropa es grasiento entonces el tiempo de lavado debería ser alto. Diferentes combinaciones de este tipo de reglas y otras condiciones son necesarias para construir el controlador difuso propuesto. Reglas del controlador difuso if dirtness_of_clothes is Large and type_of_dirt is Greasy then wash_time is VeryLong; if dirtness_of_clothes is Medium and type_of_dirt is Greasy then wash_time is Long; if dirtness_of_clothes is Small and type_of_dirt is Greasy then wash_time is Long;

Page 24: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos Aires.

if dirtness_of_clothes is Large and type_of_dirt is Medium then wash_time is Long; if dirtness_of_clothes is Medium and type_of_dirt is Medium then wash_time is Medium; if dirtness_of_clothes is Small and type_of_dirt is Medium then wash_time is Medium; if dirtness_of_clothes is Large and type_of_dirt is NotGreasy then wash_time is Medium; if dirtness_of_clothes is Medium and type_of_dirt is NotGreasy then wash_time is Short; if dirtness_of_clothes is Small and type_of_dirt is NotGreasy then wash_time is VeryShort Superficie del controlador difuso

Page 25: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos Aires.

CONTROLADORES PI DIFUSOS

La Figura presenta un diagrama de un controlador PI difuso incremental, donde las entradas son el error e k ref y k( ) ( )= − y su tasa de cambio de k e k e k( ) ( ) ( )= − − 1 , y la salida es el cambio incremental en la variable manipulada du(k).

Controlador ProcesoGE

GR

e(k)

de(k)

refGU

du(k) y(k)

Los parámetros del controlador son las ganancias GE, GR y GU, que multiplican a e(k), de(k) y du(k) respectivamente. En general, estos controladores presentan las siguientes características: dos o siete conjuntos difusos para las variables de entrada, tres o siete conjuntos difusos para la variable de salida, funciones de pertenencia triangulares, fusificación con universos continuos, implicación utilizando operador min, inferencia basada en implicancia difusa y defusificación por el método de la media de los máximos modificada. Este tipo de controlador difuso se deriva a partir del comportamiento deseado del sistema en lazo cerrado. En la siguiente figura se aprecia la respuesta típica de un sistema controlado, donde las entradas al controlador son e(k) y de(k), y la salida es du(k).

Page 26: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos Aires.

a1 a2 a3 a4

e(k)de(k)

+ - +

++

- - -

ref

tiempo

y(k)

Analizando en detalle esta respuesta se pueden observar diferentes situaciones. Considerando el valor de e(k) y el signo de de(k), se tienen los casos presentados en la tabla 1(a). Además, existen dos tipos de situaciones especiales, cuando el error e(k) es cero y cuando su tasa de cambio de(k) es cero. Estas situaciones se muestran en las siguientes figuras y en las tablas 1(b) y 1 (c). Tabla 1: Situaciones de las variables e(k) y de(k)

e(k) de(k) e(k) de(k) de(k) e(k) a1 >0 <0 b1 =0 <<<0 c1 =0 <<<0 a2 <0 <0 b2 =0 <<0 c2 =0 <<0 a3 <0 >0 b3 =0 <0 c3 =0 <0 a4 >0 >0 b4 =0 >0 c4 =0 >0 b5 =0 >>0 c5 =0 >>0 b6 =0 >>>0 c6 =0 >>>0 (a) (b) (c)

Page 27: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos Aires.

b1b2

b3

b4

b5b6

ref

tiempo

c1c2c3

c4c5

c6

ref

tiempo(a) (b)

y(k) y(k)

A partir de estas condiciones, se puede configurar una tabla en función de las variables de entrada del controlador (ver Tabla 2). En ella se consideran siete conjuntos difusos NB ("Negative Big"), NM ("Negative Medium"), NS ("Negative Small"), ZE ("Zero"), PS ("Positive Small"), PM ("Positive Medium") y PB ("Positive Big") para las variables de entrada que describen los estados <<<, <<, <, =, >, >> y >>> 0, respectivamente. Tabla 2: Diagrama de estados e(k) y de(k).

de(k) NB NM NS ZE PS PM PB NB a2 a2 a2 c1 a3 a3 a3 NM a2 a2 a2 c2 a3 a3 a3 NS a2 a2 a2 c3 a3 a3 a3 e(k) ZE b1 b2 b3 ZE b4 b5 b6 PS a1 a1 a1 c4 a4 a4 a4 PM a1 a1 a1 c5 a4 a4 a4 PB a1 a1 a1 c6 a4 a4 a4

Las acciones de control, es decir, los incrementos en la variable manipulada, se definen a partir de la proposición de MacVicar-Whelan (1976), como lo muestra la Tabla 3. Por ejemplo, para el elemento de la tercera fila y sexta columna, la regla de control se interpreta como: "Si el error es negativo pequeño y la variación incremental del error es

Page 28: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos Aires.

positiva mediana, entonces hacer positiva pequeña la variación incremental en el control". Tabla 3: Reglas de control PI difuso.

de(k) NB NM NS ZE PS PM PB NB NB NB NB NB NM NS ZE NM NB NB NM NM NS ZE PS NS NB NM NS NS ZE PS PM e(k) ZE NM NM NS ZE PS PM PM PS NM NS ZE PS PS PM PB PM NS ZE PS PM PM PB PB PB ZE PS PM PB PB PB PB

El diseño de un controlador difuso PI incluye, además de definir las reglas de control, determinar las funciones de pertenencia de cada conjunto difuso. En general, se utilizan funciones triangulares como se muestran en la siguiente figura, donde el universo varía entre -L y L, siendo L un factor de escalamiento de las variables.

1NB NS NM ZE PS PM PB

-L -2L/3 -L/3 L/3O 2L/3 L Los principales parámetros de sintonía de estos controladores son las ganancias GE, GR y GU.

Page 29: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

y

u

ModelosModelos difusosdifusos

Takagi & Takagi & SugenoSugeno

– Modelos lineales en las consecuencias

Page 30: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-UBA, Buenos Aires.

SEMINARIO AADECA-UBA

“Lógica difusa, redes neuronales y control predictivo.

Técnicas modernas de control”

Profesora: Dra. Doris Sáez

Apuntes II: Control basado en Redes Neuronales

Page 31: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-UBA, Buenos Aires.

REDES NEURONALES Las redes neuronales constituyen una poderosa herramienta para modelar sistemas, especialmente no lineales, sean dinámicos o estáticos. El cerebro humano es una sistema muy complejo formado por muchas células llamadas neuronas; se estima que existen entre 1010 y 1011 de células en el cerebro. Las redes neuronales artificiales emulan la arquitectura y capacidades de sistemas neuronales biológicos. Una esquema simplificado de una neurona se muestra en la siguiente figura.

Dendrita

Cuerpo celular

Axón

Sinapsis

Page 32: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-UBA, Buenos Aires.

En el cuerpo celular se realizan la mayoría de las funciones lógicas de la neurona. El axón es el canal de salida final de la neurona. Las dentritas reciben las señales de entrada de los axones de otras neuronas y se conectan al cuerpo celular por medio de las sinapsis.

Page 33: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-UBA, Buenos Aires. -

Page 34: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-UBA, Buenos Aires.

REPRESENTACION MATEMATICA DE UNA NEURONA

En la siguiente figura se observa la estructura de una neurona artificial con múltiples entradas.

x1

x2

x3

xk

xn

yΣ f

θ

u

w1

w2

w3

wk

wn

En esta estructura, se tiene

u w xi ii

n

==

∑1

donde wi son los pesos de la neurona (sinápsis) xi son las entradas a la neurona n es el número de entradas a la neurona

Page 35: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-UBA, Buenos Aires.

( )y f u f w xi ii

n

= = −

=∑

1

θ

donde y es la salida de la neurona (axón) f es la función de activación, correspondiente, en

general, a una función no lineal (cuerpo celular) θ es el sesgo En general, se utilizan las siguientes funciones de activación:

1

-1

1

-1 -1

1

b b b

f f f

x x x

Limitador duro Hiperbólica Sigmoidal

Page 36: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-UBA, Buenos Aires.

Page 37: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-UBA, Buenos Aires.

Las redes neuronales son estructuras de procesamiento formadas por una gran cantidad de neuronas, que operan en paralelo. Además, los distintos tipos de redes neuronales se generan a partir de la interconexión de neuronas. Las principales redes neuronales que se utilizan para modelación no lineal son:

• Redes perceptrón multicapa • Redes recurrentes • Redes de funciones de base radiales (RBFN)

Page 38: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-UBA, Buenos Aires.

VENTAJAS DE LAS REDES NEURONALES Las redes neuronales deben su capacidad de procesamiento de información a su estructura distribuida y paralela, a su capacidad de apredizaje y por tanto de generalización. Tareas - Reconocimiento de patrones - Memorias asociativas - Aproximación funcional - Etc. Propiedades - No linealidad. Las neuronas son elementos de proceso

generalmente no lineales. La interconexión de estos elementos genera estructuras dde transformación de datas donde este carácter no lineal queda distribuido a lo largo y ancho de la red.

- Modelado de relaciones de entrada/salida. - Adaptibilidad. Las redes neuronales son por definición

estructuras adaptivas capaces de ajustar sus pesos, y por

Page 39: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-UBA, Buenos Aires.

tanto su función de transferencia, a cambios en su entorno.

- Tolerancia ante fallos. Una red neuronal tiene la

capacidad de seguir respondiendo de forma no catastrófica cuando parte de su estructura no está dañada. Esto es debido al tratamiento distribuido de la información y a la redundancia implícita en su estructura.

Page 40: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-UBA, Buenos Aires.

PERCEPTRÓN MULTICAPA El perceptrón multicapa es una estructura jerárquica que consiste en varias capas de neuronas totalmente interconectadas, que admiten como entradas las salidas de los elementos de proceso (neuronas) de la capa anterior.

x1

x2

y

capa 1

capa 2

capa 3

En las redes perceptrón multicapa se distinguen tres tipos de capas: • Capa de entrada. Esta formada por n unidades (siendo n el

número de entradas externas) que se limitan a distribuir las señales de entrada a la capa siguiente.

Page 41: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-UBA, Buenos Aires.

• Capas ocultas. Están formadas por neuronas que no tienen contacto físico con el exterior. El número de capas ocultas es variable, pudiendo incluso ser nulo.

• Capa de salida. Está formado por m neuronas (siendo m el

número de salidas externas) cuyas salidas constituyen el vector de salidas externas del perceptrón multicapa.

Los modelos dinámicos neuronales están dados por: ))nut(u,),1t(u),nyt(y,),1t(y(N)t(y −−−−= …… donde N es la red neuronal que puede ser un perceptrón multicapa, como se muestra en la siguiente figura.

Page 42: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-UBA, Buenos Aires.

...

y(t-1)

y(t-ny)

u(t-1)

...

u(t-nu)

y(t)

Page 43: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-UBA, Buenos Aires.

Aplicaciones - Aproximación funcional - Reconocimiento de patrones - Filtrado de señales - Eliminación de ruido - Segmentación de imágenes y señales - Control adaptivo - Compresión de datos - Etc. Ventajas - Capacidad de representación funcional universal. Gran

rapidez de procesamiento. Genera buenas representaciones internas de las características de los datos de entrada. Ampliamente estudiada. Es la red neuronal más aplicada en la práctica

Desventajas - Tiempo de aprendizaje elevado para estructuras

complejas

Page 44: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-UBA, Buenos Aires.

Ejemplo Modelación de la química del agua de una central térmica utilizando redes neuronales. Se considera la central térmica a carbón Anllares (350 MW), propiedad de la empresa Unión Eléctrica Fenosa (UEFSA), España. Esta central tiene en operación un sistema experto denominado SEQA que permite adquirir variables relacionadas con las propiedades químicas de los siguientes flujos del ciclo agua-vapor: vapor condensado, agua de alimentación, vapor saturado, vapor sobrecalentado y vapor recalentado.

Turbinas

Vapor Sobrecalentado

VaporRecalentado

Caldera

Vapor Saturado

Condensador

VaporCondensado Agua de

Alimentación

Las propiedades químicas analizadas para los flujos considerados son: la conductividad catiónica, la

Page 45: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-UBA, Buenos Aires.

conductividad específica, el pH y el porcentaje de O2. La utilización de modelos predictivos para estas propiedades químicas, en el sistema experto SEQA, permite controlar los problemas de corrosión de componentes presentes en la producción de energía eléctrica. Especialmente, es importante la modelación de la conductividad catiónica del ciclo agua-vapor, debido a que esta propiedad es muy representativa de las impurezas del agua. Como ejemplo de la modelación neuronal de las propiedades químicas del agua, se presentan los resultados obtenidos para la modelación de la conductividad catiónica del agua de alimentación (CCaa). Las variables de entrada al modelo son: la potencia generada de la central (P) y la conductividad catiónica del condensado (CCcond, flujo precedente). Los datos son adquiridos con un período de muestreo de 15 minutos. El modelo neuronal para la conductividad catiónica del agua de alimentación está dada por:

CC k N CC k P k P k

k CC kaa aa

cond cond

( ) ( ( ), ( ), ( ),( ), ( ))

= − − −−

1 1 21

CC

donde N es un perceptrón multicapa con una capa oculta de neuronas de funciones de activación tangente hiperbólica y una capa de salida lineal.

Page 46: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-UBA, Buenos Aires.

Page 47: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-UBA, Buenos Aires.

REDES RECURRENTES Estos modelos son capaces de representar sistemas realimentados dinámicos no lineales (Narendra, 1990).

...

x1(t)

x2(t)

xn(t)

x1(t+1)

x2(t+1)

...

xn(t+1)

z-1

z-1

z-1

Además, se debe mencionar que existen diversos modelos neuronales que son combinaciones de las redes perceptrón multicapa y redes recurrentes.

Page 48: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-UBA, Buenos Aires.

REDES DE FUNCIONES DE BASE RADIALES (RBFN)

Las redes de funciones de base radiales (RBFN “Radial Basis Function Networks”) consisten en dos capas (Jang, 1993). Los modelos dinámicos basados en las redes RBFN están dados por: y t N y t y t ny u t u t nu( ) ( ( ), , ( ), ( ), , ( ))= − − − −1 1… … donde N es una red neuronal como se muestra en la siguiente figura con n = ny + nu.

y(t)

...

y(t-1)

u(t-1)

y(t-ny)

u(t-nu)

...

a1

an

anyv1

vny

vn

Page 49: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-UBA, Buenos Aires.

La capa oculta esta compuesta por n unidades radiales totalmente conectadas al vector de entrada. Las funciones de transferencia de la capa oculta son similares a una función de densidad gaussiana, es decir:

ax r

ii

i

= −−

exp

2

donde [ ]x y t y t ny u t u t nu= − − − −( ), , ( ), ( ), ( )1 1… … es el vector de entradas de la red, ri son los centros de las unidades radiales, σ i representan los anchos. La salida de la red está dada por:

y t v ai ii

n

( ) ==∑

1

donde vi son los pesos de las unidades radiales.

Page 50: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-UBA, Buenos Aires.

Ejemplo Modelación neuronal basada en RBFN para un fermentador batch de alimentación. La presión en el estanque de fermentación puede ser controlada a través del cambio de flujo de aire de salida manteniendo constante el flujo de aire de entrada.

Page 51: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-UBA, Buenos Aires.

El modelo de la red está dado por: ( )$( ) ( ), ( )y k N y k u k+ =1 donde y(k) es la presión en el estanque y u(k) es el flujo de salida. Además, N es una red neuronal lineal/RBF dada por las siguientes ecuaciones:

)k(xw)k(rww)1k(y T2

n

1iiii10 +φ+=+ ∑

=

ii c)k(x)k(r −= [ ]T

uy )nk(u,),k(u),nk(y,),k(y)k(x −−= ……

Page 52: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-UBA, Buenos Aires.

Aplicaciones - Aproximación funcional - Reconocimiento de patrones Ventajas Capacidad de representación funcional universal. La estructura de esta red tiene interpretación directa, lo que permite realizar una buena inicialización de los pesos de la red, y extraer conocimiento de las estructuras ajustadas. La buena inicialización de los pesos acelera el proceso de aprendizaje. Desventajas El procesamiento realizado es algo más complejo que en el caso del perceptrón multicapa.

Page 53: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-UBA, Buenos Aires.

OTROS TIPOS DE REDES Adaline. Estas neuronas tienen capacidad de aprendizaje debido a que sus pesos son cambiados adaptivamente de acuerdo a un algoritmo adaptivo. Sus aplicaciones principales son: filtrado adaptivo de señales, reconocimiento de patrones. Son fácilmente implementables en hardware debido a su sencillez y homogeneidad, sin embargo sólo son capaces de resolver problemas de clasificación linealmente separables y llevar a cabo transformaciones lineales. Mapas autoorganizativos de Kohonen. En este caso, las neuronas están ordenadas topológicamente. Frente a la presentación de un patrón n-dimensional de entrada, compiten lateralmente hasta que sólo una de ellas queda activa. El objetivo es que patrones de entrada con características parecidas queden asociados a neuronas topológicamente cercanas. Sus principales aplicaciones son: agrupación y representación de datos, compresión de datos y optimización.

Page 54: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-UBA, Buenos Aires.

ENTRENAMIENTO DE REDES NEURONALES Se entiende por entrenamiento el cálculo de pesos y sesgos de manera que la red se comporte de una manera deseada. De acuerdo al tipo de entrenamiento, las redes se pueden subdividir en dos grandes grupos: • Redes con entrenamiento supervisado. Estas redes se

entrenan presentando, para cada combinación de entradas, las salidas que se espera ellas produzcan. Los algoritmos de entrenamiento calculan pesos y sesgos nuevos de manera de minimizar el error entre la salida deseada y la obtenida realmente.

• Redes sin supervisión. Los algoritmos de entrenamiento

calculan nuevos pesos libremente. Estas redes se utilizan como clasificadores, pues se caracterizan por asociar una combinación de entradas especifica con una sola salida.

Page 55: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-UBA, Buenos Aires.

ALGORITMO DE ENTRENAMIENTO BACKPROPAGATION

El algoritmo de entrenamiento backpropagation se utiliza para ajustar los pesos y sesgos de un red, con el fin de minimizar la suma del cuadrado de los errores de la red. El algoritmo backpropagation es un método iterativo de optimización de descenso según el gradiente, cuyos detalles se presentan a continuación. Para una neurona j en una capa oculta o en la salida, la señal de salida es

o f w o bj ij i ji

n

= −

=∑

1

donde f es la función de activación de la neurona

wij son los pesos de las conexiones entre la neurona considerada, j, y la neurona i, perteneciente a la capa precedente. oi es la salida de la neurona i de la capa precedente bj es el sesgo de la neurona j

En este caso, se considera funciones de activación sigmoide logarítmicas.

Page 56: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-UBA, Buenos Aires.

Además, se define

net w o bj ij i ji

n

= −=∑

1

La salida de la neurona j, entonces, está dada por

( )o f nete

j j net j= =

+ −

11

Para el entrenamiento, el valor -bj se considera como un peso correspondiente a la conexión de la neurona j con una supuesta neurona de la capa precedente cuya salida es constante e igual a uno. El algoritmo de backpropagation permite ajustar los pesos de la red neuronal con el fin de minimizar el error cuadrático sobre un conjunto de entradas y salidas asociadas (patrones) que la red debe ser capaz de aprender para luego realizar generalizaciones a partir de ellas. Además, se define como superficie de error a la función multivariable generada por la expresión del error de ajuste en términos de los pesos y sesgos de las neuronas de la red.

Page 57: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-UBA, Buenos Aires.

El algoritmo backpropagation permite determinar los valores de los pesos para los cuales la función de error es mínima. Esto no siempre se logra, convergiendo muchas veces el algoritmo a mínimos locales, no al mínimo global buscado, o simplemente no convergiendo. Se considera una red con M neuronas en la capa de salida y suponiendo que se dispone de un conjunto de entrenamiento con P patrones, uno de los cuales, denominado p, tiene salidas dadas por

[ ]t t t tp p p pM= 1 2, , ,… el error cuadrático tiene, para ese patrón, la siguiente expresión

( )E t op pi pii

M

= −=∑1

22

1

que corresponde al error tomado para derivar la regla de optimización. Los valores tpi representan las salidas deseadas ante las entradas correspondientes al patrón p. Cuando dicho patrón es presentado a la red, los pesos se modifican según una

Page 58: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-UBA, Buenos Aires.

regla iterativa derivada del método de optimización según el gradiente, con lo cual el peso wij según la ecuación w h w h w hij ij ij( ) ( ) ( )= − +1 ∆ donde h corresponde al contador dentro de una iteración. En este caso, una iteración se define como la presentación (una vez) de todos los patrones entrada/salida de los cuales se dispone para el entrenamiento. El valor de ∆w hij( ) se calcula como

∆w hEw

Enet

netwij

p

ij

p

j

j

ij

( ) = −

= −

η

∂∂

η∂

∂∂∂ (*)

donde η es la tasa de aprendizaje (constante de proporcionalidad) ( 0 1< <η ) En general, los pesos se inicializan entre cero y uno aleatoriamente. Se define el parámetro δj como

δ∂∂

∂∂

∂∂j

p

j

p

j

j

j

Enet

Eo

onet

= − = −

Page 59: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-UBA, Buenos Aires.

En las expresión siguientes, el subíndice p se ha omitido por simplicidad. Para calcular las derivadas es necesario tener en cuenta que la función de activación escogida es una sigmoide logarítmica, cuya derivada es

( )df xdx

ddx e e e

f x f xx x x

( )( ) ( )=

+

=+

−+

= −− − −

11

11

11

11

Para una neurona j en la capa de salida se tiene, entonces,

( ) ( )δ j j j j jt o o o= − −1 Para una neurona en la capa oculta o en la capa de entrada, se tiene

( ) ( )∑ δ−=δk

jkkjjj wo1o

donde el contador k cubre las neuronas de la capa posterior a la j. Entonces, la corrección de los pesos se comienza por la capa de salida y se propaga hacia atrás hasta llegar a la capa de entrada.

Page 60: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-UBA, Buenos Aires.

Con esto, el término (*) se puede expresar como ∆w oij j i= ηδ Ahora bien, normalmente no se emplea sólo esta expresión sino que se agrega un término denominado momentum, que corresponde al cambio anterior en el peso ponderado por el coeficiente de momentum. Entonces, se tiene ∆w o w hij j i ij= + −ηδ α∆ ( )1 donde α es el coeficiente de momento. Este término permite suavizar la convergencia del método y ayuda a que la convergencia de los pesos no se vea demasiado afectada por irregularidades en la superficie de error. Considerando los P patrones de que se dispone y con los cuales se realizará el entrenamiento, la expresión para el error total, o error de ajuste, es la siguiente

( )E E t opp

P

pi pii

M

p

P

= = −

= ==

∑ ∑∑1

2

11

12

En general, el entrenamiento se considera acabado cuando el valor de E es menor o igual que un límite preestablecido.

Page 61: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes II: Control basado en Redes Neuronales. Seminario AADECA-UBA, Buenos Aires.

IDENTIFICACION CON REDES NEURONALES

Modelación directa

Proceso

Algoritmode Aprendizaje

M

yp

ym

u

d d’

Page 62: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes II: Control basado en Redes Neuronales. Seminario AADECA-UBA, Buenos Aires.

En este caso, se entrena una red neuronal de manera de obtener la dinámica directa de la planta. La red es colocada en paralela a la planta y el error entre el sistema y las salidas de la red son usados como entrada al entrenamiento (“Backpropagation”). Ecuación del sistema no lineal (Proceso)

( ))1nt(u,),t(u),1nt(y,),t(yf)1t(y ppp +−+−=+ …… Red neuronal (Modelo) ( ))1nt(u,),t(u),1nt(y,),t(yf)1t(y ppm +−+−=+ …… donde f es la relación de entrada – salida dada por la red neuronal. Luego de un tiempo adecuado de entrenamiento, se tiene: pm yy ≈ De esta manera, la red se independiza de la planta, es decir: ( ))1nt(u,),t(u),1nt(y,),t(yf)1t(y mmm +−+−=+ ……

Page 63: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes II: Control basado en Redes Neuronales. Seminario AADECA-UBA, Buenos Aires.

Modelación inversa

Proceso

Algoritmode Aprendizaje

M

ypur

ss

ss es la señal de entrada para el entrenamiento. Los modelos inversos de la dinámica de la planta juegan un rol importante en el diseño de control. La salida yp es usada como entrada a la red neuronal. La salida de la red u es comparada con la entrada del sistema ss (señal de entrenamiento) y este error es usado para entrenar la red.

Page 64: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes II: Control basado en Redes Neuronales. Seminario AADECA-UBA, Buenos Aires.

Esta estructura claramente tiende a forzar a la red neuronal a representar la dinámica inversa de la planta. Modelación inversa especializada

Proceso

Algoritmode Aprendizaje

C

ypur

M

ym

En este caso, el modelo red neuronal inverso precede al sistema y recibe como entrada la referencia deseada de la salida. Esta estructura de aprendizaje contiene además un modelo red neuronal directo (M).

Page 65: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes II: Control basado en Redes Neuronales. Seminario AADECA-UBA, Buenos Aires.

La señal de error para el algoritmo de entrenamiento, en este caso, es la diferencia entre la señal entrenada ym y la señal entrenada yp. Alternativamente, la señal de error puede ser la diferencia entre r y yp. La estructura entrada salida de la modelación del sistema inverso está dada por:

( ))1nt(u,),1t(u),1t(r),1nt(y,),t(yf)t(u pp1 +−−+−+= − ……

Si no se dispone de yp,

( ))1nt(u,),1t(u),1t(r),1nt(y,),t(yf)t(u mm1 +−−+−+= − ……

Page 66: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes II: Control basado en Redes Neuronales. Seminario AADECA-UBA, Buenos Aires.

ESTRUCTURAS DE CONTROL CON REDES NEURONALES

Existen diversas estructuras de control bien establecidas para sistemas no lineales (Hunt, 1992). Control supervisor o por operador

OperadorHumano

Procesou y

RedNeuronal

Procesou y

En este caso, se diseña un controlador que imite las acciones de control del operador humano.

Page 67: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes II: Control basado en Redes Neuronales. Seminario AADECA-UBA, Buenos Aires.

El controlador corresponde a una red neuronal que es entrenada con la información sensioral recibida por el operador y la salida del proceso. Control inverso directo

G-1 G y

RedNeuronal

Planta y

yd

yd

En este caso, se utiliza un modelo inverso de la planta talque el sistema compuesto resulte la identidad entre la salida del proceso y la salida deseada.

Page 68: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes II: Control basado en Redes Neuronales. Seminario AADECA-UBA, Buenos Aires.

Control por modelo de referencia

Proceso

Algoritmo de Aprendizaje

C

ur

Modelo de Referencia

+

-

yr

yp er

El funcionamiento deseado del sistema en lazo cerrado es especificado a través de un modelo de referencia estable, que se define por el par entrada-salida {r(t),yr(t)}. El sistema de control pretende llevar a la salida de la planta yp(t) a la salida del modelo de referencia yr(t) asintoticamente, es decir:

0 )t(y)t(ylim prt≥εε≤−

∞→ En esta estructura, el error entre yr e yp es usado para entrenar al controlador neuronal.

Page 69: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes II: Control basado en Redes Neuronales. Seminario AADECA-UBA, Buenos Aires.

Control por modelo interno

ProcesoC

ypur

M

ym

ys +

-

e F

+

-

En este caso, los modelos directo e inverso son utilizados directamente como elementos dentro del lazo de retroalimentación. La diferencia entre la salida del sistema yp y la salida del modelo ym es utilizada en la retroalimentación. La retroalimentación es usada por el subsistema controlador que utiliza un controlador relacionado con el inverso del sistema. El subsitema F es usualmente un filtro lineal que introduce robustez al sistema.

Page 70: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

SEMINARIO AADECA-UBA

“Lógica difusa, redes neuronales y control predictivo.

Técnicas modernas de control”

Profesora: Dra. Doris Sáez

APUNTES III: FUNDAMENTOS DE CONTROL PREDICTIVO

Page 71: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

CONTROL PREDICTIVO BASADO EN MODELOS (MBPC “Model Based Predictive Control”)

El control predictivo basado en modelos se presenta actualmente como una atractiva herramienta de control que permite incorporar criterios operacionales a través de la utilización de una función objetivo y restricciones para el cálculo de las acciones de control. Además, estas estrategias de control han alcanzado un nivel muy significativo de aceptabilidad industrial en aplicaciones prácticas de control de procesos. El control predictivo basado en modelos se basa principalmente en los siguientes elementos: - El uso de un modelo matemático del proceso que se utiliza

para predecir la evolución futura de las variables controladas sobre un horizonte de predicción.

- La imposición de una estructura en las variables manipuladas

futuras. - El establecimiento de una trayectoria deseada futura, o

referencia, para las variables controladas. - El cálculo de las variables manipuladas optimizando una cierta

función objetivo o función de costos. - La aplicación del control siguiendo una política de horizonte

móvil.

Page 72: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

ESTRATEGIA DEL MBPC La metodología de los controladores MBPC consiste en los siguientes pasos:

t t+N

u(t+j/t)

y(t+j/t)

t+1 t+j... ...

y(t)

u(t)

1. Las salidas futuras para un horizonte de predicción N son

predichas en cada instante t, usando un modelo del proceso. Estas salidas predichas $ ( / )y t j t+ dependen de los valores conocidos hasta t (entradas y salidas pasadas) y además pueden depender de las señales de control futuras u(t+j/t) que se quieren calcular.

2. Las acciones de control futuras u(t+j/t) son calculadas

optimizando una función objetivo de manera de llevar la salida del proceso lo más cerca posible de una trayectoria de referencia dada. Este criterio, generalmente es una función cuadrática de los errores entre la salida predicha y la trayectoria de referencia deseada, incluyendo en muchos casos el esfuerzo de control.

Page 73: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

3. Sólo se aplica u(t/t) al proceso, debido a que en el instante siguiente t+1 se tienen los valores de todas las variables controladas hasta t+1 y variables manipuladas hasta t.

Page 74: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

ESTRUCTURA BÁSICA DEL CONTROL MBPC La figura muestra la estructura básica de las estrategias de control predictivo basado en modelos. En este caso, se hace uso de un modelo para predecir las salidas futuras del proceso, basándose además en los controles futuros o entradas futuras propuestas. Estas señales son calculadas por un optimizador teniendo en cuenta una función de costo y restricciones del proceso.

Modelo

Entradas pasadasy salidas pasadas

Salidaspredichas

+

Optimizador

Controlesfuturos

Trayectoria de referencia

Erroresfuturos

Funciónde costo

Restricciones

Page 75: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

ELEMENTOS DEL MBPC

Los elementos principales del control predictivo son: - Modelos de predicción - Función objetivo - Obtención de la ley de control MODELOS DE PREDICCIÓN El modelo de predicción debe ser capaz de capturar la dinámica del proceso para poder predecir las salidas futuras, al mismo tiempo que debe ser sencillo de usar y comprender, y además permitir un análisis teórico. Las estrategias de MBPC utilizan diferentes modelos del proceso para representar la relación de las salidas con las entradas medibles (variables manipuladas y perturbaciones medibles). Además, se considera incluir las entradas no medibles, el ruido y los errores de modelación (pereturbaciones). A continuación se presentarán los principales modelos utilizados para las formulaciones del control predictivo.

Page 76: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

Modelo de respuesta al escalón

gNgig2g1

t+2t+1 t+Nt

y(t)

La salida está dada por:

)t(n)it(ug)t(y1i

i +−∆= ∑∞

=

donde gi son los valores muestreadas cuando el proceso es excitado con un escalón. Las perturbaciones se consideran constantes a lo largo del horizonte de predicción e iguales al valor en el instante t, es decir: $ ( / ) $ ( / ) ( ) $( / )n t j t n t t y t y t t+ = = − La predicción está dada por:

)t/jt(n)t/ijt(ug)t/jt(y1i

i ++−+∆=+ ∑∞

=

Entonces, la predicción está dada por

Page 77: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

$ ( / )

( / ) ( ) $ ( / )

y t j t

g u t j i t g u t j i n t j tii

j

ii j

acciones d acciones d

+

= + − + + − + += = +

∑ ∑∆ ∆1 1

e control futuras

econtrol pasadas

1 2444 3444 1 244 344

Reemplazando la predicción de la perturbación en esta ecuación y el modelo para $ ( / )y t t en ella, se tiene:

∑∑∞

=

+==

−∆−+

−+∆+−+∆=+

1ii

1jii

j

1ii

(**) )it(ug)t(y

)ijt(ug)t/ijt(ug)t/jt(y

Entonces, se define la respuesta libre del sistema como los valores conocidos hasta el instante t, es decir:

p g u t j i y t g u t ij ii j

ii

= + − + − −= +

=

∑ ∑∆ ∆( ) ( ) ( )1 1

[ ]p g g u t i y tj j i ii

= − − ++=

∑ ∆ ( ) ( )1

Como g gj i i+ − ≈ 0 para i > N, se tiene:

[ ]p g g u t i y tj j i ii

N

= − − ++=∑ ∆ ( ) ( )

1

Page 78: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

Por lo tanto, la ecuación (**) se puede reescribir como:

$ ( / ) ( / )y t j t g u t j i t pii

j

j+ = + − +=

∑ ∆1

Entonces, las predicciones en el intervalo N1 y N2 están dadas por: $ ( / ) ( / ) ( / )

$ ( / ) ( / ) ( / )

$ ( / ) ( / ) ( / )

y t N t g u t N t g u t t p

y t N t g u t N t g u t t p

y t N t g u t N t g u t t p

N N

N N

N N

+ = + − + + +

+ + = + + + +

+ = + − + + +

+ +

1 1 1

1 1 1 1 1

2 1 2

1

1

1

1 1

1 1

2 2

∆ ∆

∆ ∆

∆ ∆

LL

ML

Matricialmente, y considerando que ∆u t j( )+ − =1 0 para j > Nu, se tiene: $y G u p= +∆ donde

[ ]$ $ ( / ) $( / ) $ ( / )y y t N t y t N t y t N t T= + + + +1 1 21 L

Page 79: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

G

g gg g

g g

N

N

N N Nu

=

+

− +

1

1

2 2

1

1 1

1

0 00 0

0

L L LL L L

M M M M O OM M M M O O M

L L L L L

[ ]∆ ∆ ∆ ∆u u t t u t t u t N tuT= + + −( / ) ( / ) ( / )1 1L

[ ]p p p pN N N= +1 1 21, , ,… Una gran ventaja de este método es que no requiere información previa sobre el proceso, con lo cual el proceso de identificación se simplifica. Además, permite modelar sistemas complejos como fase no mínima y sistemas con retardos. Sin embargo, esta representación sólo es válida para procesos estables. Modelo función de transferencia Este modelo está dado por la siguiente ecuación:

)t(n)t(u)z(B)t(y)z(A 11 += −−

A z a z a z a znana( )− − − −= + + + +1

11

221 L

B z b z b z b znbnb( )− − − −= + + +1

11

22 L

Page 80: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

Para calcular la predicción, se considera un modelo ARIMAX:

∆+−=+−= −−− )t(w

)dt(u)z(B)t(n)dt(u)z(B)t(y)z(A 111

yBA

uwAt t d

t= +− ∆

yBA

uw

At j t d jt j

+ − ++= +∆

donde

{1

AE

FA

zj

Cuociente

j j

sto

∆ ∆= + −

Re123 Ecuación diofántica

( Fj y G j

notación en ARMAX)

La división 1

A∆ se realiza hasta que Ej sea un polinomio de grado

j−1 , de modo que E wj t j+ tenga los valores futuros de wt, es decir, w w wt t t j+ + +1 2, , ,… Además,

A z a z a z∆ = − + − +− − −1 11

11

2 L entonces A∆ es mónico y por ende Ej es mónico. Por lo tanto,

Page 81: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

y

BA

u E wF

Awt j t d j j t j

w w

jt

w wt tt t

+ − + += + ++ +

−( , , )

( , , )1 21

… …123 123∆

(#)

Para la determinación de wt, wt-1, ...., se utiliza el modelo ARIMAX, es decir

Ay Buw

t t dt= +− ∆

w A y B ut t t d= − −∆ ∆ Entonces, reemplazando wt en la ecuación (#), se obtiene:

yBA

u E wF

AA y

FA

B ut j t d j j t jj

tj

t d+ − + + −= + + −∆

∆∆

yBA

u Fy FBA

u E wt j t d j j t j t d j t j+ − + − += + − + ( )1j ≥

Fj es de grado n-1 (n orden del sistema) considerando que Ej tiene grado j-1 por hipótesis. A continuación,

y

BA

u E w Fy FBA

u zt j t d j j t j j t j t d jj

u t d

+ − + + − +−= + + −

1 24 34

[ ]yBA

u Fz E w Fyt j t d j jj

j t j j t+ − +−

+= − + +1

Page 82: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

donde según la ecuación diofántica

Fz E Ajj

j− = −1 ∆

Entonces,

yBA

u E A E w Fyt j t d j j j t j j t+ − + += + +∆

y BE u E w F yt j j t d j j t j j t+ − + += + +∆ Se define G BEj j≅

y G u E w F yt j j t d j j t j j t+ − + += + +∆ Por lo tanto, la predicción a j pasos de “y” está dada por:

[ ]E y t y G u Fyt j t j j t d j j t+ + − +≡ = +/ $ ∆ (*) pues E wj t j+ genera sólo valores futuros de ruido blanco (wt+1, wt+2,

wt+3, ...). Gj representa los j primeros términos de la respuesta escalón, entonces g gji i= para i = 0, 1, 2, ... < j. Es decir,

Page 83: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

g g g g

g g g g

j k

ji ji ki i

0 10 0 0= = = = =

= = = = =

L LM

L L

Por lo tanto, se tiene

G g g z g znn

b

b1 0 1

1= + + +− −L

G g g z g znn

b

b2 0 1

11

1= + + +−+

− +L ( )

G g g z g znn

b

b3 0 1

12

2= + + +−+

− +L ( )

G g g z g zj n jn j

b

b= + + +−+ −

− + −0 1

11

1L ( )

Por otra parte, $y G u F yt j j t d j j t+ − += +∆ y si d = 1, N1 = 1 y N2 = N, se tiene

$$

$

y G u F yy G u F y

y G u F y

t t t

t t t

t N N t N N t

+

+ +

+ − +

= += +

= +

1 1 1

2 2 1 2

1

∆∆

∆M

A continuación, se agrupan los términos conocidos hasta “t” en el vector f { }∆ ∆u u y yt t t t− − −1 2 1, ,..., , , ... , es decir

Page 84: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

[ ][ ]

f G z g u F y

f G z g z g u F y

t t t

t t t

+−

+− −

+

= − +

= − − +

1 11

0 1

2 21

11

0 1 2

( )

( )

M

Entonces, la expresión (*) se puede expresar de manera vectorial como $ ~y Gu f= + donde [ ]$ $ , $ , , $y y y yt t t N≡ + + +2 … son las predicciones desde el horizonte de predicción N1 = 1 hasta N2 = N.

G

gg g

g g gN N N N

=

− − ×

0

1 0

1 2 0

0 00

L LL L

M M O

M ML

[ ]~ , ,..., ,....,u u u u ut t t t NT≡ + + + −∆ ∆ ∆ ∆1 2 1 son las acciones de

control futuras.

Page 85: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

Por lo tanto, Gu~ contiene términos desconocidos por determinar { }∆ ∆ ∆u u ut t t N, ,...,+ + −1 1 y f agrupa los términos conocidos

{ }∆ ∆u u y yt t t t− − −1 2 1, ,..., , ,... Está representación es también válida para procesos inestables.

Page 86: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

FUNCIÓN OBJETIVO Los diferentes algoritmos de control predictivo utilizan diferentes funciones objetivo o de costo para la obtención de la ley de control. En primer lugar se considera la función objetivo dada por:

[ ]J w t y t t= + − +( ) $( / )1 1 2

donde w(t+1) es la referencia o salida deseada en el instante t+1 y $( / )y t t+1 es la salida predicha en el instante t+1.

Nótese que utilizando esta función objetivo y un modelo ARIX, se obtiene un controlador de varianza mínima. Para reducir variaciones en la variable manipulada o sobreactuaciones se puede utilizar la siguiente función objetivo, que además incluye acción integral.

[ ] [ ]J w t y t t u t= + − + +( ) $ ( / ) ( )1 1 2 2λ ∆ A continuación, para incluir algunos sistemas de fase no mínima y sistemas inestables se utiliza la siguiente función objetivo que incluye horizontes de predicción y control mayores:

[ ] [ ]J j w t j y t j t i u t ij N

N

i

Nu

= + − + + + −= =∑ ∑δ λ( ) ( ) $ ( / ) ( ) ( )

2 2

11

2

1∆

Page 87: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

donde δ(j) y λ(j) son coeficientes que ponderan el comportamiento futuro, $( / )y t j t+ es la salida predicha en el instante t+j, w t j( )+ representa la trayectoria de referencia deseada, N1 y N2 son los horizontes mínimo y máximo de predicción, Nu es el horizonte de control OBTENCIÓN DE LA LEY DE CONTROL Para obtener los valores u(t+j/t) es necesario minimizar la función de objetivo planteada anteriormente. Para ello se calculan los valores de las salidas predichas $( / )y t j t+ en función de los valores pasados de las entradas y salidas, y de las señales de control futuras, haciendo uso de un modelo de predicción y luego se sustituyen estos valores en la función objetivo. La minimización de esta expresión conduce a los valores buscados. Además se ha encontrado que una estructuración de la ley de control produce una mejora en la robustez del sistema. Esta estructura de la ley de control se basa en el uso del concepto de horizonte de control (Nu), que consiste en considerar que tras un cierto intervalo Nu < N2 no hay variación en las señales de control propuestas, es decir: ∆u t j( )+ − =1 0 para j > Nu.

Page 88: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

CONTROL POR MATRIZ DINÁMICA (DMC “Dynamic Matrix Control”)

Este algoritmo utiliza el modelo repuesta al escalón para la predicción. Matricialmente, y considerando que ∆u t j( )+ − =1 0 para j > Nu, se tiene que la predicción está dada por: $y G u p= +∆ donde

[ ]$ $ ( / ) $( / ) $ ( / )y y t N t y t N t y t N t T= + + + +1 1 21 L

G

g gg g

g g

N

N

N N Nu

=

+

− +

1

1

2 2

1

1 1

1

0 00 0

0

L L LL L L

M M M M O OM M M M O O M

L L L L L

[ ]∆ ∆ ∆ ∆u u t t u t t u t N tuT= + + −( / ) ( / ) ( / )1 1L

[ ]p p p pN N N= +1 1 21, , ,… Por otra parte, el controlador por matriz dinámica utiliza la función objetivo definida en la ecuación (*) con δ = 1, la cual matricialmente está dada por:

Page 89: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

[ ] [ ]J w y w y u uT T= − − +$ $ λ∆ ∆ Reemplazando en esta ecuación la predicción $y , se tiene

[ ] [ ]J w G u p w G u p u uT T= − − − − +∆ ∆ ∆λ∆ Si se define e w p0 = − , entonces

[ ] [ ]J e G u e G u u uT T= − − +0 0∆ ∆ ∆λ∆ Minimizando esta función objetivo se obtiene:

[ ]∆u G G I G eT T= +−

λ1

0 donde sólo se aplica ∆u(t/t) de acuerdo a la estrategia de control de horizonte móvil definida. Esto es, ∆u t t Ke( / ) = 0

donde K es la primera fila de matriz [ ]G G I GT +−

λ1

.

Page 90: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

CONTROL PREDICTIVO GENERALIZADO

G.P.C. (“Generalized Predictive Control”) Para el diseño de Controladores Predictivos Generalizados G.P.C. se utiliza el siguiente modelo ARIMAX:

A z y B z u nt t d t( ) ( )− −−= +1 1

donde ∆=

−t

1

tw)z(C

n

Predicción óptima

[ ]$ /y E y t G u F yt j t j j t d j j t+ + − += = +∆ (*) con G BEj j= y 1 = + −A E z Fj

jj∆ (Ecuación diofántica)

y si d = 1, N1 = 1 y N2 = N, se tiene

$$

$

y G u F yy G u F y

y G u F y

t t t

t t t

t N N t N N t

+

+ +

+ − +

= += +

= +

1 1 1

2 2 1 2

1

∆∆

∆M

A continuación, se agrupan los términos conocidos hasta “t” en el vector f { }∆ ∆u u y yt t t t− − −1 2 1, ,..., , , ... , es decir

Page 91: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

[ ][ ]

f G z g u F y

f G z g z g u F y

t t t

t t t

+−

+− −

+

= − +

= − − +

1 11

0 1

2 21

11

0 1 2

( )

( )

M

Entonces, la expresión (*) se puede expresar de manera vectorial como $ ~y Gu f= + donde [ ]$ $ , $ , , $y y y yt t t N≡ + + +2 … son las predicciones desde el horizonte

de predicción N1 = 1 hasta N2 = N.

G

gg g

g g gN N N N

=

− − ×

0

1 0

1 2 0

0 00

L LL L

M M O

M ML

[ ]~ , ,..., ,....,u u u u ut t t t NT≡ + + + −∆ ∆ ∆ ∆1 2 1 son las acciones de

control futuras. Por lo tanto, Gu~ contiene términos desconocidos por determinar { }∆ ∆ ∆u u ut t t N, ,...,+ + −1 1 y f agrupa los términos conocidos

{ }∆ ∆u u y yt t t t− − −1 2 1, ,..., , ,...

Page 92: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

Para el cálculo de las acciones de control futuras, el algoritmo de Control Predictivo Generalizado G.P.C. minimiza la siguiente función de costos:

[ ] [ ]J r ut j t j ii

N

t ij N

N u

= − ++ +=

+ −=

∑∑ $y 2

11

2

1

2

λ ∆ (**)

En general, N1 = d (N1 = 1, por defecto) N2 = 10 o N2 es del orden del tiempo de estabilización (Ts)

del sistema. Nu = 1 hasta el orden de la planta. Además, la función de costo definida anteriormente (ecuación (**)) se puede expresar en forma más compacta por

J y r y r u uT T= − − +( $ ) ( $ ) ~ ~λ donde $ ~y Gu f= +

[ ]r r r rt t t NT= + + +1 2, ,..., (con N1 = 1, N2 = N)

Page 93: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

G

gg g

g g g

g g g

N N

N N N N N N

u u

uu

=

− −

− − − ×

0

1 0

1 2 0

1 2

0 00

LL

M M OL

M M ML

pues ∆u t j+ = 0 para j ≥ Nu.

Entonces,

J Gu f r Gu f r u uT T= + − + − +( ~ ) ( ~ ) ~ ~λ Para la minimización de esta función de costos, se tiene

∂∂

Ju~

= 0

Entonces, ( ~ ) ~Gu f r G uT T+ − + =λ 0 G Gu f r uT ( ~ ) ~+ − + =λ 0

G Gu u G r fT T~ ~ ( )+ = −λ Por lo tanto, las acciones de control óptimas están dadas por:

Page 94: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

~ ( ) ( )u G G I G r fT T= + −−λ 1 De este modo, se tiene

∆∆

uu

u

HH

r f

t

t

t N

T

T

u

+

+ −

=

−1

1

1

2

M ( )

Sin embargo, sólo se utiliza ∆ut, dado que en el siguiente instante se desplazan los horizontes de predicción y control, siendo posible calcular una nueva acción de control para ese instante. La acción de control en “t” está dada por:

∆u H r ftT= −1 ( )

con H T

1 la primera fila de( )G G I GT T+ −λ 1 ∆u u ut t t= − −1 Entonces,

u u H r ft tT= + −−1 1 ( )

Page 95: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

RESUMEN CONTROL PREDICTIVO GENERALIZADO (G.P.C.)

Modelo ARIMAX

A z y B z uw

t t dt( ) ( )− −

−= +1 1

Predicción óptima

[ ]$ /y E y t G u F yt j t j j t d j j t+ + − += = +∆ con G BEj j= y 1 = + −A E z Fj

jj∆ (Ecuación diofántica)

Función de costo

[ ] [ ]J r ut j t j ii

N

t ij N

N u

= − ++ +=

+ −=

∑∑ $y 2

11

2

1

2

λ ∆

con ∆u t j+ = 0 para j ≥ Nu.

Acción de control óptima

u u H r ft tT= + −−1 1 ( )

con H T

1 la primera fila de ( )G G I GT T+ −λ 1

Gu~ términos desconocidos { }∆ ∆ ∆u u ut t t N u, ,...,+ + −1 1

f términos conocidos { }∆ ∆u u y yt t t t− − −1 2 1, , ... , , ,...

Page 96: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

EJEMPLO DE GPC MULTIVARIABLE

Columna de destilación Variable manipuladas: Tasa de tiro superior (top draw rate) u1 Tasa de tiro lateral (side draw rate) u2 Reflujo inferior (bottom reflux duty) u3 Variables controladas: Composición producto superior (top

product composition) y1 Compision de producto lateral

(side product composition) y2 Temperatura inferior (Bottom

temperature) y3

Page 97: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

La dinámica de la planta está descrita por:

Page 98: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

Los retardos van desde 0 a 28 min. El modelo discreto con Ts = 4 min, está dado por:

La matriz A(z-1) es una matriz diagonal con los siguientes elementos:

Page 99: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

El mínimo retardo de las variables de salida es 27, 14 y 0 min. Entonces, los mínimos retardos son 6, 3 y 0 (con Ts = 4 min). Ny = 30 y Nu = 5 para todas las variables.

=

100010001

Q

=

200020002

R

Set points o referencias = 0.5, 0.3 y 0.1 respectivamente. Prueba realizada: Cambio de set-point de la composición superior de 0.5 a 0.4

Page 100: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

Como se observa todas las variables llegan rápidamente al set-point, sólo la temperatura inferior tiene un overshoot apreciable. El reflujo superior (upper reflux) es considerado como una perturbación no medible. Una perturbación de 0.5 es introducida en el reflujo superior, manteniendo todas las referencias en cero.

Page 101: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

Como se puede observar la perturbación es rápidamente cancelada.

Page 102: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

CONTROL PREDICTIVO CON RESTRICCIONES En la práctica, se requiere mantener las variables del proceso en rangos que aseguren el buen comportamiento de los equipos y evitar situaciones críticas. Por ejemplo, los actuadores tienen restricciones de límite y velocidad. Además, los puntos de operación del proceso están determinados por objetivos económicos, que usualmente llevan al proceso a operar cerca de las restricciones. Los sistemas de control, en especial, los sistemas de control predictivo se anticipan a estas restricciones y corregir las acciones de control. TIPOS DE RESTRICCIONES Restricciones de rango en las variables manipuladas

máxmin u)1it(uu ≤−+≤ i = 1, …, Nu. En general, se pueden saturar las variables manipuladas pero la solución obtenida no es óptima con respecto a la función objetivo predictiva. Ejemplo: Control predictivo Nu = 2

máxu)t(u <

máxu)1t(u <+

Page 103: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

GPCsin restricciones

u(t)

u(t+1)

umax

umaxu*

u* sin restr.

En forma matricial, la restricción de rango en las variables manipuladas está dada por:

max

u

min u

1

11

)1Nt(u

)1t(u)t(u

1

11

u

++

+≤

MMM

maxmin uuu 11 ≤≤

o bien en función de )t(u∆

Page 104: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

[ ] [ ])1t(uu

1

11

111

11001

1

11

)1t(uu maxmin −−

−− ML

OMM

[ ] [ ])1t(uuuT)1t(uu maxmin −−≤∆≤−− 11

con [ ]Tu )1Nt(u,),1t(u),t(uu ++∆+∆∆=∆ …

Restricciones de variación de las variables manipuladas Los actuadores generalmente no responden con una rapidez adecuada, por lo cual es usual que se establezcan restricciones sobre las variaciones de las variables manipuladas.

máxmin u)1it(uu ∆≤−+≤∆ con i = 1,…,Nu.

con máxmin u,u ∆∆ límites mínimo y máximo para las variaciones de las acciones de control. Matricialmente, se tiene

Page 105: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

máxmin u

1

11

u

1000

10001

1

11

u ∆

≤∆

∆ ML

OMM

L

M

máxmin uuu ∆≤∆≤∆ 1I1 Restricciones de rango en las variables controladas En muchos procesos productivos, por problemas de seguridad o costos, se debe limitar las variables controladas a rangos de operación establecidos.

máxmin y)jt(yy ≤+≤ j = 1, …, Ny.

Utilizando el predictor del GPC, se tiene: fuGy +∆=

con [ ]Tu )1Nt(u,),1t(u),t(uu ++∆+∆∆=∆ …

[ ]Ty)N,y(t),1(tyy ++= … f agrupa los términos conocidos hasta t. Matricialmente, las restricciones de rango están dadas por:

máxmin yfuGy 11 ≤+∆≤

Page 106: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

fyuGf-y máxmin −≤∆≤ 11 Restricciones de variación en las variables controladas

máxmin y)jt(yy ∆≤+∆≤∆ j = 1, …, Ny. Matricialmente, expresando estas restricciones en función de ∆u, se tiene:

−+−+

−+

=

+∆

+∆

=∆

)1Nt(y)Nt(y

)t(y)1t(y

)Nt(y

)1t(y

y

yyy

MM

)t(y

0

01

)Nt(y

)1t(y

10011

1

y

y

+∆

+∆

=∆ MM

OMO

)t(y

)Nt(y

)1t(y

y

y

01D −

+∆

+∆

=∆M

fuGy +∆=

Page 107: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

)t(yfuGy 01DD −+∆=∆

Entonces,

)t(yfyuGy(t)fy máxmin 00 1D-D1D +∆≤∆≤+−∆ ( )buA ≤∆ Restricciones para asegurar el comportamiento monotónico Algunos sistemas de control presentan oscilaciones en las variables controladas antes de alcanzar una condición de régimen. En general, estas oscilaciones no son deseables, pues entre otras razones pueden dar origen a perturbaciones sobre otros procesos. Para evitar el comportamiento monotónico y en caso que y(t) ≠ w(t), se tiene: )1jt(y)jt(y −+≤+ si y(t) < w(t) )1jt(y)jt(y −+≥+ si y(t) > w(t) Matricialmente, se tiene:

+∆

≤+∆

'f)t(y

u'G

0fuG si y(t) < w(t)

Page 108: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

+∆

≥+∆

'f)t(y

u'G

0fuG si y(t) > w(t)

con G’ se compone de las primeras N-1 filas de G y f’ se compone de las primeras N-1 componentes de f. Restricciones para evitar comportamiento de fase no mínima Existen procesos que presentan un comportamiento de fase no minima, es decir, cuando son excitados responden inicialmente en sentido inverso a como lo hacen finalmente. Para evitar este comportamiento, que en ciertos procesos es muy perjudicial, se incorporan las siguientes restricciones cuando y(t)≠w(t). )t(y)jt(y ≤+ si y(t) > w(t) )t(y)jt(y ≥+ si y(t) < w(t) Matricialmente, )t(yfuG 1≤+∆ si y(t) > w(t) )t(yfuG 1≥+∆ si y(t) < w(t)

Page 109: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

CONDICIONES: CONTROL PREDICTIVO CON RESTRICCIONES

1.- Si no existen restricciones o si éstas no se consideran, la

minimización de la función objetivo genera una solución analítica.

2.- Si se consideran restricciones, la solución, en general, se

obtiene utilizando un algoritmo numérico de optimización con restricciones. Para esta clase de problemas, en que la función objetivo es cuadrática, se cumple:

• Para que exista solución al problema sin restricciones, la

función objetivo debe ser convexa. • Para que exista solución al problema de optimización con

restricciones, debe haber al menos un valor para el cual las variables de optimización cumplan todas las restricciones impuestas.

• Para asegurar la existencia de una solución única, el espacio de restricciones debe ser convexo

Cuando se incorporan restricciones lineales, el problema de optimización para el GPC queda definido por:

uur)-fu(Gr)-fu(GJ Min TT ∆∆λ++∆+∆= s.a buA ≤∆ con A, b determinados de acuerdo al tipo de restricción.

Page 110: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

EJEMPLOS DE RESTRICIONES EN CONTROL PREDICTIVO

Restricciones en las variables manipuladas Modelo multivariable

∆+= −− e

u)z(By)z(A 11

=

)t(y)t(y

y2

1

=

)t(u)t(u

u2

1

+−+−

=−−

−−−

21

211

z8737.0z8695.110

0z8669.0z8629.11)z(A

−−−−

=−−

−−−

11

111

z1361.01445.0z054.00582.0z4559.04758.0z038.00420.0

)z(B

2.0u ≤∆

3.0u3.0 1 ≤≤− 2.0u3.0 2 ≤≤−

Page 111: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

Restricciones de comportamiento de fase no mínima Modelo lineal

s1s1

)s(G+−=

con Ts = 0.3 seg.

1

11

z7408.01z2592.11

)z(G −

−−

++−

=

Page 112: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA, Buenos Aires.

GPC sin restricciones Ny = 30, Nu = 10, λ = 0.1 GPC con restricción de fase no mínima El sistema obtenido es más lento pero los peaks son eliminados.

Page 113: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes IV: Control Predictivo No Lineal. Seminario AADECA-UBA, Buenos Aires.

SEMINARIO AADECA-UBA

“Lógica difusa, redes neuronales y control predictivo.

Técnicas modernas de control”

Profesora: Dra. Doris Sáez

APUNTES III: CONTROL PREDICTIVO NO LINEAL

Page 114: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes IV: Control Predictivo No Lineal. Seminario AADECA-UBA, Buenos Aires.

CONTROL PREDICTIVO NO LINEAL

Debido a que los procesos reales son no lineales o presentan diferentes condiciones de operación han surgido diversas estrategias de control para resolver este tema. En particular se presentarán, a continuación, estrategias de control predictivo no lineal.

CONTROL PREDICTIVO “GAIN SCHEDULED” (Chow, 1995)

Modelo no lineal: Modelo interpolado para describir el comportamiento no lineal del proceso (Modelo discreto variante en el tiempo).

( ) ( ) )1t(uz),t(vB)t(yz),t(vA 11 −= −−

con v(t) es una variable “scheduling” de la cual dependen los parámetros de los polinomios A y B. A continuación, se presentan los pasos de la estrategia de control. 1.- Identificación de una familia de modelos lineales

( ) ( ) )1t(uzB)t(yzA 1i

1i −= −−

2.- Derivación de una ley de control GPC para cada modelo

lineal válido para un punto de operación.

( ) ( )fwGIGG)t(u TTi −λ+=∆

3.- La ley de control global “Gain-sheduling” es obtenida

interpolando los parámetros del controlador entre los puntos

Page 115: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes IV: Control Predictivo No Lineal. Seminario AADECA-UBA, Buenos Aires.

de operación. Generalmente, los puntos de operación dependen de una variable del proceso v(t).

4.- Para la interpolación se puede utilizar la interpolación de

ganancias y ceros del proceso, obteniendo transiciones suaves en la respuesta del sistema.

Por ejemplo, la ganancia interpolada K está dada por:

( ) ( ) ( ) ( )( ))t(v)t(v)t(v)t(v

)t(vK)t(vK)t(vK)t(vK12

1111 −

−−+=

con v(t) es la variable que determina el punto de operación y vi(t) son los puntos de operación.

CONTROL PREDICTIVO

CON TRANSFORMACIÓN NO LINEAL (Bosley, 1993) 1.- Modelo no lineal

)u,x(gx =& 2.- Transformación en variables de estado para convertir el

sistema no lineal en un sistema lineal. 3.- Derivación de un controlador lineal (controlador predictivo)

para el sistema lineal 4.- Transformación inversa para determinar la acción de control Desventaja: Este método es sólo aplicable a ciertos sistemas no lineales donde es posible encontrar las respectivas transformaciones.

Page 116: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes IV: Control Predictivo No Lineal. Seminario AADECA-UBA, Buenos Aires.

CONTROL DMC LINEAL PONDERADO (Di Marco, 1997) 1.- Modelo no lineal: Suma ponderada de modelos lineales para

representar las diferentes zonas de operación.

∑=

=n

1iii )t(yw)t(y

donde n es el número de zonas de operación y yi(t) son los modelos lineales para cada zona de operación. Las ponderaciones wi son calculadas en función de la distancia di entre un punto de operación genérico (actual) y(t) y un punto de operación yi (t):

∑=

= n

1j

1j

1i

i

d

dw

con )t(y)t(yd ii −= y ∑=

=n

1ii 1w

2.- Derivación de un modelo lineal en cada instante de muestreo. 3.- Derivación de una acción de control DMC para cada instante

de muestreo.

CONTROL DMC NO LINEAL (Di Marco, 1997) 1.- Modelo no lineal: Modelo fenomelógico 2.- Derivación de un modelo lineal por linealización en cada

instante de muestreo. 3.- Derivación de un DMC en cada instante de muestreo.

Page 117: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes IV: Control Predictivo No Lineal. Seminario AADECA-UBA, Buenos Aires.

CONTROL PREDICTIVO BASADO EN MODELOS DIFUSOS

Los modelos difusos sirven para representar las no linealidades del proceso. A continuación, se presentan las diversas estrategias de control predictivo difuso. Cipriano & Ramos (1995) GPC basado en modelos difusos de Takagi & Sugeno. Modelo difuso de Takagi & Sugeno

ii

nui1

iny

i1i

ii

iii

c)nut(ub)1t(ub

)nyt(ya)1t(ya=(t)y entonces

Bnu es nu)-u(ty y B1 es 1)-u(t y Any es ny)-y(ty y Al es 1)-y(t Si :R

+−++−+

−++−

……

……

=

== M

1ii

M

1iii

w

yw)t(y

Controlador difuso Para cada regla se deriva un controlador GPC lineal. De esta manera, el controlador difuso incluye las mismas premisas que el modelo difuso y las consecuencias están dadas por las acciones de control resultantes (GPC lineales)

Page 118: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes IV: Control Predictivo No Lineal. Seminario AADECA-UBA, Buenos Aires.

( )……

……

),1t(y),t(y,),1t(uf=(t)u entonces

Bnu es nu)-u(ty y B1 es 1)-u(t y Any es ny)-y(ty y Al es 1)-y(t Si :R

ii

ii

iii

−−∆∆

con fi es un controlador GPC lineal para la regla i. Entonces, la acción de control GPC difusa está dada por:

=

=

∆=∆ M

1ii

M

1iii

w

)t(uw)t(u

Desventajas Consecuencia del modelo difuso regla Ri:

iinu

i1

iny

i1i

c)nut(ub)1t(ub

)nyt(ya)1t(ya=(t)y

+−++−+

−++−

……

Para cada regla se minimiza la siguiente función objetivo:

[ ] [ ]∑∑==

−+∆λ++−+=u2

1

N

1j

2N

Nj

2ii )1jt(u)j()t/jt(y)jt(wJ

donde )t/jt(yi + es la predicción a j pasos con el modelo lineal de la regla i. Se debiese minimizar la siguiente función objetivo:

Page 119: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes IV: Control Predictivo No Lineal. Seminario AADECA-UBA, Buenos Aires.

[ ] [ ]∑∑==

−+∆λ++−+=u2

1

N

1j

2N

Nj

2 )1jt(u)j()t/jt(y)jt(wJ

donde )t/jt(y + es la predicción a j pasos con el modelo difuso completo.

y

ut t+j Sin embargo, la solución del GPC difuso (Cipriano & Ramos, 1995) es una buena aproximación y es de fácil y rápida implementación. Roubos (1998) Controlador predictivo basado en la linealización del modelo difuso de Takagi & Sugeno Modelo difuso de Takagi & Sugeno

iiii

ini1i

C)t(uB)t(xA1)+(tx entonces

An es (t)y x y Al es (t) xSi :R

++=

Page 120: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes IV: Control Predictivo No Lineal. Seminario AADECA-UBA, Buenos Aires.

∑=

+=+M

1i

ii )1t(xw)1t(x

con wi es el grado de activación normalizado.

1.- Modelo lineal variante en el tiempo equivalente )t(C)t(u)t(B)t(x)t(A1)+(tx ++=

con ∑=

=n

1i

ii A)t(w)t(A

∑=

=n

1i

ii B)t(w)t(B

∑=

=n

1i

ii C)t(w)t(C

2.- En cada instante o período de muestreo, se deriva un modelo

lineal, evaluando las premisas del modelo difuso o grados de activación.

3.- Para cada modelo lineal resultante se diseña un controlador

predictivo lineal. 4.- En el siguiente instante, se actualiza el modelo lineal Ventajas: Fácil y rápida implementación. Desventajas: Solución sub-óptima

Page 121: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes IV: Control Predictivo No Lineal. Seminario AADECA-UBA, Buenos Aires.

Cipriano & Sáez (1996) Modelo difuso de Takagi & Sugeno

∆+−−− )t(e

)1t(u)z(B=(t)y)z(A entonces

Bnu es nu)-u(ty y B1 es 1)-u(t

y Any es ny)-y(ty y Al es 1)-y(t Si :R

i1ii

1i

ii

iii

……

Predictor difuso Se deriva la predicción lineal para cada modelo lineal de cada regla:

iii

ii

iii

fuGy entonces

Bnu es nu)-u(ty y B1 es 1)-u(t y Any es ny)-y(ty y Al es 1)-y(t Si :R

+∆=

……

donde iy es el vector de predicciones

[ ]T2i1ii )Nt(y,),Nt(yy ++= …

Entonces, la predicción global está dada por:

[ ]

=

=

=

=

+∆== M

1ii

M

1iiii

M

1ii

M

1iii

)t(w

fuG)t(w

)t(w

y)t(wy

con wi(t) es el grado de activación y M es el número de reglas.

Page 122: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes IV: Control Predictivo No Lineal. Seminario AADECA-UBA, Buenos Aires.

Controlador difuso

( ) ( ) uuywywJ TT ∆∆λ+−−= con w es el vector de referencias futuras, y es el vector de predicciones y ∆u es el vector de acciones de control futuras. Sustituyendo el predictor difuso en la función objetivo se tiene:

[ ] [ ]

uu

)t(w

fuG)t(ww

)t(w

fuG)t(wwJ

T

M

1ii

M

1iiii

T

M

1ii

M

1iiii

∆∆λ+

+∆−

+∆−=

=

=

=

=

J Min

u∆

( )fwG)IGG(u T1T −λ+=∆ −

con

=

== M

1ii

M

1iii

)t(w

G)t(wG

=

== M

1ii

M

1iii

)t(w

f)t(wf

Ventajas: Rápida y fácil implementación Desventajas: Sólo es una mejor aproximación del óptimo global.

Page 123: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes IV: Control Predictivo No Lineal. Seminario AADECA-UBA, Buenos Aires.

Espinosa (1999) Modelo difuso de Takagi & Sugeno

∆+−−− )t(e

)1t(u)z(B=(t)y)z(A entonces

Bnu es nu)-u(ty y B1 es 1)-u(t

y Any es ny)-y(ty y Al es 1)-y(t Si :R

i1ii

1i

ii

iii

……

Predictor difuso

)jt(y)jt(y)jt(y forzadolibre +++=+

donde )jt(y libre + depende de las entradas y salidas pasadas

)jt(y forzado + depende de las acciones de control futuras En este caso, se tiene:

)jt(yuG)jt(y libre ++∆=+

donde ∑−

=

−−+∆=∆=+1j

1iforzado )1ijt(uuG)jt(y

y )jt(y libre + es calculado por la simulación del modelo difuso considerando las acciones de control futuras constantes e iguales a u(t-1). Luego, la acción de control está dada por:

( )libreT1T ywG)IGG(u −λ+=∆ −

Page 124: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes IV: Control Predictivo No Lineal. Seminario AADECA-UBA, Buenos Aires.

donde

))nujt(u,),1jt(u

),nyjt(y,),1jt(y(f)jt(y libre

−+−+

−+−+=+

……

Babuska (1999), Espinosa & Vandewalle (1998, 1999) y Hadjli & Wertz (1999) Linealización multipaso El modelo difuso es primero linealizado en el instante actual t. Entonces, la acción de control actual u(t+j) sirve para predecir

)jt(y + y el modelo no lineal es de nuevo linealizado entorno al futuro punto de operación. Este procedimiento se repite hasta t+N2 Modelo difuso

iinu

i1

iny

i1i

ii

iii

c)nut(ub)1t(ub

)nyt(ya)1t(ya=(t)y entonces

Bnu es nu)-u(ty y B1 es 1)-u(t y Any es ny)-y(ty y Al es 1)-y(t Si :R

+−++−+

−++−

……

……

)t(c)t(ub)t(ya=(t)ynb

1

ny

1

+−+− ∑∑== l

ll

l ll

con ∑=

M

1i

ii a)t(w=(t)a ll

∑=

M

1i

ii b)t(w=(t)b ll

Page 125: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes IV: Control Predictivo No Lineal. Seminario AADECA-UBA, Buenos Aires.

∑=

M

1i

ii c)t(w=(t)cl

Predictor difuso multipaso

)jt(c)jt(u)jt(b

)jt(y)jt(a=j)(ty

nb

1

ny

1

++−+++

−+++

=

=

ll

ll

l

l

con ∑=

++M

1i

ii a)jt(w=j)(ta ll

∑=

++M

1i

ii bj)(tw=j)(tb ll

∑=

++M

1i

ii cj)(tw=j)(tcl

0))nujt(u),1jt(u ),nyjt(y,),1jt(y(f)jt(w i

=−+−+−+−+=+

……

En este caso, el predictor difuso utiliza la predicción )1t(y + para obtener )2t(y + y este procedimiento se repite hasta t+N2. Solución de controlador difuso Método del Lagrangiano y condiciones de Kuhn-Tucker (Solución numérica)

Ventajas: Mejor aproximación del modelo no lineal, especialmente útil para horizontes de predicción largos. Desventajas: Mayor esfuerzo computacional.

Page 126: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes IV: Control Predictivo No Lineal. Seminario AADECA-UBA, Buenos Aires.

CONTROL PREDICTIVO BASADO EN REDES NEURONALES

En general, los controladores predictivos basado en redes neuronales presentan el siguiente esquema básico:

Proceso

Predictor

yur

M

y

Optimizador

En este esquema, la obtención de la ley de control con redes neuronales puede considerar: 1.- Determinar el modelo del sistema con una red neuronal. El

modelo es usado para predecir las salidas futuras de la planta. Esto permite tratar con procesos no lineales.

2.- Entrenar una red neuronal para que realice la misma tarea que

un controlador predictivo. El entrenamiento se realiza por simulación fuera de linea. De este modo, se obtiene un controlador más rápido.

3.- Entrenar una red neuronal de forma que optimice un criterio.

El modelo es evaluado tan solo en la fase de entrenamiento del controlador.

Page 127: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes IV: Control Predictivo No Lineal. Seminario AADECA-UBA, Buenos Aires.

A continuación, se presentan algunas estrategias de control predictivo basado en redes neuronales Hunt (1992)

ProcesoC

ypur

MOptimizador

u’

MR

yr

AA

ym

En este caso, una red neuronal predice las respuestas futuras de la planta sobre un horizonte de tiempo. Las predicciones alimentan al optimizador de manera de optimizar el siguiente criterio:

[ ] [ ]∑∑==

−+∆λ++−+δ=u2

1

N

1i

2N

Nj

2

mr )1it('u)i()t/jt(y)jt(y)j(J

Una alternativa es entrenar una red neuronal C de manera de imitar la acción de control u’.

Page 128: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes IV: Control Predictivo No Lineal. Seminario AADECA-UBA, Buenos Aires.

Arahal (1997) GPC basado en respuesta libre (red neuronal) y respuesta forzada.

ModeloNeuronal

ModeloLineal

OptimizadorProceso

∆uResp.libre

Resp.forzada

e

yu

yl

+

-

r

Se propone dividir la respuesta del sistema en libre y forzada. La respuesta forzada es debido a la señal de control, el resto se considera respuesta libre. Para predecir la respuesta forzada se usará un modelo lineal. Lpredicción de la respuesta libre se hará en base a un modelo neuronal, válido para todo rango de operación. El proceso de optimización puede resolverse analíticamente puesto que el modelo dependiente de la señal de mando es lineal. A fin de obtener mejores resultados, el modelo usado para calcular la respuesta forzada se cambia con el punto de operación.

Page 129: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes IV: Control Predictivo No Lineal. Seminario AADECA-UBA, Buenos Aires.

Draeger (1995) DMC basado en redes neuronales Se considera un modelo lineal respuesta al escalón

dfuGy ++∆=

con G es la matriz con coeficientes de la respuesta al escalon, f es agrupa los términos conocidos hasta t (respuesta libre) y d es un vector de perturbaciones. El vector de perturbaciones será tal que una parte representará la no linealidad del proceso y la otra parte considera las influencias desconocidas.

*ddd nl +=

con myy*d −= Entonces, la acción de control está dada por:

)dfr(G)IGG(u T1T −−λ+=∆ −

Page 130: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes IV: Control Predictivo No Lineal. Seminario AADECA-UBA, Buenos Aires.

DMC Proceso

Modelolineal

Modelono lineal

Modelono lineal

Modelono lineal

y

ym

-d*

-

-fr

-dnl

-

Page 131: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Doris Sáez (Marzo, 2002). Apuntes IV: Control Predictivo No Lineal. Seminario AADECA-UBA, Buenos Aires.

Referencias Arahal, M., Berenguel, M., Camacho, E. (1997). Nonlinear neural model-based predictive control of a solar plant. European Control Conference, July 1-4, Brussels, Belgium, TH-E I2, paper 264. Babuska, R., Sousa, J., Verbruggen, H. (1999). Predictive control of nonlinear systems based on fuzzy and neural models. Proceedings of the European Control Conference, ECC’99, August 31- September 3, Karlsruhe, Germany, pp. 667. Babuska, R. (1998). Fuzzy modeling for control. International series in intelligent technologies, Kluwer Academic Publishers, Massachusetts, United States of America. Bosley, J., Edgar, T., Patwardhan, A., Wright, G. (1993). Model - based control: a survey. AIChE Journal of Process Systems Engineering, Vol. 39, Nº 2, pp. 138-147. Chow, C., Kuznetsov, A., Clarke, D. (1995). Using multiple models in predictive control. Proceedings of the 3rd European Control Conference, September 5-8, Rome, Italy, pp. 1732-1737. Cipriano, A., Ramos, M. (1995). A fuzzy model based predictive controller and its application to a mineral flotation plant. Journal A: Benelux Quarterly Journal on Automatic Control, Vol. 36, Nº 2, pp. 29-36. Cipriano, D. Sáez. (1996). Fuzzy generalized predictive control and its application to an inverted pendulum. Proceedings of the 22nd Annual International Conference on Industrial Electronics, Control and Instrumentation, IECON'96, Taipei, Taiwan, August 5-10, pp. 1966-1971. Di Marco, R., Semino, D., Brambilla, A. (1997). From linear to nonlinear model predictive control: comparison of different algorithms. Industrial Engineering Chemistry Research, Vol. 36, pp. 1708-1716. Draeger, A., Ranke, H., Engell, S. (1994). Neural network based model predictive control of a continuos neutralization reactor. Proceedings of the third IEEE Conference on Control Applications, August 24-26, Glasgow, Great Britain, pp. 427-432. Espinosa, J., Vandewalle, J. (1999). Predictive control using fuzzy models. In: Roy R., Furuhashi, T., Pravir K. (eds.) Advances in Soft Computing Engineering Design and Manufacturing, Springer-Verlag, pp. 187-200. Espinosa, J., Hadjili, M., Wertz, V., Vandewalle, J. (1999a). Predictive control using fuzzy models – comparative study. Proceedings of the European Control Conference, ECC’99, August 31- September 3, Karlsruhe, Germany, pp. 273. Espinosa, J., Vandewalle, J. (1998). Predictive control using fuzzy models applied to a steam generating unit. Proceedings of the 3rd International FLINS Workshop on Fuzzy Logic and Intelligent Technologies for Nuclear Science Industrie, September 14-16, Antwerp, Belgium, pp. 151-160. Hadjili, M., Wertz, V. (1999). Generalized predictive control using Takagi-Sugeno fuzzy models. Proceedings of the 1999 IEEE International Symposium on Intelligent Control, Intelligent Systems & Semiotics, ISIC’99, September 15-17, Cambridge, United States of America, pp. 405-410. Hunt, K., Sbarbaro, D. Zbikowski, R. Gawthrop, P. (1992). Neural networks for control systems: a survey. Automatica, Vol. 28, pp. 1083-1112. Roubos, J., Babuska, R., Bruijn, P., Verbruggen, H. (1998). Predictive control by local linearization of a Takagi-Sugeno fuzzy model. Proceedings of IEEE International Conference on Fuzzy Systems, May 4-9, Anchorage, Alaska, United States of America, pp. 37-42. Van der Veen, P., Babuska, R., Verbruggen, H. (1999). Comparison of nonlinear predictive control methods for a waste-water treatment benchmark. Proceedings of the European Control Conference, ECC’99, August 31- September 3, Karlsruhe, Germany, pp. 268 (5 pages).

Page 132: Seminário - Lógica Difusa, Redes Neuronales y Control Predictivo. Técnicas Modernas de Control - Sáez - Universidad de Buenos Aires

Referencia Seminario Allgöwer, F., Zheng, A., "Nonlinear Predictive Control", Birkäuser Verlag, 2000. Babuska, R., "Fuzzy Modelling for Control", KAP, 1998. Bitmead, R., Gevers, M., Wertz, V., "Adaptive Optimal Control". The Thinking Man's GPC, Prentice Hall, 1990. Camacho, E., Bordons, C. "Model Predictive Control", Springer-Verlag, 1998. Cichocki, A. Unbehauen, R., "Neural networks for Optimization and Signal Processing", John Wiley & Sons, 1993. Clarke, D. "Advances in Model Based Predictive Control". Oxford University Press, 1994. Driankov, D., Hellendoorn, H., Reinfrank, M., "An Introduction to Fuzzy Control" Springer-Verlag, 1996. Harris, C., Moore, C., Brown, M. "Intelligent Control Aspects of Fuzzy Logic and Neural Nets", World Scientific, 1993. Martín Sánchez, J., Rodellar, J., "Adaptive Predictive Control: From the Concepts to Plant Optimization", Prentice Hall, 1996. Reznik, L. "Fuzzy Controllers", Newnes, 1997. Palm, R., Driankov, D., Hellendoorn, H. "Model Based Fuzzy Control", Springer-Verlag, 1996. Sáez, D., Cipriano, A., Ordys, A. "Optimization of industrial processes at supervisory level: Application to control of thermal power plants". Springer-Verlag, 2002. http://www.amazon.com/exec/obidos/ASIN/1852333863/qid%3D1015435578/ref%3Dsr%5F11%5F0%5F1/103-2288317-9507007 Yager, R., Filev, D. "Essentials of Fuzzy Modeling and Control", John Wiley & Sons, 1994. Pag. Web de interés. Redes Neuronales http://www.doc.ic.ac.uk/~nd/surprise_96/journal/vol4/cs11/report.html http://hem.hj.se/~de96klda/NeuralNetworks.htm http://www.gc.ssr.upm.es/inves/neural/ann2/anntutorial.html