5 Estrategias de Control

5. Estartegias Basicas de Control

Dr. Martn Velasco Villa

Seccion de Mecatronica

Abril de 2015

Control Proporcional Derivativo (PD) y control PD aumentado(PD+)

I Una ley de control Proporcional-Derivativo PD puede obtenerse en el caso de unmanipulador al linealizar su dinamica alrededor de un punto de equilibrio y deesta forma, mediante el uso de la teora de control para sistemas lineales, obteneruna retroalimentacion PD que resuelva el problema de regulacion o seguimientode trayectorias.

I En este caso es facil probar la estabilidad local del sistema al analizar la ubicacionde los polos de lazo cerrado resultante.

I En el caso no lineal, como resulta el modelo de un manipulador, el analisis deestabilidad en lazo cerrado puede llevarse a cabo considerando un enfoque basadoen tecnicas de Lyapunov.

Control PD

Considere un manipulador en el cual los terminos de amortiguamiento y de gravedadson nulos, esto es,

M (q) q + C (q, q) q = u. (1)

En su forma mas simple, una ley de control PD esta dada por

u = kv q kp q (2)donde q = q qd con qd representando una posicion deseada de las coordenadasgeneralizadas.

I La retroalimentacion (2) no contiene un termino integral clasico (PID) ya queesto puede complicar la determinacion de la estabilidad del sistema.

El problema de regulacion para el manipulador (1) se resuelve a partir del siguienteresultado en el cual se prueba que la posicion de las coordenadas generalizadas q(t)converge a su posicion deseada qd (t).

Teorema 1Si qd = 0 y Kv , Kp > 0 (Matrices definidas positivas) entonces el sistema en lazocerrado (1)-(2) tiene un punto de equilibrio q = qd globalmente asintoticamenteestable.

Demostracion. Considerando qd = 0, el sistema en lazo cerrado es,

M (q) q + C (q, q) q +Kv q + kp (q qd ) = 0. (3)Notese que el punto de equilibrio del sistema anterior resulta

q0 = qd

entonces, sin perdida de generalidad, se puede considerar qd = 0.

Recuerdese que si qd 6= 0, existe un cambio de coordenadas p = q q0, p = q quetransforma el sistema (3) en un nuevo sistema en las coordenadas p = q q0, p = qel cual tiene presenta un equilibrio en el origen.

I Por lo tanto puede considerarse qd = 0.

Considere la funcion candidata de Lyapunov,

V (q, q) =1

2qT M (q) q +

1

2qT Kpq. (4)

Entonces, V es radialmente no acotada y definida positiva.

Derivando V a lo largo de las trayectorias del sistema,

V (q, q) = qT M (q) q + 12 qT M (q) q + qT Kpq

= qT[C (q, q) q Kv q

kpq

]+ 12 q

T M (q) q +

qT Kpq

= qT Kv q + 12 qT M (q) q qT C (q, q) q= qT Kv q + 12 qT

[M (q) 2C (q, q)] q.

(5)

Como M (q) 2C (q, q) es antisimetrica,

V (q, q) = qT Kv q (6)donde V resulta semidefinida negativa por lo que solo se obtiene estabilidad del puntode equilibrio.

Considerando el Teorema de LaSalle, el conjunto S para el cual V = 0 resulta,

S ={

q, q| V = 0} = {q = 0} . (7)Para encontrar el maximo conjunto invariante contenido en S , se sustituye q = 0 en laecuacion de lazo cerrado (3), donde se considera,

q = 0 q = 0y por lo tanto se obtiene,

Kpq = 0. (8)

Como Kp es definida positiva, Kp es de rango pleno y por lo tanto q = 0, de donde seprueba que el equilibrio del sistema es asintoticamente estable.

Control PD aumentado (PD+)

Considere ahora el modelo general,

M (q) q + C (q, q) q +B (q) q + g (q) = u (9)

y el problema de control en el cual qd 6= 0.En este caso se pretende lograr el seguimiento de una trayectoria de referencia y nosolo estabilizar el equilibrio del sistema.En este caso, la retroalimentacion (2) puede modificarse como

u = M (q) qd + C (q, q) qd +Bqd + g (q)Kv q Kp q (10)

Teorema 2Bajo el conocimiento de q, q, la ley de control (10) aplicada al sistema (9), resulta enun seguimiento asintotico de la trayectoria deseada si Kv , Kp > 0.

Demostracion. El sistema en lazo cerrado (9)-(10) toma la forma,

M (q) q + C (q, q) q +B q +Kv q +Kp q = 0

que puede reescribirse en la forma,

M (q) q + C (q, q) q +KBv q +Kp q = 0, KBv = B +Kv . (11)

Notese que el punto de equilibrio del sistema (11) resulta q = 0, q = 0.La ecuacion (11) representa la dinamica del error de seguimiento q del sistema en lazocerrado (9)-(10).Utilizando de nueva cuenta la funcion candidata de Lyapunov (4),

V (q, q) =1

2qT M (q) q +

1

2qT Kp q (12)

Se obtiene,

V = qT M (q) q + 12 qT M (q) q + qT Kp q

= qT[C (q, q) q KBv q

kp q

]+ 12 q

T M (q) q + qT Kp q

= qT[C (q, q) + 12 M (q)] q qT KBv q

= qT KBv q

(13)

lo cual prueba la estabilidad del error.La utilizacion del Teorema de LaSalle prueba la estabilidad asintotica del sistema enlazo cerrado. En este caso el conjunto S para el cual V = 0 resulta,

S = { q = 0} . (14)Y el maximo conjunto invariante contenido en S resulta,

q = q = 0

de donde se obtiene el resultado buscado.

Control por Par Calculado

Considere el modelo general de un robot manipulador,

M (q) q + C (q, q) q +B (q) q + g (q) = u. (15)

Se desea encontrar una estrategia de control que sea robusta con respecto al error deseguimiento ocasionado por las condiciones iniciales, al ruido de los sensores y aincertidumbres parametricas.Despreciando la dinamica de los actuadores y conservando solamente terminos deamortiguamiento en el mecanismo, el modelo (15) puede escribirse como,

D (q) q + C (q, q) q +B (q) q + g (q) = . (16)

Una estrategia simple consiste en cancelar las no linealidades del sistema e imponer eltorque necesario que venza las inercias del manipulador.

Considere entonces la retroalimentacion,

= D (q) qd + C (q, q) q +B (q) + g (q) (17)

donde qd es la senal de referencia deseada.Sustituyendo (17) en (16) se obtiene en lazo cerrado,

D (q) q = D (q) qdD (q) q = 0 (18)

donde q = q qd .Como D (q) es definida positiva y por lo tanto invertible, la ecuacion (18) esequivalente a

q = 0 = q = qd . (19)

I Por lo tanto, si la posicion y la velocidad inicial del manipulador son igual a cero(q = q = 0), el robot seguira la trayectoria deseada.

I Si el error inicial no es cero, la ley de control (17) no puede corregirlo.

Suponga que (19) se satisface y que q (t0) = a y q (t0) = b, entonces tt0

q () d = q (t) q (t0) = q (t) b

entonces tt0

tt0

q () d = t

t0( q () b) d = q (t) q (t0) b (t t0)

= q (t) a b (t t0) = 0.Por lo tanto, es claro que aunque q (t) = 0, la ley (19) no garantiza la convergenciade q, q a cero ya que conforme t se obtiene,

q b, q a + b (t t0) . (20)

Para mejorar el desempeno de la ley de control anterior, considere ahora laretroalimentacion,

= D (q) (qd Kv q Kp q) + C (q, q) q +Bq + g (q) (21)donde, como se ha definido anteriormente,

q = q qdcon qd la trayectoria deseada y kv , kp matrices constantes definidas positivas.

I La ecuacion (21) describe el denominado Par calculado.

Sustituyendo (21) en (15) se obtiene,

D (q) q = D (q) (qd Kv q Kp q)esto es,

D (q) ( q +Kv q +Kp q) = 0

y como D (q) es invertible se obtiene,

q +Kv q +Kp q = 0 (22)

que representa un sistema lineal facilmente estabilizable mediante la eleccionapropiada de las matrices Kv , Kp .

En el caso mas simple, Kv , Kp se eligen como matrices diagonales, produciendo lossistemas desacoplados de primer orden

qi +Kvii qi +Kpii qi = 0 (23)

donde los polos deben de colocarse en el lado izquierdo del plano complejo.La ley de control por Par Calculado consiste de dos partes. La ecuacion (21) se puedeescribir como,

= D (q) qd + C (q, q) q +B (q) + g (q) ff

+D (q) (Kv q Kp q) fb

. (24)

I Al termino ff se le conoce como la componente predictiva y provee la cantidadde momento necesaria para llevar al sistema a lo largo de la trayectoria nominal.

I El termino fb es la componente de retroalimentacion que reduce los errores deseguimiento de trayectoria.

Teorema 3Considere el manipulador (15) en lazo cerrado con la retroalimentacion (21). Si Kv ,Kp > 0 son matrices constantes (definidas positivas) entonces la retroalimentacion,

= D (q) (qd Kv q Kp q) + C (q, q) q +B (q) + g (q)aplicada al sistema (15), resulta en un seguimiento exponencial.

Demostracion. La dinamica (22) se puede escribir como,

d

dt

[qq

]=

[0 IKp Kv

] [qq

](25)

que bajo la consideracion de,

q1 = q, q2 = q, q = [q1, q2]T

se obtiene, [q1q2

]=

[0 IKp Kv

] [q1q2

]q = Aq.

Para probar la convergencia exponencial del error basta con probar que los valorespropios de A tienen parte real negativa.

Sea C un valor propio de A correspondiente al vector propio v = [ v1 v2 ]T ,con v 6= 0 y v C2n. Entonces [v = Av , (I A) v = 0],

[v1v2

]=

[0 IKp Kv

] [v1v2

]=

[v2

Kpv1 Kv v2]

(26)

Notese que:

I Si = 0 entonces v = 0 y por lo tanto = 0 no es un valor propio de A.

I Si 6= 0,{

v2 = 0 implica que v1 = 0v1 = 0 implica que v2 = 0

}Por lo tanto v1, v2 6= 0.

Recuerdese que en el caso complejo:

v = (v v ) 12donde (v v ) es el producto interior complejo definido como,

(u w ) = u1w1 + ...+ unwn = w ucon wi representando el complejo conjugado de wi y w

= wT la transpuestahermitiana de w .Supongase sin perdida de generalidad que v1 = 1, entonces,

v 1 2v1 = 2v 1 v1 = 2 v12 = 2

Entonces,2 = v 1 2v1 = v 1 (v1) = v 1 v2

= v 1 (Kpv1 Kv v2)= v 1 Kpv1 v 1 Kv v1

(27)

Como v 1 Kpv1 > 0 y v 1 Kv v1 > 0 ya que son formas cuadraticas se tiene entonces,

2 + + = 0 (28)

con , > 0 lo que permite concluir que la parte real de es negativa.

El teorema anterior puede demostrarse alternativamente al considerar la funcion deLyapunov

V =1

2qT q +

1

2qT Kp q. (29)

Notese que el equilibrio de (22) es el origen y que V es definida positiva cuandoKp > 0. Entonces

V = qT q + qT Kp q = qT (Kv q Kp q) + qT Kp q = qT Kv q. (30)Kv se puede descomponer en la forma,

Kv =1

2

(Kv +K

Tv

)+

1

2

(Kv K Tv

)= A+B

donde A > 0 es simetrica y B > 0 antisimetrica. Por lo tanto,

V = qT A q.Dado que

min (A) q2 qT A q max (A) q2

se tiene entonces,V min (A) q2 .

Como V es semidefinida negativa, se ha probado hasta este momento que el sistemaes solamente estable.Considerando de nuevo el Teorema de LaSalle,

S ={

q, q| V = 0} = { q = 0} .El maximo conjunto invariante contenido en S se obtiene al sustituir q = 0 en (22)obteniendo,

Kp q = 0

dado que q = 0. Entonces ( q,q) = (0, 0) es el maximo conjunto invariante contenidoen S y por lo tanto se prueba la estabilidad asintotica.La estabilidad exponencial se obtiene del hecho que (22) es un sistema lineal.

Control basado en la estructura pasiva de robots rgidos

Considere las siguientes variables,

q = q qdqr = qd q

s = q qr = q +q(44)

La siguiente retroalimentacion garantiza un seguimiento asintotico sin utilizar elTeorema de LaSalle.

Teorema 4Considere el robot manipulador,

D (q) q + C (q, q) q +Bq + g (q) = . (45)

Sea qd una senal continua, acotada y con primera y segunda derivadas continuas yacotadas; si > 0 en (44), entonces la ley de control,

= D (q) qr + C (q, q) qr +Bqr + g (q)Kv s (46)con Kv > 0, en lazo cerrado con el sistema (45) produce un seguimiento asintotico delas trayectorias deseadas qd , qd .

Demostracion. El sistema en lazo cerrado toma la forma,

D (q) q + C (q, q) q +Bq + g (q) = D (q) qr + C (q, q) qr +Bqr + g (q)Kv sesto es,

D (q) s + C (q, q) s +Bs +Kv s = 0D (q) s + C (q, q) s +KBv s = 0

(47)

donde KBv = B +Kv .Considere ahora la funcion,

V (t) =1

2sT D (q) s.

Su derivada temporal a lo largo de (47) produce,

V (t) = sT D (q) s +1

2sT D (q) s

= sT [C (q, q) s KBv s ] + 12

sT D (q) s

= sT[

1

2D (q) C (q, q)

]s sT KBv s

= sT KBv s.Por lo tanto,

lmt s = 0.

Demostracion alterna

Notese que la ecuacion (47) no solo depende de s sino tambien de la variable q. De laecuacion (44) es posible ver que estas dos variables se relacionan dinamicamente apartir de

q = q + s.Por lo tanto, el sistema en lazo cerrado (45)-(46) puede describirse formalmente apartir del sistema aumentado,

D (q) s + C (q, q) s +KBv s = 0q = q + s. (48)

La prueba anterior se realiza a partir de la convergencia de una funcion de Lyapunovque depende solo de s y por lo tanto no esta completa formalmente ya que no se tomaen cuenta la dinamica de q. La ecuacion (48) debe reescribirse en la forma,

D (q + qd ) s + C (q + qd , q + qd ) s +KBv s = 0q = q + s (49)

donde se ha considerado que q = q + qd .

El sistema (49) tiene un equilibrio en el origen, por lo tanto, considerando la funcionde Lyapunov,

V =1

2sT Ds +

1

2qT q.

Se obtiene entonces,

V = sT Ds +1

2sT Ds + qT q

= sT [Cs KBv s ] + 12

sT Ds + qT [q + s ]

= sT[

1

2D C

]s sT KBv s qTq + qT s

= sT KBv s qTq + qT s.Por lo tanto,

V min (KBv ) s2 min () q2 + q s

[ s q ] [ min (KBv ) 12 12 min ()] [ sq

]

Entonces, el sistema resulta asintoticamente estable si

min (KBv ) min () 14> 0, min (KBv ) min () >

1

4(50)

lo cual siempre puede satisfacerse ya que KBv y son matrices de diseno.De lo anterior se obtiene la convergencia de s y q lo cual implica

q 0 y s 0y entonces

q qd y s q 0 q qd .

Diseno en el espacio de trabajo

Basado en un cambio de coordenadas al espacio cartesiano.

I Se desea que el efector final siga una trayectoria predeterminada.

I Conociendo la trayectoria cartesiana del efector final, el uso de la cinematicainversa permite obtener una trayectoria articular deseada equivalente.

I Alternativamente, es posible realizar la tarea de control en el espacio Cartesiano,lo que se conoce como Control en el espacio de trabajo.

Sea f : Q Rp un mapeo suave e invertible entre las variables articulares q Q y lasvariables del espacio de trabajo x Rp .

I El caso optimo es aquel en el cual n = p, esto es, el numero de grados de libertaddel robot es igual al numero de variables del espacio de trabajo.

I Si p < 6, las variables del espacio de trabajo solo proporcionan unaparametrizacion parcial de SE (3) = R3 SO(3).

La dinamica de un manipulador esta dada en general por:

D (q) q + C (q, q) q +Bq + g (q) = (51)

La relacion de velocidad entre la posicion Cartesiana x Rp del efector final y lasvariables articulares se obtiene al considerar el Jacobiano del sistema,

x = J (q) q, J (q) =f

q. (52)

Considerando que f es un mapeo suave e invertible, se puede escribir,

q = J1x q = J1x + ddt

(J1

)x . (53)

Definiendo la notacion,

JT =(J1

)Tla ecuacion (51) produce,

D (q)

[J1x + d

dt

(J1

)x

]+ C (q, q) J1x +BJ1x + g (q) =

D (q) J1x +[

C (q, q) J1 +D (q)d

dt

(J1

)]x +BJ1x + g (q) =

Equivalentemente, como J (q) es invertible,

JT D (q) J1x +[JT C (q, q) J1 + JT D (q) ddt

(J1

)]x

+JT BJ1x + JT g (q) = JT (54)

Lo que produce la nueva representacion,

D (q) x + C (q, q) x + Bx + g (q) = F (55)

donde,

D (q) = JT D (q) J1, C (q, q) = JT[C (q, q) J1 +D (q) ddt

(J1

)]B = JT BJ1, g (q) = JT g (q) , F = JT .

(56)

Notese que (55) se encuentra en terminos de q y q. Es posible considerar que,

x = f (q) , q = f 1 (x) = q = J1 (q)q=f 1(x) x (57)y de esta forma realizar completamente el cambio de coordenadas y evitar el uso de q,q. Para propositos de control esto es innecesario por lo que se acostumbra utilizar larepresentacion (55).

La ecuacion (55) tiene la misma estructura que la ecuacion (51).Esto nos permite demostrar las siguientes propiedades:

Lema 5La ecuacion (55) satisface las siguientes propiedades

1. D (q) es simetrica, definida positiva.

2. D (q) 2C (q, q) Rnn es una matriz antisimetrica.

Demostracion: La propiedad (1) es trivial. Para demostrar (2) notese que,

D (q) 2C (q, q) = JT D (q) J1 + ddt

(JT

)D (q) J1 + JT D (q)

d

dt

(J1

) 2JT

[C (q, q) J1 +D (q)

d

dt

(J1

)].

Entonces,

D (q) 2C (q, q) = JT [D (q) 2C (q, q)] J1 + 2 ddt

(JT

)D (q) J1

2JT D (q) ddt

(J1

)= 2

d

dt

(JT

)D (q) J1 2JT D (q) d

dt

(J1

)= T .

Por lo tanto (recuerdese que para cualquier matriz antisimetrica A, se satisfaceA+AT = 0),(

D (q) 2C (q, q))+(

D (q) 2C (q, q))T

= T +( T

)T= 0 (58)

I Las dos propiedades anteriores permiten el empleo inmediato de las leyes decontrol desarrolladas en el espacio de coordenadas articulares.

Control por par calculado en el espacio de trabajo

Sistema:D (q) x + C (q, q) x + Bx + g (q) = F (59)

Retroalimentacion:

F = D (q) (xd Kv x Kp x) + C (q, q) x + Bx + g (q) (60)de donde

= JT F . (61)

I xd representa la trayectoria deseada en el espacio de trabajo.

I x representa el error de seguimiento en el espacio de trabajo, x = x xd .El sistema en lazo cerrado produce,

D (q) x = D (q) (xd Kv x Kp x) . (62)

Con lo cual, como D (q) es invertible, se obtiene la dinamica,

x + kv x + kp x = 0 (63)

donde kv y kp se eligen tales que (63) resulta una ecuacion asintoticamente(exponencialmente) estable.

I Recuerdese que una condicion necesaria y suficiente para estabilidades que kv ykp son matrices definidas positivas. En particular, eligiendo kv y kp diagonales seresuelve facilmente el problema.

I La prueba final sigue los pasos del problema resuelto anteriormente en el espacioarticular.

5 Estrategias de Control

Documents

Transcript of 5 Estrategias de Control