5 Estrategias de Control

32
5. Estartegias B´ asicas de Control Dr. Mart´ ın Velasco Villa Secci´ on de Mecatr´ onica Abril de 2015

description

estrategias de control

Transcript of 5 Estrategias de Control

  • 5. Estartegias Basicas de Control

    Dr. Martn Velasco Villa

    Seccion de Mecatronica

    Abril de 2015

  • Control Proporcional Derivativo (PD) y control PD aumentado(PD+)

    I Una ley de control Proporcional-Derivativo PD puede obtenerse en el caso de unmanipulador al linealizar su dinamica alrededor de un punto de equilibrio y deesta forma, mediante el uso de la teora de control para sistemas lineales, obteneruna retroalimentacion PD que resuelva el problema de regulacion o seguimientode trayectorias.

    I En este caso es facil probar la estabilidad local del sistema al analizar la ubicacionde los polos de lazo cerrado resultante.

    I En el caso no lineal, como resulta el modelo de un manipulador, el analisis deestabilidad en lazo cerrado puede llevarse a cabo considerando un enfoque basadoen tecnicas de Lyapunov.

  • Control PD

    Considere un manipulador en el cual los terminos de amortiguamiento y de gravedadson nulos, esto es,

    M (q) q + C (q, q) q = u. (1)

    En su forma mas simple, una ley de control PD esta dada por

    u = kv q kp q (2)donde q = q qd con qd representando una posicion deseada de las coordenadasgeneralizadas.

    I La retroalimentacion (2) no contiene un termino integral clasico (PID) ya queesto puede complicar la determinacion de la estabilidad del sistema.

  • El problema de regulacion para el manipulador (1) se resuelve a partir del siguienteresultado en el cual se prueba que la posicion de las coordenadas generalizadas q(t)converge a su posicion deseada qd (t).

    Teorema 1Si qd = 0 y Kv , Kp > 0 (Matrices definidas positivas) entonces el sistema en lazocerrado (1)-(2) tiene un punto de equilibrio q = qd globalmente asintoticamenteestable.

    Demostracion. Considerando qd = 0, el sistema en lazo cerrado es,

    M (q) q + C (q, q) q +Kv q + kp (q qd ) = 0. (3)Notese que el punto de equilibrio del sistema anterior resulta

    q0 = qd

    entonces, sin perdida de generalidad, se puede considerar qd = 0.

  • Recuerdese que si qd 6= 0, existe un cambio de coordenadas p = q q0, p = q quetransforma el sistema (3) en un nuevo sistema en las coordenadas p = q q0, p = qel cual tiene presenta un equilibrio en el origen.

    I Por lo tanto puede considerarse qd = 0.

    Considere la funcion candidata de Lyapunov,

    V (q, q) =1

    2qT M (q) q +

    1

    2qT Kpq. (4)

    Entonces, V es radialmente no acotada y definida positiva.

  • Derivando V a lo largo de las trayectorias del sistema,

    V (q, q) = qT M (q) q + 12 qT M (q) q + qT Kpq

    = qT[C (q, q) q Kv q

    kpq

    ]+ 12 q

    T M (q) q +

    qT Kpq

    = qT Kv q + 12 qT M (q) q qT C (q, q) q= qT Kv q + 12 qT

    [M (q) 2C (q, q)] q.

    (5)

    Como M (q) 2C (q, q) es antisimetrica,

    V (q, q) = qT Kv q (6)donde V resulta semidefinida negativa por lo que solo se obtiene estabilidad del puntode equilibrio.

  • Considerando el Teorema de LaSalle, el conjunto S para el cual V = 0 resulta,

    S ={

    q, q| V = 0} = {q = 0} . (7)Para encontrar el maximo conjunto invariante contenido en S , se sustituye q = 0 en laecuacion de lazo cerrado (3), donde se considera,

    q = 0 q = 0y por lo tanto se obtiene,

    Kpq = 0. (8)

    Como Kp es definida positiva, Kp es de rango pleno y por lo tanto q = 0, de donde seprueba que el equilibrio del sistema es asintoticamente estable.

  • Control PD aumentado (PD+)

    Considere ahora el modelo general,

    M (q) q + C (q, q) q +B (q) q + g (q) = u (9)

    y el problema de control en el cual qd 6= 0.En este caso se pretende lograr el seguimiento de una trayectoria de referencia y nosolo estabilizar el equilibrio del sistema.En este caso, la retroalimentacion (2) puede modificarse como

    u = M (q) qd + C (q, q) qd +Bqd + g (q)Kv q Kp q (10)

  • Teorema 2Bajo el conocimiento de q, q, la ley de control (10) aplicada al sistema (9), resulta enun seguimiento asintotico de la trayectoria deseada si Kv , Kp > 0.

    Demostracion. El sistema en lazo cerrado (9)-(10) toma la forma,

    M (q) q + C (q, q) q +B q +Kv q +Kp q = 0

    que puede reescribirse en la forma,

    M (q) q + C (q, q) q +KBv q +Kp q = 0, KBv = B +Kv . (11)

    Notese que el punto de equilibrio del sistema (11) resulta q = 0, q = 0.La ecuacion (11) representa la dinamica del error de seguimiento q del sistema en lazocerrado (9)-(10).Utilizando de nueva cuenta la funcion candidata de Lyapunov (4),

    V (q, q) =1

    2qT M (q) q +

    1

    2qT Kp q (12)

  • Se obtiene,

    V = qT M (q) q + 12 qT M (q) q + qT Kp q

    = qT[C (q, q) q KBv q

    kp q

    ]+ 12 q

    T M (q) q + qT Kp q

    = qT[C (q, q) + 12 M (q)] q qT KBv q

    = qT KBv q

    (13)

    lo cual prueba la estabilidad del error.La utilizacion del Teorema de LaSalle prueba la estabilidad asintotica del sistema enlazo cerrado. En este caso el conjunto S para el cual V = 0 resulta,

    S = { q = 0} . (14)Y el maximo conjunto invariante contenido en S resulta,

    q = q = 0

    de donde se obtiene el resultado buscado.

  • Control por Par Calculado

    Considere el modelo general de un robot manipulador,

    M (q) q + C (q, q) q +B (q) q + g (q) = u. (15)

    Se desea encontrar una estrategia de control que sea robusta con respecto al error deseguimiento ocasionado por las condiciones iniciales, al ruido de los sensores y aincertidumbres parametricas.Despreciando la dinamica de los actuadores y conservando solamente terminos deamortiguamiento en el mecanismo, el modelo (15) puede escribirse como,

    D (q) q + C (q, q) q +B (q) q + g (q) = . (16)

    Una estrategia simple consiste en cancelar las no linealidades del sistema e imponer eltorque necesario que venza las inercias del manipulador.

  • Considere entonces la retroalimentacion,

    = D (q) qd + C (q, q) q +B (q) + g (q) (17)

    donde qd es la senal de referencia deseada.Sustituyendo (17) en (16) se obtiene en lazo cerrado,

    D (q) q = D (q) qdD (q) q = 0 (18)

    donde q = q qd .Como D (q) es definida positiva y por lo tanto invertible, la ecuacion (18) esequivalente a

    q = 0 = q = qd . (19)

    I Por lo tanto, si la posicion y la velocidad inicial del manipulador son igual a cero(q = q = 0), el robot seguira la trayectoria deseada.

    I Si el error inicial no es cero, la ley de control (17) no puede corregirlo.

  • Suponga que (19) se satisface y que q (t0) = a y q (t0) = b, entonces tt0

    q () d = q (t) q (t0) = q (t) b

    entonces tt0

    tt0

    q () d = t

    t0( q () b) d = q (t) q (t0) b (t t0)

    = q (t) a b (t t0) = 0.Por lo tanto, es claro que aunque q (t) = 0, la ley (19) no garantiza la convergenciade q, q a cero ya que conforme t se obtiene,

    q b, q a + b (t t0) . (20)

  • Para mejorar el desempeno de la ley de control anterior, considere ahora laretroalimentacion,

    = D (q) (qd Kv q Kp q) + C (q, q) q +Bq + g (q) (21)donde, como se ha definido anteriormente,

    q = q qdcon qd la trayectoria deseada y kv , kp matrices constantes definidas positivas.

    I La ecuacion (21) describe el denominado Par calculado.

    Sustituyendo (21) en (15) se obtiene,

    D (q) q = D (q) (qd Kv q Kp q)esto es,

    D (q) ( q +Kv q +Kp q) = 0

    y como D (q) es invertible se obtiene,

    q +Kv q +Kp q = 0 (22)

    que representa un sistema lineal facilmente estabilizable mediante la eleccionapropiada de las matrices Kv , Kp .

  • En el caso mas simple, Kv , Kp se eligen como matrices diagonales, produciendo lossistemas desacoplados de primer orden

    qi +Kvii qi +Kpii qi = 0 (23)

    donde los polos deben de colocarse en el lado izquierdo del plano complejo.La ley de control por Par Calculado consiste de dos partes. La ecuacion (21) se puedeescribir como,

    = D (q) qd + C (q, q) q +B (q) + g (q) ff

    +D (q) (Kv q Kp q) fb

    . (24)

    I Al termino ff se le conoce como la componente predictiva y provee la cantidadde momento necesaria para llevar al sistema a lo largo de la trayectoria nominal.

    I El termino fb es la componente de retroalimentacion que reduce los errores deseguimiento de trayectoria.

  • Teorema 3Considere el manipulador (15) en lazo cerrado con la retroalimentacion (21). Si Kv ,Kp > 0 son matrices constantes (definidas positivas) entonces la retroalimentacion,

    = D (q) (qd Kv q Kp q) + C (q, q) q +B (q) + g (q)aplicada al sistema (15), resulta en un seguimiento exponencial.

    Demostracion. La dinamica (22) se puede escribir como,

    d

    dt

    [qq

    ]=

    [0 IKp Kv

    ] [qq

    ](25)

    que bajo la consideracion de,

    q1 = q, q2 = q, q = [q1, q2]T

    se obtiene, [q1q2

    ]=

    [0 IKp Kv

    ] [q1q2

    ]q = Aq.

    Para probar la convergencia exponencial del error basta con probar que los valorespropios de A tienen parte real negativa.

  • Sea C un valor propio de A correspondiente al vector propio v = [ v1 v2 ]T ,con v 6= 0 y v C2n. Entonces [v = Av , (I A) v = 0],

    [v1v2

    ]=

    [0 IKp Kv

    ] [v1v2

    ]=

    [v2

    Kpv1 Kv v2]

    (26)

    Notese que:

    I Si = 0 entonces v = 0 y por lo tanto = 0 no es un valor propio de A.

    I Si 6= 0,{

    v2 = 0 implica que v1 = 0v1 = 0 implica que v2 = 0

    }Por lo tanto v1, v2 6= 0.

  • Recuerdese que en el caso complejo:

    v = (v v ) 12donde (v v ) es el producto interior complejo definido como,

    (u w ) = u1w1 + ...+ unwn = w ucon wi representando el complejo conjugado de wi y w

    = wT la transpuestahermitiana de w .Supongase sin perdida de generalidad que v1 = 1, entonces,

    v 1 2v1 = 2v 1 v1 = 2 v12 = 2

    Entonces,2 = v 1 2v1 = v 1 (v1) = v 1 v2

    = v 1 (Kpv1 Kv v2)= v 1 Kpv1 v 1 Kv v1

    (27)

    Como v 1 Kpv1 > 0 y v 1 Kv v1 > 0 ya que son formas cuadraticas se tiene entonces,

    2 + + = 0 (28)

    con , > 0 lo que permite concluir que la parte real de es negativa.

  • El teorema anterior puede demostrarse alternativamente al considerar la funcion deLyapunov

    V =1

    2qT q +

    1

    2qT Kp q. (29)

    Notese que el equilibrio de (22) es el origen y que V es definida positiva cuandoKp > 0. Entonces

    V = qT q + qT Kp q = qT (Kv q Kp q) + qT Kp q = qT Kv q. (30)Kv se puede descomponer en la forma,

    Kv =1

    2

    (Kv +K

    Tv

    )+

    1

    2

    (Kv K Tv

    )= A+B

    donde A > 0 es simetrica y B > 0 antisimetrica. Por lo tanto,

    V = qT A q.Dado que

    min (A) q2 qT A q max (A) q2

    se tiene entonces,V min (A) q2 .

  • Como V es semidefinida negativa, se ha probado hasta este momento que el sistemaes solamente estable.Considerando de nuevo el Teorema de LaSalle,

    S ={

    q, q| V = 0} = { q = 0} .El maximo conjunto invariante contenido en S se obtiene al sustituir q = 0 en (22)obteniendo,

    Kp q = 0

    dado que q = 0. Entonces ( q,q) = (0, 0) es el maximo conjunto invariante contenidoen S y por lo tanto se prueba la estabilidad asintotica.La estabilidad exponencial se obtiene del hecho que (22) es un sistema lineal.

  • Control basado en la estructura pasiva de robots rgidos

    Considere las siguientes variables,

    q = q qdqr = qd q

    s = q qr = q +q(44)

    La siguiente retroalimentacion garantiza un seguimiento asintotico sin utilizar elTeorema de LaSalle.

    Teorema 4Considere el robot manipulador,

    D (q) q + C (q, q) q +Bq + g (q) = . (45)

    Sea qd una senal continua, acotada y con primera y segunda derivadas continuas yacotadas; si > 0 en (44), entonces la ley de control,

    = D (q) qr + C (q, q) qr +Bqr + g (q)Kv s (46)con Kv > 0, en lazo cerrado con el sistema (45) produce un seguimiento asintotico delas trayectorias deseadas qd , qd .

  • Demostracion. El sistema en lazo cerrado toma la forma,

    D (q) q + C (q, q) q +Bq + g (q) = D (q) qr + C (q, q) qr +Bqr + g (q)Kv sesto es,

    D (q) s + C (q, q) s +Bs +Kv s = 0D (q) s + C (q, q) s +KBv s = 0

    (47)

    donde KBv = B +Kv .Considere ahora la funcion,

    V (t) =1

    2sT D (q) s.

    Su derivada temporal a lo largo de (47) produce,

    V (t) = sT D (q) s +1

    2sT D (q) s

    = sT [C (q, q) s KBv s ] + 12

    sT D (q) s

    = sT[

    1

    2D (q) C (q, q)

    ]s sT KBv s

    = sT KBv s.Por lo tanto,

    lmt s = 0.

  • Demostracion alterna

    Notese que la ecuacion (47) no solo depende de s sino tambien de la variable q. De laecuacion (44) es posible ver que estas dos variables se relacionan dinamicamente apartir de

    q = q + s.Por lo tanto, el sistema en lazo cerrado (45)-(46) puede describirse formalmente apartir del sistema aumentado,

    D (q) s + C (q, q) s +KBv s = 0q = q + s. (48)

    La prueba anterior se realiza a partir de la convergencia de una funcion de Lyapunovque depende solo de s y por lo tanto no esta completa formalmente ya que no se tomaen cuenta la dinamica de q. La ecuacion (48) debe reescribirse en la forma,

    D (q + qd ) s + C (q + qd , q + qd ) s +KBv s = 0q = q + s (49)

    donde se ha considerado que q = q + qd .

  • El sistema (49) tiene un equilibrio en el origen, por lo tanto, considerando la funcionde Lyapunov,

    V =1

    2sT Ds +

    1

    2qT q.

    Se obtiene entonces,

    V = sT Ds +1

    2sT Ds + qT q

    = sT [Cs KBv s ] + 12

    sT Ds + qT [q + s ]

    = sT[

    1

    2D C

    ]s sT KBv s qTq + qT s

    = sT KBv s qTq + qT s.Por lo tanto,

    V min (KBv ) s2 min () q2 + q s

    [ s q ] [ min (KBv ) 12 12 min ()] [ sq

    ]

  • Entonces, el sistema resulta asintoticamente estable si

    min (KBv ) min () 14> 0, min (KBv ) min () >

    1

    4(50)

    lo cual siempre puede satisfacerse ya que KBv y son matrices de diseno.De lo anterior se obtiene la convergencia de s y q lo cual implica

    q 0 y s 0y entonces

    q qd y s q 0 q qd .

  • Diseno en el espacio de trabajo

    Basado en un cambio de coordenadas al espacio cartesiano.

    I Se desea que el efector final siga una trayectoria predeterminada.

    I Conociendo la trayectoria cartesiana del efector final, el uso de la cinematicainversa permite obtener una trayectoria articular deseada equivalente.

    I Alternativamente, es posible realizar la tarea de control en el espacio Cartesiano,lo que se conoce como Control en el espacio de trabajo.

    Sea f : Q Rp un mapeo suave e invertible entre las variables articulares q Q y lasvariables del espacio de trabajo x Rp .

    I El caso optimo es aquel en el cual n = p, esto es, el numero de grados de libertaddel robot es igual al numero de variables del espacio de trabajo.

    I Si p < 6, las variables del espacio de trabajo solo proporcionan unaparametrizacion parcial de SE (3) = R3 SO(3).

  • La dinamica de un manipulador esta dada en general por:

    D (q) q + C (q, q) q +Bq + g (q) = (51)

    La relacion de velocidad entre la posicion Cartesiana x Rp del efector final y lasvariables articulares se obtiene al considerar el Jacobiano del sistema,

    x = J (q) q, J (q) =f

    q. (52)

    Considerando que f es un mapeo suave e invertible, se puede escribir,

    q = J1x q = J1x + ddt

    (J1

    )x . (53)

    Definiendo la notacion,

    JT =(J1

    )Tla ecuacion (51) produce,

    D (q)

    [J1x + d

    dt

    (J1

    )x

    ]+ C (q, q) J1x +BJ1x + g (q) =

    D (q) J1x +[

    C (q, q) J1 +D (q)d

    dt

    (J1

    )]x +BJ1x + g (q) =

  • Equivalentemente, como J (q) es invertible,

    JT D (q) J1x +[JT C (q, q) J1 + JT D (q) ddt

    (J1

    )]x

    +JT BJ1x + JT g (q) = JT (54)

    Lo que produce la nueva representacion,

    D (q) x + C (q, q) x + Bx + g (q) = F (55)

    donde,

    D (q) = JT D (q) J1, C (q, q) = JT[C (q, q) J1 +D (q) ddt

    (J1

    )]B = JT BJ1, g (q) = JT g (q) , F = JT .

    (56)

    Notese que (55) se encuentra en terminos de q y q. Es posible considerar que,

    x = f (q) , q = f 1 (x) = q = J1 (q)q=f 1(x) x (57)y de esta forma realizar completamente el cambio de coordenadas y evitar el uso de q,q. Para propositos de control esto es innecesario por lo que se acostumbra utilizar larepresentacion (55).

  • La ecuacion (55) tiene la misma estructura que la ecuacion (51).Esto nos permite demostrar las siguientes propiedades:

    Lema 5La ecuacion (55) satisface las siguientes propiedades

    1. D (q) es simetrica, definida positiva.

    2. D (q) 2C (q, q) Rnn es una matriz antisimetrica.

    Demostracion: La propiedad (1) es trivial. Para demostrar (2) notese que,

    D (q) 2C (q, q) = JT D (q) J1 + ddt

    (JT

    )D (q) J1 + JT D (q)

    d

    dt

    (J1

    ) 2JT

    [C (q, q) J1 +D (q)

    d

    dt

    (J1

    )].

  • Entonces,

    D (q) 2C (q, q) = JT [D (q) 2C (q, q)] J1 + 2 ddt

    (JT

    )D (q) J1

    2JT D (q) ddt

    (J1

    )= 2

    d

    dt

    (JT

    )D (q) J1 2JT D (q) d

    dt

    (J1

    )= T .

    Por lo tanto (recuerdese que para cualquier matriz antisimetrica A, se satisfaceA+AT = 0),(

    D (q) 2C (q, q))+(

    D (q) 2C (q, q))T

    = T +( T

    )T= 0 (58)

    I Las dos propiedades anteriores permiten el empleo inmediato de las leyes decontrol desarrolladas en el espacio de coordenadas articulares.

  • Control por par calculado en el espacio de trabajo

    Sistema:D (q) x + C (q, q) x + Bx + g (q) = F (59)

    Retroalimentacion:

    F = D (q) (xd Kv x Kp x) + C (q, q) x + Bx + g (q) (60)de donde

    = JT F . (61)

    I xd representa la trayectoria deseada en el espacio de trabajo.

    I x representa el error de seguimiento en el espacio de trabajo, x = x xd .El sistema en lazo cerrado produce,

    D (q) x = D (q) (xd Kv x Kp x) . (62)

  • Con lo cual, como D (q) es invertible, se obtiene la dinamica,

    x + kv x + kp x = 0 (63)

    donde kv y kp se eligen tales que (63) resulta una ecuacion asintoticamente(exponencialmente) estable.

    I Recuerdese que una condicion necesaria y suficiente para estabilidades que kv ykp son matrices definidas positivas. En particular, eligiendo kv y kp diagonales seresuelve facilmente el problema.

    I La prueba final sigue los pasos del problema resuelto anteriormente en el espacioarticular.