Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a...

189
Lio Fidalgo Gon¸calves Controlo n˜ ao linear de sistemas com elevados n´ ıveis de incerteza etodos e aplica¸ c˜oes Tese submetida `a Faculdade de Ciˆ encias da Universidade do Porto para obten¸c˜ ao do grau de Doutor em Matem´atica Aplicada Departamento de Matem´atica Aplicada Faculdade de Ciˆ encias da Universidade do Porto 2006

Transcript of Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a...

Page 1: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

Lio Fidalgo Goncalves

Controlo nao linear de sistemascom elevados nıveis de incerteza

Metodos e aplicacoes

Tese submetida a Faculdade de Ciencias daUniversidade do Porto para obtencao do grau de Doutor

em Matematica Aplicada

Departamento de Matematica AplicadaFaculdade de Ciencias da Universidade do Porto

2006

Page 2: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram
Page 3: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

A Adelaide, ao Joao Pedro e a Ana Beatriz

Page 4: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram
Page 5: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

Agradecimentos

Aos meus orientadores, Professora Doutora Teresa Mendonca e Professor Doutor JoaoMiranda Lemos, agradeco o apoio, a orientacao e a amizade. O caminho seguidoate concluir esta tese nao foi uma linha recta, mas mantiveram a confianca em mimdurante este longo perıodo. Estou-lhes profundamente grato.

Em questoes cientıficas, para alem dos meus orientadores, foram varias as pessoasque me ajudaram na preparacao deste trabalho. Destaco o Prof. Lennart Ljung,investigador sueco de renome internacional, por me ter proporcionado a oportunidadede trabalhar com ele num estagio de curta duracao e o Hugo Magalhaes, colega dogrupo do DMA que se mostrou sempre disponıvel para me ajudar.

A todos os meus colegas do Departamento de Matematica da UTAD, sem excepcao,agradeco todo o apoio concedido no que concerne a realizacao de vigilancias. Do pontode vista institucional, agradeco a todos os colegas que estiveram na coordenacao doDepartamento durante o perıodo de preparacao deste trabalho, bem como ao Conselhode Departamento por todo o apoio e confianca que me transmitiram nos momentosmais difıceis.

Aos amigos e famılia. A minha ausencia, a grande maioria das vezes em pensamento,em muitos eventos importantes para todos nos faria pensar que esta tese ia ter, pelomenos, 500 paginas. Tive que cortar cerca de 300 paginas senao voces nao liam, agoranao tem desculpas!

Ao meu Pai, Joao da Silva Goncalves (1943-1993).

Um agradecimento muito especial as estrelas (sentido astronomico) do meu nucleofamiliar, a Adelaide, o Joao Pedro e a Ana Beatriz. Voces formam a minha Estrelado Norte.

Em termos institucionais agradeco o apoio concedido pelas seguintes entidades duranteo perıodo de preparacao deste trabalho: Departamento de Matematica da UTAD -pelos tres anos de dispensa de servico docente que me concedeu; Departamento deMatematica Aplicada-FCUP e INESC-ID (Lisboa)- pelas condicoes de trabalho queme foram proporcionadas; Division of Automatic Control-Linkoping (Suecia) - pelaoptima atmosfera de trabalho que encontrei durante um estagio de curta duracao em2002.

Page 6: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

Do ponto de vista financeiro gostava de agradecer ao Fundo Social Europeu, pelo apoioconcedido no ambito do PRODEPIII, concurso no 4/5.3/PRODEP/2000:

Page 7: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

Resumo

A engenharia do controlo tem sido o suporte de avancos tecnologicos em diversas areasdo conhecimento, nomeadamente, aeroespacial, quımica, electronica, comunicacoes,transportes e redes. O impacto dos sistemas de controlo na medicina moderna temsido, no entanto, menos significativo, atendendo as caracterısticas proprias dos proble-mas a resolver. O grau de fiabilidade e de robustez que se exige num sistema de controloautomatico de variaveis fisiologicas, a par da incerteza inerente a estes sistemas justificao continuado desenvolvimento de metodos de identificacao e de controlo adequados.

Uma das areas da medicina na qual a modelacao matematica e a identificacao desistemas desempenham um papel determinante e a farmacologia clınica. Os modelosdos farmacos descritos na literatura nao permitem explicar a variabilidade intra-e interindividual observada, reforcando a importancia do desenvolvimento de metodosde identificacao (em particular, em tempo real) a partir de dados recolhidos quer emmalha aberta quer em malha fechada. Neste trabalho sao propostos metodos paraestimar parametros de modelos que apresentam uma estrutura do tipo “modelo deWiener”.

Os controladores preditivos adaptativos tem sido usados com sucesso em diversasaplicacoes. Na literatura aparecem descritos diversos metodos aplicados ao controloautomatico da anestesia em que se recorre a linearizacao do modelo. Neste trabalho saoapresentados algoritmos preditivos adaptativos que sao extensoes de algoritmos do tipoGPC no controlo de sistemas nao lineares com estrutura de Wiener. O desempenhodestes algoritmos e ilustrado atraves de estudos de simulacao do controlo do bloqueioneuromuscular por infusao de atracurio em pacientes sujeitos a anestesia.

A convergencia e a estabilidade em malha fechada dos sistemas de controlo adaptativospropostos e demonstrada analiticamente. Na analise da estabilidade recorre-se aochamado “Lema Tecnico Chave” e a tecnicas semelhantes ao “metodo directo deLyapunov” para sistemas dinamicos discretos.

7

Page 8: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram
Page 9: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

Abstract

Control engineering is the underpinning for technological advances in fields as diverseas aerospace, chemical, electronic, communication, transportation, and network en-gineering. Control technology has had, however, less impact on modern medicinedue to the proper characteristics of the problems to be solved. The robustness andreliability degree that is demanded in an automatic control system of physiologicalvariables, along with the inherent uncertainty of these systems justify the continueddevelopment of adequate methods for identification and control.

One of the areas of medicine in which mathematical modelling and systems iden-tification have a prominent role is clinical pharmacology. As the models describedin literature don’t replicate the observed variability of the dynamic responses to themuscle relaxant, the parameters of the models must be estimated (in particular, on-line) using data collected in open- and closed loop. In this work several identificationmethods are proposed to address the problem of identification of systems with so-called“Wiener structure”.

Predictive adaptive controllers have been used with success in several applications.The methods described in the literature for automatic control of anesthesia makeuse of a linearized model. In this work, several predictive controllers are presentedthat can be considered extensions of GPC-like controllers in order to control systemswith Wiener nonlinear structure. The performance of these algorithms is illustratedthrough studies of simulation of the control of the neuromuscular blockade induced byatracurium administration in patients under surgery.

The convergence and the stability of the adaptive control systems proposed is esta-blished. The stability analysis make use of the so-called “Technical Key Lemma” andof techniques similar to “Lyapunov’s direct method” for discrete dynamical systems.

9

Page 10: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram
Page 11: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

Resume

L’Automatique est le soutien a des progres technologiques dans des domaines aussidivers que l’ingenierie aerospatiale, la chimique, l’electronique, les communications, lestransports et la technologie des reseaux. L’impact de la technologie du controle sur lamedecine moderne est, cependant, moins significatif. En general, il y a des barrieresa l’application de la theorie et technologie du controle moderne a la medecine. Lesobstacles les plus difficiles a surmonter sont les incertitudes inherentes aux systemesbiologiques, lesquelles conditionnent l’obtention de bons modeles mathematiques etl’usage des modernes outils de controle.

Un des secteurs de la medecine qui est devenu un champ d’application de la theoriedu controle est la pharmacologie clinique, discipline ou la modelisation mathematiquejoue un role primordial. Puisque les modeles decrits dans la litterature ne presententpas la variabilite intra- et interindividuelle dans la decontraction des muscles, il fautestimer les parametres du modele en ligne, en utilisant des donnes rassemblees enchirurgie en boucle ouverte et boucle fermee. Dans ce travail, on propose quelquesmethodes pour identifier les parametres des modeles de perfusion de medicaments ensituation d’incertitude.

Les controleurs predictifs adaptatifs ont ete utilises avec succes en plusieurs applicati-ons, notamment dans le controle du blocage neuromusculaire. Les methodes decritesdans la litterature s’appuient sur la linearisation du modele autour d’un point defonctionnement. Dans ce travail, on presente des algorithmes predictifs adaptatifs quisont des extensions d’algorithmes du type GPC dans le controle de systemes non-lineaires a structure de Wiener. On illustre la performance de ces algorithmes pardes etudes de simulation du controle du blocage neuromusculaire en consequence dela perfusion d’atracurium chez des patients soumis a l’anesthesie.

On demontre analytiquement la convergence et la stabilite en boucle fermee de quel-ques uns des systemes de controle developpes. Notre analyse fait appel au “LemmeTechnique Principal” et a des techniques apparentees a la “Methode Directe de Lya-punov” pour des systemes dynamiques discrets.

11

Page 12: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram
Page 13: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

Abreviaturas

BIBO Bounded Input Bounded OutputCARIMA Controlled AutoRegressive Integrated Moving AverageDARMA Deterministic AutoRegressive Moving AverageDFRLS Directional Forgetting Recursive Least SquaresEMRC Explicit Model Reference ControllerEMRAC Explicit Model Reference Adaptive ControllerGPC Generalized Predictive Controli.i.d. independent and identically distributedIMRC Implicit Model Reference ControllerIMRAC Implicit Model Reference Adaptive ControllerIMRACW Implicit Model Reference Adaptive Controller for Wiener modelsIMRACLW Implicit Model Reference Adaptive Controller for Linearized

Wiener modelsLQG/LTR Linear Quadratic Gaussian with Loop Transfer RecoveryMSE Mean Square ErrorMRAC(s) Model Reference Adaptive Controller(s)NARMAX Nonlinear AutoRegressive Moving Average model with

eXogenous variablesNMB NeuroMuscular BlockadeNMBs NeuroMuscular Blocking AgentsOE Output Error model structurePID Proportional Integral Derivative controllerPK/PD PharmacoKinetics/ PharmacoDynamicsRLS Recursive Least SquaresSISO Single Input Single OutputSIMO Single Input Multiple OutputWFPAC Wiener Full Parameterization Adaptive ControllerWIMRHAC Wiener Interlaced Multipredictor Receding Horizon

Adaptive ControllerWIPC Wiener Inverse Predictive ControllerWNPC Wiener Nonlinear Predictive Controller

13

Page 14: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram
Page 15: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

Conteudo

Resumo 7

Abstract 9

Resume 11

Abreviaturas 13

1 Introducao 21

1.1 Motivacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

1.2 Estrutura da tese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

1.3 Contribuicoes originais desta tese . . . . . . . . . . . . . . . . . . . . . 25

1.4 Metodos de identificacao de sistemas nao lineares de Wiener . . . . . . 26

1.4.1 Modelos de Wiener . . . . . . . . . . . . . . . . . . . . . . . . . 26

1.4.2 Estado da arte . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

1.5 Controlo automatico do bloqueio neuromuscular . . . . . . . . . . . . . 30

1.5.1 Estado da arte . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

2 Identificacao de sistemas fisiologicos de Wiener 35

2.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

2.2 Algoritmos de optimizacao . . . . . . . . . . . . . . . . . . . . . . . . . 36

2.2.1 Metodo de pesquisa direccional . . . . . . . . . . . . . . . . . . 38

2.2.1.1 Estimacao parametrica do modelo PK/PD do atracurio 40

15

Page 16: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

2.2.2 Metodo de Simplex de Nelder-Mead -identificacao do sistema de controlo do NMB . . . . . . . . . . . 45

2.3 Algoritmo de identificacao baseado emparametrizacoes lineares . . . . . . . . . . . . . . . . . . . . . . . . . . 47

2.3.1 Parametrizacao do modelo de Wiener . . . . . . . . . . . . . . . 48

2.3.2 Caracterizacao do ruıdo . . . . . . . . . . . . . . . . . . . . . . 48

2.3.3 Estimador de mınimos quadrados . . . . . . . . . . . . . . . . . 49

2.3.4 Algoritmos de identificacao . . . . . . . . . . . . . . . . . . . . . 50

2.4 Identificacao em tempo real do modelo PK/PD do atracurio . . . . . . 53

2.4.1 Procedimento para se obter um modelo inicial . . . . . . . . . . 54

2.4.2 Estimacao em malha fechada dos parametros do modelo . . . . 58

2.5 Identificacao de sistemas de Wiener robustos . . . . . . . . . . . . . . . 62

2.5.1 Procedimento para se obter o modelo de Wiener robusto . . . . 65

2.5.2 Identificacao de um modelo para o atracurio com estrutura Wi-ener robusto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

3 Controlo adaptativo de sistemas de Wiener 71

3.1 Formulacao do problema . . . . . . . . . . . . . . . . . . . . . . . . . . 71

3.2 Controlo para parametros do modelo de Wiener conhecidos . . . . . . . 71

3.2.1 Parametrizacao da funcao inversa da nao linearidade . . . . . . 73

3.2.2 Algoritmo de controlo EMRC . . . . . . . . . . . . . . . . . . . 74

3.2.3 Algoritmo de controlo IMRC . . . . . . . . . . . . . . . . . . . 75

3.2.3.1 Modelo preditor . . . . . . . . . . . . . . . . . . . . . 76

3.2.3.2 Lei de controlo IMRC . . . . . . . . . . . . . . . . . . 76

3.3 Sistemas adaptativos para sistemas de Wiener . . . . . . . . . . . . . . 76

3.3.1 Nao linearidade conhecida . . . . . . . . . . . . . . . . . . . . . 77

3.3.2 Nao linearidade desconhecida ou desconhecida e variante no tempo 78

3.3.2.1 Lei de controlo IMRACW baseada em T modelospreditivos . . . . . . . . . . . . . . . . . . . . . . . . . 80

3.4 Controlo preditivo adaptativo de sistemas de Wiener . . . . . . . . . . 82

Page 17: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

3.4.1 Controlador preditivo WIMRHAC . . . . . . . . . . . . . . . . 83

3.4.2 Controlador preditivo WFPAC . . . . . . . . . . . . . . . . . . 87

4 Convergencia e Estabilidade 91

4.1 Analise da estabilidade do algoritmo IMRACW . . . . . . . . . . . . 91

4.1.1 Estabilidade do algoritmo IMRACW baseado em T modelospreditivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

4.1.2 Estabilidade na presenca de incerteza associada ao modelo . . . 97

4.2 Analise da estabilidade do algoritmo WFPAC . . . . . . . . . . . . . . 99

5 Resultados de simulacao 105

5.1 Parametros de simulacao . . . . . . . . . . . . . . . . . . . . . . . . . . 106

5.2 Algoritmo IMRACW aplicado ao controlo do NMB . . . . . . . . . . . 108

5.2.1 Lei de controlo IMRACW com peso na accao de controlo . . . 109

5.2.2 Resultados de simulacao . . . . . . . . . . . . . . . . . . . . . . 110

5.3 Algoritmo IMRACLW aplicado ao controlo do NMB . . . . . . . . . . 118

5.3.1 Resultados de simulacao . . . . . . . . . . . . . . . . . . . . . . 120

5.4 Algoritmo WFPAC aplicado ao controlo do NMB . . . . . . . . . . . . 125

5.5 Algoritmo IMRHAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133

5.6 Algoritmo WIMRHAC . . . . . . . . . . . . . . . . . . . . . . . . . . . 134

5.6.1 Aproximacao da inversa da nao linearidade por B-splines . . . . 138

5.7 Analise qualitativa dos algoritmos de controlo propostos . . . . . . . . 141

6 Conclusoes finais e trabalho futuro 147

6.1 Conclusoes finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147

6.2 Trabalho futuro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148

Apendices 149

A Modelo matematico para o atracurio 149

A.1 Modelo compartimental do atracurio . . . . . . . . . . . . . . . . . . . 149

Page 18: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

A.1.1 Modelo farmacocinetico . . . . . . . . . . . . . . . . . . . . . . 149

A.1.2 Modelo farmacodinamico . . . . . . . . . . . . . . . . . . . . . . 151

A.1.3 A equacao de disposicao . . . . . . . . . . . . . . . . . . . . . . 153

A.2 Variabilidade interindividual . . . . . . . . . . . . . . . . . . . . . . . . 154

A.2.1 Modelos farmacocineticos individuais . . . . . . . . . . . . . . . 154

A.2.2 Modelos farmacodinamicos individuais . . . . . . . . . . . . . . 154

A.2.3 Analise comparativa entre os casos reais e os modelos disponıveisna literatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156

B Controlo automatico do bloqueio neuromuscular em ambiente clınico163

C Identificacao de sistemas - modelacao caixa preta 165

C.1 Modelacao caixa preta . . . . . . . . . . . . . . . . . . . . . . . . . . . 165

C.1.1 Introducao: modelos de diferentes cores . . . . . . . . . . . . . . 165

C.1.2 Caracterısticas elementares dos modelos caixa preta . . . . . . . 166

C.1.3 Tecnicas de estimacao e propriedades basicas . . . . . . . . . . . 168

C.1.3.1 Criterio de ajuste . . . . . . . . . . . . . . . . . . . . . 168

C.1.3.2 Convergencia quando N −→∞ . . . . . . . . . . . . . 169

C.1.3.3 Distribuicao assimptotica . . . . . . . . . . . . . . . . 169

C.1.4 Escolha do “tipo” e “tamanho” do modelo . . . . . . . . . . . . 169

C.1.4.1 Compromisso entre polarizacao-variancia . . . . . . . . 169

C.1.4.2 Procedimento a seguir na pratica . . . . . . . . . . . . 170

C.1.5 Modelos caixa preta lineares . . . . . . . . . . . . . . . . . . . . 170

C.1.5.1 Modelos lineares gerais . . . . . . . . . . . . . . . . . . 170

C.1.5.2 Modelos lineares de entrada-saıda . . . . . . . . . . . . 171

C.1.5.3 Modelos lineares de variaveis de estado . . . . . . . . . 172

C.1.6 Modelos nao lineares caixa preta . . . . . . . . . . . . . . . . . . 172

C.1.6.1 Modelos caixa preta . . . . . . . . . . . . . . . . . . . 172

C.1.6.2 Serie de potencias . . . . . . . . . . . . . . . . . . . . 174

Page 19: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

C.1.6.3 Polinomios de Chebyshev . . . . . . . . . . . . . . . . 174

C.1.6.4 B-splines . . . . . . . . . . . . . . . . . . . . . . . . . 175

C.1.6.5 Redes neuronais . . . . . . . . . . . . . . . . . . . . . 175

D Lema Tecnico Chave 177

E Relacao entre a sensibilidade na variacao de parametros e o erro deestimacao 179

Referencias 183

Page 20: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram
Page 21: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

Capıtulo 1

Introducao

1.1 Motivacao

A engenharia do controlo tem sido o suporte de avancos tecnologicos em diversas areasdo conhecimento, nomeadamente, a engenharia aeroespacial, quımica, electronica,comunicacoes, transportes e de redes. O impacto na medicina moderna tem sido,no entanto, menos significativo, devido aos desafios particulares encontrados pelacomplexidade inerente aos sistemas biologicos.

Westenskow (1986) efectuou uma revisao da investigacao que decorreu nos anos oitentasobre a aplicabilidade clınica do controlo em malha fechada. Este autor destacou,em particular, as poupancas de tempo e de trabalho que se podem obter em algumasaplicacoes, nomeadamente, na regulacao dos nıveis da glucose, no controlo do bloqueioneuromuscular e na regulacao da pressao sanguınea.

Os autores Seiver (2003) e Parker e Doyle (2001) efectuaram uma revisao sobreas aplicacoes do controlo na area de medicina. De entre as aplicacoes descritas,destacam-se a optimizacao do tratamento por quimioterapia, o desenvolvimento dedispositivos para assistencia a actividade cardiovascular e o controlo em malha fechadada administracao de farmacos para regular diversas variaveis fisiologicas.

A farmacologia clınica e uma das areas da medicina na qual a modelacao matematicadesempenha um papel determinante. Os modelos matematicos usados sao os chamadosmodelos compartimentais. Na Figura 1.1 apresenta-se o diagrama de blocos do modeloPK/PD (PharmacoKinetics/PharmacoDynamics) de um farmaco. O modelo encontra--se dividido em duas partes: a farmacocinetica (PK), que caracteriza as relacoes deabsorcao, distribuicao, metabolizacao e eliminacao do farmaco e a farmacodinamica(PD), que caracteriza os efeitos induzidos pelo farmaco e a relacao entre a concentracaode farmaco e o efeito produzido.

Os modelos lineares que descrevem a cinetica dos farmacos (farmacocinetica) sao

Page 22: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

22 Introducao

doseuCompartimentoEfeitoCompartimentoEfeito NMB [%]Equação de HillEquação de Hill

Compartimento 1C1, V1Compartimento 1C1, V1 CompartimentoC2, V2CompartimentoC2, V2farmacocinética (PK)

farmacodinâmica (PD)

doseuCompartimentoEfeitoCompartimentoEfeito NMB [%]Equação de HillEquação de Hill

Compartimento 1C1, V1Compartimento 1C1, V1 CompartimentoC2, V2CompartimentoC2, V2farmacocinética (PK)

farmacodinâmica (PD)

Figura 1.1: Modelo (compartimental) PK/PD de um relaxante muscular.

caracterizados por um sistema de equacoes de estado do tipo

c(t) = Ac(t), c(0) = c0, t ≥ 0, (1.1)

em que c ∈ IRn representa as concentracoes nos diversos compartimentos. Os parametrosfarmacocineticos, elementos da matriz A, sao estimados ajustando os modelos aosdados. Um dos metodos usados frequentemente para estimar os parametros far-macocineticos e o metodo da maxima verosimilhanca (Davidian e Giltinan 1995).Neste tipo de analise assume-se uma distribuicao estatıstica para o erro de predicao edepois determinam-se os valores dos parametros que maximizam a verosimilhancados resultados observados. Assuma-se, por exemplo, que se tinha efectuado umestudo com um unico paciente, ao qual tinha sido administrado um bolus (grandequantidade de farmaco administrada num curto espaco de tempo) e posteriormenterecolhido 10 amostras de sangue ao longo do tempo. Admitindo que o erro de predicaoapresenta uma distribuicao Gaussiana, a verosimilhanca dos resultados observados seraproporcional a

N∏i=1

1√2π σ2

e−EP 2i /2σ2

, (1.2)

em que EPi e o erro de predicao da i-esima observacao e e dado por EPi = Cpi −Cmi, em que Cpi e a concentracao de farmaco predita e Cmi e a concentracao defarmaco registada; σ2 e a variancia da (assumida) distribuicao Gaussiana dos erros depredicao e N e o numero de observacoes (concentracoes registadas). Ao maximizar aexpressao (1.2) (usualmente, o logaritmo de (1.2)), em relacao aos parametros farma-cocineticos e com respeito ao parametro σ, conseguem-se estimar os parametros quemaximizam a verosimilhanca das concentracoes medidas. Quando se tentam validar os

Page 23: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

1.1 Motivacao 23

modelos obtidos seguindo este procedimento, verifica-se que nao sao representativosda variabilidade observada nos pacientes, como se descreve no Apendice A. Estaconstatacao motivou o desenvolvimento de metodos de identificacao que usam os dadosrecolhidos no bloco operatorio, em malha aberta e em malha fechada, para identificarum modelo ajustado ao paciente em causa.

Um modelo que mostrou ser adequado para representar o efeito de varios farmacose a chamada equacao de Hill. Quando o farmaco e um relaxante muscular e oefeito induzido corresponde ao bloqueio neuromuscular (caso em estudo no presentetrabalho) a equacao de Hill e dada por (Weatherley, Williams e Neill 1983),

r(t) =100

1 +(

ce(t)c50

)s , (1.3)

em que ce(t) e a concentracao de farmaco no chamado compartimento efeito, c50

corresponde ao valor da concentracao para o qual se obtem 50% do efeito induzidoe s e um parametro adimensional responsavel pela forma sigmoidal da curva carac-terıstica do farmaco (r(t) = 0% corresponde a inducao completa de relaxamento er(t) = 100% corresponde a ausencia de relaxamento induzido). Em farmacologiaclınica, os parametros (c50, s) sao estimados seguindo um procedimento identico aodescrito acima para estimar os parametros farmacocineticos. No entanto, na praticaclınica, em particular, no bloco operatorio, nao e viavel registar em tempo real aconcentracao de um determinado farmaco. Esta situacao justifica o desenvolvimentode metodos para a estimacao de parametros de modelos compartimentais em temporeal. Na literatura referem-se diversos metodos para a estimacao off-line de parametrosfarmacocineticos (Amisaki e Eguchi 1999), mas nao aparecem descritos metodos paraa estimacao de parametros farmacocineticos e farmacodinamicos em tempo real.

Os modelos constituıdos por um bloco linear em serie com um bloco nao linear dizem-se modelos de Wiener. Na Figura 1.2 ilustra-se um sistema que integra algoritmos deidentificacao e de controlo para sistemas de Wiener e que constitui a aplicacao prefe-rencial dos metodos propostos neste trabalho. E um sistema de controlo automaticodo bloqueio neuromuscular.

O controlo automatico do bloqueio neuromuscular ja se encontra em funcionamento emambiente clınico no Hospital Geral de Santo Antonio (ver Apendice B). Tendo sidocomprovada a aplicabilidade clınica, a motivacao para a presente tese consistiu emdesenvolver novos algoritmos de controlo, nomeadamente controladores adaptativosbaseados em modelos parametricos identificados em tempo real e em malha fechada demodo a melhorar o desempenho na presenca de incerteza, e.g, dinamica nao modelada,variacao de parametros, etc, explorando a estrutura de Wiener dos sistemas em causa.

Nas ultimas duas decadas tem sido desenvolvidos diversos controladores que visam ocontrolo do bloqueio neuromuscular (Bradlow, Uys e Rametti 1986, Wait, Goat e Blogg1987, Mendonca, Lemos e Lago 1989, Lemos, Mendonca e Mosca 1991, Kansanaho eOlkkola 1996, Lago, Mendonca e Goncalves 1998, Mahfouf e Linkens 1998, Shieh,

Page 24: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

24 Introducao

PACIENTE

MÓDULO DE LEITURA

SISTEMA DE CONTROLO DO BLOQUEIO

NEUROMUSCULAR

MODELO de Wiener DO PACIENTE

PK/PD linear Eq. de Hill

IDENTIFICAÇÃO

CONTROLO

BOMBA PERFUSORA

Taxa de infusão de fármaco Nível de bloqueio registado

Figura 1.2: Diagrama de blocos de um sistema de controlo automatico do bloqueioneuromuscular.

Fan, Chang e Liu 2000, Mendonca, Lago, Magalhaes, Neves e Rocha 2002). Embora omodelo PK/PD do farmaco apresente uma estrutura de Wiener, na generalidade dosalgoritmos de controlo descritos na literatura assume-se um modelo linearizado emtorno de um ponto de funcionamento. Esta constatacao motivou o dimensionamentode controladores preditivos adaptativos de modo a explorar a estrutura nao linear dossistemas de Wiener.

1.2 Estrutura da tese

A tese comeca com um capıtulo introdutorio em que se formula o problema a tratar.Sao descritos os metodos de identificacao e de controlo que foram desenvolvidos nopassado para este tipo de aplicacoes, fazendo-se uma revisao do chamado estado daarte. Neste capıtulo tambem sao descritas as contribuicoes originais desta tese.

No Capıtulo 2 sao propostos diversos metodos para a identificacao de sistemas comestrutura de Wiener, nomeadamente: metodos de optimizacao, em que se incorporao conhecimento que existe sobre a estrutura dos modelos e metodos baseados emparametrizacoes lineares nos quais os modelos de regressao obtidos sao lineares nosparametros a estimar. Os metodos de identificacao propostos sao depois validadoscom dados previamente obtidos em ambiente clınico. Mostra-se, por simulacao, queos modelos identificados com dados obtidos em malha fechada fornecem uma boapredicao da resposta do paciente no futuro. Este facto e relevante porque permitedisponibilizar, em tempo real, uma previsao da resposta individual do paciente parauma dada taxa de infusao de farmaco. Esta informacao pode ser util se integrada num

Page 25: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

1.3 Contribuicoes originais desta tese 25

sistema de apoio a decisao do clınico a desenvolver no futuro. Finalmente, descreve-seum procedimento para identificar modelos aqui designados como Wiener robustos. Aideia subjacente e o uso de dados obtidos em tempo real de forma a actualizar ao longodo tempo uma cintura de confianca para as observacoes futuras. Mediante um criterioestatıstico robusto, este algoritmo podera ser usado para detectar, por exemplo, falhasnas leituras dos sensores.

No Capıtulo 3 sao propostos diversos algoritmos de controlo para sistemas de Wienerbaseados em modelos de referencia. Sao estabelecidas diversas hipoteses sobre o mo-delo e desenvolvidas leis de controlo adequadas. Nas diversas estrategias apresentadasnunca se recorre ao sinal intermedio (entre as partes linear e a nao linear), que seassume nao estar disponıvel para medida. A estabilidade do sistema de controloadaptativo proposto e estabelecida no Capıtulo 4 mediante algumas hipoteses sobre osistema. No caso de nao serem satisfeitas todas as hipoteses, prova-se que mesmo napresenca de incerteza no modelo e possıvel assegurar o seguimento da referencia.

No Capıtulo 5 e avaliado o desempenho dos algoritmos propostos ao longo da tese.Como o caso em estudo e o controlo do bloqueio neuromuscular em pacientes sujeitosa anestesia, as simulacoes foram efectuadas de forma a emular as caracterısticasinerentes ao ambiente clınico, nomeadamente: restricoes na variavel manipulada, ruıdona leitura dos sensores e variacao abrupta de parametros do modelo.

No capıtulo 6 sao explicitadas conclusoes finais e sao apontadas algumas direccoes depesquisa a seguir no futuro.

1.3 Contribuicoes originais desta tese

As contribuicoes originais desta tese, em sıntese, sao:

• Aplicacao de metodos de optimizacao a identificacao de sistemas de Wiener,nomeadamente o metodo de pesquisa direccional que permite incorporar de formaeficiente todo o conhecimento que existe a priori sobre a estrutura do modelo(Seccao 2.2.1.1).

• Desenvolvimento de um metodo de identificacao em malha fechada para modelosPK/PD de farmacos com estrutura de Wiener (Seccao 2.4).

• Desenvolvimento de diversos controladores adaptativos MRAC (Model ReferenceAdaptive Controllers) para sistemas de Wiener (Seccao 3.3).

• Generalizacao dos algoritmos de controlo propostos utilizando o princıpio docontrolo recidivo e um banco de modelos preditivos adaptativos (Seccao 3.4).

• Analise teorica da convergencia e estabilidade dos seguintes sistemas de con-trolo adaptativos: IMRACW - Implicit Model Reference Adaptive Controller for

Page 26: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

26 Introducao

)(tu )(tx )(ty)(θG ),( ηxf

)(tu )(tx )(ty)(θG),( ηxh

Wiener

Hammerstein

)(tu )(tx )(tx′)(θG ),( ηxf

)(ty

Wiener-Hammerstein

)(ζH

Figura 1.3: Modelos nao lineares orientados por blocos mais comuns: Wiener,Hammerstein e Wiener-Hammerstein.

Wiener Models e WFPAC - Wiener Full Parameterization Adaptive Controller.De salientar que na presenca de incerteza (aditiva) no modelo, e ainda possıvelassegurar a estabilidade do sistema (Capıtulo 4).

1.4 Metodos de identificacao de sistemas nao line-

ares de Wiener

Nesta seccao e apresentado o estado da arte no que concerne a identificacao de sistemasnao lineares, sendo dado particular enfase aos metodos para identificacao de sistemascom estrutura de Wiener. Este trabalho insere-se na area de aplicacoes a biomedicina,pelo que na revisao do chamado estado da arte se deu especial atencao aos trabalhosem que se usam metodos para identificar sistemas fisiologicos.

1.4.1 Modelos de Wiener

Um sistema composto por uma rede de elementos dinamicos lineares e elementos naolineares estaticos, pode ser representado por um modelo orientado por blocos. Osmodelos nao lineares orientados por blocos mais comuns sao: os modelos de Wiener,de Hammerstein e de Wiener-Hammerstein, representados na Figura 1.3.

Wiener (1958) considerou uma representacao em serie de Volterra e propos um modelopara um sistema dinamico e invariante no tempo. Consiste em duas operacoes em

Page 27: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

1.4 Metodos de identificacao de sistemas nao lineares de Wiener 27

cascata. O sinal de entrada u(t) e aproximado por uma serie de Laguerre da seguinteforma (u representa a aproximacao de u):

u(t) = A0 L0(t) + . . . + AN LN(t),

em que os Li, i = 0, . . . , N sao polinomios de Laguerre e os coeficientes Ai sao numerosreais.

A saıda e aproximada por uma expansao em serie de Hermite dada por:

y(t) =Na∑a=0

Nb∑

b=0

. . .

Nk∑

k=0

ca,b,...,k Ha(A0)Hb(A1) . . . Hk(AN)

em que ca,b,...,k sao os coeficientes da expansao a estimar e Hi(Aj) e o i-esimo polinomiode Hermite, que tem como argumento o coeficiente de Laguerre Aj. Este modeloe referido na literatura como a representacao ortogonal de Wiener. Do ponto devista fısico, a primeira operacao pode ser considerada como um conjunto de sistemaslineares ligados em paralelo cuja resposta impulsiva e dada pelos termos polinomiais deLaguerre (sistema dinamico linear SIMO - Single Input Multiple Output) e cujas saıdassao os coeficientes de Laguerre. A segunda operacao pode ser considerada como umsistema estatico composto por polinomios de Hermite e blocos de adicao ponderada emultiplicacao. Quando o sinal de entrada e ruıdo branco, os coeficientes ca,b,...,k podemser determinados pela expressao dada por Wiener (1958).

Os modelos de Wiener fazem parte da famılia dos modelos nao lineares que se usamquando os modelos lineares nao conseguem capturar todas as caracterısticas conside-radas relevantes de um sistema. Entre os modelos nao lineares de maior complexidadedestacam-se os modelos NARMAX (Nonlinear AutoRegressive Moving Average modelwith eXogenous variables) e os modelos de Volterra. A popularidade dos modelos deWiener/Hammerstein deve-se em grande medida ao facto de permitirem explicar dadosexperimentais sem grande aumento do grau de complexidade em relacao aos modeloslineares. No diagrama de Venn da Figura 1.4 ilustra-se a relacao entre os modelos maisusados em identificacao. O grau de complexidade e a correspondente capacidade degeneralizacao aumenta do “interior” para o “exterior”, leia-se: dos modelos lineares,comuns aos demais, para os modelos NARMAX.

1.4.2 Estado da arte

Os primeiros investigadores que abordaram o problema da identificacao de sistemasde Wiener foram, provavelmente, Narendra e Gallman (1966). O metodo seguidobaseia-se num procedimento iterativo de mınimos quadrados, em que se actualizamalternadamente os parametros das partes linear e nao linear. Embora nao tenha sidoprovada a convergencia do algoritmo, mostrou-se, atraves de simulacao, que para omodelo de Hammerstein, na maior parte dos casos, o algoritmo converge em poucasiteracoes. O algoritmo revelou-se, no entanto, ineficiente no caso do modelo de Wiener.

Page 28: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

28 Introducao

NARMAX

Volterra

Wiener HammersteinLinear

Figura 1.4: Relacao entre os modelos lineares e nao lineares.

Nas ultimas quatro decadas foram publicados diversos trabalhos sobre identificacaode sistemas de Wiener onde se trata o caso em que a entrada e ruıdo (branco)Gaussiano. Hunter e Korenberg (1986) estimam a parte linear do modelo usandoa funcao de correlacao cruzada e a nao linearidade e representada por um polinomio.Billings e Fakhouri (1982) identificam a resposta impulsional do subsistema lineara partir da funcao de correlacao cruzada entre a entrada e a saıda, obtida a partirda autocorrelacao da entrada, fazendo uso do teorema classico de Bussgang. A naolinearidade e expressa usando uma serie de potencias. Este tipo de abordagem ecomum na identificacao de sistemas fisiologicos.

Kearney e Westwick (1997) efectuaram uma revisao dos metodos de identificacao ateentao desenvolvidos para sistemas fisiologicos. Algumas da estruturas de modelosapresentadas correspondem a bancos de modelos de Wiener, uma vez que o sinalde entrada passa atraves de um banco de filtros lineares e o sinal obtido e depoisaplicado a uma nao linearidade estatica com multiplas entradas, que por sua vez eexpressa como uma expansao de um conjunto de polinomios ortogonais. As estruturasapresentadas na revisao de Kearney e Westwick (1997) sao tambem usadas no livrode Khoo (2000), onde sao ilustrados diversos exemplos de aplicacao de tecnicas deidentificacao e modelacao de sistemas biomedicos.

Como exemplo mais recente da aplicacao de tecnicas de identificacao de sistemas naolineares a sistemas fisiologicos considere-se, e.g., os trabalhos apresentados por Nunes,Mendonca, Amorim, Ferreira e Antunes (2005) e Kim, Sanchez, Rao, Erdogmus,Carmena, Lebedev, Nicolelis e Principe (2006). No primeiro trabalho, foram usadosdiversos tipos de modelos, nomeadamente, modelos de regressao estocasticos, modelosdifusos e redes neuronais, para tentar predizer o retorno ao estado de consciencia em

Page 29: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

1.4 Metodos de identificacao de sistemas nao lineares de Wiener 29

pacientes sujeitos a anestesia. No segundo trabalho, sao usados diversos modelos naolineares, nomeadamente, filtros de Wiener e redes neuronais para tentar mapear arelacao entre a actividade cerebral de macacos em laboratorio e a posicao da mao doanimal quando executa uma tarefa simples, como apanhar comida. Como o conjuntode dados e muito vasto, o uso de tecnicas de subespaco revela-se muito util. Notrabalho de Kim et al. (2006) os registos experimentais correspondem ao registo daactividade em 100-200 neuronios. Sao necessarios milhares de parametros para tentarmapear a actividade motora dos animais, pelo que e imperativo usar tecnicas desubespaco que permitam “descartar” parametros que nao tenham um “peso relevante”no custo que se pretende minimizar.

Os chamados metodos de Subespaco sao usados para identificar a parte linear emWestwick e Verhaegen (1996) onde se mostra que para uma entrada Gaussiana aestimativa e consistente. Em Bruls, Chou, Haverkamp e Verhaegen (1999), usa-seum modelo de variaveis de estado para representar a parte linear e polinomios deChebyshev para parametrizar a nao linearidade. E assim possıvel exprimir o pro-blema de minimizacao do erro de predicao como um problema de mınimos quadradosseparavel, que apresenta melhores propriedades numericas que o problema original. Apesquisa numerica e inicializada a partir da estimativa da parte linear usando o metodoproposto por Westwick e Verhaegen (1996). Os metodos de subspaco tambem foramusados por Lovera (1998) e por Lin, Beck e Bloom (2004). Este ultimo trabalho insere-se no ambito das aplicacoes biomedicas. Os autores comparam a qualidade da predicaoda resposta de um paciente sujeito a anestesia, obtida com modelos lineares porintervalos, com a predicao obtida usando os modelos compartimentais habitualmenteadoptados em farmacologia. Segundo os autores, os modelos lineares por intervalos saomais faceis de integrar em algumas estrategias de controlo, nomeadamente, controlopor escalonamento de ganhos.

No contexto da identificacao de sistemas fisiologicos, alguns autores tentaram obteruma identificacao global do modelo. Assume-se que, em certas condicoes, e possıvelobter uma solucao unica para os parametros desconhecidos do modelo. O metodoapresentado por Audoly, Bellu, Dapos, Angio, Saccomani e Cobelli (2001), recorrea algebra diferencial para obter o conjunto caracterıstico do sistema de equacoesdinamicas que descreve o modelo. Usando tecnicas de algebra numerica, os autoresapresentam um procedimento para resolver o conjunto de equacoes algebricas naolineares resultante. Sendo uma abordagem interessante do ponto de vista formal,apresenta diversos inconvenientes, e.g., e demasiado sensıvel a erros na leitura dossensores.

No presente trabalho foram usados exclusivamente metodos de identificacao parame-tricos. A escolha destes metodos deve-se em grande parte ao facto das parame-trizacoes, quando lineares nos parametros a estimar, permitirem obter uma mini-mizacao explıcita do custo quadratico, geralmente, o erro quadratico medio. A identi-ficacao de sistemas de Hammerstein/Wiener/Hammerstein-Wiener recorrendo a metodosparametricos, tem sido abordada por diversos autores, referem-se alguns, por ordemcronologica: (Wigren 1993, Boutayeb e Darouach 1995, Kalafatis, Wang e Cluett 1997,

Page 30: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

30 Introducao

Bai 1998, Zhu 1999, Hagenblad 1999, Pearson e Pottmann 2000, Fang e Chow 2000,Voros 2001, Kerschner e Kozek 2001, Spilker e Vicini 2001, Bai 2002, Zhu 2002, Lacye Bernstein 2002, Quaglini, Previdi, Contro e Bittanti 2002, Goncalves, Mendonca eLemos 2002, Schoukens, Nemeth, Crama, Rolain e Pintelon 2003, Goncalves, Men-donca e Lemos 2004).

1.5 Controlo automatico do bloqueio neuromuscu-

lar

Os primeiros trabalhos descritos na literatura sobre estrategias de infusao de farmacoscombinadas com a teoria do controlo, devem-se a Bluell, Jellife, Kalaba e Sridhar(1969). A formulacao do problema como podendo ser resolvido com a ajuda decomputadores deve-se a Bellman (1971) e Sheiner, Rosenberg e Melmon (1972). Desdelogo ficou claro que os problemas clınicos nao podem ser todos resolvidos recorrendo acomputadores, mas os computadores sempre se revelaram uteis quando a teoria (nestecaso, do controlo) esta proxima da “realidade”.

Os avancos teoricos na afinacao de controladores para sistemas nao lineares comelevados nıveis de incerteza conduziram ao desenvolvimento, nos ultimos 30 anos,de diferentes estrategias para o controlo do bloqueio neuromuscular. Os controladorespropostos variam desde o simples controlador on-off de Wait et al. (1987) a algoritmosde controlo baseados em metodos adaptativos, robustos, de logica difusa, entre outros.

Na proxima seccao apresenta-se uma sıntese do trabalho mais relevante desenvolvidona area do controlo automatico do bloqueio neuromuscular por diversos grupos deinvestigacao. Da-se particular enfase aos controladores adaptativos por pertencerema categoria de controladores desenvolvidos neste trabalho.

1.5.1 Estado da arte

Nas ultimas decadas desenvolveram-se numerosos controladores autossintonizaveis comaplicacoes a biomedicina. Alguns dos controladores adaptativos desenvolvidos especifi-camente para o bloqueio neuromuscular devem-se a: (Linkens, Menad e Asbury 1985,Bradlow et al. 1986, Jaklitsch e Westenskow 1987, Denai, Linkens, Asbury, MacLeod eGray 1990, Lendl, Geldner e Unbehauen 1999). Um problema inerente a esta aplicacao,diagnosticado desde logo por estes autores e que, durante a fase inicial da inducao dobloqueio neuromuscular, tem que se administrar uma grande quantidade de farmaco,designada por bolus, para que a cirurgia possa ter inıcio. Como consequencia, ocorreinicialmente uma saturacao no efeito produzido, pelo que nao se pode fechar a malhade controlo ate que o nıvel de relaxamento atinja um nıvel adequado. Isto coloca doisproblemas:

Page 31: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

1.5 Controlo automatico do bloqueio neuromuscular 31

• Qualquer dose elevada de farmaco pode causar (novamente) a saturacao navariavel de saıda, devido a natureza nao linear do processo.

• O esquema de identificacao, se for exclusivamente em malha fechada, nao temem conta uma parte chave do registo de dados (a resposta ao bolus inicial) paraidentificar a dinamica do processo.

Os autores Mendonca et al. (1989) foram pioneiros na implementacao de algoritmosde horizonte extendido para o controlo do bloqueio neuromuscular. No seu trabalhode doutoramento, Mendonca (1992), abordou muitos dos problemas subjacentes aocontrolo do bloqueio neuromuscular, tendo efectuado, nomeadamente:

• a avaliacao clınica de um controlador PID. Muitos dos resultados apresentadosate entao referiam-se a resultados de simulacao.

• a introducao do conceito de controlador β-robusto, sendo a sıntese do controladorbaseada no metodo LQG/LTR projectado a partir de um modelo nominal e deuma envolvente de erro (cintura de β confianca).

• o dimensionamento de um controlador adaptativo que incorpora restricoes naentrada; a accao de controlo resulta da minimizacao de um funcional de custoquadratico que incorpora as restricoes da variavel manipulada (Lemos et al.1991).

Mahfouf e Linkens, que pertencem ao grupo de investigacao designado, neste trabalho,por grupo de Sheffield, no Reino Unido, tem dimensionado diversos controladores com oobjectivo de controlar o bloqueio neuromuscular. Numa das suas publicacoes, Mahfoufe Linkens (1998), compilaram varios trabalhos da sua autoria que tem como denomi-nador comum o uso de controladores preditivos adaptativos. Todos os controladoresapresentados fazem uso de algumas caracterısticas que popularizaram o ja classicoalgoritmo GPC (Clarke, Mohtadi e Tuffs 1987), nomeadamente:

• o modelo CARIMA em que se baseia (e que e equivalente a introducao de efeitointegral) e eficiente na abordagem do problema do erro estatico no seguimentoda trajectoria de referencia.

• a possibilidade de predicao do comportamento do processo num horizonte ex-tendido, tendo em conta o atraso do processo.

• a inclusao do objectivo do controlo (funcional de custo), tomando em consi-deracao os “erros futuros” e pesando o esforco na accao de controlo, o queconduz a um controlador que e, simultaneamente, de variancia mınima masque apresenta uma actividade de controlo razoavel.

Page 32: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

32 Introducao

O grupo de controlo designado, neste trabalho, por grupo do Porto, desenvolveuum algoritmo de controlo comutado com multiplos modelos aplicado ao controlo dobloqueio neuromuscular (Mendonca et al. 2002).

Em Goncalves et al. (2004) e proposto um controlador preditivo adaptativo aplicavelao controlo do bloqueio neuromuscular. Neste algoritmo de controlo combina-seidentificacao em tempo real, em que as observacoes sao recolhidas em malha fechada,com a identificacao obtida ainda em malha aberta, fazendo uso da resposta impulsionaldo modelo. Verificou-se que, aquando da resposta a um bolus, os dados disponıveispermitem reduzir a incerteza no modelo, porque e possıvel capturar a dinamica daparte linear. Quando se fecha a malha, usa-se a estimativa obtida ate ao momento,para determinar a curva caracterıstica do farmaco, podendo assim ser usado umcontrolador adaptativo linear.

Mais recentemente, Lemos, Magalhaes, Mendonca e Dionısio (2005), fizeram uso dateoria Bayesiana e abordaram o problema da deteccao de falhas na leitura dos sensores.Os resultados, validados em ambiente clınico, foram muito satisfatorios.

Stadler, Schumacher, Hirter, Leibundgut, Bouillon, Glattfelder e Zbinden (2006),tambem dedicaram especial atencao aos dados recolhidos pelos sensores, tendo va--lidado em ambiente clınico, um controlador baseado na realimentacao do estadoestimado. A particularidade deste trabalho decorre do estudo experimental ter sidoefectuado com caninos e dos autores referirem que efectuaram medicoes diferentes dasrespostas usuais a estimulacao de nervos perifericos.

Relativamente ao controlo automatico de variaveis fisiologicas, para alem do bloqueioneuromuscular, referem-se alguns trabalhos:

Laubscher, Heinrichs, Weiler, Hartmann e Brunner (1994), apresentaram um trabalhoinovador, por se tratar de um controlador adaptativo da ventilacao pulmonar. Segundoos autores, o clınico pode definir o perfil pretendido para a ventilacao alveolar (l/min.)e o controlador dimensionado tenta que a saıda siga a trajectoria de referencia. Osresultados foram validados em ambiente clınico.

Na literatura recente tambem se referem trabalhos em que o objectivo e a glicorre-gulacao, isto e, pretende-se controlar variaveis hemodinamicas e condicionar a meta-bolizacao da glucose. Citam-se alguns trabalhos: (Laubscher et al. 1994, Aufderheide,Rao e Bequette 1999, Rao, Aufderheide e Bequette 2003).

Gentilini, Frei, Glattfedler, Morari, Sieber, Wymann, Schnider e Zbinden (2001)pertencem ao grupo de investigacao designado, neste trabalho, por grupo de Zurique,que tambem se tem dedicado ao dimensionamento de controladores para diversasvariaveis fisiologicas, com a correspondente validacao em ambiente clınico.

Na Tabela 1.1, encontra-se uma lista com as publicacoes acima descritas. As pu-blicacoes estao ordenadas segundo a variavel fisiologica a controlar e dentro de cadacategoria por ano de publicacao.

Page 33: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

1.5 Controlo automatico do bloqueio neuromuscular 33

Controlador Variavel Grupo

Publicacao PID AD. Out. NMB Out. Porto Out.

(Linkens et al. 1985) X X - X - - X(Mendonca et al. 1989) - X - X - X -

(Denai et al. 1990) X X - X - - X(Lemos et al. 1991) - X - X - X -

(Mendonca 1992) X X - X - X -

(Lago et al. 1998) X - - X - X -

(Mahfouf e Linkens 1998) - X - X - X -

(Mendonca et al. 2002) - - X X - X -

(Goncalves et al. 2004) - X - X - Xa -

(Lemos et al. 2005) - - X X - Xa -

(Stadler et al. 2006) - - X X - - X(Laubscher et al. 1994) - - X - Xb - X

(Candas e Radziuk 1994) - - X - Xc - X(Aufderheide et al. 1999) - X - - Xc - X

(Rao et al. 2003) - X - - Xc - X(Gentilini et al. 2001) - - X - X - Xa& INESC IDbventilacaocglicorregulacao

Tabela 1.1: Sumario de publicacoes relacionadas com o controlo automatico devariaveis fisiologicas. Abreviaturas: PID - controladores PID; AD. - algoritmos (decontrolo) adaptativos; NMB - bloqueio neuromuscular; Out. - outros.

Page 34: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram
Page 35: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

Capıtulo 2

Identificacao de sistemasfisiologicos de Wiener

2.1 Introducao

O diagrama de blocos de um modelo de Wiener, apresentado na Figura 2.1, consistenum elemento dinamico linear em serie com um elemento nao linear estatico. Neste

)(tu )(tx )(ty)(θG ),( ηxf

Figura 2.1: Modelo de Wiener: o sistema linear e parametrizado por um vector deparametros θ e a nao linearidade por um vector de parametros η.

Capıtulo apresentam-se metodos para a identificacao de sistemas fisiologicos de Wie-ner, em particular, para a estimacao de parametros de modelos PK/PD de farmacos. Avariabilidade intra- e interindividual inerente a modelos PK/PD de farmacos, descritano Apendice A faz com que os parametros do modelo (desconhecidos ou variantes notempo) tenham que ser estimados. Ver-se-a mais adiante neste capıtulo que a identi-ficacao em tempo real e durante grande parte do tempo em malha fechada do modeloPK/PD de um farmaco (relaxante muscular) esta sujeita a fortes condicionantes, e.g.,os sinais usados na identificacao sao pouco persistentes.

Este Capıtulo esta estruturado do seguinte modo: na seccao 2.2 sao apresentadosmetodos para identificacao de sistemas de Wiener baseados em algoritmos de opti-mizacao. O metodo de pesquisa direccional segue a metodologia inicialmente propostapor Hagenblad (1999), tendo sido adaptado ao caso em estudo de forma a integrar oconhecimento que existe a priori sobre os modelos PK/PD de farmacos. Na seccao 2.3

Page 36: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

36 Identificacao de sistemas fisiologicos de Wiener

apresentam-se algoritmos de identificacao de sistemas de Wiener baseados em parame-trizacoes lineares. Na seccao 2.4 e apresentado um metodo para estimar parametrosde modelos PK/PD de farmacos com estrutura de Wiener. O algoritmo proposto evalidado com dados recolhidos em ambiente clınico. Na seccao 2.5 e apresentado ummetodo para identificar sistemas de Wiener na presenca de incerteza, aqui designadospor sistemas de Wiener robustos. O que se propoe e uma variante de um metodoinicialmente proposto por Skrjanc, Blazic e Agamennoni (2005) que permite definiruma cintura de confianca para as observacoes futuras do sistema de Wiener.

2.2 Algoritmos de optimizacao

A identificacao de modelos “caixa-cinza”, descritos no Apendice C e efectuada emdois passos. Comeca por se desenvolver a estrutura do modelo em coerencia com oconhecimento que existe a priori sobre o sistema. Depois de estabelecido o modelo, osparametros desconhecidos sao estimados minimizando (ou maximizando) um criterioque reflecte o grau de ajuste entre as predicoes obtidas e as leituras observadas.

No caso do sistema de controlo do bloqueio neuromuscular o conhecimento que existea priori sobre o sistema esta, resumidamente, descrito no Apendice A. O farmacousado foi o atracurio e nas simulacoes usou-se o modelo PK/PD proposto por Lagoet al. (1998).

Uma vez estabelecido o funcional de custo que se pretende minimizar, geralmente anorma (Euclidiana) quadratica do vector dos resıduos, o problema da estimacao dosparametros e transformado num problema de optimizacao. O procedimento e ilustradono diagrama de blocos da Figura 2.2.

A escolha do algoritmo de optimizacao e um passo importante. Neste trabalho nao seapresenta um estudo exaustivo do desempenho de diversos algoritmos de optimizacaoporque nao era esse o objectivo principal. O que se fez, conforme referido anterior-mente, foi adaptar ao caso em estudo um algoritmo de identificacao para sistemas deWiener baseado numa pesquisa direccional, proposto para sistemas lineares por Ljung(1999) e estendido para sistemas de Wiener por Hagenblad (1999). Como base decomparacao do desempenho do algoritmo de pesquisa direccional, considerou-se outrometodo de minimizacao numerica, o metodo de simplex de Nelder-Mead (Nelder eMead 1965) que se encontra implementado numa das bibliotecas do MATLAB, versao7.0.1 (2004), software de simulacao usado na preparacao deste trabalho.

A ideia subjacente ao algoritmo de pesquisa direccional que ira ser descrito na proximaseccao e a seguinte: assuma-se que se pretende estimar dois parametros, θ1 e θ2. Nestecaso o custo J e funcao de θ1 e θ2 e quando avaliado nas gamas de variacao dosparametros corresponde a uma superfıcie em IR3. Na Figura 2.3-(a) apresenta-seuma ilustracao dos contornos das curvas de nıvel de uma superfıcie deste tipo. Nosmetodos de pesquisa direccional comeca por se considerar uma estimativa inicial dos

Page 37: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

2.2 Algoritmos de optimizacao 37

)(tu

Sistema Fisiológico

Modelo

ruído de leitura

Saída

Prediçãodo modelo

Algoritmode

Optimização

J

parâmetrosestimadosηθˆˆ ∑= )(2 teJ

Função Critério

Erro

)(te

)(ty

)(typred

Figura 2.2: Diagrama de blocos que ilustra o uso de algoritmos de optimizacao naestimacao de parametros.

parametros, e depois calculado localmente o gradiente e seguem-se sucessivamentedireccoes de “descida rapida” em direccao ao mınimo (global). Alguns metodos usaminformacao sobre a curvatura (i.e., segundas derivadas) da superfıcie. Estes metodosdizem-se metodos de Newton.

Uma desvantagem dos metodos de pesquisa direccional e a necessidade de avaliaras derivadas do custo em relacao a todos os parametros a estimar em cada iteracao.Acresce que se a razao sinal/ruıdo for baixa e a superfıcie J for irregular estes metodospodem conduzir a falsos mınimos locais. Uma alternativa que nao implica o calculo dederivadas e que tambem foi explorada e o chamado algoritmo de simplex de Nelder-Mead (Nelder e Mead 1965). Para um problema de dois parametros a estimar o simplextoma a forma de um triangulo. Os tres vertices do triangulo representam os pontosdo custo que se conhecem em cada iteracao do algoritmo. Comeca-se com tres pontosdo custo, depois o triangulo e reflectido sobre o segmento que une os vertices a quecorresponde um custo menor e a altura do triangulo e contraıda/expandida de modoa que ao vertice restante corresponda o menor custo possıvel. Este procedimento erepetido sucessivamente ate serem validas as condicoes do criterio de paragem consi-derado. A funcao “fminsearch” do MATLAB, versao 7.0.1 (2004), usa o metodo desimplex de Nelder-Mead para determinar o mınimo de uma funcao multidimensional.

Page 38: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

38 Identificacao de sistemas fisiologicos de Wiener

(a)

MínimoGlobal

1J

2J

21 JJ >

(b)

MínimoGlobal

1J

2J

21 JJ >

Figura 2.3: Metodos para encontrar o mınimo de uma funcao de custo: (a) metodode pesquisa direccional; (b) metodo de simplex.

2.2.1 Metodo de pesquisa direccional

Considere-se o diagrama de blocos de um modelo de Wiener ilustrado na Figura 2.1.As estruturas dos blocos nao sao fixas e apenas se assume que o sistema linear Ge parametrizado por um vector θ e a nao linearidade f por um vector η. O sinalintermedio x (Figura 2.1) - que nao esta acessıvel para medida - escreve-se comox(t, θ), uma vez que depende do tempo t e dos parametros θ da parte linear. Quandoa nao linearidade f e parametrizada por η, pode-se predizer y da seguinte forma:

y(t) = f(x(t, θ), η) (2.1)

Como medida da qualidade do modelo e usado o seguinte criterio de erro de predicao:

V (θ, η) =1

N

N∑t=1

(y(t)− f(x(t, θ), η))2. (2.2)

As estimativas dos parametros θ e η sao os argumentos que minimizam o criterio (2.2):

(θ, η) = arg minθ,η

V (θ, η) (2.3)

Geralmente, o criterio (2.2) nao pode ser minimizado analiticamente pelo que e ne-cessario recorrer a metodos numericos na pesquisa do mınimo (Ljung 1999). Umasolucao iterativa e dada por,

(θη

)(i+1)

=

(θη

)(i)

+ α(i)g(i)

onde g(i) e a direccao de pesquisa e α(i) e o tamanho do passo, escolhidos de forma aassegurar que o valor do custo quadratico decresce em cada passo.

Page 39: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

2.2 Algoritmos de optimizacao 39

O calculo da direccao de pesquisa, g(i), depende da informacao disponıvel e e usual-mente baseado

• no valor do custo quadratico;

• no valor de V e do vector gradiente;

• nos valores de V , do gradiente e da matriz Hessiana (classe de algoritmos deNewton).

Para os chamados algoritmos de Newton a direccao de pesquisa e dada por

g(i) = −[V ′′(ζ(i))]−1 V ′(ζ(i)) (2.4)

onde V ′ e o vector gradiente, V ′′ e a matriz Hessiana e ζ = [θ> η>]>.

Na minimizacao do criterio (2.2) usou-se a direccao de pesquisa (2.4) que pode serclassificada de “Newton”, mas modificada, uma vez que se usou uma aproximacao daHessiana. Diz-se que este algoritmo pertence a classe dos algoritmos quasi-Newton,pelo facto da direccao de pesquisa usada nao ser, em rigor, uma “direccao de Newton”.

O calculo do gradiente de (2.2) e efectuado em dois passos. A primeira parte e ocalculo do gradiente com respeito a θ:

V ′θ = − 1

N

N∑t=1

2(y(t)− f(x(t, θ), η)) Ψ(t, θ, η) (2.5)

onde Ψ(t, θ, η) = f ′x(x(t, θ), η) x′θ(t, θ) e a derivada de f com respeito a θ.

As componentes do vector gradiente com respeito a η sao dadas por

V ′η = − 1

N

N∑t=1

2(y(t)− f(x(t, θ), η)) f ′η(x(t, θ), η) (2.6)

O gradiente “total”, V ′, e dado por V ′ =[

V ′θ

V ′η

].

A matriz Hessiana obtem-se derivando (2.5) e (2.6). As entradas da matriz Hessianaque afectam a actualizacao do vector de parametros θ sao dadas por

V ′′(θ) =1

N

N∑t=1

2 Ψ(t, θ, η) Ψ>(t, θ, η)− 1

N

N∑t=1

2 Ψ′(t, θ, η) ε(t, θ, η) (2.7)

em que ε(t, θ, η) , y(t)− f(x(t, θ), η) e o erro de predicao. O segundo termo de (2.7)pode ser excluıdo se o mınimo fornecer erros de predicao independentes. Neste caso,

Page 40: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

40 Identificacao de sistemas fisiologicos de Wiener

torna-se mais facil o calculo da matriz Hessiana e, simultaneamente, assegura-se quea matriz e semidefinida positiva.

No exemplo que se segue, adaptado de um exemplo apresentado por Ljung (1999),descreve-se o procedimento para o calculo do gradiente Ψ(t, θ, η) da equacao (2.5).Recorde-se que Ψ(t, θ, η) = f ′x(x(t, θ), η) x′θ(t, θ). O calculo de x′θ(t, θ) justifica umaexplicacao mais detalhada.

Exemplo 2.1 (Calculo do gradiente da parte linear de um modelo de Wie-ner)

Assuma-se que a estrutura da parte linear do modelo de Wiener e do tipo OE (Ljung1999). Neste caso e assumindo um atraso unitario no sistema, tem-se:

x(t, θ) =B(q−1)

A(q−1)u(t)

=b1q

−1 + · · ·+ bnbq−nb

1 + a1q−1 + · · ·+ anaq−nau(t),

(2.8)

∂x

∂bk

(t, θ) =q−k

A(q−1)u(t) (2.9)

∂x

∂ak

(t, θ) = − B(q−1)

(A(q−1))2q−k u(t) = − q−k

A(q−1)x(t, θ) (2.10)

Se a equacao (2.8) for reescrita na forma de modelo de regressao, sendo o regressordado por,

φ>(t, θ) = [ u(t− 1) . . . u(t− nb) − x(t− 1, θ) . . . − x(t− na, θ) ],

resulta:

x′θ(t, θ) =1

A(q−1)φ(t, θ). (2.11)

O calculo de x′θ corresponde a filtrar o regressor atraves do filtro (estavel)1

A(q−1).

2.2.1.1 Estimacao parametrica do modelo PK/PD do atracurio

Nesta seccao apresentam-se resultados de simulacao obtidos quando se usa o algoritmode pesquisa direccional descrito na seccao 2.2.1 na identificacao de sistemas de Wiener,em particular, sistemas fisiologicos de Wiener.

Page 41: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

2.2 Algoritmos de optimizacao 41

G(q−1) η = [ c50 s ]>

M?10−4 ∗ 0.098 q−1 +0.265 q−2−0.263 q−3−0.079q−4

1−3.63 q−1 +4.94 q−2−2.982 q−3+0.673 q−4 [ 0.653 3.989 ]>

M0 G?(q−1) [ 1.25 10 ]>

M G?(q−1) [ 0.599 1.82 ]>

Tabela 2.1: Algoritmo de pesquisa direccional: Modelo “verdadeiro”, M? vs.estimativa inicial, M0 vs. modelo identificado, M . Neste exemplo so os parametrosc50 e s da equacao de Hill- (5.4) sao estimados.

No caso do sistema de controlo do bloqueio neuromuscular, um dos farmacos usadosno bloco operatorio e o atracurio. O modelo matematico do atracurio encontra-sedescrito no Apendice A. O modelo do atracurio consiste num elemento dinamicolinear, composto por tres “compartimentos”, a que estao associadas tres equacoesdiferenciais, descritas por (A.4) e (A.5) e por um elemento nao linear estatico dadopela equacao de Hill, (A.8). Pelos motivos apresentados na seccao A.2.3 o modelo daparte linear usado nas simulacoes e de ordem 4.

O calculo da direccao de pesquisa (2.4) para o modelo PK/PD do atracurio justificauma explicacao mais detalhada:

O calculo do gradiente relativo a parte linear do modelo de Wiener e efectuado seguindoum procedimento identico ao descrito no Exemplo 2.1. O vector η no caso do bloqueioneuromuscular e dado por: η = [ c50 s ]>.

As componentes do vector gradiente com respeito a η sao dadas por

V ′η = − 1

N

N∑t=1

2(y(t)− f(x(t, θ), η)) f ′η(x(t, θ), η),

em que o vector f ′η(x(t, θ), η), no caso do bloqueio neuromuscular e dado por:

f ′η(x(t, θ), η) = [ f ′c50(x(t, θ), c50, s) f ′s(x(t, θ), c50, s) ]>, (2.12)

com,

f ′c50(x(t, θ), c50, s) =100 ·

(s

c50

)·(

x(t,θ)c50

)s

[1 +

(x(t,θ)c50

)s ]2 (2.13)

f ′s(x(t, θ), c50, s) = −f ′c50(x(t, θ), c50, s) ·(c50

s

)· ln

(x(t, θ)

c50

)(2.14)

Page 42: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

42 Identificacao de sistemas fisiologicos de Wiener

0 20 40 60 80 100 1200

10

20

30

40

50

60

70

80

90

100

Time(min)

r(t) %

r(t)

rinicial (t); MSEinicial=846.5029

rfinal (t); MSEfinal=122.0438

Figura 2.4: Algoritmo de pesquisa direccional: comparacao da resposta ao bolus inicialdos modelos M?, M0 e M , respectivamente, modelo “verdadeiro”, estimativa iniciale modelo identificado. Neste exemplo, a parte linear e comum aos tres modelos (verTabela 2.1).

Figura 2.5: Custo quadratico V (θ, c50, s) no plano (c50, s), quando o vector deparametros θ da parte linear do modelo de Wiener e considerado igual a θ?. Atrajectoria apresentada corresponde a evolucao das estimativas dos parametros c50

e s quando se usa o algoritmo de pesquisa direccional na estimacao dos parametros.

Page 43: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

2.2 Algoritmos de optimizacao 43

O desempenho do algoritmo de pesquisa direccional depende fortemente da informacaoque chega ao algoritmo. No Apendice E descreve-se a relacao inversa que existe entrea sensibilidade na variacao de parametros e o erro de estimacao. No caso do modeloPK/PD do atracurio, o nıvel de bloqueio neuromuscular e dado por:

r(t) =100

1 +[

ce(t)c50

]s (2.15)

Quando ce(t) ≈ 0, a saıda r(t) e pouco sensıvel a variacao dos parametros c50 e so que faz com que as componentes do vector gradiente (2.12) sejam nulas. Comoconsequencia, o algoritmo apresenta um mau desempenho. Para ilustrar este factoconsiderou-se um exemplo em que se assume conhecer a parte linear do modelo ea minimizacao do criterio quadratico (2.2) tem que ser conseguida “a custa” dosparametros da parte nao linear, c50 e s. Os resultados da simulacao sao apresentadosnas Figuras 2.4 e 2.5 e na Tabela 2.1. Os dados usados na identificacao correspondema resposta a um bolus de 500µg/kg/min do modelo 1 do banco de modelos apresentadona Tabela A.3.

O desempenho do algoritmo e satisfatorio. Sendo a solucao do custo quadratico dadapor ( θ?, 0.653, 3.989 ), a estimativa que se obtem e ( θ?, 0.599, 1.82 ). Para o parametros, o erro de estimacao, s, dado por, s = 3.989 − 1.82, e elevado. A explicacao paraeste facto decorre da pouca sensibilidade do custo quadratico, V (θ, c50, s), ilustrado naFigura 2.5, a variacoes do parametro adimensional s. Este facto tambem e evidenciadopela Figura 2.6, em que se faz uma analise de sensibilidade do custo quadraticoV (b0, b1, b2, b3, a1, a2, a3, a4, c50, s) a variacoes num parametro da parte linear, a1 e avariacoes nos parametros c50 e s. Considera-se uma variacao de ±50% em relacao aovalor nominal para cada parametro em analise; os outros parametros sao mantidosnos seus valores nominais. Constata-se que a sensibilidade do custo a variacoes noparametro a1 e muito superior a sensibilidade verificada em relacao aos parametros c50

e s. Esta observacao justifica o pior desempenho do algoritmo de pesquisa direccionalna estimacao dos parametros da parte nao linear. O bom desempenho do algoritmona estimacao dos parametros da parte linear, (b0, b1, b2, b3, a1, a2, a3, a4), e evidenciadono proximo exemplo de simulacao apresentado.

Os resultados da simulacao sao apresentados na Figura 2.7 e na Tabela 2.2. Nestecaso usou-se como estimativa inicial o modelo 16 do banco de modelos de Lago et al.(1998). Escolheu-se este modelo por ser o modelo do banco que apresenta um atrasomaior na resposta a um bolus inicial comparativamente com o modelo 1 do bancoque e o modelo “verdadeiro”. Como se pode verificar pelas respostas apresentadasna Figura 2.7, em particular, nos primeiros 10 minutos, a dinamica da parte linear ecaptada pelo algoritmo.

Em conclusao, o algoritmo de pesquisa direccional apresentado para a identificacaode sistemas de Wiener quando aplicado ao caso de estudo apresenta um desempenhorazoavel. A (quase) saturacao da nao linearidade nos trocos em que a caracterıstica

Page 44: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

44 Identificacao de sistemas fisiologicos de Wiener

−50 −40 −30 −20 −10 0 10 20 30 40 500

50

100

150

200

250

% variação sobre o valor nominal do parâmetro

V(a

1),

V(c

50),

V(s

)a1

c50

s

Figura 2.6: Sensibilidade do custo quadratico a variacao de parametros do modeloPK/PD do farmaco.

0 20 40 60 80 100 1200

10

20

30

40

50

60

70

80

90

100

Time(min)

r(t) %

r(t)

rinicial (t); MSEinicial=176.238

rfinal (t); MSEfinal=14.1843

Figura 2.7: Algoritmo de pesquisa direccional: comparacao da resposta ao bolus inicialdos modelos M?, M0 e M , respectivamente, modelo “verdadeiro”, estimativa iniciale modelo estimado. A resposta ao bolus inicial do modelo M0 apresenta um atrasorelevante (ver 10 minutos iniciais) relativamente ao modelo “verdadeiro”, M1 ≡ M?.

Page 45: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

2.2 Algoritmos de optimizacao 45

G(q−1) η = [ c50 s ]>

M?10−4 ∗ 0.098 q−1 +0.265 q−2−0.263 q−3−0.079q−4

1−3.63 q−1 +4.94 q−2−2.982 q−3+0.673 q−4 [ 0.653 3.989 ]>

M0 10−5 ∗ 0.1643 q−1 +0.4683 q−2−0.4586 q−3−0.1452q−4

1−3.792 q−1 +5.389 q−2−3.402 q−3+0.805 q−4 [ 0.623 4.36 ]>

M 10−4 ∗ 0.016 q−1 +0.218 q−2−0.437 q−3 +0.205q−4

1−3.485 q−1 +4.52 q−2−2.58 q−3+0.545 q−4 [ 0.1 17.43 ]>

Tabela 2.2: Algoritmo de pesquisa direccional: Modelo “verdadeiro”, M? vs.estimativa inicial, M0 vs. modelo estimado, M . A estimativa inicial, M0, correspondeao modelo “16”, M16, do banco de modelos, que apresenta uma dinamica linear muitodistinta do modelo “verdadeiro”, M1 ≡ M?.

nao linear e mais evidente condiciona o desempenho do algoritmo. Este algoritmopode ser util na identificacao de outros sistemas fisiologicos de Wiener desde que asensibilidade a variacoes nos parametros do modelo seja elevada.

2.2.2 Metodo de Simplex de Nelder-Mead -identificacao do sistema de controlo do NMB

O raciocınio subjacente ao metodo de Simplex de Nelder-Mead ja foi descrito naintroducao da seccao 2.2. Este metodo encontra-se implementado no MATLAB, versao7.0.1 (2004), nomeadamente, na rotina “fminsearch”. Foi usado no caso em estudopara tentar contornar o problema da pouca sensibilidade do custo quadratico (2.2)a variacoes nos parametros a estimar. Neste metodo a minimizacao do funcional decusto e conseguida sem se recorrer ao calculo de derivadas, constituindo por isso umaalternativa ao metodo de pesquisa direccional.

Para se poder comparar o desempenho dos metodos de optimizacao acima descritosefectuaram-se diversas simulacoes. Apresenta-se o resultado de duas simulacoes quepermitem evidenciar diferencas no desempenho dos dois metodos quando aplicados aocaso de estudo.

Quando se usa a resposta de um modelo do banco a um bolus de 500 µg/kg/minna estimacao dos parametros da parte nao linear, η, assumindo que se conhecem osparametros θ da parte linear, constata-se que o metodo de simplex de Nelder-Meadpermite obter melhores resultados; neste caso, o erro de estimacao para os parametrosc50 e s e quase nulo (Figura 2.8).

Para um exemplo de simulacao identico ao apresentado na Figura 2.7 e na Tabela 2.2,em que se pretendia testar o desempenho do metodo de pesquisa direccional na es-timacao dos parametros da parte linear, constatou-se que o algoritmo de Simplex deNelder-Mead apresenta um desempenho semelhante.

Page 46: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

46 Identificacao de sistemas fisiologicos de Wiener

0 20 40 60 80 100 1200

20

40

60

80

100

tempo (min)

r(t)

%

η0 = [ 1.25 10 ]

η? = [ 0.653 3.99 ]

η = [ 0.653 3.98 ]

# iterações=48algoritmo : SimplexNelder−MeadMSE=1.44

Figura 2.8: Algoritmo de Simplex de Nelder-Mead: comparacao da resposta aobolus inicial dos modelos M? e M , respectivamente, modelo “verdadeiro” e modeloidentificado. Neste exemplo, a parte linear e comum aos dois modelos.

No sistema de controlo automatico do nıvel de bloqueio neuromuscular, e frequente atrajectoria de referencia ser constante. Estudou-se o desempenho de ambos os metodosde optimizacao caso se considere uma linearizacao da equacao de Hill (2.15) em tornode um ponto de funcionamento, (ce0, r0) (µg/ml, %), que se assume conhecido. Numavizinhanca de (ce0, r0), o nıvel de bloqueio neuromuscular, pode ser dado por,

r(t) ≈ r0 +dr

dce

∣∣∣∣ce=ce0

· (ce(t)− ce0)

em que ce(t) e a concentracao de farmaco no compartimento de efeito. Seja

α0 , dr

dce

∣∣∣∣ce=ce0

um parametro desconhecido que se pretende estimar. O custo quadratico que sepretende minimizar depende agora de nove parametros: ( b0, b1, b2, b3, a1, a2, a3, a4, α0 ).

Na Figura 2.9 apresentam-se os resultados obtidos com o metodo de Nelder-Mead.Usaram-se os primeiros 100 minutos do registo na identificacao do modelo e os 128 mi-nutos restantes foram usados na validacao do modelo linearizado (estimado). Constata--se que a predicao e boa enquanto o nıvel medio de bloqueio neuromuscular se si-tua num valor proximo de 10%, quando o desvio padrao do erro de seguimentoaumenta, o ponto de funcionamento deixa de ser (ce0, r0) e a predicao deixa deser fiavel. Esta abordagem so faz sentido na pratica se forem considerados outrospontos de funcionamento num sistema de escalonamento de ganhos a serem estimados.Esta ultima abordagem tambem foi explorada e sera apresentada mais adiante neste

Page 47: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

2.3 Algoritmo de identificacao baseado emparametrizacoes lineares 47

(a)

0 50 100 150 200 250−20

0

20

40

60

80

100

120

tempo(min)

r(t)

%

Horizonte de Predição

(b)

0 50 100 150 200 2500

5

10

15

20

25

30

35

tempo(min)

u(t

)(µ

g/k

g/m

in)

Figura 2.9: Algoritmo de Simplex de Nelder-Mead- Predicao do NMB em malhafechada: (a) resposta do paciente “real” vs. predicao (linha a tracejado) obtida com oalgoritmo de Nelder-Mead; (b) taxa de infusao de farmaco administrada ao paciente“real” (omitiu-se o bolus inicial).

Capıtulo ainda que nao seja designada por escalonamento de ganhos. Recorre-se a umaparametrizacao da equacao de Hill por B-splines (segmentos lineares) cujos coeficientessao estimados.

2.3 Algoritmo de identificacao baseado em

parametrizacoes lineares

Considere-se o modelo de Wiener (Figura 2.1) representado por

x(t) = φ>(t) θ + φ>u(t) θu + v(t)

y(t) = f(x(t)) + e(t)(2.16)

em que φ>(t) = [ u(t) u(t − 1) . . . u(t − n) ] e o regressor principal, θ e o vector deparametros e φ>u(t) = [ u(t − n − 1) . . . ] e θu representam a dinamica nao modeladaque (se assume) satisfaz, ||θu|| ≤ ε, onde || · || e a norma Euclidiana.

Os ruıdos aditivos, v(t) e e(t), representam, respectivamente, o ruıdo no processo e oruıdo na medicao do sinal de saıda. Assume-se que v(t) e e(t) sao uma sequenciade variaveis aleatorias mutuamente independentes e identicamente distribuıdas (i.i.d.).Apenas u e y estao acessıveis para medida, nao podendo a variavel intermedia x sermedida directamente. O sistema assume-se BIBO (Bounded Input Bounded Output)estavel e ainda: ||θ||+ ||θu|| < ∞.

Page 48: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

48 Identificacao de sistemas fisiologicos de Wiener

2.3.1 Parametrizacao do modelo de Wiener

No caso em estudo neste trabalho, a funcao nao linear f(·) do modelo de Wiener(Figura 2.1) representa a resposta em estado estacionario de um dado paciente aofarmaco, sendo portanto uma funcao estritamente monotona (quanto maior for ataxa de infusao de farmaco maior e o impacto no bloqueio neuromuscular). Estapropriedade e usada, e.g., por Hagenblad (1999) no desenvolvimento de algoritmos deidentificacao eficientes para sistemas de Wiener. Os aspectos inovadores introduzidosnesta seccao dizem respeito a caracterizacao do ruıdo e ao uso de algoritmos demınimos quadrados com projeccao, descritos, e.g., em Goodwin e Sin (1984), paraevitar problemas de convergencia nas estimativas dos parametros.

Assuma-se que f(·) em (2.16) e uma funcao suave e monotona decrescente na regiaode operacao Ωx de x(t). Em particular, assuma-se que

−∞ < β ≤ ∂f/∂x ≤ β < 0, ∀x ∈ Ωx.

Como resultado, f(·) tem uma inversa h(·). Verifica-se facilmente que, se f(x(t)) =kx(t), um dos parametros de θ e redundante. Assuma-se, sem perda de generalidade,que θ e monico, isto e, θ(1) = 1. O sistema de Wiener (2.16) pode ser reescrito comose segue:

x(t) = u(t) + φ>(t) θ + φ>u(t) θu + v(t)

x(t) = h(y(t))− e0(t),(2.17)

em que φ>(t) = [ u(t− 1) . . . u(t− n) ], h(·) e a inversa de f(·) e e0(t) e o erro inferidoa partir do erro de leitura, e(t). O vector de parametros θ reescreve-se como: θ> =[ θ(2) . . . θ(n + 1) ]. Assume-se que θ ∈ Ωθ, com Ωθ convexo e compacto.

As propriedades do algoritmo de identificacao dependem das perturbacoes associadasao sistema. Nas seccoes que se seguem descreve-se a influencia do ruıdo e da incertezaassociada a parametrizacao adoptada na identificacao do sistema de Wiener.

2.3.2 Caracterizacao do ruıdo

A partir de y(t) = f(x(t)) + e(t), tem-se,

h[y(t)] = h[f(x(t)) + e(t)].

Como h(·) e a inversa de f(·), h[f(x(t))] = x(t) e

h[y(t)] = x(t) + h[f(x(t)) + e(t)]− h[f(x(t))].

Assim, e0(t) em (2.17) e dado por

e0(t) = h[f(x(t)) + e(t)]− h[f(x(t))] (2.18)

Page 49: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

2.3 Algoritmo de identificacao baseado emparametrizacoes lineares 49

Como−∞ < β ≤ ∂f/∂x ≤ β < 0, ∀x ∈ Ωx,

tem-se

−∞ < 1/β ≤ ∂h/∂y ≤ 1/β < 0.

Pelo teorema do valor medio, pode-se escrever:

e0(t) = (∂h(z)/∂y) e(t),

para algum z no segmento de recta que une os pontos de abcissa f(x(t)) e f(x(t)) + e(t).Devido a esta dependencia, e0(t) pode nao ter media nula nem ser distribuıdo iden-ticamente mesmo que e(t) seja i.i.d. e tenha media nula. No entanto, sao validas asseguintes propriedades para a sequencia e0(t):

1. Se e(t) e v(t) sao sequencias independentes, entao e0(t) e uma sequenciaindependente.

2. Seja σ2(t) = E[e0(t)− Ee0(t)]2. Entao,

|Ee0(t)| ≤ 1

|β| E|e(t)|, σ2(t) ≤ 1

β2E[e(t)]2, ∀t.

Observe-se que, se e(t) for uma sequencia i.i.d., entao E|e(t)| e E[e(t)]2 sao inde-pendentes de t. Assim, se E|e(t)| = a e E[e(t)]2 = b, pode-se majorar o valor esperadoe a variancia de e0(t), como se segue:

supt|Ee0(t)| ≤ a

|β| , supt

σ2(t) ≤ b

β2.

2.3.3 Estimador de mınimos quadrados

Considere-se uma parametrizacao da inversa da nao linearidade, h(·), dada por h(·, α).Quando se incorporam as parametrizacoes das partes linear e nao linear do modelo deWiener descritas em (2.17) num custo quadratico, pode-se escrever:

J(θ, α) =N∑

t=1

[ h(y(t), α)− u(t)− φ>(t) θ ]2. (2.19)

O objectivo e determinar a estimativa

(θα

)∈ Ω = Ωθ × Ωα ⊆ IRn+nl que minimiza

o criterio J(θ, α), isto e,(θ, α) = arg min

θ∈Ωθ,α∈Ωα

J(θ, α) (2.20)

Page 50: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

50 Identificacao de sistemas fisiologicos de Wiener

Quando se considera conhecida a inversa da nao linearidade, h(·), isto e, para α ∈Ωα fixo, a estimativa θ e dada pelo seguinte estimador de mınimos quadrados semrestricoes,

θ(α) =

(N∑

t=1

φ(t) φ>(t)

)−1 N∑t=1

φ(t) [h(y(t), α)− u(t)] (2.21)

Seguindo um raciocınio semelhante, tambem e possıvel considerar apenas a estimacaodos parametros da inversa da nao linearidade. Neste caso, tem-se: α = arg minα J(θ, α).

Em lugar da abordagem anterior, em que se identificam separadamente os parametrosθ e α, o algoritmo de identificacao descrito por Hagenblad (1999) contempla a identi-ficacao conjunta dos vectores de parametros θ e α.

Considere-se a parametrizacao da inversa da parte nao linear fazendo uso de funcoesde base, e.g., polinomios de Chebyshev ou B-splines (ver seccao C.1.6),

x(t) =nl∑

j=1

αj bj(y(t)) = α>p(t) (2.22)

em que bj(y(t)), j = 1, . . . , nl sao funcoes de base, p(t) = [ b1(y(t)) . . . bnl(y(t)) ]> eα> = [ α1 . . . αnl ].

Seja

ψ>(t) = [ φ(t),−p(t) ]> e Θ =

(θα

)∈ IRn+nl (2.23)

O custo quadratico J(θ, α) dado por (2.19) pode agora ser descrito por

J(Θ) =N∑

t=1

[−u(t)− ψ>(t) Θ ]2. (2.24)

Na implementacao pratica tem que se tomar em conta o atraso no sistema, por issou(t) devera ser substituıdo por u(t− d), em que d e o atraso no processo.

2.3.4 Algoritmos de identificacao

Uma solucao de mınimos quadrados sem restricoes para (2.24) e:

Θ(t + 1) =

(N∑

t=1

ψ(t) ψ>(t)

)−1 N∑t=1

ψ(t) ζ(t), (2.25)

com ζ(t) = −u(t).

Page 51: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

2.3 Algoritmo de identificacao baseado emparametrizacoes lineares 51

O estimador (2.25) pode ser descrito de forma recursiva por:

Θ(t + 1) = Θ(t) + K(t + 1)[ ζ(t)− ψ>(t) Θ(t) ],

K(t + 1) =P (t) ψ(t)

λ + ψ>(t) P (t) ψ(t),

P (t + 1) = [ I −K(t + 1) ψ>(t) ] P (t)/λ,

(2.26)

em que K(t+1) e o denominado ganho de Kalman, P (t+1) e a matriz de covariancia doerro de estimacao e λ e o factor de esquecimento. A chegada de cada nova observacao,a estimativa e actualizada adicionando a estimativa anterior um termo de correccaoobtido multiplicando o ganho K(t+1) pelo erro de predicao ζ(t)−ψ>(t) Θ(t), calculadocom base na estimativa dos parametros conhecida no instante t.

O algoritmo de mınimos quadrados (2.26) e usado frequentemente sem projeccao. Sena implementacao do algoritmo ocorrer, por exemplo, a “deriva” de parametros ou achamada “explosao” da matriz de covariancia, P (t + 1), deve-se incluir um teste deestabilidade no algoritmo. Caso o modelo identificado seja instavel o que se faz napratica e reduzir sucessivamente o termo de correccao K(t + 1)ζ(t).

Para incorporar restricoes nas estimativas dos parametros usa-se em alternativa aoalgoritmo (2.26) um algoritmo recursivo com projeccao:

Θ(t + 1) = ΠΩ[ Θ(t) + K(t + 1)[ ζ(t)− ψ>(t) Θ(t) ] ],

K(t + 1) =P (t) ψ(t)

λ + ψ>(t) P (t) ψ(t),

P (t + 1) = [ I −K(t + 1) ψ>(t) ] P (t)/λ,

(2.27)

em que ΠΩ(x) denota o ponto de Ω “mais proximo” de x e Ω e a regiao admissıvel,Ω = Ωθ × Ωα. Trata-se de um algoritmo de mınimos quadrados com projeccao.

De seguida apresenta-se um exemplo que pretende a ilustrar a aplicacao do algoritmo(2.25) na identificacao de um sistema de Wiener.

Exemplo 2.2 (Exemplo ilustrativo do algoritmo (2.25))

Considere-se um sistema linear de segunda ordem e uma nao linearidade exponencial.O sistema e dado pelas seguintes equacoes:

x(t) =q−1

(1− 0.7q−1)2u(t) (2.28)

y(t) = ex(t) (2.29)

O sinal de entrada, u(t), e uma soma de sinusoides

u(t) =20∑

k=1

sin(kπt/10 + φk) (2.30)

Page 52: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

52 Identificacao de sistemas fisiologicos de Wiener

0 50 100 150 200 250 3000

20

40

60

y

0 50 100 150 200 250 300

−2

−1

0

1

2

u

Figura 2.10: Dados para identificacao.

em que φk e uma variavel estocastica com distribuicao uniforme em [0, 2π]. As 300amostras usadas na identificacao sao apresentadas na Figura 2.10.

Para melhor se analisar o comportamento do algoritmo de identificacao, apresentam-segraficos em que os pontos (x(t), y(t)) se obtem a partir do sinal recuperado x(t) e dosinal medido, y(t). O sinal x(t) pode ser obtido a partir da estimativa do modelo lineare/ou a partir da estimativa da inversa da nao linearidade. Se a estimativa for consis-tente deve-se conseguir visualizar a nao linearidade, neste caso, a exponencial. Casoa estimativa seja pouco precisa, os pontos aparecem dispersos a volta da exponencial.

Neste exemplo de simulacao usou-se um modelo FIR na representacao da parte lineardo modelo de Wiener e como funcoes de base usaram-se polinomios de Chebyshev eB-splines, respectivamente. Na Figura 2.11 apresentam-se os resultados obtidos.

A estimativa da nao linearidade quando se usam B-splines e mais precisa do que aestimativa obtida com polinomios de Chebyshev. Em ambos os casos usaram-se 20parametros FIR e 10 parametros na parametrizacao da inversa da nao linearidade. Oresultado desta simulacao nao permite inferir que se obtem sempre melhores resultadoscom B-splines. Note-se que, na escolha dos nos - assinalados com cırculos no grafico- assegurou-se um “suporte” equitativo a partir dos dados de identificacao, isto e, onumero de amostras disponıveis para a identificacao de cada B-spline e igual. Estaescolha conduziu aos melhores resultados. Isto significa tambem que, quando os dados

Page 53: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

2.4 Identificacao em tempo real do modelo PK/PD do atracurio 53

(a)

−6 −4 −2 0 2 4

0

5

10

15

20

25

30

35

40

45

x

y

(b)

−6 −4 −2 0 2 4

0

5

10

15

20

25

30

35

40

45

x

y

Figura 2.11: y vs. x quando se usam dois tipos de funcoes de base: (a) Polinomios deChebyshev, com n = 20 e nl = 10 e (b) B-splines, com n = 20 e nl = 10.

sao gerados em malha fechada, pode haver problemas dado que esta condicao podeestar longe de ser garantida, dependendo da evolucao temporal da referencia.

Na proxima seccao mostra-se como e que os algoritmos de identificacao anteriormentedescritos - com algumas alteracoes que decorrem da aplicacao - podem ser usados naestimacao parametrica de modelos PK/PD de farmacos.

2.4 Identificacao em tempo real do modelo PK/PD

do atracurio

Uma das principais dificuldades inerentes ao controlo automatico do bloqueio neu-romuscular decorre da incerteza associada ao comportamento dinamico do paciente,que resulta de uma grande variabilidade interindividual. Este facto aparece ilustradona Figura A.4. Para melhorar o desempenho dos controladores dimensionados paraesta aplicacao e conveniente obter modelos ajustados a cada paciente. A tarefa edificultada pelo facto de os sinais disponıveis para identificacao em tempo real serempouco persistentes. A forma encontrada para contornar este problema e a incorporacaode informacao conhecida a priori e o uso de dados recolhidos em tempo real paraajustar o modelo.

O procedimento a seguir pode ser resumido da seguinte forma:

1. O banco de 100 modelos desenvolvido por Lago et al. (1998) permite definirconjuntos de incerteza para os parametros farmacocineticos e farmacodinamicosdo modelo PK/PD do atracurio. De acordo com este banco de modelos e possıvelestabelecer um modelo medio que caracteriza a “populacao”.

Page 54: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

54 Identificacao de sistemas fisiologicos de Wiener

2. O modelo inicial obtido no passo anterior e afinado, se possıvel, com os dadosdisponıveis em tempo real. Diz-se, se possıvel, porque a informacao disponıvelnos primeiros 30 minutos e escassa. Corresponde a resposta impulsiva do modeloque decorre da administracao do chamado bolus inicial.

3. Os passos anteriores permitem “recuperar” o sinal intermedio do modelo deWiener e com isto pode-se inferir a concentracao sanguınea (µg/ml) de farmacoem cada instante de tempo.

4. Recorrendo a parametrizacoes lineares, em particular, a uma parametrizacaoda nao linearidade estatica e a um algoritmo de mınimos quadrados, pode-seactualizar o modelo preditor com dados recolhidos em malha fechada.

A implementacao do procedimento anterior para se obter um modelo PK/PD para oatracurio e bastante intuitiva e descreve-se na proxima seccao.

2.4.1 Procedimento para se obter um modelo inicial

Para se obter um modelo inicial para o atracurio a partir do banco de modelos desen-volvido por Lago et al. (1998), comeca-se por caracterizar a incerteza nos parametrosfarmacocineticos e farmacodinamicos. Para facilitar a analise considere-se a seguintedefinicao de conjunto de incerteza:

Definicao 2.1. Dado um par de parametros (θ1, θ2) ∈ IR2, defina-se o conjunto deincerteza, Ωθ2

θ1, do seguinte modo:

Ωθ2θ1

, [θ1, θ1]⊗ [θ2, θ2],

em que θ1 ∈ [θ1, θ1] e θ2 ∈ [θ2, θ2], sendo ⊗ o produto Cartesiano.

No caso do modelo do atracurio podem-se definir os seguintes conjuntos de incerteza:

• ΩtαA , conjunto de incerteza relativo a distribuicao do farmaco no organismo.

• ΩtβB , conjunto de incerteza relativo a eliminacao do farmaco.

• Ωτtke0

, conjunto de incerteza relativo a aspectos temporais na distribuicao e eli-minacao do farmaco.

Na Figura 2.12 estabelecem-se os conjuntos de incerteza, ΩtαA , Ω

tβB e Ωτ

tke0, tendo por

base o banco de 100 modelos definido por Lago et al. (1998). Os valores mediosdos pares de parametros, (A, tα), (B, tβ) e (tke0, τ), encontram-se sintetizados naTabela 2.3. Quando se efectua a discretizacao do modelo PK/PD do atracurio,com um tempo de amostragem de 20 segundos (1/3 min.), os conjuntos de incerteza

Page 55: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

2.4 Identificacao em tempo real do modelo PK/PD do atracurio 55

0 0.02 0.04 0.06

2

4

6

A (kg/ml)

t α(m

in.)

Ωtα

A

2 4 6 8 10

x 10−3

20

25

30

35

40

B (kg/ml)

t β(m

in.)

Ωtβ

B

6 8 10 12

0

1

2

3

tke0 (min.)

τ(m

in.) Ωτ

tke0

Figura 2.12: Conjuntos de incerteza para os parametros farmacocineticos e farmaco-dinamicos do modelo do atracurio.

Page 56: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

56 Identificacao de sistemas fisiologicos de Wiener

(A, tα)(kg/ml,min.)

(B, tβ)(kg/ml,min.)

(tke0, τ)(min.,min.)

(0.019, 2.8) (0.005, 28.6) (10.2, 1.7)

Tabela 2.3: Valores medios dos parametros que caracterizam a resposta impulsiva domodelo PK/PD do atracurio.

da Figura 2.12, sao mapeados para o domınio discreto e os parametros passam a ser oscoeficientes bi , i = 0, 1, 2, 3 e aj , j = 1, 2, 3, 4, de um modelo DARMA (DeterministicAutoRegressive Moving Average) de ordem 4. Na Figura 2.13 aparecem ilustrados osconjuntos de incerteza no domınio discreto.

Com os conjuntos de incerteza apresentados nas Figuras 2.12 e 2.13 pretende-se ilustrara ordem de grandeza dos parametros e a sua dispersao. Para serem verdadeirosconjuntos de incerteza ter-se-ia que analisar com mais detalhe a distribuicao de cadaum dos parametros o que ia resultar necessariamente em conjuntos “menos conservado-res”. Na pratica, a estimativa inicial da parte linear do modelo PK/PD do atracurioe obtida considerando um modelo medio do banco de modelos, que corresponde adiscretizacao do modelo contınuo que se obtem quando se consideram os valores mediosdos parametros farmacocineticos e farmacodinamicos que constam na Tabela 2.3.

Apos se ter obtido um modelo inicial, valida-se o modelo com dados recolhidos nobloco. Se a resposta impulsiva do modelo inicial aproximar com acuidade a respostaao bolus inicial observada, a estimativa inicial da parte linear do modelo do atracurioe considerada valida e nao e actualizada. Caso o tempo de estabelecimento, quecorresponde ao tempo que decorre ate se atingir o efeito maximo pretendido, fordiferente da soma das constantes de tempo tke0 e τ entao o valor destas constantes eactualizado e consequentemente os parametros do modelo.

Na Figura 2.14 usa-se um registo clınico do bloqueio neuromuscular para ilustrar comoe que se pode efectuar a actualizacao dos parametros tke0 e τ : atraves da resposta aobolus inicial pode-se verificar qual o atraso τ efectivamente registado e obter um valoraproximado para o tempo de distribuicao do farmaco no compartimento efeito, tke0.Pelo registo clınico pode-se afirmar que, para este perfil de dados em particular, ovalor de τ e cerca de 0.67 (min.) e o valor de tke0 e cerca de 6.33 (min.). Significaque para este paciente, nesta intervencao cirurgica, o atraso introduzido pelo modelofarmacodinamico foi cerca de 7 minutos (τ + tke0), muito aquem dos cerca de 12minutos previstos pela soma dos valores medios (τ + tke0) que constam na Tabela 2.3.Sempre que se observa esta discrepancia nas constantes de tempo, actualizam-se osparametros da parte linear do modelo PK/PD.

O procedimento anterior pode ser util no ajuste dos parametros da parte lineardo modelo de Wiener, mas as predicoes da saıda do sistema quando se actualizam

Page 57: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

2.4 Identificacao em tempo real do modelo PK/PD do atracurio 57

0 5 10

x 10−5

0

5

10

x 10−5

b0

b1 Ω

b1

b0

−15 −10 −5 0

x 10−5

−2

−1.5

−1

−0.5

0

x 10−5

b2

b3

Ωb3

b2

−4.5 −4 −3.5 −3 −2.5

2

3

4

5

6

a1

a2

Ωa2

a1

−3 −2 −1

0

0.2

0.4

0.6

0.8

a3

a4

Ωa4

a3

Figura 2.13: Conjuntos de incerteza para os parametros da parte linear do modelo(discreto) do atracurio.

0 20 40 60 80 100 1200

20

40

60

80

100

tempo (min.)

r(t

)%

(a)

0 5 100

20

40

60

80

100

(b)

tempo (min.)

r(t

)%

τ ≈ 0.67 (min.)

tke0 ≈ 6.33 (min.)

Figura 2.14: Actualizacao dos valores de τ e tke0 em funcao da resposta ao bolusinicial registada no bloco operatorio: (a) registo clınico; (b) resposta ao bolus inicial -primeiros 10 minutos do registo.

Page 58: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

58 Identificacao de sistemas fisiologicos de Wiener

apenas os parametros da parte linear nao sao fiaveis. Como se pode verificar pelaFigura 2.15, em que se faz uma comparacao da resposta de 6 pacientes “reais” coma resposta predita pelos 100 modelos do banco - obtida fazendo uso do historial dadose administrada - constata-se que nem sempre a resposta observada no paciente eexplicada pelas saıdas simuladas. Esta observacao e mais notoria nos registos obtidospara o paciente aqui designado por paciente 1 , sintetizados na Figura 2.15 (a). Paraeste paciente em particular, a resposta prevista pelos 100 modelos do banco parat = 60 min. esta acima da resposta observada. Caso os modelos do banco fossemincorporados num sistema de apoio a decisao do anestesista, a diferenca entre aspredicoes obtidas e os valores registados ia necessariamente minar a confianca doanestesista no sistema e limitar o seu uso. Esta observacao enfatiza a necessidade dese actualizar os parametros dos modelos PK/PD dos farmacos ao longo da intervencaocirurgica.

2.4.2 Estimacao em malha fechada dos parametros do modelo

Na tentativa de se encontrar um preditor mais fiavel para as respostas verificadasnos pacientes reais, comeca por se usar o modelo inicial, obtido seguindo o procedi-mento descrito na seccao anterior. O sinal intermedio, x(t) (ou c(t), uma vez que setrata de uma concentracao de farmaco no sangue, em µg/ml) e depois incorporadonuma parametrizacao da nao linearidade estatica. Neste caso, as funcoes de baseusadas nas parametrizacoes foram polinomios de Chebyshev e B-splines, descritas nasseccoes C.1.6.3 e C.1.6.4, respectivamente.

As saıdas do modelo preditor sao dadas pela seguinte parametrizacao:

r(t) = γ1(t) B1(c(t)) + . . . + γm(t) Bm(c(t)) (2.31)

em que Bi(·), i = 1, . . . , m, sao funcoes de base.

A parametrizacao (2.31) e linear nos parametros a estimar, pelo que as estimativas dosparametros, γi, i = 1, . . . , m, podem ser obtidas pelo algoritmo classico de mınimosquadrados:

Γ = Φ† rident, (2.32)

em que Γ e o vector com as estimativas dos parametros γi, i = 1, . . . , m, Φ† e apseudoinversa da matriz de dados Φ e rident e o vector com os registos do bloqueioneuromuscular induzido num dado paciente.

Na Figura 2.16 apresentam-se as respostas obtidas para 6 modelos identificados usandoos registos clınicos de 6 pacientes “reais”. Neste caso usaram-se B-splines como funcoesde base. A grelha de nos de ligacao entre as funcoes de base e ajustada automatica-mente de acordo com a gama de variacao do sinal recuperado x(t) e garantindo quetodos os nos tem igual suporte a partir dos dados (Hagenblad 1999).

Na identificacao usaram-se apenas os registos clınicos obtidos em malha fechada, apartir dos 30 minutos. O numero de amostras usadas na identificacao nao foi igual

Page 59: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

2.4 Identificacao em tempo real do modelo PK/PD do atracurio 59

(a)

0 20 40 60 80 100 1200

50

100

tempo (min.)

r 1,...,100(t

),r p

ac1(t

)(%

)

0 20 40 60 80 100 1200

5

10

15

20

tempo (min.)

u(t

)(µ

g/kg/m

in)

(b)

0 50 100 150 200 2500

50

100

150

tempo (min.)

r 1,...,100(t

),r p

ac2(t

)(%

)

0 50 100 150 200 2500

10

20

30

40

tempo (min.)

u(t

)(µ

g/kg/m

in)

(c)

0 50 100 150 2000

50

100

tempo (min.)

r 1,...,100(t

),r p

ac3(t

)(%

)

0 50 100 150 2000

10

20

30

tempo (min.)

u(t

)(µ

g/kg/m

in)

(d)

0 20 40 60 80 100 120 1400

50

100

150

tempo (min.)

r 1,...,100(t

),r p

ac4(t

)(%

)

0 20 40 60 80 100 120 1400

5

10

15

20

tempo (min.)

u(t

)(µ

g/kg/m

in)

(e)

0 20 40 60 80 100 1200

50

100

tempo (min.)

r 1,...,100(t

),r p

ac5(t

)(%

)

0 20 40 60 80 100 1200

5

10

15

20

tempo (min.)

u(t

)(µ

g/kg/m

in)

(f)

0 20 40 60 80 100 1200

50

100

tempo (min.)

r 1,...,100(t

),r p

ac6(t

)(%

)

0 20 40 60 80 100 1200

10

20

30

tempo (min.)

u(t

)(µ

g/kg/m

in)

Figura 2.15: Registo do relaxamento induzido e da dose administrada, em que seomitiu o bolus inicial, em 6 pacientes submetidos a anestesia geral, em sobreposicaocom as respostas previstas com os 100 modelos do banco: (a) → (f), paciente 1 →paciente 6.

Page 60: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

60 Identificacao de sistemas fisiologicos de Wiener

(a)

0 20 40 60 80 100 1200

10

20

30

40

50

60

70

80

90

100

tempo (min.)

r pac1(t

),r p

ac1(t

)(%

)

G(q−1) = 10−4·

0.1 q−1

+0.2 q−2

−0.2 q−3

−0.1 q−4

1−3.7q−1+5q−2−3 q−3+0.7q−4

nos = [ 0.00 0.09 0.18 0.23 0.41 ]

Γ = [ 6.2 7.9 7.7 10.2 13.3 ]

(b)

0 50 100 150 200 2500

20

40

60

80

100

120

tempo (min.)r p

ac2(t

),r p

ac2(t

)(%

)

G(q−1) = 10−4·

0.1 q−1

+0.2 q−2

−0.2q−3

−0.1q−4

1−3.7q−1+5q−2−3 q−3+0.7q−4

nos = [ 0.00 1.01 1.66 1.95 2.07 ]

Γ = [ 11.6 13.4 10.3 10.0 10.2 ]

(c)

0 50 100 150 2000

10

20

30

40

50

60

70

80

90

100

tempo (min.)

r pac3(t

),r p

ac3(t

)(%

)

G(q−1) = 10−4·

0.1 q−1

+0.2 q−2

−0.2 q−3

−0.1 q−4

1−3.7q−1+5q−2−3 q−3+0.7q−4

nos = [ 0.00 0.12 0.75 0.82 0.95 ]

Γ = [ 6.5 13.6 8.8 10.6 9.6 ]

(d)

0 20 40 60 80 100 120 1400

20

40

60

80

100

120

tempo (min.)

r pac4(t

),r p

ac4(t

)(%

)

G(q−1) = 10−4·

0.1 q−1

+0.2 q−2

−0.2q−3

−0.1q−4

1−3.7 q−1+5q−2−3 q−3+0.7 q−4

nos = [ 0.00 0.25 0.55 0.83 1.03 ]

Γ = [ 9.1 9.6 10.3 10.2 9.5 ]

(e)

0 20 40 60 80 100 1200

10

20

30

40

50

60

70

80

90

100

tempo (min.)

r pac5(t

),r p

ac5(t

)(%

)

G(q−1) = 10−4·

0.1 q−1

+0.2 q−2

−0.2 q−3

−0.1 q−4

1−3.7 q−1+5q−2−3 q−3+0.7q−4

nos = [ 0.00 0.48 0.73 1.15 1.59 ]

Γ = [ 13.2 8.1 12.1 11.4 9.5 ]

(f)

0 20 40 60 80 100 1200

10

20

30

40

50

60

70

80

90

100

tempo (min.)

r pac6(t

),r p

ac6(t

)(%

)

G(q−1) = 10−4·

0.1 q−1

+0.2 q−2

−0.2 q−3

−0.1 q−4

1−3.7 q−1+5q−2−3 q−3+0.7q−4

nos = [ 0.0 0.002 0.44 0.55 0.71 ]

Γ = [ 3.6 14.7 6.9 11.6 9.2 ]

Figura 2.16: Registo do relaxamento induzido em 6 pacientes submetidos a anestesiageral em sobreposicao com as respostas previstas pelos modelos de Wiener identificadosusando B-splines:(a) → (f), rpac1 vs. rpac1 → rpac6 vs. rpac6.

Page 61: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

2.4 Identificacao em tempo real do modelo PK/PD do atracurio 61

para todos os pacientes porque a duracao dos registos e variavel. Na Figura 2.16 saoapresentados os valores considerados para os nos e o vector Γ, com os coeficientesdas B-splines estimados. Os resultados sao satisfatorios para todas as simulacoesefectuadas e pode-se afirmar que a incorporacao de informacao disponıvel a priori,conjugada com o uso de dados reais na actualizacao dos parametros, permite umaidentificacao quase “personalizada” do modelo de um dado paciente. Note-se que oerro de predicao e insignificante quando comparado com o erro que se obtem com os100 modelos do banco cujas respostas se apresentam na Figura 2.15.

O uso de B-splines neste contexto apresenta, no entanto, um inconveniente que reduz aaplicabilidade em ambiente clınico: se, por qualquer motivo, a dose administrada sofreruma variacao significativa, os valores obtidos para o sinal recuperado x(t) podem naopertencer ao intervalo de operacao que se considerou na escolha dos nos. Neste casoa matriz de dados passa a ser singular pelo que a estimativa de mınimos quadrados(2.32) deixa de ser consistente. A opcao por outras funcoes de base, nomeadamente,polinomios de Chebyshev, permitiu contornar este problema.

Na Figura 2.17 apresenta-se uma comparacao das respostas observadas em ambienteclınico versus respostas simuladas com 100 modelos versus respostas inferidas a partirdos modelos preditores obtidos seguindo o procedimento descrito nesta seccao.

O registo da dose administrada ao paciente “real” e usado na validacao da predicao,i.e., e administrada “a mesma dose” para se verificar se a predicao k passos a frentee fiavel. Como se pode constatar pelas respostas obtidas, nomeadamente para opaciente 1 , Figura 2.17-(a), quando se usam os 100 modelos o erro de predicao e muitosignificativo. Nao podem ser usados como preditores da resposta em malha fechada.Ao inves, os modelos preditivos adaptativos fornecem predicoes fiaveis porque usamparte do registo obtido em malha fechada para fornecer a predicao k passos a frente.

Na Figura 2.17-(a) apresenta-se a resposta predita quando se usa a informacao dis-ponıvel ate aos 70 minutos. A predicao e razoavel se for usado como criterio oerro quadratico medio nos ultimos 30 minutos (validacao) do registo. As predicoesefectuadas com informacao disponıvel ate aos 50/60 minutos para o paciente 1, naosao muito consistentes. Note-se que este registo clınico e, do ponto de vista depredicao da resposta, o mais exigente. De facto, para o paciente 1, o nıvel do bloqueioneuromuscular entre os 30 minutos e os 60 minutos foi em media de 7.9% e entreos 60 minutos e os 100 minutos foi de 12.3%. A predicao obtida, condicionada ainformacao disponıvel atraves do registo em malha fechada desde os 30 minutos ateaos 50, 60, 70 (mins.), assinalados com marcadores, nao e boa porque a adaptacaoesta condicionada a um nıvel de bloqueio muito inferior ao que se registou no perıodode validacao. Uma forma de contornar o problema e tornar a abordagem mais realistae considerar uma janela de tempo deslizante, em que se usam apenas dados registadose.g., nos ultimos 10 minutos. Para o paciente 1, caso seja usada a informacao disponıveldesde os 60 minutos ate aos 70 minutos para predizer a resposta do paciente a partirdos 70 minutos, o erro de predicao diminui significativamente, como se pode observarpela resposta obtida (troco a vermelho) em que se mostra apenas o perıodo de predicao.

Page 62: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

62 Identificacao de sistemas fisiologicos de Wiener

Para os outros pacientes, as predicoes obtidas sao muito satisfatorias. Note-se que nocaso do paciente 2, aos 60 minutos efectua-se a predicao da resposta ate 140 minutosa frente, fazendo uso da dose administrada ao paciente real e o erro quadratico medioe cerca de 10%, o que significa um desvio padrao de cerca 3% em relacao ao nıvelde bloqueio efectivamente registado. Os outros registos confirmam a utilidade destemetodo caso venha a ser usado mais tarde para indicar ao anestesista qual o nıvel debloqueio expectavel para um dado paciente k minutos a frente.

Na Figura 2.18 faz-se uma comparacao das distribuicoes do erro (de predicao) quadra-tico medio obtido com os 100 modelos versus o erro obtido com os modelos actualizadoscom dados recolhidos em malha fechada. Os diagramas de dispersao apresentados naFigura 2.18 permitem inferir que a predicao da resposta pelos modelos “estimados”e significativamente melhor do que a predicao obtida atraves dos modelos do banco.Este facto e ainda mais evidente quando se compara a mediana dos erros quadraticos(assinalada a vermelho nos diagramas).

Na proxima seccao explica-se como podem ser estendidos os metodos de identificacaoclassicos, nomeadamente, os metodos baseados em parametrizacoes lineares descritosna seccao 2.3, de modo a estabelecer cinturas de confianca para os dados observados.

2.5 Identificacao de sistemas de Wiener robustos

A identificacao de sistemas de Wiener aqui designados como “robustos”, difere daidentificacao classica no seguinte: em lugar de se estimarem os parametros do modelo,estimam-se intervalos para os parametros do modelo, isto e, intervalos de parametrosque definem uma cintura de confianca que contem todos os dados observados.

Os sistemas de Wiener robustos podem ser muito uteis na abordagem do problemada deteccao de falhas na leitura dos sensores. A ideia subjacente e a seguinte: oregisto de dados observado e usado para identificar um sistema de Wiener robusto,ao qual esta associada uma cintura de confianca. Quando os “novos” dados ou osdados que se pretendem validar sao usados na identificacao do sistema de Wiener,caso falhem as condicoes pre-estabelecidas, isto e, caso nao pertencam a cintura deconfianca, esta-se na presenca de uma falha e os “outliers” tem que ser substituıdospor amostras que pertencam a cintura de confianca (Chen 2001). O algoritmo descritona proxima seccao foi originalmente proposto por Skrjanc et al. (2005). Estes autoresconsideraram modelacao difusa do sistema de Wiener com incerteza e programacaolinear para se obter uma cintura de confianca que contenha os dados observados. Oalgoritmo proposto na proxima seccao pode ser considerado uma variante do algoritmoproposto por Skrjanc et al. (2005). Para alem da programacao linear proposta porestes autores e usada programacao quadratica que permite obter cinturas de confianca“mais estreitas”.

Page 63: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

2.5 Identificacao de sistemas de Wiener robustos 63

(a)

0 20 40 60 80 1000

10

20

30

40

50

60

70

80

90

100

tempo (min.)

r(t

)(%

)

r1,...,100 (t)

rpac1(t)

rpac1(t) (%)

(b)

0 20 40 60 80 100 120 140 160 180 2000

20

40

60

80

100

120

tempo (min.)

r(t

)(%

)

r1,...,100 (t)

rpac2(t)

rpac2(t) (%)

(c)

0 20 40 60 80 100 120 1400

10

20

30

40

50

60

70

80

90

100

tempo (min.)

r(t

)(%

)

r1,...,100 (t)

rpac3(t)

rpac3(t) (%)

(d)

0 20 40 60 80 1000

10

20

30

40

50

60

70

80

90

100

tempo (min.)

r(t

)(%

)

r1,...,100 (t)

rpac4(t)

rpac4(t) (%)

(e)

0 20 40 60 80 1000

10

20

30

40

50

60

70

80

90

100

tempo (min.)

r(t

)(%

)

r1,...,100 (t)

rpac5(t)

rpac5(t) (%)

(f)

0 20 40 60 80 1000

10

20

30

40

50

60

70

80

90

100

tempo (min.)

r(t

)(%

)

r1,...,100 (t)

rpac6(t)

rpac6(t) (%)

Figura 2.17: Comparacao do registo do relaxamento induzido em 6 pacientessubmetidos a anestesia geral com as predicoes obtidas atraves de modelos predi-tivos (do banco de 100 modelos) e modelos preditivos adaptativos: (a) → (f),rpac1 vs. rpac1, r1,...,100 → rpac6 vs. rpac6, r1,...,100 .

Page 64: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

64 Identificacao de sistemas fisiologicos de Wiener

(a)

Modelos do Banco Modelos Identificados0

50

100

150

200

250

300

350

MS

E, p

aci

en

te n

º 1

MSE; predição com dados em cadeia fechada até: 50,60,70 (mins.)

(b)

Modelos do Banco Modelos Identificados

10

20

30

40

50

60

70

80

90

100

MS

E, p

aci

en

te n

º 2

MSE; predição com dados em cadeia fechada até: 40,50,60 (mins.)

(c)

Modelos do Banco Modelos Identificados0

20

40

60

80

100

120

140

MS

E, p

aci

en

te n

º 3

MSE; predição com dados em cadeia fechada até: 40,50,60 (mins.)

(d)

Modelos do Banco Modelos Identificados

0

5

10

15

20

25

30

35

MS

E, p

aci

en

te n

º 4

MSE; predição com dados em cadeia fechada até: 40,50,60 (mins.)

(e)

Modelos do Banco Modelos Identificados

0

10

20

30

40

50

60

70

80

90

MS

E, p

aci

en

te n

º 5

MSE; predição com dados em cadeia fechada até: 40,50,60 (mins.)

(f)

Modelos do Banco Modelos Identificados

10

20

30

40

50

60

70

80

90

100

MS

E, p

aci

en

te n

º 6

MSE; predição com dados em cadeia fechada até: 40,50,60 (mins.)

Figura 2.18: Comparacao das distribuicoes do erro (de predicao) quadratico medio:modelo medio do banco de 100 modelos vs. modelo preditivo adaptativo. A predicaofoi obtida e validada usando como informacao os registos previamente obtidos de 6pacientes reais.

Page 65: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

2.5 Identificacao de sistemas de Wiener robustos 65

2.5.1 Procedimento para se obter o modelo de Wiener ro-busto

Assuma-se, sem perda de generalidade, que os parametros da parte linear do modelode Wiener sao conhecidos ou foram previamente estimados usando um metodo classicode identificacao de sistemas de Wiener. Neste caso, a parte linear do modelo de Wienerrobusto assume-se conhecida e pode ser dada por:

x(t, θ) = G(q−1, θ) u(t) (2.33)

em que G(., .) e uma funcao racional propria.

O modelo de Wiener robusto obtem-se combinando a parte linear, dada por (2.33),com as aproximacoes da nao linearidade finf e f sup que estabelecem uma cintura deconfianca para a saıda do modelo e sao dadas por:

yinf (t) = finf (x(t, θ)) (2.34)

= ϕ>(x(t, θ)) Γinf

= [ `1(x(t, θ)) · · · `nl(x(t, θ)) ] Γinf

e

ysup(t) = f sup(x(t, θ)) (2.35)

= ϕ>(x(t, θ)) Γsup

= [ `1(x(t, θ)) · · · `nl(x(t, θ)) ] Γsup,

em que as funcoes `i, i = 1, . . . , nl sao funcoes de base, e.g., B-splines e Γinf e Γsup saovectores de parametros cujas componentes sao os coeficientes das funcoes finf e f sup.

Os vectores de parametros Γinf e Γsup das funcoes finf e f sup podem ser obtidosresolvendo os seguintes problemas de optimizacao:

Γinf = minΓ

maxxi∈X

| yi − ϕ>(xi) Γ | s.a. yi − ϕ>(xi) Γ ≥ 0 (2.36)

Γsup = minΓ

maxxi∈X

| yi − ϕ>(xi) Γ | s.a. yi − ϕ>(xi) Γ ≤ 0 (2.37)

Os problemas min-max (2.36) e (2.37) podem ser resolvidos como problemas de pro-gramacao linear, minimizando λinf e λsup, sujeitos as desigualdades

λinf ≥ yi − ϕ>(xi) Γ, i = 1, . . . , N

yi − ϕ>(xi) Γ ≥ 0, i = 1, . . . , N

λsup ≥ −yi + ϕ>(xi) Γ, i = 1, . . . , N

yi − ϕ>(xi) Γ ≤ 0, i = 1, . . . , N

Page 66: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

66 Identificacao de sistemas fisiologicos de Wiener

As cinturas de confianca que se pretendem estabelecer para o modelo de wiener robustodevem ser tao “estreitas” quanto possıvel, de modo que caso este modelo venha a serusado, e.g., na deteccao de falhas, seja mais facil distinguir se se trata de um outlierou se e uma amostra admissıvel no contexto dos dados observados.

A abordagem min-max anterior em que se minimiza o pior caso conduz a cinturas deconfianca demasiado conservativas. Apos varias simulacoes constatou-se que se obtemmelhores resultados penalizando o erro quadratico.

Os vectores Γinf e Γsup podem ser obtidos recorrendo a programacao quadratica, daseguinte forma:

Γinf = minΓ

1

2(Y − Φ Γ)>(Y − Φ Γ) s.a. Φ Γ ≤ Y

Γsup = minΓ

1

2(Y − Φ Γ)>(Y − Φ Γ) s.a. − Φ Γ ≤ −Y

ou

Γinf = minΓ

1

2Γ>(Φ>Φ) Γ− Y>ΦΓ +

1

2Y>Y s.a. Φ Γ ≤ Y

Γsup = minΓ

1

2Γ>(Φ>Φ) Γ− Y>ΦΓ +

1

2Y>Y s.a. − Φ Γ ≤ −Y

em que Φ>Φ e uma matriz nl × nl simetrica positiva definida, Φ ∈ IRN×nl, Y ∈ IRN eΓ ∈ IRnl.

2.5.2 Identificacao de um modelo para o atracurio com es-trutura Wiener robusto

Nesta seccao ilustra-se a aplicacao do procedimento descrito na seccao anterior ao casoem estudo.

Para o modelo PK/PD do atracurio assumiu-se conhecida a parte linear do modelo.Considerou-se um modelo aqui designado por paciente medio que se obtem por dis-cretizacao do modelo que decorre da media de cada um dos parametros do banco de100 modelos.

O modelo DARMA para o paciente medio e dado por:

G(q−1) = 10−4 · 0.1 q−1 + 0.2 q−2 − 0.2 q−3 − 0.1 q−4

1− 3.7 q−1 + 5 q−2 − 3 q−3 + 0.7 q−4(2.38)

Nas Figuras 2.19 e 2.20 sao apresentadas as cinturas de confianca obtidas recorrendoa programacao linear e quadratica, respectivamente, para os registos de 6 pacientes“reais” obtido no bloco operatorio.

Page 67: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

2.5 Identificacao de sistemas de Wiener robustos 67

O procedimento que se seguiu para obter os modelos de Wiener robustos foi o seguinte:

A partir da parte linear do modelo, (2.38), infere-se o sinal intermedio x(t). De seguida,definem-se os nos de ligacao das B-splines garantindo um suporte equitativo a partirdos dados. A partir dos pontos (x(t), y(t)) e seguindo as duas abordagens descritasanteriormente, obtem-se os modelos Wiener robustos. Esta abordagem ainda necessitade ser trabalhada no futuro para se poder avaliar a sua utilidade no contexto do casode estudo.

Page 68: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

68 Identificacao de sistemas fisiologicos de Wiener

(a)

30 40 50 60 70 80 90 1002

4

6

8

10

12

14

16

tempo (min.)

rpac1(t

),rin

fpac1(t

),rpac1(t

),rsup

pac1(t

)(%

)

Cintura de confiança obtida através de Programação Linear

(b)

50 100 150 2002

4

6

8

10

12

14

16

18

20

tempo (min.)

rpac2(t

),rin

fpac2(t

),rpac2(t

),rsup

pac2(t

)(%

)

Cintura de confiança obtida através de Programação Linear

(c)

40 60 80 100 120 1400

2

4

6

8

10

12

14

16

18

20

tempo (min.)

rpac3(t

),rin

fpac3(t

),rpac3(t

),rsup

pac3(t

)(%

)

Cintura de confiança obtida através de Programação Linear

(d)

30 40 50 60 70 80 90 1002

4

6

8

10

12

14

16

tempo (min.)

rpac4(t

),rin

fpac4(t

),rpac4(t

),rsup

pac4(t

)(%

)

Cintura de confiança obtida através de Programação Linear

(e)

30 40 50 60 70 80 90 1002

4

6

8

10

12

14

16

tempo (min.)

rpac5(t

),rin

fpac5(t

),rpac5(t

),rsup

pac5(t

)(%

)

Cintura de confiança obtida através de Programação Linear

(f)

30 40 50 60 70 80 90 100−2

0

2

4

6

8

10

12

14

16

18

tempo (min.)

rpac6(t

),rin

fpac6(t

),rpac6(t

),rsup

pac6(t

)(%

)

Cintura de confiança obtida através de Programação Linear

Figura 2.19: Registo do relaxamento induzido em 6 pacientes submetidos a anestesiageral em sobreposicao com as respostas previstas pelos modelos de Wiener robustos:(a) → (f): rpac1 vs.rinf

pac1, rpac1, rsuppac1 → rpac6 vs. rinf

pac6, rpac6, rsuppac6.

Page 69: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

2.5 Identificacao de sistemas de Wiener robustos 69

(a)

30 40 50 60 70 80 90 1002

4

6

8

10

12

14

16

tempo (min.)

rpac1(t

),rin

fpac1(t

),rpac1(t

),rsup

pac1(t

)(%

)

Cintura de confiança obtida através de Programação Quadrática

(b)

50 100 150 2002

4

6

8

10

12

14

16

18

20

tempo (min.)

rpac2(t

),rin

fpac2(t

),rpac2(t

),rsup

pac2(t

)(%

)

Cintura de confiança obtida através de Programação Quadrática

(c)

40 60 80 100 120 1400

2

4

6

8

10

12

14

16

18

tempo (min.)

rpac3(t

),rin

fpac3(t

),rpac3(t

),rsup

pac3(t

)(%

)

Cintura de confiança obtida através de Programação Quadrática

(d)

30 40 50 60 70 80 90 1002

3

4

5

6

7

8

9

10

11

12

tempo (min.)

rpac4(t

),rin

fpac4(t

),rpac4(t

),rsup

pac4(t

)(%

)Cintura de confiança obtida através de Programação Quadrática

(e)

30 40 50 60 70 80 90 1002

4

6

8

10

12

14

16

tempo (min.)

rpac5(t

),rin

fpac5(t

),rpac5(t

),rsup

pac5(t

)(%

)

Cintura de confiança obtida através de Programação Quadrática

(f)

30 40 50 60 70 80 90 1000

2

4

6

8

10

12

14

16

18

20

tempo (min.)

rpac6(t

),rin

fpac6(t

),rpac6(t

),rsup

pac6(t

)(%

)

Cintura de confiança obtida através de Programação Quadrática

Figura 2.20: Registo do relaxamento induzido em 6 pacientes submetidos a anestesiageral em sobreposicao com as respostas previstas pelos modelos de Wiener robustos:(a) → (f): rpac1 vs.rinf

pac1, rpac1, rsuppac1 → rpac6 vs. rinf

pac6, rpac6, rsuppac6.

Page 70: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram
Page 71: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

Capıtulo 3

Controlo adaptativo de sistemas deWiener

3.1 Formulacao do problema

O objectivo desta parte do trabalho e projectar sistemas de controlo adaptativos paraa regulacao ou o controlo de processos que pertencem a classe de sistemas de Wiener.Sao considerados varios casos:

• os parametros da parte nao linear do modelo de Wiener assumem-se conhecidos .

• os parametros da parte linear sao desconhecidos (constantes ou lentamentevariaveis no tempo) e a forma da nao linearidade e conhecida.

• os parametros da parte nao linear do modelo de Wiener assumem-se desconhe-cidos mas a forma da nao linearidade e conhecida.

• desconhecem-se os parametros do modelo de Wiener e tambem a forma da naolinearidade.

A abordagem dos diversos casos acima descritos e realizada fazendo uso dos diversosalgoritmos desenvolvidos neste trabalho.

3.2 Controlo para parametros do modelo de Wie-

ner conhecidos

Na Figura 3.1 e apresentada a estrutura de um controlador para processos do tipoWiener em que se assumem conhecidos os parametros. No diagrama de blocos da

Page 72: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

72 Controlo adaptativo de sistemas de Wiener

Modelo de Wiener

NLL)q(G

11−

)q(G 1m

− NL-1 )t(u

)q(S 1− NL-1

)t(y

)t(xa

)1dt(y m ++ )1dt(xm ++

)t(r

Controlador

Figura 3.1: Estrutura generica de um controlador para modelos de Wiener.

Figura 3.1 a inversa da nao linearidade do modelo de Wiener e usada na linearizacaodo sistema com retroaccao.

Sendo o objectivo do controlo o seguimento da referencia, a variavel manipulada, u,deve ser tal que a saıda, y, seja igual a saıda do modelo de referencia, dada por,

ym(t) =Bm(q−1)

Am(q−1)q−(d+1) r(t)

= Gm(q−1) q−(d+1) r(t)

(3.1)

em que Am(q−1) e Bm(q−1) sao polinomios conhecidos e de Hurwitz. Para se imple-mentar o controlador, isto e, para se obterem os coeficientes dos polinomios S(q−1) eG(q−1) podem ser usadas duas estrategias distintas:

• um sistema de controlo baseado de forma explıcita no modelo de referencia(EMRC - Explicit Model Reference Controller).

• um controlador baseado de forma implıcita no modelo de referencia (IMRC -Implicit Model Reference Controller).

No desenvolvimento e analise dos algoritmos preditivos adaptativos e usada frequen-temente a representacao do modelo DARMA na forma preditor. O Lema seguintesintetiza o procedimento a seguir para escrever um modelo na forma preditor:

Lema 3.1. Considere-se o sistema linear SISO em tempo discreto descrito pelo se-guinte modelo DARMA:

A(q−1) x(t) = q−(d+1) B(q−1) u(t) (3.2)

em que

A(q−1) = 1 + a1q−1 + · · ·+ anaq

−na (3.3)

B(q−1) = b0 + b1q−1 + · · ·+ bnbq

−nb (3.4)

Page 73: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

3.2 Controlo para parametros do modelo de Wiener conhecidos 73

e d + 1 e o tempo de atraso do sistema.

A saıda do sistema em t + d + j pode ser expressa na seguinte forma preditor:

x(t + d + j) = α(q−1) x(t) + β(q−1) u(t + j − 1) (3.5)

ondeα(q−1) = S(q−1), β(q−1) = B(q−1)F (q−1) (3.6)

e S(q−1) e F (q−1) sao os unicos polinomios que satisfazem

1 = F (q−1)A(q−1) + q−(d+j)S(q−1) (3.7)

F (q−1) = 1 + f1q−1 + · · ·+ fd+j−1q

−(d+j−1) (3.8)

S(q−1) = s0 + s1q−1 + · · ·+ sna−1q

−(na−1) (3.9)

Demonstracao. Multiplicando a equacao (3.2) por qd+jF (q−1) obtem-se:

F (q−1)A(q−1)x(t + d + j) = F (q−1)B(q−1) u(t + j − 1) (3.10)

Da equacao diofantina (3.7) decorre que

F (q−1)A(q−1) = 1 − q−(d+j)S(q−1) (3.11)

Combinando as equacoes (3.10) e (3.11) obtem-se o modelo preditor d + j passos afrente. ¥

3.2.1 Parametrizacao da funcao inversa da nao linearidade

Do calculo elementar sabe-se que toda a funcao contınua num dado intervalo podeser aproximada com a acuidade pretendida por funcoes constantes por intervalos. EmLancaster e Salkauskas (1986) prova-se que para uma funcao com derivada contınuanum intervalo limitado e fechado e possıvel obter uma aproximacao da funcao comB-splines com a acuidade desejada. Este resultado conduziu ao uso de funcoes debase, e.g., B-splines ou polinomios de Chebyshev, na aproximacao da inversa da naolinearidade presente em sistemas com estrutura de Wiener. No Apendice C descrevem-se outros tipos de modelos caixa preta que tambem poderiam ser usados.

Quando se usam funcoes de base, e.g., polinomios de Chebyshev Tj para parametrizara inversa da parte nao linear, o sinal xa(t) (ver Figura 3.1) e dado por:

xa(t) =nl∑

j=0

γj Tj(y(t)) (3.12)

e o sinal xm(t) correspondente ao sinal de referencia pode ser expresso como

xm(t) =nl∑

j=0

γj Tj(ym(t)) (3.13)

Page 74: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

74 Controlo adaptativo de sistemas de Wiener

)q(G1

1−)q(H 1− )t(u

)q(S 1−

)t(r

Controlador

Modelo)t(x

Figura 3.2: Estrutura generica de um controlador.

Pajunen (1992) foi pioneira no uso da parametrizacao da inversa da nao linearidadepara dimensionar um controlador para sistemas de Wiener. Nos algoritmos descritosnas proximas seccoes usa-se a parametrizacao da funcao inversa da nao linearidadede modo que a lei de controlo dependa apenas dos sinais que estao disponıveis paramedida, os sinais de entrada u(·) e de saıda y(·), respectivamente.

3.2.2 Algoritmo de controlo EMRC

No algoritmo EMRC o objectivo de controlo e fazer com que o erro de seguimento,ε(t), dado por

ε(t) = xa(t)− xm(t)

tenda assimptoticamente para zero, isto e,

limt−→+∞

ε(t) = 0.

A estrutura do controlador EMRC tem por base o metodo de colocacao de polos,descrito na literatura, por exemplo, em Astrom e Wittenmark (1989). Na Figura 3.2apresenta-se a estrutura do controlador.

Para que o sistema em malha fechada seja estavel, tem que ser validas algumascondicoes, nomeadamente:

• os polinomios A(q−1) e B(q−1) tem que ser de Hurwitz;

• b0 deve ser nao nulo e de sinal conhecido;

• assumem-se conhecidas as ordens na e nb e

• um minorante para o tempo de atraso d + 1.

Page 75: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

3.2 Controlo para parametros do modelo de Wiener conhecidos 75

Nas condicoes acima descritas, os polinomios H(q−1) e G(q−1) (Figura 3.2), sao dados,respectivamente, por:

H(q−1) =Bm(q−1)

Am(q−1)

G(q−1) = B(q−1) F (q−1),

em que o polinomio F (q−1) deve satisfazer a equacao diofantina (3.7). Note-se quea equacao (3.7) (para j = 1, preditor um passo a frente) tem solucao unica se osgraus dos polinomios G(q−1), S(q−1) e F (q−1), forem, respectivamente, ∂G = nb + d,∂S = na− 1 e ∂F = d.

A lei de controlo do algoritmo EMRC e dada por:

u(t) =1

b0

[ xm(t + d + 1)− S(q−1)xa(t)−G?(q−1)u(t) ] (3.14)

em que G?(q−1) = G(q−1)− b0.

Substituindo em (3.14) xm(t+d+1) e xa(t) utilizando (3.12) e (3.13), respectivamente,obtem-se:

u(t) =1

b0

θ>e φe(t) (3.15)

onde

θ>e = [ γ0 · · · γnl γ0s0 · · · γnls0 · · · γ0sna−1 · · · γnlsna−1 g?1 · · · g?

nb+d ] (3.16)

φ>e(t) = [ T0(ym(t + d + 1)) · · ·Tnl(ym(t + d + 1)) φ>e2(t) ] (3.17)

e

φ>e2(t) = [−T0(y(t)) · · · − Tnl(y(t)) · · · − T0(y(t− na + 1)) · · ·− Tnl(y(t− na + 1)) − u(t− 1) · · · − u(t− nb− d) ]

(3.18)

3.2.3 Algoritmo de controlo IMRC

Para a aplicacao do controlador IMRC o procedimento a seguir consiste nos seguintespassos:

• obtencao de um modelo preditor

• dimensionamento da lei de controlo,

sendo o objectivo de controlo fazer com que o erro de predicao,

ε(t + d + 1) = x(t + d + 1)− x(t + d + 1), (3.19)

tenda assimptoticamente para zero.

Page 76: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

76 Controlo adaptativo de sistemas de Wiener

3.2.3.1 Modelo preditor

A partir da saıda do modelo preditor, y(t), pode-se recuperar o sinal intermedio domodelo de Wiener, x(t), do seguinte modo:

x(t) =nl∑

j=0

γj Tj(y(t)) (3.20)

Utilizando o Lema 3.1 e tendo em conta o objectivo do controlo,

limt−→+∞

[ x(t + d + 1)− x(t + d + 1) ] = 0 (3.21)

pode-se escrever,x(t + d + 1) ≈ S(q−1)x(t) + G(q−1)u(t). (3.22)

Substituindo x(t) na equacao (3.22) pela aproximacao xa(t) e usando as equacoes(3.12) e (3.20), obtem-se,

nl∑j=0

γj Tj(y(t + d + 1)) = θ>1 φ1(t) + b0u(t) (3.23)

onde

θ>1 = [ γ0s0 · · · γnls0 · · · γ0sna−1 · · · γnlsna−1 g?1 · · · g?

nb+d ] (3.24)

φ>1(t) = −φ>e2(t) (3.25)

e φ>e2(t) e o regressor descrito pela equacao (3.18).

3.2.3.2 Lei de controlo IMRC

A lei de controlo e calculada de modo que y(t + d + 1) = ym(t + d + 1) e por issoresulta na mesma lei de controlo que e usada no algoritmo de controlo EMRC, sendodada pela equacao (3.15).

3.3 Sistemas adaptativos para sistemas de Wiener

Quando os parametros do modelo de Wiener sao desconhecidos ou variantes no tempo,deve ser considerado o uso de sistemas adaptativos. Ha dois casos de especial interesse:

• a nao linearidade e conhecida ou foi estimada previamente e e invariante notempo.

• a nao linearidade e desconhecida ou desconhecida e variante no tempo.

Page 77: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

3.3 Sistemas adaptativos para sistemas de Wiener 77

3.3.1 Nao linearidade conhecida

Quando a nao linearidade e conhecida, os sinais xa(t) e xm(t) estao acessıveis (oscoeficientes γj sao conhecidos) e o algoritmo EMRAC - versao adaptativa do algoritmoEMRC - pode ser usado. Na Figura 3.3 apresenta-se o respectivo diagrama de blocos.O procedimento a seguir para se obter a versao adaptativa de um algoritmo deste tipoe simples. Consiste em tres passos:

• Estabelecer um modelo preditor.

• Usar um algoritmo recursivo de mınimos quadrados para obter as estimativasdos parametros.

• Aplicar a lei de controlo.

Considere-se o seguinte modelo preditivo que se obtem quando se reescreve a equacao(3.14):

xm(t + d + 1) = θ>0 φ0(t) (3.26)

onde

θ>0 = [ b0 g?1 · · · g?

nb+d s0 · · · sna−1 ] (3.27)

φ>0(t) = [ u(t) u(t− 1) · · · u(t− nb− d) xa(t) · · · xa(t− na + 1) ] (3.28)

Substituindo os parametros desconhecidos pelas suas estimativas, obtem-se uma lei decontrolo adaptativa que decorre do seguinte modelo de regressao,

xm(t + d + 1) = θ>0(t) φ0(t) (3.29)

O algoritmo adaptativo usado na estimacao dos parametros baseia-se num algoritmorecursivo de mınimos quadrados (Goodwin e Sin 1984, Ljung 1999) cuja versao comfactor de esquecimento exponencial λ, e dada por

K(t) =P (t) φ0(t− d− 1)

λ + φ>0(t− d− 1) P (t) φ0(t− d− 1)(3.30)

θ0(t) = θ0(t− 1) + K(t) [ xm(t)− θ>0(t− 1) φ0(t− d− 1) ] (3.31)

P (t + 1) = [I −K(t) φ>0(t− d− 1) ] P (t)/λ (3.32)

O algoritmo EMRAC apresenta o inconveniente de requerer o conhecimento previo danao linearidade, ou seja, os sinais xa(t) e xm(t) tem que estar disponıveis. Quando seconsideram aplicacoes em modelos orientados por blocos, em particular, modelos deWiener, dificilmente se pode admitir o acesso ao sinal intermedio, pelo que a variavelde controlo so pode depender de amostras dos sinais de entrada e de saıda do sistemade Wiener. Uma solucao possıvel passa pelo uso do algoritmo IMRAC combinadocom o metodo de identificacao com erro de predicao na entrada (ver, por exemplo,Goodwin e Sin (1984)) para o ajuste dos parametros do modelo preditor. Este metodoe descrito na proxima seccao.

Page 78: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

78 Controlo adaptativo de sistemas de Wiener

ControladorEMRAC

L

Modelo de Wiener

NL)t(u )t(y

)1dt(xm ++

0b

1

)q(G 1−∗

)q(S 1− )t(xa ∑=

nl

0jjj ))t(y(Tγ

)q(G 1m

)1dt(y m ++

)t(r ∑=

++nl

0jmjj ))1dt(y(Tγ

RLS

)1d(q +−)1d(q +−

)1dt(u −−

)t(xm)t(ˆ0θ

Figura 3.3: Diagrama de blocos do algoritmo EMRAC aplicavel ao controlo de modelosde Wiener quando se conhece a priori a nao linearidade.

3.3.2 Nao linearidade desconhecida ou desconhecida e vari-ante no tempo

De acordo com consideracoes anteriores, quando se desconhece a nao linearidade, naose podem recuperar os sinais xa(t) e xm(t) a partir das equacoes (3.12) e (3.13), uma vezque os coeficientes γj sao desconhecidos. Estes parametros tem agora que ser estimadosem conjunto com os parametros da parte linear do modelo de Wiener. Como nao epossıvel identificar separadamente as partes linear e nao linear dos sistemas de Wiener,e necessario impor determinadas condicoes para garantir a identificabilidade. Umdos procedimentos mais adoptados, que aparece descrito na literatura (Bai 2002), e a

normalizacao do vector de parametros a identificar, e.g. ||θ(t)|| = 1(||θ(t)|| = θ(t)

||θ(t)||

).

Sem perda de generalidade, outra solucao possıvel e fixar um dos parametros da partelinear ou nao linear do modelo de Wiener.

No algoritmo que se descreve a seguir, fixou-se um parametro da parte linear do modelode Wiener, nomeadamente, b0, tendo-se considerado b0 = 1.

O objectivo de controlo que se estabelece para o algoritmo IMRACW - ImplicitModel Reference Adaptive Controller for Wiener models que se descreve nesta seccaoe assegurar que:

limt−→+∞

[u(t)− u(t)] = 0.

Page 79: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

3.3 Sistemas adaptativos para sistemas de Wiener 79

De facto, quando se minimiza o erro de predicao na entrada, implicitamente, esta-se aassegurar que a saıda do modelo preditor ira seguir a trajectoria definida pelo modelode referencia, ou seja, lim

t−→+∞[y(t) − ym(t)] = 0. A seguir descreve-se o algoritmo

adaptativo IMRACW.

Na seccao 3.2.3 ja se tinha obtido um modelo preditor para o algoritmo IMRC. Para seobter uma versao adaptativa para modelos de Wiener, procede-se do seguinte modo:

• O modelo preditor da equacao (3.23) pode ser reescrito do seguinte modo:

nl∑j=0

γj Tj(y(t + d + 1)) = θ>1 φ1(t) + 1 u(t), (3.33)

em que o coeficiente de u(t) e um.

• O modelo preditor na entrada decorre da equacao (3.33) e e dado por:

u(t) = θ>2 φ2(t) (3.34)

onde

θ>2 = [ γ0 · · · γnl γ0s0 · · · γnls0 · · · γ0sna−1 · · · γnlsna−1 g?1 · · · g?

nb+d ] (3.35)

φ>2(t) = [ T0(y(t + d + 1)) · · ·Tnl(y(t + d + 1)) φ>e2(t) ], (3.36)

em que φ>e2(t) e dado pela equacao (3.18).

• Substituindo os parametros desconhecidos pelas suas estimativas, obtem-se ummodelo adaptativo,

u(t) = θ>2(t) φ2(t) (3.37)

Na estimacao do vector de parametros, θ2, pode ser usado o algoritmo recursivo dadopelas equacoes, (3.30)-(3.32), mas o erro de adaptacao em (3.31), deve ser substituıdo,por

e2(t) = u(t− d− 1)− θ>2(t− 1) φ2(t− d− 1) (3.38)

A lei de controlo a ser aplicada obtem-se a partir de (3.37) substituindo o sinaly(t + d + 1) pelo sinal ym(t + d + 1).

Na Figura 3.4 e apresentado o diagrama de blocos do algoritmo IMRACW usadono controlo de sistemas de Wiener. Os parametros s?

ji que aparecem no diagrama,correspondem aos produtos, γjsi, com i = 0, . . . , na− 1 e j = 0, . . . , nl.

Page 80: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

80 Controlo adaptativo de sistemas de Wiener

ControladorIMRACW

)1d(q +−

)1dt(u −−

RLS(erro na entrada )

)t(ˆ2θ

)t()t(ˆ2

T2 φθ

)t(2φ

)1d(q +−

L

Modelo de Wiener

NL)t(u )t(y

∑=

∗ −nl

0jj1j ))1t(y(Ts

∑=

∗nl

0jj0j ))t(y(Ts

∑=

∗− +−

nl

0jj)1na(j ))1nat(y(Ts

1q −

)q(G 1−∗

)1dt(xm ++

)q(G 1m

)1dt(y m ++

)t(r ∑=

++nl

0jmjj ))1dt(y(Tγ

)1( −− naq

Figura 3.4: Diagrama de blocos do algoritmo IMRACW aplicavel ao controlo desistemas de Wiener quando se desconhece a nao linearidade.

3.3.2.1 Lei de controlo IMRACW baseada em T modelos preditivos

A lei de controlo adaptativa que se obtem a partir de (3.37) depende de um modelopreditor um passo a frente.

Nesta seccao pretende-se mostrar como se pode implementar o algoritmo IMRACWa partir de um modelo preditor que se obtem somando T modelos preditivos de umbanco de modelos.

Recorde-se que a parte linear do modelo de Wiener pode ser representada pelo seguintemodelo

A(q−1

)x(t) = q−(d+1)B(q−1)u(t) (3.39)

Considere-se a equacao diofantina

Am(q−1) = Fj(q−1) A(q−1) + q−(d+j) Sj(q

−1) (3.40)

em que Am(q−1) e o polinomio do modelo de referencia (3.1). O grau dos polinomiosAm(q−1) e A(q−1) e na; o grau de Fj(q

−1) e d + j − 1 e o grau de Sj(q−1) e na− 1.

Combinando as equacoes (3.39) e (3.40), resulta na equacao:

Am(q−1) x(t + d + j) = Sj(q−1) x(t) + Gj(q

−1) u(t + j − 1) (3.41)

Page 81: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

3.3 Sistemas adaptativos para sistemas de Wiener 81

com Gj(q−1) , Fj(q

−1)B(q−1).

O polinomio Gj(q−1) pode ser decomposto da seguinte forma:

Gj(q−1) = Wj(q

−1) + q−j G?j(q

−1), (3.42)

em que:

Wj(q−1) = w1 + w2 q−1 + . . . + wj q−(j−1) (3.43)

G?j(q

−1) = gj0 + gj

1 q−1 + . . . + gjnb+d−1 q−(nb+d−1) (3.44)

Inserindo (3.42) em (3.41), pode-se escrever:

Am(q−1) x(t + d + j) = Sj(q−1) x(t) + Wj(q

−1) u(t + j − 1) + G?j(q

−1) u(t− 1) (3.45)

Quando se somam T modelos preditores, que se obtem a partir da equacao (3.45),para j = 1, . . . , T , obtem-se o seguinte modelo:

Am(q−1)T∑

j=1

x(t + d + j) =T∑

j=1

Sj(q−1) x(t) + (w1 + w2 + . . . + wT ) u(t)

+ (w1 + w2 + . . . + wT−1) u(t + 1) + . . . + w1 u(t + T − 1)

+T∑

j=1

G?j(q

−1) u(t− 1)

(3.46)

Sabendo que o sinal intermedio do modelo de Wiener pode ser recuperado atraves daparametrizacao,

x(t + d + j) =nl∑

i=0

γi Ti(y(t + d + j)),

em os Ti(·) sao funcoes de base, pode-se reescrever o modelo (3.46):

T∑j=1

nl∑i=0

γi T?i (y(t + d + j)) =

na−1∑

k=0

nl∑i=0

γis+k Ti(y(t− k))

+ (w1 + w2 + . . . + wT ) u(t) + (w1 + w2 + . . . + wT−1) u(t + 1)

+ . . . + w1 u(t + T − 1)

+ (g+0 + g+

1 q−1 + . . . + g+nb+d−1 q−(nb+d−1)) u(t− 1),

(3.47)

em que T ?i (·) , Am(q−1) Ti(·).

SejawT

1+ , (w1 + w2 + . . . + wT );

wT−11+ , (w1 + w2 + . . . + wT−1);

...

wj1+ , (w1 + w2 + . . . + wj).

Page 82: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

82 Controlo adaptativo de sistemas de Wiener

Quando se assumem conhecidos os coeficientes wj, j = 1, . . . , T , pode-se estabelecer oseguinte modelo de regressao:

wT1+ u(t) + wT−1

1+ u(t + 1) + . . . + w1 u(t + T − 1) = θ>5 φ5(t), (3.48)

onde,

θ>5 = [ γ10 · · · γ1nl · · · γT0 · · · γTnl γ0s+0 · · · γnls

+0 · · · γ0s

+na−1 · · · γnls

+na−1g

+0 · · · g+

nb+d−1 ]

φ>5(t) = [ T ?0 (y(t + d + 1)) · · ·T ?

nl(y(t + d + 1)) · · ·T ?

0 (y(t + d + T )) · · ·T ?nl(y(t + d + T ))

− T0(y(t)) · · · − Tnl(y(t)) · · ·− T0(y(t− na + 1)) · · · − Tnl(y(t− na + 1))

− u(t− 1) · · · − u(t− nb− d) ]

Quando se usa um algoritmo recursivo (e.g., RLS com factor de esquecimento direc-cional) para estimar os parametros de θ5, usa-se como modelo de regressao (3.48) comuma translacao no tempo dos sinais do modelo em d+T passos. O modelo de regressaoque se usa e dado por:

wT1+ u(t−d−T )+wT−1

1+ u(t−d−T +1)+ . . .+w1 u(t−d−1) = θ>5(t−1) φ5(t−d−T ),(3.49)

A lei de controlo adaptativa IMRACW que se obtem quando se considera a soma deT modelos preditivos e se assumem conhecidos os coeficientes wj, j = 1, . . . , T , e dadapor:

u(t) =1

w1

[−wT1+u(t−T +1)−wT−1

1+ u(t−T +2)−· · ·−w21+u(t−1) + θ>5(t) φ6(t−T +1) ],

(3.50)em que φ6(·) se obtem a partir de φ5(·), substituindo o sinal de saıda y(·) nas T ∗(nl+1)primeiras componentes, pela saıda do modelo de referencia, ym(·).A lei de controlo adaptativa (3.50) e uma variante da lei de controlo adaptativa (3.37).E igualmente uma lei de controlo baseada implicitamente num modelo de referenciamas tem a particularidade de ser baseada num modelo preditor que “pesa” (de igualforma) a informacao de T modelos preditores.

3.4 Controlo preditivo adaptativo de sistemas de

Wiener

O controlo preditivo denota um grupo de algoritmos de controlo que tem em comumos seguintes conceitos elementares:

Page 83: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

3.4 Controlo preditivo adaptativo de sistemas de Wiener 83

(1) E usado um modelo dinamico do processo para prever os valores futuros da saıdado processo.

(2) Os valores actuais e futuros da accao de controlo sao determinados a partir deum criterio de desempenho avaliado num dado horizonte de controlo.

(3) O princıpio do horizonte recidivo1 e usado.

Um modelo nao linear de Wiener pode ser usado de diversas formas no controlopreditivo. Das varias abordagens possıveis, destacam-se:

(1) O Controlo Preditivo Nao Linear (WNPC - Wiener Nonlinear Predictive Con-troller). Nao e, em geral, possıvel obter a lei de controlo em forma fechada, peloque se recorre a metodos de optimizacao nao linear.

(2) O metodo da Funcao Inversa (WIPC - Wiener Inverse Predictive Controller).Quando se conhece a estrutura da nao linearidade (desde que invertıvel) pode-seusar a funcao inversa para linearizar o modelo. A vantagem deste procedimentoe que permite recorrer a controladores preditivos lineares (Norquay, Palazoglu eRomagnoli 1996, Goncalves et al. 2002, Goncalves et al. 2004).

(3) A Linearizacao por Retroaccao. Como o nome indica, o sistema em malhafechada resultante e linear, usando-se para isso uma lei de controlo adequadaobtida por retroaccao do estado ou da saıda. No caso dos modelos de Wiener,este metodo reduz-se a (2).

(4) O metodo da Linearizacao “Instantanea”. O modelo nao linear original e linea-rizado em cada instante de tempo e o modelo linearizado obtido e usado para apredicao em todo o horizonte escolhido.

Na proxima seccao propoe-se um metodo de controlo preditivo para sistemas de Wienerque pertence a categoria WIPC na classificacao estabelecida acima.

3.4.1 Controlador preditivo WIMRHAC

O controlador preditivo agora proposto designa-se por WIMRHAC - Wiener InterlacedMultipredictor Receding Horizon Adaptive Controller. O acronimo pretende sintetizaras principais caracterısticas do controlador: e um controlador para sistemas de Wiener;o algoritmo de adaptacao recorre a estimacao entrelacada; baseia-se num modelomultipreditivo; segue o princıpio do horizonte recidivo e e adaptativo.

O controlador WIMRHAC pode ser considerado uma extensao do controlador IMRHAC,desenvolvido por Lemos e Mosca (1985), para sistemas de Wiener. A metodologia

1o horizonte de predicao e constante, mas desliza por um intervalo de amostragem em cadaiteracao (ver Figura 3.6).

Page 84: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

84 Controlo adaptativo de sistemas de Wiener

Controlador WIMRHAC

ControladorWIMRHAC

Algoritmode

Identificação

AplicaçãoInversa

AplicaçãoInversa

D.F.R.L.S

)t(u NLL

Modelo de Wiener

)t(y

)t(xa

)(ty m

Figura 3.5: Diagrama de blocos do algoritmo WIMRHAC aplicavel ao controlo demodelos de Wiener.

subjacente ao controlador WIMRHAC (ver Figura 3.5) e a seguinte: em cada instantede tempo (discreto) t, a partir da saıda y(t) infere-se o sinal intermedio xa(t), quedecorre da aplicacao inversa e dos parametros estimados previamente/em tempo realusando um algoritmo de identificacao caixa cinza. O sinal xa(t) em conjunto como sinal de entrada u(t) sao usados para estimar os parametros do modelo multipre-ditivo. A partir do modelo multipreditivo e do sinal de referencia e possıvel obterexplicitamente a lei de controlo que e aplicada ao processo. O controlador obedeceao princıpio do horizonte recidivo (ver Figura 3.6) pelo que o horizonte de predicao“desliza” por um intervalo de amostragem em cada iteracao. O controlador baseia-senum dado numero (igual ao horizonte de predicao) de modelos preditivos estimadosseparadamente. O algoritmo de adaptacao recorre a chamada estimacao entrelacada(Lemos 1989, Mosca 1995). Este metodo de identificacao para modelos multipreditivostem como caracterıstica distintiva o facto de recorrer a estimacao de um conjunto demodelos usando sempre o mesmo regressor. Esta caracterıstica permite reduzir a cargacomputacional e simplifica o algoritmo de adaptacao.

O controlo preditivo consiste na optimizacao de funcoes de custo multipasso defini-dos sobre um horizonte temporal extendido. A lei de controlo preditiva obtem-seminimizando o custo quadratico

JT (t) = E

[T∑

j=1

x2(t + j) + ρu2(t + j − 1)|Ot

](3.51)

em que T ≥ 1 e um inteiro, ρ penaliza o esforco de controlo e E[ · |Ot ] denota a mediacondicionada a σ-algebra Ot, gerada pelos dados disponıveis ate ao tempo discreto t.

Page 85: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

3.4 Controlo preditivo adaptativo de sistemas de Wiener 85

referênciax(t+T)

t+Tt tempo

u(t+T-1)

tempo

xm(t+T)

u(t)=?u(t-1)u(t+1)

t+T-1t+2t+1t-1

t+Tt t+T-1t+2t+1t-1

x(t-1) x(t)

Tempo presente

Horizonte de Predição

referênciax(t+T)

t+Tt tempo

u(t+T-1)

tempo

xm(t+T)

u(t)=?u(t-1)u(t+1)

t+T-1t+2t+1t-1

t+Tt t+T-1t+2t+1t-1

x(t-1) x(t)

Tempo presente

Horizonte de Predição

Figura 3.6: Princıpio do horizonte recidivo.

Note-se que no custo quadratico acima o erro x(t) e dado por

x(t) = xm(t)− xa(t) (3.52)

em que xm(t) e o sinal de referencia (transformado, pela aplicacao inversa) e xa(t) osinal intermedio (recuperado) do modelo de Wiener (ver Figura 3.5).

O objectivo do algoritmo WIMRHAC e minimizar a funcao de custo (3.51). Para oefeito, no inıcio de cada intervalo de amostragem efectuam-se os seguintes passos deforma recursiva:

• Passo 1: A partir do sinal de referencia ym(t) e da saıda, y(t), obter, pelaaplicacao inversa (estimada previamente/em tempo real), os sinais xm(t) e xa(t),respectivamente. O erro de seguimento x(t) obtem-se usando (3.52).

• Passo 2: Usar identificacao entrelacada (ver Figura 3.7) com um algoritmo demınimos quadrados recursivo para actualizar as estimativas dos parametros wj

e πj no seguinte conjunto de modelos preditivos:

z(t + j) ≈ wju(t) + π>js(t), j = 1, . . . , T (3.53)

onde ≈ denota igualdade no sentido de mınimos quadrados e s(t) e o regressorcomum a todos os modelos de regressao, designado por pseudoestado e dado por

s(t) = [x(t) . . . x(t− na + 1) u(t− 1) . . .

u(t− nb) xm(t) . . . xm(t− nr + 1)]>.

Page 86: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

86 Controlo adaptativo de sistemas de Wiener

RLS

)(~ Ttx ++++ )(~ Ttz ++++

)(ˆ tTππππ

1 1++++−−−−++++

t TtuRLS

)1(~ ++++tx )1(~ ++++tz

RLS

)2(~ ++++tx )2(~ ++++tz

)(1 tππππ )t(ˆ 2ππππ)1( ++++tu

1−q1−q

TT tstut )]()([)( ====φφφφ

)(ˆ1 tw

)1(ˆ1 −−−−tw

)(ˆ2 tw

)1(ˆ2 −−−−tw

)(ˆ twTRLS

)(~ Ttx ++++ )(~ Ttz ++++

)(ˆ tTππππ

1 1++++−−−−++++

t TtuRLS

)1(~ ++++tx )1(~ ++++tz

RLS

)2(~ ++++tx )2(~ ++++tz

)(1 tππππ )t(ˆ 2ππππ)1( ++++tu

1−q1−q

TT tstut )]()([)( ====φφφφ

)(ˆ1 tw

)1(ˆ1 −−−−tw

)(ˆ2 tw

)1(ˆ2 −−−−tw

)(ˆ twTFigura 3.7: Esquematico que ilustra a estimacao entrelacada (Mosca 1995) .

A escolha das variaveis e do numero de amostras que fazem parte do regressors(t) definem a estrutura do controlador. A escolha de na, nb e nr deve serefectuada de modo que a dinamica dominante do sistema seja modelada. Se onumero de parametros a estimar for muito grande, podem ocorrer problemas deidentificabilidade, com consequencias no desempenho do controlador. O sinal dereferencia, xm(t), e incluıdo no pseudoestado para reduzir o erro de seguimento.Como no instante t, a amostra x(t + j), com j ≥ 1, nao esta disponıvel, osmodelos preditivos (3.53) para serem modelos de regressao tem que ser atrasadosem T amostras. O regressor comum a todos os modelos preditivos e dado por:φ(t−T ) = [u(t−T ) s>(t−T )]>. A actualizacao do ganho de Kalman e da matrizde covariancia e dada pelas equacoes:

K(t) =P (t− 1)φ(t− T )

1 + φ>(t− T )P (t− 1)φ(t− T )[1− β(t)]

P (t) = [I −K(t)φ>(t− T )(1− β(t))]P (t− 1)

em que β(t) representa a quantidade de informacao a ser esquecida em cadaiteracao. De acordo com um algoritmo de esquecimento direccional (Lemos1989), e dada por,

β(t) = 1− λ +1− λ

φ>(t− T )P (t− 1)φ(t− T )(3.54)

em que λ e um parametro - a ser escolhido entre 0 (esquecimento total) e 1(nao ha esquecimento) - que determina a taxa de esquecimento na direccao dainformacao que chega. O factor de esquecimento λ, e actualizado de acordo com,

λ(t) = 1− [1− φ>(t− T )K(t)]ε2(t)/Σ0 (3.55)

em que ε(t) e a media dos erros de predicao e Σ0 e um parametro de norma-lizacao. O uso de esquecimento direccional e importante para evitar problemasde identificabilidade.

Page 87: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

3.4 Controlo preditivo adaptativo de sistemas de Wiener 87

A actualizacao dos parametros dos T preditores e dada por:

θj(t) = θj(t− 1) + K(t)[z(t− T + j)− θj(t− T )>φ(t− T )], (3.56)

j = 1, . . . , T

onde,

z(t− T + j) = x(t− T + j)−j−1∑i=1

wi(t− 1)u(t− T + j − i).

Nas equacoes acima, θj, representa a estimativa do preditor j e e dada por:

θj = [wj π>j]>.

Como o regressor φ(t−T ) e comum a todos os preditores, a actualizacao da ma-triz de covariancia e do ganho de Kalman so necessita de ser efectuada uma vezem cada iteracao. Esta caracterıstica reduz fortemente a carga computacional.

• Passo 3: Aplicar ao processo a accao de controlo, dada por

u(t) = F>s(t) + η(t) (3.57)

em que η e ruıdo branco de pequena amplitude para garantir uma excitacaopersistente e evitar problemas de identificacao e F e o vector de ganhos docontrolador, calculado a partir das estimativas wj e πj e dado por

F> = −e>1M−1 W>Π> (3.58)

As matrizes W , M e Π e o vector e1 na equacao acima sao dados por

W =

w1

w2 w1 0...

. . . . . .

wT . . . w2 w1

M = ρ I + W>W

Π = [ π1 . . . πT ]

e1 = [1 0 . . . 0]>

3.4.2 Controlador preditivo WFPAC

Nesta seccao descreve-se o algoritmo WFPAC - Wiener Full Parameterization AdaptiveController, que consiste num algoritmo preditivo adaptativo, aplicado a sistemas deWiener, recorrendo a uma parametrizacao “total”, no sentido em que ambas as partesdo modelo sao parametrizadas de forma a que modelo multipreditivo resultante sejalinear nos parametros a estimar.

A lei de controlo preditiva WFPAC, obtem-se minimizando o custo quadratico

JT (t) = E

[T∑

j=1

x2(t + j) + ρu2(t + j − 1)|Ot

](3.59)

Page 88: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

88 Controlo adaptativo de sistemas de Wiener

em que T ≥ 1 e o horizonte de predicao (e de controlo), ρ penaliza o esforco de controloe E[ · |Ot ] denota a media condicionada a σ-algebra Ot, gerada pelos dados disponıveisate ao tempo discreto t.

Note-se que no custo quadratico acima o erro x(t), e dado por

x(t) =nl∑

i=0

γi [ Ti(ym(t))− Ti(y(t)) ] (3.60)

em que ym(t) e o sinal de referencia, y(t) a saıda do modelo de Wiener e Ti, i = 0, . . . , nlsao funcoes de base (e.g., B-splines ou polinomios de Chebyshev).

Na funcao de custo (3.59) pretende-se minimizar o erro de seguimento, x, na variavelintermedia do modelo de Wiener, x (Figura 3.8). Como o sinal x(t) nao esta acessıvelpara medida, o que se faz e estimar (no inıcio de cada intervalo de amostragem) oscoeficientes γi, i = 0, . . . , nl, da equacao (3.60) recorrendo ao modelo de regressao(3.61). As estimativas dos coeficientes γi e as estimativas dos coeficientes da respostaimpulsiva wi (da parte linear do modelo de Wiener) sao depois usadas para se estabe-lecer o modelo de regressao (3.62), de modo a que o regressor seja comum a todos osmodelos do banco multipreditivo (Mosca 1995).

O objectivo do algoritmo WFPAC e minimizar a funcao de custo (3.59). O procedi-mento a seguir pode ser sintetizado pelo seguinte algoritmo:

• Passo 1: Estimar os parametros do preditor 1 passo a frente, w1 e π1 e o vectorde parametros Γ, relativo a parametrizacao da inversa da nao linearidade. Paraisso usa-se o modelo:

ut = Γ> Tt+1 − (w1 − 1) ut − π>1 st (3.61)

em queΓ> = [ γ0 . . . γnl ]

e

T>t+1 = [ T0(ym(t + 1))− T0(y(t + 1)) . . . Tnl(ym(t + 1))− Tnl(y(t + 1)) ].

• Passo 2: Para j = 2 ate T , executar:

a) Calcular

z(t + j) , Γ> Tt+j −j−1∑i=1

wi ut+j−i,

com Γ estimado no Passo 1 e os wi substituıdos pelas suas estimativas.

b) Estimar wj e πj a partir de

z(t + j) ≈ wjut + π>j st, (3.62)

Page 89: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

3.4 Controlo preditivo adaptativo de sistemas de Wiener 89

ControladorWFPAC )()(ˆ)( tstFtu T=

RLS)(~ Ttx ++++ )(~ Ttz ++++

)(ˆ tTππππ

1 1++++−−−−++++

t TtuRLS)1(~ ++++tx )1(~ ++++tz RLS)2(~ ++++tx )2(~ ++++tz)(1 tππππ )t(ˆ 2ππππ

)1( ++++tu1−q1−q

TT tstut )]()([)( ====φφφφ

)(ˆ1 tw )1(ˆ1 −−−−tw )(ˆ2 tw )1(ˆ2 −−−−tw )(ˆ twTRLS)(~ Ttx ++++ )(~ Ttz ++++

)(ˆ tTππππ

1 1++++−−−−++++

t TtuRLS)1(~ ++++tx )1(~ ++++tz RLS)2(~ ++++tx )2(~ ++++tz)(1 tππππ )t(ˆ 2ππππ

)1( ++++tu1−q1−q

TT tstut )]()([)( ====φφφφ

)(ˆ1 tw )1(ˆ1 −−−−tw )(ˆ2 tw )1(ˆ2 −−−−tw )(ˆ twT

L

Modelo de Wiener

NL )t(y

nbjq j ,,1, K=−

)t(r)1d(q +−

1,,0

)),((0

−=−naj

jtyT nl L1,,0

)),((0

−=−naj

jtyT mnl L )q(G 1

m−

)1dt(y m ++

Figura 3.8: Diagrama de blocos do algoritmo WFPAC aplicavel ao controlo de sistemasde Wiener.

Page 90: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

90 Controlo adaptativo de sistemas de Wiener

em que

s>t = [ T>t . . . T>t−na+1 ut−1 . . . ut−nb (Tmt )> . . . (Tm

t−nr+1)> ] (3.63)

T>t−i = [ T0(ym(t− i))− T0(y(t− i)) . . . Tnl(ym(t− i))− Tnl(y(t− i)) ],

i = 0, . . . , na− 1

(Tmt−j)

> = [ T0(ym(t− j)) . . . Tnl(ym(t− j)) ], j = 0, . . . , nr − 1

• Passo 3: Aplicar ao processo a accao de controlo, dada por

u(t) = F>s(t) + η(t) (3.64)

em que η e ruıdo branco de pequena amplitude para garantir uma excitacaopersistente e evitar problemas de identificacao e F e o vector de ganhos docontrolador, calculado a partir das estimativas wj e πj e dado por

F> = −e>1M−1 W>Π> (3.65)

em que as matrizes W , M e Π e o vector e1 se obtem seguindo um raciocınioidentico ao descrito na seccao 3.4.1.

Na Figura 3.8 apresenta-se o diagrama de blocos do algoritmo WFPAC.

Page 91: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

Capıtulo 4

Convergencia e Estabilidade

Neste capıtulo e demonstrada, sob hipoteses restritivas, a convergencia e a estabilidadeglobal dos sistemas de controlo adaptativos IMRACW e WFPAC, apresentados nasseccoes 3.3.2 e 3.4.2, respectivamente. Para o algoritmo IMRACW tambem se provaque mesmo na presenca de incerteza (aditiva) no modelo, e possıvel assegurar aestabilidade do sistema.

4.1 Analise da estabilidade do algoritmo IMRACW

Nesta seccao pretende-se analisar a estabilidade do sistema adaptativo IMRACWapresentado na seccao 3.3.2 para o controlo de sistemas de Wiener com parametrosdesconhecidos. O objectivo do controlador IMRACW e assegurar que a saıda domodelo, y(t), segue a saıda do modelo de referencia, ym(t). Este objectivo deve seralcancado garantindo, simultaneamente, que as sucessoes dos sinais entrada-saıda,u(t) e y(t), sejam limitadas.

Comeca-se por recordar que a parte linear do modelo de Wiener pode ser representadapelo seguinte modelo

A(q−1

)x(t) = q−(d+1)B(q−1)u(t) (4.1)

onde A (q−1) e B(q−1) sao, respectivamente, polinomios de grau na e nb e d + 1 e otempo de atraso.

A nao linearidade e descrita pela equacao

y(t) = f(x(t)), (4.2)

onde f e uma funcao suave e estritamente monotona.

Sao consideradas as seguintes hipoteses sobre o sistema:

(H1) O tempo de atraso, d + 1, e conhecido.

Page 92: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

92 Convergencia e Estabilidade

(H2) Conhecem-se majorantes para na e nb.

(H3) B(q−1) e um polinomio estavel e o sinal de b0 e conhecido.

(H4) A nao linearidade f e uma funcao suave e injectiva num conjunto compacto.

(H5) A regiao de operacao assume-se conhecida, isto e, y ∈ [y0, yN ], com y0 e yN

conhecidos.

O modelo de referencia e dado pela equacao

Am(q−1) ym(t) = q−(d+1) Bm(q−1) r(t), (4.3)

e deve cumprir alguns pressupostos, nomeadamente:

(M1) Am(q−1) e Bm(q−1) assumem-se monicos, co-primos e de grau na e nb, respecti-vamente.

(M2) O modelo (4.3) e, por hipotese, de fase mınima e estavel.

(M3) O sinal de referencia r(t) e o modelo de referencia devem assegurar que a saıda,ym(t), esteja confinada ao intervalo de operacao [y0, yN ].

Antes de se avancar para a prova da estabilidade do algoritmo IMRACW e convenientenotar que o modelo preditor que vai ser usado na prova nao e o modelo que resulta daequacao diofantina (3.7) mas sim da equacao

Am(q−1) = F (q−1) A(q−1) + q−(d+1) S(q−1) (4.4)

em que Am(q−1) e o polinomio do modelo de referencia (4.3). O uso desta alternativadeve-se ao facto do controlador baseado num modelo de referencia assim projectadopoder ser mais robusto na presenca de dinamica nao modelada, tal como aparecedescrito em Goodwin e Sin (1984).

Para se obter o “novo” modelo preditor efectua-se um raciocınio semelhante ao descritono Lema 3.1. O modelo preditor escreve-se:

Am(q−1) x(t + d + 1) = S(q−1) xa(t) + G?(q−1) u(t) + b0 u(t) (4.5)

em que os coeficientes de S(q−1) e G?(q−1) sao desconhecidos e b0 = 1, por hipotese. O

sinal xa(t), dado pornl∑

j=0

γj Tj(y(t)), em que Tj sao funcoes de base, nao esta disponıvel

uma vez que se desconhecem os coeficientes γj.

A equacao (4.5) pode ser reescrita do seguinte modo:

u(t) = θ>3 φ3(t) (4.6)

Page 93: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

4.1 Analise da estabilidade do algoritmo IMRACW 93

ondeθ>3 =

[γ0 . . . γnl γ0s0 . . . γnls0 . . . γ0sna−1 . . . γnlsna−1 g?

1 . . . g?nb+d

](4.7)

φ>3(t) = [T ?0 (y(t + d + 1)) . . . T ?

nl(y(t + d + 1)) φ>e2(t)] (4.8)

em que φ>e2(t) e dado pela equacao (3.18) e T ?j (.) = Am(q−1)Tj(.) para j = 0, . . . , nl.

A lei de controlo baseada no modelo de referencia e dada por

u(t) = θ>3(t) φ4(t) (4.9)

ondeφ>4(t) = [T ?

0 (ym(t + d + 1)) . . . T ?nl(ym(t + d + 1)) φ>e2(t)] . (4.10)

Para se estimar o vector de parametros θ3(t) usa-se um algoritmo recursivo de mınimosquadrados em que a actualizacao do ganho de kalman, do vector de parametros e damatriz de covariancia e identica a descrita nas equacoes (3.30)-(3.32), com o erro deadaptacao a ser dado, neste caso, pela equacao

e3(t) = u(t− d− 1)− θ>3(t− 1) φ3(t− d− 1). (4.11)

O teorema seguinte constitui um resultado importante na medida em que e uma provada convergencia e estabilidade do algoritmo de controlo adaptativo IMRACW.

Teorema 4.1. O algoritmo IMRACW, quando aplicado a sistemas de Wiener queobedecem as condicoes (H1)-(H5) e em que o modelo de referencia cumpre os pre-requisitos (M1)-(M3) verifica as seguintes propriedades:

(i) u(t) e y(t) sao sucessoes limitadas.

(ii) limt→∞

(y(t)− ym(t)) = 0.

Demonstracao. Combinando as equacoes (4.6) e (4.11), pode-se escrever:

e3(t) = θ>3 φ3(t− d− 1)− θ>3(t− 1) φ3(t− d− 1)

= −θ>3(t− 1) φ3(t− d− 1)(4.12)

onde θ>3(t− 1) , θ>3(t− 1)− θ3. Por outro lado, da equacao (4.9) sabe-se que

u(t− d− 1) = θ>3(t− d− 1) φ4(t− d− 1). (4.13)

Usando (4.9) o erro de adaptacao tambem pode ser escrito como:

e3(t) = θ>3(t− d− 1) φ4(t− d− 1)− θ>3(t− 1) φ3(t− d− 1) (4.14)

ou seja:

e3(t) = φ>4(t− d− 1)(θ3(t− d− 1)− θ3(t− 1)

)

+ (φ>4(t− d− 1)− φ>3(t− d− 1)) θ3(t− 1)(4.15)

Page 94: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

94 Convergencia e Estabilidade

onde

(φ>4(t− d− 1)− φ>3(t− d− 1)) θ3(t− 1) = Am(q−1)(xm(t)− x(t)) (4.16)

= Am(q−1)ε2(t) (4.17)

= −ε3(t) (4.18)

e

xm(t) =nl∑

j=0

γj(t) Tj(ym(t))

x(t) =nl∑

j=0

γj(t) Tj(y(t)).

Quando se aplica o Lema 3.3.6 de Goodwin e Sin (1984) ao algoritmo recursivo (3.30)-(3.32), com erro de adaptacao (4.11), resulta,

limt→∞

e3(t)

(1 + k3φ>3(t− d− 1)φ3(t− d− 1))12

= 0 (4.19)

onde k3 = λmax(P (0)) denota o maior dos valores proprios de P (0) e

limt→∞

‖θ3(t)− θ3(t− k)‖ = 0, para qualquer k finito. (4.20)

Usando as equacoes (4.14), (4.15) e (4.20) em (4.19) resulta:

limt→∞

ε23(t)

1 + k3φ>3(t− d− 1)φ3(t− d− 1)= 0. (4.21)

A prova de (i) e (ii) requer que sejam validas as tres condicoes do Lema Tecnico Chaveenunciado no Apendice D. A condicao de limitacao linear e a mais difıcil de verificar,exige que se prove que

∃c1,c2∈IR+ ‖φ3(t− d− 1)‖ ≤ c1 + c2 max0≤τ≤t

|ε3(τ)|.

Para tal, comece-se por constatar que, pelo Lema B.3.3 de Goodwin e Sin (1984) epela hipotese (H3) sobre o modelo de Wiener, que se recorda- B(q−1) e um polinomioestavel e o sinal de b0 e conhecido- pode-se afirmar que existem constantes m2 < ∞ em3 < ∞ tais que

|u(k)| ≤ m2 + m3 max1≤τ≤t

|x(τ + d + 1)| ∀ 1 ≤ k ≤ t. (4.22)

Como

|Am(q−1)| ≤ 1 +na∑

k=1

amk = m1 < ∞, (4.23)

Page 95: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

4.1 Analise da estabilidade do algoritmo IMRACW 95

e |Tj(·)| ≤ 1, se as funcoes de base forem, por exemplo, polinomios de Chebyshev,tem-se:

‖φ3(t− d− 1)‖ ≤ (nl + 1)m1 + (nl + 1)na + (nb + d)

(m2 + m3 max

1≤τ≤t|x(τ)|

). (4.24)

Considere-se, sem perda de generalidade, que a nao linearidade e uma funcao suave,monotona decrescente, injectiva (por (H4)) e f(0) = yN . Recorde-se que, pelahipotese (H5), se assume que o intervalo de operacao e conhecido, isto e, y ∈ [y0, yN ],com y0 e yN conhecidos. Um exemplo de uma nao linearidade que cumpre os pressu-postos pode ser dado por

f(x(t)) =yN − y0

1 + x(t)+ y0, com x(0) = 0, x(t) ≥ 0 e y0, yN > 0. (4.25)

O sinal estimado, x(t), nas condicoes acima descritas, esta limitado pelas semi-rectas

com declives (em valor absoluto) mınimo (decmin) e maximo ( decmax), respectiva-mente. Assim,

decmin (y(t)− yN) ≤ x(t) ≤ decmax (y(t)− yN). (4.26)

Seja

k2 = − decmax yN (4.27)

k3 = −decmin yN , k2, k3 > 0. (4.28)

Por (4.26) e (4.27) pode-se escrever:

|x(t)| ≤ | decmax| |y(t)|+ k2 (4.29)

ou

|y(t)| ≥ 1

| decmax|(|x(t)| − k2). (4.30)

O valor absoluto do erro de seguimento e dado por,

|ε(t)| = |y(t)− ym(t)|≥ |y(t)| − k1, k1 < ∞

(4.31)

Inserindo (4.30) em (4.31), tem-se

|ε(t)| ≥ 1

| decmax|(|x(t)| − k2)− k1. (4.32)

Por (4.17) e (4.26) pode-se escrever:

|ε2(t)| ≥ |decmin| |ε(t)|. (4.33)

Page 96: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

96 Convergencia e Estabilidade

Inserindo (4.32) em (4.33), resulta em:

|ε2(t)| ≥ |decmin|| decmax|

|x(t)| − |decmin|(

1

| decmax|k2 + k1

)

= m4|x(t)| −m5 , m4,m5 > 0.

(4.34)

Assim

|x(t)| ≤ |ε2(t)|m4

+m5

m4

. (4.35)

Usando (4.35) em (4.22), resulta:

‖φ3(t− d− 1)‖ ≤ (nl + 1)m1 + (nl + 1)na + (nb + d)

[m2 + m3 max

1≤τ≤t

( |ε2(τ)|m4

+m5

m4

)]

(4.36)ou seja:

‖φ3(t− d− 1)‖ ≤ c1 + c′2 max1≤τ≤t

|ε2(τ)|= c1 + c2 max

1≤τ≤t|ε3(τ)| (4.37)

em que c2 =c′2m1

, com m1 dado por (4.23).

Por (4.37), conclui-se que o algoritmo IMRACW satisfaz a condicao de limitacao lineardo Lema Tecnico Chave. As outras duas condicoes do Lema sao faceis de verificar.Considere-se s(t) = ε3(t), σ(t) = φ3(t − d − 1), b1(t) = 1 e b2(t) = k3. Por aplicacaodo Lema Tecnico Chave, conclui-se que

(i) limt−→+∞

ε3(t) = 0.

(ii) ||φ3(t− d− 1)|| e majorada.

Por (4.19) e por (ii), conclui-se que o erro de adaptacao tende assimptoticamente parazero,

limt−→+∞

e3(t) = − limt−→+∞

θ>3(t− 1) φ3(t− d− 1) = 0

Finalmente, da equacao (4.21) e de (ii), resulta:

limt−→+∞

ε3(t) = 0 e limt−→+∞

(x(t)− xm(t)) = 0

e como se assume que a nao linearidade (logo, tambem a sua inversa) e injectiva,conclui-se que o erro de seguimento tende assimptoticamente para zero, isto e,

limt−→+∞

(y(t)− ym(t)) = 0

¥

Page 97: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

4.1 Analise da estabilidade do algoritmo IMRACW 97

4.1.1 Estabilidade do algoritmo IMRACW baseado em T

modelos preditivos

A prova da estabilidade e da convergencia do algoritmo IMRACW quando se usaa lei de controlo adaptativa (3.50) e identica a prova efectuada na seccao anterior.Neste caso ha mais uma hipotese restritiva a considerar: assumem-se conhecidos os Tprimeiros coeficientes da resposta impulsiva de B(q−1)/A(q−1).

Usa-se o Lema Tecnico Chave descrito no Apendice D e a prova e analoga a daSeccao 4.1, a menos de constantes de minoracao/majoracao dos sinais envolvidos.A majoracao do regressor φ5(·) a semelhanca da majoracao do regressor φ3(·) dainequacao (4.36), pode ser obtida da seguinte forma:

‖φ5(t− d−T)‖ ≤T× (nl + 1)m1 + na× (nl + 1)

+ (nb + d)×[m2 + m3 max

1≤τ≤t

( |ε2(τ)|m4

+m5

m4

)],

(4.38)

onde e assinalado um factor que difere da inequacao (4.36) por se ter considerado Tmodelos preditivos na construcao do modelo de regressao.

4.1.2 Estabilidade na presenca de incerteza associada ao mo-delo

Na Seccao 4.1 estabeleceu-se a estabilidade do algoritmo IMRACW fazendo uso deum modelo determinıstico. A questao que se coloca e: qual e a influencia dos ruıdosestocasticos ignorados na estabilidade global do algoritmo? Em particular, o quesucede quando se considera o erro na aproximacao da nao linearidade?

Quando a aproximacao da nao linearidade, xa(t), nao e exacta, o sinal intermedio x(t),pode ser definido como:

x(t) =nl∑

j=0

γj Tj(y(t))

︸ ︷︷ ︸xa(t)

+ξ(t), (4.39)

onde ξ(t) representa o erro na aproximacao da nao linearidade.

O modelo entrada-saıda e agora dado por:

u(t− d− 1) = θ>3 φ3(t) + ω(t) (4.40)

em que,ω(t) = A(q−1) ξ(t),

|ω(t)| ≤(

1 +na∑i=1

|ai|)|ξ(t)| ≤ ∆ < ∞,

Page 98: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

98 Convergencia e Estabilidade

em que os ai, i = 1, . . . , na, sao os coeficientes do polinomio A(q−1).

A magnitude do erro de aproximacao depende do numero de funcoes de base, Tj(·),usado na aproximacao. Como o sinal ω(t) e limitado, a estabilidade do algoritmoIMRACW pode ser assegurada caso se use um algoritmo de estimacao com restricoes(Kreisselmeier e Narendra 1982, Goodwin e Sin 1984). Para garantir que todos ossinais envolvidos sao limitados, assume-se que a seguinte hipotese e valida:

(H6) E conhecido um majorante, M3, para a norma do vector de parametros θ3:||θ3|| ≤ M3.

As estimativas dos parametros estao agora confinadas ao conjunto,

S3 = θ3(t) : ||θ3(t)|| ≤ M3.

O erro de seguimento residual depende da dimensao do erro de aproximacao ξ(t) ee nulo quando a aproximacao e exacta. O lema seguinte estabelece a convergencia eestabilidade do algoritmo IMRACW na presenca de incerteza associada ao modelo.

Lema 4.1. O algoritmo IMRACW com projeccao (tal que ||θ3|| ≤ M3), quando apli-cado a sistemas de Wiener que obedecem as condicoes (H1)-(H6) e em que o modelode referencia cumpre os pre-requisitos (M1)-(M3) verifica as seguintes propriedades:

(i) u(t) e y(t) sao sucessoes limitadas.

(ii) limt→∞

(y(t)− ym(t)) =

F (ξ(t)) , ξ(t) 6= 0

0 , ξ(t) = 0.

Demonstracao. A nao linearidade e injectiva, logo, admite inversa. Pela hipotese(H5) assume-se que a regiao de operacao e conhecida, isto e, y ∈ [y0, yN ], com y0 eyN conhecidos. Tem-se assim uma funcao suave definida num conjunto compacto. Docalculo elementar, pode-se afirmar: quando se tem uma funcao suave definida por,x = f−1(y), num conjunto compacto [y0, yN ], entao, para todo ∆ > 0, existe umafuncao contınua xa(t) (pode ser linear por intervalos ou obtida a partir de funcoes debase, por exemplo, polinomios de Chebyshev) tal que

|x(t)− xa(t)| < ∆, ∀y ∈ [y0, yN ].

O erro de aproximacao, ξ(t), e um sinal majorado pelo que a analise da estabilidade econvergencia do algoritmo IMRACW com projeccao e semelhante a de um algoritmoMRAC com perturbacoes majoradas. A partir da hipotese (H6) e adicionada aprojeccao para garantir a majoracao das estimativas dos parametros, as conclusoes(i) e (ii) do lema resultam das conclusoes a que chegaram Kreisselmeier e Narendra(1982) na prova da estabilidade de algoritmos MRAC na presenca de perturbacoes

Page 99: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

4.2 Analise da estabilidade do algoritmo WFPAC 99

majoradas. Em relacao a convergencia assimptotica refira-se que a eventual pola-rizacao no seguimento da referencia pode ser reduzida/eliminada se for adicionado omodo integral ao controlador. Obtem-se melhores resultados para sinais de referencialentos. ¥

Na proxima seccao analisa-se a estabilidade do algoritmo WFPAC.

4.2 Analise da estabilidade do algoritmo WFPAC

Nesta seccao pretende-se analisar a estabilidade do sistema adaptativo WFPAC apre-sentado na seccao 3.4.2 para o controlo de sistemas de Wiener com parametros des-conhecidos. De modo a tornar a analise possıvel, sao consideradas, sem perda degeneralidade, algumas hipoteses simplificativas.

Comeca-se por recordar que a parte linear do modelo de Wiener pode ser dada por

A(q−1

)x(t) = q−(d+1)B(q−1)u(t) (4.41)

onde d + 1 e o tempo de atraso e A (q−1) e B(q−1) sao polinomios de grau na e nb,respectivamente.

A nao linearidade e descrita pela equacao

y(t) = f(x(t)). (4.42)

O modelo de referencia e dado pela equacao

Am(q−1) ym(t) = q−(d+1) Bm(q−1) r(t) (4.43)

onde Am(q−1) e Bm(q−1) sao, respectivamente, polinomios de grau na e nb.

No que se segue, assume-se, para simplificar a analise da estabilidade, que os coefici-entes γj da parametrizacao da inversa da nao linearidade sao conhecidos. Os sinaisxm(t) e x(t) podem ser recuperados atraves das relacoes

xm(t) =nl∑

j=0

γj Tj(ym(t)) (4.44)

x(t) =nl∑

j=0

γj Tj(y(t)) (4.45)

em que Tj(·) sao funcoes de base.

Assuma-se ainda que o sinal xm(t), dado pela equacao (4.44), tambem pode ser“recuperado” atraves do seguinte modelo determinıstico,

A(q−1) xm(t) = q−(d+1) T (q−1) r(t) (4.46)

Page 100: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

100 Convergencia e Estabilidade

onde d + 1 e o tempo de atraso e A(q−1) e T (q−1) sao polinomios de grau na e nt,respectivamente.

Sao consideradas as seguintes hipoteses sobre o sistema:

(H1) O tempo de atraso do sistema e unitario.

(H2) Conhecem-se majorantes para na, nb e nt.

(H3) As funcoes de transferenciaB(q−1)

A(q−1)e

Bm(q−1)

Am(q−1)sao estaveis.

(H4) Os coeficientes wj, j = 1, . . . , T , da resposta impulsiva deB(q−1)

A(q−1)sao conhecidos.

(H5) A nao linearidade e uma funcao suave e injectiva num conjunto compacto.

(H6) A regiao de operacao assume-se conhecida, isto e, y, ym ∈ [y0, yN ], com y0 e yN

conhecidos.

(H7) Os coeficientes γj das relacoes (4.44) e (4.45) sao conhecidos.

O teorema seguinte constitui um resultado importante na medida em que e uma provada convergencia e estabilidade do algoritmo de controlo adaptativo WFPAC.

Teorema 4.2. O algoritmo WFPAC, quando aplicado a sistemas de Wiener queobedecem as condicoes (H1)-(H7) e ainda:

(H8) As funcoes de transferencia seguintes sao estaveis:

A(q−1)

Q(q−1),

B(q−1)

Q(q−1)e

T (q−1)

Q(q−1),

em que Q(q−1) e o polinomio caracterıstico do sistema em cadeia fechada no caso deparametros conhecidos, dado por

Q(q−1) = A(q−1)−T∑

j=1

kj qj−1[B(q−1)−Wj(q

−1)A(q−1)],

verifica as seguintes propriedades:

(i) ∃c1,c2∈IR+ : ‖s(t)‖2 ≤ c1 + c2 max0<τ<t

T∑j=1

e2j(τ).

para j = 1, . . . , T :

(ii) πj(t) e s(t) sao sucessoes limitadas.

Page 101: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

4.2 Analise da estabilidade do algoritmo WFPAC 101

(iii) limt→∞

ej(t) = 0.

(iv) limt→∞

(ut − u?t ) = 0.

Demonstracao. A partir das equacoes (4.41) e (4.46) e da hipotese (H1) obtem-se ummodelo que caracteriza a dinamica do erro no seguimento da referencia:

A(q−1) x(t) = q−1 B(q−1) u(t)− q−1 T (q−1) r(t) (4.47)

A partir da equacao diofantina

1 = Fj(q−1) A(q−1) + q−j Sj(q

−1) (4.48)

pode-se escrever o seguinte modelo j passos a frente:

x(t + j) = Sj(q−1) x(t) + Gj(q

−1) u(t + j − 1)−Hj(q−1) r(t + j − 1), (4.49)

com Gj(q−1) , Fj(q

−1)B(q−1) e Hj(q−1) , Fj(q

−1)T (q−1).

O polinomio Gj(q−1) pode ser decomposto da seguinte forma:

Gj(q−1) = Wj(q

−1) + q−j G?j(q

−1), (4.50)

em que:

Wj(q−1) = w1 + w2 q−1 + . . . + wj q−j+1 (4.51)

G?j(q

−1) = gj0 + gj

1 q−1 + . . . + gjnb q−nb (4.52)

Substituindo (4.50) em (4.49), vem:

x(t + j) = Sj(q−1) x(t) + Wj(q

−1) u(t + j − 1)

+ G?j(q

−1) u(t− 1) + H?j (q−1) r(t + j − 1),

(4.53)

com H?j (q−1) , −Hj(q

−1).

O preditor j passos a frente, dado por (4.53), pode ser reescrito como segue:

x(t + j) = w1u(t + j − 1) + w2u(t + j − 2) + . . . + wju(t) + π>j s(t), (4.54)

com

π>j = [ sj0 . . . sj

na−1 gj0 . . . gj

nb hj0 . . . hj

nt+j ] (4.55)

s(t) = [ x(t) . . . x(t− na + 1) u(t− 1) . . . u(t− nb− 1)

r(t + j − 1) . . . r(t− nt− 1) ]> (4.56)

De (4.53) e (4.54) pode-se inferir que

π>j s(t) = Sj(q−1) x(t) + G?

j(q−1) u(t− 1) + H?

j (q−1) r(t + j − 1) (4.57)

Page 102: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

102 Convergencia e Estabilidade

Prova-se facilmente que a lei de controlo que minimiza o funcional de custo

JT =T∑

j=1

x2(t + j) + ρ u2(t + j − 1) (4.58)

pode ser dada por

u(t) =T∑

j=1

kj π>j s(t) (4.59)

em que os coeficientes kj, que dependem dos coeficientes da resposta impulsiva wj, seassumem conhecidos pela hipotese (H4).

Substituindo (4.57) em (4.59) resulta,

u(t) =T∑

j=1

kj

[Sj(q

−1) x(t) + G?j(q

−1) u(t− 1) + H?j (q−1) r(t + j − 1)

](4.60)

Substituindo (4.60) em (4.47) resulta:

A(q−1) x(t) = q−1 B(q−1)T∑

j=1

kj [ Sj(q−1) x(t) + G?

j(q−1) u(t− 1)

+ H?j (q−1) r(t + j − 1) ]− q−1 T (q−1) r(t)

(4.61)

Quando se elimina u(t) na equacao (4.61) obtem-se

x(t) =1

Q(q−1)

T∑j=1

kj q−1[ q−1 T (q−1) G?j(q

−1) r(t)

+ B(q−1) H?j (q−1) r(t + j − 1) ]− q−1 T (q−1)

Q(q−1)r(t),

(4.62)

ou seja, o polinomio caracterıstico e dado por

Q(q−1) = A(q−1)−T∑

j=1

kj q−1 [ B(q−1) Sj(q−1) + G?

j(q−1) A(q−1) ]. (4.63)

Fazendo uso da equacao (4.50), o polinomio caracterıstico pode tambem ser dado por

Q(q−1) = A(q−1)−T∑

j=1

kj qj−1 [ B(q−1)−Wj(q−1) A(q−1) ]. (4.64)

Observe-se que a estabilidade do sistema em cadeia fechada depende dos polinomiosB(q−1) e A(q−1) e dos termos da resposta impulsiva na entrada u(t) do sistema emcadeia aberta.

Page 103: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

4.2 Analise da estabilidade do algoritmo WFPAC 103

Para a prova de (i) comeca-se por observar que o erro de adaptacao decorre de (4.54)quando se assume que os coeficientes wj sao conhecidos e e dado por

ej(t) = x(t + j)−Wj(q−1) u(t + j − 1)− π>j(t− 1) s(t)

= −π>j s(t)(4.65)

Somando e subtraindoT∑

j=1

kj π>j s(t) a lei de controlo adaptativa, u(t) =T∑

j=1

kj π>j(t) s(t),

resulta:

u(t) =T∑

j=1

kj π>j(t) s(t) +T∑

j=1

kj π>j s(t) (4.66)

Substituindo (4.57) em (4.66) vem:

u(t) =T∑

j=1

kj π>j(t) s(t)

+T∑

j=1

kj [ Sj(q−1) x(t) + G?

j(q−1) u(t− 1) + H?

j (q−1) r(t + j − 1) ]

(4.67)Quando se elimina x(t) em (4.67) vem:

u(t) =A(q−1)

Q(q−1)

T∑j=1

kj π>j(t) s(t)

+1

Q(q−1)

T∑j=1

kj [−q−1 Sj(q−1) T (q−1) r(t)

+ A(q−1) H?j (q−1) r(t + j − 1) ]

(4.68)

Por (4.65) pode-se escrever:

u(t) = −A(q−1)

Q(q−1)

T∑j=1

kj ej(t)

+1

Q(q−1)

T∑j=1

kj [−q−1 Sj(q−1) T (q−1) r(t)

+ A(q−1) H?j (q−1) r(t + j − 1) ]

(4.69)

Assumindo que a hipotese (H8) se verifica, pode-se inferir que

∃c3,c4,c5,c6 < ∞ :

|u(t)| ≤ c3 + c4 max0<τ<t

|T∑

j=1

ej(τ)|, (4.70)

|y(t)| ≤ c5 + c6 max0<τ<t

|T∑

j=1

ej(τ)|. (4.71)

Page 104: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

104 Convergencia e Estabilidade

Da definicao de s(t) dada pela equacao (4.56) e das desigualdades (4.70) e (4.71)prova-se a desigualdade (i).

Usando os mesmos argumentos que Lemos (1989), pode-se provar que a funcao naonegativa vj(t) = π>j P (t) πj e decrescente, logo, convergente para zero. Daqui resultaque

limt→∞

e2j(t)

1 + s>(t)P (t− 1)s(t)= 0 (4.72)

o que implica

limt→∞

∑Tj=1 e2

j(t)

1 + λmax[P (0)] ‖s(t)‖2= 0 (4.73)

onde λmax[P (0)] denota o maior dos valores proprios de P (0).

Por (i) e (4.73) pode-se concluir que sao validas as condicoes do Lema Tecnico Chaveapresentado em Goodwin e Sin (1984) e transcrito no Apendice D e daı poder concluir-se que a sucessao s(t) e limitada.

Sabendo que s(t) e majorada, a partir da equacao (4.73) prova-se (iii) e daquiresulta que πj(t) e uma sucessao limitada.

Sabendo que u?t e a lei de controlo quando se conhecem os parametros πj, por (4.66)

e (iii) resulta:

limt→∞

(ut − u?t ) = − lim

t→∞

T∑j=1

kj ej(t) = 0 (4.74)

e conclui-se (iv). ¥

Page 105: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

Capıtulo 5

Resultados de simulacao

Neste capıtulo sao apresentados resultados de simulacao obtidos quando se conside-ram os diversos algoritmos desenvolvidos neste trabalho. Os resultados apresentadospretendem ilustrar o desempenho dos diversos algoritmos e a diferenca entre eles. Aaplicacao escolhida constitui o caso de estudo deste trabalho: o controlo automaticodo bloqueio neuromuscular.

Nas seccoes seguintes sao considerados diversos algoritmos de identificacao e de con-trolo. Em cada seccao sao apresentados os resultados para um dado algoritmo, tendoem conta diversos cenarios e parametros de simulacao, nomeadamente:

• as ordens do modelo parametrico (linear e/ou nao linear);

• o modelo de regressao escolhido;

• o algoritmo de adaptacao usado;

• as leis de controlo implementadas;

• o modelo de referencia escolhido e respectiva dinamica;

• a presenca (ou nao) de variacao de parametros no modelo;

• a presenca (ou nao) de ruıdo.

Na proxima seccao descreve-se, resumidamente, o modelo PK/PD do atracurio usadonas simulacoes. No Apendice A sao apresentadas as equacoes que caracterizam adinamica do sistema em estudo.

Page 106: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

106 Resultados de simulacao

5.1 Parametros de simulacao

A resposta dinamica do bloqueio neuromuscular pode ser modelada fazendo uso deuma estrutura de Wiener. E composta por um modelo compartimental linear, desig-nado por modelo farmacocinetico, que relaciona a taxa de infusao de farmaco, u(t),com a concentracao plasmatica, cp(t), por um terceiro compartimento dito de efeitoque caracteriza aspectos temporais da distribuicao e eliminacao do farmaco e porum modelo nao linear, que relaciona a concentracao de efeito, ce(t), com a respostafarmacodinamica induzida, r(t).

A funcao de transferencia usada para representar a parte linear do modelo PK/PD dofarmaco resulta das equacoes (A.3) e (A.7) descritas no Apendice A e pode ser dadapor:

Gi(s) =

(Ai

s + αi

+Bi

s + βi

)(ki

e0

s + kie0

), i = 1, . . . , 100, (5.1)

em que Ai e Bi sao dados em mg/ml e αi, βi, kie0 em min−1.

Nas Tabelas A.3, A.4,A.5 e A.6, sao apresentadas as funcoes de transferencia, emtempo contınuo e os parametros (c50, s) da equacao de Hill (A.8) do banco de 100modelos usado nas simulacoes efectuadas. Os dados que aparecem nas tabelas foramgerados por Lago et al. (1998) a partir de dados disponıveis na literatura.

Neste capıtulo, como sao apresentados resultados de simulacao de diversos algoritmosadaptativos em que o numero de parametros a estimar e elevado, em lugar de seusar um modelo de ordem 4 para caracterizar a dinamica linear do atracurio, usa-seum modelo de ordem 3. Para se reduzir a ordem do modelo, nao foi consideradoo modelo empırico com funcao de transferencia, Gatraso(s) que aparece nas Tabe-las A.3, A.4, A.5 e A.6.

A funcao de transferencia para o primeiro modelo do banco, designado por Pac1, edada por

G1(s) =

(0.0303

s + 0.5715+

0.0055

s + 0.0368

)(0.1014

s + 0.1014

). (5.2)

A funcao de transferencia em tempo discreto, para um tempo de amostragem de 20segundos (ta = 1/3 (min.)) e fazendo uso do metodo ZOH, e dada por:

G1(z) = (10−3) · 0.1891z2 − 0.0047z − 0.1702

z3 − 2.7811z2 + 2.5705z − 0.7893. (5.3)

O efeito farmacodinamico induzido pelo atracurio pode ser modelado pela equacao deHill,

r(t) =100

1 +[

ce(t)

ci50

]sii = 1, . . . , 100, (5.4)

em que r(t) e o nıvel de bloqueio neuromuscular, ce(t) e a concentracao de efeito e ci50

e si sao parametros que dependem (em ambiente clınico) do paciente. No contexto

Page 107: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

5.1 Parametros de simulacao 107

das simulacoes efectuadas, ci50 (µg/ml) e si (adimensional), i = 1, . . . , 100, decorrem

do banco de 100 modelos referido anteriormente.

Em quase todas as simulacoes apresentadas neste capıtulo foi adicionado ruıdo paramelhor replicar o que acontece em ambiente clınico. A simulacao do ruıdo na leiturado datex relaxograph, usado no bloco operatorio para registar o nıvel de relaxamentomuscular, e efectuada assumindo que o sinal com ruıdo, aqui designado por yr(t),segue uma distribuicao Lognormal, com valor esperado y e desvio padrao a xγ, em quea e γ sao parametros que caracterizam a intensidade do ruıdo.

Nas proximas seccoes serao apresentados diversos resultados de simulacao, que resul-tam da aplicacao das leis de controlo descritas no Capıtulo 3 e de algumas variantesdesenvolvidas para o controlo do bloqueio neuromuscular, descritas na respectivaseccao. Para cada simulacao apresentam-se geralmente tres graficos, que correspon-dem, respectivamente:

• ao nıvel de relaxamento obtido, r(t)(%), versus a saıda estabelecida pelo modelode referencia, ym(t);

• a taxa de infusao farmaco, u(t) (µg/kg/min), administrada;

• a evolucao das estimativas: o vector de parametros e composto por parametrosda parte linear do modelo de Wiener, os parametros g?

i ; da inversa da parte naolinear, os parametros γj e por parametros combinados, os parametros, γj sk.

Para facilitar a interpretacao dos resultados de simulacao, sao apresentadas tabelascom os parametros de simulacao adoptados. A seguir descreve-se o significado dasabreviaturas usadas nas tabelas:

(Parametros de simulacao I)

Ordens na: ordem do numeradornb: ordem do denominadornl: grau mais elevado de entre os polinomios de Chebyshev

Alg. de Adaptacao Tipo : Padrao (P), Esquecimento Exponencial (EE),Esquecimento Direccional Variavel (EDV)

λ: Factor de EsquecimentoΣ0: parametro de actualizacao do λ (se) variavel

Controlo P. Fix.: controlador de parametros fixos usado, P, PD, ou PIDtCA: tempo (min.) de activacao do controlador adaptativo

ρ: Peso no esforco de controloσ2

η : variancia do dither adicionado para assegurar a excitacao persistente

b0(t): Indica se o parametro b0 e estimado

Page 108: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

108 Resultados de simulacao

(Parametros de simulacao II)

Variacao de Parametros Tipo : Variacao Linear (Var. Lin.) ou Exponencial (Var. Exp.)ti (min.): tempo inicial de variacao de parametros

Paci (min.): modelo inicial (i = 1, . . . , 100)Pacf (min.): modelo final (se ocorrer variacao de parametros)

Modelo de Referencia α: (0 ≤ α < 1), define a dinamica do modelo de referencia,α ≈ 0, dinamica rapida; α ≈ 1, dinamica lenta

tsalto(min.): tempo (min.) em que ocorre um “salto” na referencia

Ruıdo s/n: indica se a simulacao foi efectuada com a adicao de ruıdo

5.2 Algoritmo IMRACW aplicado ao controlo do

NMB

O algoritmo de controlo IMRACW (Implicit Model Reference Adaptive Controller forWiener Models) descrito na seccao 3.3.2, consiste num controlador baseado, implicita-mente, num modelo de referencia, projectado para modelos com estrutura de Wiener.O diagrama de blocos apresentado na Figura 3.4 e tambem na Tabela 5.1 ilustra aestrategia de controlo IMRACW.

Na descricao do algoritmo IMRACW efectuada anteriormente fixou-se o parametrob0. Esta opcao justifica-se para garantir a identificabilidade do sistema de Wiener.Constatou-se, no entanto, que o controlador assim obtido nao apresenta um bomdesempenho porque conduz a saturacao da variavel manipulada. Esta observacaomotivou o desenvolvimento de algumas variantes para o algoritmo IMRACW que saodescritas neste capıtulo.

O modelo preditor na entrada, quando se assume que b0 e conhecido e dado por:

u(t) =1

b0

θ>1 φ1(t) (5.5)

onde

θ>1 = [ γ0 · · · γnl γ0s0 · · · γnls0 · · · γ0sna−1 · · · γnlsna−1 g?1 · · · g?

nb+d ] (5.6)

φ>1(t) = [ T0(y(t + d + 1)) · · ·Tnl(y(t + d + 1)) φ>11(t) ] (5.7)

e

φ>11(t) = [−T0(y(t)) · · · − Tnl(y(t)) · · · − T0(y(t− na + 1)) · · ·− Tnl(y(t− na + 1)) − u(t− 1) · · · − u(t− nb− d) ]

(5.8)

Quando se pretende estimar b0, o modelo preditor passa a ser dado por:

u(t) = θ>2 φ2(t) (5.9)

onde

θ>2 = [ (1− b0) θ>1 ] (5.10)

φ>2(t) = [ u(t) φ>1(t) ] (5.11)

Page 109: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

5.2 Algoritmo IMRACW aplicado ao controlo do NMB 109

Nas simulacoes efectuadas, quando se optou por esta segunda via, considerou-se umaestimativa de b0 com restricoes para assegurar a identificabilidade do modelo deWiener. Assumiu-se que b0(t) ∈ [ b0, b0 ], com b0 e b0 definidos a priori.

Na estimacao dos parametros dos modelos preditivos (5.5) e (5.9), usaram-se diversasvariantes de um algoritmo de mınimos quadrados recursivo, sendo que os melhoresresultados foram obtidos com a variante designada por RLS com esquecimento direc-cional variavel, descrita na seccao 3.4.1.

Observe-se que os erros de adaptacao para os preditores (5.5) e (5.9) sao dados,respectivamente, por

e1(t) = u(t− d− 1)− θ>1(t− 1) φ1(t− d− 1)

e

e2(t) = u(t− d− 1)− θ>2(t− 1) φ2(t− d− 1)

A lei de controlo adaptativa IMRACW obtem-se a partir de (5.5) ou (5.9), substituindoos parametros pelas suas estimativas e incorporando nos regressores a informacaorelativa ao modelo de referencia. A lei de controlo para cada uma das variantes edada, respectivamente, por:

u1(t) =1

b0

θ>1(t) φ1m(t) (5.12)

u2(t) =1

b0(t)θ>1(t) φ1m(t) (5.13)

ondeφ>1m(t) = [ T0(ym(t + d + 1)) · · ·Tnl(ym(t + d + 1)) φ>11(t) ] (5.14)

com φ>11(t) dado pela equacao (5.8).

As leis de controlo (5.12) e (5.13) nem sempre conduzem a bons resultados, uma vezque se verifica frequentemente a saturacao na variavel manipulada. Para reduzir oesforco de controlo desenvolveu-se uma lei de controlo que penaliza a actividade decontrolo (para o NMB a taxa de infusao de farmaco). A lei de controlo IMRACW queincorpora o peso na accao de controlo e apresentada na proxima seccao.

5.2.1 Lei de controlo IMRACW com peso na accao de con-trolo

A solucao pode passar por considerar um funcional de custo que pese o esforco decontrolo. Considere-se,

J = E[(x(t + d + 1)− xm(t + d + 1))2 + ρ u2(t)|Ot

](5.15)

Page 110: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

110 Resultados de simulacao

em que x(t+d+1) corresponde ao preditor d+1 passos a frente da variavel intermediado modelo de Wiener e xm(t+d+1) decorre do modelo de referencia. Ambos os sinaissao obtidos a partir das estimativas dos parametros γj que aparecem nos modelos deregressao descritos nesta seccao. O parametro ρ pesa o esforco de controlo e E[ · |Ot ]denota a media condicionada a σ-algebra Ot, gerada pelos dados disponıveis ate aotempo discreto t.

Derivando em ordem a u(t) e igualando a zero, vem:

(x(t + d + 1)− xm(t + d + 1)) b0 + ρ u(t) = 0 (5.16)

Pelo Lema 3.1, sabe-se que

x(t + d + 1) = S(q−1) x(t) + F (q−1)B(q−1) u(t) (5.17)

Substituindo (5.17) em (5.16), vem,

S(q−1) x(t) + F (q−1)B(q−1) u(t) +ρ

b0

u(t) = xm(t + d + 1) (5.18)

A lei de controlo, u(t), que decorre de (5.18) e dada por,

u(t) =b0

b20 + ρ

[ xm(t + d + 1)− S(q−1) x(t)−G?(q−1) u(t) ], (5.19)

em que G?(q−1) = B(q−1)F (q−1)− b0.

Prova-se que os polos do sistema em malha fechada estao situados sobre o lugargeometrico das raızes de

Am(q) [ B(q) qd+1 +ρ

b0

A(q) ] = 0 (5.20)

Para valores baixos do peso de controlo ρ, as raızes de (5.20) estao perto das raızes deAm(q) B(q) qd+1, recuperando-se os resultado do controlo dado pelas leis de controlo(5.12) e (5.13). Para valores elevados de ρ os polos estao perto dos polos do modelode referencia e dos polos do sistema em cadeia aberta. Para valores intermedios, aposicao dos polos obtem-se tracando o lugar geometrico das raızes de (5.20). Deixapois de haver um cancelamento exacto dos zeros do sistema em cadeia aberta, o que,por vezes, gera modos internos instaveis no controlo que decorre de (5.12) e (5.13).

5.2.2 Resultados de simulacao

Nesta seccao sao apresentados os resultados das simulacoes efectuadas de forma aavaliar o desempenho do algoritmo IMRACW quando aplicado ao controlo do bloqueioneuromucular. Na Tabela 5.1 recordam-se as principais caracterısticas do controladorIMRACW.

Page 111: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

5.2 Algoritmo IMRACW aplicado ao controlo do NMB 111

IMRACWImplicit Model Reference Adaptive

Controller for Wiener Models

modelo preditor: (3.34)

lei de controlo: (3.37)

variante A

modelo preditor: (5.9)

lei de controlo: (5.13)

variante B

modelo preditor: (5.9)

lei de controlo: (5.19)

ResumoE usado um unico modelo preditor na forma de errona entrada. Recorre-se a um modelo DARMA paraparametrizar a parte linear e a uma combinacao linearde funcoes de base para parametrizar a inversa da naolinearidade. A lei de controlo e baseada implicitamentenum modelo de referencia. Na variante A, o primeirocoeficiente da resposta impulsiva tambem e estimado.Na variante B pesa-se o esforco de controlo para evitarvariacoes bruscas na variavel de controlo.

ControladorIMRACW

)1d(q +−

)1dt(u −−

RLS(erro na entrada )

)t(ˆ2θ

)t()t(ˆ2

T2 φθ

)t(2φ

)1d(q +−

L

Modelo de Wiener

NL)t(u )t(y

∑=

∗ −nl

0jj1j ))1t(y(Ts

∑=

∗nl

0jj0j ))t(y(Ts

∑=

∗− +−

nl

0jj)1na(j ))1nat(y(Ts

1q −

)q(G 1−∗

)1dt(xm ++

)q(G 1m

)1dt(y m ++

)t(r ∑=

++nl

0jmjj ))1dt(y(Tγ

)1( −− naq

Tabela 5.1: Caracterısticas principais do algoritmo de controlo IMRACW e dasvariantes consideradas.

Page 112: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

112 Resultados de simulacao

Nas Figuras 5.1, 5.2 e 5.3 sao apresentados os resultados obtidos quando se usa ocontrolador IMRACW, aplicado ao controlo do bloqueio neuromuscular. Na Tabela 5.2sao especificados os parametros de simulacao. Neste caso foram escolhidos 6 (nl + 1)polinomios de Chebyshev para parametrizar a inversa da nao linearidade e foi usadoo algoritmo de adaptacao RLS com esquecimento direccional variavel. Quanto aocontrolo, comecou por se usar um controlador de parametros fixos (neste caso, PID),porque durante o bolus inicial (tbolus ≤ 5min.) a curva do relaxamento “varre” toda agama de operacao, (0 ≤ r(t) ≤ 100), numa fase em que ainda nao chegou informacaosuficiente ao filtro de Kalman para que ocorra a convergencia dos parametros. Ocontrolador de parametros fixos e uma solucao para que a saıda r(t) se situe numa faixade um dado ponto de operacao pre-estabelecido. O controlador adaptativo foi “ligado”,neste exemplo, a partir de tCA = 250min. No grafico relativo a dose administrada quese mostra na Figura 5.2, e assinalado o momento a partir do qual e usado o controladorIMRACW. Depois do bolus inicial a dose a administrar esta condicionada a gama devariacao: 0 ≤ u(t) ≤ 20 µg/kg/min.

Neste exemplo de simulacao foi usada a lei de controlo dada por (5.13), com a variante(5.19) que pesa o esforco de controlo. A lei de controlo resultante e a seguinte:

u(t) =b0(t)

b20(t) + ρ

θ>1(t) φ1m(t) (5.21)

Neste exemplo foi ainda adicionado ruıdo para tentar replicar o ruıdo na leitura dorelaxamento muscular que ocorre no bloco operatorio. O desempenho do controladore bastante satisfatorio. Note-se que uma lei de controlo do tipo “dead-beat” permitecolocar - na ausencia de perturbacoes - a saıda a seguir a referencia em poucas amostrasmantendo-se, a partir daı, constante o valor da variavel de controlo. Este facto podeconduzir a saturacao da variavel manipulada quando ocorrem mudancas bruscas natrajectoria de referencia. Para contornar este problema usou-se a lei de controlo (5.21).

Ordens Alg. de Adaptacao Controlo

na nb nl Tipo λ Σ0 P. Fix. tCA ρ σ2η b0(t)

3 2 5 EDV 0.95 5e-011 PID 250 1e-030 0 s

Tabela 5.2: Ordem adoptada para o modelo de Wiener, configuracao do algoritmo deadaptacao e controlo efectuado - controlador IMRACW.

Neste exemplo de simulacao tambem se incluiu a variacao de parametros no modelo.Como no contexto desta aplicacao existe uma grande intra-variabilidade na resposta dopaciente ao farmaco, que decorre, entre outros factores, do estado clınico do paciente,torna-se importante verificar o desempenho do controlador quando se alteram osparametros do modelo. Testou-se uma situacao limite. Para t = 1500 min. atet = 1600 min. fizeram-se variar os parametros do modelo de forma exponencial, sendoque no inıcio da simulacao se tinha o modelo classificado como “1” do banco de 100

Page 113: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

5.2 Algoritmo IMRACW aplicado ao controlo do NMB 113

0 1000 2000 3000 40000

20

Tempo(min)

r(t)

%

↓↓

Variação EXPONENCIAL de Parâmetros

Figura 5.1: Resultados do controlo do bloqueio neuromuscular. Relaxamento vs.trajectoria de referencia a seguir - controlador IMRACW.

0 500 1000 1500 2000 2500 3000 3500 40000

5

10

15

20

25

35

Tempo(min)

u(t

) µg

/kg/m

in ↓IMRACW

↓↓Variação EXPONENCIAL de Parâmetros

Figura 5.2: Dose u(t) em µg/kg/min - controlador IMRACW.

Page 114: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

114 Resultados de simulacao

0 500 1000 1500 2000 2500 3000 3500 4000−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1x 10

−8

Tempo(min)

Evolu

ção d

as

Est

ima

tiva

s

Figura 5.3: Evolucao no tempo das estimativas dos parametros - controladorIMRACW.

modelos e em t = 1600min. os parametros correspondem aos do modelo “86”. Verifica-se que o controlador corrige rapidamente a sobreelevacao causada pela alteracao nadinamica do modelo (Figuras 5.1 e 5.2).

A variacao exponencial de parametros foi implementada da seguinte forma: sejapar(t) um parametro do modelo, variavel no intervalo [ ti, tf ]. Seja par(ti) o valordo parametro no modelo inicial e par(tf ) o valor do parametro no modelo final. Avariacao exponencial pode ser conseguida fazendo:

par(t) = par(ti) + (e−1γ(t−ti) − 1) · [ par(tf )− par(ti) ] · 1

(e−1γ(tf−ti) − 1)

(5.22)

em que γ e a constante de tempo que define a taxa com que par(t) → par(tf ).

A seguir ilustra-se o desempenho do controlador IMRACW quando a referencia “varre”varios pontos de operacao. Consideram-se dois cenarios:

• sem ruıdo de “leitura”: Figuras 5.4, 5.5 e 5.6 e Tabela 5.3;

• com ruıdo de “leitura”: Figuras 5.7, 5.8 e 5.9 e Tabela 5.4.

O desempenho do controlador no primeiro cenario e optimo. Como seria expectavelo desempenho e pior na presenca de ruıdo de leitura. Note-se que a intensidade doruıdo e maior para nıveis de relaxamento mais elevados, pelo que o erro de seguimentoe maior quando os pontos de operacao estao acima de 15%.

Page 115: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

5.2 Algoritmo IMRACW aplicado ao controlo do NMB 115

0 1000 2000 3000 40000

20

40

Tempo(min)

r(t)

%

Figura 5.4: Nıvel de bloqueio neuromuscular vs. trajectoria de referencia. Teste dedesempenho para varios pontos de funcionamento - controlador IMRACW.

0 500 1000 1500 2000 2500 3000 3500 40000

5

10

15

20

25

35

Tempo(min)

u(t

) µg

/kg/m

in ↓IMRACW

Figura 5.5: Dose u(t) em µg/kg/min. Teste de desempenho para varios pontos defuncionamento - controlador IMRACW.

Ordens Alg. de Adaptacao Controlo

na nb nl Tipo λ Σ0 P. Fix. tCA ρ σ2η b0(t)

3 2 5 EDV 0.95 5e-011 PID 250 1e-030 0 s

Tabela 5.3: Parametros de simulacao. Teste de desempenho para varios pontos defuncionamento - controlador IMRACW.

Page 116: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

116 Resultados de simulacao

0 500 1000 1500 2000 2500 3000 3500 4000−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1x 10

−8

Tempo(min)

Evolu

ção d

as

Est

ima

tiva

s

Figura 5.6: Evolucao no tempo das estimativas dos parametros. Teste de desempenhopara varios pontos de funcionamento - controlador IMRACW.

0 1000 2000 3000 40000

20

40

Tempo(min)

r(t)

%

Figura 5.7: Nıvel de bloqueio neuromuscular vs. trajectoria de referencia. Teste dedesempenho para varios pontos de funcionamento, com adicao de ruıdo - controladorIMRACW.

Ordens Alg. de Adaptacao Controlo

na nb nl Tipo λ Σ0 P. Fix. tCA ρ σ2η b0(t)

3 2 5 EDV 0.95 5e-011 PID 250 1e-030 0 s

Tabela 5.4: Parametros de simulacao. Teste de desempenho para varios pontos defuncionamento, com adicao de ruıdo - controlador IMRACW.

Page 117: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

5.2 Algoritmo IMRACW aplicado ao controlo do NMB 117

0 500 1000 1500 2000 2500 3000 3500 40000

5

10

15

20

25

35

Tempo(min)

u(t

) µg

/kg/m

in ↓IMRACW

Figura 5.8: Dose u(t) em µg/kg/min. Teste de desempenho para varios pontos defuncionamento, com adicao de ruıdo - controlador IMRACW.

0 500 1000 1500 2000 2500 3000 3500 4000−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1x 10

−8

Tempo(min)

Evolu

ção d

as

Est

ima

tiva

s

Figura 5.9: Evolucao no tempo das estimativas dos parametros. Teste de desempenhopara varios pontos de funcionamento, com adicao de ruıdo - controlador IMRACW.

Page 118: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

118 Resultados de simulacao

5.3 Algoritmo IMRACLW aplicado ao controlo do

NMB

Quando se pretende implementar um controlador adaptativo para um modelo comestrutura de Wiener, uma ideia que desde logo ocorre e: “por que nao linearizar omodelo em torno de um ponto de funcionamento para depois se usar um controladorlinear?”

A ideia faz todo o sentido caso se pretenda manter o estado num unico ponto deoperacao, o que nem sempre e o caso. No entanto, no contexto do bloqueio neu-romuscular, a nao linearidade pode ser aproximada, num dado intervalo, por umsegmento de recta. O controlador descrito a seguir foi obtido seguindo esta linhade raciocınio: se a nao linearidade puder ser aproximada, num dado intervalo, porum segmento de recta, entao, caso se assuma que se conhece um ponto da recta, onumero de parametros a estimar e reduzido, uma vez que se tem que estimar apenasos parametros da parte linear do modelo de Wiener e o declive do segmento de rectausado na aproximacao. A seguir descreve-se o procedimento para se obter a lei decontrolo designada por IMRACLW - Implicit Model Reference Adaptive Controller forLinearized Wiener Models .

Um preditor para a parte linear do modelo de Wiener pode ser dado por:

x(t + d + 1) = S(q−1) x(t) + G(q−1) u(t), (5.23)

em que os graus dos polinomios sao, respectivamente, ∂S = na− 1 e ∂G = nb + d.

Considere-se a linearizacao da funcao f do modelo de Wiener em torno do ponto(x0, y0), que se assume conhecido. Note-se que esta hipotese nao e demasiado restritiva,pelo facto de haver quase sempre algum conhecimento a priori sobre o processo.Quando nao existe qualquer conhecimento antecipado, pode sempre recorrer-se atecnicas de identificacao classicas para obter um ponto do grafico de f . Numa vi-zinhanca de x0, Vδ(x0), pode-se escrever,

y(t) = m(x(t)− x0) + y0, x ∈ Vδ(x0) (5.24)

A equacao anterior pode ser escrita como,

x(t) =1

m(y(t)− y0) + x0, y ∈ Vδ(y0), (5.25)

em que m se assume nao nulo.

Combinando as equacoes (5.23) e (5.25), vem,

y(t + d + 1)− y0 = m (S(q−1)− 1) x0 + S(q−1) (y(t)− y0) + mG(q−1) u(t), (5.26)

O preditor (5.26) pode ser reescrito na forma regressor,

(y(t + d + 1)− y0) = θ>lin φlin(t), (5.27)

Page 119: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

5.3 Algoritmo IMRACLW aplicado ao controlo do NMB 119

onde

θ>lin = [ m (s0 + · · ·+ sna−1 − 1) s0 · · · sna−1 mg0 · · ·mgnb+d ] (5.28)

φ>lin(t) = [ x0 (y(t)− y0) · · · (y(t− na + 1)− y0) u(t) · · · u(t− nb− d) ] (5.29)

Quando os parametros de (5.28) sao substituıdos pelas suas estimativas, obtem-se alei de controlo IMRACLW,

u(t) =1

mg0(t)[ (ym(t + d + 1)− y0)− θ>linmod(t) φlinmod ], (5.30)

em que θlinmod e φlinmod se obtem a partir dos vectores θlin e φlin excluindo o elementoque resulta na parcela mg0(t) u(t) da equacao (5.30).

Para pesar o esforco de controlo segue-se a estrategia ja descrita na seccao 5.2.1 eusa-se a lei de controlo,

u(t) =mg0(t)

mg02(t) + ρ

[ (ym(t + d + 1)− y0)− θ>linmod(t) φlinmod ]. (5.31)

Para se poder usar o controlador IMRACLW no controlo do NMB, e necessario obtero modelo farmacodinamico linearizado em torno de um certo ponto de funcionamento.

O caracter nao linear do modelo farmacodinamico do paciente e introduzido, conformeja se referiu, pela equacao

r(t) =100

1 +[

ce(t)c50

]s , (5.32)

onde r(t) (%) descreve o grau de relaxamento.

Usando a relacao descrita pela equacao (5.32) e designando r(t) = f(ce(t)) obtem-se,utilizando o desenvolvimento em serie de Taylor, o seguinte modelo linearizado de 1a

¯

ordem:

f(ce) ≈ f(c0e) +

(df

dce

)

|ce=c0e

(ce − c0e) = f(c0

e) + FL(c0e)(ce − c0

e) (5.33)

Derivando (5.32) em ordem a ce(t):

(df

dce

)

|ce=c0e

= −100s

c50

(ce

c50

)s−1 [1 +

(ce

c50

)s]−2

(5.34)

e resolvendo (5.32) em ordem a (ce(t)/c50) obtem-se:

ce(t)

c50

=

(100− r(t)

r(t)

) 1s

(5.35)

Page 120: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

120 Resultados de simulacao

Substituindo (5.35) em (5.34) obtem-se:

FL =

(df

dce

)

|ce=c0e

= − s

c50

r2(t)

100

(100− r(t)

r(t)

) s−1s

|r(t)=ref0

(5.36)

ficando deste modo caracterizado em funcao de r(t), o modelo farmacodinamico line-arizado.

A lei de controlo IMRACLW aplicada ao controlo do bloqueio neuromuscular e dadapor,

u(t) =mg0(t)

mg02(t) + ρ

[ (rm(t + d + 1)− ref0)− θ>IMRACLW (t) φIMRACLW ], (5.37)

onde

θ>IMRACLW (t) = [ m(s0 + · · ·+ sna−1 − 1) s0 · · · sna−1 mg1 · · · mgnb+d ] (5.38)

φ>IMRACLW (t) = [ c0e (r(t)− ref0) · · · (r(t− na + 1)− ref0) u(t− 1) · · · u(t− nb− d) ]

(5.39)

em que m = FL(c0e) e rm(t + d + 1) e a referencia a seguir.

5.3.1 Resultados de simulacao

Nesta seccao sao apresentados os resultados das simulacoes efectuadas de forma a ava-liar o desempenho do algoritmo IMRACLW quando aplicado ao controlo do bloqueioneuromucular. Na tabela 5.5 recordam-se as principais caracterısticas do controladorIMRACLW.

Nas Figuras 5.10, 5.11 e 5.12 e ilustrado o desempenho do controlador IMRACLW. Odesempenho do controlador e muito satisfatorio mesmo em pontos de funcionamentodistintos de ref0 = 10%, ponto que se assumiu conhecido nesta simulacao.

Nas Figuras 5.13, 5.14 e 5.15 e ilustrado o desempenho do controlador IMRACLWaplicado ao controlo do bloqueio neuromuscular, quando ocorre variacao exponencialde parametros. O controlador funciona correctamente, mesmo quando se escolhe comomodelo final (consultar Tabelas 5.6 e 5.7) o modelo “16”, modelo “mais afastado” -do ponto de vista da dinamica linear - do modelo “1” do banco de modelos. NaFigura 5.15 mostra-se a adaptacao do algoritmo de identificacao, que ocorre quando sevaria a dinamica do modelo. O seguimento da referencia, sem polarizacao significativa,e conseguido dentro do intervalo de variacao dos parametros, neste caso, entre ti =1000 min. e tf = 1100 min..

Nas Figuras 5.16, 5.17 e 5.18 ilustra-se o desempenho do controlador IMRACLWquando a referencia a seguir e sinusoidal, dada por

ref(t) = 10 + 5 sin(2π/400 t) + 2 sin(2π/50 t) h(t− 2400),

Page 121: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

5.3 Algoritmo IMRACLW aplicado ao controlo do NMB 121

IMRACLW IMRAC for Linearized Wiener Models

modelo preditor: (5.27)

lei de controlo: (5.30)

variante A

modelo preditor: (5.27)

lei de controlo: (5.31)

variante B

lei de controlo: (5.37)

ResumoPara reduzir o numero de parametros a estimar, assume-se que se conhece um ponto de funcionamento da naolinearidade. Os parametros a estimar sao os parametrosda parte linear do modelo de Wiener combinados como declive da recta usada na aproximacao da nao line-aridade. Na variante A pesa-se o esforco de controlopara evitar variacoes bruscas na variavel de controlo.Na variante B apresenta-se uma versao da lei de controloIMRACLW aplicada ao controlo do bloqueio neuromus-cular.

ControladorIMRACLW

AlgoritmoadaptativoIMRACLW

)(ˆ tIMRACLWθ

)()(ˆ tt IMRACLWTIMRACLW φθ

)(tIMRACLWφ

k0x

)q(G 1m

)1dt(y m ++

)t(r

0y

L

Modelo de Wiener

NL)t(u )t(y

)(ˆ 1−∗ qG

)(ˆ 1−qS

Tabela 5.5: Caracterısticas principais do algoritmo de controlo IMRACLW.

Ordens Alg. de Adaptacao Controlo

na nb nl Tipo λ Σ0 P. Fix. tCA ρ σ2η mg0(t)

3 2 – EDV 0.95 1 PID 250 0 0 s

Tabela 5.6: Parametros de simulacao. Variacao exponencial de parametros -controlador IMRACLW.

Variacao de Parametros Modelo de Referencia Ruıdo

Tipo ti (min.) tf (min.) Paci Pacf α tsalto(min.) s/n

Var. Exp. 1000 1100 1 16 0.9 1600 s

Tabela 5.7: Variacao exponencial de parametros - controlador IMRACLW.

Page 122: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

122 Resultados de simulacao

0 1000 2000 3000 40000

20

40

Tempo(min)

r(t)

%

Figura 5.10: Nıvel de bloqueio neuromuscular vs. trajectoria de referencia -controlador IMRACLW.

0 500 1000 1500 2000 2500 3000 3500 40000

5

10

15

20

25

35

Tempo(min)

u(t

) µg

/kg/m

in ↓IMRACWLin

Figura 5.11: Dose u(t) em µg/kg/min - controlador IMRACLW.

Page 123: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

5.3 Algoritmo IMRACLW aplicado ao controlo do NMB 123

0 500 1000 1500 2000 2500 3000 3500 4000−2

−1.5

−1

−0.5

0

0.5

1

1.5

2

Tempo(min)

Evolu

ção d

as

Est

ima

tiva

s

Figura 5.12: Evolucao no tempo das estimativas dos parametros - controladorIMRACLW.

0 1000 2000 3000 40000

20

40

Tempo(min)

r(t)

%

↓↓Variação EXPONENCIAL de Parâmetros

Figura 5.13: Nıvel de bloqueio neuromuscular vs. trajectoria de referencia. Variacaoexponencial de parametros - controlador IMRACLW.

Page 124: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

124 Resultados de simulacao

0 500 1000 1500 2000 2500 3000 3500 40000

5

10

15

20

25

35

Tempo(min)

u(t

) µg

/kg/m

in ↓IMRACWLin

↓↓Variação EXPONENCIAL de Parâmetros

Figura 5.14: Dose u(t) em µg/kg/min. Variacao exponencial de parametros -controlador IMRACLW.

0 500 1000 1500 2000 2500 3000 3500 4000−2

−1.5

−1

−0.5

0

0.5

1

1.5

2

Tempo(min)

Evolu

ção d

as

Est

ima

tiva

s

Figura 5.15: Evolucao no tempo das estimativas dos parametros. Variacao exponencialde parametros - controlador IMRACLW.

Page 125: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

5.4 Algoritmo WFPAC aplicado ao controlo do NMB 125

em que h(·) e a funcao degrau unitario. O seguimento da referencia nao e muito bomquando se comuta do controlador de parametros fixos, para o controlador adaptativo,mas logo que o controlador “agarra” a referencia o desempenho e bom, o que seconfirma quando se adiciona uma sinusoide com 1/8 de perıodo da sinusoide de maioramplitude.

0 1000 2000 3000 40000

20

Tempo(min)

r(t)

%

Figura 5.16: Nıvel de bloqueio neuromuscular vs. trajectoria de referencia sinusoidal- controlador IMRACLW.

5.4 Algoritmo WFPAC aplicado ao controlo do

NMB

Nesta seccao sao apresentados os resultados das simulacoes efectuadas de forma aavaliar o desempenho do algoritmo WFPAC (Wiener Full Parameterization AdaptiveController). Na Tabela 5.8 recordam-se as principais caracterısticas do controladorWFPAC.

Nas Figuras 5.19, 5.20 e 5.21 e ilustrado o desempenho do controlador WFPAC. Osparametros de simulacao sao apresentados nas Tabelas 5.9 e 5.10. Comeca-se por usarum controlador de parametros fixos, neste caso usou-se um controlador proporcional,afinado para o modelo de Wiener linearizado em torno do ponto de funcionamento,r(t) = 10%. Logo que se “activa” o controlador WFPAC - assinalado com uma seta -melhora o seguimento da referencia. Entre ti = 1500min e tf = 1550min provocou-seuma variacao abrupta (exponencial) da dinamica do modelo. O controlador corrige odesvio na trajectoria, ainda que apresente uma polarizacao, que e mais significativanos extremos do intervalo de operacao. Este comportamento justifica-se pelo facto dechegar mais informacao ao filtro de Kalman para valores do relaxamento proximos de

Page 126: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

126 Resultados de simulacao

0 500 1000 1500 2000 2500 3000 3500 40000

5

10

15

20

25

35

Tempo(min)

u(t

) µg

/kg/m

in ↓IMRACWLin

Figura 5.17: Dose u(t) em µg/kg/min. Desempenho do controlador IMRACLW paratrajectoria de referencia sinusoidal.

0 500 1000 1500 2000 2500 3000 3500 4000−2

−1.5

−1

−0.5

0

0.5

1

1.5

2

Tempo(min)

Evolu

ção d

as

Est

ima

tiva

s

Figura 5.18: Evolucao no tempo das estimativas dos parametros. Desempenho docontrolador IMRACLW para trajectoria de referencia sinusoidal.

Page 127: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

5.4 Algoritmo WFPAC aplicado ao controlo do NMB 127

WFPAC Wiener Full Parameterization Adaptive Controller

modelo multipreditor: (3.62)

lei de controlo: (3.64)

ResumoE um metodo de controlo adaptativo que se baseianum modelo multipreditor. A accao de controloe ponderada de acordo com as predicoes ate Tpassos a frente. O banco de preditores adaptativose construıdo parametrizando a inversa da naolinearidade com funcoes de base.

ControladorWFPAC )()(ˆ)( tstFtu T=

RLS)(~ Ttx ++++ )(~ Ttz ++++

)(ˆ tTππππ

1 1++++−−−−++++

t TtuRLS)1(~ ++++tx )1(~ ++++tz RLS)2(~ ++++tx )2(~ ++++tz)(1 tππππ )t(ˆ 2ππππ

)1( ++++tu1−q1−q

TT tstut )]()([)( ====φφφφ

)(ˆ1 tw )1(ˆ1 −−−−tw )(ˆ2 tw )1(ˆ2 −−−−tw )(ˆ twTRLS)(~ Ttx ++++ )(~ Ttz ++++

)(ˆ tTππππ

1 1++++−−−−++++

t TtuRLS)1(~ ++++tx )1(~ ++++tz RLS)2(~ ++++tx )2(~ ++++tz)(1 tππππ )t(ˆ 2ππππ

)1( ++++tu1−q1−q

TT tstut )]()([)( ====φφφφ

)(ˆ1 tw )1(ˆ1 −−−−tw )(ˆ2 tw )1(ˆ2 −−−−tw )(ˆ twT

L

Modelo de Wiener

NL )t(y

nbjq j ,,1, K=−

)t(r)1d(q +−

1,,0

)),((0

−=−naj

jtyT nl L1,,0

)),((0

−=−naj

jtyT mnl L )q(G 1

m−

)1dt(y m ++

Tabela 5.8: Caracterısticas principais do algoritmo de controlo WFPAC.

Ordens Alg. de Adaptacao Controlo

na nb nl Tipo λ Σ0 P. Fix. tCA ρ T σ2η

3 2 4 EDV 0.985 5e-011 P 250 1e-025 5 0

Tabela 5.9: Ordem adoptada para o modelo de Wiener, configuracao do algoritmo deadaptacao - controlador WFPAC.

Page 128: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

128 Resultados de simulacao

0 1000 2000 3000 40000

10

20

30

Tempo(min)

r(t)

% ↓WFPAC activo ↓↓

Variação EXPONENCIAL de Parâmetros

Figura 5.19: Nıvel de bloqueio neuromuscular vs. trajectoria de referencia -controlador WFPAC.

0 500 1000 1500 2000 2500 3000 3500 40000

5

10

15

20

25

30

Tempo(min)

u(t

) µg

/kg/m

in

↓WFPAC activo

↓↓Variação EXPONENCIAL de Parâmetros

Figura 5.20: Dose u(t) em µg/kg/min - controlador WFPAC.

Variacao de Parametros Modelo de Referencia Ruıdo

Tipo ti (min.) tf (min.) Paci Pacf α tsalto(min.) s/n

Var. Exp. 1500 1550 1 16 0.9 1600 s

Tabela 5.10: Variacao de parametros (s/n) e dinamica do modelo de referencia -controlador WFPAC.

Page 129: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

5.4 Algoritmo WFPAC aplicado ao controlo do NMB 129

0 500 1000 1500 2000 2500 3000 3500 4000−2000

−1500

−1000

−500

0

500

1000

Tempo(min)

Evolu

ção d

os

gan

hos

do c

on

trola

dor

WF

PA

C

Figura 5.21: Evolucao no tempo das estimativas dos parametros - controladorWFPAC.

10%. O ajuste dos parametros da inversa da nao linearidade vai traduzir este facto; aacuidade na aproximacao e melhor para valores de r(t) proximos de 10%.

Existem formas de corrigir a polarizacao, mas tem que se aumentar o esforco decontrolo. Tem que ocorrer uma ponderacao sobre o esforco de controlo desejado e apolarizacao que se considera aceitavel.

Ordens Alg. de Adaptacao Controlo

na nb nl Tipo λ Σ0 P. Fix. tCA ρ T σ2η

3 2 4 EDV 0.985 5e-011 P 250 1e-025 5 0.01

Tabela 5.11: Parametros de simulacao. Reducao do erro de seguimento - controladorWFPAC.

Nas Figuras 5.22, 5.23 e 5.24 e na Tabela 5.11, onde constam os parametros desimulacao, avalia-se o desempenho do controlador WFPAC quando se tenta reduziro erro de seguimento. Consegue-se mas com um aumento significativo do esforco decontrolo como se pode verificar pelas Figuras 5.22 e 5.23. Esta reducao do erro de se-guimento deveu-se ao aumento do chamado dither, neste caso, a variancia consideradafoi de σ2

η = 0.01. Ao aumentar a excitacao persistente melhora-se o desempenho doalgoritmo de adaptacao e por arrastamento do controlador.

Nas Figuras 5.25, 5.26 e 5.27 ilustra-se o desempenho do controlador WFPAC quandoa referencia a seguir e sinusoidal, dada por

ref(t) = 10 + 5 sin(2π/400 t) + 2 sin(2π/50 t) h(t− 2400),

em que h(·) e a funcao degrau unitario.

Page 130: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

130 Resultados de simulacao

0 1000 2000 3000 40000

10

20

30

Tempo(min)

r(t)

% ↓WFPAC activo ↓↓

Variação EXPONENCIAL de Parâmetros

Figura 5.22: Nıvel de bloqueio neuromuscular vs. trajectoria de referencia. Reducaodo erro de seguimento - controlador WFPAC.

0 500 1000 1500 2000 2500 3000 3500 40000

5

10

15

20

25

30

Tempo(min)

u(t

) µg

/kg/m

in

↓WFPAC activo

↓↓Variação EXPONENCIAL de Parâmetros

Figura 5.23: Dose u(t) em µg/kg/min. A reducao do erro de seguimento e conseguidaaumentando o esforco de controlo - controlador WFPAC.

Page 131: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

5.4 Algoritmo WFPAC aplicado ao controlo do NMB 131

0 500 1000 1500 2000 2500 3000 3500 4000−200

−100

0

100

200

300

400

500

600

Tempo(min)

Evolu

ção d

os

gan

hos

do c

on

trola

dor

WF

PA

C

Figura 5.24: Evolucao no tempo das estimativas dos parametros. Reducao do erro deseguimento - controlador WFPAC.

0 1000 2000 3000 40000

10

20

30

Tempo(min)

r(t)

% ↓WFPAC activo ↓↓

Variação EXPONENCIAL de Parâmetros

Figura 5.25: Nıvel de bloqueio neuromuscular vs. trajectoria de referencia sinusoidal- controlador WFPAC.

Page 132: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

132 Resultados de simulacao

0 500 1000 1500 2000 2500 3000 3500 40000

5

10

15

20

25

30

Tempo(min)

u(t

) µg

/kg/m

in

↓WFPAC activo

↓↓Variação EXPONENCIAL de Parâmetros

Figura 5.26: Dose u(t) em µg/kg/min. Trajectoria de referencia sinusoidal -controlador WFPAC.

0 500 1000 1500 2000 2500 3000 3500 4000−2000

−1500

−1000

−500

0

500

1000

Tempo(min)

Evolu

ção d

os

gan

hos

do c

on

trola

dor

WF

PA

C

Figura 5.27: Evolucao no tempo das estimativas dos parametros. Trajectoria dereferencia sinusoidal - controlador WFPAC.

Page 133: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

5.5 Algoritmo IMRHAC 133

O desempenho do controlador e muito satisfatorio. Note-se que ocorre uma variacaoabrupta na dinamica do modelo e mais tarde uma variacao na trajectoria da referenciaa seguir. Em ambos os casos o controlador correspondeu as expectativas.

Na proxima seccao ilustra-se a aplicacao do controlador IMRHAC desenvolvido porLemos e Mosca (1985) na regulacao de uma instalacao simples. Este exemplo eapresentado para se mostrar que o controlador IMRHAC que serviu como pontode partida para o desenvolvimento do controlador WIMRHAC (descrito na proximaseccao) apresenta um bom desempenho.

5.5 Algoritmo IMRHAC

Considere-se o modelo DARMA, estavel e de fase mınima,

y(t)− 1.5y(t− 1) + 0.7y(t− 2) = u(t− 1) + 0.5u(t− 2) (5.40)

Para uma estrutura do controlador definida por

na = 2, nb = 1 e ρ = 1,

os valores optimos dos ganhos de retroaccao sao

f ? = [−0.762 0.440 − 0.314 ].

A Figura 5.28 mostra a evolucao dos ganhos do controlador para um horizonte de

0 200 400 600 800 1000−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

f1(t)

f?

1

f2(t)

f?

2

f3(t)

f?

3

Tempo (min)

Gan

hos

do C

on

trola

dor

IMR

HA

C

Figura 5.28: Evolucao dos ganhos de retroaccao para o controlador IMRHAC.

predicao, T = 5 e variancia do dither que assegura a excitacao persistente de σ2η = 10−4.

Page 134: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

134 Resultados de simulacao

5.6 Algoritmo WIMRHAC

A ideia subjacente ao controlador WIMRHAC (Wiener Interlaced Multipredictor Rece-ding Horizon Adaptive Controller) e a seguinte: em cada instante de tempo (discreto)t, a partir da saıda y(t) infere-se o sinal intermedio xa(t), que decorre da aplicacaoinversa e dos parametros estimados previamente/em tempo real usando um algoritmode identificacao caixa-cinza. O sinal xa(t) em conjunto com o sinal de entrada u(t),e usado para estimar os parametros do modelo multipreditivo. A partir do modelomultipreditivo e do sinal de referencia e possıvel obter explicitamente a lei de controloque e aplicada ao processo. Na tabela 5.12 recordam-se as principais caracterısticasdo controlador WIMRHAC.

WIMRHACWiener Interlaced Multipredictor Receding Horizon

Adaptive Controller

modelo multipreditor: (3.53)

lei de controlo: (3.57)

ResumoO algoritmo WIMRHAC e um controlador predi-tivo adaptativo linear para sistemas de Wiener. Osinal intermedio do sistema de Wiener e recupe-rado, assumindo que se conhece a inversa da naolinearidade ou que os parametros da funcao inversaforam previamente estimados.

Controlador WIMRHAC

ControladorWIMRHAC

Algoritmode

Identificação

AplicaçãoInversa

AplicaçãoInversa

D.F.R.L.S

)t(u NLL

Modelo de Wiener

)t(y

)t(xa

)(ty m

Tabela 5.12: Caracterısticas principais do algoritmo de controlo WIMRHAC.

Nas Figuras 5.29, 5.30 e 5.31 ilustra-se o desempenho do controlador WIMRHACquando a trajectoria de referencia a seguir e dada por uma onda quadrada. NaTabela 5.13 aparecem especificados os parametros de simulacao. O horizonte depredicao, T = 25, para um tempo de amostragem de 20 segundos, significa que naponderacao da accao de controlo a aplicar num dado instante de tempo, sao usadosdados entrada-saıda relativos aos (cerca de) oito minutos anteriores. Neste exemplo o

Page 135: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

5.6 Algoritmo WIMRHAC 135

0 1000 2000 3000 40000

10

20

30

Tempo (min)

r(t)

% ↓WIMRHAC activo

Figura 5.29: Nıvel de bloqueio neuromuscular vs. trajectoria de referencia -controlador WIMRHAC.

0 500 1000 1500 2000 2500 3000 3500 40000

5

10

15

20

25

30

Tempo(min)

u(t

) µg

/kg/m

in

↓WIMRHAC activo

Figura 5.30: Dose u(t) em µg/kg/min - controlador WIMRHAC.

Ordens Alg. de Adaptacao Controlo

na nb nr Tipo λ Σ0 P. Fix. tCA ρ T σ2η

3 2 1 EDV 0.985 100 P 50 0.0001 25 0.0001

Tabela 5.13: Ordem adoptada para o modelo de Wiener, configuracao do algoritmode adaptacao - controlador WIMRHAC.

Page 136: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

136 Resultados de simulacao

0 500 1000 1500 2000 2500 3000 3500 4000−400

−300

−200

−100

0

100

200

300

400

Tempo(min)

Evolu

ção d

os

gan

hos

do c

on

trola

dor

WIM

RH

AC

Figura 5.31: Evolucao no tempo das estimativas dos parametros - controladorWIMRHAC.

sinal intermedio e recuperado a partir da inversa da equacao de Hill, dada por

ce(t) = c50

(100− r(t)

r(t)

) 1s

(r(t) 6= 0), (5.41)

em que se admite que se conhecem os parametros (c50, s) da inversa da nao linearidade.O desempenho do controlador e muito satisfatorio, o que era expectavel, atendendo aque na pratica se tem um controlador preditivo adaptativo linear.

Ordens Alg. de Adaptacao Controlo

na nb nr Tipo λ Σ0 P. Fix. tCA ρ T σ2η

3 2 1 EDV 0.985 100 P 50 0.0001 25 0.0001

Tabela 5.14: Parametros de simulacao. Variacao exponencial de parametros -controlador WIMRHAC.

Variacao de Parametros Modelo de Referencia Ruıdo

Tipo ti (min.) tf (min.) Paci Pacf α tsalto(min.) s/n

Var. Exp. 1500 1550 1 16 0.9 1600 s

Tabela 5.15: Variacao exponencial de parametros - controlador WIMRHAC.

Nas Figuras 5.32, 5.33 e 5.34 e correspondentes Tabelas 5.14 e 5.15, e ilustrado o desem-penho do controlador quando se provoca uma variacao exponencial dos parametros. Oalgoritmo de controlo adapta-se rapidamente a esta alteracao na dinamica do modeloe o erro de seguimento tende assimptoticamente para zero.

Page 137: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

5.6 Algoritmo WIMRHAC 137

0 1000 2000 3000 40000

10

20

30

Tempo (min)

r(t)

% ↓WIMRHAC activo

↓↓Variação EXPONENCIAL de Parâmetros

Figura 5.32: Nıvel de bloqueio neuromuscular vs. trajectoria de referencia. De-sempenho do controlador WIMRHAC quando ocorre uma variacao exponencial deparametros.

0 500 1000 1500 2000 2500 3000 3500 40000

5

10

15

20

25

30

Tempo(min)

u(t

) µg

/kg/m

in

↓WIMRHAC activo

↓↓

Variação EXPONENCIAL de Parâmetros

Figura 5.33: Dose u(t) em µg/kg/min - controlador WIMRHAC.

Page 138: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

138 Resultados de simulacao

0 500 1000 1500 2000 2500 3000 3500 4000−500

−400

−300

−200

−100

0

100

200

300

400

Tempo(min)

Evolu

ção d

os

gan

hos

do c

on

trola

dor

WIM

RH

AC

Figura 5.34: Evolucao no tempo das estimativas dos parametros - controladorWIMRHAC.

Nos exemplos anteriores assumiu-se que se podia recuperar o sinal intermedio, x(t), apartir da inversa da nao linearidade (5.41), com (c50, s) conhecidos.

Na proxima seccao descreve-se uma abordagem que consiste em usar o algoritmode optimizacao descrito na seccao 2.2.1.1 para obter uma estimativa da parte lineardo modelo de Wiener. Os pontos (y(t), x(t)) sao depois usados para se obter umaaproximacao da inversa da nao linearidade. Obtiveram-se bons resultados com B-splines, tambem conhecidas por funcoes tenda (Lancaster e Salkauskas 1986).

5.6.1 Aproximacao da inversa da nao linearidade por B-splines

Como o desempenho do algoritmo WIMRHAC (Tabela 5.12) esta dependente darecuperacao do sinal intermedio x(t), se, por hipotese, a inversa da equacao de Hill(5.41) nao permitir inferir com acuidade o sinal intermedio, o algoritmo WIMRHACpode apresentar um mau desempenho porque a trajectoria de referencia tambem esta aser inferida a partir da inversa da equacao de Hill. Antecipando este cenario, efectuou-se uma abordagem em que se usam as boas estimativas dos parametros da parte linearobtidas com o algoritmo de optimizacao descrito na seccao 2.2.1.1 para recuperar osinal intermedio x(t) e com os pontos (y(t), x(t)) estimaram-se em tempo real oscoeficientes de funcoes de base, no caso B-splines.

Nas Figuras 5.35, 5.36 e 5.37, apresentam-se os resultados do controlador WIMRHAC,quando se usam B-splines na aproximacao da inversa da nao linearidade e quando seassume que os coeficientes das B-splines sao conhecidos. Note-se que os chamados nosdas B-splines, assim designados por serem pontos de ligacao dos varios segmentos, sao

Page 139: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

5.6 Algoritmo WIMRHAC 139

0 1000 2000 3000 40000

10

20

30

Tempo (min)

r(t)

% ↓WIMRHAC activo

Figura 5.35: Nıvel de bloqueio neuromuscular vs. trajectoria de referencia. Desem-penho do controlador WIMRHAC quando se assume que os coeficientes das B-splinessao conhecidos.

0 500 1000 1500 2000 2500 3000 3500 40000

5

10

15

20

25

30

Tempo(min)

u(t

) µg

/kg/m

in

↓WIMRHAC activo

Figura 5.36: Dose u(t) em µg/kg/min - controlador WIMRHAC.

Page 140: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

140 Resultados de simulacao

0 500 1000 1500 2000 2500 3000 3500 4000−200

−150

−100

−50

0

50

100

150

200

250

Tempo(min)

Evolu

ção d

os

gan

hos

do c

on

trola

dor

WIM

RH

AC

Figura 5.37: Evolucao no tempo das estimativas dos parametros. Nesta simulacao oscoeficientes das B-splines nao sao estimados.

0 1000 2000 3000 40000

1

2

3

4

5

6

7

8

Tempo (min)

Coefi

cien

tes

das

splines

? j

γ?0

γ?1

γ?2

γ?3

γ?4

Figura 5.38: Coeficientes das splines γ?j (nao foram estimados) usados para inferir o

sinal intermedio x(t).

Page 141: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

5.7 Analise qualitativa dos algoritmos de controlo propostos 141

definidos a priori.

Nesta simulacao considerou-se o vector de nos:

rnos = [ 0.01 5 10 15 20 ]>,

a que correspondem os coeficientes,

Γ? = [ 6.6 1.4 1.1 1.0 0.9 ]>.

0 1000 2000 3000 40000

10

20

30

Tempo (min)

r(t)

% ↓WIMRHAC activo

Figura 5.39: Nıvel de bloqueio neuromuscular vs. trajectoria de referencia. Desem-penho do controlador WIMRHAC quando os coeficientes das B-splines sao estimadosem tempo real.

Nas Figuras 5.39, 5.40 e 5.41 apresentam-se os resultados do controlador WIMRHAC,quando se usam B-splines na aproximacao da inversa da nao linearidade e quandose assume que os coeficientes das B-splines sao desconhecidos. O desempenho doalgoritmo e muito satisfatorio. Note-se que mesmo quando se consideram algumasestimativas iniciais dos coeficientes γj nulas, ocorre a convergencia dos parametrose e mantida a monotonia da funcao, neste caso, estritamente decrescente, porqueγj(t) < γj+1(t), j = 0, 1, 2, 3, com t ≥ N0 em que N0 e o numero mınimo de amostraspara se obter a convergencia dos parametros.

5.7 Analise qualitativa dos algoritmos de controlo

propostos

O desempenho dos algoritmos de controlo propostos neste trabalho mostrou ser sa-tisfatorio em ambiente de simulacao. Nesta seccao faz-se uma analise qualitativa dosalgoritmos desenvolvidos.

Page 142: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

142 Resultados de simulacao

0 500 1000 1500 2000 2500 3000 3500 40000

5

10

15

20

25

30

Tempo(min)

u(t

) µg

/kg/m

in

↓WIMRHAC activo

Figura 5.40: Dose u(t) em µg/kg/min - controlador WIMRHAC.

0 500 1000 1500 2000 2500 3000 3500 4000−250

−200

−150

−100

−50

0

50

100

150

200

250

Tempo(min)

Evolu

ção d

os

gan

hos

do c

on

trola

dor

WIM

RH

AC

Figura 5.41: Evolucao no tempo das estimativas dos parametros - controladorWIMRHAC.

Page 143: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

5.7 Analise qualitativa dos algoritmos de controlo propostos 143

IMRACWImplicit Model Reference Adaptive

Controller for Wiener Models

modelo preditor: (3.34)

lei de controlo: (3.37)

extensao

modelo preditor: (3.48)

lei de controlo: (3.50)

# de parametros a estimar:

p + p× na + nb + d

ou

T × p + p× na + nb + d

IMRACLW IMRAC for Linearized Wiener Models

modelo preditor: (5.27)

lei de controlo: (5.30)

# de parametros a estimar:

1 + na + nb + d + 1

WFPAC Wiener Full Parameterization Adaptive Controller

modelo multipreditor: (3.62)

lei de controlo: (3.64)

# de parametros a estimar:

p + T × (1 + na + nb + nr)

.

WIMRHACWiener Interlaced Multipredictor Receding Horizon

Adaptive Controller

modelo multipreditor: (3.53)

lei de controlo: (3.57)

# de parametros a estimar:

T × (1 + na + nb + nr)

.

Tabela 5.16: Algumas caracterısticas dos algoritmos de controlo propostos. Legenda:na, numero de amostras da saıda do modelo usadas no regressor; nb + d, numero deamostras da entrada do modelo usadas no regressor, sendo d + 1 o atraso no sistema;nr, numero de amostras da saıda do modelo de referencia usadas no regressor; p,numero de funcoes de base usadas na parametrizacao e T , horizonte de predicao.

Page 144: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

144 Resultados de simulacao

0 20 50 100 2000

1

2

3

4

5

6

7

8

Tempo (min)

Est

imati

vas

dos

coefi

cien

tes

das

splines

j(t

)

γ0(t)γ1(t)γ2(t)γ3(t)γ4(t)

Figura 5.42: Evolucao das estimativas dos coeficientes das splines, γj(t).

Os algoritmos de controlo apresentados tem como principal caracterıstica a adapta-bilidade. Na presenca de variacao de parametros todos os controladores permitiramrapidamente reduzir o erro de seguimento da trajectoria de referencia. Atendendoa que a intra-variabilidade e uma caracterıstica inerente aos sistemas fisiologicos, asleis de controlo propostas mostraram ser adequadas para reduzir, neste contexto, aincerteza.

Os algoritmos adaptativos exigem, no entanto, que os sinais usados na identificacaosejam suficientemente persistentes para que se possa assegurar a convergencia dasestimativas dos parametros. Para a aplicacao que constitui o caso em estudo nestetrabalho, o controlo automatico do bloqueio neuromuscular, nao se pode garantir que osinal de entrada (taxa de infusao de farmaco) seja sempre suficientemente persistente.O que se pode fazer para assegurar uma convergencia mais rapida dos parametros ecomecar por usar um controlador de parametros fixos e um vector de ganhos auxiliar,previamente obtido, para que o algoritmo adaptativo possa “agarrar” a referencia. Dosalgoritmos recursivos de mınimos quadrados (RLS) usados na estimacao de parametroso que permitiu obter um melhor desempenho foi a versao com esquecimento direccionalvariavel. A “memoria” do filtro de Kalman depende da informacao que chega e a taxade “esquecimento” tambem e variavel.

O desempenho dos algoritmos adaptativos depende da consistencia das estimativasdos parametros. Por outro lado, a acuidade na estimacao depende da informacaodisponıvel. Na Tabela 5.16 apresenta-se o numero total de parametros a estimar paracada um dos algoritmos de controlo. Como o numero de parametros a estimar dependedo numero de modelos preditores usados na lei de controlo, na Figura 5.43 ilustra-sea relacao: numeros de parametros a estimar vs. numero de preditores, para cada umdos algoritmos apresentados.

Quando se fixam alguns parametros, nomeadamente, ( na, nb, nr, d+1, p ) = ( 3, 2, 2, 1, 5 )

Page 145: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

5.7 Analise qualitativa dos algoritmos de controlo propostos 145

0 5 10 15 20 25 300

50

100

150

200

250

# preditores

# p

arâ

metr

os

# parâmetros vs. # preditores

IMRACW

IMRACW(T)

IMRACLW

WFPAC

WIMRHAC

Figura 5.43: Analise comparativa do numero de parametros a estimar versus numerode modelos preditores usados para cada um dos algoritmos de controlo propostos. Paratornar a analise possıvel, fixaram-se os seguintes parametros: ( na, nb, nr, d + 1, p ) =( 3, 2, 2, 1, 5 ) (ver Tabela 5.16).

Page 146: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

146 Resultados de simulacao

descritos Tabela 5.16 e se considera um horizonte de predicao T de 30 amostras (parao NMB corresponde a cerca de 10 minutos), constata-se o seguinte: quando se usa oalgoritmo WFPAC tem que se estimar cerca de 250 parametros. Se, por outro lado,se optar pelo algoritmo IMRACLW, tem que se estimar somente 7 parametros. Estaconstatacao poe em evidencia o equilıbrio que e necessario garantir entre o desempenhopretendido e o esforco (de identificacao) exigido. Se o perfil da referencia a seguir forconstante num dado ponto de funcionamento (ce0, ref0), deve-se optar pelo algoritmoIMRACLW. Caso se pretenda minimizar o erro de seguimento e simultaneamentereduzir as variacoes na variavel manipulada, o algoritmo WFPAC pode ser uma boaopcao. Neste caso, deve-se optar por um horizonte de predicao de modo a que onumero total de parametros a estimar nao exceda os 30 parametros. Quanto menorfor o numero de parametros a estimar, menor sera o numero de amostras necessariaspara assegurar a convergencia das estimativas.

Page 147: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

Capıtulo 6

Conclusoes finais e trabalho futuro

6.1 Conclusoes finais

Neste trabalho foram apresentados diversos metodos para a identificacao e controloadaptativo de sistemas nao lineares de Wiener. Foi dada uma atencao especial aoproblema do controlo do bloqueio neuromuscular.

Foram propostos os seguintes metodos de identificacao:

• metodos de optimizacao: quando se assume que se conhece a estrutura do modelode Wiener mostra-se como e que se pode calcular o gradiente, isto e, a sensibili-dade da saıda do sistema a variacao de cada um dos parametros e implementa-seum algoritmo de identificacao iterativo em que a direccao de pesquisa dependedo gradiente; o desempenho do algoritmo nao e muito satisfatorio no caso emestudo porque a sensibilidade da funcao de custo a variacao nos parametros daparte nao linear do modelo de Wiener e muito reduzida como se pode observarpela Figura 2.6; os parametros da parte linear sao estimados correctamente.

• metodos baseados em parametrizacoes lineares: e efectuada uma parametrizacao(linear nos parametros a estimar) dos dois blocos do modelo de Wiener; estaabordagem foi seguida tendo em vista a aplicacao na identificacao de mode-los PK/PD de farmacos com estrutura de Wiener. Nestas aplicacoes nao epossıvel medir no bloco operatorio a variavel intermedia por se tratar de umaconcentracao plasmatica. Sao necessarios metodos de identificacao em que ainformacao que e usada na identificacao depende apenas da taxa de infusao defarmaco (variavel manipulada) e do efeito observado (saıda). O desempenhodestes algoritmos e muito satisfatorio.

Foram tambem propostos metodos para o controlo adaptativo de sistemas de Wie-ner baseados em modelos de referencia (MRAC). Estes metodos foram validados emambiente de simulacao no controlo do bloqueio neuromuscular. Quando comparados

Page 148: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

148 Conclusoes finais e trabalho futuro

com outras tecnicas implementadas tendo em vista a mesma aplicacao, nomeada-mente, controladores de parametros fixos (Mendonca 1992) ou o controlo comutadocom multiplos modelos (Mendonca et al. 2002), os controladores MRAC apresentamalgumas vantagens, nomeadamente:

• permitem o ajuste de parametros em tempo real e nao requerem a construcaoprevia de um banco de modelos;

• apresentam bom desempenho na presenca de variacao de parametros;

• permitem incorporar facilmente restricoes.

Efectuou-se uma generalizacao dos algoritmos MRAC acima referidos de forma a aper-feicoar a capacidade de predicao do comportamento dinamico do sistema de Wiener.No funcional de custo ponderam-se os erros futuros e o esforco de controlo. Em lugarde se usar um modelo preditivo usa-se um modelo multipreditivo e o horizonte depredicao passa a ser mais um parametro que se pode afinar. O controlo segue oprincıpio do controlo recidivo. O desempenho do controlador WFPAC no controlo dobloqueio neuromuscular e muito satisfatorio.

Assumindo algumas hipoteses simplificativas de forma a tornar a analise possıvel,estabeleceu-se a estabilidade global de dois sistemas adaptativos propostos.

6.2 Trabalho futuro

Os algoritmos agora propostos devem ser validados em ambiente clınico.

As tecnicas apresentadas neste trabalho, em particular os sistemas adaptativos, de-vem ser usadas noutras aplicacoes, nomeadamente no controlo de sistemas biologicossujeitos a variacoes de parametros e a variabilidade intra- e interindividual.

Sendo a variabilidade um dos obstaculos mais difıceis de ultrapassar no controloautomatico de infusao de farmacos, devem ser prosseguidos esforcos na definicao daincerteza no sistema, que pode ser usada no dimensionamento do controlador de formaa assegurar a estabilidade do sistema em malha fechada.

Um dos problemas inerentes ao controlo de infusao de farmacos em ambiente clınicosao os erros de leitura nos sensores que podem afectar o desempenho dos controladores.Quando se opta por estrategias como as apresentadas neste trabalho em que se tem queestimar muitos parametros, uma falha nos sensores pode comprometer o desempenhodos mecanismos de adaptacao de parametros. O trabalho desenvolvido por Magalhaes(2006) constitui um bom ponto de partida para abordar este assunto.

Page 149: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

Apendice A

Modelo matematico para oatracurio

Para o estabelecimento de algoritmos de controlo adequados e imprescindıvel conhecer,pelo menos de forma aproximada, as caracterısticas farmacodinamicas do relaxamentomuscular. O farmaco adoptado neste trabalho foi a atracurio, acerca do qual seconhecem da literatura modelos famacocineticos individuais (Ward, Neill, Weatherleye Corall 1983) e o valor medio dos parametros farmacodinamicos (Weatherley et al.1983). A partir desta informacao e possıvel descrever a variabilidade interindividualque, associada as especificacoes clınicas, condicionam as estrategias de controlo aadoptar.

Neste capıtulo comeca-se por descrever o modelo matematico para o atracurio, depoise analisada a variabilidade interindividual para os modelos disponıveis na literatura,estendendo-se esta analise aos casos reais.

A.1 Modelo compartimental do atracurio

No estudo do modelo de um farmaco, e usual dividir em duas partes a descricaomatematica da resposta: farmacocinetica e farmacodinamica. O modelo farmacocine-tico descreve a evolucao temporal da concentracao plasmatica do farmaco, tratando-senormalmente de um modelo linear. O modelo farmacodinamico descreve a relacaoentre a concentracao plasmatica do farmaco e o efeito fisiologico induzido.

A.1.1 Modelo farmacocinetico

O objectivo da farmacocinetica e definido por (Gibaldi e Perrier 1975) como “oestudo do percurso do farmaco ao longo do tempo e dos nıveis de metabolismo nos

Page 150: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

150 Modelo matematico para o atracurio

...................

....................

...................

..................

.....................................

...................................................................................................................

..................

...................

....................

..........

.........

..........

.........

....................

...................

..................

..................

................... .................... ................... ................... .......................................

..................

..................

...................

....................

...................

...................

....................

...................

..................

.....................................

...................................................................................................................

..................

...................

....................

..........

.........

..........

.........

....................

...................

..................

..................

................... .................... ................... ................... .......................................

..................

..................

...................

....................

...................

? ?

-u(t) k12

k21

k10 k20

Compartimento

central

1

Compartimento

periferico

2

Figura A.1: Modelo farmacocinetico para o atracurio com dois compartimentos.

diferentes fluidos, tecidos e excrecoes do corpo e as relacoes matematicas necessariaspara desenvolver modelos para interpretar esses dados”.

Apos ter sido administrado o farmaco, a concentracao plasmatica do atracurio decairapidamente (com comportamento exponencial) em duas fases, correspondendo adistribuicao e eliminacao. Na pratica, utiliza-se um modelo com dois compartimentoscom a adicao de uma constante de eliminacao k20 no compartimento periferico. AFigura A.1 e um diagrama esquematico onde se mostram as diferentes componentes domodelo farmacodinamico: Geralmente, nao e possıvel medir a quantidade de farmaconum dado compartimento, mas apenas a concentracao. No entanto pode-se expressaro modelo matematico que representa a dinamica farmacocinetica para o atracurio,fazendo uso de um modelo com dois compartimentos, em que

x1(t) = −(k12 + k10)x1(t) + k21x2(t) + u(t)

x2(t) = k12x1(t)− (k21 + k20)x2(t)(A.1)

com xi(t) = ci(t)Vi

onde:

xi e a quantidade de farmaco no compartimento i,Vi e o volume aparente da distribuicao no compartimento i,ci e a concentracao de farmaco no compartimento i,kijxi e a quantidade de farmaco transferida por unidade de tempo docompartimento i para o compartimento j,kj0xj e a quantidade de farmaco eliminada por unidade de tempo docompartimento j eu(t) e a quantidade de farmaco administrada por unidade de tempo e porunidade de massa do paciente.

Dividindo ambos os membros da equacao (A.1) por V1 e V2 respectivamente, vem:

x1(t)V1

= −(k12 + k10)x1(t)V1

+ k21x2(t)V1

+ u(t)V1

x2(t)V2

= k12x1(t)V2

− (k21 + k20)x2(t)V2

Atendendo a que o farmaco se move igualmente em todas as direccoes vem: k12V1 =

Page 151: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

A.1 Modelo compartimental do atracurio 151

k21V2, substituindo em (A.2), resulta:

c1(t) = −(k12 + k10)c1(t) + k12c2(t) + u(t)V1

c2(t) = k21c1(t)− (k21 + k20)c2(t)

correspondendo a concentracao plasmatica cp(t) a concentracao de farmaco no com-partimento central aqui designada por c1(t).

Um outro metodo que tambem e utilizado para estimar os parametros farmacocineticosbaseia-se na observacao da resposta impulsiva do sistema. Para o atracurio, o modelofarmacocinetico e razoavelmente bem descrito por um sistema linear de 2a

¯ ordem, comuma resposta impulsional do tipo,

cp(t) = Ae−αt + Be−βt (A.2)

onde A, B, α e β sao constantes. A concentracao plasmatica decai em duas fases(Ward et al. 1983) correspondentes a distribuicao e eliminacao do farmaco.

Aplicando transformadas de Laplace, a equacao (A.2) pode ser reescrita como:

Cp(s) = As+α

+ Bs+β

= (A + B)s+Aβ+Bα

A+B

s2+(α+β)s+αβ.

(A.3)

Neste caso, o modelo farmacocinetico e descrito pelo seguinte sistema linear de equacoesde estado,

x1(t) = −αx1(t) + Au(t)

x2(t) = −βx2(t) + Bu(t)(A.4)

e cp(t) =2∑

i=1

xi(t).

A.1.2 Modelo farmacodinamico

A identificacao da relacao farmacodinamica (Sheiner, Donald, Stanski, Vozeh, Millere Ham 1979) para o d - tubocarine (relaxante muscular), sendo tambem aplicavel aoutros relaxantes musculares, como por exemplo o atracurio, permitiu constatar quea dinamica do efeito do farmaco nao coincide com a concentracao plasmatica. Paraefectuar a caracterizacao completa dos aspectos temporais do efeito induzido pelofarmaco, e introduzido um terceiro compartimento designado como compartimentoefeito.

A entrada para o compartimento efeito, k1e e arbitrariamente pequena enquanto aeliminacao total do farmaco atraves do compartimento efeito e caracterizada por ke0,como se mostra na Figura A.2.

Page 152: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

152 Modelo matematico para o atracurio

...................

....................

...................

..................

.....................................

...................................................................................................................

..................

...................

....................

..........

.........

..........

.........

....................

...................

..................

..................

................... .................... ................... ................... .......................................

..................

..................

...................

....................

...................

...................

....................

...................

..................

.....................................

...................................................................................................................

..................

...................

....................

..........

.........

..........

.........

....................

...................

..................

..................

................... .................... ................... ................... .......................................

..................

..................

...................

....................

...................

...................

....................

...................

..................

.....................................

...................................................................................................................

..................

...................

....................

..........

.........

..........

.........

....................

...................

..................

..................

................... .................... ................... ................... .......................................

..................

..................

...................

....................

...................

? ?

6

-

-

.... ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........ ........

u(t) k12

k21

k10 k20

k1e

ke0

Compartimento

central

1

Compartimento

periferico

2

Compartimento

efeito

3 Dinamica

Cinetica

Figura A.2: Modificacao da cinetica do atracurio para incluir o compartimento efeito.

No compartimento efeito, a variacao da concentracao de farmaco e dada pela seguinteequacao de estado:

ce(t) = k1ecp(t)− ke0ce(t). (A.5)

E possıvel admitir que k1e = ke0 como demonstrou Mendonca (1992). Com estepressuposto, a equacao anterior pode ser expressa do seguinte modo:

ce(t) = ke0cp(t)− ke0ce(t). (A.6)

Aplicando transformadas de Laplace, a equacao (A.6) pode ser reescrita como:

Ce(s) =ke0

s + ke0

Cp(s) (A.7)

A seguinte relacao nao linear (equacao de Hill), pode ser usada para se obter o efeitocorrespondente a uma concentracao especıfica de farmaco,

r(t) =100

1 +[

ce(t)c50

]s , (A.8)

em que:

c50 corresponde ao valor de ce(t) para o qual se obtem 50% do efeitoinduzido es e um parametro adimensional responsavel pela forma sigmoidal da curvado relaxamento muscular.

A variavel r(t) normalizada entre 0 e 100, mede o nıvel relaxamento muscular, 0corresponde ao relaxamento total e 100 a plena actividade muscular.

Page 153: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

A.1 Modelo compartimental do atracurio 153

A.1.3 A equacao de disposicao

A evolucao no tempo da concentracao induzida pela administracao de um farmacopode ser descrita pelo seguinte integral de convolucao,

c(t) =

∫ t

0

g(t− τ)u(τ)dτ (A.9)

em que:

τ e uma variavel de tempo que varia ao longo do intervalo ate ao instanteactual t durante o qual e administrado o farmaco,u(t) descreve a quantidade de farmaco administrada por unidade de tempoe por unidade de massa do paciente, M ,c(t) e a concentracao induzida eg(t) e a funcao de peso do sistema (tambem designada por resposta im-pulsiva do sistema para sistemas invariantes no tempo), que pesa valoresanteriores da entrada u(t) para se obter o valor actual da saıda c(t).

Num sistema deste tipo esta implıcita a hipotese de que o sistema e linear e invarianteno tempo, aproximacao aceitavel para o atracurio e para muitos outros farmacosno intervalo de concentracoes em que sao utilizados. Para alem desta restricao estemodelo e bastante geral, cobrindo situacoes diversas no que diz respeito ao significadoda concentracao c(t) (plasmatica ou outra) e ao tipo de administracao utilizada:administracao endovenosa (contınua, por bolus ou mista), administracao oral,etc.

Decorre de (A.9) que a resposta impulsiva g(t) pode ser obtida experimentalmente apartir da concentracao observada cB(t) induzida pela administracao em tempo muitocurto (uma aproximacao em δ de Dirac) de uma quantidade de farmaco, (B), porunidade de massa do paciente,

g(t) = B−1cB(t)|u(t)=Bδ(t) (A.10)

O calculo de regimes de administracao de farmacos exige uma descricao parametricade cB(t), nomeadamente a partir de uma aproximacao do tipo

cB(t) 'n∑

i=1

A′ie

αit, (A.11)

a que corresponde um modelo para a resposta impulsiva

g(t) =n∑

i=1

Aieαit, (A.12)

equacao normalmente designada na literatura da especialidade por equacao de dis-posicao, a qual fica completamente caracterizada pelos parametros farmacocineticos(Ai,αi).

Page 154: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

154 Modelo matematico para o atracurio

A.2 Variabilidade interindividual

A.2.1 Modelos farmacocineticos individuais

A Tabela A.1 sintetiza os resultados obtidos em 12 indivıduos, tendo sido adminis-trado aos 6 primeiros pacientes um bolus de 0.6 mg/kg e aos 6 restantes um bolusde 0.3 mg/kg. Para cada um dos 12 pacientes foram estimados os parametros(Ai,αi) da equacao de disposicao (A.12) (Ward et al. 1983). Os parametros θi =A1i, α1i, B1i, β1ii=1,2,...,12 correspondentes ao modelo farmacocinetico do atracurioidentificados para cada um dos 12 indivıduos foram estimados pelo metodo dos mınimosquadrados.

Como se pode verificar pela analise directa da Tabela A.1 a variabilidade dos para-metros e muito elevada. A Figura A.3 a) ilustra a variabilidade interindividual dasconcentracoes plasmaticas induzidas pela administracao de um bolus de 0.5 mg/kg aos12 pacientes simulados a partir dos dados da Tabela A.1.

Paciente no¯

1 2 3 4 5 6A(mg/ml) 0.01764 0.01873 0.016150 0.02500 0.03476 0.01032B(mg/ml) 0.004182 0.004725 0.005384 0.004118 0.004603 0.004286α(min−1 ) 0.247 0.433 0.408 0.533 0.495 0.301β(min−1 ) 0.032 0.030 0.041 0.032 0.034 0.035

Paciente no¯ (cont.)

7 8 9 10 11 12A(mg/ml) 0.008066 0.01677 0.03000 0.01563 0.01172 0.00933B(mg/ml) 0.004839 0.006452 0.005455 0.003750 0.006897 0.004000α(min−1 ) 0.315 0.347 0.693 0.257 0.289 0.210β(min−1 ) 0.035 0.036 0.039 0.031 0.043 0.034

Tabela A.1: Parametros farmacocineticos de 12 modelos identificados na literaturapara o atracurio.

A.2.2 Modelos farmacodinamicos individuais

Os parametros farmacodinamicos representados globalmente por θf = [ke0, s, c50] fo-ram identificados a partir de medicoes electromiograficas (“single twitch”) do efeitoneuromuscular induzido, quando foram administradas 4 infusoes contınuas e dois bolus ,de 0.3 e 0.6 mg/kg de atracurio (Weatherley et al. 1983). Destes estudos apenasforam publicados os valores medios dos parametros farmacodinamicos e respectivosdesvios padrao, que se encontram sintetizados na Tabela A.2. As Figuras A.3 (b)

Page 155: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

A.2 Variabilidade interindividual 155

(a)

0 20 40 60 80 1000

2

4

6

8

10

12

14

16

18

20

Tempo(min)

c p(t

) µg

/ml

Concentração plasmática

(b)

0 20 40 60 80 1000

0.5

1

1.5

2

2.5

3

3.5

Tempo(min)

c e(t

) µg

/ml

Concentração efeito

(c)

0 20 40 60 80 1000

10

20

30

40

50

60

70

80

90

100

Tempo(min)

r(t)

%

Efeito induzido

Figura A.3: (a) Concentracoes plasmaticas; (b) concentracoes no compartimento efeitoe (c) curvas de relaxamento induzido pela administracao de um bolus de 0.5 mg/kgde atracurio, aos 12 modelos identificados na literatura.

Page 156: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

156 Modelo matematico para o atracurio

ke0 ± σ(min−1)

c50 ± σµg ml−1 s± σ

0.100± 0.008 0.652± 0.23 4.25± 0.55

Tabela A.2: Parametros farmacodinamicos medios obtidos para o atracurio.

(a)

0 2 4 6 8 100

20

40

60

80

100

120

140

Tempo(min)

r(t)

%

Efeito induzido (86 pacs. reais; 100 modelos)

(b)

0 2 4 6 8 100

20

40

60

80

100

120

140

Tempo(min)

r(t)

%

Efeito induzido (86 pacs. reais; 100 modelos c/ atraso)

Figura A.4: Registo do relaxamento (10 minutos iniciais) induzido pela administracaode um bolus de 0.5 mg/kg em 86 pacientes submetidos a anestesia geral emsobreposicao com as respostas previstas com os 100 modelos do banco: (a) sem atraso;(b) com atraso de 1 minuto.

e (c) ilustram a variabilidade interindividual das concentracoes no compartimentoefeito, e dos nıveis de relaxamento muscular induzidos pela administracao de umbolus de 0.5 mg/kg no instante t = 0. Uma vez que so se conhecem valores mediosdos parametros farmacodinamicos para o atracurio, a variabilidade observada e umaconsequencia apenas da variabilidade dos parametros farmacocineticos.

A.2.3 Analise comparativa entre os casos reais e os modelosdisponıveis na literatura

Uma das principais restricoes inerentes ao controlo do bloqueio neuromuscular e a in-certeza associada ao comportamento dinamico do paciente, que resulta de uma grandevariabilidade interindividual. Para ilustrar este facto apresenta-se na Figura A.4 (a)o registo obtido para o relaxamento induzido pela administracao de um bolus de0.5 mg /kg em 86 pacientes submetidos a anestesia geral (a preto) e as respostasprevistas com os 100 modelos do banco (a cinza) desenvolvido por Lago et al. (1998).

Analisando a Figura A.4 (a) pode verificar-se que a variabilidade nos casos reais esuperior a prevista a partir do banco de modelos usado nas simulacoes. Pode-se

Page 157: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

ainda verificar que existe um atraso no inıcio da accao nos pacientes reais de cercade 1 minuto, como constatou Lago et al. (1998), que e confirmado pela analise daFigura A.4 (b) em que as respostas referentes aos 100 modelos vem afectadas com umatraso dessa ordem e se verifica uma maior semelhanca com os casos reais. Devidoa esta observacao, Lago et al. (1998) incluiu um modelo empırico de primeira ordempara que as respostas obtidas a partir dos modelos sejam mais proximas (no sentidode mınimos quadrados) das verificadas em ambiente clınico. A funcao de transferenciado modelo empırico e dada por

Gatraso(s) =1/τ

s + 1/τ(A.13)

em que τ (min.) e uma variavel aleatoria, considerada independente dos outrosparametros farmacocineticos/farmacodinamicos. As respostas ilustradas na Figura A.4(b) foram obtidas quando se assume que τ segue uma distribuicao uniforme no intervalo[ 0, 3.5 ] (min.). Nas simulacoes apresentadas neste trabalho, sempre que se adicionouruıdo, nao se incluiu o modelo empırico, na medida em que entendeu que o atraso intro-duzido pelo filtro de media - usado para filtrar o ruıdo que se adiciona para replicar emambiente de simulacao o erro na leitura do relaxograph - e da mesma ordem de grandezaque o atraso introduzido pelo modelo empırico. Nas Tabelas A.3, A.4, A.5 e A.6, saoapresentadas as funcoes de transferencia, em tempo contınuo e os parametros (c50, s)da equacao de Hill (A.8) do banco de 100 modelos usado nas simulacoes efectuadas.

Page 158: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

158 Modelo matematico para o atracurio

Modelo Gp(s) Ge(s) Gatraso(s) Hill(·, c50, s)

M10.036 s +0.0042

s2 +0.61 s +0.0210.1

s +0.10.48

s +0.48Hill(·, 0.65271, 3.9896)

M20.025 s +0.0022

s2 +0.39 s +0.0110.09

s +0.091.3

s +1.3Hill(·, 0.67687, 3.9476)

M30.011 s +0.00081

s2 +0.23 s +0.00610.09

s +0.090.9

s +0.9Hill(·, 0.62395, 3.1482)

M40.025 s +0.0034

s2 +0.43 s +0.0170.097

s +0.0970.41

s +0.41Hill(·, 0.67421, 4.3279)

M50.012 s + 0.001

s2 +0.27 s +0.00770.095

s +0.0952.4

s +2.4Hill(·, 0.64354, 4.7597)

M60.025 s +0.0024

s2 +0.38 s +0.0120.1

s +0.10.37

s +0.37Hill(·, 0.63108, 4.2727)

M70.03 s +0.0033

s2 +0.46 s +0.0150.097

s +0.0970.54

s +0.54Hill(·, 0.66554, 4.1166)

M80.027 s +0.0024

s2 +0.39 s +0.0120.1

s +0.10.52

s +0.52Hill(·, 0.66974, 3.7007)

M90.03 s +0.0027

s2 +0.45 s +0.0120.1

s +0.10.49

s +0.49Hill(·, 0.63985, 4.091)

M100.02 s +0.0031

s2 +0.45 s +0.0160.084

s +0.0840.87

s +0.87Hill(·, 0.66201, 4.2006)

M110.036 s +0.0035

s2 +0.56 s +0.0190.1

s +0.10.41

s +0.41Hill(·, 0.60971, 5.1818)

M120.018 s +0.0017

s2 +0.33 s +0.00940.11

s +0.112

s + 2Hill(·, 0.65448, 4.4898)

M130.027 s +0.0021

s2 +0.3 s +0.00850.12

s +0.121.8

s +1.8Hill(·, 0.60664, 4.3392)

M140.022 s +0.0023

s2 +0.33 s +0.0110.096

s +0.0960.59

s +0.59Hill(·, 0.6563, 5.3965)

M150.014 s +0.0019

s2 +0.33 s +0.0110.088

s +0.0880.33

s +0.33Hill(·, 0.64562, 5.048)

M160.0081 s +0.00076s2 +0.2 s +0.0053

0.098s +0.098

0.35s +0.35

Hill(·, 0.62344, 4.3575)

M170.023 s +0.0027

s2 +0.46 s +0.0150.1

s +0.10.51

s +0.51Hill(·, 0.63926, 4.7257)

M180.035 s +0.0031

s2 +0.42 s +0.0130.11

s +0.110.39

s +0.39Hill(·, 0.61245, 3.8534)

M190.025 s +0.0023

s2 +0.41 s +0.0120.095

s +0.0950.9

s +0.9Hill(·, 0.7091, 3.3303)

M200.018 s +0.0022

s2 +0.46 s +0.0130.093

s +0.0932.1

s +2.1Hill(·, 0.68488, 4.7091)

M210.023 s + 0.003

s2 +0.48 s +0.0160.091

s +0.0910.54

s +0.54Hill(·, 0.64053, 5.4086)

M220.015 s +0.0017

s2 +0.33 s +0.0110.092

s +0.0920.92

s +0.92Hill(·, 0.69753, 4.2585)

M230.036 s +0.0041

s2 +0.67 s +0.0220.11

s +0.110.49

s +0.49Hill(·, 0.65064, 3.5436)

M240.0085 s +0.0013

s2 +0.21 s +0.00710.11

s +0.110.55

s +0.55Hill(·, 0.66046, 4.5706)

M250.029 s +0.0041

s2 +0.58 s +0.0210.089

s +0.0890.66

s +0.66Hill(·, 0.64521, 3.5223)

Tabela A.3: Funcoes de transferencia e parametros da equacao de Hill dos modelosM1 → M25 do banco de 100 modelos (Lago et al. 1998).

Page 159: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

A.2 Variabilidade interindividual 159

Modelo Gp(s) Ge(s) Gatraso(s) Hill(·, c50, s)

M260.045 s +0.0064

s2 +0.73 s +0.0270.1

s +0.11.1

s +1.1Hill(·, 0.67159, 3.7446)

M270.03 s +0.0029

s2 +0.47 s +0.0140.09

s +0.090.77

s +0.77Hill(·, 0.62016, 4.6149)

M280.023 s +0.003

s2 +0.5 s +0.0170.094

s +0.0940.73

s +0.73Hill(·, 0.63445, 5.05)

M290.015 s +0.0022

s2 +0.38 s +0.0120.099

s +0.0990.64

s +0.64Hill(·, 0.6651, 3.4746)

M300.026 s +0.0038

s2 +0.42 s +0.0180.1

s +0.10.6

s +0.6Hill(·, 0.6548, 3.9473)

M310.019 s +0.003

s2 +0.59 s +0.020.085

s +0.0850.74

s +0.74Hill(·, 0.62292, 4.28)

M320.03 s +0.0037

s2 +0.47 s +0.0180.093

s +0.0931

s +1Hill(·, 0.66504, 4.3926)

M330.025 s +0.0039s2 +0.5 s +0.018

0.11s +0.11

3.7s +3.7

Hill(·, 0.66526, 4.5267)

M340.011 s +0.00089

s2 +0.23 s +0.00610.11

s +0.110.77

s +0.77Hill(·, 0.62624, 4.2578)

M350.033 s +0.0031s2 +0.5 s +0.016

0.1s +0.1

1.1s +1.1

Hill(·, 0.64987, 4.5096)

M360.021 s +0.0028s2 +0.5 s +0.015

0.094s +0.094

0.43s +0.43

Hill(·, 0.6533, 4.4695)

M370.018 s +0.0017

s2 +0.27 s +0.00830.1

s +0.10.42

s +0.42Hill(·, 0.66033, 3.7671)

M380.022 s +0.0017

s2 +0.32 s +0.00950.085

s +0.0850.56

s +0.56Hill(·, 0.66239, 4.2315)

M390.023 s +0.0025

s2 +0.38 s +0.0130.095

s +0.0950.39

s +0.39Hill(·, 0.61609, 3.9712)

M400.022 s +0.0021

s2 +0.35 s +0.0110.097

s +0.0970.4

s +0.4Hill(·, 0.64996, 4.6327)

M410.037 s +0.0034

s2 +0.61 s +0.0170.093

s +0.0930.3

s +0.3Hill(·, 0.65987, 3.2811)

M420.016 s +0.0016

s2 +0.24 s +0.00790.11

s +0.110.62

s +0.62Hill(·, 0.69554, 4.4275)

M430.03 s +0.0027

s2 +0.42 s +0.0130.1

s +0.10.3

s +0.3Hill(·, 0.65167, 3.5224)

M440.018 s +0.0021

s2 +0.41 s +0.0120.1

s +0.10.89

s +0.89Hill(·, 0.69407, 4.2905)

M450.028 s +0.0037

s2 +0.47 s +0.0170.1

s +0.10.62

s +0.62Hill(·, 0.64269, 4.0431)

M460.015 s +0.0024

s2 +0.47 s +0.0150.1

s +0.10.55

s +0.55Hill(·, 0.661, 4.2986)

M470.019 s +0.0023

s2 +0.36 s +0.0120.11

s +0.110.43

s +0.43Hill(·, 0.65866, 3.8199)

M480.026 s +0.0023s2 +0.34 s +0.01

0.1s +0.1

0.71s +0.71

Hill(·, 0.64908, 4.3942)

M490.017 s +0.0023

s2 +0.37 s +0.0120.095

s +0.0950.47

s +0.47Hill(·, 0.63719, 4.0812)

M500.024 s +0.003

s2 +0.44 s +0.0150.086

s +0.0860.29

s +0.29Hill(·, 0.6451, 4.4704)

Tabela A.4: Funcoes de transferencia e parametros da equacao de Hill dos modelosM26 → M50 do banco de 100 modelos (Lago et al. 1998).

Page 160: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

160 Modelo matematico para o atracurio

Modelo Gp(s) Ge(s) Gatraso(s) Hill(·, c50, s)

M510.031 s + 0.002

s2 +0.4 s +0.0110.09

s +0.091.9

s +1.9Hill(·, 0.66061, 3.873)

M520.014 s +0.0013

s2 +0.26 s +0.00770.1

s +0.10.43

s +0.43Hill(·, 0.66221, 4.6127)

M530.022 s +0.0024

s2 +0.51 s +0.0160.09

s +0.090.83

s +0.83Hill(·, 0.67142, 3.9129)

M540.026 s + 0.003

s2 +0.48 s +0.0160.089

s +0.0890.53

s +0.53Hill(·, 0.65491, 4.4047)

M550.019 s +0.0026

s2 +0.41 s +0.0150.1

s +0.10.55

s +0.55Hill(·, 0.60307, 3.3747)

M560.021 s +0.0028

s2 +0.46 s +0.0170.11

s +0.110.34

s +0.34Hill(·, 0.67317, 4.963)

M570.02 s +0.0032

s2 +0.48 s +0.0170.093

s +0.09319

s +19Hill(·, 0.67468, 3.7667)

M580.024 s +0.0032

s2 +0.49 s +0.0170.1

s +0.11

s + 1Hill(·, 0.62722, 4.3128)

M590.02 s +0.0022

s2 +0.37 s +0.0120.11

s +0.110.44

s +0.44Hill(·, 0.64606, 4.9081)

M600.016 s +0.0023

s2 +0.46 s +0.0160.1

s +0.10.52

s +0.52Hill(·, 0.63154, 4.917)

M610.019 s +0.0021s2 +0.4 s +0.013

0.1s +0.1

0.31s +0.31

Hill(·, 0.67029, 3.924)

M620.026 s +0.0036s2 +0.6 s +0.02

0.099s +0.099

1.1s +1.1

Hill(·, 0.62713, 5.2428)

M630.015 s +0.0012

s2 +0.24 s +0.00710.1

s +0.10.29

s +0.29Hill(·, 0.59644, 3.6932)

M640.032 s +0.0027

s2 +0.42 s +0.0120.13

s +0.131.2

s +1.2Hill(·, 0.61738, 4.0606)

M650.018 s +0.0019

s2 +0.33 s +0.0110.1

s +0.10.34

s +0.34Hill(·, 0.64059, 4.0815)

M660.023 s +0.0024

s2 +0.42 s +0.0140.11

s +0.110.41

s +0.41Hill(·, 0.63817, 2.8659)

M670.016 s +0.0018

s2 +0.35 s +0.0120.096

s +0.0960.63

s +0.63Hill(·, 0.69176, 4.6857)

M680.023 s +0.0023

s2 +0.39 s +0.0120.1

s +0.10.35

s +0.35Hill(·, 0.66304, 4.0857)

M690.015 s +0.0015

s2 +0.33 s +0.0090.096

s +0.09613

s +13Hill(·, 0.65679, 4.3558)

M700.025 s +0.0031

s2 +0.47 s +0.0160.1

s +0.11.8

s +1.8Hill(·, 0.63348, 4.8719)

M710.015 s +0.0013

s2 +0.23 s +0.00690.1

s +0.10.4

s +0.4Hill(·, 0.66733, 3.5112)

M720.067 s +0.0032

s2 +0.45 s +0.0120.097

s +0.0970.4

s +0.4Hill(·, 0.63824, 4.2303)

M730.043 s +0.0033

s2 +0.46 s +0.0150.098

s +0.0980.65

s +0.65Hill(·, 0.64662, 4.5427)

M740.023 s +0.0027

s2 +0.44 s +0.0140.1

s +0.10.49

s +0.49Hill(·, 0.64592, 4.3404)

M750.021 s +0.0034

s2 +0.61 s +0.0190.09

s +0.090.38

s +0.38Hill(·, 0.64544, 3.9773)

Tabela A.5: Funcoes de transferencia e parametros da equacao de Hill dos modelosM51 → M75 do banco de 100 modelos (Lago et al. 1998).

Page 161: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

A.2 Variabilidade interindividual 161

Modelo Gp(s) Ge(s) Gatraso(s) Hill(·, c50, s)

M760.016 s +0.0016

s2 +0.34 s +0.00920.11

s +0.110.29

s +0.29Hill(·, 0.59722, 3.2956)

M770.03 s +0.0032

s2 +0.56 s +0.0190.11

s +0.110.41

s +0.41Hill(·, 0.64328, 5.2459)

M780.012 s +0.0009

s2 +0.21 s +0.0060.11

s +0.111

s +1Hill(·, 0.64482, 3.7874)

M790.039 s +0.004

s2 +0.64 s +0.0190.11

s +0.110.38

s +0.38Hill(·, 0.61018, 3.389)

M800.018 s +0.0024

s2 +0.43 s +0.0130.095

s +0.0951.7

s +1.7Hill(·, 0.63307, 4.0243)

M810.018 s +0.002

s2 +0.41 s +0.0120.093

s +0.09367

s +67Hill(·, 0.63437, 4.3891)

M820.037 s +0.0036

s2 +0.52 s +0.0160.1

s +0.10.58

s +0.58Hill(·, 0.67671, 4.5957)

M830.015 s +0.002

s2 +0.33 s +0.0110.093

s +0.0933.6

s +3.6Hill(·, 0.67562, 4.0209)

M840.037 s +0.004

s2 +0.67 s +0.020.095

s +0.0951.8

s +1.8Hill(·, 0.65277, 4.0483)

M850.015 s +0.002

s2 +0.33 s +0.0110.09

s +0.090.32

s +0.32Hill(·, 0.57707, 4.7046)

M860.02 s +0.0024

s2 +0.42 s +0.0130.1

s +0.10.36

s +0.36Hill(·, 0.69752, 4.1069)

M870.036 s +0.008

s2 +0.72 s +0.0320.1

s +0.10.38

s +0.38Hill(·, 0.63865, 4.4922)

M880.013 s +0.0012

s2 +0.24 s +0.0070.1

s +0.10.65

s +0.65Hill(·, 0.64987, 3.9735)

M890.026 s +0.0022

s2 +0.39 s +0.0110.11

s +0.1145

s +45Hill(·, 0.64244, 3.5674)

M900.041 s +0.0054

s2 +0.81 s +0.0270.1

s +0.10.49

s +0.49Hill(·, 0.64181, 4.5014)

M910.018 s +0.0018s2 +0.32 s +0.01

0.099s +0.099

0.55s +0.55

Hill(·, 0.63315, 5.273)

M920.029 s +0.0051

s2 +0.68 s +0.0240.089

s +0.0894.3

s +4.3Hill(·, 0.65499, 4.3442)

M930.019 s +0.0024

s2 +0.38 s +0.0140.1

s +0.10.53

s +0.53Hill(·, 0.65736, 5.7029)

M940.046 s +0.0045

s2 +0.63 s +0.0220.093

s +0.0930.73

s +0.73Hill(·, 0.63194, 4.3254)

M950.018 s +0.0018

s2 +0.31 s +0.0110.091

s +0.0911.3

s +1.3Hill(·, 0.64947, 4.1183)

M960.019 s +0.0018

s2 +0.38 s +0.0110.1

s +0.10.74

s +0.74Hill(·, 0.61919, 3.6866)

M970.022 s +0.0035

s2 +0.63 s +0.0240.092

s +0.0920.46

s +0.46Hill(·, 0.64718, 4.4492)

M980.026 s +0.0034s2 +0.5 s +0.017

0.11s +0.11

0.43s +0.43

Hill(·, 0.68998, 3.4982)

M990.041 s +0.003

s2 +0.41 s +0.0130.091

s +0.0910.4

s +0.4Hill(·, 0.67823, 4.5144)

M1000.029 s +0.0031s2 +0.5 s +0.018

0.1s +0.1

0.53s +0.53

Hill(·, 0.625, 4.1006)

Tabela A.6: Funcoes de transferencia e parametros da equacao de Hill dos modelosM76 → M100 do banco de 100 modelos (Lago et al. 1998).

Page 162: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

162 Modelo matematico para o atracurio

Page 163: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

Apendice B

Controlo automatico do bloqueioneuromuscular em ambiente clınico

Figura B.1: Foto tirada num bloco operatorio do Hospital Geral de Santo Antonio.

Neste Apendice descreve-se sucintamente o sistema de controlo automatico do bloqueioneuromuscular que se encontra em funcionamento no Hospital Geral de Santo Antonio.Na Figura B.1 sao visıveis os modulos que compoem o sistema, designadamente:

• o modulo de leitura, que consiste no sistema de monitorizacao Datex AS/3 NMT-NeuroMuscular Transmission, que regista o nıvel de bloqueio neuromuscular;

• o sistema de perfusao, em que e usada uma bomba digital B—Braun paraadministracao do farmaco;

• o modulo de controlo, que consiste num computador com duas portas serie paraligar ao sensor NMT e a bomba perfusora, respectivamente. No computador estainstalado software que incorpora algoritmos de controlo desenvolvidos para estaaplicacao, e.g., o software Hipocrates (Mendonca, Magalhaes, Lago e Esteves2004).

Page 164: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

164 Controlo automatico do bloqueio neuromuscular em ambiente clınico

Page 165: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

Apendice C

Identificacao de sistemas -modelacao caixa preta

C.1 Modelacao caixa preta

Diz-se que o modelo de um sistema e do tipo caixa preta se nao usa qualquer informacaoa priori sobre as relacoes fısicas envolvidas no sistema. E portanto mais uma questaode “ajuste” do que “modelacao”.

Neste Apendice sao apresentados varios exemplos de estruturas de modelos caixa preta.Sao descritas estruturas lineares e naoda-se particular enfase aos modelos caixa pretaque recorrem a funcoes de base, e.g., splines lineares e polinomios de Chebyshev. Estetipo de funcoes foram usadas de forma recorrente neste trabalho na parametrizacaode funcoes nao lineares.

C.1.1 Introducao: modelos de diferentes cores

O cerne de qualquer problema de estimacao consiste na escolha da estrutura do modeloadequado aos dados em causa. Uma regra basica em estimacao e “nao estimar o queja se conhece”. Por outras palavras, deve-se usar todo o conhecimento que existe apriori sobre o sistema quando se escolhe a estrutura do modelo. E habitual usar-se umacodificacao por cores - numa gama da cor cinza - para realcar o tipo de conhecimentoa priori que foi usado na seleccao da estrutura do modelo:

• Modelos caixa branca: e o caso em que se conhece perfeitamente o modelo; foipossıvel obter o modelo com acuidade a partir do conhecimento a priori sobre osistema.

• Modelos caixa cinza: quando se tem algum conhecimento sobre o sistema, mas

Page 166: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

166 Identificacao de sistemas - modelacao caixa preta

ainda ha varios parametros que precisam de ser determinados a partir dos dadosobservados. E util considerar dois casos:

- Modelacao fısica: a estrutura do modelo e definida a partir de fundamentosfısicos e ha diversos parametros que tem que ser estimados a partir dosdados observados. Um exemplo do que se afirma pode ser, um modelo emespaco de estados com uma determina estrutura e de uma dada ordem.

- Modelacao semi-fısica: a compreensao que existe sobre o sistema e usada paraestabelecer diversas combinacoes, nao lineares, entre os sinais que fazemparte do conjunto das observacoes. Estes novos sinais, sao depois sujeitosa estruturas de modelos do tipo caixa preta.

• Modelos caixa preta: nao e usado qualquer conhecimento a priori, a estruturado modelo deve pertencer a “famılias” de modelos que tenham permitido obter“bons resultados” no passado.

C.1.2 Caracterısticas elementares dos modelos caixa preta

Para melhor se perceber quais as caracterısticas de um problema de estimacao caixapreta, considere-se o seguinte exemplo:

Exemplo C.1 (problema caixa preta - simples)

Assuma-se que se pretende estimar a seguinte funcao desconhecida,

g0(x), −1 ≤ x ≤ 1.

As observacoes disponıveis y(k) sao medicoes sujeitas a ruıdo nos pontos x(k), quepodem ser escolhidos ou nao:

y(k) = g0(xk) + e(k) (C.1)

Como abordar este problema? No caso de se saber que se trata, por exemplo, de umpolinomio de terceira ordem, isto conduziria a um modelo caixa cinza, com estruturadada por

g(x, θ) = θ1 + θ2x + θ3x2 + . . . + θnx

n−1, (C.2)

com n = 4 e ter-se-ia que estimar o vector de parametros θ a partir do conjunto dasobservacoes, usando, e.g, o metodo classico dos mınimos quadrados.

Suponha-se agora que nao ha qualquer informacao a priori sobre a estrutura da funcaog. Tambem neste caso ter-se-a que assumir alguma caracterıstica de g, por exemplo,que g e uma funcao analıtica, ou que e constante por intervalos etc. Nesta situacao,e ainda possıvel usar a estrutura (C.2), mas agora como modelo caixa preta: quandose assume que g e uma funcao analıtica, sabe-se, do calculo elementar, que pode ser

Page 167: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

C.1 Modelacao caixa preta 167

1 2 3 4 5 6 7 8 9 10

0.7

0.8

0.9

1

1.1

1.2

1.3

1.4

1.5

Figura C.1: Aproximacao por uma funcao constante por intervalos.

aproximada com a precisao que se pretenda por um polinomio. A ordem do polinomionao e conhecida e ter-se-a que encontrar um valor usando um procedimento adequado.

Note-se que ha diversas alternativas a aproximacao por um polinomio. Pode-se usaruma aproximacao por uma funcao racional

g(x, θ) =θ1 + θ2x + θ3x

2 + . . . + θnxn−1

1 + θn+1x + θn+2x2 + . . . + θn+m−1xm−1, (C.3)

ou expansoes em serie de Fourier

g(x, θ) = θ0 +n∑

`=1

θ2`−1 cos(`πx) + θ2` sin(`πx) (C.4)

Alternativamente, podem-se usar funcoes constantes por intervalos para aproximar afuncao, como se ilustra na Figura C.1.

A partir do exemplo apresentado, torna-se agora claro que os passos basicos a seguirem modelacao caixa preta, sao:

1. Escolher o “tipo” de estrutura do modelo. No exemplo acima, transformada deFourier, funcao racional ou funcao constante por intervalos.

2. Determinar o “tamanho” do modelo, isto e, o numero de parametros, n oun + m− 1. Isto vai determinar o grau de acuidade na aproximacao.

3. Usar o conjunto das observacoes para estimar os parametros do modelo e paraescolher um valor adequado para n.

Page 168: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

168 Identificacao de sistemas - modelacao caixa preta

C.1.3 Tecnicas de estimacao e propriedades basicas

Nesta seccao vao-se abordar questoes que sao independentes da estrutura do modelo.Princıpios e algoritmos para ajustar modelos aos dados, assim como propriedadesgerais dos modelos estimados, sao questoes que nao dependem da estrutura do modeloe que sao aplicaveis a varias famılias de modelos, nomeadamente: modelos linearesARMAX, modelos de Wiener, Redes Neuronais, etc.

C.1.3.1 Criterio de ajuste

Uma abordagem quase “natural” e o uso do criterio que minimiza o erro quadraticomedio,

VN(θ, ZN) =1

N

N∑t=1

‖y(t)− y(t, θ)‖2 (C.5)

Neste caso, a estimativa do vector de parametros (Ljung 1999) e dada por

θN = arg minθ

VN(θ, ZN) (C.6)

A diferenca entre o valor medido, y(t) e o valor previsto/predito y(t, θ), chama-se errode predicao,

ε(t, θ) = y(t)− y(t, θ) (C.7)

Ha varias interpretacoes estatısticas associadas ao criterio (C.5). Note-se que, quandoa fonte de ruıdo no sistema se assume ser uma sequencia Gaussiana (de variaveisaleatorias independentes), e(t), a estimativa (C.6) torna-se uma estimativa de MaximaVerosimilhanca (EMV).

Se o preditor, y(t, θ), e uma funcao linear de θ, o problema de estimacao e de facilresolucao. Em casos mais complexos, a minimizacao e levada a cabo atraves deuma pesquisa iterativa (local) do mınimo. A actualizacao do vector de parametrose realizada da seguinte forma:

θ(i+1)N = θ

(i)N + µ f(ZN , θ

(i)N ) (C.8)

onde, f , geralmente, esta relacionada com o gradiente de VN , tal como a direccao deGauss-Newton, em que a actualizacao do vector de parametros e dada por

θ(i+1)N = θ

(i)N − µ

(i)N [ HN(θ

(i)N ) ]−1 V ′

N(θ(i)N , ZN) (C.9)

em que µ(i)N e, geralmente, uma sucessao decrescente que minimiza o criterio VN , HN(·),

denota a matriz Hessiana e V ′N(·) e o vector gradiente (Capıtulo 10 de Ljung (1999)).

Page 169: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

C.1 Modelacao caixa preta 169

C.1.3.2 Convergencia quando N −→∞

Uma questao essencial e saber quais as propriedades da estimativa que resulta de(C.5). Estas derivam, naturalmente, das propriedades do conjunto das observacoes,ZN . Sendo, em geral, difıcil caracterizar exactamente a qualidade da estimativa, θN ,fica-se pelo estudo das propriedades assimptoticas de θN a medida que o numero deobservacoes, N , tende para infinito.

O primeiro resultado basico e o seguinte:

θN −→ θ∗ a medida que N −→∞, onde (C.10)

θ∗ = arg minθ

E‖ε(t, θ)‖2 (C.11)

A medida que mais dados estao disponıveis, a estimativa converge para θ∗, queminimiza o valor esperado da norma quadratica dos erros de predicao.

C.1.3.3 Distribuicao assimptotica

Depois de estabelecida a convergencia, a proxima questao e: quao rapido e atingido ovalor limite? Para responder a esta questao, usa-se a distribuicao assimptotica da esti-mativa. O resultado basico e o seguinte: Se ε(t, θ∗) e aproximadamente ruıdo branco,entao a distribuicao do vector aleatorio

√N (θN − θ∗) converge para a distribuicao

normal com media nula e a matriz de covariancia de θN e dada, aproximadamente,por

Pθ = λ [ E ψ(t)ψ>(t) ]−1 (C.12)

λ = E ε2(t, θ∗)

ψ(t) =d

dθy(t, θ)|θ=θ∗

(C.13)

Pode-se pensar em ψ como a sensibilidade da saıda do modelo preditor em relacao avariacoes nos parametros a estimar. A equacao (C.12) permite afirmar: “a matriz decovariancia de θN e proporcional a inversa da matriz de covariancia de ψ(t)”.

O resultado (C.12)-(C.13) e geral e e valido para todas as estruturas de modelos.Note-se que a matriz de covariancia assimptotica (C.12) e igual ao limite inferior deCramer-Rao (para perturbacoes Gaussianas). Isto e, os metodos baseados no erro depredicao conduzem a propriedades assimptoticas “optimas” (Ljung 1999).

C.1.4 Escolha do “tipo” e “tamanho” do modelo

C.1.4.1 Compromisso entre polarizacao-variancia

O modelo obtido no Exemplo C.1, g(x, θN), esta condicionado por dois tipos de erro:

Page 170: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

170 Identificacao de sistemas - modelacao caixa preta

1. Primeiro, ha uma discrepancia entre o modelo limite g(x, θ∗) e a verdadeirafuncao, g0(x), uma vez que as hipoteses formuladas sobre a estrutura do modelo,geralmente, nao sao totalmente validas, por exemplo, a funcao pode nao serconstante por intervalos. Este tipo de erro designa-se por erro de polarizacao.

2. Segundo, ocorrera uma discrepancia entre a estimativa actual, θN e o valor limite,θ∗. Este erro deve-se ao ruıdo no sistema e designa-se por erro de variancia epode ser medido atraves de (C.12).

E evidente que tem que ocorrer um compromisso entre estes dois aspectos: para seobter um erro de polarizacao menor, deve-se, e.g., usar uma grelha mais “fina” naaproximacao por funcoes definidas por intervalos. Isto, por outro lado, implica o usode um registo de dados mais curto para estimar cada nıvel da aproximacao (por funcoesdefinidas por intervalos), o que conduz a uma maior variancia nas estimativas.

O compromisso polarizacao-variancia e uma questao chave na identificacao de sistemascaixa preta. A seguir indica-se um procedimento simples a seguir na pratica para obterum bom equilıbrio entre estes dois aspectos.

C.1.4.2 Procedimento a seguir na pratica

• Separar os dados observados em dois conjuntos: conjunto de estimacao e con-junto de validacao.

• Estimar modelos, fazendo uso do conjunto de estimacao, para diferentes valoresda dimensao do vector de parametros (dim θ).

• Calcular o valor do custo quadratico para cada um dos modelos obtidos no passoanterior, usando para isso o conjunto de validacao.

• Escolher para modelo final o que minimiza o erro de ajuste (para dados devalidacao).

C.1.5 Modelos caixa preta lineares

Nesta seccao apresenta-se uma breve descricao sobre a identificacao de sistemas line-ares fazendo uso de modelacao caixa preta.

C.1.5.1 Modelos lineares gerais

Se as observacoes y a serem usadas no ajuste do modelo sao dados entrada-saıda nodomınio do tempo, procede-se como segue: assuma-se que os dados foram gerados deacordo com

y(t) = G(q, θ) u(t) + H(q, θ) e(t) (C.14)

Page 171: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

C.1 Modelacao caixa preta 171

onde e(t) e ruıdo branco, q e o operador avanco, e H e monico. Assume-se tambemque G contem um atraso. Reescreva-se (C.14) como

y(t) = [I −H−1(q, θ)] y(t) + H−1(q, θ) G(q, θ) u(t) + e(t) (C.15)

O primeiro termo de (C.15) so contem saıdas “antigas”, o preditor natural de y(t),pode ser dado por

y(t, θ) = Wy(q, θ) y(t) + Wu(q, θ) u(t)

Wy(q, θ) = [I −H−1(q, θ)]

Wu(q, θ) = H−1(q, θ) G(q, θ)

(C.16)

Evidentemente, so sao admissıveis para θ valores que assegurem que os filtros H−1 Ge H−1 sejam estaveis.

C.1.5.2 Modelos lineares de entrada-saıda

No caso caixa preta, uma abordagem natural e, escrever, G e H em (C.14) como funcoesde transferencia racionais no operador atraso, em que o numerador e o denominadorsao polinomios desconhecidos. Tem-se assim,

G(q−1, θ) =B(q−1)

F (q−1)(C.17)

=b1q

−nk + b2q−nk−1 + · · ·+ bnbq

−nk−nb+1

1 + f1q−1 + · · ·+ fnfq−nf(C.18)

quando se considera um tempo de atraso de nk amostras.

Da mesma forma, a funcao de transferencia da perturbacao pode ser escrita como

H(q−1, θ) =C(q−1)

D(q−1)(C.19)

=1 + c1q

−1 + · · ·+ cncq−nc

1 + d1q−1 + · · ·+ dndq−nd(C.20)

O vector de parametros θ contem os coeficientes, bi, ci, di e fi. Este modelo e descritopor cinco parametros estruturais: nb, nc, nd, nf e nk e e conhecido por modelo Box-Jenkins (BJ). Quando as propriedades dos sinais de perturbacao nao sao modeladas,escolhe-se H(q−1) ≡ 1, isto e, nc = nd = 0. Este caso especial e conhecido comomodelo de erro na saıda, uma vez que, neste caso, a fonte de ruıdo corresponde adiferenca entre a saıda actual e a saıda sem ruıdo.

Uma variante habitual e usar o mesmo denominador para G e H:

F (q−1) = D(q−1) = A(q−1) = 1 + a1q−1 + · · ·+ anaq

−na

Page 172: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

172 Identificacao de sistemas - modelacao caixa preta

O modelo (C.14) com as alteracoes descritas acima, vem:

A(q−1) y(t) = B(q−1) u(t) + C(q−1) e(t)

Este modelo e conhecido como modelo ARMAX. O caso especial, C(q−1) = 1, daorigem ao bem conhecido modelo ARX.

C.1.5.3 Modelos lineares de variaveis de estado

Os modelos de variaveis de estado permitem incorporar facilmente conhecimentosdisponıveis a priori sobre o sistema. Tambem podem ser usados em modelacao caixapreta, em tempo discreto ou contınuo. Uma representacao em tempo discreto e dadapor

x(t + 1) = A(θ) x(t) + B(θ) u(t) + K(θ) e(t) (C.21)

y(t) = C(θ) x(t) + e(t) (C.22)

Se a parametrizacao for efectuada de modo que, quando as componentes de θ variamnum dado conjunto, (C.21) abranja todos os sistemas lineares de uma certa ordem,isto conduz a um modelo caixa preta.

C.1.6 Modelos nao lineares caixa preta

Ha uma grande variedade de modelos nao lineares. Neste trabalho foram estudados oschamados modelos orientados por blocos, em particular, os modelos de Wiener. Esteestudo transparece ao longo do texto por isso nao se refere uma seccao ou Capıtulo emparticular. Nesta seccao, sao apresentados varios modelos, dando-se especial enfaseaos modelos parametricos, por terem sido as ferramentas mais usadas no presentetrabalho.

C.1.6.1 Modelos caixa preta

Geralmente considera-se que o regressor, ϕ, contem um numero finito de entradas esaıdas (antigas):

ϕ(t) = [ y(t− 1) . . . y(t− n) u(t− k) . . . u(t− k −m) ]> (C.23)

e o preditor para y(t) e uma funcao generica de ϕ(t):

y(t) = g(ϕ(t)) (C.24)

O preditores que se descreveram no Exemplo C.1 sao do mesmo tipo que (C.24).

Page 173: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

C.1 Modelacao caixa preta 173

A aplicacao g pode ser parametrizada como expansao em serie de funcoes,

g(ϕ, θ) =n∑

k=1

αk κ(βk(ϕ− γk)) (C.25)

Na equacao (C.25), κ e a chamada “funcao de base mae”, a partir da qual sao criadasas funcoes da expansao: por dilatacao (parametro β) e translacao (parametro γ). Porexemplo, quando se define κ = cos, pode-se obter a expansao em serie de Fourier,com β como frequencia e γ como fase. Sao mais comuns casos em que ϕ e um pulsounitario. Com essa escolha, (C.25) pode descrever qualquer funcao constante porintervalos. No caso do Exemplo C.1, em particular, da Figura C.1, a escolha dosparametros da expansao seria:

• n = 4,• γ1 = 1, γ2 = 2, γ3 = 3.5, γ4 = 7,• β1 = 1, β2 = 2/3, β3 = 1/3.5, β4 = 1/3,• α1 = 0.79, α2 = 1.1, α3 = 1.3, α4 = 1.43

Outras escolhas possıveis para κ, poderiam ser: uma versao suave do pulso unitario,por exemplo, o sino Gaussiano; a funcao degrau unitario (adequada para aproximacaopor funcoes constantes por intervalos); um degrau suave, por exemplo, uma funcaosigmoidal, etc.

A parametrizacao (C.25) em termos de θ pode ser caracterizada por tres tipos deparametros:

• As coordenadas α

• Os parametros de escala ou dilatacao β

• Os parametros de localizacao γ

Estes parametros afectam o modelo de diferentes formas. As coordenadas “entram”de forma linear, significa que (C.25) e uma regressao linear para parametros de escalae localizacao fixos. A regressao linear tem duas grandes vantagens em relacao aoutros metodos de identificacao: fornece uma estimativa unica e e rapida. Regrageral, um criterio baseado no erro de predicao pode ter varios mınimos locais e enecessario recorrer a metodos numericos que requerem muito tempo de computacaopara minimizar o criterio.

Quando se usam funcoes de base para parametrizar uma funcao - no contexto destetrabalho - nao linear , a estrutura principal para uma funcao f , real de variavel real,e a seguinte:

f(x) =nl∑

i=1

αi Bi(x) (C.26)

Nas proximas seccoes apresentam-se varias escolhas possıveis para funcoes de base,em que x se assume escalar.

Page 174: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

174 Identificacao de sistemas - modelacao caixa preta

C.1.6.2 Serie de potencias

Numa serie de potencias as funcoes de base sao simplesmente potencias de x,

Bi(x) = xi, i = 0, 1 . . . , nl − 1 (C.27)

E um resultado conhecido do calculo elementar, que uma serie de potencias permiteobter uma boa aproximacao proximo de um ponto fixo, previamente seleccionado.A desvantagem no uso deste metodo, reside em a aproximacao ser, usualmente, po-bre longe do ponto fixo. Como as funcoes de base (C.27) sao independentes dosparametros, pode ser usada a regressao linear para estimar os parametros a partir dosdados.

C.1.6.3 Polinomios de Chebyshev

Se for desejavel uma aproximacao polinomial da nao linearidade, os polinomios deChebyshev podem ser uma escolha mais adequada que a serie de potencias. Nestecaso, as funcoes de base sao definidas como segue:

Bk(x) = cos((k − 1) arccos x), k = 1, . . . , nl (C.28)

−1 −0.5 0 0.5 1−1

−0.5

0

0.5

1

x

Ti(x), i=1,...,6

Figura C.2: Polinomios de Chebyshev de primeira especie. Estes polinomios saoortogonais no intervalo [−1, 1].

A Figura C.2 mostra exemplos de polinomios de chebyshev de primeira especie. Ospolinomios de Chebyshev sao interessantes porque obedecem a chamada propriedade“minimax”: entre todos os polinomios monicos de grau n, os polinomios de Chebyshevapresentam a menor norma maxima no intervalo [−1, 1]. Em geral, esta caracterısticapermite que a aproximacao por polinomios de Chebyshev apresente menor oscilacaodo que a aproximacao, por exemplo, por serie de potencias.

Page 175: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

C.1.6.4 B-splines

As splines sao tambem conhecidas como polinomios “aos pedacos”: um dado numerode polinomios unidos nos chamados nos. Uma spline de primeira ordem e uma funcaoconstante por intervalos. Uma spline de segunda ordem e uma funcao contınua e linearpor intervalos. Se os “pedacos” sao polinomios de ordem n (e a spline de ordem n+1),podem ser unidos para formar uma funcao com derivada contınua ate a ordem n− 1.Neste trabalho foram usadas splines lineares, tambem designadas por B-splines. Umafuncao de base deste tipo e dada, explicitamente, por:

Bi(x) =

0 se x < xi−1x− xi−1

xi − xi−1

se xi−1 ≤ x < xi

xi+1 − x

xi+1 − xi

se xi ≤ x < xi+1

0 se xi+1 ≤ x

(C.29)

em que os pontos xi sao os nos. Se os nos forem seleccionados/determinados previ-amente, a parametrizacao (C.26), corresponde a uma combinacao linear das funcoesde base e por isso pode ser usada a regressao linear para estimar os parametros. Oespacamento dos nos nao tem que ser uniforme. Normalmente, e desejavel seleccionarmais nos nas regioes onde o grafico da funcao muda rapidamente. Obviamente, namaior parte dos casos de interesse, a funcao e desconhecida e por isso nao se podeseguir este raciocınio. Uma forma de contornar o problema e estimar tambem os nos.Isto fara com que a estrutura seja mais flexıvel, mas simultaneamente, vai complicaro problema de identificacao. Uma boa referencia sobre splines e a sua utilidade naaproximacao de funcoes e Lancaster e Salkauskas (1986).

C.1.6.5 Redes neuronais

O conceito de redes neuronais e baseado no uso de funcoes de base, sendo que a maiscomum e a funcao sigmoidal. A funcao de base sigmoidal pode ser dada pela seguinteequacao:

Bk(x) =1

1 + e−(α0k+x α1k)(C.30)

A funcao de base tem dois parametros internos: α1k, determina a rapidez da transicaode 0 para 1 e α0k a localizacao da transicao.

Page 176: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

176 Identificacao de sistemas - modelacao caixa preta

Page 177: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

Apendice D

Lema Tecnico Chave

A analise da convergencia e da estabilidade de alguns algoritmos de controlo adap-tativos apresentados neste trabalho e realizada tendo por base o seguinte resultadofundamental. Este lema e usado de forma recorrente no Capıtulo 4.

Lema D.1 (Lema Tecnico Chave). Dadas as sucessoes

s(t) (escalar)σ(t) (vectorial)

b1(t), b2(t) (escalares),

se forem validas as seguintes hipoteses:

(H1)

limt−→+∞

s2(t)

b1(t) + b2(t) σ>(t) σ(t)= 0

(H2) Condicao de limitacao uniforme:

0 < b1(t) < k < ∞0 ≤ b2(t) < k < ∞ ∀t≥1

(H3) Condicao de limitacao linear:

∃c1,c2∈IR+ : ||σ(t)|| ≤ c1 + c2 max0≤τ≤t

|s(τ)|

entao:

(i) limt−→+∞

s(t) = 0.

(ii) ||σ(t)|| e majorada.

Page 178: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

178 Lema Tecnico Chave

Page 179: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

Apendice E

Relacao entre a sensibilidade navariacao de parametros e o erro deestimacao

A relacao entre a sensibilidade na variacao de parametros e o erro na estimacao dosparametros pode ser demonstrada analiticamente. Comeca-se por se considerar ofuncional de custo na forma vectorial,

V =1

2(Y − Y )>(Y − Y ), (E.1)

onde Y sao as saıdas preditas.

Quando se deriva V com respeito ao vector de parametros θ, obtem-se,

∂V

∂θ

>

= −(Y − Y )>∂Y

∂θ(E.2)

Note-se que a derivada no segundo membro de (E.2) e uma matriz N × p, cujascomponentes representam o efeito de uma pequena variacao em cada parametro nasaıda do modelo. Esta matriz e designada por matriz de sensibilidade, S, isto e,

S =∂Y

∂θ(E.3)

Assuma-se que θ? representa o vector de parametros no mınimo global da superfıcieV . Recorrendo a uma expansao em serie de Taylor, apenas com termos de primeiraordem, a saıda do modelo na vizinhanca do mınimo pode ser expressa por,

Y (θ) = Y (θ?) + Sθ? (θ − θ?), (E.4)

Page 180: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

180Relacao entre a sensibilidade na variacao de parametros e o erro de

estimacao

onde Sθ? denota a matriz S avaliada no ponto mınimo. No ponto mınimo,∂V

∂θem

(E.2) e um vector nulo.

Inserindo a equacao (E.4) na equacao (E.2), obtem-se,

−∂V

∂θ= 0 = S>θ? [ Y − Y (θ?) ]− S>θ? Sθ? (θ − θ?), (E.5)

a qual pode ser reescrita de modo a fornecer a seguinte expressao para o erro deestimacao:

(θ − θ?) = (S>θ? Sθ?)−1 S>θ? ε, (E.6)

onde ε representa o vector que contem os erros residuais entre as observacoes, Y e assaıdas preditas, Y (θ?). Multiplicando (pela direita) ambos os membros da equacao(E.6) por (θ − θ?)> e aplicando o operador valor esperado, obtem-se,

P ≡ E [ (θ − θ?)(θ − θ?)> ] = (S>θ? Sθ?)−1 S>θ? E[ εε> ] Sθ?(S>θ? Sθ?)−1, (E.7)

em que P e conhecida por matriz de covariancia do erro de estimacao. Quando seassume que a sequencia dos resıduos e branca, isto e, o erro no tempo actual naoesta correlacionado com os erros passados ou futuros, entao, a matriz E[ εε> ], reduz-sea matriz identidade multiplicada pela variancia dos resıduos, σ2. Neste contexto, aequacao (E.7) pode ser dada por,

P = σ2 (S>θ? Sθ?)−1 (E.8)

A partir da equacao (E.8) pode-se inferir que cada elemento da matriz simetricaS>θ? Sθ? reflecte a alteracao na saıda do modelo que resulta de pequenas variacoes emtodos os possıveis pares de parametros. Se as variacoes num ou mais parametros naoproduzirem qualquer efeito na saıda do modelo (sensibilidade nula), entao uma ou maiscolunas e linhas de S>θ? Sθ? sera nula; como resultado, a matriz S>θ? Sθ? sera singulare ocorre a chamada “explosao” da matriz de covariancia. Note-se que mesmo queo modelo seja estruturalmente identificavel a matriz S>θ? Sθ? pode ser quase singular,desde que existam correlacoes entre linhas ou colunas da matriz. Ao inverter a matrizobtem-se valores inaceitaveis para as variancias e covariancias da matriz P , dadapor (E.8), na presenca de ruıdo branco. Em conclusao, a relacao inversa entre asensibilidade na variacao de parametros e o erro de estimacao torna-se evidente apartir da equacao (E.8): quanto mais elevada for a sensibilidade, menores vao ser asvariancias e covariancias do erro de estimacao.

Para melhor ilustrar a relacao que existe entre a sensibilidade do custo a variacoes nosparametros e o erro de estimacao veja-se a Figura E.1.

Page 181: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

Relacao entre a sensibilidade na variacao de parametros e o erro deestimacao 181

(a) (b)

J(θ1)

∆J

∆θ1 θ1

J(θ1)

∆J

∆θ1 θ1

Figura E.1: Relacao entre a sensibilidade a variacoes nos parametros e o erro deestimacao: (a) sensibilidade elevada; (b) baixa sensibilidade.

Neste caso, para facilitar a analise assume-se que o custo depende apenas de umparametro e que para os outros parametros se consideram os valores nominais. Noexemplo da Figura E.1 - (a), uma pequena variacao no parametro conduz a grande(e portanto observavel) variacao no custo, enquanto que no exemplo da Figura E.1 -(b), uma pequena variacao no custo, que pode ser provocada por erro de leitura napresenca de ruıdo, conduz a um erro de estimacao muito grande. Assumindo que naoha erro de leitura, tambem se pode interpretar que e necessario uma variacao muitogrande no parametro para produzir algum efeito na reducao do custo, o que tem comoconsequencia um erro de estimacao maior para este parametro porque o algoritmo vai“privilegiar” outros parametros que permitem reduzir mais fortemente o custo.

Page 182: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

182Relacao entre a sensibilidade na variacao de parametros e o erro de

estimacao

Page 183: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

Referencias

Amisaki, T. e Eguchi, S. (1999), ‘A comparison of methods for estimating individualpharmacokinetic parameters’, Journal of Pharmacokinetics and Pharmacodyna-mics 27(1), 103–121.

Astrom, K. J. e Wittenmark, B. (1989), Adaptive Control, Addison-Wesley, Reading,Massachusetts.

Audoly, S., Bellu, G., Dapos, Angio, L., Saccomani, M. e Cobelli, C. (2001), ‘Globalidentifiability of nonlinear models of biological systems’, IEEE Transactions onBiomedical Engineering 48(1), 55–65.

Aufderheide, B., Rao, R. e Bequette, B. (1999), Automated hemodynamic regulationwith model predictive control, in ‘Proceedings of the IEEE 25th Annual NortheastBioengineering Conference’, West Hartford, CT, pp. 73–74.

Bai, E. W. (1998), ‘An optimal two-stage identification algorithm for Hammerstein-Wiener nonlinear systems’, Automatica 34(3), 333–338.

Bai, E. W. (2002), ‘A blind approach to the Hammerstein-Wiener model identifica-tion’, Automatica 38(6), 967–979.

Bellman, R. (1971), ‘Topics in pharmacokinetics iii: Repeated dosage and impulsecontrol’, Mathematical Biosciences 12, 1–5.

Billings, S. A. e Fakhouri, S. Y. (1982), ‘Identification of systems containing lineardynamics and static nonlinear elements’, Automatica 18(1), 15–26.

Bluell, J., Jellife, R., Kalaba, R. e Sridhar, R. (1969), ‘Modern control theory andoptimal drug regimes’, Mathematical Biosciences 5, 285–296.

Boutayeb, M. e Darouach, M. (1995), ‘Recursive identification method forMISO Wiener-Hammerstein model’, IEEE Transactions on Automatic Control40(2), 287–291.

Bradlow, H., Uys, P. e Rametti, L. (1986), ‘On-line control of atracurium inducedmuscle relaxation’, Journal of Biomedical Engineering 8, 72–75.

Page 184: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

184 Referencias

Bruls, J., Chou, C. T., Haverkamp, B. R. J. e Verhaegen, M. (1999), ‘Linear andnon-linear system identification using separable least-squares’, European Journalof Control 5(1), 116–128.

Candas, B. e Radziuk, J. (1994), ‘An adaptive plasma glucose controller based on anonlinear insulin/glucose model’, IEEE Transactions on Biomedical Engineering41(2), 116–124.

Chen, Y.-S. (2001), ‘Outliers detection and confidence interval modification in fuzzyregression’, Fuzzy Sets and Systems 119(2), 259–272.

Clarke, D. W., Mohtadi, C. e Tuffs, P. D. (1987), ‘Generalized Predictive Control -part I: The Basic Algorithm; Part II: Extensions and Interpretations’, Automatica23(2), 137–160.

Davidian, M. e Giltinan, D. M. (1995), Nonlinear Models for Repeated MeasurementData, Chapman and Hall, London.

Denai, M., Linkens, D. A., Asbury, A. J., MacLeod, A. D. e Gray, M. W. (1990),‘Self-tuning PID control of atracurium-induced muscle relaxantion in surgicalpatients’, Control Theory and Applications 137, 261–272.

Fang, Y. e Chow, T. W. S. (2000), ‘Orthogonal wavelet neural networks applyingto identification of Wiener model’, IEEE Transactions on Circuits and Ssytems47(4), 591 – 593.

Gentilini, A., Frei, C., Glattfedler, A., Morari, M., Sieber, T., Wymann, R., Schnider,T. e Zbinden, A. (2001), ‘Multitasked closed-loop control in anesthesia’, IEEEEngineering in Medicine and Biology Magazine 20(1), 39–53.

Gibaldi, M. e Perrier, D. (1975), Pharmacokinetics, Marcel Dekker, New York.

Goncalves, L. F., Mendonca, T. F. e Lemos, J. M. (2004), Adaptive algorithmsfor Wiener nonlinear systems and their application to neuromuscular blockadecontrol, in ‘Proc. of the 6th Portuguese Conference on Automatic Control’, Faro,Portugal.

Goncalves, L., Mendonca, T. F. e Lemos, J. M. (2002), Identification and predictivecontrol of wiener nonlinear systems, in ‘Proc. of IEEE the 10th MediterraneanConference on Control and Automation’, Lisbon.

Goodwin, G. C. e Sin, K. S. (1984), Adaptive Filtering, Prediction and Control,Prentice-Hall, New Jersey.

Hagenblad, A. (1999), Aspects of the identification of wiener models, Technical ReportLicentiate Thesis no. 793, Department of Electrical Engineering, LinkopingUniversity, SE-581 83 Linkoping, Sweden.

Page 185: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

Referencias 185

Hunter, I. W. e Korenberg, M. J. (1986), ‘The identification of nonlinear biologicalsystems: Wiener and Hammerstein cascade models’, Biological Cybernetics55, 135–144.

Jaklitsch, R. e Westenskow, D. (1987), ‘A model-based self-adjusting two-phasecontroller for vecuronium-induced muscle relaxation during anesthesia’, IEEETransactions on Biomedical Engineering 34(8), 583–594.

Kalafatis, A. D., Wang, L. e Cluett, W. R. (1997), ‘Identification of Wiener-typenonlinear systems in a noisy environment’, IJC 66(6), 923–941.

Kansanaho, M. e Olkkola, K. (1996), ‘Performance assessment of an adaptivemodel-based feedback controller: comparison between atracurium, mivacurium,rocuronium and vecuronium’, Journal of Clinical Monitoring and Computing13, 217–224.

Kearney, R. e Westwick, D. (1997), Nonlinear identification methods for modelingbiomedical systems, in ‘2nd International Biomedical Engineering Days’.

Kerschner, H. e Kozek, M. (2001), Identification of combined patient pharmacokineticsand pharmacodynamics using neural networks, in ‘Proc. of the 4th InternationalEUROSIM 2001Congress’.

Khoo, M. C. K. (2000), Physiological Control Systems, IEEE Press Series in BiomedicalEnginnering.

Kim, S. P., Sanchez, J. C., Rao, Y. N., Erdogmus, D., Carmena, J. M., Lebedev, L. M.,Nicolelis, M. A. L. e Principe, J. C. (2006), ‘A comparison of optimal MIMO linearand nonlinear models for brain-machine interfaces’, Journal of Neural Engineering(3), 145 – 161.

Kreisselmeier, G. e Narendra, K. S. (1982), ‘Stable model reference adaptive control inthe presence of bounded disturbances’, IEEE Transactions on Automatic ControlAC-27(6), 1169–1175.

Lacy, S. L. e Bernstein, D. S. (2002), Identification of FIR Wiener systems withunknown, noninvertible, polynomial nonlinearities, in ‘Proc. of the AmericanControl Conference’, pp. 893 – 898.

Lago, P. J. A., Mendonca, T. F. e Goncalves, L. (1998), On-line autocalibration of a pidcontroller of neuromuscular blockade, in ‘Proceedings of the IEEE InternationalConference on Control Applications’, pp. 363–367.

Lancaster, P. e Salkauskas, K. (1986), Curve and Surface Fitting–An Introduction,Academic Press, London.

Laubscher, T., Heinrichs, W., Weiler, N., Hartmann, G. e Brunner, J. (1994),‘An adaptive lung ventilation controller’, IEEE Transactions on BiomedicalEngineering 41(1), 51–59.

Page 186: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

186 Referencias

Lemos, J. M. (1989), LQ Adaptive Control, PhD thesis, IST, Lisboa.

Lemos, J. M., Mendonca, T. F. e Mosca, E. (1991), ‘Long-range adaptive control withinput constraints’, International Journal of Control 54(6), 289–306.

Lemos, J. M. e Mosca, E. (1985), A multipredictor based LQ self-tuning controller, in‘Proc. of the 7th IFAC Symp. Ident. and Syst. Param. Estimation’, York, U.K.,pp. 137–142.

Lemos, J., Magalhaes, H., Mendonca, T. e Dionısio, R. (2005), ‘Control of neuromus-cular blockade in the presence of sensor faults’, IEEE Transactions on BiomedicalEngineering 52(11), 1902–1911.

Lendl, M., Geldner, G. e Unbehauen, R. (1999), Closed-loop drug infusion using neuralnetworks, in ‘Proceedings of the 1999 American Control Conference’, Vol. 5,pp. 3241 – 3244.

Lin, H.-H., Beck, C. e Bloom, M. (2004), ‘On the use of multivariable piecewise-linear models for predicting human response to anesthesia’, IEEE Transactionson Biomedical Engineering 51(11), 1876–1887.

Linkens, D. A., Menad, M. e Asbury, A. J. (1985), ‘Smith predictor and self-tuningcontrol of muscle relaxant drug administration’, Control Theory and Applications132, 212–218.

Ljung, L. (1999), System Identification: Theory for the User, Prentice-Hall.

Lovera, M. (1998), ‘Recursive subspace identification of linear and non-linear Wienertype models’, pp. 1250 – 1254.

Magalhaes, H. F. (2006), Contributions to neuromuscular blockade control, PhDthesis, Universidade do Porto, Portugal.

Mahfouf, M. e Linkens, D. A. (1998), Generalized Predictive Control and Bioenginee-ring, Taylor and Francis, London.

MATLAB, versao 7.0.1 (2004), The MathWorks, Inc., Natick, Massachusetts.

Mendonca, T., Magalhaes, H., Lago, P. e Esteves, S. (2004), ‘Hipocrates: a robustsystem for the control of neuromuscular blockade’, Journal of Clinical Monitoringand Computing 18(4), 265–273.

Mendonca, T. F. (1992), Metodos e algoritmos para o controlo de sistemas biologicos:aplicacao ao controlo do bloqueio neuromuscular, PhD thesis, Universidade doPorto, Portugal.

Mendonca, T. F., Lemos, J. M. e Lago, P. (1989), Long-range adaptive control ofmuscle relaxation, in ‘Proceedings of the IFAC-BME Workshop on DecisionSupport for Patient Management: Measurement and Modelling and Control’,pp. 231–241.

Page 187: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

Referencias 187

Mendonca, T., Lago, P., Magalhaes, H., Neves, A. J. e Rocha, P. (2002), On-linemultiple model switching control implementation: A case study, in ‘Proc. of the10th Mediterranean Conference on Control and Automation’, Lisbon.

Mosca, E. (1995), Optimal, Predictive and Adaptive Control, Prentice-Hall, NewJersey.

Narendra, K. S. e Gallman, P. G. (1966), ‘An iterative method for the identificationof nonlinear systems using a Hammerstein model’, IEEE Trans. Autom. Control11, 546–550.

Nelder, J. A. e Mead, R. (1965), ‘A simplex method for function minimization’,Computer Journal 7, 308–313.

Norquay, S. J., Palazoglu, A. e Romagnoli, J. A. (1996), Nonlinear model preditivecontrol of PH neutralisation using Wiener models, in ‘Proc. of the 13th IFACWorld Congress’, Vol. M, San Francisco, USA, pp. 31–36.

Nunes, C., Mendonca, T., Amorim, P., Ferreira, D. e Antunes, L. (2005), Comparisonof Neural Networks, Fuzzy and Stochastic Prediction Models for return ofconsciousness after general anesthesia, in ‘Decision and Control, 2005 and2005 European Control Conference. CDC-ECC ’05. 44th IEEE Conference on’,pp. 4827–4832.

Pajunen, G. (1992), ‘Adaptive control of Wiener type nonlinear systems’, Automatica28(4), 781–785.

Parker, R. S. e Doyle, F. J. (2001), ‘Control-relevant modeling in drug delivery’,Advanced Drug Delivery Reviews 48, 211–228.

Pearson, R. K. e Pottmann, M. (2000), ‘Gray-box identification of block-orientednonlinear models’, Journal of Process Control 10, 301–315.

Quaglini, V., Previdi, F., Contro, R. e Bittanti, S. (2002), ‘A discrete-time nonlinearwiener model for the relaxation of soft biological tissues’, Medical Engineering &Physics 24(2002), 9 – 19.*www.elsevier.com/locate/medengphy

Rao, R., Aufderheide, B. e Bequette, B. (2003), ‘Experimental studies on multiple-model predictive control for automated regulation of hemodynamic variables’,IEEE Transactions on Biomedical Engineering 50(3), 277–288.

Schoukens, J., Nemeth, J. G., Crama, P., Rolain, Y. e Pintelon, R. (2003), ‘Fastapproximate identification of nonlinear systems’, Automatica 39, 1267 – 1274.*www.sciencedirect.com

Seiver, A. (2003), ‘Chaos, computers and critical care’, Critical Care Medicine31(2), 642–644.

Page 188: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

188 Referencias

Sheiner, L., Donald, M., Stanski, R., Vozeh, S., Miller, R. e Ham, J. (1979), ‘Simul-taneous modelling of pharmacokinetics and pharmacodynamics: application tod-tubocarine’, Clin. Pharmac. Theory 25, 358s–371s.

Sheiner, L., Rosenberg, B. e Melmon, K. L. (1972), ‘Modelling of individualpharmacokinetics for computed-aided drug dosage’, Computers and BiomedicalResearch 5, 441–459.

Shieh, J. S., Fan, A. Z., Chang, L. W. e Liu, C. C. (2000), ‘Hierarchical rule-basedmonitoring and fuzzy logic control for neuromuscular block’, Journal of ClinicalMonitoring and Computing 16, 583–592.

Spilker, M. E. e Vicini, P. (2001), ‘An evaluation of extended vs weighted least squaresfor parameter estimation in physiological modeling’, Journal of BiomedicalInformatics 34(5), 348 – 364.

Stadler, K., Schumacher, P., Hirter, S., Leibundgut, D., Bouillon, T., Glattfelder, A. eZbinden, A. (2006), ‘Control of muscle relaxation during anesthesia: a novelapproach for clinical routine’, IEEE Transactions on Biomedical Engineering53(3), 387–398.

Voros, J. (2001), ‘Parameter identification of Wiener systems with discontinuousnonlinearities’, Systems and Control Letters 44, 363–372.

Skrjanc, I., Blazic, S. e Agamennoni, O. (2005), ‘Interval fuzzy modeling applied towiener models with uncertainties’, Systems, Man and Cybernetics, Part B, IEEETransactions on 35(5), 1092–1095.

Wait, C., Goat, V. e Blogg, C. (1987), ‘Feedback control of neuromuscular blockade:a simple system for infusion of atracurium’, Anaesthesia 42, 1212–1217.

Ward, S., Neill, E. A. M., Weatherley, B. C. e Corall, I. (1983), ‘Pharmacokinetics ofatracurium besylate in healthy patients (after a single i.v. bolus dose)’, BritishJournal of Anesthesia 55, 113–116.

Weatherley, B. C., Williams, S. G. e Neill, E. (1983), ‘Pharmacokinetics, pharmacody-namics and dose-response relashionships of atracurium administered i.v.’, BritishJournal of Anesthesia 55, 39s–45s.

Westenskow, R. D. (1986), ‘Automating patient care with closed-loop control’, MDComputing 3(2), 14–20.

Westwick, D. e Verhaegen, M. (1996), ‘Identifying MIMO Wiener systems usingsubspace model identification methods’, Signal Processing 52, 235–258.

Wiener, N. (1958), ‘Nonlinear problems in random theory’, Cambridge MIT PressResearch Monographs.

Page 189: Lio Fidalgo Gon»calves - INESC-ID · Miranda Lemos, agrade»co o apoio, a orienta»c~ao e a amizade. O caminho seguido at¶e concluir esta tese n~ao foi uma linha recta, mas mantiveram

Referencias 189

Wigren, T. (1993), ‘Recursive prediction error identification using the nonlinearWiener model’, Automatica 29(4), 1011–1025.

Zhu, Y. (1999), Parametric Wiener model identification for control, in ‘14th WorldCongress of IFAC’, Beijing, China, pp. 37–42.

Zhu, Y. (2002), Estimation of an N-L-N Hammerstein-Wiener model, in ‘15th TriennialWorld Congress of the International Federation of Automatic Control’, Barcelona.