SÍNTESE DE CONTROLADORES ROBUSTOS H 2 /H POR REALIMENTAÇÃO DINÂMICA DA SAÍDA PARA SISTEMAS COM INCERTEZAS POLITÓPICAS Eduardo N. Goncalves, Reinaldo M. Palhares, Ricardo H. C. Takahashi Departamento de Engenharia Elétrica Centro Federal de Educação Tecnológica de Minas Gerais Av. Amazonas 7675, 35-47, Belo Horizonte - MG - Brasil Departamento de Engenharia Eletrônica Universidade Federal de Minas Gerais Av. Antônio Carlos 6627-327-, Belo Horizonte - MG - Brasil Departamento de Matemática Universidade Federal de Minas Gerais Av. Antônio Carlos 6627-327-, Belo Horizonte - MG - Brasil Emails: eduardong@des.cefetmg.br, palhares@cpdee.ufmg.br, rtakahashi@ufmg.br Abstract This paper presents a strategy for robust H 2 /H dynamic output-feedback control synthesis, with regional pole placement, based on a multiobjective optimization algorithm applied directly in the space of controller parameters. The H 2 and H norms, computed in all polytope vertices and in worst case interior points are taken as the optimization objectives. An a posteriori LMI-based guaranteed cost computation algorithm is applied for worst-case performance assessment. Keywords Robust H 2 /H control, dynamic output feedback, regional pole placement, multiobjective optimization, non-differentiable optimization. Resumo Este artigo apresenta uma estratégia para síntese de controladores robustos H 2 /H por realimentação dinâmica da saída, com alocação regional de pólos, baseada em um algoritmo de otimização multi-objetivo aplicado diretamente no espaço de parâmetros do controlador. As normas H 2 e H, calculadas em todos os vértices do politopo e, em certos casos, em pontos interiores com pior caso, são consideradas como objetivos de otimização. Um algoritmo de cálculo do custo garantido baseado em LMI é utilizado para a determinação do desempenho. Keywords Controle robusto H 2 /H, realimentação dinâmica de saída, alocação regional de pólos, otimização multi-objetivo, otimização de funções não diferenciáveis. Introdução N A i B u i B w i i C z i D zu i D zw i, Ω i= C z2 i D zu2 i Considere o sistema LIT descrito por (2) com ẋ(t) = Ax(t) + B u u(t) + B w w(t) N z (t) = C z x(t) + D zu u(t) + D zw w(t) Ω : i, i = (3) i= z 2 (t) = C z2 x(t) + D zu2 u(t) y(t) = C y x(t) + D yw w(t) () onde x R n é o vetor de variáveis de estado, u R pu é o vetor de entrada de controle, w R pw é o vetor de entradas exógenas (tais como sinais de distúrbios, ruído de medições ou sinais de referência), z R mz é o vetor de variáveis controladas relacionadas com o desempenho H, z 2 R mz2 é o vetor de variáveis controladas relacionadas com o desempenho H 2 e y R my é o vetor de saídas medidas. As matrizes A, B u, B w, C z, D zu, D zw, C z2 e D zu2 em () variam no politopo de matrizes, i.e., T () = A B u B w C z D zu D zw C z2 D zu2 = onde N é o número de vértices do politopo, sendo = [... N o vetor que parametriza o politopo. Será utilizado o controlador por realimentação dinâmica da saída, K: K : xc = A c x c + B c y u = C c x c + D c y (4) Com este controlador, o sistema em malhafechada será: [ [ [ ẋ A + Bu D = c C y B u C c x x c B c C y A c x c [ A cl Bw + B + u D c D yw w B c D yw (5)
z = [ C z + D zu D c C y D zu C c [ x + [ D zw + D zu D c D yw w (6) z 2 = [ [ x C z2 + D zu2 D c C y D zu2 C c + [ D zu2 D c D yw w (7) Seja T (, K) a matriz de transferência de malha-fechada de w para z e T 2 (, K) a matriz de transferência de malha-fechada de w para z 2, ambas para um determinado sistema T () e um controlador K. Considere o vetor de objetivos de controle: [ max J(K) = T (, K) max T (8) 2(, K) 2 onde e 2 são, respectivamente, as normas H e H 2 do argumento. Seja Γ o conjunto de todos os controladores que satisfazem as restrições de alocação de pólos para o sistema de malhafechada: Γ K : σ(a cl (, K)) D Ω (9) sendo D C e σ( ) o espectro do argumento. O problema conceitual sendo tratado neste trabalho é descrito por: Problema do Custo Garantido H 2 /H Multi-objetivo: Encontre os controladores K que pertençam ao conjunto Pareto-ótimo Γ : Γ K Γ : K Γ J(K) J(K ) e J(K) J(K ) x c x c () Os operadores de comparação de vetores possuem os seguintes significados: x y x i y i, i e x y i x i y i. O conjunto Paretoótimo também pode ser denominado conjunto de soluções eficientes ou conjunto de soluções não dominadas (Chankong and Haimes, 983). Vários artigos tem tratado de versões aproximadas deste problema através de caracterizações por LMI (Scherer et al., 997; Takahashi et al., 24; Shimomura and Fujii, 2). Os métodos por LMI usualmente empregados para tratar dos problemas H 2 /H resultam em soluções conservadoras devido ao uso de uma única matriz de Lyapunov para lidar tanto com a desigualdade da norma H 2 como a da norma H (Scherer et al., 997). Além disso, todos os artigos apresentam soluções que são adequadas apenas para sistemas sem incertezas (ou sistema com incertezas limitadas em norma se o canal H é empregado para acomodar as incertezas do modelo, usando o teorema do ganho pequeno). Até o presente momento, não existe uma caracterização por LMI para tratar do caso de sistemas de controle por realimentação dinâmica da saída com incertezas politópicas. Isto significa que não existe um algoritmo globalmente convergente, nem mesmo um conservador, para resolver esta classe de problemas. Existem também alguns poucos artigos que tratam de versões simplificadas dos problemas multi-objetivo dos custos garantidos H 2 /H definindo problemas de otimização diretamente no espaço de variáveis do controlador (Chen et al., 995; Takahashi et al., 997; Takahashi et al., 24). Desde que a formulação do problema neste espaço se torna não convexa, não existe meios de garantir que soluções globais são encontradas com tais métodos. Uma dificuldade particular que tais métodos enfrentam é a natureza não suave das funções objetivo e das restrições, que conduzem a maioria dos algoritmos de otimização ao fracasso na busca do ótimo (Polak and Salcudean, 989). Outros algoritmos, que não são baseados no cálculo do gradiente, freqüentemente sofrem de alto custo computacional que tornam proibitivo os seus usos em problemas com um número elevado de parâmetros de otimização (Takahashi et al., 24; Chen et al., 995), ficando restritos para aplicações em projetos de controladores de baixa ordem. A maioria dos algoritmos desta classe (com exceção de (Takahashi et al., 997)) também são restritos para o caso de sistemas sem incertezas. Este trabalho apresenta uma estratégia alternativa, baseada no esquema de otimização multi-objetivo formulado no espaço de parâmetros do controlador, para tratar do problema multiobjetivo dos custos garantidos H 2 /H. As características do método proposto são: Diferentemente das formulações LMI, as soluções do conjunto Pareto-ótimo podem ser obtidas uma vez que que não existe nenhum conservadorismo intrínseco na parametrização do problema. Entretanto, como ocorre com os outros métodos no espaço de parâmetros, não existe garantia de convergência para o ótimo global. Apesar da falta de garantia de convergência, o método proposto normalmente encontra boas soluções. O algoritmo de otimização empregado aqui, adaptado de Takahashi, Saldanha, Dias-Filho and Ramírez (23), é robusto e adequado para tratar de problemas não suáveis com restrições não lineares. Este algoritmo pode tratar eficientemente de problemas com várias dezenas de variáveis. Um passo intermediário para encontrar os piores casos de normas no interior do politopo permite a otimização eficiente dos limites inferiores do vetor de objetivos. Um passo final calcula um limite superior baseado em um método por LMI para o vetor
de objetivos em todo o politopo, empregando os resultados de Palhares et al. (997), adequando o projeto resultante aos propósitos de controle robusto. 2 Procedimento de Projeto Considere o conjunto de pontos do politopo inicializado como o conjunto de seus vértices Ω: Ω : i =, j = j i, i =,...,N () Considere os pontos de pior caso no interior do politopo, dado um controlador K: (2) = arg max T 2(, K) 2 ( ) = arg max T (2) (, K) Defina agora o conjunto: Γ K : σ(a cl (, K)) D Ω (3) Será utilizado o seguinte problema auxiliar definido por: Problema Auxiliar: Dado um γ >, encontre o controlador K tal que: K = arg min max T 2(, K) 2 K sujeito a: Ω K Γ T (, K) γ (4) O procedimento de projeto proposto aqui é descrito a seguir: Procedimento de Projeto Passo Dado um γ >, resolva o Problema Auxiliar, encontrando K i K. Passo 2 Encontre (2) e ( ) para K i. Passo 3 Se T ( ( ), K i ) > γ vá para o Passo 4, senão vá para o Passo 6. Passo 4 Ω Ω (2), ( ). Passo 5 Retorne ao Passo. Passo 6 Calcule os custos garantidos para as normas H 2 e H. Estes passos são descritos em detalhes nas próximas subseções. 2. O Algoritmo Cone Elipsoidal O problema de otimização escalar associado ao problema auxiliar pode ser resolvido pelo algoritmo elipsoidal descrito pelas seguintes equações recursivas (Takahashi, Saldanha, Dias-Filho and Ramírez, 23),(Kanev et al., 23): Q k+ = β 2 ( com Q k m k x k+ = x k β (m T k Q km k ) 2 Q k β 3(Q k m k )(Q k m k ) T m T k Q km k ) (5) (6) β = n+ β 2 = n2 n 2 β 3 = 2β (7) onde x R d é o vetor de parâmetros de otimização. Seja f(x) : R d R a função objetivo e g(x) : R d R r o vetor de restrições. No método elipsoidal convencional, o vetor m k é calculado como o gradiente (ou sub-gradiente) da restrição mais violada quando x k não é uma solução factível, ou como o gradiente (ou sub-gradiente) da função objetivo quando x k é uma solução factível. Neste trabalho, o vetor m k será calculado baseado no algoritmo cone elipsoidal (CEA) proposto por Takahashi, Saldanha, Dias-Filho and Ramírez (23). Neste método, quando x k não é factível, o vetor m k será o vetor normalizado m k = m/ m calculado como a soma dos gradientes (ou sub-gradientes) das restrições ativas: f(x) se g j (x) <, j =,...,r m = r s j (x) se j g j (x) j= (8) com s j (x) = se gj (x) < g j (x) se g j (x) (9) onde (.) significa a função gradiente (ou subgradiente). O algoritmo de otimização é finalizado quando (f max f min )/f min ǫ, onde f max e f min são os valores máximo e mínimo da função objetivo nas últimas N ε iterações e ǫ é a precisão relativa requerida. 2.2 Cálculo do Pior Caso da Norma De modo a encontrar o pior caso das normas H 2 e H para as funções de transferência em malhafechada para todo o politopo, para um dado controlador K, pode-se usar um algoritmo genético para resolver os seguintes problemas de otimização scalar: δw.c. = max T 2(, K) 2 (2) sujeito a: Ω
γw.c. = max T (, K) sujeito a: Ω (2) O algoritmo genético com operador de cruzamento polarizado-real, descrito em Takahashi, Vasconcelos, Ramírez and Ktahenbuhl (23), é usado neste trabalho para resolver (2) e (2). 2.3 Cálculo dos Custos Garantidos e Restrições de Alocação de Pólos Não existe nenhuma garantia que os valores obtidos de δ w.c. e γ w.c. são o mínimo global dos problemas (2) e (2) respectivamente. De fato, este valores constituem limites inferiores para as normas de malha-fechada no interior do politopo. Os limites superiores para estas normas são obtidas por meio de cálculo dos custos garantidos H 2 e H por caracterizações LMI. O custo garantido H 2, δ c, e o custo garantido H, γ c, proposto por Palhares et al. (997), são usados neste trabalho. O conjunto de restrições de locação de pólos é definido aqui do mesmo modo que o apresentado em Chilali and Gahinet (999), usando uma caracterização LMI. 3 Exemplo Ilustrativo - Satélite Considere um satélite composto de dois corpos rígidos (corpo principal e módulo de sensores) conectados por um eixo elástico (Gahinet et al., 995) com a seguinte descrição no espaço de estados: = z 2 = + k k J J f f J J k J 2 k f J 2 J 2 f J 2 J u + J z = [ y = [ w + (22) (23) u (24) (25) onde e são os ângulos de giro do corpo principal e do módulo de sensores, u é o conjugado de controle e w é conjugado de distúrbio no corpo principal. É considerado J =, J 2 = com k e f variando nas seguintes faixas de incerteza:,9 k,4 e,38 f,4 O problema é projetar um controlador robusto por realimentação dinâmica da saída que estabeleça um compromisso entre as normas T 2 2 e T, com T, e aloca os pólos em malha-fechada λ(a cl ) na intersecção do semiplano Real(λ(A cl ))., a região do disco λ(a cl ) 2, e o setor cônico com vértice na origem λ(a cl ) 2π/3, para todos os valores possíveis dos parâmetros incertos k e f. Para este exemplo, as matrizes do controlador são relacionadas com o vetor de parâmetros de otimização x como: A c = x x 2 x 3 x 4 x 5 x 6 x 7 x 8 x 9 x x x 2 x 3 x 4 x 5 x 6 x 7 x 8 B c = x 9 x 2 x 2 x 22 x 23 x 24 C c = [ x 25 x 26 x 27 x 28 D c = [ x 29 x 3 Com as condições iniciais x = [- - - - T e Q = 4 I 3, os critérios de parada N ǫ = e ǫ =,, e γ =,, o processo de otimização levou 64, 4min (processador de 2,2GHz, 256MB de RAM), finalizando com 2522 iterações, gerando 64 soluções factíveis. A Fig. mostra a convergência da função objetivo, sendo que algumas iterações não possuem valor devido ao sistema de malha-fechada resultante não ser estável, não sendo possível calcular as normas T 2 2. Para aumentar o conjunto de soluções, e melhor caracterizar o conjunto Pareto-ótimo, basta realizar novas otimizações com diferentes valores de γ. O critério de seleção do melhor controlador é baseado no compromisso entre os custos garantidos H 2 e H. A Fig. 2 mostra os valores do custo garantido H 2, δ c, versus o custo garantido H, γ c, para as soluções não dominadas obtidas em três processos de otimização com γ,;,25;,4, representadas por *. Com base na Fig. 2, foi selecionado o controlador denominado K (s), com δ c =,962 e γ c =,432, cujas matrizes são: A c = 8, 533 8, 599 2, 742 4, 4578 2, 78 9, 78 7, 388 3, 634 2, 9268, 9539, 5368 2, 243, 6983 3, 5432 8, 5287 5, 6943 22, 336 3, 269 B c = 4, 559, 563 6, 545 37, 733 6, 3635 3, 55 C c = [ 37, 42 7, 8947 38, 4568 2, 5697 D c = [ 63, 484 35, 9976
f(xk) 5 4.5 4 3.5 3 2.5 2.5 5 5 2 25 2938 Número de iterações k Figura : Evolução da função objetivo em função do número de iterações δc 3 2.8 2.6 2.4 2.2 2.8 K (s) K 2 (s).6..2.3.4.5.6.7.8.9 γ c Figura 2: Custo garantido H 2, δ c, versus o custo garantido H, γ c, para as soluções não dominadas nos projetos do controlador geral (*) e do controlador com estrutura fixada (o) Os autovalores de A cl são apresentados na Fig. 3 para os valores de k e f variando dentro de seus limites. 3. Controlador com Estrutura Fixada Em algumas situações, pode ser desejável que o controlador tenha uma estrutura pré-definida, como por exemplo: controladores PID (possivelmente múltiplos PID s em uma configuração multi-loop ), controle decentralizado, compensadores de primeira ordem, etc. As técnicas de projeto baseadas em LMI tem dificuldades em tratar o projeto de controladores com este tipo de restrição devido ao problema de parametrização em um espaço transformado. No caso da metodologia proposta aqui, não existe tal dificuldade. Como exemplo de projeto de controlador com estrutura fixada, considere o seguinte formato para a matriz A c : A c = x x 2 x 2 x x 3 x 4 x 5 x 6 A matriz A c tem um par de autovalores complexos-conjugados x ±jx 2 determinados pelo primeiro bloco e dois outros que podem ser complexos-conjugados ou reais, determinados pelo segundo bloco. Além do formato especial para a matriz A c, a matriz C c é fixada com todos os termos iguais a. Neste caso o número de parâmetros é reduzido de 3 para 6. A otimização, com o controlador com estrutura fixada, as mesmas condições de otimização anteriores e γ =,, levou 2,min, finalizando com 943 iterações, fornecendo 87 soluções factíveis. A Fig. 2 apresenta as soluções não dominadas, com a marca o, para as soluções obtidas em três processos de otimização com γ,;,25;,4. Foi selecionado o controlador denominado K 2 (s), com δ c =,9457 e γ c =,4982, cujas matrizes são: 5, 6 6, 925 A c = 6, 925 5, 6 5, 432 3, 522 2, 3885, 2972 37, 2592 97, 344 B c = 5, 566 97, 7 9, 76 58, 893 72, 493 225, 63 D c = [ 4, 262 74, 6496 Como era de se esperar, foi verificado pela Fig. 2 que a redução do número de parâmetros livres fez com que os controladores com estrutura fixada fossem dominados pelos sem estrutura fixada para a mesma dimensão. 3.2 Mudança na região de locação de pólos Se é desejável melhorar a resposta transitória em detrimento do desempenho H 2, é necessário modificar a restrição de alocação de pólos na região semi-plano. Mudando a região semi-plano para Real(λ(A cl )),4, foi obtido o controlador K 3 (s) com os custos garantidos δ c = 3,935 e γ c =,9. A Fig. 4 apresenta a resposta ao impulso da função de transferência de malha-fechada T de w para z = baseada no controlador K 3 (s) para os valores limites de k e f. As matrizes do controlador K 3 (s) são A c = 23, 436 56, 6968 33, 378. 74, 784, 858 28, 3667 3, 483 27, 577 94, 227 4, 95 4, 293 48, 994 49, 3978 45, 8986, 572 B c = 4, 6642 256, 8573 4, 558 23, 569 68, 9552 8, 669, 763 42, 3724
C c = [ 287, 98 45, 5842 338, 93 45, 937 Imag 2 5 5 5 5 D c = [ 225, 838 42, 346 2 2 8 6 4 2 8 6 4 2 2 Real Figura 3: Autovalores de A cl com K (s) para os valores de k e f variando dentro de seus limites θ2 2.5 2.5.5 3 x 3.5 2 4 6 8 2 4 6 8 2 t(s) Figura 4: Resposta ao impulso de T baseada no controlador K 3 (s) para os valores limites de k e f 4 Conclusões A estratégia proposta mostrou ser um método válido para o projeto de controladores robustos H 2 /H por realimentação dinâmica da saída com alocação regional de pólos aplicado a sistemas com incertezas politópicas e possivelmente para controladores com restrições na estrutura. Além do caso apresentado neste artigo, a estratégia proposta foi testada com sucesso em vários outros sistemas com incertezas politópicas encontrados em referências de controle robusto, com diferentes dimensões e números de parâmetros incertos. No processo de cálculo dos custos garantidos para escolha do melhor controlador, ficou clara a necessidade do desenvolvimento de uma técnica menos conservadora de cálculo, que sempre produza resultados e que os mesmos sejam mais próximos dos custos exatos. A metodologia proposta pode também ser aplicada diretamente para o caso de sistemas de tempo discreto podendo ser considerados outros tipos de objetivos e restrições sem dificuldade. Referências Chankong, V. and Haimes, Y. Y. (983). Multiobjective Decision Making: Theory and Methodology, Elsevier, New York. Chen, B. S., Cheng, Y. M. and Lee, C. H. (995). A genetic approach to mixed H 2/H optimal PID control, IEEE Control Systems Magazine 5(5): 5 6. Chilali, M. and Gahinet, P. (999). Robust pole placement in lmi regions, IEEE Transactions on Automatic Control 44(2): 2257 227. Gahinet, P., Nemirovski, A., Laub, A. J. and Chilali, M. (995). LMI Control Toolbox: For Use with MATLAB R, The MATH WORKS Inc., Natick. Kanev, S., de Schutter, B. and Verhaegen, M. (23). An ellipsoidal algorithm for probabilistic robust controller design, System & Control Letters 49: 365 375. Palhares, R. M., Takahashi, R. H. C. and Peres, P. L. D. (997). H 2 and H guaranteed costs computation for uncertain linear systems, International Journal of Systems Science 28(2): 83 88. Polak, E. and Salcudean, S. E. (989). On the design of linear-multivariable feedback-systems via constrained nondifferentiable optimization in H- infinity spaces, IEEE Transactions on Automatic Control 34(3): 268 276. Scherer, C., Gahinet, P. and Chilali, M. (997). Multiobjective output-feedback control via LMI optimization, IEEE Transactions on Automatic Control 42(7): 896 9. Shimomura, T. and Fujii, T. (2). Multiobjective control design via sucessive over-bounding of quadratic terms, Proceedings of the 39th Conference on Decision and Control pp. 2763 2768. Takahashi, R. H. C., Palhares, R. M., Dutra, D. A. and Gonçalves, L. P. S. (24). Estimation of Pareto sets in the mixed H 2/H control problem, International Journal of Systems Science 35(): 55 67. Takahashi, R. H. C., Peres, P. L. D. and Ferreira, P. A. V. (997). Multiobjective H 2/H guaranteed cost PID design, IEEE Control Systems Magazine 7(5): 37 47. Takahashi, R. H. C., Saldanha, R. R., Dias-Filho, W. and Ramírez, J. A. (23). A new constrained ellipsoidal algorithm for nonlinear optimization with equality constraints, IEEE Transactions on Magnetics 39(3): 289 292. Takahashi, R. H. C., Vasconcelos, J. A., Ramírez, J. A. and Ktahenbuhl, L. (23). A multiobjective methodology for evaluating genetic operators, IEEE Transactions on Magnetics 39(3): 32 324.