TRABALHO: CONTROLE DE UM SISTEMA PÊNDULO-CARRO Professor: Tiago Dezuo 1 Objetivos Desenvolver técnicas de controle por variáveis de estado clássicas e ótimas, realizando comparações de desempenho entre sistemas não lineares e linearizados. 2 Informações importantes Equipes: até 3 integrantes por equipe; Formas de avaliação: 1) Relatório no formato PDF contendo a solução dos exercícios propostos na Seção 7; 2) Arguição (apresentação de simulações por parte do grupo e possíveis questionamentos). Data de entrega do relatório: até dia 28/06/2016 às 17h00 por e-mail (tiago.dezuo@udesc.br); Data da arguição: dia 29/06/2016 a partir de 07h30. 3 Introdução Um pêndulo invertido montado sobre um suporte móvel acionado a motor é mostrado na Figura 1. O controle deste tipo de sistema apresenta diversas aplicações interessantes, como: lançamento de foguetes ou mísseis, metrônomos, sismômetros, Segways (meio de transporte de duas rodas lado a lado). Mesmo o ser humano equilibrando-se em pé (parado ou em movimento) pode ser considerado um pêndulo invertido. O sistema a ser tratado neste documento é um sistema MIMO 1, pois possui duas saídas: θ(t) e p(t), que são, respectivamente, a posição angular do pêndulo com relação ao eixo vertical (superior) e a posição do centro do carrinho no eixo horizontal; e duas entradas: f (t) e τ(t), que são a força que movimenta o carrinho na horizontal (aplicada nas rodas por um motor) e o torque aplicado à haste do pêndulo (por um motor na base da mesma). Tal sistema MIMO pode ser encontrado em [1] onde é realizado controle de um sistema robótico modelado como um pêndulo invertido sobre um carrinho móvel. A posição vertical do pêndulo invertido é instável pelo fato de que ele tende a se afastar desta posição, para um lado ou para o outro, a menos que sejam aplicadas forças de controle adequadas. Considera-se aqui somente 1 Do inglês, Multiple-Input and Multiple-Output. 1
Figura 1: Sistema pêndulo-carro. o problema a duas dimensões, em que o movimento do pêndulo fica restrito ao plano da página. A força de controle f (t) é aplicada ao suporte móvel e o torque de controle τ(t) é aplicado à base da haste. Os parâmetros do sistema e seus valores adotados para simulação, obtidos em [2], são apresentados na Tabela 1. Parâmetro Valor Massa do carrinho M 0.5 kg Massa do pêndulo m 0.2 kg Coeficiente de atrito do carrinho b 0.1 N.s/m Comprimento até o centro de massa do pêndulo l 0.3 m Momento de inércia da massa do pêndulo J 0.006 kg.m 2 Aceleração da gravidade g 9.81 m/s 2 Tabela 1: Dados do sistema pêndulo-carro adotado. O momento de inércia do pêndulo com relação à sua base, apresentado na Tabela 1, também pode ser obtido pela seguinte relação: J = ml2 (1) 3 2
4 Modelo não linear do sistema O modelo do sistema pode ser representado pelas equações diferenciais a seguir, onde a dependência do tempo nas variáveis θ, p, f, τ é omitida. (M + m) d2 d2 (p) + bṗ + ml (senθ) = f (2) dt2 dt2 J d2 d2 (θ) + ml cosθ dt2 dt 2 (p) + ml2 cosθ d2 dt 2 (senθ) mgl senθ ml2 senθ d2 (cosθ) = τ (3) dt2 A modelagem do sistema 2 pode ser conferida com mais detalhes em [2], [4], atentando-se ao fato de que a escolha do referencial para θ pode levar a modelos diferentes. Sabendo que e substituindo (4) e (5) em (2) e (3), tem-se d 2 dt 2 (senθ) = θ cosθ θ 2 senθ (4) d 2 dt 2 (cosθ) = θ senθ θ 2 cosθ (5) (M + m) p = bṗ ml θcosθ + ml θ 2 senθ + f (6) J θ = mlcosθ p + mglsenθ τ (7) Finalmente, resolvendo o sistema de equações para p e θ, tem-se o seguinte modelo não linear: p = 1 [ bj ṗ gm 2 l 2 cosθsenθ + J ml θ 2 senθ + J f + mlcosθτ ] Φ(θ) (8) θ = 1 [ ml bcosθ ṗ + (M + m)mgl senθ m 2 l 2 θ 2 cosθsenθ ml cosθ f (M + m)τ ] Φ(θ) (9) onde Φ(θ) = J(M + m) (ml cosθ) 2 (10) 5 Modelo linearizado A linearização do sistema em torno do equilíbrio é feita considerando pequenos ângulos θ, e, portanto, cosθ 1 (11) senθ θ (12) Substituindo (11) e (12) nas Equações (2) e (3) e resolvendo para p e θ, tem-se o seguinte modelo linearizado do sistema: p = 1 φ [ bj ṗ gm 2 l 2 θ + J f + mlτ ] (13) θ = 1 [ml bṗ + (M + m)mgl θ ml f (M + m)τ] (14) φ 2 A operação deste sistema com diferentes técnicas de controle pode ser conferido em [3]. 3
onde φ = J(M + m) (ml) 2 (15) As mesmas equações para o modelo linearizado podem ser obtidas substituindo (11) e (12) nas Equações (8) e (9) e levando em conta que θ 0. Considerando p, ṗ, θ, θ como variáveis de estado, a representação do sistema em espaço de estados fica dada por: com 6 Limitações do sistema { ẋ = Ax + Bu y = Cx + Du A =, x = p ṗ θ θ, u = [ f τ 0 1 0 0 0 bj/φ gm 2 l 2 /φ 0 0 0 0 1 0 ml b/φ mgl(m + m)/φ 0 0 0 B = J/φ ml/φ 0 0 ml/φ (M + m)/φ [ ] 1 0 0 0 C = 0 0 1 0 [ ] 0 0 D = 0 0 ] (16) (17) (18) O modelo não linear do sistema apresenta não linearidades adicionais, que são limitações no movimento do carro, do pêndulo e nas forças aplicadas 3. Para a posição do carro temos (19) (20) p lim p p lim (21) onde p lim = 0.5. Na prática, isso significa que o carro pode mover-se sobre um trilho de comprimento limitado. Outra limitação é referente ao ângulo do pêndulo. Como o controle é baseado no modelo linearizado do pêndulo, o ângulo deve ficar sempre pequeno. Considere que θ lim θ θ lim (22) onde θ lim = 0.35 rad (aproximadamente 20 ). Os sinais de controle são a força e o torque, gerados na prática por um motor elétrico, por exemplo. Por razões físicas, a força e o torque ficam limitados ao intervalo 4 f lim f f lim (23) 3 No modelo linearizado, tais limitações são desconsideradas. 4 Incluir uma saturação nos sinais de controle f e τ do sistema não linear em simulação. Para a limitação em p, apenas observar em simulação se os valores ultrapassam o limite. 4
τ lim τ τ lim (24) onde f lim = τ lim = 0.3. Isso significa que o controle aplicado ao sistema será diferente do calculado quando os sinais de controle estão fora do intervalo acima. 7 Exercícios de simulação 1) Realimentação de estados com alocação de polos. a) Escolha um ponto de equilíbrio para o sistema do pêndulo-carro e obtenha o modelo linearizado. O sistema é estável em malha aberta? É controlável? É observável? b) Projete uma realimentação de estados de tal forma que os polos de malha fechada sejam tais que a maior constante de tempo do sistema seja de 1 segundo. Não usar a função place. Utilize como condição inicial x 0 = [0.5 0 0.3 0]. Simule o sistema no Simulink e verifique, tanto para o caso linear como não linear, se após cinco constantes de tempo o equilíbrio é atingido. Observe a saturação nos sinais de controle (força e torque), presente no sistema não linear, e comente sua influência no tempo de acomodação do sistema. c) Para o mesmo conjunto de polos escolhidos no item (b), calcule a matriz de ganhos usando a função place. Os resultados são os mesmos? d) Usando a função place, escolha a matriz de ganhos de realimentação de estados de tal forma que os polos dominantes de malha fechada sejam 0.5 ± 0.5i. Verifique se os sistemas linear e não linear atingem o equilíbrio após cinco constantes de tempo e se existe saturação nos atuadores para a condição inicial x 0 definida no item (b). e) Repita o exercício anterior, mas escolha os polos de tal forma que o tempo de acomodação (tempo de 5%) seja inferior a 4 segundos. Comente sobre as diferenças do sistema linear e não linear. O sistema ficou saturado? Se sim, o que poderia ser feito para evitar a saturação? f) É possível controlar o sistema apenas com o sinal de entrada f (considerando τ = 0)? Justifique. 2) Observadores de estados. a) Considere o sistema do do pêndulo-carro. Projete uma realimentação de estados do tipo u = Kx, onde x é o estado real não disponível, de tal forma que o sistema fique estável e a maior constante de tempo do sistema seja de 1 segundo. Na sequência projete um observador de ordem completa para o sistema linearizado e troque a lei de controle u = Kx por u = Kx f onde x f é o estado estimado. Utilize como condição inicial do sistema e do observador x 0 = x f (0) = [0.5 0 0.3 0]. Verifique o erro do estado estimado em comparação com estado real para os sistemas linear e não linear. Comente os resultados para observador lento e rápido. b) Repita a experiência anterior, considerando condições inicias diferentes para o observador e o sistema (suponha x f (0) = 0). Observe a dinâmica do erro de estimação para os sistemas linear e não linear em duas situações: i) constantes de tempo do erro de estimação duas vezes mais rápidas que a do sistema em malha fechada; ii) constantes de tempo do erro de estimação dez vezes mais rápidas que a do sistema em malha fechada. 5
Analise os resultados obtidos. c) Repita o exercício anterior (itens (i) e (ii)) considerando agora a existência de ruídos de medida. Considere condições iniciais nulas do observador e do sistema (x 0 = x f (0) = 0) e observe que nessas condições o erro de estimação é o próprio estado estimado. Analise o efeito dos seguintes sinais de ruído nos medidores: A) Um sinal aleatório de medida nula e variância de 0.1 em cada medidor. Comente a influência do ganho do observador na variância do estado estimado; B) Um sinal senoidal com frequência ajustável (utilize 2π/5 e 4π) e amplitude de 0.1. Como você explicaria a atenuação do ruído nas altas frequências e a amplificação da amplitude do erro de estimação provocada pelo ganho do observador? d) Suponha que os ganhos dos atuadores não sejam bem conhecidos, e que o modelo do sistema seja na realidade ẋ = Ax+(B+ B)u onde B é a matriz nominal e B uma matriz de incerteza que define a variação máxima de cada ganho em relação ao seu valor nominal. B não é conhecida, mas seus elementos podem assumir qualquer valor em uma faixa conhecida. Seria possível obter erro nulo nesse caso? A dinâmica do erro de estimação é independente do sinal de controle? e) É possível controlar o sistema medindo apenas o estado da posição do carrinho p? Justifique. 3) Controle ótimo (LQR). Referências a) Considere o sistema pêndulo-carro linearizado num ponto de equilíbrio e suponha que podemos medir todos os estados e que as condições iniciais do sistema são nulas. Suponha ainda que o sinal de referência seja um sinal constante r(t) = [0.4 0.2] e defina a lei de controle u(t) = Kx(t)+r(t). Projete um controlador LQR para atingir os seguintes requisitos na resposta: i) O tempo de acomodação deve ser inferior a 5 segundos e o erro em regime permanente do modelo linearizado deve ser nulo; ii) A ação de controle (força e torque) não deve ultrapassar, em módulo, 0.2 unidades; iii) A posição do carrinho deve ficar limitada, em módulo, a 0.2 unidades. b) Utilize na realimentação a metade do ganho calculado anteriormente e verifique se o sistema continua estável. c) Repita o item (a) usando apenas as variáveis medidas na ponderação dos estados, isto é, a matriz de ponderação dos estados é tal que x Qx = x C Q 0 Cx = y Q 0 y onde Q 0 é a matriz de ponderação do vetor y que deve ser ser escolhida. Considere dois casos para a matriz C. Primeiro considere que y = Cx representa as medidas dos estados x 1 e x 3. No segundo caso considere que os estados medidos são o x 1 e x 4. d) O controle LQR pode ser utilizado em sistemas que apresentam polos não controláveis? Justifique. [1] E. Doskocz, Y. Shtessel, and C. Katsinis. MIMO sliding mode control of a robotic pick and place system modeled as an inverted pendulum on a moving cart. In Proceedings of the Thirtieth Southeastern Symposium on System Theory, pages 379 383, Morgantown, EUA, Março 1998. 6
[2] CONTROL TUTORIALS FOR MATLAB & SIMULINK. Inverted pendulum: System modeling. http://ctms.engin.umich.edu/ctms/index.php?example=invertedpendulum& section=systemmodeling, 2012. Acessado em: 14/05/2016. [3] J. A. Kypuros. Inverted pendulum control system. http://dsc.utpa.edu/virtuallab/ Pendulum/Pendulum.html, 2013. Acessado em: 14/05/2016. [4] K. Ogata. Engenharia de Controle Moderno. UFV, 4 edition, 2003. 7