Controlo em Espaço de Estados Professor Catedrático: João Miranda Lemos

Documentos relacionados
Realimentação e Observador no Espaço de Estados Revisão

Estimadores ou Observadores de Estado

5. Síntese de leis de controlo usando técnicas polinomiais

Realimentação de Estado Sistemas SISO

Cap.2. Representação de Estado e Controlabilidade

FUNDAMENTOS DE SISTEMAS LINEARES PARTE 2

Observabilidade, Decomposição Canônica

EES-49/2012 Correção do Exame. QBM1 Esboce o diagrama de Nyquist para a seguinte função de transferência:

X. MÉTODOS DE ESPAÇO DE ESTADOS

ANÁLISE DE SISTEMAS LINEARES NO ESPAÇO DE ESTADOS

Álgebra Linear. Determinantes, Valores e Vectores Próprios. Jorge Orestes Cerdeira Instituto Superior de Agronomia

Ficha de Exercícios nº 3

Análise Dinâmica de Sistemas Mecânicos e Controle

14 Estimador assintótico

Controlabilidade. Uma representação (ou realização) de um sistema dinâmico no espaço de estados:

Cap. 3 - Observabilidade e desacoplamento da Saída

Estabilidade de sistemas de controle lineares invariantes no tempo

Controlo Em Espaço de Estados. Trabalho de Laboratório nº 3

Modelagem de Sistemas de Controle por Espaço de Estados

Análise e Processamento de Bio-Sinais. Mestrado Integrado em Engenharia Biomédica. Sinais e Sistemas. Licenciatura em Engenharia Física

Capítulo 8: Estado. Samir A. M. Martins 1. Programa de Pós-Graduação em Engenharia Elétrica Associação ampla entre CEFET MG e UFSJ

Controlabilidade. Uma representação (ou realização) de um sistema dinâmico no espaço de estados:

Modelação e Simulação 4.Sistemas lineares Sistemas lineares

Teoria de Sistemas Lineares I

Retroacção Linear de Variáveis de Estado

5 a Lista de Exercícios de Introdução à Álgebra Linear IMPA - Verão Encontre os autovalores, os autovetores e a exponencial e At para

Álgebra Linear e Geometria Anaĺıtica. Matrizes e Sistemas de Equações Lineares

Controle utilizando variáveis de estado - v1.1

Mestrado Integrado em Engenharia Electrotécnica e de Computadores Controlo em Espaço de Estados

EES-20: Sistemas de Controle II. 31 Julho 2017

Controlo Em Espaço de Estados. Trabalho de Laboratório nº 2

Valores e vectores próprios

EES-20: Sistemas de Controle II. 21 Agosto 2017

Análise Complexa e Equações Diferenciais 1 ō Semestre 2016/2017

= f(0) D2 f 0 (x, x) + o( x 2 )

SEM Sistemas de Controle. Aula 4 - Controladores PID, Avanço, Atraso, Esp. Estados

MODELAÇÃO E SIMULAÇÃO MEEC IST, TESTE N0.1 TIPO V02. Consider o sistema dinâmico descrito pela equação diferencial

Definição (6.1): Definimos equação diferencial como uma qualquer relação entre uma função e as suas derivadas.

Sumário. CAPÍTULO 1 Introdução 1. CAPÍTULO 2 Terminologia dos Sistemas de Controle 14

Sistemas Dinâmicos Lineares

ANÁLISE COMPLEXA E EQUAÇÕES DIFERENCIAIS. Apresente e justifique todos os cálculos

Aulas práticas de Álgebra Linear

Análise Complexa e Equações Diferenciais Guia 9 João Pedro Boavida. 23 a 30 de Novembro

étodos uméricos SISTEMAS DE EQUAÇÕES LINEARES (Continuação) Prof. Erivelton Geraldo Nepomuceno PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA

Fundamentos de Controlo

Modelação, Identificação e Controlo Digital

Redução de Múltiplos Subsistemas. Carlos Alexandre Mello. Carlos Alexandre Mello 1

Parte II. Análise funcional II

1. Realimentação de Estado: sistemas MIMO

1ā lista de exercícios de Sistemas de Controle II

Aula 8. Cristiano Quevedo Andrea 1. Curitiba, Abril de DAELT - Departamento Acadêmico de Eletrotécnica

Exponencial de uma matriz

Autovalores e Autovetores

Estabilidade. Samir A. M. Martins 1. Programa de Pós-Graduação em Engenharia Elétrica Associação ampla entre UFSJ e CEFET MG

Métodos Não Paramétricos

Convergência em espaços normados

Estabilidade de sistemas de controle lineares invariantes no tempo

Métodos Não Paramétricos

ALGEBRA LINEAR 1 RESUMO E EXERCÍCIOS* P1

ESPAÇO DE ESTADOS. Capítulo 4. Objectivos do capítulo. Espaço de estados Plano de fase Estabilidade. Sistemas não lineares.

Matrizes hermitianas e unitárias

Estabilidade entrada-saída (externa).

Capítulo 3. Função de transferência e dinâmicas dos sistemas (Parte D, continuação)

INTRODUÇÃO AOS MÉTODOS NUMÉRICOS. Solução de Sistemas Lineares

Estabilidade. 1. Estabilidade Entrada-Saída Sistemas LIT. 2. Estabilidade BIBO Sistemas LIT. 3. Estabilidade BIBO de Equações Dinâmicas Sistemas LIT

Equações Diofantinas + = polinómios conhecidos polinómios desconhecidos

MAE125 Álgebra Linear /1 Turmas EQN/QIN

LISTAS DE EXERCÍCIOS PTC Controle Linear Multivariável (Pós-Graduação) Prof. Paulo Sérgio Pereira da Silva

-GNE219 - Controle em Espaço de Estados

DAS 5142 Sistemas Dinâmicos

Instituto Superior de Engenharia de Lisboa Engenharia Informática e de Computadores

Cálculo Diferencial e Integral 2 Formas Quadráticas

Mini-teste 1 (Licenciatura em Matemática) 12/01/2007 Duração: 15 mn (Sem consulta)

ANÁLISE COMPLEXA E EQUAÇÕES DIFERENCIAIS AULA TEÓRICA DE MAIO DE 2017

Exercício: Identifique e faça um esboço do conjunto solução da. 3x xy + y 2 + 2x 2 3y = 0

COMPENSAÇÃO CP s(s+2)(s+8) CP1- Dada a FT em malha aberta G(s) = de um sistema com realimentação

EES-49/2012 Prova 1. Q1 Dado o seguinte conjunto de equações:

Valores e vectores próprios

(2008/2009) Espaços vectoriais. Matemática 1º Ano - 1º Semestre 2008/2009. Mafalda Johannsen

Parte 3 - Produto Interno e Diagonalização

2 - Modelos em Controlo por Computador

Aula 05 Transformadas de Laplace

Aula 05 Transformadas de Laplace

Capítulo 2 Dinâmica de Sistemas Lineares

7. Controlo Adaptativo

Sistemas de Controle 1

Sistemas de Equações Diferenciais Lineares

SISTEMAS REALIMENTADOS

Parte 1 - Matrizes e Sistemas Lineares

Introduzir os conceitos de base e dimensão de um espaço vetorial. distinguir entre espaços vetoriais de dimensão fnita e infinita;

Erros de Estado Estacionário. Carlos Alexandre Mello. Carlos Alexandre Mello 1

- identificar operadores ortogonais e unitários e conhecer as suas propriedades;

Álgebra Linear /2 Turma EM1 (unificada)

4. Tensores cartesianos em 3D simétricos

Estabilidade Interna. 1. Estabilidade Interna. 2. Análise de Estabilidade Segundo Lyapunov. 3. Teorema de Lyapunov

TRANSFORMADA DE LAPLACE E OPERADORES LINEARES

ALGA I. Representação matricial das aplicações lineares

EXAMES DE ANÁLISE MATEMÁTICA III

Transcrição:

Instituto Superior Técnico Controlo em Espaço de Estados Professor Catedrático: João Miranda Lemos Resumo da Teoria João Paulo Silva, 73411, MEAer Lisboa, Março de 2015

Conteúdo 1 Modelo de Estado de Sistemas Lineares Contínuos 1 11 Equações do Modelo de Estado de Sistemas Lineares Contínuos 1 12 Conversão entre Modelo de Estado e Função de Transferência 2 13 Pólos e Zeros 3 14 Mudança de Coordenadas 5 15 A Equação Homogénea 6 16 Matriz de Transição 8 17 Sistemas Não Homogéneos 11 18 Modelo de estado de Sistemas Discretos 12 2 Retroacção Linear de Variáveis de Estado 13 21 Motivação para retroacção linear de variáveis de estado 13 22 Controlabilidade 14 23 Observabilidade 20 24 Influência de uma transformação linear do estado na Observabilidade 21 25 Controlabilidade e Observabilidade Conjunta 24 26 Realimentação Linear de Variáveis de Estado 25 27 Observadores Assimptóticos 30 28 Teorema de Separação 34 29 Seguimento de referências e efeito integral 37

1 Modelo de Estado de Sistemas Lineares Contínuos 11 Equações do Modelo de Estado de Sistemas Lineares Contínuos Objectivo: Mostrar que há um conjunto diversificado de sistemas que podem ser modelados através das equações de estado No caso geral temos: Em que as Matrizes são: ẋ(t) = Ax(t) + Bu(t) x(0) = x 0 y(t) = Cx(t) + Du(t) (11) A - Matriz da Dinâmica (Quadrada) - Define o comportamento dinâmico do Sistema, ie se é instável ou estável e se é rápido ou lento Essas características dependem dos Valores Próprios B - Matriz da Entrada (normalmente Matriz Coluna) - Define o modo como a entrada (actuação) afecta o estado C - Matriz de Saída (normalmente Matriz Linha) - É a relação entre o estado do sistema e a saída que se deseja escolher D - Matriz de Saída directa (normalmente Nula) - Define o modo como a entrada (actuação) afecta directamente a saída, e para sistemas causais ela é nula E que os domínios são: Estados: x(t) R n em que n = #estados (também chamada Ordem do Sistema) Entradas: u(t) R m em que m = #entradas (normalmente 1) Saída: y(t) R p em que p = #saídas (normalmente 1) Como tal as matrizes tem a seguinte dimensão: A [n x n] B [n x m] C [p x n] D [p x m] [ A B C D ] Nesta forma o Modelo em Espaço de Estados tem a seguinte representação de Diagrama de Blocos: 1

111 Espaço de Estados O vector de estados é o vector que contém todas as variáveis que representam o sistema, é ele: x 1 (t) x 2 (t) x(t) = x n (t) Podemos então definir um referencial ortogonal em R n e cujos eixos representam os n estados Assim, a forma como o sistema evolui, ie os vários valores de x(t) no tempo podem ser representados e a sua evolução é chamada de trajectória Para sistemas de ordem 2, o Espaço de Estados passa a ser o Plano de Estados: (12) 12 Conversão entre Modelo de Estado e Função de Transferência Objectivo: Após estudar este módulo, o aluno deverá ser capaz de obter as matrizes que definem o modelo de estado dada uma função de transferência e vice-versa 121 Função de Transferência Partindo do Modelo em Espaço de Estados (11) da secção anterior (a partir daqui usa-se D = 0): ẋ(t) = Ax(t) + bu(t) x(0) = x 0 y(t) = Cx(t) E aplicando a Transformada de Laplace com condições iniciais nulas então: { sx(s) = AX(s) + bu(s) O que resulta na seguinte equação: Y (s) = CX(s) (13) Y (s) = C(sI A) 1 bu(s) (14) 2

E como tal podemos converter de novo para o tempo continuo usando a Transformada de Laplace Inversa, isto é: y(t) = L 1 {C(sI A) 1 bu(s)} (15) Esta análise também permite definir a Função de Transferência (relação da entrada para a saída), que é definida como: Em que: Y (s) U(s) = G(s) = C(sI A) 1 b (16) (si A) 1 = adj(si A) det(si A) Sendo a Matriz Adjunta a Matriz dos Co-factores Transposta, isto é: adj(si A) = [M ij ] T Atenção: a solução obtida em (15) e (16) resulta do facto da condição inicial ser nula Caso isso não se verificasse então não se poderia obter uma função de transferência, e ter-se-ia ainda que: y(t) = L 1 {C(sI A) 1 [x 0 + bu(s)]} (17) 13 Pólos e Zeros Analisando a Função de transferências podemos ver os pólos e zeros Os pólos são por definição as raízes do Denominador de G(s), o chamado polinómio característico: det(si A) = 0 (18) Como tal os pólos dum Sistema em Cadeia Aberta apenas dependem da Matriz da Dinâmica Os zeros são por definição as raízes do Numerador de G(s) Cadj(sI A)b = 0 (19) Como tal os zeros dependem não só da Matriz da Dinâmica mas também das matrizes de Entrada e Saída 131 Obtenção do Modelo de Estado Tendo a Função de Transferência é possível obter o Modelo de Estado Este modelo não é único, existem infinitas realizações de Modelos, as quais podem ser obtidas umas das outras através de Transformações 3

Sistema sem Zeros: Neste caso a Função de Transferência é do tipo: G(s) = b 0 s n + a 1 s n 1 + + a n 1 s + a n (110) Assim uma realização possível é usar as Variáveis de Fase, ie começar por definir os estados (fases) como sendo: x 1 (t) = y(t) x 2 (t) = ẋ 1 (t) = ẏ(t) E como tal, a derivada da última variável de fase é dada por: x n (t) = ẋ n 1 (t) = y (n 1) (t) (111) ẋ n (t) = y (n) (t) = a 1 x n (t) a n 1 x 2 (t) a n x 1 (t) + b 0 u(t) (112) Ou seja, temos a Matriz da Dinâmica na Forma Companheira e podemos definir o Modelo de Estados da seguinte forma: ẋ(t) = E a Equação de Saída como sendo: Sistema com Zeros 0 1 0 0 0 0 1 0 0 0 0 1 a n a n 1 a 2 a 1 Neste caso a Função de transferência é do tipo: G(s) = A equação anterior é assim definida para sistemas causais x(t) + 0 0 0 b 0 u(t) (113) y(t) = [ 1 0 0 ] x(t) (114) b 1s n 1 + b 2 s n 2 + + b n s n + a 1 s n 1 + + a n 1 s + a n (115) Podemos definir o sistema como uma parte sem zeros e outra com zeros: Parte sem zeros: X(s) = 1 s n + a 1 s n 1 + + a n 1 s + a n 4

Que resulta: ẋ(t) = 0 1 0 0 0 0 1 0 0 0 0 1 a n a 2 a 1 x(t) + 0 0 0 1 u(t) (116) Parte com zeros: Y (s) = X(s) (b 1 s n 1 + b 2 s n 2 + + b n ) E como tal: y(t) = [ b n b n 1 b 2 b 1 ] x(t) (117) Note-se que no sistema com zeros a Matriz da Dinâmica manteve-se constante 14 Mudança de Coordenadas Objectivo: Dado um modelo de estado e uma transformação linear das variáveis de estado, calcular as equações do modelo de estado nas novas coordenadas Começando de novo pelo Modelo em Espaço de estados: ẋ(t) = Ax(t) + bu(t) x(0) = x 0 y(t) = Cx(t) Pode-se fazer uma Transformação de Coordenadas: Aplicando no sistema podemos chegar a: z(t) = T x(t ) ż(t) = T ẋ(t) (118) u(t) z(0) = T x(0) = T x 0 = z 0 z(t) (119) ż(t) = T } AT {{ 1 } z(t) + }{{} T b A z b z y(t) = } CT {{ 1 } C z Podemos então definir um Modelo em Espaço de Estados na forma convencional: ż(t) = A z z(t) + b z u(t) z(0) = z 0 (120) Com: y(t) = C z z(t) (121) A z = T AT 1 b z = T b C z = CT 1 z 0 = T x 0 5

141 Frequências Naturais da Transformação de Coordenadas Ao se fazer uma transformação de coordenadas seria expectável que os pólos do sistema fossem afectados Na verdade tal não acontece, isto é, os pólos (valores próprios ou frequências naturais) do sistema mantém-se constantes, como se pode demonstrar: E portanto: det(si T AT 1 ) = det(t sit 1 T AT 1 ) = det(t (si A)T 1 ) = det(t ) det(si A) det(t 1 ) = det(t ) det(si A) det(t ) = det(si A) det(si T AT 1 ) = det(si A) (122) Ou seja, as Frequências Naturais do Sistema não se alteraram pelo facto de existir uma Mudança de Coordenadas 15 A Equação Homogénea Objectivo: Apresentar a estrutura da solução da equação homogénea Relaxando o Modelo do Sistema contendo apenas a Matriz da dinâmica então ficámos com um Sistema mais simples A solução desta equação desempenha um papel fundamental na solução da equação de estado A estrutura da solução depende dos valores próprios e dos vectores próprios de A Assim: ẋ(t) = Ax(t) x(0) = x 0 (123) 151 Campo de Vectores e Retrato de Fase Assumindo o vector de estados como sendo a posição no Espaço de Estados e analisando a Equação Homogénea verifica-se que se trata de um Sistema Dinâmico em que o estado no instante imediatamente seguir está na direcção definida pelo estado actual e a Matriz A Assim, a direcção tangente à trajectória no instante arbitrário t é: Podemos assim definir: ẋ = Ax(t) Campo de Vectores - Representam a direcção tangente à trajectória, isto é, ẋ = Ax(t) São as setas a verde Retrato de Fase - Infinitas linhas que vem desde todas as arbitrárias condições iniciais até ao estado final As linhas nunca se tocam (Principio da invariância no tempo) Da solução da equação homogénea resulta que o estado final só pode ser 0 ou São as linhas a azul 6

152 Valores e Vectores Próprios Sendo A quadrada [n x n] então podemos chegar à seguinte igualdade: Av i = λ i v i (124) Em que v i também se podem chamar vectores de modo Geralmente existem (podem não existir) n vectores próprios linearmente independentes Caso existam podemos usar a Diagonalização de Matrizes para resolver a Equação Homogénea (já veremos a seguir) Valores Próprios: λ i são as soluções de det(λ i I A) = 0 Vectores Próprios: v i são as soluções de (λ i I A)v i = 0 (são definidos a menos de uma razão de normalização) 153 Diagonalização de Matrizes Tendo n vectores próprios linearmente independentes então é possível definir a Matriz Modal [n x n] que tem inversa: M = [ v 1 v n ] (125) E tendo também n valores próprios podemos definir uma Matriz Diagonal [n x n] que tem os valores próprios na sua diagonal: Assim sendo podemos escrever: Λ = diag(λ 1,, λ n ) (126) AM = MΛ { A = MΛM 1 Λ = M 1 AM (127) 154 Solução da Equação Homogénea por Diagonalização Ao Modelo da Equação Homogénea podemos fazer uma transformação particular, isto é, fazer uma transformação em que se roda as Coordenadas para as Coordenadas Ortogonais definidas pelos vectores próprios, isto é: Como Vem: x(t) = Mz(t) z(t) = M 1 x(t) (128) ż(t) = M 1 ẋ(t) = M 1 Ax(t) = M 1 AMz(t) Em que Λ é a Matriz Diagonal que contém os Valores Próprios ż(t) = Λz(t) (129) 7

Ficamos então com um sistema mais simples, que facilmente pode ser resolúvel: { ż 1 (t) = λ 1 z 1 (t) ż n (t) = λ n z n (t) Cuja solução (que depende das condições iniciais) é dada por: (130) Logo nas coordenadas x vem: Ou seja: { z 1 (t) = k 1 e λ 1t (131) z n (t) = k n e λnt x(t) = Mz(t) = [ v 1 v n ] k 1 e λ 1t k n e λnt (132) Em que temos os n Modos do Sistema: x(t) = k 1 v 1 e λ 1t + + k n v n e λnt = v i e λ it n k i v i e λ it i=1 (133) 16 Matriz de Transição Objectivo: A solução da equação homogénea como uma transformação do estado associada à matriz de transição Principais propriedades da matriz de transição Continuando a análise da Equação Homogénea: ẋ(t) = Ax(t) x(0) = x 0 Podemos definir uma Matriz de Transição, que leva o estado desde o estado inicial, t 0, até ao estado arbitrário t: x(t) = Φ(t, t 0 )x 0 (134) Pode-se provar que a Matriz de Transição obedece a: Série de Peano-Baker Φ(t, t 0 ) = I + A(t to) + 1 2! A2 (t t 0 ) 2 + = + k=0 A k (t t 0 ) k k! (135) 8

Exponencial de Matriz Φ(t, t 0 ) = e A(t t 0) (136) Pois: Φ(t, t 0 ) = Φ(t t 0 ) (137) Atenção: Estas propriedades aplicam-se apenas a sistemas invariantes no tempo, em que a matriz A é constante 161 Mudança de Coordenadas - Efeito na Matriz de Transição Usando a transformação habitual de x(t) para z(t): z(t) = T x(t) ż(t) = T AT 1 z(0) = z 0 = T x(0) = T x 0 Usando a Matriz de Transformação então: Logo podemos escrever: z(t) = T x(t) = T Φ(t, t 0 )x 0 = T Φ(t, t 0 )T 1 z 0 (138) }{{} Φ z(t,t 0 ) Φ z (t, t 0 ) = T Φ x (t, t 0 )T 1 (139) O que era semelhante ao encontrado nas Mudanças de Coordenadas em relação à Matriz da Dinâmica: ż(t) = } T AT {{ 1 } z(t) A z = T AT 1 A z 162 Cálculo da Matriz de Transformação usando a Transformada de Laplace Aplicando a Transformada de Laplace à Equação homogénea vem: sx(s) x 0 = AX(s) X(s) = (si A) 1 x 0 (140) E aplicando a Transformada Inversa: x(t) = L 1 {(si A) 1 } t t0 x 0 (141) Pois x 0 = cte Logo pode-se concluir que: Φ(t, t 0 ) = L 1 {(si A) 1 } t t0 (142) 9

163 Propriedades da Matriz de Transição A matriz de transição definida de estado em (134) tal que: x(t) = Φ(t, t 0 )x 0 Obedece, além das propriedades já referidas anteriormente, às seguintes propriedades: Diferenciação Identidade d dt Φ(t, t 0) = AΦ(t, t 0 ) (143) Invertibilidade da Matriz de Transição Pelo Teorema de Abel-Jacobi-Liouville (caso particular) temos: Φ(t, t) = I t (144) det(e A(t t 0) ) = e (t t 0)tr(A) (145) E como a exponencial nunca é 0 então o determinante nunca se anula e a Matriz de Transição é sempre invertível Inversa Demonstração: Φ 1 (t, t 0 ) = Φ(t 0, t) (146) Φ(t, t 0 )Φ(t 0, t) = Φ(t, t) = I Φ(t 0, t) = Φ 1 (t, t 0 ) Assim sendo, podemos sempre recuperar a condição inicial para sistemas contínuos Para sistemas discretos tal pode não ser possível Semigrupo Demonstração: Φ(t 2, t 0 ) = Φ(t 2, t 1 )Φ(t 1, t 0 ) (147) Continuidade x(t 2 ) = Φ(t 2, t 1 )x(t 1 ) = Φ(t 2, t 1 )Φ(t 1, t 0 )x(t 0 ) = Φ(t 2, t 0 )x(t 0 ) A Matriz de Transição é uma função contínua entre t e t 0 10

164 Cálculo de e At por diagonalização Usando de novo a Equação Homogénea e partindo de t 0 = 0 então temos: x(t) = e At x(0) (148) Admitindo que a Matriz da Dinâmica possui n vectores próprios linearmente independentes então já sabemos que podemos aplicar a Transformação com a Matriz Modal (é invertível) de modo a: x(t) = Mz(t) ż(t) = Λz(t) Como Λ é diagonal então existe uma propriedade da soma de séries exponenciais que diz: e Λt = I + Λt + 1 e λ 1t 0 2! Λ2 t 2 + = (149) 0 e λnt E como: Vem que: x(t) = Mz(t) = Me Λt z(0) = Me Λt M 1 x(0) (150) e At = Me Λt M 1 (151) 17 Sistemas Não Homogéneos Objectivo: Cálculo da resposta no tempo de um SLIT não homogéneo descrito pelo modelo de estado Os Sistemas Não Homogéneos são sistemas nos quais o estado não evolui livremente, isto é, não é apenas afectado pela dinâmica do sistema mas também por uma entrada No caso de sistemas não homogéneos a solução obtém-se da solução da equação homogénea tendo em conta a entrada e recorrendo ao Princípio de Sobreposição Sendo o sistema descrito pela equação de estado (11): ẋ(t) = Ax(t) + bu(t) x(t 0 ) = x 0 A evolução temporal do estado vem dado por: t x(t) = e A(t t0) x }{{} 0 + e A(t τ) bu(τ)d τ t 0 Regime Livre }{{} Regime Forçado (152) Em que se usou a fórmula da Análise Diferencial chamada Fórmula das Variação das Constantes 11

18 Modelo de estado de Sistemas Discretos Objectivo: Estudo muito abreviado da resposta no tempo de sistemas discretos representados pelo modelo de estado Para Sistemas Discretos, a Equação Homogénea vem dada por: x(k + 1) = Ax(k) x(k 0 ) = x 0 (153) Uma vez mais o estado no instante k está relacionado com o estado no instante k 0 k por um operador matricial linear (matriz de transição de estado) Então temos: x(k) = A k k 0 x 0 (154) 181 Não invertibilidade da matriz de transição no caso discreto Uma diferença com consequências do caso discreto em relação ao contínuo é que, no caso discreto, a matriz de transição pode não ser invertível (ao contrário dos sistemas contínuos em que a matriz de transição é sempre invertível) Se a matriz A for singular as suas potências também o serão Isto significa que há sistemas discretos para os quais, sabendo o estado no instante k, não podemos inferir qual a condição inicial de onde ele partiu, ao contrário dos sistemas contínuos em que isso é sempre possível 182 Solução da equação não homogénea (caso discreto) x(k) = A k k 0 x 0 }{{} Regime Livre Se as condições iniciais forem nulas então: + k 1 j=k 0 A k j 1 bu(j) }{{} Regime Forçado (155) x(k) = A k 1 bu(0) + A k 2 bu(1) + + bu(k 1) (156) Este resultado pode ser facilmente demonstrado através do Princípio de Sobreposição Conhecida a sequência de entrada e a condição inicial do estado, as expressões anteriores permitem calcular o estado no final do intervalo de tempo (quer em tempo contínuo, quer discreto) Pode naturalmente pensar-se no problema inverso Este será estudado posteriormente 12

2 Retroacção Linear de Variáveis de Estado 21 Motivação para retroacção linear de variáveis de estado Objectivo: Motivar o projecto de controladores com base no modelo de estado e apresentar os principais problemas que esta abordagem coloca, relacionando-os com os conceitos de controlabilidade e observabilidade A retroacção linear de todas as variáveis de estado permite aumentar a flexibilidade no projecto do controlador, dado que temos um procedimento sistemático para colocar os pólos da cadeia fechada Tendo o acesso ao estado podemos fazer a sua retroacção para a entrada, de modo a termos assim o comportamento desejado para a dinâmica do sistema Podemos tornar sistemas naturalmente instáveis em sistemas estáveis Podemos tornar sistemas lentos em sistemas mais rápidos, puxando os pólos para a esquerda do Plano Complexo, alterando a sua constante de tempo Também podemos alterar o factor de amortecimento de sistemas amortecidos, puxando os pólos complexos mais ou menos na direcção do eixo imaginário No entanto, algumas questões importantes podem ser levantadas: Acessibilidade do estado Será que o estado está sempre acessível? Na realidade o estado nem sempre está acessível para medida directa, por exemplo devido a limitações tecnológicas ou de custo dos sensores Pode prender-se ainda com o facto de nem sempre o estado ter uma realidade física, e como tal não consegue sequer ser medido Esta questão vai estar relacionada com a observabilidade Existência de solução das equações Será que a colocação dos pólos é sempre possível? Na maior parte dos sistemas realimentando todos os estados sim, mas isso depende também da entrada Uma entrada que só actue sobre alguns estados (portanto fraca) e que estes não tenham uma relação significativa com outros então nem sempre consegue controlar o sistema do modo que se quer, e a solução da colocação de pólos nem sempre existe Esta questão vai estar relacionada com a controlabilidade A necessidade de uma descrição interna dos sistemas Há sistemas complexos que possuem modos da dinâmica que nem sempre são observáveis a olho nu, e portanto uma descrição interna dos mesmos é necessário, de modo a clarificar questões relativas ao cancelamento de pólos e zerosisto vai conduzir-nos uma vez mais aos conceitos anteriores Os métodos para o projecto de sistemas de controlo baseados no modelo de estado nasceram nos anos 60 nos USA, associados aos problemas postos pela Engenharia Aeroespacial (a célebre aposta de Kennedy sobre a ida à Lua data desse período) Têm no entanto raízes mais antigas (e importantes) nos trabalhos de Poincaré e Lyapunov (que já consideravam problemas não-lineares) Uma boa parte dos fundamentos da teoria do controlo em espaço de estado é devida a R Kalman (que viu muitos dos seus trabalhos rejeitados em revistas de Electricidade, o que o levou a publicar em revistas de Mecânica) Na Europa o problema era diferente: Após a destruição causada pela II Guerra Mundial a prioridade ia para o desenvolvimento das indústrias de bens de consumo Aqui, ao contrário da indústria Aeroespacial, é muito difícil construir modelos de estado a partir de princípios básicos, o que levou a um maior desenvolvimento dos modelos entrada/saída Nomes como V Peterka (na Checoslováquia, onde a indústria do aço adquiriu grande importância) ou K Astrom (na Suécia, com trabalhos ligados à indústria do papel) ilustram esta afirmação A partir dos anos 80 compreendeu-se progressivamente melhor (não sem que antes tivesse havido debates acesos) que as duas abordagens são, de facto, as duas faces da mesma moeda, dando pontos de vista complementares sobre virtualmente todas as questões 13

22 Controlabilidade 221 Definição de Contrabilidade - Sistemas Contínuos Dado o Sistema habitual (11): ẋ(t) = Ax(t) + bu(t) x(0) = x 0 Será possível, partindo da origem (x(0) = 0), levar o estado a um valor especificado arbitrário por escolha conveniente das entradas? A resposta a esta questão depende do par de matrizes A e b Para sistemas contínuos a realização de estado contínua diz-se completamente controlável se: Dado um estado inicial na origem (x(0) = 0) e qualquer x f, existir um instante finito t f e uma função de entrada u(t), 0 t t f tal que x(t f ) = x f Para sistemas contínuos a definição de controlabilidade é equivalente a impor que de qualquer estado se atinja a origem num intervalo de tempo finito por escolha conveniente da entrada É esta a definição dada em [Rugh] A definição dada anteriormente é normalmente referida como atingibilidade Para sistemas contínuos as duas definições são equivalentes mas para sistemas discretos não 222 Critério de Contrabilidade - Sistemas Contínuos O sistema contínuo (11): ẋ(t) = Ax(t) + bu(t) x(0) = x 0 É completamente controlável se a Matriz de Controlabilidade tiver característica (Rank) a ordem ou dimensão n = dim(x) A Matriz de Contrabilidade é a seguinte: C [A, b] = [ b Ab A 2 b A n 1 b ] (21) Logo para o sistema ser controlável então: car (C [A, b]) = n (22) Em que car(x) é o número de vectores linearmente independentes de X Caso car (C [A, b]) = m < n então a partir da condição inicial o sistema só conseguirá atingir um susbespaço R m, de dimensão m, e contido em R n Imagine-se que n = 3 e m = 2 então o conjunto de pontos que o sistema consegue atingir no Espaço de Estados é um plano Caso m = 1 então seria uma recta e m = 0 seria um ponto, ie, o sistema não sairia da condição inicial por ser totalmente não controlável 14

Exemplo: Caso em que n = 2 mas se obtém dois valores próprios iguais (ou seja apenas um vector próprio linearmente independente) e logo m = 1: 223 Interpretação em Termos de Sistemas diagonais (Contínuo) Considerando agora um sistema diagonal (note-se que se houverem n vectores próprios linearmente independentes então podemos sempre diagonalizar o sistema através de uma transformação) tal que: ż(t) = Λz(t) + bu(t) Λ = diag(λ 1, λ 2,, λ n ) (23) Então usando a expressão (21) chegamos à Matriz de Controlabilidade: b 1 λ 1 b 1 λ 2 1 b 1 λ n 1 1 b 1 b 2 λ 2 b 2 λ 2 2 C[Λ, b] = b 2 λ n 1 2 b 2 (24) b n λ n b n λ 2 nb n λ n 1 n b n Para que esta realização de estado seja controlável, tem de ser b i 0 i para que nenhuma linha se anule e λ i λ j i j ainda para que não haja linhas proporcionais O sistema diagonal tem um diagrama de blocos do tipo: Logo: Se houver b i nulo, a entrada não afecta o respectivo estado, que não sairá da origem Se houver valores próprios iguais, os correspondentes estados serão sempre proporcionais 15

224 Definição de Contrabilidade - Sistemas Discretos Dado o Sistema habitual para o modelos discreto: ẋ(k + 1) = Ax(k) + bu(k) x(0) = x 0 A realização de estado de ordem n diz-se completamente controlável se e só se para uma condição inicial x(0) = 0 e x f qualquer, existe N finito e uma sequência de entradas: u(0), u(1),, u(n 1) Tal que x(n) = x f 225 Critério de Contrabilidade - Sistemas Discretos À semelhança dos Sistemas Contínuos, o Sistema Discreto: x(k + 1) = Ax(k) + bu(k) x(0) = x 0 É completamente controlável se a Matriz de Controlabilidade tiver característica (Rank) a ordem ou dimensão n = dim(x) A Matriz de Contrabilidade é a seguinte: Logo para o sistema ser controlável então: C [A, b] = [ b Ab A 2 b A n 1 b ] (25) car (C [A, b]) = n Em que car(x) é o número de vectores linearmente independentes de X 226 Demonstração do Critério de Contrabilidade (Discreto) Pela fórmula de variação das constantes e tendo em conta que a condição inicial é nula, o estado ao fim de N n passos vem dado por: x(n) = A N 1 bu(0) + A N 2 bu(1) + + bu(n 1) (26) Então os pontos do espaço de estados que podem ser atingidos a partir da origem são aqueles que se podem ser obtidos como combinação linear dos vectores: b, Ab,, A N 2 b, a N 1 b (27) E se seguirmos o Lema (29), então o subespaço gerado por estes vectores é igual ao subespaço gerado pelos vectores: Que são os vectores coluna da matriz de controlabilidade b, Ab,, A n 2 b, a n 1 b (28) Sendo assim, para provar o Critério precisamos primeiro de provar o Lema O que o Lema diz é que os vectores (27) e (28) geram o mesmo subespaço 16

Lema N n car [ b Ab A n 1 b A N 1 b ] = car [ b Ab A n 1 b ] (29) Como tal qualquer ponto x(n) será atingido no instante N apenas se os vectores (28) forem linearmente independentes O Lema pode ser provado tendo em conta o Teorema de Cailey-Hamilton que nos diz: Teorema de Cailey-Hamilton: Seja a(s) = det(si A) = s m + a s 1 1 + + a n o polinómio característico da matriz da dinâmica A, então: Ou seja, podemos multiplicar à direita e esquerda por b e obter: A n + a 1 A n 1 + + a n I = 0 (210) A n b + a 1 A n 1 b + + a n b = 0 (211) O que significa que A n b é combinação linear de a 1 A n 1 b + + a n b Assim sendo, por indução podemos provar para para i n que o mesmo se verifica, e portanto para N n podemos afirmar que os vectores (28) são combinações lineares de (27) e geram o mesmo subespaço 227 Controlabilidade para a origem e Controlabilidade Nos sistemas discretos os conceitos de controlabilidade para a origem (ser capaz de atingir a origem a partir de qualquer estado) e controlabilidade (ser capaz de atingir a origem a partir de qualquer estado) não são equivalentes Isto leva a que a controlabilidade como a definimos seja também designada por atingibilidade Nos sistemas contínuos os dois conceitos são equivalentes Repare-se que o critério relativo à característica da matriz de controlabilidade se refere à atingibilidade (=controlabilidade) e não à controlabilidade para a origem 228 Influência de uma transformação linear do estado na Controlabilidade Dado o sistema habitual (11): ẋ(t) = Ax(t) + bu(t) x(0) = x 0 y(t) = Cx(t) Pode-se fazer uma Transformação de Coordenadas: E chegar a: x(t) = T z(t ) ẋ(t) = T ż(t) ż(t) =T 1 AT z(t) + T bu(t) z(0) = T 1 x(0) = T 1 x 0 = z 0 y(t) =CT z(t) 17

Assim sendo, nas coordenadas z, a Matriz de Controlabilidade vem dada por: Simplificando e tendo em conta que: C[A z, b z ] = [ T 1 b T 1 AT T 1 b (T 1 AT ) n 1 T 1 b ] (212) Então: (T 1 AT ) n 1 T 1 = T } 1 AT T 1 AT {{ T 1 AT } T 1 = T 1 A n 1 n 1 vezes C[A z, b z ] = [ T 1 b T 1 Ab T 1 A n 1 b ] (213) E como T tem característica n pode sair e obtemos: C[A z, b z ] = T 1 [ b Ab A n 1 b ] (214) Ou seja: C[A z, b z ] = T 1 C[A x, b x ] (215) Logo podemos escrever: T = C[A x, b x ]C 1 [A z, b z ] (216) 229 Forma Canónica do Controlador Analisando o obtido no ponto anterior então tendo: Uma qualquer representação em espaço de estados, que permite obter C[A x, b x ] e a Função de Transferência G(s) Podemos obter a Matriz de Mudança de Coordenadas T que permite passar qualquer representação em espaço de estados para a representação na forma canónica do controlador, que torna a RLVE trivialmente mais fácil A função de transferência G(s) permite obter C[A xk, b xk ] (em que x k retrata o estado na forma canónica do controlador) e é do tipo: G(s) = b 1s n 1 + b 2 s n 2 + + b n s n + a 1 s n 1 + + a n (217) O seu modelo em espaço de estados usando as variáveis de fase do controlador vem: ẋ k (t) = a 1 a 2 a n 1 0 0 0 0 0 1 0 x k(t) + 1 0 0 u(t) (218) y(t) = [ b 1 b 2 b n ] x k (t) (219) 18

Assim sendo a Matriz de Contrabilidade no estado do controlador (sem demonstração) vem dada por: 1 a 1 a n 1 C[A xk, b xk ] = 0 1 0 0 a1 0 0 0 1 1 (220) E assim sendo a Matriz de Mudança de Coordenadas entre qualquer modelo de estado que tem uma função de transferência G(s) (única e independente do modelo escolhido) na forma (217) e o modelo de estados na forma do controlador vem dada por: 1 a 1 a n 1 T = C[A x, b x ] 0 1 0 0 (221) a1 0 0 0 1 Exemplo: Para n = 3, resulta uma função de transferência G(s) do tipo: O Diagrama de Blocos é do tipo: G(s) = b 1 s 2 + b 2 s + b 3 s 3 + a 1 s 2 + a 2 s + a 3 E a Matriz de mudança de coordenadas para a forma do controlador é: 1 a 1 a 2 T = C[A x, b x ] 0 1 a 1 x(t) = T x c (t) 0 0 1 19

23 Observabilidade 231 Definição de Observabilidade - Sistemas Contínuos Dado a realização de estado habitual (11): ẋ(t) = Ax(t) + bu(t) x(0) = x 0 Será possível determinar a condição inicial x 0 (e portanto x(t)forall t ) por observação da saída? A resposta a esta questão depende do par A, C Uma outra questão relacionada é: Como estimar o estado a partir das observações da saída? Para sistemas contínuos a realização de estado contínua diz-se completamente observável se: Existir um tempo finito t 1 : 0 < t 1 < tal que a saída y(t) para 0 t t 1 é suficiente para determinar a condição inicial do estado, x(0) 232 Critério de Observabilidade - Sistemas Contínuos O sistema contínuo (11): ẋ(t) = Ax(t) + bu(t) x(0) = x 0 É completamente observável se a Matriz de Observabilidade tiver característica (Rank) a ordem ou dimensão n = dim(x) A Matriz de Observabilidade é a seguinte: Logo para o sistema ser controlável então: O [A, C] = C CA CA n 1 (222) car (O [A, C]) = n (223) Em que car(x) é o número de vectores linearmente independentes de X 233 Interpretação em termos de sistemas diagonais Considerando agora um sistema diagonal, equação (23) (note-se que se houverem n vectores próprios linearmente independentes então podemos sempre diagonalizar o sistema através de uma transformação), tal que: ż(t) = Λz(t) + bu(t) Λ = diag(λ 1, λ 2,, λ n ) Então usando a expressão (222) chegamos à Matriz de Observabilidade: c 1 c 2 c n c 1 λ 1 c 2 λ 2 c n λ n O[A, C] = c 1 λ 2 1 c 2 λ 2 2 c n λ 2 n (224) c 1 λ1 n 1 c 2 λ n 1 2 c n λn n 1 Para que esta realização de estado seja observável, tem de ser c i 0 i para que nenhuma coluna se anule e λ i λ j i j ainda para que não haja colunas proporcionais 20

24 Influência de uma transformação linear do estado na Observabilidade Dado o sistema habitual (11): ẋ(t) = Ax(t) + bu(t) x(0) = x 0 y(t) = Cx(t) Pode-se fazer uma Transformação de Coordenadas: x(t) = T z(t ) ẋ(t) = T ż(t) E chegar a: ż(t) =T 1 AT z(t) + T bu(t) z(0) = T 1 x(0) = T 1 x 0 = z 0 y(t) =CT z(t) Assim sendo, nas coordenadas z, a Matriz de Observabilidade vem dada por: CT CT T 1 AT O[A z, C z ] = CT (T 1 AT ) n 1 Simplificando e tendo em conta que: (225) Então: T (T 1AT ) n 1 = T } T 1 AT T 1 AT {{ st 1 AT } = T A n 1 n 1 vezes O[A z, C z ] = CT CAT CA n 1 T (226) E como T tem característica n pode sair e obtemos: C CA O[A z, C z ] = T (227) CA n 1 Ou seja: Logo podemos escrever: O[A z, C z ] = O[A x, C x ]T (228) T = O 1 [A x, C x ]O[A z, C z ] (229) 21

241 Forma Canónica do Observador Analisando o obtido no ponto anterior então tendo: Uma qualquer representação em espaço de estados, que permite obter O[A x, C x ] e a Função de Transferência G(s) Podemos obter a Matriz de Mudança de Coordenadas T que permite passar qualquer representação em espaço de estados para a representação na forma canónica do observador, que torna o cálculo do ganho L do observador assimptótico trivialmente mais fácil A função de transferência G(s) permite obter O[A xo, C xo ] (em que x O retrata o estado na forma canónica do observador) e é do tipo: G(s) = bs 1 n 1 + b 2s n 2 + + b m s n + a n 1 1 + + a n (230) O seu modelo em espaço de estados usando as variáveis de fase do observador bem: ẋ O (t) = a 1 1 0 a 2 0 0 1 a n 0 0 0 x O(t) + b 1 b 2 b n u(t) (231) y(t) =[ 1 0 0]x O (t) (232) Assim sendo a Matriz de Observabilidade no estado do observador (sem demonstração) vem dada por: 1 0 0 0 a 1 1 0 0 O[A xo, C xo ] = 0 a n 1 a 1 1 1 (233) E assim sendo a Matriz de Mudança de Coordenadas entre qualquer modelo de estado que tem uma função de transferência G(s) (única e independente do modelo escolhido) na forma (217) e o modelo de estados na forma do observador vem dada por: T = 1 0 0 0 a 1 1 0 0 0 a n 1 a 1 1 1 O 1 [A x, C x ] = O[A x, C x ] 1 0 0 0 a 1 1 0 0 0 a n 1 a 1 1 1 (234) 22

Exemplo: Para n = 3, resulta uma função de transferência G(s) do tipo: O Diagrama de Blocos é do tipo: G(s) = b 1 s 2 + b 2 s + b 3 s 3 + a 1 s 2 + a 2 s + a 3 E a Matriz de mudança de coordenadas para a forma do observador é: T = O[A x, b x ] 1 0 0 a 1 1 0 a 2 a 1 1 1 x(t) = T x O (t) 23

25 Controlabilidade e Observabilidade Conjunta Continuando com a nossa intuição acerca de sistemas diagonais (equação (23)): ż(t) = Λz(t) + bu(t) Λ = diag(λ 1, λ 2,, λ n ) Podemos chegar à função de transferência do mesmo: 1 0 H(s) = C(sI A) 1 s λ 1 b = [ c 1 c n ] 1 0 Ou seja: s λ n b 1 b n (235) H(s) = O somatório terá menos de n termos se houver um i tal que: b i = 0 c i = 0 λ i repetido Perda de Controlabilidade Perda de Observabilidade n i=1 Perda de Controlabilidade e Observabilidade c i b i s λ i (236) Conclusão: Haverá cancelamento de pólos e zeros se o sistema não for controlável ou observável Este facto, que demonstrámos para sistemas diagonais, é válido em geral 251 Decomposição de Kalman Como vimos o sistema pode ser controlável e/ou observável ou nenhuma das duas Como tal existem quatro tipos tipos de sistemas O que a decomposição de Kalman diz é que, em geral, é possível levar um sistema à representação de estado: ẋ(t) = A 11 A 12 0 0 0 A 22 0 0 A 31 A 32 A 33 A 34 0 A 42 0 A 44 x(t) + b 1 0 b 3 0 u(t) (237) y(t) = [ c 1 c 2 0 0 ]x(t) (238) Em que o vector de estados é a composição dos 4 possíveis tipos de estados: E portanto, se fizermos a função de transferência, vem que: 252 Rescontructibilidade e Detectibilidade x(t) = [ x T OC x T OC xt OC xt OC ]T (239) Dois conceitos importantes relacionados com a observabilidade são: G(s) = c 1 (si A 11 ) 1 b 1 (240) Se a partir das observações da saída for possível obter o último valor do estado (mas não necessariamente a condição inicial), a realização diz-se reconstruível Se a parte não observável do estado for assimptoticamente estável, a realização diz-se detectável 24

26 Realimentação Linear de Variáveis de Estado Objectivo: Projectar um regulador de colocação de pólos por realimentação linear de todas as variáveis de estado Demonstração da fórmula de Bass-Gura 261 Projecto de um regulador por RLVE Admite-se modelo em espaço de estados habitual: ẋ(t) = Ax(t) + bu(t) x(0) = x 0 y(t) = Cx(t) Em que se considera que o sistema é controlável, observável e com o polinómio característico em Malha Aberta: Problema de Seguimento de Referência a(s) = det(si A) = s n + a 1 s n 1 + + a n (241) Uma Lei de Controlo que permite resolver o problema do seguimento de referência é: Assim sendo o sistema em Malha Fechada fica: E como tal o Diagrama de Blocos é: u(t) = r(t) Kx(t) (242) ẋ(t) = (A bk)x(t) + br(t) x(0) = x 0 y(t) = Cx(t) (243) Este problema é um pouco mais complexo que o da regulação pelo que será visto mais à frente Problema de Regulação Um problema mais simples que o do seguimento de referência é o da regulação Para Lei de Controlo vamos admitir uma simples retroacção linear (multiplicada por um ganho K) de todos os estados, de modo a que a entrada fique definida em função do estado: Em que o sinal negativo é puramente convencional u(t) = Kx(t) (244) 25

Assim sendo, em Malha Fechada temos: ẋ(t) = (A bk)x(t) x(0) = x 0 y(t) = Cx(t) (245) O objectivo desejado para o controlador é que seja capaz de respeitar a dinâmica pedida, ie, desejamos que o polinómio característico do sistema em malha fechada seja: E como tal o Diagrama de Blocos é: α(s) = s n + α 1 s n 1 + + α n (246) Dada a realimentação de estado então o polinómio característico do sistema passa a ser: a k (s) = det(si A + bk) = s n + a 1 k sn 1 + + a n k (247) Em que se usa o subscrito k para controlador Resumo: Temos assim 3 polinómios característicos diferentes: Sistema em Malha Aberta (Traduz a dinâmica do sistema sem Controlo) a(s) = det(si A) = s n + a 1 s n 1 + + a n Especificado (Traduz a dinâmica pretendida para a cadeia fechada) α(s) = s n + α 1 s n 1 + + α n Sistema em Malha Fechada (Traduz a influência do Controlador) a k (s) = det(si A + bk) = s n + a 1 k sn 1 + + a n k Assim sendo para resolver o problema é necessário igualar as equações (246) e (247), ou seja: α(s) = a k (s) (248) 26

262 Método dos Coeficientes Indeterminados Uma forma de resolver esta equação corresponde a igualar os coeficientes dos monómios do mesmo grau em ambos os polinómios Assim obtém-se o sistema de equações lineares verificado pelo ganho: a 1 k = α 1 (249) a n k = α n Este sistema tem solução quando o par (A, b) for controlável 263 Fórmula de Bass-Gura para o cálculo dos ganhos do Controlador Uma outra forma de obter os ganhos automaticamente é a chamada fórmula de Bass-Gura Esta fórmula permite o posicionamento arbitrário dos pólos da cadeia fechada caso o par (A, b) seja controlável Nestas condições o vector de ganhos é calculado por: K = (α a)m T C 1 (A, b) (250) Em que C 1 (A, b) é a Matriz de Controlabilidade (24) e: 1 0 α = [ α 1 α 2 α n ] M = a 1 1 a = [ a 1 a 2 a n ] 0 a n 1 a 1 1 Uma das consequências iniciais da fórmula de Bass-Gura é: O ganho do controlador é proporcional à diferença entre α e a (251) Isto significa que quanto mais afastados estejam os pólos da cadeia fechada e os pólos da dinâmica pretendida, maior vai ser o ganho do controlador Portanto se pedirmos uma dinâmica bastante rápida a um sistema que era relativamente lento poderemos correr o risco de usar um K demasiado elevado que sature a entrada Esta é a ração pela qual sistemas fracos não conseguem ficar imediatamente bons pela RLVE sem que haja melhoramento das características de entrada do sistema 264 Forma Canónica do Controlador Uma outra forma (trivial) de calcular o ganho do controlador, K, é colocar o sistema na sua forma canónica Nesta forma, uma função de transferência do tipo: G(S) = (Em que se considerou n = 3 mas pode ser generalizado) b 1 s 2 + b 2 s + b 3 s 3 + a 1 s 2 + a 2 s + a 3 (252) 27

Este sistema na forma canónica tem o diagrama de blocos à esquerda, sendo que o desejado seria o diagrama à direita: Para tal podemos fazer uma realimentação para a entrada de todos os estados corresponde a um sistema em malha fechada com o diagrama de blocos da figura: O permite fazer uma fácil comparação e obter o ganho na forma canónica do controlador: K c = α a (253) Assim sendo para resolver o problema basta simplesmente modelar o sistema em espaço de estados na forma canónica do controlador Para tal é necessário recorrer a uma transformação do tipo: x(t) = T x c (t) T = C(A, b)m T (254) Podemos retirar o ganho na forma canónica como vimos em (253) e voltar de novo para a forma original invertendo ou seja: K = K c T 1 (255) 28

Este raciocínio corresponde a fazer: 265 Fórmula de Ackermann Alternativamente, o vector de ganhos do controlador pode ser calculado pela fórmula de Ackermann, que não necessita do conhecimento explícito do polinómio característico do sistema em cadeia aberta: A fórmula de Ackermann é: Em que: K = [ 0 0 1 ]C 1 (A, b)α(a) (256) [ 0 0 1 ]C 1 (A, b) é a última linha da Matriz de Controlabilidade α(a) é o polinómio característico desejado em que s = A, ou seja α(a) = A n + α 1 A n 1 + + α n I 29

27 Observadores Assimptóticos Objectivo: Projecto de observadores assimptóticos de ordem completa Já vimos, na subsecção anterior, como definir os ganhos do controlador O problema prende-se agora com o facto de nem sempre o estado do sistema estar acessível, e como tal é necessário usar uma estimativa desse mesmo estado para o poder controlar Problema: Estimação de Estado Dada a realização de estado {A, b, C} (11) de um sistema: ẋ(t) = Ax(t) + Bu(t) x(0) = x 0 y(t) = Cx(t) Determinar uma estimativa ˆx(t) de x(t) por observação da entrada e da saída Esta estimativa deve ser recursiva, ie definida por uma equação diferencial cuja integração produza ˆx(t) para todo o t Podemos assim definir o erro de estimação: E o nosso objectivo é que o erro tenda para 0 x(t) = x(t) ˆx(t) (257) 271 1 a Solução - Observador em Cadeia Aberta Usando uma replica exacta do sistema em cadeia aberta (apenas parte da dinâmica e entrada, sem usar a saída) podemos obter uma estimativa do estado, pois temos u(t) Erro de Estimação no observador em cadeia aberta As equações da dinâmica serão então: ẋ(t) =Ax(t) + bu(t) ˆẋ(t) =Aˆx(t) + bu(t) (258) Assim sendo, para este tipo de observador, o erro de estimação seguirá a equação da dinâmica: x(t) =ẋ(t) ˆẋ(t) = Ax(t) + bu(t) Aˆx bu(t) x(t) =A x(t) (259) 30

Conclusão: Com o observador em cadeia aberta, o erro de estimação do estado apenas tende para zero para sistemas estáveis em cadeia aberta e com uma taxa que depende dos valores próprios de A Ou seja, podemos ter sistemas dinâmicos instáveis que como tal sejam impossíveis de observar pois o erro de observação nunca tende para 0 E podemos ter também sistemas dinâmicos estáveis mas lentos e como tal o erro de estimação tende também lentamente para 0, o que não é exequível pois sistemas que se prezem tem que ter a dinâmica da observação mais rápida que a dinâmica do próprio sistema, de modo a ser possível um controlo eficaz 272 2 a Solução: Observador em Cadeia Fechada (Assimptótico) Usando não só a entrada mas também a saída podemos então obter a diferença entre a saída estimada e observada (real), o chamado erro de estimação, e usa-la para melhorar a dinâmica do erro de estimação Erro de Estimação no observador em cadeia fechada (assimptótico) As equações da dinâmica serão então: ẋ(t) =Ax(t) + bu(t) ˆẋ(t) =Aˆx(t) + bu(t) + L [y(t) C ˆx(t)] }{{} Termo de correcção (260) Em que dim(l) =dim(x) Como tal, quando a estimativa for correcta vem que y(t) = C ˆx(t) pelo que a dinâmica da real e da estimação serão exactamente iguais (seguiram um observador do tipo em cadeia aberta (258) O erro será: Cx(t) {}}{ x(t) = ẋ(t) ˆẋ(t) = Ax(t) + bu(t) Aˆx bu(t) L[ y(t) C ˆx(t)] x(t) = [A LC] x(t) (261) 31

Dinâmica do erro do observador assimptótico A equação de dinâmica do erro de observação (261) é: x(t) = [A LC] x(t) Conclusão: Com o observador em cadeia fechada, o erro de estimação do estado já não depende dos valores próprops de A, mas sim de A LC E portanto, se o par (A, C) for observável podemos colocar arbitrariamente os pólos (valores próprios) da matriz A LC de modo a termos uma dinâmica pretendida para o erro de observação Pelo facto de (para realizações observáveis) o ganho L poder ser dimensionado por forma a que o erro tenda assimptotiocamente para zero, este tipo de observadores diz-se assimptótico Nota: Este tipo de observador é uma versão simplificada daquele que é um dos observadores mais importantes de toda a teoria de controlo, o chamado Filtro de Kalman, desenvolvido na a meio do século XX e que permitiu a viagem do homem à Lua 273 Escolha dos valores próprios da dinâmica do erro A escolha dos valores próprios de (A LC) resulta do seguinte compromisso: Não podem ser muito pequenos, para que o erro não tenda lentamente para zero; Não podem ser muito grandes pois, se o estimador fôr muito rápido, pode ser enganado pelos erros de modelação Em particular, o ganho de malha resultante quando se fecha a cadeia realimentando as estimativas do estado deve respeitar a condição de estabilidade robusta 274 Método do Coeficientes Indeterminados Temos assim uma equação que permite verificar como se comporta a dinâmica do erro: x(t) = (A LC) x(t) Podemos assim de definir um polinómio característico desejado, que traduz a dinâmica do erro de estimação, sendo ele: α(s) = s n + α n 1 1 + + α n (262) E compará-lo com o polinómio característico da dinâmica do erro de observação: a O (s) = det(si A CL) = s n + a 1 Os n 1 + + a n O (263) E portanto podemos usar o método dos coeficientes indeterminados para resolver o sistema que corresponde a igualar os dois polinómios, ou seja: a 1 O = α 1 a O (s) = α(s) (264) a n O = α n Este sistema tem solução quando o par (A, C) for observável 32

275 Fórmula de Bass-Gura para o cálculo dos ganhos do Observador Uma outra forma de obter os ganhos automaticamente é a chamada fórmula de Bass-Gura Já a vimos para o posicionamento arbitrário de pólos da cadeia fechada acerca da RLVE mas também funciona para o caso de ganho do observador Funciona caso o par (A, C) seja controlável Nestas condições o vector de ganhos é calculado por: Em que O[A, C] é a Matriz de Observabilidade (222) e: α = [ α 1 α 2 α n ] a = [ a 1 a 2 a n ] L T = (α a)mo[a, C] (265) M = Uma das consequências iniciais da fórmula de Bass-Gura é: 1 0 a 1 1 0 a n 1 a 1 1 O ganho do observador é proporcional à diferença entre α e a No entanto, aqui o erro pode ter a dinâmica tão rápida como se pretenda (266) 276 Forma Canónica do Observador Uma outra forma (trivial) de calcular o ganho do observador L é colocar o sistema na sua forma canónica do observador Nesta fórmula, tendo em conta o Modelo em espaço de estados do observador, a dinâmica do erro vem: x(t) = a 1 1 0 a 2 0 0 1 a n 0 0 0 L 1 L 2 L n [ 1 0 0 ] x(t) = a 1 L 1 1 0 a 2 L 2 0 0 1 a n L n 0 0 0 x(t) (267) E cujo polinómio característico é : det(si A + LC) = s + (a 1 + L 1 )s n 1 + + (a n L n ) (268) O que permite obter o ganho na forma do observador facilmente usando: L T O = (α a) (269) Assim sendo para resolver o problema basta simplesmente modelar o sistema em espaço de estados na forma canónica do controlador Para tal é necessário recorrer a uma transformação do tipo: x(t) = T x c (t) T = (MO[A, C]) 1 (270) Podemos retirar o ganho na forma canónica e voltar de novo para a forma original invertendo ou seja: L = L O T 1 (271) 33

28 Teorema de Separação Objectivo: Mostrar que o observador e o controlador por realimentação da estimativa do estado podem ser projectados independentemente Na subsecção de Realimentação Linear de Variáveis de Estado (26) vimos que tendo acesso a todos os n estados de um sistema então podemos projectar um controlador usando a realimentação dos mesmos com um ganho linear para a entrada, de modo a obtermos a dinâmica pretendida para o sistema em malha fechada Quando o estado não está acessível para medida directa, uma ideia natural consiste em realimentar a estimativa produzida por um Observador Assimptótico do tipo do discutido na subsecção anterior (27) Juntando as duas ideias tem-se então a estrutura do compensador (controlador) (a maneira correcta de introduzir a referência será discutida posteriormente): Sistema: Controlador (Lei de Controlo): Observador: ẋ(t) = Ax(t) + bu(t) x(0) = x 0 y(t) = Cx(t) (272) u(t) = K ˆx(t) (273) ˆx(t) = Aˆx(t) + bu(t) + L[y(t) C ˆx(t)] (274) Assim sendo, o sistema (compensado) é de ordem 2n 281 Teorema de Separação Segundo o Teorema da Separação, o polinómio característico do sistema global em cadeia fechada (sistema em cadeia aberta e observador, com realimentação da estimativa do estado) é o produto dos polinómios característicos de (A bk) e de (A LC) Este teorema diz-nos que podemos projectar o vector de ganhos K como se realimentássemos o estado e não a sua estimativa, e o vector de ganhos do observador L como se estimássemos o estado em cadeia aberta O observador e o controlador podem pois ser projectados separadamente Nota sobre o Teorema de Separação: Em geral, para sistemas não lineares, o controlador e o observador não podem ser projectados separadamente Isto acontece porque a variável de controlo tem um efeito chamado dual: Por um lado, permite efectuar a acção de regulação da saída; por outro lado proporciona a excitação suficiente para se estimar o estado Estes dois efeitos conflituam e a escolha do controlo deve ser feito como um compromisso entre ambos O efeito de dualidade é conhecido (no âmbito do Controlo Adaptativo) desde os anos 50, pelos trabalhos de Feld baum No caso linear, o conflito não existe, tendo lugar o teorema de separação Há classes de sistemas não lineares para os quais é possível demonstrar teoremas de separação Isto constitui um tema de investigação actual 34

282 Demonstração do Teorema da Separação Juntando as equações (272), (273) e (274) obtém-se: ẋ(t) =Ax(t) bk ˆx(t) (275) ˆx(t) =LCx(t) + (A LC bk)ˆx(t) (276) Ou seja o sistema completo é de ordem 2n sendo n para o semi estado x(t) e n para o ˆx(t) Designando o estado global X então a matriz da dinâmica do mesmo tem todas as entradas preenchidas, pelo que o cálculo do seu determinante (polinómio característico) não é assim tão trivial Trabalhando antes com o erro de estimação, ie, x(t) = x(t) ˆx(t) e não com a estimativa do estado podemos facilitar o cálculo do seu determinante Isto corresponde a fazer uma transformação invertível de coordenadas no estado, pelo que os valores próprios do sistema global não são alterados Subtraindo as duas equações anteriores, obtém-se: E portanto o sistema global é descrito por: x(t) = (A LC) x(t) (277) ẋ(t) =(A bk)x(t) + bk x(t) (278) x(t) =(A LC) x(t) (279) Podemos então escrever o estado total com dimensão 2n e como tal: [ ] [ ] ẋ(t) (A bk) bk Ẋ(t) = = x(t) 0 (A LC) Em que A X é a matriz da dinâmica do sistema total } {{ } A X [ x(t) x(t) ] (280) A matriz A X é uma matriz triangular por blocos, como tal a matriz (si A X ) também o será Vem da álgebra que o determinante de matrizes triangulares por blocos é o produto dos determinantes das matrizes na diagonal principal Assim sendo: det(si A X ) = det(si A + bk) det(si A + LC) }{{}}{{} controlador observador (281) Conclusão: As frequências naturais agrupam-se em dois tipos de termos: Uma parte dependem apenas do ganho K do controlador, como se fosse feita uma retroacção do estado e não da sua estimativa A outra parte depende apenas do ganho L do observador, como se o controlador estivesse ausente 35

283 Função de Transferência do Compensador O Modelo do processo (11): ẋ(t) = Ax(t) + Bu(t) x(0) = x 0 y(t) = Cx(t) Tem a função de transferência (16): Y (s) U(s) = G P (s) = C(sI A) 1 b Agora vamos usar a saída para estimar qual vai ser a entrada controlador temos: Das equações do observador e do ˆx(t) = (A LC)ˆx(t) + Cy(t) + bu(t) u(t) = K ˆx(t) Usando a Transformada de Laplace com condições iniciais nulas e simplificando as equações podemos chegar à Função de Transferência do Compensador (Conjunto observador + retroacção da estimativa do estado): U(s) Y (s) = G C(s) = K(sI A + LC + bk) 1 L (282) E portanto tem uma dinâmica do tipo (A LC bk) Assim, a função de transferência do compensador e, por conseguinte o ganho de malha, dependem dos ganhos K e L Estes ganhos podem pois ser encarados como botões de ajuste que permitem moldar o ganho de malha por forma a satisfazer especificações 36

29 Seguimento de referências e efeito integral Objectivo: Mostrar como é possível modificar o regulador de retroacção de variáveis de estado por forma a seguir referências não nulas, incluindo ou não efeito integral Seguimento de referências não nulas Temos considerado até agora o problema de projectar controladores que levem o estado do processo para zero, rejeitando assim perturbações que tenham causado condições iniciais não nulas Este problema é conhecido como problema de regulação Em geral pretende-se seguir referências não nulas, eventualmente variáveis Neste último caso o problema diz-se problema do servomecanismo (isto é uma herança dos tempos em que os controladores visavam movimentar sistemas mecânicos, por exemplo lemes de navios (anos 20) ou canhões (anos 40) 291 Possibilidade de inclusão de Referência Para seguirmos a referência iremos usar um controlador semelhante ao visto do para na subsecção de RLVE (26) Da equação (242) do seguimento de referência tínhamos u(t) = r(t) Kx(t) Não tendo acesso ao estado mas sim a uma estimativa do mesmo, então podemos fazer uma retroacção do tipo: u(t) = K ˆx(t) + Nr(t) (283) Em que se acrescentou o escalar N para multiplicar pela referência e cuja função será vista de seguida Não tendo acesso ao estado então podemos usar um observador para obter uma estimativa do estado, cuja equação da dinâmica deverá ser semelhante à habitual (274) mas incluindo a referência: ˆx(t) = (A bk)ˆx(t) + L[y(t) C ˆx(t)] + Mr(t) (284) Em que se acrescentou o vector M para multiplicar pela referência e cuja função será vista de seguida Tendo em conta estas equações (283) e (284) então chegamos ao diagrama de blocos geral para seguimento de referências não nulas: Repare-se que se r(t) for nulo ou M e N forem nulos então ficamos com um compensador (Realimentação dos estados mais observador) exactamente igual ao visto na secção do Teorema de Separação, subsecção da Função de Transferência do Compensador (283) e que satisfaz o problema da Regulação Há várias possibilidades para a escolha de M (vector) e N (escalar) De acordo com estas possibilidades resultam vários tipos de resposta à referência Vamos considerara duas hipóteses 37