FILTRAGEM ESTOCÁSTICA APLICADA A SISTEMAS MAX-PLUS LINEARES

Documentos relacionados
FILTRO DE PARTÍCULAS PARA SISTEMAS MAX PLUS COM DENSIDADE DE

CONTROLE DE SISTEMAS MAX-PLUS LINEARES SUJEITOS A RESTRIÇÕES NO ESTADO: APLICAÇÃO A SISTEMAS DE TRANSPORTE

MP-208: Filtragem Ótima com Aplicações Aeroespaciais

MP-208: Filtragem Ótima com Aplicações Aeroespaciais

Comparação entre Algoritmos para a Solução do Controle Just-in-Time em Sistemas Max-Plus Lineares

3 Filtro de Kalman Discreto

APLICAÇÃO DO FILTRO DE KALMAN A UM SISTEMA DE POSICIONAMENTO DE VEÍCULO AQUÁTICO

ESTRATÉGIAS DE CONTROLE POR MODELO DE REFERÊNCIA DE SISTEMAS A EVENTOS DISCRETOS MAX-PLUS LINEARES

5 Filtro de Kalman Aplicado ao Modelo de Schwartz e Smith (2000)

XIII Simpósio Brasileiro de Automação Inteligente Porto Alegre RS, 1 o 4 de Outubro de 2017

Um Sistema de Numeração Aplicado a Grafos a Eventos

MP-208: Filtragem Ótima com Aplicações Aeroespaciais

Modelagem e Avaliação de Desempenho. Pós Graduação em Engenharia Elétrica - PPGEE Prof. Carlos Marcelo Pedroso 2014

ESTATÍSTICA COMPUTACIONAL

7 Conclusões e desenvolvimentos futuros

Metodologia de inversão

Modelagem e Avaliação de Desempenho. Pós Graduação em Engenharia Elétrica - PPGEE Prof. Carlos Marcelo Pedroso 2017

CÍNTIA RIBEIRO ANDRADE CONTROLE DE SISTEMAS MAX-PLUS LINEARES SUJEITOS A RESTRIÇÕES NO ESTADO: APLICAÇÃO A SISTEMAS DE TRANSPORTE

Modelagem e Avaliação de Desempenho. Pós Graduação em Engenharia Elétrica - PPGEE Prof. Carlos Marcelo Pedroso 2018

A análise de séries temporais é uma área da estatística dedicada ao estudo de dados orientados no tempo (MONTGOMERY, 2004).

Guilherme Gomes da Silva. Estudo e Desenvolvimento de Técnicas de Controle Para Grafos de Eventos Temporizados

PRE29006 LISTA DE EXERCÍCIOS #

Redes de Petri. Marcação e seu comportamento dinâmico. Marcação

Controle Ótimo - Aula 8 Equação de Hamilton-Jacobi

Universidade Federal do Rio Grande do Sul Escola de Engenharia Departamento de Engenharia Elétrica ENG04037 Sistemas de Controle Digitais

6. Predição Linear e Controlo de Variância Mínima

Cálculo Numérico BCC760

Introdução ao Processamento Estatístico de Sinais

étodos uméricos SISTEMAS DE EQUAÇÕES LINEARES (Continuação) Prof. Erivelton Geraldo Nepomuceno PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA

IMPLEMENTAÇÃO DE SISTEMA DE ATITUDE EM DSP

Método de amostragem por conglomerados em dois estágios para estimativa de população canina/felina domiciliada.

[a11 a12 a1n 7. SISTEMAS LINEARES 7.1. CONCEITO. Um sistema de equações lineares é um conjunto de equações do tipo

EES-20: Sistemas de Controle II. 20 Novembro 2017

Algoritmo Array Rápido para Filtragem de Sistemas Lineares Sujeitos a Saltos Markovianos com Variação Estruturada dos Parâmetros no Tempo

3 Aprendizado por reforço

ACH Introdução à Estatística Conteúdo Teórico: 12 - Simulação

Introdução. Geovany A. Borges

AST203-CVR 4-1 AST203-CVR. Observação eletromagnética. Processamento de sinais importante em várias áreas, além da astronomia telecomunicações

Sistemas Dinâmicos Não-Lineares aplicados ao Design Sonoro

Modelagem Computacional. Parte 8 2

Noções de Processos Estocásticos e Cadeias de Markov

Disciplina: Processamento Estatístico de Sinais (ENGA83) - Aula 06 / Classes Especiais de Processos Aleatórios

Modelação, Identificação e Controlo Digital 2003/04 Segundo Exame

Sistemas de equações lineares

PROGRAMA DE ENSINO. Teoria da Estimação II CAR Área de Concentração AQUISIÇÃO, ANÁLISE E REPRESENTAÇÃO DE INFORMAÇÕES ESPACIAIS

MATRIZES - PARTE Definição e Manipulação de Matrizes AULA 21

INTRODUÇÃO À INTELIGÊNCIA COMPUTACIONAL. Aula 06 Prof. Vitor Hugo Ferreira

Processos Estocásticos e Cadeias de Markov Discretas

Geração de cenários de energia renovável correlacionados com hidrologia: uma abordagem bayesiana multivariada.

Resolução de Sistemas Lineares. Ana Paula

INSTITUTO TECNOLÓGICO DE AERONÁUTICA

f(h) δ h p f(x + h) f(x) (x) = lim

SCX5005 Simulação de Sistemas Complexos II. Problemas em Simulação

2 Modelos em Espaço de Estado Lineares: Formulação Geral

Resolução do Exame Tipo

Simulação Usando Rede de Petri Software PIPE

4 Método Proposto CR AD PA NDVI Descrição geral do modelo

Plano Básico Processos Estocásticos

FUNDAMENTOS DE SISTEMAS LINEARES PARTE 2

Métodos Não Paramétricos

Modelização do Sistema Produtivo Teoria das Filas de Espera

Anexo 1 - Revisões de Teoria das Probabilidades e Processos Estocásticos

3 Equação de Estado. 3.1 Introdução

Implementação de Técnicas de Controle Max-Plus em um Simulador Realista Marcelo Xavier Reis Souza

ÁLGEBRA LINEAR AULA 2

2 Provisão de Reservas IBNR - Conceitos Básicos

Avaliação de Desempenho

ÁLGEBRA LINEAR SISTEMAS DE EQUAÇÕES LINEARES

O teorema do ponto fixo de Banach e algumas aplicações

Universidade Federal do Rio Grande do Norte. Métodos Computacionais Marcelo Nogueira

Neste capítulo é introduzido um conceito que permite definir eventos de uma forma mais

Cadeias de Markov em Tempo Continuo

Aplicação da metodologia Box & Jenkins para previsão de vendas de emulsificante

Teoria de Filas Aula 10

Sistemas de equações lineares

X. MÉTODOS DE ESPAÇO DE ESTADOS

Primeiro Exercício programa: Como o Google ordena páginas. MAP-2121 para EPUSP

Unidade 1 - O que é Álgebra linear? A. Hefez e C. S. Fernandez Resumo elaborado por Paulo Sousa. 9 de agosto de 2013

Matriz de Variância e Covariância e o Teorema de Gauss-Markov

Métodos Não Paramétricos

Considerações sobre a Condição Inicial na Construção do Diagrama de Bifurcação para o Mapa Logístico

O Algoritmo Talus para Otimização Global

INTRODUÇÃO AOS MÉTODOS NUMÉRICOS. Solução de Sistemas Lineares

Modelo para estimativa de risco operacional e previsão de estoque para equipamentos da Comgás

2 FUNDAMENTACÃO TEÓRICA

Mineração de Dados. Análise e Seleção de Variáveis

Redes Neurais: MLP. Universidade Federal do Rio Grande do Norte Departamento de Engenharia de Computação e Automação

Universidade Federal do Paraná.

Noções de Simulação. Ciências Contábeis - FEA - Noturno. 2 o Semestre MAE0219 (IME-USP) Noções de Simulação 2 o Semestre / 23

Redes Neurais e Sistemas Fuzzy

Instituto Tecnológico de Aeronáutica Divisão de Engenharia Mecânica-Aeronáutica. Professora: Denise Beatriz T. P. do Areal Ferrari

Inferência Bayesiana Exata para Processos de Cox Level-Set

Observabilidade, Decomposição Canônica

Estimação na Presença de Ruído colorido

Renato Martins Assunção

Metodologia de Box-Jenkins. Metodologia de Box-Jenkins. Metodologia de Box-Jenkins

Parte 1 - Matrizes e Sistemas Lineares

Interpolação polinomial

Matriz de Variância e Covariância e o Teorema de Gauss-Markov

Introdução aos Métodos Numéricos

Transcrição:

FILTRAGEM ESTOCÁSTICA APLICADA A SISTEMAS MAX-PLUS LINEARES DIEGO FIGUEIRÊDO E SILVA, RAFAEL SANTOS MENDES, LAURENT HARDOUIN, CARLOS ANDREY MAIA, BERTRAND COTTENCEAU Faculdade de Engenharia Elétrica e de Computação - UNICAMP DCA/FEEC/UNICAMP-C.P. 6101 13083-970 Campinas - SP - Brasil Laboratoire d Ingénierie des Systèmes Automatisés - ISTIA/Université d Angers Av. Notre Dame du Lac 62 49000 Angers - França Depto. de Engenharia Elétrica - UFMG Av. Antônio Carlos 6627 - Pampulha 31270-010 Belo Horizonte - MG - Brasil Emails: dfs@dr.com, rafael@dca.fee.unicamp.br, laurent.hardouin@istia.univ-angers.fr, maia@cpdee.ufmg.br, bertrand.cottenceau@istia.univ-angers.fr Abstract This paper proposes a particle filter for linear max-plus systems. A brief introduction to discrete event systems is presented in a max-plus context. The paper describes some fundamental results in particle filtering and applies these results to the max-plus linear systems leading to a stochastic filtering algorithm. An example illustrates the method and some conclusions are drawn. Keywords Stochastic Filtering, Discrete Event Systems, Max-plus Algebra, Particle Filters Resumo Este trabalho propõe um filtro estocástico do tipo filtro de partículas para sistemas max-plus lineares. Uma pequena introdução aos sistemas a eventos discretos no contexto da abordagem max-plus é apresentada. Em seguida os fundamentos de filtros de partículas, aplicados aos sistemas max-plus, são descritos, chegando assim a um algoritmo de filtragem estocástica. Um exemplo ilustrativo é apresentado e são esboçadas conclusões. Palavras-chave Filtragem Estocástica, Sistemas a Eventos Discretos, Álgebra Max-plus, Filtros de Partículas 1 Introdução O desenvolvimento das técnicas de filtragem estocástica (Brown and Hwang, 1997) vem permitindo os avanços em várias áreas de pesquisa, em especial na geração de tecnologia espacial e militar (Bar-Shalom et al., 2001). Pode-se citar particularmente o filtro de Kalman (Brown and Hwang, 1997), cuja presença se tornou indispensável em equipamentos eletrônicos de comunicação via frequência modulada (FM) e em sistemas de rastreamento aéreo e de navegação (Bar- Shalom et al., 2001). Os Sistemas a Eventos Discretos (SED) (Cassandras and Lafortune, 1999) constituem uma classe de sistemas caracterizados pelo fato de sua dinâmica ser dirigida pela ocorrência de eventos, em oposição aos sistemas contínuos cuja dinâmica é determinada pela passagem do tempo. Num SED as mudanças de estado ocorrem única e exclusivamente devido à ocorrência de eventos. O estudo destes sistemas é de fundamental importância em diversas áreas como redes de computadores, sistemas de tráfego e no planejamento de atividades de carácter logístico, podendo-se destacar a sua aplicação nos sistemas de manufatura, onde é utilizado para otimizar o tempo de produção e o uso do estoque (Maia et al., 2005). Dentre os modelos existentes para o tratamento de tais sistemas, destacam-se as Redes de Petri (RP) (Murata, 1989) e a abordagem baseada na álgebra de dióides, ou mais simplesmente, na álgebra max-plus (Baccelli et al., 1992). Esta última é a abordagem utilizada neste trabalho. Um enfoque possível para os SED considera como variáveis de modelagem os datadores, isto é, as informações relativas aos instantes de ocorrência de eventos. Neste contexto, podem ocorrer situações práticas onde nem todos os datadores são diretamente observados, de forma análoga ao que ocorre em sistemas contínuos nos quais o estado não é totalmente observado. Além disso, é comum que os datadores não observados tenham seus valores influenciados por variáveis aleatórias, que combinadas com os aspectos estruturais do sistema provocam variações aleatórias nos instantes de ocorrência dos eventos. O presente trabalho pretende abordar exatamente esta situação, tratando do problema de obter estimativas ótimas, num contexto ruidoso, de instantes de ocorrência de eventos não-observáveis em SED. Estas estimativas deverão ser obtidas de modo análogo ao utilizado nos filtros de Kalman para sistemas contínuos, isto é, a partir de observações de algumas variáveis do sistema, obter-se-ão estimativas de outras variáveis não-observadas sujeitas a perturbações estocásticas previamente modeladas. A técnica de filtragem conhecida como Filtro de Partículas será utilizada neste trabalho. Os filtros de partículas utilizam o conceito de simulação de Monte-Carlo, isto é, produzem uma aproximação de uma distribuição proba- ISSN: 2175-8905 - Vol. X 1388

bilística através de um grande número de amostras às quais são atribuídos pesos. Estas amostras evoluem de acordo com a dinâmica do sistema e têm seus pesos atualizados a partir da existência de medidas das saídas do sistema. O artigo está organizado como segue. Na seção 2 os sistemas max-plus são brevemente descritos, definindo-se também o cenário de perturbações que afetam o sistema. A seção 3 descreve o princípio de funcionamento do filtro de partículas e a maneira pela qual ele pode ser aplicado aos sistemas maxplus lineares com perturbação. Finalmente, na seção 4 apresentam-se alguns resultados de simulação numérica e na seção 5 esboçam-se algumas conclusões. 2 Álgebra Max-Plus É possível modelar um sistema a eventos discretos como uma rede de Petri (Baccelli et al., 1992). Uma rede de Petri é um objeto abstrato constituído de um grafo bi-partido e de uma marcação (função). No grafo os nós podem ser de dois tipos: lugares e transições. A marcação associa a cada lugar um número inteiro (diz-se que o lugar contém fichas). As transições estão relacionadas aos eventos do sistema e os lugares definem condições para que estes eventos ocorram. Uma transição pode disparar se os lugares acima dela contêm fichas. Neste trabalho consideraremos RP p-temporizadas, nas quais os lugares têm um tempo de permanência mínimo para as fichas. O disparo de uma transição altera a marcação da rede, redefinindo as condições de disparo e produzindo a dinâmica do sistema. Neste contexto, os recursos do sistema são representados por fichas nas diversas posições do processo de produção, as durações das atividades são representadas pelo tempo de permanência das fichas nos lugares e as ocorrências dos eventos são representadas pelos disparos das transições, que consomem fichas nos lugares anteriores à transição e produzem fichas nos lugares seguintes à transição. Uma classe importante de redes de Petri são os Grafos de Eventos Temporizados (GET), caracterizados por apresentarem um único arco de entrada e um único arco de saída em cada lugar. Na figura 1 apresenta-se um grafo de eventos temporizado. Figura 1: Exemplo de Grafo de Eventos Temporizado Nesta figura é importante observar a existência de transições não condicionadas por nenhuma outra transição do sistema (transição u na figura) e transições que não condicionam nenhuma outra transição do sistema (transição z na figura). Estas transições são chamadas respectivamente de entrada e de saída do sistema; as outras transições são chamadas de internas ou transições de estado. Assume-se que apenas as transições de saída do sistema são observadas no contexto de filtragem desenvolvido na próxima seção. Pode-se associar a cada transição de um GET uma seqüência crescente de números inteiros {x(k)}, para k = 0, 1, 2,..., onde cada elemento da série representa o instante do k-ésimo disparo dessa transição. Supondo agora conhecida a seqüência associada às transições de entrada de um GET, é possível determinar as seqüências de disparo de todas as transições do GET. De fato, considerando novamente o GET da figura 1, é possível escrever as seguintes relações entre os instantes de disparo das transições: x 1 (k) = 1 + x 2 (k 1) x 2 (k) = max{2 + x 2 (k 1); u(k)} z(k) = max{2 + x 1 (k); 1 + x 2 (k)} (1a) (1b) (1c) Renomeando o operador max como sendo e o operador + como sendo, pode-se reescrever: x 1 (k) = 1 x 2 (k 1) x 2 (k) = 2 x 2 (k 1) u(k) ou, em forma matricial: sendo: A = x k = ( x 1 (k) z(k) = 2 x 1 (k) 1 x 2 (k) (2a) (2b) (2c) x k = A x k 1 B u k (3) z k = C x k ( ) 1 ; B = 2 ( ) ; C = ( 2 1 ) 0 x 2 (k) ) T ; uk = u(k) e z k = z(k) Tem-se portanto um sistema de equações recursivas lineares numa nova álgebra. De modo geral, um semi-anel idempotente (ou dióide) é caracterizado por um conjunto e duas operações (soma e produto), notado (D,, ), tal que a soma seja associativa, comutativa e idempotente (a a = a), e o produto seja associativo (mas não necessariamente comutativo) e distributivo à esquerda e à direita em relação à soma. Além disso, devem existir elementos neutros para ambas as operações, notados por ε (elemento nulo) e por e (elemento unitário), e o elemento nulo deve ser absorvente em relação ao produto. Isto é, a D, a ε = a, a e = a, a ε = ε. É imediato perceber que o conjunto Z { } munido das duas operações max e + é um dióide, no qual ε = e e = 0. Um dióide é completo se ele for fechado em relação a somas infinitas e se o produto for ISSN: 2175-8905 - Vol. X 1389

distributivo em relação a somas infinitas. A estrutura (Z { } { }, max, +) é um dióide completo usualmente denominado Max-plus e notado por Z max. Este exemplo utiliza o que se convenciona chamar de datadores, isto é, sequências crescentes {x(k)} que representam as datas ou instantes de ocorrência dos disparos da transição x. Observa-se que, formalmente, as equações 3 são muito similares às equações de estado em sistemas com dinâmica contínua. Os sistemas abordados neste trabalho são, por definição os sistemas a eventos discretos que podem ser descritos pelas equações 3 admitindo-se em geral que x k R n 1, u k R p 1 e z k R q 1 e que as matrizes A, B e C tem dimensões apropriadas. Além disso, duas hipóteses adicionais são consideradas. Por um lado admite-se que a matriz C contém exatamente um elemento e em cada linha, sendo todos os outros iguais a ɛ havendo no máximo um elemento e em cada coluna. Esta hipótese não é restritiva pois qualquer sistema do tipo da equação 3 pode ser colocado nesta forma pela inclusão de linhas e colunas nas matrizes A e B (Hardouin et al., 2010). Em outras palavras assume-se que a matriz C tem a matriz identidade como sub-matriz e que algumas das variáveis internas são diretamente observadas. Pode-se portanto reescrever o modelo dado pela equação 3 da seguinte forma: x k = A x k 1 B u k (4) z k = x k ( ) ( ) x sendo x k = k A e A =. A partir destas x k equações é possível escrever: A z k = A x k 1 B u k (5) Por outro lado, assume-se que as perturbações que afetam o sistema atuam exclusivamente nos elementos da matriz A e da matriz B, admitindo-se que os elementos a ij e b ij destas matrizes são variáveis aleatórias independentes entre si com distribuições uniformes e conhecidas. No contexto deste trabalho o problema de filtragem consiste portanto em obter estimativas para os estados não diretamente observados x k conhecendose uma sequência de medidas z j e de entradas u j, j = 1,..., k e a distribuições de probabilidade dos elementos das matrizes A e B. 3 Filtros de Partículas aplicados a Sistemas Max-Plus Os Filtros de Partículas utilizam uma representação por partículas da densidade de probabilidade do estado do sistema para realizar uma estimação sequencial de Monte-Carlo 1 deste estado. Uma representação por partículas é um conjunto de amostras da variável que se deseja estimar, amostradas de acordo com 1 Uma estimação sequencial de Monte-Carlo é uma técnica para a implementação de um filtro Bayesiano recursivo através de simulações de Monte-Carlo (Ristic et al., 2004) uma densidade chamada "densidade de importância". O método de Monte-Carlo é baseado no seguinte fato. Seja I = g(x) dx uma integral que se deseja avaliar e π(x) uma densidade de probabilidade tal que g(x) = f(x) π(x). Se for possível sortear N amostras da variável x de acordo com a densidade π(x) {x i, i = 1,..., N}, então I N = 1 N N f(xi ) é uma estimativa não-polarizada da integral I. Além disso, se as amostras da variável x forem sorteadas segundo uma outra densidade q(x), similar 2 a π(x), então I N = N f(xi ) w(x i ), sendo w(x i ) = 1 N w(x i ) e N j=1 w(xj ) w(xi ) = π(xi ) q(x i ) a densidade de importância.. A densidade q(x) é Considerando agora um sistema max-plus linear conforme descrito na seção anterior, seja X k = {x j }, j = 0,..., k o conjunto de todos os valores das variáveis de estado x até o instante k e seja Z k definido de modo análogo. Uma abordagem comum para o problema de filtragem consiste em realizar o cálculo da probabilidade p(x k Z k ) a partir da probabilidade p(x k 1 Z k 1 ) e do valor da medida z k. Contudo, levando em conta a equação 4 e que os elementos da matriz A são variáveis aleatórias independentes, concluise que, dado x k 1, os vetores x k e x k = z k são independentes. Em outras palavras: p(x k X k 1, z k ) = p(x k X k 1 ). A melhor estimativa que se pode ter do estado x k depende exclusivamente da estimativa do estado x k 1. Por este motivo busca-se neste trabalho um procedimento recursivo para a obtenção da probabilidade p(x k 1 Z k ), em função da probabilidade p(x k 2 Z k 1 ) e da medida z k. A representação para as densidades de probabilidade acima é feita através do conceito de "partículas", isto é, supõe-se a existência de um conjunto de amostras (ou partículas) {X i k 1 }, i = 1,..., N amostrado segundo a densidade de importância q(x k 1 Z k ) com os respectivos pesos {wk i } que representam a probabilidade p(x k 1 Z k ), isto é: p(x k 1 Z k ) = N wk i δ(x k 1 X i k 1) (6) Conforme a discussão ao início desta seção temse que: w i k p(xi k 1 Z k) q(x i k 1 Z k) Deseja-se portanto, a partir de uma representação de p(x k 2 Z k 1 ) (do tipo definido pela equação 6) e da medida z k, obter uma representação por partículas para p(x k 1 Z k ). Para obter fórmulas recursivas adequadas, deve-se escolher uma densidade de importância que satisfaça a seguinte condição de fatorização: q(x k 1 Z k ) q(x k 1 X k 2, Z k ) q(x k 2 Z k 1 ). (7) 2 Uma densidade de probabilidade q(x) é similar a π(x) se x : π(x) > 0 q(x) > 0. ISSN: 2175-8905 - Vol. X 1390

A densidade q(x k 1 X k 2, Z k ) deve ser utilizada para expandir a partícula X i k 2 para Xi k 1, incluindo um novo estado x i k 1. A equação de atualização do respectivo peso wk i é obtida a seguir. Tem-se: mas dado que: p(x k 1 Z k ) = = p(x k 1 z k, Z k 1 ) = p(z k X k 1, Z k 1 ) p(x k 1 Z k 1 ), (8) p(z k Z k 1 ) p(x k 1 Z k 1 ) = = p(x k 1 X k 2, Z k 1 ) p(x k 2 Z k 1 ) = p(x k 1 x k 2 ) p(x k 2 Z k 1 ), (9) pode-se substituir (9) em (8) obtendo-se a seguinte expressão: Mas: p(x k 1 Z k ) = = p(z k x k 1 ) p(x k 1 x k 2 ) p(x k 2 Z k 1 ) p(z k Z k 1 ) p(z k x k 1 ) p(x k 1 x k 2 ) p(x k 2 Z k 1 ). w i k p(xi k 1 Z k) q(x i k 1 Z k) Portanto: p(z k x i k 1 ) p(xi k 1 xi k 2 ) p(xi k 2 Z k 1) q(x i k 1 Xi k 2, Z k) q(x i k 2 Z k 1) p(z k x i k 1 ) p(xi k 1 xi k 2 ) q(x i k 1 Xi k 2, Z k) w i k 1, wk i = wk 1 i p(z k x i k 1 ) p(xi k 1 xi k 2 ) q(x i k 1 Xi k 2, Z. k) Admite-se ainda: q(x i k 1 X i k 2, Z k ) = q(x i k x i k 2, z k ) e finalmente: wk i = wk 1 i p(z k x i k 1 ) p(xi k 1 xi k 2 ) q(x i k 1 xi k 2, z.(10) k) Desde que respeitada a condição de similaridade citada no início desta seção, em princípio a função de densidade de importância pode ser escolhida com liberdade. Entretanto, segundo (Ristic et al., 2004) esta escolha é um aspecto crítico em filtros de partículas. Mostra-se em (Doucet and Andrieu, 2000) que a escolha ótima é dada por: q opt (x i k 1 x i k 2, z k ) = p(x i k 1 x i k 2, z k ). Visando a simplicidade do algoritmo, neste trabalho adotar-se-á uma escolha sub-ótima para a densidade de importância dada por: q(x i k 1 x i k 2, z k ) = p(x i k 1 x i k 2). (11) Esta escolha permite avançar o contador k no processo de filtragem simplesmente multiplicando-se ( ) uma nova realização das matrizes A e B por cada partícula x i k 2, i = 1,..., N e pelos valores conhecidos de u k 1, expandindo assim a partícula X i k 2 para X i k 1. Esta etapa é similar, em filtragem de Kalman, ao procedimento de previsão do estado. A substituição da equação 11 na equação 10 resulta em: w i k = w i k 1 p(z k x i k 1). (12) Esta equação é utilizada para atualizar os pesos das partículas no momento em que a medida z k se torna disponível. Em filtragem de Kalman isto equivale ao procedimento de atualização das previsões, isto é, o procedimento de correção da estimativa feita no procedimento de previsão, à luz de uma nova medida. Levando-se em conta que tanto a medida z k quanto a partícula x i k 1 e as variáveis de entrada u k são conhecidas no momento deste cálculo, conclui-se que a atualização deve ser feita por: w i k = w i k 1 V (η k, z k ), (13) sendo a função de verossimilhança V (η, z) deduzida no apêndice (equação 15) e ηk T = [xit k 1 ut k ]. Observa-se que o procedimento de previsão baseado na equação 11 não depende da ocorrência da k- ésima medida z k. Portanto nada impede que seja realizado logo após a atualização da estimativa de X k 1, resultando, conforme discutido anteriormente, na melhor estimativa possível para x k dadas as medidas em k. A estimativa de x k é portanto dada por: ˆx k = N x i k wk. i (14) É usual na evolução de um algoritmo de filtragem por partículas a observação de um fenômeno de colapso de probabilidades no qual ao longo das iterações, muitas partículas adquirem pesos muito baixos e poucas assumem peso não desprezível. A ocorrência deste fato leva a um mal-condicionamento da representação por partículas da densidade de probabilidade de X k. Para evitar este problema, quando se detecta que o número efetivo de partículas que representa a função de densidade de probabilidade é muito baixo, utiliza-se um procedimento de reamostragem de partículas, que pode ser resumido como segue. Cada partícula é clonada um número de vezes proporcional ao seu peso. Como o número total de partículas deve permanecer igual a N, resulta que as patículas com peso muito baixo não terão clones, sendo assim abandonadas. Após o procedimento de clonagem, os pesos das partículas sobreviventes são reajustados, assumindo o valor 1/N. Este procedimento é formalmente descrito em (Ristic et al., 2004). Finalmente, é possível sintetizar o algoritmo proposto para filtragem por partículas de sistemas maxplus da seguinte forma: ISSN: 2175-8905 - Vol. X 1391

1. k=0; 2. Inicializar N partículas, X i 0, i = 1,..., N; 3. Para cada k: Ler a medida z k ; Atualizar os pesos de X i k 1 (eq. 13); Se necessário, reamostrar; Gerar as partículas para k (eq. 4); Estimar x k (eq. 14); 4. Fim Na próxima seção um exemplo permite avaliar o desempenho do algoritmo de filtragem proposto. 4 Resultados Consideremos o sistema descrito pela matriz A abaixo, proposto em (Loreto et al., 2010). Supõe-se que as entradas sejam nulas (sistema autônomo) e que os estados de número 3, 6 e 8 sejam diretamente observados. Os elementos (2, 1), (5, 2), e (5, 4) da matriz A são variáveis aleatórias uniformemente distribuídas segundo os valores entre colchetes. Os outros valores são determinísticos. ε ε 4 ε ε ε 2 ε ε [1, 7] ε ε ε ε ε ε 3 ε ε 5 ε ε ε ε ε ε 1 4 ε ε ε ε 3 ε ε ε A = ε [3, 5] ε [1, 3] ε ε ε ε ε ε ε 5 ε 4 ε ε ε ε ε ε ε 4 ε ε ε ε 3 ε ε ε ε 3 ε 5 ε ε ε ε ε ε ε 2 ε ε ε A este sistema foi aplicado o filtro de partículas descrito anteriormente e comparado com o observador de estado proposto em (Hardouin et al., 2010), caracterizado por determinar um limite inferior para cada variável de estado. As figuras 2 e 3 e as tabelas comparativas dos erros médio e máximo para cada estado são apresentadas a seguir. Figura 2: Trajetória da transição 2 Figura 3: Trajetória da transição 5 Erro Médio Est. Filt. Obs. x 1 0,00 0,00 x 2 1,19 2,61 x 3 0,00 0,00 x 4 0,00 0,00 x 5 0,58 3,17 x 6 0,00 0,00 x 7 0,00 0,00 x 8 0,00 0,00 x 9 0,00 0,00 Erro Máximo Est. Filt. Obs. x 1 0,00 0,00 x 2 2,44 5,85 x 3 0,00 0,00 x 4 0,00 0,00 x 5 1,25 5,66 x 6 0,00 0,00 x 7 0,00 0,00 x 8 0,00 0,00 x 9 0,00 0,00 Observa-se que, exceto os estados 2 e 5, todos os outros são observados e filtrados com precisão. As figuras mostram que nos trechos selecionados as estimativas produzidos pelo filtro de partículas são em geral mais próximas do estado real que o seu limiar inferior. Este fato é confirmado pelas estimativas de erro dos dois algoritmos mostradas nas tabelas. 5 Conclusão Neste trabalho desenvolveu-se um algoritmo de filtragem estocástica para sistemas max-plus lineares baseado na técnica conhecida como filtro de partículas. Mostrou-se uma maneira simples de realizar a amostragem por importância, baseada na geração de previsões a partir de partículas do estado no valor precedente de contagem. Mostrou-se também como atualizar os pesos das partículas a partir da obtenção de uma nova medida, utilizando unicamente a função de verossimilhança obtida a partir da probabilidade da medida condicionada ao estado. Uma expressão para esta função de verossimilhança foi deduzida para o caso max-plus linear em que as perturbações estocásticas estão associadas aos elementos das matrizes A e B do modelo dinâmico do sistema, sendo variáveis aleatórias uniformemente distribuídas. Os resultados apresentados mostram que as técnicas de filtragem de partículas aplicadas a sistemas max-plus lineares, embora envolvendo uma escolha sub-ótima da densidade de ISSN: 2175-8905 - Vol. X 1392

importância, levam a estimativas próximas aos valores reais do estado do sistema. Estudos estão em curso visando a utilização da amostragem ótima, que tem como contrapartida maior complexidade tanto na fase de previsão como na fase de atualização. Agradecimentos Este trabalho é parte das atividades do projeto CA- PES/COFECUB 642/09 e contou com o financiamento do CNPq através do projeto PIBIC (Programa Institucional de Bolsas de Iniciação Científica - Unicamp) Referências Baccelli, F., Cohen, G., Olsder, G. and Quadrat, J. (1992). Synchronization and Linearity: An Algebra for Discrete Event Systems, John Wiley and Sons, New York. Bar-Shalom, Y., Li, X. and Kirubarajan, T. (2001). Estimation with Applications to Tracking and Navigation, Artech House, Norwood. Brown, R. and Hwang, P. (1997). Introduction to Random Signals and Applied Kalman Filtering, John Wiley and Sons, New York. Cassandras, C. G. and Lafortune, S. (1999). Introduction to Discrete Event Systems, Kluwer Academic Publishers. Doucet, A., G. S. and Andrieu, C. (2000). On sequential monte-carlo sampling methods for bayesian filtering, Statistics and Computing 10: 197 208. Hardouin, L., C.A.Maia, Cottenceau, B. and Lhommeau, M. (2010). Observer design for (max,+) linear systems, IEEE Trans. on Automatic Control 55-2: 538 543. Loreto, M. D., Gaubert, S., Katz, R. D. and Loiseau, J. (2010). Duality between invariant spaces for max-plus linear discrete event systems, SIAM J. on Control and Optimaztion 48-8: 5606 5628. Maia, C., Santos-Mendes, R., Luders, R. and Hardouin, L. (2005). Estratégias de controle por modelo de referência de sistemas a eventos discretos max-plus lineares, SBA 16(3): 263 278. Murata, T. (1989). Petri nets : properties, analysis and applications., Proceedings of the IEEE 77(4): 541 580. Ristic, B., Arulampalam, S. and Gordon, N. (2004). Beyond the Kalman Filter - Particle Filters for Tracking Applications, Artech House. Apêndice: Cálculo da função de verossimilhança Consideremos a equação max-plus z = A x B u, sendo x R n 1, z R q 1, u R p 1, A R q n e B R q p. Definindo η T = [x T u T ], e H = [A B], tem-se z = H η, sendo η R r 1, H R q r e r = n + p. Supõe-se que os elementos da matriz H, notados por h ij, sejam variáveis aleatórias independentes e uniformemente distribuídas entre h ij e h ij, sendo suas funções de probabilidade acumulada e de densidade de probabilidade respectivamente dadas por: 0 se τ h ij τ h ij F ij (τ) = se h h ij < τ h ij ij h ij 1 se τ > h ij 1 se h h ij < τ h ij p ij (τ) = ij h ij 0 se τ h ij ou τ > h ij Determina-se a seguir a densidade de probabilidade da variável aleatória z, condicionada pelo vetor η, isto é, p z (t η), sendo t = [t 1... t q ] T R q 1. Em razão da independência dos elementos de H tem-se que: q P [z t] = P [z 1 t 1 e... e z q t q ] = P [z i t i ] Porém: P [z i t i ] = P [max(h ij + η j ) t i ] j = P [h i1 t i η 1 e... e h ir t i η r ] = F ij (t i η j ) j=1 Portanto a função de probabilidade acumulada conjunta do vetor z, condicionada por η, é dada por: q F z (t η) = F ij (t i η j ) j=1 Derivando-se sucessivamente em relação a t 1... t q obtém-se a densidade de probabilidade procurada: q p z (t η) = ( F ij (t i η j )) t i = = q r ( j=1 j=1 j=1 t i (F ij (t i η j )) q r ( p ij (t i η j ) F ik (t i η k )) k j F ik (t i η k )) k j Se o vetor z for conhecido, a função acima é chamada de função de verossimilhança de η. Neste caso, substituindo-se t pelo valor conhecido de z, obtém-se: q r V (η, z) = ( p ij (z i η j ) F ik (z i η k )) j=1 k j (15) ISSN: 2175-8905 - Vol. X 1393