Inferência Sequencial em Modelos Dinâmicos Generalizados

Documentos relacionados
4 Filtro de Kalman. 4.1 Introdução

MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE SOBREVIVÊNCIA

5.1. Filtragem dos Estados de um Sistema Não-Linear Unidimensional. Considere-se o seguinte MEE [20] expresso por: t t

Séries temporais Modelos de suavização exponencial. Séries de temporais Modelos de suavização exponencial

Conceito. Exemplos. Os exemplos de (a) a (d) mostram séries discretas, enquanto que os de (e) a (g) ilustram séries contínuas.

3 Modelos de Markov Ocultos

4 Método de geração de cenários em árvore

4 O modelo econométrico

Prof. Lorí Viali, Dr. UFRGS Instituto de Matemática - Departamento de Estatística

3 Retorno, Marcação a Mercado e Estimadores de Volatilidade

*UiILFRGH&RQWUROH(:0$

3 Uma metodologia para validação estatística da análise técnica: a busca pela homogeneidade

Aplicações à Teoria da Confiabilidade

Instituto de Física USP. Física V - Aula 26. Professora: Mazé Bechara

3 Metodologia do Estudo 3.1. Tipo de Pesquisa

4 Análise de Sensibilidade

4 Metodologia Proposta para o Cálculo do Valor de Opções Reais por Simulação Monte Carlo com Aproximação por Números Fuzzy e Algoritmos Genéticos.

Introdução ao Controle Ótimo: Otimização de funções e funcionais. Otimização paramétrica. Problema de controle ótimo com tempo final fixo.

Universidade Federal do Rio de Janeiro

Universidade Federal de Minas Gerais Instituto de Ciências Exatas Departamento de Estatística

Cálculo do valor em risco dos ativos financeiros da Petrobrás e da Vale via modelos ARMA-GARCH

EXAME DE ESTATÍSTICA AMBIENTAL 2ª Época (V1)

João Vitor Dias Monteiro, Rosângela H. Loschi, Enrico A. Colosimo e Fábio N. Demarqui

EXAME DE ESTATÍSTICA AMBIENTAL 1ª Época (v1)

Instituto de Física USP. Física Moderna. Aula 23. Professora: Mazé Bechara

Teoremas Básicos de Equações a Diferenças Lineares

EXAME DE ESTATÍSTICA AMBIENTAL Ano lectivo 2015/16-1ª Época (V1) 18 de Janeiro de 2016

Aplicação. Uma famosa consultoria foi contratada por uma empresa. que, entre outras coisas, gostaria de entender o processo

REDUÇÃO DE DIMENSIONALIDADE

4 Modelo de fatores para classes de ativos

DEMOGRAFIA. Assim, no processo de planeamento é muito importante conhecer a POPULAÇÃO porque:

Tabela: Variáveis reais e nominais

Capítulo 4. Propriedades dos Estimadores de Mínimos Quadrados

5 Metodologia Probabilística de Estimativa de Reservas Considerando o Efeito-Preço

Modelagem e Previsão do Índice de Saponificação do Óleo de Soja da Giovelli & Cia Indústria de Óleos Vegetais

Modelos para Dados de Contagem com Estrutura Temporal

Circuitos Elétricos I EEL420

5 Método dos Mínimos Quadrados de Monte Carlo (LSM)

Contabilometria. Séries Temporais

Rodolfo Santos Nunes Rodrigues

4 O Papel das Reservas no Custo da Crise

Considere uma economia habitada por um agente representativo que busca maximizar:

Exercícios sobre o Modelo Logístico Discreto

4 Análise dos tributos das concessionárias selecionadas

IV. METODOLOGIA ECONOMÉTRICA PROPOSTA PARA O CAPM CONDICIONAL A Função Máxima Verosimilhança e o Algoritmo de Berndt, Hall, Hall e Hausman

Modelos Não-Lineares

ANÁLISE DE SÉRIES TEMPORAIS NA PREVISÃO DA RECEITA DE UMA MERCEARIA LOCALIZADA EM BELÉM-PA USANDO O MODELO HOLT- WINTERS PADRÃO

Problema de controle ótimo com equações de estado P-fuzzy: Programação dinâmica

TRANSFORMADA DE FOURIER NOTAS DE AULA (CAP. 18 LIVRO DO NILSON)

Características dos Processos ARMA

UNIVERSIDADE FEDERAL DE JUIZ DE FORA DEPARTAMENTO DE ESTATÍSTICA CURSO DE ESTATÍSTICA

APLICAÇÃO DOS MODELOS BAYESIANOS NA COOPERATIVA REGIONAL TRITÍCOLA SERRANA LTDA. COTRIJUÍ

Estimação em Processos ARMA com Adição de Termos de Perturbação

UNIVERSIDADE FEDERAL DE MINAS GERAIS INSTITUTO DE CIÊNCIAS EXATAS PROGRAMA DE MESTRADO EM ESTATÍSTICA THAIZE VIEIRA MARTINS

Capítulo 11. Corrente alternada

Universidade Federal de Lavras

INFLUÊNCIA DO FLUIDO NA CALIBRAÇÃO DE UMA BALANÇA DE PRESSÃO

Experiência IV (aulas 06 e 07) Queda livre

3 O Modelo SAGA de Gestão de Estoques

forma em espaço de estado e filtro de Kalman

Motivação. Prof. Lorí Viali, Dr.

Econometria Semestre

Análise de Pós-optimização e de Sensibilidade

Séries de Tempo. José Fajardo. Agosto EBAPE- Fundação Getulio Vargas

CAPÍTULO 10 DERIVADAS DIRECIONAIS

Grupo I (Cotação: 0 a 3.6 valores: uma resposta certa vale 1.2 valores e uma errada valores)

3 Modelo Teórico e Especificação Econométrica

PARTE 12 DERIVADAS DIRECIONAIS

2 Revisão Bibliográfica

6 Análise do processo de filtragem

5 Aplicação da Modelagem Estrutural ao problema de previsão de Preço Spot de Energia Elétrica.

A entropia de uma tabela de vida em previdência social *

1 Pesquisador - Embrapa Semiárido. 2 Analista Embrapa Semiárido.

Análise de séries de tempo: modelos de decomposição

Universidade de Brasília. Instituto de Ciências Exatas. Departamento de Estatística. Dissertação de Mestrado

ECONOMETRIA. Prof. Patricia Maria Bortolon, D. Sc.

4 Modelagem e metodologia de pesquisa

3 Metodologia 3.1. O modelo

3 Estudo da Barra de Geração [1]

Antes de mais nada, é importante notar que isso nem sempre faz sentido do ponto de vista biológico.

EFEITO DE REPARAMETRIZAÇÃO EM INFERÊNCIA BAYESIANA PARA UM MODELO DE REGRESSÃO EXPONENCIAL

4. Modelagem (3) (4) 4.1. Estacionaridade

Comportamento Assimptótico dos Mínimos Quadrados Questão: Será que a estimativa de mínimos quadrados converge para o valor verdadeiro dos parâmetros?

UNIVERSIDADE DA BEIRA INTERIOR FACULDADE DE CIÊNCIAS SOCIAIS E HUMANAS DEPARTAMENTO DE GESTÃO E ECONOMIA MACROECONOMIA III

3 Metodologia. 3.1 Modelos em Espaço de Estado Lineares Gaussianos

A CONTABILIZAÇÃO DOS LUCROS DO MANIPULADOR 1

5 Solução por Regressão Simbólica 5.1. Introdução

Estimação de Hiperparâmetros para um Modelo de Previsão Holt-Winters com Múltiplos Ciclos por Algoritmos Genéticos

DISSERTAÇÃO DE MESTRADO

DEPARTAMENTO DE ESTATÍSTICA - UFSCar 6 a Lista de exercício de Teoria de Matrizes 28/06/2017

AULA 22 PROCESSO DE TORNEAMENTO: CONDIÇÕES ECONÔMICAS DE USINAGEM

Prof. Carlos H. C. Ribeiro ramal 5895 sala 106 IEC

Processos de Markov. Processos de Markov com tempo discreto Processos de Markov com tempo contínuo. com tempo discreto. com tempo contínuo

2 Formulação do Problema

Aplicação de Séries Temporais na Série Teor de Umidade da Areia de Fundição da Indústria FUNDIMISA*

4 Aplicação do Modelo

3 Metodologias Analisadas

Enunciado genérico. Trabalho: Séries Temporais Disciplina: Estatística Ambiental

CINÉTICA QUÍMICA LEI DE VELOCIDADE - TEORIA

1. Introdução. 2. Séries Temporais. Modelagem e Simulação - Modelos de Previsão

Transcrição:

Inferência Sequencial em Modelos Dinâmicos Generalizados Carlos Tadeu Pagani Zanini Universidade Federal do Rio de Janeiro Insiuo de Maemáica Deparameno de Méodos Esaísicos 2015

Inferência Sequencial em Modelos Dinâmicos Generalizados Carlos Tadeu Pagani Zanini Disseração de Mesrado submeida ao Programa de Pós-Graduação em Esaísica do Insiuo de Maemáica da Universidade Federal do Rio de Janeiro - UFRJ, como pare dos requisios necessários à obenção do íulo de Mesre em Esaísica. Aprovada por: Prof. Helio dos Sanos Migon PhD - IM - UFRJ - Orienador. Prof a Mariane Branco Alves D.Sc - IM - UFRJ - Co-orienadora. Dani Gamerman PhD - IM - UFRJ. Glaura Conceição Franco D.Sc - ICE - UFMG. Rio de Janeiro, RJ - Brasil 2015 ii

iii À minha família, amigos e professores.

Do you remember sanding on he shore, Head in he clouds, your pockes filled wih dreams Bound for glory on he seven seas of life, Bu he ocean is deeper han i seems Sail your ship across he waer, Spread your wings across he sky Take he ime o see You re he one who holds he key, Or sailing ships will pass you by (...) Spread your wings and you will see You conrol your desiny, So sailing ships don pass you by Sailing ships - Whiesnake COVERDALE, DAVID & VANDENBERG, ADRIAN iv

Agradecimenos Os úlimos dois anos foram, sem dúvida alguma, os mais desafiadores da minha vida e, se consegui complear mais essa eapa, não foi sem ajuda das pessoas mais maravilhosas e compreensivas dese mundo. Sendo assim, dedico esa pequena seção do meu rabalho a agradacer a esas pessoas por esarem ao meu lado nas mais diversas e adversas siuações. Primeiramene, agradeço à minha família. Meus pais, que souberam esimular em mim o amor incondicional pelo conhecimeno desde de criança, pelos valores e princípios que me ensinaram e pelo amor e carinho que sempre iveram comigo. Ao meu irmão, agradeço por absoluamene udo, por ser o melhor amigo que alguém pode er, por esar sempre do meu lado pra me alegrar com as suas piadas, me inspirar com seus conselhos ou mesmo rir dos meus acessos de raiva quando meus programas não rodavam. Talvez você nem saiba disso, Gabriel, mas você me ensinou que a melhor maneira de resolver os problemas é com um largo sorriso na cara e não com um murro na mesa. Aos meus amigos da pós-graduação, agradeço por dividirem comigo odos esses momenos memoráveis que passamos junos esudando, programando, reclamando, rindo e ouros gerúndios. Vocês foram as pessoas com quem passei mais empo nesses dois anos em que praicamene vivi no fundão. Aqui incluo odos os meu amigos da pós-graduação em esaísica, ao pessoal da maemáica e da maemáica aplicada. Sem odos vocês, essa eapa seria muio mais difícil e menos diverida. Em especial, Marianas, Rafael e Ingrid, muiíssimo obrigado pelo convívio e companheirismo em absoluamene odos os momenos, desde as caronas, ônibus loados, confraernizações, aulas, congressos e aé os almoços no bandejão (porque é claro que eu enho que lembrar de comida sempre). Como vou senir fala de udo isso nos próximos anos... Aos meus amigos de mais longa daa, agradeço por coninuarem ao meu lado mesmo nos vários momenos em que me ausenei por cona dos compromissos com o mesrado. v

Gusavo, Fred, Raphael, Lucas, Vicene, Daniel, Bianca, Alexandre, Luciana, Paraíba e Mirna dedicar a vocês ese rabalho é uma singela forma de agradecer a udo o que vocês significam pra mim; afinal crescemos junos como uma grande (na verdade, imensa) família. Vou sempre levar na minha memória os seus conselhos, conversas, piadas e as jogainas de videogame nos fins de semana. Agradeço a odo o corpo docene da pós graduação por auar com ana dedicação para nos ransmiir da melhor forma possível o conhecimeno acadêmico necessário para o nosso fuuro profissional. Agradeço à Mariane e ao Migon por me orienarem pelos inrincados caminhos dessa jornada de pesquisa que chamamos de disseração de mesrado. Tem sido uma grande honra e um grande prazer rabalhar com vocês dois. Faço um agradecimeno especial à Mariane, que além de excelene coorienadora é uma grande amiga. Obrigado por confiar em meu poencial desde quando enrei na UFRJ ao me oferecer um projeo de iniciação cienífica (o que foi a fagulha inicial que iluminou minha decisão pela carreira acadêmica) e cujos conselhos me levaram onde esou hoje. Agradeço ambém à Alexandra e ao Migon pelo consane incenivo que me dão a paricipar de congressos. A paricipação nesses evenos conribuiu muio para o meu aprendizado e foi, ceramene, o faor que mais ajudou a norear meu caminho para o douorado. Vejo nesa nova eapa que se inicia, uma excelene oporunidade de reribuir a odo conhecimeno que vocês, professores, ransmiiram a mim e aos meus colegas neses úlimos anos. Aos professores Carlos Abano Valle, Dani Gamerman e Glaura Franco, agradeço por aceiarem fazer pare da banca. Finalmene, Agradeço ao CNPQ e à Faperj pelo apoio financeiro no primeiro e segundo ano de mesrado, respecivamene. vi

Resumo Na práica, análises esaísicas de séries emporais requerem aualização consane da inferência à medida que novas observações ornam-se disponíveis. Nesse senido, o ideal é uilizar procedimenos sequenciais de inferência, sobreudo quando os inervalos de empo em que se recebe novas informações são curos. Tendo como base esa moivação de caráer práico, ese rabalho propõe uma meodologia sequencial bayesiana aplicada a modelos dinâmicos não-lineares com resposa na família exponencial. Uiliza-se de expansão do veor de esados e linearização da equação de evolução resulane para esimar hiperparâmeros originalmene perencenes à mariz de evolução, permiindo esimação dos esados e hiperparâmeros conjunamene. Para esimação da variância de evolução de componenes dinâmicas, uiliza-se quadraura de Gauss Hermie. A aplicação da meodologia sequencial proposa aqui é exemplificada em conexos de modelos na família exponencial com esruura laene auorregressiva e ambém em modelos com efeio de função de ransferência para descrever o impaco de regressoras sobre a variável resposa. Palavras-Chaves: modelos dinâmicos, linear bayes, processos auoregressivos, compuação sequencial bayesiana, quadraura de Gauss-Hermie. vii

Absrac From a pracical poin of view, saisical ime series analysis ofen require he inference procedure o be consanly updaed as new observaions become available. In his sense, he use of sequenial inference procedures is desirable, specially when new daa arrive in shor ime inervals. Focusing on his pracical moivaion, his work proposes a sequenial Bayesian mehodology ha applies o non-linear dynamic models wih response variable belonging o he exponenial family of disribuions. Expansion of he sae vecor and linearizaion of he resuling evoluion equaion are used o esimae hyperparameers originally belonging o he evoluion marix, which allows he esimaion of he saes and hyperparameers joinly. In order o esimae he evoluion variances relaed o dynamic componens in he model, Gauss-Hermie quadraure is used. The aplicaion of he sequenial mehodology proposed here is shown in examples ha concern dynamic models in he exponenial family wih laen auorregressive srucure and in models wih ransfer funcion effecs describing how covariaes impac he response variable. Keywords: dynamic models,linear bayes, auorregressive processes, sequenial bayesian compuaion, Gauss-Hermie quadraure. viii

Sumário 1 Inrodução 1 2 Esimação bayesiana e modelos dinâmicos 4 2.1 Inferência bayesiana.............................. 4 2.1.1 Esimação ponual.......................... 6 2.1.2 Esimação por inervalo....................... 7 2.1.3 Aspeco sequencial do Teorema de Bayes.............. 7 2.1.4 Previsões............................... 8 2.1.5 Esimador linear de Bayes...................... 9 2.2 Modelos dinâmicos.............................. 11 2.2.1 Modelos lineares dinâmicos...................... 11 2.2.2 Modelos lineares generalizados dinâmicos.............. 17 2.2.3 Procedimeno sequencial de inferência em MLGD......... 19 2.3 Especificação dos erros de evolução via faores de descono........ 24 3 Inferência sequencial em modelos dinâmicos não lineares 26 3.1 Modelos dinâmicos não lineares....................... 26 3.2 Processos auorregressivos.......................... 27 3.3 Funções de ransferência........................... 30 3.4 Inferência em modelos dinâmicos não-lineares............... 34 3.4.1 Expansão do veor de esados.................... 35 3.4.2 Linearização da equação de evolução................ 36 3.4.3 Exemplos............................... 37 ix

3.5 Quadraura de Gauss-Hermie em modelos dinâmicos não-lineares............................ 39 3.6 Faores de descono para componenes auorregressivas.......... 45 4 Esudo de simulação 48 4.1 Descrição e objeivos do esudo simulado.................. 48 4.2 Modelo Normal................................ 50 4.2.1 Modelo normal com esruura laene AR(1)............ 51 4.2.2 Modelo normal com esruura laene AR(2)............ 58 4.2.3 Modelo normal com esruura laene AR(3)............ 63 4.3 Modelo Poisson................................ 69 4.3.1 Modelo poisson com esruura laene AR(1)............ 69 4.3.2 modelo Poisson com esruura laene AR(2)............ 76 4.3.3 modelo Poisson com esruura laene AR(3)............ 80 4.4 Modelo Binomial............................... 84 4.4.1 Modelo binomial com esruura laene AR(1)........... 85 4.4.2 Modelo binomial com esruura laene AR(2)........... 90 4.4.3 Modelo binomial com esruura laene AR(3)........... 94 4.5 Conclusões do esudo simulado....................... 98 5 Aplicação a dados reais 101 5.1 Inrodução................................... 101 5.2 Descrição do conjuno de dados....................... 102 5.3 Descrição dos modelos proposos...................... 103 5.3.1 Simulação............................... 107 5.3.2 Aplicação aos dados......................... 111 5.4 Conclusões da aplicação aos dados reais................... 115 6 Conclusões e rabalhos fuuros 117 A Disribuições de Probabilidade 120 x

Lisa de Tabelas 4.1 Tempo compuacional médio em segundos para implemenação da meodologia sequencial baseada na expansão do veor de esados e uso da quadraura de Gauss-Hermie aos modelos dinâmicos normais, poisson e binomial com esruura laene AR(1), AR(2) e AR(3). Foram uilizados 15 ponos na quadraura de Gauss-Hermie................. 100 5.1 Logarimo da verossimilhança prediiva para cada um dos modelos ajusados.112 5.2 Resumo a poseriori para os parâmeros esáicos considerando oda a série de dados. LI e LS (limies inferior e superior, respecivamene) referem-se aos exremos do inervalos de credibilidade marginais (média ± 2 desvios). 113 xi

Lisa de Figuras 2.1 Esimação de θ AR(1) em MLD{1, φ, V, W } com φ, W e V conhecidos. m = E(θ D ), C = V ar(θ D ). À esquerda, exibe-se a sequência C junamene com o valor limie C dado pela Proposição 2.2. À direia, exibe-se a sequência de esimaivas e inervalos de credibilidade a poseriori para os esados................................. 17 3.1 Esimação de θ AR(1) em MLD{1, φ, V, W } com φ conhecido e W especificado pelo faor de descono δ. Priori: θ 1 N(0, 100). m = E(θ D ), C = V ar(θ D )............................. 47 4.1 Resulados para uma réplica simulada do modelo normal AR(1) com φ = 0.5, 0.7, 0.95 (1 a, 2 a e 3 a linhas, respecivamene) considerando a variância de evolução fixa em seu valor real no processo de esimação........ 53 4.2 Hisogramas suavizados para a disribuição das esimaivas de φ condicionais a W no empo N com base nas 100 séries simuladas do modelo normal AR(1). Os ponos represenam a média amosral do respecivo conjuno de esimaivas ponuais E(φ W, D N ). A linha racejada represena o valor verdadeiro de φ.............................. 54 4.3 Hisogramas suavizados para a disribuição das esimaivas de V condicionais a W no empo N com base nas 100 séries simuladas para o modelo normal AR(1). Os ponos represenam a média amosral do respecivo conjuno de esimaivas ponuais E(V W, D N ). A linha racejada represena o valor verdadeiro de V......................... 54 xii

4.4 Resulados para uma réplica simulada do modelo normal AR(1) com φ = 0.5, 0.7, 0.95 (1 a, 2 a e 3 a linhas, respecivamene) esimando a variância de evolução via quadraura de Gauss-Hermie................ 56 4.5 Esimação da variância de evolução W para a primeira réplica simulada do modelo normal AR(1) com φ {0.5, 0.7, 0.95} (1 a, 2 a e 3 a coluna, respecivamene)............................... 57 4.6 Hisogramas suavizados para a disribuição das esimaivas de φ, W e V (1 a, 2 a e 3 a linhas, respecivamene) no empo N, incondicionalene a W, com base nas 100 séries simuladas com φ {0.5, 0.7, 0.95}. Os ponos represenam a média amosral do respecivo conjuno de esimaivas ponuais E(φ D N ). A linha racejada represena o valor verdadeiro de φ. 58 4.7 Resulados para a 1 a réplica simulada do modelo normal AR(2) com φ = (φ 1, φ 2 ) = (0.1, 0.8) considerando a variância de evolução fixa em seu valor real no processo de esimação......................... 59 4.8 Hisogramas suavizados para a disribuição das esimaivas de φ 1 e φ 2 condicionais a W no empo N com base nas 100 séries simuladas do modelo normal AR(2). Os ponos represenam a média amosral do respecivo conjuno de esimaivas ponuais E(φ 1 W, D N ) (1 a linha) e E(φ 1 W, D N ) (2 a linha). A linha racejada represena o valor verdadeiro de φ 1 ou φ 2.. 60 4.9 Resulados para a primeira réplica simulada do modelo normal AR(2) com φ 1 = 0.1, φ 2 = 0.8 esimando a variância de evolução via quadraura de Gauss-Hermie................................. 62 4.10 Esimação da variância de evolução W para a primeira réplica simulada do modelo normal AR(2) com φ 1 = 0.1 e φ 2 = 0.8............. 62 4.11 Hisogramas suavizados para a disribuição das esimaivas de φ 1 e φ 2 no empo N com base nas 100 séries simuladas do modelos normal AR(2). Os ponos represenam a média amosral do respecivo conjuno de esimaivas ponuais E(φ D N ). A linha racejada represena o valor verdadeiro de φ 1, φ 2, W e V................................ 63 xiii

4.12 Resulados para a primeira réplica simulada do modelo normal AR(3) com φ = (φ 1, φ 2, φ 3 ) = (0.81, 0.77, 0.86) considerando a variância de evolução fixa em seu valor real no processo de esimação............... 65 4.13 Hisogramas suavizados para a disribuição das esimaivas de φ condicionalmene a W no empo N com base nas 100 séries simuladas do modelo normal AR(3). Os ponos represenam a média amosral do respecivo conjuno de esimaivas ponuais E(φ W, D N ), i {1,..., 5}. A linha racejada represena o valor verdadeiro de φ i................ 66 4.14 Hisogramas suavizados para a disribuição das esimaivas de V no empo N com base nas 100 séries simuladas do modelo normal AR(3) condicionalmene a W. Os ponos represenam a média amosral do respecivo conjuno de esimaivas ponuais E(V W, D N ). A linha racejada represena o valor verdadeiro de V......................... 66 4.15 Resulados para a 1 a réplica simulada do modelo normal AR(3) com φ = (φ 1, φ 2, φ 3 ) = (0.81, 0.77, 0.86) esimando a variância de evolução W via quadraura de Gauss-Hermie......................... 68 4.16 Resulados referenes à esimação da variância de evolução W e de observação V para uma réplica simulada do modelo normal AR(3) com φ = (φ 1, φ 2, φ 3 ) = (0.81, 0.77, 0.86)..................... 68 4.17 Hisogramas suavizados para a disribuição das esimaivas de φ i, i {1,..., 5}, W e V no empo N com base nas 100 séries simuladas do modelo normal AR(3). Os ponos represenam a média amosral do respecivo conjuno de esimaivas ponuais E(φ i D N ), E(W D N ) e E(V D N ). A linha racejada represena o valor verdadeiro de φ i, W e V....... 69 4.18 Resulados para a 1 a réplica simulada do modelo Poisson AR(1) com φ 1 {0.5, 0.7, 0.95} (1 a, 2 a e 3 a linhas respecivamene) considerando a variância de evolução fixa em seu valor real no processo de esimação... 71 4.19 Esimaivas a poseriori para a soma do nível do predior com o processo AR(1): β + µ para a primeira réplica simulada do modelo Poisson AR(1). 72 xiv

4.20 Hisogramas suavizados para a disribuição das esimaivas de φ condicionalmene a W, no empo N com base nas 100 séries simuladas do modelo Poisson AR(1). Os ponos represenam a média amosral do respecivo conjuno de esimaivas E(φ W, D N ). A linha racejada represena o valor verdadeiro de φ.............................. 72 4.21 Resulados para a 1 a réplica simulada do modelo Poisson AR(1) com φ 1 {0.5, 0.7, 0.95} (1 a, 2 a e 3 a colunas respecivamene) esimando a variância de evolução................................... 74 4.22 Resulados referenes à esimação da variância de evolução W para uma réplica simulada do modelo Poisson AR(1) com φ 1 {0.5, 0.7, 0.95} (1 a, 2 a e 3 a linhas respecivamene)........................ 75 4.23 Hisogramas suavizados para a disribuição das esimaivas de φ no empo N com base nas 100 séries simuladas com φ {0.5, 0.7, 0.95}. Os ponos represenam a média amosral do respecivo conjuno de esimaivas ponuais E(φ D N ). A linha racejada represena o valor verdadeiro de φ. 76 4.24 Resulados para uma réplica simulada do modelo Poisson AR(2) com φ = (φ 1, φ 2 ) = (0.1, 0.8) considerando a variância de evolução fixa em seu valor real no processo de esimação........................ 77 4.25 Hisogramas suavizados para a disribuição das esimaivas de φ condicionais a W no empo N com base nas 100 séries simuladas com φ = (φ 1, φ 2 ) = (0.1, 0.8). Os ponos represenam a média amosral do respecivo conjuno de esimaivas ponuais E(φ 1 W, D N ) ou E(φ 2 W, D N ). A linha racejada represena o valor verdadeiro de φ 1 e φ 2......... 78 4.26 Resulados para uma réplica simulada do modelo Poisson AR(2) com φ = (φ 1, φ 2 ) = (0.1, 0.8) esimando a variância de evolução aravés de quadraura de Gauss Hermie......................... 79 xv

4.27 Hisogramas suavizados para a disribuição das esimaivas de φ no empo N com base nas 100 séries simuladas do modelo Poisson AR(2) com φ = (φ 1, φ 2 ) = (0.1, 0.8). Os ponos represenam a média amosral do respecivo conjuno de esimaivas ponuais E(φ 1 D N ), E(φ 2 D N ) e E(W D N ). A linha racejada represena o valor verdadeiro de φ 1, φ 2 e W. 79 4.28 Resulados para uma réplica simulada do modelo Poisson AR(3) com φ = (φ 1, φ 2, φ 3 ) = (0.81, 0.77, 0.86) considerando a variância de evolução fixa em seu valor real no processo de esimação.................. 81 4.29 Hisogramas suavizados para a disribuição das esimaivas de φ i, i{1,..., 5} condicionais a W no empo N com base nas 100 séries simuladas do modelo Poisson AR(3). Os ponos represenam a média amosral do respecivo conjuno de esimaivas ponuais E(φ i W, D N ). A linha racejada represena o valor verdadeiro de φ i...................... 82 4.30 Resulados para uma réplica simulada do modelo Poisson AR(3) com φ = (φ 1, φ 2, φ 3 ) = (0.81, 0.77, 0.86) esimando a variância de evolução.... 83 4.31 Resulados referenes à esimação da variância de evolução W para a primeira réplica simulada do modelo Poisson AR(3) com φ = (φ 1, φ 2, φ 3 ) = (0.81, 0.77, 0.86)............................... 84 4.32 Hisogramas suavizados para a disribuição das esimaivas de φ i, i {1,..., 5} e W no empo N com base nas 100 séries simuladas do modelo Poisson AR(3). Os ponos represenam a média amosral do respecivo conjuno de esimaivas ponuais E(φ i D N ) ou E(W D N )........ 84 4.33 Resulados para uma réplica simulada do modelo binomial AR(1) com φ 1 {0.5, 0.7, 0.95} (1 a, 2 a e 3 a linhas respecivamene) considerando a variância de evolução fixa em seu valor real no processo de esimação.. 86 4.34 Hisogramas suavizados para a disribuição das esimaivas de φ no empo N condicionalmene a W com base nas 100 séries simuladas do modelo binomial AR(1). Os ponos represenam a média amosral do respecivo conjuno de esimaivas ponuais E(φ W, D N )............... 87 xvi

4.35 Resulados para a primeira réplica simulada do modelo binomial AR(1) com φ 1 {0.5, 0.7, 0.95} (1 a, 2 a e 3 a colunas, respecivamene) esimando a variância de evolução............................ 88 4.36 Resulados referenes à esimação da variância de evolução W para uma réplica simulada do modelo binomial AR(1) com φ 1 {0.5, 0.7, 0.95}... 89 4.37 Hisogramas suavizados para a disribuição das esimaivas de φ e W no empo N com base nas 100 séries simuladas com do modelo binomial AR(1). Os ponos represenam a média amosral do respecivo conjuno de esimaivas ponuais E(φ D N ) e E(W D N ).............. 90 4.38 Resulados para a primeira réplica simulada do modelo binomial AR(2) considerando a variância de evolução fixa em seu valor real no processo de esimação................................... 91 4.39 Hisogramas suavizados para a disribuição das esimaivas de φ 1 e φ 2 condicionalmene a W no empo N com base nas 100 séries simuladas do modelo binomial AR(2). Os ponos represenam a média amosral do respecivo conjuno de esimaivas ponuais E(φ i W, D N ), i {1, 2}.... 91 4.40 Resulados para a primeira réplica simulada do modelo binomial AR(2) esimando a variância de evolução...................... 92 4.41 Resulados referenes à esimação da variância de evolução W para a primeira réplica simulada do modelo binomial AR(2)............. 93 4.42 Hisogramas suavizados para a disribuição das esimaivas de φ 1 e φ 2 no empo N com base nas 100 séries simuladas com φ = (φ 1, φ 2 ) = (0.1, 0.8). Os ponos represenam a média amosral do respecivo conjuno de esimaivas ponuais E(φ i D N ), i {1, 2} e E(W D N )........... 93 4.43 Resulados para a primeira réplica simulada do modelo binomial AR(3) considerando a variância de evolução fixa em seu valor real no processo de esimação.................................... 95 xvii

4.44 Hisogramas suavizados para a disribuição das esimaivas de φ i condicionais a W no empo N com base nas 100 séries simuladas do modelo binomial AR(3) com φ = (φ 1, φ 2, φ 3 ) = (0.81, 0.77, 0.86). Os ponos represenam a média amosral do respecivo conjuno de esimaivas ponuais E(φ i W, D N ), i {1,..., 5}...................... 96 4.45 Resulados para a primeira réplica simulada do modelo binomial AR(3) esimando a variância de evolução...................... 97 4.46 Resulados referenes à esimação da variância de evolução W para a prieira réplica simulada do modelo nbinomial AR(3)............. 97 4.47 Hisogramas suavizados para a disribuição das esimaivas de φ no empo N com base nas 100 séries simuladas do modelo binomial AR(3) com φ = (φ 1, φ 2, φ 3 ) = (0.81, 0.77, 0.86). Os ponos represenam a média amosral do respecivo conjuno de esimaivas ponuais E(φ i D N ), i {1,..., 5} e E(W D N ).................................. 98 5.1 Séries emporais da variável resposa e das regressoras........... 102 5.2 Inervalos de credibilidade a poseriori (média ± 2 desvios) para os parâmeros esáicos do modelo 7, condicionalmene a oda a série de dados, obidos via meodologia sequencial e via MCMC................... 109 5.3 Função de resposa imediaa ao impulso (γ ) esimada sequencialmene e via MCMC no modelo 7. Exibe-se a série real e inervalos de credibilidade a poseriori (média ± 2 desvios) condicionalmene a oda a série de dados. 110 5.4 Hisograma (MCMC) e curva de densidade aproximada (meodologia sequencial) para a variância de evolução a poseriori no modelo 7. Curva obida com 15 ponos na quadraura de Gauss-Hermie........... 111 5.5 Inervalos de credibilidade a poseriori (média ± 2 desvios-padrões) para os parâmeros esáicos considerando-se oda a série de dados....... 114 5.6 Função de resposa ao impulso esimada para o modelo 4.......... 114 5.7 Previsões um passo à frene para o número de óbios de crianças por doença respiraória em São Paulo.......................... 115 xviii

Capíulo 1 Inrodução Em muias siuações de caráer práico, exise o ineresse, ou a necessidade, em compreender o comporameno de alguma variável no decorrer do empo ou mesmo em prever a rajeória de al variável em empos fuuros. Nesses conexos, é comum que se receba novas informações com o passar do empo, o que requer múliplas aplicações do procedimeno inferencial adoado, visando incorporar novas observações de variáveis ao modelo conforme elas se ornam disponíveis. Assim, é naural recorrer a procedimenos sequenciais de inferência para modelagem de séries emporais. Os modelos de espaço de esados, ambém conhecidos como modelos dinâmicos, êm sido amplamene uilizados nos úlimos anos para raar de dados com dependência emporal sob enfoque bayesiano. Essa classe de modelos é basane flexível, permiindo efeios laenes esáicos e dinâmicos sobre a resposa. A dinâmica de ais efeios é deerminada por uma mariz de evolução que pode depender de hiperparâmeros, em geral, desconhecidos. Nessas circunsâncias, é fundamenal a inferência sobre ais parâmeros, uma vez que eles deerminam a dinâmica de processos laenes que por sua vez descreverão o comporameno da variável resposa ao longo do empo. Nos modelos dinâmicos em que a variável resposa é um membro da família exponencial e não há parâmeros desconhecidos na mariz de evolução, Wes e al. (1985) descrevem meodologia sequencial de inferência para os esados (feia em ermos de média e mariz de covariâncias), propondo especificação da sequência de variâncias de evolução via faores de descono. Em conexos onde exisem parâmeros a serem esimados na ma- 1

riz de evolução, Pole (1988) e Pole e Wes (1990) propõem a esimação sequencial de ais parâmeros uilizando quadraura de Gauss-Hermie, ambém especificando a sequência de variâncias de evolução aravés de faores de descono, porém somene abordam casos em que se em normalidade para a variável resposa. Nesa disseração, propõe-se um esquema sequencial de inferência bayesiana em modelos dinâmicos na família exponencial com hiperparâmeros na mariz de evolução. Para inferir sobre os hiperparâmeros uilizamos a expansão do veor de esados e linearização da equação de evolução. A variância de evolução de componenes dinâmicas é suposa consane e esimada via quadraura de Gauss-Hermie. A implemenação da meodologia sequencial proposa foi feia em linguagem R (R Developmen Core Team, 2008), com uilização do pacoe fasghquad (Blocker, 2014) para ober os ponos da quadraura de Gauss-Hermie e pesos associados. A seguir, descreve-se brevemene a esruura da disseração. No capíulo 2, apresena-se conceios gerais sobre inferência bayesiana e modelos dinâmicos que servirão como base para o resane da disseração. Nese capíulo, considerase modelos dinâmicos com resposa perencene à família exponencial e descreve-se em linhas gerais o procedimeno sequencial proposo por Wes e al. (1985) em ais modelos. O capíulo 3 aborda modelos dinâmicos não lineares, apresenando a meodologia sequencial proposa para esimação dos esados, dos parâmeros de não-linearidade (ou hiperparâmeros) que caracerizam a dinâmica dos esados e das variâncias de evolução. As variâncias de evolução são esimadas via quadraura de Gauss Hermie ou especificadas via faores de descono. A esimação dos hiperparâmeros é feia incluindo-os como componenes do veor de esados aplicando-se, em seguida, écnicas de linearização que possibiliam aplicar do esquema sequencial para esimação dos esados, descrio em Wes e al. (1985). Além disso, descreve-se brevemene dois ipos de processos laenes (processos auorregressivos e de função de ransferência), que serão abordados no esudo simulado e na aplicação a dados reais. O capíulo 4 consise num esudo simulado de modelos dinâmicos normal, poisson e binomial com esruura laene auorregressiva de ordem 1, 2 e 3 aplicando-se a meodologia sequencial descria no capíulo 3. O objeivo é idenificar a eficiência do procedimeno 2

sequencial em esimar ais processos, bem como os parâmeros que os definem. O capíulo 5 descreve uma aplicação a dados reais no conexo de desfechos epidemiológicos, onde esuda-se a modelagem de efeios cumulaivos de regressoras sobre a resposa aravés de funções de ransferência. Nese capíulo, faz-se uma comparação enre as esimaivas obidas sequencialmene aravés da meodologia proposa nese rabalho e obidas por méodo de Mone Carlo via Cadeias de Markov (MCMC), uilizando o esquema proposo por Gamerman (1998) e aplicado a esse conexo de funções de ransferência por Alves e al. (2010). Em seguida, o capíulo 6 apresena as conclusões gerais sobre a meodologia proposa na disseração, descrevendo possíveis exensões do méodo e aplicações para rablhos fuuros. Por fim, o apêndice apresena a paramerização adoada para algumas das disribuições que aparecem ao longo do exo. São elas: bea binomial, binomial negaiva, gama, gama inversa, log normal, -suden com parâmeros de posição e escala e -suden mulivariada com posição e escala. 3

Capíulo 2 Esimação bayesiana e modelos dinâmicos Ese capíulo faz uma breve inrodução à inferência paramérica sob enfoque bayesiano, apresenando os conceios básicos referenes a esimação de parâmeros e a realização de previsões. Apresena-se, em seguida, a classe dos modelos dinâmicos (ambém conhecidos na lieraura como modelos de espaço de esados), os quais permiem que um conjuno de parâmeros responsáveis pela descrição probabilísica das observações varie com o decorrer do empo. Considera-se primeiramene o caso em que a variável resposa em disribuição normal para, em seguida, raar do caso mais geral em que a resposa é um membro da família exponencial. O caso em que a evolução dos parâmeros do modelo ocorre de forma não linear é raado no capíulo 3. 2.1 Inferência bayesiana Considere Y uma variável de ineresse com disribuição de probabilidade caracerizada por um veor de parâmeros θ. Em geral, visando compreender o comporameno probabilísico de Y, obém-se uma amosra aleaória y 1,..., y n dessa variável, a parir da qual obém-se esimaivas para θ. A plausibilidade desse procedimeno reside no fao de que os dados observados carregam consigo informação sobre os parâmeros θ, sendo essa informação raduzida formalmene em ermos maemáicos pela função de verossi- 4

milhança l( ; y 1,..., y n ) : Θ R +, dada por l(θ ; y 1,..., y n ) = p(y 1,..., y n θ), onde Θ é o espaço paramérico e p(y 1,..., y n θ) é a função de densidade de (y 1,..., y n ) no caso em que o veor é conínuo, ou a função de probabilidades quando o veor é discreo. A verossimilhança pode ser visa, porano, como medida de plausibilidade para o valor θ Θ à luz das observações (y 1,..., y n ). Sob o paradigma bayesiano considera-se ambém a informação subjeiva sobre o veor paramérico θ. Essa informação é raduzida maemaicamene pela disribuição de probabilidades a priori p : Θ R +, a qual é especificada previamene à observação dos dados, de modo que oda informação proveniene dos dados eseja conida apenas na função de verossimilhança. O Teorema de Bayes, enunciado a seguir, esabelece a relação enre priori e verossimilhança na composição da incereza acerca dos parâmeros. Teorema 2.1. (Teorema de Bayes) Sejam θ Θ o veor de parâmeros, p(θ) a densidade (ou função de probabilidade) a priori, e y o veor de observações com verossimilhança l(θ; y) = p(y θ). Enão, a disribuição a poseriori é dada por p(θ y) = p(y θ)p(θ) p(y θ)p(θ), p(y θ)p(θ)dθ em que o produo p(y θ)π(θ), bem como qualquer de seus múliplos por funções que não dependam de θ, é chamado núcleo da disribuição a poseriori. A incereza sobre θ após a observação dos dados é represenada em ermos probabilísicos aravés da disribuição a poseriori, cuja densidade (ou função de probabilidade) é denoada por p( y 1,..., y n ) : Θ R +. A parir da disribuição a poseriori são calculadas as esimaivas ponuais dos parâmeros e medidas de incereza referenes ao processo de esimação, denre ouras quanidades de ineresse possíveis. 5

2.1.1 Esimação ponual O processo de esimação ponual do veor paramérico θ com dimensão, digamos, p 1 pode ser viso sob o paradigma da eoria da decisão (Migon e al., 2014). O objeivo é sineizar a informação sobre θ em um único pono ˆθ do supore da disribuição a poseriori. Considere Ω o conjuno de odos os valores possíveis para um veor de observações y = (y 1,..., y n ). Define-se a regra de decisão δ : Ω A como a função que associa a cada veor de observações y a decisão δ(y) no espaço das ações A. Em seguida, especifica-se a função de perda L : A Θ R + que associa à decisão δ(y) A uma perda que depende do verdadeiro valor de θ Θ. Por fim, define-se a função de risco R(δ) = E[L(δ, θ) y], que represena a perda esperada quando se adoa a decisão δ = δ(y). O objeivo é, dadas a função de perdas L e as observações y, omar a decisão óima δ = δ(y) que minimiza o risco R(δ) = E[L(δ, θ) y]. A regra de decisão óima é conhecida em pelo menos 3 imporanes casos: Perda quadráica: L(δ, θ) = (δ θ) (δ θ). A decisão óima é a média a poseriori δ = ˆθ = E(θ y). Perda absolua: L(δ, θ) = δ θ.a decisão óima é a mediana a poseriori: δ = ˆθ = med, onde P (θ < med y) = 0, 5. Aqui, quando θ é mulidimensional, a desigualdade θ < med significa que cada enrada de θ é menor que a respeciva enrada do veor med. Perda 0 1: 1 se δ = θ, L(δ, θ) = I(δ = θ) = 0 se δ θ. A decisão óima nesse caso é a moda a poseriori δ = ˆθ = arg max θ Θ p(θ y). 6

2.1.2 Esimação por inervalo Em muios problemas práicos, exise ineresse não apenas em esimaivas ponuais dos parâmeros, mas ambém na incereza associada a essas medidas. Dessa forma, emse o ineresse em considerar alguma medida resumo da poseriori que seja capaz de refleir a incereza associada ao procedimeno de esimação ponual. No caso, uma possibilidade é realizar esimação aravés de inervalos de credibilidade a poseriori. Uma região C R p é dia região de credibilidade com probabilidade γ a poseriori para θ se P (θ C y) = γ, onde p é a dimensão de θ. No caso θ unidimensional, referese a C como inervalo de credibilidade. Além disso, no caso em que p > 1, cosuma-se reporar inervalos de credibilidade marginais unidimensionais para cada componene do veor de esados θ. 2.1.3 Aspeco sequencial do Teorema de Bayes O Teorema de Bayes pode ambém ser viso sob o aspeco sequencial, segundo o qual cada observação é incorporada em sequência à informação a priori para compor a disribuição a poseriori. Mais especificamene, denoando o veor de observações por y = (y 1, y 2,..., y n ), emos no insane zero a disribuição a priori p(θ). Incorporada a primeira observação y 1 à informação a priori, aualiza-se a incereza a respeio de θ aravés do Teorema de Bayes, obendo assim a disribuição a poseriori no empo 1: p(θ y 1 ) p(y 1 θ)p(θ) Agora, no insane 2, oda a informação prévia a respeio de θ (represenada pela poseriori no insane 1: p(θ y 1 )) é considerada informação a priori e, ao ser combinada com a observação no empo correne, resula na poseriori no insane 2: p(θ y 1, y 2 ) p(y 2 θ, y 1 )p(θ y 1 ) = p(y 2 θ)p(θ y 1 ), onde a igualdade ocorre quando se supõe independência enre as observações dado o conhecimeno do veor paramérico, o que significa assumir que o veor paramérico sineiza oda a informação necessária para deerminação do comporameno probabilísico 7

de y i. Em ouras palavras, o conhecimeno de y j, para qualquer j i, não alera em nada a disribuição probabilísica de y i se os parâmeros são conhecidos. Prosseguindo com o mesmo raciocínio, em-se no empo n a relação de recorrência p(θ y 1,..., y n ) p(y n θ)p(θ y n 1,..., y 1 ), que permie chegar à fórmula enunciada no Teorema de Bayes: p(θ y 1,..., y n ) p(y n θ)p(y n 1 θ)...p(y 1 θ)p(θ) = p(y θ)p(θ), onde a igualdade novamene ocorre quando se supõe independência enre as observações condicionalmene ao veor paramérico. Porano, a disribuição a poseriori obida sequencialmene é a mesma que se obém com uma única aplicação do Teorema de Bayes considerando o veor compleo y = (y 1,..., y n ). Nesse pono, cabe uma breve consideração sobre a noação que por vezes será usada ao longo dese rabalho no que se refere à aualização sequencial de informação segundo a óica bayesiana. Considera-se D 0 o conjuno conendo a informação necessária para compor a disribuição a priori p(θ). Recursivamene, em-se no insane o conjuno D 1 represenando oda informação disponível a priori, ou seja, aé o insane 1. Com a chegada de uma nova observação y, em-se D = {y } D 1 no caso em que não se deseja incorporar nenhuma informação exerna aos dados do insane 1 para o insane. Porano, em problemas onde se uiliza de informação subjeiva apenas no insane prévio à observação do primeiro dado y 1, em-se D = {y 1,..., y } D 0. 2.1.4 Previsões A disribuição prediiva é um objeo probabilísico que permie não só fazer previsões como ambém avaliar a adequação do modelo eórico formulado pelo esaísico, pois permie verificar se o modelo obido é capaz de reproduzir dados próximos dos que foram observados sob o pono de visa prediivo. 8

A disribuição prediiva para um veor de dados não observados z a parir do conjuno de observações y é a função densidade (ou função de probabilidade) dada por p(z y) = Θ p(z θ)p(θ y)dθ = E θ y [p(z θ)]. A disribuição prediiva para z pode ser inerpreada como uma média dos valores de l(θ; z) = p(z θ) ponderados pela poseriori p(θ y). Nese pono, é imporane observar que a predição feia desa forma esá condicionada apenas ao veor de observações, sem nenhuma dependência analíica com respeio ao veor paramérico. 2.1.5 Esimador linear de Bayes Conforme viso na subseção 2.1.1, fixada uma função de perda, a eoria da decisão fornece o esimador óimo para o veor paramérico θ procurando denre odas as funções dos dados, que aqui represenamos por δ = δ(y), aquela que minimiza o risco a poseriori R(δ) = E[L(δ, θ) y]. Exisem casos em que não se conhece a forma analíica do esimador óimo de θ segundo o criério de minimização do risco a poseriori, mesmo quando se uiliza uma das funções de perda apresenadas na subseção 2.1.1. Isso pode ocorrer, por exemplo, quando não se em forma analíica disponível para a densidade poseriori p(θ y) e, por consequência, não se consegue ober a média, moda ou mediana para θ y. Nessas circunsâncias, o processo de esimação linear de Bayes fornece uma aproximação para a solução óima dada pela eoria da decisão quando se considera a função de perda quadráica. O procedimeno, ao invés de minimizar o risco a poseriori sob odas as possíveis funções dos dados, minimiza o risco a priori E[L(δ, θ)], resringindo-se as decisões a funções lineares d(y) do veor de observações. O esimador obido dessa forma recebe o nome de esimador linear de Bayes, e sua perda quadráica é usada como aproximação para a variância a poseriori de θ. 9

Proposição 2.1. (Esimador Linear de Bayes) O esimador linear de Bayes para θ é a função linear das observações d = d(y) que minimiza a perda quadráica esperada a priori E[(θ d) (θ d)]. Em suma, o esimador linear de Bayes pode ser viso como uma aproximação linear para a função δ(y) = E(θ y) e o risco associado ao esimador linear de Bayes consiui uma aproximação para V ar(θ y). A obenção de esimadores lineares de Bayes é pare essencial do procedimeno de inferência sequencial em modelos dinâmicos descrio na seção 2.2. Em paricular, uiliza-se a proposição a seguir, cuja demonsração pode ser visa em Wes e Harrison (1997). Proposição 2.1. Suponha um veor aleaório (θ, y) com veor de médias e mariz de covariâncias dados por y f, Q S. θ a S R Nesse caso, o esimador linear de Bayes para θ é d = d(y) = a + SQ 1 (y f) e a perda quadráica esperada para esse esimador é R SQ 1 S. Nauralmene, o valor R SQ 1 S corresponde à menor perda esperada a priori sob funções lineares das observações y. Noe-se que, sob normalidade da disribuição conjuna (y, θ), o esimador linear de Bayes para θ coincide com a esperança a poseriori E(θ y) e o risco associado coincide com a variância a poseriori V ar(θ y). 10

2.2 Modelos dinâmicos Os modelos dinâmicos, ambém conhecidos como modelos de espaço de esados, assumem que a cada empo N a observação y é caracerizada probabilisicamene por um veor de parâmeros θ (denominado veor de esados) cujas componenes podem variar ao longo do empo. 2.2.1 Modelos lineares dinâmicos Um modelo linear dinâmico (MLD) em sua forma geral é descrio por duas equações: a equação de observação, que descreve a relação enre covariáveis e a variável resposa, e a equação de evolução, que descreve a forma com que os parâmeros do modelo evoluem com o empo: y = F θ + v, v N(0, V ) θ = G θ 1 + w, w N(0, W ), (2.1) sendo (v ) N e (w ) N sequências de variáveis aleaórias ais que v v s, e w w s, s. Além disso, v w s, s,. O erro v é chamado erro de observação e w é chamado erro de evolução. Um MLD é, porano, caracerizado pela quádrupla (F, G, V, W ), onde: F é o veor de planejameno no empo, com valores conhecidos que podem coner variáveis explicaivas: F = (x 1,..., x p ) ; y é a resposa observada no empo ; θ é o veor paramérico no empo : θ = (θ 1,..., θ p ) ; G é a mariz de evolução no empo (dimensão p p). 11

As variâncias V e W conrolam a magniude dos erros de observação e de evolução, respecivamene. Quano maiores os valores na posição i, i {1,..., p} da diagonal das marizes de covariâncias W, {1,..., p}, mais voláil é a rajeória da componene θ i, do veor de esados θ ao longo do empo, e quano maiores os valores de V, maior é a variabilidade das observações em orno do predior linear η = F θ que, no caso normal, coincide com a média da variável resposa: E(y ) = µ = η. A classe MLD abrange vários ipos de modelos imporanes, como os Modelos de Regressão Linear Normais (F, G = I, V = σ 2, W = 0) e os Modelos de Séries Temporais (F = F, G = G, V, W ). Sob o enfoque Bayesiano necessia-se ainda especificar as disribuições a priori para os parâmeros de ineresse de modo a complear a descrição do modelo. Adoando priori normal para θ 1 e conhecidos V e W, em-se forma analíica fechada para as poserioris θ D, = 1, 2,..., conforme análise bayesiana sequencial do modelo (2.1) dada pelas equações a seguir, em que θ 1 D 1 N(m 1, C 1 ). Priori no empo : θ D 1 N(a, R ), a = G m 1 R = G C 1 G + W, Prediiva no empo : y D 1 N(f, Q ), = F a f Q = F R F + V, Veor de coeficienes adapaivos A e erro de previsão e : A = R F Q 1 e = y f, Poseriori no empo : θ D N(m, C ), m = a + A e C = R A A Q. 12

Noe-se, a parir das equações, que y não consa na expressão analíica de nenhuma das variâncias R, Q, C, porano, as variâncias a poseriori diag(c ) decrescem em função apenas da quanidade de observações conida no veor de dados, independenemene dos pariculares valores observados para y. Nessas circunsâncias em-se conjugação para o veor de esados, porano θ D e θ D 1 êm disribuição normal N e as prediivas y D 1 ambém são obidas analiicamene e possuem disribuição normal. Também é possível ober forma analíica fechada para as poserioris via conjugação no caso em que V = V, N com V desconhecido. Nessas circunsâncias, obém-se conjugação adoando priori Normal-Gama (Wes e Harrison, 1997) para o veor (θ, τ) D, onde τ = 1/V. Marginalmene, o veor de esados θ em disribuição T-Suden mulivariada (ano a priori quano a poseriori) e a precisão dos erros de observação τ D em disribuição Gama. As equações do procedimeno sequencial bayesiano para o caso em que V é desconhecido esão descrias a seguir, onde V D 1 GamaInv( n 1 2, d 1 2 ) e θ 1 D 1 N(m 1, C 1 ). Esse conjuno de equações consa em Wes e Harrison (1997) pp. 119 a 122. Priori no empo : θ D 1 T n 1 (a, R ), a = G m 1 R = G C 1 G + W, (2.2) Prediiva no empo : y D 1 T n 1 (f, Q ), (S 1 = d 1 /n 1 ) f = F a Q = F R F + S 1, (2.3) Veor de coeficienes adapaivos A e erro de previsão e : A = R F Q 1 e = y f, (2.4) Variância observacional a poseriori: V D GamaInv( n 2, d 2 ), 13

n = n 1 + 1 d = d 1 + S 1 e 2 /Q, (2.5) Poseriori no empo : θ D T n (m, C ), (S = d /n ) m = a + A e C = (R A A Q )S /S 1. (2.6) No caso em que se desconhece as variâncias de evolução, as poserioris marginais (ano para os esados quano para a variância observacional) não são mais conhecidas analiicamene. Exisem diversas proposas na lieraura para raar dese caso, denre as quais cia-se aqui apenas algumas delas a íulo de exeplificação. Frühwirh-Schnaer (1994) e Carer e Kohn (1994) descrevem um esquema MCMC para o caso em que V e W são consanes no empo onde as condicionais compleas de V, W e θ são conhecidas, permiindo assim a simulação de cadeias aravés do amosrador de Gibbs. Poseriormene, Gamerman (1998) descreve ouro amosrador de Gibbs obido reparamerizando o modelo em ermos dos erros de evolução w, reconsruindo-se o veor de esados θ ao final da geração das cadeias. No que ange aplicação de meodologia sequencial, diversos esquemas para implemenação de filros de parículas podem ser considerados, denre os quais cia-se aqui Liu e Wes (2001), Sorvik (2002) e Carvalho e al. (2010) por raarem do caso geral em que θ coném, possivelmene, componenes esáicas e as variâncias V e W são desconhecidas. Cada um dos rês rabalhos propõe uma forma diferene de raar o problema de degeneração das parículas conforme o empo progride. É possível incorporar aos modelos dinâmicos diversos ipos de esruuras laenes para descrever a evolução do processo observado y. Essa classe de modelos permie raar, por exemplo, de séries que apresenem simulaneamene uma endência polinomial linear, sazonalidade, influência de covariáveis e assim por diane. Mais precisamene, cada uma das p esruuras laenes corresponde a um bloco θ i, de componenes do veor de esados, a uma mariz de evolução G i,, a uma mariz de planejameno F i, e uma mariz de covariâncias W i,, de modo que o modelo dinâmico consiuído por F = (F 1,..., F p ), G = BlocoDiag(G 1,..., G p ), W = BlocoDiag(W 1,..., W p ) com veor de esados θ = 14

(θ i,..., θ p ) incorpora simulaneamene odas as p esruuras laenes. Para uma descrição mais dealhada quano à especificação de G i,, F i, e W i, para diversos ipos de esruuras laenes, referencia-se Wes e Harrison (1997) capíulos 6 a 9. O exemplo a seguir considera um MLD com um único componene no veor de esados com dinâmica dada por um processo auorregressivo. Exemplo 2.1. Considere o MLD dado pela quádrupla {1, φ, V, W }, onde V, W e φ são conhecidos: y = θ + v, v N(0, V ) θ = φθ 1 + w, w N(0, W ). As equações de aualização aplicadas ao MLD {1, φ, V, W } resulam em a = φm 1 R = φ 2 C 1 + W, f = a = φm 1, Q = R + V, A = R R + V, e = y φm 1, m = φm 1 + C = A V. R R + V (y φm 1 ) No caso específico do modelo raado no exemplo 2.1, é possível ober facilmene expressões analíicas para o limie da sequência de variâncias a poseriori (C ) N, se (V ) N e (W ) N são sequências convergenes, como apona a Proposição 2.2 a seguir. Proposição 2.2. Considere o MLD dado pela quádrupla {1, φ, V, W }, onde V e W são conhecidos N. Suponha que lim V = V > 0 e lim W = W > 0. Se a 15

sequência C converge, enão seu valor limie é C = (W + V φ2 V ) + (V + W + φ 2 V ) 2 + 4φW V 2φ 2. Demonsração. No MLD {1, φ, V, W }, em-se C = A V = R V R + V = (φ2 C 1 + W )V φ 2 C 1 + W + V. Supondo lim W = W e lim V = V e que C = lim C, em-se C = (φ2 C + W )V φ 2 C + W + V, donde φ 2 C 2 + (W + V )C φ 2 CV W V = 0. Resolvendo para C, obém-se C = (W + V φ2 V ) ± (W + V φ 2 V ) 2 + 4φ 2 W V 2φ 2. Como C 0, segue que o único limie possível para C é C = (W + V φ2 V ) + (W + V φ 2 V ) 2 + 4φ 2 W V 2φ 2. Cabe ciar aqui o Teorema 2.3 em Wes e Harrison (1997), que garane que a sequência C de variâncias a poseriori converge em qualquer MLD com veor de esados unidimensional, desde que as variâncias (observacionais e de evolução) sejam consanes e conhecidas. Sendo esse o caso, a Proposição 2.2 fornece expliciamene o limie de C no caso paricular em que G = φ, N. O comporameno assinóico expliciado na Proposição 2.2 pode ser verificado empiricamene, como ilusrado pela figura 2.1 para uma série simulada com φ = 1 e oura com φ = 0, 8. Verifica-se que o comporameno limie para as variâncias a poseriori é alcançado rapidamene. A parir de 20 observações, praicamene não se observa diminuição na incereza a respeio do processo auorregressivo laene. A parir de al pono, 16

as observações acrescenam informação apenas na média das esimaivas ponuais de θ, permiindo-as acompanhar as variações na rajeória efeiva do processo laene θ. A disribuição a priori adoada é θ 1 D 0 N(0, 100). 0 2 4 6 8 10 C C 0 20 40 60 80 100 10 5 0 5 10 0 20 40 60 80 100 m m ± 2 C (a) φ = 1 (b) φ = 1 0 1 2 3 4 5 6 C C 5 0 5 10 m m ± 2 C 0 20 40 60 80 100 0 20 40 60 80 100 (c) φ = 0.8 (d) φ = 0.8 Figura 2.1: Esimação de θ AR(1) em MLD{1, φ, V, W } com φ, W e V conhecidos. m = E(θ D ), C = V ar(θ D ). À esquerda, exibe-se a sequência C junamene com o valor limie C dado pela Proposição 2.2. À direia, exibe-se a sequência de esimaivas e inervalos de credibilidade a poseriori para os esados. 2.2.2 Modelos lineares generalizados dinâmicos Os Modelos Lineares Generalizados Dinâmicos permiem descrever o comporameno probabilísico de observações y, cujo indíce geralmene se refere a uma deerminada unidade de empo, segundo uma disribuição perencene à família exponencial, com 17

parâmeros variando com o passar do empo. A classe MLGD é uma exensão dos chamados Modelos Lineares Generalizados (MLG) (Nelder e Wedderburn, 1972) devido a evolução emporal dos parâmeros de esado θ que descrevem o predior linear η. Em ermos práicos, considerar um MLGD para observações y permie que os efeios laees sobre a variável resposa se diferenciem ao longo do empo. Mais precisamene, um MLGD é descrio por 3 equações: p(y ψ ) = exp ( V 1 [f (y )ψ a(ψ )] ) b (y, V ) (2.7) η = g(ψ ) = F θ (2.8) θ = G θ 1 + ω, ω [0, W ] (2.9) onde a equação (2.7) represena a densidade ou função de probabilidade das observações y como membro da família exponencial, a equação (2.8) relaciona o parâmero naural ψ e o predior linear η aravés da função de ligação g, descrevendo o predior linear como função linear dos esados θ e, por fim, a equação (2.9), chamada equação de evolução, descreve a dinâmica do veor de esados de maneira linear deerminada pela mariz de evolução G. Em geral, ao longo do exo, usaremos a noação x [a, b] para indicar que a variável aleaória (veor aleaório) x em média (veor de médias) a e variância (mariz de variância) b, como no caso da equação (2.9). Usaremos ambém os ermos mariz de variância e mariz de covariâncias de forma indisina, uma vez que al mariz pode ser visa como uma generalização do conceio de variância para veores aleaórios (por isso mariz de variância), bem como suas enradas represenam as covariâncias dois a dois enre as respecivas componenes do veor aleaório (por isso mariz de covariâncias). Com respeio à esimação bayesiana de parâmeros em MLGD, as equações (2.2), (2.3), (2.4), (2.5) e (2.6) fornecem solução analíica no caso paricular em que a resposa é normal (e porano, em-se em paricular um Modelo Linear Dinâmico), a variância de observação é conhecida e as variâncias dos erros de evolução são desconhecidas. No caso geral em que a resposa perence a qualquer membro da família exponencial, Wes e al. (1985) descrevem uma meodologia sequencial para inferência em MLGD, que se dá em ermos de primeiro e segundo momenos para os esados fazendo uso do procedimeno 18