APOSTILA DE MODELOS LINEARES EM SÉRIES TEMPORAIS

Documentos relacionados
Séries temporais Modelos de suavização exponencial. Séries de temporais Modelos de suavização exponencial

Capítulo 4. Propriedades dos Estimadores de Mínimos Quadrados

Cálculo do valor em risco dos ativos financeiros da Petrobrás e da Vale via modelos ARMA-GARCH

ECONOMETRIA. Prof. Patricia Maria Bortolon, D. Sc.

4 O modelo econométrico

Análise de séries de tempo: modelos de decomposição

3 Retorno, Marcação a Mercado e Estimadores de Volatilidade

Econometria Semestre

ESCOLA SECUNDÁRIA COM 3º CICLO D. DINIS 12º ANO DE ESCOLARIDADE DE MATEMÁTICA A Tema II Introdução ao Cálculo Diferencial II

Características dos Processos ARMA

Circuitos Elétricos I EEL420

Universidade Federal do Rio de Janeiro

Seção 5: Equações Lineares de 1 a Ordem

4 Metodologia Proposta para o Cálculo do Valor de Opções Reais por Simulação Monte Carlo com Aproximação por Números Fuzzy e Algoritmos Genéticos.

Contabilometria. Séries Temporais

4 O Papel das Reservas no Custo da Crise

Modelagem e Previsão do Índice de Saponificação do Óleo de Soja da Giovelli & Cia Indústria de Óleos Vegetais

Instituto de Física USP. Física V - Aula 26. Professora: Mazé Bechara

AULA 22 PROCESSO DE TORNEAMENTO: CONDIÇÕES ECONÔMICAS DE USINAGEM

Introdução às Medidas em Física

O gráfico que é uma reta

Capítulo 7. O Modelo de Regressão Linear Múltipla

TRANSFORMADA DE FOURIER NOTAS DE AULA (CAP. 18 LIVRO DO NILSON)

Estudo comparativo do fluxo de caminhões nos portos de Uruguaiana e Foz do Iguaçu

2.6 - Conceitos de Correlação para Sinais Periódicos

ONDAS ELETROMAGNÉTICAS

O gráfico que é uma reta

CINÉTICA RADIOATIVA. Introdução. Tempo de meia-vida (t 1/2 ou P) Atividade Radioativa

5 Metodologia Probabilística de Estimativa de Reservas Considerando o Efeito-Preço

Prof. Carlos H. C. Ribeiro ramal 5895 sala 106 IEC

Regressão Linear Simples

DEMOGRAFIA. Assim, no processo de planeamento é muito importante conhecer a POPULAÇÃO porque:

Tópicos Especiais em Energia Elétrica (Projeto de Inversores e Conversores CC-CC)

Universidade do Estado do Rio de Janeiro Instituto de Matemática e Estatística Econometria

4 Aplicação do Modelo

UTILIZAÇÃO DO MÉTODO DE HOLT-WINTERS PARA PREVISÃO DO LEITE ENTREGUE ÀS INDÚSTRIAS CATARINENSES

4 Modelagem e metodologia de pesquisa

Capítulo Cálculo com funções vetoriais

Estimação em Processos ARMA com Adição de Termos de Perturbação

1 Pesquisador - Embrapa Semiárido. 2 Analista Embrapa Semiárido.

A entropia de uma tabela de vida em previdência social *

6 Processos Estocásticos

Professor: Danilo Dacar

Professor: Danilo Dacar

Movimento unidimensional 25 MOVIMENTO UNIDIMENSIONAL

Critérios e Metodologia de Apuração de Superfície de Volatilidade

Universidade Federal do Rio Grande do Sul Escola de Engenharia de Porto Alegre Departamento de Engenharia Elétrica ANÁLISE DE CIRCUITOS II - ENG04031

Função de risco, h(t) 3. Função de risco ou taxa de falha. Como obter a função de risco. Condições para uma função ser função de risco

ANÁLISE DO PROCESSO PRODUTIVO DE UMA INDÚSTRIA TÊXTIL ATRAVÉS DE CARTAS DE CONTROLE

Exercícios Sobre Oscilações, Bifurcações e Caos

CINÉTICA QUÍMICA LEI DE VELOCIDADE - TEORIA

APLICAÇÃO DO MÉTODO DE HOLT NA PREVISÃO DE DADOS DE ÁGUA DA CIDADE DE RONDONÓPOLIS-MT

2.7 Derivadas e Taxas de Variação

) quando vamos do ponto P até o ponto Q (sobre a reta) e represente-a no plano cartesiano descrito acima.

RÁPIDA INTRODUÇÃO À FÍSICA DAS RADIAÇÕES Simone Coutinho Cardoso & Marta Feijó Barroso UNIDADE 3. Decaimento Radioativo

Fenômenos de adsorção em interfaces sólido/solução. Modelagens matemáticas de processos cinéticos

Confiabilidade e Taxa de Falhas

Função Exponencial 2013

PREVISÃO DE PREÇOS NA BOVINOCULTURA DE CORTE

A MÉDIA APARADA ASSIMÉTRICA COMO INDICADOR DE TENDÊNCIA DA INFLAÇÃO

Decomposição Clássica

ESCOLA SECUNDÁRIA COM 3º CICLO D. DINIS 11º ANO DE ESCOLARIDADE DE MATEMÁTICA A

LIGAÇÕES QUÍMICAS NOS COMPOSTOS DE COORDENAÇÃO: TEORIA DO CAMPO CRISTALINO (TCC)

30/08/15' Incerteza- Padrão. Repetitividade. Estimativa da Repetitividade (para 95,45% de probabilidade) Estimativa da Repetitividade

Biofísica II Turma de Biologia FFCLRP USP Prof. Antônio Roque Biologia de Populações 2 Modelos não-lineares. Modelos Não-Lineares

MODELOS USADOS EM QUÍMICA: CINÉTICA NO NÍVEL SUPERIOR. Palavras-chave: Modelos; Cinética Química; Compostos de Coordenação.

Duas opções de trajetos para André e Bianca. Percurso 1( Sangiovanni tendo sorteado cara e os dois se encontrando no ponto C): P(A) =

Análise de Projectos ESAPL / IPVC. Critérios de Valorização e Selecção de Investimentos. Métodos Dinâmicos

MATEMÁTICA APLICADA AO PLANEJAMENTO DA PRODUÇÃO E LOGÍSTICA. Silvio A. de Araujo Socorro Rangel

AMANDA OLIVEIRA, G. Depto. Engenharia de Computação e Automação - UFRN

F B d E) F A. Considere:

Capítulo 8. O Modelo de Regressão Múltipla: Testes de Hipóteses e a Utilização de Informações Não Amostrais

GRUPO XIII GRUPO DE ESTUDO DE INTERFERÊNCIAS, COMPATIBILIDADE ELETROMAGNÉTICA E QUALIDADE DE ENERGIA - GCQ

Análise através de gráficos de controle da série resistência à compressão da areia base para fundição

QUESTÃO 60 DA CODESP

Lista de Exercícios nº 3 - Parte IV

6 Análise do processo de filtragem

3 A Formação de Preços dos Futuros Agropecuários

ECONOMETRIA. Prof. Patricia Maria Bortolon, D. Sc.

Os Efeitos da Inflação Sobre o Orçamento do Governo: Uma Análise Empírica

Noções de Espectro de Freqüência

Avaliando e Propondo Medidas de Núcleo da Inflação no Brasil Ivan Castelar Cristiano Santos

Tipos de Processos Estocásticos

Capítulo 2: Conceitos Fundamentais sobre Circuitos Elétricos

Um modelo matemático discreto para a dispersão da leptospirose em uma população de ratos

3 Processos Estocásticos

DENOMINADORES: QUAIS SÃO? COMO SE CALCULAM?

N(0) número de núcleos da espécie inicial no instante t=0. N(t) número de núcleos da espécie inicial no instante t. λ constante de decaimento

UNIVERSIDADE FEDERAL DE JUIZ DE FORA DEPARTAMENTO DE ESTATÍSTICA CURSO DE ESTATÍSTICA

QUESTÕES ANPEC EQUAÇÕES DIFERENCIAIS E EQUAÇÕES DE DIFERENÇAS

NOTA TÉCNICA. Nota Sobre Evolução da Produtividade no Brasil. Fernando de Holanda Barbosa Filho

MODELAGEM E PREVISÃO DE VOLATILIDADE DETERMINÍSTICA E ESTOCÁSTICA PARA A SÉRIE DO IBOVESPA 1

2 PREVISÃO DA DEMANDA

Capítulo 5: Introdução às Séries Temporais e aos Modelos ARIMA

Modelos para Previsão em Séries Temporais: uma Aplicação para a Taxa de Desemprego na Região Metropolitana de Porto Alegre

GERAÇÃO DE PREÇOS DE ATIVOS FINANCEIROS E SUA UTILIZAÇÃO PELO MODELO DE BLACK AND SCHOLES

Insper Instituto de Ensino e Pesquisa. Decio Albert da Silva Santos PREVISÃO DE VOLATILIDADE:

2 Processos Estocásticos de Reversão à Média para Aplicação em Opções Reais

Expectativas, consumo e investimento CAPÍTULO 16. Olivier Blanchard Pearson Education Pearson Education Macroeconomia, 4/e Olivier Blanchard

Um modelo matemático para o ciclo de vida do mosquito Aedes aegypti e controle de epidemias

Transcrição:

UNIVERSIDADE FEDERAL DE MINAS GERAIS - UFMG INSIUO DE CIÊNCIAS EXAAS ICEx DEPARAMENO DE ESAÍSICA ES APOSILA DE MODELOS LINEARES EM SÉRIES EMPORAIS Glaura da Conceição Franco (ES/UFMG) Belo Horizone, agoso de 206

Coneúdo. Inrodução... 3 PARE : MODELOS DE REGRESSÃO NORMAIS PARA SÉRIES EMPORAIS 2. Modelo de regressão com funções do empo... 7 2.. Modelando endência aravés de funções polinomiais... 7 2.2. Esimação de parâmeros e adequação do modelo... 9 2.3. Previsão... 0 2.4. Exemplos... 2.4.. emperaura global... 2.4.2. Preço do grão e farelo de soja... 3. Deecando a auocorrelação... 4 3.. ipos de auocorrelação... 5 3.2. Auocovariância e auocorrelação... 3.3. Méodos para deecção da auocorrelação... 5 3.3.. Gráfico de resíduos versus empo... 3.3.2. ese de Durbin-Wason... 3.3.3. Função de auocorrelação amosral (FAC)... 3.4. Exemplos... 3.4.. emperaura global... 3.4.2. Preço do grão e farelo de soja... 4. Modelando auocorrelação nos resíduos... 8 4.. Modelo de regressão com erros auorregressivos... 4.2. Previsão... 4.3. Inervalo de confiança para as previsões... 4.4. Exemplos... 4.4.. emperaura global... 4.4.2. Preço do grão e farelo de soja... 5. Séries sazonais... 5.. Modelo de regressão para séries sazonais com erros auorregressivos... 2

5.2. Previsão... 5.3. Exemplo Série CEP... 6. Análise de Inervenção... 6.. Modelo de regressão para séries com inervenção e erros auorregressivos... 6.2. Previsão... 6.3. Exemplo Série Acidenes... PARE 2: MODELOS DE REGRESSÃO PARA SÉRIES EMPORAIS DE CONAGEM 7. Modelos lineares generalizados... 7.. Família Exponencial a um parâmero 7.2. Componenes do modelo 7.3. Esimação 7.4. Adequação de modelos 7.5. Análise de resíduos 7.6. Exemplo Série Polio 8. Modelos ARMA... 8.. ipos de modelos... 8.2. Idenificação de modelos... 8.2.3. Exemplos... 8.3. Esimação de parâmeros... 8.4. Análise de resíduos... 8.5. Exemplo- Série soja... 9. Modelos GLARMA 9.. Definição 9.2. Esimação 9.3. Previsão 9.4. Exemplo Série Polio Referências ANEXO: Séries uilizadas nos exemplos... 33 3

. Inrodução O ermo previsão no empo é muio uilizado quando possuímos um conjuno de dados ordenados no empo, ou seja, uma série emporal, e desejamos prever valores fuuros para esa série. Definição: Uma série emporal é um conjuno de observações geradas sequencialmene no empo. Caracerísica principal: As variáveis são dependenes. Denoaremos a série emporal por y,...,, y2 yn onde n é o amano da série. rabalaremos com séries emporais a empo discreo, onde os dados são coleados diariamene, semanalmene, mensalmene ou anualmene. Os objeivos principais da análise de séries emporais são a modelagem e a previsão de valores fuuros para a série. Para prever evenos que ocorrerão no fuuro, o pesquisador deve se basear em informações concernenes a evenos que enam ocorrido no passado. Assim, a análise pode ser feia da seguine forma. Primeiro, o pesquisador analisa os dados para poder idenificar um comporameno que possa ser usado para descrevê-lo. Ese comporameno é enão exrapolado, ou esendido no fuuro, para calcular uma previsão. Esa esraégia básica é empregada na maioria das écnicas de previsão e se baseia na suposição de que o comporameno que foi idenificado coninuará no fuuro. Se o padrão que foi idenificado para os dados não persise no fuuro, iso indica que a écnica de previsão usada provavelmene produzirá previsões incorreas. Um analisa não deveria ficar surpreso em ais siuações, mas deveria enar anecipar quando al mudança no padrão ocorreria, para que mudanças apropriadas no sisema de previsão pudessem ser feias anes das previsões se ornarem incorreas. A seguir apresenamos alguns exemplos. 4

Farelo 50 200 250 300 Grao 8 0 2 4 6 desvio emperaura -0.4-0.2 0.0 0.2 0.4 Exemplo.: Série de emperaura global (empmedia), de 900 a 997. Os dados foram calculados como um desvio da emperaura global média anual do período 96-990. Exise uma endência aparenemene crescene na série e iso em sido usado para susenar a ipóese de aquecimeno global. 900 920 940 960 980 2000 Figura.: Série empmedia Exemplo.2: Os dados na Figura.2 referem-se às séries de preços do grão e do farelo de soja, respecivamene, no esado de São Paulo, no período de jan/990 a se/999, em um oal de 7 observações. Podemos perceber um comporameno muio parecido para as duas séries. 990 994 998 ime 990 994 998 ime Figura.2: Séries de Farelo e Grão de soja 5

No de Acidenes 000 500 2000 2500 CEP 250 300 350 400 450 500 Exemplo.3: Série do consumo de energia elérica das Cenrais Eléricas do Paraná (CEP), de jan/80 a dez/92. A série apresena sazonalidade e endência crescene. 980 982 984 986 988 990 992 Figura.3: Série CEP Exemplo.4: A Figura.4 mosra a série mensal de número oal de moorisas moros ou seriamene feridos em acidenes de rânsio na Grã Breana, enre Jan/969 a Dez/984. O uso compulsório do cino de segurança foi inroduzido em 3 de Jan/983. 970 975 980 985 Figura.4: Série de acidenes de rânsio na Grã Breana 6

Polio 0 2 4 6 8 0 2 4 Exemplo.5: Número de casos de poliomielie (Polio) reporados pelo Cenro de Conrole de Doenças dos Esados Unidos, de janeiro de 970 a dezembro de 983. Esa é uma série de conagens com valores baixos, porano a suposição de disribuição Normal não seria adequada nese caso. 970 972 974 976 978 980 982 984 Figura.5: Série Polio Vamos uilizar eses exemplos ao longo do curso, para explicar a forma de se ober modelos lineares em séries emporais e como consruir previsões para valores fuuros da série. Desde que evenos fuuros envolvem incereza, as previsões geralmene não são perfeias. O objeivo da análise de previsão é reduzir o erro de previsão: produzir previsões que raramene são incorreas e que conenam pequenos erros. Referências. O maerial desa aposila foi baseado nos livros e arigos que se enconram na seção de 7

PARE : MODELOS DE REGRESSÃO NORMAIS PARA SÉRIES EMPORAIS As séries emporais apresenadas nos Exemplos.2 a.4 são composas de observações conínuas (Exemplos. a.3) ou discreas com valores relaivamene alos ( Exemplo.4), que a princípio podem ser modeladas supondo normalidade dos dados. Uma das possibilidades para a modelagem desas séries é a uilização de modelos lineares, como o modelo de regressão, se ouver uma relação linear enre a série e alguma(s) oura(s) série(s) explicaiva(s), ou enão com funções do empo. As suposições básicas dese modelo são normalidade, variância consane e independência. Enreano, uma das principais caracerísicas de uma série emporal é a exisência de correlação enre observações sucessivas. Desa forma, o ajuse de modelos de regressão deve ser usado com cauela nese caso. Se a suposição de independência não for saisfeia, devemos incluir componenes no modelo para corrigir ese problema. Na Pare desa aposila vamos descrever os modelos de regressão no empo, as possíveis formas de se deecar correlação nos dados e, caso esa exisa, como podemos corrigir o problema. 8

2. Modelo de regressão com funções do empo Os modelos de auorregressão relacionam a variável dependene y (o aribuo sobre o qual se busca deerminar um padrão de informação no empo) com funções do empo. Eses modelos são mais úeis quando os parâmeros descrevendo a série emporal a ser previsa permanecem consanes no empo. Por exemplo, se a série emporal exibe uma endência linear, enão a inclinação da lina de endência permanece consane. A Seção 2. mosra como modelar a endência usando funções polinomiais do empo e a Seção 2.2 apresena o méodo de esimação dos parâmeros do modelo. Na Seção 2.3 vemos como consruir previsões para valores fuuros da série y e a Seção 2.4 apresena dois exemplos com séries reais. 2.. Modelando endência aravés de funções polinomiais Algumas vezes podemos descrever uma série emporal y usando um modelo de endência. al modelo é definido como segue: 2 onde N0, ~, independenes. y,,..., n (2.) Ese modelo diz que a série emporal y pode ser represenada por um nível médio (denoado ) e pelo ermo de erro. Ese ermo de erro represena fluuações aleaórias que causam o desvio dos valores y do nível médio. As endências mais simples são as obidas aravés de um comporameno linear da série observada (ver Figura 2.). O Modelo sem endência, que é definido como = 0, implica que não á crescimeno ou decrescimeno a longo prazo na série emporal ao longo do empo, veja Figura 2.(a). O 9

Modelo de endência linear, que é modelado como = 0 +, implica que á um crescimeno (a inclinação é maior que zero) ou decrescimeno (menor que zero) em lina rea ao longo do empo, veja Figuras 2.(b) e (c). Bo (a) endência consane (b) Crescimeno em lina rea (c) Decrescimeno em lina rea Figura 2.: Diferenes ipos de endência para modelos lineares No Caso (a): 0 ; No Caso (b): No Caso (c): 0, onde > 0; 0, onde < 0. Modelos mais complexos ambém podem ser obidos na práica, como Modelos lineares de endência quadráica, que são modelados como = 0 + + 2 2, ou Modelos lineares de endência polinomial de ordem k, que são modelados como 2 k 0 2... k,,..., n. (2.2) Podemos er ambém um modelo com variáveis explicaivas, x,..., x r, além do ermo de endência. Nese caso, o modelo é definido como: y 2 onde N0, 2 k 0 2... k kx,... kr xr,,,..., n (2.3) ~, independenes. 0

2.2. Esimação de parâmeros e adequação do modelo Esimaivas ponuais dos parâmeros do modelo (2.3) podem ser obidas usando o méodo de mínimos quadrados ordinários. O modelo esimado é escrio como, k y 2 0 2... k k x,... kr xr,, (2.4) e o resíduo dese modelo é calculado como: e y y,,... n. (2.5) Suposições do modelo: Normalidade: A suposição de normalidade pode ser verificada aravés da consrução de isogramas, Normal Probabiliy Plo e eses de normalidade para os resíduos. Variância consane: Violação da suposição de variância consane é sugerida por um afunilameno no gráfico de resíduos, e, versus valores ajusados, ŷ. Independência: A verificação da suposição de independência será discuida no Capíulo 3. Quando as suposições de normalidade ou variância consane não são saisfeias, devemos fazer uma ransformação nos dados para enar resolver o problema. Porém, a ransformação não resolve o problema de fala de independência. Nese caso, veremos no Capíulo 4 como fazer a modelagem quando os erros não são independenes.

2.3. Previsão Vamos denoar por Y a previsão para o empo +, dado que observamos a série aé o empo. A parir de esimaivas ponuais para os parâmeros 0,,..., k, k+,..., k+r, podemos ober previsões para um valor fuuro da série. Assim, uma previsão ponual feia no empo para dada por k Y ( ) 0 ( )... k ( ) k x,( )... k r xr,( ) (2.6) onde xi, ( ) é o valor da variável x i no empo +. Além diso, inervalos de previsão aproximados de 00(-)% são obidos como segue: y Y np ( ) / 2 s (2.7) np onde / 2 é o percenil /2 da disribuição -Suden com -np graus de liberdade, np é o número de parâmeros do modelo e s é o desvio padrão dos resíduos. Para comparar modelos diferenes, podemos calcular a soma de quadrados dos erros de previsão: é onde H é o número de previsões realizadas. EQMP H Y Y H ( ) 2 (2.8) 2.4. Exemplos 2.4.. emperaura global Uilizando os dados do Exemplo., vamos ajusar um modelo de regressão à série do desvio da emperaura global média, para o período de 900-994. Deixaremos os anos de 995-997 para validação do modelo aravés da comparação das previsões, porano n=95. 2

O modelo ajusado foi o seguine: empmedia = -,6333 + 0,005923 x Ano Saída do R: Esimae Sd. Error value Pr(> ) (Inercep) -.63e+0 9.336e-0-2.46 <2e-6 *** Ano 5.923e-03 4.794e-04 2.35 <2e-6 *** Residual sandard error: 0.28 on 93 degrees of freedom Muliple R-squared: 0.624, Adjused R-squared: 0.673 AIC(M): -6.795 O valor esimado de 0, ou seja o pono onde a rea ajusada inercepa o eixo dos y s foi igual a -,6333, e o valor de, a inclinação da rea foi de 0,005923. Eses dois valores foram esaisicamene significaivos, pois o valor-p para ambos foi <2e-6 (menor que o nível de significância = 0.05). Como o sinal do coeficiene foi posiivo, iso indica que a emperaura global ende a aumenar com o empo. Porém, o valor de R 2 não foi muio alo (62.4%), indicando que a rea ajusada explica parcialmene a variação dos dados. Obs.: A variável Ano foi consruída com valores de 900 a 994, mas poderia ser consruída ambém com os valores de a 95 (a quanidade de observações presenes na série). Nese caso, o ajuse ficaria: Esimae Sd. Error value Pr(> ) (Inercep) -0.3852587 0.0265043-4.54 <2e-6 *** Ano 5.923e-03 4.794e-04 2.35 <2e-6 *** Podemos perceber que apenas a esimaiva do inercepo, 0, mudou. Como o ineresse não é no inercepo, e sim na relação emporal, dada pela esimaiva de, e esa não muda com a definição da variável empo, podemos usar as duas formas. 3

Frequency 0 5 5 25 M$res -0.3-0. 0. 0.3 Análise de Resíduos Um ouro problema ocorre com os resíduos, como podemos noar pelos gráficos da Figura 2.2. O gráfico de resíduos no empo não apresena um comporameno aleaório em orno do valor zero, indicando clara fala de independência enre os resíduos. Já o isograma mosra uma leve assimeria, mas o ese de normalidade de Sapiro-Wilks não rejeia a ipóese de normalidade (valor-p=0,8484). O problema da fala de independência pode er sido causada pela auocorrelação exisene enre observações sucessivas da série. Na próxima seção, vamos verificar como corrigir eses problemas. 0 20 40 60 80 Index Hisogram of M$res -0.3-0.2-0. 0.0 0. 0.2 0.3 0.4 M$res Figura 2.2: Gráficos de resíduos para o modelo M (emperaura global) Apesar deses problemas, vamos enar deerminar previsões para os anos de 995-997, para os quais possuímos os valores reais. 4

Previsões para os anos de 995 a 997: Previsão para 995: Para calcular a previsão para o ano de 995 uilizamos o modelo M onde o ano será igual a 995. Logo o desvio da emperaura previso será de empmedia 995 = -,6333 + 0,005923 x 995 = 0,83. (2.9) Inervalo de previsão de 95%: 0,83 ±,9858 x 0,28 = [ -0,07 ; 0,4378 ] (2.0) 952 onde 0.975 =,9858 é o percenil 0,975 da disribuição -Suden com 95-2 graus de liberdade e s=0,28 é o erro padrão dos resíduos. Previsão para 996: empmedia 996 = -,6333 + 0,005923 x 996 = 0.890. Inervalo de previsão de 95%: 0, 890 ±,9858 x 0,28 = [ -0,0654 ; 0,4434 ] Previsão para 997: empmedia 997 = -,6333 + 0,005923 x 997 = 0.949. Inervalo de previsão de 95%: 0,949 ±,9858 x 0,28 = [ -0,0595 ; 0,4493 ] As previsões rês passos à frene, inervalos de previsão e valores reais para 995 a 997 são dados na abela 2.. 5

desvio emperaura -0.4-0.2 0.0 0.2 0.4 abela 2.: Previsão para os anos de 995 a 997 do desvio da emperaura global Ano Real Previso Erro (Real-Previso) 995 0,39 0,83 0, 2069 [-0,07 ; 0,4378] 996 0,22 0,890 0, 030 [-0,0654 ; 0,4434] 997 0,43 0,949 0, 235 [-0,0595 ; 0,4493] EQMP = [ (0,2069) 2 + (0,03) 2 + (0,235) 2 ] / 3 = 0,0330. A Figura 2.3 mosra o ajuse, assim como as previsões para 995 a 997, com o inervalo de previsão. Podemos ver que odas as previsões subesimaram o verdadeiro valor do desvio médio de emperaura, mas os valores reais esão denro do inervalo de previsão. o : Previsão -- : Inervalo Previsao 0 20 40 60 80 00 empo Figura 2.3: Ajuse, previsão e inervalos de previsão para o modelo M (emperaura global). Os ponos em azul são os valores previsos e as linas em vermelo são os inervalos de previsão. 6

farelo 50 200 250 300 2.4.2. Preço do grão e farelo de soja Com os dados do Exemplo.2, vamos ajusar um modelo para a série do preço do farelo de soja (Farelo), usando como variável explicaiva a série de preço do grão de soja (Grao). Os dados vão de Jan/990 a Ago/999, mas deixaremos os úlimos 2 meses (Se/998 a Ago/999) para validação do modelo aravés da comparação das previsões. Assim, nossa série erá amano n=04. A Figura 2.4 mosra o gráfico de dispersão das duas variáveis. Podemos perceber uma relação linear posiiva enre as duas séries, ou seja, parece que quano maior o valor do preço do grão de soja, maior o valor do preço do farelo de soja, como esperado. Além diso, o coeficiene de correlação enre as duas foi de 0,8794. Como as séries apresenadas na Figura.2 mosram que não exise endência crescene nem decrescene nesas séries, não é necessário incluir componenes de endência no ajuse. 8 0 2 4 6 Grao Figura 2.4: Gráfico de dispersão para as séries do preço de grão e farelo de soja. Desa forma, podemos ajusar o modelo de regressão, cujo resulado é dado por: Modelo M: Esimae Sd. Error value Pr(> ) (Inercep) -8.9569.7744-0.76 0.449 Grao 7.3237 0.967 7.92 <2e-6 *** Residual sandard error: 2.5 on 02 degrees of freedom Muliple R-squared: 0.7588, Adjused R-squared: 0.7564 7

AIC(M): 937.2809 Nese caso, somene foi significaivo, indicando que exise uma relação linear posiiva enre os preços do grão e farelo de soja. Ou seja, se o preço do quilo do grão de soja aumena em um real, o preço médio do quilo do farelo de soja aumena em 7,3237 reais. O valor de R 2 foi de 75,88%, o que pode esar sendo afeado pela auocorrelação presene nas duas séries. Se realizamos o ajuse reirando o inercepo, obemos o seguine resulado: Modelo M2: Esimae Sd. Error value Pr(> ) Grao 6.5999 0.728 96.05 <2e-6 *** Residual sandard error: 2.46 on 03 degrees of freedom Muliple R-squared: 0.989, Adjused R-squared: 0.9889 AIC(M2): 935.8693 O valor de coninua posiivo e significaivo, e não muio diferene do resulado anerior. Porém, o valor de R 2 aumena significaivamene, passando para 98,9%. Iso poderia nos levar a crer que ese ajuse é muio superior ao anerior, mas se observarmos o valor do AIC, vemos que a diminuição não foi ão grande. Além diso, como vamos observar na análise de resíduos, as suposições do modelo ainda não esão saisfeias, e udo iso pode afear o valor de R 2. Análise de Resíduos A Figura 2.5 mosra os gráficos de resíduos no empo e isograma para o modelo sem o inercepo (M2). Podemos ver que o gráfico de resíduos apresena um comporameno cíclico em orno do valor zero, indicando clara fala de independência enre os resíduos. Já o isograma mosra uma assimeria à direia, mas o ese de Sapiro-Wilks não rejeia ipóese de normalidade (valor-p=0,82). 8

Frequency 0 5 0 5 M2$res -40 0 20 60 0 20 40 60 80 00 Index Hisogram of M2$res -40-20 0 20 40 60 M2$res Figura 2.5: Gráficos de resíduos para o modelo M2 (Farelo e Grão de soja) Apesar do problema da fala de independência dos resíduos, vamos enar deerminar previsões uilizando o modelo sem inercepo, para os meses de Se/998 a Ago/999, para os quais possuímos os valores reais. Para calcular as previsões para o preço do farelo, precisamos dos valores reais da série do preço do grão de soja no período de Se/998 a Ago/999, que são apresenados na abela 2.2. abela 2.2: Preço do Grão de Soja para o período Fev/998 a Ago/999 Mês Se/98 Ou/98 Nov/98 Dez/98 Jan/99 Fev/99 Mar/99 Abr/99 Mai/99 Jun/99 Jul/99 Ago/99 Grão,44,55,43,00 9,60 8,65 8,32 8,5 8,68 8,72 8,49 9,09 9

Previsões para Se/998 a Ago/999: Previsão para Se/998: A previsão do preço do farelo de soja para o mês de seembro de 998 é calculada como: Farelo Se/98 = 6,5999 x,44 = 89,90 Inervalo de previsão de 95%: 89,90 ±,983264 x 2,46 = [47.34 ; 232.46] 04 onde 0.975 =,983264 é o percenil 0,975 da disribuição -Suden com 04- graus de liberdade e s=2,46 é o erro padrão dos resíduos. Procedendo desa forma, obemos as previsões para os 2 meses de ineresse. A abela 2.3 mosra as previsões doze passos à frene, inervalos de previsão e valores reais para Se/998 a Ago/999. Podemos verificar que odas as previsões, exceo Fev/99, superesimam o verdadeiro valor do preço do farelo de soja, mas os valores reais esão denro do inervalo de previsão. abela 2.3: Previsões seis passos à frene para o preço do farelo de soja, Se/998 a Ago/999 Mês Real Previso Inervalo Previsão Real-Previso Se/998 5,3 89,90 [47,34 ; 232,45] -38,60 Ou/998 54,8 9,73 [49,8 ; 234,28] - 36,93 Nov/998 58,3 89,74 [47,9 ; 232,29] -3,44 Dez/999 57,5 82,60 [40,05 ; 225,5] -25,0 Jan/999 52,0 59,36 [6,8 ; 20,9] -7,36 Fev/999 58, 43,60 [ 0,04;86,4 ] 4,5 Mar/999 29,4 38, [95,56 ; 80,66] -8,7 Abr/999 30,2 4,26 [98,7 ; 83,8] -, 06 Mai/999 26,3 44,09 [0,54 ; 86,64] -7,79 Jun/999 3,2 44,75 [02,20 ; 87,30] -3,55 Jul/999 33,8 40,93 [98,38 ; 83,48] -7,3 Ago/999 44,8 50,89 [08,34 ; 93,44] -6,09 20

Farelo 00 50 200 250 300 EQMP = 460,26. A Figura 2.6 mosra o ajuse e as previsões para os doze úlimos meses, com o inervalo de previsão. Vemos que o modelo ajusado segue relaivamene bem o comporameno da série. 0 20 40 60 80 00 20 empo Figura 2.6: Ajuse, previsão e inervalos de previsão para o modelo M2 (Farelo). A lina prea represena a série do Farelo, a lina azul mosra o modelo ajusado, os ponos em azul são os valores previsos e as linas em vermelo são os inervalos de previsão. 2

3. Deecando a auocorrelação A validade dos méodos de regressão ilusrados no Capíulo 2 requer, denre ouras, que a suposição de independência seja saisfeia. Porém, quando dados de séries emporais esão sendo analisados, esa suposição é frequenemene violada. É muio comum que os ermos de erro, ordenados no empo, sejam auocorrelacionados. Nese capíulo, definimos auocorrelação posiiva e negaiva, e discuimos a deecção de auocorrelação usando gráficos de resíduos, o ese de Durbin-Wason e os gráficos da função de auocorrelação amosral (FAC). 3.. ipos de auocorrelação Auocorrelação Posiiva : Quando um ermo de erro posiivo no período de empo ende a produzir, ou ser seguido por, ouro ermo de erro posiivo no período de empo +k (um período de empo poserior) e se um ermo de erro negaivo no período de empo ende a produzir, ou ser seguido por, ouro ermo de erro negaivo no período de empo +k. Auocorrelação Negaiva : Quando um ermo de erro posiivo no período de empo ende a produzir, ou ser seguido por, um ermo de erro negaivo no período de empo +k e se um ermo de erro negaivo no período de empo ende a produzir, ou ser seguido por, um ermo de erro posiivo no período de empo +k. A ipóese de independência diz que os ermos de erro ordenados no empo não devem produzir comporameno de auocorrelações posiivas ou negaivas. Iso significa que os ermos de erro devem ocorrer de forma aleaória ao longo do empo. al comporameno implicaria que eses ermos de erro são esaisicamene independenes, o que por sua vez implicaria que os valores de y ordenados no empo são esaisicamene independenes. Se os resíduos apresenam um comporameno aleaório em orno de zero, com variância consane ao longo do empo, dizemos que eles são um ruído branco. 22

3.2 Auocovariância e Auocorrelação Auocovariância: É a covariância enre y e y -k separados por k inervalos de empo. A auocovariância, k, é calculada como: k Cov y, y Ey y, k 0,, 2,... k k Se emos uma série real, o esimador amosral aproximadamene não-endencioso (para grandes amosras) da auocovariância é dado por: n. k y y yk y n k Como a auocovariância é uma função par, emos que para odo ineiro k, k k. Porano, é necessário deerminar k apenas para k 0. Auocorrelação: A auocorrelação é a auocovariância padronizada. Serve para medirmos o comprimeno e a memória de um processo, ou seja, a exensão para a qual o valor omado no empo depende daquele omado no empo -k, y, yk y Var y Cov k k. 0 Var k Claramene, e. Um esimador amosral da auocorrelação de defasagem k é dado 0 k k por: k k 0, k 0,,2,... 23

3.3. Méodos para deecção da auocorrelação 3.3.. Gráfico de resíduos versus empo Desde que os resíduos são esimaivas ponuais dos ermos de erro, um gráfico de resíduos versus empo pode ser usado para deecar violações da suposição de independência. Se um gráfico de resíduos conra o empo em um comporameno aleaório, os ermos de erro êm pouca ou nenuma auocorrelação. Iso sugere que os ermos de erro são independenes, ou seja, eles são um ruído branco. Se um gráfico de resíduos versus empo em um comporameno cíclico, os ermos de erro são posiivamene correlacionados, e a ipóese de independência não é válida. Se um gráfico de resíduos conra o empo em um comporameno alernado, os ermos de erro são negaivamene correlacionados, e a ipóese de independência ambém não é válida. 3.3.2. ese de Durbin-Wason O ipo de auocorrelação (posiiva ou negaiva) com a qual rabalaremos é camada de auocorrelação de primeira ordem. Apresenamos a seguir o ese de Durbin-Wason, que é um ese formal para deecar auocorrelação de primeira ordem. A esaísica de Durbin-Wason é dada por d n 2 e e n e 2 2 (3.) onde e,...,, e2 en são resíduos ordenados no empo. Considere o ese H 0 : Os ermos de erro não são auocorrelacionados H : Os ermos de erro são posiivamene ou negaivamene auocorrelacionados. 24

Durbin e Wason (95) mosraram que exisem ponos (denoados por d L, e d U, ) ais que, se é a probabilidade de um erro ipo I (ou seja, a probabilidade de rejeiarmos H 0 quando esa ipóese é verdadeira), enão:. Se d L, / 2 d ou 4 d d L, / 2 2. Se d U, / 2 d e 4 d d U, / 2 d 3. Se L, / 2 U, / 2, nós rejeiamos H 0 ;, nós não rejeiamos H 0 ; d d e d L, / 2 4 d du, / 2, o ese é inconclusivo. Aqui, valores pequenos de d levam à conclusão de uma auocorrelação posiiva, porque se d é pequeno, as diferenças e e são pequenas. Por ouro lado, valores grandes de d (logo valores pequenos de ( 4 d ) levam à conclusão de uma auocorrelação negaiva, porque se d é grande, as diferenças e e são grandes. Para que o ese de Durbin-Wason possa ser facilmene aplicado, abelas conendo os ponos d L, e U, d devem ser consruídas. Esas abelas calculam os ponos d L, e d U, apropriados para vários valores de, np (onde np é o número de covariáveis do modelo) e n ( o número de observações). Noe que, por exemplo, np para o modelo linear simples. Uma abela com a disribuição de d para alguns valores de n e np é apresenada em Guajarai (2009). Geralmene, d = 2 indica que não exise auocorrelação. Se a esaísica de Durbin Wason é subsancialmene menor que 2, exise evidência de correlação serial posiiva. Como uma regra aproximada, se d é menor que, exise moivo para alarme. Pequenos valores de d indicam ermos de erro posiivamene correlacionados. Se d > 2, os ermos de erro são, em media, negaivamene correlacionados. relevanes: Anes de concluirmos esa apresenação do ese de Durbin-Wason, vários comenários são 25

a validade do ese de Durbin-Wason depende da suposição de que a população de odos os possíveis resíduos em qualquer empo ena uma disribuição normal; auocorrelações posiivas são enconradas mais comumene na práica que auocorrelações negaivas; a maioria dos sofwares de regressão calculam a esaísica d de Durbin-Wason e a auocorrelação de primeira ordem não é o único ipo de auocorrelação exisene. Dados de séries emporais podem exibir esruuras de auocorrelação dos erros mais complicadas. Em ais casos, a auocorrelação é deecada usando o que é camado de função de auocorrelação amosral. 3.3.3. Função de Auocorrelação Amosral (FAC) Vimos na Seção 3.2 que a auocorrelação amosral é calculada como: k k, k 0,,2,.... 0 O gráfico da FAC é simplesmene um gráfico de k versus k. Se os resíduos são ruídos brancos, ou seja, se eles saisfazem a suposição de independência, enão a FAC não deve apresenar picos significaivos em nenum lag k diferene de zero. A FAC pode ser consruída no R usando o comando: acf(y, lag.max = NULL) onde y é a série e lag.max é o número de lags que se quer uilizar no cálculo da FAC. Se não for especificado um número, como no caso acima, o R usa o defaul de 0*log0(n/m) onde n é o número de observações e m é o número de séries. 26

ACF -0.2 0.0 0.2 0.4 0.6 0.8.0 3.4. Exemplos 3.4.. emperaura global No Exemplo 2.4. vimos, aravés dos gráficos de resíduos, que um possível problema de auocorrelação poderia esar compromeendo o modelo linear ajusado à série. Como o gráfico de resíduos na Figura 2.2 mosrou um comporameno cíclico, os ermos de erro devem ser posiivamene correlacionados. Para confirmar a exisência de auocorrelação de primeira ordem, vamos fazer o ese de Durbin-Wason. O valor desa esaísica foi d = 0,9036. Nese caso, n 95 e np. Logo para um nível de significância de 5% emos, d L, =,64 e U, d =,69. Como d, 64, concluímos que realmene exise uma auocorrelação posiiva de primeira ordem. Vamos ambém fazer o gráfico da função de auocorrelação amosral (FAC) dos resíduos do modelo M. O gráfico apresenado na Figura 3. mosra que exisem vários picos significaivos na FAC, porano os resíduos não são independenes. Series M$res 0 5 0 5 Lag Figura 3.: FAC para os resíduos do modelo M (emperaura global) 27

ACF -0.2 0.0 0.2 0.4 0.6 0.8.0 3.4.2. Preço do grão e farelo de soja O gráfico de resíduos do modelo M2, na Figura 2.5, mosrou um possível problema de fala de independência dos resíduos do modelo. Como o gráfico apresenou um comporameno cíclico, os ermos de erro devem ser posiivamene correlacionados. Para confirmar a exisência de auocorrelação de primeira ordem, vamos fazer o ese de Durbin-Wason. O valor desa esaísica foi d = 0,3633. Nese caso, n 0 e np. Logo para um nível de significância de 5% emos, d L,,65 e d U,, 69. Como d, 65, concluímos que realmene exise uma auocorrelação posiiva de primeira ordem nesa série. O gráfico apresenado na Figura 3.2 mosra a função de auocorrelação amosral (FAC) dos resíduos do modelo M2. Podemos ver que exisem vários picos significaivos na FAC, porano os resíduos não são independenes. Series M2$res 0 5 0 5 20 Lag Figura 3.2: FAC para os resíduos do modelo M2 (Farelo) 28

4. Modelando a auocorrelação nos resíduos Já vimos que os ermos de erro para modelos de regressão em séries emporais são frequenemene correlacionados. Em ais casos, devemos remediar o problema modelando a auocorrelação. Se ignoramos os ermos de erro auocorrelacionados, pagamos uma penalidade em ermos de inervalos de previsão maiores. Levando em cona a auocorrelação, podemos ober inervalos de previsão mais precisos. Ese capíulo apresena uma forma de rabalar com erros correlacionados, uilizando os modelos de regressão com erros auorregressivos. 4.. Modelo de regressão com erros auorregressivos O nome auorregressivo se deve ao fao de que a série no insane é função da série nos insanes aneriores a. Podemos ajusar modelos auorregressivos para qualquer série emporal, mas nese caso usaremos ese modelo para a série de resíduos,. Se exise uma relação da série no empo presene somene com o empo imediaamene anerior, emos um modelo auorregressivo de ordem, AR(): u onde u é um ruído branco Gaussiano. Se exise uma correlação com os dois empos aneriores, emos um AR(2): u. 22 Generalizando, podemos er uma relação com aé p empos aneriores, ou seja, um AR(p), 29

30 Consideremos agora o modelo de regressão polinomial dado na Equação (2.3), que conena erros auorregressivos de ordem p. Nese caso, o modelo a ser esimado é n x x y r r k k k k,...,,...... 2 2 0 (4.) onde é descrio por um processo AR(p), p p u... 2 2. Os parâmeros dese modelo podem ser esimados por mínimos quadrados ordinários ou aravés do méodo de máxima verossimilança. Após a esimação do modelo (4.) devemos verificar as suposições sobre os novos resíduos do modelo, ou seja, para a série u esimada. Eses resíduos devem er disribuição Normal, média zero, variância consane e devem ser independenes. 4.2. Previsão No caso do modelo com erros auorregressivos, a previsão Y é dada por: x x Y r r k k k k... ) (... ) ( ) ( ),( ),( 0 (4.2) onde é calculado aravés do valor esperado das observações fuuras condicionado aos valores passados e ao valor presene da variável, E E,,.

Por exemplo, para um AR(), u a previsão passos à frene, dado que esamos no empo, é: E u ( ). E A expressão acima consiui o modelo geral da previsão. Para sua implemenação compuacional, subsiuímos as esperanças condicionais pelos seus valores correspondenes saisfazendo às seguines resrições: i) Esperança condicional dos já realizados são os próprios resíduos, e, do modelo de regressão original, sem os erros auorregressivos, E E,, e y y para = 0,, 2,... ii) Esperança condicional dos ainda não realizados são as respecivas previsões para, E E,, para =, 2,... iii) Esperança condicional dos u 's, u Eu u, u, 0 E para =, 2,... 3

4.3. Inervalo de Confiança para as Previsões Suposição: onde 2,, ~ N 2 ; é a variância da disribuição de,,. Desa forma, um inervalo de previsão de 00(-)% para as observações fuuras é dado por: np Y ( ) s / 2 (4.3) np onde / 2 é o percenil /2 da disribuição -Suden com -np graus de liberdade, np é o número de parâmeros do modelo, s é o desvio padrão dos resíduos e é o desvio-padrão da disribuição de,,. Mosramos abaixo como calcular para os modelos AR() e AR(2), que são os mais comuns na práica. Modelos com ordem maior que 2 são mais complexos, mas e o cálculo é mais complicado. AR(): 2 4... 2( ) AR(2): 2 2 2 2... onde, 2 2, j j 2 j2, j 3. 32

4.4. Exemplos 4.4.. emperaura global Como vimos nos Exemplos 2.4. e 3.4., o modelo linear ajusado ao desvio da emperaura global possui auocorrelação de ª ordem nos resíduos. Assim, vamos ajusar um novo modelo incluindo um componene AR() para os ermos de erro. O modelo proposo é enão dado por: y 0 900,...,995 2 u, onde u ~ N(0, ), independenes, u que pode ambém ser escrio como: y u 900,...,995. 0 Desa forma, o modelo ajusado, denoado por M.AR, é: y 0 e = -,3582 + 0,0058 x Ano + 0,5663 x e - Saída do R: Esimae Sd. Error z value Pr(> z ) ar 5.6626e-0 8.8868e-02 6.372.866e-0 *** inercep -.358e+0.6980e+00-6.689 2.247e- *** Ano 5.784e-03 8.7664e-04 6.598 4.66e- *** sigma^2 esimaed as 0.005: log likeliood = 79.0, aic = -50.0 R2 = 0.7479499 R2adj = 0.750603 33

rnorm(n - H) -2-0 2 ACF -0.2 0.2 0.4 0.6 0.8.0 M.AR$res -0.2-0. 0.0 0. 0.2 Frequency 0 5 0 5 20 Observamos que os rês coeficienes, 0, e foram esaisicamene significaivos, pois para odos eles o valor-p foi bem menor que 0,05. Verificamos ambém que o valor de R 2 aumenou de 62% para 75%, indicando que a rea ajusada explica melor a variação dos dados. Além diso, o valor do AIC diminuiu de -6,795 para -50,0. Analisando os gráficos de resíduos (Figura 4.) não observamos mais nenum padrão específico no gráfico de resíduos vs. empo, porano podemos dizer que as observações se enconram aleaoriamene disribuídas em orno de zero. O isograma ainda mosra uma leve assimeria, mas o ese de Sapiro-Wilks ambém não rejeiou a suposição de normalidade (0,6688). Os gráficos de FAC e FACP não mosram nenum pico significaivo e a esaísica de Durbin-Wason, d=,967 e 4-d=2,0383, são maiores que d U, =,69. Logo, não exise mais o problema de auocorrelação nos dados. Hisogram of M.AR$res 0 20 40 60 80 ime -0.3-0.2-0. 0.0 0. 0.2 M.AR$res Series M.AR$res -0.2-0. 0.0 0. 0.2 M.AR$res 0 5 0 5 Lag Figura 4.: Gráficos de resíduos para o modelo M.AR ajusado ao desvio da emperaura global Como o modelo M.AR parede adequado, podemos uilizar ese modelo para fazer previsões para os anos de 995-997. 34

Previsões para 995 a 997: Previsão para 995: Para calcular a previsão para o ano de 995 uilizamos o modelo M.AR, onde o ano será igual a 995. Logo o desvio da emperaura previso para 995 será de empmedia 995 = -,3586 + 0,00578404 x 995 + 0,56626 x e 994 = 0,2279 onde e 994 0,0825592 foi obido do modelo M. Inervalo de previsão de 95%: 0,2279 ±,985802 x 0,05227 x = [0,09 ; 0,4366] 953 onde 0.975 =,986 é o percenil 0,975 da disribuição -Suden com 95-3 graus de liberdade, s=0,05227 é o erro padrão dos resíduos e o desvio-padrão da disribuição de,, é igual a, já que emos um AR() e =. Previsão para 996: Para calcular a previsão para 996, uilizamos o modelo M.AR, com o ano igual a 996. empmedia 995 = -,3586 + 0,00578404 x 996 + 0,56626 x e 995 = 0,234 Nese caso, não podemos ober o valor de e 995 direamene do modelo M, pois ese só foi ajusado para os anos de 900 a 994. Assim, caímos no caso (ii) da Seção (2.3). Ou seja, e 995 será dado pela previsão um passo à frene, feia em 994: e 995 994 e994 = 0,56626 x 0,0825592 = 0,234. 35

Inervalo de previsão de 95%: 0,234 ±,985802 x 0,05227 x 0,56626 2 = [-0,0265 ; 0,4533]. Nese caso, a variância da disribuição de AR() e =2.,, é igual a 0,56626 2, já que emos um Previsão para 997: Para calcular a previsão para 997, uilizamos o modelo M.AR, com o ano igual a 997. empmedia 995 = -,3586 + 0,00578404 x 997 + 0,56626 x e 996 = 0,2077 Nese caso, e 996 será dado pela previsão dois passos à frene, feia em 994: e 996 994 2 2 e994 = (0,56626) 2 x 0,0825592 = 0,02647275. Inervalo de previsão de 95%: 0,56626 2 0, 56626 = [-0.044 ; 0.4568]. 0,2077 ±,985802 x 0,05227 x 4 Nese caso, a variância da disribuição de,, é igual a 0,56626 2 0, 56626 4 que emos um AR() e =3. As previsões e os valores reais do desvio da emperaura para ese período são dados na abela 4.. Podemos verificar que o EQMP caiu de 0,0330 para 0,0252 em relação ao modelo sem os erros AR, do Exemplo 2.4.. A Figura 4.2 mosra o ajuse, assim como previsões para os rês úlimos anos, com o inervalo de previsão. Podemos ver que as previsões ainda subesimam o verdadeiro valor do desvio médio de, já 36

desvio emperaura -0.4-0.2 0.0 0.2 0.4 emperaura, apesar dos valores reais esarem denro do inervalo de previsão. Além diso, o ajuse segue de forma bem mais próxima o comporameno da série, comparado com o ajuse do modelo M. abela 4.: Valores reais e previsos para o desvio da emperaura global, de 995 a 997 Ano Real Previso Erro (Real-Previso) 995 0,39 0,2279 0, 62 [0.09 ; 0, 0.4366] 996 0,22 0,234 0, 0066 [-0.0265 ; 0.4533] 997 0,43 0,2077 0, 2223 [-0.044 ; 0.4568] EQMP = 0,0252. 0 20 40 60 80 00 empo Figura 4.2: Ajuse, previsão e inervalos de previsão para o modelo M.AR (emperaura global). A lina prea represena a série do desvio da emperaura média, a lina azul mosra o modelo ajusado, os ponos em azul são os valores previsos e as linas em vermelo são os inervalos de previsão 37

4.4.2. Preço do grão e farelo de soja Nos Exemplos 2.4.2 e 3.4.2, vimos que o modelo linear ajusado ao preço do farelo de soja possui auocorrelação nos resíduos. Após alguns eses, vemos que é necessário ajusar um modelo AR(2) aos resíduos, pois ese modelo apresenou odos os coeficienes significaivos e menor AIC. Assim, vamos ajusar o modelo de regressão com erros AR(2), para o período de jan/990 a fev/999. Novamene, o inercepo não foi significaivo, porano o modelo ajusado, denoado por M2.AR2, foi: y Grao e e = 6,694069 x Grao +,22359 x e - - 0,26080 x e -2 2 2 Saída do R: Esimae Sd. Error z value Pr(> z ) ar.22359 0.098556.3880 < 2e-6 *** ar2-0.26080 0.02302-2.552 0.007 * Grao 6.694069 0.53290 3.428 < 2e-6 *** sigma^2 esimaed as 0.3: log likeliood = -392.97, aic = 793.94 R2 = 0.9430322 R2adj = 0.9480736 Observamos que os coeficienes de, e 2 foram esaisicamene significaivos, pois odos os valores-p foram menores que 0,05. Verificamos que o valor de 2 R adj diminuiu um pouco em relação ao modelo M2 (de 99% para 95%), mas coninua sendo um valor alo e, além diso, vimos que no modelo M2 o R 2 poderia esar sendo afeado pela não validade das suposições do modelo. Corroborando esa análise, vemos que o valor do AIC diminuiu de 935,87 para 793,94. Analisando os gráficos de resíduos (Figura 4.3) não observamos mais nenum padrão específico no gráfico de resíduos vs. empo, porano podemos dizer que as observações se enconram aleaoriamene disribuídas em orno de zero. O isograma ainda mosra uma leve assimeria à direia, mas o ese de Sapiro-Wilks ambém não rejeiou a suposição de normalidade (0,4742). Finalmene, o 38

rnorm(n - H) -2-0 2 ACF -0.2 0.2 0.4 0.6 0.8.0 M2.AR2$res -20-0 0 0 20 30 Frequency 0 5 0 5 20 25 gráfico da FAC não mosra picos significaivos (somene um pico na muio afasado da origem, o que pode ser considerado um ruído) e a esaísica de Durbin-Wason, d= 2,228 e 4-d=,7782 são maiores que d U, =,69. Logo, não exise mais o problema de auocorrelação nos dados. Hisogram of M2.AR2$res 0 20 40 60 80 00 ime -20-0 0 0 20 30 M2.AR2$res Series M2.AR2$res -20-0 0 0 20 30 M2.AR2$res 0 5 0 5 20 Lag Figura 4.3: Gráficos de resíduos para o modelo M2.AR2 ajusado á série do preço do farelo de soja Como o modelo M2.AR2 parece adequado, podemos uilizar ese modelo para fazer previsões para os meses de Se/998 a Ago/999. Previsões para Se/998 a Ago/999: A previsão do preço do farelo de soja para o mês de seembro de 998 é calculada como: Farelo Se/98 = 6,694 x Grao Se/98 +,224 x e Ago/98-0,260 x e Jul/98 = 68,7670 e e e Jul / 98 são obido do modelo M2. onde Ago/ 98 39

Inervalo de previsão de 95%: 68,767 ±,98373 x 0,50 x = [47,94 ; 89,60] 043 onde 0.975 =,98373 é o percenil 0,975 da disribuição -Suden com 04-3 graus de liberdade, s=0,50 é o erro padrão dos resíduos e o desvio-padrão da disribuição de,, é igual a, já que emos um AR(2) e =. A abela 4.2 mosra as previsões doze passos à frene, inervalos de previsão e valores reais para Se/998 a Ago/999. Podemos verificar que a maioria das previsões superesima o verdadeiro valor do preço do farelo de soja, mas os valores reais esão denro do inervalo de previsão. Comparando as previsões do modelo M2 com o modelo M2.AR2, vemos que ese úlimo apresena um EQMP bem menor que o M2, que possuía valor de 460,26. abela 4.2: Previsões seis passos à frene para o preço do farelo de soja, Se/998 a Ago/999 Mês Real Previso Inervalo Previsão Real-Previso Se/998 5,3 68,77 [47,94 ; 89,60] -7,47 Ou/998 54,8 75,56 [44,25 ; 206,87] - 20,76 Nov/998 58,3 77,25 [39,65 ; 24,84] -8,95 Dez/999 57,5 72,9 [3,56 ; 24,27] -5,4 Jan/999 52,0 5,77 [08,3 ; 95,4] 0,23 Fev/999 58, 37,67 [ 92,64;82,70 ] 20,43 Mar/999 29,4 33,56 [87,66 ; 79,45] -4,6 Abr/999 30,2 37,83 [9,40 ; 84,26] -7, 63 Mai/999 26,3 4,55 [94,78 ; 88,3] -5,25 Jun/999 3,2 42,9 [95,94 ; 89,88] -,7 Jul/999 33,8 39,62 [95,52 ; 86,72] -5,82 Ago/999 44,8 50,07 [02,89 ; 95,26] -5,27 EQMP = 88,06. 40

Farelo 00 50 200 250 300 A Figura 4.4 mosra o ajuse, assim como previsões para os seis úlimos meses, com o inervalo de previsão. Podemos ver que o modelo ajusado segue bem o comporameno da série, com previsões próximas dos valores reais. 0 20 40 60 80 00 20 empo Figura 4.4: Ajuse, previsão e inervalos de previsão para o modelo M2.AR2 (Farelo). A lina prea represena a série do preço do farelo de soja, a lina azul mosra o modelo ajusado, os ponos em azul são os valores previsos e as linas em vermelo são os inervalos de previsão. 4

CEP 250 300 350 400 450 500 5. Séries sazonais Sazonalidade: endência do processo em repeir um cero ipo de comporameno denro de um período sazonal (geralmene 2 meses para séries mensais, 4 meses para séries rimesrais, ec.). Um exemplo de série sazonal é a série das Cenrais Eléricas do Paraná (CEP), visa no do Exemplo.3. A Figura 5. apresena novamene a série CEP, onde podemos visualizar a sazonalidade que ocorre de 2 em 2 meses. 980 982 984 986 988 990 992 Figura 5.. Série CEP, com sazonalidade mensal A série CEP, além da sazonalidade, apresena ambém uma endência crescene. Assim, para ajusar um modelo de regressão a esa série emos que incluir ano componenes de endência, quando componenes para modelar a sazonalidade. Nese capíulo vamos ver como ajusar modelos que incluem odos eses componenes, assim como covariáveis, caso enamos alguma variável exerna que possa ajudar a modelar e fazer previsões para séries sazonais. Além diso, vamos ambém incorporar o modelo auorregressivo nos erros do modelo de regressão, caso os resíduos não sejam um ruído branco. 42

5. Modelo de regressão para séries sazonais com erros auorregressivos Consideremos o seguine modelo para séries sazonais: ' y F x,,..., n, (5.) onde é um ruído branco Gaussiano, é a endência no período de empo, que pode ser modelada como dado na Equação (2.2), x é o veor de covariáveis e F é o componene de sazonalidade. Uma forma de modelar padrões sazonais é empregando variáveis dummy. Assumindo que exisem S períodos sazonais, o componene F pode ser escrio como: F D, 2D2,... ( S ) D( S ), (5.2) onde D, D2,,..., D( S ),, são variáveis indicadoras (ou dummy) consruídas da seguine forma: D, D 2, 0 0 para o período caso conrário para o período 2 caso conrário D... ( S ), 0 para o períodos - caso conrário Obs.: Devemos consruir sempre (S-) variáveis dummy para modelar a pare sazonal, para eviar o problema da mulicolinearidade. 43

Desa forma, o modelo geral para séries polinomiais de ordem k, com p variáveis explicaivas, x,..., x p, e variação sazonal de período S é dado por: y k 0... k k x... k r xr k r D,... k r ( S ) D( S ),,,..., n 2 onde N0, ~, independenes. (5.3) O componene, i k r,..., k r ( S ), da pare sazonal, represena a diferença, i excluindo a endência, enre o nível da série emporal no período i em relação ao período S. Por exemplo, se i for negaivo, o valor da série no período i é esperado ser menor do que no período S. Os parâmeros do modelo podem ser esimados por mínimos quadrados ordinários. O modelo (5.3) pode ser esimado uilizando mínimos quadrados ordinários. A análise de resíduos deve verificar se odas as suposições do modelo esão sendo saisfeias, ou seja, se os resíduos são independenes, com disribuição normal de média zero e variância consane. Se a suposição de independência não for saisfeia, devemos ajusar o modelo com erros auorregressivos. Consideremos enão o modelo de regressão polinomial em séries emporais, que conena variação sazonal com período S e erros auorregressivos de ordem p. Nese caso, o modelo a ser esimado é o mesmo dado na Equação (5.3). Porém, o ermo de erro,, é descrio por um processo auoregressivo de ordem p, 2... p u. (5.4) Os parâmeros dese modelo ambém podem ser esimados por mínimos quadrados ordinários ou aravés do méodo de máxima verossimilança. Além diso, devemos verificar as suposições de independência, normalidade e variância consane sobre os novos resíduos do modelo, ou seja, para a série u esimada. 44

45 5.2. Previsão No caso do modelo de regressão polinomial, que conena variação sazonal com período S e erros auorregressivos de ordem p, a previsão Y é dada por: D D x x Y S S r k r k r r k k p k......... ) ( ) ( ), ( ) (, ),( ),( 0 onde é calculado aravés do valor esperado das observações fuuras condicionado aos valores passados e ao valor presene da variável, como viso na Seção 4.2, E. Um inervalo de previsão de 00(-)% para as observações fuuras é dado por: np s Y 2 / ) ( onde np 2 / é o percenil /2 da disribuição -Suden com -np graus de liberdade, np é o número de parâmeros do modelo, s é o desvio padrão dos resíduos e é o desvio-padrão da disribuição de,,. Caso não seja necessário incluir a pare auorregressiva no modelo, a previsão ponual feia no empo para y é dada simplesmene por, S S r k r k r r k k p k D D x x Y ), ( ) (, ),( ),( 0......... ) ( ) ( e os inervalos de previsão de 00(-)% são obidos como: s Y np 2 / ) (.

5.3. Exemplo Série CEP Vamos uilizar a série das Cenrais Eléricas do Paraná (CEP), de jan/80 a dez/92, reirando as úlimas 2 observações (jan/92 a dez/92) para fazer previsões. Logo, n=44. O modelo uilizado é dado por: y 0 2D,... 2D,,,...,44. Desa forma, as esimaivas para os parâmeros do modelo M_CEP são dadas por: Saída do R: Esimae Sd. Error value Pr(> ) (Inercep) 227.6076 3.2438 70.29 < 2e-6 *** Ano.36033 0.02047 66.464 < 2e-6 *** facor(sazon)2 25.88967 4.5362 6.233 5.8e-09 *** facor(sazon)3 34.69600 4.5377 8.353 8.33e-4 *** facor(sazon)4 46.25233 4.5402.34 < 2e-6 *** facor(sazon)5 54.72533 4.5438 3.73 < 2e-6 *** facor(sazon)6 5.69833 4.5483 2.443 < 2e-6 *** facor(sazon)7 45.25466 4.5538 0.89 < 2e-6 *** facor(sazon)8 48.4433 4.5604.584 < 2e-6 *** facor(sazon)9 47.733 4.5680.335 < 2e-6 *** facor(sazon)0 42.42366 4.5765 0.204 < 2e-6 *** facor(sazon) 22.22999 4.586 5.346 3.88e-07 *** facor(sazon)2 9.966 4.5967 4.596 9.99e-06 *** Residual sandard error: 0.7 on 3 degrees of freedom Muliple R-squared: 0.9736, Adjused R-squared: 0.972 F-saisic: 402. on 2 and 3 DF, p-value: < 2.2e-6 AIC(M): 09.46 Os coeficienes 0 e são ambos significaivos e, como o sinal de foi posiivo, iso indica que o consumo de energia elérica no Paraná em uma endência de aumeno com o passar do empo. As variáveis dummy foram consruídas com janeiro sendo o mês de referência. Como odos os coeficienes sazonais foram significaivos e posiivos, iso significa que odos os meses apresenam um consumo de energia significaivamene maior do que o do mês de janeiro. O valor de R 2 foi 46

rnorm(n - H) -3-2 - 0 2 3 ACF -0.2 0.2 0.4 0.6 0.8.0 M_CEP$res -20-0 0 0 20 30 Frequency 0 5 0 5 20 25 30 35 suficienemene alo (97,2%), o que pode levar à conclusão de que a rea ajusada explica bem a variação dos dados. Porém, analisando os gráficos de resíduos da Figura 5.2 observamos que várias suposições do modelo não esão saisfeias. Hisogram of M_CEP$res 0 20 40 60 80 00 40 Index -30-20 -0 0 0 20 30 M_CEP$res Series M_CEP$res -20-0 0 0 20 30 M_CEP$res 0 5 0 5 20 Lag Figura 5.2: Gráficos de resíduos para o modelo M_CEP ajusado á série CEP O gráfico de resíduos vs. empo, mosra uma diminuição nos empos iniciais e depois um aumeno, porano não podemos dizer que as observações se enconram aleaoriamene disribuídas em orno de zero. O isograma apresena uma leve assimeria à direia, mas o qqplo e o ese de Sapiro- Wilks (valor-p=0,855) não rejeiam a suposição de normalidade. O gráfico da FAC mosra vários 47

picos significaivos e a esaísica de Durbin-Wason (d= 0,579) é menor que d U, =,65, logo exise auocorrelação posiiva de ordem nos dados. Se quisermos fazer previsões 2 passos à frene uilizando ese modelo, eremos: Janeiro de 994: A previsão do consumo de energia da série CEP para o mês de jan/94 é: CEP Jan/94 = 227,6076 +,3603 x 45 = 424,85. Observamos que nenum coeficiene das variáveis dummy enra na previsão acima, já que para o mês de janeiro odas as dummy são iguais a zero. Inervalo de previsão de 95%: 424,85 ±,9782 x 0,743 = [404,7246 ; 444,9776] onde 443 0.975 =,9782 é o percenil 0,975 da disribuição -Suden com 44-3 graus de liberdade e s=0,743 é o erro padrão dos resíduos. Fevereiro de 994: A previsão do consumo de energia da série CEP para o mês de fev/94 é dada por: CEP Fev/94 = 227,6076 +,3603 x 46 + 25,8897 x = 452,0. Para a previsão de Fev/94 será necessário incluir somene o coeficiene da variável dummy de fevereiro, 25,8897, já que odas as ouras variáveis dummy serão iguais a zero para ese mês. Desa forma, obemos as previsões para os meses subsequenes, que são apresenadas na abela 5.. A Figura 5.3 mosra o ajuse, assim como previsões para os seis úlimos meses, com o inervalo de 48

CEP 250 300 350 400 450 500 previsão. Podemos ver que o ajuse para os 4 úlimos meses não é muio boa, e ano as previsões como os inervalos se enconram bem abaixo dos valores reais. abela 5.: Previsões 2 passos à frene para o consumo de energia elérica da CEP, Jan/92 a Dez/92 Mês Real Previso Inervalo Previsão Real-Previso Jan/992 425 424,85 [404,72 ; 444,98] 0,4 Fev/992 465 452,0 [43,98 ; 472,23] 2,89 Mar/992 474 462,27 [442,5 ; 482,40],73 Abr/992 485 475,9 [455,06 ; 495,32] 9,8 Mai/992 506 485,02 [464,90 ; 505,5] 20,98 Jun/992 499 483,36 [463,23 ;503,48] 5,64 Jul/992 48 478,27 [458,5 ; 498,40] 2,73 Ago/992 492 482,52 [462,40 ; 502,65] 9,48 Se/992 54 482,86 [462,73 ; 502,98] 3,4 Ou/992 55 479,52 [459,40 ; 499,65] 35,48 Nov/992 483 460,69 [440,56 ; 480,82] 22,3 Dez/992 48 458,94 [438,8 ; 479,07] 22,06 EQMP = 366,26. 0 50 00 50 empo 49