ANÁLISE DE SÉRIES TEMPORAIS Ralph S. Silva http://www.im.ufrj.br/ralph/seriestemporais.html Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro
Estimação dos coeficientes autoregressivos φ 1, φ 2,..., φ p. Estimação dos coeficientes médias móveis θ 1, θ 2,..., θ q. Estimação da variância (σ 2 ) do ruído branco. Escolher a ordem p e q do modelo ARMA utilizando critérios de seleção baseados na função de verossimilhança mais uma penalização: AIC e BIC. Em geral, podemos trabalhar com processos ARMA com média zero: Φ(B)Y t = Θ(B)ε t, ε t RB(0, σ 2 ). Suponha que {Y t} seja um série temporal gaussiana com média zero e função de autocovariância κ(i, j) = E(Y i Y j ).
Seja Y T = (Y 1,..., Y T ) e seja Y T = ( Y 1,..., Y T ) em que Y 1 = 0 e Y j = E(Y j Y 1,..., Y j 1 ) = P j 1 Y j, j 2. Denotaremos por Γ T a matriz de covariância Γ T = E(y T Y T ). Suponha que Γ T seja não singular. Então, a função de verossimilhança é dada por ( L(Γ T ) = (2π) T /2 Γ T 1/2 exp 1 ) 2 Y T Γ 1 T Y T. (1) O cálculo direto de Γ T e Γ 1 T podem ser evitados. Para isto se utiliza os erros de previsão um passo à frente Y j Y j e suas variâncias ν j 1, j = 1,..., T. Ambos podem ser calculados através do algoritmo das inovações.
Do algoritmo das inovações, temos Y T = C T (Y T Y T ). Pode ser mostrado que as componentes de (Y T Y T ) são não correlacionadas. Logo, (Y T Y T ) tem matriz de covariância diagonal dada por Logo, Γ T = C T D T C T, e Y T Γ 1 T D T = diag{ν 0,..., ν T 1 }. Y T = (Y T Y T ) Γ 1 T (Y T Y T ) = T (Y j Y j ) 2 /ν j 1. j=1 Γ T = ( C T ) 2 ( D T ) = ν 0 ν 1 ν n 1. A função de verossimilhança em (1) do vetor Y T se reduz a 1/2 ( T T /2 L(Γ T ) = (2π) ν j 1 exp 1 T Y j Y ) j. (2) 2 j=1 j=1 ν j 1
Teremos {Y t} como um processo ARMA(p, q) e portanto Γ T pode ser expresso em termos de um número finito de parâmetros desconhecidos. Logo, o estimador de máxima verossimilhança dos parâmetros são aqueles valores que maximizam a função L(Γ T ) para uma série observada. Recorremos a métodos numéricos para encontrar as estimativas de máxima verossimilhança. No programa R utilizaremos a função arima.
Seleção de modelos AIC = 2 log L(Γ T ) + 2k = 2 log L(Φ, Θ, σ 2 ) + 2(p + q + 1) BIC = 2 log L(Γ T ) + k log(t ) = 2 log L(Φ, Θ, σ 2 ) + (p + q + 1) log(t ) Devemos escolher, em geral, p, q, Φ p and Θ q que minimizam o valor do AIC. O mesmo vale se usarmos o BIC.
Intervalo de confiança para os coeficientes Para um tamanho de amostra grande o estimador de máxima verossimilhança β de β = (φ 1,..., φ p, θ 1,..., θ q) tem distribuição aproximadamente normal com média β e matriz de covariância T 1 V (β). A matriz de covariância T 1 V (β) pode ser aproximada por 2H 1 (β), em que H a matriz hessiana: [ ] 2 log L(β, σ 2 p+q ) β i β j. i,j=1 As variâncias e covariâncias podem ser usadas para construir intervalos de confiança. Então, para uma amostra grande de um processo ARMA(p, q) temos β N (β, T 1 V (β)).
ARIMA(p, d, q) para séries não estacionárias Os processos ARIMA se reduzem aos processos ARMA quando diferenças finitas são aplicadas várias vezes. Definição Se d é um inteiro não negativo, então {W t} é um processo ARIMA(p, d, q) se Y t (1 B) d W t for um processo ARMA(p, q) causador. Uma outra maneira de representar o processo é Φ(B)(1 B) d Y t = Θ(B)ε t, ε t RB(0, σ 2 ).
SARIMA(p, d, q)(p, D, Q): o ARIMA com sazonalidade Definição Se d e D são inteiros não negativos, então {Y t} é um processo ARIMA(p, d, q)(p, D, Q) sazonal com período s se a séria diferenciada W t = (1 B) d (1 B s ) D Y t é um processo ARMA causal definido por Φ(B) Φ(B s )W t = Θ(B) Θ(B s )ε t, ε t RB(0, σ 2 ), em que Φ(B) = 1 φ 1 z φ pz p, Φ(B) = 1 φ 1 z φ pz p, Θ(B) = 1 + θ 1 z + + θ qz q e Θ(B) = 1 + θ 1 z + + θ qz q. Os modelos ARIMA sazonal permitem aleatoriedade no padrão sazonal da série temporal de um ciclo para o outro. Isto é diferente do modelo aditivo Y t = m t + s t + ε t.
Regressão com erros ARMA (ARMAX) O modelo de regressão com erros ARMA é definido por Y t = β 0 + β 1 X 1t + + β k X kt + W t, W t ARMA(p, q), com média zero e para t = 1, 2,..., T. Podemos reescrever o modelo como Φ(B)Y t x tβ = Θ(B)ε t, ε t RB(0, σ 2 ).