ESTATÍSTICA COMPUTACIONAL Ralph dos Santos Silva Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro
Sumário
Motivação Por exemplo, queremos analisar a série de vendas mensais de um certo tipo doce no Reino Unido de janeiro de 1976 a dezembro de 1981 e, se possível, utilizar a série de preços, na escala do logaritmo, deste doce como variável explicativa. Tendência? Sazonalidade? Variáveis causais (explicativas)? Vendas 7 8 9 10 11 Preços 2 1 0 1 2 1976 1977 1978 1979 1980 1981 1982 Mês (a) Vendas 1976 1977 1978 1979 1980 1981 1982 Mês (b) Preços Figura: Vendas e logaritmo dos preços mensais de um certo tipo doce no Reino Unido de janeiro de 1976 a dezembro de 1981.
A maioria das análises estatísticas utiliza modelos estáticos: modelos com uma descrição fixa (através de parâmetros fixos) ao longo das unidades de observação. Por exemplo: Análise de regressão, Modelos ARMA, y t = α + βx t + ε t, ε t N (0, σ 2 ); e y t = α+φ 1 y t 1 + +φ py t p +θ 1 ε t 1 + +θ qε t q +ε t, ε t N (0, σ 2 ). Em séries temporais, essa hipótese muitas vezes é violada: as estruturas mudam com a passagem do tempo. Séries temporais ligados às atividades humanas são alvos de mudanças: Abruptas - devido a grandes mudanças, hecatombes, novas leis; Graduais.
Aqui, todos os modelos são dinâmicos: A descrição (os parâmetros) muda com a passagem do tempo. Neste curso em especial, os modelos dinâmicos nos permitem a modelagem da tendência (média) e variância (volatilidade). Eles incluem como casos particulares os modelos estáticos. Normalmente, a passagem do tempo traz observações e aumenta o nosso conhecimento. Em modelos dinâmicos temos também perda de informação devido à passagem do tempo. Exemplo: o nível de vendas mês passado é mais relevante hoje que o nível de vendas em janeiro passado. Construção do modelo dinâmico é feita em duas etapas: 1 a : Qualitativa; 2 a : Quantitativa de uma forma local. Em modelos estáticos, a mesma quantificação é válida globalmente.
O modelo de regressão usual Em um modelo de regressão temos uma variável resposta y que é explicada por um conjunto de variáveis explicativas x 1,..., x p através da relação y = θ 0 + θ 1 x 1 +... + θ px p + ε. Em geral, assume-se que o ε tem distribuição N (0, σ 2 ). A equação acima pode ser mais compactamente escrita como: y = x θ + ε, sendo x = 1 x 1. x p e θ = θ 0 θ 1. θ p.
A natureza das variáveis explicativas ou regressoras é bastante ampla. Podendo assim, utilizar-se qualquer variável quantificável. Os coeficientes de regressão θ 1,..., θ p informam sobre a influência que os regressores têm sobre a resposta y. Na prática, seus valores são desconhecidos e estimados a partir de uma coleção de observações feitas sobre o modelo acima. Observamos respostas y 1,..., y n com seus respectivos regressores x 1,..., x n. Simbolicamente, temos: y t = x tθ + ε t, t = 1,..., n.
Definição do modelo de espaço de estados Em modelos dinâmicos os parâmetros mudam com o passar do tempo. O modelo de regressão é estendido para Note a indexação de θ. y t = x tθ t + ε t, t = 1,..., n. A formulação acima cria uma profusão de parâmetros a serem estimados. O modelo acima necessita de mais informação. Essa informação vem do fato que os parâmetros sucessivos estão intimamente relacionados. Em geral, um parâmetro é igual ao seu antecessor mais uma pequena perturbação causada pelas mudanças às quais o sistema está sujeito. Se o sistema é estático, como em regressão, temos: θ t = θ t 1 = θ.
Em modelos dinâmicos, vamos admitir a forma mais geral θ t = G tθ t 1 + w t, sendo que G t contém valores conhecidos (ou parâmetros fixos) e w t é uma perturbação aleatória. A equação acima é conhecida como equação do sistema. A matriz de evolução G t controla a parte determinística da evolução do sistema e estabelece a propagação do sistema ao longo do tempo. A perturbação w t é responsável pela introdução de incertezas devidas à passagem do tempo e consequente perda de informação. Note que se G t = I e w t = 0, o modelo se reduz ao caso estático.
Exemplo Se observamos uma série de vendas explicada pela respectiva série de preços através de uma relação estável teremos: vendas t = µ t + β tpreço t + v t µ t = µ t 1 + w 1t β t = β t 1 + w 2t. As vendas são explicadas pelo preço em uma regressão dinâmica. A maior (ou menor) estabilidade dessa relação será controlada pela magnitude dos incrementos (erros) w 1t e w 2t.
Modelo linear dinâmico O modelo linear dinâmico pode então ser definido como: Equação das observações: y t = F tθ t + v t, v t N (0, V t) Equação do sistema: θ t = G tθ t 1 + w t, w t N (0, W t) No exemplo acima, y t = venda t, F t = (1, preço t ) ( ) ( ) µt 1 0 θ t =, G t = I 2 = 0 1 β t e w t = ( w1t w 2t )
Exemplo Vamos analisar a série de vendas mensais de um certo tipo doce no Reino Unido de janeiro de 1976 a dezembro de 1981. Também utilizaremos a série de preços, na escala do logaritmo, deste doce como variável explicativa. Vendas 7 8 9 10 11 Preços 2 1 0 1 2 1976 1977 1978 1979 1980 1981 1982 Mês (a) Vendas 1976 1977 1978 1979 1980 1981 1982 Mês (b) Preços Figura: Vendas e logaritmo dos preços mensais de um certo tipo doce no Reino Unido de janeiro de 1976 a dezembro de 1981.
Alguns modelos Consideraremos três modelos. Modelo de tendência estável. É composto apenas de um nível que varia segundo um passeio aleatório. vendas t = µ t + v t, v t N (0, V t) µ t = µ t 1 + w t, w t N (0, W t). Segundo esse modelo, o nível permanece localmente constante, mas varia quando se considera longos períodos de tempo. Usualmente, a variação das observações em torno dos níveis (medida por V t) é bem maior que as variações temporais do nível ao longo do tempo (medidas por W t). O modelo de tendência estável é obtido ao particularizar o modelo dinâmico com F t = 1 e G t = 1. Para a série de vendas de doce faremos V t = V e W t = W para todo t (variâncias constantes ao longo do tempo).
Observações importantes Consideraremos a análise somente após observar toda a série. Isto é, a análise suavizada. É possível considerar a análise sequencial no tempo. Para uma subclasse dos modelos dinâmicos (lineares e com erros normais) é possível aplicar o filtro de Kalman na análise sequencial. Por exemplo, os três modelos que veremos para os dados de vendas do doce. O filtro de Kalman também pode ser empregado nestes modelos para a análise por máxima verossimilhança. Nós consideraremos somente a análise bayesiana. Precisaremos descrever o modelo e a distribuição priori dos parâmetros. Utilizaremos o OpenBUGS para fazer a análise. Podemos calcular o Critério de Informação do Desvio (DIC) para comparar modelos. Mostrar exemplo no OpenBUGS: doce_modelo_01.odc
Modelo de tendência linear. Isso é quantificado através de um parâmetro adicional. vendas t = µ t + v t, v t N (0, V t) µ t = µ t 1 + β t 1 + w 1t β t = β t 1 + w 2t, sendo w t = (w 1t, w 2t ) N (0, W t). ( 1 Esse modelo é obtido com F t = 0 ) ( 1 1 e G t = 0 1 Aqui, o nível permanece localmente linear, mas a forma da reta pode variar com o tempo. ( ) σ 2 Para a série de vendas de doce faremos V t = V e W t = W = 1 0 0 σ2 2 para todo t (independência e variâncias constantes ao longo do tempo). Mostrar exemplo no OpenBUGS: doce_modelo_02.odc ).
Modelo de regressão dinâmica. Introduzimos variáveis explicativas com coeficientes variando no tempo. vendas t = µ t + β tpreço t + v t, v t N (0, V t) µ t = µ t 1 + w 1t β t = β t 1 + w 2t, sendo w t = (w 1t, w 2t ) N (0, W t). ) (, F t = ) e G t = I. ( µt 1 Esse modelo é obtido com θ t = β t preço t ( ) σ 2 Para a série de vendas de doce faremos V t = V e W t = W = 1 0 0 σ2 2 para todo t (independência e variâncias constantes ao longo do tempo). Mostrar exemplo no OpenBUGS: doce_modelo_03.odc
Modelo de efeitos sazonais. Considere o modelo y t = γ t + v t, sendo γ t a componente de sazonalidade. Seja s o número de períodos nos dados. Por exemplo, s = 12 para dados mensais; s = 4 para dados trimestrais; e s = 7 para dados diários e modelagem de padrões semanais. A maneira mais simples de modelar efeitos sazonais é utilizando variáveis binárias. A soma dos efeitos do período devem ser igual a zero, s 1 γ t = γ t j. Para permitir que o padrão mude ao longo do tempo, introduzimos um novo termo de erro, j=1 j=1 s 1 γ t = γ t j + w t, w t N (0, σ 2 ). O valor esperado da soma dos efeitos sazonais é zero.
Previsão Estamos interessados na previsão de horizonte h na origem t, y t+h. Podemos considerar o conjunto {y t+1, y t+2,..., y t+h } como não observados (dados faltantes). Do ponto de vista bayesiano, devemos estimar estas quantidades condicional aos dados. Este procedimento é facilmente implementado no OpenBUGS. Em geral, tomamos a média a posterior de y t+h como a previsão (pontual). Temos também o intervalo de previsão (intervalo de credibilidade) de y t+h. Mostrar exemplos no OpenBUGS: doce_modelo_01_b.odc e doce_modelo_02_b.odc
Superposição de modelos Estamos interessados em uma forma geral para estruturar e acomodar as várias componentes intervenientes em um modelo dinâmico. Por exemplo, variáveis causais e sazonalidade. Muitas séries temporais exibem um comportamento bastante complexo. Ao identificarmos as características mais marcantes, estamos caminhando na direção de formular um modelo. A série ilustrada na figura a seguir é um exemplo típico. A tendência global parece ser de uma variação suave do nível. Se agora nos concentramos na variação em torno desse nível, podemos detectar um comportamento cíclico. Essa inspeção permitiu identificar as duas componentes do modelo: uma componente para a tendência e outro para a sazonalidade.
Exemplo Vendas 5 10 15 20 25 1960 1962 1964 1966 1968 Mês Figura: Venda de carros nos EUA de janeiro de 1960 a dezembro de 1968.
A estrutura dos modelos dinâmicos é apropriada para isto, pois permite que as componentes sejam modeladas separadamente e depois integradas em um modelo. No caso mais comum de duas componentes: tendência e sazonalidade, estruturamos a equação das observações com dois termos: y t = y Nt + y St + v t. Cada um dos termos é descrito na dinâmica a seguir. y Nt = F Ntθ Nt θ Nt = G Ntθ Nt 1 + w Nt e y St = F Stθ St θ St = G Stθ St 1 + w St.
Se agora integramos esses termos, obtemos a equação das observações Y t = F tθ t + v t sendo F t = ( FNt F St ) e θ t = ( θnt Similarmente, a equação do sistema (integrado) fica θ St ). θ t = G tθ t 1 + w t, w t N (0, W t) sendo ( GNt 0 G t = 0 G St ) ( WNt 0 e W t = 0 W St ). Modelos com mais componentes são construídos da mesma forma: cada termo contribui para a equação das observações e com um bloco de parâmetros para a equação do sistema.
Exemplo (superposição: tendência linear e sazonalidade) Vamos analisar a série de venda de carros nos EUA. Note a tendência linear e a sazonalidade. Mostrar exemplo no OpenBUGS: carro_modelo_01.odc Exercício Agora, como exercício da Lista 06, analise a série vendas mensais de vinho na Austrália de janeiro de 1980 a dezembro de 1991. Arquivo vinho_openbugs.txt Dica: note a presença de tendência linear, sazonalidade e variância crescente ao longo do tempo.
Modelos condicionalmente heterocedásticos O objetivo é a modelagem da volatilidade do retorno de um ativo. Os modelos são chamados de condicionalmente heterocedásticos. A volatilidade é um fator importante na negociação de opções (por exemplo, fórmula de Black-Scholes). A volatilidade significa a variância (ou desvio padrão) condicional do retorno de um ativo. A modelagem da volatilidade de uma série temporal pode melhorar a eficiência na estimação dos parâmetros e na precisão do intervalo de previsão. Veremos o seguinte modelo: SV: volatilidade estocástica. Existem muitos outros. Por exemplo, ARCH e GARCH.
Características da volatilidade A volatilidade de uma ação não é diretamente observável. Isto implica que é difícil avaliar a performance de previsão nos modelos condicionalmente heterocedásticos. Existem conglomerados de volatilidade (períodos de alta e de baixa). A volatilidade muda de forma contínua através do tempo. A volatilidade não diverge para o infinito. Logo, a volatilidade é geralmente estacionária. A volatilidade parece reagir diferentemente para um aumento grande de preço ou uma queda grande de preço, conhecido como efeito de influência (leverage effect).
Log Retorno 0.10 0.05 0.00 0.05 0.10 0 500 1000 1500 2000 2500 3000 Dias Figura: Log retornos diários do IBOVESPA de 3 de janeiro de 2000 a 26 de abril de 2013.
ACF 0.0 0.2 0.4 0.6 0.8 1.0 ACF 0.0 0.2 0.4 0.6 0.8 1.0 0 2 4 6 8 10 12 14 Defasagem (a) Log retornos 0 2 4 6 8 10 12 14 Defasagem (b) Valor absolutos log retornos ACF 0.0 0.2 0.4 0.6 0.8 1.0 0 2 4 6 8 10 12 14 Defasagem PACF 0.2 0.0 0.2 0.4 0.6 0.8 1.0 2 4 6 8 10 12 14 Defasagem (c) Quadrados dos log retornos (d) Quadrados dos log retornos Figura: ACF e PACF amostral para algumas funções do log retornos diários do IBOVESPA de 3 de janeiro de 2000 a 26 de abril de 2013.
Modelo de volatilidade estocástica Estamos interessados em modelar a volatilidade. Este modelo também está na classe dos modelos dinâmicos (não lineares). O modelo: r t = exp{h t/2}ε t, ε t N (0, 1) h t = α + φ(h t 1 α) + ω t, ω t N (0, σ 2 ), para t = 1, 2,..., T. r t é o log retorno, isto é, r t = ln(p t) ln(p t 1 ); h t é a log volatilidade; α é o intercepto (constante); φ é o parâmetro de persistência; e σ 2 é a variância das log volatilidades.
Inferência bayesiana Para este modelo, utilizaremos a abordagem bayesiana para inferir sobre as quantidades desconhecidas do modelo. Construimos a função de verossimilhança utilizando as equações das observações e do estado. Completamos o modelo com a distribuição a priori. Distribuição a posteriori: p(α, φ, σ 2, h 1:T y) [ T ] [ T ] p(y t h t) p(h t h t 1, α, φ, σ 2 ) t=1 sendo p(α, φ, σ 2 ) a distribuição a priori. t=2 p(h 1 α, φ, σ 2 )p(α, φ, σ 2 ), Em geral, assumimos que p(α, φ, σ 2 ) = p(α)p(φ)p(σ 2 ). Temos a restrição φ < 1. Vamos impor que 0 φ < 1.
Distribuição a priori: h 1 N ( ) σ 2 α, 1 φ 2 α N (0; 10000) φ Beta(20; 1, 5) σ 2 IG(2, 5; 0, 025) (inversa gama).
Exemplo: Retornos do Reino Unido (MSCI) Retornos 0.15 0.10 0.05 0.00 0.05 0.10 0 50 150 250 350 450 Semanas Figura: Retornos semanais do Reino Unido (MSCI) de 6/jan/2000 a 28/jan/2010 (T=526).
Resultados Mostrar exemplo no OpenBUGS: volatilidade_01.odc Previsão Parâmetro Média D.P. 2,5% Mediana 97,5% α -7,534 0,4505-8,282-7,545-6,713 φ 0,966 0,0171 0,927 0,968 0,993 σ 2 0,056 0,0256 0,021 0,052 0,120 A previsão segue o padrão mostrado para os modelos dinâmicos. Mostrar exemplo no OpenBUGS: volatilidade_02.odc Superposição de modelos A equação da média com estrutura de tendência estável: r t = γ t + exp{h t/2}ε t e γ t = γ t 1 + ξ t, ξ t N (0, δ 2 ). Podemos incluir o retorno defasado como um AR, por exemplo r t = γ + βr t 1 + exp{h t/2}ε t.
Resultados do modelo r t = γ + βr t 1 + exp{h t/2}ε t h t = α + φ(h t 1 α) + ω t. Mostrar exemplo no OpenBUGS: volatilidade_03.odc Parâmetro Média D.P. 2,5% Mediana 97,5% α -7,575 0,3852-8,2750-7,5800-6,8450 φ 0,960 0,0190 0,9165 0,9623 0,9899 σ 2 0,068 0,0299 0,0254 0,0624 0,1380 γ 0,002 0,0009 0,0002 0,0020 0,0038 β -0,014 0,0297-0,0973-0,0022 0,0233