ESTATÍSTICA COMPUTACIONAL

Documentos relacionados
Econometria em Finanças e Atuária

Econometria em Finanças e Atuária

Análise Multivariada Aplicada à Contabilidade

4 Modelos de Regressão Dinâmica

Metodologia de Box-Jenkins. Metodologia de Box-Jenkins. Metodologia de Box-Jenkins

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.

AULA 09 Regressão. Ernesto F. L. Amaral. 17 de setembro de 2012

AULAS 14 E 15 Modelo de regressão simples

IND 1115 Inferência Estatística Aula 6

Aula 2 Tópicos em Econometria I. Porque estudar econometria? Causalidade! Modelo de RLM Hipóteses

CONHECIMENTOS ESPECÍFICOS

Modelos ARCH e GARCH Aula 8. Morettin e Toloi, 2006, Capítulo 1 e 14 Morettin, 2011, Capítulo 1 e 5 Bueno, 2011, Capítulo 8

Exercícios Selecionados de Econometria para Concursos Públicos

Nessa situação, a média dessa distribuição Normal (X ) é igual à média populacional, ou seja:

Econometria em Finanças e Atuária

Introdução ao modelo de Regressão Linear

REGRESSÃO LINEAR Parte I. Flávia F. Feitosa

ECONOMETRIA. Prof. Patricia Maria Bortolon, D. Sc.

Introdução a Inferência Bayesiana

Módulo 2 AVALIAÇÃO DA DEMANDA EM TRANSPORTES

Introdução ao Planejamento e Análise Estatística de Experimentos 1º Semestre de 2013 Capítulo 3 Introdução à Probabilidade e à Inferência Estatística

Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência

MAE Introdução à Probabilidade e Estatística II Resolução Lista 5

A Metodologia de Box & Jenkins

INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA

Probabilidade e Estatística. Estimação de Parâmetros Intervalo de Confiança

Correlação e Regressão Linear

Determinantes da Demanda de Óleo Diesel no Brasil. Niágara Rodrigues UFF Luciano Losekann UFF Getúlio Borges UFRJ

Definição. Os valores assumidos pelos estimadores denomina-se estimativas pontuais ou simplesmente estimativas.

Inferência Estatística:

4 Modelos Lineares Generalizados

Capítulo 3: Elementos de Estatística e Probabilidades aplicados à Hidrologia

Introdução a Modelos ARCH

UMA ANÁLISE ECONOMÉTRICA DO ICMS *

ECONOMETRIA. Prof. Patricia Maria Bortolon, D. Sc.

Conceitos Básicos de Séries Temporais para Modelagem Macroeconômica

AULA 11 Heteroscedasticidade

3 Modelos Comparativos: Teoria e Metodologia

ECONOMETRIA. Prof. Patricia Maria Bortolon, D. Sc.

AULA 30 16/06/2009 Econometria. Bibliografia:Introdução do livro: GUJARATI, D. Econometria Básica. São Paulo: Makron Books, 2000.

Revisão de Modelos de regressão. Prof. Thais C O Fonseca - DME, UFRJ

Séries Temporais e Modelos Dinâmicos. Econometria. Marcelo C. Medeiros. Aula 4

Análise de séries temporais financeiras

Sumário. CAPÍTULO 1 Conceitos preliminares 1. CAPÍTULO 2 Descrição de dados: análise monovariada 47

EXAME NACIONAL DE SELEÇÃO 2010

Universidade Federal de Viçosa Departamento de Estatística

Investigação Operacional 2º Semestre 2002/2003 Problema Resolvido

CONHECIMENTOS ESPECÍFICOS

Paulo Jorge Silveira Ferreira. Princípios de Econometria

Modelos de Regressão Linear Simples - Análise de Resíduos

Distribuição Amostral e Estimação Pontual de Parâmetros

Procedimento Complementar para Validação de Métodos Analíticos e Bioanalíticos usando Análise de Regressão Linear

Distribuições Amostrais e Estimação Pontual de Parâmetros

Carteiras de Variância Mínima no Brasil

DISTRIBUIÇÃO DOS RETORNOS DE UM ÍNDICE DE AÇÕES COM VOLATILIDADE ESTOCÁSTICA

Aula 2. ESTATÍSTICA E TEORIA DAS PROBABILIDADES Conceitos Básicos

Introdução aos Proc. Estocásticos - ENG 430

Inferência Estatística: Conceitos Básicos II

Métodos Quantitativos

Gestão de Stocks. Estudo realizado por: Dulce Varandas e Lídia Teixeira. Orientação:

Uso de séries temporais na análise da temperatura média mensal da cidade de Mossoró, RN

Estatística - Análise de Regressão Linear Simples. Professor José Alberto - (11) sosestatistica.com.br

Exercícios de programação

Inferência Bayesiana - Aula 1 -

2 Medida de Incertezas: Fundamentos

AULAS 25 E 26 Heteroscedasticidade

Econometria Semestre

Distribuição de frequências. Prof. Dr. Alberto Franke

Estimação e Testes de Hipóteses

Inferência Estatística:

Econometria. Regressão Linear Simples Lista de Exercícios

Opções Reais. Modelagem do Ativo Básico. Processos Estocásticos. Modelando Incerteza. Processos Estocásticos. IAG PUC-Rio

Econometria - Lista 5

Homocedasticidade? Exemplo: consumo vs peso de automóveis

ECONOMETRIA AVANÇADA Prova Intermediária - 09/04/2015

AULA 01 Principais Conceitos em Econometria

Séries de Tempo. José Fajardo. Agosto Fundação Getulio Vargas-EBAPE. José Fajardo (FGV-EBAPE) Fundamentos Estatísticos Agosto / 49

M l u t l i t c i oli l n i e n arid i a d de

Modelos Lineares Generalizados - Componentes do Modelo

Aplicação da metodologia Box & Jenkins para previsão de vendas de emulsificante

Regressão de Poisson e parentes próximos

étodos uméricos AJUSTE DE FUNÇÕES Prof. Erivelton Geraldo Nepomuceno PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA

AULAS 28 E 29 Análise de Regressão Múltipla com Informações Qualitativas

Correlação Serial e Heterocedasticidade em Regressões de Séries Temporais. Wooldridge, Cap. 12

Anexo 1 - Revisões de Teoria das Probabilidades e Processos Estocásticos

ANOVA - parte I Conceitos Básicos

Resolução da Prova de Matemática Financeira e Estatística do ISS Teresina, aplicada em 28/08/2016.

FACULDADE DE ECONOMIA, ADMINISTRAÇÃO E CONTABILIDADE FEA/USP. Lista 7 - Econometria I

Medidas de Dispersão. Prof.: Joni Fusinato

Introdução à Inferência Estatística

MOQ-13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

INE 7001 Estatística para Administradores I Turma Prática 1 15/08/2016 GRUPO:

Distribuições derivadas da distribuição Normal. Distribuição Normal., x real.

ANÁLISE DOS RESÍDUOS. Na análise de regressão linear, assumimos que os erros E 1, E 2,, E n satisfazem os seguintes pressupostos:

Técnicas econométricas para avaliação de impacto O uso de métodos de regressão e introdução aos métodos de diferençasdas-diferenças

Transcrição:

ESTATÍSTICA COMPUTACIONAL Ralph dos Santos Silva Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro

Sumário

Motivação Por exemplo, queremos analisar a série de vendas mensais de um certo tipo doce no Reino Unido de janeiro de 1976 a dezembro de 1981 e, se possível, utilizar a série de preços, na escala do logaritmo, deste doce como variável explicativa. Tendência? Sazonalidade? Variáveis causais (explicativas)? Vendas 7 8 9 10 11 Preços 2 1 0 1 2 1976 1977 1978 1979 1980 1981 1982 Mês (a) Vendas 1976 1977 1978 1979 1980 1981 1982 Mês (b) Preços Figura: Vendas e logaritmo dos preços mensais de um certo tipo doce no Reino Unido de janeiro de 1976 a dezembro de 1981.

A maioria das análises estatísticas utiliza modelos estáticos: modelos com uma descrição fixa (através de parâmetros fixos) ao longo das unidades de observação. Por exemplo: Análise de regressão, Modelos ARMA, y t = α + βx t + ε t, ε t N (0, σ 2 ); e y t = α+φ 1 y t 1 + +φ py t p +θ 1 ε t 1 + +θ qε t q +ε t, ε t N (0, σ 2 ). Em séries temporais, essa hipótese muitas vezes é violada: as estruturas mudam com a passagem do tempo. Séries temporais ligados às atividades humanas são alvos de mudanças: Abruptas - devido a grandes mudanças, hecatombes, novas leis; Graduais.

Aqui, todos os modelos são dinâmicos: A descrição (os parâmetros) muda com a passagem do tempo. Neste curso em especial, os modelos dinâmicos nos permitem a modelagem da tendência (média) e variância (volatilidade). Eles incluem como casos particulares os modelos estáticos. Normalmente, a passagem do tempo traz observações e aumenta o nosso conhecimento. Em modelos dinâmicos temos também perda de informação devido à passagem do tempo. Exemplo: o nível de vendas mês passado é mais relevante hoje que o nível de vendas em janeiro passado. Construção do modelo dinâmico é feita em duas etapas: 1 a : Qualitativa; 2 a : Quantitativa de uma forma local. Em modelos estáticos, a mesma quantificação é válida globalmente.

O modelo de regressão usual Em um modelo de regressão temos uma variável resposta y que é explicada por um conjunto de variáveis explicativas x 1,..., x p através da relação y = θ 0 + θ 1 x 1 +... + θ px p + ε. Em geral, assume-se que o ε tem distribuição N (0, σ 2 ). A equação acima pode ser mais compactamente escrita como: y = x θ + ε, sendo x = 1 x 1. x p e θ = θ 0 θ 1. θ p.

A natureza das variáveis explicativas ou regressoras é bastante ampla. Podendo assim, utilizar-se qualquer variável quantificável. Os coeficientes de regressão θ 1,..., θ p informam sobre a influência que os regressores têm sobre a resposta y. Na prática, seus valores são desconhecidos e estimados a partir de uma coleção de observações feitas sobre o modelo acima. Observamos respostas y 1,..., y n com seus respectivos regressores x 1,..., x n. Simbolicamente, temos: y t = x tθ + ε t, t = 1,..., n.

Definição do modelo de espaço de estados Em modelos dinâmicos os parâmetros mudam com o passar do tempo. O modelo de regressão é estendido para Note a indexação de θ. y t = x tθ t + ε t, t = 1,..., n. A formulação acima cria uma profusão de parâmetros a serem estimados. O modelo acima necessita de mais informação. Essa informação vem do fato que os parâmetros sucessivos estão intimamente relacionados. Em geral, um parâmetro é igual ao seu antecessor mais uma pequena perturbação causada pelas mudanças às quais o sistema está sujeito. Se o sistema é estático, como em regressão, temos: θ t = θ t 1 = θ.

Em modelos dinâmicos, vamos admitir a forma mais geral θ t = G tθ t 1 + w t, sendo que G t contém valores conhecidos (ou parâmetros fixos) e w t é uma perturbação aleatória. A equação acima é conhecida como equação do sistema. A matriz de evolução G t controla a parte determinística da evolução do sistema e estabelece a propagação do sistema ao longo do tempo. A perturbação w t é responsável pela introdução de incertezas devidas à passagem do tempo e consequente perda de informação. Note que se G t = I e w t = 0, o modelo se reduz ao caso estático.

Exemplo Se observamos uma série de vendas explicada pela respectiva série de preços através de uma relação estável teremos: vendas t = µ t + β tpreço t + v t µ t = µ t 1 + w 1t β t = β t 1 + w 2t. As vendas são explicadas pelo preço em uma regressão dinâmica. A maior (ou menor) estabilidade dessa relação será controlada pela magnitude dos incrementos (erros) w 1t e w 2t.

Modelo linear dinâmico O modelo linear dinâmico pode então ser definido como: Equação das observações: y t = F tθ t + v t, v t N (0, V t) Equação do sistema: θ t = G tθ t 1 + w t, w t N (0, W t) No exemplo acima, y t = venda t, F t = (1, preço t ) ( ) ( ) µt 1 0 θ t =, G t = I 2 = 0 1 β t e w t = ( w1t w 2t )

Exemplo Vamos analisar a série de vendas mensais de um certo tipo doce no Reino Unido de janeiro de 1976 a dezembro de 1981. Também utilizaremos a série de preços, na escala do logaritmo, deste doce como variável explicativa. Vendas 7 8 9 10 11 Preços 2 1 0 1 2 1976 1977 1978 1979 1980 1981 1982 Mês (a) Vendas 1976 1977 1978 1979 1980 1981 1982 Mês (b) Preços Figura: Vendas e logaritmo dos preços mensais de um certo tipo doce no Reino Unido de janeiro de 1976 a dezembro de 1981.

Alguns modelos Consideraremos três modelos. Modelo de tendência estável. É composto apenas de um nível que varia segundo um passeio aleatório. vendas t = µ t + v t, v t N (0, V t) µ t = µ t 1 + w t, w t N (0, W t). Segundo esse modelo, o nível permanece localmente constante, mas varia quando se considera longos períodos de tempo. Usualmente, a variação das observações em torno dos níveis (medida por V t) é bem maior que as variações temporais do nível ao longo do tempo (medidas por W t). O modelo de tendência estável é obtido ao particularizar o modelo dinâmico com F t = 1 e G t = 1. Para a série de vendas de doce faremos V t = V e W t = W para todo t (variâncias constantes ao longo do tempo).

Observações importantes Consideraremos a análise somente após observar toda a série. Isto é, a análise suavizada. É possível considerar a análise sequencial no tempo. Para uma subclasse dos modelos dinâmicos (lineares e com erros normais) é possível aplicar o filtro de Kalman na análise sequencial. Por exemplo, os três modelos que veremos para os dados de vendas do doce. O filtro de Kalman também pode ser empregado nestes modelos para a análise por máxima verossimilhança. Nós consideraremos somente a análise bayesiana. Precisaremos descrever o modelo e a distribuição priori dos parâmetros. Utilizaremos o OpenBUGS para fazer a análise. Podemos calcular o Critério de Informação do Desvio (DIC) para comparar modelos. Mostrar exemplo no OpenBUGS: doce_modelo_01.odc

Modelo de tendência linear. Isso é quantificado através de um parâmetro adicional. vendas t = µ t + v t, v t N (0, V t) µ t = µ t 1 + β t 1 + w 1t β t = β t 1 + w 2t, sendo w t = (w 1t, w 2t ) N (0, W t). ( 1 Esse modelo é obtido com F t = 0 ) ( 1 1 e G t = 0 1 Aqui, o nível permanece localmente linear, mas a forma da reta pode variar com o tempo. ( ) σ 2 Para a série de vendas de doce faremos V t = V e W t = W = 1 0 0 σ2 2 para todo t (independência e variâncias constantes ao longo do tempo). Mostrar exemplo no OpenBUGS: doce_modelo_02.odc ).

Modelo de regressão dinâmica. Introduzimos variáveis explicativas com coeficientes variando no tempo. vendas t = µ t + β tpreço t + v t, v t N (0, V t) µ t = µ t 1 + w 1t β t = β t 1 + w 2t, sendo w t = (w 1t, w 2t ) N (0, W t). ) (, F t = ) e G t = I. ( µt 1 Esse modelo é obtido com θ t = β t preço t ( ) σ 2 Para a série de vendas de doce faremos V t = V e W t = W = 1 0 0 σ2 2 para todo t (independência e variâncias constantes ao longo do tempo). Mostrar exemplo no OpenBUGS: doce_modelo_03.odc

Modelo de efeitos sazonais. Considere o modelo y t = γ t + v t, sendo γ t a componente de sazonalidade. Seja s o número de períodos nos dados. Por exemplo, s = 12 para dados mensais; s = 4 para dados trimestrais; e s = 7 para dados diários e modelagem de padrões semanais. A maneira mais simples de modelar efeitos sazonais é utilizando variáveis binárias. A soma dos efeitos do período devem ser igual a zero, s 1 γ t = γ t j. Para permitir que o padrão mude ao longo do tempo, introduzimos um novo termo de erro, j=1 j=1 s 1 γ t = γ t j + w t, w t N (0, σ 2 ). O valor esperado da soma dos efeitos sazonais é zero.

Previsão Estamos interessados na previsão de horizonte h na origem t, y t+h. Podemos considerar o conjunto {y t+1, y t+2,..., y t+h } como não observados (dados faltantes). Do ponto de vista bayesiano, devemos estimar estas quantidades condicional aos dados. Este procedimento é facilmente implementado no OpenBUGS. Em geral, tomamos a média a posterior de y t+h como a previsão (pontual). Temos também o intervalo de previsão (intervalo de credibilidade) de y t+h. Mostrar exemplos no OpenBUGS: doce_modelo_01_b.odc e doce_modelo_02_b.odc

Superposição de modelos Estamos interessados em uma forma geral para estruturar e acomodar as várias componentes intervenientes em um modelo dinâmico. Por exemplo, variáveis causais e sazonalidade. Muitas séries temporais exibem um comportamento bastante complexo. Ao identificarmos as características mais marcantes, estamos caminhando na direção de formular um modelo. A série ilustrada na figura a seguir é um exemplo típico. A tendência global parece ser de uma variação suave do nível. Se agora nos concentramos na variação em torno desse nível, podemos detectar um comportamento cíclico. Essa inspeção permitiu identificar as duas componentes do modelo: uma componente para a tendência e outro para a sazonalidade.

Exemplo Vendas 5 10 15 20 25 1960 1962 1964 1966 1968 Mês Figura: Venda de carros nos EUA de janeiro de 1960 a dezembro de 1968.

A estrutura dos modelos dinâmicos é apropriada para isto, pois permite que as componentes sejam modeladas separadamente e depois integradas em um modelo. No caso mais comum de duas componentes: tendência e sazonalidade, estruturamos a equação das observações com dois termos: y t = y Nt + y St + v t. Cada um dos termos é descrito na dinâmica a seguir. y Nt = F Ntθ Nt θ Nt = G Ntθ Nt 1 + w Nt e y St = F Stθ St θ St = G Stθ St 1 + w St.

Se agora integramos esses termos, obtemos a equação das observações Y t = F tθ t + v t sendo F t = ( FNt F St ) e θ t = ( θnt Similarmente, a equação do sistema (integrado) fica θ St ). θ t = G tθ t 1 + w t, w t N (0, W t) sendo ( GNt 0 G t = 0 G St ) ( WNt 0 e W t = 0 W St ). Modelos com mais componentes são construídos da mesma forma: cada termo contribui para a equação das observações e com um bloco de parâmetros para a equação do sistema.

Exemplo (superposição: tendência linear e sazonalidade) Vamos analisar a série de venda de carros nos EUA. Note a tendência linear e a sazonalidade. Mostrar exemplo no OpenBUGS: carro_modelo_01.odc Exercício Agora, como exercício da Lista 06, analise a série vendas mensais de vinho na Austrália de janeiro de 1980 a dezembro de 1991. Arquivo vinho_openbugs.txt Dica: note a presença de tendência linear, sazonalidade e variância crescente ao longo do tempo.

Modelos condicionalmente heterocedásticos O objetivo é a modelagem da volatilidade do retorno de um ativo. Os modelos são chamados de condicionalmente heterocedásticos. A volatilidade é um fator importante na negociação de opções (por exemplo, fórmula de Black-Scholes). A volatilidade significa a variância (ou desvio padrão) condicional do retorno de um ativo. A modelagem da volatilidade de uma série temporal pode melhorar a eficiência na estimação dos parâmetros e na precisão do intervalo de previsão. Veremos o seguinte modelo: SV: volatilidade estocástica. Existem muitos outros. Por exemplo, ARCH e GARCH.

Características da volatilidade A volatilidade de uma ação não é diretamente observável. Isto implica que é difícil avaliar a performance de previsão nos modelos condicionalmente heterocedásticos. Existem conglomerados de volatilidade (períodos de alta e de baixa). A volatilidade muda de forma contínua através do tempo. A volatilidade não diverge para o infinito. Logo, a volatilidade é geralmente estacionária. A volatilidade parece reagir diferentemente para um aumento grande de preço ou uma queda grande de preço, conhecido como efeito de influência (leverage effect).

Log Retorno 0.10 0.05 0.00 0.05 0.10 0 500 1000 1500 2000 2500 3000 Dias Figura: Log retornos diários do IBOVESPA de 3 de janeiro de 2000 a 26 de abril de 2013.

ACF 0.0 0.2 0.4 0.6 0.8 1.0 ACF 0.0 0.2 0.4 0.6 0.8 1.0 0 2 4 6 8 10 12 14 Defasagem (a) Log retornos 0 2 4 6 8 10 12 14 Defasagem (b) Valor absolutos log retornos ACF 0.0 0.2 0.4 0.6 0.8 1.0 0 2 4 6 8 10 12 14 Defasagem PACF 0.2 0.0 0.2 0.4 0.6 0.8 1.0 2 4 6 8 10 12 14 Defasagem (c) Quadrados dos log retornos (d) Quadrados dos log retornos Figura: ACF e PACF amostral para algumas funções do log retornos diários do IBOVESPA de 3 de janeiro de 2000 a 26 de abril de 2013.

Modelo de volatilidade estocástica Estamos interessados em modelar a volatilidade. Este modelo também está na classe dos modelos dinâmicos (não lineares). O modelo: r t = exp{h t/2}ε t, ε t N (0, 1) h t = α + φ(h t 1 α) + ω t, ω t N (0, σ 2 ), para t = 1, 2,..., T. r t é o log retorno, isto é, r t = ln(p t) ln(p t 1 ); h t é a log volatilidade; α é o intercepto (constante); φ é o parâmetro de persistência; e σ 2 é a variância das log volatilidades.

Inferência bayesiana Para este modelo, utilizaremos a abordagem bayesiana para inferir sobre as quantidades desconhecidas do modelo. Construimos a função de verossimilhança utilizando as equações das observações e do estado. Completamos o modelo com a distribuição a priori. Distribuição a posteriori: p(α, φ, σ 2, h 1:T y) [ T ] [ T ] p(y t h t) p(h t h t 1, α, φ, σ 2 ) t=1 sendo p(α, φ, σ 2 ) a distribuição a priori. t=2 p(h 1 α, φ, σ 2 )p(α, φ, σ 2 ), Em geral, assumimos que p(α, φ, σ 2 ) = p(α)p(φ)p(σ 2 ). Temos a restrição φ < 1. Vamos impor que 0 φ < 1.

Distribuição a priori: h 1 N ( ) σ 2 α, 1 φ 2 α N (0; 10000) φ Beta(20; 1, 5) σ 2 IG(2, 5; 0, 025) (inversa gama).

Exemplo: Retornos do Reino Unido (MSCI) Retornos 0.15 0.10 0.05 0.00 0.05 0.10 0 50 150 250 350 450 Semanas Figura: Retornos semanais do Reino Unido (MSCI) de 6/jan/2000 a 28/jan/2010 (T=526).

Resultados Mostrar exemplo no OpenBUGS: volatilidade_01.odc Previsão Parâmetro Média D.P. 2,5% Mediana 97,5% α -7,534 0,4505-8,282-7,545-6,713 φ 0,966 0,0171 0,927 0,968 0,993 σ 2 0,056 0,0256 0,021 0,052 0,120 A previsão segue o padrão mostrado para os modelos dinâmicos. Mostrar exemplo no OpenBUGS: volatilidade_02.odc Superposição de modelos A equação da média com estrutura de tendência estável: r t = γ t + exp{h t/2}ε t e γ t = γ t 1 + ξ t, ξ t N (0, δ 2 ). Podemos incluir o retorno defasado como um AR, por exemplo r t = γ + βr t 1 + exp{h t/2}ε t.

Resultados do modelo r t = γ + βr t 1 + exp{h t/2}ε t h t = α + φ(h t 1 α) + ω t. Mostrar exemplo no OpenBUGS: volatilidade_03.odc Parâmetro Média D.P. 2,5% Mediana 97,5% α -7,575 0,3852-8,2750-7,5800-6,8450 φ 0,960 0,0190 0,9165 0,9623 0,9899 σ 2 0,068 0,0299 0,0254 0,0624 0,1380 γ 0,002 0,0009 0,0002 0,0020 0,0038 β -0,014 0,0297-0,0973-0,0022 0,0233