Fatos estilizados e volatilidade de retorno do petróleo WTI Bruno Marangoni Costa (PUC-Rio) brunomcosta@yahoo.com Fernando Antônio Lucena Aiube (PUC-Rio) aiube@ind.puc-rio.br Tara Keshar Nanda Baídya (PUC-Rio) baidya@ind.puc-rio.br Resumo O artigo analisa a série de retornos do petróleo tipo WTI, referente a seus preços de fechamento na NYMEX. São analisados alguns fatos estilizados da série, tais como aglomerados de volatilidade, estacionariedade, distribuição incondicional e previsibilidade dos retornos. A estacionariedade é comprovada através dos testes ADF e Phillips-Perron. Foi constatada a não-normalidade da série de retornos. A dependência temporal dos retornos (linear e não-linear) foi testada através das autocorrelações dos mesmos e posteriormente modelada. Primeiramente, filtrou-se a dependência linear por um modelo AR e depois ajustou-se a dependência não-linear através de um modelo da família GARCH. Palavras chave: Séries financeiras, Volatilidade, Previsibilidade de retornos. 1. Introdução A caracterização das propriedades estatísticas de uma série de preços é essencial para permitir a correta aplicação de modelos que envolvem as previsões de retorno e volatilidades. As propriedades de uma série financeira tais como retorno e variância têm se tornado cada vez mais importantes para a tomada de decisões de investimento e para a análise de risco de projetos e portfólios. Para administrar seus riscos e evitar grandes perdas financeiras, diversas empresas e bancos utilizam métodos de controle de portfólios baseados no comportamento histórico dos seus ativos. A variável fundamental na construção de um modelo de quantificação de risco é a volatilidade da série de retornos do ativo. Para evitar simplificações e melhorar a precisão do modelo utilizado, é importante que sejam conhecidos os diversos fatos estilizados da série de retornos de forma que se possa modelar o comportamento tanto da média quanto da variância dos mesmos. Nesse trabalho, pretendemos caracterizar os fatos estilizados das séries de retornos de ativos financeiros através da análise de uma commodity negociada ativamente no mercado mundial: o petróleo. A escolha desse ativo baseou-se no fato de que seu comportamento de preços afeta toda a cadeia produtiva mundial, tornando-se muito importante para a economia moderna e para o mercado de capitais. O trabalho analisa propriedades estatísticas tais como os aglomerados de volatilidade, estacionariedade e não-normalidade. Para a perfeita determinação de cada uma dessas características, fizemos uso de diferentes testes estatísticos. A dependência temporal da série de retornos é comprovada e identificada, permitindo sua decomposição em dois tipos: linear e não-linear. Torna-se possível e interessante, então, a construção de modelos que permitam inferir retornos futuros e a volatilidade dos mesmos. A dependência linear é filtrada através de um modelo AR, que permite, assim, a modelagem da dependência não-linear através do modelo heterocedástico GARCH (1,1). ENEGEP 2004 ABEPRO 2273
2. Dados e Série de Retorno 2.1. Dados A base de dados para este estudo foi a série de preços de fechamento do barril de petróleo tipo WTI, negociado na NYMEX. A série corresponde ao período entre 2 de janeiro de 1986 e 27 de fevereiro de 2004, totalizando 4588 observações. Os dados foram coletados na página do Departamento de Energia dos Estados Unidos (U.S. Department of Energy - Energy Information Administration), que os obteve através da agência de notícias Reuters. A série de preços foi devidamente deflacionada através do índice de preços ao consumidor americano (CPI), cuja série foi obtida através do programa Economática. Vale ressaltar que a série foi ajustada de modo que fossem considerados somente os dias úteis de negociação do ativo estudado. O software utilizado para análise foi o Eviews 4.0 2.2. Cálculo do Retorno Em qualquer análise de série de preços, o objeto de discussão é a taxa de retorno do ativo estudado. Os retornos de uma série de preços podem ser calculados de duas maneiras: retorno aritmético ou retorno geométrico (log-retorno). Nesse trabalho, optamos por utilizar o logretorno, por esse ser mais amplamente utilizado quando se trata de retornos de longo prazo. O log-retorno é definido como o logaritmo da razão entre preços sucessivos. Segundo Jorion (1997), a vantagem dos log-retornos é que se estes forem distribuídos normalmente, a distribuição nunca poderá levar a um preço que seja negativo, o que é coerente com a idéia de que esta variável é sempre maior ou igual a zero. A Figura 1 mostra a distribuição obtida para os retornos e algumas estatísticas da mesma. 2000 1600 1200 800 400 Média -4.10E-05 Mediana 0.000365 Máximo 0.191419 Mínimo -0.406667 Desv.Pad. 0.026195 Curtose 21.36047 Jarque-Bera 65311.27 Probabilidade 0.000000 0-0.375-0.250-0.125 0.000 0.125 3. Fatos Estilizados da Série de Retorno Figura 1 Distribuição dos log-retornos Diariamente, no mercado financeiro, utiliza-se a distribuição normal como uma boa aproximação para a distribuição de séries de retornos de ativos como ações e commoditties. O histograma da série de estudada, apresentado anteriormente, sugere que a mesma apresenta distribuição parecida com a distribuição normal. No entanto, sem a realização de testes estatísticos não é possível avaliar o quão próximas são as distribuições. Nessa parte de nosso estudo, dedicamo-nos a verificar os fatos estilizados (características) da série de retornos. ENEGEP 2004 ABEPRO 2274
3.1. Aglomerados de Volatilidade Observamos a existência de períodos de baixa e alta volatilidade, o que nos sugere que existe dependência dos retornos em relação a retornos passados. Observando a figura 2, fica clara a presença de no mínimo quatro períodos de alta volatilidade, que são seguidos por períodos de volatilidade baixa. Para melhor compreensão do comportamento da série, foi feita a associação de cada aglomerado de volatilidade a seu fato gerador. Nota-se no preço do petróleo os efeitos das crises financeiras mundiais e dos acontecimentos de grande repercussão no cenário mundial..2.1 Iraque-Kwait.0 -.1 -.2 -.3 Crise da Asia -.4 -.5 Crise da OPEP Guerra do Golfo 1000 2000 3000 4000 Figura 2 Identificação dos eventos associados a períodos de alta volatilidade 3.2. Estacionariedade Uma série é considerada estacionária quando as estatísticas amostrais média e variância incondicional são constantes e a covariância entre retornos defasados é função apenas desta defasagem. Nesse trabalho, foram realizados dois testes para avaliar a estacionariedade na amostra dos log-retornos: ADF e Phillips-Perron. Em ambos, foi feito teste de raiz unitária nos próprios valores, e não nas diferenças entre eles. No ADF, utilizou-se um número de lags igual a quatro. Obteve-se estatística de Durbin Watson muito próxima a 2, o que evidencia que o número de lags usados foi suficiente e adequado. Além disso, em todos os testes obteve-se uma estatística de teste com valor absoluto muito superior aos valores críticos apontados. Isso rejeita fortemente a hipótese nula e aceita a hipótese de estacionariedade para a série de retornos. Estatística-t -33,13013 Valor Crítico 1% -2,56620 Valor Crítico 5% -1,93940 Estatística de Durbin-Watson 2,002152 Valor Crítico 10% -1,61560 Tabela 1 Teste de estacionariedade ADF ENEGEP 2004 ABEPRO 2275
O teste de Phillips Perron parte das mesmas equações do ADF, porém utiliza uma correção na estatística do teste baseada num ajuste não paramétrico que corrige a presença de heterocedasticidade e/ou autocorrelação nos resíduos. Utilizou-se um número de truncation lag igual a 9, assim como sugerido por Newey West. Obteve-se estatística de Durbin Watson bem próxima a 2, o que novamente evidencia a adequação dos parâmetros usados. Além disso, obteve-se uma estatística de teste (estatística de P-Perron) com valor absoluto bem superior aos valores críticos, o que confirma a hipótese de estacionariedade dos retornos estudados. Estatística-t -68,75026 Valor Crítico 1% -2,56620 Valor Crítico 5% -1,93940 Estatística de Durbin-Watson 2,000737 Valor Crítico 10% -1,61560 Tabela 2 Teste de estacionariedade Phillips-Perron 3.3. Normalidade Uma propriedade bastante útil da distribuição normal é que todos os momentos ímpares a partir do terceiro assumem valor zero, sendo que o quarto momento, a curtose, assume valor 3. Observando as estatísticas da série estudada, entendemos que há indícios de que esta não apresenta distribuição normal, visto que sua curtose é de 21,36. Para comprovar essa hipótese, foram feitos dois testes de normalidade: Jarque-Bera e Q-Q Plot. O teste de Jarque-Bera baseia-se nos coeficientes de assimetria e curtose da distribuição dos retornos. Para o nível de significância de 5%, a estatística de Jarque-Bera encontrada rejeita a hipótese de normalidade para a série de retornos, assumindo o valor de 65311,27. Este resultado condiz com o que foi indicado pela curtose da série. O Q-Q Plot representa um dos métodos gráficos mais utilizados na verificação da normalidade de séries temporais. O procedimento empregado consiste na comparação gráfica dos quantis teóricos da distribuição normal com os quantis dos dados amostrais. O gráfico resultante (Figura 3) mostrou a existência de uma relação não-linear entre os quantis teóricos e empíricos, bastante acentuada nas caudas das distribuições, indicando caudas mais pesadas na distribuição empírica. Concluímos, então, que todos os testes rejeitaram fortemente a hipótese de normalidade da série estudada. ENEGEP 2004 ABEPRO 2276
4 3 2 1 0-1 -2-3 -4 -.5 -.4 -.3 -.2 -.1.0.1.2 Figura 3 Gráfico Q-Q Plot dos log-retornos 3.4. Previsibilidade dos Retornos A importância de se analisar os fatos estilizados de uma série temporal está diretamente ligada à idéia de previsibilidade dos retornos. Se uma série é independente, isto significa que o processo é totalmente aleatório e, conseqüentemente, nenhum modelo determinístico de previsão pode ser construído para inferir seu comportamento futuro. 3.4.1. Dependência da Série de Retornos Quando o retorno do ativo em um dia é função de seus retornos passados, caracteriza-se alguma forma de dependência temporal. Se este é o caso, as autocorrelações entre os resíduos são diferentes de zero. Foi realizado o teste de Ljung-Box para verificação da dependência. O resultado foi expresso em termos da função de autocorrelação, que apresentou coeficientes significantes, sendo a menor correlação verificada no primeiro lag. Dessa forma, ficou evidente a forte correlação entre os retornos. O teste de Ljung-Box, realizado acima, verifica apenas se os retornos estão correlacionados. Para descartar totalmente a hipótese de independência, é necessário recorrermos ao teste, BDS. Os resultados estão mostrados na tabela abaixo: Dimensão Estatística BDS P-Valor 2 0,019553 0.0000 3 0,038911 0.0000 4 0,053286 0.0000 5 0,062163 0.0000 6 0,066796 0.0000 Tabela 3 Teste BDS nos retornos A hipótese nula de que os retornos são independentes é rejeitada, e a hipótese alternativa sugere a existência de dependência linear, dependência não-linear na média e/ou variância, ou ainda a situação de caos determinístico. Este último caso foi descartado por não ser o escopo do trabalho. ENEGEP 2004 ABEPRO 2277
Com o objetivo de detectar a existência de algum tipo de dependência não-linear na série analisada, a dependência linear da mesma foi retirada ajustando-se um modelo AR(p) para a mesma. Para definição da ordem p do processo utilizado, foram rodadas regressões de ordem p inferior a 12 e analisadas as estatísticas de Akaike e Schwarz, o chamado critério AIC/SBC. O primeiro critério sugeriu a utilização de um modelo de grande ordem tal como o AR(12). Já o SBC sugeriu que o processo de melhor ajuste seria o AR(3). Por ser esse um critério mais preciso e que sugere um modelo mais parcimonioso (de menor ordem), escolhemos segui-lo. Os resultados estão descritos na equação abaixo: Ret t = - 0,0000485-0,010363 Ret t - 1-0,055585 Ret t - 2-0,060386 Ret t - 3 (0,8999) (0,4823) (0,0002) (0,0000) Os termos entre parênteses representam o p-valor. Observamos que apenas os termos de segunda e terceira ordem são significantes. Foi analisado, então, o correlograma dos resíduos dessa regressão, que indicou que os coeficientes de correlação entre os resíduos são insignificantes, principalmente nos primeiros lags. Concluímos, então, que foi removida a dependência linear da série de retornos. Partimos para a análise da dependência não-linear dos retornos. Primeiramente, analisamos o correlograma dos quadrados dos resíduos do AR(3), que apresentou coeficientes de autocorrelação significantes em todos os lags. Isso indica a presença de forte correlação entre os mesmos, o que nos sugere a idéia da presença de alguma forma de dependência não-linear entre os retornos. Para confirmar essa hipótese, foi realizado o teste BDS nos mesmos resíduos do processo AR(3). O objetivo era que, uma vez removida a linearidade, a hipótese alternativa, caso aceita, ficasse restrita somente a dependência não-linear. A tabela abaixo apresenta os resultados do teste BDS nos resíduos do processo auto-regressivo: Dimensão Estatística BDS Prob. 2 0,0190590 0.0000 3 0,0381490 0.0000 4 0,0525160 0.0000 5 0,0614650 0.0000 6 0,0661300 0.0000 Tabela 4 Teste BDS nos resíduos do AR (3) A hipótese nula de independência é rejeitada em favor da hipótese alternativa de dependência não-linear. A dependência não-linear é um fato estilizado das séries financeiras e está presente no ativo analisado. Até o momento, podemos caracterizar que a distribuição dos retornos não é normal, apresentando caudas pesadas. Verificamos também a presença de dependência linear dos retornos, que foi removida através do ajuste de um processo auto-regressivo. Podemos afirmar que a série estudada não se assemelha a um processo do tipo random walk. Também foi constatada a presença de dependência não-linear, que pode ser na média, na variância ou em ambas. Utilizamos o teste de HSIEH para caracterizar o tipo de dependência não-linear existente. Para tal, é preciso que a dependência linear esteja totalmente removida dos dados testados. A hipótese nula de dependência não-linear na variância foi aceita, rejeitando-se a hipótese alternativa de dependência não-linear na média ou em ambas. Partimos, então, para a modelagem da variância do processo através de um modelo GARCH. ENEGEP 2004 ABEPRO 2278
3.4.2. Especificação da Não-Linearidade Em geral, séries de retornos financeiros apresentam dependência linear e não linear. Constatamos e removemos a dependência linear da série estudada, obtendo como modelo a seguinte equação: Ret t = - 0,055585 Ret t - 2-0,060386 Ret t - 3 + resíduo O resíduo contém a dependência não-linear constatada anteriormente e será estudado por um modelo de variância condicional heterocedástico, que supõe que a variância é função do tempo. Os modelos GARCH-lineares (modelos autoregressivos de heterocedasticidade condicional) são o mais populares dentre todos os da família ARCH e foram desenvolvidos por Bollerslev em 1986. A especificação dos modelos baseia-se na escolha do número de termos ARCH e do número de termos GARCH a serem utilizados. Tal escolha é geralmente feita com base no critério AIC/SBC, que, nesse caso, nos sugere um modelo GARCH (2,2). No entanto, ao compararmos os resultados desse modelo com os resultados obtidos com o GARCH(1,1), observamos que não havia diferença prática na significância dos resultados. Optamos por utilizar o GARCH(1,1), por esse ser um modelo mais simples. Os resultados dessa regressão estão abaixo: Ret t = - 0,035360 Ret t 2-0,042025 Ret t 3 (0,0172) (0,0055) h t = 0,00000639 + 0,117453 w 2 t 2 + 0,883744 h 2 t 3 (0,0000) (0,0000) (0,0000) Os termos entre parênteses representam o p-valor e h t é a variância condicional estimada do processo. Foi analisada a estatística Ljung-Box (autocorrelação) dos resíduos padronizados da regressão acima. Os resultados mostram que a hipótese de correlação serial dos resíduos é rejeitada, aceitando-se a hipótese nula de descorrelação serial, o que significa que o modelo definido está adequado. Também foram analisados o BDS dos resíduos e o correlograma dos quadrados dos mesmos, que indicaram descorrelação e independência dos resíduos do processo modelado. Partimos, então, para a análise da normalidade dos resíduos. O gráfico Q-Q Plot indicou que os resíduos apresentam cauda mais pesada que a normal padronizada, o que indica um desvio em relação à hipótese de normalidade dos resíduos obtidos, condição intrínseca do modelo GARCH. A estatística de Jarque-Bera apresentou o valor de 2035, que, para um nível de significância de 5%, rejeita a hipótese de normalidade. Para verificar a possível existência de alguma heterocedasticidade nos resíduos obtidos, realizamos o teste ARCH LM, que rejeitou a hipótese de existência de efeito ARCH remanescente na série de resíduos. A figura 4 representa o gráfico da volatilidade condicional do modelo GARCH(1,1), que indica que o modelo reproduziu bem os eventos marcantes de alta volatilidade da série. ENEGEP 2004 ABEPRO 2279
.16.14.12.10.08.06.04.02.00 1000 2000 3000 4000 Figura 4 Volatilidade condicional Garch (1,1) 4. Conclusões O trabalho verifica os principais fatos estilizados do ativo petróleo-wti, negociado na NYMEX. Foi filtrada a dependência linear e verificada a não linearidade na variância. Usamos um modelo da família GARCH para modelar a não-linearidade. Concluímos, assim, que o modelo GARCH proposto removeu toda a dependência não-linear presente na série de retornos estudada. Os resíduos desse modelo apresentaram-se fortemente descorrelatados e independentes. No entanto, o modelo apresentou um desajuste em relação à hipótese inicial de normalidade dos resíduos. Esse desajuste poderia ser resolvido através de uma modelagem GARCH que supusesse outra distribuição para os resíduos do processo, como, por exemplo, a t-student. Tal modelagem, mais elaborada e precisa, pode ser objeto da continuação desse trabalho. Referências CAMPBEL, J. Y. Lo and Mackinlay (1997) - The Econometrics of Financial Markets, Princeton University Press. COSTA, P.H.S. e BAÍDYA, T.K.N. - Propriedades Estatísticas das Séries de Retornos das Principais Ações Brasileiras. Pesquisa Operacional, Rio de Janeiro, v. 61, p. 61-87, 2001. DAMODAR N. GUJARATI (1993) - Basic Econometrics, McGraw-Hill International Editions. JORION, P. (1997) - Value at Risk: The New Benchmark for Managing Financial Risk, McGraw-Hill. ENEGEP 2004 ABEPRO 2280