UM POUCO SOBRE GESTÃO DE RISCO Por Hindemburg Melão Jr. http://www.saturnov.com Certa vez o maior trader de todos os tempos, Jesse Livermore, disse que a longo prazo ninguém poderia bater o Mercado. Ele viveu antes de Soros e Buffett, e embora fosse habilidoso com números, com lógica e questões quantitativas, não conhecia muito sobre Estatística, inclusive porque não havia tanto sobre Estatística naquela época. A idéia de Livermore não é despropositada, aliás é muito bem fundamentada, porém incorreta. Tentarei resumir o que suponho ter sido a interpretação de Livermore, que, aliás, foi minha interpretação inicial do critério Kelly, depois revisada e aprimorada várias vezes: Num grupo com 100 pessoas provenientes de uma população cuja altura tenha média µ e desvio-padrão σ, se o grupo não for constituído por pessoas selecionadas com base em algum(ns) critério(s), espera-se que estes parâmetros sejam aproximadamente mantidos e a amostra também tenha média m µ e desvio-padrão s σ., ou seja, espera-se que a distribuição de uma variável (a altura, nesse caso) típica dos elementos da amostra seja basicamente a mesma distribuição desta mesma variável na população da qual proveio a amostra. Porém o máximo e o mínimo na população serão muito provavelmente mais afastados da média do que na amostra, sendo a diferença tanto maior se maior for a proporção entre o tamanho da população e o da amostra. Então espera-se que numa amostra com 1000 pessoas provenientes dessa mesma população, a mais alta no grupo de 1000 seja mais alta do que a mais alta no grupo de 100. Mais precisamente: dados dois grupos A e B, sendo que A tem mais elementos que B, quanto maior a proporção entre o número de elementos em A e B, maior é a probabilidade de que o elemento extremo de A na variável considerada seja mais extremo que o elemento extremo de B na mesma variável. Isso pode parecer bastante intuitivo e até meio óbvio, porém se fosse tão óbvio esse conceito não estaria sendo repetido incorretamente tantas vezes em livros e artigos que tratam de Teoria dos Jogos e Gestão de Risco. Numa série temporal, a probabilidade de ocorrência de um evento extremo também aumenta com o tempo. Assim, uma estratégia que tenha certa probabilidade de ter um máximo drawdown num certo intervalo de tempo, terá probabilidade maior de ter mesmo drawdown num intervalo maior, e terá também probabilidade igual de um máximo drawdown maior num intervalo maior. Ou seja: o máximo drawdown esperado num período de 100 anos é maior que o máximo drawdown esperado num período de 10 anos, para a mesma estratégia e mesmo Mercado, inclusive se o Mercado conservar todas as suas propriedades relevantes ao longo do tempo. Se as propriedades do Mercado variarem aleatoriamente, também se espera aproximadamente mesmo efeito. Essa propriedade é citada em vários de meus artigos desde 2006, porém como me parece que a maioria das pessoas (talvez todas as pessoas) não está ciente desse fato, achei que poderia ser interessante escrever um artigo tratando especificamente desse assunto. Uma das conseqüências disso pode ser vista nos gráficos a seguir. No primeiro gráfico a curva plotada exibe a variação do balanço em função do aumento na porcentagem da carteira investida em cada operação, usando o Saturno V 6.11 (ou 3.1415926c83) no período de 1/1/2010 a 7/8/2010. As porcentagens testadas foram de 1% a 26% variando de 0,5% em 0,5%. Os números que aparecem no eixo x não são as porcentagens investidas, mas sim o ID do genótipo: ID0=1% ID1=1,5% ID2=2% ID3=2,5% etc.
Podemos observar que quanto maior a porcentagem investida em cada operação, maior é o balanço ao final do período testado. Porém há uma informação que o gráfico não exibe, que são os máximos drawdowns. Quanto maior a porcentagem investida, maior é o máximo drawdown. Se prosseguirmos além dos 26%, também de 0,5% em 0,5%, veremos que o comportamento da curva começa a mudar e o ritmo de crescimento vai se tornando mais lento até 34%, e a partir daí começa a diminuir a performance com o aumento da quantidade aplicada em cada operação. Constatamos que o máximo de retorno é obtido aplicando 34% da carteira em cada operação. O gráfico a seguir é uma extensão do anterior, prosseguindo de 26% até 68%. O pico fica em 34% da carteira em cada operação. Um valor próximo a este é o que se encontra ao aplicar o critério Kelly, ou Optimal-F, ou mesmo Bayesian Kelly e outros mais requintados. Porém nenhum destes procedimentos é razoável para gerenciamento de risco, porque se baseiam num intervalo de tempo demasiado curto, em que o máximo drawdown
observado é muito menor do que o esperado num intervalo de tempo maior. Na verdade não existe um intervalo de tempo suficientemente longo. Recentemente, dois amigos me perguntaram sobre o critério Kelly. O Fausto queria saber qual era a fração equivalente do critério Kelly para definir o tamanho da carteira investida em determinada configuração do Saturno V. O Alexandre queria saber a diferença entre Kelly Heurístico e Kelly Bayesiano. A resposta às duas perguntas é a mesma: não importa. Simplesmente porque o critério Kelly e similares não vão proporcionar nenhuma informação útil sobre como devem ser os tamanhos das apostas. O gerenciamento correto do risco precisa ser mais elaborado, levando em conta o aumento na probabilidade de ocorrências de eventos extremos à medida que a amostra cresce ou que a série temporal se alonga no tempo. No próximo gráfico podemos observar a variação do balanço em função do aumento na porcentagem da carteira investida em cada operação, usando também o Saturno V 6.11 (ou 3.1415926c83) com a mesma configuração em que foi gerado o primeiro gráfico, variando entre 1% e 26% da carteira em cada operação, de 0,5% em 0,5%, porém com uma diferença: o período foi de 10/7/1998 a 7/8/2010. O máximo ocorre quando se investe 13,5% da carteira. Quando se investe 26%, já fica perto de chegar à ruína, bem antes do valor ótimo de 34%, que seria definido com base no critério Kelly e equivalentes. Então surgem alguns ajustes: 1/3 do critério Kelly daria cerca de 12%, bem próximo ao valor ótimo nesse segundo caso. Muitas fontes recomendam o uso de 1/3 a 1/5 do critério Kelly, como uma solução milagrosa para o problema empírico que se observa de se chegar à ruína usando o critério Kelly e similares. Mas como se chegou a este valor de 1/3? Aqui temos uma situação muito similar à que descrevo no livro sobre IMC, em que se usa um índice que pressupõe implicitamente que as pessoas sejam criaturas bidimensionais (quando na realidade são estruturas pseudofractais) e se faz numerosos remendos com base na idade, etnia etc., para compensar o erro fundamental em que o método se baseava. O uso de frações do valor ótimo definido pelo critério Kelly é um procedimento que padece do mesmo mal, pois não se percebe a natureza do problema e suas propriedades, e tenta-se fazer um ajuste empírico para atenuar o desastre, sem no entanto eliminar a causa. O método que descrevo para cálculo de IMC serve para criaturas de Lilliput, bem como para a estátua da Liberdade ou a estátua do Cristo Redentor. O método tradicional de IMC só serve razoavelmente para
pessoas entre 1,60 e 1,80m, e seria necessária uma pilha de remendos para que fosse aplicável a gigantes como King Kong ou anões como o Pequeno Polegar. Esse método inapropriado sobreviveu quase 2 séculos porque a altura das pessoas não varia com uma amplitude suficientemente grande para que o erro ficasse tão evidente. Mas no Mercado Financeiro as variações são bem maiores, e tanto maiores se mais longo é o intervalo de tempo considerado. Quando se fala em usar 1/3 do critério Kelly, nesse caso só seria válido porque a primeira otimização do valor a ser aplicado em cada operação foi definido para um intervalo de 8 meses, e no segundo caso para um intervalo de 12 anos. Se a proporção entre os intervalos fosse diferente, não seria aplicável 1/3 de Kelly. Além disso, essa proporção é observada para essa estratégia específica e esse mercado específico. Para uma estratégia diferente ou um mercado diferente, a proporção teria que ser personalizada tendo em conta a maneira como se alteram o risco e o retorno em função do aumento no intervalo considerado. Além disso, para intervalos específicos se observa proporções específicas, dependendo do comportamento de certas propriedades do Mercado nos tais intervalos em comparação a estas mesmas propriedades no período inteiro. Sendo que o período inteiro é apenas a série histórica inteira de que se dispõe, mas constitui apenas uma pequenina fração do tempo. A solução arbitrária de usar 1/5 do critério Kelly ou algo assim, além de não permitir estimar o risco de falência num determinado prazo, geralmente implica rendimentos menores do que seriam possíveis. Há muito mais a se considerar, inclusive porque a fórmula para determinar o tamanho de cada aposta varia com a estratégia, o mercado e o período, embora o princípio que fundamenta a fórmula seja o mesmo em todos os casos. Na essência, o princípio é este que foi descrito. Quando se determina o tamanho da carteira a ser investido em cada operação com base no critério Kelly, Optimal-F, etc., dever-se-ia calcular também a probabilidade de ruína num determinado prazo. Não importa qual a seja porcentagem da carteira com base no critério Kelly ou similares, sempre haverá um risco de ruína maior do que 0 para um período de tempo suficientemente longo. Nesse contexto, Livermore estaria certo se essa fosse a única forma de gerenciar o capital. Porém há uma maneira de determinar o tamanho de cada aplicação reduzindo, teoricamente, a 0 o risco de ruína, independentemente de quão longo seja o período de aplicações, ou seja, pode-se sobreviver indefinidamente no Mercado, ao contrário do que afirmava Livermore. Buffett e Soros não fazem isso. Eles apenas aplicam frações tão pequenas de Kelly, que sobrevivem muitas gerações. Porém se eles vivessem por 1.000 ou 10.000 anos e continuassem a usar seus métodos, fatalmente chegariam à ruína em algum momento. Além disso, ambos deixam de obter ganhos maiores do que estão obtendo, por estarem operando com um risco abaixo do que seria possível a curto prazo, embora seja um risco exorbitante a longo prazo. No caso de Buffett, que não opera alavancado, seria difícil conseguir ganhos maiores porque ele nem sequer consegue encontrar oportunidades suficientes para investir toda sua carteira. Mas no caso de Soros, e principalmente de investidores menores, o uso dos métodos de gestão tradicionais, com riscos tão baixos quanto os de Soros e Buffett implicam rendimentos abaixo do que se pode obter com uma gestão mais adequada. Na verdade, há mais de uma maneira de não quebrar a longo prazo. Uma delas permite maximizar lucros e manter o risco num patamar baixo, além de teoricamente anular o risco de ruína. Outras são menos eficientes e permitem apenas anular, teoricamente, o risco de ruína, sem no entanto maximizar os lucros. Uma destas soluções menos eficientes é bem simples: basta aplicar valores fixos quando se ganha, em vez de uma fração da carteira, e aplicar uma fração quando se perde. Claro que os valores fixos precisam ser suficientemente pequenos, algo como 1/1000 de Kelly no início, e como a carteira vai crescendo e o valor continua fixo, vai ficando uma fração cada vez menor da que foi inicialmente definida pelo critério Kelly. O risco
de falir desta maneira é teoricamente 0, desde que a estratégia seja promissora e desde que o cenário se mantenha apropriado para uso da estratégia. Porém os ganhos ficam num patamar tão baixo que acaba sendo mais vantajoso aplicar em renda fixa. Tendo uma estratégia eficiente, o próximo pulo do gato passa a ser definir o tamanho correto de cada operação, para maximizar os lucros sem extrapolar o limite de risco. Com o Saturno V 6.11, 6.1 e R8c, e séries históricas utilizáveis desde 1928, podemos realizar diferentes experimentos com a finalidade de compreender melhor como devem ser estimados os parâmetros das fórmulas que determinam o tamanho ótimo de cada operação. Também serão testadas versões como a 3.03 e Guinho 2009, para avaliar como varia a gestão de risco em função do nível de eficiência da estratégia adotada. Os métodos que usamos atualmente para gestão de capital provavelmente já são melhores do que outros gestores utilizam, por levar em consideração mais fatos relevantes. Porém ainda podemos aprimorar sensivelmente nosso método com o estudo de séries históricas mais longas e uma estratégia com praticamente 100% de segurança na validação. A validação da estratégia não é o mesmo que a validação dos parâmetros para a tal estratégia. Pode-se ter uma excelente estratégia que não funcione devido à má determinação nos valores dos parâmetros. Bem como pode-se ter dificuldades para determinar os valores ótimos para os parâmetros devido a limitações e/ou falhas na estratégia. O conceito de falha quando se trata de algo que não tem como acertar 100% das vezes é complexo. Na verdade, em última instância, todas as estratégias são falhas. Mas quando se consegue que a uniformidade de resultados atenda a uma série de condições extremamente improváveis de serem atendidas por mero acaso, como comentamos num artigo recente, pode-se dizer que a quantidade de imperfeições é suficientemente pequena para que a estratégia seja aprovada sem reservas. A versão 6.1 do Saturno V é a primeira a atender a estas condições.