161 OS EXPOENTES DE HURST NO RECONHECIMENTO DE PADRÕES EM MEDICINA Antônio Carlos da Silva Filho Uni-FACEF Introdução O reconhecimento de padrões é uma área da ciência à qual são incorporadas novas técnicas a todo instante. Na medicina, em particular, o reconhecimento de padrões é usado para diferenciar estados, como os de saúde plena dos patológicos e é, portanto, fundamental para o diagnóstico médico. Uma série imensa de parâmetros advindos das ciências físico-matemáticas têm sido usados para diferenciar estados e levar ao reconhecimento da presença de muitas doenças ou anomalias. Metodologicamente, foram cedidos para esta pesquisa pelo Laboratório de Fisiologia do Exercício da Faculdade de Medicina de Ribeirão Preto, os eletrocardiogramas de 45 indivíduos, sendo que 24 apresentavam a Doença de Chagas e 21 foram considerados saudáveis. A partir dos eletrocardiogramas, colhidos na posição de repouso sentado, foram formadas séries de dados, para cada indivíduo, dos intervalos RR, que são os intervalos entre duas ondas R. Cada série tem ao redor de 1000 pontos e, a partir delas, é feito o cálculo do Expoente de Hurst. A idéia original de Hurst ocorreu ao estudar dimensionamentos de reservatórios, analisando a vazão anual, por décadas, de algumas represas. O objetivo era bem pragmático: analisar os volumes máximos e mínimos dos reservatórios para prever secas ou inundações. Sua análise ficou conhecida por análise R/S, onde o "R" deriva de range, a diferença entre o volume máximo e o mínimo durante o ano e o "S" deriva de desvio padrão. Hurst descobriu, durante seus estudos, que a estatística R/S é igual à metade do número de observações elevado a um expoente H, sendo este H denominado Expoente de Hurst. A interpretação dos Expoentes de Hurst é a seguinte: se 0 < H < 0,5 a série é antipersistente, o que significa que uma tendência positiva no passado é mais provável de se converter em tendência negativa e vice-versa. Quando H = 0 temos a situação de um movimento puramente aleatório. Finalmente, quando 0,5 < H < 1 os dados
162 são persistentes, o que significa que uma tendência positiva no passado tem maior probabilidade de continuar positiva e vice-versa. O cálculo dos Expoentes de Hurst para as duas populações deste estudo revelou que há uma diferença estatisticamente significante apenas para um nível de significância de 15%, o que revela que os Expoentes de Hurst não são o melhor parâmetro diagnóstico para diferenciar estas duas populações. 1 Desenvolvimento da Pesquisa Este estudo trabalha com duas populações de indivíduos: uma de indivíduos saudáveis (21) e outra com portadores de Doença de Chagas (24). Para cada indivíduo foi colhido, em repouso deitado, o intervalo RR dos batimentos cardíacos. A seguir, fez-se a análise do Expoente de Hurst para cada uma das séries obtidoas. Finalmente, fez-se uma análise estatística, um t-teste, de comparação entre médias de duas amostras de tamanhos diferentes para ver se há alguma diferença significativa entre os valores encontrados para as duas populações. Hurst, que era um engenheiro do Império Britânico, formado em Oxford, estudou, quando trabalhou no norte da África, problemas de dimensionamento de reservatórios, analisando a vazão anual, durante décadas, de várias represas. Sua idéia básica era encontrar os volumes máximo e mínimo nos reservatórios para prever secagem ou transbordamento. Essa diferença entre os valores máximo e mínimo de água do reservatório foi chamada por ele de range. Além deste cálculo foram realizados os desvios padrões das vazões de água. A estatística R/S é o resultado da divisão do range pelo desvio padrão, o que produz um valor adimensional. Hurst notou também que havia uma função relacionando o valor da estatística R/S ao número de observações que entram no cálculo (HURST,1951). Posteriormente este cálculo foi feito para outros fenômenos naturais e Hurst percebeu que ele funcionava. Ele descobriu, também, que a estatística R/S é igual à metade do número de observações elevado a um expoente H, conhecido hoje como Expoente de Hurst. Assim, tem-se a seguinte relação:
163 Sendo que: R/S = diferença da amplitude entre a maior e a menor ocorrência registrada (R), dividida pelo desvio padrão encontrado na série (S); N = número de observações H = fator da lei de potência, que originalmente foi objeto de estudo de Hurst (nesta fórmula chamado de expoente de Hurst, variando entre zero e um). O trabalho de Hurst foi redescoberto em 1969 por Mandelbrot e Wallis (MANDELBROT E WALLIS, 1960), que verificaram que há uma relação empírica entre o expoente de Hurst e o movimento browniano fracionário. A descoberta afirma que o coeficiente de Hurst apresenta a mesma forma do movimento browniano, no que se refere ao rescaled range (R/S) em função do período utilizado no cálculo (N). Isso significa que a estatística R/S e o expoente de Hurst H podem ser utilizados para representar as propriedades de memória de longo prazo para séries que apresentam um movimento browniano. Os valores do expoente de Hurst podem ser interpretados da seguinte maneira: 0 < H < 0,5: indica que a série é anti-persistente, no qual uma tendência positiva no passado é mais provável de se converter em tendência negativa e viceversa. Para H = 0.5: a série representa random walk, ou seja, o movimento é puramente aleatório. E para 0,5 < H < 1 a série é persistente, no qual uma tendência positiva no passado é mais provável de continuar positiva e vice-versa, e o nível desta persistência é medido quão maior for o valor. O cálculo do Expoente de Hurst através da análise R/S clássica é assintótico, o que implica um erro, o qual será menor quanto maior for o tamanho da amostra submetida à análise (SELVARATNAM E KIRLEY, 2006). A análise clássica, infelizmente, não prevê uma correção para a estatística R/S no caso de amostras pequenas. Mas a quantidade de dados em cada série neste trabalho é adequada para o cálculo. 2 Objetivos O objetivo deste trabalho é investigar se um parâmetro muito usado em Sistemas Dinâmicos, o Expoente de Hurst, pode ter algum papel positivo na
164 separação entre dois grupos de indivíduos, sendo um saudável e outro com pacientes portanto Doença de Chagas. 3 Metodologia Este trabalho usa dados obtidos experimentalmente na Faculdade de Medicina de Ribeirão Preto da Universidade de São Paulo, tendo a sua obtenção sido aprovada pelo comitê de ética daquela instituição. A partir destes dados foram realizados cálculos computacionais a fim de se determinar o Expoente de Hurst. Finalmente, foi feita uma análise estatística dos resultados obtidos para as duas populações em foco. 4 Análise dos Dados e Resultados Os resultados obtidos estão resumidos na tabela 1 a seguir. Tabela 1. Valores do Expoente de Hurst obtidos para duas populações de indivíduos, uma com indivíduos saudáveis e outra com portadores da Doença de Chagas Indivíduo Saudáveis Portadores 1 0.2958 0.2788 2 0.2200 0.2250 3 0.2534 0.3799 4 0.1796 0.2449 5 0.3885 0.1984 6 0.3262 0.3165 7 0.3712 0.4366 8 0.2676 0.3978 9 0.3428 0.3383 10 0.3603 0.2693 11 0.2985 0.4212 12 0.2976 0.3702
165 13 0.3724 0.3214 14 0.1774 0.2892 15 0.3384 0.3154 16 0.1837 0.4634 17 0.2833 0.2418 18 0.3352 0.3664 19 0.1972 0.2307 20 0.2643 0.4387 21 0.4101 0.3545 22-0.2538 23-0.2706 24-0.4126 Fonte: Confeccionada pelo autor A seguir foi realizado um t-teste para duas amostras com números diferentes de dados em cada uma. O resultado só começou a ser significante para um nível de significância de 15%. CONCLUSÃO Os Expoentes de Hurst não corresponderam à expectativa de serem bons parâmetros para se diferençiar as duas populações, pois só com um nível de significância de 15%, considerado ruim, é que se conseguiu discriminar os dois conjuntos de dados. Referências HURST, E. Long term storage capacity of reservoirs. Transactions of the American society of civil engenieers. V.116, p.770-799, 1951.
MANDELBROT, B. B.; WALLIS, J. R. Robustness of the rescaled range R/S in the measurement of noncyclic log run statistical dependence. Water Resources Research, v.5, p.967-988, 1969. 166