Sistema de Suporte à Auditoria de Folhas de Pagamento Baseado em Redes Neurais

Sistema de Suporte à Auditoria de Folhas de Pagamento Baseado em Redes Neurais Adriano L. I. Oliveira, Gabriel Azevedo, Adélia Barros, André L. M. Santos Escola Politécnica Universidade de Pernambuco (UPE) Rua Benfica, 455 50750-410 Recife PE Centro de Informática Universidade Federal de Pernambuco (UFPE) Caixa Postal 7851 50732-970 Recife PE alio@cin.ufpe.br, gabriel, adelia @upe.poli.br, alms@cin.ufpe.br Abstract. Artificial neural networks have been applied successfully to time series forecasting. In this paper, a system for support of payroll audit is presented. The system uses neural networks to analyse the temporal behaviour of each earning/deduction and to alarm when they behave suspiciously. Results of experiments with two earnings extracted from a real payroll using both Multi- Layer Perceptron (MLP) and Elman neural networks are presented. For the analysed earnings, Elman neural networks have shown better results, obtaining lower forecasting errors in test sets. Additionally, a simulation of frauds in test sets and the respective indications by Elman networks is presented. Resumo. Redes neurais artificiais tḙm sido aplicadas com sucesso ao problema da previsão de séries temporais. Neste artigo, apresenta-se um sistema para suporte à auditoria de folhas de pagamento. O sistema usa redes neurais para analisar o comportamento temporal de cada verba e apontar verbas com comportamento suspeito. São apresentados resultados de experimentos com redes neurais Multi-Layer Perceptron (MLP) e redes de Elman na análise de duas verbas extraídas de uma folha de pagamento real. Para as verbas analisadas, redes de Elman obteveram melhores resultados, produzindo menores erros de previsão nos conjuntos de teste. Apresenta-se, também, uma simulação de fraudes nos conjuntos de teste e as respectivas indicações pelas redes de Elman. 1. Introdução Despesas com pessoal formam uma parcela significativa das despesas de uma organização, seja ela pública ou privada. No caso do Brasil, a Lei limita as despesas com pessoal a 50% da receita corrente líquida, para a União e a 60%, para os Estados e Municípios. Todavia, uma parte dos Estados e Municípios ainda possui despesas com pessoal um pouco acima do limite legal. Por outro lado, a maioria dos Estados e Municípios gasta com pessoal apenas um pouco abaixo deste limite. A fiscalização das contas públicas no nosso país é função dos Tribunais de Contas. Devido à sua importância financeira, a auditoria das despesas com pessoal é um dos itens mais relevantes nessa fiscalização. Em empresas privadas de médio e grande porte as despesas com pessoal também são significativas e sua fiscalização é bastante relevante.

As organizações normalmente gerenciam suas despesas com pessoal através de sistemas de folha de pagamento. Esses sistemas de informação são responsáveis pelo cálculo da folha de pagamento e gerenciamento dos dados, incluindo emissão de relatórios e contra-cheques. Para calcular o salário líquido de cada funcionário é necessário levar em conta uma série de verbas. As verbas podem ser do tipo vencimento (por exemplo: salário base, gratificação de chefia e adiantamento de férias) ou desconto (por exemplo: desconto para a previdência, empréstimo bancário e desconto de imposto de renda). A quantidade de tipos de verbas numa folha de pagamento pode alcançar algumas centenas. A detecção de fraudes em folhas de pagamento é feita por auditores especializados através de auditorias nos dados armazenados nos respectivos sistemas de informação. Devem ser levadas em conta em auditorias desse tipo um conjunto de leis que regulamentam a inclusão ou exclusão de determinada verba para determinados funcionários, bem como a forma de cálculo dessas verbas. Auditorias de folhas de pagamento têm se tornado cada vez mais complexas devido ao volume de dados e de informações legais a serem analisadas. Na prática, na grande maioria dos trabalhos não é possível realizar todos os testes de auditoria. Por isso, devem ser aplicadas técnicas para a seleção dos casos mais importantes a serem testados. Neste trabalho, é descrito um sistema inteligente baseado em redes neurais para ser usado como ferramenta de suporte à auditoria de folhas de pagamento. O objetivo do sistema é auxiliar o auditor na tarefa de selecionar as verbas e meses a serem auditados. Técnicas de computação inteligente têm sido aplicadas com sucesso em diversos problemas de detecção de fraudes, em áreas como: cartões de crédito, telecomunicações, sistemas de saúde e contabilidade [Dorronsoro et al., 1997, Ezawa and Norton, 1996, Koskivaara, 2000]. Existem algumas abordagens diferentes para a aplicação dessas técnicas ao problema da detecção de fraudes. O sistema proposto neste trabalho foi inspirado nos resultados de [Koskivaara, 2000] para auditoria contábil. A idéia é totalizar cada uma das verbas da folha de pagamento mensalmente, de modo que cada uma delas possa ser tratada como uma série temporal. Redes neurais são usadas para acompanhar a evolução mensal dos valores dessas verbas. Quando o valor previsto pela rede neural se afastar significativamente do valor observado num determinado mês, o auditor será notificado. Desse modo, ele poderá concentrar seus trabalhos na análise das verbas apontadas como suspeitas pelo sistema. Na próxima seção apresenta-se uma descrição do sistema proposto e da base de dados em que os experimentos foram realizados. A seção 3. descreve os experimentos feitos com aplicação de redes neurais MLP ao problema e apresenta os resultados obtidos. Por outro lado, a seção 4. descreve a aplicação de redes de Elman ao problema e compara os resultados obtidos com os resultados de redes MLP. Além disso, essa seção mostra uma simulação de fraudes nos dados e sua detecção pelas redes de Elman. Finalmente, na seção 5. são apresentadas as conclusões e sugestões para trabalhos futuros. 2. Descrição do Sistema e da Base de Dados O sistema proposto supõe que está disponível uma base de dados de anos anteriores já auditada, ou seja, uma base em que todas as verbas estão livres de fraudes. Essa base de dados é utilizada para treinar redes neurais projetadas para a previsão de séries temporais.

q p r mno lk jih e fg c d. / 0 1 * +, - & ' ( ) " # $ %! 2 3 4 5 6 7 8 9 : ; < = >? @ A B C D E F G H I J K L M N O P Q R S T U V W X Y Z [ \ ] ^ _ ` a b Figura 1: Verba 1 normalizada entre 0 e 1. Valores entre janeiro/1996 e dezembro/2002. As redes neurais, depois de treinadas, são usadas para prever os valores mensais das verbas no ano em que está sendo realizada a auditoria. Isso deve ser feito antes do início da auditoria. É importante ressaltar que os valores mensais do ano auditado não são usados para treinamento das redes neurais. Os valores previstos pelas redes neurais são comparados aos valores reais das verbas observados na auditoria. Devem ser definidos critérios para alarmar os auditores quando houver diferença significativa entre os valores previstos e observados num dado mês. Assim, os auditores concentrariam seus trabalhos de análise nas verbas em que houvesse alarmes. Este artigo descreve a primeira etapa do desenvolvimento do sistema, que consistiu na realização de experimentos com dois tipos diferentes de redes neurais com o objetivo de verificar a viabilidade do uso dessas redes e comparar seu desempenho neste problema, usando dados reais. Os experimentos descritos neste artigo foram realizados com duas verbas, selecionadas pela sua representatividade tanto em termos financeiros quanto pela complexidade das séries temporais correspondentes. As verbas foram obtidas da folha de pagamento de um dos órgãos do Estado de Pernambuco. Cada uma dessas verbas foi totalizada, considerando todos os funcionários, a cada mês, entre os meses de janeiro de 1996 e dezembro de 2002, produzindo séries temporais com 84 meses. Os valores foram normalizados entre 0 e 1, usando a expressão sutwvyx{z} s~ suz ƒt suz ˆ~ suz Št (1) onde sut vœx{z é o valor normalizado correspondente ao valor original s do total da verba em determinado mês e suz Št e suz são, respectivamente, os valores mínimo e máximo entre os 84 possíveis valores da verba. A série correspondente à verba 1, com seus valores normalizados, está mostrada na figura 1. A figura 2 mostra a série temporal correspondente à verba 2 normalizada. Nos experimentos descritos a seguir, os valores dos 72 primeiros meses foram usados como conjunto de treinamento e validação enquanto que os 12 últimos foram

ø ù ôõö óò ñðï ì íî ê ë µ ± ² ³ ª «ž Ÿ š œ Ž ¹ º» ¼ ½ ¾ À Á Â Ã Ä Å Æ Ç È É Ê Ë Ì Í Î Ï Ð Ñ Ò Ó Ô Õ Ö Ø Ù Ú Û Ü Ý Þ ß à á â ã ä å æ ç è é Figura 2: Verba 2 normalizada entre 0 e 1. Valores entre janeiro/1996 e dezembro/2002. usados como conjunto de teste. Um dos problemas enfrentados é o pequeno tamanho dessa série, que certamente dificulta o treinamento das redes neurais. Deve-se ressaltar que, na prática, será difícil obter uma quantidade de dados substancialmente maior que esta, pelo menos nos órgãos do Estado de Pernambuco, pois boa parte desses órgãos teve suas folhas de pagamento automatizadas apenas na década de 90. Além disso, deve-se garantir que os dados usados no treinamento estejam livres de fraudes, ou seja, que já tenham sido auditados. No Tribunal de Contas de Pernambuco a auditoria das folhas de pagamento informatizadas foi iniciada apenas a partir de 1996, portanto, neste trabalho, só é possível garantir que os dados estejam livres de fraudes a partir desse ano. 3. Experimentos com Multi-Layer Perceptron (MLP) Para usar redes neurais MLP (Multi-Layer Perceptron) para previsão de séries temporais, define-se como entrada um conjunto de valores passados ordenado seqüencialmente no tempo e como saída o valor posterior a esta seqüência [Haykin, 1998]. O número de valores passados a ser usado como entrada é chamado de ordem da linha de atraso. Assim, por exemplo, se tivermos uma ordem da linha de atraso de 2, os meses de janeiro e fevereiro são usados como entrada e o mês de março como saída correspondente; os meses de fevereiro e março são usados como entrada e o mês de abril como saída correspondente e assim por diante. 3.1. Topologias das Redes Neurais Foram utilizadas redes neurais MLP contendo uma ou duas camadas escondidas. As unidades das camadas escondidas usaram função de ativação sigmóide logística, enquanto que a unidade da camada de saída usou função de ativação linear. As redes possuem todas as possíveis conexões feedforward. Para as redes com uma camada escondida, foram treinadas topologias com 3, 7, 14 e 28 unidades nesta camada, enquanto que para as redes com duas camadas escondidas foram treinadas topologias com 2, 3, 4 e 5 unidades em cada camada escondida. Para cada uma dessas topologias, foram utilizadas linhas de atraso de ordem 2, 4, 6 e 12.

~ ~ ú ~ ú 3.2. Divisão dos Conjuntos de Dados em Treinamento, Validação e Teste Para treinar e testar as redes, foram usados os dados normalizados correspondentes às verbas 1 e 2, conforme descrito na seção 2. Para um total de 84 meses disponíveis para cada verba, ao utilizar uma MLP com linha de atraso de ordem ú, o conjunto de dados fica reduzido a ûýü ú meses, pois os ú primeiros meses são usados para previsão do valor do mês úÿþ e, portanto, não há previsão para esses ú meses iniciais. Para treinar uma rede neural para previsão temporal, a divisão do conjunto de dados em conjuntos de treinamento, validação e teste deve ser feita na ordem temporal, ou seja, os dados mais antigos devem ser usados para treinamento, dados posteriores devem formar o conjunto de validação, enquanto os últimos dados devem formar o conjunto de teste [Koskela et al., 1996]. Dentre os û ü meses disponíveis, os 12 últimos foram utilizados como conjunto de teste (correspondendo ao ano de 2002), os 12 meses do ano de 2001 foram utilizados como conjunto de validação e os meses iniciais formaram o conjunto de treinamento. 3.3. Metodologia de Treinamento O algoritmo de treinamento utilizado foi uma versão do método de Levenberg-Marquadt [Fletcher, 1987]. Para cada topologia, os treinamentos foram realizados dez vezes, com diferentes inicializações dos pesos. Para cada treinamento, a parada ocorre se for satisfeito o critério do Proben1 [Prechelt, 1994] por duas vezes, se for satisfeito o critério do progresso de treinamento do Proben1, com ou se a quantidade máxima de épocas de treinamento de 300 for atingida. A parada pelo critério corresponde ao método de parada antecipada (early stopping) baseada no conjunto de validação. A perda de generalização (generalization loss GL) na época é definida como o crescimento do erro no conjunto de validação relativo ao valor mínimo obtido até o momento. Pelo critério, o treinamento pára se a perda de generalização for maior ou igual a 5% [Prechelt, 1994]. 3.4. Resultados Obtidos Os aspectos observados ao final do treinamento foram o MSE (mean square error erro médio quadrático) nos conjuntos de treinamento, validação e teste e o número de épocas treinadas. As tabelas 1 e 2 apresentam os valores de média e desvio-padrão dos aspectos observados para as verbas 1 e 2, respectivamente. Note que são apresentados apenas os resultados obtidos pela melhor ordem de linha de atraso para cada verba, variando o número de camadas escondidas e a quantidade de unidades em cada camada escondida. Para a verba 1, a linha de atraso de ordem 12 produziu os menores erros no conjunto de teste, enquanto que para a a verba 2, os melhores resultados foram obtidos pela linha de atraso de ordem 6. Como o interesse deste trabalho é avaliar a capacidade de previsão das redes neurais para dados não utilizados no treinamento, considera-se como melhor arquitetura aquela que minimiza o MSE no conjunto de teste. Assim, para a verba 1, a tabela 1 mostra que a melhor MLP obtida possui linha de atraso de ordem 12 e duas camadas escondidas, com cinco neurônios em cada uma delas. Para esta topologia, o MSE médio obtido no conjunto de teste foi de 0,00644. Já para a verba 2, a tabela 2 mostra que a arquitetura de MLP, dentre as testadas, que minimiza o erro no conjunto de treinamento é a que possui linha de atraso de ordem 6, com duas camadas escondidas e dois neurônios em cada uma delas. Neste caso, foi obtido um MSE médio no conjunto de teste de 0,01200.

Camada(s)/ MSE treinamento MSE validação MSE teste Épocas treinadas Unidades Média Desvio Média Desvio Média Desvio Média Desvio 1 / 3 0,00044 0,00036 0,00374 0,00248 0,00698 0,00582 15 4 1 / 7 0,00008 0,00011 0,00569 0,00227 0,01154 0,00286 13 4 1 / 14 0,00001 0,00002 0,00662 0,00311 0,01474 0,00654 8 3 1 / 28 2,0 3,0 0,00740 0,00254 0,01371 0,00387 5 1 2 / 2 0,00417 0,01081 0,01143 0,02309 0,01531 0,02474 20 9 2 / 3 0,00052 0,00042 0,00344 0,00206 0,00743 0,01057 18 8 2 / 4 0,00041 0,00057 0,00369 0,00114 0,00697 0,00188 20 10 2 / 5 0,00015 0,00005 0,00417 0,00129 0,00644 0,00368 16 2 Tabela 1: Média e desvio-padrão dos resultados obtidos para a verba 1 com redes MLP com linha de atraso de ordem 12. Camada(s)/ MSE treinamento MSE validação MSE teste Épocas treinadas Unidades Média Desvio Média Desvio Média Desvio Média Desvio 1 / 3 0,00231 0,00024 0,00928 0,00313 0,02338 0,02459 11 2 1 / 7 0,00207 0,00032 0,05419 0,08051 0,16067 0,25810 9 3 1 / 14 0,00141 0,00030 0,05137 0,05231 0,19705 0,41316 8 1 1 / 28 0,00128 0,00034 0,08955 0,11553 0,16156 0,16004 8 2 2 / 2 0,00299 0,00142 0,00723 0,00300 0,01200 0,00897 27 30 2 / 3 0,00271 0,00040 0,01419 0,01335 0,05094 0,07068 10 3 2 / 4 0,00386 0,00549 0,01191 0,00933 0,01966 0,02042 10 3 2 / 5 0,00234 0,00027 0,01221 0,01349 0,05524 0,06371 12 4 Tabela 2: Média e desvio-padrão dos resultados obtidos para a verba 2 com redes MLP com linha de atraso de ordem 6. 4. Experimentos com Redes de Elman Redes de Elman são redes parcialmente recorrentes desenvolvidas para processamento temporal [Haykin, 1998, Koskela et al., 1996]. Essas redes possuem unidades de contexto que formam conexões recorrentes entre a camada escondida e a camada de entrada. As conexões recorrentes fazem com que as unidades da camada escondida vejam na sua entrada valores prévios de sua própria saída, o que adiciona memória à rede e possibilita melhor capacidade de processamento temporal. Redes de Elman originais possuíam apenas uma camada escondida, no entanto, posteriormente foram desenvolvidas extensões com mais de uma camada. A divisão dos dados em conjuntos de treinamento, validação e testes, foi a mesma adotada para redes MLP. Com o objetivo de comparar os resultados com os das redes MLP, foram usadas redes de Elman com topologias similares às usadas nas redes MLP, sendo diferentes apenas na utilização de unidades de contexto pelas redes de Elman. O algoritmo usado para treinar as redes de Elman foi o resilient backpropagation (RPROP) [Riedmiller and Braun, 1993], com parâmetros "! #$, z ÿ &%. A escolha desses parâmetros não é crítica, sendo esta uma das vantagens do RPROP. Os parâmetros usados foram sugeridos em [Riedmiller and Braun, 1993]. O critério de parada adotado foi o mesmo usado para o treinamento das redes MLP e descrito na seção 3.3., com a única alteração de que, neste caso, o número máximo de épocas foi fixado em 2000. 4.1. Resultados Obtidos Os aspectos observados ao final do treinamento neste caso também foram o MSE nos conjuntos de treinamento, validação e teste e o número de épocas treinadas. Como nos

Camada(s)/ MSE treinamento MSE validação MSE teste Épocas treinadas Unidades Média Desvio Média Desvio Média Desvio Média Desvio 1 / 3 0,00121 0,00046 0,00294 0,00133 0,00443 0,00191 163 95 1 / 7 0,00189 0,00055 0,00249 0,00068 0,00286 0,00064 73 33 1 / 14 0,00205 0,00067 0,00384 0,00337 0,00319 0,00227 72 35 1 / 28 0,00139 0,00054 0,00724 0,01311 0,00521 0,00222 84 21 2 / 2 0,00100 0,00080 0,00330 0,00133 0,00515 0,00172 225 246 2 / 3 0,00086 0,00038 0,00313 0,00187 0,00463 0,00226 85 31 2 / 4 0,00102 0,00064 0,00319 0,00187 0,00465 0,00222 110 100 2 / 5 0,00170 0,00118 0,00286 0,00168 0,00449 0,00228 69 16 Tabela 3: Média e desvio-padrão dos resultados obtidos para a verba 1 com redes de Elman com linha de atraso de ordem 12. Camada(s)/ MSE treinamento MSE validação MSE teste Épocas treinadas Unidades Média Desvio Média Desvio Média Desvio Média Desvio 1 / 3 0,02230 0,01544 0,04908 0,04425 0,05728 0,05703 23 22 1 / 7 0,02145 0,02329 0,03030 0,04279 0,01794 0,02636 26 14 1 / 14 0,00805 0,00344 0,01061 0,01628 0,00576 0,00594 30 10 1 / 28 0,00757 0,00251 0,00792 0,00538 0,00508 0,00367 32 7 2 / 2 0,03291 0,01129 0,12269 0,10173 0,06999 0,07056 34 60 2 / 3 0,03135 0,01400 0,04490 0,06294 0,03454 0,04048 25 30 2 / 4 0,02936 0,01263 0,06923 0,05625 0,06999 0,06822 19 11 2 / 5 0,02402 0,01149 0,07708 0,08422 0,10761 0,11968 23 12 Tabela 4: Média e desvio-padrão dos resultados obtidos para a verba 2 com redes de Elman com linha de atraso de ordem 6. experimentos com MLP, as redes de Elman com linha de atraso de ordem 12 foram as que produziram melhores resultados para a verba 1, enquanto que as redes com linha de atraso de ordem 6 produziram melhores resultados para a verba 2. As tabelas 3 e 4 apresentam os resultados produzidos por essas redes de Elman para as verbas 1 e 2, respectivamente. A tabela 3 mostra que a melhor rede de Elman dentre as testadas para a verba 1 possui uma única camada intermediária com sete neurônios escondidos, ordem da linha de atraso de 12 e produziu um MSE médio no conjunto de teste de 0,00286. Este resultado é bem melhor que o apresentado pela melhor arquitetura de MLP testada, que produziu MSE médio de teste de 0,00644. Além disso, comparando as tabelas 1 e 3, observa-se que as redes de Elman produzem MSE médio no conjunto de teste menores que os das redes MLP para todas as topologias consideradas. No caso da verba 2, a tabela 4 mostra que a melhor rede de Elman obtida produz MSE médio no conjunto de teste de 0,00508 e possui uma única camada escondida com 28 unidades e ordem da linha de atraso de 6. Este erro também é significativamente inferior ao melhor resultado obtido com MLP, que foi de 0,01200. Em contraste com a verba 1, para a verba 2, as redes de Elman produziram melhores resultados que as redes MLP em apenas metade das topologias comparadas. 4.2. Usando Redes de Elman para Indicar Suspeitas de Fraudes Novos experimentos foram feitos usando as melhores redes de Elman obtidas para as verbas 1 e 2, desta vez treinando 30 vezes a mesma rede com diferentes inicializações dos pesos. As redes foram testadas de duas maneiras. A primeira consistiu em testar a rede usando os vetores do conjunto de teste, da forma descrita na seção 3. A outra maneira foi gerar os vetores do conjunto de teste dinamicamente. Assim, por exemplo, para uma linha

i o u Ÿ ¹ ³ µ ²± ª«T U V W P Q R S L M N O H I J K D E F G @ A B C < = >? 8 9 : ; 4 5 6 7 0 1 2 3, -. / ' ( ) * + ] ^ _ ` a b c X Y Z [ \ d e f g h j k l m n p q r s t { } ~ v w x y z ƒ ˆ Š Œ Ž š œ ž º» ¼ ½ ¾ À Á Â Ã Ä Å Figura 3: Comparação entre os valores previstos pela melhor rede de Elman obtida e os valores reais, a cada mês do conjunto de teste. de atraso de ordem 2, usam-se os meses de novembro e dezembro de 2001 para prever o mês de janeiro de 2002. Para prever o valor de fevereiro de 2002, são utilizados o mês de dezembro de 2001 e o valor previsto pela rede para janeiro de 2002. Este procedimento é realizado para gerar os demais vetores do conjunto de teste de maneira dinâmica. Usando conjuntos de teste gerados dinamicamente, são obtidos melhores resultados para ambas as verbas. No caso da verba 1, o MSE médio, calculado a partir da comparação da previsão média de cada mês e considerando as 30 execuções, ficou em 0,00088. Para a verba 2, esse MSE teve valor de 0,00181. A figura 3 mostra uma comparação entre os valores reais do conjunto de teste e a média dos valores previstos para cada mês pela melhor arquitetura de rede de Elman obtida para a verba 1, usando a geração dinâmica do conjunto de teste descrita anteriormente e considerando 30 execuções. Observa-se que a rede consegue prever de maneira satisfatória os valores do conjunto de teste, referentes a 2002. A tabela 5 apresenta as diferenças entre os valores médios previstos e os valores reais, para cada mês do conjunto de teste, tanto para a verba 1 quanto para a verba 2. Para as duas verbas foi utilizada geração dinâmica do conjunto de teste. A partir dos resultados da tabela 5, este trabalho propõe como critério de alarme para fraudes a ocorrência de diferenças entre os valores normalizados previsto e real acima do valor máximo obtido para determinada verba no ano anterior. Assim, neste estudo de caso, quando o auditor fosse avaliar as verbas 1 e 2 referentes a 2003, ele compararia a previsão fornecida com o sistema com os valores reais obtidos. O sistema indicaria suspeição de fraudes nos meses em que a verba 1 apresentasse uma diferença absoluta entre os valores real e previsto maior que 0,053. Para a verba 2, haveria indicação de suspeita de fraude quando esse diferença fosse maior que 0,064. A figura 4 mostra o resultado de uma simulação de fraudes na verba 1 nos meses de julho e outubro. Neste caso, o mês de julho passou a ter sua diferença entre valor real e previsto aumentada para 0,1 e o mês de outubro para 0,065, ou seja, valores acima do limiar de 0,053 e

Mês/Ano Verba 1 Verba 2 Diferença entre valores reais e previstos Diferença entre valores reais e previstos jan/02 0,02250 0,04626 fev/02 0,00709 0,04642 mar/02 0,01854 0,01740 abr/02 0,00437 0,00068 mai/02 0,03563 0,05589 jun/02 0,00400 0,03739 jul/02 0,00424 0,04210 ago/02 0,02273 0,01966 set/02 0,02299 0,06352 out/02 0,01473 0,04728 nov/02 0,01700 0,00360 dez/02 0,05216 0,06375 Tabela 5: Diferença absoluta entre os valores médios previstos pela melhor rede de Elman para cada verba e os valores reais, nos respectivos conjuntos de teste. que, portanto, fariam com que os respectivos meses fosse indicados como suspeitos pelo sistema. Apesar do sistema indicar automaticamente as suspeitas de fraude, note que até mesmo visualmente é possível identificar meses com comportamento suspeito. 5. Conclusões e Trabalhos Futuros Este trabalho teve como objetivo mostrar resultados de um sistema proposto para oferecer suporte à auditoria de folhas de pagamento. O sistema analisa o comportamento temporal das verbas totalizadas de uma folha de pagamento usando redes neurais. O auditor é informado quando uma verba apresenta desvio em relação ao comportamento previsto pela rede neural em determinados meses. O sistema foi testado em duas verbas extraídas de uma folha de pagamento real, utilizando redes neurais Multi-Layer Perceptron (MLP) e redes de Elman. Os experimentos foram feitos tanto com redes com uma camada escondida quanto com redes com duas camadas escondidas, variando a quantidade de neurônios na camada escondida e a ordem da linha de atraso na entrada das redes. As redes de Elman obtiveram previsões consideravelmente melhores que as redes MLP para ambas as verbas analisadas. O trabalho também mostrou resultados de uma simulação de indicação de fraudes usando o sistema proposto com redes de Elman O uso de redes neurais como ferramenta de suporte à auditoria de folhas de pagamento ainda necessita de bastante investigação. Entre os trabalhos futuros a serem realizados visando a melhoria da capacidade de previsão do sistema e uma avaliação mais ampla da sua viabilidade, serão priorizados: testes com diversas outras verbas extraídas de algumas diferentes folhas de pagamento de modo a verificar qual o tipo de rede neural mais adequado e se esse tipo varia de acordo com o tipo de verba; avaliação de outras arquiteturas voltadas para processamento temporal, como redes FIR [Koskela et al., 1996, Haykin, 1998], neste problema; avaliação da influência de alternativas de pré-processamento das verbas nos resultados de previsão; investigação do uso de uma única rede neural para a previsão de várias verbas, levando em conta sua interdependência [Koskivaara, 2000] e, por fim, avaliação de técnicas de otimização global de arquiteturas de redes neurais, tais como simulated annealing, tabu search e algoritmos

X PO Q KJ VWU RST MN L FG HI ó ô õ ö ï ð ñ ò ë ì í î ç è é ê ã ä å æ ß à á â Û Ü Ý Þ Ø Ù Ú Ó Ô Õ Ö Ï Ð Ñ Ò Ë Ì Í Î Æ Ç È É Ê ü ý þ ÿ ø ù ú û! " # $%& ' () *+,? @ A BC D E Y Z [ \ ] ^_ ` ab c d -. / 012 3 45 678 9 :; <=> Figura 4: Comparação entre os valores previstos pela melhor rede de Elman obtida e os valores obtidos na auditoria, com simulação de fraudes nos meses de julho e outubro. genéticos [Prudêncio and Ludermir, 2001]. Referências Dorronsoro, J. R., Ginel, F., Sanchez, C., and Cruz, C. S. (1997). Neural fraud detection in credit card operations. IEEE Transactions on Neural Networks. Ezawa, K. J. and Norton, S. W. (1996). Constructing bayesian networks to predict uncollectible telecommunications accounts. IEEE Expert, (5). Fletcher, R. (1987). Practical methods of optimization. Wiley. Haykin, S. (1998). Neural Networks: A Comprehensive Foundation. Prentice Hall, 2nd edition. Koskela, T., Lehtokangas, M., Saarinen, J., and Kaski, K. (1996). Time series prediction with multi-layer perceptron, FIR and Elman neural networks. In Proceedings of the World Congress on Neural Networks, pages 491 496, San Diego, USA. Koskivaara, E. (2000). Artificial neural network models for predicting patterns in auditing monthly balances. Journal of Operational Research Society, 51(9):1060 1069. Prechelt, L. (1994). Proben1 a set of neural networks benchmark problems and benchmarking rules. Technical Report 21/94, Universität Karlsruhe, Germany. Prudêncio, R. B. C. and Ludermir, T. B. (2001). Design of neural networks for time series prediction using case-initialized genetic algorithms. In Proceedings of the 8th International Conference on Neural Information Processing, ICONIP 01, Shanghai,China. Riedmiller, M. and Braun, H. (1993). A direct adaptive method for faster backpropagation learning: The RPROP algorithm. In Proceedings of the IEEE International Conference on Neural Networks (ICNN 93).