UNIVERSIDADE FEDERAL DE OURO PRETO ESCOLA DE MINAS COLEGIADO DO CURSO DE ENGENHARIA DE CONTROLE E AUTOMAÇÃO - CECAU DIEGO GOMES COELHO

UNIVERSIDADE FEDERAL DE OURO PRETO ESCOLA DE MINAS COLEGIADO DO CURSO DE ENGENHARIA DE CONTROLE E AUTOMAÇÃO - CECAU DIEGO GOMES COELHO Um Estudo Comparativo Entre a Aplicação de Mapas Auto-Organizáveis e Perceptron Múltiplas Camadas na Classificação de Falhas Incipientes em Transformadores de Potência MONOGRAFIA DE GRADUAÇÃO EM ENGENHARIA DE CONTROLE E AUTOMAÇÃO Ouro Preto 2012

DIEGO GOMES COELHO Um Estudo Comparativo Entre a Aplicação de Mapas Auto-Organizáveis e Perceptron Múltiplas Camada na Classificação de Falhas Incipientes em Transformadores de Potência Monografia apresentada ao Curso de Engenharia de Controle e Automação da Universidade Federal de Ouro Preto como parte dos requisitos para obtenção do Grau de Engenheiro de Controle e Automação Orientador: Agnaldo J. Rocha Reis Ouro Preto Escola de Minas - UFOP 2012

AGRADECIMENTOS Agradeço a Deus por ter me dado forças e por todas as graças recebidas em minha vida. Agradeço a meus pais Luciano e Eva, pela dedicação e por darem a mim e aos meus irmãos maior riqueza do mundo, o estudo. Agradeço aos meus irmãos Lorene e Douglas, por todo o companheirismo e apoio nas horas boas e nas difíceis. A toda minha família que sempre teve orgulho e acreditou em mim. A Elisa por seu amor e companhia nessa jornada. Aos amigos da República Taranóia, irmãos de caminhada. Ao professor Agnaldo, sempre paciente, disponível e disposto a ajudar com ideias e conhecimentos muito úteis nesse percurso final. A todos os amigos e professores do Curso de Engenharia de Controle e Automação, que compartilharam um pouco de seu conhecimento e experiências nessa caminhada.

RESUMO Entre os equipamentos de potência mais importantes no processo de transmissão de energia elétrica se encontram os transformadores de potência. Trata-se de equipamentos que requerem alto investimento na sua aquisição e comissionamento. Durante sua operação os transformadores são expostos a vários fenômenos naturais que tem a diminuir sua vida útil. Logo, se vê a importância de implementar um plano de manutenção que assegure o funcionamento do transformador, dê confiabilidade à transmissão de energia e, consequentemente, o fornecimento de energia aos usuários finais. Uma técnica de manutenção muito utilizada é a análise cromatográfica do óleo isolante do transformador. A partir dessa análise é possível diagnosticar o estado operacional do mesmo através das concentrações dos gases dissolvidos no óleo e verificar se há ou não necessidade de algum tipo de reparo ou até mesmo substituição da unidade. Dentro desse contexto, é apresentado um estudo sobre a técnica dos mapas auto-organizáveis (do inglês, Self OrganizingMaps ), aplicada em bases de dados reais para identificação de padrões no funcionamento operacional dos transformadores de potência. Os mapas auto-organizáveis são um tipo de rede neural com aprizado não supervisionado, ou seja, não é necessária nenhuma intervenção para que a ferramenta realize a classificação. São classificados três tipos de padrões, so eles: funcionamento normal, falha elétrica e falha térmica. A identificação é feita através dos dados de análises cromatográficas realizadas nos óleos dos transformadores. A ferramenta desenvolvida visa apoiar o diagnóstico de falhas, prevenindo desta forma, os inconvenientes acima relatados e facilitando a decisão de técnicos e engenheiros de manutenção para a manutenção preventiva dos transformadores. Serve também de base para o diagnóstico, permitindo uma estimativa do grau de envelhecimento e da vida útil do transformador. Palavras chave: Transformador de potência, Mapas auto-organizáveis, Redes neurais, Classificação de padrões, Manutenção preventiva.

ABSTRACT Among the major power equipment in the transmission of electricity are the power transformers. It is a device that requires high investment in its acquisition and commissioning. During operation, transformers are exposed to various natural phenomena that t to shorten its life thence;one can readily see the importance of implementing a maintenance plan that ensures the operation of the transformer and give the power transmission reliability, and guarantees the supply to users. A technical maintenance widely used is the chromatographic analysis of the insulating oil of the transformer. From this analysis it is possible to diagnose its operational state through the concentrations of dissolved gases in the oil and check whether there is need for some kind of repair or even replacement of the unit. Within this context, one presents a study on the technique of Self-Organizing Maps, applied to real datasets to identify patterns in the operational functioning of power transformers. The self-organizing maps are a type of neural network with unsupervised learning, i.e., intervention is not necessary to perform the classification. Three types of patterns are classified namely: normal operation, electrical failure and thermal failure. The identification is made through the data of chromatographic analyzes performed on transformer oil. The developed tool aims to support fault diagnosis, thus preventing the drawbacks reported above and facilitating the decision of maintenance technicians and engineers for preventive maintenance of transformers. It also serves as a basis for the diagnosis, allowing an estimate of the degree of aging and service life of the transformer. Key words: Power transformers, Self-organizing maps, Neural networks, Classification of Patterns, Preventive Maintenance.

LISTA DE FIGURAS FIGURA 2.1 - Representação básica de um neurônio... FIGURA 2.2 - Rede de camada única... FIGURA 2.3 - Rede de múltiplas camadas... FIGURA 2.4 - Esquema de aprizado supervisionado... FIGURA 2.5 - Esboço do funcionamento de um aprizado não supervisionado... FIGURA 2.6 - Mapas topológicos, hexagonal e retangular... FIGURA 2.7 - Função de vizinhança gaussiana... FIGURA 3.1 - Matrizes-U para diferentes mapas. (1) pequeno, (2) médio e (3)grande... FIGURA 3.2 - Matriz-U do mapa de tamanho 5x16... FIGURA 3.3 - Matriz-U em 3 dimensões para o mapa de tamanho 5x16... FIGURA 4.1 - Matriz-U em 3 dimensões com as regiões de borda marcadas para o mapa de tamanho 5x16... 12 13 13 14 14 16 18 30 31 31 37

LISTA DE TABELAS TABELA 3.1: Base de dados IEC com algumas amostras... TABELA 3.2: Medidas originais e normalizadas... TABELA 4.1: Comparação dos índices de concordância percentual global para a base desbalanceada (IEC)... TABELA 4.2: Comparação dos índices de concordância percentual discriminado por tipo de defeito para a base desbalanceada (IEC)... TABELA 4.3: Comparação dos índices de concordância percentual global para a base desbalanceada (Base 1)... TABELA 4.4: Comparação dos índices de concordância percentual discriminado por tipode defeito para a base desbalanceada (Base 1)... TABELA 4.5: Índice de Concordância Percentual global para a base desbalanceada (Base 2)... TABELA 4.6: Índice de Concordância Percentual discriminado por tipo de defeito para a base desbalanceada (Base 2)... 27 28 34 34 35 35 36 36

SUMÁRIO 1 INTRODUÇÃO... 9 1.1 Objetivo...10 1.2 Justificativa...10 1.3 Metodologia...11 2 REVISÃO BIBLIOGRÁFICA...12 2.1 Redes Neurais Artificiais...12 2.2 Mapas auto-organizáveis...16 2.2.1 Topologia da rede...17 2.2.2 Processo de competição...17 2.2.3 Processo de cooperação...18 2.2.4 Processo adaptativo...20 2.3 Transformador de Potência...22 3 DESENVOLVIMENTO...26 3.1 Escolha do Software...26 3.2 Base de dados...27 3.2.1 Pré-processamento de dados...28 3.3 Inicialização e Treinamento...29 3.4 Visualização...30 3.5 Validação...32 3.6 Medidas de qualidade...33 4 RESULTADOS E DISCUSSÕES...35 5 CONCLUSÕES...39 5.1 Trabalhos futuros...40 REFERÊNCIAS BIBLIOGRÁFICAS...41 ANEXO...43

9 1INTRODUÇÃO O transformador de potência possui um custo elevado de aquisição e é um equipamento de grande importância no sistema de fornecimento de energia elétrica. Sua operação está diretamente vinculada ao fornecimento de energia, uma vez que sua perda, por falha ou por defeito, pode ocasionar a suspensão do fornecimento. Por conseguinte, a detecção prematura de falhas que possam ajudar na sua manutenção tem uma grande valia, pois a substituição desse equipamento é onerosa e demanda muito tempo. Uma técnica bastante eficaz de detecção de falhas em transformadores é a análise do gás dissolvido no óleo do transformador, proposta por M. Duval (DUVAL, 2002). Em seu trabalho, Duval propõe a identificação de falhas elétricas e térmicas através da concentração dos seguintes gases: etileno (C 2 H 4 ), metano (CH 4 ), acetileno (C 2 H 2 ), hidrogênio (H 2 ) e etano (C 2 H 6 ). Medições dessas concentrações podem ser obtidas com um cromatógrafo líquido e posteriormente armazenadas em um banco de dados. A cromatografia é uma técnica quantitativa, tem por finalidade geral duas utilizações, a de identificação de substâncias e de separação-purificação de misturas. Usando propriedades como solubilidade, tamanho e massa. O armazenamento de dados tem se mostrado cada vez mais frequente nos dias atuais, devido à facilidade de acesso às tecnologias de aquisição e de armazenagem. Se por um lado o armazenamento está facilitado, a análise desses dados está cada vez mais complexa devido ao grande volume a ser examinado. Portanto, se não é possível extrair informações desses dados, sua armazenagem por si só perde um pouco o sentido. A fim de extrair informação dessas bases de dados, é possível utilizar ferramentas que combinam métodos estatísticos, banco de dados, inteligência artificial e aprizado de máquina. Uma dessas ferramentas é conhecida como Mineração de Dados (do inglês, Data Mining ). A Mineração de Dados é a extração de informação implícita, previamente desconhecida, e potêncialmente útil de uma base de dados (WITTEN, EIBE e HALL, 2011). So um pouco mais específico, Redes Neurais Artificiais, Máquinas de Vetores Suporte, Redes Neuro-Fuzzy, Árvores de Decisão, Wavenets, etc. são alguns exemplos de ferramentas utilizadas na mineração de dados. É nesse contexto que este trabalho se insere. A partir de uma base de dados real conto dados da IEC TC10, CEPEL (Centro de Pesquisas de Energia Elétrica) e de uma empresa da

10 área de elétrica (aqui estas bases de dados foram denominadas de IEC, Base 1 e Base 2), foi desenvolvida uma ferramenta que possa realizar o diagnóstico do estado operacional de um transformador de potência através dos dados de cromatografia do mesmo. Mapas Auto-Organizáveis (do inglês, self organizingmaps ), que são um tipo de rede neural de aprizado não supervisionado, são utilizados na tarefa de mineração de dados com o objetivo de classificar diversos tipos de falhas com base nas concentrações medidas dos gases dissolvidos supracitados. Os resultados aqui apresentados serão comparados com aqueles publicados em [CASTANHEIRA, 2008], que foram obtidos com classificadores baseados em Perceptron Múltiplas Camadas (PMC). 1.1 Objetivo Desenvolver uma rede neural treinada de forma não supervisionada que seja capaz de diagnosticar o estado de operação dos transformadores de potência, seja normal, falha elétrica ou falha térmica, to como entradas os teores de concentração dos gases: etileno (C 2 H 4 ), metano (CH 4 ), acetileno(c 2 H 2 ), hidrogênio (H 2 ) e etano (C 2 H 6 ) no óleo do transformador. Esse classificador será uma ferramenta de auxílio bastante importante para fins de manutenção de transformadores. 1.2 Justificativa A criação dessa ferramenta de diagnóstico visa proporcionar rapidez e exatidão na detecção de falhas, além da diminuição do tempo e do custo de manutenção de transformadores de potência, aumentando a vida útil do equipamento e, por consequência, tornando o fornecimento de energia menos suscetível a falhas, aumentando assim a disponibilidade de energia para o usuário final.

11 1.3 Metodologia O desenvolvimento do trabalho foi feito utilizando o software MATLAB para a criação de uma ferramenta de detecção de falhas incipientes em transformadores de potência. O algoritmo da ferramenta foi desenvolvido utilizando técnicas de redes neurais artificiais. Após o desenvolvimento, foram utilizadas bases de dados reais para realizar o seu treinamento e validação. Posteriormente a ferramenta foi submetida a novos dados, para verificar sua eficácia nos diagnósticos.

12 2 REVISÃO BIBLIOGRÁFICA 2.1 Redes Neurais Artificiais Segundo Braga, Ludemir e Carvalho (2000), Redes Neurais Artificiais (RNA) são sistemas paralelos distribuídos compostos por unidades de processamento simples (nodos) que calculam determinadas funções matemáticas (normalmente não lineares). Tais unidades são dispostas em uma ou mais camadas e interligadas por um grande número de conexões, geralmente unidirecionais. As redes neurais artificiais se espelham no funcionamento das redes biológicas de um cérebro, buscando reproduzir seu funcionamento e sua dinâmica, para o meio digital. A tentativa de replicar o modo de comunicação dos neurônios biológicos permitiu trazer para as máquinas o conceito de aprizagem. Esse tipo de interação permitiu aos meios digitais recriar o mesmo padrão e organização, em termos de processamento de dados que o cérebro. Uma rede neural possui muitas características e para Haykin (2009), as principais são: não linearidade, mapeamento de entrada-saída, adaptabilidade, resposta a evidências, informação contextual, tolerância a falhas, implementação em VLSI (Very Large Scale Implementation), uniformidade de análise e projeto e analogia neurobiológica. VLSI consiste em criar circuitos integrados combinando milhares de transistores em um único chip, aumentando muito o poder computacional. A unidade fundamental de uma RNA assim como o cérebro, é o neurônio so o artificial uma simplificação do biológico. O neurônio de uma RNA possui varias entradas, uma unidade de processamento e apenas uma saída que correspondem respectivamente, aos dritos, ao núcleo e ao axônio de seu equivalente biológico. Cada uma das entradas possui um peso chamado de peso sináptico que varia entre 0 e 1. Os valores das entradas são multiplicados pelos pesos sinápticos e são somados, o valor resultante é usado na função de ativação da unidade de processamento, gerando assim uma saída. A função de ativação é escolhida pelo desenvolvedor da rede, podo ser uma função linear, degrau, rampa, tangencial e hiperbólica. Na figura 2.1 temos a representação básica de um neurônio artificial.

13 FIGURA 2.1 - Representação básica de um neurônio. Fonte: Haykin (2009). Ao combinarmos diversos neurônios podemos formar uma rede. Numa rede os neurônios são elementos processadores simples, executando somente sua função de ativação, mas uma rede neural como um todo, tem capacidade para resolução de problemas complexos. Geralmente os elementos processadores são organizados em camadas e interligados ente si. Alguns neurônios recebem estímulo do mundo exterior e são conhecidos como neurônios de entrada. Outros têm suas saídas usadas para interagir de alguma forma com o mundo exterior e por isso são chamados neurônios de saída. Existem também os neurônios que não interagem com o mundo externo, pois ficam situados em camadas internas da rede e são conhecidos como neurônios ocultos. As redes neurais possuem diferentes tipos de arquiteturas. A definição da arquitetura de uma RNA é um parâmetro importante na sua concepção, uma vez que ela restringe o tipo de problema que pode ser tratado pela rede. (Braga, Ludemir e Carvalho, 2000). Para a classificação das arquiteturas de rede podemos levar em conta o número de camadas de neurônios. Redes de camada única são redes em que só existe um neurônio entre qualquer entrada e qualquer saída, como pode ser visto na figura 2.2. No caso de haver mais de um neurônio entre alguma entrada e alguma saída, classificamos essa arquitetura como rede de múltiplas camadas como pode ser visto na figura 2.3.

14 FIGURA 2.2 - Rede de camada única. Fonte: Haykin (2009). FIGURA 2.3 - Rede de múltiplas camadas. Fonte: Haykin (2009). As redes neurais artificiais têm capacidade de adquirir, armazenar e utilizar conhecimento experimental. Para adquirir esse conhecimento, a aprizagem pode ser feita de forma supervisionada ou não supervisionada.

15 Para Marsland (2009), o aprizado supervisionado se dá, quando é fornecido um conjunto de exemplos com as respostas corretas e, com base nesse conjunto de treinamento, o algoritmo generaliza para responder corretamente todas as entradas possíveis. E no aprizado não supervisionado, as respostas corretas não são fornecidas, então o algoritmo tenta identificar similaridades nas entradas. E as entradas que possuírem alguma similaridade são colocadas em uma mesma categoria. No aprizado supervisionado as entradas e saídas desejadas são dadas para a rede por um supervisor externo. O objetivo é ajustar os parâmetros da rede a fim de encontrar uma relação entre os pares de entrada e saídas fornecidos. Na figura 2.4, tem-se o esquema de funcionamento de um aprizado supervisionado. Pela figura vê-se que a diferença entre o valor de saída calculado pela rede neural e o valor desejado é realimentado na rede a fim de que os pesos sinápticos dos neurônios sejam atualizados, atingindo o valor mais próximo possível do que se deseja. FIGURA 2.4 - Esquema de aprizado supervisionado. Fonte: Braga, Ludemir e Carvalho (2000). No aprizado não supervisionado, como é sugerido pelo nome, não existe um supervisor externo. Dessa forma os pesos sinápticos dos neurônios são atualizados conforme a rede consegue detectar padrões do ambiente, levando em conta a similaridade dos dados na camada de entrada. Na figura 2.5 tem-se o esboço do funcionamento de um aprizado não supervisionado. FIGURA 2.5 - Esboço do funcionamento de um aprizado não supervisionado. Fonte: Braga, Ludemir e Carvalho (2000).

16 2.2 Mapas auto-organizáveis Os mapas auto-organizáveis, conhecidos também como Self-Organizing Maps (SOM), é um tipo de rede neural com aprizado não supervisionado desenvolvido por Teuvo Kohonen em 1988. Kohonen, ao desenvolver esse tipo de rede levou em consideração como sinais sensoriais são mapeados no córtex cerebral (Marsland, 2009). Sabe-se que nosso cérebro possui áreas que são responsáveis por funções específicas. Observa-se que os neurônios estão especialmente ordenados dentro dessas áreas, e, assim neurônios topologicamente próximos tem a responder padrões ou estímulos semelhantes (Braga, Ludemir e Carvalho, 2000). A rede SOM procura identificar padrões semelhantes nas entradas, assim quando um determinado padrão P é a entrada da rede, a mesma procura a unidade mais semelhante com P. Durante o treinamento, a rede aumenta a semelhança do neurônio escolhido e dos seus vizinhos com o padrão P. Dessa maneira a rede constrói um mapa topológico onde os nodos que estão mais próximos correspondem de forma semelhante aos padrões de entrada semelhantes. Algumas características importantes dos mapas auto-organizáveis são a sua não-linearidade, a redução da dimensionalidade, a identificação de agrupamentos ou clusterização e a sua técnica competitiva de aprizagem. A redução da dimensionalidade permite que um sinal de entrada de dimensão arbitrária se transforme em um mapa discreto de uma ou duas dimensões. A aprizagem competitiva se dá com os neurônios de saída da RNA competindo entre si para serem ativados, com o resultado de que apenas um neurônio de saída (ou um neurônio por grupo) esteja "ligado" a qualquer instante. O neurônio de saída que vence a competição é chamado neurônio vencedor, so esse o que mais se assemelha a um determinado grupo de dados de entrada e por isso ele permanece ativado e tem seu peso atualizado.

17 2.2.1 Topologia da rede Segundo Braga, Ludemir e Carvalho (2000), na rede SOM, os nodos se organizam em uma grade ou reticulado, geralmente bidimensional, podo por vezes ser unidimensional. Também são encontradas, embora raramente, grades de três ou mais dimensões. Tomando como objeto de estudo a grade de bidimensional é possível termos duas opções de inicialização: hexagonal ou retangular. A figura 2.6 ilustra as duas alternativas, na topologia retangular vemos que cada nó possui quatros nodos vizinhos e na configuração hexagonal, cada neurônio possui outros seis a sua volta. FIGURA2.6 - Mapas topológicos, hexagonal e retangular. O algoritmo responsável pela formação do mapa pode ser dividido em quatro etapas, so a primeira a inicialização do mapa, seguido de três processos essenciais que são o processo competitivo, o processo cooperativo e a adaptação sináptica. Uma breve descrição dos mesmos será dada na sequência. 2.2.2 Processo de competição A rede SOM utiliza uma tática de competição entre neurônios que funciona da seguinte maneira: dado um conjunto de dados de entrada, o neurônio com maior ativação àquele conjunto é declarado o neurônio vencedor, portanto somente ele terá uma adaptação sináptica

18 completa. Um algoritmo é utilizado para declarar o neurônio vencedor, cujo funcionamento será detalhado abaixo. Seja m a dimensão dos dados de entrada, selecionando-se aleatoriamente um padrão de entrada representado por. (2.1) A dimensão do vetor de pesos sinápticos de qualquer neurônio é a mesma dos dados de entrada, o vetor peso sináptico do neurônio j é representado por (2.2) Para determinar o neurônio vencedor é usado como parâmetro o produto interno para todo j de 1 a k, logo o neurônio que possuir maior ativação a certo conjunto de entrada é o que terá maior produto interno. Segundo Haykin (2009) o critério de para determinar qual vetor de entrada X que mais se aproxima dos pesos sinápticos, baseado no na maximização do produto interno é matematicamente equivalente a minimizar a distância Euclidiana entre os vetores e. Então é possível usar o índice ( )para identificar qual neurônio mais se aproxima do padrão de entrada, que é representado por ( ) (2.3) 2.2.3 Processo de cooperação Em uma rede SOM o processo de cooperação consiste em atualizar além do neurônio vencedor, os pesos sinápticos da vizinhança ao seu redor. Após a determinação do neurônio vencedor ele é definido como o centro da vizinhança a ser atualizada, e à medida que o raio da

19 vizinhança aumenta, menor é o fator de atualização dos pesos, esse fator decresce até atingir zero para neurônios muito distantes. Pode ser utilizada qualquer função para descrever a atualização dos pesos da vizinhança, desde que essa função satisfaça as condições de decrescer conforme a distância até o neurônio vencedor e aumente e seja simétrica em relação ao centro da vizinhança. Segundo Haykin (2009) uma boa escolha para a função de vizinhança é a função gaussiana que é representada por ( ) (2.4) Onde é a distância entre neurônio e o neurônio vencedor e é a largura efetiva da vizinhança topológica como ilustrada na figura 2.7. FIGURA 2.7 - Função de vizinhança gaussiana. Uma característica única do algoritmo SOM é que o tamanho da vizinhança topológica da vizinhança encolhe com o tempo. Para que isso aconteça, a largura da função vizinhança deve decrescer com o tempo. Uma maneira para a depência de no tempo discreto é o decaimento exponencial descrito por

20 ( ) ( ) (2.5) So o valor de na inicialização do algoritmo, o tempo discreto e uma constante de tempo. Dessa maneira uma nova função de vizinhança que ata esses requisitos é representada por ( ( ) ) (2.6) 2.2.4 Processo adaptativo No processo adaptativo, os vetores de pesos sinápticos do neurônio vencedor e de sua vizinhança são atualizados de forma a se aproximarem do padrão de entrada apresentado, respeitando a relação de vizinhança definida durante o processo de cooperação. O valor no tempo ( ) é dado por ( ) ( ) ( ) ( ) ( ) (2.7) So ( ) chamado de taxa de aprizagem e decresce com o tempo discreto conforme ( ) ( ) (2.8) Onde é o valor inicial para o parâmetro taxa de aprizagem e uma constante de tempo.

21 É possível dividir o processo adaptativo em duas fases distintas: primeiramente uma fase de ordenação seguida por uma fase de convergência. É durante a primeira fase que ocorre a ordenação dos pesos sinápticos. Na fase de ordenação é necessário realizar escolhas dos parâmetros, razão de aprizado e das constantes de tempo e. Esses parâmetros devem ser escolhidos de maneira a fazer com que a taxa de aprizagem decresça gradualmente com o tempo, mas permaneça em um valor acima de 0,01 e a função de vizinhança inclua inicialmente quase todos os neurônios da grade e diminua, para no final conter apenas alguns neurônios vizinhos ao redor do neurônio vencedor. Segundo Haykin (2009) essa fase pode exigir 1000 interações ou mais, e para alcançar os objetivos expostos acima se deve escolher os seguintes valores para os parâmetros:, e. Na fase de convergência é feito o ajuste fino dos neurônios da grade e a representação efetiva dos dados de entrada. Para Haykin (2009), o número mínimo de interações para essa fase deve ser de 500 vezes o número de neurônios da grade. O parâmetro taxa de aprizagem deve se manter num valor superior a ordem de 0,01, pois ao se aproximar de zero o mapa pode atingir um estado que não se atualize mais e nem represente os dados de entrada. A função vizinhança deve conter apenas os vizinhos mais próximos do neurônio vencedor, ou somente o próprio. O algoritmo SOM pode ser resumido em 5 etapas segundo Haykin (2009): 1. Inicialização: escolha dos pesos sinápticos de todos os neurônios para o tempo discreto. Usualmente a inicialização é feita de modo aleatório; 2. Amostragem: retirada de um conjunto de dados do espaço de entrada e alimentação do mesmo no processo de competição; 3. Determinação do neurônio vencedor: determinar qual neurônio tem a maior ativação para o conjunto de dados alimentados pela menor distância euclidiana. Essa etapa corresponde ao processo de competição; 4. Atualização: os pesos sinápticos do neurônio vencedor e de seus vizinhos são atualizados conforme a equação 2.7. Corresponde ao processo adaptativo;

22 5. Continuação: volta ao passo de amostragem até que não sejam observadas mudanças significativas no mapa. 2.3 Transformador de Potência Para determinar a concentração dos gases dissolvidos no óleo mineral isolante do transformador é feita uma análise cromatográfica do mesmo. A formação desses gases no interior do transformador pode causar alguns tipos de problemas como mau contato entre componentes internos e fugas de energia entre espiras (Datalink, 2011). To em vista esse cenário, diversos trabalhos foram desenvolvidos a respeito da detecção de falhas através da concentração desses gases, e a aplicação da rede SOM em diversos cenários. Alguns desses trabalhos estão listados a seguir: Em Zhang et al. (1996), foi apresentado o desenvolvimento de uma rede neural que utiliza dois passos para detecção de falhas no transformador de potência através da concentração de gases dissolvidos em seu óleo refrigerante. A rede é usada tanto em casos onde a celulose está envolvida como em casos em que não. Nesse trabalho vários recursos foram avaliados e várias topologias de rede foram consideradas. A abordagem em duas fases fez com que a rede neural se tornasse mais fácil de ser treinada e mais precisa na detecção de falhas. Em Duval (2002) é apresentada uma lista codificada de falhas detectáveis pela análise de gases dissolvidos em transformadores de potência. To isso como base, é proposto uma maneira mais amigável de análise dessas faltas, utilizando uma ferramenta gráfica. Esse método gráfico é proposto através da representação de um triângulo que é separado em zonas, so essas, delimitadas através da coordenadas da figura. Desse modo é possível ter uma visualização facilitada do tipo de falha e também é possível realizar a comparação entre diferentes casos. Em Morais e Rolim (2006), foi descrito o desenvolvimento e a implementação de uma ferramenta para o diagnóstico de falhas em transformadores de potência através da análise dos gases dissolvidos no óleo. A abordagem computacional é baseada na

23 utilização combinada de critérios tradicionais utilizados nesse tipo de análise, juntamente com uma rede neural artificial e um sistema de lógica fuzzy. O objetivo dessa ferramenta é prover ao usuário com uma resposta obtida a partir análise não só dos métodos tradicionais já consolidados na literatura técnica, mas também através de técnicas de inteligência artificial aplicadas, atingindo um grau elevado de confiabilidade. Os resultados obtidos com esta ferramenta foram promissores no diagnóstico de falhas incipientes em transformadores, atingindo níveis de sucesso de mais de 80%. Em Aguado et al. (2008) a técnica de SOM e de PCA foram aplicadas para a análise de dados multidimensionais na remoção de fósforo biológico de águas residuais. As duas técnicas apresentaram resultados muito bons em relação à interpretação dos dados, to a técnica SOM apresentado uma vantagem sobre o PCA por ter uma estratégia apta a lidar com problemas não-lineares e também por lidar diretamente com as variáveis originais. Em Naresh, Sharma e Vashisth (2008), foi apresentada uma nova forma de detecção de falhas incipientes em transformadores de potência. A abordagem apresentada utiliza a aprizagem competitiva em um primeiro momento para diminuir a dimensão dos dados de entrada. Após isso utiliza uma rede neural fuzzy para a identificação das falhas. Em comparação com os resultados obtidos pelos métodos convencionais existentes, o método proposto demonstrou possuir um desempenho superior em identificar falhas no transformador. Em Chen et al. (2009), foi proposto um estudo comparativo da eficácia de redes Wavelet (WNs) para a detecção de falhas incipientes de transformadores de potência. As redes Wavelet são um modelo de processamento de sinal não-linear desenvolvidos nos últimos anos. Um grupo de amostras de concentração de gases foi submetido a uma rede Fuzzy e seus resultados foram comparados aos de cinco WNs cujo mesmo grupo de amostra foi utilizado. Muitos exemplos de diagnóstico mostraram que a precisão do diagnóstico e eficiência das propostas cinco abordagens WN prevaleceu às do método convencional de back-propagation da rede Fuzzy e, portanto se mostraram mais adequados para diagnóstico de falhas em transformadores de potência.

24 Em Ouzounoglou et al. (2010) foi implementada uma nova técnica de identificação de impressões digitais. Para realizar a identificação de uma impressão é necessário que essa impressão tenha sido previamente armazenada em um banco de dados. Então utiliza-se um algoritmo de comparação, entre a impressão fornecida e aquelas que se encontram no banco de dados, a fim de achar a sua correspondente. Os algoritmos comumente utilizados levam em conta as seguintes características da impressão: Características que são globais de uma impressão digital como o fluxo de cume; Características que se referem a minúcias, como bifurcações, cume e terminações; Características que incluem todos os atributos dimensionais da crista como caminho do cume, desvio, largura, forma, poros, contornos de borda, pausas e cicatrizes. Para esse trabalho foi desenvolvido um algoritmo de comparação utilizando a técnica SOM que usa como base de comparação somente as características que se referem a minúcias da impressão digital. Em Fuertes et al. (2010) foi utilizada a técnica de SOM para visualizar operações de multiestado. O método proposto identifica os clusters presentes na operação e a probabilidade de transição entre eles usando a trajetória seguida pelos dados alimentados ao sistema no mapa 2D. Um novo método de detecção e identificação de falhas também foi proposto. Os métodos foram aplicados na supervisão de uma planta real com 26 variáveis. Em Castanheira et al. (2011), foi apresentado um estudo comparativo da aplicação do Perceptron Multi-camada via algoritmo Rprop e árvores de decisão na classificação de falhas incipientes em transformadores de potência. Os procedimentos propostos foram aplicados a bases de dados reais derivadas dos ensaios cromatográficos de transformadores de potência. Em David e Rajaram (2012) é apresentada uma nova ferramenta gráfica para visualização e classificação de falhas detectáveis pela análise de gases dissolvidos, em transformadores de potência. É proposta a utilização de um hexágono composto por

25 um número de polígonos onde cada polígono representa uma determinada falha. Através de método é possível determinar visualmente a evolução de uma falha. O resultado experimental confirma a eficácia do algoritmo do hexágono, portanto, é útil para o controle e proteção de falhas, dando mais confiabilidade do sistema de fornecimento de energia.

26 3 DESENVOLVIMENTO Neste capítulo serão apresentadas todas as etapas realizadas para a criação e utilização da ferramenta. Para melhor visualização essas foram etapas dividas em: Escolha do software; Base de dados; Pré-processamento de dados; Inicialização e treinamento; Visualização; Validação; Medidas de qualidade. 3.1 Escolha do Software Para aplicação da técnica dos mapas auto-organizáveis escolheu-se trabalhar com o programa MATLAB, por se mostrar uma ferramenta bastante útil no trabalho com matrizes. No MATLAB foi criado um algoritmo que realiza a leitura dos dados de entrada, o treinamento e a validação do mapa, e após esses processos, o mapa treinado é submetido a novos dados para verificar a acurácia da rede treinada. Para gerar o código no MATLAB foi utilizado um toolbox chamado SOM Toolbox. O Som Toolbox é uma ferramenta computacional desenvolvida na Universidade da Finlândia pela equipe de pesquisas em Mapas Auto-Organizáveis. Trata-se de uma ferramenta de fácil utilização e muito versátil, so possível utilizá-la desde o processamento de dados até a visualização dos resultados de forma bem ágil. O toolbox está disponível para download em http://www.cis.hut.fi/somtoolbox/. O toolbox possui uma vasta biblioteca com funções que abrangem todos os processos de criação e implementação de uma rede SOM. Algumas das funções servem para normalizar os dados de entrada, de maneira que a diferença de grandezas entre as variáveis de entrada não influenciem de maneira negativa na fase de treinamento. O toolbox também permite que outras características sejam modificadas, como o número de neurônios treinados pelo mapa, treinamento sequencial ou em batelada, inicialização do mapa topológico hexagonal ou

27 retangular, função da vizinhança utilizada, inicialização dos pesos sinápticos, aleatória ou linear, entre outras. A fase de treinamento do mapa pode ser realizada em duas etapas: primeiro a etapa de convergência com todos os dados e depois escolher um conjunto para a etapa de sintonia fina, representando-o assim de forma mais exata. 3.2 Base de dados O sistema de diagnóstico é baseado na análise dos gases dissolvidos em óleo e foi desenvolvido a partir de dados de transformadores faltosos derivado do banco de dados do IECTC10. A base de dados possui 51 amostras, destas 35 foram utilizadas para o treinamento do mapa, dividas em 11 amostras para transformadores com funcionamento normal, 15 para transformadores que apresentavam falha elétrica e as 9 amostras restantes se tratavam de transformadores que apresentavam falha térmicas. Para a fase de validação foram usadas as 16 amostras restantes, que estavam dividas em 5 amostras para transformadores normais, 7 para transformadores com falha elétrica e 4 para transformadores com falha térmica. Essas quantidades foram estabelecidas para manter a mesma proporção entra as amostras na fase de treinamento e na fase de validação. Além da base IEC, foram usadas mais duas bases, que foram intituladas Base 1 e Base 2. A Base 1 possui 224 amostras dividas em 83 para funcionamento normal, 61 para falha elétrica e 80 para falha térmica. Já a Base2 possui 232 amostras separadas em 191 para funcionamento normal, 13 para falha elétrica e 28 para transformadores com falha térmica. Para todas as amostras utilizou-se o mesmo critério apresentado em (Castanheira, 2008), so 70% da base de dados para treinamento e os outros 30% para a validação da rede treinada. Tanto os dados de treinamento quanto os dados de validação são os mesmo que foram utilizados em (Castanheira, 2008). Os dados apresentados no capítulo de desenvolvimento foram obtidos a partir do treinamento da rede utilizando a base de dados IEC.

28 Para poder fazer uso desses dados foi necessário adequar a base para o formato que pudesse ser reconhecido pelo toolbox. A primeira linha da base de dados deve conter o número de variáveis, a segunda linha deve conter os nomes das variáveis precedidos de #n. Para cada amostra de dados é possível inserir labels ou rótulos que podem facilitar a análise dos dados após o treinamento. Os rótulos que determinam a classe na qual a amostra pertence são desconsiderados pelo algoritmo na fase de treinamento. Abaixo temos alguns exemplos da base utilizada. TABELA 3.1: Base de dados IEC com algumas amostras. Dados de transformadores faltosos Gases H 2 CH 4 C 2 H 2 C 2 H 4 C 2 H 6 Diagnóstico 27,68562 19,37993 2,768562 47,06555 19,37993 Normal 17,09484 50,3848 1,799457 26,99186 44,98643 Normal 19,21514 12,81009 0,960757 19,21514 16,01262 Normal 43,08088 8,616177 14,93471 8,041765 4,020883 Falha Elétrica 34,29765 2,858137 12,00418 12,00418 1,143255 Falha Elétrica 896,3717 236,0446 193,0187 236,0446 16,73227 Falha Elétrica 349,0209 1465,888 0,83765 1884,713 668,724 Falha Térmica 92,12102 216,4844 5,527261 188,8481 48,36353 Falha Térmica 0,189232 94,30041 2,113086 822,4005 945,8426 Falha Térmica 3.2.1Pré-processamento de dados O treinamento de um mapa auto-organizável é influenciado principalmente pelos dados de entrada, so a escolha desses dados de fundamental importância. Após a escolha da base de dados é importante realizar a normalização das variáveis em uma mesma escala, pois o algoritmo utilizado pelo toolbox utiliza a distância euclidiana entre vetores. Logo, uma diferença de grandeza entre os dados de entrada podem impactar no mapa. Para realizar o pré-processamento foi utilizada uma função de normalização do SOM Toolbox que utiliza um logaritmo natural em sua operação, cuja expressão é dada a seguir

29 ( ) (3.1) so a linha a ser normalizada e o valor mínimo dos valores de. Na tabela abaixo temos os valores originais da primeira linha da base de dados IEC, e os valores após sofrerem a normalização. É possível ver que existia antes da normalização uma grande discrepância entres os valores. TABELA3.2: Medidas originais e normalizadas. Medidas Originais Medidas normalizadas 43,1029; 43,1029; 5,468; 14,4749;50.5012 3,7481; 3,7553; 1,8484; 2,684;3.9203 3.3 Inicialização e Treinamento Para realizar o treinamento do mapa, é necessário antes definir os pesos sinápticos iniciais dos neurônios. Neste trabalho essa inicialização se deu de forma linear. Após os dados carregados, normalizados e os pesos inicializados, é possível realizar o treinamento do mapa. O treinamento foi feito em duas etapas. Primeiramente foi realizada a etapa de convergência e depois a de refino. A etapa de convergência foi realizada com um raio de vizinhança maior e com mais épocas de treinamento, o raio inicial estabelecido foi de três neurônios ao redor do neurônio vencedor e o raio final de apenas um, utilizando 1300 épocas de treinamento. Já a etapa de refino foi feita com um raio de vizinhança reduzido e com poucas épocas de treinamento. O raio inicial estabelecido foi de um neurônio ao redor do neurônio vencedor e o raio final de apenas o próprio neurônio vencedor, utilizando 100 épocas de treinamento. Além dos parâmetros de épocas de treinamento e raio de vizinhança é possível também definir o tamanho do mapa e a topologia do mesmo. Para o presente trabalho foi escolhida a topologia hexagonal de neurônios. O tamanho definido para o mapa foi uma matriz de 5x16

30 neurônios, por representar melhor as regiões e possibilitar uma classificação mais fácil. A seguir será apresentado um estudo mais detalhado que justifica a escolha do tamanho do mapa. 3.4 Visualização Um dos recursos utilizados para visualização de um mapa treinado por SOM é a matriz-u. A equação 3.2 rege a construção da matriz e cada distância calculada é associada uma cor. A representação dos neurônios é feita por hexágonos, so o centro de cada hexágono a localização do neurônio e regiões de cor referentes a baixas distâncias podem ser interpretadas como clusters. ( ( ) ( )) ( ) (3.2) Na equação 3.2, representa o valor exibido na matriz-u, ( ( ) ( )) é a distância entre o vetor peso sináptico do neurônio e do neurônio e ( )) o conjunto de neurônios vizinhos a. Um fator determinante para a criação da rede é o tamanho do mapa. Abaixo são mostrados três matrizes de neurônios com tamanhos diferentes, so que o menor dos mapas possui uma matriz de 3x8 neurônios, o mapa médio possui uma matriz de 5x16 e o mapa grande possui uma matriz de 10x32. Todos os mapas foram submetidos à mesma base de dados e ao mesmo tipo de treinamento.

31 FIGURA 3.1 - Matrizes-U para diferentes mapas. (1) pequeno, (2) médio e (3) grande. Analisando a figura 3.1 é possível ver claramente que o tamanho do mapa é um fator determinante para a posterior caracterização do mesmo. O menor dos mapas não consegue separar adequadamente as regiões e acaba fundindo diferentes regiões de operação no mesmo lugar, dificultando ou até impossibilitando a análise. O mapa médio começa a delimitar melhor as regiões de operação e o mapa grande acaba por ter uma separação exagerada das regiões criando clusters muito grandes, que são representados pelas regiões azuis.com base nisso escolheu-se o mapa de tamanho médio.

32 FIGURA 3.2 - Matriz-U do mapa de tamanho 5x16. A seguir, na Figura 3.3 pode ser vista a visualização em 3D para a matriz U, dessa vez com uma componente vertical representando as distâncias entre um neurônio e seus vizinhos. FIGURA 3.3 - Matriz-U em 3 dimensões para o mapa de tamanho 5x16. É possível ver claramente a delimitação das regiões na representação 3D da Figura 3.3. A base de dados contempla dados de três tipos de funcionamento de transformadores, logo é possível ver que o mapa treinado corresponde ao esperado, por gerar três regiões de clusterização. 3.5 Validação Após o mapa ter completado o seu treinamento, foram inseridos novos dados a fim de verificar a acurácia do mesmo. Foram separados 30% da base de dados original para serem utilizadas na fase de validação.

33 Na validação não ocorre nenhum tipo de mudança no mapa, os novos valores são inseridos e para cada novo dado de entrada é determinado o neurônio vencedor. Após identificado o neurônio vencedor, é verificado a região onde o mesmo se encontra para poder determinar o tipo de falha que o transformador apresenta ou se seu funcionamento é normal. 3.6 Medidas de qualidade Os mapas auto-organizáveis são propriamente definidos na fase de treinamento. Durante essa fase, deve-se supor diversos parâmetros para o mapa, tais como parâmetros de aprizagem, topologia do mapa e tamanho do mapa. Essas características influenciam na sua concepção final. Logo, as escolhas desses parâmetros devem ser feitas de maneira cuidadosa a fim de se atingir o mapa apropriado. Uma vez que foram testadas diferentes escolhas, é possível utilizar certas medidas para verificar a qualidade do mapa e selecionar os melhores valores para representar os dados. Uma das ferramentas de qualidade se chama Erro Médio de Quantização (Quantization Error - QE), que representa a média das distâncias entre cada vetor de dados de entrada e o correspondente vetor de pesos do neurônio vencedor. É interessante que o valor de QE seja pequeno, pois dessa maneira, menor será a distância entre o vetor dos dados e o vetor de pesos do neurônio vencedor. Essa medida é regida pela equação a seguir (3.3) Onde é o número de vetores de entrada e é o vetor de pesos do neurônio vencedor correspondente a, que é o vetor de entrada. Outra medida também usada é o Erro Topográfico (Topographic Error TE), que quantifica a capacidade do mapa em representar a topologia dos dados de entrada, e quanto menor for o valor de TE, mais o mapa consegue preservar sua topologia. Essa medida é calculada segundo a equação 3.4,

34 (3.4) Onde é o número de vetores de entrada e é 1 se possui os dois primeiros neurônios vencedores adjacentes e 0 caso contrário. A medida QE corresponde à resolução do mapa, so que o erro de representação diminui com o aumento do número de neurônios do arranjo, ou seja, é inversamente proporcional ao número de neurônios. Se o mapa possuir um número elevado de neurônios ou se sofrer um processo de treinamento onde o raio de vizinhança torna-se menor ou igual a 1 durante boa parte do treinamento, pode ocorrer de os neurônios se posicionarem sobre os objetos a serem representados, fazo assim QE = 0. Porém quando essa situação ocorre, o arranjo pode estar bastante retorcido, perdo a capacidade de representar a topologia dos dados (aumentando TE). O comportamento de TE também depe do número de neurônios disponíveis no arranjo, so que o mesmo cresce quando há poucos neurônios no mapa. Para o mapa treinado utilizando a base de dados IEC os valores de QE e TE foram respectivamente 0.78 e 0.00. Utilizando a Base 1 para o treinamento os valores de QE e TE foram respectivamente 1.16 e 0.01 e com a Base 2 valores de QE e TE foram respectivamente 0,85 e 0.02. Os valores atingidos com a base de dados IEC foram mais satisfatórios por se tratar da base de dados mais balanceada e por possuir um baixo número de amostras. Assim o mapa teve mais facilidade de representar a topologia dos dados.

35 4 RESULTADOS E DISCUSSÕES Para a classificação de defeitos incipientes em transformadores de potência em relação às concentrações dos gases, foram realizadas diversas tentativas de arranjo para se estabelecer o modelo que fornecesse a melhor taxa de acerto. O modelo que, segundo os testes, obteve melhor resposta apresenta uma topologia de mapa hexagonal, com uma matriz de neurônios de 5x16. Seu treinamento foi feito em duas etapas uma para a convergência do mapa, seguida pela etapa de refino. Na primeira análise, foi usada a base de dados IEC para treinamento e validação. Após a rede estar treinada, foram inseridas as Bases 1 e 2 para verificar a eficácia da rede para realizar os diagnósticos. Seguindo o modelo publicado em (Castanheira, 2008), são apresentados os resultados globais e os resultados separados por diagnósticos dos transformadores. TABELA 4.1: Comparação dos índices de concordância percentual global para a base desbalanceada (IEC). Rede Neural Rede SOM Índice de concordância (%) Índice de concordância (%) Geração da rede Diagnóstico Geração da rede Diagnóstico (IEC) (IEC) Trein. Valid Base1 Base 2 Trein. Valid Base1 Base 2 95,4 68,8 50,9 52,6 85,7 56,3 31,7 7,8 TABELA 4.2: Comparação dos índices de concordância percentual discriminado por tipo de defeito para a base desbalanceada (IEC). Defeitos Rede Neural Rede SOM Índice de Concordância (%) Índice de Concordância (%) Geração da rede (IEC) Diagnóstico Geração da rede (IEC) Diagnóstico Trein. Valid Base1 Base 2 Trein. Valid Base1 Base 2 Normal 98,8 98,6 42,8 51,1 100,0 60,0 12,5 0,5 Def. Elétrico 90,5 46,8 49,9 71,5 93,0 71,4 57,4 30,8 Def. Térmico 99,0 98,0 65,6 61,1 77,8 25,0 32,5 46,4

36 Para a segunda análise foi usada a base de dados Base 1 para treinamento e validação, após a rede estar treinadas foram inseridas as bases IEC e Base 2 para verificar a eficácia da rede para realizar os diagnósticos. TABELA 4.3: Comparação dos índices de concordância percentual global para a base desbalanceada (Base 1). Rede Neural Rede SOM Índice de concordância (%) Índice de concordância (%) Geração da rede Diagnóstico Geração da rede Diagnóstico (Base 1) (Base 1) Trein. Valid IEC Base 2 Trein. Valid IEC Base 2 91,6 66,3 57,7 52,8 81,1 69,6 74,5 28,5 TABELA 4.4: Comparação dos índices de concordância percentual discriminado por tipode defeito para a base desbalanceada (Base 1). Defeitos Rede Neural Rede SOM Índice de Concordância (%) Índice de concordância (%) Geração da rede (Base1) Diagnóstico Geração da rede (Base 1) Diagnóstico Trein. Valid IEC Base 2 Trein. Valid IEC Base 2 Normal 93,9 54,1 63,1 63,6 83,8 77,8 50,0 28,5 Def. Elétrico 91,9 60,3 82,8 78,7 87,3 83,3 100,0 92,3 Def. Térmico 87,8 76,1 21,3 12,1 77,8 50,0 61,5 0,0 Para terceira análise foi usada a base de dados Base2 para treinamento e validação. Após a rede estar treinada, foram inseridas as bases IEC e Base 1 para verificar a eficácia da rede. No trabalho realizado por (Castanheira, 2008), essa análise não ocorreu. Portanto não foi possível estabelecer um comparativo. Nas Tabelas 4.5 e 4.6 estão presentes, respectivamente, o índice de concordância percentual global para a base desbalanceada e o índice de concordância percentual discriminado por tipo de defeito para a base desbalanceada.

37 TABELA 4.5: Índice de Concordância Percentual global para a base desbalanceada (Base 2). Rede SOM Índice de concordância (%) Geração da rede (Base 2) Diagnóstico Trein. Valid. IEC Base 1 87,7 82,6 43,1 46,4 TABELA 4.6: Índice de Concordância Percentual discriminado por tipo de defeito para a base desbalanceada (Base 2). Rede SOM Índice de concordância (%) Defeitos Geração da rede (Base2) Diagnóstico Trein. Valid IEC Base 1 Normal 97,8 100,0 100,0 98,8 Def. Elétrico 33,3 0,0 27,3 32,8 Def. Térmico 45,0 0,0 0,0 2,5 No comparativo entre os resultados obtidos neste trabalho e os obtidos por (Castanheira, 2008), foi possível perceber que a rede SOM apresentou um desempenho inferior a PMC. A rede SOM é muito depente da base de dados por ser um modelo de rede neural de aprizado não supervisionado. Portanto uma base de dados não balanceada ou com poucas amostras pode ser a causa dos resultados insatisfatórios. Ao analisarmos as bases de dados, a base IEC, é a que possui maior confiabilidade por ter respaldo de uma comissão internacional. Porém possui poucas amostras o que pode diminuir a capacidade de generalização do mapa que foi treinado por ela. Os melhores resultados apresentados foram obtidos nos testes onde a rede foi treinada com a Base1, por se tratar de uma base que possui um maior número de amostras e por ser balanceada, o que permitiu uma boa capacidade de generalização da rede. Já os teste feitos com o mapa que foi treinado com a Base2 foram os que apresentaram os piores resultados. Uma possível explicação para isso seria o fato de que apesar dessa base de dados possuir muitas amostras, ela é extremamente desbalanceada, pois 82% da base de dados é composta por amostras do tipo funcionamento normal do transformador.