Diagnóstico de Imagens de Ressonância Magnética quanto a presença de Esclerose Múltipla por meio de Redes Neurais Artificiais



Documentos relacionados
PALAVRAS-CHAVE: Massas Nodulares, Classificação de Padrões, Redes Multi- Layer Perceptron.

29/08/2011. Radiologia Digital. Princípios Físicos da Imagem Digital 1. Mapeamento não-linear. Unidade de Aprendizagem Radiológica

MLP (Multi Layer Perceptron)

Aprendizagem de Máquina

Figura 5.1.Modelo não linear de um neurônio j da camada k+1. Fonte: HAYKIN, 2001

Aula 2 RNA Arquiteturas e Treinamento

Projeto de Redes Neurais e MATLAB

Matlab - Neural Networw Toolbox. Ana Lívia Soares Silva de Almeida

3 Metodologia de Previsão de Padrões de Falha

Análise e visualização de dados utilizando redes neurais artificiais auto-organizáveis

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

SEGMENTAÇÃO DE IMAGENS EM PLACAS AUTOMOTIVAS

CorelDRAW UM PROGRAMA DE DESIGN

Modelos Pioneiros de Aprendizado

3 Classificação Resumo do algoritmo proposto

Processamento de Imagem. Prof. MSc. André Yoshimi Kusumoto

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas

Complemento II Noções Introdutória em Redes Neurais

Redes Neurais Construtivas. Germano Crispim Vasconcelos Centro de Informática - UFPE

RECONHECIMENTO DE PLACAS DE AUTOMÓVEIS ATRAVÉS DE CÂMERAS IP

Inteligência Artificial. Redes Neurais Artificiais

UNIVERSIDADE FEDERAL DE SANTA CATARINA

4 Avaliação Experimental

Nathalie Portugal Vargas

DESENVOLVIMENTO DE UM SOFTWARE NA LINGUAGEM R PARA CÁLCULO DE TAMANHOS DE AMOSTRAS NA ÁREA DE SAÚDE

Redes Neurais. Mapas Auto-Organizáveis. 1. O Mapa Auto-Organizável (SOM) Prof. Paulo Martins Engel. Formação auto-organizada de mapas sensoriais

VISUALIZAÇÃO VOLUMÉTRICA DE EXAMES DE RESSONÂNCIA MAGNÉTICA DA MAMA

Desenvolvimento do Módulo de Pré-processamento e Geração de Imagens de. Imagens de Teste do Sistema DTCOURO

Radiology: Volume 274: Number 2 February Amélia Estevão

MINERAÇÃO DE DADOS PARA DETECÇÃO DE SPAMs EM REDES DE COMPUTADORES

IW10. Rev.: 02. Especificações Técnicas

IN Redes Neurais

5 Extraindo listas de produtos em sites de comércio eletrônico

PROF. DR. JACQUES FACON

Tecnologia em Gestão Pública Desenvolvimento de Projetos - Aula 9 Prof. Rafael Roesler

UNISINOS - UNIVERSIDADE DO VALE DO RIO DOS SINOS

Do neurônio biológico ao neurônio das redes neurais artificiais

Redes Neurais. Profa. Flavia Cristina Bernardini

Reconhecimento de Padrões Utilizando Filtros Casados

15 Computador, projeto e manufatura

Redes Neurais. A IA clássica segue o paradigma da computação simbólica

TÍTULO: PROPOSTA DE METODOLOGIA BASEADA EM REDES NEURAIS ARTIFICIAIS MLP PARA A PROTEÇÃO DIFERENCIAL DE TRANSFORMADORES DE POTÊNCIA

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

3 Estado da arte em classificação de imagens de alta resolução

PROTÓTIPO DE SOFTWARE PARA APRENDIZAGEM DE REDES NEURAIS ARTIFICIAIS

Capítulo 3. Avaliação de Desempenho. 3.1 Definição de Desempenho

Aprendizagem de Máquina

Identificação de Caracteres com Rede Neuronal Artificial com Interface Gráfica

UBER: Uma ferramenta para realce de microcalcificações mamárias

Glossário Apresenta a definição dos termos, siglas e abreviações utilizadas no contexto do projeto Citsmart.

1.6. Tratamento de Exceções

Aprendizagem de Máquina

CONTROLE DE QUALIDADE e VALIDAÇÃO DE PRODUTO CARTOGRÁFICO

2 Trabalhos Relacionados

Classificação da imagem (ou reconhecimento de padrões): objectivos Métodos de reconhecimento de padrões

5 Resultados Avaliação Baseada na Taxa de Igual Erro

Verificação de Qualidade de Imagens de Fundo de Olho a Partir de Descritores Baseados em Histogramas. Marina Silva Fouto - Reconhecimento de Padrões

ANÁLISE DA CONSERVAÇÃO PÓS-COLHEITA DA ALFACE (Lactuca Sativa, L) UTILIZANDO O SISTEMA DE APOIO À TOMADA DE DECISÃO BKD

Algoritmos Indutores de Árvores de

Prof. Júlio Cesar Nievola Data Mining PPGIa PUCPR

Reconhecimento de marcas de carros utilizando Inteligência Artificial. André Bonna Claudio Marcelo Basckeira Felipe Villela Lourenço Richard Keller

Ensaio de Emissão Acústica Aplicado em Cilindros sem Costura para Armazenamento de Gases

Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados

Seção 2/E Monitoramento, Avaliação e Aprendizagem

3 Metodologia para Segmentação do Mercado Bancário

Módulo 4. Construindo uma solução OLAP

Resultados Experimentais

AMBIENTE PARA AUXILIAR O DESENVOLVIMENTO DE PROGRAMAS MONOLÍTICOS

Abordagem de Processo: conceitos e diretrizes para sua implementação

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka

Relatório da Aula Prática sobre Redes Neurais Artificiais

O que é a ciência de dados (data science). Discussão do conceito. Luís Borges Gouveia Universidade Fernando Pessoa Versão 1.

REDUZINDO AS QUEBRAS ATRAVÉS DA MANUTENÇÃO PROFISSIONAL

¹CPTL/UFMS, Três Lagoas, MS,Brasil, ²CPTL/UFMS, Três Lagoas, MS, Brasil.

PROCESSO DE DESENVOLVIMENTO DE SOFTWARE. Modelos de Processo de Desenvolvimento de Software

Feature-Driven Development

Figura 01: Aplicações do Filtro Espacial Passa-Baixa.

Cálculo de volume de objetos utilizando câmeras RGB-D

Organização e Arquitetura de Computadores I

UFGD FCA PROF. OMAR DANIEL BLOCO 6 CLASSIFICAÇÃO DE IMAGENS

CONCURSO PÚBLICO ANALISTA DE SISTEMA ÊNFASE GOVERNANÇA DE TI ANALISTA DE GESTÃO RESPOSTAS ESPERADAS PRELIMINARES

Dadas a base e a altura de um triangulo, determinar sua área.

Pag: 1/20. SGI Manual. Controle de Padrões

Estudo comparativo entre dois tradicionais algoritmos de roteamento: vetor distância e estado de enlace.

7.Conclusão e Trabalhos Futuros

ESTUDO DE CASO: LeCS: Ensino a Distância

Introdução à Computação

17/10/2012. dados? Processo. Doutorado em Engenharia de Produção Michel J. Anzanello. Doutorado EP - 2. Doutorado EP - 3.

GARANTIA DA QUALIDADE DE SOFTWARE

Aprendizagem de Máquina

PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO DEPARTAMENTO DE INFORMÁTICA PÓS GRADUAÇÃO EM INFORMÁTICA

CAPÍTULO 3 - TIPOS DE DADOS E IDENTIFICADORES

Pós-Graduação em Engenharia Elétrica Inteligência Artificial

4 Segmentação Algoritmo proposto

Setores Trilhas. Espaço entre setores Espaço entre trilhas

Avaliando o que foi Aprendido

2 Atualidade de uma base de dados

Hardware (Nível 0) Organização. Interface de Máquina (IM) Interface Interna de Microprogramação (IIMP)

Transcrição:

Diagnóstico de Imagens de Ressonância Magnética quanto a presença de Esclerose Múltipla por meio de Redes Neurais Artificiais Fillipe Joelson Silva¹; Rita Maria Silva Julia²; Ayres Barcelos³ ¹ ² ³Faculdade de Ciência da Computação Universidade Federal de Uberlândia (UFU) fillip.jsilva@gmail.com, rita@ufu.br, abarcelos@gmail.com Abstract. This paper proposes an automatic method of classifying Magnetic Resonance Images (MRI) in terms of the presence or not of lesions that would indicate the diagnosis of Multiple Sclerosis (MS). To achieve the desired results, two artificial neural networks are used: a Kohonen-SOM, trained without supervision, and a Learning Vector Quantization (LVQ) trained under supervision. The motivation for that is to estimate and to compare the performance of both approaches in the evaluation of diagnosis. Note that, distinct from most related works whose motivation is the automation of the image segmenting process, the contribution here consists of producing the final diagnosis associated with the input images. Resumo. Este artigo propõe um método automático para classificação de Imagens de Ressonância magnética (IRM) quanto à presença ou não de características que indicariam o diagnóstico de Esclerose Múltipla (EM). Para realizar tal tarefa, duas redes neurais artificiais foram usadas: Kohonen-SOM e uma outra baseada em Learning Vector Quantization (LVQ), treinadas sem e com supervisão, respectivamente, de modo a comparar o desempenho do aprendizado de máquina supervisionado e sem interferência humana. Note que, diferentemente da maioria dos trabalhos correlatos cuja motivação é automatizar o processo de segmentação das imagens, a contribuição aqui consiste em produzir como saída o diagnóstico final associado às imagens de entrada. 1. INTRODUÇÃO Esclerose Múltipla (EM) é uma doença inflamatória e desmielinizante do sistema nervoso central (SNC) que afeta principalmente adultos jovens. É considerada uma doença auto-imune no qual o sistema imunitário reconhece erroneamente a bainha de mielina do SNC como um elemento externo e então o ataca, resultando em inflamação e danos. Em cada indivíduo a EM se manifesta com diferentes sintomas, que variam dependendo das zonas afetadas no SNC, tais sintomas são não permanentes no primeiro momento e, quando a pessoa percebe, geralmente, a doença se encontra em fase mais adiantada, o que torna a investigação difícil. No primeiro trimestre do ano de 2007, o Sistema Único de Saúde (SUS) realizou 544 internações decorrentes da doença. Em 2006, o total de assistências foi de 2.328 [1]. Imagens de Ressonância Magnética (IRM) têm sido usadas clinicamente com muito sucesso para o diagnóstico e monitoramento da EM devido a suas excelentes propriedades, como alta resolução e boa diferenciação de tecidos moles, além de permitir

a obtenção de diferentes informações de contrastes [2] [3]. O método tradicional da análise de tais imagens baseia-se no delineamento manual de áreas de interesse em IRM por especialistas. Este procedimento é caro, requer muito tempo e os resultados podem variar de acordo com o observador. Este fato tem motivado a proposição de vários métodos automáticos e semi-automáticos para facilitar a detecção de anomalias em IRM. Neste contexto, este artigo propõem dois métodos automáticos para detectar a presença de EM em IRM. Ambos os métodos utilizam redes neurais artificiais, sendo uma Kohonen-SOM e a outra baseada em Learning Vector Quantization (LVQ). O objetivo de se usarem estas duas abordagens é analisar o aprendizado de máquina supervisionado e o desprovido da, bem como comparar os resultados obtidos por ambos. Para tanto, foi usado um banco de imagens de IRM composto de 3.000 imagens representantes dos dois grupos: um primeiro, correspondendo à metade das imagens, que possui lesões de EM e um segundo, com a outra metade, que não as possui. Em cada grupo, 50% das imagens foram usadas para treinamento da rede e as 50% remanescentes foram usadas para testes. Tais imagens foram resgatadas a partir de 15 pacientes com periodicidade semestral. As imagens apresentadas no banco de dados são submetidas a um pré-processamento realizado pelo sistema que reduz seus ruídos e minera seus aspectos relevantes. Após o pré-processamento é realizada a análise quantitativa do volume dos tecidos cerebrais das imagens. A análise de volume gera uma representação baseada em ternas matemáticas contendo informações relativas aos tecidos (ou matérias) que serão relevantes ao diagnóstico realizado pelas redes. Em uma etapa posterior (e onde se concentra o trabalho a que se dedica o presente artigo), essas ternas são usadas como dados de entrada nas redes neurais. Depois de treinadas, as redes serão capazes de detectar se as imagens mapeadas em sua camada de entrada correspondem a imagens de pacientes portadores da doença ou não. Os resultados obtidos nos testes comprovam a eficácia de ambas as estratégias como ferramentas para detecção dos diagnósticos. 2. FUNDAMENTOS TEÓRICOS 2.1 Redes neurais Artificiais e Kohonen-SOM Com base em redes neurais biológicas, uma rede neural artificial é um modelo computacional que consiste de unidades básicas chamadas neurônios. Cada um dos neurônios que compõem uma rede neural artificial pretende simular a operação de um único neurônio de uma rede neural biológica. Mais detalhes podem ser vistos em [4] [5] [6] [7] [8] [9]. Um mapa auto-organizável Kohonen-SOM é um tipo especial de rede neural artificial com aprendizado não supervisionado. A rede Kohonen-SOM consiste de duas camadas de neurônios, sendo a primeira a camada de entrada e a segunda a de saída. A camada de entrada aceita padrões de qualquer dimensão e então mapeia esses padrões para a camada de saída. A camada de saída representa o espaço vetorial dos elementos a serem agrupados. O objetivo é que entradas topologicamente próximas correspondam a neurônios de saída topologicamente próximos. Mais detalhes podem ser vistos em [4] [5] [6] [7] [8] [9] [10].

2.2 Learning Vector Quantization Learning Vector Quantization (LVQ) é uma técnica supervisionada de compressão de dados que utiliza como vantagem o fato que vetores de entrada do mesmo espaço vetorial apresentam similaridades significativas. Nesta técnica, os espaços vetoriais dos dados de entrada são divididos em várias regiões, onde para cada região é definido um vetor de reconstrução. Quando uma nova entrada é apresentada a rede, é definida a qual região a nova entrada pertence, daquele momento em diante a entrada será representada pelo vetor de reconstrução daquela região. Usando versões codificadas dos vetores de reconstrução das entradas para armazenamento e transmissão, pode-se obter economia em espaço de armazenamento ou banda de transmissão, isto é claro, ao preço de alguma distorção. Mais detalhes podem ser vistos em [4] [5] [6]. 2.3 Classificação de Imagens A classificação de imagens é basicamente o processo de se separar imagens em grupos previamente definidos, onde imagens pertencentes a um mesmo grupo possuem semelhanças significativas, ao mesmo tempo em que possuem, também, diferenças significativas com imagens dos demais grupos. A definição dos critérios de classificação de imagens baseia-se na extração de atributos das mesmas. Para que se torne possível produzir um classificador automático, os critérios de classificação das imagens precisam ser expressos numericamente, possibilitando, desta forma, que um método seja desenvolvido ou adaptado a reconhecer padrões dentro destes critérios. Naturalmente, para o processamento de imagens, são escolhidos critérios baseados na intensidade dos pixels para se classificar objetos ou regiões das imagens. As características escolhidas para a classificação de imagens neste trabalho consistem na quantificação dos volumes das matérias branca, cinza e fluido cerebrospinal contidas nas IRM a serem analisadas. 3 ESTADO DA ARTE Esta seção apresenta trabalhos correlatos sobre diagnóstico e detecção automática da presença de EM em IRM. Em [11], é apresentado um método de segmentação automática e detecção de lesões de EM em IRM. Tal método utiliza características de textura, bem como, uma Support Vector Machine (SVM) treinada para diferenciar os blocos que estão e os que não estão presentes em possíveis regiões de lesões de EM. Os resultados obtidos pelo método foram: 79% de precisão em similaridade e 90% de precisão na carga de lesões quando se comparando com o método manual. Em [3], é apresentado um método automático para detectar estruturas anormais em IRM e sua aplicação na detecção de EM. Tal método utiliza metodologias de multiescala combinadas com segmentação para realizar tal detecção. Os resultados obtidos pelo método foram: 97% de precisão por similaridade e 90% de precisão na detecção da carga de lesões quando comparado ao método manual. Em [12] é proposto um método para classificação de mamografias com tecidos benignos, malignos e normais. Para tal classificação são usadas redes neurais Perceptron de Multi-Camadas, Probabilísticas e de Funções de Base Radial. Os melhores resultados

obtidos foram por redes Probabilísticas, onde se foi obtido 97.3% de taxa de acerto, com 100% de especificidade e 96% de sensibilidade. Em [13] é proposto um método de classificação de regiões de mamografias em normais e anormais, assim como, em benignas e malignas, através de redes neurais artificiais. Os resultados obtidos foram de 88.23% de precisão na detecção de anormalidades e, 79.31% em distinguir entre regiões benignas e malignas. 4 SISTEMA PROPOSTO A motivação para se usarem redes neurais artificiais como ferramenta de classificação de IRM é o fato de que estas ferramentas mostram grande eficiência em agrupar elementos por suas similaridades. Duas redes neurais artificiais foram usadas no diagnóstico das IRM, a primeira é uma rede Kohonen-SOM treinada sem supervisão, enquanto que a segunda é uma rede similar em estrutura porém que utiliza LVQ e é treinada de forma supervisionada. O objetivo destas duas técnicas é analisar o aprendizado de máquina guiado por especialistas humanos e sem intervenção humana. Modificações foram realizadas sobre os algoritmos originais de treinamento de ambas as redes encontrados na literatura para adaptar esses métodos ao problema proposto. Ambas as redes foram treinadas usando um banco de dados com cerca de 3000 IRM e seus respectivos diagnósticos de 150 pacientes com periodicidade semestral. Para permitir o treinamento das redes, uma representação das imagens foi escolhida. A representação das imagens, a arquitetura das redes e o método de treinamento de cada rede são apresentados abaixo. 4.1 Representação das IRM As imagens apresentadas no banco de dados usado no presente trabalho foram obtidas a partir de um pré-processamento e de uma análise quantitativa do volume dos tecidos cerebrais das imagens. O pré-processamento incluiu: a aplicação do filtro de difusão anisotrópica robusta (Robust Anisotropic Difusion Filter [14] [15]) usado para a redução do ruído das imagens de RM, a normalização da intensidade de cinza das fatias de cada volume através de uma técnica proposta em [16], a correção de não-uniformidades através do algoritmo N3 (Non-parametric Non-uniform intensity Normalisation [14]), o alinhamento das imagens do paciente juntamente com as dos atlas anatômicos para um espaço estereotáxico comum [17], a determinação da área do encéfalo através do algoritmo BET (Brain Extraction Tool [18]), a fim de evitar o processamento desnecessário de regiões além do encéfalo, e a normalização da intensidade de cinza entre as diversas imagens de um mesmo paciente. O pré-processamento e a análise descrita acima geram a representação final da imagem usada no presente trabalho, ou seja, uma tripla de elementos, onde cada elemento possui informações relativas aos tecidos (ou matérias) que serão relevantes ao diagnóstico realizado pelas redes. A Figura 1 ilustra, esquematicamente, a representação da imagem a partir da qual foi feito o pré-processamento e a análise. Na figura, uma dada imagem I é visualizada em três diferentes tons de cinza (ou contrastes), indicados por: T1, T2 e PD, representados, em ordem, por cada um dos cubos na figura. A análise de uma imagem nestes três

contrastes é importante para sua classificação, isto devido ao fato de que lesões de EM são mais bem detectadas em diferentes contrastes [2] [3]. Na Fig. 1 considere cada,, onde 0 x n, 0 y m e 0 z k como um voxel (pixel em três dimensões) que apresenta um volume de matéria cinza, branca e fluido cerebrospinal sob a ótica de um dos 3 (três) contrastes contr utilizados (contr pode ser T1,T2 ou PD). Logo, em cada contraste contr, a imagem toda é representada por um conjunto de n * m * k voxels denominado Desta forma, cada é obtido por cálculos envolvendo seus voxels correspondentes e é representado por uma tripla <,,,,, >, onde,,, e, indicam o volume das matérias cerebrais branca, cinza e fluido cerebrospinal, respectivamente, nos voxels de. A representação final de uma imagem I corresponde à tripla <,, >. Assim sendo, a representação final consiste de nove valores, três para cada elemento da tripla. Figura 1: Representação das Imagens de Ressonância Magnética 4.2 Diagnóstico automático não supervisionado através de rede Kohonen-SOM Com o objetivo de criar uma rede Kohonen-Som capaz de classificar as IRM, durante o período de treinamento, parte das IRM disponíveis no banco da dados de imagem já préprocessadas são apresentadas a rede. Como o objetivo da rede é obter diagnósticos para as IRM, a rede conta com apenas dois neurônios na camada de saída, um para cada diagnóstico possível (EM presente ou não presente). A camada de entrada da rede é composta de nove neurônios de entrada, onde cada um representa um dos valores obtidos pelo pré-processamento das imagens. Geralmente são escolhidos valores aleatórios para os pesos iniciais [5], porém, no caso aqui tratado, isto não foi possível. A razão pela qual uma escolha randômica de valores para se iniciar os pesos não é adequada provém do fato de os espaços vetoriais das imagens que apresentam e das que não apresentam EM serem muito próximos, causando uma situação de vitória de somente um neurônio, o que tornaria a rede incapaz de aprender. Isto é, como o método utilizado para a atualização de pesos é a Distância Euclidiana e os espaços vetoriais são muito próximos, o primeiro neurônio a vencer também venceria todas as disputas subsequentes, e seria, assim, o único a ter os pesos

atualizados. Este fenômeno ocorre devido ao fato de que, uma vez que um neurônio vença, ele sempre se encontrará mais próximo dos espaços vetoriais de ambos os diagnósticos do que o neurônio perdedor. A ocorrência de tal fato foi comprovada durante o treinamento da rede através do monitoramento da atualização de pesos, onde se comprovou que sempre apenas um dos neurônios vencia as disputas, mesmo após várias tentativas de inicialização de pesos aleatórios diferentes. Saliente-se que não houve relato da ocorrência de problema similar na literatura correlata consultada que usa Redes Neurais na classificação de imagens médicas, fato que leva a crer que, distintamente do que ocorre na EM, os espaços vetoriais das imagens correspondentes à ocorrência ou não de câncer de mama [12] [13] sejam suficientemente distintos. A seguir apresenta-se um exemplo que ilustra o problema acima, bem como o método estatístico usado para inicializar os pesos da rede Kohonen de maneira a contorná-lo. A Fig. 2 ilustra claramente o problema associado aos espaços vetoriais através do uso de um exemplo. Suponha que o espaço x é o espaço das imagens que possuem lesões de EM e y o espaço das imagens que não as possuem. Suponha, também, que w e z são neurônios de saída inicializados com valores aleatórios. Note que em relação à z, w está mais próximo aos espaços vetoriais x e y. Após a primeira vitória inicial de w (já que sua distância é menor para qualquer imagem pertencente a x ou y), durante o treinamento da rede, com seus pesos reajustados, ele estará ainda mais próximo de x e y, como exemplificado na imagem mais a direita da Fig. 2. Figura 2: Exemplo de posicionamento de pesos inicializados de forma aleatória Como w estará situado ainda mais próximo aos espaços vetoriais x e y, ele continuará ganhando todas as disputas durante a fase de treinamento. Devido a este fato, w será o único neurônio com pesos atualizados, o que, consequentemente, não permitirá que a rede aprenda corretamente. Uma boa estratégia para contornar tal problema é o uso de métodos alternativos para definição dos pesos iniciais da rede, estratégia, esta, em que tais valores iniciais são obtidos a partir dos elementos a serem classificados [19]. Particularmente neste trabalho, o método utilizado baseou-se na média aritmética do volume das matérias cerebrais, ou seja, para cada diagnóstico são calculados os valores de média aritmética de cada combinação possível de tecido cerebral e contraste. Por fim, os valores correspondentes a um diagnósticos são ligados a um dos neurônios de saída, ao passo que os valores do diagnóstico alternativo são ligados ao outro neurônio. 4.2.1 Treinamento O treinamento da rede é realizado com uma taxa de aprendizado (α no pseudocódigo abaixo) decrescente e sem intervenção humana. O banco de dados usado contém cerca de 3000 IRM, onde metade destas imagens possui lesões de EM e a outra metade não as

possui. Metade das IRM são utilizadas para o treinamento e as restantes são utilizadas para realizar testes avaliativos de desempenho. Durante o treinamento da rede são-lhe apresentadas, intercaladamente, IRM com e sem lesões de EM. Desta forma, a possibilidade de que a rede se especialize em apenas um padrão de entrada é evitado. Este fenômeno ocorre devido ao fato de que uma vez que IRM de um mesmo padrão são apresentadas em sequência e por muitas vezes à rede, esta se torna incapaz de classificar satisfatoriamente imagens de outros padrões. Uma vez que o treinamento esteja finalizado, a rede se torna capaz de obter diagnósticos satisfatórios para qualquer IRM que pertença ou não ao conjunto de IRM de treino. O pseudocódigo abaixo resume o algoritmo utilizado: 1-Instantiate the initial weights values, 2 -cycles = 1 3-while quantity of cycles < 1000 do 4- for each input datum : do 5- for each output neuron j: do 6- = W A ² 7- find the output neuron J with minimum D(j) 8 - for all input neuron i: do 9- W, = W, +α X W, 10- cycles = cycles + 1 11- α α 0.05 12-end of while A linha 1 inicia os valores dos pesos iniciais W por meio de métodos estatísticos; A linha 2 inicializa a quantidade de ciclos; A linha 6 calcula a distância euclidiana entre a imagem de entrada e cada neurônio de saída; As linhas 7,8,9 e 10 atualizam os pesos de todos as conexões entre os neurônios de entrada e o neurônio de saída J com a mínima distância euclidiana calculada; Observe que a taxa de aprendizado α varia de 0.1 a 0.001, com decréscimo de 5% a cada ciclo (linhas 3 a 12); A linha 12 checa se todos os ciclos previstos já foram processados. O algoritmo aplicado no treino da rede difere do algoritmo tradicional de uma rede Kohonen-SOM, principalmente no que tange à condição de parada e à inexistência de uma vizinhança para a atualização de pesos. A abordagem tradicional de parada é baseada em um valor mínimo que limita a taxa de aprendizagem [5]. No presente trabalho, a abordagem que condiciona a parada a um número fixo que limita os ciclos mostrou-se mais apropriada. Testes mostraram que com uma quantidade de 1000 ciclos o aprendizado da rede converge. A aplicação da atualização dos pesos sobre uma vizinhança não foi necessária, uma vez que a rede possui apenas dois neurônios de saída, onde, cada um deles se adapta a apenas uma classificação de imagem. 4.3 Diagnóstico automático supervisionado através de rede LVQ A rede que utiliza LVQ tem uma estrutura similar à rede Kohonen-SOM desenvolvida, isto é, dois neurônios na camada de entrada e nove neurônios na camada de saída. A fim

de melhor avaliar a eficácia de cada método de forma isolada, os pesos iniciais usados para o treinamento da rede LVQ são os mesmos utilizados para rede Kohonen, tornando análogas assim, as condições de treinamento para ambas as redes. O treinamento da rede LVQ utiliza os diagnósticos obtidos por especialistas humanos para as IRM do banco de dados de imagens para guiar o aprendizado supervisionado da mesma. A subseção abaixo descreve o treino da rede LVQ. 4.3.1 Treinamento Assim que o treinamento da rede LVQ é concluído, a mesma é capaz de classificar IRM fora e dentro do conjunto de treino sobre a presença ou não de lesões de EM. Durante o treinamento, a taxa de aprendizado decresce lentamente e imagens que apresentam e não apresentam lesões de EM são apresentadas a rede de forma intercalada, tal como feito no treinamento da rede Kohonen-SOM. O processo de treinamento é dado da seguinte forma: se o diagnóstico alcançado pela rede corresponde ao obtido por especialistas humanos, então os pesos do neurônio ganhador sofrem um ajuste positivo (reforço), caso contrário, o ajuste sofrido é negativo (castigo). Este procedimento objetiva criar padrões nos neurônios de saída mais próximos à entrada oferecida. O pseudocódigo abaixo resume o algoritmo utilizado: 1- Instantiate the initial weight values, 2- cycles = 1 3- while quantity of cycles < 1000 do 4- for each input datum : do 5- for each output neuron j: do 6- = W A ² 7- find the output neuron J with minimum D(j) 8- if = d, do 9- for all input neuroni: do 10- W, = W, +α X W, 11- else do 12- for all input neuroni: do 13- W, = W, α X W, 14- cycles = cycles +1 15- α α 0.05 16- end of while Este algoritmo diferente do algoritmo Kohonen principalmente quanto à condição de atualização dos pesos e o modo como estes são atualizados que podem ser vistos nas linhas 8 a 13.

5 RESULTADOS Esta seção apresenta os resultados finais obtidos pelas redes Kohonen e LVQ bem como a comparação entre os mesmos. Os resultados finais são obtidos calculando a porcentagem de erro para os dois diagnósticos possíveis para cada rede. O diagnóstico dado por uma rede é considerado correto se este coincide com o diagnóstico do método manual obtido por especialistas. Automaticamente, um erro ocorre quando um diagnóstico dado pela rede não coincide com o diagnóstico obtido através do método manual. As porcentagens de erro de diagnóstico obtidas na classificação de IRM sem lesões de EM para cada rede foram de 3,6% para a LVQ e 7,6% para a Kohonen. Em IRM que apresentam lesões de EM presentes as porcentagens de erros de diagnóstico obtidas para cada rede foram de 2,2% e 1,6% para LVQ e Kohonen respectivamente. Estes resultados confirmam a eficácia de redes neurais artificiais como método automático de detecção de lesões de EM em IRM, considerando-se o elevado grau de dificuldade da detecção do diagnóstico de EM por especialistas humanos [1]. Com a rede LVQ, obteve-se uma melhora de 47,36% na classificação de imagens que não apresentam EM em relação a rede Kohonen. Em contrapartida, através da rede Kohonen, obteve-se um resultado 72,73% melhor na classificação de imagens que apresentam lesões de EM. As redes LVQ e Kohonen apresentaram diagnósticos errados para as IRM apresentadas durante os testes conduzidos em 2,9% e 4,6% delas, respectivamente. Conclui-se, então, que a rede LVQ tem um desempenho 63% melhor que a rede Kohonen na classificação das IRM, o que é compreensível visto que uma técnica supervisionada pode ajustar melhor seu treinamento a fim de obter melhores resultados. TABELA I. RESULTADOS Resultado Método de diagnóstico Rede LVQ Rede Kohonem Erro relativo a EM presente (falsos negativos) Erro relativo a EM não presente (falsos positivos) 2,2% 1,6% 3,6% 7,6% Erro total 2,9% 4,6% 6 CONCLUSÃO Neste artigo foram apresentados dois métodos automáticos para detecção de lesões de EM em IRM. Tais métodos correspondem a uma rede neural Kohonen-SOM (aprendizagem não supervisionada) e a uma LVQ (aprendizagem supervisionada) para mapear IRM em espaços vetoriais, onde os espaços mapeados indicarão o diagnóstico das IRM.

O diagnóstico dado pelas redes é baseado na similaridade entre os padrões de volume de matérias cerebrais contidas nos pesos das redes e o volume de matérias cerebrais no dado de entrada dado. Outros métodos automáticos para detecção de lesões de EM em IRM [11] [3] obtêm seus resultados por comparações entre a segmentação realizada por seus métodos automáticos desenvolvidos e o método de detecção manual. A segmentação das IRM não foi tratada neste artigo. Acredita-se que o diagnóstico fornecido pelos métodos desenvolvidos é suficiente para auxiliar especialistas no diagnóstico preventivo de IRM sobre a presença de lesões de EM. A rede LVQ obteve resultados melhores, o que é compreensível, já que uma técnica supervisionada é capaz de ajustar seu treinamento para obter melhores resultados. Trabalhos futuros pretendem explorar características mais específicas das IRM como o posicionamento e formato das matérias cerebrais identificadas, bem como fatores de idade e gênero dos pacientes. 7 AGRADECIMENTOS À FAPEMIG pelo auxílio financeiro. 8 REFERENCIAS 1. Paraná Online, O Difícil diagnóstico da Esclerose Múltipla, http://paranaonline.com.br/canal/vida-e-saude/news/258317, Access date: 29/08/2012. 2. D. H. Miller and R. I. Grossman, The role of magnetic resonance techniques in understanding and managing multiple sclerosis Brain, vol 121, pp. 3-24, 1998. 3. A. Ayelet, G. Meirav, M. G. John, F. Massimo, V. Paola, B. Ronen and B. Achi, Automatic Segmentation and Classification of Multiple Sclerosis in Multichannel MRI, IEE Transactions On Biomedical Engineering, Vol. 56, NO. 10, 2009. 4. L. Fausett, Fundamentals of Neural Networks: Architectures, Algorithms And Applications, Prentice Hall, 1994. 5. S. Haykin, Redes Neurais: Princípios e Prática (2ª Edição), Bookman Editora, 2001. 6. Z. L. Kovacs, Redes Neurais e Aplicações, Collegium Cognitio, 1996. 7. I. Xingand, D. Pham, Neural Networks for Identification, Prediction, and Control, Strpinger-Verlag, 1995. 8. I. N. Silva, D. H. Spatti, R. A. Flauzino, Redes Neurai Artificiais para engenharia e ciências aplicadas, Editora Artliber, 2010. 9. G. Bittencour, Inteligência Artificial Ferramentas e Teorias, Editora UFSC, 2006. 10. H. C. Neto, Ls-draughts um sistema de aprendizagem de jogos de damas baseado em algoritmos genéticos, redes neurais e diferenças temporais, Computer Science Faculty Federal University Of Uberlândia, Uberlândia, Brazil, 2007.

11. A. A. Bassem, A. Y. Akmal, M. P. Pradip and S. Efrat, Textural based SVM for MS Lesion Segmentation in FLAIR MRIs, Open Journal of Medical Imaging,1,26-42, doi;10.4236/ojmi.2011.12005, 2011. 12. CAMPS L.F.A., SILVA A.C., BARROS A.K. Diagnosis of Breast Cancer in Digital Mammograms Using Independent Component Analysis and Neural Networks, Available: http://www.springerlink.com/content/k2w2ug4619275huv Access date: 20/03/2012. 13. CHRISTOYIANNI, I.; KOUTRAS, A.; DERMATAS, E.; KOKKINAKIS, G. Computer aided diagnosis of breast cancer in digitized mammograms Available: http://www.medicalimagingandgraphics.com/article/s0895-6111(02)00031-9/abstract, Access date: 20/03/2012. 14. J. G. Sled, A. P. Zijdenbos, and A. C. Evans, A Nonparametric Method for Automatic Correction of Intesity Nonuniformity in MRI Data, IEEE Transactions on Medical Imaging, 17(3):143 155, 2002. 15. Modelo Estatístico para a Determinação do Número Ótimo de Iterações do Filtro de Difusão Anisotrópica Aplicado à Redução de Ruído de Imagens de Ressonância Magnética do Cérebro", Y. Saito, R.J. Ferrari 1, J. Teixeira, A.P.L.F. de Carvalho, P.M. de Azevedo Marques, A.C. dos Santos, Revista de Informática Teórica e Aplicada, 16(3), pp. 1-19, 2010. 16. A. Madabhushi and J. K. Udupa, New methods of MR image intensity standardization via generalized scale, Medical Physics, 33(9):3426 3434, 2006. 17. J. L. Lancaster, D. Todesillas-Gutierrez, M. Martinez, F. Salinas, A. Evans, K. Zilles, J. C. Mazziotta, and P. T. Fox, Bias between MNI and Talairach coordinates analyzed using the ICBM-152 brain template, Human Brain Mapping, 28:1194 1205, 2007. 18. S. M. Stephen Fast robust automated brain extraction, Human Brain Mapping, 17(3):143 155, 2002. 19. F. J. V. Zuben IA 353 - Redes Neurais, Available: ftp://ftp.dca.fee.unicamp.br/pub/docs/vonzuben/ia353_01/revisao/tema19.doc, Access date: 20/03/2012.