Documentos relacionados
Arquitetura Para um Sistema de Diagnóstico Auxiliado por Computador

Diagnóstico Médico de Imagem Auxiliado por Computador

Descritores de Imagens

Detecção Auxiliada por Computador

Métodos de Extração de Características

INVESTIGATING THE USE OF BLOCK-MATCHING 3D DENOISING ALGORITHM TO REDUCE RADIATION DOSE IN DIGITAL MAMMOGRAPHY

Processamento digital de imagens para a detecção e classificação de nódulos em mamografias

Diego Martin Mancini Orientador: Prof. Paulo A. V. de Miranda Instituto de Matemática e Estatística Universidade de São Paulo

AVALIAÇÃO DOS ACHADOS MAMOGRÁFICOS CLASSIFICADOS CONFORME SISTEMA BI RADS¹. Beatriz Silva Souza², Eliangela Saraiva Oliveira Pinto³

AUTOMATED ASSESSMENT OF BREAST TISSUE DENSITY IN DIGITAL MAMMOGRAMS

Segmentação do Músculo Peitoral em Imagens Mamográficas Através do Recorte Automático de ROI e da Binarização de Otsu

Implementação de uma Ferramenta para Recuperação de Imagens Mamográficas Baseada em Conteúdo

Extração de atributos usando o método LBP - Local Binary Pattern

Extração de objetos de interesse em imagens digitais utilizando a biblioteca de Visão Computacional OpenCV

Compressão Com Controle de Perdas de Imagens Mamográficas Utilizando Segmentação e o Algoritmo PPM

MouseCam: aplicação de controle do mouse via câmera

Descritores de Imagens

Métodos de Segmentação de Imagem para Análise da Marcha

Auto-Fusão na Recuperação de Imagens Baseadas em Conteúdo.

O reconhecimento facial é dividido em três etapas: i) detecção da face, ii) extração de características e iii) reconhecimento da face.

Face Recognition using RGB-D Images

T4.1 Processamento de Imagem

Capítulo III Processamento de Imagem

Compressão de Imagens Mamográficas Utilizando Segmentação e o Algoritmo PPM

Consultas por Similaridade em Domínios de Dados Complexos

Máquinas de Vetores de Suporte Aplicadas à Classificação de Defeitos em Couro Bovino

Identificação de Pontos Perceptualmente Importantes (PIP) em séries temporais de tópicos extraídos de dados textuais

Detalhes do método proposto e da sua implementação são descritos nas

Classificação de Padrões Radiológicos por Blocos em Imagens Não Segmentadas de Tomografia Computadorizada

Sistema para o Controle de Qualidade de Mamógrafos e Geração Automática de Laudos Através da Análise de Imagens de Fantoma

Processamento de Imagens Médicas

IDENTIFICAÇÃO DE MARCADORES DE PAVIMENTAÇÃO NA ORIENTAÇÃO DE CEGOS. André Zuconelli 1 ; Manassés Ribeiro 2

Fusão de Atributos para Segmentação de Couro Bovino

Sketch to Photo Matching: A Feature-based Approach (Klare and Jain [2010])

Classificação de Padrões por Blocos em Imagens Não Segmentadas de Tomografia Computadorizada

Respostas do Teste de Analise de Imagens :

Métricas Morfológicas para a Classificação de Tumores de Mama

Software para detecção de melanoma para ios

IDENTIFICAÇÃO DAS ESTRUTURAS DE TECIDOS PLANOS ATRAVÉS DA CÂMERA DE SMARTPHONE

Busca de imagens baseada no conteúdo: Aplicação em imagens médicas

Reconhecimento de palma de mão. Peterson Wagner Kava de Carvalho

Extração de características utilizando filtros de Gabor aplicado a identificação de defeitos no couro bovino

Orientação de Bordas em Imagens Digitais: Abordagem por Análise de Vizinhança Local

CLASSIFICAÇÃO DE PADRÕES EM IMAGENS UTILIZANDO DESCRITORES DE TEXTURA Pattern Classification in Images Using Descriptors of Texture

Recuperação de Imagens 2D Utilizando Técnicas de Inteligência Artificial

Processamento de Imagens COS756 / COC603

Aplicação de Histograma de Gradientes Orientados para detecção de hidrômetros em imagens de fundo complexo

Reconhecimento e diagnóstico automático de melanoma

Aula 7 - Representação e Descrição de Estruturas Bi-dimensionais. Prof. Adilson Gonzaga

SEGMENTAÇÃO DA MAMA: DETECÇÃO DO CONTORNO EXTERNO E EXTRAÇÃO DO MÚSCULO PEITORAL

SEL-0339 Introdução à Visão Computacional. Aula 5 Segmentação de Imagens

"Análise de Extratores de Característica para Reconhecimento de Face"

Image Descriptors: color

ALGORITMOS PARA ALINHAMENTO DE IMAGENS MÉDICAS: PRÍNCIPIOS E APLICAÇÃO EM IMAGENS DE ESCLEROSE MÚLTIPLA

INFORMAÇÕES DO ACADÊMICO PLANO DE TRABALHO. 1. Justificativa

Extração de Características por meio de Redes Complexas

AVALIAÇÃO QUALITATIVA DE DETECÇÃO DE BORDAS EM IMAGENS DE RADIOGRAFIA PERIAPICAIS

Ambiente de Data Warehouse Para Imagens Médicas Baseado Em Similaridade

1.1. Trabalhos Realizados na Área

T4 Processamento de Imagem

Radiologia Digital versus Analógica, CAD e Telerradiologia

UNIVERSIDADE ESTADUAL PAULISTA Campus de Sorocaba. Segmentação

Descritores de Imagem

Redução de falsos positivos em imagens de mamografias digitais usando os índices phylogenetic species variability, phylogenetic species richness

Reconhecimento de texturas utilizando padrão binário local e classificador knn.

Sistema de Reconhecimento de Logotipos

Rastreamento de Objetos Baseado em Grafos. Casamento Inexato entre Grafos Relacionais com Atributos

Filtros de Resposta Máxima e Padrões Binários Locais Aplicados na Detecção de Anormalidades em Mamografias

Identificação de Órgãos Foliares utilizando as Wavelets de Daubechies

[2CTA121] Processamento de Imagens em Alimentos: Conceitos e Aplicações

RECONHECIMENTO DE ÍRIS EM AMBIENTES NÃO COOPERATIVOS UTILIZANDO WAVELETS E GABOR 2D

Classificação de Tecidos da Mama em Maligno e Benigno baseado em Mamografias Digitais usando Descritores de Textura

Computaçã. Visão Geral. Sistema Gráfico. Computação Gráfica. Pixels. Sistema Gráfico e o Frame Buffer. Introdução à Computação Gráfica

Processamento digital de imagens

Anotador automático de placas de publicidade em vídeos esportivos

EXTRAÇÃO SEMI - AUTOMÁTICA DE FEIÇÕES LINEARES E A CALIBRAÇÃO DOS PARÂMETROS INTRÍNSECOS DE CÂMERAS Projeto de Pesquisa PIBIC/CNPq ( )

Igor dos Santos Montagner Orientador: Roberto Marcondes Cesar Junior 20/09/2010

Extração de características de imagens. Descritores de cor

ANÁLISE DA SEGMENTAÇÃO DO VENTRÍCULO ESQUERDO EM IMAGENS DIGITAIS DE ECOCARDIOGRAMA POR DIFERENTES MÉTODOS DE CONTORNOS ATIVOS

Dermanostic: um método para normalização da iluminação em imagens de lesões cutâneas

Descritores de Imagem (exemplos)

04-07 de Julho - FCT/UNESP - P. Prudente VI Workshop de Visão Computacional

Descritores de Imagens

Trabalho Final de Processamento de Imagens: Panografia

SEMINÁRIO DOS ARTIGOS:

Proposta de um Protótipo de um Sistema de Recuperação de Imagens com Base na Cor

Person Re-Identification. Autor: Guilherme Zasyeki Machado

Um Método para Melhoria de Dados Estruturados de Imóveis

Processamento Digital de Imagens

Reconhecimento Facial 3D utilizando o Simulated Annealing com as Medidas Surface Interpenetration Measure e M-Estimator Sample Consensus

Descritores de Imagem (introdução)

Um Estudo sobre Vetores de Descritores Localmente Agregados para Diagnóstico de Câncer de Mama

TÍTULO: IDENTIFICAÇÃO DE CARACTERES APRESENTADOS A UMA CÂMERA POR MEIO DO MOVIMENTO DOS DEDOS DA MÃO DE UM SER HUMANO

SEGMENTAÇÃO E RECONHECIMENTO DA ÍRIS

APLICAÇÃO DE TÉCNICAS DE PROCESSAMENTO DE IMAGENS DIGITAIS EM IMAGENS GERADAS POR ULTRA-SOM

DETECÇÃO DE AGRUPAMENTOS DE MICROCALCIFICAÇÕES EM IMAGENS MAMOGRÁFICAS DIGITAIS UTILIZANDO ETAPAS DE SEGMENTAÇÃO DA MAMA E REALCE

Processamento de Imagens Marcia A. S. Bissaco

Processamento De Imagem. Descritores de Cor

DENSIDADE MAMÁRIA. Risco de densidade mamária e cancro da mama

Aplicação de Wavelets para Recuperação de Imagens Médicas por Conteúdo

Transcrição:

Um Sistema Para Diagnóstico Auxiliado por Computador Voltado Para Imagens Mamográficas: Desempenho da Busca Baseada em Conteúdo na Recuperação de Achados JanKees v. d. Poel 1, Elton da N. Mascena 2, Glauber M. Pires 3, Tatiane C. de S. Honório 4, Thiago F. L. de Medeiros 5, Leonardo V. Batista 6 1,6 Programa de Pós-graduação em Engenharia Mecânica, Universidade Federal da Paraíba 2,4,5,6 Departamento de Informática, Universidade Federal da Paraíba 4,5,6 Programa de Educação Tutorial, Departamento de Modernização e Programas da Educação Superior, Secretaria de Educação Superior do Ministério da Educação 3 Programa de Pós-graduação em Informática, Universidade Federal de Pernambuco 6 Programa de Pós-graduação em Informática, Universidade Federal da Paraíba jkvdpoel@yahoo.com.br, eltonnobrega@yahoo.com.br, glaubermpires@yahoo.com, tatihonorio@gmail.com, thiago_flm@yahoo.com.br, leonardo@di.ufpb.br Abstract. According to the World Health Organization (WHO), every year around one million women all over the world develop breast cancer. A lesion in a mammogram is mainly identified by the existence of microcalcifications and masses in the breast, which happen in several shapes and sizes. This work presents the current development stage of a system capable of analyze and classify tumoral shapes using the Curvature Scale Space method, aiming to help the breast cancer diagnosis by a radiologist. It also presents some search results obtained with this system in a mammography database. Resumo. Anualmente, cerca de um milhão de mulheres no mundo descobre que está com câncer de mama, segundo a Organização Mundial de Saúde (OMS). Uma lesão é identificada em um mamograma principalmente pela existência de microcalcificações e massas na mama, que ocorrem em diversas formas e tamanhos. Este trabalho apresenta o estágio atual de desenvolvimento de um sistema para classificação de formas de tumores usando o método da Curvature Scale Space, com o propósito de ajudar o radiologista no diagnóstico do câncer de mama. Também são apresentados alguns resultados de buscas feitas pelo sistema em um banco de dados de mamografias. 1. Introdução e Motivação Grandes coleções de imagens médicas trouxeram consigo a necessidade de utilizar técnicas computacionais para processar, análisar e recuperar a informação pictórica relacionada às mesmas. Assim, o diagnóstico auxiliado por computador vem atraindo grande interesse [1][2]. Este trabalho apresenta um novo sistema de diagnóstico auxiliado por computador (Computer-Aided Diagnosis System, CADS) chamado Sistema de Auxílio ao Diagnóstico Médico (SIAD-M), o qual possibilita, entre outras opções, efetuar Buscas e Recuperações de Imagens Baseada em Conteúdo (Content-Based Image Search and Retrieval, CBISR). 194

O sistema analisa e classifica imagens de tumores de câncer de mama, auxiliando o radiologista em seu diagnóstico, posto que o câncer de mama é um grave problema de saúde pública: em mulheres, é o tipo de câncer que mais causa mortes no Brasil, e o segundo em termos de incidência, com 48.930 casos previstos para o ano de 2006 [3]. A prevenção do câncer de mama por meio do rastreamento (a realização de exames em mulheres assintomáticas) é considerada a forma mais correta de reduzir a mortalidade associada a esta neoplasia, pois procura identificar e tratar o câncer precocemente [4]. Adicionalmente, a mamografia é, atualmente, a forma mais eficiente para detectar lesões subclínicas, constituindo a técnica mais confiável para detectar o câncer de mama em estádios iniciais [5]. O SIAD-M está sendo desenvolvido pelo Grupo de Pesquisa em Processamento e Análise de Sinais, Imagens e Vídeo dos Programas de Pós-Graduação em Engenharia Mecânica (PPGEM) e em Informática (PPGI) da UFPB. Sua interface é construída sobre o software de domínio público ImageJ, através de plugins específicos para o processamento de imagens mamográficas, e vem produzindo resultados que serão descritos ao longo deste trabalho. 2. Revisão da Literatura O sistema desenvolvido tem por finalidade auxiliar os médicos no sentido de emitir um diagnóstico mais acurado devido ao suporte dado por uma ferramenta CAD, bem como possibilitar a comparação de casos semelhantes por meio de uma ferramenta CBIR. 2.1. Diagnóstico Auxiliado por Computador (Computer-Aided Diagnosis, CAD) A detecção de anomalias em imagens médicas é, em geral, um procedimento demorado, muitas vezes propenso a erros e a algum grau de subjetividade devido a inúmeras razões, dentre as quais pode-se citar a existência de estruturas complexas e de grande número de imagens normais; à variação na aparência dos tecidos (mesmo aqueles normais); a sutileza das anormalidades; a superposição dos tecidos; e à grande sensibilidade necessária para minimizar o retorno desnecessário dos pacientes. O diagnóstico auxiliado por computador é aquele emitido por um radiologista que usa como referência as análises feitas por um software de reconhecimento de padrões em imagens: o radiologista é alertado para que examine de forma mais detalhada os padrões suspeitos detectados pelo sistema. Isto melhora tanto a acurácia do diagnóstico quanto a consistência da interpretação da imagem, servindo como uma segunda opinião quando da tomada de decisões diagnósticas [6]. Deve-se salientar que o radiologista continua interpretando a imagem e sendo responsável pelo laudo, com o CAD apenas auxiliando-o [6]. Um sistema CAD processa imagens para: 1) melhorar a qualidade [7] (aumentar o contraste, por exemplo); 2) segmentar [8] (delimitar os achados na imagem); 3) parametrizar [9] (calcular atributos para cada achado área, perímetro e forma, por exemplo); 4) reconhecer [1] (classificar os achados); e 5) analisar [10] (associar os parâmetros calculados ao problema dado). 2.2. Recuperação de Imagens por Conteúdo (Content-Based Image Retrieval, CBIR) Um sistema CBIR usa o conteúdo das imagens para efetuar buscas, no lugar de utilizar descrições textuais feitas por seres humanos (palavras-chave, por exemplo) pois a 195

tradicional busca baseada em texto, apesar de bastante rápida, não é efetiva quando as imagens são complexas e em grande quantidade: a interpretação humana é muito variável e o esforço requerido para anotar toda a base de dados é enorme. Este tipo de sistema vem sendo pesquisado a pelo menos dez anos, mas os primeiros artigos na área datam do início da década de 80 [11]. Na literatura, o projeto QBIC (Query by Image Content) da IBM [12] é citado como sendo o marco inicial da recuperação de imagens por conteúdo. Indexar e buscar imagens médicas eficientemente envolve extrair delas atributos visuais que correspondam à patologia de interesse. Dentre estes atributos podem ser citados a cor [11], a textura [13] e os contornos [14]. A extração de cada atributo é feita por um algoritmo específico e, geralmente, apenas em uma região de interesse (Region Of Interest, ROI). Os atributos extraídos de uma imagem-exemplo são ordenados e comparados, através de métricas de distância específicas, aos atributos de outras imagens em um banco de dados (Figura 1) e, em seguida, é feita a recuperação das imagens mais semelhantes à imagem-exemplo. Figura 1. Sistema de análise, busca e recuperação de imagens genérico. Os sistemas de CBIR usam vários tipos de imagens para query [15], desde exemplos (o usuário inicia a busca a partir de uma imagem exemplo e o sistema procura devolver imagens similares à mesma) até esboços (o usuário desenha um esboço da imagem desejada e o sistema procura devolver imagens similares ao mesmo). Vários trabalhos analisam a utilização de sistemas de análise, busca e recuperação de imagens médicas [9]. Estes sistemas podem ajudar, por exemplo, um médico com dúvidas quanto ao diagnóstico: o médico faria uso do sistema para recuperar imagens semelhantes (e de diagnóstico confirmado) à imagem duvidosa. Entretanto, a eficiência destes sistemas envolve uma série de escolhas a respeito de quais atributos devem ser extraídos, da representação destes atributos, dos métodos a serem utilizados para especificar as queries, das métricas de distância e das estratégias de indexação do banco de dados, tornando o trabalho difícil e demorado. 3. Materiais e Métodos 3.1. ImageJ O ImageJ [16] é um software de domínio público em Java voltado para o desenvolvimento de aplicações para processamento e análise de imagens. Possui uma arquitetura aberta cuja extensibilidade é obtida através de plugins em Java. Plugins 196

específicos escritos pelos usuários para aquisição, análise e processamento de imagens podem ser desenvolvidos usando apenas o editor do ImageJ e um compilador Java. Por ser escrito em Java, o ImageJ é compatível com todos os sistemas operacionais e arquiteturas que possuam uma máquina virtual Java. 3.2. Arquitetura do SIAD-M O SIAD-M está organizado como mostra a Figura 2. Uma interface gráfica permite ao usuário efetuar cada etapa do processamento ou busca da imagem de maneira simples e direta. Os diversos módulos do sistema possuem um fraco acoplamento, permitindo sua substituição por outros escolhidos pelo usuário. Figura 2. Sistema CAD/CBIR. Cada módulo do sistema possui uma responsabilidade específica, a saber: 1) aquisição da imagem: carrega a imagem no sistema; 2) pré-processamento: filtra e prepara a imagem original para a etapa de delimitação das áreas de interesse; 3) delimitação das regiões de interesse: separa as diversas regiões que compõem a imagem e identifica a região de interesse; 4) pré-processamento: filtra as regiões de interesse, evitando a supersegmentação ou subsegmentação; 5) segmentação: delimita os objetos encontrados na região de interesse; 6) redução de ruído: filtra os ruídos das regiões delimitadas na segmentação; 7) extração de contorno: cada região segmentada na imagem tem seu contorno extraído; 8) ajuste do contorno: caso necessário, o médico pode modificar o contorno delimitado na segmentação; 9) cálculo dos descritores: obtenção de um conjunto de descritores a partir das regiões delimitadas pelos contornos extraídos em etapas anteriores (os descritores serão utilizados para procura ou armazenamento no banco de dados); e 10) Banco de Dados: responsável pela procura e armazenamento das imagens a partir dos descritores extraídos. Algumas das operações atualmente implementadas no sistema são descritas a seguir: Equalização de histograma [8]: o histograma da imagem original é modificado de forma a apresentar uma distribuição mais uniforme de níveis de cinza, de forma a melhorar a qualidade da imagem. 197

Expansão de histograma [8]: o histograma de uma imagem é expandido para utilizar toda a faixa disponível de níveis de cinza, melhorando a qualidade da imagem. Crescimento de regiões (Region Growing) [8]: algoritmo que agrupa pixels ou subregiões baseando-se em dois critérios: a escolha dos pixels iniciais e das sub-regiões iniciais; e o critério de término do crescimento de cada região. Comumente, este algoritmo semeia pixels pela imagem e os associa com pixels vizinhos que possuam propriedades semelhantes (nível de cinza ou cor dentro de uma dada tolerância, por exemplo). Curvatura em Espaço de Escala (Curvature Scale Space, CSS) [14]: descritor de forma que reflete propriedades relacionadas à percepção visual humana, tem boa generalização, é compacto, é robusto à mudança de escala, a movimentos não rígidos, à oclusão parcial, à orientação, ao ruído e possibilita busca baseada em similaridade; é o padrão usado para os descritores de forma baseados em contorno no MPEG-7 [17]. Testes preliminares [18] mostraram a viabilidade deste descritor para detectar e classificar tumores em mamogramas. A adição de novas características ao SIAD-M é feita de forma bastante simples: basta apenas instalar, no ImageJ, novos plugins que implementem a operação a ser adicionada ou substituída. 3.3. Curvatura em Espaço de Escala (Curvature Scale Space, CSS) A escolha dos atributos a serem extraídos das imagens deve levar em conta características perceptuais que sejam úteis para o reconhecimento das formas de um objeto. Por este motivo, a busca por imagens baseada na similaridade dos contornos das mesmas, notadamente por medidas de curvatura, tem sido largamente estudada pela literatura [14][19]. O contorno das formas em imagens pode ser representado por diversas medidas, incluindo excentricidade e circularidade [12], código de cadeia (chain code) [20], descritores de Fourier [21] e Curvatura em Espaço de Escala (Curvature Scale Space, CSS) [14]. Dentre estas técnicas, o CSS é considerado um método confiável e rápido para representar formas em grandes bases de dados, além de ser robusto em relação a ruído e a mudanças de escala e orientação. Para calcular o CSS, inicialmente obtém-se o contorno fechado Γ do objeto. Em seguida, selecionam-se N pontos (x,y) eqüidistantes e pertencentes ao contorno. A partir de um ponto inicial arbitrariamente escolhido percorre-se o contorno no sentido antihorário. As coordenadas x(u) e y(u) do contorno representam as coordenadas paramétricas da curva Γ, com Γ(u) = (x(u),y(u)). A versão evoluída Γ σ de Γ é definida como Γ σ (u) = (x(u),y(u)), onde X(u,σ) = x(u)*g(u,σ), Y(u,σ) = y(u)*g(u,σ), * é o operador de convolução e g(u,σ) uma gaussiana de desvio padrão σ. O cálculo da curvatura k(u,σ) [14] sobre Γ σ é obtido através da Equação 1: X u ( u, σ ) Yuu ( u, σ ) X uu ( u, σ ) Yu ( u, σ ) k( u, σ ) = [1] 3 2 2 ( X ( u, σ ) + Y ( u, σ )) 2 u u Nesta equação, X u (u,σ), Y u (u,σ), X uu (u,σ) e Y uu (u,σ) são, respectivamente, a primeira e segunda derivadas em relação a u das componentes X(u,σ) e Y(u,σ) da curva. 198

A Imagem CSS de Γ é uma imagem binária cujos eixos horizontal e vertical são, respectivamente, o índice do respectivo ponto u e o valor de σ da gaussiana definida pelos pontos de cruzamentos por zero de k(u,σ) calculados e armazenados para valores crescentes de σ. Esta imagem será a assinatura utilizada no reconhecimento e classificação da forma. A similaridade entre duas formas é medida por uma soma de distâncias entre picos semelhantes e picos não semelhantes. O CSS, entretanto, possui alguns problemas. Comparar utilizando o CSS é difícil pois este descritor baseia-se nos picos das Imagens CSS, os quais estão presentes em quantidades que variam de contorno para contorno e são localizados em posição e ordem diferentes. Além disto, o CSS captura apenas as características locais das formas, e não as globais. Para que estas falhas não afetem em demasia o desempenho, características globais (a excentricidade, a circularidade e o número de picos na Imagem CSS, no presente caso) são combinadas com o descritor [22]. 3.4. Sistema de Gerenciamento de Banco de Dados O Sistema de Gerenciamento de Banco de Dados (SGBD) utilizado no SIAD-M é o MySQL, pois seu código fonte é aberto e sua utilização é gratuita. Devido ao uso do Hibernate, o MySQL pode ser facilmente trocado por outros SGBDs. O Hibernate é um framework em Java para persistência, a qual é uma maneira eficaz e orientada a objetos para efetuar o armazenamento de dados, abstraindo totalmente o SGBD utilizado. 3.5. Recuperação de Achados em Mamografias A recuperação de achados em mamografias está basicamente organizada como mostra a Figura 3. A interface gráfica da recuperação faz parte do SIAD-M e também foi implementada sobre o ImageJ, permitindo ao usuário efetuar cada etapa da busca da imagem de maneira simples e direta. Figura 3. Sistema de busca de achados mamográficos. Para buscar uma imagem deve-se, basicamente, adquirir a imagem para o sistema; filtrar e melhorar a imagem; delimitar as regiões de interesse; segmentar os objetos encontrados na região de interesse (no caso do SIAD-M isto é feito através do algoritmo de crescimento de regiões [8]); extrair o contorno de cada região segmentada (caso necessário, o médico especialista deve efetuar o ajuste do contorno obtido); e montar um vetor de características composto pelo descritor CSS. De posse deste vetor de características, o sistema procura, em um banco de dados previamente alimentado, pelos 199

vetores mais semelhantes (usando a distância euclidiana [23] entre os vetores como métrica: quanto menor for o valor desta distância, mais semelhantes serão os vetores), e retorna as imagens associadas a estes vetores. 3.6. Digital Database for Screening Mammography (DDSM) O banco de dados de imagens utilizado para os testes do sistema CBIR é o Digital Database for Screening Mammography (DDSM) [24]. Esta base de dados é muito utilizada como benchmark em vários artigos [25] por ser gratuita, estar disponível na Internet e conter uma grande quantidade e diversidade de casos. Todas as imagens possuem informações técnicas e clínicas, dentre as quais pode-se citar a idade da paciente, o digitalizador utilizado (bem como a resolução, o número de linhas, de pixels por linha e de bits por pixel com que foram adquiridas as imagens), o tipo das lesões (de acordo com o padrão BI-RADS [26]) e as patologias identificadas. O padrão BI-RADS classifica os achados em mamografias pelas variações das formas e dos contornos mais comuns em nódulos de mama (Figura 4). Tumores malignos geralmente infiltram o tecido adjacente, resultando em um contorno irregular. Espiculações, margens anguladas e irregulares dos contornos são características que indicam malignidade nos tumores de mama, enquanto que, geralmente, nódulos de limites precisos, arredondados ou ovalados são benignos [27]. Analisando o contorno de um tumor, é possível iniciar uma hipótese diagnóstica que aponte a malignidade do mesmo. Figura 4. Classificação BI-RADS de formas e contornos em nódulos de mama. 4. Resultados O processamento e busca de uma imagem mamográfica no SIAD-M inicia-se ao carregar a mesma para o sistema. A Figura 5 mostra alguns dos algoritmos implementados no SIAD-M usando a interface do ImageJ, juntamente com uma imagem de mamografia após a mesma ser carregada para o sistema. A região do achado é delimitada, pré-processada (através do filtro da mediana do próprio ImageJ), o achado é segmentado utilizando-se o algoritmo de crescimento de regiões e seu contorno é extraído (Figura 6). Os contornos dos achados mamográficos e os descritores CSS correspondentes a estes contornos são extraídos e armazenados no banco de dados do sistema de forma automática. Apenas a etapa de delimitação do achado é feita de forma não automática, sendo executada pelo usuário do sistema. Na busca, o usuário utiliza uma imagem como query. O sistema, então, compara as características extraídas desta imagem com as características das imagens armazenadas no banco de dados e retorna uma lista com as imagens mais semelhantes à imagem usada como query. Um especialista que esteja inseguro em um diagnóstico pode 200

VII Workshop de Informática Médica - WIM 2007 utilizar esta opção para encontrar imagens semelhantes (e corretamente diagnosticadas) ao caso sob análise e melhorar a acurácia do seu laudo através de comparações. Figura 5. Menu do SIAD-M (esquerda) e imagem mamográfica (direita). Para testar o CBIR foram usadas 20 imagens aleatóriamente selecionadas do DDSM (dez com achados benignos e as restantes com achados malignos). Imagens de microcalcificações não foram utilizadas, pois o SIAD-M está voltado para achados que obedeçam aos padrões de forma e contorno do BI-RADS. Os resultados estão apresentados na Tabela 1 (a imagem de query usada possuia características benignas) e na Tabela 2 (a imagem de query usada possuia características malignas). O banco de dados foi alimentado tanto com imagens de características benignas quanto malignas. Figura 6. Achado delimitado (esquerda), achado segmentado (centro) e seu contorno (direita). Tabela 1. Resutados da busca por imagens benignas no banco de dados. Imagens Benignas Usadas na Query B_3473_1.LEFT_MLO C_0417_1.LEFT_CC C_0474_1.RIGHT_MLO C_0480_1.LEFT_CC_0 C_0480_1.LEFT_CC_1 C_0480_1.LEFT_MLO_1 C_0484_1.RIGHT_MLO C_0504_1.LEFT_CC C_0504_1.LEFT_MLO C_0510_1.RIGHT_CC Imagens Retornadas Tipo do Achado Acerto B_3473_1.LEFT_CC C_0312_1.LEFT_CC C_0312_1.LEFT_CC C_0312_1.LEFT_CC B_3473_1.LEFT_CC B_3473_1.LEFT_CC C_0003_1.RIGHT_CC C_0510_1.RIGHT_MLO B_3473_1.LEFT_CC C_0003_1.RIGHT_CC Maligno Maligno Não Não Os testes de busca utilizando imagens benignas e malignas foram efetuados procurando-se por imagens de achados semelhantes. Estas buscas obtiveram acertos de 201

80% e 70%, respectivamente. Na média, o CBIR do SIAD-M acertou em 75% dos casos, o que, para um primeiro teste, pode ser considerado satisfatório. Tabela 2. Resultados da busca por imagens malignas no banco de dados. Imagens Malignas Usadas na Query Imagens Retornadas Tipo do Achado Acerto C_0002_1.LEFT_CC C_0001_1.RIGHT_CC Maligno C_0003_1.RIGHT_MLO C_0417_1.LEFT_MLO Não C_0004_1.RIGHT_MLO C_0480_1.LEFT_MLO_0 Não C_0006_1.LEFT_MLO C_0011_1.RIGHT_MLO Maligno C_0006_1.RIGHT_CC C_0312_1.LEFT_MLO Não C_0007_1.LEFT_CC C_0003_1.RIGHT_CC Maligno C_0009_1.RIGHT_MLO C_0003_1.RIGHT_CC Maligno C_0011_1.RIGHT_CC C_0001_1.RIGHT_CC Maligno C_0014_1.RIGHT_CC C_0011_1.RIGHT_MLO Maligno C_0014_1.RIGHT_MLO C_0002_1.LEFT_MLO Maligno 5. Discussões e Conclusões Este trabalho apresentou um sistema CAD com vários algoritmos para processamento de imagens e uma ferramenta CBIR baseada no descritor CSS. Alguns dos diferenciais desta abordagem incluem o fato do sistema possuir arquitetura aberta, extensibilidade e portabilidade, pois o mesmo é construído sobre o software de domínio público ImageJ. No estágio atual, o sistema posui algumas limitações que deverão ser sanadas em breve, visto que o mesmo é constantemente aperfeiçoado. Pelos resultados apresentados, utilizar o SIAD-M na análise e na busca de imagens mamográficas é de grande valia para o médico especialista. Embora alguns erros tenha sido obtidos durante o uso do SIAD-M como CBIRS, isto pode ser creditado à grande variabilidade das formas e contornos nos achados mamográficos, a qual confunde até mesmo médicos especialistas na área. Espera-se, em uma próxima etapa, utilizar um número maior de tumores de mama nos testes, bem como avaliar melhor o uso de outros parâmetros, tais como a circularidade e a Curvatura Completa em Espaço de Escala (Full Curvature Scale Space, FullCSS) [28] para separar melhor tumores de contorno regular e irregular, resultando em uma maior taxa de acertos. 6. Agradecimentos Ao Conselho Nacional de Pesquisa, CNPq, e ao PET/DEPEM/SESu/MEC, pelo auxílio financeiro e na forma de bolsas. A Guilherme Costa Guedes Pereira, médico, pelo auxilio na avaliação da segmentação dos achados mamográficos. 7. Referencias [1] Doi, K. (2006); Diagnostic imaging over the last 50 years: research and development in medical imaging science and technology. Phys Med Biol, v. 51, n. 13, pp. 5-27. [2] Antani, S.; Kasturi, R.; Jain, R. (2002); A survey on the use of pattern recognition methods for abstraction, indexing and retrieval of images and video. Pattern Recognition, v. 35, n. 4, pp. 945-965. [3] Ministério da Saúde. Secretaria de Atenção à Saúde. Instituto Nacional do Câncer. Coordenação de Prevenção e Vigilância (2005), Estimativa 2006: Incidência de câncer no Brasil, Rio de Janeiro. [4] Godinho, E. R.; Koch, H. A. (2004); Rastreamento do câncer de mama: aspectos relacionados ao médico. Radiol Bras, v. 37, n. 2, pp. 91-99. [5] Crespo, T. M.; Galbán A. T. (1995); Valor de la mamografia em el diagnóstico del cáncer de mama. Acta Cancerol, n. 25, pp. 126-128. [6] Azevedo-Marques, P. M. de (2001); Diagnóstico Auxiliado por Computador na Radiologia. Radiol Bras, v. 34, n. 5, pp. 285-293. 202

[7] Zaharescu, E. (2005); Medical Image Enhancement using Logarithmic Image Processing. In: Proceedings of the Visualization, Imaging, and Image Processing (VIIP 2005), v. 1, p. 480. [8] Gonzalez, R. C.; Woods, R. E. (2001); Digital Image Processing (2 nd Ed), Prentice Hall. [9] Howarth, P.; Yavlinsky, A.; Heesch, D.; Rüger, S. (2004); Visual Features for Content-Based Medical Image Retrieval, 5th Workshop of the Cross-Language Evaluation Forum (CLEF 2004) Working Notes, 15-17 September, Bath, UK. [10] Sampat, M. P.; Bovik; A. C. (2003); Detection of Spiculated Lesions in Mammograms. In: Proceedings of the 25th Annual International Conference Of the IEEE Engineering in Medicine and Biology Society, Cancun, Mexico, pp. 100-105. [11] Chang, N.-S.; Fu, K.-S. (1980); Query-bypictorial-example. IEEE Transactions on Software Engineering, SE. 6, n. 6, pp. 519-524. [12] Niblack, W.; Barber, R.; Equitz, W.; Flickner, M. D.; Glasman, E. H.; Petkovic, D.; Yanker, P.; Faloutsos, C.; Taubin, G. (1993); QBIC project: querying images by content, using color, texture, and shape. In: Niblack, W. (Ed.), Storage and Retrieval for Image and Video Databases, SPIE Proceedings, v.1908, pp. 173-187. [13] Batista, L. V.; Meira, M. M. (2004); Texture classification using the Lempel-Ziv-Welch algorithm. In: Proceedings of the 17th Brazilian Symposium on Artificial Intelligence, pp. 444-453. [14] Mokhtarian, F.; Abbasi, S.; Kittler, J. (1996); Robust and efficient shape indexing through curvature scale space. In: Proc. British Machine Vision Conference, Edinburgh, UK, pp. 53-62. [15] Hare, J. S. (2006); Saliency for Image Description and Retrieval. Ph.D. Thesis, Faculty of Engineering, Science and Mathematics, School of Electronics and Computer Science, University of Southampton. Southampton, Hampshire, England. [16] U. S. National Institutes of Health (2006); ImageJ. Disponível em <http://rsb.info.nih.gov/ij/index.html>. Consultado em [01 de fevereiro de 2007]. [17] International Organisation for Standardisation (2004); MPEG-7 Overview (version 10). ISO/IEC JTC1/SC29/WG11N6828, Coding of Moving Pictures and Audio, Palma de Mallorca. [18] Almeida, C. W. D. de; Poel, J. v d; Batista, L. V (2005); Análise de Formas Baseada no Método da Curvature Scale Space Para Tumores de Câncer de Mama. In: Anais do V Workshop de Informática Médica WIM'05, Porto Alegre, v. 1. p. 1-4. [19] Pavlidis, T. (1980); Algorithms for shape analysis of contours and waveforms. IEEE Trans. Pattern Analysis and Machine Intelligence, v. 2, n. 4, pp. 301-312. [20] Freeman, H.; Saaghri, A. (1978); Generalized chain codes for planar curves. In Proceedings of the 4th International Joint Conference on Pattern Recognition, pp. 701-703. [21] Nixon, M. S.; Aguado, A. S. (2002); Feature Extraction and Image Processing (2nd Ed), Elsevier/Newnes/Butterworth-Heinemann, Oxford, United Kingdom. [22] Zhang, D., Lu, G. (2001), Content-Based Shape Retrieval Using Different Shape Descriptors: A Comparative Study. In: Proceedings of 2001 IEEE International Conference on Multimedia and Expo (ICME'01), v. 1, p. 289. [23] Salkind, N. J. (2006). Encyclopedia of Measurement and Statistics. Thousand Oaks (CA): Sage Publications, Inc. [24] Heat, M.; Bowyer, K.; Kopans, D.; Moore, R.; Kegelmeyer, P. (2000); The digital database for screening mammography. In: Digital Mammography Proceedings of the 5th International Workshop on Digital Mammography (IWDM2000), Yaffe, M. J. (Ed.), Toronto, pp. 212-218. [25] Bovis, K., Singh, S. (2002), Classification of mammographic breast density using a combined classifier paradigm. In: Proceedings of the 2002 Medical Image Understanding and Analysis, pp. 177-180, University of Portsmouth. [26] American College of Radiology (2003). Breast Imaging Reporting and Data System (BI-RADS ) Atlas. 5th Ed., Reston, VA. [27] Azevedo, C. M. (1994). Manual de radiologia da mama. Rio de Janeiro: INCa/Du Pont/Microservice. [28] Poel, J. v. d.; Batista, L. V.; Almeida, C. W. D. de, (2006); A New Multiscale Curvature-Based Shape Representation Technique For Content-Based Image Retrieval. In: Proceedings of the International Conference on Computer Vision Theory and Applications, Setúbal, v.1, pp. 100-105. 203