Compressão Com Controle de Perdas de Imagens Mamográficas Utilizando Segmentação e o Algoritmo PPM José R. T. Marques 1, JanKees v. d. Poel 3, Yuri de A. M. Barbosa 1, 4, Fabrizia M. de S. Matos 2, 5 1, 2, 3, 4, Leonardo V. Batista 1 Departamento de Informática, Universidade Federal da Paraíba Brasil 2 Programa de Pós-graduação em Informática, Universidade Federal da Paraíba Brasil 3 Programa de Pós-graduação em Eng. Mecânica, Universidade Federal da Paraíba Brasil 4 Programa de Educação Tutorial, Departamento de Modernização e Programas da Educação Superior, Secretaria de Educação Superior do Ministério da Educação - PET/DEPEM/SESu/ MEC - Brasil 5 Coordenação de Informática, Centro Federal de Ensino Tecnológico da Paraíba - Brasil Abstract. This work describes a mammographic image compression method that uses segmentation and the Prediction by Partial Matching (PPM) data compression algorithm, together with a bit plane image decomposition. The method allows controlling the amount of acceptable distortion, including the possibility of lossless compression and progressive reconstruction (lossy-tolossless compression). The compressor will be included in a Computer-Aided Diagnosis System which is still being developed. Resumo. Este trabalho descreve um método de compressão de imagens mamográficas que utiliza segmentação e o algoritmo de compressão de dados Prediction by Partial Matching (PPM), juntamente com decomposição da imagem em planos de bits. O método permite o controle sobre o grau de distorção aceitável, incluindo a possibilidade de compressão sem perdas e reconstrução progressiva (compressão com perdas a sem perdas em fluxo único). O compressor será futuramente incluído em um sistema de Diagnóstico Auxiliado por Computador ainda em desenvolvimento. 1. Introdução e Motivação O câncer de mama é a principal causa de óbitos por câncer na população feminina brasileira. A Organização Mundial de Saúde (OMS) recomenda o rastreamento em massa para enfermidades que constituam problemas sérios de saúde pública, desde que sua detecção precoce leve à redução da morbidade e da mortalidade, como é o caso do câncer de mama. O diagnóstico auxiliado por computador Computer-Aided Diagnosis (CAD) [1][2] pode facilitar o trabalho do radiologista e até emitir uma segunda opinião, aumentando as chances de um diagnóstico precoce. A utilização de bancos de dados de imagens mamográficas em formato digital e as práticas de telemedicina trazem a necessidade de armazenar e transmitir grandes quantidades de dados. A título de ilustração, a digitalização das imagens de um único exame mamográfico com duas incidências (médio-lateral oblíqua e crânio-caudal) por 186
mama e utilizando uma resolução adequada ao diagnóstico pode produzir até 120 MBytes de dados. O problema torna-se ainda mais relevante quando se tem em mente que uma única clínica de porte médio pode efetuar diariamente dezenas de exames mamográficos. Os fatos acima expostos indicam que o emprego de técnicas eficientes de compressão de dados é necessário para reduzir custos de armazenamento e transmissão. Entretanto, tais técnicas não devem gerar perdas excessivas de informação clinicamente relevante, pois isto poderia comprometer o diagnóstico médico e a análise das mamografias por sistemas CAD [3]. Este trabalho propõe um método de compressão com perdas de imagens mamográficas que utiliza segmentação e o algoritmo Prediction by Partial Matching (PPM), juntamente com decomposição da imagem em planos de bits. Pretende-se mostrar que a decomposição em planos de bits em associação com um esquema de modelagem avançada produz um esquema de compressão eficaz e traz uma série de benefícios adicionais, tais como a possibilidade de controlar de forma simples e precisa o grau de distorção aceitável e de permitir reconstrução progressiva da imagem, partindo de uma reconstrução de baixa qualidade até reconstrução perfeita. 2. Materiais e Métodos O compressor de dados Prediction by Partial Matching (PPM) [5][6] é uma técnica de codificação por entropia baseada na modelagem estatística adaptativa e na predição por contexto. O PPM é considerado um dos compressores de propósito genérico mais eficazes da atualidade. O modelo PPM utiliza um conjunto de no máximo K símbolos precedentes como contexto para estimar a distribuição de probabilidades condicionais para o próximo símbolo da mensagem. O modelo alimenta um codificador aritmético, que atribui a cada símbolo um número de bits igual a sua informação condicional, que por sua vez depende da probabilidade de ocorrência do símbolo condicionada ao contexto [7]. Assim, o esquema de codificação aritmética é capaz de igualar a entropia da fonte em todos os casos, atingindo compressão máxima para o modelo utilizado [5][7]. A decomposição em planos de bits decompõe uma imagem S de n bits por pixel (ou seja, 2 n níveis de cinza) em n imagens binárias, ou plano de bits, S 0, S 1,, S n-1. Um pixel no plano S i equivale ao i-ésimo bit do pixel na mesma posição em S. A Figura 1 ilustra a decomposição em planos de bits. Nesse exemplo, cada pixel na imagem original possui três bits, assim, a decomposição gera três imagens binárias [4]. O primeiro plano de bits é formado pelos bits mais significativos de cada pixel, e assim sucessivamente. A Figura 2 mostra uma imagem mamográfica e dois dos seus planos de bits: a imagem original, o plano de bits S 8 e o plano de bits S 10. O método de compressão proposto no presente trabalho envolve decompor em planos de bits a imagem mamográfica para, em seguida, comprimir separadamente os planos de bits pelo PPM, adaptado para alfabeto binário, o que reduz drasticamente os requisitos computacionais do compressor. 187
Figura 1. Decomposição de uma imagem em planos de bits. (a) (b) (c) Figura 2. Imagem mamográfica e dois dos seus planos de bits: (a) Imagem original; (b) Plano de bits S 8; (c) plano de bits S 10. Com o intuito de melhorar a razão de compressão (RC), o background foi separado da região da mama através de segmentação por limiarização. Se L é um valor de limiar escolhido de acordo com as características do background da imagem mamográfica, cada píxel da imagem é classificado como pertencente à região da mama se tiver seu valor maior que L; caso contrário é classificado como background. O processo de segmentação baseia-se no fato de que o background, em geral, é a região mais escura da mamografia, cujos pixels normalmente possuem nível de cinza próximos à zero. São criados dois modelos estatísticos diferentes, um para cada região presente na mamografia, o que tende a melhorar a compressão, pois os modelos serão mais específicos para cada região. Uma imagem binária adicional, com bits de valor 1 indicando região de mama e de valor 0 indicando região de background é anexada ao arquivo comprimido, para permitir a descompressão com os modelos corretos para cada pixel. O banco de dados de imagens utilizado para testar o compressor é o Digital Database for Screening Mammography (DDSM) [8]. Esta base de dados vem sendo largamente utilizada como benchmark em vários artigos na área de mamografia [9], por ser de utilização gratuita e conter uma grande quantidade e diversidade de casos, compostos por imagens e informações técnicas e clínicas correspondentes. Para os testes foram escolhidas de forma aleatória quatro imagens dentre aquelas presentes no DDSM [8]. Todas as imagens escolhidas foram digitalizadas por um scanner Lumisys 200 de 12 níveis/pixel e 50 microns. 188
Nas imagens de teste provenientes do DDSM há 2949 níveis de cinza diferentes, codificados em 16 bits de tal forma que assumem valores inteiros entre 0 e 65355. Uma vez que 12 bits seriam suficientes para codificar cada pixel, antes da decomposição em planos de bits os níveis são mapeados para valores inteiros entre 0 e 2948, e representados em 12 bits, gerando 12 planos de bits. O grau de compressão é aferido considerando que as imagens originais têm 12 bits/pixel, e não 16 bits/pixel. Para mensurar o grau de compressão, utiliza-se neste trabalho a Razão de Compressão (RC) definida como: RC= To Tc onde, To e Tc são os tamanhos em bits da imagem original e da imagem comprimida, respectivamente. Em Tc são incluídas todas as informações necessárias à descompressão das imagens. O compressor foi escrito em linguagem Java e dividido em módulos independentes. A arquitetura proposta para o compressor/descompressor está mostrada na Figura 3. Figura 3. Arquitetura do Compressor/ Descompressor Proposto. Uma das formas de introdução de perdas aqui investigadas consiste na remoção total de planos de bits. Sendo um sinal decomposto em planos de bits {S 0, S 1,...,S n-1 }, durante a compressão do sinal, são codificados apenas os n-p planos mais significativos (os demais p planos são descartados), onde p pode assumir valores inteiros entre 0 e n- 1, definindo a intensidade da perda. Assim, se p = 0 nenhum plano é descartado, e se p = n-1, todos os planos exceto o mais significativo são descartados, resultando em uma imagem com apenas dois níveis de cinza por pixel. 189
Uma desvantagem da remoção total de planos de bits é o aumento excessivo na distorção entre o sinal original e o sinal descomprimido. Isso ocorre devido ao fato de que os bits desprezados são simplesmente mantidos em zero durante a reconstrução do sinal. Para reduzir a distorção uma segunda alternativa para introdução de perdas foi aqui estudada: antes da codificação do sinal, é realizado um arredondamento nos valores das amostras. Esse arredondamento consiste em analisar o valor do bit mais significativo a ser desprezado (bit do plano S p-1, p > 0); caso o valor desse bit seja 1, é somado 1 ao valor correspondente ao restante dos bits que irão ser preservados. Para aferição da qualidade do sinal reconstruído após a introdução de perdas, são utilizadas as medidas Mean Square Error (MSE) e Peak Signal-to-Noise Ratio (PSNR): 1 MSE = N N 1 i= 0 [ f ( i) f' ( i) ] 2 2 4095 PSNR = 10log MSE onde, f(i) e f (i) são os valores dos pixels na imagem original e na imagem descomprimida respectivamente e 4095 é o valor máximo que um píxel de 12 bits pode assumir. Como as imagens adquiridas do banco apresentavam 2949 níveis de cinza distribuídos em 16 bits (0 a 65535), não foi possível identificar os valores reais dos pixels. Dessa forma, para obter resultados mais consistentes, antes do cálculo das distorções, as imagens foram mapeadas para 12 bits ocupando valores de 0 a 4095. As imagens obtidas do DDSM continham na região de background algumas informações relacionadas ao exame mamográfico. Após a digitalização, essas informações não são mais úteis, pois podem ser armazenadas de outras formas mais eficientes como um arquivo texto. A presença dessas informações no background causa perda de compressão já que são classificadas como mama, porém não possuem nenhuma similaridade com a região mamária. Assim, essas informações foram removidas manualmente de forma que a imagem resultante apresentasse apenas a região da mama. (a) Figura 4. Informações do Background: (a) Imagem original; (b) Imagem limpa. (b) 190
3. Resultados Experimentais Os testes foram feitos em um microcomputador com processador AMD Sempron 2800+ de 1,6GHz, 1GByte de memória DDR400, disco rígido ATA de 7200RPM, sistema operacional Windows XP com Service Pack 2 e Máquina Virtual Java versão 1.6.0-b105. Uma imagem de 32MBbytes é comprimida/descomprimida em aproximadamente 5 minutos, aí inclusos o tempo de leitura e escrita em disco rígido. Nos testes, o limiar de segmentação utilizado foi L = 0, o que significa que pixels com valor zero são considerados background, e os demais são considerados pixels de mama. Com o limiar L = 0, o background apresentou-se totalmente composto por pixels de valor zero, podendo então ser descartado sem precisar ser comprimido pelo PPM. Já que apenas a região da mama é comprimida e assim é a única região que pode sofrer perdas, as medidas de distorção são calculadas levando-se em conta apenas a região da mama. Nos testes realizados, a utilização de contextos de tamanho máximo 9 resultou numa melhor compressão. Dessa forma, todos os testes a seguir foram realizados utilizando K = 9. As mamografias utilizadas apresentam bastante ruído nos seis planos de bits menos significativos. Com base nessas informações, foram testados vários valores de p variando de p = 0 (compressão sem perdas) até p = 6 (eliminação de seis planos menos significativos ruidosos). As tabelas 1 e 2 apresentam as compressões e distorções obtidas em relação à eliminação de planos. Várias métricas de distorção foram utilizadas para analisar melhor a distorção introduzida nas imagens. Tabela 1. Comparação das compressões e distorções em função do número de planos com perdas sem a utilização de arredondamento. Sem Arredondamento (K = 9) Planos com Perdas 0 1 2 3 4 5 6 RC 4,15 4,69 5,38 6,32 7,65 9,68 13,20 MSE 0,00 0,81 5,26 25,84 113,88 476,55 1952,29 PSNR 168,67 149,88 133,98 119,15 104,84 90,73 Erro Máximo 0,00 2,00 4,00 8,75 18,75 38,00 76,25 Tabela 2. Comparação das compressões e distorções em função do número de planos com perdas com a utilização de arredondamento. Com Arredondamento (K = 9) Planos com Perdas 0 1 2 3 4 5 6 RC 4,15 4,69 5,38 6,32 7,64 9,67 13,16 MSE 0,00 0,81 2,34 8,19 31,56 125,91 501,06 PSNR 168,68 158,02 145,47 131,99 118,14 104,34 Erro Máximo 0,00 2,00 3,00 6,00 12,00 23,25 46,75 191
(a) (b) (c) Figura 5. Eliminação de planos de bits (com arredondamento): (a) Imagem Original; (b) Imagem reconstruída com p = 5; (c) Imagem reconstruída com p = 6. Como pode ser visto na Figura 5, a eliminação de cinco ou seis planos de bits causa baixa distorção visual. Com p = 4, nenhuma distorção seria visível em monitores padrão, de 8 bits de profundidade de cor, nem numa impressão com impressora convencional. Penedo et al. [11] reportam uma RC de 12 com PSNR de no máximo 80,75 enquanto o compressor proposto neste trabalho apresenta uma RC de 13,16 com PSNR de 104,34. Apesar da aparentemente grande vantagem apresentada pelo compressor aqui proposto, essa comparação não é perfeitamente segura, uma vez que as imagens utilizadas para os testes são diferentes. 4. Discussão e Conclusões Este trabalho apresentou um método de compressão com controle de perdas para imagens mamográficas, utilizando segmentação e o algoritmo PPM, juntamente com decomposição em planos de bits. Nos testes foram utilizadas três métricas de distorção muito comuns na literatura, uma vez que nenhuma delas isoladamente permite uma análise adequada da distorção. As tabelas 1 e 2 demonstram uma significativa diminuição das distorções com a utilização do arredondamento, sem prejudicar a compressão. Os resultados alcançados indicam que a decomposição em planos de bits em associação com um esquema de modelagem avançada produz um esquema de compressão eficaz e traz benefícios adicionais, tais como: Extensão imediata para compressão lossy-to-lossless em fluxo único, característica importante para telemedicina. A transmissão progressiva dos planos de bits mais significativos seria muito eficiente. A eliminação de planos excessivamente ruidosos pode até melhorar a qualidade diagnóstica das imagens, ou o desempenho de sistemas CAD. Essa afirmação será verificada futuramente em conexão com o sistema CAD em desenvolvimento pelos autores do presente trabalho, e em avaliações por radiologistas. 192
A eliminação total de planos de bits seguida por arredondamento mostrou-se uma forma simples e eficiente de introduzir perdas. Testes futuros com o compressor deverão avaliar a influência dos padrões de densidade mamária, de acordo com a classificação BI- RADSTM [10], sobre as taxas de compressão. 5. Agradecimentos Ao Conselho Nacional de Pesquisa, CNPq, e ao PET/DEPEM/SESu/ MEC, pelo auxílio financeiro e na forma de bolsas. 6. Referências [1] Almeida, C. W. D.; Poel, J.; Batista, L. V.; Amorim, H. L. E (2005), Análise de Formas Baseada no Método da Curvature Scale Space Para Tumores de Câncer de Mama. In: Anais do V Workshop de Informática Médica, Porto Alegre, v. 1. p. 20-24. [2] Astley, S., Gilbert, F. (2004), Computer-aided Detection in Mammography, Clinical Radiol., n. 59, pp. 390-399. [3] Escarpinati, M. C., Schiabel, H. (2002), Avaliação de Técnicas de Compressão sem Perdas Aplicadas a Imagens Mamográficas Digitais de Mamas Densas. In: Anais do XVIII Congresso Brasileiro de Engenharia Biomédica (CBEB 2002), São José dos Campos, SP, Brasil v. 1, pp. 195-198. [4] Gonzalez, R. C., Woods, R. E. (2002), Digital Image Processing (2nd Ed). Prentice Hall, Inc., Upper Saddle River, New Jersey, USA. [5] Bell, T., Cleary, J., Witten, I. (1984), Data compression using adaptive coding and partial string matching. IEEE Transactions on Communications, v. 32, n. 4, pp. 396-402. [6] Moffat, A. (1990), Implementing the PPM data compression scheme. IEEE Transactions on Communications, v. 38, n. 11, pp. 1917-1921. [7] Shannon, C. E. A Mathematical Theory of Communication. Bell Syst. Tech. J., v. 27, p. 379-423, 1948. [8] Heat, M., Bowyer, K., Kopans, D., Moore, R., Kegelmeyer, P. (2000), The digital database for screening mammography. In: Digital Mammography Proceedings of the 5th International Workshop on Digital Mammography (IWDM2000), Yaffe, M. J. (Ed.), Toronto, pp. 212-218. [9] Heat, M., Bowyer, K. (2000), Mass detection by relative image intensity Digital Mammography. In: Digital Mammography Proceedings of the 5th International Workshop on Digital Mammography (IWDM2000), Yaffe, M. J. (Ed.), Toronto, pp. 219-225. [10]American College of Radiology (2003). Breast Imaging Reporting and Data System (BI-RADS ) Atlas. 5th Edition. Reston, VA. [11] M. Penedo, W. A. Pearlman, P. G. Tahoces, M. Souto, and J. J. Vidal, "Region-Based Wavelet Coding Methods for Digital Mammography," IEEE Trans. on Medical Imaging, Vol. 22, pp. 1288-1296, Oct. 2003. 193