ISSN 1981-6251, p. 372-378 INFLUÊNCIA DA COMPRESSÃO JPEG NA DETECÇÃO DE BORDAS EM IMAGENS DIGITAIS JOÃO BATISTA TAVARES JÚNIOR ELMO LEONARDO XAVIER TANAJURA JORGE A. SILVA CENTENO Universidade Federal do Paraná UFPR Setor de Ciências da Terra, Curitiba - PR Curso de Pós-Graduação em Ciências Geodésicas joaotavaresjunior@yahoo.com.br elmotanajura@yahoo.com.br centeno@ufpr.br RESUMO Em função do crescente volume de dados utilizados na fotogrametria e sensoriamento remoto, a compactação de imagens passou a ser uma prática comum para o armazenamento e transmissão de imagens. Um dos métodos mais comuns de compactação é o formato JPEG. Este formato atinge um maior grau de compressão quando são toleradas perdas nos dados. Neste artigo é apresentado um estudo que aborda o efeito da compressão JPEG no resultado da detecção de bordas. Para isto, diferentes graus de compressão são aplicados a uma imagem, a qual é posteriormente submetida ao processo de detecção de bordas. Resultado é depois comparado com o resultado obtido com uma imagem sem compressão. ABSTRACT Because of the increasing amount of data that is used in photogrammetry and remote sensing, the use of compression algorithms is a common practice for storing and data transmission. One of the most popular algorithms is the JPEG compression. Using the JPEG compression, high compression rates can be obtained when loss of information is tolerated. In the present paper, we present a study aimed at the evaluation of the effect of the JPEG compression on the edge detection process. Therefore, different levels of compression with information loss are applied to digital images, which are later used to detect borders. The results are compared to the result obtained with an image without information loss. 1 INTRODUÇÃO Com a evolução tecnológica, alguns sensores têm sido desenvolvidos com a possibilidade de capturar dados com resolução espacial e espectral mais fina. Os produtos resultantes proporcionam uma grande melhoria no monitoramento e planejamento dos recursos naturais e do uso e cobertura da superfície terrestre, por possibilitar uma descrição mais detalhada da superfície da terra. Por outro lado, a quantidade de dados gerados por estes sensores exige um maior espaço para o seu armazenamento e transmissão. Em busca de soluções, pesquisadores indústria vêm desenvolvendo métodos capazes de diminuir o tamanho dos dados, sendo o padrão JPEG (Joint Photographic Experts Group) bastante conhecido entre os usuários de imagens digitais. Este método de compressão tem suas origens nos estudos de um processo denominado compressão de largura de banda que consiste na redução da largura da banda de transmissão de vídeo desenvolvida a partir de métodos analógicos. O padrão JPEG permite a redução da redundância, fazendo com que os arquivos digitais fiquem menores. Uma alta taxa de compressão é atingida quando se tolera uma certa perda de dados. A perda de dados é uma crítica muito comum ao uso deste tipo de compressão em sensoriamento remoto pelo fato de não haver a possibilidade de reconstituir os valores originais. Isto se aplica plenamente quando a finalidade do estudo envolve a análise dos dados contidos nos pixels para fins de interpretação. Porém, em estudos que envolvem a extração de informação geométrica, a degradação radiométrica dos dados passa a ser uma questão secundária. Estudos do efeito da compressão de imagens em processos de obtenção de informações são necessários para avaliar as conseqüências da perda de informação decorrente da compressão JPEG. Por exemplo, segundo Centeno et al. (2003), a compressão de imagens com perdas JPEG tem baixa influência na eficiência da identificação da posição de padrões por correlação,comprovando ser mínimo mesmo para altos fatores de compressão com perda. No processamento digital de imagens, uma técnica muito empregada é a detecção de bordas. A distinção de bordas permite identificar pixels que compõem as
fronteiras naturais de objetos nas imagens. Agrupando estes pixels em regiões, este processo permite localizar os objetos contidos na imagem, definindo desta forma propriedades como área, perímetro e forma. O objetivo deste trabalho é avaliar o efeito da compressão JPEG com perdas no resultado da detecção de bordas em imagens digitais. 2 COMPRESSÃO DE IMAGENS A compressão de imagens reduz a quantidade de dados que são necessários para representar uma dada imagem digital. A compressão de dados fundamenta-se em eliminar a redundância de dados, eliminando a redundância de codificação, redundância interpixels e redundância psicovisual (Gonzalez, 2000). Redundância de codificação pode ser assumida como uma variável discreta rk no intervalo de [0,1] representada pelos níveis de cinza de uma imagem. O comprimento médio das palavras de código atribuídas aos vários valores de níveis de cinza é encontrado pelo somatório do produto do número de bits utilizados para representar cada nível de cinza e a probabilidade em que o nível de cinza ocorre. Redundância interpixel é a correlação resultante das relações geométricas ou estruturais entre os objetos na imagem. Redundância psicovisual é a eliminação de variações de intensidade que o olho não percebe numa área de intensidade constante. Tal fenômeno resulta do fato de que o olho não responde com a mesma sensibilidade a todas as informações visuais. A eliminação dos dados psicovisualmente redundantes resulta em perda de informação quantitativa, sendo comumente denominada quantização (Carvalho et al., 2001). 2.1 Compressão JPEG A Consultative Commitee of International Telephone and Telegraph (CCIT) e a International Standardization Organization (ISO) colaboraram no desenvolvimento da padronização mais popular e completa de imagens estáticas e tons contínuos chamada Joint Photographic Experts Group (JPEG). A padronização JPEG define três diferentes sistemas de codificação: (01) um sistema de codificação linha base, com perdas, que baseia na transformação discreta do coseno (DCT) e é adequado à maioria das aplicações de compressão; (02) um sistema de codificação estendido para aplicações de maior precisão, maior compressão e de reconstrução progressiva; e (03) um sistema de codificação independente sem perdas para compressão reversível. Para ser compatível com JPEG, um produto ou sistema deve incluir suporte para o sistema linha base. Nenhum modelo particular de formato de arquivo, resolução espacial ou de espaço de cores é especificado (Gonzalez, 2000). No sistema linha base, freqüentemente chamado de sistema linha base seqüencial, a precisão de entrada e saída são limitadas a 8 bits, enquanto os valores quantizados da DCT são restritos a 11 bits. A própria compressão é realizada em três passos seqüenciais: a computação da DCT, quantização e atribuição do código de tamanho variável. A imagem é em primeiro lugar subdividida em blocos de pixel de tamanho 8 x 8, que são processados da esquerda para a direita e de cima para baixo. Na medida em que cada bloco ou sub-imagem 8 x 8 é encontrado, seus 64 pixels têm seus níveis deslocados, subtraindo-se a quantidade 2 n 1 n, em que 2 é o maior número de níveis de cinza. A transformada discreta do co-seno bidimensional do bloco é então computada, quantizada de acordo com a Equação 01 e reordenada, usando um padrão ziguezague para formar uma seqüência unidimensional de coeficientes quantizados ^ ( ^ ( T ( u, u, = round Z( u, T (1) onde T u, é uma aproximação limiarizada e quantizada de T ( u, e Z é a matriz de normalização da transformada (Gonzalez, 2000). A compressão é realizada devido ao fato de que uma grande quantidade de informação sobre o nível de cinza (NC) de um pixel pode ser obtida pela análise da vizinhança devido à alta correlação dos valores dos pixels adjacentes. Então os pixels da imagem podem ser representados por uma menor quantidade de NCs (representando um menor número de bits) especialmente os que alcançam o nível 256, através da remoção ou redução da correlação entre estes pixels (Li et al., 2002). 3 DETECÇÃO DE BORDAS A idéia por trás da maioria das técnicas para a detecção de bordas é a computação de um operador local diferencial, sendo que a primeira derivada em qualquer ponto da imagem é obtida usando-se a magnitude do gradiente naquele ponto. O operador gradiente de uma imagem f ( x, y) na posição ( x, y ), é dado pelo vetor f G = G x y f = f x y (2) O vetor gradiente, aponta na direção de mudança mais rápida de f na posição ( x, y). Geralmente, este gradiente é dado pela aproximação do gradiente com valores absolutos: (3) f G x + G y
Gonzalez (2000) sugere que para calcular o vetor gradiente, pode-se aplicar as derivadas baseadas nas máscaras de Sobel, sendo expressas pelo computo de G x fator de compressão de 90:1 e a Figura 2-c o efeito do fator de compressão 99:1. e G onde: y G x ( z7 + 2z8 + z9 ) ( z1 + 2z2 + z3) G y ( z3 + 2z6 + z9 ) ( z1 + 2z4 + z7 ) = (4) = (5) Neste caso os valores de z são os valores dos pixels de uma janela de 3 x 3 em torno do pixel central (Figura 1). A utilização do filtro de Sobel tem como vantagem a eliminação dos efeitos de diferenciação e a suavização numa única operação. z 1 z 2 z 3-1 -2-1 -1 0 1 z 4 z 5 z 6 0 0 0-2 0 2 z 7 z 8 z 9 1 2 1-1 0 1 (a) (b) (c) Figura 1 (a) vizinhança 3x3; (b) máscara usada no cômputo de G x ; (c) máscara usada no cômputo de G y. 4 EXPERIMENTOS Para ilustrar este trabalho, foi utilizada uma imagem do sensor QuickBird que cobre a região do Jardim Botânico de Curitiba PR. A escolha desta região, deve-se ao fato da sua variação de textura e forma. Os experimentos realizados foram aplicados apenas na imagem da banda pancromática, a qual foi convertida de 16 bits para 8 bits, sofrendo assim uma perda psicovisual. A imagem de 8 bits (Figura 2-a) foi tida como padrão, dando origem a mais onze imagens, cada uma delas resultado da aplicação de diferentes fatores de compressão, como mostra a tabela 1. Estes valores representam um fator da qualidade (denominado fator Q) que expressa a compactação da imagem (Mendonça Júnior, 2002). O efeito da compressão no tamanho do arquivo pode ser observado na Tabela 1. Tabela 1 Efeito da compactação JPEG no tamanho do arquivo. Fator de Tamanho (KB) % de compactação Compressão Imagem Padrão 252 100 1:1 163 35,3 10:1 78 69,0 20:1 56 77,8 30:1 46 81,7 40:1 40 84,1 50:1 35 86,1 60:1 31 87,7 70:1 26 89,7 80:1 21 91,7 90:1 13 94,8 99:1 4 98,4 Figura 2-a - Detalhe da imagem Padrão. Figura 2-b - Detalhe da imagem com um fator de compressão de 90:1. Figura 2-c - Detalhe da imagem com um fator de compressão de 99:1. O operador de Sobel foi implementado em ambiente MatLab para realizar os testes de detecção de bordas. Para a eliminação de ruídos, foi adotado um limiar de 40. Para análise visual do comportamento das bordas, foi efetuando a composição colorida das imagens segmentadas na tela do computador, utilizando a combinação da banda padrão segmentada na primeira e terceira componente R (red) e B (blue), e na segunda componente G (green) utilizou-se imagem segmentada e limiarizada provinda da imagem compactada. Nas Figuras 3 e 4, podem-se observar os efeitos da compressão, onde a cor magenta representa as bordas da imagem padrão, o verde representa as bordas da imagem teste, o branco, representa as regiões de sobreposição das bordas, ou seja os locais onde as bordas são coincidentes. A Figura a-a mostra um recorte da imagem original, sem compressão. A figura 2-b ilustra o efeito do
forma que o resultado mostra a distância de cada pixel de borda à borda da imagem original. 5 RESULTADOS E DISCUSSÕES Figura 3 Visualização do efeito da compressão com um fator de 90:1 na detecção de bordas. Figura 3 Visualização do efeito da compressão com um fator de 99:1 na detecção de bordas. Para efetuar a análise quantitativa destas informações, comparou-se as bordas obtidas da imagem padrão com as provindas das imagens compactadas. Para quantificar a diferença entre as imagens, calculou-se a distância média entre as bordas obtidas na imagem compactada e a imagem original. Para isto, foi definida uma imagem onde os pixels armazenam o valor da distância do pixel à borda na imagem de referência, como é mostrado na figura 5. A distância máxima admitida ` e de 3 pixels. Na imagem da figura 5, a cor branca representa os pixels na borda original,a cor vermelha representa os pixels com afastamento de 01 pixel da borda original, a cor verde representa os pixels afastados de 02 pixels da borda original e a cor azul representa os pixels afastados 03 pixels da borda original. Os resultados apresentados para análise visual, mostram os efeitos da compressão JPEG, podendo observar o surgimento de algumas bordas e o desaparecimento de outras. A Figura 4 é resultante da combinação das bordas da imagem que foi compactada com um fator de compressão igual a 99:1 com as bordas da imagem padrão, ela mostra que o padrão JPEG tende a orientar as bordas na vertical e horizontal, descaracterizando as bordas originais. Como pode observar na Figura 6-g, a compressão JPEG forma quadrados uniformes na imagem, degradando a sua qualidade e descaracterizando as bordas originais. Isto acontece devido ao fato que a compressão JPEG introduzir uniformidade nas regiões onde a variação dos valores digitais é pequena, ou seja, nas áreas uniformes da imagem. Já nas áreas onde a variação dos valores digitais é maior, ela introduz uma forte suavização. Os efeitos nas bordas podem ser visualizados nas Figuras 6-a; 6b; 6-c; 6- d; 6-e; 6-f. Figura 6-a - Detalhe imagem padrão. Figura 5 - Detalhe da mascara para contar os pixels deslocados. Esta imagem foi multiplicada com a imagem resultante da segmentação da imagem compactada, de Figura 6-b Detalhe das bordas detectadas na imagem padrão.
Figura 6-c - Detalhe imagem compactada com um fator de 1:1. Figura 6-f - Detalhe das bordas detectadas na imagem compactada com um fator de 90:1. Figura 6-d - Detalhe das bordas detectadas na imagem compactada com um fator de 1:1. Figura 6-g - Detalhe imagem compactada com um fator de 99:1. Figura 6-e - Detalhe imagem compactada com um fator de 90:1. Figura 6-h Detalhe das bordas detectadas na imagem compactada com um fator de 99:1.
A análise comparativa, da mascara com as bordas das imagens compactadas, possibilitou efetuar a contagem dos pixels que coincidem com a borda da imagem padrão e dos que coincidem com as casas vizinhas, possibilitando efetuar uma análise quantitativa. Os valores encontrados podem ser vistos na Tabela 2. 85.000 75.000 Tabela 2 Quantização dos pixels por região da mascara. Número de pixels por região Fator de 0 1 2 3 Compressão Mascara 80247 69678 34884 20724 Imagem padrão 80247 0 0 0 1:1 59036 21411 46 6 10:1 59081 21310 181 37 20:1 59074 21375 355 48 30:1 59090 21430 435 61 40:1 58938 21616 569 77 50:1 59048 21760 613 97 60:1 59016 21762 802 123 70:1 58876 21990 1010 163 80:1 58222 22407 1509 267 90:1 56319 23157 2657 659 99:1 34508 17253 4704 1813 O Gráfico 1 mostra que para o fator de compressão igual a 1:1, a quantidade de pixels que não coincide com a borda original, é aproximadamente igual à quantidade de pixels que surgiu na borda afastada de 01 casa da borda original e que para as duas casas seguintes, esta quantidade pode ser considerada insignificante. A relação entre a quantidade de pixels permanente na borda original e com uma casa afastada, permanece até o fator de compactação de 80:1, sendo que a quantidade de pixels surgidos nas duas casa vizinhas aumentam gradativamente. 65.000 55.000 45.000 35.000 25.000 15.000 5.000-5.000 0 1 10 20 30 40 50 60 70 80 90 99 Borda Original Deslocamento de 02 pixel Fat or de compressão Deslocamento de 01 pixel Deslocamento de 03 pixel Gráfico 1: Número de pixels em função da distância. A contagem de incidência em cada caso, possibilitou efetuar a relação em porcentagem de ocorrência, podendo ser observadas na Tabela 3. Tabela 3 Percentagem do número de pixels encontrados por região da mascara. % de número de pixels por região Fator de 0 1 2 3 Compressão Imagem padrão 100 0 0 0 1:1 73,57 26,68 0,06 0,01 10:1 73,62 30,58 0,52 0,18 20:1 73,62 30,68 1,02 0,23 30:1 73,64 30,76 1,25 0,29 40:1 73,45 31,02 1,63 0,37 50:1 73,58 31,23 1,76 0,47 60:1 73,54 31,23 2,30 0,59 70:1 73,37 31,56 2,90 0,79 80:1 72,55 32,16 4,33 1,29 90:1 70,18 33,23 7,62 3,18 99:1 43,00 24,76 13,48 8,75 Os resultados desta tabela foram plotados em um gráfico (Gráfico 2), onde visualiza melhor a degradação das bordas com o aumento do valor do fator de
compressão, podendo avaliar melhor o surgimento das bordas nas casas 02 e 03. Do fator de compressão de 90:1 para o de 99:1, nota-se uma queda brusca dos pixels coincidentes com a borda detectada na imagem padrão e o aumento de bordas deslocadas. 100 A emprese TESE Tecnologia em Sistemas Espaciais, pela disponibilidade da imagem para a realização deste trabalho. REFERÊNCIAS CENTENO, J. A. S.; MACHADO, A. M. L.; PEDRO, P. C. O efeito da compressão de imagens no processo de correlação digital. Série em Ciências Geodésicas, V. 3, p. 332-344, 2003. 90 80 70 GONZALES, R. C.; WOODS, R. E. Digital image processing, first ed. Wesley Publishing Company Inc. Tradução para a lingual portuguesa: Júnior, R. M. C.; Costa, L. F.; São Paulo: Editora Edgard Blücher Ltda, 2000. 508p. ISBN 85-212-0264-4 60 50 CARVALHO, C. A.; MENEGUETTE, M. Jr.; SILVA, E. A. A influencia do espaço de cores na compressão JPEG de imagens orbitais. Revista Brasileira de Cartografia, V. 1, nº55, p. 40-47, 2003 40 30 LI, Z.; YUAN, X.; LAM, K. W. K. Effects of JPEG compression on the accuracy of photogrammetric point determination. Photogrammetric Engineering & Remote Sensing. V. 68, n. 8, p. 847-853, 2002. 20 10 0 0 1 10 20 30 40 50 60 70 80 90 99 Fat or de compressão MENDONÇA JÚNIOR, M. G. Estratégias para Geração Semi-Automática de Modelos Digitais do Terreno Visando seu Emprego no Mapeamento Sistemático. Rio de Janeiro : Instituto Militar de Engenharia, Dissertação (mestrado) 2002. Borda Original Deslocamento de 02 pixel Deslocamento de 01 pixel Deslocamento de 03 pixel Gráfico 2: Percentagem do número de pixels quantizados por região da mascara. 6 CONCLUSÃO Os resultados apresentados pelos experimentos, mostraram que o padrão JPEG influencia o posicionamento das bordas, tendendo a orientá-la na vertical e horizontal à medida que o fator de compressão aumenta, provocando a perda dos cantos arredondados. Para um valor de 99:1 do fator de compressão, as bordas da imagem são completamente deformadas apresentando somente bordas verticais e horizontais totalmente deslocadas. No entanto, o padrão JPEG pode ser empregado para compactar imagens digitais com um fator entre 1:1 à 10:1, ocorrendo uma redução do tamanho do arquivo entre 35 a 69%, não tendo efeitos significativos no posicionamento das bordas. AGRADECIMENTOS