EFEITO DA COMPRESSÃO FRACTAL DE IMAGENS NA ETAPA DE SEGMENTAÇÃO DE UM SISTEMA DE RECONHECIMENTO DE ÍRIS Milena B. P. Carneiro *, Sandreane P. Silva #, Antônio C. P. Veiga, Edna L. Flores, Gilberto A. Carrijo Universidade Federal de Uberlândia, Faculdade de Engenharia Elétrica, Uberlândia-MG * milenabueno@yahoo.com, # popolana1@yahoo.com.br, acpveiga@ufu.br, edna@ufu.br, gilberto@ufu.br Resumo Este artigo tem como objetivo investigar o impacto de uma compressão severa de imagens de íris na etapa de segmentação de um sistema de reconhecimento automático de indivíduos pela íris. A eficiência do algoritmo que localiza a região da íris na imagem é de vital importância para a credibilidade do reconhecimento biométrico e esta é a primeira etapa que pode ser influenciada pela perda de qualidade da imagem a ser processada. Foi utilizada a compressão por fractais que foi aplicada às imagens de um banco de dados público. Dois métodos de localização das bordas circulares da íris e um método de detecção das pálpebras e cílios são avaliados quanto a sua eficiência quando se utiliza imagens comprimidas. Os resultados obtidos com a simulação dos métodos, quando as imagens são submetidas a diversos níveis de compressão, mostram que esta etapa não se apresenta como uma barreira à utilização de imagens comprimidas em um sistema de reconhecimento de íris. Palavras-Chave Biometria, Compressão Fractal, Reconhecimento de íris, Segmentação de Íris. EFFECT OF IMAGE FRACTAL COMPRESSION ON THE SEGMENTATION STAGE OF AN IRIS RECOGNITION SYSTEM Abstract - The objective of this work is to investigate the impact of a severe iris image compression on the segmentation stage of an automatic iris recognition system. The efficiency of the algorithm which localizes the iris region in the image is essential for the credibility of the biometric recognition and this is the first stage which can be influenced by the loss of quality of the processing image. Fractal compression was applied to the images of a public database. Two methods which localize the circular edges of the iris and a method for detection of eyelids and eyelashes have their efficiency evaluated when the images are compressed. The results obtained with the simulations, when the images are submitted to several compression levels, show that this stage does not represent a barrier for the utilization of compressed images in an iris recognition system.1 Nota de rodapé na página inicial será utilizada apenas pelo professor avaliador para indicar o andamento do processo de revisão. Não suprima esta nota de rodapé quando editar seu artigo. Keywords Biometrics, Fractal Compression, Íris Recognition, Íris Segmentation. I. INTRODUÇÃO Biometria é o nome dado às técnicas utilizadas para reconhecer automaticamente uma pessoa através de características físicas e comportamentais do corpo humano como aquelas encontradas na face, impressão digital, geometria da mão, íris, assinatura ou voz. De todas as opções biométricas, o reconhecimento de íris merece uma atenção especial uma vez que a íris contém uma enorme riqueza de informações que são únicas e não mudam com o passar do tempo. Estes fatores podem garantir que seja construído um sistema extremamente confiável e seguro para identificar pessoas. Um sistema de reconhecimento de íris prevê a realização do processamento da imagem do olho em diversos estágios, que são: a segmentação da região da íris na imagem de olho; a normalização da região da íris para lidar com as inconsistências dimensionais; o processo de codificação das características e a etapa de comparação. A eficiência da primeira etapa de processamento, a segmentação, é essencial para o sucesso do processo de reconhecimento de íris, uma vez que, se regiões não pertencentes à íris forem codificadas e processadas, os erros de reconhecimento podem aumentar consideravelmente. Um sistema de reconhecimento de íris exige que sejam armazenados dados relativos a irises para uma posterior comparação. O problema de se armazenar a imagem da íris é que imagens ocupam um grande espaço em disco e demandam uma elevada largura de banda para a transmissão. Existe a alternativa de se armazenar apenas o código gerado a partir das características da íris, que possui um tamanho consideravelmente menor, porém, este código é gerado por algum algoritmo proprietário, o que tornaria o sistema dependente de determinado fornecedor. Atualmente, os órgãos governamentais têm exigido que os dados biométricos sejam gravados e armazenados na forma de imagens, justamente para terem liberdade para negociações. O fato de se armazenar imagens brutas, ou seja, sem que sejam submetidas a nenhum pré-processamento, também apresenta a vantagem de tornar o banco de dados armazenado apto a ser beneficiado com as inevitáveis evoluções dos algoritmos de reconhecimento. Neste contexto, observa-se a necessidade da compressão de imagens em biometria e, ainda, a importância de se conhecer o quanto a imagem capturada pode ser comprimida sem prejudicar o desempenho do sistema de reconhecimento de íris.
Neste trabalho, será verificado o que acontece com a eficiência do algoritmo de segmentação quando as imagens são submetidas a uma compressão severa. Para tal, usa-se o método de compressão fractal que utiliza particionamento quadtree, com o intuito de comprimir as imagens de irises com várias taxas de compressão, analisando até que ponto a compressão seria viável. Na próxima seção, serão apresentados os métodos de segmentação utilizados. Em seguida, na seção III, a técnica de compressão fractal será definida e as particularidades da sua implementação neste trabalho serão detalhadas. Todos os resultados das simulações dos algoritmos, que servirão de base para a avaliação dos métodos, são apresentados na seção IV. Finalmente, na seção V conclui-se o trabalho. II. MÉTODOS DE SEGMENTAÇÃO A. Transformada de Hough A Transformada de Hough é um algoritmo comum de visão computacional que pode ser usado para determinar parâmetros de objetos geométricos simples, como linhas e círculos, presentes em uma imagem. A Transformada de Hough Circular (THC) é capaz de reconhecer círculos presentes em uma imagem e pode ser usada para obter os parâmetros dos círculos que definem a pupila e a borda externa da íris. Estes parâmetros são o raio e as coordenadas do centro do círculo. Para se aplicar a THC, o primeiro passo é converter a imagem, originalmente em níveis de cinza, em um mapa de bordas binarizado. A geração do mapa de bordas é realizada pelo método de detecção de bordas de Canny [1]. Foi utilizada, também, a proposta de Wildes[2] de incorporar informações sobre o gradiente. Wildes sugeriu ponderar os gradientes horizontal e vertical para selecionar faixas de orientação. Os gradientes foram atenuados na direção vertical para evitar interferências decorrentes dos cílios na detecção da borda externa da íris. Para a detecção da pupila, os gradientes horizontal e vertical têm ponderações de mesmo valor. O procedimento de Hough requer a geração de uma matriz de acumulação de votos com o número de dimensões igual ao número de parâmetros necessários para definir a forma geométrica. Para um círculo, o acumulador terá 3 dimensões. As coordenadas do centro x c e y c variam de x cmin até x cmax e de y cmin até y cmax respectivamente, e o raio varia de r min a r max conforme ilustrado na Figura 1. Fig. 1. Acumulador de votos. Na TCH, cada pixel de borda com coordenadas (x,y) no espaço de imagem é mapeado para o espaço de parâmetros determinando-se dois dos parâmetros (por exemplo, x c e y c ) e encontrando-se o terceiro (por exemplo, r), o que resolve a equação do círculo (x-x c ) 2 + (y-y c ) 2 = r 2. Como resultado, o ponto (x c ; y c ; r) é obtido no espaço de parâmetros e representa um possível círculo na imagem. Para cada conjunto de parâmetros obtidos (x c ; y c ; r) o valor do acumulador na posição A(x c ; y c ; r) é incrementado, ou seja, um voto é atribuído àquela posição. Quando todos os pixels forem processados, o valor mais alto do acumulador A, ou seja, a posição que recebeu o maior número de votos, indicará os parâmetros de um provável círculo na imagem. Os raios da borda externa da íris e da pupila têm tamanhos médios diferentes, portanto, a detecção destas duas circunferências é realizada separadamente, ou seja, é necessário aplicar todo o algoritmo para detectar o círculo externo da íris e, então, repetir o processo para a detecção da pupila. Para tornar o processo mais eficiente, a transformada de Hough para a detecção da borda externa é realizada primeiro, e posteriormente, a transformada de Hough para a detecção da pupila é realizada dentro da região da íris, ao invés da imagem inteira, dado que a pupila encontra-se sempre dentro da região da íris. B. Operador Integro-Diferencial John Daugman[3] propôs um operador integro-diferencial para localizar as regiões circulares da íris e da pupila. Este operador é definido pela equação (1). I( x, y) max( r, x0, y0) Gσ ( r) ds (1) r r, x0, y0 2π r Onde I(x,y) é a imagem do olho, r é o raio para procura, G σ (r) representa uma função Gaussiana de suavização e s é o contorno do círculo de raio r e centro em x 0 e y 0. O operador procura pelo caminho circular onde existe a maior mudança nos valores de pixel, quando se varia o raio e as coordenadas x e y do centro do contorno circular. O operador é aplicado iterativamente com o nível de suavização progressivamente reduzindo até se obter uma localização precisa. Embora os resultados de procura de íris recaiam sobre a procura da pupila, não se pode assumir as mesmas concentricidades desses limites. Geralmente, o centro da pupila é nasal e inferior ao centro da íris e seu raio pode variar de 0.1 a 0.8 do raio da íris. Então, os três parâmetros que definem o círculo da pupila devem ser estimados separadamente aos que definem a íris. C. Detecção das Pálpebras e dos Cílios Foi utilizado o procedimento sugerido por Libor Masek[4] para realizar a detecção da região da íris coberta pelas pálpebras e cílios. Para se isolar as pálpebras, admitiu-se que a borda da mesma pode ser aproximada por um segmento de linha. O primeiro passo é encontrar uma linha correspondente à borda da pálpebra superior e uma correspondente à borda da pálpebra inferior. Para isto foi utilizada a Transformada de Hough Linear. Uma segunda linha é então desenhada horizontalmente interceptando a
primeira no ponto de borda da íris mais próximo à pupila. Este procedimento é realizado tanto para a pálpebra superior quanto para a inferior e as regiões acima da linha horizontal referente à pálpebra superior e abaixo da referente à pálpebra inferior são excluídas. Ao se traçar a segunda linha, se garante uma isolação máxima da região pertencente às pálpebras. Para a detecção de bordas utilizou-se o método de Canny e somente as informações de gradiente horizontal. Pode acontecer de, em algumas imagens, não existir a oclusão da íris pelas pálpebras. Assim, se o máximo valor no espaço de Hough for menor que um limiar pré-estabelecido, então, nenhuma linha é identificada, o que representa uma não oclusão. Além disso, uma linha só é considerada quando ela se encontra fora da região da pupila e dentro da região da íris. Para se isolar os cílios é utilizada, simplesmente, uma técnica de estabelecimento de um limiar, uma vez que, para o conjunto de imagens utilizado, os cílios são, em geral, um pouco mais escuros quando comparados com o resto da imagem. Assim, todos os pixels da imagem com tom de cinza mais escuro do que o limiar estabelecido são considerados pixels pertencentes aos cílios e são excluídos. fim de se obter imagens com taxas variadas de compressão tais como 0.7, 0.5, 0.3 e 0.15 bits por pixel (bpp), por exemplo. A Figura 1 e a Figura 2 abaixo mostram respectivamente a imagem original de uma íris humana e a imagem recuperada após a compressão fractal. Tal imagem foi comprimida a uma taxa de 0.76 bpp e obteve uma relação sinal ruído de pico (PSNR) de 30.4247 db. Tais valores são satisfatórios segundo Fischer[5]. Fig. 1. Imagem original de uma íris humana obtida do banco de dados UBIRIS Seção 1[6] de tamanho 200 x 150 pixels. III. COMPRESSÃO FRACTAL Atualmente o armazenamento e manipulação de imagens tornaram-se quase que totalmente digital. Embora a informatização de dados seja benéfica, criam-se problemas como, por exemplo, gasto computacional de tempo e memória para tais manipulações. Para tanto, tornou-se necessário o avanço em tecnologias de compressão de dados e no caso em questão de compressão de imagens a fim de facilitar seu armazenamento e processamento. Tais estudos se iniciaram com as teorias da informação desenvolvidas por C. E. Shannon na década de 40 e se estenderam e evoluíram bastante até os dias atuais. Dentre as técnicas de compressão mais usadas tais como JPEG, JPEG2000, PNG, Codificação de Huffman, uma que merece destaque seria a Compressão Fractal, por conseguir equilibrar altas taxas de compressão e fidelidade à imagem original. Tal técnica parte do princípio de que as imagens mesmo reais possuem auto-similaridade e que tais similaridades são dados redundantes que, portanto, podem ser eliminados. Para tal, aplicam-se diversas transformações afins sobre o todo ou uma parte da imagem, o que faz com que cada parte da imagem sofre uma convergência para um ponto em comum chamado de atrator[5]. Assim, as imagens podem ser armazenadas por conjuntos de coeficientes de transformações afins, reduzindo, portanto memória utilizada. Neste trabalho, foi implementado um método de compressão fractal com particionamento quadtree que garante maior rapidez no processamento das imagens e uma grande manipulação de parâmetros com o intuito de equilibrar taxa de compressão e qualidade da imagem. Foram testadas várias imagens quadradas e verificando-se a eficiência do método partiu-se para o processamento das imagens das íris. Para tal utilizou-se o banco de dados UBIRIS- Seção 1 [6], com um total de 1202 imagens. Os coeficientes do algoritmo de compressão foram ajustados a Fig. 2. Imagem de uma íris humana obtida do banco de dados UBIRIS Seção 1[6] de tamanho 200 x 150 pixel,comprimida a uma taxa de 0.76 bpp. Percebe-se pelas imagens que, quando se aplica uma compressão moderada, não há perda de informação a olho nu. Tal perda só pode ser notada se observada a uma compressão brusca de, por exemplo, 0.5 bpp na imagem. A Tabela I a seguir exibe alguns testes feitos com uma imagem de íris humana retirada do banco de dados UBIRIS Seção 1[5], especificamente a Img_161_1_1, que apresenta uma imagem não muito escura. Tais valores não são fixos para todas as imagens, uma vez que a compressão trabalha com ajuste de contraste e brilho e isso varia da tonalidade da imagem. Observa-se que à medida que se comprime mais a imagem, aumenta-se o tempo de execução e diminui-se em qualidade, o que é comprovado pela diminuição dos valores de PSNR. Tais valores encontram-se bastante satisfatórios em relação ao que diz Fischer [5], e inclusive o tempo de execução mostra-se melhor. Tal fato pode ter ocorrido pelos métodos como foram implementados o algoritmo, e principalmente pela escolha do ambiente de implementação, linguagem Java, que é uma linguagem livre, de alto desempenho e possui vasta biblioteca.
TABELA I Testes feitos com uma imagem de íris humana, variandose taxas de compressão. Imagem Taxa de Compressão PSNR Tempo de execução Img_161_1_1 0,3448 bpp 27,9647 db 1219 ms Img_161_1_1 0,416 bpp 28,6721 db 1422 ms Img_161_1_1 0,5033 bpp 29,3468 db 1781 ms Img_161_1_1 0,6291 bpp 30,0104 db 2188 ms Img_161_1_1 0,76 bpp 30,4247 db 2750 ms Tendo feito vários testes comprovando a eficiência do método para a compressão de imagens de irises o próximo passo seria tomar essas imagens comprimidas e fazer a segmentação em tais imagens analisando sob diversas taxas, os efeitos que a compressão causa na segmentação das mesmas, em comparação com as imagens originais. IV. RESULTADOS EXPERIMENTAIS Conforme mencionado anteriormente, o método de compressão fractal foi utilizado para comprimir as imagens do banco de dados UBIRIS [6] sob as seguintes taxas de compressão: 0.7, 0.5, 0.3 e 0.15. Assim, foi possível avaliar a eficiência dos métodos de segmentação quando as imagens sofrem desde uma compressão mais moderada (taxa de 0.7) até quando estão submetidas a uma compressão extremamente severa (taxa de 0.15). A Figura 3, abaixo, mostra uma imagem recuperada após uma compressão fractal a uma taxa de 0.15. Esta compressão foi tão severa que o seu efeito pode ser visto perfeitamente a olho nu. Fig. 3. Imagem de uma íris humana obtida do banco de dados UBIRIS Seção 1[6] de tamanho 200 x 150 pixel,comprimida a uma taxa de 0.15 bpp. A Tabela II, a seguir, mostra o efeito da compressão nas imagens. Em média, as imagens originais possuem um tamanho de 22000 bytes, assim, a compressão com as taxas 0.7, 0.5, 0.3 e 0.15 produzem imagens comprimidas de tamanho médio 15400 bytes, 11000 bytes, 6600 bytes e 3300 bytes, respectivamente. Com relação à imagem original, a compressão com estas taxas representa um fator de redução médio de 1.5:1, 2:1, 3.5:1 e 6.7:1, respectivamente. TABELA II Efeito da compressão nas imagens. Dimensão Tamanho Fator de redução Original 200 x 150 22 KB - Taxa 0.7 200 x 150 15.4 KB 1.5 : 1 Taxa 0.5 200 x 150 11 KB 2 : 1 Taxa 0.3 200 x 150 6.6 KB 3.5 : 1 Taxa 0.15 200 x 150 3.3 KB 6.7 : 1 Nas subseções a seguir, serão apresentados os resultados obtidos com cada método de segmentação. Na seqüência, todos os resultados serão resumidos na Tabela III. A. Resultados da Aplicação da Transformada de Hough Para se aplicar a transformada de Hough a uma imagem é necessário que, primeiramente, seja gerado um mapa de bordas a partir desta imagem. Portanto, antes de se verificar a influência da compressão fractal na capacidade de segmentação da íris através da transformada de Hough, é interessante analisar o efeito da compressão no mapa de bordas que é gerado. O mapa de bordas de cada imagem original foi comparado com o mapa de bordas da imagem correspondente comprimida sob as taxas de compressão: 0.7, 0.5, 0.3 e 0.15. Em média, 90.5% dos pixels considerados de bordas no mapa de bordas da imagem original, também foram considerados pertencentes à borda no mapa de bordas gerado a partir da imagem comprimida com taxa de 0.7 bpp. Para os mapas de bordas gerados a partir das imagens comprimidas com taxas de 0.5, 0.3 e 0.15 bpp, esta razão foi, em média, de 79.7%, 78.1% e 51.5%, respectivamente. Pode se observar que, para a taxa de compressão de 0.7 bpp, houve pouca variação no mapa de bordas e, como resultado, o algoritmo foi capaz de segmentar corretamente a região da íris de 99,5% das imagens que foram segmentadas corretamente quando se utilizou as imagens originais. Isto mostra que uma compressão moderada, praticamente, não interfere na eficiência da transformada de Hough. Para as taxas de compressão de 0.5 e 0.3, o mapa de bordas variou um pouco mais, porém, ainda assim, o algoritmo foi capaz de segmentar corretamente 99,3% e 98.5% das imagens, respectivamente, o que representa uma eficiência bastante aceitável. Com a taxa de compressão de 0.15, o algoritmo foi capaz de segmentar corretamente 94,7% das imagens. A diminuição da eficiência do algoritmo, provavelmente se deveu à variação mais intensa que ocorreu nos mapas de bordas. B. Resultados da Aplicação do Operador Integro-Diferencial Ao se aplicar o operador integro-diferencial às imagens originais e comprimidas, observou-se que, quando a compressão foi realizada com taxas 0.7 e 0.5 bpp, 100% das imagens originais que foram corretamente segmentadas, também foram devidamente segmentadas quando comprimidas. Portanto, a compressão com estas taxas não prejudicou, em nada, a eficiência do algoritmo de segmentação.
Com a taxa de compressão de 0.3 bpp, o algoritmo conseguiu segmentar corretamente 98.6% das imagens, o que representa um erro desconsiderável diante dos benefícios da compressão. Quando foi utilizada uma compressão mais severa (com taxa 0.15%), 89.7% das imagens foram corretamente segmentadas. Neste caso, percebe-se que o algoritmo sofreu uma maior interferência da compressão e, para esta técnica, isto se deveu, principalmente, à diminuição do contraste entre a parte branca do olho e a íris e entre a íris e a pupila na imagem comprimida. C. Resultados da Aplicação do Método de Detecção de Pálpebras e Cílios O método proposto para detecção de pálpebras e cílios também foi aplicado às imagens originais e às imagens comprimidas com taxas 0.7, 0.5, 0.3 e 0.15. Pôde-se observar que 100% das imagens originais que tiveram as pálpebras e os cílios corretamente detectados, também os tiveram quando estavam comprimidas com qualquer uma das taxas utilizadas. Isto demonstra que a compressão, mesmo sendo bastante severa, não prejudica o algoritmo utilizado para detectar pálpebras e cílios. TABELA III Efeito da compressão nas técnicas de segmentação utilizadas. Transformada de Hough * Operador Integro- Diferencial * Método de detecção de pálpebras e cílios* Taxa 0.7 99.5 % 100 % 100 % Taxa 0.5 99.3 % 100 % 100 % Taxa 0.3 98.5 % 98.6 % 100 % Taxa 0.15 94.7% 89.7 % 100 % * Porcentagem de imagens que foram corretamente segmentadas. V. CONCLUSÕES Através dos resultados obtidos com as simulações e que foram apresentados na seção anterior, pode-se concluir que, em geral, os algoritmos mais tradicionais de segmentação da região da íris, praticamente não são prejudicados pela compressão da imagem a ser processada. O algoritmo da transformada de Hough se mostrou um pouco mais imune a taxas de compressão extremamente severas do que o algoritmo do operador integro-diferencial que apresentou uma eficiência de 89.7% enquanto o primeiro teve uma eficiência de 94.7% para uma taxa de 0.15 bpp. Finalmente, conclui-se que, em um sistema completo de reconhecimento de íris, a etapa de segmentação não representará um gargalo, ou seja, ela não irá comprometer o desempenho do sistema caso sejam utilizadas imagens comprimidas. Um próximo trabalho a ser sugerido, é a realização de uma pesquisa de como a compressão irá interferir nas outras etapas de processamento, especialmente na habilidade do sistema em reconhecer com exatidão os indivíduos. REFERÊNCIAS BIBLIOGRÁFICAS [1] J. Canny, A computational approach to edge detection, IEEE Transactions on PAMI-8, no.6, 1986. [2] R. P. Wildes, Iris recognition: An emerging biometric technology, Proceedings of the IEEE, 1997, vol 85, no. 9, pages 1348-1363. [3] J. G. Daugman, High confidence visual recognition of person by a test of statistical independence, IEEE Transactions on Pattern Analysis and Machine Intelligence, 1993, vol 15, no. 11, pp.1148-1161. [4] L. Masek, Recognition of human iris patterns for biometric identification, Dissertação de Mestrado, The University of Western Australia. [5] FISHER, Y., Fractal Image Compression - Theory and Application, New York: Springer- Verlag, 1995. 341 p. ISBN: 0-387-94211-4 (New York) - 3-540-94211-4 (Berlin). [6] H. Proença, L. A. Alexandre, UBIRIS: a noisy iris image database, ICIAP 2005 13th Int. Conf. On Image Analysis and Processing, Cagliari, Italy, 6-8 September 2005, Lect. Notes Comput. Sci; 3617, pp.970-977, ISBN 3-540 - 28869 4. http//iris.di.ubi.pt