Contagem Automa tica de Colo nias usando Hough Circles Arthur Melo Pinheiro, Kathiani Elisa de Souza Valguima Victoria Viana Aguiar Odakura, Willian Paraguassu Amorim Universidade Federal da Grande Dourados Faculdade de Cie ncias Exatas e Tecnologias arthur.siufgd10@gmail.com, kathianielisa2@hotmail.com valguima.odakura@gmail.com, paraguassuec@gmail.com Abstract - The uroculture is an important exam for human urinary infection level detection. The level is determined by counting the colonies cultivated in Petri Dishes. The colonies appear in large quantities and usually in clusters thus an automatic counting procedure is a hard task. This paper presents an automatic method for colonies counting based on the Hough Circles technique. Resumo - A urocultura e um importante exame para a detecc a o do nı vel de infecc a o urina ria humana. O nı vel de infecc a o e determinado pela contagem das colo nias cultivadas em placas de Petri. As colo nias aparecem em grandes quantidades e, geralmente, em grupos, portanto, um procedimento de contagem automa tica e uma tarefa difı cil. Este artigo apresenta um me todo automa tico para contagem das colo nias baseado na te cnica Hough Circles. 1. Introduc a o As infecc o es urina rias causadas por bacte rias sa o as mais comuns entre os seres humanos, atra s somente das infecc o es respirato rias causadas por vı rus. O principal agente causador da infecc a o urina ria e a bacte ria Escherichia coli que pode afetar o rga os como a bexiga e os rins [5]. Para diagnosticar a doenc a, e necessa ria a realizac a o da urocultura, um exame realizado em laborato rio em que se cultiva o sedimento depositado no fundo do tubo de ensaio apo s a centrifugac a o da urina. O cultivo das bacte rias e realizado em placas de Petri1, dura em torno de quarenta e oito horas e formara o colo nias que sera o contadas e avaliadas pelo laboratorista [1]. A Figura 1, ilustra as colo nias bacterianas apo s o perı odo de cultivo. 1 Um recipiente cilı ndrico, achatado, de vidro ou pla stico utilizado na cultura de microorganismos. Figura 1. Imagens representando as colo nias bacterianas cultivadas em placas de Petri. A contagem das colo nias e o passo fundamental para diagnosticar o nı vel de infecc a o do paciente, em que o resultado implicara nas deciso es me dicas como receitar um determinado antibio tico. Portanto, a precisa o desta contagem deve ser a mais pro xima possı vel da exatida o. Em muitos casos, as colo nias cultivadas em placas de Petri se apresentam em grande nu mero ou aglomeradas entre elas que dificulta a contagem causando imprecisa o. Para solucionar este problema, foi proposta a utilizac a o de uma te cnica de processamento de imagens conhecida como Hough Circles, aplicada na detecc a o de objetos circulares [6]. Para aplicac a o da te cnica Hough Circles, e necessa ria a utilizac a o de algumas fases de pre -processamento. Neste trabalho, e apresentada a avaliac a o do processo de contagem de colo nias usando Hough Circles comparadas com especialistas na a rea, sobre condic o es diferentes de pre -processamento. O trabalho esta organizado da seguinte forma. Na sec a o 2, e apresentado o funcionamento da te cnica Hough Circles e o algoritmo utilizado na criac a o do espac o de Hough. Na sec a o 3, e apresentado o me todo proposto nesse trabalho em que duas configurac o es de pre -processamento foram testadas. Nas
seções 4 e 5, são apresentados os experimentos realizados e os resultados gerados utilizando o método proposto. E nas seções 6 e 7, são apresentados a análise referente aos resultados obtidos nos experimentos e as conclusões do trabalho. 2. Hough Circles A técnica Hough Circles consiste em encontrar através de um raio (r) estipulado, coordenadas de possíveis centros de circunferências (xc, yc). As coordenadas são encontradas através de um cálculo trigonométrico que serão utilizadas para gerar o espaço de Hough. O espaço de Hough é uma imagem com a mesma dimensão da imagem original em que inicialmente terá todos os pixels com valor 0 (zero, correspondendo a cor preta). Estes pixels sofrerão alteração de seus valores conforme as coordenadas encontradas (localização do pixel), incrementando o seu valor em 1 (um), [6]. O Algoritmo 1 representa a criação do espaço de Hough. O algoritmo realiza cálculos trigonométricos somente quando localiza o pixel representando a borda de algum objeto, ou seja, após o pré-processamento estes pixels serão representados com valor 255 (valor que corresponde a cor branca em imagem binária),tendo um padrão para identificá-las. Em uma imagem pode haver diversos objetos circulares de raios distintos ou até mesmo desconhecidos. Portanto, é inviável a utilização de um raio fixo para encontrar as coordenadas centrais. Para a criação do espaço de Hough é utilizado uma matriz de três dimensões representadas pelas coordenadas (x, y) do pixel e o raio da circunferência, em que seu valor irá variar entre um intervalo de raio mínimo e máximo. Formado o espaço de Hough, ilustrado na Figura 2, é possível detectar as possíveis regiões circulares. Para isso, cada pixel do espaço de Hough será comparado a fim de encontrar o pixel de maior valor, este possivelmente representará um centro de circunferência. Com os valores de raio conhecidos, é possível marcar essa circunferência a partir do pixel encontrado. O processo persiste caso seja necessário detectar outras circunferências. Mas para isso, primeiramente serão zerados os pixels que correspondem a circunferência encontrada, evitando detectá-la novamente. A técnica Hough Circles foi implementada por Pistori e Costa em plug-in para o ImageJ 2 (software livre de processamento de imagens). O plug-in é capaz de detectar e marcar em uma imagem digital a quantidade de regiões circulares fornecidas pelo usuário a partir de parâmetros pré definidos, como raio mínimo e máximo, incremento de raio, e quantidade de regiões circulares a serem encontradas. 2 http://rsbweb.nih.gov/ij/plugins/hough-circles.html Algoritmo 1: Criação do Espaço de Hough Entrada: I[x][y] - Matriz binarizada após o pré-processamento. m,n - Representam a largura e altura da imagem. x,y - Correspondem as coordenadas. θ - Ângulo. xc,yc - Coordenadas centrais. r - Raio. Saída: H[x][y] - Matriz resultante que possuirá o espaço de Hough. para x de 0 até n - 1 faça para y de 0 até m - 1 faça se I[x][y] = 255 então para θ de 0 até 2 π faça xc = x r * cos(ang) yc = y r * sen(ang) H[xc][yc]++ retorna H (a) (c) (b) (d) Figura 2. Processamento das Imagens de Colônias de Bactérias. (a) Imagem Original, (b) Image pré-processada, (c) Espaço de Hough, (d) Colônias detectadas. 3. Método Proposto Hough Circles é uma técnica capaz de detectar objetos circulares em imagens digitais através de pontos de máximo
(pixels com maior valor após incrementos) em uma imagem gerada conhecida como espaço de Hough. A mesma foi desenvolvida a partir da transformada de Hough, técnica conhecida desde a década de 60 desenvolvida por Paul Hough [4]. Esta técnica é utilizada em projetos como: Detecção de objetos circulares usando transformada de Hough [8], contagem de leveduras para o controle da fermentação na produção de álcool [7], detecção, rastreamento e reconhecimento de ações através de imagens e videos [2], e outros trabalhos de detecção de padrões geométricos. Para a utilização da técnica Hough Circles é necessário que a imagem seja pré-processada. Algumas técnicas como detecção de bordas e binarização de imagem são necessárias para a aplicação do algoritmo. Nesse trabalho foram utilizadas duas configurações de pré-processamento. A primeira baseado no método proposto por Silva e Pistori [7], em que se obteve uma ótima precisão na contagem de leveduras, e a segunda baseado no mesmo pré-processamento da primeira configuração acrescido da técnica Watershed, responsável por dividir as regiões em que as colônias se encontram aglomeradas. A seguir, a lista das técnicas de pré-processamento utilizadas para os experimentos de detecção de colônias. Configuração 1: Enhance Contrast Gaussian Filter Converter para Escalas de Cinza (8-bit) Canny Filter Contagem de colônias utilizando Hough Circles. Configuração 2: Enhance Contrast Gaussian Filter Converter para Escalas de Cinza (8-bit) Canny Filter Watershed Contagem de colônias utilizando Hough Circles. 4. Experimentos Para a realização dos experimentos, primeiramente foram coletadas no laboratório do Hospital Universitário de Dourados MS, imagens das colônias cultivadas em placas de Petri. Para a captura das imagens foi utilizada a Câmera Digital 14MP 15x Zoom Óptico que fornece imagens com uma dimensão de 2560 x 1920 pixels no formato JPEG. Para auxiliar nos experimentos, foi desenvolvido um plug-in para o software ImageJ, capaz de gerar amostras recortando as imagens coletadas em uma dimensão fornecida pelo usuário, e arquivadas em um diretório. Por meio de análises visuais foi estipulado uma dimensão de 200 x 200 pixels para as amostras geradas, facilitando a comparação da contagem realizada pelo especialista com a contagem realizada pelo software. Gerado o banco de amostras, foram contadas manualmente as colônias de cada amostra, onde foi registrado no próprio nome do arquivo o valor da contagem. No total foram analisadas 1.254 amostras correspondendo a 34 imagens com média de 1.489 colônias por imagem. Foi desenvolvido um plug-in para o software ImageJ capaz de gerar os primeiros resultados de contagem utilizando a técnica Hough Circles. A intenção é testar parâmetros como o valor de Threshold utilizado na condição de parada de contagem, o valor do Sigma (σ) utilizado na técnica Gaussian blur, e o valor de Alpha (α) utilizado na técnica Canny filter. Para os três parâmetros, foram analisados um intervalo de valores nos quais poderiam ser testados e avaliados, a fim de encontrar os melhores valores para uma contagem de maior precisão. Para uma melhor análise, foram selecionadas 30 amostras que não possuem qualquer tipo de interferência como a luz e reflexo da placa de Petri, divididas igualmente em três categorias. A categoria 1 possui imagens com poucas colônias, as mesmas com o formato circular muito bem definido e separadas uma das outras, definido pelo especialista com complexidade baixa de avaliação. A categoria 2, com complexidade média de avaliação, possui imagens com colônias localizadas muito próximas uma das outras e em alguns casos se encontram aglomeradas. E por fim a categoria 3, com complexidade alta de avaliação, possui imagens em que as colônias normalmente se encontram aglomeradas, sendo este um grande desafio para a contagem utilizando o método proposto. A Figura 3 ilustra uma imagem de cada categoria. Para uma melhor análise dos parâmetros, foram utilizados quatro equações [3], que são: Média Erro (ME): Consiste na média da diferença entre a quantidade de colônias contadas pelo especialista (ec) e a quantidade de colônias contadas pelo software (hc) de todas as imagens de cada categoria, ilustrado na Equação 1. Recall: Consiste na divisão entre a quantidade de colônias contadas corretamente pelo software (hr) e a quantidade de colônias contadas pelo especialista (ec). Avaliado em uma escala de 0 a 1, quanto mais próximo do valor 1, indica que o software está detectando corretamente o maior número de colônias existentes, ilustrado na Equação 2. Precision: Consiste na divisão entre a quantidade de colônias contadas corretamente pelo software (hr) e a quantidade de colônias contadas pelo software (hc). Avaliado em uma escala de 0 a 1, quanto mais próximo do valor 1, mais o software é preciso na realização da contagem, ilustrado na Equação 3. F-Score (F): Uma equação que balanceia os valores de Precision e Recall, obtendo um valor mais significativo para a análise. Um valor de Recall alto não significa que a técnica seja eficiente, pois a técnica pode detectar todas as colônias, mas poderá detectar vários pontos que não correspondem uma colônia, o que ocasionará em uma Precision
baixa. Portanto, equilibrar estes valores é importante para a análise, ilustrado na Equação 4. ME = F = 2 n i=img1 ec i hc i n Recall = hr ec P recision = hr hc precision recall precision + recall (1) (2) (3) (4) 5. Resultados Primeiramente foram testados valores para α nas duas configurações de pré-processamento. Analisando visualmente o desempenho da contagem pelo especialista, foram selecionados quatro valores consecutivos para α (1.0, 1.1, 1.2, 1.3) para cada categoria de imagens. As Tabelas 1 e 2 apresentam os melhores resultados dos cálculos efetuados utilizando as configurações de pré-processamento 1 e 2. O segundo teste tem como finalidade, encontrar os melhores valores para σ e Threshold. Visualmente foram analisados pelo especialista, os melhores valores para os experimentos de σ e Threshold, cada qual possuindo três valores consecutivos, σ(1.4, 1.5, 1.6), Threshold(20, 21, 22). Foi utilizado o melhor valor de α para cada categoria de imagens encontrados no primeiro teste. Foi considerado mais relevante, os valores obtidos no cálculo do ME para selecionar os valores de α. As Tabelas 3, 4, 5, 6, 7 e 8 apresentam os melhores resultados dos cálculos através do melhor valor de α, utilizando as configurações 1 e 2 de préprocessamento para todas as categorias de imagens. Categoria α M E Recall P recision F (a) (b) 1 1.1 1.1 1.00 1.00 1.00 2 1.0 4.0 0.72 0.77 0.74 3 1.0 32.9 0.73 0.56 0.63 3 1.2 28.6 0.70 0.58 0.63 3 1.3 29.7 0.70 0.60 0.64 Tabela 1. Melhores resultados variando valor de α para o cálculo das equações Recall, Precision, F-Score, com configuração de préprocessamento 1. Categoria α M E Recall P recision F (c) Figura 3. Representa exemplos de imagens selecionadas para a Categoria 1 (a), Categoria 2 (b), e Categoria 3 (c). 1 1.9 3.8 1.00 0.87 0.93 2 2.3 35.9 0.86 0.30 0.44 2 2.4 31.2 0.86 0.31 0.45 2 2.5 77.0 0.86 0.34 0.48 3 2.6 36,8 0,67 0,45 0,53 3 2.8 43.5 0.65 0.54 0.58 Tabela 2. Melhores resultados variando valor de α para o cálculo das equações Recall, Precision, F-Score, com configuração de préprocessamento 2.
1.4 22 1.2 1.00 1.00 1.00 1.5 21 1.1 1.00 1.00 1.00 1.6 20 1.0 1.00 1.00 1.00 Tabela 3. Melhores resultados da categoria 1 de imagens com α fixo em 1.1, variando configuração de pré-processamento 1. Analisando os resultados, a configuração 1 de préprocessamento teve melhor desempenho em todas as categorias de imagens. Para a categoria 1, se destaca o desempenho de contagem utilizando os valores α(1.0), σ(1.6), e Threshold(20) com ME = 1.0 colônias. Para a categoσ T hreshold M E Recall P recision F 1.4 22 2.8 1.00 1.00 1.00 1.5 22 2.2 1.00 0.87 0.93 1.6 21 3.4 1.00 0.87 0.93 Tabela 6. Melhores resultados da categoria 1 de imagens com α fixo em 1.9, variando configuração de pré-processamento 2. 1.4 21 4.4 0.65 0.70 0.67 1.5 20 5.4 0.69 0.53 0.59 1.5 22 8.2 0.48 0.72 0.57 1.6 20 3.8 0.67 0.58 0.62 Tabela 4. Melhores resultados da categoria 2 de imagens com α fixo em 1.0, variando configuração de pré-processamento 1. 1.4 22 32.1 0.75 0.72 0.73 1.6 20 37.5 0.82 0.56 0.66 1.6 21 25.3 0.71 0.61 0.65 1.6 22 29.5 0.73 0.72 0.72 Tabela 5. Melhores resultados da categoria 3 de imagens com α fixo em 1.2, variando configuração de pré-processamento 1. 6. Análises 1.4 22 24.9 0.83 0.37 0.51 1.5 22 23.2 0.86 0.36 0.50 1.6 20 87.9 0.88 0.29 0.43 Tabela 7. Melhores resultados da categoria 2 de imagens com α fixo em 2.4, variando configuração de pré-processamento 2. 1.4 20 69.5 0.66 0.36 0.46 1.4 22 27.2 0.62 0.47 0.53 1.6 22 55.4 0.61 0.54 0.57 Tabela 8. Melhores resultados da categoria 3 de imagens com α fixo em 2.6, variando configuração de pré-processamento 2. ria 2, se destaca o desempenho de contagem com os valores α(1.1), σ(1.6), e Threshold(20) com M E = 3.8 colônias. Para a categoria 3, o desempenho cai significativamente com ME = 25.3 colônias. Observa-se através do F-Score que o desempenho da técnica Hough Circles é excelente quando aplicado em imagens com regiões circulares bem definidas, não aglomeradas, e com poucas interferências do ambiente. Porém, em casos mais críticos onde as colônias se encontram aglomeradas, as mesmas podem ser identificadas como um único objeto, dificultando consideravelmente a contagem pela técnica. Em relação a configuração 2 de pré-processamento, em que se utilizou a técnica Watershed para dividir regiões de
colônias aglomeradas, não se obteve sucesso, pois a técnica criava bordas de objetos visualmente inexistentes, obtendo um espaço de Hough com regiões circulares também inexistentes, aumentando consideravelmente a quantidade de colônias contadas pelo software, comprovadas pelo baixos valores obtidos pela informação de Precision. 7. Conclusão Através deste trabalho, pode-se concluir que o método proposto para contagem obteve resultados satisfatórios. Algumas dificuldades como reflexos na placa de Petri e regiões de colônias aglomeradas, tem interferido significativamente na contagem utilizando a técnica Hough Circles. Para solucionar estes problemas, será necessário criar um ambiente padrão para a captura de imagens, onde elimine qualquer tipo de interferência externa. Atualmente estão sendo estudadas outras técnicas de préprocessamento como segmentação de imagens, remoção de ruídos e outras técnicas de detecção de padrões geométricos como o Template Matching, para a aplicação e análise da contagem de colônias comparadas com os resultados obtidos usando Hough Circles. Referências [1] O. Cunha, A. Garrido, M. Gonçalves, G. Ferreira, E. Marques, and A. Vilarinho. Utilidade da urocultura de controlo na infecção urinária. Acta Pediatr Port 2010;41(2):51-3, 2010. [2] J. Gall, A. Yao, N. Razavi, L. Van Gool, and V. Lempitsky. Hough forests for object detection, tracking, and action recognition. IEEE transactions on pattern analysis and machine intelligence, 2011. [3] C. Goutte and E. Gaussier. A probabilistic interpretation of precision, recall and f-score, with implication for evaluation. Proceedings of the 27th European Conference on Information Retrieval, 2005. [4] P. V. C. Hough. Methods and means for recognizing complex patterns. USENIX Security Symposium, 1962. [5] C. L. M. Lima and P. M. C. Alves. Infecção urinária. Disponível em: http://www.abcdasaude.com.br/artigo.php?259, Acesso em: 05 de maio de 2012. [6] H. Pistori, J. Pistori, and E. R. Costa. Hough-circles: Um módulo de detecção de circunferências para o imagej. Workshop Software Livre, Porto Alegre. Anais do 6o Workshop de Software Livre, 2005. [7] D. S. Silva and H. Pistori. Yeast counting using the circular hough transform. Sibgrapi paper., 2011. [8] M. Smereka and I. Duleba. Circular object detection using a modified hough transform. Appl. Math Comput. Dci., vol. 18, no. 1, 2008.