Classificação de Espécies de Pássaros Utilizando Características de Textura

Documentos relacionados
Extração de atributos usando o método LBP - Local Binary Pattern

Textura. Textura 04/09/2014. Prof. Yandre Costa

UNIVERSIDADE ESTADUAL DE MARINGÁ PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO. Prof. Yandr re Costa - 1. Prof. Yandre Costa.

Reconhecimento de texturas utilizando padrão binário local e classificador knn.

Métodos de Extração de Características

Classificação de Padrões por Blocos em Imagens Não Segmentadas de Tomografia Computadorizada

Descritores de Imagens

O reconhecimento facial é dividido em três etapas: i) detecção da face, ii) extração de características e iii) reconhecimento da face.

Processamento de Imagens. Texturas

Extração de características: textura

Face Recognition using RGB-D Images

Introdução Trabalhos Relacionados Metodologia Resultados Considerações Finais. Aluna: Aline Dartora Orientador: Prof. Dr. Lucas Ferrari de Oliveira

Descritores de Imagens

Descritores de Imagem

Classificação de Padrões Radiológicos por Blocos em Imagens Não Segmentadas de Tomografia Computadorizada

Objetivos. 1. O método desenvolvido usa características de pares de pixeis para fazer estatísticas e formar

CLASSIFICAÇÃO DE PADRÕES EM IMAGENS UTILIZANDO DESCRITORES DE TEXTURA Pattern Classification in Images Using Descriptors of Texture

Color Texture Classification by using Opponent Color and Local Mapped Pattern

Sistema de Reconhecimento de Logotipos

UNIVERSIDADE FEDERAL DE UBERLÂNDIA UFU

Introdução a Local Binary Patterns (LBP) Prof. Dr. Geraldo Braz Junior

10º Congresso Interinstitucional de Iniciação Científica CIIC a 04 de agosto de 2016 Campinas, São Paulo ISBN

Visão computacional. Juliana Patrícia Detroz Orientador: André Tavares Silva

Sketch to Photo Matching: A Feature-based Approach (Klare and Jain [2010])

Uma nova proposta para análise de textura local por conjuntos fuzzy

Diego Martin Mancini Orientador: Prof. Paulo A. V. de Miranda Instituto de Matemática e Estatística Universidade de São Paulo

METODOLOGIA PARA A QUANTIZAÇÃO DE CORES PELO MÉTODO SMCb: INTRODUÇÃO E EXEMPLOS DE RESULTADOS

Color texture classification by a local multiscale descriptor

UNIVERSIDADE FEDERAL DE UBERLÂNDIA UFU

Person Re-Identification. Autor: Guilherme Zasyeki Machado

Reconhecimento e diagnóstico automático de melanoma

Máquinas de Vetores de Suporte Aplicadas à Classificação de Defeitos em Couro Bovino

Projetos finais. Grupo 3

SEMINÁRIO DOS ARTIGOS:

Aprendizagem de Máquina

Image Descriptors: color

Compound Local Binary Pattern para reconhecimento de expressões faciais

Aplicação de Histograma de Gradientes Orientados para detecção de hidrômetros em imagens de fundo complexo

Orientação de Bordas em Imagens Digitais: Abordagem por Análise de Vizinhança Local

PROCESSAMENTO DE IMAGENS DIGITAIS PARA VISÃO ROBÓTICA. Digital Image Processing for Robotic Vision

Processamento De Imagem. Descritores de Cor

Face Descrip+on with Local Binary Pa6erns: Applica+on to Face Recogni+on JULIANO RAMOS LUANN LUNA

Descritores de Imagens

IDENTIFICAÇÃO DE MARCADORES DE PAVIMENTAÇÃO NA ORIENTAÇÃO DE CEGOS. André Zuconelli 1 ; Manassés Ribeiro 2

Descritores de Imagem (introdução)

1. Introdução. Tecnologia do Estado do Ceará. (IFCE) Sobral CE Brasil

AUTENTICAÇÃO DE IMPRESSÕES DIGITAIS

Fusão de Atributos para Segmentação de Couro Bovino

Seleção de Atributos para a Segmentação do Couro Bovino.

DETECÇÃO DE LINHA DO HORIZONTE EM IMAGENS DIGITAIS HORIZON LINE DETECTION IN DIGITAL IMAGES

Aprendizado de Máquina. Combinando Classificadores

Lip Recognition. Victor Mocelin

Image Descriptors: texture

Reconhecimento de linguagem de sinais: aplicação em LIBRAS

Classificação Automática de Gêneros Musicais

Padrões binários locais na classificação de imagens de sensoriamento remoto

XIII Simpósio Brasileiro de Automação Inteligente Porto Alegre RS, 1 o 4 de Outubro de 2017

Universidade Católica Dom Bosco

Consultas por Similaridade em Domínios de Dados Complexos

Uma Análise Comparativa entre Classificadores para Detecção de Nódulos Pulmonares

4 Construção dos Classificadores

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Extração de Características

"Análise de Extratores de Característica para Reconhecimento de Face"

Reconhecimento de Símbolos de LIBRAS

Extração de características de imagens. Descritores de cor

Processamento de Imagens Coloridas. Prof. Adilson Gonzaga

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Representação. David Menotti.

Extração de Características

SEL-0339 Introdução à Visão Computacional. Aula 3 Processamento de Imagens Coloridas

Processamento Digital de Imagens. Cor

INFORMAÇÕES DO ACADÊMICO PLANO DE TRABALHO. 1. Justificativa

SEMINÁRIO Visão Computacional Aluno: Afonso Pinheiro

Desenvolvimento de um método para segmentação de imagens histológicas da rede vascular óssea

Aprendizagem de Máquina

Extração de objetos de interesse em imagens digitais utilizando a biblioteca de Visão Computacional OpenCV

Color Eyes Detector. Duarte Petiz. DCC/FCUP

Romuere Silva, Kelson Aires, Rodrigo Veras, Alcilene Sousa Universidade Federal do Piauí Piauí, Brasil

SIFT - Scale Invariant Feature Transform

VISÃO COMPUTACIONAL. Marcelo Henrique dos Santos

Identificação de Órgãos Foliares utilizando as Wavelets de Daubechies

Classificação de Texturas Invariante a Rotação Usando Matriz de Co-ocorrência

Os Momentos de Zernike no Reconhecimento de Contornos de Edifícios

Descritores de Imagem (exemplos)

SISTEMA AUTOMÁTICO PARA AVALIAÇÃO POSTURAL BASEADO EM DESCRITORES DE IMAGENS

Auto-Fusão na Recuperação de Imagens Baseadas em Conteúdo.

Cursos da Escola de Engenharias e Ciências Exatas - UnP

Processamento de Imagem. A Imagem digital Professora Sheila Cáceres

EXTRAÇÃO SEMI - AUTOMÁTICA DE FEIÇÕES LINEARES E A CALIBRAÇÃO DOS PARÂMETROS INTRÍNSECOS DE CÂMERAS Projeto de Pesquisa PIBIC/CNPq ( )

Caracterização de Imagens via Redes Neurais Artificiais

Processamento de Imagens

Universidade Católica Dom Bosco

Ambiente de Data Warehouse Para Imagens Médicas Baseado Em Similaridade

Extração de características utilizando filtros de Gabor aplicado a identificação de defeitos no couro bovino

SEMINÁRIO IMPRESSÃO PALMAR

AUTOMATED ASSESSMENT OF BREAST TISSUE DENSITY IN DIGITAL MAMMOGRAMS

Dr. Sylvio Barbon Junior. Departamento de Computação - UEL. 1 o Semestre de 2015

Introdução a Visão Computacional. Prof. Dr. Geraldo Braz Junior DEINF - UFMA

PROCESSAMENTO DE IMAGENS COLORIDAS. Nielsen Castelo Damasceno

Face Detection. Image Processing scc moacir ICMC/USP São Carlos, SP, Brazil

Image Descriptors: local features

Transcrição:

Classificação de Espécies de Pássaros Utilizando Características de Textura Andréia Marini 1, Alessandro L. Koerich 1, Irapuru H. Florido 1 1 Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Curitiba PR Brazil 80.215-901 {andreia,alekoe,irapuru}@ppgia.pucpr.br Abstract. This paper investigates the use descriptors of texture on Local Binary Patterns (LBP) extracted for birds species classification basead on texture features extracted form unconstrained images. This means that birds may appear in different settings have different poses, sizes and viewing angles. Furthermore, the images show strong variations in illumination and parts of the birds may be omitted by other elements of the scenario. The proposed approach performs the extraction of textures of images in different formats: RBG, HSV and GRAY (gray levels). Next, features vectors are generated with different settings LBP operator, being LBPP,R u2, LBPP,R, ri LBPP,R riu2. The experimental results on the Caltech-UCSD Birds 200 (CUB-200) database demonstrate positive results for the descriptors used in the birds specie classification with success rates varies between 85% and 1,4% depending on the number of classes taken into account. Resumo. O presente trabalho investiga o uso de descritores de textura baseados em Padrões Binários Locais (LBP) extraídos de imagens na classificação de espécies de pássaros. As imagens utilizadas são coletadas sem restrições. Isto significa que os pássaros podem aparecer em diferentes cenários, apresentar diferentes poses, tamanhos e ângulos de visão. Além disso, as imagens apresentam grandes variações de iluminação e partes do pássaro pode ser omitido por outros elementos do cenário. A abordagem proposta realiza a extração de texturas das imagens em diferentes formatos: RBG, HSV e GRAY (níveis de cinza). Em seguida, vetores de carcterísticas são gerados com diferentes configurações do operador LBP, sendo LBPP,R u2, LBPP,R, ri LBPP,R riu2. Os resultados experimentais obtidos por meio da base de dados Caltech-USCD Birds 200 (CUB- 200) demostram bons resultados para os descritores utilizados na classificação de espécies de passáros com taxas de acerto entre 85% e 1,4%, dependendo da quantidade classes condideradas. 1. Introdução A identificação da espécie a qual um pássaro pertence desperta interesse de admiradores, pela indiscutível beleza das aves e também de especialistas em fauna, pela sua importância ecológica. Entretanto, a classificação de espécies de pássaros é um problema desafiador tanto para seres humanos quanto para algoritmos computacionais que tentam realizar essa tarefa de maneira automática. Em nosso contexto, problema de classificação de espécies será investigado por meio de imagens, ou seja, dada uma imagem de um pássaro identificar qual espécie ele pertence. A dificuldade desta tarefa de reconhecimento através de

imagens pode ser observado, por exemplo, na variação de cores, luminosidade, rotação, escalas e o fato de muitas imagens de pássaros serem capturadas em seu habitat natural, como florestas ou parques. Dada a complexidade do problema e a grande similaridade entre as espécies ainda é necessário o desenvolvimento de novos métodos de extração de características para fornecer informações adicionais e auxiliar o processo de classificação. A capacidade humana de reconhecer sutilezas entre as diferentes cores, formas e texturas não é um procedimento simples para algoritmos automáticos, devido a diversos fatores como: iluminação, orientação, resolução, etc. Apesar de não haver um conceito formal para textura entendemos a ideia de um padrão que recobre um objeto. A textura pode ser entendida como características intrínsecas de uma imagem (por exemplo: brilho, cor e distribuição de formas) que remetem à ideia de regularidade [Mäenpää and Pietikäinen 2004], [Mäenpää and Pietikäinen 2005]. Este artigo apresenta uma abordagem baseada em características de textura para identificação automática de espécies de pássaros por meio da classificação supervisionada destes. Na literatura, análise de texturas é utilizada com sucesso em diferentes domínios de aplicação, tais como inspeção visual [Mäenpää et al. 2003] reconhecimento facial [Choi et al. 2010] e reconhecimento visual de objetos [Zhu et al. 2010]. Este artigo está organizado da seguinte forma: na próxima seção apresenta o operador de textura utilizado. Na seção 3, descreve-se o método de identificação de espécies de pássaros proposto. Uma discussão sobre os testes realizados e os resultados experimentais obtidos é incluída na seção 4. Finalmente, são apresentadas as conclusões e sugestões para trabalhos futuros. 2. Descritor de textura - Padrão Binário Local - LBP Diferentes métodos de extração e representação de texturas podem ser utilizados, os quais podem ser classificados em estatísticos (distribuições espaciais de níveis de cinza), geométricos (propriedades de elementos de textura ou primitivas) e de processamento de sinais (análise da frequência da imagem para classificar a textura) [Tuceryan and Jain 1993]. O descritor utilizado neste artigo é o Padrão Binário Local (do inglês - Local Binary Pattern - LBP). O operador local binário representa uma medida geral para microtextura unificando modelos estatísticos e estruturais de análise de textura. Sendo invariante a alterações de níveis de cinza e de baixo custo computacional o que permite aplicá-lo em problemas de processamento em tempo real. Em imagens coloridas podem ser aplicados em problemas com grande variação de iluminação, variação de poses ou diferentes resoluções de imagens [Ojala et al. 2002]. A extração da textura da imagem é realizada através de um operador e organizadas em um histograma de ocorrência desses padrões. O operador permite a detecção dos padrões binários em uma vizinhança circular, em qualquer espaço angular, e independente de resolução da imagem. O LBP associado a um pixel de uma imagem é calculado por P vizinhos simétricos em R raio de circunferência, conforme a Figura 1. Em seguida os pixels de uma imagem são rotulados pelo operador de textura gerando um mapa LBP, limiarizando os vizinhos de cada pixel da imagem e atribuindo um código binário para cada um destes pixels [Ojala et al. 2002].

Figura 1. Conjunto de vizinhos igualmente espaçados em uma superfície circular para diferentes P e R [Ojala et al. 2002]. O operador LBP pode ser definido por meio de uma textura T em uma vizinhança de uma imagem monocromática (distribuição em níveis de cinza de P (P> 1). Definido a partir da intensidade g p de cada amostra, de forma que 0 p < P e da intensidade do pixel g c. O nível de cinza g c corresponde ao valor do pixel central, e o valores g p (p=0,...,p-1) aos valores de cinza dos P pixels vizinhos em uma circunferência de raio R(R>0). Caso a posição do pixel central g c sejam (0, 0), as coordenadas de g p serão obtidas por (-Rsin(2π/P), Rcos(2π/P))[Ojala et al. 2002]. O valor de textura da imagem é obtido subtraindo o valor do pixel central g c dos valores de cada pixel da sua vizinhança g p (p=0,...,p-1) conforme a Equação 1: T = t(g c, g 0 g c, g 1 g c,..., g p 1 g c ) (1) Assim, assumimos que a diferença de g p g c seja independente de g c de forma que pode ser representada pela Equação 2. T t(g c )t(g 0 g c, g 1 g c,..., g p 1 g c ) (2) O operador descrito é sensível a variações na escala de cinza, então para obter invariância de textura independente de alterações na escala de cinza de uma imagem consideramos apenas os sinais dos resultados ao invés de seu valor exato, como na Equação 3. Onde S(x) = 1 se x for não negativo, e 0 caso contrário. T = t(s(g 0 g c, s(g 1 g c ),..., s(g p 1 g c )) (3) Em seguida atribuindo a potência 2 p para cada sinal s(x), obten-se um valor único que identifica cada estrutura da textura obtendo o operador LBP P,R = P 1 p=0 s(g p g c )2 p. O operador LBP P,R gera valores correspondentes aos 2 P diferentes padrões que podem ser estabelecidos por P pixels vizinhos, quando uma imagem sofre uma rotação os P pixels vizinhos. Quando uma imagem sofre uma rotação os P pixels irão transitar no perímetro do círculo ao redor de g c, como g 0 sempre é associado ao pixel à direita de g c uma rotação dos valores resultará (assinalado um identificador único para cada padrão, definido através da Equação 4) em uma mudança no valor do operador LBP P,R. Desta forma ROR(x, i) fará uma rotação nos bits associados a x, i vezes, buscando o menor número inteiro entre os bits, ou seja que tenha a maior quantidade de zeros nos bits mais significativos. LBP ri P,R = minror(lbp P,R i) i = 0, 1,..., P 1 (4)

Para esse trabalho foram adotados os operadores LBPP,R u2, LBPP,R, ri LBPP,R riu2. No primeiro, a medida u2 corresponde ao número de transições espaciais, bit a bit 0 ou 1 de alterações entre sucessivos bits na representação circular LBP. São designados padrões que tenham valor U de no máximo 2 como uniforme e usadas as estatísticas de ocorrência de diferentes padrões uniformes para discriminação da textura [Ojala and Maenpaa 2001]. O segundo, operador é invariante a rotação e igualmente invariante a transformações monotônicas da escala de cinza, portanto, da textura de cada pixel. Finalmente, o operador LBP que é uma excelente medida espacial e estrutural para texturas de uma imagem. 3. Metodologia Baseado em informações de texturas extraídas de imagens é apresentado um estudo para identificação automática de espécies de pássaros. A textura é uma característica importante para classificação e reconhecimento, pode ser caracterizada por valores de pixels ao longo do objeto ou imagem que se repetem de maneira regular ou aleatória. O operador de textura LBP permite a detecção dos padrões binários em uma vizinhança circular em qualquer espaço angular e em qualquer resolução. O operador utilizado é formado por um conjunto de P vizinhos simétricos e em um círculo de raio R, desta forma obtemos LBP P,R. Neste trabalho adotamos o operador LBP considerando oito e doze vizinhos de um pixel, mas a definição pode ser estendida para incluir diferentes quantidades de pixels. 3.1. Base de dados Todos os experimentos foram realizados na base de dados Caltech-USCD Birds 200 (CUB-200) [Welinder et al. 2010]. Trata-se de um conjunto de imagens com 200 espécies de aves (principalmente norte-americanas). São 6.033 imagens rotuladas com diversas informações, por exemplo: bounding box, segmentação e outros atributos categóricos, tais como: forehead color; breast pattern; breast color; size; wing shape, entre outros. Essas anotações são efetuadas através de uma interface visual e critérios pré-estabelecidos. A Figura 2 apresenta algumas imagens pertencentes a esse conjunto de dados. Observase que a maioria das imagens foram obtidas em ambientes reais, em geral o habitat do pássaro, tendo como agravante o fato dos mesmos estarem imersos em ambientes naturais sem restrições para coleta de imagens. A base de dados CUB-200 apresenta-se originalmente no formato RGB (do inglês: Red, Blue, Green) o qual é baseado em um sistema de coordenadas cartesianas. Trata-se um modelo de cor baseado na síntese aditiva, com o qual é possível representar uma cor com diferentes adições das três cores primárias. Atualmente, é um modelo muito utilizado, sendo aplicado, por exemplo, em câmeras e monitores de vídeo [Filho and Neto. 1999]. O modelo RGB apresenta uma grande correlação entre seus canais. A alteração em um canal reflete na imagem inteira. O operador LBP foi originalmente proposto para trabalhar com imagens em escala de cinza [Ojala et al. 2002]. Com o objetivo de observar o comportamento do operador LBP nessas condições, a base de dados será convertida entre os modelos RGB e GRAY (escala de cinza). Finalmente, para investigar o comportamento da extração de textura em diferentes espaços de cores a base de dados será convertida entre os modelos RGB e HSV. O modelo HSV (do inglês: Hue, Saturation, Value) representa uma cor em torno dos

valores da matiz, saturação e valor. O espaço de cor HSV se torna atrativo para realização de testes, pois, as informações de cores e as informações de intensidade de luminosidade estão separadas [Du and Sun 2005]. Figura 2. Visão geral de amostras pertencentes a base de dados Caltech-USCD Birds 200 (CUB-200) [Welinder et al. 2010]. 3.2. Extração de características As características avaliadas neste trabalho são obtidas através da informação de texturas oferecidas pelas imagens. Nesta etapa, as imagens são submetidas a diferentes processos que podem detectar e extrair características, separando algumas informações relevantes que são reduzidas a um vetor de características. A Figura 3 apresenta uma visão geral do método empregado para a construção dos vetores de características. Figura 3. Visão geral da metodologia adotada extração e construção dos vetores de características.

Dada uma imagem de entrada no formato RGB essa será convertida para os formatos HSV e GRAY. A aplicação de três operadores foi utilizada, sendo eles LBPP,R, u2 LBPP,R, ri LBPP,R riu2 que utilizaram valores 8 e 2 para P e 1 e 1.5 para R. Os operadores quando aplicados as imagens no formato RGB utilizaram um canal de cada vez, gerando diferentes vetores para cada canal ou que chamamos de vetores LBP R G B. No caso das imagens no formato HSV, apenas o canal H foi utilizado, gerando LBP H. Quando utilizadas a imagens em escala de cinza definimos o vetor LBP GRAY. 3.3. Classificador Técnica de classificação dominante na literatura para identificação de espécie de pássaros [Branson et al. 2010], [Welinder et al. 2010], [Chai et al. 2011], [Yao et al. 2012] as Máquinas de Vetores de Suporte (SVMs, do Inglês Support Vector Machines) são embasadas pela teoria de aprendizado estatístico e muito atrativas por funcionarem bem com dados de alta dimensionalidade. Neste trabalho, as SVMs foram implementadas por meio da biblioteca LIBSVM [Chang and Lin 2011]. O kernel utilizado foi o Radial Basis Function com a alteração dos parâmetros custo e gamma e validação cruzada de cinco partições no conjunto de dados. 3.4. Métricas de avaliação Na abordagem de problemas com mais de duas classes as instâncias podem ser corretamente ou incorretamente classificadas em relação a qualquer classe. Com c classes, a matriz de confusão se transforma em uma matriz contendo os y resultados do classificador. Com a construção de uma matriz de confusão resultados da classificação podem ser analisados e algumas métricas podem ser calculadas: Exatidão / Acurácia: é o número de classificações de corretas (a soma dos resultados Verdadeiros Positivos (VP) e Verdadeiros Negativos (VN)) dividido pelo número total de classificações (a soma de todos os itens). Conforme representa a equação 5. Exatidão / Acurácia = V P + V N V P + V N + F P + F N Taxa de erro: é o número de Falsos Positivos (FP), dividido pela soma dos Verdadeiros Positivos e Falsos Negativos (FN). A taxa de erro assume um papel importante, uma vez que o objetivo constante é construir classificadores com baixa taxa de erro quando são apresentados novos exemplos. Conforme a equação 6. (5) Taxa de erro = F P V P + F N (6) 4. Experimentos e Discussões Essa seção detalha os experimentos realizados com o propósito de avaliar os descritores de textura baseados em LBP. Um fator importante na implementação de um problema de classificação é a seleção das características mais discriminativas. Em aplicações com textura, dependendo do tipo do operador e os parâmetros P e R utilizados é possível trabalhar

Tabela 1. Quantidade de características geradas pelos operadores utilizados. P=8, R=1 P=12, R=1.5 LBPP,R u2 59 36 LBPP,R ri 36 352 LBPP,R riu2 10 14 centenas de características. Nos experimentos aqui descritos foram considerados os vetores de características originais, sem a aplicação de métodos de seleção de características. A Tabela 1 apresenta a quantidade de características utilizadas em cada um dos vetores. Os resultados obtidos no primeiro experimento são descritos na Tabela 2. A taxa classificação é apresentada para descritores de textura sendo LBP P =8,R=1. Os resultados obtidos experimentalmente, demostraram que é possível atingir resultados similares por meio de textura obtidas de imagens em escala de cinza ou coloridas. Apesar do espaço RGB em conjunto com o operador LBPP u2 =8,R=1 apresentar o melhor desempenho utilizando duas classes, nos demais casos, é claro que quando o número de classes é aumentado a taxa de acerto vai diminuindo. É importante destacar que os resultados apresentados pelo LBP R G B corresponde a média dos resultados obtidos separadamente em cada canal. Essa métrica foi utilizada, pelo fato dos resultados obtidos nos diferentes canais foram muitos similares. No caso do conjunto de características baseado em escala de cinza, observou-se, em alguns casos, similaridade com os resultados obtidos pelo espaço de cor HSV. Tabela 2. Resumo da classificação usando SVM e variações do método LBP como descritor - Experimento 1. Taxa de classificação para o classificador SVM (% ) LBP u2 P =8,R=1 LBP ri P =8,R=1 LBP riu2 P =8,R=1 Classes 2 5 17 200 2 5 17 200 2 5 17 200 LBP GRAY 77,9 48,3 30,4 8,0 76,5 39,7 21,8 7,4 61,8 39,1 20,8 5,8 LBP RGB 82,3 42,4 25,4 7,4 74,5 42,8 22,9 7,2 71,6 43,7 20,4 5,5 LBP H 76,5 42,4 24,7 9,0 75,0 45,7 24,9 8,5 69,1 34,4 20,6 6,7 Os resultados obtidos no segundo experimento são descritos na Tabela 3. A taxa classificação é apresentada para descritores de textura sendo LBPP u2 =12,R=1.5. Observase que a abordagem baseada em SVM detectou corretamente espécies obtendo taxa de acerto de de 85,5%, novamente para o conjunto de duas classes aplicados ao modelo RGB. Ainda é possível observar que as características baseadas em cor apresentam resultados melhores que as características baseadas em escala de cinza para ambos os modelos. Observa-se isso, principalmente, por meios dos resultados obtidos por meio do espaço de cor HSV. Em ambos os experimentos realizados os melhores desempenhos foram obtidos pelo operador LBPP,R, u2 seguidos dos operadores LBPP,R ri e LBPP,R riu2. De forma geral, nos resultados obtidos com as características de textura, observamos que o operador LBP possui um bom poder de discriminação aplicado ao problema de classificação de espécies de pássaros. Para fins de comparação os experimentos aqui descritos apresentaram desempenho médio ligeiramente, superior, quando compa-

Tabela 3. Resumo da classificação usando SVM e variações do método LBP como descritor - Experimento 2. Taxa de classificação para o classificador SVM (% ) LBP u2 P =12,R=1.5 LBP ri P =12,R=1.5 LBP riu2 P =12,R=1.5 Classes 2 5 17 200 2 5 17 200 2 5 17 200 LBP GRAY 79,4 38,8 28,7 9,0 72,1 46,4 26,6 1,4 64,7 37,1 23,7 5,5 LBP RGB 85,3 45,0 27,7 7,5 71,1 38,9 21,5 1,9 64,2 37,1 19,2 5,7 LBP H 79,4 54,3 24,5 8,8 76,5 39,7 20,4 3,3 72,1 33,8 17,3 6,5 rados com um trabalho prévio, recentemente realizado sobre a mesma base de dados [Marini et al. 2013] (in press). Tal estudo buscou identificar o impacto da característica cor no processo de segmentação, consequentemente, na performance dos classificadores quando aplicados a classificação de espécies de pássaros. As taxas de reconhecimentos foram obtidas para a classificação baseada exclusivamente na característica de cor sem o uso de técnicas de segmentação e em seguida com a aplicação da técnica de segmentação proposta em dois cenários diferentes utilizando os espaços de cores RGB e HSV. Para ambos os espaços de cores os pixels da imagens possuem taxa correta segmentação de mais de 70%. Entretanto, o impacto sobre a classificação de espécies de pássaros varia de 8,82% a 0,43%. Isso sugere que, somente a melhoria do algoritmo de segmentação, não oferecerá aumento significativo na taxa de acerto nesse problema, em particular, quando o número de classes é elevado. No entanto, essa conclusão só é válida para utilização dos recursos de cores utilizados. Vários experimentos foram realizados e os resultados com relação a segmentação baseada em cores e a avaliação da segmentação baseada em cores. A Tabela 4 apresenta um resumo dos resultados obtidos dependendo a quantidade de classes utilizadas. Tabela 4. Resumo da classificação de espécie de pássaros utilizando SVM obtidas sem aplicação de técnica de segmentação e em seguida com a técnica de classificação baseada em cores proposta [Marini et al. 2013] (in press). Taxa de classificação (%) Sem segmentação Com segmentação Espaço de cores 2 5 17 200 2 5 17 200 HSV 83.8 47,2 25,5 8,1 92.6 48,3 25,6 8,6 RGB 73,5 39,7 16,9 4,1 77,9 40,3 18,4 6,8 A comparação do trabalho aqui apresentado com outros trabalhos disponíveis na literatura, possui um certo grau de dificuldade, devido ao uso de diferentes protocolos experimentais. A Tabela 5 apresenta um resumo de alguns trabalhos recentes em relação a classificação de espécies de pássaros. Os resultados obtidos, em tais trabalhos são descritos por meio da aplicação de diferentes protocolos experimentais. Em comum a todos existe a utilização da base de dados Caltech-USCD Birds 200 (CUB-200). De forma geral, as taxas de acerto obtidas pelos trabalhos relacionados, comparadas as obtidas neste estudo, indicam que as características extraídas por meio de textura da imagens são alternativas interessantes para solução do problema de identificação de espécies de pássaros.

Tabela 5. Resumo de alguns trabalhos encontrados na literatura que utilizam a base de dados Caltech-USCD Birds 200 (CUB-200). Referência Características Método Taxa de acerto [Welinder et al. 2010] Tamanho da imagem KNN 0,6 % [Welinder et al. 2010] Histograma colorido KNN 1,7% [Branson et al. 2010] SIFT + Spatial Pyramids SVM 19% [Chai et al. 2011] SIFT sem segmentação SVM 6,7% [Chai et al. 2011] SIFT + BiCos-MT e segmentação SVM 16,7% [Chai et al. 2011] SIFT + Ground Truth e segmentação SVM 23,3% [Moghimi 2011] Cor + segmentação KNN 18,9% 5. Conclusões Este artigo abordou a classificação automática de espécies de pássaros por meio do uso de técnicas de Visão Computacional e Reconhecimento de Padrões. Apresentou uma abordagem extração de características de texturas de imagens para identificar a influência da característica textura aplicadas a base Caltech-USCD Birds 200. Em ambos os espaços (cor ou escala de cinza) os resultados obtidos experimentalmente, demostraram que é possível atingir resultados similares por meio de texturas obtidas de imagens em escala de cinza ou coloridas. Ainda, no caso do conjunto de características baseado em escala de cinza, observou-se o bom desempenho do operador LBP. Embora os resultados obtidos sejam interessantes, apontam que somente os descritores de textura LBP, não oferecem informações suficientes para classificação das espécies de pássaros. Cabe mencionar que trabalhos recentes introduziram outras formas de representação de textura similares ao LBP que apresentaram resultados superiores ao LBP em certas classes de aplicações e podem ser aplicados ao problema de classificação de espécies de pássaros para avaliação de desempenho. 6. Agradecimentos Os autores agradecem à CAPES e Fundação Aráucaria pelo auxílio financeiro. Referências Branson, S., Wah, C., Schroff, F., Babenko, B., Welinder, P., Perona, P., and Belongie, S. (2010). Visual recognition with humans in the loop. Technical report, University of California, San Diego - California Institute of Technology. Chai, Y., Lempitsky, V., and Zisserman, A. (2011). Bicos: A bi-level co-segmentation method for image classification. In Computer Vision (ICCV), 2011 IEEE International Conference on, pages 2579 2586. Chang, C.-C. and Lin, C.-J. (2011). LIBSVM: A library for support vector machines. ACM Transactions on Intelligent Systems and Technology, 2:27:1 27:27. Choi, J. Y., Plataniotis, K., and Ro, Y. M. (2010). Using colour local binary pattern features for face recognition. In Image Processing (ICIP), 2010 17th IEEE International Conference on, pages 4541 4544.

Du, C.-J. and Sun, D.-W. (2005). Comparison of three methods for classification of pizza topping using different colour space transformations. Journal of Food Engineering, 68(3):277 287. Filho, O. M. and Neto., H. V. (1999). Processamento Digital de Imagens. Rio de Janeiro: Brasport. Mäenpää, T., Turtinen, M., and Pietikäinen, M. (2003). Real-time surface inspection by texture. Real-Time Imaging, 9(5):289 296. Marini, A.,, Koerich, A., and Facon, J. (2013). Bird species classification based on color features. In IEEE International Conference on Systems, Man and Cybernetics, 2013. Mäenpää, T. and Pietikäinen, M. (2004). Classification with color and texture: jointly or separately? Pattern Recognition, 37(8):1629 1640. Mäenpää, T. and Pietikäinen, M. (2005). Texture analysis with local binary patterns. In: Chen CH & Wang PSP (eds) Handbook of Pattern Recognition and Computer Vision, 3rd ed, World Scientific, 197-216 (invited chapter). Moghimi, M. (2011). Using color for object recognition. Technical report, California Institute of Technology. Ojala, T. and Maenpaa, T. (2001). A generalized local binary pattern operator for multiresolution gray scale and rotation invariant texture classification. In: Advances in Pattern Recognition, ICAPR 2001 Proceedings, Lecture Notes in Computer Science 2013, Springer, 397-406. Ojala, T., Pietikainen, M., and Maenpaa, T. (2002). Multiresolution gray-scale and rotation invariant texture classification with local binary patterns. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 24(7):971 987. Tuceryan, M. and Jain, A. K. (1993). Handbook of pattern recognition & computer vision. chapter Texture analysis, pages 235 276. World Scientific Publishing Co., Inc., River Edge, NJ, USA. Welinder, P., Branson, S., Mita, T., Wah, C., Schroff, F., Belongie, S., and Perona, P. (2010). Caltech-UCSD Birds 200. Technical Report CNS-TR-2010-001, California Institute of Technology. Yao, B., Bradski, G., and Fei-Fei, L. (2012). A codebook-free and annotation-free approach for fine-grained image categorization. In Computer Vision and Pattern Recognition (CVPR), 2012 IEEE Conference on, pages 3466 3473. Zhu, C., Bichot, C.-E., and Chen, L. (2010). Multi-scale color local binary patterns for visual object classes recognition. In Pattern Recognition (ICPR), 2010 20th International Conference on, pages 3065 3068.