RECUPERAÇÃO DE IMAGENS UTILIZANDO TÉCNICAS DE AGRUPAMENTO DE DADOS

Documentos relacionados

Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas

ADM041 / EPR806 Sistemas de Informação

CorelDRAW UM PROGRAMA DE DESIGN

DATA WAREHOUSE. Introdução

Figura 5.1.Modelo não linear de um neurônio j da camada k+1. Fonte: HAYKIN, 2001

Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU

Organizaçãoe Recuperação de Informação GSI521. Prof. Rodrigo Sanches Miani FACOM/UFU

SUMÁRIO. Introdução... 3

Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados

Resultados Experimentais

3 Classificação Resumo do algoritmo proposto

7.Conclusão e Trabalhos Futuros

Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados

MODELAGEM DE DADOS MODELAGEM DE DADOS. rafaeldiasribeiro.com.br 04/08/2012. Aula 7. Prof. Rafael Dias Ribeiro.

6. Geometria, Primitivas e Transformações 3D

Módulo 4. Construindo uma solução OLAP

4 Segmentação Algoritmo proposto

6 Construção de Cenários

Engenharia de Software III

5 Extraindo listas de produtos em sites de comércio eletrônico

RECUPERAÇÃO DE DOCUMENTOS TEXTO USANDO MODELOS PROBABILISTICOS ESTENDIDOS

Na medida em que se cria um produto, o sistema de software, que será usado e mantido, nos aproximamos da engenharia.

CAPÍTULO 3 - TIPOS DE DADOS E IDENTIFICADORES

Agrupamento de dados

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE GOIÁS Curso Superior de Tecnologia em Análise e Desenvolvimento de Sistemas

MLP (Multi Layer Perceptron)

Capítulo 3. Avaliação de Desempenho. 3.1 Definição de Desempenho

Faculdade de Engenharia Optimização. Prof. Doutor Engº Jorge Nhambiu

Universidade Federal de Goiás Instituto de Informática Processamento Digital de Imagens

INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática. (1) Data Mining Conceitos apresentados por

QFD: Quality Function Deployment QFD: CASA DA QUALIDADE - PASSO A PASSO

DESENVOLVIMENTO DE UM SOFTWARE NA LINGUAGEM R PARA CÁLCULO DE TAMANHOS DE AMOSTRAS NA ÁREA DE SAÚDE

Processamento de Imagem. Prof. MSc. André Yoshimi Kusumoto

Para construção dos modelos físicos, será estudado o modelo Relacional como originalmente proposto por Codd.

Status. Barra de Título. Barra de Menu. Barra de. Ferramentas Padrão. Caixa de nomes. Barra de. Ferramentas de Formatação. Indicadores de Coluna

Nathalie Portugal Vargas

UNIVERSIDADE FEDERAL DO PARANÁ UFPR Bacharelado em Ciência da Computação

4 Avaliação Econômica

Classificação da imagem (ou reconhecimento de padrões): objectivos Métodos de reconhecimento de padrões

Algoritmos e Estrutura de Dados III. Árvores

UFGD FCA PROF. OMAR DANIEL BLOCO 6 CLASSIFICAÇÃO DE IMAGENS

Algoritmos e Programação (Prática) Profa. Andreza Leite andreza.leite@univasf.edu.br

Desenvolvendo uma Arquitetura de Componentes Orientada a Serviço SCA

CONCURSO PÚBLICO ANALISTA DE SISTEMA ÊNFASE GOVERNANÇA DE TI ANALISTA DE GESTÃO RESPOSTAS ESPERADAS PRELIMINARES

Dadas a base e a altura de um triangulo, determinar sua área.

Roteiro. Arquitetura. Tipos de Arquitetura. Questionário. Centralizado Descentralizado Hibrido

2 Atualidade de uma base de dados

Clip-art Retrieval using Sketches PTDC/EIA-EIA/108077/2008

Programação Estruturada e Orientada a Objetos. Fundamentos Orientação a Objetos

Sistemas de Informação I

Ivan Guilhon Mitoso Rocha. As grandezas fundamentais que serão adotadas por nós daqui em frente:

O que é a ciência de dados (data science). Discussão do conceito. Luís Borges Gouveia Universidade Fernando Pessoa Versão 1.

Novell. Novell Teaming 1.0. novdocx (pt-br) 6 April 2007 EXPLORAR O PORTLET BEM-VINDO DESCUBRA SEU CAMINHO USANDO O NOVELL TEAMING NAVIGATOR

Faculdades Santa Cruz - Inove. Plano de Aula Base: Livro - Distributed Systems Professor: Jean Louis de Oliveira.

Governança de TI. ITIL v.2&3. parte 1

Ciclo de Vida Clássico ou Convencional CICLOS DE VIDA DE DESENVOLVIMENTO DE SISTEMAS. Ciclo de Vida Clássico ou Convencional. Enfoque Incremental

UNIVERSIDADE FEDERAL DO PARANÁ UFPR Bacharelado em Ciência da Computação

UNIVERSIDADE FEDERAL DA BAHIA - UFBA

Manual do Painel Administrativo

PROPOSTA DE UM MODELO DE SISTEMA HIPERMÍDIA PARA APRESENTAÇÃO DO CURSO DE CIÊNCIA DA COMPUTAÇÃO

MÓDULO 6 INTRODUÇÃO À PROBABILIDADE

3 SCS: Sistema de Componentes de Software

UM ESTUDO DE CASO SOBRE A INDEXAÇÃO AUTOMÁTICA DE DOCUMENTOS OFICIAIS DA UENP BASEADO EM LAYOUTS

Sistemas Distribuídos

UNIVERSIDADE DE SÃO PAULO. Faculdade de Arquitetura e Urbanismo

PALAVRAS-CHAVE: Massas Nodulares, Classificação de Padrões, Redes Multi- Layer Perceptron.

Estruturas de Armazenamento e Indexação. Rafael Lage Moreira Barbosa

IW10. Rev.: 02. Especificações Técnicas

Disciplina de Banco de Dados Introdução

RECONHECIMENTO DE PLACAS DE AUTOMÓVEIS ATRAVÉS DE CÂMERAS IP

Guia Básico de Utilização da Biblioteca Virtual da FAPESP. Thais Fernandes de Morais Fabiana Andrade Pereira

ISO/IEC 12207: Gerência de Configuração

SISTEMAS DE GESTÃO São Paulo, Janeiro de 2005

3 Arquitetura do Sistema

Organização e Arquitetura de Computadores I

Manual do Ambiente Moodle para Professores

A IMPORTÂNCIA DO SISTEMA DE INFORMAÇÃO GERENCIAL PARA AS EMPRESAS

Reconhecimento de marcas de carros utilizando Inteligência Artificial. André Bonna Claudio Marcelo Basckeira Felipe Villela Lourenço Richard Keller

Possui como idéia central a divisão de um universo de dados a ser organizado em subconjuntos mais gerenciáveis.

Conteúdo. Disciplina: INF Engenharia de Software. Monalessa Perini Barcellos. Centro Tecnológico. Universidade Federal do Espírito Santo

3.1 Definições Uma classe é a descrição de um tipo de objeto.

APOSTILA DE EXCEL 2007

ATENÇÃO: * Arquivos com tamanho superior a 500 KB NÃO SERÃO ACEITOS * SOMENTE serão aceitos documentos do formato: PDF

Semântica para Sharepoint. Busca semântica utilizando ontologias

Feature-Driven Development

APLICATIVOS GRÁFICOS (AULA 4)

Projeto de Redes Neurais e MATLAB

Conceitos de Banco de Dados

Pós-Graduação em Gerenciamento de Projetos práticas do PMI

Sistemas Operacionais

A memória é um recurso fundamental e de extrema importância para a operação de qualquer Sistema Computacional; A memória trata-se de uma grande

Disciplina: Introdução à Informática Profª Érica Barcelos

Tabela de Símbolos. Análise Semântica A Tabela de Símbolos. Principais Operações. Estrutura da Tabela de Símbolos. Declarações 11/6/2008

Notas da Aula 17 - Fundamentos de Sistemas Operacionais

DEPARTAMENTO DE MATEMÁTICA E CIÊNCIAS EXPERIMENTAIS

Transcrição:

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE MINAS GERAIS Programa de Pós-Graduação em Informática RECUPERAÇÃO DE IMAGENS UTILIZANDO TÉCNICAS DE AGRUPAMENTO DE DADOS Fabiano Pereira Bhering Belo Horizonte 2012

Fabiano Pereira Bhering RECUPERAÇÃO DE IMAGENS UTILIZANDO TÉCNICAS DE AGRUPAMENTO DE DADOS Dissertação apresentada ao Programa de Pós-Graduação em Informática como requisito parcial para qualificação ao Grau de Mestre em Informática pela Pontifícia Universidade Católica de Minas Gerais. Orientador: Silvio Jamil Ferzoli Guimarães Co-orientador: Zenilton Kleber Gonçalves do Patrocínio Júnior Belo Horizonte 2012

FICHA CATALOGRÁFICA Elaborada pela Biblioteca da Pontifícia Universidade Católica de Minas Gerais B575r Bhering, Fabiano Pereira Recuperação de imagens utilizando técnicas de agrupamento de dados / Fabiano Pereira Bhering. Belo Horizonte, 2012. 57f.:il. Orientador:Silvio Jamil Ferzoli Guimarães Co-orientador: Zenilton Kleber Gonçalves do Patrocínio Júnior Dissertação (Mestrado) Pontifícia Universidade Católica de Minas Gerais. Programa de Pós-graduação em Informática. 1.Processamento de imagens Técnicas digitais. 2. Sistemas de recuperação da informação. 3. Análise por agrupamento. I. Guimarães, Silvio Jamil Ferzoli. II. Pontifícia Universidade Católica de Minas Gerais. Programa de Pós-Graduação em Informática. III. Título. CDU: 681.3.093

Fabiano Pereira Bhering Recuperação de Imagens Utilizando Técnicas de Agrupamento de Dados. Dissertação apresentada ao Programa de Pós-Graduação em Informática como requisito parcial para qualificação ao Grau de Mestre em Informática pela Pontifícia Universidade Católica de Minas Gerais. Silvio Jamil Ferzoli Guimarães (Orientador) PUC Minas Zenilton Kleber Gonçalves do Patrocínio Júnior (Co-orientador) PUC Minas Luis Enrique Zárate Galvez PUC Minas Clodoveu Augusto Davis Junior UFMG Belo Horizonte, 3 de Fevereiro de 2012.

RESUMO Nos dias atuais, as imagens digitais estão cada vez mais presentes e distribuídas em diversos meios de comunicação, tornando-se essencial a adoção de sistemas automatizados, capazes de lidar com o armazenamento e a recuperação das imagens em um tempo aceitável para os padrões exigidos. Em geral, o armazenamento das imagens é realizado com referência ao conteúdo de cada arquivo, que pode ser extraído por suas características de cor. Nesse sentido, para a pesquisa de uma imagem ser eficiente, são necessários sistemas capazes de recuperar grandes volumes de imagens com base no conteúdo, em um intervalo de tempo aceitável. Para isso, torna-se indispensável adotar uma metodologia que determine as técnicas de indexação e recuperação de imagens, tendo como finalidade a diminuição do tempo de consulta, sem que isso signifique perda na qualidade das respostas. Neste trabalho é desenvolvido um método para recuperação de imagens com base no conteúdo, utilizando-se técnicas de agrupamento de dados. Objetiva-se, dessa forma, a diminuição da complexidade computacional, classificando os grupos de imagens com características semelhantes, de modo que se possa evitar a pesquisa sequêncial que tem sido adotada em alguns sistemas. Palavras-chave: Recuperação de imagens baseada em conteúdo, características de cor, técnicas de agrupamento, classificação de Imagens.

ABSTRACT Nowadays, digital images are increasingly present and distributed in various media, making it essential to adopt automated systems, capable of dealing with the storage and retrieval of images at a time acceptable to the standards required. In general, the storage of images is done with reference to the content of each file, which can be extracted by its color characteristics. In this sense, to search for an image to be effective, you need systems capable of retrieving large volumes of images based on content in an acceptable time frame. For this, it is essential to adopt a methodology that determines the techniques of indexing and retrieval of images, with the purpose of reducing the query time, without meaning a loss in quality of responses. The paper is develop a method for image retrieval based on content, using data clustering techniques. Thus, the objective is the reduction of computational complexity, classifying groups of images with similar characteristics, so that we can avoid sequential search which has been adopted in current systems. Keywords: Contet-based image retrieval, color features, clustering techniques, classification of images.

LISTA DE FIGURAS FIGURA 1 Estrutura do sistema de recuperação por conteúdo. Adaptação: (TOR- RES; FALCÃO, 2006).................................................. 27 FIGURA 2 Arquitetura proposta.............................................. 32 FIGURA 3 Estrutura de índice invertido....................................... 39 FIGURA 4 Estrutura de índice invertido no processo de recuperação por merge 39 FIGURA 5 Arquitetura utilizando o Lucene................................... 40 FIGURA 6 Gráfico com o número de clusters e seu impacto no tempo da para cada variação do método proposto.......................................... 44 FIGURA 7 Gráfico com a média do tempo de resposta dos métodos implementados e a pesquisa sequencial do LIRe....................................... 45 FIGURA 8 Gráfico com o número de cluster e o impacto na qualidade das consultas para o método utilizando o k-means, considerando a pesquisa sequencial do LIRe como o conjunto de resposta ideal........................... 46 FIGURA 9 Gráfico com o número de cluster e o impacto na qualidade das consultas para o método utilizando o Árvore Geradora Mínima, considerando a pesquisa sequencial do LIRe como o conjunto de resposta ideal....... 47 FIGURA 10 Gráfico com a qualidade dos métodos implementados, considerando a pesquisa sequêncial no LIRe como o conjunto de respostas ideal....... 48 FIGURA 11 Gráfico com a qualidade dos métodos implementados em relação ao LIRe, considerando a classificação do COREL como o conjunto de respostas ideal.............................................................. 49 FIGURA 12 Conjunto de imagens indexadas, separadas por categorias.......... 49 FIGURA 13 Agrupamento realizado pelo K-Means.............................. 50

FIGURA 14 Agrupamento realizado pela Árvore Geradora Mínima.............. 50 FIGURA 15 Recuperação de imagens realizado pelo K-Means................... 51 FIGURA 16 Recuperação de imagens realizado pela Árvore Geradora Mínima... 51

SUMÁRIO 1 INTRODUÇÃO...................................................... 13 1.1 Objetivos.................................................. 14 1.2 Contribuições.............................................. 14 1.3 Organização da dissertação.................................. 15 2 RECUPERAÇÃO DE IMAGEM BASEADA EM CONTEÚDO VI- SUAL............................................................... 16 2.1 Características das imagens.................................. 16 2.1.1 Descritor de Cor...................................... 16 2.1.2 Descritor de Textura................................... 18 2.1.3 Descritor de Forma.................................... 18 2.2 Medidas de similaridade.................................. 19 2.3 Sistemas de Recuperação de Imagens baseado em conteúdo visual 20 3 AGRUPAMENTO DE DADOS...................................... 22 3.1 Agrupamento por particionamento.......................... 22 3.1.1 Algoritmo K-Means.................................... 23 3.2 Agrupamento baseado em grafos........................... 24 3.2.1 Árvore Geradora Mínima(AGM)......................... 24 4 ESTRUTURA PARA UM SISTEMA DE RECUPERAÇÃO DE IN- FORMAÇÃO........................................................ 26 4.1 Etapas da Recuperação de Informação....................... 26 4.1.1 Processo de indexação.................................. 26 4.1.2 Processo de recuperação................................. 28

4.2 Modelos de Recuperação de Informação..................... 28 4.2.1 Modelo Booleano...................................... 29 4.2.2 Modelo Vetorial....................................... 29 5 METODOLOGIA PARA RECUPERAÇÃO DE IMAGENS UTILI- ZANDO TÉCNICAS DE AGRUPAMENTO DE DADOS............ 31 5.1 Arquitetura proposta..................................... 31 5.1.1 Processo de indexação.................................. 31 5.1.1.1 Extração de características............................... 31 5.1.1.2 Similaridade entre imagens............................... 33 5.1.1.3 Agrupamento de imagens................................ 33 5.1.1.4 Lista Invertida.......................................... 34 5.1.1.5 Indexador.............................................. 35 5.1.2 Processo de recuperação................................. 35 5.1.2.1 Pesquisa............................................... 36 5.1.2.2 Merge................................................. 36 5.2 Considerações Finais........................................ 37 6 IMPLEMENTAÇÃO E RESULTADOS EXPERIMENTAIS.......... 38 6.1 Estrutura de armazenamento e recuperação das imagens......... 38 6.2 Biblioteca Lucene........................................... 39 6.2.1 LIRe (Lucene Image Retrieval)........................... 41 6.3 Avaliação dos sistemas de recuperação de informação........... 41 6.4 Experimentos realizados.................................. 42 6.4.1 Experimento 1: Escolha do número de clusters.............. 43 6.4.2 Experimento 2: Avaliação da qualidade das consultas......... 44 6.4.3 Experimento 3: Avaliação Visual do agrupamento das imagens. 46 6.5 Considerações finais...................................... 47

7 CONCLUSÃO....................................................... 52 REFERÊNCIAS........................................................ 54

13 1 INTRODUÇÃO Observa-se atualmente a crescente disponibilização de imagens em vários meios de comunicação, assim como a intensificação da popularização das câmeras digitais, tornando-se necessário o desenvolvimento de diversas técnicas para a recuperação de informação com base no conteúdo visual das imagens. Os meios de armazenamento das imagens necessitam de aplicações eficientes e eficazes para as pesquisas em seus acervos. Uma das maneiras de se buscar informação em uma imagem é encontrar representações descritivas baseadas em seu conteúdo, onde este conteúdo é descrito por meio de características visuais de baixo nível, como forma, textura e cor. Os aspectos visuais de cores das imagens permitem gerar uma fonte de dados para pesquisas, se revelando como os índices mais satisfatórios para recuperação de informação com base em seu conteúdo visual. A cada dia, aumentam-se os esforços no desenvolvimento de trabalhos que visam solucionar os problemas de estruturação e acesso aos conteúdos visuais das imagens. As técnicas para recuperação de informação em imagens têm sido obtidas utilizando metodologias para extração, armazenamento e pesquisas de características das imagens. Uma maneira de representar o conteúdo da imagem é medir seus níveis de cor, obtidos no cálculo de seu histograma, aplicando-se o processamento da imagem. Os estudos e as técnicas do processamento digital de imagens progrediram na criação de ferramentas para a extração de características das imagens, porém, as características reconhecidas necessitam ser armazenadas e organizadas em base de dados para futuras consultas. Os sistemas de recuperação de imagens retornam de seus índices as imagens mais similares ao padrão de consulta definido pelo usuário, ou seja, percorrem todas as imagens armazenadas na base, comparando-as com a imagem pesquisada. Todavia, os mesmos têm mostrado problemas de desempenho ao exibir os resultados. Dessa forma, considera-se que a melhoria do desempenho nas buscas pode ser obtida na organização e agrupamento das informações extraídas. Os métodos de agrupamento podem ser usados para reduzir a dimensão de um conjunto de dados, reduzindo uma ampla gama de objetos à informação do centro do seu conjunto. Assim é possível organizar elementos de um determinado conjunto mutuamente similares e, preferencialmente, muito diferentes dos elementos de outros conjuntos. As técnicas de agrupamento se mostram como uma das mais úteis para diminuir a complexidade computacional destes sistemas, uma vez que agrupam dados com características semelhantes sob determinado critério, sem perder a representatividade das informações. Logo, nosso maior desafio é a utilização das técnicas de agrupamento de dados para classificar as imagens em grupos similares conforme o reconhecimento de suas características,

14 com intuito de melhorar o desempenho nas consultas. 1.1 Objetivos O principal objetivo do presente trabalho é desenvolver uma metodologia para a recuperação de imagens utilizando técnicas de agrupamento de dados, buscando melhorar a eficência das pesquisas. As etapas para o desenvolvimento são: Analisar métodos de extração de características e similaridade das imagens; Organizar a indexação das imagens, utilizando técnicas de agrupamento de dados, para classificar as imagens de acordo com a similaridade entre elas; Estruturar os índices e agrupamentos para o armazenamento e consulta das imagens. Para o desenvolvimento da metodologia são utilizados vetores que descrevem a extração da característica das imagens, obtida por um cálculo do histograma de cor, enquanto os agrupamentos são implementados com os algoritmos, sendo um por particionamento (K-Means) e o outro baseado em grafos (árvore geradora mínima), este, adotando a técnicas de poda normalizada da árvore. 1.2 Contribuições Tendo em vista o aumento dos meios para armazenamento de imagens, as técnicas eficientes para recuperação de imagens têm se mostrado muito relevantes. Nesse sentido, o conteúdo visual existente nas imagens pode servir como base para as pesquisas, assim como uma importante ferramenta para consultas em acervos multimídias. As principais contribuições do trabalho são: Revisão bibliográfica, com o estudo dos métodos de recuperação de imagens baseado em conteúdo visual; Escolha de métodos para agrupamento de características de imagens; Desenvolvimento de um sistema de recuperação de imagens utilizando técnicas de agrupamento de dados; Avaliação dos resultados experimentais do método proposto para resolução de problemas da pesquisa sequencial nos mecanismos de busca de imagens. Dessa forma, este estudo produz uma metodologia que servirá como base para novas pesquisas na área de recuperação de imagens.

15 1.3 Organização da dissertação O presente texto está organizado da seguinte forma: O Capítulo 2 faz referência aos trabalhos que já foram desenvolvidos na área de recuperação de imagens com base no conteúdo visual, expondo sobre as bases teóricas e sobre os métodos existentes. A especificação das técnicas de agrupamento de dados será exposta no Capítulo 3, exibindo a estrutura e as técnicas utilizadas para agrupamento de imagens. A estrutura dos sistemas de recuperação de imagens será discutida no Capítulo 4, juntamente com as ferramentas e fundamentos tecnológicos utilizados. O Capítulo 5 descreve a metodologia para recuperação de imagens utilizando técnicas de agrupamento de dados, apresentando a arquitetura da proposta e sua implementação. A avaliação do conjunto de experimentos realizados na metodologia proposta será exposta no Capítulo 6. Encerra-se o trabalho no Capítulo 7 com a conclusão dos resultados e sugestões para trabalhos futuros.

16 2 RECUPERAÇÃO DE IMAGEM BASEADA EM CONTEÚDO VISUAL Uma das abordagens utilizadas para recuperação de imagens é conhecida como recuperação de imagens baseada em conteúdo (RIBC). Seu principal objetivo é encontrar imagens relevantes conforme a necessidade do usuário, por meio de características visuais automaticamente extraídas das imagens. Pode-se observar que a interpretação semântica é fator essencial para a recuperação de imagens e as estratégias de caracterização, modelagem, pesquisa, similaridade, visualização e realimentação desses sistemas determinam conjuntamente sua eficiência e popularidade, representando portanto, a principal dificuldade desta área de estudo. As estratégias fundamentais para um sistema RIBC são caracterizadas em três classes: Extração de caraterísticas visuais, indexação e recuperação. Os métodos de representação de características das imagens mais utilizados usam cor, textura e forma como atributos de indexação, os quais são extraídos da imagem de maneira independente (CHORA; ANDRYSIAK; CHORA, 2007). As características das imagens são extraídas e armazenadas em vetores de características. Para comparar os vetores é necessária a utilização de medidas que verificam a similaridade entre os vetores das imagens da base de dados com o vetor da imagem exemplo. A verificação da similaridade é normalmente baseada em medidas de distância e os vetores das imagens têm geralmente a mesma dimensão. 2.1 Características das imagens A extração de características é obtida através do processamento de imagens, realizada com a finalidade de obter valores numéricos que possam caracterizar essas imagens. Os recursos utilizados na extração das características para descrever uma imagem podem ser agrupados nos seguintes tipos: 2.1.1 Descritor de Cor Uma das propriedades visuais mais utilizadas em sistemas de recuperação de imagens por conteúdo (TORRES; FALCÃO, 2006). É um importante componente para representação da imagem e se apresenta robusta a distorção, rotação e translação do objeto (ALBUQUERQUE; GUIMARÃES, 2000). Existem várias formas de representar as cores. Para

17 a realização de tal tarefa, utiliza-se um espaço de cor como base para a representação. De acordo com a aplicação, certo espaço de cor pode apresentar-se mais adequado ou viável frente aos demais. Os descritores de cor é representada como ponto de um espaço tridimensional (tais como RGB, HSV, YCbCr, YUV) (BIMBO, 1999). Eles permitem a discriminação entre o estímulo de cor, além da avaliação de similaridade e identificação de cores. A seguir são especificados alguns descritores e espaços de cores mais utilizados: Histograma de Cores: Descreve a ocorrência das cores em uma imagem. Para a obtenção de compactabilidade e desempenho, normalmente os histogramas apresentam a frequência de um intervalo de valores ao invés de um único valor de cor. Outras vezes, ocorre a fixação do número de cores utilizadas, seja pela maior frequência dessa cor na coleção de imagens, ou pelo seu podes de discriminação frente as demais. Entre os problemas dos histogramas de cores pode-se destacar sua alta diminsionalidade e o fato de não considerarem a localização espacial das cores. Assim, imagens muito diferentes podem ter representações semelhantes. Caso adotada a divisão das imagens em regiões, observa-se o aumento da dimensionalidade e da carga computacional necessária para a comparação dos descritores. Momentos de Cores: Caracterizam as imagens segundo suas distribuições de cores por meio de três medidas: média, desvio padrão e inclinação. Cada uma dessas medidas é computada para cada um dos canais de cores de uma imagem. Desta forma, para imagens pertencentes ao espaço RGB, calcula-se a média, desvio padrão e inclinação para os canais R, G e B, respectivamente. Devido a sua alta compactabilidade e por não considerar informações espaciais, este descritor tem poder de discriminação reduzido. Portanto, seu desempenho pode ser significativamente aprimorado quando aplicado a regiões de imagens, caracterizando localmente a região. Vetores de Coerência de Cores: Nesta abordagem, cada pixel de uma imagem é classificado como coerente ou incoerente. Um pixel será coerente se ele fizer parte de uma região de coloração uniforme (de tamanho pré-definido), caso contrário, ele será classificado como incoerente. Geralmente, para imagens com muitas regiões de cores uniforme ou muita textura, os vetores de coerência produzem bons resultados de recuperação, principalmente quando aplicados ao espaço de cor HSV (PASS; ZABIH; MILLER, 1996). Correlograma de Cores: É um histograma tridimensional que caracteriza a distribuição das cores e a correlação espacial entre os pares de cores. A Primeira e a segunda dimensão do histograma representam as cores de qualquer par de pixel e a terceira dimensão, a distância espacial entre eles (HUANG et al., 1997). Produz

18 bons resultados comparado ao histograma e o vetor de coerência, porém é computacionalmente mais caro devido a sua alta dimensionalidade (LONG; ZHANG; FENG, 2003). Características Invariantes de Cores: Fatores como mudança de iluminação, as orientações das superfícies dos objetos, o posicionamento e a angulação das câmeras, e a refração, entre outros, influenciam consideravelmente na variação das cores. Por isso, representações invariantes de cores foram propostas e introduzidas na recuperação de imagem por conteúdo. Apresentam um conjunto de características invariantes de cores derivada das propriedades de reflexão dos objetos. Quando aplicadas na recuperação de imagens, produzem representações do conteúdo das imagens independente da iluminação e geometria da cena, mas acabam por introduzir certa perda no poder de discriminação entre imagens. O descritor de cor mais comum é o histograma, que descreve o conteúdo global de uma imagem pelo percentual de pixels em cada cor. São observadas pequenas diferenças entre o espaço RGB com os outros espaços em Smith e Chang (1996). 2.1.2 Descritor de Textura Certas regiões da imagem apresentam uma homogeneidade, na forma de padrões visuais com propriedades estruturais que não são suficientemente representadas por cores. Essas regiões apresentam texturas que necessitam de recursos próprios para sua representação. O descritor de textura é representado de forma significativa por Tamura, Mori e Yamawaki (1978), definindo as propriedades de grossura, contraste, direcionalidade, linearidade, regularidade e aspereza. A representação do descritor de textura também é obtida através da wavelet de Gabor (RUI; HUANG; CHANG, 1999) e apresenta resultados próximos ao da visão humana. 2.1.3 Descritor de Forma O descritor de forma pode se basear em características perceptivas da forma presente no contorno e também no conteúdo do interior dos objetos, e depende muito do domínio das imagens em questão. Torres et al. (2008) afirmam que é um desafio encontrar uma descrição ideal para cada tipo de aplicação, considerando informações de contorno, interior ou uma combinação dos métodos para obter uma recuperação de imagens mais eficiente. Entre os métodos de extração de características citados, os histogramas de cor obtêm melhores resultados para fotografias coloridas em geral. No entanto, as abordagens

19 utilizando descritores de forma são melhores em várias tarefas, mas geralmente possuem um maior custo computacional (DESELAERS; KEYSERS; NEY, 2008). Os histogramas de cores considera a informação de cor de uma imagem globalmente. Como nenhum particionamento ou pré-processamento da imagem é necessário durante a extração de características, esses descritores normalmente apresentam algoritmos de extração de características mais simples e rápidos. 2.2 Medidas de similaridade A semelhança entre duas imagens pode ser avaliada por meio de medidas de similaridade ou dissimilaridade, utilizando funções para calcular a distância entre os vetores de características das imagens. A função de distância é utilizada de acordo com a estrutura e conteúdo dos vetores, podendo ser necessário utilizar mais de uma função de distância. Esta escolha depende das especificidades do conjunto de imagens utilizado e seus respectivos vetores. Algumas das medidas de similaridade mais utilizadas para vetores de características de imagens estão descritas a seguir: Distância de Minkowski: Esta técnica é uma generalização da distância entre dois pontos I = (x i1, x i2, x i3,..., x in ) e J = (y j1, y j2, y j3,..., y jn ) em um espaço n- dimensional. Na equação 2.1 observa-se a fórmula matemática, onde q é um inteiro positivo que representa a norma: d Minkowski (I, J) = q ( x i1 x j1 q + x i2 x j2 q +... + x in x jn q (2.1) Distância Euclidiana: Trata-se de uma especialização da distância de Minkowski para q = 2, sendo a distância linear entre os pontos I = (x i1, x i2, x i3,..., x in ) e J = (y j1, y j2, y j3,..., y jn ), com sua fórmula definida pela equação 2.2 para n dimensões. d Euclidiana (I, J) = ( x i1 x j1 2 + x i2 x j2 2 +... + x in x jn 2 (2.2) Distância Manhattan: Refere-se a outra especialização da distância de Minkowski para q = 1, sendo a distância linear entre os pontos I = (x i1, x i2, x i3,..., x in ) e J = (y j1, y j2, y j3,..., y jn ), com sua fórmula definida pela equação 2.3 para n dimensões. d Manhattan (I, J) = x i1 x j1 + x i2 x j2 +... + x in x jn (2.3) A tradicional função de distância utilizada para calcular a similaridade entre imagens nos sistemas RIBC é a distância Euclidiana, porém, para alguns descritores conseguem obter melhores resultados utilizando a função de distância Manhatan, onde a

20 distância entre dois pontos á dada pela soma das diferenças absolutas entre as suas coordenadas. 2.3 Sistemas de Recuperação de Imagens baseado em conteúdo visual Entre os sistemas de recuperação de imagens baseados em conteúdo mais conhecidos está o QBIC da IBM (FALOUTSOS et al., 1994), pioneiro na área. É considerado um dos mais importantes até hoje, utilizando histograma de cor, textura e formas para representar a característica das imagens. Sua consulta é baseado em imagem exemplo, inclusive permitindo a inserção de rascunhos. Utiliza a distância Euclidiana para a cor média, para textura e distância quadrática do histograma para histogramas de cores (alto custo computacional), computando um somatório final que representa o casamento entre a imagem consulta e componentes da coleção. Seus resultados são ordenados por relevância, apresentando o ranqueamento final opcionalmente e possui realimentação de relevância. Após o QBIC, outros sistemas foram desenvolvidos, como o Photobook (PENTLAND; PI- CARD; SCLAROFF, 1996), ao qual foram sendo agregados novos recursos de aparência para descrever o conteúdo. O Blobworld (CARSON et al., 1999) introduziu o uso da segmentação para representar regiões da imagens. Para a consulta o usuário seleciona uma categoria limitando o espaço de consulta e então marca uma região indicando sua importância e a de cada característica, sendo que mais de uma região pode ser marcada para a consulta. Utiliza a distância quadrática para histogramas de cores, distância Euclidiana para textura, distância entre centroides para localização das regiões, todas combinadas em um somatório final. Os resultados são ordenados linearmente e apresentados juntamente com uma versão segmentada da imagem recuperada. Outros sistemas também utilizaram essa abordagem, como o SIMBA (SIGGELKOW; SCHAEL; BURKHARDT, 2001), CIRES (IQBAL; AGGARWAL, 2002), SIMPLIcity (WANG; LI; WIEDERHOLD, 2001) e o IRMA (LEHMANN et al., 2005). Muitos trabalhos e sistemas RIBC fornecem ao usuário a possibilidade de refinar suas buscas através de realimentação de relevância. A recuperação de imagens utilizando este paradigma consiste na interação do usuário com o sistema de busca com intuito de melhorar a qualidade da recuperação a partir de indicação de exemplos positivos e/ou negativos das imagens recuperadas. Este tipo de implementação pode ser encontrado em PicHunter (COX et al., 1996), essa estrate?gia utiliza da subjetividade humana para refinamento da busca. Outra abordagem, que também faz o uso de realimentação de relevância, é proposta no sistema MARS (RUI; HUANG; MEHROTRA, 1997) e tem destaque perante os demais sistemas pelo envolvimento de múltiplas pesquisas em sua implementação, que incluem visão computacional, recuperação de informação e sistemas de gerenciamento de bancos de dados.

21 Podem ser encontrados na web sistemas de dominio público como o GIFT (GNUImage- Finding Tool) e demonstrações disponíveis on-line do Viper e do Compass (Computer Aided Search System). Uma descrição mais apurada desses e de outros sistemas RIBC pode ser vista em Veltkamp e Tanase (2002). As tendências das pesquisas relacionadas aos sistemas RIBC podem ser vistas em Datta et al. (2006). O Moving Picture Experts Group (MPEG) define um padrão para acesso de conteúdo em base de dados multimídia com seu padrão MPEG-7, com um conjunto de descritores padronizados para as imagens (CHANG; SIKORA; PURI, 2001). Os descritores mais populares para caracterizar as informações de cor em imagens são histogramas de cor, momentos de cor e correlogramas de cor. Embora todos estes métodos proporcionam boa caracterização de cor, eles têm o problema de altadimensionalidade. Isso conduz a tempos computacional mais caros, tornando a indexação ineficiente quanto ao seu desempenho. Para solucionar esses problemas foi proposto por Venugopal e Sudhamani (2008) a utilização de técnicas de agrupamento de dados, onde a segmentação de regiões das imagens são obtidas por agrupamento de cores, e o processo de indexação é baseado na técnica de agrupamento R* Tree, onde as imagens são indexadas por meio de estruturas multidimensionais. Uma proposta para o balanceamento dos cluster, também utilizando técnicas de agrupamentos de dados, é descrita por Amsaleg, Jégou e Tavenard (2011), por meio da alteração do algoritmo k-means. Ela produz grupos de imagens com tamanhos equilibrados, sem prejudicar a qualidade da pesquisa. Neste trabalho será utilizado como base o LIRe (LUX; CHATZICHRISTOFIS, 2008), uma importante biblioteca, que oferece as principais técnicas de extração de características de imagens, além dos meios de indexação e recuperação. Trata-se de uma extensão da biblioteca de recuperação de informação Lucene (HATCHER; GOSPODNETIC, 2004), disponibilizando recursos de extração de características por meio de diversos descritores, funções de cálculo de similaridade e mecanismo de indexação e recuperação dos vetores de características, e ainda fornece métodos para realimentação de relevância. Porém, suas consultas são inapropriadas para grandes base de imagens, por serem realizadas utilizando a pesquisa sequêncial. Assim, pode-se considerar uma fonte de estudo para implementações de novas técnicas, como as de agrupamento de dados, buscando melhorar a eficiência e eficácia da recuperação de imagens.