RECUPERAÇÃO DE IMAGENS UTILIZANDO TÉCNICAS DE AGRUPAMENTO DE DADOS

Tamanho: px
Começar a partir da página:

Download "RECUPERAÇÃO DE IMAGENS UTILIZANDO TÉCNICAS DE AGRUPAMENTO DE DADOS"

Transcrição

1 PONTIFÍCIA UNIVERSIDADE CATÓLICA DE MINAS GERAIS Programa de Pós-Graduação em Informática RECUPERAÇÃO DE IMAGENS UTILIZANDO TÉCNICAS DE AGRUPAMENTO DE DADOS Fabiano Pereira Bhering Belo Horizonte 2012

2 Fabiano Pereira Bhering RECUPERAÇÃO DE IMAGENS UTILIZANDO TÉCNICAS DE AGRUPAMENTO DE DADOS Dissertação apresentada ao Programa de Pós-Graduação em Informática como requisito parcial para qualificação ao Grau de Mestre em Informática pela Pontifícia Universidade Católica de Minas Gerais. Orientador: Silvio Jamil Ferzoli Guimarães Co-orientador: Zenilton Kleber Gonçalves do Patrocínio Júnior Belo Horizonte 2012

3 FICHA CATALOGRÁFICA Elaborada pela Biblioteca da Pontifícia Universidade Católica de Minas Gerais B575r Bhering, Fabiano Pereira Recuperação de imagens utilizando técnicas de agrupamento de dados / Fabiano Pereira Bhering. Belo Horizonte, f.:il. Orientador:Silvio Jamil Ferzoli Guimarães Co-orientador: Zenilton Kleber Gonçalves do Patrocínio Júnior Dissertação (Mestrado) Pontifícia Universidade Católica de Minas Gerais. Programa de Pós-graduação em Informática. 1.Processamento de imagens Técnicas digitais. 2. Sistemas de recuperação da informação. 3. Análise por agrupamento. I. Guimarães, Silvio Jamil Ferzoli. II. Pontifícia Universidade Católica de Minas Gerais. Programa de Pós-Graduação em Informática. III. Título. CDU:

4 Fabiano Pereira Bhering Recuperação de Imagens Utilizando Técnicas de Agrupamento de Dados. Dissertação apresentada ao Programa de Pós-Graduação em Informática como requisito parcial para qualificação ao Grau de Mestre em Informática pela Pontifícia Universidade Católica de Minas Gerais. Silvio Jamil Ferzoli Guimarães (Orientador) PUC Minas Zenilton Kleber Gonçalves do Patrocínio Júnior (Co-orientador) PUC Minas Luis Enrique Zárate Galvez PUC Minas Clodoveu Augusto Davis Junior UFMG Belo Horizonte, 3 de Fevereiro de 2012.

5 RESUMO Nos dias atuais, as imagens digitais estão cada vez mais presentes e distribuídas em diversos meios de comunicação, tornando-se essencial a adoção de sistemas automatizados, capazes de lidar com o armazenamento e a recuperação das imagens em um tempo aceitável para os padrões exigidos. Em geral, o armazenamento das imagens é realizado com referência ao conteúdo de cada arquivo, que pode ser extraído por suas características de cor. Nesse sentido, para a pesquisa de uma imagem ser eficiente, são necessários sistemas capazes de recuperar grandes volumes de imagens com base no conteúdo, em um intervalo de tempo aceitável. Para isso, torna-se indispensável adotar uma metodologia que determine as técnicas de indexação e recuperação de imagens, tendo como finalidade a diminuição do tempo de consulta, sem que isso signifique perda na qualidade das respostas. Neste trabalho é desenvolvido um método para recuperação de imagens com base no conteúdo, utilizando-se técnicas de agrupamento de dados. Objetiva-se, dessa forma, a diminuição da complexidade computacional, classificando os grupos de imagens com características semelhantes, de modo que se possa evitar a pesquisa sequêncial que tem sido adotada em alguns sistemas. Palavras-chave: Recuperação de imagens baseada em conteúdo, características de cor, técnicas de agrupamento, classificação de Imagens.

6 ABSTRACT Nowadays, digital images are increasingly present and distributed in various media, making it essential to adopt automated systems, capable of dealing with the storage and retrieval of images at a time acceptable to the standards required. In general, the storage of images is done with reference to the content of each file, which can be extracted by its color characteristics. In this sense, to search for an image to be effective, you need systems capable of retrieving large volumes of images based on content in an acceptable time frame. For this, it is essential to adopt a methodology that determines the techniques of indexing and retrieval of images, with the purpose of reducing the query time, without meaning a loss in quality of responses. The paper is develop a method for image retrieval based on content, using data clustering techniques. Thus, the objective is the reduction of computational complexity, classifying groups of images with similar characteristics, so that we can avoid sequential search which has been adopted in current systems. Keywords: Contet-based image retrieval, color features, clustering techniques, classification of images.

7 LISTA DE FIGURAS FIGURA 1 Estrutura do sistema de recuperação por conteúdo. Adaptação: (TOR- RES; FALCÃO, 2006) FIGURA 2 Arquitetura proposta FIGURA 3 Estrutura de índice invertido FIGURA 4 Estrutura de índice invertido no processo de recuperação por merge 39 FIGURA 5 Arquitetura utilizando o Lucene FIGURA 6 Gráfico com o número de clusters e seu impacto no tempo da para cada variação do método proposto FIGURA 7 Gráfico com a média do tempo de resposta dos métodos implementados e a pesquisa sequencial do LIRe FIGURA 8 Gráfico com o número de cluster e o impacto na qualidade das consultas para o método utilizando o k-means, considerando a pesquisa sequencial do LIRe como o conjunto de resposta ideal FIGURA 9 Gráfico com o número de cluster e o impacto na qualidade das consultas para o método utilizando o Árvore Geradora Mínima, considerando a pesquisa sequencial do LIRe como o conjunto de resposta ideal FIGURA 10 Gráfico com a qualidade dos métodos implementados, considerando a pesquisa sequêncial no LIRe como o conjunto de respostas ideal FIGURA 11 Gráfico com a qualidade dos métodos implementados em relação ao LIRe, considerando a classificação do COREL como o conjunto de respostas ideal FIGURA 12 Conjunto de imagens indexadas, separadas por categorias FIGURA 13 Agrupamento realizado pelo K-Means

8 FIGURA 14 Agrupamento realizado pela Árvore Geradora Mínima FIGURA 15 Recuperação de imagens realizado pelo K-Means FIGURA 16 Recuperação de imagens realizado pela Árvore Geradora Mínima... 51

9 SUMÁRIO 1 INTRODUÇÃO Objetivos Contribuições Organização da dissertação RECUPERAÇÃO DE IMAGEM BASEADA EM CONTEÚDO VI- SUAL Características das imagens Descritor de Cor Descritor de Textura Descritor de Forma Medidas de similaridade Sistemas de Recuperação de Imagens baseado em conteúdo visual 20 3 AGRUPAMENTO DE DADOS Agrupamento por particionamento Algoritmo K-Means Agrupamento baseado em grafos Árvore Geradora Mínima(AGM) ESTRUTURA PARA UM SISTEMA DE RECUPERAÇÃO DE IN- FORMAÇÃO Etapas da Recuperação de Informação Processo de indexação Processo de recuperação

10 4.2 Modelos de Recuperação de Informação Modelo Booleano Modelo Vetorial METODOLOGIA PARA RECUPERAÇÃO DE IMAGENS UTILI- ZANDO TÉCNICAS DE AGRUPAMENTO DE DADOS Arquitetura proposta Processo de indexação Extração de características Similaridade entre imagens Agrupamento de imagens Lista Invertida Indexador Processo de recuperação Pesquisa Merge Considerações Finais IMPLEMENTAÇÃO E RESULTADOS EXPERIMENTAIS Estrutura de armazenamento e recuperação das imagens Biblioteca Lucene LIRe (Lucene Image Retrieval) Avaliação dos sistemas de recuperação de informação Experimentos realizados Experimento 1: Escolha do número de clusters Experimento 2: Avaliação da qualidade das consultas Experimento 3: Avaliação Visual do agrupamento das imagens Considerações finais

11 7 CONCLUSÃO REFERÊNCIAS

12 13 1 INTRODUÇÃO Observa-se atualmente a crescente disponibilização de imagens em vários meios de comunicação, assim como a intensificação da popularização das câmeras digitais, tornando-se necessário o desenvolvimento de diversas técnicas para a recuperação de informação com base no conteúdo visual das imagens. Os meios de armazenamento das imagens necessitam de aplicações eficientes e eficazes para as pesquisas em seus acervos. Uma das maneiras de se buscar informação em uma imagem é encontrar representações descritivas baseadas em seu conteúdo, onde este conteúdo é descrito por meio de características visuais de baixo nível, como forma, textura e cor. Os aspectos visuais de cores das imagens permitem gerar uma fonte de dados para pesquisas, se revelando como os índices mais satisfatórios para recuperação de informação com base em seu conteúdo visual. A cada dia, aumentam-se os esforços no desenvolvimento de trabalhos que visam solucionar os problemas de estruturação e acesso aos conteúdos visuais das imagens. As técnicas para recuperação de informação em imagens têm sido obtidas utilizando metodologias para extração, armazenamento e pesquisas de características das imagens. Uma maneira de representar o conteúdo da imagem é medir seus níveis de cor, obtidos no cálculo de seu histograma, aplicando-se o processamento da imagem. Os estudos e as técnicas do processamento digital de imagens progrediram na criação de ferramentas para a extração de características das imagens, porém, as características reconhecidas necessitam ser armazenadas e organizadas em base de dados para futuras consultas. Os sistemas de recuperação de imagens retornam de seus índices as imagens mais similares ao padrão de consulta definido pelo usuário, ou seja, percorrem todas as imagens armazenadas na base, comparando-as com a imagem pesquisada. Todavia, os mesmos têm mostrado problemas de desempenho ao exibir os resultados. Dessa forma, considera-se que a melhoria do desempenho nas buscas pode ser obtida na organização e agrupamento das informações extraídas. Os métodos de agrupamento podem ser usados para reduzir a dimensão de um conjunto de dados, reduzindo uma ampla gama de objetos à informação do centro do seu conjunto. Assim é possível organizar elementos de um determinado conjunto mutuamente similares e, preferencialmente, muito diferentes dos elementos de outros conjuntos. As técnicas de agrupamento se mostram como uma das mais úteis para diminuir a complexidade computacional destes sistemas, uma vez que agrupam dados com características semelhantes sob determinado critério, sem perder a representatividade das informações. Logo, nosso maior desafio é a utilização das técnicas de agrupamento de dados para classificar as imagens em grupos similares conforme o reconhecimento de suas características,

13 14 com intuito de melhorar o desempenho nas consultas. 1.1 Objetivos O principal objetivo do presente trabalho é desenvolver uma metodologia para a recuperação de imagens utilizando técnicas de agrupamento de dados, buscando melhorar a eficência das pesquisas. As etapas para o desenvolvimento são: Analisar métodos de extração de características e similaridade das imagens; Organizar a indexação das imagens, utilizando técnicas de agrupamento de dados, para classificar as imagens de acordo com a similaridade entre elas; Estruturar os índices e agrupamentos para o armazenamento e consulta das imagens. Para o desenvolvimento da metodologia são utilizados vetores que descrevem a extração da característica das imagens, obtida por um cálculo do histograma de cor, enquanto os agrupamentos são implementados com os algoritmos, sendo um por particionamento (K-Means) e o outro baseado em grafos (árvore geradora mínima), este, adotando a técnicas de poda normalizada da árvore. 1.2 Contribuições Tendo em vista o aumento dos meios para armazenamento de imagens, as técnicas eficientes para recuperação de imagens têm se mostrado muito relevantes. Nesse sentido, o conteúdo visual existente nas imagens pode servir como base para as pesquisas, assim como uma importante ferramenta para consultas em acervos multimídias. As principais contribuições do trabalho são: Revisão bibliográfica, com o estudo dos métodos de recuperação de imagens baseado em conteúdo visual; Escolha de métodos para agrupamento de características de imagens; Desenvolvimento de um sistema de recuperação de imagens utilizando técnicas de agrupamento de dados; Avaliação dos resultados experimentais do método proposto para resolução de problemas da pesquisa sequencial nos mecanismos de busca de imagens. Dessa forma, este estudo produz uma metodologia que servirá como base para novas pesquisas na área de recuperação de imagens.

14 Organização da dissertação O presente texto está organizado da seguinte forma: O Capítulo 2 faz referência aos trabalhos que já foram desenvolvidos na área de recuperação de imagens com base no conteúdo visual, expondo sobre as bases teóricas e sobre os métodos existentes. A especificação das técnicas de agrupamento de dados será exposta no Capítulo 3, exibindo a estrutura e as técnicas utilizadas para agrupamento de imagens. A estrutura dos sistemas de recuperação de imagens será discutida no Capítulo 4, juntamente com as ferramentas e fundamentos tecnológicos utilizados. O Capítulo 5 descreve a metodologia para recuperação de imagens utilizando técnicas de agrupamento de dados, apresentando a arquitetura da proposta e sua implementação. A avaliação do conjunto de experimentos realizados na metodologia proposta será exposta no Capítulo 6. Encerra-se o trabalho no Capítulo 7 com a conclusão dos resultados e sugestões para trabalhos futuros.

15 16 2 RECUPERAÇÃO DE IMAGEM BASEADA EM CONTEÚDO VISUAL Uma das abordagens utilizadas para recuperação de imagens é conhecida como recuperação de imagens baseada em conteúdo (RIBC). Seu principal objetivo é encontrar imagens relevantes conforme a necessidade do usuário, por meio de características visuais automaticamente extraídas das imagens. Pode-se observar que a interpretação semântica é fator essencial para a recuperação de imagens e as estratégias de caracterização, modelagem, pesquisa, similaridade, visualização e realimentação desses sistemas determinam conjuntamente sua eficiência e popularidade, representando portanto, a principal dificuldade desta área de estudo. As estratégias fundamentais para um sistema RIBC são caracterizadas em três classes: Extração de caraterísticas visuais, indexação e recuperação. Os métodos de representação de características das imagens mais utilizados usam cor, textura e forma como atributos de indexação, os quais são extraídos da imagem de maneira independente (CHORA; ANDRYSIAK; CHORA, 2007). As características das imagens são extraídas e armazenadas em vetores de características. Para comparar os vetores é necessária a utilização de medidas que verificam a similaridade entre os vetores das imagens da base de dados com o vetor da imagem exemplo. A verificação da similaridade é normalmente baseada em medidas de distância e os vetores das imagens têm geralmente a mesma dimensão. 2.1 Características das imagens A extração de características é obtida através do processamento de imagens, realizada com a finalidade de obter valores numéricos que possam caracterizar essas imagens. Os recursos utilizados na extração das características para descrever uma imagem podem ser agrupados nos seguintes tipos: Descritor de Cor Uma das propriedades visuais mais utilizadas em sistemas de recuperação de imagens por conteúdo (TORRES; FALCÃO, 2006). É um importante componente para representação da imagem e se apresenta robusta a distorção, rotação e translação do objeto (ALBUQUERQUE; GUIMARÃES, 2000). Existem várias formas de representar as cores. Para

16 17 a realização de tal tarefa, utiliza-se um espaço de cor como base para a representação. De acordo com a aplicação, certo espaço de cor pode apresentar-se mais adequado ou viável frente aos demais. Os descritores de cor é representada como ponto de um espaço tridimensional (tais como RGB, HSV, YCbCr, YUV) (BIMBO, 1999). Eles permitem a discriminação entre o estímulo de cor, além da avaliação de similaridade e identificação de cores. A seguir são especificados alguns descritores e espaços de cores mais utilizados: Histograma de Cores: Descreve a ocorrência das cores em uma imagem. Para a obtenção de compactabilidade e desempenho, normalmente os histogramas apresentam a frequência de um intervalo de valores ao invés de um único valor de cor. Outras vezes, ocorre a fixação do número de cores utilizadas, seja pela maior frequência dessa cor na coleção de imagens, ou pelo seu podes de discriminação frente as demais. Entre os problemas dos histogramas de cores pode-se destacar sua alta diminsionalidade e o fato de não considerarem a localização espacial das cores. Assim, imagens muito diferentes podem ter representações semelhantes. Caso adotada a divisão das imagens em regiões, observa-se o aumento da dimensionalidade e da carga computacional necessária para a comparação dos descritores. Momentos de Cores: Caracterizam as imagens segundo suas distribuições de cores por meio de três medidas: média, desvio padrão e inclinação. Cada uma dessas medidas é computada para cada um dos canais de cores de uma imagem. Desta forma, para imagens pertencentes ao espaço RGB, calcula-se a média, desvio padrão e inclinação para os canais R, G e B, respectivamente. Devido a sua alta compactabilidade e por não considerar informações espaciais, este descritor tem poder de discriminação reduzido. Portanto, seu desempenho pode ser significativamente aprimorado quando aplicado a regiões de imagens, caracterizando localmente a região. Vetores de Coerência de Cores: Nesta abordagem, cada pixel de uma imagem é classificado como coerente ou incoerente. Um pixel será coerente se ele fizer parte de uma região de coloração uniforme (de tamanho pré-definido), caso contrário, ele será classificado como incoerente. Geralmente, para imagens com muitas regiões de cores uniforme ou muita textura, os vetores de coerência produzem bons resultados de recuperação, principalmente quando aplicados ao espaço de cor HSV (PASS; ZABIH; MILLER, 1996). Correlograma de Cores: É um histograma tridimensional que caracteriza a distribuição das cores e a correlação espacial entre os pares de cores. A Primeira e a segunda dimensão do histograma representam as cores de qualquer par de pixel e a terceira dimensão, a distância espacial entre eles (HUANG et al., 1997). Produz

17 18 bons resultados comparado ao histograma e o vetor de coerência, porém é computacionalmente mais caro devido a sua alta dimensionalidade (LONG; ZHANG; FENG, 2003). Características Invariantes de Cores: Fatores como mudança de iluminação, as orientações das superfícies dos objetos, o posicionamento e a angulação das câmeras, e a refração, entre outros, influenciam consideravelmente na variação das cores. Por isso, representações invariantes de cores foram propostas e introduzidas na recuperação de imagem por conteúdo. Apresentam um conjunto de características invariantes de cores derivada das propriedades de reflexão dos objetos. Quando aplicadas na recuperação de imagens, produzem representações do conteúdo das imagens independente da iluminação e geometria da cena, mas acabam por introduzir certa perda no poder de discriminação entre imagens. O descritor de cor mais comum é o histograma, que descreve o conteúdo global de uma imagem pelo percentual de pixels em cada cor. São observadas pequenas diferenças entre o espaço RGB com os outros espaços em Smith e Chang (1996) Descritor de Textura Certas regiões da imagem apresentam uma homogeneidade, na forma de padrões visuais com propriedades estruturais que não são suficientemente representadas por cores. Essas regiões apresentam texturas que necessitam de recursos próprios para sua representação. O descritor de textura é representado de forma significativa por Tamura, Mori e Yamawaki (1978), definindo as propriedades de grossura, contraste, direcionalidade, linearidade, regularidade e aspereza. A representação do descritor de textura também é obtida através da wavelet de Gabor (RUI; HUANG; CHANG, 1999) e apresenta resultados próximos ao da visão humana Descritor de Forma O descritor de forma pode se basear em características perceptivas da forma presente no contorno e também no conteúdo do interior dos objetos, e depende muito do domínio das imagens em questão. Torres et al. (2008) afirmam que é um desafio encontrar uma descrição ideal para cada tipo de aplicação, considerando informações de contorno, interior ou uma combinação dos métodos para obter uma recuperação de imagens mais eficiente. Entre os métodos de extração de características citados, os histogramas de cor obtêm melhores resultados para fotografias coloridas em geral. No entanto, as abordagens

18 19 utilizando descritores de forma são melhores em várias tarefas, mas geralmente possuem um maior custo computacional (DESELAERS; KEYSERS; NEY, 2008). Os histogramas de cores considera a informação de cor de uma imagem globalmente. Como nenhum particionamento ou pré-processamento da imagem é necessário durante a extração de características, esses descritores normalmente apresentam algoritmos de extração de características mais simples e rápidos. 2.2 Medidas de similaridade A semelhança entre duas imagens pode ser avaliada por meio de medidas de similaridade ou dissimilaridade, utilizando funções para calcular a distância entre os vetores de características das imagens. A função de distância é utilizada de acordo com a estrutura e conteúdo dos vetores, podendo ser necessário utilizar mais de uma função de distância. Esta escolha depende das especificidades do conjunto de imagens utilizado e seus respectivos vetores. Algumas das medidas de similaridade mais utilizadas para vetores de características de imagens estão descritas a seguir: Distância de Minkowski: Esta técnica é uma generalização da distância entre dois pontos I = (x i1, x i2, x i3,..., x in ) e J = (y j1, y j2, y j3,..., y jn ) em um espaço n- dimensional. Na equação 2.1 observa-se a fórmula matemática, onde q é um inteiro positivo que representa a norma: d Minkowski (I, J) = q ( x i1 x j1 q + x i2 x j2 q x in x jn q (2.1) Distância Euclidiana: Trata-se de uma especialização da distância de Minkowski para q = 2, sendo a distância linear entre os pontos I = (x i1, x i2, x i3,..., x in ) e J = (y j1, y j2, y j3,..., y jn ), com sua fórmula definida pela equação 2.2 para n dimensões. d Euclidiana (I, J) = ( x i1 x j1 2 + x i2 x j x in x jn 2 (2.2) Distância Manhattan: Refere-se a outra especialização da distância de Minkowski para q = 1, sendo a distância linear entre os pontos I = (x i1, x i2, x i3,..., x in ) e J = (y j1, y j2, y j3,..., y jn ), com sua fórmula definida pela equação 2.3 para n dimensões. d Manhattan (I, J) = x i1 x j1 + x i2 x j x in x jn (2.3) A tradicional função de distância utilizada para calcular a similaridade entre imagens nos sistemas RIBC é a distância Euclidiana, porém, para alguns descritores conseguem obter melhores resultados utilizando a função de distância Manhatan, onde a

19 20 distância entre dois pontos á dada pela soma das diferenças absolutas entre as suas coordenadas. 2.3 Sistemas de Recuperação de Imagens baseado em conteúdo visual Entre os sistemas de recuperação de imagens baseados em conteúdo mais conhecidos está o QBIC da IBM (FALOUTSOS et al., 1994), pioneiro na área. É considerado um dos mais importantes até hoje, utilizando histograma de cor, textura e formas para representar a característica das imagens. Sua consulta é baseado em imagem exemplo, inclusive permitindo a inserção de rascunhos. Utiliza a distância Euclidiana para a cor média, para textura e distância quadrática do histograma para histogramas de cores (alto custo computacional), computando um somatório final que representa o casamento entre a imagem consulta e componentes da coleção. Seus resultados são ordenados por relevância, apresentando o ranqueamento final opcionalmente e possui realimentação de relevância. Após o QBIC, outros sistemas foram desenvolvidos, como o Photobook (PENTLAND; PI- CARD; SCLAROFF, 1996), ao qual foram sendo agregados novos recursos de aparência para descrever o conteúdo. O Blobworld (CARSON et al., 1999) introduziu o uso da segmentação para representar regiões da imagens. Para a consulta o usuário seleciona uma categoria limitando o espaço de consulta e então marca uma região indicando sua importância e a de cada característica, sendo que mais de uma região pode ser marcada para a consulta. Utiliza a distância quadrática para histogramas de cores, distância Euclidiana para textura, distância entre centroides para localização das regiões, todas combinadas em um somatório final. Os resultados são ordenados linearmente e apresentados juntamente com uma versão segmentada da imagem recuperada. Outros sistemas também utilizaram essa abordagem, como o SIMBA (SIGGELKOW; SCHAEL; BURKHARDT, 2001), CIRES (IQBAL; AGGARWAL, 2002), SIMPLIcity (WANG; LI; WIEDERHOLD, 2001) e o IRMA (LEHMANN et al., 2005). Muitos trabalhos e sistemas RIBC fornecem ao usuário a possibilidade de refinar suas buscas através de realimentação de relevância. A recuperação de imagens utilizando este paradigma consiste na interação do usuário com o sistema de busca com intuito de melhorar a qualidade da recuperação a partir de indicação de exemplos positivos e/ou negativos das imagens recuperadas. Este tipo de implementação pode ser encontrado em PicHunter (COX et al., 1996), essa estrate?gia utiliza da subjetividade humana para refinamento da busca. Outra abordagem, que também faz o uso de realimentação de relevância, é proposta no sistema MARS (RUI; HUANG; MEHROTRA, 1997) e tem destaque perante os demais sistemas pelo envolvimento de múltiplas pesquisas em sua implementação, que incluem visão computacional, recuperação de informação e sistemas de gerenciamento de bancos de dados.

20 21 Podem ser encontrados na web sistemas de dominio público como o GIFT (GNUImage- Finding Tool) e demonstrações disponíveis on-line do Viper e do Compass (Computer Aided Search System). Uma descrição mais apurada desses e de outros sistemas RIBC pode ser vista em Veltkamp e Tanase (2002). As tendências das pesquisas relacionadas aos sistemas RIBC podem ser vistas em Datta et al. (2006). O Moving Picture Experts Group (MPEG) define um padrão para acesso de conteúdo em base de dados multimídia com seu padrão MPEG-7, com um conjunto de descritores padronizados para as imagens (CHANG; SIKORA; PURI, 2001). Os descritores mais populares para caracterizar as informações de cor em imagens são histogramas de cor, momentos de cor e correlogramas de cor. Embora todos estes métodos proporcionam boa caracterização de cor, eles têm o problema de altadimensionalidade. Isso conduz a tempos computacional mais caros, tornando a indexação ineficiente quanto ao seu desempenho. Para solucionar esses problemas foi proposto por Venugopal e Sudhamani (2008) a utilização de técnicas de agrupamento de dados, onde a segmentação de regiões das imagens são obtidas por agrupamento de cores, e o processo de indexação é baseado na técnica de agrupamento R* Tree, onde as imagens são indexadas por meio de estruturas multidimensionais. Uma proposta para o balanceamento dos cluster, também utilizando técnicas de agrupamentos de dados, é descrita por Amsaleg, Jégou e Tavenard (2011), por meio da alteração do algoritmo k-means. Ela produz grupos de imagens com tamanhos equilibrados, sem prejudicar a qualidade da pesquisa. Neste trabalho será utilizado como base o LIRe (LUX; CHATZICHRISTOFIS, 2008), uma importante biblioteca, que oferece as principais técnicas de extração de características de imagens, além dos meios de indexação e recuperação. Trata-se de uma extensão da biblioteca de recuperação de informação Lucene (HATCHER; GOSPODNETIC, 2004), disponibilizando recursos de extração de características por meio de diversos descritores, funções de cálculo de similaridade e mecanismo de indexação e recuperação dos vetores de características, e ainda fornece métodos para realimentação de relevância. Porém, suas consultas são inapropriadas para grandes base de imagens, por serem realizadas utilizando a pesquisa sequêncial. Assim, pode-se considerar uma fonte de estudo para implementações de novas técnicas, como as de agrupamento de dados, buscando melhorar a eficiência e eficácia da recuperação de imagens.

Autor: Patrícia Aparecida Proença 1 Orientador: Prof. Dr. Ilmério Reis da Silva 1 Co-Orientadora: Profª. Drª Celia A.

Autor: Patrícia Aparecida Proença 1 Orientador: Prof. Dr. Ilmério Reis da Silva 1 Co-Orientadora: Profª. Drª Celia A. UMA PROPOSTA DE MELHORIA NO PROCESSO DE RECUPERAÇÃO DE IMAGENS DIGITAIS COM BASE NA DISTRIBUIÇÃO DE CARACTERÍSTICAS DE BAIXO NÍVEL EM SEUS SEGMENTOS UTILIZANDO ÍNDICE INVERTIDO Autor: Patrícia Aparecida

Leia mais

RECUPERAÇÃO DE DOCUMENTOS TEXTO USANDO MODELOS PROBABILISTICOS ESTENDIDOS

RECUPERAÇÃO DE DOCUMENTOS TEXTO USANDO MODELOS PROBABILISTICOS ESTENDIDOS ISBN 978-85-61091-05-7 Encontro Internacional de Produção Científica Cesumar 27 a 30 de outubro de 2009 RECUPERAÇÃO DE DOCUMENTOS TEXTO USANDO MODELOS PROBABILISTICOS ESTENDIDOS Marcello Erick Bonfim 1

Leia mais

RESUMO. Palavras-Chaves: Índice Invertido, Recuperação de Imagens, CBIR. Nos últimos anos, o crescimento do número de imagens produzidas em meio

RESUMO. Palavras-Chaves: Índice Invertido, Recuperação de Imagens, CBIR. Nos últimos anos, o crescimento do número de imagens produzidas em meio UMA PROPOSTA DE MELHORIA NO PROCESSO DE RECUPERAÇÃO DE IMAGENS DIGITAIS COM BASE NA DISTRIBUIÇÃO DE CARACTERÍSTICAS DE BAIXO NÍVEL EM SUAS REGIÕES UTILIZANDO ÍNDICE INVERTIDO Patrícia Aparecida Proença

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Alessandro L. Koerich Algoritmo k Means Mestrado/Doutorado em Informática (PPGIa) Pontifícia Universidade Católica do Paraná (PUCPR) 2 Problema do Agrupamento Seja x = (x 1, x 2,,

Leia mais

Opala: uma biblioteca de indexação e busca de textos e imagens por conteúdo

Opala: uma biblioteca de indexação e busca de textos e imagens por conteúdo Opala: uma biblioteca de indexação e busca de textos e imagens por conteúdo Lidijanne de Miranda Santos (1); Aécio Solano Rodrigues Santos (2); Ricardo Martins Ramos (3); Valéria Oliveira Costa (4) Instituto

Leia mais

Indexação e Recuperação de Imagens por Conteúdo. Cleigiane Lemos Josivan Reis Wendeson Oliveira

Indexação e Recuperação de Imagens por Conteúdo. Cleigiane Lemos Josivan Reis Wendeson Oliveira Indexação e Recuperação de Imagens por Conteúdo Cleigiane Lemos Josivan Reis Wendeson Oliveira 1 Content-based Image Retrieval (CBIR) 2 Roteiro Introdução Arquitetura Extração de Características Indexação

Leia mais

Introdução ao SIG. Objetivos Específicos 18/11/2010. Competência: Apresentar: Utilidade de um SIG

Introdução ao SIG. Objetivos Específicos 18/11/2010. Competência: Apresentar: Utilidade de um SIG MINISTÉRIO DO MEIO AMBIENTE - MMA INSTITUTO CHICO MENDES DE CONSERVAÇÃO DA BIODIVERSIDADE - ICMBio DIRETORIA DE PLANEJAMENTO, ADMINISTRAÇÃO E LOGÍSTICA - DIPLAN COORDENAÇÃO GERAL DE GESTÃO DE PESSOAS -

Leia mais

Tratamento da Imagem Transformações (cont.)

Tratamento da Imagem Transformações (cont.) Universidade Federal do Rio de Janeiro - IM/DCC & NCE Tratamento da Imagem Transformações (cont.) Antonio G. Thomé thome@nce.ufrj.br Sala AEP/133 Tratamento de Imagens - Sumário Detalhado Objetivos Alguns

Leia mais

Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU

Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Organizaçãoe Recuperaçãode Informação GSI521 Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Aula anterior Organização e Recuperação de Informação(GSI521) Modelo vetorial- Definição Para o modelo vetorial, o

Leia mais

CLASSIFICAÇÃO DE IMAGENS

CLASSIFICAÇÃO DE IMAGENS CLASSIFICAÇÃO DE IMAGENS SIG Profa.. Dra. Maria Isabel Castreghini de Freitas ifreitas@rc.unesp.br Profa. Dra. Andréia Medinilha Pancher medinilha@linkway.com.br O que é classificação? É o processo de

Leia mais

Recuperação de imagens por conteúdo baseada em realimentação de relevância e classicador por oresta de caminhos ótimos

Recuperação de imagens por conteúdo baseada em realimentação de relevância e classicador por oresta de caminhos ótimos Recuperação de imagens por conteúdo baseada em realimentação de relevância e classicador por oresta de caminhos ótimos André Tavares da Silva Orientador: Léo Pini Magalhães Co-orientador: Alexandre Xavier

Leia mais

SUMÁRIO. Introdução... 3

SUMÁRIO. Introdução... 3 SUMÁRIO Introdução..................................... 3 1 Consultas por Similaridade e Espaços métricos............. 5 1.1 Consultas por abrangência e consultas aos k-vizinhos mais próximos... 5 1.2

Leia mais

Avaliação de técnicas de seleção de quadros-chave na recuperação de informação por conteúdo visual

Avaliação de técnicas de seleção de quadros-chave na recuperação de informação por conteúdo visual Avaliação de técnicas de seleção de quadros-chave na recuperação de informação por conteúdo visual Shênia Salvador de Pinho, Kleber J. F. Souza Instituto de Ciências Exatas e Informática PUC Minas Guanhães,

Leia mais

Otimização de Recuperação de Informação usando Algoritmos Genéticos

Otimização de Recuperação de Informação usando Algoritmos Genéticos Otimização de Recuperação de Informação usando Algoritmos Genéticos Neide de Oliveira Gomes, M. Sc., nog@inpi.gov.br Prof. Marco Aurélio C. Pacheco, PhD Programa de Doutorado na área de Métodos de Apoio

Leia mais

Nathalie Portugal Vargas

Nathalie Portugal Vargas Nathalie Portugal Vargas 1 Introdução Trabalhos Relacionados Recuperação da Informação com redes ART1 Mineração de Dados com Redes SOM RNA na extração da Informação Filtragem de Informação com Redes Hopfield

Leia mais

Sistema de Controle de Acesso Baseado no Reconhecimento de Faces

Sistema de Controle de Acesso Baseado no Reconhecimento de Faces Sistema de Controle de Acesso Baseado no Reconhecimento de Faces Access Control System Based on Face Recognition Tiago A. Neves, Welton S. De Oliveira e Jean-Jacques De Groote Faculdades COC de Ribeirão

Leia mais

Universidade Federal de Goiás Instituto de Informática Processamento Digital de Imagens

Universidade Federal de Goiás Instituto de Informática Processamento Digital de Imagens Universidade Federal de Goiás Instituto de Informática Processamento Digital de Imagens Prof Fabrízzio Alphonsus A M N Soares 2012 Capítulo 2 Fundamentos da Imagem Digital Definição de Imagem: Uma imagem

Leia mais

BCC204 - Teoria dos Grafos

BCC204 - Teoria dos Grafos BCC204 - Teoria dos Grafos Marco Antonio M. Carvalho (baseado nas notas de aula do prof. Haroldo Gambini Santos) Departamento de Computação Instituto de Ciências Exatas e Biológicas Universidade Federal

Leia mais

2.1.2 Definição Matemática de Imagem

2.1.2 Definição Matemática de Imagem Capítulo 2 Fundamentação Teórica Este capítulo descreve os fundamentos e as etapas do processamento digital de imagens. 2.1 Fundamentos para Processamento Digital de Imagens Esta seção apresenta as propriedades

Leia mais

Aula 6 - Segmentação de Imagens Parte 2. Prof. Adilson Gonzaga

Aula 6 - Segmentação de Imagens Parte 2. Prof. Adilson Gonzaga Aula 6 - Segmentação de Imagens Parte 2 Prof. Adilson Gonzaga 1 Motivação Extração do Objeto Dificuldades Super segmentação over-segmentation 1) Segmentação por Limiarização (Thresholding Global): Efeitos

Leia mais

Agrupamento de dados

Agrupamento de dados Organização e Recuperação de Informação: Agrupamento de dados Marcelo K. A. Faculdade de Computação - UFU Agrupamento de dados / 7 Overview Agrupamento: introdução Agrupamento em ORI 3 K-médias 4 Avaliação

Leia mais

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br MINERAÇÃO DE DADOS APLICADA Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br Processo Weka uma Ferramenta Livre para Data Mining O que é Weka? Weka é um Software livre do tipo open source para

Leia mais

UMA ABORDAGEM DE SIMPLIFICAÇÃO DE IMAGEM COLORIDA BASEADA NA ÁRVORE GERADORA MÍNIMA

UMA ABORDAGEM DE SIMPLIFICAÇÃO DE IMAGEM COLORIDA BASEADA NA ÁRVORE GERADORA MÍNIMA PONTIFÍCIA UNIVERSIDADE CATÓLICA DE MINAS GERAIS Programa de Pós-Graduação em Informática UMA ABORDAGEM DE SIMPLIFICAÇÃO DE IMAGEM COLORIDA BASEADA NA ÁRVORE GERADORA MÍNIMA Kleber Jacques Ferreira de

Leia mais

Universidade Federal de Alagoas Instituto de Matemática. Imagem. Prof. Thales Vieira

Universidade Federal de Alagoas Instituto de Matemática. Imagem. Prof. Thales Vieira Universidade Federal de Alagoas Instituto de Matemática Imagem Prof. Thales Vieira 2014 O que é uma imagem digital? Imagem no universo físico Imagem no universo matemático Representação de uma imagem Codificação

Leia mais

Prof. Júlio Cesar Nievola Data Mining PPGIa PUCPR

Prof. Júlio Cesar Nievola Data Mining PPGIa PUCPR Encontrar grupos de objetos tal que objetos em um grupo são similares (ou relacionados) uns aos outros e diferentes de (ou não relacionados) a objetos em outros grupos Compreensão Agrupa documentos relacionados

Leia mais

Processamento Digital de Imagens

Processamento Digital de Imagens Processamento Digital de Imagens Israel Andrade Esquef a Márcio Portes de Albuquerque b Marcelo Portes de Albuquerque b a Universidade Estadual do Norte Fluminense - UENF b Centro Brasileiro de Pesquisas

Leia mais

1 Tipos de dados em Análise de Clusters

1 Tipos de dados em Análise de Clusters Curso de Data Mining Sandra de Amo Aula 13 - Análise de Clusters - Introdução Análise de Clusters é o processo de agrupar um conjunto de objetos físicos ou abstratos em classes de objetos similares Um

Leia mais

EMENTAS DO CURSO SUPERIOR DE TECNOLOGIA EM ANÁLISE E DESENVOLVIMENTO DE SISTEMAS

EMENTAS DO CURSO SUPERIOR DE TECNOLOGIA EM ANÁLISE E DESENVOLVIMENTO DE SISTEMAS EMENTAS DO CURSO SUPERIOR DE TECNOLOGIA EM ANÁLISE E DESENVOLVIMENTO DE SISTEMAS INTRODUÇÃO À COMPUTAÇÃO 60 h 1º Evolução histórica dos computadores. Aspectos de hardware: conceitos básicos de CPU, memórias,

Leia mais

Extensão do WEKA para Métodos de Agrupamento com Restrição de Contigüidade

Extensão do WEKA para Métodos de Agrupamento com Restrição de Contigüidade Extensão do WEKA para Métodos de Agrupamento com Restrição de Contigüidade Carlos Eduardo R. de Mello, Geraldo Zimbrão da Silva, Jano M. de Souza Programa de Engenharia de Sistemas e Computação Universidade

Leia mais

Processamento e Análise de Imagens (MC940) Análise de Imagens (MO445)

Processamento e Análise de Imagens (MC940) Análise de Imagens (MO445) Processamento e Análise de Imagens (MC940) Análise de Imagens (MO445) Prof. Hélio Pedrini Instituto de Computação UNICAMP 2º Semestre de 2015 Roteiro 1 Morfologia Matemática Fundamentos Matemáticos Operadores

Leia mais

Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados

Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados Prof. Celso Kaestner Poker Hand Data Set Aluno: Joyce Schaidt Versão:

Leia mais

Recuperação de Imagens na Web Baseada em Informações Textuais

Recuperação de Imagens na Web Baseada em Informações Textuais Recuperação de Imagens na Web Baseada em Informações Textuais André Ribeiro da Silva Mário Celso Candian Lobato Universidade Federal de Minas Gerais Departamento de Ciência da Computação {arsilva,mlobato}@dcc.ufmg.br

Leia mais

Organizaçãoe Recuperação de Informação GSI521. Prof. Rodrigo Sanches Miani FACOM/UFU

Organizaçãoe Recuperação de Informação GSI521. Prof. Rodrigo Sanches Miani FACOM/UFU Organizaçãoe Recuperação de Informação GSI521 Prof. Rodrigo Sanches Miani FACOM/UFU Introdução Organização e Recuperação de Informação(GSI521) Tópicos Recuperação de informação (RI); Breve histórico; O

Leia mais

O MODELO ESPAÇO VETORIAL NO DESENVOLVIMENTO DE INTERFACES DE BUSCA E RECUPERAÇÃO DE INFORMAÇÃO

O MODELO ESPAÇO VETORIAL NO DESENVOLVIMENTO DE INTERFACES DE BUSCA E RECUPERAÇÃO DE INFORMAÇÃO O MODELO ESPAÇO VETORIAL NO DESENVOLVIMENTO DE INTERFACES DE BUSCA E RECUPERAÇÃO DE INFORMAÇÃO RESUMO LOPES, T.S.F. 1., FERNEDA, E. 2 1 Mestranda do Programa de Pós-graduação em Ciência da Informação Rua

Leia mais

Redes Neurais. Mapas Auto-Organizáveis. 1. O Mapa Auto-Organizável (SOM) Prof. Paulo Martins Engel. Formação auto-organizada de mapas sensoriais

Redes Neurais. Mapas Auto-Organizáveis. 1. O Mapa Auto-Organizável (SOM) Prof. Paulo Martins Engel. Formação auto-organizada de mapas sensoriais . O Mapa Auto-Organizável (SOM) Redes Neurais Mapas Auto-Organizáveis Sistema auto-organizável inspirado no córtex cerebral. Nos mapas tonotópicos do córtex, p. ex., neurônios vizinhos respondem a freqüências

Leia mais

Sistemas de Informação Geográfica (SIG) para Agricultura de Precisão

Sistemas de Informação Geográfica (SIG) para Agricultura de Precisão 01 Sistemas de Informação Geográfica (SIG) para Agricultura de Precisão Rodrigo G. Trevisan¹; José P. Molin² ¹ Eng. Agrônomo, Mestrando em Engenharia de Sistemas Agrícolas (ESALQ-USP); ² Prof. Dr. Associado

Leia mais

Resultados Experimentais

Resultados Experimentais Capítulo 6 Resultados Experimentais Este capítulo é dedicado às avaliações experimentais do sistema CBIR. Os experimentos aqui realizados têm três objetivos principais: comparar os nossos resultados com

Leia mais

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS VINICIUS DA SILVEIRA SEGALIN FLORIANÓPOLIS OUTUBRO/2013 Sumário

Leia mais

Introdução do Processamento de Imagens. Julio C. S. Jacques Junior juliojj@gmail.com

Introdução do Processamento de Imagens. Julio C. S. Jacques Junior juliojj@gmail.com Introdução do Processamento de Imagens Julio C. S. Jacques Junior juliojj@gmail.com Porque processar uma imagem digitalmente? Melhoria de informação visual para interpretação humana Processamento automático

Leia mais

RE-RANKING DE BUSCA VISUAL DE PRODUTOS USANDO INFORMAÇÃO MULTIMODAL. Joyce Miranda dos Santos

RE-RANKING DE BUSCA VISUAL DE PRODUTOS USANDO INFORMAÇÃO MULTIMODAL. Joyce Miranda dos Santos IComp/UFAM RE-RANKING DE BUSCA VISUAL DE PRODUTOS USANDO INFORMAÇÃO MULTIMODAL Joyce Miranda dos Santos Dissertação de Mestrado apresentada ao Programa de Pós-Graduação em Informática, Instituto de Computação

Leia mais

Organização e Recuperação da Informação

Organização e Recuperação da Informação GSI024 Organização e Recuperação da Informação Introdução Ilmério Reis da Silva ilmerio@facom.ufu.br www.facom.ufu.br/~ilmerio/ori UFU/FACOM - 2011/1 Arquivo 1a Introdução Porque RI? Problemas da solução

Leia mais

UFGD FCA PROF. OMAR DANIEL BLOCO 6 CLASSIFICAÇÃO DE IMAGENS

UFGD FCA PROF. OMAR DANIEL BLOCO 6 CLASSIFICAÇÃO DE IMAGENS UFGD FCA PROF. OMAR DANIEL BLOCO 6 CLASSIFICAÇÃO DE IMAGENS Obter uma imagem temática a partir de métodos de classificação de imagens multi- espectrais 1. CLASSIFICAÇÃO POR PIXEL é o processo de extração

Leia mais

Agenda. Detecção e Análise de Movimento em Vídeos. Detecção e Análise de Movimentos: Introdução. Detecção e Análise de Movimentos: Introdução

Agenda. Detecção e Análise de Movimento em Vídeos. Detecção e Análise de Movimentos: Introdução. Detecção e Análise de Movimentos: Introdução Agenda Detecção e Análise de Movimento em Vídeos Alceu de Souza Britto Jr. Alessandro L. Koerich InviSys Sistemas de Visão Computacional Ltda Programa de Pós-Graduação em Informática (PPGIa PUCPR) Introdução

Leia mais

Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU

Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Organizaçãoe Recuperaçãode Informação GSI521 Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Análisede links Page Rank Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Motivação Suponha que um modelo clássico, como

Leia mais

Balanceamento de Carga

Balanceamento de Carga 40 4. Balanceamento de Carga Pode-se entender por balanceamento de carga uma política a ser adotada para minimizar tanto a ociosidade de utilização de alguns equipamentos quanto a super utilização de outros,

Leia mais

Explorando Dicionários Visuais para Recuperação de Imagem por Conteúdo

Explorando Dicionários Visuais para Recuperação de Imagem por Conteúdo Explorando Dicionários Visuais para Recuperação de Imagem por Conteúdo Bruno Miranda Sales¹ e Rodrigo Tripodi Calumby¹ ¹Departamento de Ciências Exatas Universidade Estadual de Feira de Santana (UEFS)

Leia mais

Processamento de Imagem. Prof. MSc. André Yoshimi Kusumoto andrekusumoto.unip@gmail.com

Processamento de Imagem. Prof. MSc. André Yoshimi Kusumoto andrekusumoto.unip@gmail.com Processamento de Imagem Prof. MSc. André Yoshimi Kusumoto andrekusumoto.unip@gmail.com Visão Computacional Não existe um consenso entre os autores sobre o correto escopo do processamento de imagens, a

Leia mais

Vetor Quantização e Aglomeramento (Clustering)

Vetor Quantização e Aglomeramento (Clustering) (Clustering) Introdução Aglomeramento de K-partes Desafios do Aglomeramento Aglomeramento Hierárquico Aglomeramento divisivo (top-down) Aglomeramento inclusivo (bottom-up) Aplicações para o reconhecimento

Leia mais

Técnicas de Clustering: Algoritmos K-means e Aglomerative

Técnicas de Clustering: Algoritmos K-means e Aglomerative Técnicas de Clustering: Algoritmos K-means e Aglomerative Danilo Oliveira, Matheus Torquato Centro de Informática Universidade Federal de Pernambuco 9 de outubro de 2012 Danilo Oliveira, Matheus Torquato

Leia mais

Muitas aplicações modernas podem ser modeladas como tarefas divisíveis.

Muitas aplicações modernas podem ser modeladas como tarefas divisíveis. 1 Introdução O grande aumento de performance das redes de computadores, combinado com a proliferação de computadores de baixo custo e alto desempenho, trouxe à tona ambientes de meta-computação, ou grids[15,

Leia mais

O uso da Mineração de Textos para Extração e Organização Não Supervisionada de Conhecimento

O uso da Mineração de Textos para Extração e Organização Não Supervisionada de Conhecimento Revista de Sistemas de Informacao da FSMA n. 7 (2011) pp. 7-21 http://www.fsma.edu.br/si/sistemas.html O uso da Mineração de Textos para Extração e Organização Não Supervisionada de Conhecimento Solange

Leia mais

Aplicação A. Aplicação B. Aplicação C. Aplicação D. Aplicação E. Aplicação F. Aplicação A REL 1 REL 2. Aplicação B REL 3.

Aplicação A. Aplicação B. Aplicação C. Aplicação D. Aplicação E. Aplicação F. Aplicação A REL 1 REL 2. Aplicação B REL 3. Sumário Data Warehouse Modelagem Multidimensional. Data Mining BI - Business Inteligence. 1 2 Introdução Aplicações do negócio: constituem as aplicações que dão suporte ao dia a dia do negócio da empresa,

Leia mais

Modelo de dados do Data Warehouse

Modelo de dados do Data Warehouse Modelo de dados do Data Warehouse Ricardo Andreatto O modelo de dados tem um papel fundamental para o desenvolvimento interativo do data warehouse. Quando os esforços de desenvolvimentos são baseados em

Leia mais

AULA 3 Ferramentas de Análise Básicas

AULA 3 Ferramentas de Análise Básicas 3.1 AULA 3 Ferramentas de Análise Básicas Neste capítulo serão apresentadas algumas ferramentas de análise de dados com representação vetorial disponíveis no TerraView. Para isso será usado o banco de

Leia mais

1 http://www.google.com

1 http://www.google.com 1 Introdução A computação em grade se caracteriza pelo uso de recursos computacionais distribuídos em várias redes. Os diversos nós contribuem com capacidade de processamento, armazenamento de dados ou

Leia mais

2. O que é Redundância de código ou informação? Como a compressão Huffman utiliza isso? Você conhece algum formato de imagem que a utiliza?(1.

2. O que é Redundância de código ou informação? Como a compressão Huffman utiliza isso? Você conhece algum formato de imagem que a utiliza?(1. Respostas do Estudo Dirigido Cap. 26 - Reducing the information:... ou Image Compression 1. Para que serve comprimir as imagens? Que aspectos estão sendo considerados quando se fala de: Compression Rate,

Leia mais

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5 Para entender bancos de dados, é útil ter em mente que os elementos de dados que os compõem são divididos em níveis hierárquicos. Esses elementos de dados lógicos constituem os conceitos de dados básicos

Leia mais

Conceitos de Mineração de Dados Multimídia

Conceitos de Mineração de Dados Multimídia Capítulo 1 Conceitos de Mineração de Dados Multimídia Rafael Santos Resumo Avanços recentes em várias áreas tecnológicas possibilitaram um crescimento explosivo na capacidade de gerar, coletar e armazenar

Leia mais

Criação de um Arquivo Invertido para a Recuperação de Informação em Grandes Volumes de Texto

Criação de um Arquivo Invertido para a Recuperação de Informação em Grandes Volumes de Texto Criação de um Arquivo Invertido para a Recuperação de Informação em Grandes Volumes de Texto Rafael Rodrigo da Silva 1, Wender Magno Cota 1 1 Universidade Presidente Antônio Carlos (UNIPAC) Faculdade Regional

Leia mais

TRATAMENTO MULTIVARIADO DE DADOS POR ANÁLISE DE CORRESPONDÊNCIA E ANÁLISE DE AGRUPAMENTOS

TRATAMENTO MULTIVARIADO DE DADOS POR ANÁLISE DE CORRESPONDÊNCIA E ANÁLISE DE AGRUPAMENTOS TRATAMENTO MULTIVARIADO DE DADOS POR ANÁLISE DE CORRESPONDÊNCIA E ANÁLISE DE AGRUPAMENTOS Luciene Bianca Alves ITA Instituto Tecnológico de Aeronáutica Praça Marechal Eduardo Gomes, 50 Vila das Acácias

Leia mais

Clustering - agrupamento. Baseado no capítulo 8 de. Introduction to Data Mining

Clustering - agrupamento. Baseado no capítulo 8 de. Introduction to Data Mining Clustering - agrupamento Baseado no capítulo 8 de Introduction to Data Mining de Tan, Steinbach, Kumar Clustering - agrupamento 1 O que é Clustering? Encontar grupos de objectos tal que os objectos dentro

Leia mais

3 Estado da arte em classificação de imagens de alta resolução

3 Estado da arte em classificação de imagens de alta resolução 37 3 Estado da arte em classificação de imagens de alta resolução Com a recente disponibilidade de imagens de alta resolução produzidas por sensores orbitais como IKONOS e QUICKBIRD se tornou-se possível

Leia mais

ADM041 / EPR806 Sistemas de Informação

ADM041 / EPR806 Sistemas de Informação ADM041 / EPR806 Sistemas de Informação UNIFEI Universidade Federal de Itajubá Prof. Dr. Alexandre Ferreira de Pinho 1 Sistemas de Apoio à Decisão (SAD) Tipos de SAD Orientados por modelos: Criação de diferentes

Leia mais

3 Metodologia de Previsão de Padrões de Falha

3 Metodologia de Previsão de Padrões de Falha 3 Metodologia de Previsão de Padrões de Falha Antes da ocorrência de uma falha em um equipamento, ele entra em um regime de operação diferente do regime nominal, como descrito em [8-11]. Para detectar

Leia mais

Verificação de Qualidade de Imagens de Fundo de Olho a Partir de Descritores Baseados em Histogramas. Marina Silva Fouto - Reconhecimento de Padrões

Verificação de Qualidade de Imagens de Fundo de Olho a Partir de Descritores Baseados em Histogramas. Marina Silva Fouto - Reconhecimento de Padrões Verificação de Qualidade de Imagens de Fundo de Olho a Partir de Descritores Baseados em Histogramas Marina Silva Fouto - Reconhecimento de Padrões Tópicos Importância Trabalhos Relacionados Imagens e

Leia mais

Classificação de Imagens de Sensoriamento Remoto usando SVM

Classificação de Imagens de Sensoriamento Remoto usando SVM Raphael Belo da Silva Meloni Classificação de Imagens de Sensoriamento Remoto usando SVM Dissertação de Mestrado Dissertação apresentada como requisito parcial para obtenção do título de Mestre pelo Programa

Leia mais

Comparação entre as Técnicas de Agrupamento K-Means e Fuzzy C-Means para Segmentação de Imagens Coloridas

Comparação entre as Técnicas de Agrupamento K-Means e Fuzzy C-Means para Segmentação de Imagens Coloridas Comparação entre as Técnicas de Agrupamento K-Means e Fuzzy C-Means para Segmentação de Imagens Coloridas Vinicius Ruela Pereira Borges 1 1 Faculdade de Computação - Universidade Federal de Uberlândia

Leia mais

INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática. (1) Data Mining Conceitos apresentados por

INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática. (1) Data Mining Conceitos apresentados por INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática (1) Data Mining Conceitos apresentados por 1 2 (2) ANÁLISE DE AGRUPAMENTOS Conceitos apresentados por. 3 LEMBRE-SE que PROBLEMA em IA Uma busca

Leia mais

CAPÍTULO 1 INTRODUÇÃO 1.1 INTRODUÇÃO

CAPÍTULO 1 INTRODUÇÃO 1.1 INTRODUÇÃO CAPÍTULO 1 INTRODUÇÃO 1.1 INTRODUÇÃO Em quase todas as nossas atividades diárias precisamos enfrentar filas para atender as nossas necessidades. Aguardamos em fila na padaria, nos bancos, quando trafegamos

Leia mais

Detecção de mudanças em imagens oriundas de sensoriamento remoto, usando conjuntos fuzzy.

Detecção de mudanças em imagens oriundas de sensoriamento remoto, usando conjuntos fuzzy. Detecção de mudanças em imagens oriundas de sensoriamento remoto, usando conjuntos fuzzy. Marcelo Musci Baseado no artigo: Change detection assessment using fuzzy sets and remotely sensed data: an application

Leia mais

Introdução à Simulação

Introdução à Simulação Introdução à Simulação O que é simulação? Wikipedia: Simulação é a imitação de alguma coisa real ou processo. O ato de simular algo geralmente consiste em representar certas características e/ou comportamentos

Leia mais

Plano Curricular de Matemática 9º ano - 2014 /2015-3º Ciclo

Plano Curricular de Matemática 9º ano - 2014 /2015-3º Ciclo Plano Curricular de Matemática 9º ano - 2014 /2015-3º Ciclo Tema/Subtema Conteúdos Metas Nº de Aulas Previstas Org.Trat.Dados / Planeamento Estatístico Especificação do problema Recolha de dados População

Leia mais

Conceitos de Mineração de Dados na Web

Conceitos de Mineração de Dados na Web Capítulo 2 Conceitos de Mineração de Dados na Web Rafael Santos Resumo Já não é mais possível apresentar a Web como uma novidade, comentando sobre suas características básicas sua pervasividade e ubiqüidade

Leia mais

2 Trabalhos Relacionados

2 Trabalhos Relacionados 2 Trabalhos Relacionados O desenvolvimento de técnicas de aquisição de imagens médicas, em particular a tomografia computadorizada (TC), que fornecem informações mais detalhadas do corpo humano, tem aumentado

Leia mais

Reconhecimento de Padrões

Reconhecimento de Padrões Engenharia Informática (ramos de Gestão e Industrial) Departamento de Sistemas e Informação Reconhecimento de Padrões Projecto Final 2004/2005 Realizado por: Prof. João Ascenso. Departamento de Sistemas

Leia mais

Recuperação parcial de imagens: Abordagem baseada em topologia hierárquica e similaridade de cor

Recuperação parcial de imagens: Abordagem baseada em topologia hierárquica e similaridade de cor Recuperação parcial de imagens: Abordagem baseada em topologia hierárquica e similaridade de cor Autor: Dalí Freire Dias dos Santos Orientadora: Denise Guliato Programa de Pós-Graduação em Ciência da Computação

Leia mais

UFGD FCA PROF. OMAR DANIEL BLOCO 4 PROCESSAMENTO DE IMAGENS

UFGD FCA PROF. OMAR DANIEL BLOCO 4 PROCESSAMENTO DE IMAGENS UFGD FCA PROF. OMAR DANIEL BLOCO 4 PROCESSAMENTO DE IMAGENS Executar as principais técnicas utilizadas em processamento de imagens, como contraste, leitura de pixels, transformação IHS, operações aritméticas

Leia mais

PROPOSTA PARA CONSTRUÇÃO DE UMA BIBLIOTECA DIGITAL COMO FERRAMENTA DE AUXÍLIO NO ENSINO À DISTÂNCIA

PROPOSTA PARA CONSTRUÇÃO DE UMA BIBLIOTECA DIGITAL COMO FERRAMENTA DE AUXÍLIO NO ENSINO À DISTÂNCIA PROPOSTA PARA CONSTRUÇÃO DE UMA BIBLIOTECA DIGITAL COMO FERRAMENTA DE AUXÍLIO NO ENSINO À DISTÂNCIA Daniel Gonzaga dos Santos 1 Faculdade Cidade de João Pinheiro Resumo: Este artigo aborda as etapas para

Leia mais

Sistemas de Gerência de Bancos de Dados

Sistemas de Gerência de Bancos de Dados Sistemas de Gerência de Bancos de Dados - Módulo 8a - Armazenamento e Recuperação de Dados Geográficos modulo8a.prz 1 29/0 Tópicos Motivação Indexação Espacial Grid files Árvores-R e variantes Armazenamento

Leia mais

Classificação da imagem (ou reconhecimento de padrões): objectivos Métodos de reconhecimento de padrões

Classificação da imagem (ou reconhecimento de padrões): objectivos Métodos de reconhecimento de padrões Classificação de imagens Autor: Gil Gonçalves Disciplinas: Detecção Remota/Detecção Remota Aplicada Cursos: MEG/MTIG Ano Lectivo: 11/12 Sumário Classificação da imagem (ou reconhecimento de padrões): objectivos

Leia mais

Na medida em que se cria um produto, o sistema de software, que será usado e mantido, nos aproximamos da engenharia.

Na medida em que se cria um produto, o sistema de software, que será usado e mantido, nos aproximamos da engenharia. 1 Introdução aos Sistemas de Informação 2002 Aula 4 - Desenvolvimento de software e seus paradigmas Paradigmas de Desenvolvimento de Software Pode-se considerar 3 tipos de paradigmas que norteiam a atividade

Leia mais

Apresentação do Curso e da Área de Processamento de Imagem Digital

Apresentação do Curso e da Área de Processamento de Imagem Digital Apresentação do Curso e da Área de Processamento de Imagem Digital Instituto de Computação - UNICAMP afalcao@ic.unicamp.br Introdução Este curso abordará conceitos e técnicas de processamento de imagem

Leia mais

Processamento Digital de Imagens

Processamento Digital de Imagens Processamento Digital de Imagens (Fundamentos) Prof. Silvio Jamil F. Guimarães PUC Minas 2013-1 Prof. Silvio Guimarães (PUC Minas) Processamento Digital de Imagens 2013-1 1 / 70 Tipos de sinais Conceito

Leia mais

Costa, B.L. 1 ; Faria, R.A.M²; Marins, L.S.³. ²Universidade do Estado do Rio de Janeiro / Faculdade de Formação de Professores - rfariageo@hotmail.

Costa, B.L. 1 ; Faria, R.A.M²; Marins, L.S.³. ²Universidade do Estado do Rio de Janeiro / Faculdade de Formação de Professores - rfariageo@hotmail. GERAÇÃO DE MAPA DE USO E COBERTURA DE SOLO UTILIZANDO IMAGENS DE SATÉLITE LANDSAT 8 PARA O SUPORTE AO PLANEJAMENTO MUNICIPAL DO MUNICÍPIO DE NITERÓI RJ. Costa, B.L. 1 ; Faria, R.A.M²; Marins, L.S.³ 1 Universidade

Leia mais

Índice Invertido para Recuperação de Imagens Baseada em

Índice Invertido para Recuperação de Imagens Baseada em Índice Invertido para Recuperação de Imagens Baseada em Conteúdo Tauller A. Matos, Ilmério Silva, Celia A. Barcelos, Patrícia A. Proença Faculdade de Ciência da Computação, FACOM, UFU 38400-902, Uberlândia,

Leia mais

Segmentação de Imagens

Segmentação de Imagens Segmentação de Imagens (Processamento Digital de Imagens) 1 / 36 Fundamentos A segmentação subdivide uma imagem em regiões ou objetos que a compõem; nível de detalhe depende do problema segmentação para

Leia mais

MODELAGEM DIGITAL DE SUPERFÍCIES

MODELAGEM DIGITAL DE SUPERFÍCIES MODELAGEM DIGITAL DE SUPERFÍCIES Prof. Luciene Delazari Grupo de Pesquisa em Cartografia e SIG da UFPR SIG 2012 Introdução Os modelo digitais de superficie (Digital Surface Model - DSM) são fundamentais

Leia mais

Instituto de Ciências Matemáticas e de Computação ICMC-USP

Instituto de Ciências Matemáticas e de Computação ICMC-USP Instituto de Ciências Matemáticas e de Computação ICMC-USP Monitoramento de população de aves por meio de segmentação de imagens aéreas: uma abordagem por algoritmos de detecção de comunidades, superpixels

Leia mais

Clip-art Retrieval using Sketches PTDC/EIA-EIA/108077/2008

Clip-art Retrieval using Sketches PTDC/EIA-EIA/108077/2008 PROJECTOS DE INVESTIGAÇÃO CIENTÍFICA E DESENVOLVIMENTO TECNOLÓGICO Clip-art Retrieval using Sketches PTDC/EIA-EIA/108077/2008 Deliverable: D1 - Clip-art Simplification Tool Task: T1 - Clip-art Simplification

Leia mais

CBPF Centro Brasileiro de Pesquisas Físicas. Nota Técnica

CBPF Centro Brasileiro de Pesquisas Físicas. Nota Técnica CBPF Centro Brasileiro de Pesquisas Físicas Nota Técnica Aplicação de Física Médica em imagens de Tomografia de Crânio e Tórax Autores: Dário Oliveira - dario@cbpf.br Marcelo Albuquerque - marcelo@cbpf.br

Leia mais

Teoria : Estruturas de Dados. Estrutura Vetorial. Quais tipos de dados são representados por estruturas vetoriais? Mapa temático:

Teoria : Estruturas de Dados. Estrutura Vetorial. Quais tipos de dados são representados por estruturas vetoriais? Mapa temático: Universidade do Estado de Santa Catarina UDESC Centro de ciências Humanas e da Educação FAED Mestrado em Planejamento Territorial e Desenvolvimento Socio- Ambiental - MPPT Disciplina: Geoprocessamento

Leia mais

Flavia Medeiros dos Anjos. Reorganização e Compressão de Dados Sísmicos DISSERTAÇÃO DE MESTRADO

Flavia Medeiros dos Anjos. Reorganização e Compressão de Dados Sísmicos DISSERTAÇÃO DE MESTRADO Flavia Medeiros dos Anjos Reorganização e Compressão de Dados Sísmicos DISSERTAÇÃO DE MESTRADO DEPARTAMENTO DE INFORMÁTICA Programa de Pós-Graduação em Informática Rio de Janeiro, agosto de 2007 Flavia

Leia mais

Análise de componentes principais (PCA)

Análise de componentes principais (PCA) Análise de componentes principais (PCA) Redução de dados Sumarizar os dados que contém muitas variáveis (p) por um conjunto menor de (k) variáveis compostas derivadas a partir do conjunto original. p k

Leia mais

2 Conceitos Gerais de Classificação de Documentos na Web

2 Conceitos Gerais de Classificação de Documentos na Web Conceitos Gerais de Classificação de Documentos na Web 13 2 Conceitos Gerais de Classificação de Documentos na Web 2.1. Páginas, Sites e Outras Terminologias É importante distinguir uma página de um site.

Leia mais

Recuperação de Informação em Bases de Texto. Aula 10

Recuperação de Informação em Bases de Texto. Aula 10 Aula 10 1 Agrupamento/ clustering de documentos: Agrupar os documentos em classes/grupos, de acordo com a sua semelhança Aprendizagem não supervisionada Sem conjunto de treino/exemplos 2 3 Agrupamento/

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Introdução Aprendizagem de Máquina Alessandro L. Koerich Introdução Desde que os computadores foram inventados temos nos perguntado: Eles são capazes de aprender? Se pudéssemos programá-los para aprender

Leia mais

Descoberta de Domínio Conceitual de Páginas Web

Descoberta de Domínio Conceitual de Páginas Web paper:25 Descoberta de Domínio Conceitual de Páginas Web Aluno: Gleidson Antônio Cardoso da Silva gleidson.silva@posgrad.ufsc.br Orientadora: Carina Friedrich Dorneles dorneles@inf.ufsc.br Nível: Mestrado

Leia mais

Mineração de Dados em Grandes Bancos de Dados Geográficos

Mineração de Dados em Grandes Bancos de Dados Geográficos Programa de Ciência e Tecnologia para Gestão de Ecosistemas Ação "Métodos, modelos e geoinformação para a gestão ambiental Mineração de Dados em Grandes Bancos de Dados Geográficos Marcos Corrêa Neves

Leia mais

Tabela 4.2 Estatística típica de um sistema em 2007

Tabela 4.2 Estatística típica de um sistema em 2007 4. CONSTRUÇÃO DE ÍNDICE Neste capítulo é mostrado como construir um índice invertido, processo chamado de indexação. O projeto de indexação depende de algumas restrições de hardware, fato que leva a necessidade

Leia mais

AULAS 13, 14 E 15 Correlação e Regressão

AULAS 13, 14 E 15 Correlação e Regressão 1 AULAS 13, 14 E 15 Correlação e Regressão Ernesto F. L. Amaral 23, 28 e 30 de setembro de 2010 Metodologia de Pesquisa (DCP 854B) Fonte: Triola, Mario F. 2008. Introdução à estatística. 10 ª ed. Rio de

Leia mais