Recuperação de Imagem por Conteúdo considerando a Percepção Visual Humana

Tamanho: px
Começar a partir da página:

Download "Recuperação de Imagem por Conteúdo considerando a Percepção Visual Humana"

Transcrição

1 Recuperação de Imagem por Conteúdo considerando a Percepção Visual Humana Autor: Robson de Carvalho Soares 1, Orientadora: Denise Guliato 1 1 Programa de Pós-Graduação em Ciência da Computação Universidade Federal do Uberlândia (UFU) Uberlândia MG Brasil robsoncsoares@gmail.com, guliato@ufu.br Nível: Mestrado Ano de ingresso no programa: 2009 Época esperada de conclusão: Fevereiro / 2012 Resumo. Com o volume crescente de imagens sendo capturadas nas mais diversas modalidades de aquisição, surge a necessidade de novas técnicas capazes de gerenciar e recuperar imagens de maneira eficiente. Assim, uma das técnicas que mais vem sendo utilizada na recuperação de imagens por conteúdo (CBIR - Content Based Image Retrieval) é conhecida como bag-of-features ou ainda bag-of-visual-words. Essa técnica esta baseada em um dicionário de palavras visuais que caracteriza uma coleção de imagens. Para cada imagem, é criado um histograma que indica com que frequência cada palavra visual deste dicionário ocorre na mesma. No entanto, na montagem deste histograma não é levado em consideração a importância da palavra para efeito discriminativo da consulta. Este trabalho propõe a utilização da percepção humana para enfatizar o que há de mais importante em uma determinada imagem e consequentemente permitir que sejam gerados histogramas com maior poder discriminativo. Palavras-Chave. bag-of-features, palavras visuais, codebook, dicionário, CBIR, Saliency Map

2 1. Introdução Com o volume crescente de imagens sendo capturadas nas mais diversas modalidades de aquisição, surge a necessidade de novas técnicas capazes de gerenciar e recuperar imagens de maneira eficiente [Fayyad and Uthurusamy 2002], [Razente 2009]. O acesso eficiente a imagens em grandes bases de dados é ainda mais problemático quando estas bases não estão organizadas [Rui et al. 1997], como é o caso das bases disponíveis na Web. Neste cenário, surge a necessidade da criação de técnicas cada vez mais eficazes para o armazenamento e recuperação de imagens. Assim, uma das técnicas que mais vem sendo utilizada na recuperação de imagens por conteúdo (CBIR - Content Based Image Retrieval) é conhecida como bag-of-features ou ainda bag-of-visual-words [Sivic and Zisserman 2003]. Essa abordagem baseou-se na técnica conhecida como bag-of-words [Dumais et al. 1998], [Baeza-Yates and Ribeiro-Neto 1999] a qual é aplicada em recuperação de informações textuais (RI - Information Retrieval). Essas técnicas tem como objetivo principal criar o chamado dicionário de palavras responsável pela categorização textual quando aplicado a recuperação textual e pela classificação da imagem quando aplicado a recuperação de imagem por conteúdo. Em bag-of-features, o dicionário de palavras também é chamado de dicionário de palavras visuais. Para construí-lo, utiliza-se descritores de características de pontos-chave extraídos das imagens. Os pontos-chave são saliências que contêm informações locais da imagem e são obtidos automaticamente por métodos de detecção de pontos-chave [Lindeberg 1993], [Lazebnik et al. 2003]. Uma vez detectados, os pontos-chave são representados por descritores como Invariant Feature Transform (SIFT) [Lowe 1999], Principal Component Analysis (PCA)- SIFT [Ke and Sukthankar 2004] e o Speeded Up Robust Features (SURF) [Bay et al. 2006]. Assim, no dicionário de palavras visuais, cada palavra visual está associada a um agrupamento de descritores de pontos-chave. Tipicamente, o método de agrupamento é o k-means [Mitchell 1997] e a distância utilizada é a Euclidiana. Cada palavra visual representa, portanto, um padrão local específico compartilhado por todos os descritores de um dado agrupamento. Uma vez definido o dicionário de palavras visuais, é possível associar a cada descritor de ponto-chave à palavra visual mais próxima. Alguns trabalhos recentes baseados em bagof-features propõem melhorar o tempo de atribuição de descritores individuais para palavras visuais [Nister and Stewenius 2006], [Philbin et al. 2007]. Cada imagem é, então, representada por um histograma que indica com que frequência cada palavra visual do dicionário ocorre na imagem (de forma análoga ao que se faz em recuperação de informações textuais) [Jiang et al. 2007]. Acesso rápido ao vetor de frequência é alcançado usando sistema de arquivos invertidos [Ribeiro-Neto et al. 1999]. A representação da imagem em termos do histograma é utilizada em tarefas de classificação ou de recuperação de imagens por conteúdo. A Figura 1 ilustra todo o processo para obtenção do dicionário de palavras visuais e para a descrição de imagens via histograma. 2. Objetivo Geral O objetivo geral deste trabalho é explorar o uso da estratégia baseada em bag-of-features para a recuperação de imagens por conteúdo. Neste estudo serão exploradas técnicas que extraem a percepção visual humana de uma determinada imagem com o intuito de melhorar a qualidade discrimitativa dos histogramas gerados; propor diferentes estratégias de ponderação de palavras visuais nas imagens; avaliar o uso das técnicas propostas para a identificação de versões de

3 Figura 1. Uma visa o geral do processo de criac a o de um diciona rio de palavras visuais. Ilustrac a o baseada no artigo [Yang et al. 2007] imagens; criar uma base de imagens de verso es. 3. Trabalhos Relacionados De acordo com a literatura podemos encontrar va rios trabalhos relacionados a te cnica bag-of-features. Os trabalhos mais cla ssicos foram propostos por Sivic e Zisserman [Sivic and Zisserman 2003] e Csurka et al. [Csurka et al. 2004]. Sivic e Zisserman apresentam a te cnica como uma abordagem para recuperar todas as ocorre ncias de um objeto em cenas ( frames ) de um determinado vı deo. Ja Csurka tem o objetivo de encontrar um processo que seja gene rico para lidar com diversos tipos de objetos. Ambos representam os objetos como um conjunto de descritores invariantes a escala, rotac a o, translac a o, iluminac a o e oclusa o parcial. Ale m disso, nos dois trabalhos, utiliza-se o SIFT como descritor de caracterı sticas das imagens, o diciona rio de palavras visuais e gerado aplicando-se o k-means e os histogramas de freque ncia das palavras visuais de cada imagem sa o montados com base no diciona rio gerado. Um dos primeiros trabalhos a considerar a utilizac a o da percepc a o visual humana foi em um processo de classificac a o de objetos proposto por [Moosmann et al. 2006]. Apesar de sua te cnica na o utilizar a abordagem bag-of-features, e aplicada a te cnica de Saliency Map [Itti et al. 1998] [Harel et al. 2007] justamente com o intuito de separar as regio es importantes da imagem. Durante a classificac a o o classificador e utilizado para montar o mapa de salie ncia da imagem analisada, ajudando a identificar partes da imagem como parte do objeto ou parte

4 do fundo da imagem. Os experimentos do trabalho mostraram ganhos na utilização da técnica de Saliency Map comparada com a não utilização. Sato e Katto [Sato and Katto 2010] propuseram a remoção de áreas desnecessárias nas imagens para melhorar a fase de aprendizagem em um processo de classificação. Para isso, utilizaram duas técnicas em conjunto com a abordagem de bag-of-features, Saliency Map e Seam Carving [Avidan and Shamir 2007]. Inicialmente a imagem é processada gerando o seu mapa de saliências. A técnica Seam Carving é aplicada na imagem removendo regiões desnecessárias na mesma de acordo com o mapa de saliência extraído. Por fim, na geração dos vetores de características, são considerados apenas os pontos-chave que fazem parte da área da imagem de maior interesse definida pelo mapa de saliência. Não é apresentada nehuma estratégia de selecionar ou ponderar os pontos chaves através do mapa de saliênica. A percepção visual humana também é abordada no trabalho de Shogo [Nakamoto and Toriu 2011]. Neste trabalho é investigada a eficácia dos mapas de saliência para reduzir os pontos-chaves extraídos das imagens de modo que somente realce uma determinada região de interesse da cena. Assim, são considerados apenas os pontos-chaves que fazem parte de alta saliência da imagem extraída por percentual de thresholding. 4. Metodologia e Estado da Pesquisa 4.1. Aspectos Teóricos Na literatura podemos perceber que a maioria dos trabalhos que utilizam a abordagem bag-of-features, como por exemplo, [Sivic and Zisserman 2003], [Csurka et al. 2004], [Batista et al. 2009], [Lopes et al. 2009], entre outros, apesar da diferença dos domínios de aplicação todos apresentam a mesma forma de extrair as características (na maioria das vezes utilizando o SIFT como descritor), gerar o dicioário de palavras visuais e montar o histograma de frequência dessas palavras nas imagens. Percebemos então, que o dicionário de palavras visuais gerado pela quantização dos pontos chaves obtidos pelo SIFT não leva em consideração uma diferenciação entre o background e foreground da imagem. Um dos motivos é a dificuldade de identificar qual parte da imagem pertence ao background e qual pertence ao foreground de uma maneira fácil, rápida e automática. Dessa forma, encontramos uma resposta para esta diferenciação em estudos da percepção visual humana. Uma técnica denominada Saliency Map [Itti et al., 1998] [Perona et al., 2007], quando aplicada a uma imagem é capaz de identificar o que é relevante na mesma de acordo com a percepção humana. Um exemplo da aplicação do Saliency Map é ilustrado na Figura 2. Este trabalho explora essa capacidade da técnica do Saliency Map em identificar, de forma rápida e automática, as partes mais relevantes e menos relevantes de uma determinada imagem com o intuito de melhorar a performance de recuperação de um determinado objeto ou cena. Para isso, são propostos dois métodos para a montagem e processamento dos histogramas de palavras visuais, a contrução de histogramas com o uso do mapa de saliências binário e a contrução de histogramas com o uso do mapa de saliências fuzzy. Abaixo segue o detalhamento de cada processo comparados com o processo convencional de construção de histogramas globais utilizados na literatura.

5 Figura 2. Exemplo da representação de imagens utilizando a técnica Saliency Map Construção de histogramas globais O histograma representa a frequência com que cada palavra visual do dicionário aparece em uma determinada imagem. Assim, todo descritor gerado da imagem é combinado com todas as palavras do dicionário através da distância Euclidiana para identificar qual palavra visual este descritor mais se assemelha e atualizar o histograma com a frequência dessa palavra na imagem. Durante a fase de recuperação, as imagens mais similares a uma determinada imagem de referência são obtidas através da combinação do histograma da imagem de referência com todos os outros histogramas das imagens da base utilizando a distância Cosseno Contrução de histogramas com o uso do mapa de saliências binário Conforme mostra a Figura 2, a técnica do Saliency Map gera imagens em tons de cinza, onde a parte mais clara da imagem representa o objeto de interesse (foreground) e a parte mais escura o fundo (background) da imagem. Assim, na estratégia binária, os descritores que representam o foreground e os descritores que representam o background da imagem são tratados separadamente. Dessa forma, para cada imagem são montados dois histogramas, o que contém a frequência das palavras que fazem parte do foreground da imagem e o que contém a frequência das palavras que fazem parte do background da imagem. Durante o processo de recuperação conseguimos ponderar os histogramas (foreground x background) selecionando qual parte da imagem tem mais relevância no contexto analisado. Para selecionar os descritores que fazem parte do foreground e do background da imagem, criamos um thresholding que é a média dos valores da imagem gerada pelo Saliency Map. A Figura 3 mostra os descritores do SIFT plotados da maneira convencional e considerando a estratégia binária utilizando duas técnicas de Saliency Map ITTI [Itti et al. 1998] e GBVS [Harel et al. 2007] Contrução de histogramas com o uso do mapa de saliências fuzzy Nesta estratégia, diferentemente da estratégia binária, ao invés de se criar um thresholding que separa as palavras contidas no background das palavras contidas no foreground da imagem, todas as palavras que ocorrem na imagem são inclusas nos histogramas (foreground e background) indicando o quanto ela é importante para o foreground e o quanto ela é importante para

6 Figura 3. Plotagem dos descritores do SIFT da forma convencional e utilizando a Estratégia Binária para duas técnicas de Saliency Map diferentes, ITTI e GBVS o background. Dessa forma, uma palavra na imagem pode fazer parte tanto do seu foreground quanto do seu background e assim será associado um fator de importância a essa palavra no histograma de palavras foreground e 1-fator no histograma de palavras background. Este fator corresponde ao valor normalizado no intervalo de [0,1] da imagem de tons de cinza gerada pelo Saliency Map e funcionam como um peso para ponderar a importância dos descritores SIFT extraídos da imagem Bases de dados Uma possível aplicação da proposta deste projeto é a identificação de versões de imagens. Esta identificação é de interesse da polícia federal para identificar violação de copyright, ou adulteração das imagens. Assim, como não encontramos uma base de dados pública nesse formato, criamos bases de imagens de versões. Nessas novas bases foram utilizadas imagens de duas bases públicas conhecidas: Caltech 256 ( Caltech256/). WANG ( Ao todo foram criadas 8 bases com um total de 4720 de imagens para que conseguíssemos avaliar o comportamento da nova proposta nos mais diversos contextos. Cada

7 base contém 10 classes de imagens diferentes. As classes utilizadas são: Africa, Ibis, Buses, Giraffe, Elephant, Motorbike, Horses, Dinossaurs, LightHouse e Teepe. A Figura 4 mostra uma imagem de cada classe. Abaixo segue o detalhamento e a metodologia utilizada para a criação de cada base. Figura 4. Imagens de consulta de cada classe da base de imagens Escala: O objetivo dessa base é avaliar o comportamento das estratégias propostas variando o tamanho do objeto de interesse na cena. A base possui 110 imagens, sendo 11 imagens por classe. Das 11 imagens, 1 é a imagem original, 5 são imagens onde o objeto de interesse diminui gradativamente em relação ao objeto de interesse da imagem original e 5 são imagens onde o objeto de interesse aumenta gradativamente em relação ao objeto de interesse da imagem original. A Figura 5 mostra algumas imagens de uma classe dessa base. Figura 5. Imagens de exemplo da Base Escala Rotação: O objetivo dessa base é avaliar o comportamento das estratégias propostas variando a rotação do objeto de interesse na cena. A base possui 390 imagens, sendo 39 imagens por classe. Das 39 imagens, 1 é a imagem original, 3 são as imagens rotacionadas por completo e 35 são as imagens onde o objeto de interesse é rotacionado na cena de 10 em 10 graus. A Figura 6 mostra algumas imagens de uma classe dessa base. Figura 6. Imagens de exemplo da Base Rotação

8 Translação: O objetivo dessa base é avaliar o comportamento das estratégias propostas variando a posição do objeto de interesse na cena. A base possui 70 imagens, sendo 7 imagens por classe. Das 7 imagens, 1 é a imagem original e as outras 6 variam a posição do objeto de interesse em esquerda superior, esquerda inferior, direita superior, direita inferior, centro superior e centro inferior. A Figura 7 mostra algumas imagens de uma classe dessa base. Figura 7. Imagens de exemplo da Base Translação Cor: O objetivo dessa base é avaliar o comportamento das estratégias propostas variando as cores da imagem. A base possui 550 imagens, sendo 55 imagens por classe. Das 55 imagens, 1 é a imagem original, 27 são geradas através da combinação dos valores 1.3, 1.5, 1.8 que são multiplicados ao RGB da imagem e as outras 27 são geradas através da combinação dos valores 0.3, 0.5, 0.8 que são multiplicados ao RGB da imagem. A Figura 8 mostra algumas imagens de uma classe dessa base. Figura 8. Imagens de exemplo da Base Cor Iluminação: O objetivo dessa base é avaliar o comportamento das estratégias propostas variando o contraste e o brilho das imagens. A base possui 370 imagens, sendo 37 imagens por classe. Das 37 imagens, 1 é a imagem original, 18 são as imagens que tiveram a variação de 0.1 a 0.9 para mais e para menos no brilho e 18 são as imagens que tiveram a variação de 0.1 a 0.9 para mais e para menos no contraste. A Figura 9 mostra algumas imagens de uma classe dessa base. Figura 9. Imagens de exemplo da Base Iluminação Fundo: O objetivo dessa base é avaliar o comportamento das estratégias propostas variando o fundo das imagens. A base possui 110 imagens, sendo 11 imagens por classe.

9 Das 11 imagens, 1 é a imagem original e 10 são imagens que tiveram o fundo da cena alterados. A Figura 10 mostra algumas imagens de uma classe dessa base. Figura 10. Imagens de exemplo da Base Fundo Híbrido: O objetivo dessa base é avaliar o comportamento das estratégias propostas juntando todas as variações realizada nas imagens das bases Escala, Rotação, Translação, Cor, Iluminação e Fundo. A base possui 1550 imagens, sendo 155 imagens por classe. Das 155 imagens, 1 é a imagem original e as restantes são das outras bases. A Figura 11 mostra algumas imagens de uma classe dessa base. Figura 11. Imagens de exemplo da Base Híbrido Cena: O objetivo dessa base é avaliar o comportamento das estratégias propostas quando se consulta pelo fundo da imagem. A base possui 1570 imagens, sendo 157 imagens por classe. Das 157 imagens, 1 é a imagem original, 1 é apenas a imagem da cena sem nenhum objeto, 1 é a imagem origem em que foi recortado o fundo a ser utilizado para montar as versões das imagens e as restantes são da base Híbrido. A Figura 12 mostra algumas imagens de uma classe dessa base. Figura 12. Imagens de exemplo da Base Cena 4.3. Estágio atual de desenvolvimento O projeto se encontra em fase de compilação dos experimentos e de escrita da dissertação de mestrado Experimentos Para as 8 bases de imagens criadas utilizou-se a mesma metodologia de experimentação. Foram extraídos os descritores de características das imagens utilizando o descritor SIFT. O processo

10 de agrupamento utilizado para a criação do dicionário de palavras visuais foi o k-means gerando um dicionário com 4000 palavras. As propostas analisadas e comparadas foram: Global: Processo convencional de geração do dicionário de palavras visual utilizando todos os descritores de características sem aperfeiçoamento na criação dos histogramas; SM Binário ITTI: Construção de histogramas com o uso do mapa de saliências binário utilizando a técnica de [Itti et al. 1998] para extrair os mapas de saliências das imagens. SM Binário GBVS: Construção de histogramas com o uso do mapa de saliências binário utilizando a técnica de [Harel et al. 2007] para extrair os mapas de saliências das imagens. SM Fuzzy ITTI: Construção de histogramas com o uso do mapa de saliências fuzzy utilizando a técnica de [Itti et al. 1998] para extrair os mapas de saliências das imagens. SM Fuzzy GBVS: Construção de histogramas com o uso do mapa de saliências fuzzy utilizando a técnica de [Harel et al. 2007] para extrair os mapas de saliências das imagens. CEDD (Color and edge directivity descriptor): Descritor de características de cor proposto por [Chatzichristofis et al. 2010]. Foi utilizada essa abordagem para comparar com as novas propostas e identificar o comportamento da utilização do descritor de cor nas bases de versões. Os resultados foram obtidos utilizando a ferramenta chamada LIRE ( e adequando a metodologia de experimentação utilizada. FCTH (Fuzzy color and texture histogram): Descritor de características de cor proposto por [Chatzichristofis et al. 2010]. Foi utilizada essa abordagem para comparar com as novas propostas e identificar o comportamento da utilização do descritor de cor nas bases de versões. Os resultados foram obtidos utilizando a ferramenta chamada LIRE ( e adequando a metodologia de experimentação utilizada. As imagens de consultas utilizadas nas bases de Cor, Iluminação, Escala, Rotação, Translação e Híbrido são apresentadas na Figura 4, ou seja, 1 imagem de consulta por classe. A base de Fundo utilizou 3 imagens de consulta por classe ao invés de 1 conforme os exemplos das imagens de consulta da classe Africa mostradas na Figura 13. Figura 13. Imagens de consulta da classe Africa da base Fundo Além disso, para a base Cena, foi utilizada 1 imagem de consulta por classe só que não as mesmas utilizadas nas outras bases. A Figura 14 mostra alguns exemplos. Essa mudança ajuda na validação da ponderação dos histogramas considerando background e foreground das imagens. Foram utilizadas duas medidas de avaliação dos experimentos, o MAP (Mean Average Precision) e o NDCG (Normalized Discounted Cumulative Gain). Além disso variou-se a quan-

11 Figura 14. Exemplo de Imagens de consulta da base Cena tidade de classes utilizadas durante a experimentação de 2, 4 e 10 classes. No Anexo segue os gráficos dos resultados obtidos de todos os experimentos realizados para cada base de imagens. 5. Cronograma do Trabalho até a Defesa As atividades previstas para o desenvolvimento deste trabalho até a defesa são: 1. Finalização e compilação dos experimentos; 2. Elaboração de artigo para submissão em congressos científicos e periódicos; 3. Elaboração e revisão da dissertação; O cronograma previsto para as atividades listadas acima é sintetizado na Tabela 1. Meses Atividades Jul/2011 X Ago/2011 X Set/2011 X Out/2011 X X X Nov/2011 X X Dez/2011 X Jan/2012 X Tabela 1. Cronograma de Atividades Referências Avidan, S. and Shamir, A. (2007). Seam carving for content-aware image resizing. In ACM Trans. Graph, page 10. SIGGRAPH. Baeza-Yates, R. A. and Ribeiro-Neto, B. (1999). Modern Information Retrieval. Addison- Wesley Longman Publishing Co., Inc., Boston, MA, USA. Batista, N. C., Lopes, A. P. B., and de A. Araujo, A. (2009). Detecting buildings in historical photographs using bag-of-keypoints. Computer Graphics and Image Processing, Brazilian Symposium on, 0: Bay, H., Tuytelaars, T., and Gool, L. V. (2006). Surf: Speeded up robust features. In In ECCV, pages Chatzichristofis, S. A., Zagoris, K., Boutalis, Y. S., and Papamarkos, N. (2010). Accurate image retrieval based on compact composite descriptors and relevance feedback information. IJPRAI, 24:

12 Csurka, G., Dance, C. R., Fan, L., Willamowski, J., and Bray, C. (2004). Visual categorization with bags of keypoints. In In Workshop on Statistical Learning in Computer Vision, ECCV, pages Dumais, S., Platt, J., Sahami, M., and Heckerman, D. (1998). Inductive learning algorithms and representations for text categorization. pages ACM Press. Fayyad, U. and Uthurusamy, R. (2002). Evolving data into mining solutions for insights. Commun. ACM, 45: Harel, J., Koch, C., and Perona, P. (2007). Graph-based visual saliency. In Advances in Neural Information Processing Systems 19, pages MIT Press. Itti, L., Koch, C., and Niebur, E. (1998). A model of saliency-based visual attention for rapid scene analysis. IEEE Transactions on Pattern Analysis and Machine Intelligence, 20: Jiang, Y.-G., Ngo, C.-W., and Yang, J. (2007). Towards optimal bag-of-features for object categorization and semantic video retrieval. In Proceedings of ACM International Conference on Image and Video Retrieval. Ke, Y. and Sukthankar, R. (2004). Pca-sift: A more distinctive representation for local image descriptors. Computer Vision and Pattern Recognition, IEEE Computer Society Conference on, 2: Lazebnik, S., Schmid, C., and Ponce, J. (2003). Affine-invariant local descriptors and neighborhood statistics for texture recognition. In In Proc. ICCV, pages Lindeberg, T. (1993). Detecting salient blob-like image structures and their scales with a scalespace primal sketch: A method for focus-of-attention. International Journal of Computer Vision, 11: Lopes, A. P. B., de Avila, S. E. F., Peixoto, A. N. A., Oliveira, R. S., de M. Coelho, M., and de Albuquerque Araújo, A. (2009). Nude detection in video using bag-of-visual-features. In SIBGRAPI, pages IEEE Computer Society. Lowe, D. G. (1999). Object recognition from local scale-invariant features. Computer Vision, IEEE International Conference on, 2:1150. Mitchell, T. M. (1997). Machine Learning. McGraw-Hill, New York. Moosmann, F., Larlus, D., and Jurie, F. (2006). Learning saliency maps for object categorization. In ECCV International Workshop on The Representation and Use of Prior Knowledge in Vision. Springer. Nakamoto, S. and Toriu, T. (2011). Combination way of local properties, classifiers and saliency in bag-of-keypoints approach for generic object recognition. International Journal of Computer Science and Network Security, 11: Nister, D. and Stewenius, H. (2006). Scalable recognition with a vocabulary tree. Computer Vision and Pattern Recognition, IEEE Computer Society Conference on, 2: Philbin, J., Chum, O., Isard, M., Sivic, J., and Zisserman, A. (2007). Object retrieval with large vocabularies and fast spatial matching. Computer Vision and Pattern Recognition, IEEE Computer Society Conference on, 0:1 8. Razente, H. L. (2009). Adequando consultas por similaridade para reduzir a descontinuidade semântica na recuperação de imagens por conteúdo. Tese de doutorado, instituto de ciências matemáticas e de computação, ICMC-USP, São Carlos-SP.

13 Ribeiro-Neto, B., Moura, E. S., Neubert, M. S., and Ziviani, N. (1999). Efficient distributed algorithms to build inverted files. In Proceedings of the 22nd annual international ACM SIGIR conference on Research and development in information retrieval, SIGIR 99, pages , New York, NY, USA. ACM. Rui, Y., Huang, T. S., and fu Chang, S. (1997). Image retrieval: Past, present, and future. In Journal of Visual Communication and Image Representation, pages Sato, M. and Katto, J. (2010). Performance improvement of generic object recognition by using seam carving and saliency map. In The International Workshop on Advanced Image Technology (IWAIT). Sivic, J. and Zisserman, A. (2003). Video google: A text retrieval approach to object matching in videos. Computer Vision, IEEE International Conference on, 2:1470. Yang, J., Jiang, Y.-G., Hauptmann, A. G., and Ngo, C.-W. (2007). Evaluating bag-of-visualwords representations in scene classification. In Wang, J. Z., Boujemaa, N., Bimbo, A. D., and Li, J., editors, Multimedia Information Retrieval, pages ACM. 6. Anexo Figura 15. Gráfico de variação do MAP para todas as abordagens de acordo com o aumento do número de classes na Base Cor

14 Figura 16. Gráfico de variação do NDCG para todas as abordagens de acordo com o aumento do número de classes na Base Cor Figura 17. Gráfico de variação do MAP para todas as abordagens de acordo com o aumento do número de classes na Base Escala

15 Figura 18. Gráfico de variação do NDCG para todas as abordagens de acordo com o aumento do número de classes na Base Ecala Figura 19. Gráfico de variação do MAP para todas as abordagens de acordo com o aumento do número de classes na Base Fundo

16 Figura 20. Gráfico de variação do NDCG para todas as abordagens de acordo com o aumento do número de classes na Base Fundo Figura 21. Gráfico de variação do MAP para todas as abordagens de acordo com o aumento do número de classes na Base Híbrido

17 Figura 22. Gráfico de variação do NDCG para todas as abordagens de acordo com o aumento do número de classes na Base Híbrido Figura 23. Gráfico de variação do MAP para todas as abordagens de acordo com o aumento do número de classes na Base Iluminação

18 Figura 24. Gráfico de variação do NDCG para todas as abordagens de acordo com o aumento do número de classes na Base Iluminação Figura 25. Gráfico de variação do MAP para todas as abordagens de acordo com o aumento do número de classes na Base Rotação

19 Figura 26. Gráfico de variação do NDCG para todas as abordagens de acordo com o aumento do número de classes na Base Rotação Figura 27. Gráfico de variação do MAP para todas as abordagens de acordo com o aumento do número de classes na Base Translação

20 Figura 28. Gráfico de variação do NDCG para todas as abordagens de acordo com o aumento do número de classes na Base Translação Figura 29. Gráfico de variação do MAP para todas as abordagens de acordo com o aumento do número de classes na Base Cena

Técnicas para Recuperação de Imagens por Conteúdo baseadas em Dicionário de Palavras Visuais

Técnicas para Recuperação de Imagens por Conteúdo baseadas em Dicionário de Palavras Visuais Técnicas para Recuperação de Imagens por Conteúdo baseadas em Dicionário de Palavras Visuais Autor: Robson de Carvalho Soares 1, Orientadora: Denise Guliato 1 1 Programa de Pós-Graduação em Ciência da

Leia mais

Descritores de Imagens

Descritores de Imagens Descritores de Imagens André Tavares da Silva PPGCA/UDESC Outubro de 2017 André Tavares da Silva (PPGCA/UDESC) Descritores de Imagens Outubro de 2017 1 / 17 Introdução Excelentes pesquisas sobre descritores

Leia mais

Descritores de Imagens

Descritores de Imagens Descritores de Imagens André Tavares da Silva PPGCA/UDESC Outubro de 2017 André Tavares da Silva (PPGCA/UDESC) Descritores de Imagens Outubro de 2017 1 / 18 Descritores Locais e Frameworks SIFT SURF Viola-Jones

Leia mais

Making an image worth a thousand visual words

Making an image worth a thousand visual words Universidade de São Paulo Biblioteca Digital da Produção Intelectual - BDPI Departamento de Ciências de Computação - ICMC/SCC Comunicações em Eventos - ICMC/SCC 2015-10 Making an image worth a thousand

Leia mais

Sistema de Reconhecimento de Logotipos

Sistema de Reconhecimento de Logotipos Sistema de Reconhecimento de Logotipos Fellipe Duarte, Saulo T. Oliveira {duartefellipe,sto}@cos.ufrj.br Relatório Técnico, Introdução ao Processamento de Imagens Programa de Engenharia de Sistemas e Computação

Leia mais

Caracterização de Imagens via Redes Neurais Artificiais

Caracterização de Imagens via Redes Neurais Artificiais Caracterização de Imagens via Redes Neurais Artificiais Autor: Eduardo Ferreira Ribeiro 1, Orientadora: Celia Zorzo Barcelos 1 1 Programa de Pós-Graduação em Ciência da Computação Universidade Federal

Leia mais

Image Descriptors: local features

Image Descriptors: local features Image Descriptors: local features Image Processing scc0251 www.icmc.usp.br/ moacir moacir@icmc.usp.br ICMC/USP São Carlos, SP, Brazil 2011 Moacir Ponti Jr. (ICMCUSP) Image Descriptors: local features 2011

Leia mais

Extração de atributos usando o método LBP - Local Binary Pattern

Extração de atributos usando o método LBP - Local Binary Pattern Extração de atributos usando o método LBP - Local Binary Pattern Lia Nara Balta Quinta. 2 de maio de 2006 1 Antecedentes e Justificativa O Brasil possui, atualmente, um grande rebanho bovino, porém em

Leia mais

Face Recognition using RGB-D Images

Face Recognition using RGB-D Images Face Recognition using RGB-D Images Helder C. R. de Oliveira N.USP: 7122065 Polyana Nunes N.USP: 9043220 Sobre o Artigo Publication: 2013 IEEE Sixth International Conference Author(s) Goswami, G. (Índia

Leia mais

Universidade Federal de Pernambuco

Universidade Federal de Pernambuco Universidade Federal de Pernambuco Graduação em Engenharia da Computação Centro de Informática 2 0 1 2. 2 PROPOSTA DE TRABALHO DE GRADUAÇÃO Aluno Arthur de Lima Padilha {alp4@cin.ufpe.br} Orientadora Veronica

Leia mais

Sketch to Photo Matching: A Feature-based Approach (Klare and Jain [2010])

Sketch to Photo Matching: A Feature-based Approach (Klare and Jain [2010]) Sketch to Photo Matching: A Feature-based Approach (Klare and Jain [2010]) Marco Antonio de A. Silva Programa de Pós-Graduação em Ciência da Computação - PPGCC Departamento de Computação - DECOM Universidade

Leia mais

Igor dos Santos Montagner Orientador: Roberto Marcondes Cesar Junior 20/09/2010

Igor dos Santos Montagner Orientador: Roberto Marcondes Cesar Junior 20/09/2010 Análise e conversão de tablóides de promoções Igor dos Santos Montagner Orientador: Roberto Marcondes Cesar Junior 20/09/2010 1 1 Introdução Com os avanços na área de computação e a demanda crescente por

Leia mais

"Análise de Extratores de Característica para Reconhecimento de Face"

Análise de Extratores de Característica para Reconhecimento de Face Universidade Federal de Pernambuco Centro de Informática Graduação em Engenharia de Computação Proposta de Trabalho de Graduação "Análise de Extratores de Característica para Reconhecimento de Face" Orientador:

Leia mais

Descritores de Imagem

Descritores de Imagem Descritores de Imagem André Tavares da Silva 31 de março de 2014 1 Descritores de imagem (continuação) 1.1 Frameworks de detecção de objetos SIFT (scale-invariant features transform) (Lowe, 1999) SIFT

Leia mais

Feature Description (SIFT + SURF) Prof. Dr. Geraldo Braz Junior

Feature Description (SIFT + SURF) Prof. Dr. Geraldo Braz Junior Feature Description (SIFT + SURF) Prof. Dr. Geraldo Braz Junior Feature Detection 1. Encontre um conjunto de keypoints 2. Defina uma região ao redor do keypoint 3. Normalize a região 4. Extraia caracterísfcas

Leia mais

Anotador automático de placas de publicidade em vídeos esportivos

Anotador automático de placas de publicidade em vídeos esportivos MAC0499 - Trabalho de Formatura Supervisionado Professor: Carlos Eduardo Ferreira Universidade de São Paulo Instituto de Matemática e Estatística Aluno: Ricardo Augusto Fernandes Orientador: Prof. Dr.

Leia mais

Reconhecimento de Instâncias (parte 2)

Reconhecimento de Instâncias (parte 2) Reconhecimento de Instâncias (parte 2) Rafael Galvão de Mesquita rgm@cin.ufpe.br Carlos Alexandre Mello cabm@cin.ufpe.br SURF Speeded-Up Robust Features [3] Computer Vision and Image Understanding, 2004

Leia mais

Recuperação de Imagens Digitais com Base na Distribuição de Características de Baixo Nível em Partições do Domínio Utilizando Índice Invertido

Recuperação de Imagens Digitais com Base na Distribuição de Características de Baixo Nível em Partições do Domínio Utilizando Índice Invertido Recuperação de Imagens Digitais com Base na Distribuição de Características de Baixo Nível em Partições do Domínio Utilizando Índice Invertido Autor: Patrícia Aparecida Proença 1, Orientador: Ilmério Reis

Leia mais

Mineração de Textos na Web

Mineração de Textos na Web Mineração de Textos na Web Luciano Antonio Digiampietri Escola de Artes Ciências e Humanidades da Universidade de São Paulo digiampietri@usp.br Resumo: Com o crescimento das informações disponíveis na

Leia mais

Métodos de Segmentação de Imagem para Análise da Marcha

Métodos de Segmentação de Imagem para Análise da Marcha Métodos de Segmentação de Imagem para Análise da Marcha Maria João M. Vasconcelos, João Manuel R. S. Tavares maria.vasconcelos@fe.up.pt, tavares@fe.up.pt 3º Congresso Nacional de Biomecânica 11-12 Fevereiro

Leia mais

Grammatical Inference and SIFT for Scene Recognition

Grammatical Inference and SIFT for Scene Recognition Grammatical Inference and SIFT for Scene Recognition Lucas C. Ribas 1, Marcelo Borth, Amaury A. Castro Jr., Wesley N. Gonçalves e Hemerson Pistori Universidade Federal de Mato Grosso do Sul, UFMS - CPPP

Leia mais

Aprendizagem de Máquinas. Extração de Características

Aprendizagem de Máquinas. Extração de Características Universidade Federal do Paraná (UFPR) Departamento de Informática (DInf) Aprendizagem de Máquinas Extração de Características David Menotti, Ph.D. http://web.inf.ufpr.br/menotti 1 Objetivos Entender os

Leia mais

Identification of foliar soybean diseases using local descriptors

Identification of foliar soybean diseases using local descriptors Identification of foliar soybean diseases using local descriptors Rillian Diello Lucas Pires, Wesley Eiji Sanches Kanashiro, Wesley Nunes Gonçalves, Bruno Brandoli Machado, Mauro dos Santos de Arruda and

Leia mais

Bag-of-visual-words on orthogonal planes applied to dynamic scene recognition

Bag-of-visual-words on orthogonal planes applied to dynamic scene recognition Bag-of-visual-words on orthogonal planes applied to dynamic scene recognition Wesley Eiji Sanches Kanashiro and Wesley Nunes Gonçalves Faculdade de Computação, Universidade Federal de Mato Grosso do Sul,

Leia mais

SIMPLES: UM DESCRITOR DE CARACTERÍSTICAS LOCAIS RÁPIDO E SIMPLES

SIMPLES: UM DESCRITOR DE CARACTERÍSTICAS LOCAIS RÁPIDO E SIMPLES SIMPLES: UM DESCRITOR DE CARACTERÍSTICAS LOCAIS RÁPIDO E SIMPLES MARCOS CESAR VOLTOLINI, HAE YONG KIM Dept. Eng. Sistemas Eletrônicos, Escola Politécnica, USP Av. Prof. Luciano Gualberto, trav. 3, 158,

Leia mais

Aplicação de Histograma de Gradientes Orientados para detecção de hidrômetros em imagens de fundo complexo

Aplicação de Histograma de Gradientes Orientados para detecção de hidrômetros em imagens de fundo complexo Aplicação de Histograma de Gradientes Orientados para detecção de hidrômetros em imagens de fundo complexo Juliana Patrícia Detroz Professor: André Tavares da Silva Universidade do Estado de Santa Catarina

Leia mais

SIFT - Scale Invariant Feature Transform

SIFT - Scale Invariant Feature Transform SIFT - Scale Invariant Feature Transform Daniel Pinto Coutinho Prof. Ricardo Marroquim 1 Introdução A detecção de pontos de interesse em uma figura é uma tarefa muito comum no campo de processamento de

Leia mais

O reconhecimento facial é dividido em três etapas: i) detecção da face, ii) extração de características e iii) reconhecimento da face.

O reconhecimento facial é dividido em três etapas: i) detecção da face, ii) extração de características e iii) reconhecimento da face. ESTUDO SOBRE MÉTODOS DE RECONHECIMENTO FACIAL EM FOTOGRAFIAS DIGITAIS Ana Elisa SCHMIDT¹, Elvis Cordeiro NOGUEIRA² ¹ Orientadora e docente do IFC-Campus Camboriú; ² Aluno do curso de Bacharelado em Sistemas

Leia mais

Métodos de Extração de Características

Métodos de Extração de Características 1. Introdução Métodos de Extração de Características A Interpretação ou entendimento de uma cena demanda o reconhecimento de seus objetos. Reconhecimento de objetos ou padrões contidos em uma cena -> é

Leia mais

ANÁLISE COMPARATIVA DE DETECTORES DAS CARACTERÍSTICAS LOCAIS DE UMA IMAGEM NA RECUPERAÇÃO DE VÍDEOS

ANÁLISE COMPARATIVA DE DETECTORES DAS CARACTERÍSTICAS LOCAIS DE UMA IMAGEM NA RECUPERAÇÃO DE VÍDEOS ANÁLISE COMPARATIVA DE DETECTORES DAS CARACTERÍSTICAS LOCAIS DE UMA IMAGEM NA RECUPERAÇÃO DE VÍDEOS ISSN: 1984-3151 COMPARATIVE ANALYSIS OF LOCAL FEATURES DETECTORS OF IMAGES IN THE VIDEO RETRIEVAL Juliana

Leia mais

SIFT (Scale-invariant feature transform), SURF (Speeded up robust features)

SIFT (Scale-invariant feature transform), SURF (Speeded up robust features) SIFT (Scale-invariant feature transform), SURF (Speeded up robust features) Scale- and rotation-invariant interest point detector and descriptor. detector (keypoints) descriptor matching Aplicações: Camera

Leia mais

Redução do Gap Semântico em CBIR utilizando Ontologia de Objeto

Redução do Gap Semântico em CBIR utilizando Ontologia de Objeto Redução do Gap Semântico em CBIR utilizando Ontologia de Objeto Autor: Juliana de Fátima Franciscani 1, Orientador: Prof. Dr. Ilmério Reis da Silva 1, Co-Orientadora: Prof a. Dr a. Celia A. Zorzo Barcelos

Leia mais

Identificação de Pontos Perceptualmente Importantes (PIP) em séries temporais de tópicos extraídos de dados textuais

Identificação de Pontos Perceptualmente Importantes (PIP) em séries temporais de tópicos extraídos de dados textuais Universidade de São Paulo Biblioteca Digital da Produção Intelectual - BDPI Departamento de Ciências de Computação - ICMC/SCC Comunicações em Eventos - ICMC/SCC 2015 Identificação de Pontos Perceptualmente

Leia mais

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Representação. David Menotti.

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Representação. David Menotti. Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica Representação David Menotti www.inf.ufpr.br/menotti/ci171-182 Representação Agenda Introdução Extraindo Representações de Imagens

Leia mais

Reconhecimento de Alimentos utilizando Histograma de Cor e SIFT

Reconhecimento de Alimentos utilizando Histograma de Cor e SIFT Reconhecimento de Alimentos utilizando Histograma de Cor e SIFT Daniela S. Costa 1, Polyana B. Costa 1, Geraldo Braz Jr. 2 1 Núcleo de Computaçao Aplicada - Universidade Federal do Maranhão (UFMA) Caixa

Leia mais

Image Descriptors: color

Image Descriptors: color Image Descriptors: color Image Processing scc0251 www.icmc.usp.br/ moacir moacir@icmc.usp.br ICMC/USP São Carlos, SP, Brazil 2011 Moacir Ponti Jr. (ICMCUSP) Image Descriptors: color 2011 1 / 29 Agenda

Leia mais

Análise e conversão de tabloides de. Igor dos Santos Montagner Orientador: Prof. Dr. Roberto Marcondes Cesar Junior. promoções

Análise e conversão de tabloides de. Igor dos Santos Montagner Orientador: Prof. Dr. Roberto Marcondes Cesar Junior. promoções Análise e conversão de tabloides de Igor dos Santos Montagner Orientador: Prof. Dr. Roberto Marcondes Cesar Junior promoções Agenda Problema Objetivo nal Solução proposta Atenção visual e mapa de saliências

Leia mais

Diego Martin Mancini Orientador: Prof. Paulo A. V. de Miranda Instituto de Matemática e Estatística Universidade de São Paulo

Diego Martin Mancini Orientador: Prof. Paulo A. V. de Miranda Instituto de Matemática e Estatística Universidade de São Paulo Estudo de comparação do descritor de imagens coloridas BIC empregando diferentes abordagens de classificação de detecção de bordas: Canny e Operador Laplaciano Diego Martin Mancini Orientador: Prof. Paulo

Leia mais

Extração de características de imagens. Descritores de cor

Extração de características de imagens. Descritores de cor Extração de características de imagens Descritores de cor Descritores de imagens Problema: computar, de forma eficiente, valores que descrevam uma imagem (ou parte dela) Vetores de características (feature

Leia mais

Extração de características utilizando filtros de Gabor aplicado a identificação de defeitos no couro bovino

Extração de características utilizando filtros de Gabor aplicado a identificação de defeitos no couro bovino Extração de características utilizando filtros de Gabor aplicado a identificação de defeitos no couro bovino André Luiz Pasquali 24 de abril de 2006 1 Antecedentes e Justificativa Atualmente o Brasil vem

Leia mais

Índice. Classificação de textos para o ensino de português como segunda língua. Índice. technology from seed

Índice. Classificação de textos para o ensino de português como segunda língua. Índice. technology from seed Classificação de textos para o ensino de português como segunda língua Pedro Santos Curto Conclusões, Contribuições e Trabalho futuro 1 2 Motivação Aplicações e escala da classificação de textos Motivação

Leia mais

DESENVOLVIMENTO DE SISTEMA PARA GERAÇÃO DE MOSAICO DE IMAGENS VISANDO LOCALIZAÇÃO E NAVEGAÇÃO DE ROBÔS MÓVEIS

DESENVOLVIMENTO DE SISTEMA PARA GERAÇÃO DE MOSAICO DE IMAGENS VISANDO LOCALIZAÇÃO E NAVEGAÇÃO DE ROBÔS MÓVEIS DESENVOLVIMENTO DE SISTEMA PARA GERAÇÃO DE MOSAICO DE IMAGENS VISANDO LOCALIZAÇÃO E NAVEGAÇÃO DE ROBÔS MÓVEIS Edson CAVALCANTI Neto (1), Guilherme Costa HOLANDA (1), Antonio Themoteo VARELA (1), André

Leia mais

Person Re-Identification. Autor: Guilherme Zasyeki Machado

Person Re-Identification. Autor: Guilherme Zasyeki Machado Person Re-Identification Autor: Guilherme Zasyeki Machado Sumário - Introdução ao problema - Visão geral ao processo de Re-Identificação - Evolução estado da arte - Datasets disponíveis - Análise estado

Leia mais

SEMINÁRIO DOS ARTIGOS:

SEMINÁRIO DOS ARTIGOS: SEMINÁRIO DOS ARTIGOS: Text Detection and Character Recognition in Scene Images with Unsupervised Feature Learning End-to-End Text Recognition with Convolutional Neural Networks Fernanda Maria Sirlene

Leia mais

Face Descrip+on with Local Binary Pa6erns: Applica+on to Face Recogni+on JULIANO RAMOS LUANN LUNA

Face Descrip+on with Local Binary Pa6erns: Applica+on to Face Recogni+on JULIANO RAMOS LUANN LUNA Face Descrip+on with Local Binary Pa6erns: Applica+on to Face Recogni+on JULIANO RAMOS LUANN LUNA Introdução O ar%go visa criar uma abordagem para o problema de reconhecimento de face: i.e.: Dada uma face,

Leia mais

Análise do Uso de Descritores Locais e Classificadores no Reconhecimento de Cédulas de Real

Análise do Uso de Descritores Locais e Classificadores no Reconhecimento de Cédulas de Real III Escola Regional de Informática do Piauí. Livro Anais - Artigos e Minicursos, v. 1, n. 1, p. 218-223, jun, 2017. www.eripi.com.br/2017 - ISBN: 978-85-7669-395-6 Análise do Uso de Descritores Locais

Leia mais

Autor 1 Orientador: 1. dia de mês de ano

Autor 1 Orientador: 1. dia de mês de ano Título Autor 1 Orientador: 1 1 Laboratório de Sistemas de Computação Universidade Federal de Santa Maria dia de mês de ano Roteiro Introdução Fundamentação Desenvolvimento Resultados Conclusão e Trabalhos

Leia mais

Processamento De Imagem. Descritores de Cor

Processamento De Imagem. Descritores de Cor Processamento De Imagem Descritores de Cor Cores Uma das propriedades mais importantes para visão humana. Muito usada em sistemas de recuperação de imagens, CBIRs. Taxonomia Global A informação de cor

Leia mais

Universidade Católica Dom Bosco

Universidade Católica Dom Bosco Universidade Católica Dom Bosco Curso de Bacharelado em Engenharia de Computação Comparação entre Técnicas de Reconhecimento de Faces para Controle de Acesso a Computadores Vinícius Assis Saueia da Silva

Leia mais

Region Based CNNs. Francisco Calaça Xavier. Programa de pós-graduação em Ciências da Computação Mestrado e Doutorado. Instituto de Informática UFG

Region Based CNNs. Francisco Calaça Xavier. Programa de pós-graduação em Ciências da Computação Mestrado e Doutorado. Instituto de Informática UFG Region Based CNNs Francisco Calaça Xavier Programa de pós-graduação em Ciências da Computação Mestrado e Doutorado Instituto de Informática UFG Prof. Anderson Soares Agenda O problema Estado da arte R-CNN

Leia mais

Máquinas de Vetores de Suporte Aplicadas à Classificação de Defeitos em Couro Bovino

Máquinas de Vetores de Suporte Aplicadas à Classificação de Defeitos em Couro Bovino Máquinas de Vetores de Suporte Aplicadas à Classificação de Defeitos em Couro Bovino Ricardo Cezar Bonfim Rodrigues 24 de abril de 2006 1 Antecedentes e Justificativa Hoje, em diversos processos industriais,

Leia mais

Um Estudo sobre Vetores de Descritores Localmente Agregados para Diagnóstico de Câncer de Mama

Um Estudo sobre Vetores de Descritores Localmente Agregados para Diagnóstico de Câncer de Mama Um Estudo sobre Vetores de Descritores Localmente Agregados para Diagnóstico de Câncer de Mama Ricardo Costa da Silva Marques 1, Geovane Menezes Ramos Neto 1, Geraldo Braz Júnior 1, João Dallyson de Sousa

Leia mais

Visão computacional. Juliana Patrícia Detroz Orientador: André Tavares Silva

Visão computacional. Juliana Patrícia Detroz Orientador: André Tavares Silva Visão computacional Juliana Patrícia Detroz Orientador: André Tavares Silva Visão computacional Tentativa de replicar a habilidade humana da visão através da percepção e entendimento de uma imagem; Fazer

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Horários Aulas Sala 3 CCET [quinta-feira, 8:20 12:00] Atendimento

Leia mais

Bruno de Brito Leite

Bruno de Brito Leite Universidade Federal de Campina Grande UFCG Centro de Engenharia Elétrica e Informática CEEI Coordenação de Pós Graduação em Ciência da Computação COPIN Bruno de Brito Leite Mestrando Sumário Detecção

Leia mais

Classificação Automática de Gêneros Musicais

Classificação Automática de Gêneros Musicais Introdução Método Experimentos Conclusões Utilizando Métodos de Bagging e Boosting Carlos N. Silla Jr. Celso Kaestner Alessandro Koerich Pontifícia Universidade Católica do Paraná Programa de Pós-Graduação

Leia mais

First-person activity recognition. Matheus A. Nerone

First-person activity recognition. Matheus A. Nerone First-person activity recognition Matheus A. Nerone Sumário 1. 2. 3. Introdução a. Contexto b. Problema c. Exemplos de uso d. Dificuldades Trabalhos Relacionados a. Artigo inicial b. Histórico Artigos

Leia mais

Keypoints Reduction Applied to Image Classification Problems

Keypoints Reduction Applied to Image Classification Problems Keypoints Reduction Applied to Image Classification Problems Marcelo Rafael Borth IFPR Instituto Federal do Paraná Umuarama, Brazil marcelo.borth@ifpr.edu.br Wesley Nunes Gonçalves UFMS Universidade Federal

Leia mais

Criação de mosaico usadando o SURF e o matcher FLANN

Criação de mosaico usadando o SURF e o matcher FLANN Criação de mosaico usadando o SURF e o matcher FLANN Felipe Jordão Pinheiro de Andrade Universidade Federal do Maranhão, São Luis, BRA Abstract. O trabalho propoe uma metodologia para a criação de um mosaico

Leia mais

Classificação Hierárquica Multirrótulo Utilizando Redes Neurais Artificiais

Classificação Hierárquica Multirrótulo Utilizando Redes Neurais Artificiais Classificação Hierárquica Multirrótulo Utilizando Redes Neurais Artificiais Ricardo Cerri Instituto de Ciências Matemáticas e de Computação Universidade de São Paulo cerri@icmc.usp.br Roteiro Introdução

Leia mais

Reconhecimento Facial 3D utilizando o Simulated Annealing com as Medidas Surface Interpenetration Measure e M-Estimator Sample Consensus

Reconhecimento Facial 3D utilizando o Simulated Annealing com as Medidas Surface Interpenetration Measure e M-Estimator Sample Consensus Reconhecimento Facial 3D utilizando o Simulated Annealing com as Medidas Surface Interpenetration Measure e M-Estimator Sample Consensus Dissertação de Mestrado em Informática Sídnei Augusto Drovetto Jr.

Leia mais

Processamento de Imagens COS756 / COC603

Processamento de Imagens COS756 / COC603 Processamento de Imagens COS756 / COC603 aula 13 - Transformada de Hough e SIFT Antonio Oliveira Ricardo Marroquim 1 / 41 aula de hoje descritores Transformada de Hough SIFT 2 / 41 transformada de Hough

Leia mais

Um sistema para extração automática de keyframes a partir de fluxos de vídeo direcionado à reconstrução tridimensional de cenários virtuais

Um sistema para extração automática de keyframes a partir de fluxos de vídeo direcionado à reconstrução tridimensional de cenários virtuais Um sistema para extração automática de keyframes a partir de fluxos de vídeo direcionado à reconstrução tridimensional de cenários virtuais Sérgio Carlos Portari Júnior Orientador: Prof. Dr. Antonio Carlos

Leia mais

Descritores de Imagem (introdução)

Descritores de Imagem (introdução) Descritores de Imagem (introdução) André Tavares da Silva andre.silva@udesc.br Roteiro da aula Definição de descritor de imagem Extração de Característica Tipos Geral x Específico Global (cor, textura,

Leia mais

Objetivos. 1. O método desenvolvido usa características de pares de pixeis para fazer estatísticas e formar

Objetivos. 1. O método desenvolvido usa características de pares de pixeis para fazer estatísticas e formar Introdução Comidas podem apresentar deformações e variações em sua forma, além de conter muitos ingredientes, nem todos visíveis; Métodos tradicionais de reconhecimento requerem a detecção de características

Leia mais

Textura. Textura 04/09/2014. Prof. Yandre Costa

Textura. Textura 04/09/2014. Prof. Yandre Costa UNIVERSIDADE ESTADUAL DE MARINGÁ PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO Prof. Yandre Costa - 1 Prof. Yandre Costa Prof. Yandre Costa - 2 é um importante atributo visual presente em imagens,

Leia mais

UNIVERSIDADE ESTADUAL DE MARINGÁ PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO. Prof. Yandr re Costa - 1. Prof. Yandre Costa.

UNIVERSIDADE ESTADUAL DE MARINGÁ PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO. Prof. Yandr re Costa - 1. Prof. Yandre Costa. UNIVERSIDADE ESTADUAL DE MARINGÁ PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO Prof. Yandr re Costa - 1 Textura Prof. Yandre Costa Prof. Yandr re Costa - 2 Textura é um importante atributo visual

Leia mais

Combinando Fatores de Ponderação para Melhorar a

Combinando Fatores de Ponderação para Melhorar a Computer on the Beach 2014 - Artigos Completos 32 Combinando Fatores de Ponderação para Melhorar a Classificação de Textos Frederico P. de Souza 1, Patrick M. Ciarelli 2, Elias de Oliveira 1 1 Departamento

Leia mais

RECONHECIMENTO DE CARACTERES EM IMAGENS COM RUÍDO

RECONHECIMENTO DE CARACTERES EM IMAGENS COM RUÍDO RECONHECIMENTO DE CARACTERES EM IMAGENS COM RUÍDO Fernanda Maria Sirlene Pio SUMARIO Introdução Trabalhos Relacionados Metodologia Experimentos Conclusão Referências 2 INTRODUÇÃO Reconhecimento de Padrões

Leia mais

Método de Balanceamento de Múltiplos Descritores Usando Condições de Contorno para Pesquisas por Similaridade

Método de Balanceamento de Múltiplos Descritores Usando Condições de Contorno para Pesquisas por Similaridade Método de Balanceamento de Múltiplos Descritores Usando Condições de Contorno para Pesquisas por Similaridade Rodrigo Fernandes Barroso, Renato Bueno Departamento de Computação Universidade Federal de

Leia mais

Trabalho Final de Sistemas Inteligentes

Trabalho Final de Sistemas Inteligentes Trabalho Final de Sistemas Inteligentes Rodrigo Kanehisa 2 1 Departamento de Informática Universidade Federal do Maranhão (UFMA) Av. dos Portugueses, 1966 Bacanga - CEP 65080-805 São Luís MA Brasil 2 Universidade

Leia mais

Computação Evolucionária

Computação Evolucionária UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ UTFPR Programa de Pós-Graduação em Engenharia e Informática CPGEI Laboratório de Bioinformática e Inteligência Computacional Câmpus Curitiba (PR) Computação Evolucionária

Leia mais

IN Redes Neurais

IN Redes Neurais IN0997 - Redes Neurais Aluizio Fausto Ribeiro Araújo Universidade Federal de Pernambuco Centro de Informática - CIn Departamento de Sistemas da Computação aluizioa@cin.ufpe.br Conteúdo Objetivos Quem usa

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Aprendizagem de Máquina Segundo semestre de 2018 Francisco Carvalho e Cleber Zanchettin Universidade Federal de Pernambuco - UFPE Centro de Informtica - CIn Objetivos da disciplina

Leia mais

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Extração de Características

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Extração de Características Universidade Federal do Paraná Departamento de Informática Reconhecimento de Padrões Extração de Características Luiz Eduardo S. Oliveira, Ph.D. http://lesoliveira.net Objetivos Entender os conceitos de

Leia mais

Extração de objetos de interesse em imagens digitais utilizando a biblioteca de Visão Computacional OpenCV

Extração de objetos de interesse em imagens digitais utilizando a biblioteca de Visão Computacional OpenCV Extração de objetos de interesse em imagens digitais utilizando a biblioteca de Visão Computacional OpenCV Izadora Aparecida RAMOS 1,3,4 ; Servílio Souza de ASSIS 1,3,4 ; Bruno Alberto Soares OLIVEIRA

Leia mais

Eficácia e Correlação de Descritores Visuais para Recuperação de Imagens de Turismo

Eficácia e Correlação de Descritores Visuais para Recuperação de Imagens de Turismo Eficácia e Correlação de Descritores Visuais para Recuperação de Imagens de Turismo Vinícius Pereira Santana 1 e Rodrigo Tripodi Calumby 1 1 Departamento de Ciências Exatas, Universidade Estadual de Feira

Leia mais

Descritores de Imagens

Descritores de Imagens Descritores de Imagens André Tavares da Silva PPGCA/UDESC Outubro de 2017 André Tavares da Silva (PPGCA/UDESC) Descritores de Imagens Outubro de 2017 1 / 40 Descritores baseados em textura Local Activity

Leia mais

Fast Object Search In Home Environments using Saliency Detection and Color Signature Matching

Fast Object Search In Home Environments using Saliency Detection and Color Signature Matching Fast Object Search In Home Environments using Saliency Detection and Color Signature Matching José Grimaldo Universidade Federal da Bahia Salvador-BA Email: jose.jgrimaldo@gmail.com Deivite Guimarães,

Leia mais

Reconhecimento de texturas utilizando padrão binário local e classificador knn.

Reconhecimento de texturas utilizando padrão binário local e classificador knn. Reconhecimento de texturas utilizando padrão binário local e classificador knn. Vinicius Santos Andrade 1 Resumo. Através de uma imagem é possível obter inúmeras informações. Portanto, é cada vez mais

Leia mais

Visualização de Informação Parte III. Multi-dimensional Visualization: Visual Mining of Text, Images and other Multi-dimensioanl entities.

Visualização de Informação Parte III. Multi-dimensional Visualization: Visual Mining of Text, Images and other Multi-dimensioanl entities. Visualização de Informação Parte III Multi-dimensional Visualization: Visual Mining of Text, Images and other Multi-dimensioanl entities. Rosane Minghim + The team Instituto de Ciências Matemáticas e de

Leia mais

Auto-Fusão na Recuperação de Imagens Baseadas em Conteúdo.

Auto-Fusão na Recuperação de Imagens Baseadas em Conteúdo. Auto-Fusão na Recuperação de Imagens Baseadas em Conteúdo. Severino Jr, Osvaldo IMES - FAFICA osvaldo@fafica.br Gonzaga, Adilson Escola de Engenharia de São Carlos - USP adilson@sc.usp.br Resumo Neste

Leia mais

Profª Ana Lúcia Lima Marreiros Maia Profª Fabiana Cristina Bertoni

Profª Ana Lúcia Lima Marreiros Maia Profª Fabiana Cristina Bertoni Profª Ana Lúcia Lima Marreiros Maia Profª Fabiana Cristina Bertoni Motivação e Objetivos Etapas do Desenvolvimento de um Sistema de Recuperação de Informações (SRI): Pré-processamento; Representação; Extração

Leia mais

Reconhecimento Ótico de Caracteres em Placas Veiculares

Reconhecimento Ótico de Caracteres em Placas Veiculares Universidade Federal De Pernambuco Centro De Informática Graduação Em Engenharia Da Computação 2012.2 Reconhecimento Ótico de Caracteres em Placas Veiculares Proposta de Trabalho de Graduação Aluno Pedro

Leia mais

Um método automático de segmentação de imagens aplicado à análise do marmoreio da carne em plataforma móvel

Um método automático de segmentação de imagens aplicado à análise do marmoreio da carne em plataforma móvel Um método automático de segmentação de imagens aplicado à análise do marmoreio da carne em plataforma móvel Gabriel Fillipe Centini Campos 1, Sylvio Barbon Júnior 1 1 Departamento de Computação Universidade

Leia mais

Recuperação de imagens por conteúdo utilizando Lógica Fuzzy - um estudo de caso sobre imagens faciais

Recuperação de imagens por conteúdo utilizando Lógica Fuzzy - um estudo de caso sobre imagens faciais Recuperação de imagens por conteúdo utilizando Lógica Fuzzy - um estudo de caso sobre imagens faciais Leila Cristina Carneiro Bergamasco; Fátima L.S. Nunes Universidade de São Paulo Escola de Artes, Ciências

Leia mais

Mapeamento de ambientes e processamento visual utilizando Kinect

Mapeamento de ambientes e processamento visual utilizando Kinect Mapeamento de ambientes e processamento visual utilizando Kinect Mário Alberto Cecchi Raduan Bolsista PIBIC/UFRJ Orientador: Adriano Joaquim de Oliveira Cruz, PhD Laboratório de Inteligência Computacional

Leia mais

INFORMAÇÕES DO ACADÊMICO PLANO DE TRABALHO. 1. Justificativa

INFORMAÇÕES DO ACADÊMICO PLANO DE TRABALHO. 1. Justificativa INFORMAÇÕES DO ACADÊMICO Nome: Kleber Padovani de Souza Curso: Engenharia de Computação Semestre: R.A.: Título do plano de trabalho: Extração de atributos da imagem através de momentos de imagem. Nome

Leia mais

Predição de links em uma rede heterogênea baseada em dados geolocalizados e de relacionamentos

Predição de links em uma rede heterogênea baseada em dados geolocalizados e de relacionamentos Universidade Federal de Pernambuco Centro de Informática Graduação em Ciência da Computação Predição de links em uma rede heterogênea baseada em dados geolocalizados e de relacionamentos Proposta de Trabalho

Leia mais

Fusão de Atributos para Segmentação de Couro Bovino

Fusão de Atributos para Segmentação de Couro Bovino Fusão de Atributos para Segmentação de Couro Bovino Lia Nara Balta Quinta. Grupo de Pesquisa em Engenharia e Computação, GPEC Universidade Católica Dom Bosco, UCDB Av. Tamandaré, 6000 - Jardim Seminário

Leia mais

USO DO DETECTOR DE PONTOS DE INTERESSE SIFT PARA LOCALIZAÇÃO DE ALVOS ARTIFICIAIS DE CONTROLE

USO DO DETECTOR DE PONTOS DE INTERESSE SIFT PARA LOCALIZAÇÃO DE ALVOS ARTIFICIAIS DE CONTROLE IV Simpósio Brasileiro de Geomática SBG17 II Jornadas Lusófonas - Ciências e Tecnologias de Informação Geográfica - CTIG17 Presidente Prudente - SP, 24-26 de julho de 17 p. 341-346 USO DO DETECTOR DE PONTOS

Leia mais

Introdução a Visão Computacional. Prof. Dr. Geraldo Braz Junior DEINF - UFMA

Introdução a Visão Computacional. Prof. Dr. Geraldo Braz Junior DEINF - UFMA Introdução a Visão Computacional Prof. Dr. Geraldo Braz Junior DEINF - UFMA O que é Visão Computacional? Você já viu? 2 O que se espera? Visão é sobre entender imagens Coloridas ou em tons de cinza Pequenas

Leia mais

Recuperação de Informação em Bases de Texto

Recuperação de Informação em Bases de Texto Recuperação de Informação em Bases de Texto Mestrado em Engenharia Informática Universidade de Évora 2010/2011 Paulo Quaresma pq@di.uevora.pt http://www.moodle.uevora.pt 1 Objectivos Programa Avaliação

Leia mais

Orientação de Bordas em Imagens Digitais: Abordagem por Análise de Vizinhança Local

Orientação de Bordas em Imagens Digitais: Abordagem por Análise de Vizinhança Local Orientação de Bordas em Imagens Digitais: Abordagem por Análise de Vizinhança Local Inês Aparecida Gasparotto Boaventura DCCE-IBILCE-UNESP Rua Cristovão Colombo, 2265 15054-000, São José do Rio Preto,

Leia mais

DESCRITOR DE TEXTURA BASEADO EM DADOS SIMBÓLICOS

DESCRITOR DE TEXTURA BASEADO EM DADOS SIMBÓLICOS XIV CONGRESSO DE INICIAÇÃO CIENTÍFICA DA UNIVERSIDADE FEDERAL CAMPINA GRANDE DESCRITOR DE TEXTURA BASEADO EM DADOS SIMBÓLICOS Ronaldo Medeiros Pessoa Filho 1 Carlos Wilson Dantas de Almeida 2 RESUMO Na

Leia mais

Comunicação Científica I

Comunicação Científica I Faculdade de Engenharia da Universidade do Porto Programa Doutoral em Engenharia Biomédica 2008/2009 Disciplina: Comunicação Científica I Relatório sobre as actividades de investigação, trabalhos e comunicações

Leia mais

Um Mecanismo de Detecção de Versões de Páginas Web para Melhoria do Desempenho do Algoritmo de PageRank

Um Mecanismo de Detecção de Versões de Páginas Web para Melhoria do Desempenho do Algoritmo de PageRank Um Mecanismo de Detecção de Versões de Páginas Web para Melhoria do Desempenho do Algoritmo de PageRank Glauber Rodrigues da Silva, Renata de Matos Galante Instituto de Informática Universidade Federal

Leia mais

Proposta de Curso LNCC

Proposta de Curso LNCC Proposta de Curso LNCC Professor: Gilson A. Giraldi (D.Sc) Título do Curso: Visualização Científica para Análise de Imagens Médica. Período: Quarto Período de 2001 Objetivos O processamento/visualização

Leia mais

5 ESTUDO DE CASOS 5.1 CATEGORIZAÇÃO

5 ESTUDO DE CASOS 5.1 CATEGORIZAÇÃO 102 5 ESTUDO DE CASOS 5.1 CATEGORIZAÇÃO Conforme detalhado na seção 4.3, foram criados três conjuntos de dados: clientes BT com 382 padrões, clientes comerciais MT com 866 padrões e clientes industriais

Leia mais

Image Descriptors: texture

Image Descriptors: texture Image Descriptors: texture Image Processing scc0251 www.icmc.usp.br/ moacir moacir@icmc.usp.br ICMC/USP São Carlos, SP, Brazil 2011 Moacir Ponti Jr. (ICMCUSP) Image Descriptors: texture 2011 1 / 28 Agenda

Leia mais