NLOOK: Modelo de Atenção Visual Relativamente Insensível a Transformações Afins

Tamanho: px
Começar a partir da página:

Download "NLOOK: Modelo de Atenção Visual Relativamente Insensível a Transformações Afins"

Transcrição

1 NLOOK: Modelo de Atenção Visual Relativamente Insensível a Transformações Afins Milton Roberto Heinen 1 e Paulo Martins Engel 1 1 Instituto de Informática Universidade Federal do Rio Grande do Sul (UFRGS) Caixa Postal 15064, CEP , Porto Alegre-RS, Brasil mrheinen@inf.ufrgs.br, engel@inf.ufrgs.br Abstract. The computational models of visual attention, originally proposed as cognitive models of human attention, nowadays are being used as front-ends in some computational vision systems, but in these kinds of applications the model must be relatively insensitive to affine transformations. In this paper a new visual attention model, called NLOOK, is proposed and validated using several experiments, and the results show that NLOOK is less sensitive to affine transformations than the best known attention model, called NVT. Thus, the proposed model is an excellent tool to be used in computational vision systems. Resumo. Os modelos de atenção visual, originalmente propostos para explicar os mecanismos de atenção biológicos, ultimamente vem sendo utilizados como front-ends em aplicações de visão computacional, porém neste tipo de aplicação o modelo precisa ser relativamente insensível a transformações afins. Neste artigo um novo modelo de atenção visual, chamado de NLOOK, é proposto e validado através de diversos experimentos. Estes experimentos demonstram que o NLOOK é bem menos sensível a transformações afins que o NVT, que é o modelo de atenção visual mais conhecido e utilizado. Assim, o NLOOK é bastante adequado de ser utilizado em aplicações de visão computacional. 1. Introdução A quantidade de informações que chega ao sistema visual dos primatas estimada como sendo da ordem de 10 8 bits por segundo excede em muito a capacidade que o cérebro tem de processá-la e assimilá-la em sua experiência consciente [Itti et al. 1998]. A estratégia utilizada pelos sistemas biológicos para lidar com este excesso de informações é processar de forma detalhada somente algumas partes do campo visual, chamadas de regiões de interesse, e ignorar o restante das informações [Niebur and Koch 1998]. O mecanismo de atenção do seres humanos é influenciado por dois principais tipos de informações: bottom-up ou exógenas (elementos da cena visual que se destacam dos demais) e top-down ou endógenas (informações do córtex cerebral que alteram o foco da atenção). Inspirados nos sistemas de atenção biológicos, é possível desenvolver sistemas de atenção computacionais que sejam capazes de selecionar as regiões de interesse do campo visual a serem completamente processadas, e isto torna possível a análise de cenas complexas em tempo real com recursos limitados de processamento. Embora diversos modelos de atenção visual bottom-up já tenham sido propostos e implementados [Koch and Ullman 1985, Tsotsos et al. 1995, Itti et al. 1998, Orabona et al. 2005,

2 Frintrop 2006], a maioria destes modelos tem como foco principal entender o funcionamento dos mecanismos de atenção dos seres vivos, e como tal têm sido avaliados somente em relação à sua plausibilidade biológica [Draper and Lionelle 2005]. Em um sistema de visão computacional é necessário, entre outras coisas, que o modelo de atenção seja relativamente insensível a transformações afins (rotação, translação, reflexão e escala). Porém, segundo [Draper and Lionelle 2005], o NVT [Itti et al. 1998], que é o modelo de atenção visual mais conhecido e utilizado, é bastante sensível a transformações afins, e portanto não deve ser utilizado em aplicações de visão computacional. Este artigo apresenta um novo modelo de atenção visual, chamado de NLOOK [Heinen and Engel 2008c], que é bem menos sensível a transformações afins que o NVT. Assim, o modelo proposto é uma excelente ferramenta para ser utilizada em tarefas de visão computacional e robótica, como a identificação de objetos e a detecção de landmarks. Este artigo está estruturado da seguinte forma: a Seção 2. descreve o modelo de atenção visual mais conhecido e utilizado, chamado de NVT [Itti et al. 1998]; a Seção 3. descreve o modelo proposto; a Seção 4. descreve os experimentos realizados e os resultados obtidos; e a Seção 5. descreve as conclusões finais e as perspectivas futuras. 2. Trabalhos relacionados O primeiro modelo de atenção visual biologicamente plausível foi proposto originalmente em [Koch and Ullman 1985] e posteriormente aperfeiçoado em [Itti et al. 1998]. Ele é baseado na teoria da integração de feições (Feature Integration Theory FIT) [Treisman and Gelade 1980] e na hipótese de que um mapa de saliências é capaz de fornecer uma estratégia eficiente no controle da atenção utilizando somente informações da própria cena visual (bottom-up) [Itti 2005]. Neste modelo, chamado de NVT, a imagem de entrada é decomposta em três mecanismos de detecção de características pré-atentivas (intensidade, cores e orientações), que operam em paralelo sobre toda a cena visual. Estas três características são posteriormente unidas em um único mapa de saliências, que codifica os estímulos mais importantes da cena visual. Para a criação dos mapas de características, no NVT são utilizadas operações lineares de centro-periferia aplicadas sobre pirâmides gaussianas [Burt et al. 1983] com níveis ϕ [0, 8], onde ϕ = 0 corresponde ao tamanho original da imagem. No modelo de [Itti et al. 1998], as operações lineares de centro-periferia são implementadas através da diferença entre os níveis finos e grosseiros das pirâmides gaussianas, onde o centro corresponde aos níveis c {2, 3, 4} e a periferia aos níveis s = c + δ, com δ {3, 4}. Os mapas resultantes deste processo são então reduzidos para o nível ϕ = 4 (mais grosseiro) e normalizados através do operador de normalização não linear N( ), que intensifica os mapas que possuem poucos picos salientes que se destacam dos demais [Itti et al. 1998], e em seguida estes mapas são combinados em um único mapa de características. Para a criação dos mapas de intensidade I no NVT, inicialmente os canais vermelho (red r), verde (green g) e azul (blue b) são extraídos da imagem colorida original. A partir destes canais é gerada a imagem I = (r + g + b)/3, e sobre esta imagem são aplicadas as operações de centro-periferia. Os mapas de cores C, que codificam a oponência espacial e cromática das cores vermelho/verde (RG) e azul/amarelo (BY ), são criados de forma similar. Inicialmente os canais r, g e b da imagem de entrada são normalizados por I de forma a separar a cor da intensidade. Em seguida quatro canais largamente sintoni-

3 zados R, G, B e Y são criados. A partir destes canais são criadas pirâmides gaussianas e realizadas as operações de centro-periferia, sendo que no centro são utilizadas as pirâmides de uma cor (R ou B) e na periferia as pirâmides de outra (G ou Y ). Para a criação dos mapas de orientação O(θ), são utilizadas pirâmides de Gabor [Greenspan et al. 1994] a partir da imagem I, com as orientações preferenciais θ {0, 45, 90, 135 }. Em seguida estes quatro mapas são unidos em um único mapa de orientações O. Após a construção dos mapas de características, estes são unidos para formarem um único mapa de saliências global S = (N(I) + N(C) + N(O))/3, que codifica os estímulos mais importantes da cena visual. Para a seleção dos focos de atenção (focus of attention FOA), também chamados de fixações, é utilizada uma rede neural do tipo o vencedor leva tudo (winner-take-all WTA). Esta rede neural utiliza neurônios do tipo integra e dispara [Liu and Wang 2001] com forte inibição global, e um mecanismo de inibição de retorno (inhibition of return IOR) [Klein 2000] evita que o foco de atenção (focus of attention FOA) fique sempre preso ao mesmo objeto. Embora este modelo de atenção seja bastante conhecido e biologicamente plausível, segundo [Draper and Lionelle 2005] ele não é muito adequado de ser utilizado em aplicações de visão computacional, pois é muito sensível a transformações afins (reflexão, rotação, translação e escala) na imagem original. Assim, optou-se pela criação de um novo modelo de atenção visual que fosse menos sensível a transformações afins. Este modelo é descrito em detalhes na próxima seção. 3. Modelo proposto A Figura 1 mostra a arquitetura geral do modelo proposto neste artigo, chamado de NLOOK 1 [Heinen and Engel 2008b, Heinen and Engel 2008c, Heinen and Engel 2008a, Heinen and Engel 2009], que é inspirado nos conceitos de scale-space (espaço-escala) [Witkin 1983], também utilizados por Lowe nos descritores SIFT (Scale Invariant Feature Transform) [Lowe 2004]. Ou seja, diferentemente de outros modelos de atenção visual, o NLOOK utiliza scale-spaces ao invés de apenas pirâmides gaussianas para as operações de centro-periferia, o que torna o modelo proposto menos sensível a transformações afins que os demais. Além disso, o modelo proposto consegue selecionar a escala aproximada dos focos de atenção. Figura 1. Arquitetura do modelo proposto Para a criação de um scale-space, a imagem de entrada é inicialmente sub-amostrada em diversos oitavos, e as imagens iniciais de cada oitavo correspondem a uma pi- 1 NLOOK

4 râmide gaussiana, ou seja, cada oitavo possui metade do tamanho de seu antecessor e o oitavo 0 corresponde à imagem original. Em seguida são criadas diversas escalas para cada oitavo através da convolução sucessiva das imagens iniciais com kernels gaussianos. Por último, as diferenças de gaussianas (DoG) são obtidas através da subtração absoluta das escalas adjacentes de cada oitavo. A Figura 2 ilustra este processo [Lowe 2004]. Figura 2. Diferença de gaussianas utilizando scale-spaces O modelo proposto neste artigo utiliza o número máximo possível de oitavos, além do qual a imagem inicial deste oitavo seria menor que os kernels gaussianos. Isto corresponde a cinco oitavos para uma imagem de pixels e seis oitavos para uma imagem de pixels. Segundo [Lowe 2004], o número ideal de escalas por oitavo a ser utilizado é três. Assim, os kernels gaussianos utilizados no NLOOK para as escalas 0, 1 e 2 possuem desvios de , e , respectivamente. Estes são os mesmos valores utilizados nos descritores SIFT de Lowe [Lowe 2004]. Para a criação dos mapas de intensidade, a imagem original é convertida para uma imagem em tons de cinza I, e as diferenças de gaussianas são geradas para esta imagem utilizando scale-spaces. Assim, para uma imagem típica de pixels são criadas 12 diferenças de gaussianas (duas por oitavo). Em seguida cada uma destas diferenças de gaussianas são normalizadas pela subtração da média e divisão do resultado pelo desvio padrão. Diferentemente do NVT, no NLOOK os diferentes oitavos e escalas não são unidos em um único mapa, ou seja, todas as DoGs dos mapas de características são preservadas. Para a criação dos mapas de cores, inicialmente são gerados quatro scale-spaces para os canais de cores largamente sintonizados R (vermelho), G (verde), B (azul) e Y (amarelo). A criação destes canais é descrita de forma detalhada em [Itti et al. 1998]. Em seguida são geradas as diferenças de gaussianas entre os diferentes canais, ou seja, para os mapas RG as subtrações absolutas ocorrem entre os canais R 0 B 1 e R 1 B 2 de cada oitavo (onde 0, 1 e 2 são as escalas), e para os mapas BY ocorrem entre os canais B 0 Y 1 e B 1 Y 2. Assim, são criados dois scale-spaces de cores: RG e BY. Para a criação dos mapas de orientação são utilizados filtros de Gabor [Daugman 1988]. A criação destes mapas é semelhante a dos mapas de intensidade, porém antes da convolução com os kernels gaussianos de cada escala a imagem inicial de cada oitavo é convolucionada com os filtros Gabor. Assim como no NVT, no modelo proposto são utilizadas quatro orientações preferenciais θ {0, 45, 90, 135 }, ou seja, o modelo possui quatro scale-spaces de orientação. As DoGs destes quatro scale-spaces são então normalizadas e somadas, dando origem assim a um único scale-space de orientações.

5 Após a criação dos scale-spaces de características, estes são normalizados e somados em um único scale-space de saliências, que possui diversas DoGs (12 para uma imagem pixels). Estas DoGs são então redimensionadas para a escala 0 (tamanho original da imagem) e somadas, formando assim um único mapa de saliências. Ao contrário do NVT, no qual o mapa de saliências possui escala 4 (mais grosseira), no NLOOK optou-se por expandir as DoGs para a escala 0 para que não houvesse perda de informações. Esta técnica também é adotada em [Frintrop 2006]. A função do mapa de saliências único é servir como um resumo do scale-space de saliências, permitindo assim o uso de um mecanismo de inibição de retorno (IOR) único. Após a criação do mapa de saliências único, este é percorrido pelo foco de atenção da seguinte forma: inicialmente o ponto mais saliente deste mapa é encontrado, e o scale-space de saliências é então analisado para que seja descoberto o oitavo/escala que mais contribuiu para a saliência deste ponto. Em caso de empate é utilizado o menor (mais fino) oitavo/escala. O mecanismo de inibição de retorno, que possui o formato de uma gaussiana invertida, é então aplicado sobre o mapa de saliências único, sendo que o diâmetro deste depende do oitavo/escala mais relevante para o FOA atual, isto é, quanto maior o oitavo/escala (mais grosseiro), maior o diâmetro do IOR. Figura 3. Imagens utilizadas nos experimentos 4. Experimentos realizados Nesta seção são descritos os experimentos realizados visando verificar a sensibilidade do modelo proposto em relação às transformações afins, bem como comparar o seu desempenho com o do NVT. Para isto, foram selecionadas 15 imagens de pixels, mostradas na Figura 3, e sobre estas foram aplicadas as seguintes transformações: Reflexões vertical e horizontal; Rotações de 45 a 315, em intervalos de 45 ; Translação vertical e horizontal de 1, 4, 9 e 16 pixels; Alteração de escala: fatores 1.2, 1.1, 0.9 e 0.8. Totalizando 25 transformações distintas para cada imagem. Um modelo de atenção insensível a transformações afins deverá encontrar as mesmas fixações nas imagens originais e

6 transformadas estas apenas estarão deslocadas de acordo com a transformação aplicada. Para evitar que parte das informações fossem perdidas, cada uma das imagens originais foi acrescida de bordas cinzentas, e a fronteira entre a imagem original e as bordas foi levemente desfocada para evitar que esta região ficasse muito saliente. O tamanho das imagens com bordas é de pixels, e assim foram utilizados 6 oitavos no NLOOK. Para avaliar a performance dos dois modelos de atenção em relação às transformações aplicadas, foram utilizadas as seguintes medidas de desempenho (adaptadas de [Draper and Lionelle 2005]): taxa de erros grosseiros (gross errors GE) e deslocamento médio (mean drift MD). A taxa de erros grosseiros mede o percentual de fixações da imagem original que não são encontradas na imagem transformada, aplicando-se as devidas transformações nas posições dos FOAs originais e levando-se em conta uma margem de erro de 18 pixels (a mesma usada em [Draper and Lionelle 2005]). Já o deslocamento médio mede a distância média em pixels entre a posição desejada para as fixações, que é a posição do FOA na imagem original deslocada de acordo com a transformação aplicada, em relação à posição das fixações obtidas na imagem transformada, ou seja: MD = 1 /N N n=1 D(F d(n), F o(n)) (1) onde N é o número de FOAs utilizado (10 nos experimentos realizados), F d(n) é a posição desejada do FOA n, F o(n) é a posição obtida do FOA n na imagem transformada, e D( ) é a distância euclidiana entre F d(n) e F o(n). A Tabela 1 mostra a média dos resultados obtidos com estas imagens em cada dos modelos de atenção analisados. A primeira coluna descreve a transformação aplicada. As demais colunas trazem a média dos valores do deslocamento médio (MD) e dos erros grosseiros (GE) sobre todas as 15 imagens. Os experimentos da Tabela 1 demonstram que o NVT é bastante sensível a transformações afins, não sendo adequado para ser utilizado em aplicações de visão computacional. Já o NLOOK apresentou resultados melhores que o NVT, ou seja, ele apresenta um sensibilidade a transformações afins muito menor que o NVT. A Figura 4 mostra o desempenho dos dois modelos de atenção utilizando uma imagem original e sua respectiva versão rotacionada em 45 (parte das bordas foi retirada para melhorar a visualização). Percebe-se que os FOAs selecionados pelo NLOOK, levando-se em conta as transformações aplicadas, foram os mesmos em ambas as versões da imagem (original e rotacionada), ou seja, o NLOOK se mostrou insensível à transformação aplicada. Já o NVT selecionou FOAs diferentes para cada versão da imagem. (a) Original NVT (b) Rot. 45 NVT (c) Original NLOOK (d) Rot. 45 NLOOK Figura 4. Comparação visual dos dois modelos de atenção

7 Tabela 1. Resultados obtidos NVT NLOOK Transformação MD GE MD GE Reflexão vertical 123, ,0000% 10,1914 0,6667% Reflexão horizontal 119, ,0000% 1,5288 0,0000% Rotação , ,6667% 13,9553 2,0000% Rotação , ,3333% 2,0000 0,0000% Rotação , ,6667% 18,6985 4,0000% Rotação , ,0000% 3,5418 0,6667% Rotação , ,3333% 13,9964 4,0000% Rotação , ,3333% 2,0016 0,0000% Rotação , ,3333% 12,4510 3,3333% Translação vertical 1 pixels 42,8538 4,0000% 3,1510 0,0000% Translação vertical 4 pixels 81, ,0000% 0,0133 0,0000% Translação vertical 9 pixels 84,2279 9,3333% 3,1443 0,0000% Translação vertical 16 pixels 79, ,6667% 2,4757 0,0000% Translação horizontal 1 pixels 41,9955 3,3333% 4,4449 0,0000% Translação horizontal 4 pixels 84,4627 7,3333% 0,0067 0,0000% Translação horizontal 9 pixels 97,6045 6,6667% 4,4316 0,0000% Translação horizontal 16 pixels 88,4299 8,0000% 0,0067 0,0000% Alteração de escala fator 1,2 122, ,0000% 84, ,6667% Alteração de escala fator 1,1 121, ,6667% 54,3286 9,3333% Alteração de escala fator 0,9 126, ,6667% 60,7751 8,6667% Alteração de escala fator 0,8 125, ,3333% 91, ,6667% Média 108, ,3333% 24,8051 4,8533% Desvio padrão 27, ,8228% 36,2401 8,4097% 5. Conclusões e perspectivas Este artigo apresentou um novo modelo de atenção visual, chamado de NLOOK, desenvolvido para ser utilizado em aplicações de visão computacional e robótica. Este modelo é bem menos sensível às transformações afins que o modelo de atenção mais conhecido e utilizado, chamado de NVT, e assim é mais adequado de ser utilizado em aplicações de visão computacional. As perspectivas futuras incluem a utilização de informações topdown no processo de elaboração dos mapas de características, bem como a utilização do modelo proposto em aplicações de visão computacional como a identificação de objetos. Agradecimentos Agradecemos ao apoio do CNPq que tornou possível a realização deste trabalho. Referências Burt, P. J., Hong, T., and Adelson, E. H. (1983). The laplacian pyramid as a compact image code. IEEE Trans. Communications, 31(4): Daugman, J. G. (1988). Complete discrete 2-d gabor transforms by neural networs for image analysis and compression. IEEE Trans. Acoustics, Speech, and Signal Processing, 36(7):

8 Draper, B. A. and Lionelle, A. (2005). Evaluation of selective attention under similarity transformations. Computer Vision and Image Understanding, 100: Frintrop, S. (2006). VOCUS: A Visual Attention System for Object Detection and Goaldirected Search. PhD thesis, Rheinische Friedrich-Wilhelms-Univ. Bonn, Germany. Greenspan, S., Belongie, S., Goodman, R., Perona, P., Rakshit, S., and Anderson, C. H. (1994). Overcomplete steerable pyramid filters and rotation invariance. In Proc. IEEE Computer Vision and Pattern Recognition (CVPR), pages , Seattle, WA. Heinen, M. R. and Engel, P. M. (2008a). Avaliação de modelos de atenção visual em relação a transformações afins. In Proc. IV Workshop de Visão Computacional (WVC 2008), Bauru, SP. IEEE press. Heinen, M. R. and Engel, P. M. (2008b). Modelo de atenção visual seletiva para aplicações em tempo real. In Proc. IV Workshop on MSc Dissertation and PhD Thesis in Artificial Intelligence (WTDIA 2008), LNCS, Salvador, BH. Springer-Verlag. Heinen, M. R. and Engel, P. M. (2008c). Visual selective attention model for robot vision. In Proc. 5th IEEE Latin American Robotics Symposium (LARS 08), Salvador, BH, Brazil. IEEE press. Heinen, M. R. and Engel, P. M. (2009). Evaluation of visual attention models under 2d similarity transformations. In Proc. 24th Annual ACM Symposium on Applied Computing (SAC 09), Honolulu, Hawaii, USA. ACM press. To appear. Itti, L. (2005). Models of Bottom-Up Attention and Saliency, pages Neurobiology of Attention. Elsevier Press, San Diego, CA. Itti, L., Koch, C., and Niebur, E. (1998). A model of saliency-based visual attention for rapid scene analysis. IEEE Trans. Pattern Analysis and Machine Intell., 20: Klein, R. M. (2000). Inhibition of return. Trends in Cognitive Sciences, 4(4): Koch, C. and Ullman, S. (1985). Shifts in selective visual attention: Toward the underlying neural circuitry. Human Neurobiology, 4(4): Liu, Y.-H. and Wang, X.-J. (2001). Spike-frequency adaptation of a generalized leaky integrate-and-fire model neuron. Journal of Computational Neuroscience, 10: Lowe, D. G. (2004). Distinctive image features from scale-invariant keypoints. Int. Journal of Computer Vision, 60(2): Niebur, E. and Koch, C. (1998). Computational architectures for attention, pages The Attentive Brain. MIT Press, Cambridge, MA. Orabona, F., Metta, G., and Sandini, G. (2005). Object-based visual attention: a model for a behaving robot. In Proc. 3rd Int. Workshop on Attention and Performance in Computational Vision (WAPCV 05), San Diego, CA. Treisman, A. M. and Gelade, G. (1980). A feature-integration theory of attention. Cognitive Psychology, 12: Tsotsos, J. K., Culhane, S. M., Wai, W. Y. K., Lai, Y., Davis, N., and Nuflo, F. (1995). Modeling visual attention via selective tuning. Artificial Intelligence, 78(1-2): Witkin, A. P. (1983). Scale-space filtering. In Proc. Int. Joint Conf. Artificial Intelligence, pages , Karlsruhe, Germany.

Avaliação de Modelos de Atenção Visual em Relação a Transformações Afins

Avaliação de Modelos de Atenção Visual em Relação a Transformações Afins Avaliação de Modelos de Atenção Visual em Relação a Transformações Afins Milton Roberto Heinen e Paulo Martins Engel UFRGS Instituto de Informática CEP 91501-970, Porto Alegre, RS mrheinen@inf.ufrgs.br,

Leia mais

Anais do IX Congresso Brasileiro de Redes Neurais / Inteligência Computacional (IX CBRN) CATEGORIZAÇÃO DE OBJETOS UTILIZANDO ATENÇÃO VISUAL

Anais do IX Congresso Brasileiro de Redes Neurais / Inteligência Computacional (IX CBRN) CATEGORIZAÇÃO DE OBJETOS UTILIZANDO ATENÇÃO VISUAL CATEGORIZAÇÃO DE OBJETOS UTILIZANDO ATENÇÃO VISUAL MILTON ROBERTO HEINEN, PAULO MARTINS ENGEL Instituto de Informática, Universidade Federal do Rio Grande do Sul (UFRGS) Caixa Postal 15064, 91501-970 Porto

Leia mais

Modelo de Atenção Visual Seletiva

Modelo de Atenção Visual Seletiva Modelo de Atenção Visual Seletiva Milton Roberto Heinen 1 e Paulo Martins Engel 1 1 Instituto de Informática Universidade Federal do Rio Grande do Sul (UFRGS) Caixa Postal 15064 CEP 91501-970 Porto Alegre

Leia mais

Modelo de Atenção Visual Seletiva para Aplicações em Tempo Real

Modelo de Atenção Visual Seletiva para Aplicações em Tempo Real Modelo de Atenção Visual Seletiva para Aplicações em Tempo Real Milton Roberto Heinen 1 e Paulo Martins Engel 1 Universidade Federal do Rio Grande do Sul Instituto de Informática Caixa Postal 15064, CEP

Leia mais

Descritores de Imagens

Descritores de Imagens Descritores de Imagens André Tavares da Silva PPGCA/UDESC Outubro de 2017 André Tavares da Silva (PPGCA/UDESC) Descritores de Imagens Outubro de 2017 1 / 18 Descritores Locais e Frameworks SIFT SURF Viola-Jones

Leia mais

Face Recognition using RGB-D Images

Face Recognition using RGB-D Images Face Recognition using RGB-D Images Helder C. R. de Oliveira N.USP: 7122065 Polyana Nunes N.USP: 9043220 Sobre o Artigo Publication: 2013 IEEE Sixth International Conference Author(s) Goswami, G. (Índia

Leia mais

Descritores de Imagem

Descritores de Imagem Descritores de Imagem André Tavares da Silva 31 de março de 2014 1 Descritores de imagem (continuação) 1.1 Frameworks de detecção de objetos SIFT (scale-invariant features transform) (Lowe, 1999) SIFT

Leia mais

Sistema de Reconhecimento de Logotipos

Sistema de Reconhecimento de Logotipos Sistema de Reconhecimento de Logotipos Fellipe Duarte, Saulo T. Oliveira {duartefellipe,sto}@cos.ufrj.br Relatório Técnico, Introdução ao Processamento de Imagens Programa de Engenharia de Sistemas e Computação

Leia mais

Igor dos Santos Montagner Orientador: Roberto Marcondes Cesar Junior 20/09/2010

Igor dos Santos Montagner Orientador: Roberto Marcondes Cesar Junior 20/09/2010 Análise e conversão de tablóides de promoções Igor dos Santos Montagner Orientador: Roberto Marcondes Cesar Junior 20/09/2010 1 1 Introdução Com os avanços na área de computação e a demanda crescente por

Leia mais

SIFT - Scale Invariant Feature Transform

SIFT - Scale Invariant Feature Transform SIFT - Scale Invariant Feature Transform Daniel Pinto Coutinho Prof. Ricardo Marroquim 1 Introdução A detecção de pontos de interesse em uma figura é uma tarefa muito comum no campo de processamento de

Leia mais

Análise e conversão de tabloides de. Igor dos Santos Montagner Orientador: Prof. Dr. Roberto Marcondes Cesar Junior. promoções

Análise e conversão de tabloides de. Igor dos Santos Montagner Orientador: Prof. Dr. Roberto Marcondes Cesar Junior. promoções Análise e conversão de tabloides de Igor dos Santos Montagner Orientador: Prof. Dr. Roberto Marcondes Cesar Junior promoções Agenda Problema Objetivo nal Solução proposta Atenção visual e mapa de saliências

Leia mais

RECONHECIMENTO DE ÍRIS EM AMBIENTES NÃO COOPERATIVOS UTILIZANDO WAVELETS E GABOR 2D

RECONHECIMENTO DE ÍRIS EM AMBIENTES NÃO COOPERATIVOS UTILIZANDO WAVELETS E GABOR 2D RECONHECIMENTO DE ÍRIS EM AMBIENTES NÃO COOPERATIVOS UTILIZANDO WAVELETS E GABOR 2D Fernanda Maria Sirlene Pio SUMÁRIO 1. Introdução 2. Trabalhos relacionados 3. Metodologia 1. Segmentação 2. Normalização

Leia mais

AVALIAÇÃO QUALITATIVA DE DETECÇÃO DE BORDAS EM IMAGENS DE RADIOGRAFIA PERIAPICAIS

AVALIAÇÃO QUALITATIVA DE DETECÇÃO DE BORDAS EM IMAGENS DE RADIOGRAFIA PERIAPICAIS AVALIAÇÃO QUALITATIVA DE DETECÇÃO DE BORDAS EM IMAGENS DE RADIOGRAFIA PERIAPICAIS Hedlund Erik Martins Távora 1, John Hebert Da Silva Felix 2, Darleison Rodrigues Barros Filho 3, Fausta Joaquim Faustino

Leia mais

T4 Processamento de Imagem

T4 Processamento de Imagem T4 Processamento de Imagem Proc. Sinal e Imagem Mestrado em Informática Médica Hélder Filipe Pinto de Oliveira Resumo 1. Manipulação ponto a ponto 2. Conetividade 3. Filtros espaciais 4. Extração de estruturas

Leia mais

Aprendizagem de Máquinas. Extração de Características

Aprendizagem de Máquinas. Extração de Características Universidade Federal do Paraná (UFPR) Departamento de Informática (DInf) Aprendizagem de Máquinas Extração de Características David Menotti, Ph.D. http://web.inf.ufpr.br/menotti 1 Objetivos Entender os

Leia mais

Descritores de Imagens

Descritores de Imagens Descritores de Imagens André Tavares da Silva PPGCA/UDESC Outubro de 2017 André Tavares da Silva (PPGCA/UDESC) Descritores de Imagens Outubro de 2017 1 / 17 Introdução Excelentes pesquisas sobre descritores

Leia mais

Textura. Textura 04/09/2014. Prof. Yandre Costa

Textura. Textura 04/09/2014. Prof. Yandre Costa UNIVERSIDADE ESTADUAL DE MARINGÁ PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO Prof. Yandre Costa - 1 Prof. Yandre Costa Prof. Yandre Costa - 2 é um importante atributo visual presente em imagens,

Leia mais

Image Descriptors: local features

Image Descriptors: local features Image Descriptors: local features Image Processing scc0251 www.icmc.usp.br/ moacir moacir@icmc.usp.br ICMC/USP São Carlos, SP, Brazil 2011 Moacir Ponti Jr. (ICMCUSP) Image Descriptors: local features 2011

Leia mais

Processamento de Imagens COS756 / COC603

Processamento de Imagens COS756 / COC603 Processamento de Imagens COS756 / COC603 aula 13 - Transformada de Hough e SIFT Antonio Oliveira Ricardo Marroquim 1 / 41 aula de hoje descritores Transformada de Hough SIFT 2 / 41 transformada de Hough

Leia mais

UNIVERSIDADE ESTADUAL DE MARINGÁ PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO. Prof. Yandr re Costa - 1. Prof. Yandre Costa.

UNIVERSIDADE ESTADUAL DE MARINGÁ PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO. Prof. Yandr re Costa - 1. Prof. Yandre Costa. UNIVERSIDADE ESTADUAL DE MARINGÁ PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO Prof. Yandr re Costa - 1 Textura Prof. Yandre Costa Prof. Yandr re Costa - 2 Textura é um importante atributo visual

Leia mais

SEMINÁRIO DOS ARTIGOS:

SEMINÁRIO DOS ARTIGOS: SEMINÁRIO DOS ARTIGOS: Text Detection and Character Recognition in Scene Images with Unsupervised Feature Learning End-to-End Text Recognition with Convolutional Neural Networks Fernanda Maria Sirlene

Leia mais

Anotador automático de placas de publicidade em vídeos esportivos

Anotador automático de placas de publicidade em vídeos esportivos MAC0499 - Trabalho de Formatura Supervisionado Professor: Carlos Eduardo Ferreira Universidade de São Paulo Instituto de Matemática e Estatística Aluno: Ricardo Augusto Fernandes Orientador: Prof. Dr.

Leia mais

Aula 7 - Representação e Descrição de Estruturas Bi-dimensionais. Prof. Adilson Gonzaga

Aula 7 - Representação e Descrição de Estruturas Bi-dimensionais. Prof. Adilson Gonzaga Aula 7 - Representação e Descrição de Estruturas Bi-dimensionais Prof. Adilson Gonzaga 1 Introdução Objetos ou Segmentos são representados como uma coleção de pixels em uma imagem. Para o reconhecimento

Leia mais

DESENVOLVIMENTO DE SISTEMA PARA GERAÇÃO DE MOSAICO DE IMAGENS VISANDO LOCALIZAÇÃO E NAVEGAÇÃO DE ROBÔS MÓVEIS

DESENVOLVIMENTO DE SISTEMA PARA GERAÇÃO DE MOSAICO DE IMAGENS VISANDO LOCALIZAÇÃO E NAVEGAÇÃO DE ROBÔS MÓVEIS DESENVOLVIMENTO DE SISTEMA PARA GERAÇÃO DE MOSAICO DE IMAGENS VISANDO LOCALIZAÇÃO E NAVEGAÇÃO DE ROBÔS MÓVEIS Edson CAVALCANTI Neto (1), Guilherme Costa HOLANDA (1), Antonio Themoteo VARELA (1), André

Leia mais

Métodos de Extração de Características

Métodos de Extração de Características 1. Introdução Métodos de Extração de Características A Interpretação ou entendimento de uma cena demanda o reconhecimento de seus objetos. Reconhecimento de objetos ou padrões contidos em uma cena -> é

Leia mais

2 SIFT (Scale Invariant Feature Transform)

2 SIFT (Scale Invariant Feature Transform) SIFT (Scale Invariant Feature Transform) O SIFT é um algoritmo de visão computacional proposto e publicado pelo pesquisador David Lowe (Lowe, 1999), professor do departamento de Ciência da Computação na

Leia mais

MouseCam: aplicação de controle do mouse via câmera

MouseCam: aplicação de controle do mouse via câmera MouseCam: aplicação de controle do mouse via câmera Introdução ao Processamento de Imagens COS756 PESC/COPPE/UFRJ 2013 1 Renan Garrot garrot@cos.ufrj.br 1. Introdução O processo de tracking por vídeo consiste

Leia mais

Orientação de Bordas em Imagens Digitais: Abordagem por Análise de Vizinhança Local

Orientação de Bordas em Imagens Digitais: Abordagem por Análise de Vizinhança Local Orientação de Bordas em Imagens Digitais: Abordagem por Análise de Vizinhança Local Inês Aparecida Gasparotto Boaventura DCCE-IBILCE-UNESP Rua Cristovão Colombo, 2265 15054-000, São José do Rio Preto,

Leia mais

IDENTIFICAÇÃO DE MARCADORES DE PAVIMENTAÇÃO NA ORIENTAÇÃO DE CEGOS. André Zuconelli 1 ; Manassés Ribeiro 2

IDENTIFICAÇÃO DE MARCADORES DE PAVIMENTAÇÃO NA ORIENTAÇÃO DE CEGOS. André Zuconelli 1 ; Manassés Ribeiro 2 IDENTIFICAÇÃO DE MARCADORES DE PAVIMENTAÇÃO NA ORIENTAÇÃO DE CEGOS André Zuconelli 1 ; Manassés Ribeiro 2 INTRODUÇÃO As tecnologias assistivas têm a finalidade de auxiliar pessoas com deficiência a alcançar

Leia mais

Image Descriptors: color

Image Descriptors: color Image Descriptors: color Image Processing scc0251 www.icmc.usp.br/ moacir moacir@icmc.usp.br ICMC/USP São Carlos, SP, Brazil 2011 Moacir Ponti Jr. (ICMCUSP) Image Descriptors: color 2011 1 / 29 Agenda

Leia mais

Ana Paula Abrantes de Castro 1,2 José Demisio Simões da Silva 2 Felipe Leonardo Lobo Medeiros 1,2 Elcio Hideiti Shiguemori 1

Ana Paula Abrantes de Castro 1,2 José Demisio Simões da Silva 2 Felipe Leonardo Lobo Medeiros 1,2 Elcio Hideiti Shiguemori 1 Restauração de Imagens e detecção automática de características aplicados à Navegação Aérea Autônoma Ana Paula Abrantes de Castro 1,2 José Demisio Simões da Silva 2 Felipe Leonardo Lobo Medeiros 1,2 Elcio

Leia mais

Reconhecimento de Instâncias (parte 2)

Reconhecimento de Instâncias (parte 2) Reconhecimento de Instâncias (parte 2) Rafael Galvão de Mesquita rgm@cin.ufpe.br Carlos Alexandre Mello cabm@cin.ufpe.br SURF Speeded-Up Robust Features [3] Computer Vision and Image Understanding, 2004

Leia mais

METODOLOGIA PARA A QUANTIZAÇÃO DE CORES PELO MÉTODO SMCb: INTRODUÇÃO E EXEMPLOS DE RESULTADOS

METODOLOGIA PARA A QUANTIZAÇÃO DE CORES PELO MÉTODO SMCb: INTRODUÇÃO E EXEMPLOS DE RESULTADOS METODOLOGIA PARA A QUANTIZAÇÃO DE CORES PELO MÉTODO SMCb: INTRODUÇÃO E EXEMPLOS DE RESULTADOS Marcelo Zaniboni 1, Osvaldo Severino Junior 2 1: Universitário do curso de Ciência da Computação, Faculdade

Leia mais

Extração de atributos usando o método LBP - Local Binary Pattern

Extração de atributos usando o método LBP - Local Binary Pattern Extração de atributos usando o método LBP - Local Binary Pattern Lia Nara Balta Quinta. 2 de maio de 2006 1 Antecedentes e Justificativa O Brasil possui, atualmente, um grande rebanho bovino, porém em

Leia mais

Face Detection. Image Processing scc moacir ICMC/USP São Carlos, SP, Brazil

Face Detection. Image Processing scc moacir ICMC/USP São Carlos, SP, Brazil Face Detection Image Processing scc0251 www.icmc.usp.br/ moacir moacir@icmc.usp.br ICMC/USP São Carlos, SP, Brazil 2011 Moacir Ponti Jr. (ICMCUSP) Face Detection 2011 1 / 24 Agenda 1 Detectando faces 2

Leia mais

T4.1 Processamento de Imagem

T4.1 Processamento de Imagem T4.1 Processamento de Imagem Proc. Sinal e Imagem Mestrado em Informática Médica Miguel Tavares Coimbra Resumo 1. Manipulação ponto a ponto 2. Filtros espaciais 3. Extracção de estruturas geométricas 4.

Leia mais

Capítulo III Processamento de Imagem

Capítulo III Processamento de Imagem Capítulo III Processamento de Imagem Proc. Sinal e Imagem Mestrado em Informática Médica Miguel Tavares Coimbra Resumo 1. Manipulação ponto a ponto 2. Filtros espaciais 3. Extracção de estruturas geométricas

Leia mais

FILTROS ESPACIAIS PASSA-BAIXA

FILTROS ESPACIAIS PASSA-BAIXA UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL PROGRAMA DE PÓS-GRADUAÇÃO EM COMPUTAÇÃO CMP65 - INTRODUÇÃO AO PROCESSAMENTO DE IMAGENS PROFESSOR JACOB SCARCHANSKI FILTROS ESPACIAIS PASSA-BAIXA POR DANIEL NEHME

Leia mais

Universidade Federal de Pernambuco

Universidade Federal de Pernambuco Universidade Federal de Pernambuco Graduação em Engenharia da Computação Centro de Informática 2 0 1 2. 2 PROPOSTA DE TRABALHO DE GRADUAÇÃO Aluno Arthur de Lima Padilha {alp4@cin.ufpe.br} Orientadora Veronica

Leia mais

Video Quality Assessment in Java

Video Quality Assessment in Java Video Quality Assessment in Java Pós-graduação strictu sensu em Ciência da Computação PROCESSAMENTO DE IMAGENS, Prof. Tsang Ing Ren Estêvão Monteiro Ricardo Scholz Junho de 2014 Introdução Fidelidade de

Leia mais

Classificação de Padrões por Blocos em Imagens Não Segmentadas de Tomografia Computadorizada

Classificação de Padrões por Blocos em Imagens Não Segmentadas de Tomografia Computadorizada Classificação de Padrões por Blocos em Imagens Não Segmentadas de Tomografia Computadorizada Aline Dartora Prof. David Menotti Departamento de Informática Universidade Federal do Paraná (UFPR) 23 de outubro

Leia mais

Feature Description (SIFT + SURF) Prof. Dr. Geraldo Braz Junior

Feature Description (SIFT + SURF) Prof. Dr. Geraldo Braz Junior Feature Description (SIFT + SURF) Prof. Dr. Geraldo Braz Junior Feature Detection 1. Encontre um conjunto de keypoints 2. Defina uma região ao redor do keypoint 3. Normalize a região 4. Extraia caracterísfcas

Leia mais

Aprendizado e Controle de Robôs Móveis Autônomos Utilizando Atenção Visual

Aprendizado e Controle de Robôs Móveis Autônomos Utilizando Atenção Visual Aprendizado e Controle de Robôs Móveis Autônomos Utilizando Atenção Visual Milton Roberto Heinen 1 Paulo Martins Engel 1 Resumo: Este artigo descreve um modelo de aprendizado por reforço capaz de aprender

Leia mais

2 Trabalhos Relacionados

2 Trabalhos Relacionados 2 Trabalhos Relacionados Este capítulo apresenta os algoritmos já existentes que são utilizados nesta dissertação para obter pontos homólogos entre duas imagens de um par estéreo. Pode-se classificar essas

Leia mais

Detecção e classificação de objetos em imagens para rastreamento de veículos. Raphael Montanari

Detecção e classificação de objetos em imagens para rastreamento de veículos. Raphael Montanari Detecção e classificação de objetos em imagens para rastreamento de veículos Raphael Montanari SERVIÇO DE PÓS-GRADUAÇÃO DO ICMC-USP Data de Depósito: Assinatura: Raphael Montanari Detecção e classificação

Leia mais

Reconhecimento de Faces com PCA e Redes Neurais

Reconhecimento de Faces com PCA e Redes Neurais Reconhecimento de Faces com Sandro Santos Andrade Programa de Pós-graduação em Mecatrônica Setembro / 2003 Visão Computacional Computacional Computação Computação Visual Computação Computação Gráfica Introdução

Leia mais

Isabela Góes Rangel. Análise de saliência visual baseada em contraste e em informações de fronteiras

Isabela Góes Rangel. Análise de saliência visual baseada em contraste e em informações de fronteiras UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE INFORMÁTICA CURSO DE BACHARELADO EM ENGENHARIA DA COMPUTAÇÃO Isabela Góes Rangel Análise de saliência visual baseada em contraste e em informações de fronteiras

Leia mais

Identificação de Órgãos Foliares utilizando as Wavelets de Daubechies

Identificação de Órgãos Foliares utilizando as Wavelets de Daubechies Identificação de Órgãos Foliares utilizando as Wavelets de Daubechies Alexander Scaranti, Ronaldo Bernardi e Rodrigo de Oliveira Plotze Instituto de Ciências Exatas e Tecnologia - Universidade Paulista

Leia mais

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Extração de Características

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Extração de Características Universidade Federal do Paraná Departamento de Informática Reconhecimento de Padrões Extração de Características Luiz Eduardo S. Oliveira, Ph.D. http://lesoliveira.net Objetivos Entender os conceitos de

Leia mais

RECONHECIMENTO DE CARACTERES EM IMAGENS COM RUÍDO

RECONHECIMENTO DE CARACTERES EM IMAGENS COM RUÍDO RECONHECIMENTO DE CARACTERES EM IMAGENS COM RUÍDO Fernanda Maria Sirlene Pio SUMARIO Introdução Trabalhos Relacionados Metodologia Experimentos Conclusão Referências 2 INTRODUÇÃO Reconhecimento de Padrões

Leia mais

Implementação do algoritmo SIFT para detecção de objetos em imagens.

Implementação do algoritmo SIFT para detecção de objetos em imagens. Universidade Federal do Rio de Janeiro Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia Programa de Engenharia de Sistemas e Computação Rio de Janeiro, RJ - Brasil Implementação

Leia mais

Framework para Detecção de Semáforos Baseado em Atenção Visual

Framework para Detecção de Semáforos Baseado em Atenção Visual Framework para Detecção de Semáforos Baseado em Atenção Visual Thiago Almeida, Nathanael Vasconcelos, Alcides Benicasa Departamento de Sistemas de Informação Universidade Federal de Sergipe - UFS Itabaiana

Leia mais

Detecção de falsas correspondências em pares de imagens estereoscópicas utilizando a transformação projetiva no plano e o algoritmo RANSAC

Detecção de falsas correspondências em pares de imagens estereoscópicas utilizando a transformação projetiva no plano e o algoritmo RANSAC Detecção de falsas correspondências em pares de imagens estereoscópicas utilizando a transformação projetiva no plano e o algoritmo RANSAC André Caceres Carrilho Mauricio Galo Renato César dos Santos Curitiba,

Leia mais

Exemplo de aplicação

Exemplo de aplicação Exemplo de aplicação Paralaxe O conceito de paralaxe está relacionado com o deslocamento relativo ou aparente dos objetos estacionários, quando um observador em movimento os olha de pontos diferentes.

Leia mais

3 Simpósio Internacional de Agricultura de Precisão

3 Simpósio Internacional de Agricultura de Precisão PROGRAMA COMPUTACIONAL PARA LOCALIZAÇÃO DE PLANTAS DANINHAS UTILIZANDO PROCESSAMENTO DE IMAGENS DIGITAIS Gustavo Finholdt 1, Celso Bandeira de Melo Ribeiro 2, Francisco de Assis de Carvalho Pinto 3 RESUMO:

Leia mais

Extração de características de imagens. Descritores de cor

Extração de características de imagens. Descritores de cor Extração de características de imagens Descritores de cor Descritores de imagens Problema: computar, de forma eficiente, valores que descrevam uma imagem (ou parte dela) Vetores de características (feature

Leia mais

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Representação. David Menotti.

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Representação. David Menotti. Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica Representação David Menotti www.inf.ufpr.br/menotti/ci171-182 Representação Agenda Introdução Extraindo Representações de Imagens

Leia mais

Sketch to Photo Matching: A Feature-based Approach (Klare and Jain [2010])

Sketch to Photo Matching: A Feature-based Approach (Klare and Jain [2010]) Sketch to Photo Matching: A Feature-based Approach (Klare and Jain [2010]) Marco Antonio de A. Silva Programa de Pós-Graduação em Ciência da Computação - PPGCC Departamento de Computação - DECOM Universidade

Leia mais

Processamento de imagem a cores

Processamento de imagem a cores A cor é um poderoso descritor que frequentemente simplifica a identificação e extracção de objectos de uma cena Os humanos podem discernir milhares de cores, mas apenas duas dezenas de cinzentos O processamento

Leia mais

Kanade-Lucas-Tomasi Tracker

Kanade-Lucas-Tomasi Tracker COPPE-UFRJ Kanade-Lucas-Tomasi Tracker Ricardo Marroquim data entrega: pós-graduação: 18/05/2016 graduação: 27/05/2016 1 NOTAÇÕES Uma imagem é definida como uma função f (x, y), x, y Z, onde f (x, y) :

Leia mais

Mathematical Morphology An Overview

Mathematical Morphology An Overview Universidade Federal Fluminense Instituto de Computação Mathematical Morphology An Overview Jacó Júlio de Souza Costa jacojulio@gmail.com jacojulio@id.uff.br March 29, 2019 Sumário 1 Definição do Tema

Leia mais

Aplicação de Histograma de Gradientes Orientados para detecção de hidrômetros em imagens de fundo complexo

Aplicação de Histograma de Gradientes Orientados para detecção de hidrômetros em imagens de fundo complexo Aplicação de Histograma de Gradientes Orientados para detecção de hidrômetros em imagens de fundo complexo Juliana Patrícia Detroz Professor: André Tavares da Silva Universidade do Estado de Santa Catarina

Leia mais

Extração de características utilizando filtros de Gabor aplicado a identificação de defeitos no couro bovino

Extração de características utilizando filtros de Gabor aplicado a identificação de defeitos no couro bovino Extração de características utilizando filtros de Gabor aplicado a identificação de defeitos no couro bovino André Luiz Pasquali 24 de abril de 2006 1 Antecedentes e Justificativa Atualmente o Brasil vem

Leia mais

Processamento Digital de Imagens

Processamento Digital de Imagens Ciência da Computação Processamento Digital de Imagens Tópicos Detecção de Pontos Isolados Detecção de Linhas Prof. Sergio Ribeiro 2 Operações lógicas e aritméticas orientadas a vizinhança utilizam o conceito

Leia mais

USO DO DETECTOR DE PONTOS DE INTERESSE SIFT PARA LOCALIZAÇÃO DE ALVOS ARTIFICIAIS DE CONTROLE

USO DO DETECTOR DE PONTOS DE INTERESSE SIFT PARA LOCALIZAÇÃO DE ALVOS ARTIFICIAIS DE CONTROLE IV Simpósio Brasileiro de Geomática SBG17 II Jornadas Lusófonas - Ciências e Tecnologias de Informação Geográfica - CTIG17 Presidente Prudente - SP, 24-26 de julho de 17 p. 341-346 USO DO DETECTOR DE PONTOS

Leia mais

Aprendizado de Máquina. Combinando Classificadores

Aprendizado de Máquina. Combinando Classificadores Universidade Federal do Paraná (UFPR) Departamento de Informática (DInf) Aprendizado de Máquina Combinando Classificadores David Menotti, Ph.D. web.inf.ufpr.br/menotti Introdução O uso de vários classificadores

Leia mais

Descritores de Imagens

Descritores de Imagens Descritores de Imagens André Tavares da Silva PPGCA/UDESC Outubro de 2017 André Tavares da Silva (PPGCA/UDESC) Descritores de Imagens Outubro de 2017 1 / 40 Descritores baseados em textura Local Activity

Leia mais

Diego Martin Mancini Orientador: Prof. Paulo A. V. de Miranda Instituto de Matemática e Estatística Universidade de São Paulo

Diego Martin Mancini Orientador: Prof. Paulo A. V. de Miranda Instituto de Matemática e Estatística Universidade de São Paulo Estudo de comparação do descritor de imagens coloridas BIC empregando diferentes abordagens de classificação de detecção de bordas: Canny e Operador Laplaciano Diego Martin Mancini Orientador: Prof. Paulo

Leia mais

PROCESSAMENTO DIGITAL DE IMAGENS

PROCESSAMENTO DIGITAL DE IMAGENS UNIVERSIDADE DE SÃO PAULO ESCOLA SUPERIOR DE AGRICULTURA LUIZ DE QUEIROZ DEPARTAMENTO DE ENGENHARIA DE BIOSSISTEMAS DISCIPLINA: LEB450 TOPOGRAFIA E GEOPROCESSAMENTO II PROF. DR. CARLOS ALBERTO VETTORAZZI

Leia mais

IN Redes Neurais

IN Redes Neurais IN0997 - Redes Neurais Aluizio Fausto Ribeiro Araújo Universidade Federal de Pernambuco Centro de Informática - CIn Departamento de Sistemas da Computação aluizioa@cin.ufpe.br Conteúdo Objetivos Quem usa

Leia mais

Person Re-Identification. Autor: Guilherme Zasyeki Machado

Person Re-Identification. Autor: Guilherme Zasyeki Machado Person Re-Identification Autor: Guilherme Zasyeki Machado Sumário - Introdução ao problema - Visão geral ao processo de Re-Identificação - Evolução estado da arte - Datasets disponíveis - Análise estado

Leia mais

Modelagem da Anomalia Magnética no Granito Silva Jardim

Modelagem da Anomalia Magnética no Granito Silva Jardim Modelagem da Anomalia Magnética no Granito Silva Jardim Antonio Nuno de Castro Santa Rosa 1 Nilton Correia da Silva 2 Natasha Gomes Santos Stanton 3 Renata Schimit 3 Universidade Federal do Rio de Janeiro/CT/NIDES

Leia mais

Universidade Federal do Rio de Janeiro. Flávio Henrique Schuindt da Silva. Estimativa de Fluxo Ótico com o método de Lukas-Kanade

Universidade Federal do Rio de Janeiro. Flávio Henrique Schuindt da Silva. Estimativa de Fluxo Ótico com o método de Lukas-Kanade Universidade Federal do Rio de Janeiro Programa de Engenharia de Sistemas e Computação Introdução ao Processamento de Imagens Flávio Henrique Schuindt da Silva Estimativa de Fluxo Ótico com o método de

Leia mais

Plano de Pesquisa. Emprego das Funções de Gabor Sintonizadas para a Análise de Sinais e a Modelagem Neuronal

Plano de Pesquisa. Emprego das Funções de Gabor Sintonizadas para a Análise de Sinais e a Modelagem Neuronal Plano de Pesquisa Emprego das Funções de Gabor Sintonizadas para a Análise de Sinais e a Modelagem Neuronal Sílvia Mara da Costa Campos Victer Instituto de Computação, UFF 17 de março de 2014 Plano de

Leia mais

Detecção de Faces Humanas em Imagens Coloridas Utilizando Redes Neurais Artificiais

Detecção de Faces Humanas em Imagens Coloridas Utilizando Redes Neurais Artificiais Detecção de Faces Humanas em Imagens Coloridas Utilizando Redes Neurais Artificiais Wellington da Rocha Gouveia Universidade de São Paulo Escola de Engenharia de São Carlos Departamento de Engenharia Elétrica

Leia mais

Processamento de Imagens. Texturas

Processamento de Imagens. Texturas Processamento de Imagens Texturas Exemplos Introdução Texturas Não existe abordagem formal Não existe definição formal São definidas qualitativamente e não há consenso quanto a sua definição quantitativa

Leia mais

Processamento de Imagens Filtragem Digital

Processamento de Imagens Filtragem Digital Filtragem Digital Consiste na aplicação de técnicas de transformação (operadores máscaras) com o objetivo de corrigir, suavizar ou realçar determinadas características de uma imagem dentro de uma aplicação

Leia mais

Processamento de Imagem. Filtragem no Domínio Espacial Professora Sheila Cáceres

Processamento de Imagem. Filtragem no Domínio Espacial Professora Sheila Cáceres Processamento de Imagem Filtragem no Domínio Espacial Professora Sheila Cáceres Filtragem A filtragem de imagens pode ser realizada no domínio do espaço e da frequência Operadores de filtragem são classificados

Leia mais

Filtros de Gabor Da Teoria à Aplicação

Filtros de Gabor Da Teoria à Aplicação Filtros de Gabor Da Teoria à Aplicação Ricardo J. Ferrari, Ph.D. rferrari@icmc.usp.br Instituto de Ciências Matemáticas e de Computação Universidade de São Paulo São Carlos, Brasil Introdução Sumário Sistema

Leia mais

Cor SCC0251 Processamento de Imagens

Cor SCC0251 Processamento de Imagens Cor SCC0251 Processamento de Imagens Prof. Moacir Ponti Jr. www.icmc.usp.br/~moacir Instituto de Ciências Matemáticas e de Computação USP 2012/1 Moacir Ponti Jr. (ICMCUSP) Cor 2012/1 1 / 39 Sumário 1 Introdução

Leia mais

4 SIFT (Scale Invariant Feature Transform)

4 SIFT (Scale Invariant Feature Transform) 4 SIFT (Scale Invariant Feature Transform) SIFT é um algoritmo de visão computacional publicado por David Lowe, em 1999 (Lowe, 1999) e patenteado nos EUA pela University of British Columbia. SIFT é composto

Leia mais

Transformação de Imagens Digitais em Código CNC Aprimoradas com Redes Neurais Artificiais

Transformação de Imagens Digitais em Código CNC Aprimoradas com Redes Neurais Artificiais Transformação de Imagens Digitais em Código CNC Aprimoradas com Redes Neurais Artificiais Abstract. Jader Teixeira 1, Alex Vinícios Telocken 1 1 Universidade de Cruz Alta (UNICRUZ) jader033139@unicruz.edu.br,

Leia mais

Processamento de Imagens

Processamento de Imagens Processamento de Imagens Introdução Prof. Dr. Márcio Sarroglia Pinho Histogramas Histogramas w Equalização alpha = 255 / numpixels for each pixel g(x,y) = cumulativefrequency[f(x,y)] * alpha end for http://www.generation5.org/content/24/histogramequalization.asp

Leia mais

SEGMENTAÇÃO E RECONHECIMENTO DA ÍRIS

SEGMENTAÇÃO E RECONHECIMENTO DA ÍRIS SEGMENTAÇÃO E RECONHECIMENTO DA ÍRIS Edno José Bozoli Junior¹, Osvaldo Severino Junior². 1. Universitário do curso de Ciências da Computação Rodovia Vicinal Raul Galvani nº. 831, Centro, CEP: 15.845-000

Leia mais

Classificação Hierárquica Multirrótulo Utilizando Redes Neurais Artificiais

Classificação Hierárquica Multirrótulo Utilizando Redes Neurais Artificiais Classificação Hierárquica Multirrótulo Utilizando Redes Neurais Artificiais Ricardo Cerri Instituto de Ciências Matemáticas e de Computação Universidade de São Paulo cerri@icmc.usp.br Roteiro Introdução

Leia mais

3 Transformação SIFT (Scale Invariant Feature Transform)

3 Transformação SIFT (Scale Invariant Feature Transform) 3 Transformação SIFT (Scale Invariant Feature Transform) Este capítulo apresenta as seguintes seções: - 3.1 Uma Introdução Sobre Descritores Locais: A técnica SIFT ( Scale Invariant Feature Transform )

Leia mais

Proposta de Curso LNCC

Proposta de Curso LNCC Proposta de Curso LNCC Professor: Gilson A. Giraldi (D.Sc) Título do Curso: Visualização Científica para Análise de Imagens Médica. Período: Quarto Período de 2001 Objetivos O processamento/visualização

Leia mais

Representação e Descrição. Guillermo Cámara-Chávez

Representação e Descrição. Guillermo Cámara-Chávez Representação e Descrição Guillermo Cámara-Chávez Introdução Objetos ou Segmentos são representados como uma coleção de pixels em uma imagem Para o reconhecimento do objeto é necessário descrever as propriedades

Leia mais

Face Descrip+on with Local Binary Pa6erns: Applica+on to Face Recogni+on JULIANO RAMOS LUANN LUNA

Face Descrip+on with Local Binary Pa6erns: Applica+on to Face Recogni+on JULIANO RAMOS LUANN LUNA Face Descrip+on with Local Binary Pa6erns: Applica+on to Face Recogni+on JULIANO RAMOS LUANN LUNA Introdução O ar%go visa criar uma abordagem para o problema de reconhecimento de face: i.e.: Dada uma face,

Leia mais

5 Estudo de Caso e Resultados

5 Estudo de Caso e Resultados 5 Estudo de Caso e Resultados 5.1. Introdução Finalizado o desenvolvimento da ferramenta, é indispensável testar suas funcionalidades e a eficácia da aplicação conjunta dos seus módulos de geração de experimentos

Leia mais

Segmentação de Impressões Digitais Baseada em Abertura Top-Hat

Segmentação de Impressões Digitais Baseada em Abertura Top-Hat Segmentação de Impressões Digitais Baseada em Abertura Top-Hat Gustavo de Sá 1, Pascual Figueroa 1, and Roberto Lotufo 2 1 Griaule Tecnologia, r. Bernardo Sayão 100, sala 209, 13083-866, Campinas, SP,

Leia mais

O reconhecimento facial é dividido em três etapas: i) detecção da face, ii) extração de características e iii) reconhecimento da face.

O reconhecimento facial é dividido em três etapas: i) detecção da face, ii) extração de características e iii) reconhecimento da face. ESTUDO SOBRE MÉTODOS DE RECONHECIMENTO FACIAL EM FOTOGRAFIAS DIGITAIS Ana Elisa SCHMIDT¹, Elvis Cordeiro NOGUEIRA² ¹ Orientadora e docente do IFC-Campus Camboriú; ² Aluno do curso de Bacharelado em Sistemas

Leia mais

Fusão de imagens de Sensoriamento Remoto utilizando a Transformada Wavelet Haar

Fusão de imagens de Sensoriamento Remoto utilizando a Transformada Wavelet Haar Fusão de imagens de Sensoriamento Remoto utilizando a Transformada Wavelet Haar Osny Ferreira da Silva 1 Giovanni Araujo Boggione 1 Leila Maria Garcia Fonseca 2 1 Centro Federal de Educação Tecnológica

Leia mais

CLASSIFICAÇÃO DE IMAGENS DE SENSORIAMENTO REMOTO BASEADA EM TEXTURA POR REDES NEURAIS ADRIANO BELUCO 1 ALEXANDRE BELUCO 2 PAULO MARTINS ENGEL 3

CLASSIFICAÇÃO DE IMAGENS DE SENSORIAMENTO REMOTO BASEADA EM TEXTURA POR REDES NEURAIS ADRIANO BELUCO 1 ALEXANDRE BELUCO 2 PAULO MARTINS ENGEL 3 CLASSIFICAÇÃO DE IMAGENS DE SENSORIAMENTO REMOTO BASEADA EM TEXTURA POR REDES NEURAIS ADRIANO BELUCO 1 ALEXANDRE BELUCO 2 PAULO MARTINS ENGEL 3 1 CEPSRM - Centro Estadual de Pesquisa em Sensoriamento Remoto

Leia mais

Relatório sobre os Resultados obtidos através do uso dos algoritmos SIFT e RANSAC para Reconstrução de um Objeto a partir de uma Nuvem de Pontos

Relatório sobre os Resultados obtidos através do uso dos algoritmos SIFT e RANSAC para Reconstrução de um Objeto a partir de uma Nuvem de Pontos Relatório sobre os Resultados obtidos através do uso dos algoritmos SIFT e RANSAC para Reconstrução de um Objeto a partir de uma Nuvem de Pontos Gustavo Moreira PUC-Rio, Departamento de Informática Rua

Leia mais

Bruno de Brito Leite

Bruno de Brito Leite Universidade Federal de Campina Grande UFCG Centro de Engenharia Elétrica e Informática CEEI Coordenação de Pós Graduação em Ciência da Computação COPIN Bruno de Brito Leite Mestrando Sumário Detecção

Leia mais

INTERPOLAÇÃO LINEAR E BILINEAR: APLICAÇÃO EM TRANSFORMAÇÕES GEOMÉTRICAS DE IMAGEM INTRODUÇÃO

INTERPOLAÇÃO LINEAR E BILINEAR: APLICAÇÃO EM TRANSFORMAÇÕES GEOMÉTRICAS DE IMAGEM INTRODUÇÃO INTERPOLAÇÃO LINEAR E BILINEAR: APLICAÇÃO EM TRANSFORMAÇÕES GEOMÉTRICAS DE IMAGEM Autores: Giulia Denise Kujat VIEIRA; Milene Karine GUBETTI. Identificação autores: Estudantes do Curso Técnico em Informática

Leia mais

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Segmentação. Luiz Eduardo S. Oliveira, Ph.D.

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Segmentação. Luiz Eduardo S. Oliveira, Ph.D. Universidade Federal do Paraná Departamento de Informática Reconhecimento de Padrões Segmentação Luiz Eduardo S. Oliveira, Ph.D. http://lesoliveira.net Objetivos Introduzir os conceitos básicos de segmentação

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Horários Aulas Sala 3 CCET [quinta-feira, 8:20 12:00] Atendimento

Leia mais