Modelo de Atenção Visual Seletiva para Aplicações em Tempo Real

Tamanho: px
Começar a partir da página:

Download "Modelo de Atenção Visual Seletiva para Aplicações em Tempo Real"

Transcrição

1 Modelo de Atenção Visual Seletiva para Aplicações em Tempo Real Milton Roberto Heinen 1 e Paulo Martins Engel 1 Universidade Federal do Rio Grande do Sul Instituto de Informática Caixa Postal 15064, CEP , Porto Alegre, RS, Brasil mrheinen@inf.ufrgs.br, engel@inf.ufrgs.br Resumo Este artigo descreve um modelo de atenção visual seletiva, chamado de NLOOK, proposto para ser utilizado em sistemas de visão computacional. Este modelo extrai, a partir dos dados de entrada, quatro mapas de características que codicam a intensidade, as cores, as orientações e o movimento da cena visual. Estes mapas são unidos em um mapa de saliências, que codica a relevância de cada um dos pontos da cena, e uma rede neural Winner-Take-All (WTA) com um mecanismo de inibição de retorno percorre este mapa em ordem decrescente de saliência. Os resultados obtidos demonstram que o NLOOK pode ser utilizado em aplicações de visão de máquina e em robôs móveis autônomos. Student level: PhD (Doutorado) Expected date of conclusion: Março de Introdução A quantidade de informações que chega ao sistema visual dos primatas estimada como sendo da ordem de 10 8 bits por segundo excede em muito a capacidade que o cérebro tem de processá-la e assimilá-la em sua experiência consciente [1]. A estratégia utilizada pelos sistemas biológicos para lidar com este excesso de informações é processar de forma detalhada somente algumas partes do campo visual, chamadas de regiões de interesse, e ignorar o restante das informações [2]. Este processamento seletivo das informações visuais inicia na retina, onde existe uma área, chamada de fóvea, que é responsável pela visão mais acurada. Esta área, que possui uma alta densidade de cones, corresponde a aproximadamente 2% do campo visual. Já no restante da retina a visão é menos acurada, mas existem células, chamadas de bastonetes, que possuem um poder de resolução menor mas são mais sensíveis à luz [3]. Para a escolha das regiões a serem examinadas pela fóvea, o ser humano utiliza os mecanismos de controle de atenção, que são inuenciados por dois tipos de informações [4]: Bottom-up: são informações de baixo para cima, ou seja, elementos da própria cena visual que inuenciam no controle da atenção; Top-down: são informações de cima para baixo, ou seja, informações provenientes do sistema nervoso que alteram o foco da atenção.

2 2 Desta forma, graças aos mecanismos de controle de atenção o ser humano consegue ter um amplo campo de visão e uma elevada percepção dos detalhes, sem exceder as capacidades de processamento do córtex visual. Inspirados nos sistemas de atenção biológicos, é possível desenvolver sistemas de atenção computacionais que sejam capazes de selecionar as regiões do campo visual a serem completamente processadas, e com isto se torna possível a análise de cenas complexas em tempo real utilizando recursos limitados de processamento. Embora diversos modelos de atenção visual bottom-up já tenham sido propostos e implementados [5,6,7,8,9,10,11], a maioria destes modelos tem como foco principal entender o funcionamento dos mecanismos de atenção dos seres vivos, e como tal têm sido avaliados somente em relação à sua plausibilidade biológica [12]. Em um sistema de visão computacional é necessário, entre outras coisas, que o modelo de atenção seja relativamente insensível a transformações ans (rotação, translação, reexão e escala). Porém, segundo [12], o NVT [1], que é o modelo de atenção visual mais conhecido e utilizado, é bastante sensível a transformações ans, e portanto não deve ser utilizado em aplicações de visão computacional. Além disso, muitos modelos trabalham apenas com imagens estáticas, o que inviabiliza a detecção de movimentos, que é um dos principais estímulos bottom-up dos seres vivos. Em relação à complexidade computacional, alguns desses modelos possuem tempos de execução bastante elevados, o que inviabiliza a utilização dos mesmos em aplicações de tempo real. Este artigo tem por objetivo descrever um modelo de controle de atenção, bem como sua implementação em um protótipo, que permite a seleção das áreas de interesse a partir de streams de vídeo fornecidas por um dispositivo de carga acoplado (Charge-Coupled Device CCD) a taxas de 30 quadros por segundo. Este modelo, chamado de NLOOK, é totalmente voltado para aplicações de visão computacional e robótica, o que permite que o mesmo venha a ser utilizado em sistemas de visão computacional para melhorar o desempenho de diversas tarefas, como por exemplo a identicação de objetos, a detecção de landmarks e a navegação de robôs móveis autônomos. Este artigo está estruturado da seguinte forma: a Seção 2 descreve o modelo proposto; a Seção 3 descreve os resultados preliminares; a Seção 4 descreve as considerações nais e as perspectivas futuras. 2 Modelo proposto A Figura 1 mostra a arquitetura geral do modelo de atenção visual proposto neste artigo, chamado de NLOOK 1. O NLOOK é inspirado no NVT [1], mas possui diversas melhorias em relação a este que o tornam mais adequado de ser utilizado em aplicações de visão computacional e robótica (em [13] é descrita uma versão preliminar do NLOOK sem algumas destas melhorias). Inicialmente as imagens coloridas fornecidas por um dispositivo CCD são utilizadas para a criação de quatro conjuntos de mapas de características: intensidade (Subseção 2.2), cores (Subseção 2.3), orientações (Subseção 2.4) e movimento (Subseção 2.5). Estes 1 NLOOK

3 conjuntos de mapas são gerados através de operações lineares de centro-periferia (Subseção 2.1) aplicadas sobre pirâmides gaussianas [14]. Em seguida estes mapas são normalizados através do operador N( ) (Subseção 2.6) e unidos para formarem um único mapa de saliências (Subseção 2.7). Posteriormente uma rede neural Winner-Take-All (WTA) seleciona o ponto mais saliente desse mapa, e um mecanismo de inibição de retorno impede que o foco de atenção que preso à mesma região do campo visual. Por último, as imagens são mapeadas para o plano log-polar (Subseção 2.8), com o centro no ponto de maior saliência. Todo esse processo ocorre de forma online a uma taxa de 30 quadros por segundo em um computador típico 2. O protótipo do modelo proposto foi implementado na linguagem de programação C++ ANSI e utiliza a biblioteca Open Source Computer Vision Library 3 (OpenCV) e threads POSIX. As próximas subseções descrevem cada uma destas etapas em detalhes. 3 Figura 1. Modelo proposto 2.1 Operações lineares de centro-periferia As operações lineares de centro-periferia, presentes no sistema visual humano, foram implementadas no NLOOK através de diferenças de gaussianas (DoG), e isto torna o modelo proposto bem menos sensível a transformações ans. De fato, segundo Draper e Lionelle [12], o NVT [1] é extremamente sensível a transformações ans justamente porque não utiliza diferenças de gaussianas ele simplesmente realiza estas operações através da diferença entre as escalas nas e grosseiras de uma pirâmide gaussiana. Assim, em uma pirâmide gaussiana com escalas σ [0, 3], o NLOOK convoluciona sucessivamente cada uma das escalas com dois kernels gaussianos, e em seguida as diferenças de gaussianas (DoG) são obtidas através da subtração absoluta das imagens resultantes. Estes kernels gaussianos possuem desvios padrão de e 1.545, que são similares aos utilizados nos descritores SIFT [15]. 2 Processador Intel(R) Core(TM)2 Duo CPU de 2.33GHz, 1.95GB de Memória RAM, placa aceleradora de vídeo Intel e sistema operacional Debian Linux 4 de 64 bits. 3 OpenCV

4 4 Para a geração dos mapas de características, é necessário que os diversos mapas em escalas diferentes sejam unidos. Isto é realizado através da soma interescalas, que para um conjunto arbitrário de mapas ocorre da seguinte forma: (i) os mapas de diferentes escalas são expandidos para a escala σ = 0; (ii) é realizada a adição ponto por ponto destes mapas. Diferentemente do NVT, o NLOOK une os mapas na escala mais na para evitar perdas de informação. 2.2 Mapas de intensidade Para a criação dos mapas de intensidade, inicialmente a imagem colorida original é transformada em uma imagem em tons de cinza (grayscale). Esta imagem é utilizada para criar uma pirâmide gaussiana [14] I(σ) com σ [0, 3], e sobre esta pirâmide são aplicadas as diferenças de gaussianas descritas na Subseção 2.1. A Figura 2 mostra um conjunto de mapas de intensidade (os pixels mais claros representam as regiões mais salientes). A Figura 2(a) mostra a imagem utilizada convertida para tons de cinza. As Figuras 2(b), 2(c), 2(d) e 2(e) mostram, respectivamente, as diferenças de gaussianas nas escalas 0, 1, 2 e 3. A Figura 2(f) mostra o mapa de intensidade nal, obtido através da soma inter-escalas : I = 3 σ=0 N(I(σ)) (1) onde N( ) é o operador de normalização descrito na Subseção 2.6. (a) Imagem (b) Escala I(0) (c) Escala I(1) (d) Escala I(2) (e) Escala I(3) (f) Mapa I Figura 2. Mapas de intensidade 2.3 Mapas de cores Segundo Engel et al. [16], no córtex visual humano existem os chamados sistemas de dupla oponência de cores, que funcionam da seguinte forma: no centro do respectivo campo, os neurônios são excitados por uma cor (ex.: vermelho) e

5 inibidos por outra (ex.: verde), enquanto que na periferia ocorre o contrário. Assim, no modelo proposto foram criados dois conjuntos de mapas: o conjunto RG(σ), para tratar a oponência dos canais vermelho/verde; e o conjunto BY (σ), para tratar a oponência dos canais azul/amarelo. Para a geração desses mapas, inicialmente os canais r, g e b são normalizados por I = (R+G+B)/3 de forma a separar a cor da intensidade, e em seguida são criados quatro canais largamente sintonizados para as cores vermelho (R), verde (G), azul (B) e amarelo (Y ): 5 R = r (g + b)/2 ; G = g (r + b)/2 ; B = b (r + g)/2 ; Y = (r + g)/2 r g /2 b. (2) onde valores negativos são ajustados para zero. Quatro pirâmides gaussianas R(σ), G(σ), B(σ) e Y (σ) são criadas para estes quatro canais, e em seguida são geradas as diferenças de gaussianas entre as diferentes cores, ou seja, para os mapas RG as subtrações absolutas ocorrem entre as pirâmides R(σ) e G(σ), e para os mapas BY ocorrem entre as pirâmides B(σ) e Y (σ). O mapa de cores C é então gerado através da seguinte equação: ( ) C = 1 /2 N(RG) + N(BY ) (3) A Figura 3 mostra um exemplo de mapa de cores. Na Figura 3(b) (mapa RG) as cores variam do verde (menor saliência) ao vermelho (maior saliência), e na Figura 3(c) (mapa BY ) as cores variam do amarelo (menor saliência) ao azul (maior saliência). A Figura 3(d) mostra o mapa de cores C, onde os tons mais claros representam as maiores saliências. (a) Original (b) Mapa RG (c) Mapa BY (d) Mapa C Figura 3. Mapas de cores 2.4 Mapas de orientações O córtex visual primário dos primatas possui neurônios sensíveis a orientação espacial, e segundo Daugman [17], ltros de Gabor [18] conseguem aproximar o perl de sensibilidade destes neurônios. Assim, o modelo proposto possui quatro conjuntos de mapas de orientações que são sensíveis, respectivamente, a orientações θ {0, 45, 90, 135 }. Estes mapas são criados utilizando pirâmides de Gabor [19] a partir da imagem I = (R + G + B)/3. Para a criação dos mapas de

6 6 orientações O(σ, θ) são calculados, para cada um dos pixels (x, y) do mapa de intensidade I(σ), os valores de ψ θ (x, y): ψ θ (x, y) = 1 2π e(x 2 +y 2 )/2 Θ θ (x, y) ; θ {0, 45, 90, 135 } (4) onde Θ θ (x, y) são senóides complexas calculadas através das equações: Θ 0 (x, y) = e i(π/2)x ; Θ 45 (x, y) = e i(π 2/4)(x+y) ; Θ 90 (x, y) = e i(π/2)y ; Θ 135 (x, y) = e i(π 2/4)(y x). Em seguida os mapas O(σ, θ) são combinados em um único mapa O: O = 1 ( ( θ {0 4,45,90,135 } N 3 )) σ=0 N(O(σ, θ)) (6) A Figura 4 um conjunto de mapas de orientações. A Figura 4(a) mostra a imagem original. As Figuras 4(b), 4(c), 4(d) e 4(e) mostram, respectivamente, os mapas com orientações preferenciais de 0, 45, 90 e 135. A Figura 4 mostra o mapa de orientações O, obtido através da Equação 6. (5) (a) Original (b) Mapa 0 (c) Mapa 45 (d) Mapa 90 (e) Mapa 135 (f) Mapa O Figura 4. Mapas de orientações 2.5 Mapas de movimento A detecção de movimentos é uma característica muito importante dos seres vivos, pois permite que estes dirijam sua atenção para as áreas de potenciais de risco e ameaças. No modelo proposto, a geração dos mapas de movimento é realizada da seguinte forma: a cada instante de tempo t, é calculada a taxa de mudança M(t) para cada um dos pixels do quadro atual: ) M(t) = 3( 1 t 1 r(t) t 1 γ t k r(k) + g(t) t 1 γ t k g(k) + b(t) γ t k b(k) k=1 k=1 k=1 (7)

7 onde γ é uma constante que serve para modular a inuência dos quadros anteriores na estimativa de movimentos. Com γ = 1, toda a experiência passada é utilizada no cálculo dos movimentos, e com γ = 0, apenas o último quadro é considerado. Nos experimentos realizados, foi utilizado γ = 0.2, valor este determinado através da realização de diversos experimentos prévios. A partir de M(t) é gerada uma pirâmide gaussiana M(σ, t), e sobre esta pirâmide são geradas as diferenças de gaussianas. Após este procedimento é gerado o mapa M(t): 3 M(t) = N(M(σ, t)) (8) σ=0 A Figura 5 mostra um exemplo de um mapa de movimento em um determinado instante de tempo t e o respectivo quadro de vídeo neste mesmo instante. 7 (a) Quadro t (b) Mapa M(t) Figura 5. Mapa de movimento 2.6 Normalização Na construção dos mapas de características, antes da soma inter-escalas ser realizada, cada um dos mapas individuais é normalizado através do operador N( ), proposto por Itti et al. [1]. Este operador funciona da seguinte forma: 1. O mapa de características é normalizado para o [0, 1] a m de se eliminar as diferenças de amplitude entre as diferentes modalidades; 2. São localizados o máximo global e a média p dos demais máximos locais; 3. O mapa de características é multiplicado globalmente por (1 p) 2. Para o cálculo de p, somente os máximos locais superiores à média são considerados. Assim, o operador N( ) faz com que os mapas com poucos picos que se destacam dos demais sejam amplicados, enquanto os mapas com muitos picos igualmente salientes são atenuados. 2.7 Mapa de saliências e rede neural WTA Após a construção de todos os mapas de características, eles são unidos para formarem o mapa de saliências S através da fórmula: S = 1 ( ) N(I) + N(C) + N(O) + N(M) (9) 4

8 8 A Figura 6(a) mostra uma imagem de exemplo e a Figura 6(b) mostra o respectivo mapa de saliências. Após a criação deste mapa, o modelo simplesmente percorre os pontos mais salientes da imagem e os analisa com maior profundidade. Para a seleção do ponto mais saliente a cada instante de tempo é utilizada uma rede neural do tipo o vencedor leva tudo (Winner-Take-All WTA) com aprendizado não-supervisionado. Esta rede neural, que possui a estrutura de uma grade bidimensional, utiliza neurônios do tipo integra e dispara [20] com forte inibição global. Desta forma, depois que um neurônio dispara, ele inibe todos os neurônios (inclusive a si mesmo), de forma que apenas o vencedor irá gerar a seqüência de potenciais de ação. (a) Original (b) Saliências (c) Log-polar (d) Cartesiano Figura 6. Mapa de saliências e mapeamento log-polar Além da rede neural WTA, um mecanismo inibição de retorno [21] foi adicionado ao modelo para evitar que o foco de atenção que sempre preso ao mesmo objeto (principalmente em cenas estáticas). Este mecanismo foi implementado na forma de um laço de realimentação e possui uma estrutura espacial de uma gaussiana invertida. Em suma, o mecanismo inibição de retorno faz com que as regiões recém atendidas sejam temporariamente suprimidas, permitindo ao modelo focar em outras regiões do campo visual. 2.8 Mapeamento log-polar Após a seleção do ponto de maior saliência, a imagem original é transformada em uma imagem retinotópica, que uma imagem com maior resolução no centro, a exemplo do que ocorre na retina dos seres humanos. Esta transformação é realizada através de um mapeamento log-polar, que é um modelo de transformação topológica do percurso visual dos primatas da retina até o córtex visual [22]. A Figura 6(c) mostra a imagem da Figura 6(a) convertida para o plano log-polar e a Figura 6(d) mostra esta imagem reconvertida para o plano cartesiano. 3 Resultados preliminares A Figura 7 demonstra o protótipo do modelo proposto utilizando os dados fornecidos pelo dispositivo CCD de forma online. Por questões de visualização são mostradas apenas as imagens geradas a cada segundo. Os círculos amarelos

9 9 mostram os três pontos mais salientes de cada imagem, sendo que o mais saliente possui um círculo maior e mais espesso. As imagens da Figura 7 também foram reconvertidas para o plano cartesiano por questões de visualização. Figura 7. Resultados obtidos com o modelo proposto Analisando a Figura 7, é possível perceber que o modelo consegue extrair os pontos mais relevantes da imagem, principalmente aqueles presentes nos objetos em movimento. Estes resultados são bastante úteis em diversas tarefas de robótica, como por exemplo a navegação na presença de obstáculos móveis. 4 Considerações nais e perspectivas Este artigo descreveu um modelo de controle de atenção biologicamente inspirado, chamado de NLOOK, que foi especialmente desenvolvido para ser utilizado em aplicações de visão computacional e robótica. Este modelo extrai quatro conjuntos de características (intensidade, cores, orientações e movimento) a partir da imagem original e as combina em um mapa de saliências, que codi ca os pontos mais relevantes da cena visual. O protótipo do modelo proposto consegue analisar imagens de pixels fornecidas por um dispositivo CCD a taxas de 30 quadros por segundo em um computador típico. Os resultados obtidos demonstram que o modelo proposto é útil para a identi cação dos pontos relevantes em uma cena visual, o que permite a sua utilização em tarefas como a identi cação de objetos e a navegação de robôs móveis autônomos. As perspectivas futuras incluem a utilização de informações top-down para modular a in uência dos mapas de características, bem como a utilização do modelo com um robô Pioneer 3-DX em tarefas de localização e mapeamento. Agradecimentos Agradecemos o apoio do CNPq a este trabalho.

10 10 Referências 1. Itti, L., Koch, C., Niebur, E.: A model of saliency-based visual attention for rapid scene analysis. IEEE Trans. Pattern Analysis and Machine Intelligence 20 (1998) Niebur, E., Koch, C. The Attentive Brain. In: Computational architectures for attention. MIT Press, Cambridge, MA (1998) Bear, M.F., Connors, B.W., Paradiso, M.A.: Neurociências: Desvendando o Sistema Nervoso. 2nd edn. ArtMed Editora, Porto Alegre, RS, Brazil (2002) 4. Indiveri, G., Mürer, R., Kramer, J.: Active vision using an analog VLSI model of selective attention. IEEE Trans. Circuits and Systems II: Analog and Digital Signal Processing 48(5) (2001) Koch, C., Ullman, S.: Shifts in selective visual attention: Toward the underlying neural circuitry. Human Neurobiology 4(4) (1985) Tsotsos, J.K., Culhane, S.M., Wai, W.Y.K., Lai, Y., Davis, N., Nuo, F.: Modeling visual attention via selective tuning. Articial Intelligence 78(1-2) (1995) Mozer, M.C., Sitton, M.: Computational modeling of spatial attention. Attention (1998) Behrmann, M., Haimson, C.: The cognitive neuroscience of visual attention. Current Opinion Neurobiology 9(2) (1999) Itti, L. Neurobiology of Attention. In: Models of Bottom-Up Attention and Saliency. Elsevier Press, San Diego, CA (2005) Ouerhani, N., Bur, A., Hügli, H.: Visual attention-based robot self-localization. In: Proc. European Conf. Mobile Robotics (ECMR'05), Ancona, Italy (2005) Frintrop, S.: VOCUS: A Visual Attention System for Object Detection and Goaldirected Search. Ph.d. dissertation, Rheinische Friedrich-Wilhelms-Universitat Bonn, Bonn, Germany (2006) 12. Draper, B.A., Lionelle, A.: Evaluation of selective attention under similarity transformations. Computer Vision and Image Understanding 100 (2005) Heinen, M.R., Engel, P.M.: Modelo de atenção visual seletiva. In: Anais do VII Simpósio de Informática da Região Centro do RS (SIRC/RS), Santa Maria, RS, Brazil, UNIFRA Editora (2008) Burt, P.J., Hong, T., Adelson, E.H.: The laplacian pyramid as a compact image code. IEEE Trans. Communications 31(4) (1983) Lowe, D.G.: Distinctive image features from scale-invariant keypoints. Int. Journal of Computer Vision 60(2) (2004) Engel, S., Zhang, X., Wandell, B.: Colour tuning in human visual cortex measured with functional magnetic resonance imaging. Nature 388(6637) (1997) Daugman, J.G.: Complete discrete 2-d gabor transforms by neural networs for image analysis and compression. IEEE Trans. Acoustics, Speech, and Signal Processing 36(7) (1988) Van Essen, D.: Hierarchical organization and functional streams in the visual cortex. Annual Reviews Neuroscience 2 (1979) Greenspan, S., Belongie, S., Goodman, R., Perona, P., Rakshit, S., Anderson, C.H.: Overcomplete steerable pyramid lters and rotation invariance. In: Proc. IEEE Computer Vision and Pattern Recognition (CVPR), Seattle, WA (1994) Liu, Y.H., Wang, X.J.: Spike-frequency adaptation of a generalized leaky integrateand-re model neuron. Journal of Computational Neuroscience 10 (2001) Klein, R.M.: Inhibition of return. Trends in Cognitive Sciences 4(4) (2000) Sandini, G., Tagliasco, V.: An anthropomorphic retina-like structure for scene analysis. Computer Vision, Graphics and Image Processing 14 (1980)

Modelo de Atenção Visual Seletiva

Modelo de Atenção Visual Seletiva Modelo de Atenção Visual Seletiva Milton Roberto Heinen 1 e Paulo Martins Engel 1 1 Instituto de Informática Universidade Federal do Rio Grande do Sul (UFRGS) Caixa Postal 15064 CEP 91501-970 Porto Alegre

Leia mais

NLOOK: Modelo de Atenção Visual Relativamente Insensível a Transformações Afins

NLOOK: Modelo de Atenção Visual Relativamente Insensível a Transformações Afins NLOOK: Modelo de Atenção Visual Relativamente Insensível a Transformações Afins Milton Roberto Heinen 1 e Paulo Martins Engel 1 1 Instituto de Informática Universidade Federal do Rio Grande do Sul (UFRGS)

Leia mais

Avaliação de Modelos de Atenção Visual em Relação a Transformações Afins

Avaliação de Modelos de Atenção Visual em Relação a Transformações Afins Avaliação de Modelos de Atenção Visual em Relação a Transformações Afins Milton Roberto Heinen e Paulo Martins Engel UFRGS Instituto de Informática CEP 91501-970, Porto Alegre, RS mrheinen@inf.ufrgs.br,

Leia mais

Anais do IX Congresso Brasileiro de Redes Neurais / Inteligência Computacional (IX CBRN) CATEGORIZAÇÃO DE OBJETOS UTILIZANDO ATENÇÃO VISUAL

Anais do IX Congresso Brasileiro de Redes Neurais / Inteligência Computacional (IX CBRN) CATEGORIZAÇÃO DE OBJETOS UTILIZANDO ATENÇÃO VISUAL CATEGORIZAÇÃO DE OBJETOS UTILIZANDO ATENÇÃO VISUAL MILTON ROBERTO HEINEN, PAULO MARTINS ENGEL Instituto de Informática, Universidade Federal do Rio Grande do Sul (UFRGS) Caixa Postal 15064, 91501-970 Porto

Leia mais

Descritores de Imagens

Descritores de Imagens Descritores de Imagens André Tavares da Silva PPGCA/UDESC Outubro de 2017 André Tavares da Silva (PPGCA/UDESC) Descritores de Imagens Outubro de 2017 1 / 18 Descritores Locais e Frameworks SIFT SURF Viola-Jones

Leia mais

Descritores de Imagem

Descritores de Imagem Descritores de Imagem André Tavares da Silva 31 de março de 2014 1 Descritores de imagem (continuação) 1.1 Frameworks de detecção de objetos SIFT (scale-invariant features transform) (Lowe, 1999) SIFT

Leia mais

Face Recognition using RGB-D Images

Face Recognition using RGB-D Images Face Recognition using RGB-D Images Helder C. R. de Oliveira N.USP: 7122065 Polyana Nunes N.USP: 9043220 Sobre o Artigo Publication: 2013 IEEE Sixth International Conference Author(s) Goswami, G. (Índia

Leia mais

Image Descriptors: color

Image Descriptors: color Image Descriptors: color Image Processing scc0251 www.icmc.usp.br/ moacir moacir@icmc.usp.br ICMC/USP São Carlos, SP, Brazil 2011 Moacir Ponti Jr. (ICMCUSP) Image Descriptors: color 2011 1 / 29 Agenda

Leia mais

Processamento de Imagens COS756 / COC603

Processamento de Imagens COS756 / COC603 Processamento de Imagens COS756 / COC603 aula 13 - Transformada de Hough e SIFT Antonio Oliveira Ricardo Marroquim 1 / 41 aula de hoje descritores Transformada de Hough SIFT 2 / 41 transformada de Hough

Leia mais

IDENTIFICAÇÃO DE MARCADORES DE PAVIMENTAÇÃO NA ORIENTAÇÃO DE CEGOS. André Zuconelli 1 ; Manassés Ribeiro 2

IDENTIFICAÇÃO DE MARCADORES DE PAVIMENTAÇÃO NA ORIENTAÇÃO DE CEGOS. André Zuconelli 1 ; Manassés Ribeiro 2 IDENTIFICAÇÃO DE MARCADORES DE PAVIMENTAÇÃO NA ORIENTAÇÃO DE CEGOS André Zuconelli 1 ; Manassés Ribeiro 2 INTRODUÇÃO As tecnologias assistivas têm a finalidade de auxiliar pessoas com deficiência a alcançar

Leia mais

Anotador automático de placas de publicidade em vídeos esportivos

Anotador automático de placas de publicidade em vídeos esportivos MAC0499 - Trabalho de Formatura Supervisionado Professor: Carlos Eduardo Ferreira Universidade de São Paulo Instituto de Matemática e Estatística Aluno: Ricardo Augusto Fernandes Orientador: Prof. Dr.

Leia mais

Plano de Pesquisa. Emprego das Funções de Gabor Sintonizadas para a Análise de Sinais e a Modelagem Neuronal

Plano de Pesquisa. Emprego das Funções de Gabor Sintonizadas para a Análise de Sinais e a Modelagem Neuronal Plano de Pesquisa Emprego das Funções de Gabor Sintonizadas para a Análise de Sinais e a Modelagem Neuronal Sílvia Mara da Costa Campos Victer Instituto de Computação, UFF 17 de março de 2014 Plano de

Leia mais

Image Descriptors: local features

Image Descriptors: local features Image Descriptors: local features Image Processing scc0251 www.icmc.usp.br/ moacir moacir@icmc.usp.br ICMC/USP São Carlos, SP, Brazil 2011 Moacir Ponti Jr. (ICMCUSP) Image Descriptors: local features 2011

Leia mais

Igor dos Santos Montagner Orientador: Roberto Marcondes Cesar Junior 20/09/2010

Igor dos Santos Montagner Orientador: Roberto Marcondes Cesar Junior 20/09/2010 Análise e conversão de tablóides de promoções Igor dos Santos Montagner Orientador: Roberto Marcondes Cesar Junior 20/09/2010 1 1 Introdução Com os avanços na área de computação e a demanda crescente por

Leia mais

Face Detection. Image Processing scc moacir ICMC/USP São Carlos, SP, Brazil

Face Detection. Image Processing scc moacir ICMC/USP São Carlos, SP, Brazil Face Detection Image Processing scc0251 www.icmc.usp.br/ moacir moacir@icmc.usp.br ICMC/USP São Carlos, SP, Brazil 2011 Moacir Ponti Jr. (ICMCUSP) Face Detection 2011 1 / 24 Agenda 1 Detectando faces 2

Leia mais

Visão computacional. Juliana Patrícia Detroz Orientador: André Tavares Silva

Visão computacional. Juliana Patrícia Detroz Orientador: André Tavares Silva Visão computacional Juliana Patrícia Detroz Orientador: André Tavares Silva Visão computacional Tentativa de replicar a habilidade humana da visão através da percepção e entendimento de uma imagem; Fazer

Leia mais

AVALIAÇÃO QUALITATIVA DE DETECÇÃO DE BORDAS EM IMAGENS DE RADIOGRAFIA PERIAPICAIS

AVALIAÇÃO QUALITATIVA DE DETECÇÃO DE BORDAS EM IMAGENS DE RADIOGRAFIA PERIAPICAIS AVALIAÇÃO QUALITATIVA DE DETECÇÃO DE BORDAS EM IMAGENS DE RADIOGRAFIA PERIAPICAIS Hedlund Erik Martins Távora 1, John Hebert Da Silva Felix 2, Darleison Rodrigues Barros Filho 3, Fausta Joaquim Faustino

Leia mais

Cursos da Escola de Engenharias e Ciências Exatas - UnP

Cursos da Escola de Engenharias e Ciências Exatas - UnP Cursos da Escola de Engenharias e Ciências Exatas - UnP Professor Nielsen Castelo Damasceno E-mail: nielsen.castelo@unp.br Web: http://ncdd.com.br Sala Virtual Disciplina Visão Computacional (CH Total

Leia mais

Processamento de Sinal e Imagem Engenharia Electrotécnica e de Computadores

Processamento de Sinal e Imagem Engenharia Electrotécnica e de Computadores Processamento de Sinal e Imagem Engenharia Electrotécnica e de Computadores António M. Gonçalves Pinheiro Departamento de Física Universidade da Beira Interior Covilhã - Portugal pinheiro@ubi.pt Bibliografia

Leia mais

METODOLOGIA PARA A QUANTIZAÇÃO DE CORES PELO MÉTODO SMCb: INTRODUÇÃO E EXEMPLOS DE RESULTADOS

METODOLOGIA PARA A QUANTIZAÇÃO DE CORES PELO MÉTODO SMCb: INTRODUÇÃO E EXEMPLOS DE RESULTADOS METODOLOGIA PARA A QUANTIZAÇÃO DE CORES PELO MÉTODO SMCb: INTRODUÇÃO E EXEMPLOS DE RESULTADOS Marcelo Zaniboni 1, Osvaldo Severino Junior 2 1: Universitário do curso de Ciência da Computação, Faculdade

Leia mais

Processamento Digital de Imagens

Processamento Digital de Imagens Ciência da Computação Processamento Digital de Imagens Tópicos Detecção de Pontos Isolados Detecção de Linhas Prof. Sergio Ribeiro 2 Operações lógicas e aritméticas orientadas a vizinhança utilizam o conceito

Leia mais

Introdução ao Processamento de Imagens Digitais Aula 01

Introdução ao Processamento de Imagens Digitais Aula 01 Introdução ao Processamento de Imagens Digitais Aula 01 Douglas Farias Cordeiro Universidade Federal de Goiás 06 de julho de 2015 Mini-currículo Professor do curso Gestão da Informação Formação: Graduação

Leia mais

Aula 7 - Representação e Descrição de Estruturas Bi-dimensionais. Prof. Adilson Gonzaga

Aula 7 - Representação e Descrição de Estruturas Bi-dimensionais. Prof. Adilson Gonzaga Aula 7 - Representação e Descrição de Estruturas Bi-dimensionais Prof. Adilson Gonzaga 1 Introdução Objetos ou Segmentos são representados como uma coleção de pixels em uma imagem. Para o reconhecimento

Leia mais

Extração de atributos usando o método LBP - Local Binary Pattern

Extração de atributos usando o método LBP - Local Binary Pattern Extração de atributos usando o método LBP - Local Binary Pattern Lia Nara Balta Quinta. 2 de maio de 2006 1 Antecedentes e Justificativa O Brasil possui, atualmente, um grande rebanho bovino, porém em

Leia mais

Color Eyes Detector. Duarte Petiz. DCC/FCUP

Color Eyes Detector. Duarte Petiz. DCC/FCUP Color Eyes Detector Duarte Petiz DCC/FCUP up201204625@fc.up.pt Resumo Este relatório descreve a implementação da aplicação desenvolvida Color Eyes Detector bem como mostra os resultados finais da execução

Leia mais

Realce de imagens parte 1: operações pontuais SCC0251 Processamento de Imagens

Realce de imagens parte 1: operações pontuais SCC0251 Processamento de Imagens Realce de imagens parte 1: operações pontuais SCC0251 Processamento de Imagens Prof. Moacir Ponti Jr. www.icmc.usp.br/~moacir Instituto de Ciências Matemáticas e de Computação USP 2013/1 Moacir Ponti Jr.

Leia mais

Processamento Digital de Imagens

Processamento Digital de Imagens 1 Ciência da Computação Processamento Digital de Imagens Prof. Sergio Ribeiro Tópicos Introdução Espectro Eletromagnético Aquisição e de Imagens Sensoriamento Remoto 2 Introdução Espectro Eletromagnético

Leia mais

Processamento Digital de Imagens

Processamento Digital de Imagens Ciência da Computação Processamento Digital de Imagens Prof. Sergio Ribeiro Tópicos Introdução Espectro Eletromagnético Aquisição e Digitalização de Imagens Efeitos da Digitalização Digitalização Sensoriamento

Leia mais

Visão Computacional. Prof. Leandro Augusto Frata Fernandes TCC Introdução à Ciência da Computação (2012.

Visão Computacional. Prof. Leandro Augusto Frata Fernandes TCC Introdução à Ciência da Computação (2012. Visão Computacional Prof. Leandro Augusto Frata Fernandes laffernandes@ic.uff.br TCC-00.169 Introdução à Ciência da Computação (2012.1) Visão Humana Responsável por cerca de 75% de nossa percepção O ato

Leia mais

Capítulo II Imagem Digital

Capítulo II Imagem Digital Capítulo II Imagem Digital Proc. Sinal e Imagem Mestrado em Informática Médica Miguel Tavares Coimbra Resumo 1. Formação de uma imagem 2. Representação digital de uma imagem 3. Cor 4. Histogramas 5. Ruído

Leia mais

Detecção e classificação de objetos em imagens para rastreamento de veículos. Raphael Montanari

Detecção e classificação de objetos em imagens para rastreamento de veículos. Raphael Montanari Detecção e classificação de objetos em imagens para rastreamento de veículos Raphael Montanari SERVIÇO DE PÓS-GRADUAÇÃO DO ICMC-USP Data de Depósito: Assinatura: Raphael Montanari Detecção e classificação

Leia mais

Processamento de Imagens. Texturas

Processamento de Imagens. Texturas Processamento de Imagens Texturas Exemplos Introdução Texturas Não existe abordagem formal Não existe definição formal São definidas qualitativamente e não há consenso quanto a sua definição quantitativa

Leia mais

Reconhecimento de texturas utilizando padrão binário local e classificador knn.

Reconhecimento de texturas utilizando padrão binário local e classificador knn. Reconhecimento de texturas utilizando padrão binário local e classificador knn. Vinicius Santos Andrade 1 Resumo. Através de uma imagem é possível obter inúmeras informações. Portanto, é cada vez mais

Leia mais

Video Quality Assessment in Java

Video Quality Assessment in Java Video Quality Assessment in Java Pós-graduação strictu sensu em Ciência da Computação PROCESSAMENTO DE IMAGENS, Prof. Tsang Ing Ren Estêvão Monteiro Ricardo Scholz Junho de 2014 Introdução Fidelidade de

Leia mais

Filtros de Gabor Da Teoria à Aplicação

Filtros de Gabor Da Teoria à Aplicação Filtros de Gabor Da Teoria à Aplicação Ricardo J. Ferrari, Ph.D. rferrari@icmc.usp.br Instituto de Ciências Matemáticas e de Computação Universidade de São Paulo São Carlos, Brasil Introdução Sumário Sistema

Leia mais

UNIVERSIDADE ESTADUAL DE MARINGÁ PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO. Prof. Yandr re Costa - 1. Prof. Yandre Costa.

UNIVERSIDADE ESTADUAL DE MARINGÁ PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO. Prof. Yandr re Costa - 1. Prof. Yandre Costa. UNIVERSIDADE ESTADUAL DE MARINGÁ PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO Prof. Yandr re Costa - 1 Textura Prof. Yandre Costa Prof. Yandr re Costa - 2 Textura é um importante atributo visual

Leia mais

Processamento Digital de Imagens

Processamento Digital de Imagens Ciência da Computação Processamento Digital de Imagens Objetivos e Introdução Prof. Sergio Ribeiro Tópicos Introdução Percepção por Máquina Imagens e Computação Gráfica Complexidade de um Sistema Elementos

Leia mais

Rastreamento de objeto e estimativa de movimento

Rastreamento de objeto e estimativa de movimento Hiroito Watanabe Rastreamento de objeto e estimativa de movimento Brasil 2015 Hiroito Watanabe Rastreamento de objeto e estimativa de movimento Relatório do trabalho 2 da disciplina de Processamento Digital

Leia mais

Métodos de Extração de Características

Métodos de Extração de Características 1. Introdução Métodos de Extração de Características A Interpretação ou entendimento de uma cena demanda o reconhecimento de seus objetos. Reconhecimento de objetos ou padrões contidos em uma cena -> é

Leia mais

Sistema de Reconhecimento de Logotipos

Sistema de Reconhecimento de Logotipos Sistema de Reconhecimento de Logotipos Fellipe Duarte, Saulo T. Oliveira {duartefellipe,sto}@cos.ufrj.br Relatório Técnico, Introdução ao Processamento de Imagens Programa de Engenharia de Sistemas e Computação

Leia mais

UNIVERSIDADE FEDERAL FLUMINENSE Pedro Martins Menezes. Um estudo dos estágios dos pipelines gráficos

UNIVERSIDADE FEDERAL FLUMINENSE Pedro Martins Menezes. Um estudo dos estágios dos pipelines gráficos UNIVERSIDADE FEDERAL FLUMINENSE Pedro Martins Menezes Um estudo dos estágios dos pipelines gráficos Niterói 2008 Pedro Martins Menezes Um estudo dos estágios dos pipelines gráficos Trabalho de Conclusão

Leia mais

Mapas Auto-Organizáveis de Kohonen SOM

Mapas Auto-Organizáveis de Kohonen SOM Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCA UFES Departamento de Computação Mapas Auto-Organizáveis de Kohonen SOM Redes Neurais Artificiais Site: http://jeiks.net E-mail: jacsonrcsilva@gmail.com

Leia mais

Aplicação de Histograma de Gradientes Orientados para detecção de hidrômetros em imagens de fundo complexo

Aplicação de Histograma de Gradientes Orientados para detecção de hidrômetros em imagens de fundo complexo Aplicação de Histograma de Gradientes Orientados para detecção de hidrômetros em imagens de fundo complexo Juliana Patrícia Detroz Professor: André Tavares da Silva Universidade do Estado de Santa Catarina

Leia mais

2 SIFT (Scale Invariant Feature Transform)

2 SIFT (Scale Invariant Feature Transform) SIFT (Scale Invariant Feature Transform) O SIFT é um algoritmo de visão computacional proposto e publicado pelo pesquisador David Lowe (Lowe, 1999), professor do departamento de Ciência da Computação na

Leia mais

Sketch to Photo Matching: A Feature-based Approach (Klare and Jain [2010])

Sketch to Photo Matching: A Feature-based Approach (Klare and Jain [2010]) Sketch to Photo Matching: A Feature-based Approach (Klare and Jain [2010]) Marco Antonio de A. Silva Programa de Pós-Graduação em Ciência da Computação - PPGCC Departamento de Computação - DECOM Universidade

Leia mais

Extração de objetos de interesse em imagens digitais utilizando a biblioteca de Visão Computacional OpenCV

Extração de objetos de interesse em imagens digitais utilizando a biblioteca de Visão Computacional OpenCV Extração de objetos de interesse em imagens digitais utilizando a biblioteca de Visão Computacional OpenCV Izadora Aparecida RAMOS 1,3,4 ; Servílio Souza de ASSIS 1,3,4 ; Bruno Alberto Soares OLIVEIRA

Leia mais

Cor SCC0251 Processamento de Imagens

Cor SCC0251 Processamento de Imagens Cor SCC0251 Processamento de Imagens Prof. Moacir Ponti Jr. www.icmc.usp.br/~moacir Instituto de Ciências Matemáticas e de Computação USP 2012/1 Moacir Ponti Jr. (ICMCUSP) Cor 2012/1 1 / 39 Sumário 1 Introdução

Leia mais

Análise e conversão de tabloides de. Igor dos Santos Montagner Orientador: Prof. Dr. Roberto Marcondes Cesar Junior. promoções

Análise e conversão de tabloides de. Igor dos Santos Montagner Orientador: Prof. Dr. Roberto Marcondes Cesar Junior. promoções Análise e conversão de tabloides de Igor dos Santos Montagner Orientador: Prof. Dr. Roberto Marcondes Cesar Junior promoções Agenda Problema Objetivo nal Solução proposta Atenção visual e mapa de saliências

Leia mais

Mapas Auto-Organizáveis de Kohonen SOM

Mapas Auto-Organizáveis de Kohonen SOM Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCA UFES Departamento de Computação Mapas Auto-Organizáveis de Kohonen SOM Redes Neurais Artificiais Site: http://jeiks.net E-mail: jacsonrcsilva@gmail.com

Leia mais

Fundamentos sobre. Universidade Federal do Rio de Janeiro - IM/DCC & NCE. Antonio G. Thomé Sala AEP/1033. Processamento de Imagens

Fundamentos sobre. Universidade Federal do Rio de Janeiro - IM/DCC & NCE. Antonio G. Thomé Sala AEP/1033. Processamento de Imagens Universidade Federal do Rio de Janeiro - IM/DCC & NCE Fundamentos sobre Processamento de Imagens Antonio G. Thomé thome@nce.ufrj.br Sala AEP/1033 Sumário do Curso Introdução Ambientação com o MatLab Aquisição

Leia mais

Textura. Textura 04/09/2014. Prof. Yandre Costa

Textura. Textura 04/09/2014. Prof. Yandre Costa UNIVERSIDADE ESTADUAL DE MARINGÁ PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO Prof. Yandre Costa - 1 Prof. Yandre Costa Prof. Yandre Costa - 2 é um importante atributo visual presente em imagens,

Leia mais

Universidade Federal do Rio de Janeiro. Flávio Henrique Schuindt da Silva. Estimativa de Fluxo Ótico com o método de Lukas-Kanade

Universidade Federal do Rio de Janeiro. Flávio Henrique Schuindt da Silva. Estimativa de Fluxo Ótico com o método de Lukas-Kanade Universidade Federal do Rio de Janeiro Programa de Engenharia de Sistemas e Computação Introdução ao Processamento de Imagens Flávio Henrique Schuindt da Silva Estimativa de Fluxo Ótico com o método de

Leia mais

Processamento Digital de Imagens

Processamento Digital de Imagens 1 Ciência da Computação Processamento Digital de Imagens Objetivos e Prof. Sergio Ribeiro Tópicos Percepção por Máquina Imagens e Computação Gráfica, Armazenamento e Exibição Processamento Digital de Imagens

Leia mais

Redes Neurais Convolucionais

Redes Neurais Convolucionais André Gustavo Hochuli Orientadores: Dr. Luiz E. S. Oliveira/Dr. Alceu Britto Programa de Pós-Graduação em Informática Departamento de Informática UFPR Neurônio Artificial Redes Neurais - Vetor de Caracteristícas

Leia mais

2. Redes Neurais Artificiais

2. Redes Neurais Artificiais Computação Bioinspirada - 5955010-1 2. Redes Neurais Artificiais Prof. Renato Tinós Depto. de Computação e Matemática (FFCLRP/USP) 1 2.1. Introdução às Redes Neurais Artificiais (RNAs) 2.1.1. Motivação

Leia mais

DETECÇÃO DE CORES DE SOLUÇÕES QUÍMICAS PARA PESSOAS COM NENHUMA OU BAIXA VISÃO UTILIZANDO OPENCV

DETECÇÃO DE CORES DE SOLUÇÕES QUÍMICAS PARA PESSOAS COM NENHUMA OU BAIXA VISÃO UTILIZANDO OPENCV DETECÇÃO DE CORES DE SOLUÇÕES QUÍMICAS PARA PESSOAS COM NENHUMA OU BAIXA VISÃO UTILIZANDO OPENCV Autor (1) Jéssica Fernandes Alves; Orientador (4) Suzete Élida Nóbrega Correia (1) Instituto Federal de

Leia mais

Universidade Federal de Pernambuco

Universidade Federal de Pernambuco Universidade Federal de Pernambuco Graduação em Engenharia da Computação Centro de Informática 2 0 1 2. 2 PROPOSTA DE TRABALHO DE GRADUAÇÃO Aluno Arthur de Lima Padilha {alp4@cin.ufpe.br} Orientadora Veronica

Leia mais

SEMINÁRIO DOS ARTIGOS:

SEMINÁRIO DOS ARTIGOS: SEMINÁRIO DOS ARTIGOS: Text Detection and Character Recognition in Scene Images with Unsupervised Feature Learning End-to-End Text Recognition with Convolutional Neural Networks Fernanda Maria Sirlene

Leia mais

Aprendizagem de Máquinas. Extração de Características

Aprendizagem de Máquinas. Extração de Características Universidade Federal do Paraná (UFPR) Departamento de Informática (DInf) Aprendizagem de Máquinas Extração de Características David Menotti, Ph.D. http://web.inf.ufpr.br/menotti 1 Objetivos Entender os

Leia mais

Framework para Detecção de Semáforos Baseado em Atenção Visual

Framework para Detecção de Semáforos Baseado em Atenção Visual Framework para Detecção de Semáforos Baseado em Atenção Visual Thiago Almeida, Nathanael Vasconcelos, Alcides Benicasa Departamento de Sistemas de Informação Universidade Federal de Sergipe - UFS Itabaiana

Leia mais

T4 Processamento de Imagem

T4 Processamento de Imagem T4 Processamento de Imagem Proc. Sinal e Imagem Mestrado em Informática Médica Hélder Filipe Pinto de Oliveira Resumo 1. Manipulação ponto a ponto 2. Conetividade 3. Filtros espaciais 4. Extração de estruturas

Leia mais

Introdução à Computação Gráfica. Claudio Esperança Paulo Roma Cavalcanti

Introdução à Computação Gráfica. Claudio Esperança Paulo Roma Cavalcanti Introdução à Computação Gráfica Claudio Esperança Paulo Roma Cavalcanti Estrutura do Curso Ênfase na parte prática Avaliação através de trabalhos de implementação C / C++ OpenGL c/ GLUT Grau (nota) baseado

Leia mais

7. Color Image Processing

7. Color Image Processing Transformação de níveis de cinza para cor a idéia por trás desta técnica é executar 3 transformações independentes sobre níveis de cinza dos pixels de uma imagem de entrada. Cada cor é transformada independentemente

Leia mais

Introdução ao Processamento Digital de Imagens. Aula 6 Propriedades da Transformada de Fourier

Introdução ao Processamento Digital de Imagens. Aula 6 Propriedades da Transformada de Fourier Introdução ao Processamento Digital de Imagens Aula 6 Propriedades da Transformada de Fourier Prof. Dr. Marcelo Andrade da Costa Vieira mvieira@sc.usp.br Uma linha de uma imagem formada por uma sequência

Leia mais

INFORMAÇÕES DO ACADÊMICO PLANO DE TRABALHO. 1. Justificativa

INFORMAÇÕES DO ACADÊMICO PLANO DE TRABALHO. 1. Justificativa INFORMAÇÕES DO ACADÊMICO Nome: Kleber Padovani de Souza Curso: Engenharia de Computação Semestre: R.A.: Título do plano de trabalho: Extração de atributos da imagem através de momentos de imagem. Nome

Leia mais

Processamento Digital de Imagens. Análise de Imagens

Processamento Digital de Imagens. Análise de Imagens Processamento Digital de Imagens Análise de Imagens Eduardo A. B. da Silva Programa de Engenharia Elétrica - COPPE/UFRJ Laboratório de Sinais, Multimídia e Telecomunicações eduardo@smt.ufrj.br Sergio L.

Leia mais

Aquisição/Codificação de Vídeo

Aquisição/Codificação de Vídeo Aquisição/Codificação de Vídeo Tópicos em Hipermídia Diego Fiori de Carvalho Rudinei Goularte 1 Roteiro Aquisição/Codificação Evolução CCD Formatos de vídeo analógico Aquisição de Imagens Padrões de Cor

Leia mais

SIFT - Scale Invariant Feature Transform

SIFT - Scale Invariant Feature Transform SIFT - Scale Invariant Feature Transform Daniel Pinto Coutinho Prof. Ricardo Marroquim 1 Introdução A detecção de pontos de interesse em uma figura é uma tarefa muito comum no campo de processamento de

Leia mais

Redes Neurais Convolucionais

Redes Neurais Convolucionais André Gustavo Hochuli Orientador: Prof. Dr. Luiz Eduardo Soares de Oliveira Programa de Pós-Graduação em Informática Departamento de Informática UFPR http://www.inf.ufpr.br/aghochuli/caffe/ Redes Neurais

Leia mais

Psicofisiologia da visão

Psicofisiologia da visão Psicologia Percepção Visual 1º Ano, Design de Comunicação 1º Ano, Imagem Animada Psicofisiologia da visão O olho A retina O nervo óptico O núcleo geniculado lateral O córtex visual Dos neurónios à percepção

Leia mais

Extração de características de imagens. Descritores de cor

Extração de características de imagens. Descritores de cor Extração de características de imagens Descritores de cor Descritores de imagens Problema: computar, de forma eficiente, valores que descrevam uma imagem (ou parte dela) Vetores de características (feature

Leia mais

Tecnologias Computacionais Aplicadas À Análise De Sinais De Voz

Tecnologias Computacionais Aplicadas À Análise De Sinais De Voz Tecnologias Computacionais Aplicadas À Análise De Sinais De Voz Charles Alexandre Blumm, José Luis Gómez Cipriano Instituto de Ciências Exatas e Tecnológicas (ICET) Centro Universitário Feevale Campus

Leia mais

Processamento e Análise de Imagens

Processamento e Análise de Imagens Processamento e Análise de Imagens Prof. Moacir Ponti www.icmc.usp.br/~moacir Instituto de Ciências Matemáticas e de Computação USP 2017/1 Moacir Ponti Jr. (ICMCUSP) Processamento e Análise de Imagens

Leia mais

Processamento de Imagem. Histograma da Imagem Professora Sheila Cáceres

Processamento de Imagem. Histograma da Imagem Professora Sheila Cáceres Processamento de Imagem Histograma da Imagem Professora Sheila Cáceres Histograma É a distribuição de frequência dos níveis de cinza da imagem onde cada entrada no eixo x representa o nível de cinza específico

Leia mais

SISTEMA DE ANÁLISE DE VÍDEO EM TEMPO REAL NA DETECÇÃO DE PADRÕES DE MOVIMENTO

SISTEMA DE ANÁLISE DE VÍDEO EM TEMPO REAL NA DETECÇÃO DE PADRÕES DE MOVIMENTO SISTEMA DE ANÁLISE DE VÍDEO EM TEMPO REAL NA DETECÇÃO DE PADRÕES DE MOVIMENTO Davi Alberto Sala, Adriane Parraga e Letícia Vieira Guimarães Universidade Estadual do Rio Grande do Sul RESUMO Uma das seções

Leia mais

SEMINÁRIO Visão Computacional Aluno: Afonso Pinheiro

SEMINÁRIO Visão Computacional Aluno: Afonso Pinheiro SEMINÁRIO Visão Computacional Aluno: Afonso Pinheiro Detecting Pedestrians Using Patterns of Motion and Appearance *Paul Viola *Michael J. Jones *Daniel Snow Por que detectar pedestres? http://conexaopenedo.com.br/2016/02/sistema-consegue-detectar-pedestres-em-tempo-real/

Leia mais

Diego Martin Mancini Orientador: Prof. Paulo A. V. de Miranda Instituto de Matemática e Estatística Universidade de São Paulo

Diego Martin Mancini Orientador: Prof. Paulo A. V. de Miranda Instituto de Matemática e Estatística Universidade de São Paulo Estudo de comparação do descritor de imagens coloridas BIC empregando diferentes abordagens de classificação de detecção de bordas: Canny e Operador Laplaciano Diego Martin Mancini Orientador: Prof. Paulo

Leia mais

Prof. Fernando V. Paulovich 3 de agosto de SCC Computação Gráca

Prof. Fernando V. Paulovich  3 de agosto de SCC Computação Gráca Dispositivos de Saída e SCC0250 - Computação Gráca Prof. Fernando V. Paulovich http://www.icmc.usp.br/~paulovic paulovic@icmc.usp.br Instituto de Ciências Matemáticas e de Computação (ICMC) Universidade

Leia mais

António Costa. Paulo Roma Cavalcanti

António Costa. Paulo Roma Cavalcanti Introdução à Computação Gráfica Preâmbulo Adaptação: Autoria: João Paulo Pereira António Costa Claudio Esperança Paulo Roma Cavalcanti Computação Gráfica Modelos Matemáticos Análise (reconhecimento de

Leia mais

Implementação do algoritmo SIFT para detecção de objetos em imagens.

Implementação do algoritmo SIFT para detecção de objetos em imagens. Universidade Federal do Rio de Janeiro Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia Programa de Engenharia de Sistemas e Computação Rio de Janeiro, RJ - Brasil Implementação

Leia mais

RECONHECIMENTO FACIAL 2D

RECONHECIMENTO FACIAL 2D RECONHECIMENTO FACIAL 2D PARA SISTEMAS DE AUTENTICAÇÃO EM DISPOSITIVOS MÓVEIS Luciano Pamplona Sobrinho Orientador: Paulo César Rodacki Gomes ROTEIRO Introdução Objetivos Fundamentação Teórica Conceitos

Leia mais

Fazendo máquinas enxergarem com OpenCV. TCHÊLINUX 2017 Felipe Aguiar Corrêa

Fazendo máquinas enxergarem com OpenCV. TCHÊLINUX 2017 Felipe Aguiar Corrêa Fazendo máquinas enxergarem com OpenCV TCHÊLINUX 2017 Felipe Aguiar Corrêa Quem é esse cara aí? UFPEL Ciência da Computação Visão Computacional Rastreamento de Pedestres Visão Computacional Sub-área da

Leia mais

Técnicas de Processamento Paralelo na Geração do Fractal de Mandelbrot

Técnicas de Processamento Paralelo na Geração do Fractal de Mandelbrot Técnicas de Processamento Paralelo na Geração do Fractal de Mandelbrot Bruno Pereira dos Santos Dany Sanchez Dominguez Esbel Tomás Evalero Orellana Universidade Estadual de Santa Cruz Roteiro Breve introdução

Leia mais

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica REDES NEURAIS ARTIFICIAIS AULA 03 Prof. Dr. André A. P. Biscaro 1º Semestre de 2017 INTRODUÇÃO Aprendizagem é um processo pelo qual os parâmetros livres de uma rede neural são adaptados através de um processo

Leia mais

Isabela Góes Rangel. Análise de saliência visual baseada em contraste e em informações de fronteiras

Isabela Góes Rangel. Análise de saliência visual baseada em contraste e em informações de fronteiras UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE INFORMÁTICA CURSO DE BACHARELADO EM ENGENHARIA DA COMPUTAÇÃO Isabela Góes Rangel Análise de saliência visual baseada em contraste e em informações de fronteiras

Leia mais

Descritores de Imagens

Descritores de Imagens Descritores de Imagens André Tavares da Silva PPGCA/UDESC Outubro de 2017 André Tavares da Silva (PPGCA/UDESC) Descritores de Imagens Outubro de 2017 1 / 17 Introdução Excelentes pesquisas sobre descritores

Leia mais

Fundamentos da Teoria da Probabilidade

Fundamentos da Teoria da Probabilidade Fundamentos da Teoria da Probabilidade Edmar José do Nascimento (Princípios de Comunicações) http://www.univasf.edu.br/ edmar.nascimento Universidade Federal do Vale do São Francisco Sinais Aleatórios

Leia mais

TE073 PDS II Programa de Pós-Graduação em Engenharia Elétrica

TE073 PDS II Programa de Pós-Graduação em Engenharia Elétrica TE073 PDS II Programa de Pós-Graduação em Engenharia Elétrica Prof. Alessandro Zimmer zimmer@eletrica.ufpr.br www.eletrica.ufpr.br/~zimmer/te073 Processamento Digital de Imagens PDI: Objetivos Melhoria

Leia mais

FILTROS ESPACIAIS PASSA-BAIXA

FILTROS ESPACIAIS PASSA-BAIXA UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL PROGRAMA DE PÓS-GRADUAÇÃO EM COMPUTAÇÃO CMP65 - INTRODUÇÃO AO PROCESSAMENTO DE IMAGENS PROFESSOR JACOB SCARCHANSKI FILTROS ESPACIAIS PASSA-BAIXA POR DANIEL NEHME

Leia mais

PRINCÍPIOS DE NEUROCOMPUTAÇÃO

PRINCÍPIOS DE NEUROCOMPUTAÇÃO PRINCÍPIOS DE NEUROCOMPUTAÇÃO Neurocomputação Funcionamento do cérebro humano e os neurônios Formação das conexões e como se concebe teoricamente a aquisição do conhecimento, formalizando-os em procedimentos

Leia mais

DESENVOLVIMENTO DE SISTEMA PARA GERAÇÃO DE MOSAICO DE IMAGENS VISANDO LOCALIZAÇÃO E NAVEGAÇÃO DE ROBÔS MÓVEIS

DESENVOLVIMENTO DE SISTEMA PARA GERAÇÃO DE MOSAICO DE IMAGENS VISANDO LOCALIZAÇÃO E NAVEGAÇÃO DE ROBÔS MÓVEIS DESENVOLVIMENTO DE SISTEMA PARA GERAÇÃO DE MOSAICO DE IMAGENS VISANDO LOCALIZAÇÃO E NAVEGAÇÃO DE ROBÔS MÓVEIS Edson CAVALCANTI Neto (1), Guilherme Costa HOLANDA (1), Antonio Themoteo VARELA (1), André

Leia mais

Processamento de Imagens COS756 / COC603

Processamento de Imagens COS756 / COC603 Processamento de Imagens COS756 / COC603 aula 09 - curvatura Antonio Oliveira Ricardo Marroquim 1 / 1 aula de hoje feature detection overview curvatura espaço de escala block matching 2 / 1 curvatura o

Leia mais

T4.1 Processamento de Imagem

T4.1 Processamento de Imagem T4.1 Processamento de Imagem Proc. Sinal e Imagem Mestrado em Informática Médica Miguel Tavares Coimbra Resumo 1. Manipulação ponto a ponto 2. Filtros espaciais 3. Extracção de estruturas geométricas 4.

Leia mais

Reconhecimento de Instâncias (parte 2)

Reconhecimento de Instâncias (parte 2) Reconhecimento de Instâncias (parte 2) Rafael Galvão de Mesquita rgm@cin.ufpe.br Carlos Alexandre Mello cabm@cin.ufpe.br SURF Speeded-Up Robust Features [3] Computer Vision and Image Understanding, 2004

Leia mais

1.1 Descrição do problema A programação genética (PG) é uma meta-heurística utilizada para gerar programas de computadores, de modo que o computador

1.1 Descrição do problema A programação genética (PG) é uma meta-heurística utilizada para gerar programas de computadores, de modo que o computador 1 Introdução 1.1 Descrição do problema A programação genética (PG) é uma meta-heurística utilizada para gerar programas de computadores, de modo que o computador possa resolver problemas de forma automática

Leia mais

Projetos finais. Grupo 3

Projetos finais. Grupo 3 Projetos finais Grupo 3 Integrantes Laez Barbosa da Fonseca Filho 8586902 laez.filho@usp.br Caetano Mastroianni Dieguez 7210164 caetano.dieguez@usp.br Lais Harumi Fukujima Aguiar 8587142 lais.aguiar.br@ieee.org

Leia mais

RECONHECIMENTO FACIAL UTILIZANDO EIGENFACES

RECONHECIMENTO FACIAL UTILIZANDO EIGENFACES Universidade Federal do Rio de Janeiro Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia Programa de Engenharia de Sistemas e Computação Rio de Janeiro, RJ Brasil RECONHECIMENTO

Leia mais

Capítulo III Processamento de Imagem

Capítulo III Processamento de Imagem Capítulo III Processamento de Imagem Proc. Sinal e Imagem Mestrado em Informática Médica Miguel Tavares Coimbra Resumo 1. Manipulação ponto a ponto 2. Filtros espaciais 3. Extracção de estruturas geométricas

Leia mais