Avaliação de Modelos de Atenção Visual em Relação a Transformações Afins

Tamanho: px
Começar a partir da página:

Download "Avaliação de Modelos de Atenção Visual em Relação a Transformações Afins"

Transcrição

1 Avaliação de Modelos de Atenção Visual em Relação a Transformações Afins Milton Roberto Heinen e Paulo Martins Engel UFRGS Instituto de Informática CEP , Porto Alegre, RS mrheinen@inf.ufrgs.br, engel@inf.ufrgs.br Resumo Os modelos computacionais de atenção visual, originalmente desenvolvidos para explicar o funcionamento dos mecanismos de atenção biológicos, ultimamente vem sendo utilizados como uma espécie de front-end em aplicações de visão computacional. Porém os requisitos necessários neste tipo de aplicação são completamente diferentes dos originalmente propostos. Em especial, um sistema de visão computacional precisa ser relativamente insensível a transformações afins. Neste artigo são descritos diversos experimentos realizados com dois modelos de atenção existentes, e estes demonstraram que o modelo mais conhecido, chamado de NVT, é extremamente sensível a transformações afins. Além disso, um novo modelo de atenção visual, chamado de NLOOK, é proposto e validado segundo os mesmos critérios, que demonstraram sua menor sensibilidade a estes tipos de transformações. Além disso, o NLOOK consegue selecionar melhor as fixações de acordo com um critério de redundância. Desta forma, o modelo proposto é uma ferramenta bastante adequada para ser utilizada em aplicações de visão computacional. I. INTRODUÇÃO A quantidade de informações que chega ao sistema visual dos primatas estimada como sendo da ordem de 10 8 bits por segundo excede em muito a capacidade que o cérebro tem de processá-la e assimilá-la em sua experiência consciente [1]. A estratégia utilizada pelos sistemas biológicos para lidar com este excesso de informações é processar de forma detalhada somente algumas partes do campo visual, chamadas de regiões de interesse, e ignorar o restante das informações [2]. Segundo [3], a seleção das regiões de interesse é dirigida por um mecanismo competitivo de controle de atenção, que facilita a emergência de um vencedor entre diversos alvos potenciais, permitindo ao sistema processar informações relevantes à tarefa atual enquanto que suprime as informações irrelevantes que não podem ser processadas simultaneamente. O mecanismo de atenção do seres humanos é influenciado por dois principais tipos de informações: bottom-up ou exógenas (elementos da cena visual que se destacam dos demais) e top-down ou endógenas (informações do córtex cerebral que alteram o foco da atenção). Assim, o ser humano consegue ter um amplo campo de visão e uma elevada percepção dos detalhes sem no entanto exceder as capacidades de processamento do córtex visual. Inspirados nos sistemas de atenção biológicos, é possível desenvolver sistemas de atenção computacionais que sejam capazes de selecionar as regiões de interesse do campo visual a serem completamente processadas, e isto torna possível a análise de cenas complexas em tempo real com recursos limitados de processamento. Embora diversos modelos de atenção visual bottom-up já tenham sido propostos e implementados [1], [4] [7], a maioria destes modelos tem como foco principal entender o funcionamento dos mecanismos de atenção dos seres vivos, e como tal têm sido avaliados somente em relação à sua plausibilidade biológica [8]. Em um sistema de visão computacional é necessário, entre outras coisas, que o modelo de atenção seja relativamente insensível a transformações afins (rotação, translação, reflexão e escala). Porém, segundo [8], o NVT [1], que é o modelo de atenção visual mais conhecido e utilizado, é bastante sensível a transformações afins, e portanto não deve ser utilizado em aplicações de visão computacional. Este artigo apresenta um novo modelo computacional de atenção visual, chamado de NLOOK, que além de possuir um excelente desempenho computacional é bem menos sensível a transformações afins que os outros modelos analisados, em especial o NVT. Além disso, o NLOOK consegue selecionar as fixações de forma mais otimizada (menos redundante), e possibilita inclusive a seleção da escala aproximada das mesmas. Todos estes fatores tornam o modelo proposto uma excelente ferramenta, que pode vir a ser utilizada em diversas tarefas de visão computacional como por exemplo a identificação de objetos e a detecção de landmarks. Este artigo está estruturado da seguinte forma: a Seção II descreve dois modelos de atenção existentes, o NVT [1] e o SAFE [8]; a Seção III descreve as características do modelo proposto; a Seção IV descreve os experimentos realizados visando verificar a sensibilidade dos diversos modelos a transformações afins; e por último, a Seção V descreve as conclusões finais e as perspectivas futuras. II. TRABALHOS RELACIONADOS O primeiro modelo de atenção visual biologicamente plausível foi proposto originalmente em [4] e posteriormente aperfeiçoado em [1]. Ele é baseado na teoria da integração de feições (Feature Integration Theory FIT) [9] e na hipótese de que um mapa de saliências é capaz de fornecer uma estratégia eficiente no controle da atenção utilizando somente informações da própria cena visual (bottom-up) [10]. Neste modelo, chamado de NVT, a imagem de entrada é decomposta em três mecanismos de detecção de características préatentivas (intensidade, cores e orientações), que operam em paralelo sobre toda a cena visual. Estas três características são posteriormente unidas em um único mapa de saliências, que codifica os estímulos mais importantes da cena visual.

2 Para a criação dos mapas de características, no NVT são utilizadas operações lineares de centro-periferia aplicadas sobre pirâmides gaussianas [11] com níveis ϕ [0, 8], onde ϕ = 0 corresponde ao tamanho original da imagem. No modelo de [1], as operações lineares de centro-periferia são implementadas através da diferença entre os níveis finos e grosseiros das pirâmides gaussianas, onde o centro corresponde aos níveis c {2, 3, 4} e a periferia aos níveis s = c + δ, com δ {3, 4}. Os mapas resultantes deste processo são então reduzidos para o nível ϕ = 4 (mais grosseiro) e normalizados através do operador de normalização não linear N( ), que intensifica os mapas que possuem poucos picos salientes que se destacam dos demais [1], e em seguida estes mapas são combinados em um único mapa de características. Para a criação dos mapas de intensidade I no NVT, inicialmente os canais vermelho (red r), verde (green g) e azul (blue b) são extraídos da imagem colorida original. A partir destes canais é gerada a imagem I = (r + g + b)/3, e sobre esta imagem são aplicadas as operações de centro-periferia descritas anteriormente. Os mapas de cores C, que codificam a oponência espacial e cromática das cores vermelho/verde (RG) e azul/amarelo (BY ), são criados de forma similar aos mapas de intensidade. Inicialmente os canais r, g e b da imagem colorida de entrada são normalizados por I de forma a separar a cor da intensidade. Em seguida quatro canais de cores largamente sintonizados R, G, B e Y são criados. A partir destes quatro canais são criadas pirâmides gaussianas e realizadas as operações de centro-periferia, sendo que no centro são utilizadas as pirâmides de uma cor (R ou B) e na periferia as pirâmides de outra (G ou Y ). Para a criação dos mapas de orientação O(θ), são utilizadas pirâmides de Gabor [12] a partir da imagem I, com as orientações preferenciais θ {0, 45, 90, 135 }. Em seguida estes quatro mapas são unidos em um único mapa de orientações O. Após a construção dos mapas de características, estes são unidos para formarem um único mapa de saliências global S = (N(I) + N(C) + N(O))/3, que codifica os estímulos mais importantes da cena visual. Para a seleção dos focos de atenção (focus of attention FOA), também chamados de fixações, é utilizada uma rede neural do tipo o vencedor leva tudo (winner-take-all WTA). Esta rede neural utiliza neurônios do tipo integra e dispara [13] com forte inibição global, e um mecanismo de inibição de retorno (inhibition of return IOR) [14] evita que o foco de atenção (focus of attention FOA) fique sempre preso ao mesmo objeto [1]. Embora este modelo de atenção já tenha sido utilizado em aplicações de visão computational [15], [16], segundo [8] ele não é muito adequado de ser utilizado neste tipo de aplicação por ser muito sensível a transformações afins (reflexão, rotação, translação e escala) na imagem original. De fato, o NVT foi desenvolvido para propiciar um melhor entendimento dos mecanismos de atenção biológicos, e não para ser utilizado em aplicações de visão computacional. Em [8] foi proposto um novo modelo de atenção visual, chamado de SAFE, e através de diversos experimentos foi mostrado que ele é menos sensível a transformações afins que o NVT. As principais diferenças do SAFE em relação ao NVT são: (i) as operações de centro-periferia são realizadas utilizando diferenças de gaussianas (DoG) aplicadas sobre os diversos níveis das pirâmides gaussianas; (ii) os diferentes níveis dos mapas de características não são unidos entre si (toda a pirâmide é preservada); (iii) ao invés de apenas um mapa, uma pirâmide de saliências é criada; (iv) o modelo tenta selecionar tanto a posição quanto a escala aproximada dos focos de atenção; (v) não é utilizada uma rede WTA nem IOR o SAFE simplesmente seleciona os máximos locais mais relevantes em cada um dos níveis da pirâmide de saliências; (vi) os mapas de características são suavizados por um kernel gaussiano com desvio padrão 22.6; (vii) ao invés de filtros de Gabor, o SAFE utiliza máscaras verticais de horizontais de Ando [17], que tornam os mapas de orientação muito similares aos mapas de intensidade, ou seja, estes mapas salientam as bordas ao invés de orientações. Analisando o desempenho do SAFE, percebe-se que, embora ele seja menos sensível a transformações afins, esta insensibilidade é obtida a custo de grandes kernels gaussianos (DoGs com desvios de e 22.6), o que em conjunto com a suavização posterior remove praticamente todos os detalhes finos da imagem. Além disso, os FOAs selecionados pelo SAFE costumam ser muito próximos entre si, ocorrendo inclusive diversas sobreposições entre FOAs de níveis diferentes. Outro problema é que os tempos de processamento do SAFE são bastante elevados, da ordem de dezenas de segundos em um computador típico, o que impede a sua utilização em tempo real. Assim, embora possua algumas vantagens em relação ao NVT, o SAFE apresenta diversas restrições que impedem seu uso em aplicações de visão computacional, especialmente em tempo real. Outros modelos de atenção chegaram a ser cogitados [7], [18], mas estes se mostraram tão insensíveis a transformações afins quanto o NVT. Assim, optou-se pela criação de um novo modelo de atenção visual, chamado de NLOOK, que é descrito detalhadamente na próxima seção. III. MODELO PROPOSTO A Figura 1 mostra a arquitetura do modelo proposto neste artigo, chamado de NLOOK 1 [19], [20], que é inspirado na conceitos de scale-space (espaço-escala) [21], também utilizados por Lowe nos descritores SIFT (Scale Invariant Feature Transform) [22]. Ou seja, diferentemente de outros modelos de atenção visual, o NLOOK utiliza scale-spaces ao invés de apenas pirâmides gaussianas para as operações de centro-periferia, o que torna o modelo proposto menos sensível a transformações afins que os demais. Além disso, embora esteja fora do escopo deste artigo, o modelo proposto consegue selecionar a escala aproximada dos FOAs de forma mais eficiente que o SAFE. Para a criação de um scale-space, a imagem de entrada é inicialmente sub-amostrada em diversos oitavos [22], e as imagens iniciais de cada oitavo correspondem a uma pirâmide gaussiana, ou seja, cada oitavo possui metade do 1 NLOOK

3 Fig. 1. Modelo proposto tamanho de seu antecessor e o oitavo 0 corresponde à imagem original. Em seguida são criadas diversas escalas para cada oitavo através da convolução sucessiva das imagens iniciais com kernels gaussianos. Por último, as diferenças de gaussianas (DoG) são obtidas através da subtração absoluta das escalas adjacentes de cada oitavo. A Figura 2, adaptada de [22], ilustra este processo. Fig. 2. Diferença de gaussianas implementada utilizando scale-spaces O modelo proposto neste artigo utiliza o número máximo possível de oitavos, além do qual a imagem inicial deste oitavo seria menor que os kernels gaussianos. Isto corresponde a cinco oitavos para uma imagem de pixels e seis oitavos para uma imagem de pixels. Segundo [22], o número ideal de escalas por oitavo a ser utilizado é três. Assim, os kernels gaussianos utilizados no NLOOK para as escalas 0, 1 e 2 possuem desvios de , e , respectivamente. Estes são os mesmos valores utilizados nos descritores SIFT de Lowe [22]. Para a criação dos mapas de intensidade, a imagem original é convertida para uma imagem em tons de cinza I, e as diferenças de gaussianas são geradas para esta imagem utilizando scale-spaces. Assim, para uma imagem típica de pixels são criadas 12 diferenças de gaussianas (duas por oitavo). Em seguida cada uma destas diferenças de gaussianas são normalizadas pela subtração da média e divisão do resultado pelo desvio padrão. Como ocorre no SAFE, os diferentes oitavos e escalas não são unidos em um único mapa, ou seja, todas as DoGs são preservadas. Para a criação dos mapas de cores, inicialmente são gerados quatro scale-spaces para os canais de cores largamente sintonizados R (vermelho), G (verde), B (azul) e Y (amarelo). A criação destes quatro canais é descrita de forma detalhada em [1]. Em seguida são geradas as diferenças de gaussianas entre os diferentes canais, ou seja, para os mapas RG as subtrações absolutas ocorrem entre os canais R 0 B 1 e R 1 B 2 de cada oitavo (onde 0, 1 e 2 são as escalas), e para os mapas BY ocorrem entre s canais B 0 Y 1 e B 1 Y 2 de cada oitavo. Assim, são criados dois scale-spaces de oposição de cores: RG e BY. Para a criação dos mapas de orientação são utilizados filtros de Gabor, que segundo [23] conseguem aproximar o perfil de sensibilidade dos neurônios sensíveis a orientação espacial presentes no córtex visual primário dos primatas. A criação destes mapas é semelhante a dos mapas de intensidade, porém antes da convolução com os kernels gaussianos de cada escala a imagem inicial de cada oitavo é convolucionada com os filtros Gabor. Assim como no NVT, no modelo proposto são utilizadas quatro orientações preferenciais θ {0, 45, 90, 135 }, ou seja, o modelo possui quatro scalespaces de orientação. As DoGs destes quatro scale-spaces são então normalizadas e somadas, dando origem assim a um único scale-space de orientações. Após a criação dos scale-spaces de características, estes são normalizados e somados em um único scale-space de saliências, que possui diversas DoGs (12 para uma imagem pixels). Estas DoGs são então redimensionadas para a escala 0 (tamanho original da imagem) e somadas, formando assim um único mapa de saliências. Ao contrário do NVT, no qual o mapa de saliências possui escala 4 (mais grosseira), no NLOOK optou-se por expandir as DoGs para a escala 0 para que não houvesse perda de informações. Esta técnica também é adotada em [7]. A função do mapa de saliências único, que não existe no SAFE, é servir como um resumo do scale-space de saliências, permitindo assim o uso de um mecanismo de inibição de retorno (IOR) único. Após a criação do mapa de saliências único, este é percorrido pelo foco de atenção da seguinte forma: inicialmente o ponto mais saliente deste mapa é encontrado, e o scale-space de saliências é então analisado para que seja descoberto o oitavo/escala que mais contribuiu para a saliência deste ponto. Em caso de empate é utilizado o menor (mais fino) oitavo/escala. O mecanismo de inibição de retorno, que possui o formato de uma gaussiana invertida, é então aplicado sobre o mapa de saliências único, sendo que o diâmetro deste depende do oitavo/escala mais relevante para o FOA atual. Mais precisamente, a seguinte fórmula foi desenvolvida para o cálculo do desvio padrão σ do IOR: ( σ = T/ F o+s/(e 1)) (1) onde T é o tamanho básico do IOR (15 no modelo proposto), E é o número de escalas (3 no modelo proposto) e F = 2 1 /E é o fator de escala, que determina a taxa de crescimento do IOR, e o e s são o oitavo e a escala mais relevantes para o FOA atual. Quanto maior o oitavo/escala (mais grosseiro), maior o diâmetro do IOR. O protótipo do NLOOK foi implementado na linguagem de programação ANSI C++, e utiliza a OpenCV (Open Source Computer Vision Library), que é uma biblioteca de processamento de imagens que possui uma coleção de

4 funções que implementam diversas rotinas de acesso a dispositivos de hardware, processamento de imagens e visão computacional de forma paralela (através do hardware gráfico) e eficiente. Além da OpenCV, o protótipo implementado utiliza threads POSIX para garantir a execução paralela dos mapas de características em plataformas multi-processadas. IV. E XPERIMENTOS REALIZADOS Nesta seção são descritos os experimentos realizados visando verificar a sensibilidade do modelo proposto em relação às transformações afins, bem como comparar o seu desempenho com o desempenho do NVT e do SAFE. Para isto, foram selecionadas 15 imagens de pixels, mostradas na Figura 3 (por questões de espaço, algumas imagens desta figura foram rotacionadas em 90 ). Estas imagens foram selecionadas de forma a conter elementos variados como cenas naturais, pessoas, ambientes internos e externos, placas de sinalização, etc., para que fosse possível validar os modelos nas mais variadas condições. Sobre estas imagens foram aplicadas as seguintes transformações: Reflexões vertical e horizontal; Rotações de 45 a 315, em intervalos de 45 ; Translação vertical de 1, 4, 9, 16 e 27 pixels; Translação horizontal de 1, 4, 9, 16 e 27 pixels; Alteração de escala com os fatores: 1.4 (aumento de 40%), 1.2, 1.1, 0.9, 0.8 e 0.6 (redução de 40%); Totalizando 25 transformações distintas para cada imagem. Um modelo de atenção insensível a transformações afins deverá encontrar as mesmas fixações nas imagens originais e transformadas estas apenas estarão deslocadas de acordo com a transformação aplicada. Para evitar que parte das informações fossem perdidas, cada uma das imagens originais foi acrescida de bordas cinzentas, e a fronteira entre a imagem original e as bordas foi levemente desfocada para evitar que esta região ficasse mais saliente que o restante da imagem. O tamanho das imagens com bordas é de pixels, e assim foram utilizados 6 oitavos no NLOOK. Para avaliar a performance dos três modelos de atenção em relação às transformações aplicadas, foram utilizadas as seguintes medidas de desempenho (adaptadas de [8]): taxa de erros grosseiros (gross errors GE) e deslocamento médio (mean drift MD). A taxa de erros grosseiros mede o percentual de fixações da imagem original que não são encontradas na imagem transformada, aplicando-se as devidas transformações nas posições dos FOAs originais e levandose em conta uma margem de erro de 18 pixels (a mesma utilizada em [8]). Já o deslocamento médio mede a distância média em pixels entre a posição desejada para as fixações, que é a posição do FOA na imagem original deslocada de acordo com a transformação aplicada, em relação à posição das fixações obtidas na imagem transformada, ou seja: MD = 1 PN D(F d(n), F o(n)) N n=1 (2) onde N é o número de FOAs utilizado (10 nos experimentos realizados), F d(n) é a posição desejada do FOA n, F o(n) é Fig. 3. Imagens utilizadas nos experimentos a posição obtida do FOA n na imagem transformada, e D( ) é a distância euclidiana entre F d(n) e F o(n). Assim, cada um dos modelos de atenção foi testado com as imagens da Figura 3 e suas respectivas versões transformadas, e para cada um destes experimentos foram calculadas as duas medidas de desempenho. A Tabela I mostra a média dos resultados obtidos com estas imagens em cada dos modelos de atenção analisados. A primeira coluna descreve a transformação aplicada. As demais colunas trazem a média dos valores do deslocamento médio (MD) e dos erros grosseiros (GE) sobre todas as imagens obtidos com os três modelos de atenção. As últimas duas linhas trazem a média e o desvio padrão das respectivas colunas, calculados em relação às operações realizadas em todas as imagens. Em [8] já haviam sido descritos experimentos similares que avaliaram o NVT e SAFE quanto a transformações afins, porém haviam sido utilizadas somente quatro imagens, das quais apenas duas eram de cenas naturais, e uma destas era bastante escura. As Figuras 4(a) e 4(b) mostram, respectivamente, os intervalos de confiança (com um grau de confiança de 95%) do deslocamento médio (MD) e dos erros grosseiros (GE) obtidos sobre todas as operações realizadas. Conforme já havia sido provado em [8], os experimentos da Tabela I demonstram que o NVT é bastante sensível a transformações afins, não sendo adequado para ser utilizado em aplicações de visão computacional. Já o SAFE e o NLOOK apresentaram resultados melhores nos dois crité-

5 TABLE I R ESULTADOS OBTIDOS Transform. Reflexão v. Reflexão h. Rot. 45 Rot. 90 Rot. 135 Rot. 180 Rot. 225 Rot. 270 Rot. 315 Transl. v. 1 Transl. v. 4 Transl. v. 9 Transl. v. 16 Transl. v. 27 Transl. h. 1 Transl. h. 4 Transl. h. 9 Transl. h. 16 Transl. h. 27 Escala 1.4 Escala 1.2 Escala 1.1 Escala 0.9 Escala 0.8 Escala 0.6 Média Desv. padrão NVT MD GE % % % % % % % % % % % % % % % % % % (a) Desloc. médio Fig. 4. SAFE MD GE % % % % % % % % % % % % (b) Erros grosseiros NLOOK MD GE % % % % % % A Figura 5 mostra o desempenho dos três modelos de atenção utilizando uma imagem original e sua respectiva versão rotacionada em 45 (parte das bordas foi retirada para melhorar a visualização). Percebe-se que os FOAs selecionados pelo NLOOK, levando-se em conta as transformações aplicadas, foram os mesmos em ambas as versões da imagem (original e rotacionada), ou seja, o NLOOK se mostrou insensível à transformação aplicada. O SAFE apresentou um desempenho similar ao NLOOK, mas o NVT selecionou FOAs diferentes para cada uma das versões da imagem, e a ordem das fixações também é diferente. Ou seja, o NVT se mostrou bastante sensível à rotação de 45 desta imagem. (a) Imagem original NVT (b) Rotação de 45 NVT (c) Imagem original SAFE (d) Rotação de 45 SAFE (e) Imagem original NLOOK (f) Rotação de 45 NLOOK (c) Distância mínima Intervalos de confiança a 95% rios analisados, sendo que o desempenho do NLOOK foi estatisticamente superior (os intervalos de confiança não se sobrepõe). Ou seja, o NLOOK apresenta um sensibilidade a transformações afins muito menor que a dos demais modelos. Com relação à complexidade de tempo, o NVT leva poucos segundos para determinar as fixações de cada imagem (em geral menos de três segundos), enquanto que o SAFE leva em média 34 segundos para analisar cada uma das imagens de pixels em um computador típico2. Já o NLOOK consegue analisar cada imagem em aproximadamente 100 milisegundos, o que o permite que o mesmo seja utilizado em aplicações de tempo real. 2 Todos os experimentos foram realizados em um computador Dell Optiplex 755, processador Intel(R) Core(TM)2 Duo CPU de 2.33GHz, 1.95GB de Memória RAM, GPU Intel e sistema operacional Linux de 64 bits. Fig. 5. Comparação visual dos três modelos de atenção Outro ponto que pode ser percebido na Figura 5 é que os FOAs selecionados pelo SAFE são bastante redundantes, existindo diversas sobreposições entre eles, e o mesmo ocorre com o NVT. Já com o NLOOK isto não acontece, ou seja, o modelo proposto consegue analisar a imagem de forma mais homogênea, não se detendo em apenas poucas partes da imagem. Isto ocorre porque o mapa de saliências é gerado

6 pelo NLOOK na escala mais fina (o NVT utiliza a escala mais grosseira) e ao uso de kernels gaussianos menores, que tornam o mapa de saliências muito mais rico e detalhado. Estes dois fatores, aliados ao mecanismo de inibição de retorno proposto na Equação 1, tornam a seleção dos FOAs do NLOOK bem mais otimizada que a dos demais modelos em relação a este critério. Para quantificar a qualidade dos FOAs selecionados em relação ao grau de sobreposição, foi utilizada a seguinte medida de desempenho: para cada um dos FOAs selecionados, foi calculada a distância deste em relação ao seu vizinho mais próximo, e no final foi calculada a média destas distâncias. Um modelo com alto grau de sobreposição irá apresentar distâncias menores que um modelo com baixo grau de sobreposição. Esta medida de desempenho foi aplicada aos FOAs selecionados pelos três modelos para as 15 imagens originais (não transformadas), e os resultados foram os seguintes: NVT: Média de e desvio padrão de 27.95; SAFE: Média de e desvio padrão de 26.17; NLOOK: Média de e desvio padrão de 15.59; A Figura 4(c) mostra os intervalos de confiança (95%) destes resultados. Os resultados apresentados pelo NVT e pelo NLOOK foram bastante similares, não sendo possível afirmar que um modelo seja superior ao outro neste critério (os intervalos de confiança se sobrepõe). Já o SAFE apresentou resultados bastante inferiores, o que evidencia que os FOAs selecionados por este modelo são mais redundantes que os FOAs selecionados pelos demais modelos. A Figura 6 mostra outra figura na qual isto é evidente. Fig. 6. (a) Fixações do SAFE (b) Fixações do NLOOK Comparação das fixações obtidas pelo SAFE e pelo NLOOK V. CONCLUSÕES E PERSPECTIVAS Este artigo apresentou um novo modelo de atenção visual, chamado de NLOOK, que foi projetado especialmente para ser utilizado em aplicações de visão computacional. Este modelo, que possui um excelente desempenho computacional, é bem menos sensível às transformações afins que os outros modelos analisados. Além disso, o NLOOK consegue selecionar as fixações de forma bastante otimizada segundo um critério de redundância, e todos esses fatores tornam o modelo proposto mais adequado de ser utilizado em aplicações de visão computacional em tempo real. As perspectivas futuras incluem: (i) melhorar o desempenho do modelo proposto em relação as variações de escala, que em nenhum dos modelos analisados foi satisfatória; (ii) utilização de informações top-down no processo de elaboração dos mapas de saliências; e (iii) utilizar do modelo proposto em aplicações de visão computacional, como por exemplo a identificação de objetos. AGRADECIMENTOS Agradecemos ao CNPq pelo apoio dado a este trabalho. REFERÊNCIAS [1] L. Itti, C. Koch, and E. Niebur, A model of saliency-based visual attention for rapid scene analysis, IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 20, pp , Nov [2] E. Niebur and C. Koch, Computational architectures for attention, ser. The Attentive Brain. Cambridge, MA: MIT Press, 1998, pp [3] R. Desimone and J. Duncan, Neural mechanisms of selective visual attention, Annual Reviews Neuroscience, vol. 18, pp , [4] C. Koch and S. Ullman, Shifts in selective visual attention: Toward the underlying neural circuitry, Human Neurobiology, vol. 4, no. 4, pp , [5] J. K. Tsotsos, S. M. Culhane, W. Y. K. Wai, Y. Lai, N. Davis, and F. Nuflo, Modeling visual attention via selective tuning, Artificial Intelligence, vol. 78, no. 1-2, pp , [6] F. Orabona, G. Metta, and G. Sandini, Object-based visual attention: a model for a behaving robot, in Proc. 3rd Int. Workshop on Attention and Performance in Comp. Vision (WAPCV), San Diego, CA, [7] S. Frintrop, VOCUS: A visual attention system for object detection and goal-directed search, Ph.D. Dissertation, Rheinische Friedrich- Wilhelms-Universitat Bonn, Bonn, Germany, Jan [8] B. A. Draper and A. Lionelle, Evaluation of selective attention under similarity transformations, Computer Vision and Image Understanding, vol. 100, pp , [9] A. M. Treisman and G. Gelade, A feature-integration theory of attention, Cognitive Psychology, vol. 12, pp , [10] L. Itti, Models of Bottom-Up Attention and Saliency, ser. Neurobiology of Attention. San Diego, CA: Elsevier Press, Jan. 2005, pp [11] P. J. Burt, T. Hong, and E. H. Adelson, The laplacian pyramid as a compact image code, IEEE Trans. Communications, vol. 31, no. 4, pp , Apr [12] S. Greenspan, S. Belongie, R. Goodman, P. Perona, S. Rakshit, and C. H. Anderson, Overcomplete steerable pyramid filters and rotation invariance, in Proc. IEEE Computer Vision and Pattern Recognition (CVPR), Seattle, WA, June 1994, pp [13] Y.-H. Liu and X.-J. Wang, Spike-frequency adaptation of a generalized leaky integrate-and-fire model neuron, Journal of Computational Neuroscience, vol. 10, pp , [14] R. M. Klein, Inhibition of return, Trends in Cognitive Sciences, vol. 4, no. 4, pp , Apr [15] D. Walther, L. Itti, M. Riesenhuber, T. Poggio, and C. Koch, Attentional selection for object recognition a gentle way, in Proc. 2nd Workshop on Biologically Motivated Comp. Vision (BMCV), vol Tubingen, Germany: LNCS, Springer-Verlag, 2002, pp [16] V. Navalpakkam and L. Itti, A goal oriented attention guidance model, in Proc. 2nd Workshop on Biologically Motivated Computer Vision (BMCV 02), Tuebingen, Germany, 2002, pp [17] S. Ando, Image field categorization and edge/corner detection from gradient covariance, IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 22, no. 2, pp , [18] N. Ouerhani, A. Bur, and H. Hügli, Visual attention-based robot selflocalization, in Proc. European Conf. Mobile Robotics (ECMR 05), Ancona, Italy, Sept. 2005, pp [19] M. R. Heinen and P. M. Engel, Visual selective attention model for robot vision, in Proc. 5th IEEE Latin American Robotics Symposium (LARS 08). Salvador, BH, Brazil: IEEE press, Oct [20], Modelo de atenção visual seletiva para aplicações em tempo real, in Proc. IV Workshop on PhD Thesis in Artificial Intelligence (WTDIA 08), ser. LNCS. Salvador, BH: Springer-Verlag, Oct [21] A. P. Witkin, Scale-space filtering, in Proc. Int. Joint Conf. Artificial Intelligence, Karlsruhe, Germany, 1983, pp [22] D. Lowe, Distinctive image features from scale-invariant keypoints, Int. Journal of Computer Vision, vol. 60, no. 2, pp , Jan [23] J. G. Daugman, Complete discrete 2-d gabor transforms by neural networs for image analysis and compression, IEEE Trans. Acoustics, Speech, and Signal Proc., vol. 36, no. 7, pp , July 1988.

NLOOK: Modelo de Atenção Visual Relativamente Insensível a Transformações Afins

NLOOK: Modelo de Atenção Visual Relativamente Insensível a Transformações Afins NLOOK: Modelo de Atenção Visual Relativamente Insensível a Transformações Afins Milton Roberto Heinen 1 e Paulo Martins Engel 1 1 Instituto de Informática Universidade Federal do Rio Grande do Sul (UFRGS)

Leia mais

Modelo de Atenção Visual Seletiva

Modelo de Atenção Visual Seletiva Modelo de Atenção Visual Seletiva Milton Roberto Heinen 1 e Paulo Martins Engel 1 1 Instituto de Informática Universidade Federal do Rio Grande do Sul (UFRGS) Caixa Postal 15064 CEP 91501-970 Porto Alegre

Leia mais

Anais do IX Congresso Brasileiro de Redes Neurais / Inteligência Computacional (IX CBRN) CATEGORIZAÇÃO DE OBJETOS UTILIZANDO ATENÇÃO VISUAL

Anais do IX Congresso Brasileiro de Redes Neurais / Inteligência Computacional (IX CBRN) CATEGORIZAÇÃO DE OBJETOS UTILIZANDO ATENÇÃO VISUAL CATEGORIZAÇÃO DE OBJETOS UTILIZANDO ATENÇÃO VISUAL MILTON ROBERTO HEINEN, PAULO MARTINS ENGEL Instituto de Informática, Universidade Federal do Rio Grande do Sul (UFRGS) Caixa Postal 15064, 91501-970 Porto

Leia mais

Modelo de Atenção Visual Seletiva para Aplicações em Tempo Real

Modelo de Atenção Visual Seletiva para Aplicações em Tempo Real Modelo de Atenção Visual Seletiva para Aplicações em Tempo Real Milton Roberto Heinen 1 e Paulo Martins Engel 1 Universidade Federal do Rio Grande do Sul Instituto de Informática Caixa Postal 15064, CEP

Leia mais

Descritores de Imagens

Descritores de Imagens Descritores de Imagens André Tavares da Silva PPGCA/UDESC Outubro de 2017 André Tavares da Silva (PPGCA/UDESC) Descritores de Imagens Outubro de 2017 1 / 18 Descritores Locais e Frameworks SIFT SURF Viola-Jones

Leia mais

Face Recognition using RGB-D Images

Face Recognition using RGB-D Images Face Recognition using RGB-D Images Helder C. R. de Oliveira N.USP: 7122065 Polyana Nunes N.USP: 9043220 Sobre o Artigo Publication: 2013 IEEE Sixth International Conference Author(s) Goswami, G. (Índia

Leia mais

Descritores de Imagem

Descritores de Imagem Descritores de Imagem André Tavares da Silva 31 de março de 2014 1 Descritores de imagem (continuação) 1.1 Frameworks de detecção de objetos SIFT (scale-invariant features transform) (Lowe, 1999) SIFT

Leia mais

Sistema de Reconhecimento de Logotipos

Sistema de Reconhecimento de Logotipos Sistema de Reconhecimento de Logotipos Fellipe Duarte, Saulo T. Oliveira {duartefellipe,sto}@cos.ufrj.br Relatório Técnico, Introdução ao Processamento de Imagens Programa de Engenharia de Sistemas e Computação

Leia mais

SIFT - Scale Invariant Feature Transform

SIFT - Scale Invariant Feature Transform SIFT - Scale Invariant Feature Transform Daniel Pinto Coutinho Prof. Ricardo Marroquim 1 Introdução A detecção de pontos de interesse em uma figura é uma tarefa muito comum no campo de processamento de

Leia mais

T4 Processamento de Imagem

T4 Processamento de Imagem T4 Processamento de Imagem Proc. Sinal e Imagem Mestrado em Informática Médica Hélder Filipe Pinto de Oliveira Resumo 1. Manipulação ponto a ponto 2. Conetividade 3. Filtros espaciais 4. Extração de estruturas

Leia mais

Processamento de Imagens COS756 / COC603

Processamento de Imagens COS756 / COC603 Processamento de Imagens COS756 / COC603 aula 13 - Transformada de Hough e SIFT Antonio Oliveira Ricardo Marroquim 1 / 41 aula de hoje descritores Transformada de Hough SIFT 2 / 41 transformada de Hough

Leia mais

MouseCam: aplicação de controle do mouse via câmera

MouseCam: aplicação de controle do mouse via câmera MouseCam: aplicação de controle do mouse via câmera Introdução ao Processamento de Imagens COS756 PESC/COPPE/UFRJ 2013 1 Renan Garrot garrot@cos.ufrj.br 1. Introdução O processo de tracking por vídeo consiste

Leia mais

Anotador automático de placas de publicidade em vídeos esportivos

Anotador automático de placas de publicidade em vídeos esportivos MAC0499 - Trabalho de Formatura Supervisionado Professor: Carlos Eduardo Ferreira Universidade de São Paulo Instituto de Matemática e Estatística Aluno: Ricardo Augusto Fernandes Orientador: Prof. Dr.

Leia mais

2 SIFT (Scale Invariant Feature Transform)

2 SIFT (Scale Invariant Feature Transform) SIFT (Scale Invariant Feature Transform) O SIFT é um algoritmo de visão computacional proposto e publicado pelo pesquisador David Lowe (Lowe, 1999), professor do departamento de Ciência da Computação na

Leia mais

Igor dos Santos Montagner Orientador: Roberto Marcondes Cesar Junior 20/09/2010

Igor dos Santos Montagner Orientador: Roberto Marcondes Cesar Junior 20/09/2010 Análise e conversão de tablóides de promoções Igor dos Santos Montagner Orientador: Roberto Marcondes Cesar Junior 20/09/2010 1 1 Introdução Com os avanços na área de computação e a demanda crescente por

Leia mais

Implementação do algoritmo SIFT para detecção de objetos em imagens.

Implementação do algoritmo SIFT para detecção de objetos em imagens. Universidade Federal do Rio de Janeiro Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia Programa de Engenharia de Sistemas e Computação Rio de Janeiro, RJ - Brasil Implementação

Leia mais

T4.1 Processamento de Imagem

T4.1 Processamento de Imagem T4.1 Processamento de Imagem Proc. Sinal e Imagem Mestrado em Informática Médica Miguel Tavares Coimbra Resumo 1. Manipulação ponto a ponto 2. Filtros espaciais 3. Extracção de estruturas geométricas 4.

Leia mais

AVALIAÇÃO QUALITATIVA DE DETECÇÃO DE BORDAS EM IMAGENS DE RADIOGRAFIA PERIAPICAIS

AVALIAÇÃO QUALITATIVA DE DETECÇÃO DE BORDAS EM IMAGENS DE RADIOGRAFIA PERIAPICAIS AVALIAÇÃO QUALITATIVA DE DETECÇÃO DE BORDAS EM IMAGENS DE RADIOGRAFIA PERIAPICAIS Hedlund Erik Martins Távora 1, John Hebert Da Silva Felix 2, Darleison Rodrigues Barros Filho 3, Fausta Joaquim Faustino

Leia mais

Capítulo III Processamento de Imagem

Capítulo III Processamento de Imagem Capítulo III Processamento de Imagem Proc. Sinal e Imagem Mestrado em Informática Médica Miguel Tavares Coimbra Resumo 1. Manipulação ponto a ponto 2. Filtros espaciais 3. Extracção de estruturas geométricas

Leia mais

FILTROS ESPACIAIS PASSA-BAIXA

FILTROS ESPACIAIS PASSA-BAIXA UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL PROGRAMA DE PÓS-GRADUAÇÃO EM COMPUTAÇÃO CMP65 - INTRODUÇÃO AO PROCESSAMENTO DE IMAGENS PROFESSOR JACOB SCARCHANSKI FILTROS ESPACIAIS PASSA-BAIXA POR DANIEL NEHME

Leia mais

IDENTIFICAÇÃO DE MARCADORES DE PAVIMENTAÇÃO NA ORIENTAÇÃO DE CEGOS. André Zuconelli 1 ; Manassés Ribeiro 2

IDENTIFICAÇÃO DE MARCADORES DE PAVIMENTAÇÃO NA ORIENTAÇÃO DE CEGOS. André Zuconelli 1 ; Manassés Ribeiro 2 IDENTIFICAÇÃO DE MARCADORES DE PAVIMENTAÇÃO NA ORIENTAÇÃO DE CEGOS André Zuconelli 1 ; Manassés Ribeiro 2 INTRODUÇÃO As tecnologias assistivas têm a finalidade de auxiliar pessoas com deficiência a alcançar

Leia mais

Processamento Digital de Imagens

Processamento Digital de Imagens Ciência da Computação Processamento Digital de Imagens Tópicos Detecção de Pontos Isolados Detecção de Linhas Prof. Sergio Ribeiro 2 Operações lógicas e aritméticas orientadas a vizinhança utilizam o conceito

Leia mais

METODOLOGIA PARA A QUANTIZAÇÃO DE CORES PELO MÉTODO SMCb: INTRODUÇÃO E EXEMPLOS DE RESULTADOS

METODOLOGIA PARA A QUANTIZAÇÃO DE CORES PELO MÉTODO SMCb: INTRODUÇÃO E EXEMPLOS DE RESULTADOS METODOLOGIA PARA A QUANTIZAÇÃO DE CORES PELO MÉTODO SMCb: INTRODUÇÃO E EXEMPLOS DE RESULTADOS Marcelo Zaniboni 1, Osvaldo Severino Junior 2 1: Universitário do curso de Ciência da Computação, Faculdade

Leia mais

SEMINÁRIO DOS ARTIGOS:

SEMINÁRIO DOS ARTIGOS: SEMINÁRIO DOS ARTIGOS: Text Detection and Character Recognition in Scene Images with Unsupervised Feature Learning End-to-End Text Recognition with Convolutional Neural Networks Fernanda Maria Sirlene

Leia mais

Image Descriptors: local features

Image Descriptors: local features Image Descriptors: local features Image Processing scc0251 www.icmc.usp.br/ moacir moacir@icmc.usp.br ICMC/USP São Carlos, SP, Brazil 2011 Moacir Ponti Jr. (ICMCUSP) Image Descriptors: local features 2011

Leia mais

Métodos de Extração de Características

Métodos de Extração de Características 1. Introdução Métodos de Extração de Características A Interpretação ou entendimento de uma cena demanda o reconhecimento de seus objetos. Reconhecimento de objetos ou padrões contidos em uma cena -> é

Leia mais

Extração de objetos de interesse em imagens digitais utilizando a biblioteca de Visão Computacional OpenCV

Extração de objetos de interesse em imagens digitais utilizando a biblioteca de Visão Computacional OpenCV Extração de objetos de interesse em imagens digitais utilizando a biblioteca de Visão Computacional OpenCV Izadora Aparecida RAMOS 1,3,4 ; Servílio Souza de ASSIS 1,3,4 ; Bruno Alberto Soares OLIVEIRA

Leia mais

Aula 7 - Representação e Descrição de Estruturas Bi-dimensionais. Prof. Adilson Gonzaga

Aula 7 - Representação e Descrição de Estruturas Bi-dimensionais. Prof. Adilson Gonzaga Aula 7 - Representação e Descrição de Estruturas Bi-dimensionais Prof. Adilson Gonzaga 1 Introdução Objetos ou Segmentos são representados como uma coleção de pixels em uma imagem. Para o reconhecimento

Leia mais

Aprendizagem de Máquinas. Extração de Características

Aprendizagem de Máquinas. Extração de Características Universidade Federal do Paraná (UFPR) Departamento de Informática (DInf) Aprendizagem de Máquinas Extração de Características David Menotti, Ph.D. http://web.inf.ufpr.br/menotti 1 Objetivos Entender os

Leia mais

Feature Description (SIFT + SURF) Prof. Dr. Geraldo Braz Junior

Feature Description (SIFT + SURF) Prof. Dr. Geraldo Braz Junior Feature Description (SIFT + SURF) Prof. Dr. Geraldo Braz Junior Feature Detection 1. Encontre um conjunto de keypoints 2. Defina uma região ao redor do keypoint 3. Normalize a região 4. Extraia caracterísfcas

Leia mais

DESENVOLVIMENTO DE SISTEMA PARA GERAÇÃO DE MOSAICO DE IMAGENS VISANDO LOCALIZAÇÃO E NAVEGAÇÃO DE ROBÔS MÓVEIS

DESENVOLVIMENTO DE SISTEMA PARA GERAÇÃO DE MOSAICO DE IMAGENS VISANDO LOCALIZAÇÃO E NAVEGAÇÃO DE ROBÔS MÓVEIS DESENVOLVIMENTO DE SISTEMA PARA GERAÇÃO DE MOSAICO DE IMAGENS VISANDO LOCALIZAÇÃO E NAVEGAÇÃO DE ROBÔS MÓVEIS Edson CAVALCANTI Neto (1), Guilherme Costa HOLANDA (1), Antonio Themoteo VARELA (1), André

Leia mais

Universidade Federal do Rio de Janeiro. Flávio Henrique Schuindt da Silva. Estimativa de Fluxo Ótico com o método de Lukas-Kanade

Universidade Federal do Rio de Janeiro. Flávio Henrique Schuindt da Silva. Estimativa de Fluxo Ótico com o método de Lukas-Kanade Universidade Federal do Rio de Janeiro Programa de Engenharia de Sistemas e Computação Introdução ao Processamento de Imagens Flávio Henrique Schuindt da Silva Estimativa de Fluxo Ótico com o método de

Leia mais

Image Descriptors: color

Image Descriptors: color Image Descriptors: color Image Processing scc0251 www.icmc.usp.br/ moacir moacir@icmc.usp.br ICMC/USP São Carlos, SP, Brazil 2011 Moacir Ponti Jr. (ICMCUSP) Image Descriptors: color 2011 1 / 29 Agenda

Leia mais

Classificação de Padrões por Blocos em Imagens Não Segmentadas de Tomografia Computadorizada

Classificação de Padrões por Blocos em Imagens Não Segmentadas de Tomografia Computadorizada Classificação de Padrões por Blocos em Imagens Não Segmentadas de Tomografia Computadorizada Aline Dartora Prof. David Menotti Departamento de Informática Universidade Federal do Paraná (UFPR) 23 de outubro

Leia mais

5 Estudo de Caso e Resultados

5 Estudo de Caso e Resultados 5 Estudo de Caso e Resultados 5.1. Introdução Finalizado o desenvolvimento da ferramenta, é indispensável testar suas funcionalidades e a eficácia da aplicação conjunta dos seus módulos de geração de experimentos

Leia mais

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Extração de Características

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Extração de Características Universidade Federal do Paraná Departamento de Informática Reconhecimento de Padrões Extração de Características Luiz Eduardo S. Oliveira, Ph.D. http://lesoliveira.net Objetivos Entender os conceitos de

Leia mais

Aprendizado de Máquina. Combinando Classificadores

Aprendizado de Máquina. Combinando Classificadores Universidade Federal do Paraná (UFPR) Departamento de Informática (DInf) Aprendizado de Máquina Combinando Classificadores David Menotti, Ph.D. web.inf.ufpr.br/menotti Introdução O uso de vários classificadores

Leia mais

2 Trabalhos Relacionados

2 Trabalhos Relacionados 2 Trabalhos Relacionados Este capítulo apresenta os algoritmos já existentes que são utilizados nesta dissertação para obter pontos homólogos entre duas imagens de um par estéreo. Pode-se classificar essas

Leia mais

Análise e conversão de tabloides de. Igor dos Santos Montagner Orientador: Prof. Dr. Roberto Marcondes Cesar Junior. promoções

Análise e conversão de tabloides de. Igor dos Santos Montagner Orientador: Prof. Dr. Roberto Marcondes Cesar Junior. promoções Análise e conversão de tabloides de Igor dos Santos Montagner Orientador: Prof. Dr. Roberto Marcondes Cesar Junior promoções Agenda Problema Objetivo nal Solução proposta Atenção visual e mapa de saliências

Leia mais

Processamento de Imagem. Filtragem no Domínio Espacial Professora Sheila Cáceres

Processamento de Imagem. Filtragem no Domínio Espacial Professora Sheila Cáceres Processamento de Imagem Filtragem no Domínio Espacial Professora Sheila Cáceres Filtragem A filtragem de imagens pode ser realizada no domínio do espaço e da frequência Operadores de filtragem são classificados

Leia mais

Processamento de imagem a cores

Processamento de imagem a cores A cor é um poderoso descritor que frequentemente simplifica a identificação e extracção de objectos de uma cena Os humanos podem discernir milhares de cores, mas apenas duas dezenas de cinzentos O processamento

Leia mais

Detecção de falsas correspondências em pares de imagens estereoscópicas utilizando a transformação projetiva no plano e o algoritmo RANSAC

Detecção de falsas correspondências em pares de imagens estereoscópicas utilizando a transformação projetiva no plano e o algoritmo RANSAC Detecção de falsas correspondências em pares de imagens estereoscópicas utilizando a transformação projetiva no plano e o algoritmo RANSAC André Caceres Carrilho Mauricio Galo Renato César dos Santos Curitiba,

Leia mais

Textura. Textura 04/09/2014. Prof. Yandre Costa

Textura. Textura 04/09/2014. Prof. Yandre Costa UNIVERSIDADE ESTADUAL DE MARINGÁ PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO Prof. Yandre Costa - 1 Prof. Yandre Costa Prof. Yandre Costa - 2 é um importante atributo visual presente em imagens,

Leia mais

Processamento de Imagens Coloridas. 35M34 Sala 3D5 Bruno Motta de Carvalho DIMAp Sala 15 Ramal 227

Processamento de Imagens Coloridas. 35M34 Sala 3D5 Bruno Motta de Carvalho DIMAp Sala 15 Ramal 227 Processamento de Imagens Coloridas 35M34 Sala 3D5 Bruno Motta de Carvalho DIMAp Sala 15 Ramal 227 Introdução Apesar do processo de percepção e interpretação de cores não ser completamente compreendido,

Leia mais

UNIVERSIDADE ESTADUAL DE MARINGÁ PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO. Prof. Yandr re Costa - 1. Prof. Yandre Costa.

UNIVERSIDADE ESTADUAL DE MARINGÁ PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO. Prof. Yandr re Costa - 1. Prof. Yandre Costa. UNIVERSIDADE ESTADUAL DE MARINGÁ PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO Prof. Yandr re Costa - 1 Textura Prof. Yandre Costa Prof. Yandr re Costa - 2 Textura é um importante atributo visual

Leia mais

PROCESSAMENTO DIGITAL DE IMAGENS

PROCESSAMENTO DIGITAL DE IMAGENS UNIVERSIDADE DE SÃO PAULO ESCOLA SUPERIOR DE AGRICULTURA LUIZ DE QUEIROZ DEPARTAMENTO DE ENGENHARIA DE BIOSSISTEMAS DISCIPLINA: LEB450 TOPOGRAFIA E GEOPROCESSAMENTO II PROF. DR. CARLOS ALBERTO VETTORAZZI

Leia mais

TELEVISÃO DIGITAL LEEC 2006/2007

TELEVISÃO DIGITAL LEEC 2006/2007 TELEVISÃO DIGITAL LEEC 2006/2007 DETECÇÃO DE CONTORNOS GRUPO 6: Hugo Miguel Rodrigues Gonçalves Dinis Guedes Afonso ee01171 ee01148 Introdução Este trabalho tem como objectivo a implementação de métodos

Leia mais

RECONHECIMENTO FACIAL UTILIZANDO EIGENFACES

RECONHECIMENTO FACIAL UTILIZANDO EIGENFACES Universidade Federal do Rio de Janeiro Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia Programa de Engenharia de Sistemas e Computação Rio de Janeiro, RJ Brasil RECONHECIMENTO

Leia mais

Region Based CNNs. Francisco Calaça Xavier. Programa de pós-graduação em Ciências da Computação Mestrado e Doutorado. Instituto de Informática UFG

Region Based CNNs. Francisco Calaça Xavier. Programa de pós-graduação em Ciências da Computação Mestrado e Doutorado. Instituto de Informática UFG Region Based CNNs Francisco Calaça Xavier Programa de pós-graduação em Ciências da Computação Mestrado e Doutorado Instituto de Informática UFG Prof. Anderson Soares Agenda O problema Estado da arte R-CNN

Leia mais

Proposta de Curso LNCC

Proposta de Curso LNCC Proposta de Curso LNCC Professor: Gilson A. Giraldi (D.Sc) Título do Curso: Visualização Científica para Análise de Imagens Médica. Período: Quarto Período de 2001 Objetivos O processamento/visualização

Leia mais

O reconhecimento facial é dividido em três etapas: i) detecção da face, ii) extração de características e iii) reconhecimento da face.

O reconhecimento facial é dividido em três etapas: i) detecção da face, ii) extração de características e iii) reconhecimento da face. ESTUDO SOBRE MÉTODOS DE RECONHECIMENTO FACIAL EM FOTOGRAFIAS DIGITAIS Ana Elisa SCHMIDT¹, Elvis Cordeiro NOGUEIRA² ¹ Orientadora e docente do IFC-Campus Camboriú; ² Aluno do curso de Bacharelado em Sistemas

Leia mais

Descritores de Imagens

Descritores de Imagens Descritores de Imagens André Tavares da Silva PPGCA/UDESC Outubro de 2017 André Tavares da Silva (PPGCA/UDESC) Descritores de Imagens Outubro de 2017 1 / 17 Introdução Excelentes pesquisas sobre descritores

Leia mais

Reconhecimento de Faces com PCA e Redes Neurais

Reconhecimento de Faces com PCA e Redes Neurais Reconhecimento de Faces com Sandro Santos Andrade Programa de Pós-graduação em Mecatrônica Setembro / 2003 Visão Computacional Computacional Computação Computação Visual Computação Computação Gráfica Introdução

Leia mais

Um Estudo das Técnicas de Obtenção de Forma a partir de Estéreo e Luz Estruturada para Engenharia

Um Estudo das Técnicas de Obtenção de Forma a partir de Estéreo e Luz Estruturada para Engenharia Um Estudo das Técnicas de Obtenção de Forma a partir de Estéreo e Luz Estruturada para Engenharia Aluno: Gabriel Malizia Orientador: Professor Marcelo Gattass Co-Orientador: Professor Paulo Cezar Carvalho

Leia mais

Processamento de Imagens. Texturas

Processamento de Imagens. Texturas Processamento de Imagens Texturas Exemplos Introdução Texturas Não existe abordagem formal Não existe definição formal São definidas qualitativamente e não há consenso quanto a sua definição quantitativa

Leia mais

5 Análise Experimental

5 Análise Experimental 5 Análise Experimental 5.1. Base de dados para testes Foram gravados diversos vídeos que serviram para realizar os testes realizados nesta dissertação. Cada um dos vídeos gerados para medir qualidade da

Leia mais

Aplicação de Histograma de Gradientes Orientados para detecção de hidrômetros em imagens de fundo complexo

Aplicação de Histograma de Gradientes Orientados para detecção de hidrômetros em imagens de fundo complexo Aplicação de Histograma de Gradientes Orientados para detecção de hidrômetros em imagens de fundo complexo Juliana Patrícia Detroz Professor: André Tavares da Silva Universidade do Estado de Santa Catarina

Leia mais

Color Eyes Detector. Duarte Petiz. DCC/FCUP

Color Eyes Detector. Duarte Petiz. DCC/FCUP Color Eyes Detector Duarte Petiz DCC/FCUP up201204625@fc.up.pt Resumo Este relatório descreve a implementação da aplicação desenvolvida Color Eyes Detector bem como mostra os resultados finais da execução

Leia mais

Reconhecimento de Instâncias (parte 2)

Reconhecimento de Instâncias (parte 2) Reconhecimento de Instâncias (parte 2) Rafael Galvão de Mesquita rgm@cin.ufpe.br Carlos Alexandre Mello cabm@cin.ufpe.br SURF Speeded-Up Robust Features [3] Computer Vision and Image Understanding, 2004

Leia mais

Processamento de Imagens Filtragem Digital

Processamento de Imagens Filtragem Digital Filtragem Digital Consiste na aplicação de técnicas de transformação (operadores máscaras) com o objetivo de corrigir, suavizar ou realçar determinadas características de uma imagem dentro de uma aplicação

Leia mais

Video Quality Assessment in Java

Video Quality Assessment in Java Video Quality Assessment in Java Pós-graduação strictu sensu em Ciência da Computação PROCESSAMENTO DE IMAGENS, Prof. Tsang Ing Ren Estêvão Monteiro Ricardo Scholz Junho de 2014 Introdução Fidelidade de

Leia mais

Face Detection. Image Processing scc moacir ICMC/USP São Carlos, SP, Brazil

Face Detection. Image Processing scc moacir ICMC/USP São Carlos, SP, Brazil Face Detection Image Processing scc0251 www.icmc.usp.br/ moacir moacir@icmc.usp.br ICMC/USP São Carlos, SP, Brazil 2011 Moacir Ponti Jr. (ICMCUSP) Face Detection 2011 1 / 24 Agenda 1 Detectando faces 2

Leia mais

Universidade Federal de Pernambuco

Universidade Federal de Pernambuco Universidade Federal de Pernambuco Graduação em Engenharia da Computação Centro de Informática 2 0 1 2. 2 PROPOSTA DE TRABALHO DE GRADUAÇÃO Aluno Arthur de Lima Padilha {alp4@cin.ufpe.br} Orientadora Veronica

Leia mais

Extração de atributos usando o método LBP - Local Binary Pattern

Extração de atributos usando o método LBP - Local Binary Pattern Extração de atributos usando o método LBP - Local Binary Pattern Lia Nara Balta Quinta. 2 de maio de 2006 1 Antecedentes e Justificativa O Brasil possui, atualmente, um grande rebanho bovino, porém em

Leia mais

SISTEMA DE ANÁLISE DE VÍDEO EM TEMPO REAL NA DETECÇÃO DE PADRÕES DE MOVIMENTO

SISTEMA DE ANÁLISE DE VÍDEO EM TEMPO REAL NA DETECÇÃO DE PADRÕES DE MOVIMENTO SISTEMA DE ANÁLISE DE VÍDEO EM TEMPO REAL NA DETECÇÃO DE PADRÕES DE MOVIMENTO Davi Alberto Sala, Adriane Parraga e Letícia Vieira Guimarães Universidade Estadual do Rio Grande do Sul RESUMO Uma das seções

Leia mais

Exemplo de aplicação

Exemplo de aplicação Exemplo de aplicação Paralaxe O conceito de paralaxe está relacionado com o deslocamento relativo ou aparente dos objetos estacionários, quando um observador em movimento os olha de pontos diferentes.

Leia mais

Plano de Pesquisa. Emprego das Funções de Gabor Sintonizadas para a Análise de Sinais e a Modelagem Neuronal

Plano de Pesquisa. Emprego das Funções de Gabor Sintonizadas para a Análise de Sinais e a Modelagem Neuronal Plano de Pesquisa Emprego das Funções de Gabor Sintonizadas para a Análise de Sinais e a Modelagem Neuronal Sílvia Mara da Costa Campos Victer Instituto de Computação, UFF 17 de março de 2014 Plano de

Leia mais

Orientação de Bordas em Imagens Digitais: Abordagem por Análise de Vizinhança Local

Orientação de Bordas em Imagens Digitais: Abordagem por Análise de Vizinhança Local Orientação de Bordas em Imagens Digitais: Abordagem por Análise de Vizinhança Local Inês Aparecida Gasparotto Boaventura DCCE-IBILCE-UNESP Rua Cristovão Colombo, 2265 15054-000, São José do Rio Preto,

Leia mais

Kanade-Lucas-Tomasi Tracker

Kanade-Lucas-Tomasi Tracker COPPE-UFRJ Kanade-Lucas-Tomasi Tracker Ricardo Marroquim data entrega: pós-graduação: 18/05/2016 graduação: 27/05/2016 1 NOTAÇÕES Uma imagem é definida como uma função f (x, y), x, y Z, onde f (x, y) :

Leia mais

SISTEMA PARA EXTRAÇÃO DE CARACTERÍSTICAS VISUAIS DE IMAGENS DE MADEIRA DE PINUS

SISTEMA PARA EXTRAÇÃO DE CARACTERÍSTICAS VISUAIS DE IMAGENS DE MADEIRA DE PINUS SISTEMA PARA EXTRAÇÃO DE CARACTERÍSTICAS VISUAIS DE IMAGENS DE MADEIRA DE PINUS Camila Piacitelli 1, Osvaldo Cesar Pinheiro de Almeida 2 1 Informática para Negócios, Faculdade de Tecnologia, Botucatu,

Leia mais

RECONHECIMENTO DE CARACTERES EM IMAGENS COM RUÍDO

RECONHECIMENTO DE CARACTERES EM IMAGENS COM RUÍDO RECONHECIMENTO DE CARACTERES EM IMAGENS COM RUÍDO Fernanda Maria Sirlene Pio SUMARIO Introdução Trabalhos Relacionados Metodologia Experimentos Conclusão Referências 2 INTRODUÇÃO Reconhecimento de Padrões

Leia mais

USO DO DETECTOR DE PONTOS DE INTERESSE SIFT PARA LOCALIZAÇÃO DE ALVOS ARTIFICIAIS DE CONTROLE

USO DO DETECTOR DE PONTOS DE INTERESSE SIFT PARA LOCALIZAÇÃO DE ALVOS ARTIFICIAIS DE CONTROLE IV Simpósio Brasileiro de Geomática SBG17 II Jornadas Lusófonas - Ciências e Tecnologias de Informação Geográfica - CTIG17 Presidente Prudente - SP, 24-26 de julho de 17 p. 341-346 USO DO DETECTOR DE PONTOS

Leia mais

Operações Pontuais. 1 operando. 2 operandos. Processamento e Análise de Imagem - A. J. Padilha - v ac

Operações Pontuais. 1 operando. 2 operandos. Processamento e Análise de Imagem - A. J. Padilha - v ac Operações Pontuais 1 operando T OP 2 operandos Pré-Processamento - 1 Operações Pontuais Nas operações pontuais, cada ponto da imagem-resultado - g(i,j) - é obtido por uma transformação T do ponto de coordenadas

Leia mais

Aprendizado e Controle de Robôs Móveis Autônomos Utilizando Atenção Visual

Aprendizado e Controle de Robôs Móveis Autônomos Utilizando Atenção Visual Aprendizado e Controle de Robôs Móveis Autônomos Utilizando Atenção Visual Milton Roberto Heinen 1 Paulo Martins Engel 1 Resumo: Este artigo descreve um modelo de aprendizado por reforço capaz de aprender

Leia mais

Redes Neurais Convolucionais

Redes Neurais Convolucionais André Gustavo Hochuli Orientadores: Dr. Luiz E. S. Oliveira/Dr. Alceu Britto Programa de Pós-Graduação em Informática Departamento de Informática UFPR Neurônio Artificial Redes Neurais - Vetor de Caracteristícas

Leia mais

4 SIFT (Scale Invariant Feature Transform)

4 SIFT (Scale Invariant Feature Transform) 4 SIFT (Scale Invariant Feature Transform) SIFT é um algoritmo de visão computacional publicado por David Lowe, em 1999 (Lowe, 1999) e patenteado nos EUA pela University of British Columbia. SIFT é composto

Leia mais

Visão computacional. Juliana Patrícia Detroz Orientador: André Tavares Silva

Visão computacional. Juliana Patrícia Detroz Orientador: André Tavares Silva Visão computacional Juliana Patrícia Detroz Orientador: André Tavares Silva Visão computacional Tentativa de replicar a habilidade humana da visão através da percepção e entendimento de uma imagem; Fazer

Leia mais

Redes Neurais Convolucionais

Redes Neurais Convolucionais André Gustavo Hochuli Orientador: Prof. Dr. Luiz Eduardo Soares de Oliveira Programa de Pós-Graduação em Informática Departamento de Informática UFPR http://www.inf.ufpr.br/aghochuli/caffe/ Redes Neurais

Leia mais

Processamento digital de imagens

Processamento digital de imagens Processamento digital de imagens Agostinho Brito Departamento de Engenharia da Computação e Automação Universidade Federal do Rio Grande do Norte 6 de outubro de 2016 Segmentação de imagens A segmentação

Leia mais

Face Descrip+on with Local Binary Pa6erns: Applica+on to Face Recogni+on JULIANO RAMOS LUANN LUNA

Face Descrip+on with Local Binary Pa6erns: Applica+on to Face Recogni+on JULIANO RAMOS LUANN LUNA Face Descrip+on with Local Binary Pa6erns: Applica+on to Face Recogni+on JULIANO RAMOS LUANN LUNA Introdução O ar%go visa criar uma abordagem para o problema de reconhecimento de face: i.e.: Dada uma face,

Leia mais

Processamento digital de imagens

Processamento digital de imagens Processamento digital de imagens Agostinho Brito Departamento de Engenharia da Computação e Automação Universidade Federal do Rio Grande do Norte 3 de março de 2016 Transformação e filtragem de imagens

Leia mais

INFORMAÇÕES DO ACADÊMICO PLANO DE TRABALHO. 1. Justificativa

INFORMAÇÕES DO ACADÊMICO PLANO DE TRABALHO. 1. Justificativa INFORMAÇÕES DO ACADÊMICO Nome: Kleber Padovani de Souza Curso: Engenharia de Computação Semestre: R.A.: Título do plano de trabalho: Extração de atributos da imagem através de momentos de imagem. Nome

Leia mais

UNIVERSIDADE ESTADUAL PAULISTA Campus de Sorocaba. Segmentação

UNIVERSIDADE ESTADUAL PAULISTA Campus de Sorocaba. Segmentação UNIVERSIDADE ESTADUAL PAULISTA Campus de Sorocaba Segmentação A separação dos pixeis relativos a cada objeto, ou região, é uma etapa fundamental para o sucesso do processo de análise da imagem. Embora

Leia mais

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Segmentação. Luiz Eduardo S. Oliveira, Ph.D.

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Segmentação. Luiz Eduardo S. Oliveira, Ph.D. Universidade Federal do Paraná Departamento de Informática Reconhecimento de Padrões Segmentação Luiz Eduardo S. Oliveira, Ph.D. http://lesoliveira.net Objetivos Introduzir os conceitos básicos de segmentação

Leia mais

Detecção de Faces Humanas em Imagens Coloridas Utilizando Redes Neurais Artificiais

Detecção de Faces Humanas em Imagens Coloridas Utilizando Redes Neurais Artificiais Detecção de Faces Humanas em Imagens Coloridas Utilizando Redes Neurais Artificiais Wellington da Rocha Gouveia Universidade de São Paulo Escola de Engenharia de São Carlos Departamento de Engenharia Elétrica

Leia mais

Processamento Digital de Imagens Aula 04

Processamento Digital de Imagens Aula 04 exatasfepi.com.br Processamento Digital de Imagens Aula 04 André Luís Duarte A sabedoria oferece proteção, como o faz o dinheiro, mas a vantagem do conhecimento é esta: a sabedoria preserva a vida de quem

Leia mais

DETECÇÃO DE CORES DE SOLUÇÕES QUÍMICAS PARA PESSOAS COM NENHUMA OU BAIXA VISÃO UTILIZANDO OPENCV

DETECÇÃO DE CORES DE SOLUÇÕES QUÍMICAS PARA PESSOAS COM NENHUMA OU BAIXA VISÃO UTILIZANDO OPENCV DETECÇÃO DE CORES DE SOLUÇÕES QUÍMICAS PARA PESSOAS COM NENHUMA OU BAIXA VISÃO UTILIZANDO OPENCV Autor (1) Jéssica Fernandes Alves; Orientador (4) Suzete Élida Nóbrega Correia (1) Instituto Federal de

Leia mais

Análise Quantitativa de Tecidos em Úlceras de Perna

Análise Quantitativa de Tecidos em Úlceras de Perna 49 5 Análise Quantitativa de Tecidos em Úlceras de Perna A avaliação das áreas proporcionais de cada tecido interno das úlceras fornece informações importantes sobre seu estado patológico [BERRISS, 2000],

Leia mais

RECONHECIMENTO DE ÍRIS EM AMBIENTES NÃO COOPERATIVOS UTILIZANDO WAVELETS E GABOR 2D

RECONHECIMENTO DE ÍRIS EM AMBIENTES NÃO COOPERATIVOS UTILIZANDO WAVELETS E GABOR 2D RECONHECIMENTO DE ÍRIS EM AMBIENTES NÃO COOPERATIVOS UTILIZANDO WAVELETS E GABOR 2D Fernanda Maria Sirlene Pio SUMÁRIO 1. Introdução 2. Trabalhos relacionados 3. Metodologia 1. Segmentação 2. Normalização

Leia mais

FILTRAGEM NO DOMÍNIO ESPACIAL. Daniel C. Zanotta 22/05/2017

FILTRAGEM NO DOMÍNIO ESPACIAL. Daniel C. Zanotta 22/05/2017 FILTRAGEM NO DOMÍNIO ESPACIAL Daniel C. Zanotta 22/05/2017 FREQUÊNCIA EM IMAGENS DIGITAIS Análise da intensidade dos NCs da imagem Banda 7 Landsat TM ao longo da distância: FREQUÊNCIA EM IMAGENS DIGITAIS

Leia mais

Figura 5.1: Resultados do método desenvolvido por Kolmogorov (09).

Figura 5.1: Resultados do método desenvolvido por Kolmogorov (09). 5 Resultados Neste capítulo vamos apresentar os resultados obtidos com o método proposto neste trabalho. Para os testes foram utilizados diferentes pares de imagens presentes no conjunto de dados disponível

Leia mais

Extração de características utilizando filtros de Gabor aplicado a identificação de defeitos no couro bovino

Extração de características utilizando filtros de Gabor aplicado a identificação de defeitos no couro bovino Extração de características utilizando filtros de Gabor aplicado a identificação de defeitos no couro bovino André Luiz Pasquali 24 de abril de 2006 1 Antecedentes e Justificativa Atualmente o Brasil vem

Leia mais

AQUISIÇÃO E REALCE EM IMAGENS UTILIZANDO JAVA COM AUXILIO DO OPENCV

AQUISIÇÃO E REALCE EM IMAGENS UTILIZANDO JAVA COM AUXILIO DO OPENCV AQUISIÇÃO E REALCE EM IMAGENS UTILIZANDO JAVA COM AUXILIO DO OPENCV Rafael Aquino 1 Fabio Gomes 2 Ciência da Computação ciências exatas e tecnológicas ISSN IMPRESSO 1980-1777 ISSN ELETRÔNICO 2316-3135

Leia mais

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Representação. David Menotti.

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Representação. David Menotti. Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica Representação David Menotti www.inf.ufpr.br/menotti/ci171-182 Representação Agenda Introdução Extraindo Representações de Imagens

Leia mais

Reconhecimento de Tipos de Movimento Humano baseados no método GMM.

Reconhecimento de Tipos de Movimento Humano baseados no método GMM. Reconhecimento de Tipos de Movimento Humano baseados no método GMM. C.Gonçalves 1 ; L.A.Pereira; J.C.Pizolato, Jr.; A.Gonzaga. Escola de Engenharia de São Carlos-EESC-USP Av. Trab. São-Carlense, 400 CP

Leia mais

I-Preproc: uma ferramenta para pré-processamento e indexação incremental de documentos

I-Preproc: uma ferramenta para pré-processamento e indexação incremental de documentos 17 I-Preproc: uma ferramenta para pré-processamento e indexação incremental de documentos Renan Gomes Pereira 1 Maria Fernanda Moura 2 Resumo: O objetivo deste trabalho é apresentar a ferramenta I-Preproc,

Leia mais

Aluno de Pós-Graduação em Engenharia de Software para Dispositivos Móveis pela UNINTER

Aluno de Pós-Graduação em Engenharia de Software para Dispositivos Móveis pela UNINTER COMPARAÇÃO DE DESEMPENHO NA PROGRAMAÇÃO PARALELA HÍBRIDA (MPI + OPENMP) NA BUSCA DE TEXTO EM ARQUIVOS 1 COMPARISON OF PERFORMANCE IN HYBRID PARALLEL PROGRAMMING (MPI + OPENMP) IN SEARCH OF TEXT IN FILES

Leia mais

Cor SCC0251 Processamento de Imagens

Cor SCC0251 Processamento de Imagens Cor SCC0251 Processamento de Imagens Prof. Moacir Ponti Jr. www.icmc.usp.br/~moacir Instituto de Ciências Matemáticas e de Computação USP 2012/1 Moacir Ponti Jr. (ICMCUSP) Cor 2012/1 1 / 39 Sumário 1 Introdução

Leia mais

3 Modelos Flex ıveis 3.1 Active Contour Model

3 Modelos Flex ıveis 3.1 Active Contour Model 3 Modelos Flexíveis Em Visão Computacional, uma das principais premissas é processar uma imagem com a finalidade de compreendê-la e retirar dela informações úteis. É utilizada em diversas aplicações atualmente,

Leia mais

Transformação de Imagens Digitais em Código CNC Aprimoradas com Redes Neurais Artificiais

Transformação de Imagens Digitais em Código CNC Aprimoradas com Redes Neurais Artificiais Transformação de Imagens Digitais em Código CNC Aprimoradas com Redes Neurais Artificiais Abstract. Jader Teixeira 1, Alex Vinícios Telocken 1 1 Universidade de Cruz Alta (UNICRUZ) jader033139@unicruz.edu.br,

Leia mais