Anotador automático de placas de publicidade em vídeos esportivos

Tamanho: px
Começar a partir da página:

Download "Anotador automático de placas de publicidade em vídeos esportivos"

Transcrição

1 Universidade de São Paulo Instituto de Matemática e Estatística Curso de Ciência da Computação Ricardo Augusto Fernandes Anotador automático de placas de publicidade em vídeos esportivos São Paulo 2011

2 Ricardo Augusto Fernandes Anotador automático de placas de publicidade em vídeos esportivos Monograa apresentada ao Curso de Ciência da Computação da USP, como requisito para a obtenção parcial do grau de BACHAREL em Ciência da Computação. Orientador: Professor Dr. Roberto Marcondes Cesar Jr. Universidade de São Paulo São Paulo 2011

3 Aos meus pais Del e Zé Carlos e ao meu irmão Cadu

4 Resumo A anotação em documentos consiste em descrever os elementos textuais, grácos ou semânticos neles presentes. A anotação de placas de publicidade em vídeos esportivos tem o objetivo de levantar estatísticas, sendo feita geralmente de modo manual, assistindo-se ao vídeo e registrando-se as aparições das logomarcas presentes. Um anotador automático tem por objetivo automatizar tal trabalho, apoiado nas técnicas de Visão Computacional e Aprendizagem de Máquina. Nessa monograa, motivada por um estágio realizado pelo aluno no IBOPE Media em 2010, pretende-se estudar e implementar técnicas para resolver esse problema, de maneira a analisar a viabilidade de um sistema com base no estado da arte da área e da tecnologia atual. Palavras-chaves: anotação de vídeo, reconhecimento, detecção, logomarcas, descritores de imagem, SURF

5 Agradecimentos Gostaria de agradecer a meus pais, meus primeiros e maiores professores. Aos amigos, professores da vida, dentre os quais incluo meu irmão. Àqueles que foram meus alunos e no dia-a-dia zeram-se meus professores. Finalmente, agradeço a todos os professores que tive em sala de aula, a todos os professores da Universidade e em especial ao Professor Roberto que pacientemente orientou esse trabalho.

6 Sumário Lista de Figuras 5 1 Introdução 6 2 Revisão Bibliográca 8 3 Método Implementado Descrição das Imagens Speeded-Up Robust Features (SURF) Correspondência de Descritores Casamentos Exclusão de quadros de longa distância Criação de Máscara Resultados 18 5 Conclusão 24 6 Avaliação Subjetiva 26 Referências Bibliográcas 27

7 Lista de Figuras 1.1 Transmissão esportiva com diversas placas de publicidade Da esquerda para direita: Derivadas de segunda ordem de uma Gaussiana, 2 G y e 2 G, discretizadas, e suas respectivas aproximações utilizadas [7] x y 3.2 Integral da Imagem [7] Haar Wavelets d/dx e d/dy [7] Máscara criada para um quadro do vídeo Plotagem em 2D das dimensões Matiz (Hue) e Saturação (Saturation) de um Histograma de região do vídeo Logo Coca-Cola Logo Coca-Cola parcial Logo Coca-Cola em cores invertidas Logo Coca-Cola em orientação invertida Logo Makita em tomada de longa distância Logo da Copa Santander Libertadores Logo da Copa Santander Libertadores apresentando falso positivo Quadro do vídeo contendo a placa da Copa Santander Libertadores Máscara correspondente ao quadro na gura Análise do quadro da gura 4.8 com máscara da gura

8 6 1 Introdução A anotação de textos, imagens ou vídeos consiste em associar descrições a eles de modo a facilitar a busca e o acesso. Tais descrições são chamadas metadados. No caso de imagens e vídeos, a extração de metadados pode ultrapassar autor e data, avançar até as características de cor, textura e forma e chegar até mesmo ao nível semântico, descrevendo emoções, sentimentos e relações entre elementos. Em especial, a anotação de vídeos pode ser feita com o intuito de contagem de um determinado elemento na sequência do vídeo, para ns estatísticos. É o caso da anotação de placas publicitárias de vídeos esportivos (Veja a gura 1.1 ). Figura 1.1: Transmissão esportiva com diversas placas de publicidade Em eventos esportivos de grande porte, é comum se encontrar placas de publicidade. Essa publicidade tem como primeiro alvo o torcedor presente no evento. Entretanto muito mais do que esses milhares de torcedores, busca atingir os telespectadores, contados em milhões. Dessa forma, existe a demanda dos anunciantes em determinar quanto vale essa exposição. Uma maneira de responder a esse questionamento dá-se por meio de argumentos estatísticos, baseados, por exemplo, na contagem do número de aparições de uma marca na transmissão de um evento. Contudo, o processo de anotação é geralmente

9 1 Introdução 7 manual, assistindo-se ao vídeo e registrando-se as aparições, o que é demorado e custoso, criando assim motivação para se automatizar o processo de contagem. De fato, esse trabalho de TCC foi motivado por um estágio realizado pelo aluno no IBOPE Media, onde se foi levantado o interesse por tal problema. Assim, dada uma logomarca e um vídeo de um evento esportivo, busca-se ter um aplicativo que possa retornar se a logomarca aparece nesse vídeo, em que momentos e com qual duração, entre tantas outras informações possíveis de serem extraídas, preferencialmente em tempo real. Para isso, as pesquisas já realizadas fazem uso principalmente de técnicas de Visão Computacional para extração de características fotométricas e geométricas das imagens a serem comparadas e de técnicas de Aprendizagem de Máquina para comparação e classicação. Entre os principais problemas enfrentados podemos destacar as possíveis oclusões das placas publicitárias, seus diferentes posicionamentos, além do alto custo de processamento dos métodos atuais.

10 8 2 Revisão Bibliográca O reconhecimento de um objeto em uma imagem é objeto de estudo da Visão Computacional. O reconhecimento de guras em duas dimensões é um subproblema, sendo como os trabalhos estudados aqui abordam o problema em relação às placas de publicidade. Tal qual nos problemas mais amplos, as placas podem encontrar-se em diferentes posições, diferentes tamanhos, diferentes luminosidades e parcialmente oclusas. No reconhecimento em vídeo, a busca deve ser feita quadro-a-quadro. A metodologia consiste em extrair um conjunto de características da imagem da placamodelo e vericar se alguma subimagem dos quadros do vídeo apresenta conjunto semelhante. As características de comparação variam de trabalho para trabalho, o mesmo acontecendo com o método de classicação, que decide se os conjuntos comparados correspondem a mesma placa ou não. Aqui, a Visão Computacional se apóia na Aprendizagem de Máquina. O artigo de Bagdanov et al [1] baseia-se no uso de descritores SIFT, características invariantes na imagem em relação à escala e rotação. Assim, o algoritmo SIFT gera um conjunto de descritores, onde cada descritor está associado a algum ponto da imagem. De posse de dois conjuntos de descritores, a comparação é feita a partir de cada descritor, comparando-se a distância normalizada até os dois vizinhos mais próximos no quadro e no modelo. A comparação é baseada na razão entre essas distâncias, que não devem exceder um determinado limiar para que as imagens sejam consideradas da mesma placa. O artigo de Ballan et al [2] desenvolve o trabalho acima modicando o método de classicação com o uso de Support Vector Machines (SVM). As SVM'S são ferramentas de Aprendizagem de Máquina para classicação supervisionada que determinam o limiar de decisão com base em um conjunto de treinamento. O trabalho conclui que sua introdução aumentou o retorno com perda desprezível de precisão. Além disso, aponta melhor retorno em uma SVM genérica do que SVM'S especícas no caso de busca de múltiplas logomarcas.

11 2 Revisão Bibliográca 9 Em Watve e Sural [3], um trabalho especíco sobre vídeos de futebol, as estratégias são totalmente diferentes das já citadas. A região de interesse é dividida em oito janelas. Usase características estatísticas como média e variância nos aspectos de cor e brilho como base de comparação, formando-se um vetor de 32 dimensões. A classicação é baseada na distância Euclidiana entre os dois vetores. Porém, o pré-processamento reduz a região de análise excluindo-se grama. A exclusão da grama é feita por Hue Slicing. Depois, buscam-se linhas paralelas na imagem que representam a borda superior e inferior das placas. Para tanto, é feito uso do Detector de Bordas Sobel, no qual se binariza a imagem e da Transformação de Hough, para se encontrar retas paralelas. Se o quadro não as possui, é descartado, o que acelera o processamento. Cada par de paralelas forma uma região de interesse. Os resultados variam muito com relação à luminosidade e logomarca. O texto de Ishimura [4] usa o descritor GLOH, também de alta invariância. Analogamente ao uso dos descritores SIFT, utilizados em Bagdanov et al, é necessário comparar os descritores dos dois conjuntos. A comparação é feita utilizando-se o método KNN. O método é aplicado a vídeos de Fórmula 1. Todos os trabalhos citam problemas como blurring (borramento) e baixa qualidade dos vídeos.

12 10 3 Método Implementado Para se fazer a implementação, decidiu-se utilizar a biblioteca open source de visão computacional OpenCV, utilizando-se a Linguagem C/C++. A OpenCV provê funções básicas de manipulação de imagem e vídeo, processamento de imagens, aprendizagem de máquina, entre outras. É otimizada no uso da linguagem C/C++ para aplicações em tempo real. Os primeiros testes preocuparam-se em disponibilizar a visualização da imagem-objeto, a ser localizada, e do vídeo a ser anotado. Desse modo, a versão preliminar exibe em um única janela tanto a imagem quanto os quadros do vídeo, de modo a facilitar a visualização dos pareamentos entre as duas imagens. Embora sejam exibidas as imagens coloridas, é necessário fazer a conversão das imagens a serem descritas para escala de cinza, por exigência do algoritmo utilizado na descrição das mesmas. Inicialmente, por meio do método que será apresentado a seguir, se faz a descrição da imagem-objeto. Em seguida, se inicia a iteração nos quadros do vídeo, que são descritos buscando-se o casamento entre eles a a imagem descrita no início. A cada quadro do vídeo, a interface mostra as correspondências existentes entre Descritores da imagem-objeto e do quadro por meio de linhas coloridas. Caso seja identicado um casamento entre as duas imagens, ocorre um pausa no quadro identicado e é necessária a digitação de uma tecla qualquer para a sequência da iteração. 3.1 Descrição das Imagens Dentro os quatro trabalhos que buscaram detecção de placas de publicidade em vídeo, três deles se basearam em algoritmos que descrevem a imagem através de pontos especícos e das características da vizinhança desses pontos, chamados Pontos de Interesse ou Pontos-chave. A única exceção foi o trabalho de Watve e Sural [3].

13 3.1 Descrição das Imagens 11 No algoritmo Scale Invariant Features Transform (SIFT) apresentado em Lowe [5], a seleção do ponto de interesse, baseia-se na função detectora de arestas DoG (Dierence of Gaussians). Descreve-se então o a vizinhança desse ponto através dos vetores-gradiente associados a ela. Já Gradient Location and Orientation Histogram (GLOH) [6], é uma extensão de SIFT feita aplicando-se Principal Components Analysis (PCA) para se poder reduzir o número de caracteríscas nas descrições dos pontos, com ganho de performance e sem perda e precisão. Outro algoritmo inspirado em [5] foi o Speeded-Up Robust Features (SURF) de Bay et al [7], no qual SURF é descrito como mais robusto e veloz do que sua inspiração. Além disso, é implementado na função cvextractsurf() da biblioteca OpenCV. Desse modo, na linha dos trabalhos descritos, esse foi o algoritmo utilizado para descrição das imagens Speeded-Up Robust Features (SURF) Extração de Pontos de Interesse (Descritores) O algoritmo SURF é um método que descreve imagens através de Pontos de Interesse, Pontos-chave ou Descritores encontrados por meio do cálculo dos determinantes H das Matrizes Hessianas da imagem. Seja f(x,y) uma função de duas variáveis, o determinante H(f(x,y)) é denido como: H(f(x, y)) = 2 f(x, y) 2 f(x, y) x 2 x y 2 f(x, y) 2 f(x, y) y x y 2 Os Pontos de Interesse são denidos onde o Determinante é máximo local. Esses conceitos são transportados para o algoritmo ao se considerar a imagem analisada como uma função I(x,y) da intensidade dos pixels e são aplicados através da convolução da imagem com uma máscara apropriada (Veja gura 3.1):

14 3.1 Descrição das Imagens 12 Figura 3.1: Da esquerda para direita: Derivadas de segunda ordem de uma Gaussiana, 2 G y e 2 G, discretizadas, e suas respectivas aproximações utilizadas [7] 2 x y A convolução entre uma imagem I e uma máscara M pode ser denida como abaixo: (I M)(x, y) = M(m, n)i(x + m, y + n) m= n= Ou seja, a convolução no pixel (x,y) será dada pela soma dos pixels de sua vizinhança, com os pesos dados a partir da máscara utilizada, sendo o pixel central da máscara o peso do pixel (x,y) da imagem. Para que se evite os problemas que poderiam ser causados por ruídos na imagem, não se faz a convolução com máscaras que simplesmente calculem as derivadas de segunda ordem. Antes disso, é necessário suavizar a imagem por meio da convolução com uma Gaussiana. Desse modo, as máscaras aplicadas são aproximações das derivadas de segunda ordem da função de suavização. Para se analisar imagens em diferentes níveis de resolução, a estratégia usual é construir uma Pirâmide de Imagens à partir da imagem analisada. Uma Pirâmide de Imagens é uma sequência na qual cada imagem subsequente tem um nível de resolução menor do que a anterior. Uma maneira de gerar os novos níveis é construindo-se uma Pirâmide, na qual o nível imediatamente acima e gerado à partir da convolução com uma máscara que reita uma distribuição Gaussiana. Porém, nota-se que é um processo de grande custo computacional. A estratégia utilizada para se reduzir o custo foi fazer uso da representação da imagem introduzida por Viola e Jones [10], chamada Integral de Imagem.

15 3.1 Descrição das Imagens 13 A Integral de Imagem pode ser denida por: II(x, y) = x y I(i, j) i=0 j=0 A gura 3.2 mostra como, após calculada a Integral da Imagem, é possível achar a área de qualquer região retangular à partir de três operações. Além disso, mostra que em uma única passada pode-se calcular a Integral da Imagem II(x,y) à partir das seguintes recorrências: s(x, y) = s(x, y 1) + I(x, y) II(x, y) = II(x 1, y) + s(x, y) Figura 3.2: Integral da Imagem [7] Devido ao cálculo da Integral da Imagem, não é mais necessário que se passe pelos diferentes níveis subsequentes da Pirâmide de Imagens, pois o cálculo envolve apenas alguns pixel em cada nível. Não sendo necessário passar por níveis cada vez menores na escala da pirâmide, a estratégia do algoritmo para fazer a análise multi-escala é ir aumentando a tamanho das máscaras aplicadas 3.1 o que é feito em tempo constante.

16 3.2 Correspondência de Descritores 14 Desse modo, reduz-se o custo computacional drasticamente, o que leva à eciência em se localizar os Pontos de Interesse. Descrição dos Pontos de Interesse A descrição dos Pontos de Interesse é feita, primeiramente, determinando-se uma orientação em torno do ponto a ser descrito. A orientação é determinada pela região de sua vizinhança que congregue, em torno de um ângulo de 30 o, o maior número de pontos descritores vizinhos. Posteriormente, determina-se uma região quadrada na vizinhança do Ponto de Interesse, subdividida em 16 subregiões, com tamanho proporcional à variância da Gaussiana utilizada. Cada subregião, contribui com 4 descritores, Dx, Dy, Dx e Dy, totalizando 64 Descritores: Dx = 25 i=1 dx i, Dy = 25 i=1 dy i, Dx = 25 i=1 dx i e Dy = 25 i=1 dy i dx i e dy i são cada uma das 25 derivadas em x e y, extraídas de 25 pontos igualmente distribuídos dentro de cada subregião, a partir da convolução com máscaras chamadas de Haar Wavelets (Ver a gura 3.3 ). Figura 3.3: Haar Wavelets d/dx e d/dy [7] 3.2 Correspondência de Descritores Os Descritores são vetores de 64 dimensões. Para se achar as correspondências, calculouse a soma do quadrado das diferenças entre cada uma das subregiões correspondentes entre cada vetor da imagem-objeto e do quadro do vídeo.

17 3.3 Casamentos Distancia = i=1 (Dx obj i Dx img i ) 2 +(Dy obj i Dy img i ) 2 +( Dx obj i Dx img i ) 2 +( Dy obj i Dy img i ) 2 Dessa forma, as correspondências são feitas a partir das menores distâncias. Simbolicamente, traçou-se linhas entre os pontos-chave correspondentes. 3.3 Casamentos A correspondência entre descritores da imagem-objeto e de um quadro do vídeo é analisada de modo a se armar se há ou não casamento entre as imagens. Os dois métodos, abaixo,foram aplicados até o momento. No primeiro, para cada par que há correspondência, verica-se se os três vizinhos mais próximos são os mesmos e na mesma ordem na imagem-objeto e no quadro do vídeo. Se há o casamento da sequência de vizinhos em um grande número de pares, considera-se que há também o casamento das imagens. No segundo, verica-se a soma das distâncias entre todos os pares, ponderados pela mediana das distâncias. Caso a diferença entre as distâncias seja proporcionalmente pequena, considera-se também um casamento das imagens. 3.4 Exclusão de quadros de longa distância O trabalho de Watve e Sural [3] trata especicamente de vídeos de futebol. O método aplicado trata de formas diferentes as tomadas de longa e curta distâncias. Para isso, faz uso do índice de "Porcentagem de grama"no quadro. Vídeos com alta "Porcentagem de grama"indicam tomadas distantes, onde a maior parte do quadro é ocupado pelo campo de jogo. O índice é calculado à partir da porcentagem de pixels de cor verde (faixa de Π/3 à 5Π/6 no espaço de cores HSV) e são considerados quadros de longa distância aqueles que possuem mais de 70%. Percebendo a baixa taxa de correspondência com quadros à longa distância, decidiu-se trabalhar inicialmente com um recorte do problema voltado a quadros de curta distância,

18 3.5 Criação de Máscara 16 de modo a prosseguir o desenvolvimento do projeto sem se ater a esse problema especíco já que, nos quadros de longa distância, até mesmo a anotação humana se torna mais difícil. Para isso, implementou-se um código auxiliar com o método descrito acima e que devolve apenas os quadros de interesse à partir de um vídeo de entrada. 3.5 Criação de Máscara Ainda se baseando em Watve e Sural [3], foi desenvolvido o cálculo de uma Máscara, como na gura 3.4, passada como parâmetro à função cvextractsurf(). Essa Máscara é utilizada para denir em quais regiões devem ser ou não procurados os Pontos de Interesse, sendo estes procurados apenas nas regiões onde a máscara apresenta mais de 50 porcento de pixels não nulos. Abaixo, cada região analisada corresponde a uma janela de 20 x 20. A máscara, utilizada inicialmente para se diminuir o tempo de processamente, colaborou para a diminuição dos falsos positivos. Figura 3.4: Máscara criada para um quadro do vídeo Para se chegar à máscara, foi utilizado o critério de proximidade de distribuição de cor entre a placa e a região analisada. Assim, convertendo-se as duas imagens para o espaço de cor HSV, através de funções cvcreatehist() e cvcomparehist() da biblioteca OpenCV

19 3.5 Criação de Máscara 17 facilmente calculam-se os histogramas das distribuições das duas imagens e a proximidade entre eles. Figura 3.5: Plotagem em 2D das dimensões Matiz (Hue) e Saturação (Saturation) de um Histograma de região do vídeo

20 18 4 Resultados Os primeiros testes foram feitos ainda sem sem qualquer implementação de critério de casamentos entre as imagens. Buscava-se apenas vericar as correspondências entre os pontos-chave. A expectativa foi atendida em grande parte ao se usar objetos grandes em imagens com tomadas feitas a pequenas distâncias. A gura 4.1 demonstra a correspondência entre os Pontos de Interesse mesmo havendo mudança de perspectiva na placa. Figura 4.1: Logo Coca-Cola

21 4 Resultados 19 Figura 4.2: Logo Coca-Cola parcial Podemos perceber também que o algoritmo é resistente à oclusão da placa causada pela trave. O teste demonstrado na gura 4.2 demonstra o mesmo, além de demonstrar resistência a variação de escala. Figura 4.3: Logo Coca-Cola em cores invertidas A gura 4.3 mostra que o algoritmo não suporta inversões de cores, como pode-se perceber nas baixas correspondências entre o objeto e a placa no vídeo. Porém, na gura 4.4 percebe-se que alterações em orientação são bem assimiladas.

22 4 Resultados 20 Figura 4.4: Logo Coca-Cola em orientação invertida Ainda na gura 4.4 percebe-se que a mudança na escala do objeto causa uma redução das correspondências, em virtude da diminuição dos Pontos-chave. Figura 4.5: Logo Makita em tomada de longa distância Como citado anteriormente, as tomadas de longa distância levam à diminuição da placa, que por sua vez, tal qual no exemplo anterior, diminuem o número de Pontos de Interesse. Esse caso aparece na gura 4.5. Mesmo utilizando-se de objeto recortado do vídeo, não são localizadas muitas correspondências.

23 4 Resultados 21 Figura 4.6: Logo da Copa Santander Libertadores Trabalhando apenas com tomadas de curta distância, começou-se a testar os métodos de vericação de casamentos entre as imagens. A vericação da correspondência entre os vizinhos mais próximos apresenta eciência em relação aos verdadeiros positivos, como na gura 4.6, porém apresentando um grande número de falsos positivos, como o da gura 4.7. O método que compara as distâncias relativas entre os pontos-chave das duas imagens parece mostrar certa eciência em evitá-los. Figura 4.7: Logo da Copa Santander Libertadores apresentando falso positivo

24 4 Resultados 22 O uso da Máscara feita com base nos histogramas de cor ajudou a reduzir a área de procura por pontos de interesse. Nas guras 4.8, 4.9 e 4.10 vemos um quadro, sua respectiva máscara e a localização dos Pontos de Interesse apenas nas áreas onde a máscara permite. Figura 4.8: Quadro do vídeo contendo a placa da Copa Santander Libertadores Figura 4.9: Máscara correspondente ao quadro na gura 4.8

25 4 Resultados 23 A utilização da máscara, ao reduzir a área de procura de Pontos de Interesse, inseriu no método desenvolvido a utilização da informação até então ignorada no projeto, já que o algoritimo SURF trabalha com imagens em escala de cinza: cor. A introdução da nova variável se mostrou eciente em evitar falsos positivos. Figura 4.10: Análise do quadro da gura 4.8 com máscara da gura 4.9

26 24 5 Conclusão A presente monograa se propôs a estudar e implementar técnicas para se desenvolver um anotador automático de placas de publicidade em vídeos esportivos, baseado no estado da arte de Visão Computacional. A anotação dos vídeos citados tem ns estatíscos e é de grande interesse do mercado publicitário, pois dene uma métrica para se denir o retorno do investimento feito pelos anunciantes. O interesse na automatização surge à partir do grande custo da mão-de-obra envolvida nesse trabalho, feito até 2010 de modo manual em instituições como o IBOPE, local do estágio motivador do estudo, feito pelo aluno no ano citado. A revisão bibliográca feita levou à trabalhos desenvolvidos nos últimos quatro anos, que trataram justamente sobre o tema da presente monograa. A maior parte deles utiliza técnicas, que como é citada em Ballan et al [2], foram as mais utilizadas pelos recentes trabalhos de reconhecimento de logomarcas, baseadas em Descritores de Pontos de Interesse. Os trabalhos estudados zeram uso dos descritores SIFT [5] e GLOH [6]. Enquanto a descrição dos quadros é feita de modos semelhantes nos diferentes artigos, a classicação em cada um deles foi abordada de diferentes formas, utilizando desde algoritmos baseados nas Distância Euclidiana entre os Descritores até o uso de Support Vector Machines (SVM), o que levou a diferentes estudos na fase inicial do projeto. O desenvolvimento da implementação se deu com o estudo da biblioteca OpenCV [9] principalmente à partir de Bradsky e Kaehler [8]. Nele se desenvolveu o uso da biblioteca por meio de suas funções de manipulação de vídeo e imagem e processamento de imagens. Finalmente, decidiu-se também pelo uso do algoritmo SURF, um descritor de imagens baseado em Pontos de Interesse e inspirado no descritor SIFT, que possui implementação na OpenCV. O algoritmo SURF (Speeded-Up Robust Features) [7] descreve a imagem baseado em Pontos de Interesse. Estes são calculados a partir dos determinantes máximos locais das

27 5 Conclusão 25 matrizes Hessianas dos pontos da imagem. Esse cálculo é feito em um espaço-escala criado à partir da formação de uma Pirâmide de Imagens, de modo que a localização dos Pontos de Interesse seja feita em diversas resoluções. No entanto, para que tudo isso atinja a performance desejada, o uso da representação inserida pelo trabalho de Viola e Jones [10], a Integral da Imagem, foi fundamental. Os Descritores dos Pontos de Interesse são construídos descrevendo-se sua vizinhança, utilizando-se para isso máscaras Haar Wavelets, que calculam as derivadas da região e a partir delas forma-se um Descritor de 64 dimensões. Determina-se a partir das distâncias no espaço 64-dimensional, entre os Descritores da placa procurada e do quadro do vídeo, os pares correspondentes. O limiar de proximidade é dado pela norma do vetor da placa. De modo a se conrmar o casamento entre os pares, busca-se correspondências não só entre um par mas também entre os pares vizinhos mais próximos. Buscando-se eliminar os falsos positivos, constrói-se uma máscara na qual se limita a área de busca dos Pontos de Interesse por meio do algoritmo SURF. Essa máscara é contruída baseada na proximidade de cor entre a região analisada e placa procurada. A proximidade é calculada através dos histogramas de cor das regiões em questão e se mostra capaz de melhorar os resultados do método. A monograa aqui apresentada, baseada no estudo dos mais recentes trabalhos da área, apresentou um método que se mostra capaz de efetuar o reconhecimento de placas de publicidade em vídeos esportivos de forma robusta a pequenas variações de escala, rotação, oclusão e mudanças de perspectiva. No entanto, não se mostra eciente nas tomadas de longa distância, nas quais as placas se apresentam em pequenas dimensões. Mostra-se viável a continuidade do estudo de modo a resolver esse problema, para então se iniciar estudos mais conclusivos em relação à precisão e cobertura do algoritmo.

28 26 6 Avaliação Subjetiva O interesse na área de Visão Computacional teve início cursando-se primeiramente Processamento de Imagens e depois Computação Gráca, disciplinas correlacionadas. A primeira foi especialmente importante na parte prática, apesar de nela se ter utilizado a Linguagem Java. No entanto, não se havia cursado a disciplina de Visão Computacional o que fez com que o Trabalho de Formatura Supervisionado tenha sido uma oportunidade para a introdução na área. Talvez esse tenha sido o motivo da grande diculdade na leitura dos trabalhos da revisão bibliográca que lidavam com muitos conceitos até então desconhecidos, em especial quando eles descreviam os trabalhos anteriores nos quais havia um sem número de algoritmos. Recuperação de Informação foi outra disciplina que deu base ao trabalho feito, em especial sobre conceito e métodos de Classicação, o que fez com que a compreensão destas seções dos trabalhos lidos tenha se dado de forma mais fácil. O estudo do algoritmo SURF deu base para compreensão não só dele próprio mas também de outros algoritmos baseados em Descritores de Pontos de Interesse, como o próprio algoritmo SIFT. Esse estudo foi de certa forma especial quando se teve que buscar outros trabalhos para se entender como o uso da Integral da Imagem se integrava as Pirâmides de Imagem utilizadas, de modo a aumentar a performance do algoritmo. E claro, fez uso das aulas de Cálculo ainda do primeiro ano. Disciplinas como as citadas diferenciam o curso feito do daqueles de muitas outras Universidades e justicam a necessidade das disciplinas de base. E também podem proporcionar exemplos interessantes de aplicações ao ensino de Matemática no ensino médio.

29 Referências Bibliográcas [1] Bagdanov,A. D., Ballan, L., Bertini, M., and Del Bimbo, A., Trademark matching and retrieval in sports video databases, in Proc. of MIR, Augsburg, Germany, 2007 [2] Ballan, L., Bertini, M., Del Bimbo, A., Jain, A., Automatic trademark detection and recognition in sport videos, in Multimedia and Expo, 2008 IEEE International Conference on. [3] Watve, A., Sural, S., Soccer Video Processing for the detection of ad- vertisement billboards, in Pattern Recognition Letters archive,volume 29, Issue 7 (May 2008) Elsevier [4] Ishimura, N., Recognizing Multiple Billboard Advertisements in Videos [5] Lowe, D., Distinctive Image Features from Scale-Invariant Keypoints, (January, 2004) [6] Mikolajczyk, K., Schmid, C., A performance evaluation of local descriptors [7] Bay, H., Ess,a., Tuytelaars, T., Speeded-Up Robust Features (SURF) [8] Bradsky, G., Kaehler,A., Learning OpenCV, O'Reilly, 2008, First Edition [9] OpenCV, [10] Viola, P., Jones, M., Robust Real-time Object Detection, Second International Workshop Statistical and Computational Theories of Vision, Vancouver, Canada, 2001

Anotador automático de placas de publicidade em vídeos esportivos

Anotador automático de placas de publicidade em vídeos esportivos MAC0499 - Trabalho de Formatura Supervisionado Professor: Carlos Eduardo Ferreira Universidade de São Paulo Instituto de Matemática e Estatística Aluno: Ricardo Augusto Fernandes Orientador: Prof. Dr.

Leia mais

Descritores de Imagens

Descritores de Imagens Descritores de Imagens André Tavares da Silva PPGCA/UDESC Outubro de 2017 André Tavares da Silva (PPGCA/UDESC) Descritores de Imagens Outubro de 2017 1 / 18 Descritores Locais e Frameworks SIFT SURF Viola-Jones

Leia mais

Descritores de Imagem

Descritores de Imagem Descritores de Imagem André Tavares da Silva 31 de março de 2014 1 Descritores de imagem (continuação) 1.1 Frameworks de detecção de objetos SIFT (scale-invariant features transform) (Lowe, 1999) SIFT

Leia mais

Image Descriptors: local features

Image Descriptors: local features Image Descriptors: local features Image Processing scc0251 www.icmc.usp.br/ moacir moacir@icmc.usp.br ICMC/USP São Carlos, SP, Brazil 2011 Moacir Ponti Jr. (ICMCUSP) Image Descriptors: local features 2011

Leia mais

SIFT - Scale Invariant Feature Transform

SIFT - Scale Invariant Feature Transform SIFT - Scale Invariant Feature Transform Daniel Pinto Coutinho Prof. Ricardo Marroquim 1 Introdução A detecção de pontos de interesse em uma figura é uma tarefa muito comum no campo de processamento de

Leia mais

Feature Description (SIFT + SURF) Prof. Dr. Geraldo Braz Junior

Feature Description (SIFT + SURF) Prof. Dr. Geraldo Braz Junior Feature Description (SIFT + SURF) Prof. Dr. Geraldo Braz Junior Feature Detection 1. Encontre um conjunto de keypoints 2. Defina uma região ao redor do keypoint 3. Normalize a região 4. Extraia caracterísfcas

Leia mais

2 SIFT (Scale Invariant Feature Transform)

2 SIFT (Scale Invariant Feature Transform) SIFT (Scale Invariant Feature Transform) O SIFT é um algoritmo de visão computacional proposto e publicado pelo pesquisador David Lowe (Lowe, 1999), professor do departamento de Ciência da Computação na

Leia mais

Visão computacional. Juliana Patrícia Detroz Orientador: André Tavares Silva

Visão computacional. Juliana Patrícia Detroz Orientador: André Tavares Silva Visão computacional Juliana Patrícia Detroz Orientador: André Tavares Silva Visão computacional Tentativa de replicar a habilidade humana da visão através da percepção e entendimento de uma imagem; Fazer

Leia mais

Sistema de Reconhecimento de Logotipos

Sistema de Reconhecimento de Logotipos Sistema de Reconhecimento de Logotipos Fellipe Duarte, Saulo T. Oliveira {duartefellipe,sto}@cos.ufrj.br Relatório Técnico, Introdução ao Processamento de Imagens Programa de Engenharia de Sistemas e Computação

Leia mais

Reconhecimento de Instâncias (parte 2)

Reconhecimento de Instâncias (parte 2) Reconhecimento de Instâncias (parte 2) Rafael Galvão de Mesquita rgm@cin.ufpe.br Carlos Alexandre Mello cabm@cin.ufpe.br SURF Speeded-Up Robust Features [3] Computer Vision and Image Understanding, 2004

Leia mais

Processamento de Imagens COS756 / COC603

Processamento de Imagens COS756 / COC603 Processamento de Imagens COS756 / COC603 aula 13 - Transformada de Hough e SIFT Antonio Oliveira Ricardo Marroquim 1 / 41 aula de hoje descritores Transformada de Hough SIFT 2 / 41 transformada de Hough

Leia mais

Processamento Digital de Imagens

Processamento Digital de Imagens Ciência da Computação Processamento Digital de Imagens Tópicos Detecção de Pontos Isolados Detecção de Linhas Prof. Sergio Ribeiro 2 Operações lógicas e aritméticas orientadas a vizinhança utilizam o conceito

Leia mais

MouseCam: aplicação de controle do mouse via câmera

MouseCam: aplicação de controle do mouse via câmera MouseCam: aplicação de controle do mouse via câmera Introdução ao Processamento de Imagens COS756 PESC/COPPE/UFRJ 2013 1 Renan Garrot garrot@cos.ufrj.br 1. Introdução O processo de tracking por vídeo consiste

Leia mais

4 SIFT (Scale Invariant Feature Transform)

4 SIFT (Scale Invariant Feature Transform) 4 SIFT (Scale Invariant Feature Transform) SIFT é um algoritmo de visão computacional publicado por David Lowe, em 1999 (Lowe, 1999) e patenteado nos EUA pela University of British Columbia. SIFT é composto

Leia mais

Diego Martin Mancini Orientador: Prof. Paulo A. V. de Miranda Instituto de Matemática e Estatística Universidade de São Paulo

Diego Martin Mancini Orientador: Prof. Paulo A. V. de Miranda Instituto de Matemática e Estatística Universidade de São Paulo Estudo de comparação do descritor de imagens coloridas BIC empregando diferentes abordagens de classificação de detecção de bordas: Canny e Operador Laplaciano Diego Martin Mancini Orientador: Prof. Paulo

Leia mais

Implementação do algoritmo SIFT para detecção de objetos em imagens.

Implementação do algoritmo SIFT para detecção de objetos em imagens. Universidade Federal do Rio de Janeiro Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia Programa de Engenharia de Sistemas e Computação Rio de Janeiro, RJ - Brasil Implementação

Leia mais

Color Eyes Detector. Duarte Petiz. DCC/FCUP

Color Eyes Detector. Duarte Petiz. DCC/FCUP Color Eyes Detector Duarte Petiz DCC/FCUP up201204625@fc.up.pt Resumo Este relatório descreve a implementação da aplicação desenvolvida Color Eyes Detector bem como mostra os resultados finais da execução

Leia mais

Descritores de Imagem (introdução)

Descritores de Imagem (introdução) Descritores de Imagem (introdução) André Tavares da Silva andre.silva@udesc.br Roteiro da aula Definição de descritor de imagem Extração de Característica Tipos Geral x Específico Global (cor, textura,

Leia mais

Exemplo de aplicação

Exemplo de aplicação Exemplo de aplicação Paralaxe O conceito de paralaxe está relacionado com o deslocamento relativo ou aparente dos objetos estacionários, quando um observador em movimento os olha de pontos diferentes.

Leia mais

Person Re-Identification. Autor: Guilherme Zasyeki Machado

Person Re-Identification. Autor: Guilherme Zasyeki Machado Person Re-Identification Autor: Guilherme Zasyeki Machado Sumário - Introdução ao problema - Visão geral ao processo de Re-Identificação - Evolução estado da arte - Datasets disponíveis - Análise estado

Leia mais

Descritores de Imagens

Descritores de Imagens Descritores de Imagens André Tavares da Silva PPGCA/UDESC Outubro de 2017 André Tavares da Silva (PPGCA/UDESC) Descritores de Imagens Outubro de 2017 1 / 17 Introdução Excelentes pesquisas sobre descritores

Leia mais

Image Descriptors: color

Image Descriptors: color Image Descriptors: color Image Processing scc0251 www.icmc.usp.br/ moacir moacir@icmc.usp.br ICMC/USP São Carlos, SP, Brazil 2011 Moacir Ponti Jr. (ICMCUSP) Image Descriptors: color 2011 1 / 29 Agenda

Leia mais

RECONHECIMENTO FACIAL 2D

RECONHECIMENTO FACIAL 2D RECONHECIMENTO FACIAL 2D PARA SISTEMAS DE AUTENTICAÇÃO EM DISPOSITIVOS MÓVEIS Luciano Pamplona Sobrinho Orientador: Paulo César Rodacki Gomes ROTEIRO Introdução Objetivos Fundamentação Teórica Conceitos

Leia mais

2 Trabalhos Relacionados

2 Trabalhos Relacionados 2 Trabalhos Relacionados Este capítulo apresenta os algoritmos já existentes que são utilizados nesta dissertação para obter pontos homólogos entre duas imagens de um par estéreo. Pode-se classificar essas

Leia mais

10º Congresso Interinstitucional de Iniciação Científica CIIC a 04 de agosto de 2016 Campinas, São Paulo ISBN

10º Congresso Interinstitucional de Iniciação Científica CIIC a 04 de agosto de 2016 Campinas, São Paulo ISBN Um Estudo de Descritores e Classificadores para Reconhecimento de Bagas de Café Pedro Henrique Ferreira Stringhini 1 ; Thiago Teixeira Santos 2 Nº 16605 RESUMO Métodos de reconhecimento de frutos baseados

Leia mais

Extração de características de imagens. Descritores de cor

Extração de características de imagens. Descritores de cor Extração de características de imagens Descritores de cor Descritores de imagens Problema: computar, de forma eficiente, valores que descrevam uma imagem (ou parte dela) Vetores de características (feature

Leia mais

Análise e conversão de tabloides de. Igor dos Santos Montagner Orientador: Prof. Dr. Roberto Marcondes Cesar Junior. promoções

Análise e conversão de tabloides de. Igor dos Santos Montagner Orientador: Prof. Dr. Roberto Marcondes Cesar Junior. promoções Análise e conversão de tabloides de Igor dos Santos Montagner Orientador: Prof. Dr. Roberto Marcondes Cesar Junior promoções Agenda Problema Objetivo nal Solução proposta Atenção visual e mapa de saliências

Leia mais

Aula 7 - Representação e Descrição de Estruturas Bi-dimensionais. Prof. Adilson Gonzaga

Aula 7 - Representação e Descrição de Estruturas Bi-dimensionais. Prof. Adilson Gonzaga Aula 7 - Representação e Descrição de Estruturas Bi-dimensionais Prof. Adilson Gonzaga 1 Introdução Objetos ou Segmentos são representados como uma coleção de pixels em uma imagem. Para o reconhecimento

Leia mais

VISÃO COMPUTACIONAL PARA RECONHECIMENTO DE FACES APLICADO NA IDENTIFICAÇÃO E AUTENTICAÇÃO DE USUÁRIOS NA WEB. Márcio Koch

VISÃO COMPUTACIONAL PARA RECONHECIMENTO DE FACES APLICADO NA IDENTIFICAÇÃO E AUTENTICAÇÃO DE USUÁRIOS NA WEB. Márcio Koch VISÃO COMPUTACIONAL PARA RECONHECIMENTO DE FACES APLICADO NA IDENTIFICAÇÃO E AUTENTICAÇÃO DE USUÁRIOS NA WEB Márcio Koch Orientador: Jacques Robert Heckmann ROTEIRO Introdução Objetivos do trabalho Fundamentação

Leia mais

Aprendizagem de Máquinas. Extração de Características

Aprendizagem de Máquinas. Extração de Características Universidade Federal do Paraná (UFPR) Departamento de Informática (DInf) Aprendizagem de Máquinas Extração de Características David Menotti, Ph.D. http://web.inf.ufpr.br/menotti 1 Objetivos Entender os

Leia mais

Image Descriptors: texture

Image Descriptors: texture Image Descriptors: texture Image Processing scc0251 www.icmc.usp.br/ moacir moacir@icmc.usp.br ICMC/USP São Carlos, SP, Brazil 2011 Moacir Ponti Jr. (ICMCUSP) Image Descriptors: texture 2011 1 / 28 Agenda

Leia mais

Detecção de falsas correspondências em pares de imagens estereoscópicas utilizando a transformação projetiva no plano e o algoritmo RANSAC

Detecção de falsas correspondências em pares de imagens estereoscópicas utilizando a transformação projetiva no plano e o algoritmo RANSAC Detecção de falsas correspondências em pares de imagens estereoscópicas utilizando a transformação projetiva no plano e o algoritmo RANSAC André Caceres Carrilho Mauricio Galo Renato César dos Santos Curitiba,

Leia mais

Extração de características: textura

Extração de características: textura Extração de características: textura Image Processing scc0251 www.icmc.usp.br/ moacir moacir@icmc.usp.br ICMC/USP São Carlos, SP, Brazil 2011 Moacir Ponti (ICMCUSP) Extração de características: textura

Leia mais

RECONHECIMENTO FACIAL UTILIZANDO EIGENFACES

RECONHECIMENTO FACIAL UTILIZANDO EIGENFACES Universidade Federal do Rio de Janeiro Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia Programa de Engenharia de Sistemas e Computação Rio de Janeiro, RJ Brasil RECONHECIMENTO

Leia mais

Processamento digital de imagens

Processamento digital de imagens Processamento digital de imagens Agostinho Brito Departamento de Engenharia da Computação e Automação Universidade Federal do Rio Grande do Norte 6 de outubro de 2016 Segmentação de imagens A segmentação

Leia mais

11º Congresso Interinstitucional de Iniciação Científica CIIC a 04 de agosto de 2017 Campinas, São Paulo ISBN

11º Congresso Interinstitucional de Iniciação Científica CIIC a 04 de agosto de 2017 Campinas, São Paulo ISBN DETECÇÃO DE FRUTOS EM CAMPO POR APRENDIZADO DE MÁQUINA Andreza Aparecida dos Santos¹; Thiago Teixeira Santos 2 Nº 17603 RESUMO Métodos de reconhecimento de frutos utilizando diferentes descritores e classificadores

Leia mais

Determinação de vícios refrativos oculares utilizando Support Vector Machines

Determinação de vícios refrativos oculares utilizando Support Vector Machines Determinação de vícios refrativos oculares utilizando Support Vector Machines Giampaolo Luiz Libralão, André Ponce de Leon F. de Carvalho, Antonio Valerio Netto, Maria Cristina Ferreira de Oliveira Instituto

Leia mais

Feature Detector. Prof. Dr. Geraldo Braz Junior

Feature Detector. Prof. Dr. Geraldo Braz Junior Feature Detector Prof. Dr. Geraldo Braz Junior Problema: Matching 2 Matching 3 Matching Processo de encontrar uma imagem em outra Normalmente usado para encontrar um objeto numa imagem, mas também: Reconhecimento

Leia mais

Processamento de Imagens COS756 / COC603

Processamento de Imagens COS756 / COC603 Processamento de Imagens COS756 / COC603 aula 09 - curvatura Antonio Oliveira Ricardo Marroquim 1 / 1 aula de hoje feature detection overview curvatura espaço de escala block matching 2 / 1 curvatura o

Leia mais

Reconhecimento de palma de mão. Peterson Wagner Kava de Carvalho

Reconhecimento de palma de mão. Peterson Wagner Kava de Carvalho Reconhecimento de palma de mão Peterson Wagner Kava de Carvalho 1 Sumário 1. Introdução 2. Artigo 1: Palmprint Recognition a. Pré-Processamento b. Extração de Features c. Classificação d. Resultados 3.

Leia mais

Objetivos. 1. O método desenvolvido usa características de pares de pixeis para fazer estatísticas e formar

Objetivos. 1. O método desenvolvido usa características de pares de pixeis para fazer estatísticas e formar Introdução Comidas podem apresentar deformações e variações em sua forma, além de conter muitos ingredientes, nem todos visíveis; Métodos tradicionais de reconhecimento requerem a detecção de características

Leia mais

3 Transformação SIFT (Scale Invariant Feature Transform)

3 Transformação SIFT (Scale Invariant Feature Transform) 3 Transformação SIFT (Scale Invariant Feature Transform) Este capítulo apresenta as seguintes seções: - 3.1 Uma Introdução Sobre Descritores Locais: A técnica SIFT ( Scale Invariant Feature Transform )

Leia mais

Face Detection. Image Processing scc moacir ICMC/USP São Carlos, SP, Brazil

Face Detection. Image Processing scc moacir ICMC/USP São Carlos, SP, Brazil Face Detection Image Processing scc0251 www.icmc.usp.br/ moacir moacir@icmc.usp.br ICMC/USP São Carlos, SP, Brazil 2011 Moacir Ponti Jr. (ICMCUSP) Face Detection 2011 1 / 24 Agenda 1 Detectando faces 2

Leia mais

Sketch to Photo Matching: A Feature-based Approach (Klare and Jain [2010])

Sketch to Photo Matching: A Feature-based Approach (Klare and Jain [2010]) Sketch to Photo Matching: A Feature-based Approach (Klare and Jain [2010]) Marco Antonio de A. Silva Programa de Pós-Graduação em Ciência da Computação - PPGCC Departamento de Computação - DECOM Universidade

Leia mais

Face Recognition using RGB-D Images

Face Recognition using RGB-D Images Face Recognition using RGB-D Images Helder C. R. de Oliveira N.USP: 7122065 Polyana Nunes N.USP: 9043220 Sobre o Artigo Publication: 2013 IEEE Sixth International Conference Author(s) Goswami, G. (Índia

Leia mais

Detecção e Correção Automáticas de Olhos Vermelhos

Detecção e Correção Automáticas de Olhos Vermelhos Setor de Tecnologia da Universidade Federal do Paraná Curso de Engenharia Elétrica TE 072 Processamento Digital de Sinais Detecção e Correção Automáticas de Olhos Vermelhos Trabalho elaborado pelo aluno

Leia mais

Mapeamento do uso do solo para manejo de propriedades rurais

Mapeamento do uso do solo para manejo de propriedades rurais 1/28 Mapeamento do uso do solo para manejo de propriedades rurais Teoria Eng. Allan Saddi Arnesen Eng. Frederico Genofre Eng. Marcelo Pedroso Curtarelli 2/28 Conteúdo programático: Capitulo 1: Conceitos

Leia mais

Visão Computacional. Alessandro L. Koerich. Programa de Pós-Graduação em Engenharia Elétrica Universidade Federal do Paraná (UFPR)

Visão Computacional. Alessandro L. Koerich. Programa de Pós-Graduação em Engenharia Elétrica Universidade Federal do Paraná (UFPR) Visão Computacional Alessandro L. Koerich Programa de Pós-Graduação em Engenharia Elétrica Universidade Federal do Paraná (UFPR) Análise da Imagem Análise da Imagem O algoritmo opera sobre a imagem e extrai

Leia mais

FILTROS ESPACIAIS PASSA-BAIXA

FILTROS ESPACIAIS PASSA-BAIXA UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL PROGRAMA DE PÓS-GRADUAÇÃO EM COMPUTAÇÃO CMP65 - INTRODUÇÃO AO PROCESSAMENTO DE IMAGENS PROFESSOR JACOB SCARCHANSKI FILTROS ESPACIAIS PASSA-BAIXA POR DANIEL NEHME

Leia mais

RECONHECIMENTO DE GESTOS COM SEGMENTAÇÃO DE IMAGENS DINÂMICAS APLICADAS A LIBRAS

RECONHECIMENTO DE GESTOS COM SEGMENTAÇÃO DE IMAGENS DINÂMICAS APLICADAS A LIBRAS RECONHECIMENTO DE GESTOS COM SEGMENTAÇÃO DE IMAGENS DINÂMICAS APLICADAS A LIBRAS ANUÁRIO DA PRODUÇÃO DE INICIAÇÃO CIENTÍFICA DISCENTE Vol. 13, N. 20, Ano 2010 Adilson Roberto Pavan Prof. Jaime Cazhurriro

Leia mais

Fundamentos da Computação Gráfica

Fundamentos da Computação Gráfica Fundamentos da Computação Gráfica Trabalho 2 Visão. Detecção de cantos. Manuel Alejandro Nodarse Moreno (1322198) Introdução. Detecção de cantos é uma abordagem utilizada em sistemas de visão computacional

Leia mais

INFORMAÇÕES DO ACADÊMICO PLANO DE TRABALHO. 1. Justificativa

INFORMAÇÕES DO ACADÊMICO PLANO DE TRABALHO. 1. Justificativa INFORMAÇÕES DO ACADÊMICO Nome: Kleber Padovani de Souza Curso: Engenharia de Computação Semestre: R.A.: Título do plano de trabalho: Extração de atributos da imagem através de momentos de imagem. Nome

Leia mais

Filtros espaciais. Processamento e Recuperação de Imagens Médicas. Prof. Luiz Otavio Murta Jr. Depto. De Computação e Matemática (FFCLRP/USP)

Filtros espaciais. Processamento e Recuperação de Imagens Médicas. Prof. Luiz Otavio Murta Jr. Depto. De Computação e Matemática (FFCLRP/USP) Processamento e Recuperação de Imagens Médicas Prof. Luiz Otavio Murta Jr. Depto. De Computação e Matemática (FFCLRP/USP) 1 Propriedades Operadores de suavização os elementos da máscara são positivos e

Leia mais

Aplicação de Histograma de Gradientes Orientados para detecção de hidrômetros em imagens de fundo complexo

Aplicação de Histograma de Gradientes Orientados para detecção de hidrômetros em imagens de fundo complexo Aplicação de Histograma de Gradientes Orientados para detecção de hidrômetros em imagens de fundo complexo Juliana Patrícia Detroz Professor: André Tavares da Silva Universidade do Estado de Santa Catarina

Leia mais

USO DO DETECTOR DE PONTOS DE INTERESSE SIFT PARA LOCALIZAÇÃO DE ALVOS ARTIFICIAIS DE CONTROLE

USO DO DETECTOR DE PONTOS DE INTERESSE SIFT PARA LOCALIZAÇÃO DE ALVOS ARTIFICIAIS DE CONTROLE IV Simpósio Brasileiro de Geomática SBG17 II Jornadas Lusófonas - Ciências e Tecnologias de Informação Geográfica - CTIG17 Presidente Prudente - SP, 24-26 de julho de 17 p. 341-346 USO DO DETECTOR DE PONTOS

Leia mais

Processamento e Análise de Imagem. Aplicações na Imagem Médica

Processamento e Análise de Imagem. Aplicações na Imagem Médica Processamento e Análise de Imagem Aplicações na Imagem Médica António M. Gonçalves Pinheiro Departamento de Física Covilhã - Portugal pinheiro@ubi.pt Tecnologia de Imagem Imagem de Entrada Processamento

Leia mais

SEMINÁRIO DOS ARTIGOS:

SEMINÁRIO DOS ARTIGOS: SEMINÁRIO DOS ARTIGOS: Text Detection and Character Recognition in Scene Images with Unsupervised Feature Learning End-to-End Text Recognition with Convolutional Neural Networks Fernanda Maria Sirlene

Leia mais

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Representação. David Menotti.

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Representação. David Menotti. Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica Representação David Menotti www.inf.ufpr.br/menotti/ci171-182 Representação Agenda Introdução Extraindo Representações de Imagens

Leia mais

Realce de imagens parte 2: ltragem espacial SCC5830/0251 Processamento de Imagens

Realce de imagens parte 2: ltragem espacial SCC5830/0251 Processamento de Imagens Realce de imagens parte 2: ltragem espacial SCC5830/0251 Processamento de Imagens Prof. Moacir Ponti Jr. www.icmc.usp.br/~moacir Instituto de Ciências Matemáticas e de Computação USP 2013/1 Moacir Ponti

Leia mais

Extração de objetos de interesse em imagens digitais utilizando a biblioteca de Visão Computacional OpenCV

Extração de objetos de interesse em imagens digitais utilizando a biblioteca de Visão Computacional OpenCV Extração de objetos de interesse em imagens digitais utilizando a biblioteca de Visão Computacional OpenCV Izadora Aparecida RAMOS 1,3,4 ; Servílio Souza de ASSIS 1,3,4 ; Bruno Alberto Soares OLIVEIRA

Leia mais

Reconhecimento de Gestos com Segmentação de Imagens Dinâmicas Aplicadas a Libras

Reconhecimento de Gestos com Segmentação de Imagens Dinâmicas Aplicadas a Libras Reconhecimento de Gestos com Segmentação de Imagens Dinâmicas Aplicadas a Libras Adilson Roberto Pavan Fábio Alexandre Caravieri Modesto Anhanguera Educacional adilson.pavan@gmail.com fabiomodesto@uol.com.br

Leia mais

Implementação dos Algoritmos e Resultados

Implementação dos Algoritmos e Resultados Capítulo 6 Implementação dos Algoritmos e Resultados 6.1 Considerações Iniciais Diversas situações foram exploradas neste trabalho visando analisar qual seria a wavelet mais adequada para sistemas de extração

Leia mais

Fazendo máquinas enxergarem com OpenCV. TCHÊLINUX 2017 Felipe Aguiar Corrêa

Fazendo máquinas enxergarem com OpenCV. TCHÊLINUX 2017 Felipe Aguiar Corrêa Fazendo máquinas enxergarem com OpenCV TCHÊLINUX 2017 Felipe Aguiar Corrêa Quem é esse cara aí? UFPEL Ciência da Computação Visão Computacional Rastreamento de Pedestres Visão Computacional Sub-área da

Leia mais

Consultas por Similaridade em Domínios de Dados Complexos

Consultas por Similaridade em Domínios de Dados Complexos Consultas por Similaridade em Domínios de Dados Complexos Guilherme Felipe Zabot Orientador: Profº Dr Caetano Traina Jr Roteiro Objetivo Introdução Dados Complexos Representação de Dados Complexos Extração

Leia mais

Rastreamento de Objetos Baseado em Grafos. Casamento Inexato entre Grafos Relacionais com Atributos

Rastreamento de Objetos Baseado em Grafos. Casamento Inexato entre Grafos Relacionais com Atributos Rastreamento de Objetos Baseado em Casamento Inexato entre Grafos Relacionais com Atributos Exame de Qualificação de Mestrado Ana Beatriz Vicentim Graciano Orientador: Roberto M. Cesar Jr. Colaboradora:

Leia mais

Criação de mosaico usadando o SURF e o matcher FLANN

Criação de mosaico usadando o SURF e o matcher FLANN Criação de mosaico usadando o SURF e o matcher FLANN Felipe Jordão Pinheiro de Andrade Universidade Federal do Maranhão, São Luis, BRA Abstract. O trabalho propoe uma metodologia para a criação de um mosaico

Leia mais

Extração dos Pontos Característicos de uma Imagem através do método SIFT. Helder C. R. de Oliveira Orientador: Prof. Marco A.

Extração dos Pontos Característicos de uma Imagem através do método SIFT. Helder C. R. de Oliveira Orientador: Prof. Marco A. Extração dos Pontos Característicos de uma Imagem através do método SIFT Helder C. R. de Oliveira Orientador: Prof. Marco A. Piteri Presidente Prudente 2013 Sumário 1 Introdução 1 2 Processamento de Imagens

Leia mais

Localização de Robôs Móveis por Aparência Visual

Localização de Robôs Móveis por Aparência Visual Felipe Gustavo Bombardelli Localização de Robôs Móveis por Aparência Visual Curitiba 2014 Felipe Gustavo Bombardelli Localização de Robôs Móveis por Aparência Visual Trabalho de Graduação apresentado

Leia mais

Processamento digital de imagens

Processamento digital de imagens Processamento digital de imagens Agostinho Brito Departamento de Engenharia da Computação e Automação Universidade Federal do Rio Grande do Norte 3 de março de 2016 Transformação e filtragem de imagens

Leia mais

Métodos de Extração de Características

Métodos de Extração de Características 1. Introdução Métodos de Extração de Características A Interpretação ou entendimento de uma cena demanda o reconhecimento de seus objetos. Reconhecimento de objetos ou padrões contidos em uma cena -> é

Leia mais

INTRODUÇÃO AO PROCESSAMENTO DIGITAL DE IMAGENS SENSORIAMENTO REMOTO

INTRODUÇÃO AO PROCESSAMENTO DIGITAL DE IMAGENS SENSORIAMENTO REMOTO INTRODUÇÃO AO PROCESSAMENTO DIGITAL DE IMAGENS SENSORIAMENTO REMOTO PROCESSAMENTO DE IMAGENS Introdução Conceitos básicos Pré-processamento Realce Classificação PROCESSAMENTO DE IMAGENS Extração de Informações

Leia mais

Extração de Características. Carlos Alexandre Mello

Extração de Características. Carlos Alexandre Mello Extração de Características Carlos Alexandre Mello Pós-Graduação em Ciência da Computação Carlos Alexandre Mello cabm@cin.ufpe.br 1 Extração de Características Representação de objetos através de um conjunto

Leia mais

O reconhecimento facial é dividido em três etapas: i) detecção da face, ii) extração de características e iii) reconhecimento da face.

O reconhecimento facial é dividido em três etapas: i) detecção da face, ii) extração de características e iii) reconhecimento da face. ESTUDO SOBRE MÉTODOS DE RECONHECIMENTO FACIAL EM FOTOGRAFIAS DIGITAIS Ana Elisa SCHMIDT¹, Elvis Cordeiro NOGUEIRA² ¹ Orientadora e docente do IFC-Campus Camboriú; ² Aluno do curso de Bacharelado em Sistemas

Leia mais

Preenchimento de Polígonos

Preenchimento de Polígonos Preenchimento de Polígonos SCC0250 - Computação Gráca Prof. Fernando V. Paulovich http://www.icmc.usp.br/~paulovic paulovic@icmc.usp.br Instituto de Ciências Matemáticas e de Computação (ICMC) Universidade

Leia mais

Relatório sobre os Resultados obtidos através do uso dos algoritmos SIFT e RANSAC para Reconstrução de um Objeto a partir de uma Nuvem de Pontos

Relatório sobre os Resultados obtidos através do uso dos algoritmos SIFT e RANSAC para Reconstrução de um Objeto a partir de uma Nuvem de Pontos Relatório sobre os Resultados obtidos através do uso dos algoritmos SIFT e RANSAC para Reconstrução de um Objeto a partir de uma Nuvem de Pontos Gustavo Moreira PUC-Rio, Departamento de Informática Rua

Leia mais

Processamento de Imagens COS756 / COC603

Processamento de Imagens COS756 / COC603 Processamento de Imagens COS756 / COC603 aula 15 - Fluxo Ótico - parte I Antonio Oliveira Ricardo Marroquim 1 / 1 aula de hoje fluxo ótico estimando movimentos em imagens 2 / 1 motivação para que serve?

Leia mais

Tracking de movimentos usando marcadores circulares

Tracking de movimentos usando marcadores circulares UNIVERSIDADE FEDERAL DO RIO DE JANEIRO - COPPE INTRODUÇÃO AO PROCESSAMENTO DE IMAGENS Tracking de movimentos usando marcadores circulares Jéssica de Abreu DRE:114069619 Junho de 2014 1 INTRODUÇÃO Com a

Leia mais

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Extração de Características

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Extração de Características Universidade Federal do Paraná Departamento de Informática Reconhecimento de Padrões Extração de Características Luiz Eduardo S. Oliveira, Ph.D. http://lesoliveira.net Objetivos Entender os conceitos de

Leia mais

Processamento de Imagem. Prof. MSc. André Yoshimi Kusumoto

Processamento de Imagem. Prof. MSc. André Yoshimi Kusumoto Processamento de Imagem Prof. MSc. André Yoshimi Kusumoto andrekusumoto.unip@gmail.com Filtragem de Imagens A utilização de filtros tem como objetivo melhorar a qualidade das imagens através da: ampliação

Leia mais

Extração de características utilizando filtros de Gabor aplicado a identificação de defeitos no couro bovino

Extração de características utilizando filtros de Gabor aplicado a identificação de defeitos no couro bovino Extração de características utilizando filtros de Gabor aplicado a identificação de defeitos no couro bovino André Luiz Pasquali 24 de abril de 2006 1 Antecedentes e Justificativa Atualmente o Brasil vem

Leia mais

Processamento de Imagens COS756 / COC603

Processamento de Imagens COS756 / COC603 Processamento de Imagens COS756 / COC603 aula 07 - deteção de características de baixo-nível (low-level feature detection) Antonio Oliveira Ricardo Marroquim 1 / 35 aula de hoje feature detection overview

Leia mais

PROCESSAMENTO DIGITAL DE IMAGENS

PROCESSAMENTO DIGITAL DE IMAGENS UNIVERSIDADE DE SÃO PAULO ESCOLA SUPERIOR DE AGRICULTURA LUIZ DE QUEIROZ DEPARTAMENTO DE ENGENHARIA DE BIOSSISTEMAS DISCIPLINA: LEB450 TOPOGRAFIA E GEOPROCESSAMENTO II PROF. DR. CARLOS ALBERTO VETTORAZZI

Leia mais

Extração de atributos usando o método LBP - Local Binary Pattern

Extração de atributos usando o método LBP - Local Binary Pattern Extração de atributos usando o método LBP - Local Binary Pattern Lia Nara Balta Quinta. 2 de maio de 2006 1 Antecedentes e Justificativa O Brasil possui, atualmente, um grande rebanho bovino, porém em

Leia mais

PMR2560 Visão Computacional Conversão e Limiarização. Prof. Eduardo L. L. Cabral

PMR2560 Visão Computacional Conversão e Limiarização. Prof. Eduardo L. L. Cabral PMR2560 Visão Computacional Conversão e Limiarização Prof. Eduardo L. L. Cabral Objetivos Processamento de imagens: Conversão de imagens; Histograma; Limiarização. Imagem digital Uma imagem é uma matriz

Leia mais

PMR2560 Visão Computacional Detecção de bordas. Prof. Eduardo L. L. Cabral

PMR2560 Visão Computacional Detecção de bordas. Prof. Eduardo L. L. Cabral PMR56 Visão Computacional Detecção de bordas Prof. Eduardo L. L. Cabral Objetivos Processamento de imagens: Características; Detecção de bordas. Características Tipos de características: Bordas; Cantos;

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial INF 1771 Inteligência Artificial Aula 13 K-Nearest Neighbor (KNN) 2016.1 Prof. Augusto Baffa Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor

Leia mais

Mapeamento de ambientes e processamento visual utilizando Kinect

Mapeamento de ambientes e processamento visual utilizando Kinect Mapeamento de ambientes e processamento visual utilizando Kinect Mário Alberto Cecchi Raduan Bolsista PIBIC/UFRJ Orientador: Adriano Joaquim de Oliveira Cruz, PhD Laboratório de Inteligência Computacional

Leia mais

Busca de imagens baseada no conteúdo: Aplicação em imagens médicas

Busca de imagens baseada no conteúdo: Aplicação em imagens médicas Busca de imagens baseada no conteúdo: Aplicação em imagens médicas Rafael Gessele Orientador: Prof. Dr. Mauro Marcelo Mattos Sumário Introdução Objetivos do trabalho Fundamentação teórica Desenvolvimento

Leia mais

Universidade Federal do Rio de Janeiro. Flávio Henrique Schuindt da Silva. Estimativa de Fluxo Ótico com o método de Lukas-Kanade

Universidade Federal do Rio de Janeiro. Flávio Henrique Schuindt da Silva. Estimativa de Fluxo Ótico com o método de Lukas-Kanade Universidade Federal do Rio de Janeiro Programa de Engenharia de Sistemas e Computação Introdução ao Processamento de Imagens Flávio Henrique Schuindt da Silva Estimativa de Fluxo Ótico com o método de

Leia mais

Face Descrip+on with Local Binary Pa6erns: Applica+on to Face Recogni+on JULIANO RAMOS LUANN LUNA

Face Descrip+on with Local Binary Pa6erns: Applica+on to Face Recogni+on JULIANO RAMOS LUANN LUNA Face Descrip+on with Local Binary Pa6erns: Applica+on to Face Recogni+on JULIANO RAMOS LUANN LUNA Introdução O ar%go visa criar uma abordagem para o problema de reconhecimento de face: i.e.: Dada uma face,

Leia mais

Region Based CNNs. Francisco Calaça Xavier. Programa de pós-graduação em Ciências da Computação Mestrado e Doutorado. Instituto de Informática UFG

Region Based CNNs. Francisco Calaça Xavier. Programa de pós-graduação em Ciências da Computação Mestrado e Doutorado. Instituto de Informática UFG Region Based CNNs Francisco Calaça Xavier Programa de pós-graduação em Ciências da Computação Mestrado e Doutorado Instituto de Informática UFG Prof. Anderson Soares Agenda O problema Estado da arte R-CNN

Leia mais

DESENVOLVIMENTO DE SISTEMA PARA GERAÇÃO DE MOSAICO DE IMAGENS VISANDO LOCALIZAÇÃO E NAVEGAÇÃO DE ROBÔS MÓVEIS

DESENVOLVIMENTO DE SISTEMA PARA GERAÇÃO DE MOSAICO DE IMAGENS VISANDO LOCALIZAÇÃO E NAVEGAÇÃO DE ROBÔS MÓVEIS DESENVOLVIMENTO DE SISTEMA PARA GERAÇÃO DE MOSAICO DE IMAGENS VISANDO LOCALIZAÇÃO E NAVEGAÇÃO DE ROBÔS MÓVEIS Edson CAVALCANTI Neto (1), Guilherme Costa HOLANDA (1), Antonio Themoteo VARELA (1), André

Leia mais

Tópicos Especiais em Reconhecimento de Padrões [2COP329] Mestrado em Ciência da. Sylvio Barbon Jr

Tópicos Especiais em Reconhecimento de Padrões [2COP329] Mestrado em Ciência da. Sylvio Barbon Jr Tópicos Especiais em Reconhecimento de Padrões [2COP329] Mestrado em Ciência da Computação Sylvio Barbon Jr barbon@uel.br (2/20) Tema Aula 1 Introdução ao Reconhecimento de Padrões 1 Introdução 2 Referências

Leia mais

Exemplos. Propagação (Reconstrução)

Exemplos. Propagação (Reconstrução) Processamento de Imagens Médicas Morfologia Matemática em Imagens Prof. Luiz Otavio Murta Jr. Informática Biomédica Depto. de Física e Matemática (FFCLRP/USP) Propagação (Reconstrução) lgoritmos Baseados

Leia mais

T4.1 Processamento de Imagem

T4.1 Processamento de Imagem T4.1 Processamento de Imagem Proc. Sinal e Imagem Mestrado em Informática Médica Miguel Tavares Coimbra Resumo 1. Manipulação ponto a ponto 2. Filtros espaciais 3. Extracção de estruturas geométricas 4.

Leia mais

INF Fundamentos da Computação Gráfica Professor: Marcelo Gattass Aluno: Rogério Pinheiro de Souza

INF Fundamentos da Computação Gráfica Professor: Marcelo Gattass Aluno: Rogério Pinheiro de Souza INF2608 - Fundamentos da Computação Gráfica Professor: Marcelo Gattass Aluno: Rogério Pinheiro de Souza Trabalho 02 Visualização de Imagens Sísmicas e Detecção Automática de Horizonte Resumo Este trabalho

Leia mais

T4 Processamento de Imagem

T4 Processamento de Imagem T4 Processamento de Imagem Proc. Sinal e Imagem Mestrado em Informática Médica Hélder Filipe Pinto de Oliveira Resumo 1. Manipulação ponto a ponto 2. Conetividade 3. Filtros espaciais 4. Extração de estruturas

Leia mais

Processamento digital de imagens

Processamento digital de imagens Processamento digital de imagens Agostinho Brito Departamento de Engenharia da Computação e Automação Universidade Federal do Rio Grande do Norte 11 de novembro de 2016 Fluxo óptico Usado para estimar

Leia mais

Capítulo III Processamento de Imagem

Capítulo III Processamento de Imagem Capítulo III Processamento de Imagem Proc. Sinal e Imagem Mestrado em Informática Médica Miguel Tavares Coimbra Resumo 1. Manipulação ponto a ponto 2. Filtros espaciais 3. Extracção de estruturas geométricas

Leia mais

INTERPOLAÇÃO LINEAR E BILINEAR: APLICAÇÃO EM TRANSFORMAÇÕES GEOMÉTRICAS DE IMAGEM INTRODUÇÃO

INTERPOLAÇÃO LINEAR E BILINEAR: APLICAÇÃO EM TRANSFORMAÇÕES GEOMÉTRICAS DE IMAGEM INTRODUÇÃO INTERPOLAÇÃO LINEAR E BILINEAR: APLICAÇÃO EM TRANSFORMAÇÕES GEOMÉTRICAS DE IMAGEM Autores: Giulia Denise Kujat VIEIRA; Milene Karine GUBETTI. Identificação autores: Estudantes do Curso Técnico em Informática

Leia mais