Uma Abordagem para Extração de Texto em Vídeos Digitais Baseada em Análise Temporal

Tamanho: px
Começar a partir da página:

Download "Uma Abordagem para Extração de Texto em Vídeos Digitais Baseada em Análise Temporal"

Transcrição

1 PONTIFÍCIA UNIVERSIDADE CATÓLICA DE MINAS GERAIS Programa de Pós-Graduação em Informática Uma Abordagem para Extração de Texto em Vídeos Digitais Baseada em Análise Temporal Ângelo Magno de Jesus Belo Horizonte 2011

2 Ângelo Magno de Jesus Uma Abordagem para Extração de Texto em Vídeos Digitais Baseada em Análise Temporal Dissertação apresentada ao Programa de Pós- Graduação em Informática como requisito parcial para obtenção do título de Mestre em Informática pela Pontifícia Universidade Católica de Minas Gerais. Orientador: Silvio Jamil Ferzoli Guimarães Belo Horizonte 2011

3 FICHA CATALOGRÁFICA Elaborada pela Biblioteca da Pontifícia Universidade Católica de Minas Gerais J58u Jesus, Ângelo Magno de Uma abordagem para extração de texto em vídeos digitais baseada em análise temporal / Ângelo Magno de Jesus. Belo Horizonte, f.: il. Orientador: Silvio Jamil Ferzoli Guimarães Dissertação (Mestrado) Pontifícia Universidade Católica de Minas Gerais. Programa de Pós-Graduação em Informática. 1. Processamento de textos (Computação). 2. Sistemas de recuperação da informação. 3. Vídeo digital. I. Guimarães, Silvio Jamil Ferzoli. II. Pontifícia Universidade Católica de Minas Gerais. Programa de Pós-Graduação em Informática. III. Título. CDU:

4 Ângelo Magno de Jesus Uma Abordagem para Extração de Texto em Vídeos Digitais Baseada em Análise Temporal Dissertação apresentada ao Programa de Pós-Graduação em Informática como requisito parcial para qualicação ao Grau de Mestre em Informática pela Pontifícia Universidade Católica de Minas Gerais. Professor Dr. Silvio Jamil Ferzole Guimarães. (Orientador) PUC Minas Professor Dr. Zenilton Kleber Gonçalves do Patrocínio Jr. PUC Minas Professor Dr. Guillermo Câmara Chávez UFOP Belo Horizonte, 25 de Março de 2011.

5 Ao meu pai com muito amor.

6 AGRADECIMENTOS A Deus por me sustentar durante todo o tempo. Ao meu pai amado Rogério Fátima de Jesus, o qual tenho muitas saudades, que tornou esta realização possível, sempre me apoiou nos estudos e fez de tudo por minha felicidade. A minha mãe Maria Angela e irmão Alessandro pelo apoio. A minha noiva Simone pela paciência e amor. Ao meu orientador Silvio Jamil Ferzoli Guimarães pela orientação e pela oportunidade. Ao professor Zenilton Kleber G. Patrocínio Junior pelas críticas e sugestões que contribuíram para o trabalho. A todos os professores do mestrado em Informática da PUC Minas pelas excelentes aulas. Aos meus amigos do mestrado Henrique e Kleber, que batalharam muito junto comigo. As novas amizades que consegui morando em Belo Horizonte durante este tempo. Aos meus companheiros do Centro de Inovação Microsoft. A Lucilene e Giovana por serem sempre receptivas e atenciosas. A minha tia Sônia e meu tio Jadir por estarem sempre dispostos a me acolher e me ajudar. Ao meu excompanheiro de apartamento Lele (Alessandro), por muitos momentos engraçados e muitos apertos vividos no cafofo. Ao programa de Mestrado da PUC Minas pela ótima oportunidade.

7 Estou pessoalmente convencido de que a ciência da computação tem muito em comum com a física. Ambas se referem a como o mundo trabalha em um nível bastante fundamental. A diferença, é claro, é que enquanto na física espera-se que você imagine como o mundo é feito, na ciência da computação o mundo é criado. Linus Torvalds - Cientista da Computação

8 RESUMO A evolução e popularização de tecnologias como softwares de edição de imagens e vídeos, aparelhos de gravação e reprodução de vídeos digitais e a Internet, possibilitou que um grande volume de conteúdo visual fosse produzido e disponibilizado em diversas bases de dados. No entanto, há poucas possibilidades de recuperação de toda esta informação, normalmente, o conteúdo de vídeos e imagens é indexado por meio de palavras chaves informadas pelos próprios usuários. Neste contexto, é de extrema importância que usuários possam encontrar com maior facilidade os dados que procuram. Técnicas de extração de texto em imagens e vídeos podem possibilitar uma maior qualidade na busca de informações, pois o texto presente em imagens e vídeos representa conteúdo relevante para ser indexado. Neste trabalho é apresentada uma nova abordagem para extração de texto em vídeos e imagens digitais. Esta abordagem é baseada na regularização de cores para extração de bordas de texto e geração de componentes conexos, e em um algoritmo que ltra falsos alarmes pelas características temporais do vídeo. Os experimentos realizados demonstraram que a abordagem proposta é promissora, uma vez que, obteve melhores resultados do que outra abordagem desenvolvida recentemente na literatura. A abordagem proposta também demonstrou ser robusta a transições de texto no vídeo. Palavras-chave: Extração de texto, Localização de texto, Análise de conteúdo de vídeo.

9 ABSTRACT The evolution and popularization of technologies such as software for editing pictures and videos, reproduction and recording digital videos devices and the Internet enabled that a large amount of visual content was produced and made available in many databases. However, there are few possibilities for recovering all of this information, usually, the content of videos and images are indexed by keywords informed by users. In this context, it is extremely important that users can nd the data that they want more eectively. Techniques for extraction of text in images and videos enable a higher quality in information retrieval, since the present text in images and videos is a relevant content to be indexed. In this paper, we present a new approach for text extraction in digital videos and images. This approach is based on the color regularization for edge detection and generation of connected components, and in an algorithm that lters out false alarms by the temporal characteristics of the video. The experiments demonstrate that the approach is very promising, because, it gets better results than other approach recently developed in the literature. The proposed approach also demonstrates to be robust to text transition in videos. Key-words: Text-extraction, Text-localization, Video content analysis.

10 LISTA DE FIGURAS FIGURA 1 Resultado da aplicação de um mecanismo de OCR na imagem original (a) e na imagem processada (b) com o método proposto, respectivamente. (a)fonte: (CEZARWORLD, 200-), (b) Fonte: Elaborada pelo autor FIGURA 2 Exemplos de texto em vídeos: (a) texto de cena; (b) texto articial. (a) Fonte: (POSTASDEPOIA, 200-), (b) Fonte: (IEEESPECTRUM, 200-). 21 FIGURA 3 (a) vizinhança-4 de um pixel; (b) vizinhança-8 de um pixel. Fonte: Elaborada pelo autor FIGURA 4 Exemplos de caminhos. (a) caminho-4 de tamanho 12; (b) caminho-8 de tamanho 9. Fonte: Elaborada pelo autor FIGURA 5 Componentes conexos em uma imagem bidimensional. Fonte: Elaborada pelo autor FIGURA 6 Borda e interior de um componente. (a) imagem binária original; (b) pixels da borda e interior. Fonte: Elaborada pelo autor FIGURA 7 (a) Subárea de uma imagem mostrando valores de pixels; (b) uma máscara 3 3 com coecients genéricos. Fonte: Adaptada de (GONZALEZ; WOODS, 1992) FIGURA 8 (a) conjunto A, (b) conjunto A transladado de um ponto x, (c) conjunto B, (d) reexão do conjunto B. Fonte: Elaborada pelo autor FIGURA 9 Exemplo de dilatação: (a) Conjunto A, (b) elemento estruturante representado pelo conjunto B e (c) resultado da operação de dilatação de A pelo elemento estruturante B. Fonte: Elaborada pelo autor

11 FIGURA 10 Exemplo de erosão: (a) Conjunto A, (b) elemento estruturante representado pelo conjunto B e (c) resultado da operação de erosão de A pelo elemento estruturante B. Fonte: Elaborada pelo autor FIGURA 11 Exemplo de aplicação da operação de abertura no conjunto A, a partir do elemento estruturante B. Fonte: Adaptada de (MARQUES FILHO; VIEIRA NETO, 1999) FIGURA 12 (a) imagem original, (b) histograma da imagem (a). (a) Fonte: (AMA- ZON, 200-), (b) Fonte: Elaborada pelo autor FIGURA 13 (a) Imagem original à esquerda e (b) imagem clusterizada pelo algoritmo mean shift à direita. (a) Fonte: (CARLTON, 2010), (b) Fonte: Elaborada pelo autor FIGURA 14 Diferentes formas de textos em imagens. Fonte: (JUNG K.; KIM; ANIL, 2003) FIGURA 15 Exemplo de texto com baixo contraste com o plano de fundo e caractere parcialmente oculto. Fonte: (DDESFILE COMPLETO, 2009) FIGURA 16 Visão geral dos métodos presentes no estado da arte em extração de conteúdo textual. Fonte: Adaptada de (JUNG K.; KIM; ANIL, 2003) FIGURA 17 Aplicação de algoritmos de AGME: (a) letra L, (b) clusterização pela distância RGB e (c) clusterização pela distância espacial/rgb. Fonte: (LOPRESTI; ZHOU, 2000) FIGURA 18 Triangulação de delaunay em centróides de componentes conexos. Fonte: (XIAO; YAN, 2003) FIGURA 19 Da esquerda para direita: imagem original, clusterização por distância euclidiana, clusterização por similaridade através do coseno. Fonte: (MANCAS-THILLOU; GOSSELIN, 2005)

12 FIGURA 20 Operador de Compasso. Fonte: (LIU; SAMARABANDU, 2006) FIGURA 21 Visão geral do método proposto por Jung; Han (2004). Fonte: (JUNG; HAN, 2004) FIGURA 22 Visão geral do método proposto para extração e reconhecimento de texto. Fonte: Elaborada pelo autor FIGURA 23 Método proposto para detecção e localização de texto. Fonte: Elaborada pelo autor FIGURA 24 (a) Exemplo de uma imagem dada como entrada para o passo de localização, (b) Imagem (a) após a aplicação da regularização de cores. Fonte: Elaborada pelo autor.(a)fonte: (SWEETHOSHI, 200-), (b)fonte: Elaborada pelo autor FIGURA 25 (a) Exemplo de obtenção das bordas aplicada na Figura 24 (b), (b) Imagem (a) após a segmentação de componentes conexos. Fonte: Elaborada pelo autor FIGURA 26 (a) Exemplo de ltragem morfológica aplicada na Figura 26 (b), (b) Imagem (a) após a ltragem heurística. Fonte: Elaborada pelo autor.. 60 FIGURA 27 (a) região localizada contendo texto (b) segmentação pelo limiar de Otsu (c) segmentação pelo limiar proposto. Fonte: Elaborada pelo autor FIGURA 28 Obtenção do limiar para segmentação do texto através da avaliação do histograma: 72 valor obtido pelo limiar de Otsu, 238 maior número de pixels a partir do centro e 155 valor do limiar obtido pela média dos valores anteriores. Fonte: Elaborada pelo autor FIGURA 29 Exemplo de tratamento temporal: frame x, frame x+t e o resultado da interseção entre os frames. Fonte: Elaborada pelo autor

13 FIGURA 30 (a) sequência de frames a ser processada com parâmetros s1 = 20 e s2 = 10, (b) delimitação por s1 da sequência de frames a ser processada, (c) interseção dos frames 1 e 10 delimitados por s2, (d) interseção dos frames 1 e 20 delimitados por s2 e (e) seleção de R1 como resultado. Fonte: Elaborada pelo autor FIGURA 31 (a) delimitação por s1 da sequência de frames a ser processada após processamento ilustrado pela Figura 30, (b) interseção dos frames 21 e 30 delimitados por s2, (c) interseção dos frames 21 e 40 delimitados por s2, (d) seleção do resultado das interseções R4, (e) detecção de transição de texto e (f) assimilação de R1 como resultado para o frame 21 em um passo de pós-processamento. Fonte: Elaborada pelo autor FIGURA 32 (a) Frame original, (b) frame (a) processado pela abordagem de Yen; Chang (2010) e (c) frame (a) processado pela abordagem proposta. (a) Fonte: (AJ NETWORK, 2009), (b) e (c) Fonte: Elaborada pelo autor FIGURA 33 (a) Frame original, (b) frame (a) processado pela abordagem de Yen; Chang (2010) e (c) frame (a) processado pela abordagem proposta. (a) Fonte: (VILLAIN, 2009), (b) e (c) Fonte: Elaborada pelo autor FIGURA 34 (a) Frame original, (b) frame (a) processado pela abordagem de Yen; Chang (2010) e (c) frame (a) processado pela abordagem proposta. (a) Fonte: (MICROSOFT, 2009), (b) e (c) Fonte: Elaborada pelo autor FIGURA 35 (a) Frame original, (b) frame (a) processado pela abordagem de Yen; Chang (2010) e (c) frame (a) processado pela abordagem proposta. (a) Fonte: (NINTENDO, 2010), (b) e (c) Fonte: Elaborada pelo autor FIGURA 36 (a) Frame original, (b) frame (a) processado pela abordagem de Yen; Chang (2010) e (c) frame (a) processado pela abordagem proposta. (a) Fonte: (IMAGEM FILMES, 2009), (b) e (c) Fonte: Elaborada pelo autor. 78 FIGURA 37 (a) Frame original, (b) frame (a) processado pela abordagem de Yen;

14 Chang (2010) e (c) frame (a) processado pela abordagem proposta. (a) Fonte: (IMAGEM FILMES, 2009), (b) e (c) Fonte: Elaborada pelo autor. 79 FIGURA 38 (a) Frame original, (b) frame (a) processado pela abordagem de Yen; Chang (2010) e (c) frame (a) processado pela abordagem proposta. (a) Fonte: (DDESFILE COMPLETO, 2009), (b) e (c) Fonte: Elaborada pelo autor FIGURA 39 (a) Frame original, (b) frame subsequente ao frame (a), resultado da integração entre os frames (a) e (b) processados pela abordagem de Yen; Chang (2010) e (c) resultado da integração entre os frames (a) e (b) processados pela abordagem proposta. (a) e (b) Fonte: (AJ NETWORK, 2009), (b) e (c) Fonte: Elaborada pelo autor FIGURA 40 (a) Frame original, (b) frame (a) processado pela abordagem de Yen; Chang (2010) e (c) frame (a) processado pela abordagem proposta. (a) Fonte: (BLANK, 2007), (b) e (c) Fonte: Elaborada pelo autor

15 LISTA DE QUADROS QUADRO 1 Informações a respeito da base de dados de vídeos para o Experimento 1. Fonte: Elaborada pelo autor QUADRO 2 Informações a respeito da base de dados de vídeos. Fonte: Elaborada pelo autor

16 LISTA DE TABELAS TABELA 1 TABELA 2 TABELA 3 Comparação da segmentação de texto para s1 = 30. Fonte: Elaborada pelo autor Comparação da segmentação de texto para s1 = 15. Fonte: Elaborada pelo autor Comparação da segmentação de texto para s1 = 10. Fonte: Elaborada pelo autor TABELA 4 Comparação da segmentação de texto. Fonte: Elaborada pelo autor. 76 TABELA 5 Comparação do reconhecimento de texto. Fonte: Elaborada pelo autor

17 SUMÁRIO 1.1 Motivação Objetivos Objetivo Geral Objetivos Especícos Restrições Tema Delimitação do Tema Justicativa Contribuições Organização deste Trabalho Vizinhança Caminho Componentes Conexos Borda Operações de Convolução com Máscara Operador Sharpen Operador Sobel Operadores Morfológicos Dilatação Erosão Abertura Textura Histograma Limiarização de Otsu Algoritmo Mean Shift Vídeo Digital Texto em Imagens e Vídeos Características Gerais de Texto em Imagens e Vídeos Características de Texto Articial Visão Geral do Estado da Arte Detecção de Texto Localização de Texto Métodos Baseados em Textura Métodos Baseados em Região Métodos Baseados em Componentes Conexos Métodos Baseados em Bordas Outras Abordagens Rastreamento e Análise Temporal Detecção e Localização de Texto Regularização de Cores da Imagem Detecção das Bordas do Texto Identicação de Componentes Conexos Filtragem

18 Filtragem Morfológica Filtragem por Heurísticas Segmentação Segmentação nas Regiões de Texto Tratamento Temporal Análise de Alinhamento Horizontal Métricas Adotadas Métricas para Avaliação da Extração de Texto Métricas para Avaliação do Reconhecimento de Texto Experimento Parâmetros Utilizados Regularização de Cores da Imagem Detecção das Bordas do Texto Identicação de Componentes Conexos Filtragem Tratamento Temporal Resultados Obtidos Experimento Parâmetros Utilizados Reconhecimento de Texto Resultados Obtidos Resultados Qualitativos REFERÊNCIAS

19 1 INTRODUÇÃO O avanço tecnológico atual, como a evolução das câmeras digitais, aparelhos de reprodução e gravação de DVDs, ferramentas de edição de imagens e vídeos, e especialmente a evolução da Internet, possibilitou um grande aumento do volume de conteúdo visual gerado por usuários e instituições. Com estas tecnologias, torna-se cada vez mais comum a criação, digitalização e cópia de vídeos. Usuários não só digitalizam seus documentos como se sentem motivados, a todo momento, a postar estes documentos em sites da Internet, como por exemplo o YouTube, para compartilhá-los com outros usuários. Com o aumento expressivo deste tipo de conteúdo, torna-se um grande desao realizar a organização e recuperação de toda esta informação. Para Lienhart; Stuber (1996) a maioria dos dados a respeito de vídeos estão desestruturados, os vídeos são gravados e disponibilizados apenas como pixels. A maior parte das bases de dados presentes na Internet apenas apresentam o título e uma breve descrição dos vídeos armazenados. Não há informações adicionais sobre conteúdo como ano de produção, autores, locais das tomadas etc. A usabilidade do vídeo é limitada impossibilitando uma recuperação efetiva e ecaz destes dados. Com isso, torna-se muito difícil encontrar determinados tipos de lmes ou cenas nas bases de dados. Informações adicionais sobre conteúdo de vídeos são de grande importância. É comum que usuários em muitas aplicações tenham que informar os metadados, para que a imagem ou o vídeo possa ser indexado a partir destes dados, no entanto, este trabalho muitas vezes é dispendioso, tomando muito tempo do usuário, sendo que em vídeos muito grandes ou em bases de imagens muito extensas se torna inviável. Dado o cenário descrito anteriormente, é de grande interesse que haja a possibilidade de indexação e recuperação automática de dados nesta grande massa de conteúdo, para facilitar o acesso a informações em vídeos e banco de dados de imagens. Métodos de extração de texto podem ser muito úteis para organização de toda essa informação, pois o texto presente em imagens pode ser utilizado na construção de índices de imagens e vídeos. Particularmente, em vídeos digitais, a indexação textual, permite que usuários naveguem entre o conteúdo de vídeos legendados, e executem consultas para realizar pesquisas complexas para encontrar determinadas cenas. Usuários podem, por exemplo, buscar em um lme, o nome de um dos atores, as cenas em que um dos personagens diz determinada palavra ou frase, podem também buscar por notícias em vídeos de telejornais 18

20 Figura 1: Resultado da aplicação de um mecanismo de OCR na imagem original (a) e na imagem processada (b) com o método proposto, respectivamente. (a)fonte: (CEZARWORLD, 200-), (b) Fonte: Elaborada pelo autor. etc. Segundo Lienhart; Eelsberg (2000), a detecção de texto em vídeos também pode ser utilizada para gravar o tempo e o dia da transmissão de comerciais, ajudando agentes a checarem se um comercial de um determinado cliente tem sido transmitido no tempo correto no canal de televisão contratado. Para Jung; Kim; Anil (2003), textos contidos em imagens e vídeos são de particular interesse pois: são muito úteis para descrever o conteúdo de uma imagem, são mais fáceis de extrair do que outros conteúdos semânticos e permitem a indexação de dados a partir de palavras chaves para aplicação de máquinas de busca. Mecanismos de OCR (Optical Character Recognition) são capazes de reconhecer texto de imagens digitais, no entanto, só funcionam corretamente se o texto na imagem estiver bastante nítido, e o plano de fundo for muito simples. Caso o plano de fundo seja complexo ou haja pouco contraste entre texto e o plano de fundo da imagem, o mecanismo de OCR pode não dar resultados satisfatórios ou tão pouco dar resultados. Portanto, fazse necessário a aplicação de uma abordagem para localização e separação do texto do plano de fundo da imagem para que, dessa forma, a aplicação de um mecanismo de OCR na imagem tratada produza resultados satisfatórios. A Figura 1, por exemplo, ilustra o desempenho de um mecanismo de OCR, antes e depois da aplicação da abordagem proposta neste trabalho para extração de texto. Portanto, pode-se subdividir o problema de extração de conteúdo textual nos subproblemas de detecção de texto, de localização de região de texto na imagem, de rastreamento, da extração e realce de texto, e da aplicação de um mecanismo de OCR (JUNG K.; KIM; ANIL, 2003). A detecção de texto consiste 19

21 em identicar se uma imagem contém ou não texto, a localização de regiões permite identicar áreas dentro da imagem que são candidatas a conter texto, a extração de texto consiste na separação do texto presente dentro destas áreas. Após a extração de texto, pode-se aplicar o mecanismo de OCR para que o texto seja obtido não mais em formato de imagem, mas em formato de um conjunto de caracteres normalmente apresentados em um arquivo ou em um editor de texto. Este trabalho propõe uma nova abordagem de extração de texto em imagens e, especialmente, vídeos embasada em uma regularização de cores para extração de bordas e geração de componentes conexos. Deni-se também uma simples limiarização para separação do texto do plano de fundo. Segundo Lienhart; Wernicke (2002), o problema de localização de texto em vídeos se difere do de imagens pela redundância temporal, isso signica que técnicas de extração de texto em vídeos são basicamente similares a técnicas de extração de texto de imagens, no entanto, técnicas de extração de texto em vídeos geralmente consideram as características temporais do mesmo. Na abordagem proposta neste trabalho será aplicado um passo adicional de tratamento temporal. Este passo serve para manter a integridade de um texto localizado durante seu tempo de ocorrência no vídeo. Este passo permite que haja economia no processamento, pois evita que o texto, já encontrado anteriormente no vídeo, seja novamente extraído. 1.1 Motivação Tomou-se como motivação para realização deste trabalho, o crescimento expressivo de vídeos e imagens digitais, principalmente destes conteúdos disponibilizados na Internet. É interessante, para usuários, que haja a possibilidade de buscar informações de maneira eciente e ecaz em bases de dados de conteúdo visual. A extração de texto em vídeos e imagens possibilita que usuários realizem buscas no conteúdo semântico de cenas de vídeos e de imagens. 1.2 Objetivos Em (LIENHART; EFFELSBERG, 2000), o texto que aparece em vídeos é dividido em duas categorias: texto de cena e texto articial. Textos de cena aparecem como parte da cena, como em placas com nomes de ruas, banners de lojas etc. Textos de cenas, na maioria dos casos, aparecem acidentalmente e raramente são intencionais, sendo, portanto, de pouca importância e sem informações relevantes para indexação e recuperação. Textos articiais são produzidos separadamente do vídeo e são inseridos em cenas do vídeo em um estágio de pós-processamento. Este tipo de texto apresenta informações relevantes e 20

22 Figura 2: Exemplos de texto em vídeos: (a) texto de cena; (b) texto articial. (POSTASDEPOIA, 200-), (b) Fonte: (IEEESPECTRUM, 200-) (a) Fonte: é extremamente importante para indexação e recuperação. Assim como em (LIENHART; EFFELSBERG, 2000), o foco da abordagem desenvolvida foi na extração de textos articias. A Figura 2 ilustra exemplos de texto de cena e de texto articial. Portanto, este trabalho propõe um novo método para extração, especialmente, de textos de legendas de vídeos. A extração deste tipo de texto se apresenta como um grande desao pois, geralmente, está inserido sobre um plano de fundo complexo, que pode se misturar ao o próprio texto, e além disso, pode estar em variados estilos de fonte e cor. Este tipo de texto, como padrão, é monocromático, possui caracteres com limitações de tamanhos, e está alinhado horizontalmente. Mais características deste tipo de texto podem ser vistas na Seção Objetivo Geral Desenvolver uma nova abordagem para extração de texto em imagens e especialmente de vídeos que permita, de forma ecaz, a obtenção de informações a respeito do conteúdo nos mesmos Objetivos Especícos Para se atingir o objetivo geral do trabalho, foi necessário alcançar os seguintes objetivos especícos: a) Desenvolver um algoritmo para localizar regiões em imagens que contenham texto; b) Identicar características de texto em imagens que auxiliem na eliminação de regiões que não contêm texto; c) Denir um método para extrair (segmentar) o texto das regiões encontradas na imagem; 21

23 d) Desenvolver um algoritmo de tratamento de múltiplos frames, presentes em um vídeo, adequado ao algoritmo de detecção de texto aplicado. 1.3 Restrições A abordagem proposta se restringe a extração de textos alinhados horizontalmente nas imagens, pois esta é uma característica de alinhamento mais comum (JUNG K.; KIM; ANIL, 2003) entre textos de imagens e vídeos, Lienhart; Wernicke (2002) armam, embasados em seus experimentos, que texto horizontal ocorre em mais de 99% de todos os textos articiais. Portanto, a abordagem proposta pode não dar resultados equivalentes em textos dispostos verticalmente, como alguns textos orientais. No entanto a abordagem poder ser ajustada para funcionar de tal maneira. 1.4 Tema Extração de texto em vídeos e imagens digitais Delimitação do Tema Estudo sobre extração de texto articial em vídeos digitais, especialmente sobre métodos de detecção, e extração de texto para indexação de conteúdo de vídeos. 1.5 Justicativa Normalmente, em bases de dados de vídeos, como as que podem ser encontradas na Internet, não há informação adicional sobre o conteúdo dos vídeos disponíveis, o usuário não tem recursos para recuperação de informações que poderiam descrever o conteúdo do vídeo, em especial em cada cena deste. O desenvolvimento de sistemas de extração de texto de vídeos para indexação é de grande relevância, pois possibilita, por exemplo, que usuários naveguem através de vídeos (principalmente legendados) e que recuperem informações a respeito do conteúdo de algum vídeo. 1.6 Contribuições A principal contribuição deste trabalho está no desenvolvimento de uma nova abordagem de extração de texto de imagens e vídeos. Para localização de texto, propõe-se um método híbrido combinando extração de bordas e geração de componentes conexos. Para segmentação de texto, propõe-se um método baseado em limiarização e tratamento temporal capaz de ltrar falsos positivos e detectar alterações de texto no tempo. Os resul- 22

Universidade Federal do Rio de Janeiro - IM/DCC & NCE

Universidade Federal do Rio de Janeiro - IM/DCC & NCE Universidade Federal do Rio de Janeiro - IM/DCC & NCE Processamento de Imagens Tratamento da Imagem - Filtros Antonio G. Thomé thome@nce.ufrj.br Sala AEP/033 Sumário 2 Conceito de de Filtragem Filtros

Leia mais

2.1.2 Definição Matemática de Imagem

2.1.2 Definição Matemática de Imagem Capítulo 2 Fundamentação Teórica Este capítulo descreve os fundamentos e as etapas do processamento digital de imagens. 2.1 Fundamentos para Processamento Digital de Imagens Esta seção apresenta as propriedades

Leia mais

Processamento e Análise de Imagens (MC940) Análise de Imagens (MO445)

Processamento e Análise de Imagens (MC940) Análise de Imagens (MO445) Processamento e Análise de Imagens (MC940) Análise de Imagens (MO445) Prof. Hélio Pedrini Instituto de Computação UNICAMP 2º Semestre de 2015 Roteiro 1 Morfologia Matemática Fundamentos Matemáticos Operadores

Leia mais

Aula 6 - Segmentação de Imagens Parte 2. Prof. Adilson Gonzaga

Aula 6 - Segmentação de Imagens Parte 2. Prof. Adilson Gonzaga Aula 6 - Segmentação de Imagens Parte 2 Prof. Adilson Gonzaga 1 Motivação Extração do Objeto Dificuldades Super segmentação over-segmentation 1) Segmentação por Limiarização (Thresholding Global): Efeitos

Leia mais

Tratamento da Imagem Transformações (cont.)

Tratamento da Imagem Transformações (cont.) Universidade Federal do Rio de Janeiro - IM/DCC & NCE Tratamento da Imagem Transformações (cont.) Antonio G. Thomé thome@nce.ufrj.br Sala AEP/133 Tratamento de Imagens - Sumário Detalhado Objetivos Alguns

Leia mais

Chow&Kaneko buscam as modas da imagem para separar os objetos. Admite que os tons na vizinhança de cada moda são do mesmo objeto.

Chow&Kaneko buscam as modas da imagem para separar os objetos. Admite que os tons na vizinhança de cada moda são do mesmo objeto. Respostas Estudo Dirigido do Capítulo 12 Image Segmentation" 1 Com suas palavras explique quais os problemas que podem ocorrer em uma segmentação global baseada em níveis de cinza da imagem. Que técnicas

Leia mais

Processamento de Imagem Morfológica (Morfologia Matemática) Tsang Ing Ren UFPE - Universidade Federal de Pernambuco CIn - Centro de Informática

Processamento de Imagem Morfológica (Morfologia Matemática) Tsang Ing Ren UFPE - Universidade Federal de Pernambuco CIn - Centro de Informática Processamento de Imagem Morfológica (Morfologia Matemática) Tsang Ing Ren UFPE - Universidade Federal de Pernambuco CIn - Centro de Informática 1 Tópicos Introdução Conceitos básicos da teoria dos conjuntos

Leia mais

Filtragem Espacial. (Processamento Digital de Imagens) 1 / 41

Filtragem Espacial. (Processamento Digital de Imagens) 1 / 41 Filtragem Espacial (Processamento Digital de Imagens) 1 / 41 Filtragem Espacial Filtragem espacial é uma das principais ferramentas usadas em uma grande variedade de aplicações; A palavra filtro foi emprestada

Leia mais

FILTRAGEM ESPACIAL. Filtros Digitais no domínio do espaço

FILTRAGEM ESPACIAL. Filtros Digitais no domínio do espaço FILTRAGEM ESPACIAL Filtros Digitais no domínio do espaço Definição Também conhecidos como operadores locais ou filtros locais Combinam a intensidade de um certo número de piels, para gerar a intensidade

Leia mais

SEGMENTAÇÃO DE IMAGENS EM PLACAS AUTOMOTIVAS

SEGMENTAÇÃO DE IMAGENS EM PLACAS AUTOMOTIVAS SEGMENTAÇÃO DE IMAGENS EM PLACAS AUTOMOTIVAS André Zuconelli 1 ; Manassés Ribeiro 2 1. Aluno do Curso Técnico em Informática, turma 2010, Instituto Federal Catarinense, Câmpus Videira, andre_zuconelli@hotmail.com

Leia mais

Comparação entre a Máscara de Nitidez Cúbica e o Laplaciano para Realce de Imagens Digitais

Comparação entre a Máscara de Nitidez Cúbica e o Laplaciano para Realce de Imagens Digitais Comparação entre a Máscara de Nitidez Cúbica e o Laplaciano para Realce de Imagens Digitais Wesley B. Dourado, Renata N. Imada, Programa de Pós-Graduação em Matemática Aplicada e Computacional, FCT, UNESP,

Leia mais

Processamento de Imagem. Prof. MSc. André Yoshimi Kusumoto andrekusumoto.unip@gmail.com

Processamento de Imagem. Prof. MSc. André Yoshimi Kusumoto andrekusumoto.unip@gmail.com Processamento de Imagem Prof. MSc. André Yoshimi Kusumoto andrekusumoto.unip@gmail.com Visão Computacional Não existe um consenso entre os autores sobre o correto escopo do processamento de imagens, a

Leia mais

2. O que é Redundância de código ou informação? Como a compressão Huffman utiliza isso? Você conhece algum formato de imagem que a utiliza?(1.

2. O que é Redundância de código ou informação? Como a compressão Huffman utiliza isso? Você conhece algum formato de imagem que a utiliza?(1. Respostas do Estudo Dirigido Cap. 26 - Reducing the information:... ou Image Compression 1. Para que serve comprimir as imagens? Que aspectos estão sendo considerados quando se fala de: Compression Rate,

Leia mais

Introdução ao Processamento de Imagens

Introdução ao Processamento de Imagens Introdução ao PID Processamento de Imagens Digitais Introdução ao Processamento de Imagens Glaucius Décio Duarte Instituto Federal Sul-rio-grandense Engenharia Elétrica 2013 1 de 7 1. Introdução ao Processamento

Leia mais

Processamento Digital de Imagens

Processamento Digital de Imagens Processamento Digital de Imagens Israel Andrade Esquef a Márcio Portes de Albuquerque b Marcelo Portes de Albuquerque b a Universidade Estadual do Norte Fluminense - UENF b Centro Brasileiro de Pesquisas

Leia mais

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS VINICIUS DA SILVEIRA SEGALIN FLORIANÓPOLIS OUTUBRO/2013 Sumário

Leia mais

Capítulo 5 Filtragem de Imagens

Capítulo 5 Filtragem de Imagens Capítulo 5 Filtragem de Imagens Capítulo 5 5.1. Filtragem no Domínio da Frequência 5.2. Filtragem no Domínio Espacial 2 Objetivo Melhorar a qualidade das imagens através da: ampliação do seu contraste;

Leia mais

Universidade Federal de Goiás Instituto de Informática Processamento Digital de Imagens

Universidade Federal de Goiás Instituto de Informática Processamento Digital de Imagens Universidade Federal de Goiás Instituto de Informática Processamento Digital de Imagens Prof Fabrízzio Alphonsus A M N Soares 2012 Capítulo 2 Fundamentos da Imagem Digital Definição de Imagem: Uma imagem

Leia mais

Transformada de Hough. Cleber Pivetta Gustavo Mantovani Felipe Zottis

Transformada de Hough. Cleber Pivetta Gustavo Mantovani Felipe Zottis Transformada de Hough Cleber Pivetta Gustavo Mantovani Felipe Zottis A Transformada de Hough foi desenvolvida por Paul Hough em 1962 e patenteada pela IBM. Originalmente, foi elaborada para detectar características

Leia mais

Simulação Gráfica. Morfologia Matemática. Julio C. S. Jacques Junior

Simulação Gráfica. Morfologia Matemática. Julio C. S. Jacques Junior Simulação Gráfica Morfologia Matemática Julio C. S. Jacques Junior Morfologia Palavra denota uma área da biologia que trata com a forma e a estrutura de animais e plantas. No contexto de Morfologia Matemática:

Leia mais

3 Estado da arte em classificação de imagens de alta resolução

3 Estado da arte em classificação de imagens de alta resolução 37 3 Estado da arte em classificação de imagens de alta resolução Com a recente disponibilidade de imagens de alta resolução produzidas por sensores orbitais como IKONOS e QUICKBIRD se tornou-se possível

Leia mais

RECONHECIMENTO DE PLACAS DE AUTOMÓVEIS ATRAVÉS DE CÂMERAS IP

RECONHECIMENTO DE PLACAS DE AUTOMÓVEIS ATRAVÉS DE CÂMERAS IP RECONHECIMENTO DE PLACAS DE AUTOMÓVEIS ATRAVÉS DE CÂMERAS IP Caio Augusto de Queiroz Souza caioaugusto@msn.com Éric Fleming Bonilha eric@digifort.com.br Gilson Torres Dias gilson@maempec.com.br Luciano

Leia mais

Filtragem. pixel. perfil de linha. Coluna de pixels. Imagem. Linha. Primeiro pixel na linha

Filtragem. pixel. perfil de linha. Coluna de pixels. Imagem. Linha. Primeiro pixel na linha Filtragem As técnicas de filtragem são transformações da imagem "pixel" a "pixel", que dependem do nível de cinza de um determinado "pixel" e do valor dos níveis de cinza dos "pixels" vizinhos, na imagem

Leia mais

Processamento Digital de Imagens

Processamento Digital de Imagens Processamento Digital de Imagens (Fundamentos) Prof. Silvio Jamil F. Guimarães PUC Minas 2013-1 Prof. Silvio Guimarães (PUC Minas) Processamento Digital de Imagens 2013-1 1 / 70 Tipos de sinais Conceito

Leia mais

Medição da Altura das Cunhas de Fricção dos Vagões Utilizando Processamento Digital de Imagem

Medição da Altura das Cunhas de Fricção dos Vagões Utilizando Processamento Digital de Imagem ARTIGO Medição da Altura das Cunhas de Fricção dos Vagões Utilizando Processamento Digital de Imagem Leonardo Borges de Castro 1 *, Dr. João Marques Salomão 2 e Me. Douglas Almonfrey 2 1 VALE - Engenharia

Leia mais

Universidade Federal de Alagoas Instituto de Matemática. Imagem. Prof. Thales Vieira

Universidade Federal de Alagoas Instituto de Matemática. Imagem. Prof. Thales Vieira Universidade Federal de Alagoas Instituto de Matemática Imagem Prof. Thales Vieira 2014 O que é uma imagem digital? Imagem no universo físico Imagem no universo matemático Representação de uma imagem Codificação

Leia mais

PROCESSAMENTO DIGITAL DE IMAGENS

PROCESSAMENTO DIGITAL DE IMAGENS PROCESSAMENTO DIGITAL DE IMAGENS Msc. Daniele Carvalho Oliveira Doutoranda em Ciência da Computação - UFU Mestre em Ciência da Computação UFU Bacharel em Ciência da Computação - UFJF FILTRAGEM ESPACIAL

Leia mais

Segmentação de Imagens

Segmentação de Imagens Segmentação de Imagens (Processamento Digital de Imagens) 1 / 36 Fundamentos A segmentação subdivide uma imagem em regiões ou objetos que a compõem; nível de detalhe depende do problema segmentação para

Leia mais

MÉTODOS PARA RETOQUE DIGITAL DE IMAGENS UTILIZANDO EQUAÇÕES DIFERENCIAIS PARCIAIS

MÉTODOS PARA RETOQUE DIGITAL DE IMAGENS UTILIZANDO EQUAÇÕES DIFERENCIAIS PARCIAIS RESUMO MÉTODOS PARA RETOQUE DIGITAL DE IMAGENS UTILIZANDO EQUAÇÕES DIFERENCIAIS PARCIAIS Antônio Gonçalves Silva Júnior Graduando do curso de Licenciatura em Matemática da Universidade Católica de Brasília

Leia mais

CBPF Centro Brasileiro de Pesquisas Físicas. Nota Técnica

CBPF Centro Brasileiro de Pesquisas Físicas. Nota Técnica CBPF Centro Brasileiro de Pesquisas Físicas Nota Técnica Aplicação de Física Médica em imagens de Tomografia de Crânio e Tórax Autores: Dário Oliveira - dario@cbpf.br Marcelo Albuquerque - marcelo@cbpf.br

Leia mais

Sistema de Controle de Acesso Baseado no Reconhecimento de Faces

Sistema de Controle de Acesso Baseado no Reconhecimento de Faces Sistema de Controle de Acesso Baseado no Reconhecimento de Faces Access Control System Based on Face Recognition Tiago A. Neves, Welton S. De Oliveira e Jean-Jacques De Groote Faculdades COC de Ribeirão

Leia mais

)LJXUD8PGRVSDUHV'SDUDFRQYROXomRTXHWHPRPHVPRHIHLWRGR NHUQHOGD)LJXUD

)LJXUD8PGRVSDUHV'SDUDFRQYROXomRTXHWHPRPHVPRHIHLWRGR NHUQHOGD)LJXUD )LOWURJDXVVLDQR O filtro Gaussiano pode ser usado como um filtro SDVVDEDL[D. Usando a função Gaussiana para obter valores de uma máscara a ser definida digitalmente. O Filtro de Gaussiano em 1-D tem a

Leia mais

SEGEMENTAÇÃO DE IMAGENS. Nielsen Castelo Damasceno

SEGEMENTAÇÃO DE IMAGENS. Nielsen Castelo Damasceno SEGEMENTAÇÃO DE IMAGENS Nielsen Castelo Damasceno Segmentação Segmentação Representação e descrição Préprocessamento Problema Aquisição de imagem Base do conhecimento Reconhecimento e interpretação Resultado

Leia mais

Introdução do Processamento de Imagens. Julio C. S. Jacques Junior juliojj@gmail.com

Introdução do Processamento de Imagens. Julio C. S. Jacques Junior juliojj@gmail.com Introdução do Processamento de Imagens Julio C. S. Jacques Junior juliojj@gmail.com Porque processar uma imagem digitalmente? Melhoria de informação visual para interpretação humana Processamento automático

Leia mais

MORFOLOGIA MATEMÁTICA APLICADA A RECONHECIMENTO DE PLACAS DE AUTOMÓVEIS

MORFOLOGIA MATEMÁTICA APLICADA A RECONHECIMENTO DE PLACAS DE AUTOMÓVEIS MORFOLOGIA MATEMÁTICA APLICADA A RECONHECIMENTO DE PLACAS DE AUTOMÓVEIS Paulo Madruga UNIBRATEC Av. Beira Mar, 220, Ap 111 Piedade J. dos Guararapes - PE madruga@unibratec.com.br Sérgio de Sá Leitão Paiva

Leia mais

2 Trabalhos Relacionados

2 Trabalhos Relacionados 2 Trabalhos Relacionados O desenvolvimento de técnicas de aquisição de imagens médicas, em particular a tomografia computadorizada (TC), que fornecem informações mais detalhadas do corpo humano, tem aumentado

Leia mais

Figura 01: Aplicações do Filtro Espacial Passa-Baixa.

Figura 01: Aplicações do Filtro Espacial Passa-Baixa. 791 IMPLEMENTAÇÃO DE TÉCNICAS DE PRÉ-PROCESSAMENTO E PROCESSAMENTO DE IMAGENS PARA RADIOGRAFIAS CARPAIS Rafael Lima Alves 1 ; Michele Fúlvia Angelo 2 Bolsista PROBIC, Graduando em Engenharia de Computação,

Leia mais

Instituto de Ciências Matemáticas e de Computação ICMC-USP

Instituto de Ciências Matemáticas e de Computação ICMC-USP Instituto de Ciências Matemáticas e de Computação ICMC-USP Monitoramento de população de aves por meio de segmentação de imagens aéreas: uma abordagem por algoritmos de detecção de comunidades, superpixels

Leia mais

Segmentação de imagens tridimensionais utilizando o sensor Microsoft Kinect

Segmentação de imagens tridimensionais utilizando o sensor Microsoft Kinect Segmentação de imagens tridimensionais utilizando o sensor Microsoft Kinect Lucas Viana Barbosa 1 ; Wanderson Rigo 2 ; Manassés Ribeiro 3 INTRODUÇÃO Os sistemas de visão artificial vêm auxiliando o ser

Leia mais

Fundamentos de Processamento de Imagens SCC0251/5830 Processamento de Imagens

Fundamentos de Processamento de Imagens SCC0251/5830 Processamento de Imagens Fundamentos de Processamento de Imagens SCC0251/5830 Processamento de Imagens Prof. Moacir Ponti Jr. www.icmc.usp.br/~moacir Instituto de Ciências Matemáticas e de Computação USP 2012/1 Moacir Ponti Jr.

Leia mais

IDENTIFICAÇÃO DE MARCADORES DE PAVIMENTAÇÃO NA ORIENTAÇÃO DE CEGOS

IDENTIFICAÇÃO DE MARCADORES DE PAVIMENTAÇÃO NA ORIENTAÇÃO DE CEGOS IDENTIFICAÇÃO DE MARCADORES DE PAVIMENTAÇÃO NA ORIENTAÇÃO DE CEGOS André Zuconelli¹, Manassés Ribeiro² Instituto Federal de Educação, Ciência e Tecnologia Catarinense - Campus Videira Rodovia SC, Km 5

Leia mais

Classificação de Imagens de Sensoriamento Remoto usando SVM

Classificação de Imagens de Sensoriamento Remoto usando SVM Raphael Belo da Silva Meloni Classificação de Imagens de Sensoriamento Remoto usando SVM Dissertação de Mestrado Dissertação apresentada como requisito parcial para obtenção do título de Mestre pelo Programa

Leia mais

Encontrando a Linha Divisória: Detecção de Bordas

Encontrando a Linha Divisória: Detecção de Bordas CAPÍTULO 1 Encontrando a Linha Divisória: Detecção de Bordas Contribuíram: Daniela Marta Seara, Geovani Cássia da Silva Espezim Elizandro Encontrar Bordas também é Segmentar A visão computacional envolve

Leia mais

Avaliação de técnicas de seleção de quadros-chave na recuperação de informação por conteúdo visual

Avaliação de técnicas de seleção de quadros-chave na recuperação de informação por conteúdo visual Avaliação de técnicas de seleção de quadros-chave na recuperação de informação por conteúdo visual Shênia Salvador de Pinho, Kleber J. F. Souza Instituto de Ciências Exatas e Informática PUC Minas Guanhães,

Leia mais

Processamento de Imagem. Prof. Herondino

Processamento de Imagem. Prof. Herondino Processamento de Imagem Prof. Herondino Sensoriamento Remoto Para o Canada Centre for Remote Sensing - CCRS (2010), o sensoriamento remoto é a ciência (e em certa medida, a arte) de aquisição de informações

Leia mais

Introdução ao SIG. Objetivos Específicos 18/11/2010. Competência: Apresentar: Utilidade de um SIG

Introdução ao SIG. Objetivos Específicos 18/11/2010. Competência: Apresentar: Utilidade de um SIG MINISTÉRIO DO MEIO AMBIENTE - MMA INSTITUTO CHICO MENDES DE CONSERVAÇÃO DA BIODIVERSIDADE - ICMBio DIRETORIA DE PLANEJAMENTO, ADMINISTRAÇÃO E LOGÍSTICA - DIPLAN COORDENAÇÃO GERAL DE GESTÃO DE PESSOAS -

Leia mais

Operações Algébricas e Lógicas. Guillermo Cámara-Chávez

Operações Algébricas e Lógicas. Guillermo Cámara-Chávez Operações Algébricas e Lógicas Guillermo Cámara-Chávez Operações Aritméticas São aquelas que produzem uma imagem que é a soma, diferença, produto ou quociente pixel a pixel Operações Aritméticas Fig A

Leia mais

1ª aula. João Kogler Departamento de Sistemas Eletrônicos Escola Politécnica da USP

1ª aula. João Kogler Departamento de Sistemas Eletrônicos Escola Politécnica da USP 1ª aula João Kogler Departamento de Sistemas Eletrônicos Escola Politécnica da USP Preliminares Informações E-mail: kogler@lsi.usp.br Sala Poli Eletrica bloco A - 2º andar LSI ramal 5673 Websites: Mais

Leia mais

Respostas do Estudo Dirigido do Capítulo 14 Classical pattern recognition and image matching"

Respostas do Estudo Dirigido do Capítulo 14 Classical pattern recognition and image matching Respostas do Estudo Dirigido do Capítulo 14 Classical pattern recognition and image matching" 1 Com suas palavras explique o que é Reconhecimento de Padrões- RP. Quais são os fases clássicas que compõem

Leia mais

Aula 2 Aquisição de Imagens

Aula 2 Aquisição de Imagens Processamento Digital de Imagens Aula 2 Aquisição de Imagens Prof. Dr. Marcelo Andrade da Costa Vieira mvieira@sc.usp.br EESC/USP Fundamentos de Imagens Digitais Ocorre a formação de uma imagem quando

Leia mais

PROCESSAMENTO DIGITAL DE IMAGENS

PROCESSAMENTO DIGITAL DE IMAGENS PROCESSAMENTO DIGITAL DE IMAGENS Motivado por duas principais aplicações: Melhorar a informação da imagem para interpretação humana Processamento de cenas para percepção de máquinas (Visão Computacional)

Leia mais

Introdução ao processamento de imagens e OCTAVE. Julio C. S. Jacques Junior juliojj@gmail.com

Introdução ao processamento de imagens e OCTAVE. Julio C. S. Jacques Junior juliojj@gmail.com Introdução ao processamento de imagens e OCTAVE Julio C. S. Jacques Junior juliojj@gmail.com Octave www.gnu.org/software/octave/ Linguagem Interpretada (similar ao MATLAB... portabilidade) Voltada para

Leia mais

Reconhecimento Automático de Placas de Veículos

Reconhecimento Automático de Placas de Veículos Reconhecimento Automático de Placas de Veículos Vinicius Bergoli Trentini, Lucas Antonio Toledo Godoy, Aparecido Nilceu Marana Universidade Estadual Paulista - UNESP (Campus de Bauru) Faculdade de Ciências

Leia mais

Codificação/Compressão de Vídeo. Tópico: Vídeo (Codificação + Compressão)

Codificação/Compressão de Vídeo. Tópico: Vídeo (Codificação + Compressão) Tópico: Vídeo (Codificação + Compressão) Um vídeo pode ser considerado como uma seqüência de imagens estáticas (quadros). Cada um desses quadros pode ser codificado usando as mesmas técnicas empregadas

Leia mais

Sistema de Identificação de Placas por Processamento Automático de Imagens. Resumo

Sistema de Identificação de Placas por Processamento Automático de Imagens. Resumo Sistema de Identificação de Placas por Processamento Automático de Imagens Tatiane Campos 1, Sergio Bampi 2, Altamiro Susin 3 Instituto de Informática - UFRGS C. P. 15064 - CEP 91501-971 - Porto Alegre

Leia mais

MORFOLOGIA MATEMÁTICA. Adair Santa Catarina Curso de Ciência da Computação Unioeste Campus de Cascavel PR

MORFOLOGIA MATEMÁTICA. Adair Santa Catarina Curso de Ciência da Computação Unioeste Campus de Cascavel PR MORFOLOGIA MATEMÁTICA Adair Santa Catarina Curso de Ciência da Computação Unioeste Campus de Cascavel PR Outubro/2015 Morfologia Matemática Morfologia na Biologia Estudo da estrutura dos animais e plantas;

Leia mais

Informática Aplicada a Radiologia

Informática Aplicada a Radiologia Informática Aplicada a Radiologia Apostila: Imagem Digital parte I Prof. Rubens Freire Rosa Imagem na forma digital A representação de Imagens na forma digital nos permite capturar, armazenar e processar

Leia mais

UFGD FCA PROF. OMAR DANIEL BLOCO 4 PROCESSAMENTO DE IMAGENS

UFGD FCA PROF. OMAR DANIEL BLOCO 4 PROCESSAMENTO DE IMAGENS UFGD FCA PROF. OMAR DANIEL BLOCO 4 PROCESSAMENTO DE IMAGENS Executar as principais técnicas utilizadas em processamento de imagens, como contraste, leitura de pixels, transformação IHS, operações aritméticas

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Alessandro L. Koerich Algoritmo k Means Mestrado/Doutorado em Informática (PPGIa) Pontifícia Universidade Católica do Paraná (PUCPR) 2 Problema do Agrupamento Seja x = (x 1, x 2,,

Leia mais

PROCESSO DE RECONHECIMENTO NÃO SUPERVISIONADO DE ÁREAS DE ESTACIONAMENTO

PROCESSO DE RECONHECIMENTO NÃO SUPERVISIONADO DE ÁREAS DE ESTACIONAMENTO UNIVERSIDADE PRESBITERIANA MACKENZIE MESTRADO EM ENGENHARIA ELÉTRICA Antonio Henrique Mexas PROCESSO DE RECONHECIMENTO NÃO SUPERVISIONADO DE ÁREAS DE ESTACIONAMENTO SÃO PAULO 2014 UNIVERSIDADE PRESBITERIANA

Leia mais

UMA ABORDAGEM DE SIMPLIFICAÇÃO DE IMAGEM COLORIDA BASEADA NA ÁRVORE GERADORA MÍNIMA

UMA ABORDAGEM DE SIMPLIFICAÇÃO DE IMAGEM COLORIDA BASEADA NA ÁRVORE GERADORA MÍNIMA PONTIFÍCIA UNIVERSIDADE CATÓLICA DE MINAS GERAIS Programa de Pós-Graduação em Informática UMA ABORDAGEM DE SIMPLIFICAÇÃO DE IMAGEM COLORIDA BASEADA NA ÁRVORE GERADORA MÍNIMA Kleber Jacques Ferreira de

Leia mais

IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES ENTRE PRODUTOS DE UMA BASE DE DADOS REAL

IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES ENTRE PRODUTOS DE UMA BASE DE DADOS REAL Universidade Federal de Ouro Preto - UFOP Instituto de Ciências Exatas e Biológicas - ICEB Departamento de Computação - DECOM IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES

Leia mais

Processamento de histogramas

Processamento de histogramas REALCE DE IMAGENS BASEADO EM HISTOGRAMAS Processamento de histogramas O que é um histograma? É uma das ferramentas mais simples e úteis para o PDI; É uma função que mostra a frequência com que cada nível

Leia mais

Agenda. Detecção e Análise de Movimento em Vídeos. Detecção e Análise de Movimentos: Introdução. Detecção e Análise de Movimentos: Introdução

Agenda. Detecção e Análise de Movimento em Vídeos. Detecção e Análise de Movimentos: Introdução. Detecção e Análise de Movimentos: Introdução Agenda Detecção e Análise de Movimento em Vídeos Alceu de Souza Britto Jr. Alessandro L. Koerich InviSys Sistemas de Visão Computacional Ltda Programa de Pós-Graduação em Informática (PPGIa PUCPR) Introdução

Leia mais

Uma Versão Intervalar do Método de Segmentação de Imagens Utilizando o K-means

Uma Versão Intervalar do Método de Segmentação de Imagens Utilizando o K-means TEMA Tend. Mat. Apl. Comput., 6, No. 2 (2005), 315-324. c Uma Publicação da Sociedade Brasileira de Matemática Aplicada e Computacional. Uma Versão Intervalar do Método de Segmentação de Imagens Utilizando

Leia mais

Instituto Tecnológico de Aeronáutica. Prof. Carlos Henrique Q. Forster Sala 121 IEC. ramal 5981

Instituto Tecnológico de Aeronáutica. Prof. Carlos Henrique Q. Forster Sala 121 IEC. ramal 5981 CC222 Visão Computacional Descrição e Feições Instituto Tecnológico de Aeronáutica Prof. Carlos Henrique Q. Forster Sala 121 IEC ramal 5981 Tópicos da aula Detecção de cantos Detecção de contornos Regiões

Leia mais

RUÍDOS EM IMAGENS FILTRAGEM DE RUÍDOS. o Flutuações aleatórias ou imprecisões em dados de entrada, precisão numérica, arredondamentos etc...

RUÍDOS EM IMAGENS FILTRAGEM DE RUÍDOS. o Flutuações aleatórias ou imprecisões em dados de entrada, precisão numérica, arredondamentos etc... RUÍDOS EM IMAGENS FILTRAGEM DE RUÍDOS RUÍDOS EM IMAGENS Em Visão Computacional, ruído se refere a qualquer entidade em imagens, dados ou resultados intermediários, que não são interessantes para os propósitos

Leia mais

RECUPERAÇÃO DE DOCUMENTOS TEXTO USANDO MODELOS PROBABILISTICOS ESTENDIDOS

RECUPERAÇÃO DE DOCUMENTOS TEXTO USANDO MODELOS PROBABILISTICOS ESTENDIDOS ISBN 978-85-61091-05-7 Encontro Internacional de Produção Científica Cesumar 27 a 30 de outubro de 2009 RECUPERAÇÃO DE DOCUMENTOS TEXTO USANDO MODELOS PROBABILISTICOS ESTENDIDOS Marcello Erick Bonfim 1

Leia mais

29/08/2011. Radiologia Digital. Princípios Físicos da Imagem Digital 1. Mapeamento não-linear. Unidade de Aprendizagem Radiológica

29/08/2011. Radiologia Digital. Princípios Físicos da Imagem Digital 1. Mapeamento não-linear. Unidade de Aprendizagem Radiológica Mapeamento não-linear Radiologia Digital Unidade de Aprendizagem Radiológica Princípios Físicos da Imagem Digital 1 Professor Paulo Christakis 1 2 Sistema CAD Diagnóstico auxiliado por computador ( computer-aided

Leia mais

17/10/2012. dados? Processo. Doutorado em Engenharia de Produção Michel J. Anzanello. Doutorado EP - 2. Doutorado EP - 3.

17/10/2012. dados? Processo. Doutorado em Engenharia de Produção Michel J. Anzanello. Doutorado EP - 2. Doutorado EP - 3. Definição de Data Mining (DM) Mineração de Dados (Data Mining) Doutorado em Engenharia de Produção Michel J. Anzanello Processo de explorar grandes quantidades de dados à procura de padrões consistentes

Leia mais

[Fingerprint Recognition]

[Fingerprint Recognition] Mestrado em Engenharia de Segurança Informática Tecnologias Biométricas Pedro Santos santos.pmcm@gmail.com 12065 Filipe Vieira fil.vieira@gmail.com 12049 Rui Pereira ruipereira.eng@gmail.com 12061 Docente

Leia mais

VCA Treinamento em Algoritmo

VCA Treinamento em Algoritmo Conteúdo VCA Treinamento em Algoritmo VCA Treinamento em Algoritmo Conteúdo Algoritmos Rastreador (tracker) Monitoramento Objeto Abandonado/Removido Pessoas Calibração Classificação Linha de contagem Auto

Leia mais

Desenvolvimento de um Sistema Híbrido para Rastreamento

Desenvolvimento de um Sistema Híbrido para Rastreamento Desenvolvimento de um Sistema Híbrido para Rastreamento de Objetos aplicado ao Futebol de Robôs Eduardo W. Basso 1, Diego M. Pereira 2, Paulo Schreiner 2 1 Laboratório de Robótica Inteligente Instituto

Leia mais

Visão Computacional e Realidade Aumentada. Trabalho 3 Reconstrução 3D. Pedro Sampaio Vieira. Prof. Marcelo Gattass

Visão Computacional e Realidade Aumentada. Trabalho 3 Reconstrução 3D. Pedro Sampaio Vieira. Prof. Marcelo Gattass Visão Computacional e Realidade Aumentada Trabalho 3 Reconstrução 3D Pedro Sampaio Vieira Prof. Marcelo Gattass 1 Introdução Reconstrução tridimensional é um assunto muito estudado na área de visão computacional.

Leia mais

RESTAURAÇÃO DE DOCUMENTOS ELETRÔNICOS DEGRADADOS COM BINARIZAÇÃO ADAPTATIVA

RESTAURAÇÃO DE DOCUMENTOS ELETRÔNICOS DEGRADADOS COM BINARIZAÇÃO ADAPTATIVA Rios Eletrônica- Revista Científica da FASETE ano 5 n. 5 dezembro de 2011 RESTAURAÇÃO DE DOCUMENTOS ELETRÔNICOS DEGRADADOS COM BINARIZAÇÃO ADAPTATIVA Mestre em Ciência da Computação - Universidade Federal

Leia mais

UFGD FCA PROF. OMAR DANIEL BLOCO 6 CLASSIFICAÇÃO DE IMAGENS

UFGD FCA PROF. OMAR DANIEL BLOCO 6 CLASSIFICAÇÃO DE IMAGENS UFGD FCA PROF. OMAR DANIEL BLOCO 6 CLASSIFICAÇÃO DE IMAGENS Obter uma imagem temática a partir de métodos de classificação de imagens multi- espectrais 1. CLASSIFICAÇÃO POR PIXEL é o processo de extração

Leia mais

Processamento de Imagens para Identificação de Veículos utilizando Inteligência Artificial

Processamento de Imagens para Identificação de Veículos utilizando Inteligência Artificial Processamento de Imagens para Identificação de Veículos utilizando Inteligência Artificial André Faria Ruaro, Nader Ghoddosi Universidade Federal do Santa Catarina (UFSC) Florianópolis SC Brasil Pós-Graduação

Leia mais

Localização de placas em imagens de veículos. Resumo

Localização de placas em imagens de veículos. Resumo Localização de placas em imagens de veículos Geovane Hilário Linzmeyer Curso de Inteligência Computacional Pontifícia Universidade Católica do Paraná Curitiba, dezembro de 2005 Resumo Um dos maiores problemas

Leia mais

Detecção de Canaletas em Imagens de Géis de Eletroforese utilizando Filtro de Kalman

Detecção de Canaletas em Imagens de Géis de Eletroforese utilizando Filtro de Kalman Detecção de Canaletas em Imagens de Géis de Eletroforese utilizando Filtro de Kalman Alessandra A. Paulino, Maurílio Boaventura, Depto de Ciências de Computação e Estatística, IBILCE, UNESP, São José do

Leia mais

5 Extraindo listas de produtos em sites de comércio eletrônico

5 Extraindo listas de produtos em sites de comércio eletrônico 5 Extraindo listas de produtos em sites de comércio eletrônico Existem diversos trabalhos direcionadas à detecção de listas e tabelas na literatura como (Liu et. al., 2003, Tengli et. al., 2004, Krüpl

Leia mais

Compressão de Imagens

Compressão de Imagens Compressão de Imagens Compressão de Imagens Geradas por Computador (Gráficos) Armazenamento (e transmissão) como um conjunto de instruções (formato de programa) que geram a imagem Utilização de algum esquema

Leia mais

REPRESENTAÇÃO DA IMAGEM DIGITAL

REPRESENTAÇÃO DA IMAGEM DIGITAL REPRESENTAÇÃO DA IMAGEM DIGITAL Representação da imagem Uma imagem é uma função de intensidade luminosa bidimensional f(x,y) que combina uma fonte de iluminação e a reflexão ou absorção de energia a partir

Leia mais

RECONHECIMENTO AUTOMÁTICO DE PLACAS DE VEÍCULOS UTILIZANDO PROCESSAMENTO DIGITAL DE IMAGENS E INTELIGÊNCIA ARTIFICIAL

RECONHECIMENTO AUTOMÁTICO DE PLACAS DE VEÍCULOS UTILIZANDO PROCESSAMENTO DIGITAL DE IMAGENS E INTELIGÊNCIA ARTIFICIAL 133 RECONHECIMENTO AUTOMÁTICO DE PLACAS DE VEÍCULOS UTILIZANDO PROCESSAMENTO DIGITAL DE IMAGENS E INTELIGÊNCIA ARTIFICIAL Guilherme Stéfano Silva de Souza; Paulo Henrique Passella Acadêmicos do Curso de

Leia mais

3 ALGORITMOS GENÉTICOS : CONCEITOS BÁSICOS E EXTENSÕES VINCULADAS AO PROBLEMA DE MINIMIZAÇÃO DE PERDAS

3 ALGORITMOS GENÉTICOS : CONCEITOS BÁSICOS E EXTENSÕES VINCULADAS AO PROBLEMA DE MINIMIZAÇÃO DE PERDAS 3 ALGORITMOS GENÉTICOS : CONCEITOS BÁSICOS E EXTENSÕES VINCULADAS AO PROBLEMA DE MINIMIZAÇÃO DE PERDAS 3.1 - Conceitos Básicos Entendemos como algoritmo um conjunto predeterminado e bem definido de regras

Leia mais

Estudos Iniciais do Sistema didático para análise de sinais no domínio da frequência DSA-PC: tipos de janelas temporais.

Estudos Iniciais do Sistema didático para análise de sinais no domínio da frequência DSA-PC: tipos de janelas temporais. Estudos Iniciais do Sistema didático para análise de sinais no domínio da frequência DSA-PC: tipos de janelas temporais. Patricia Alves Machado Telecomunicações, Instituto Federal de Santa Catarina machadopatriciaa@gmail.com

Leia mais

Profa. Dra. Soraia Raupp Musse Thanks to Prof. Dr. Cláudio Rosito Jung

Profa. Dra. Soraia Raupp Musse Thanks to Prof. Dr. Cláudio Rosito Jung Introdução ao Processamento de Imagens Profa. Dra. Soraia Raupp Musse Thanks to Prof. Dr. Cláudio Rosito Jung Introdução Processamento de Imagens: processamento de sinais bidimensionais (ou n-dimensionais).

Leia mais

Guia de Estudo de Análise Real

Guia de Estudo de Análise Real Guia de Estudo de Análise Real Marco Cabral Baseado na V2.4 Dezembro de 2011 Introdução O objetivo deste texto é orientar o estudo da aluna(o) em análise real. Ele é baseado no livro Curso de Análise Real

Leia mais

REALCE DE MICROCALCIFICAÇÕES EM IMAGENS DE MAMOGRAFIA UTILIZANDO FILTROS PASSA-ALTA

REALCE DE MICROCALCIFICAÇÕES EM IMAGENS DE MAMOGRAFIA UTILIZANDO FILTROS PASSA-ALTA REALCE DE MICROCALCIFICAÇÕES EM IMAGENS DE MAMOGRAFIA UTILIZANDO FILTROS PASSA-ALTA Caio Cesar Amorim Borges e Danilo Rodrigues de Carvalho Universidade Federal de Goiás, Escola de Engenharia Elétrica

Leia mais

CALIBRAÇÃO DE APARELHOS DE RAIO X EM IMAGENS DE TOMOGRAFIA DE CRÂNIO E TÓRAX

CALIBRAÇÃO DE APARELHOS DE RAIO X EM IMAGENS DE TOMOGRAFIA DE CRÂNIO E TÓRAX CMNE/CILAMCE 2007 Porto, 13 a 15 de Junho, 2007 APMTAC, Portugal 2007 CALIBRAÇÃO DE APARELHOS DE RAIO X EM IMAGENS DE TOMOGRAFIA DE CRÂNIO E TÓRAX Dário A.B. Oliveira 1 *, Marcelo P. Albuquerque 1, M.M.G

Leia mais

Segmentação de Imagens de Placas Automotivas

Segmentação de Imagens de Placas Automotivas Segmentação de Imagens de Placas Automotivas André Zuconelli, Manassés Ribeiro Instituto Federal Catarinense - Campus Videira. Técnico em Informática, turma 2010 Rodovia SC, Km 5 Bairro Campo Experimental

Leia mais

Universidade Federal de Santa Catarina CAPÍTULO 6 GRÁFICOS NO EXCEL.

Universidade Federal de Santa Catarina CAPÍTULO 6 GRÁFICOS NO EXCEL. CAPÍTULO 6 GRÁFICOS NO EXCEL. Um gráfico no Excel é uma representação gráfica dos números de sua planilha - números transformados em imagens. O Excel examina um grupo de células que tenham sido selecionadas.

Leia mais

Trabalho 2 Fundamentos de computação Gráfica

Trabalho 2 Fundamentos de computação Gráfica Trabalho 2 Fundamentos de computação Gráfica Processamento de Imagens Aluno: Renato Deris Prado Tópicos: 1- Programa em QT e C++ 2- Efeitos de processamento de imagens 1- Programa em QT e C++ Para o trabalho

Leia mais

INSTRUÇÃO NORMATIVA N 002/2009/PEQ-UFS ANEXO I NORMAS PARA A ELABORAÇÃO DA DISSERTAÇÃO

INSTRUÇÃO NORMATIVA N 002/2009/PEQ-UFS ANEXO I NORMAS PARA A ELABORAÇÃO DA DISSERTAÇÃO INSTRUÇÃO NORMATIVA N 002/2009/PEQ-UFS ANEXO I NORMAS PARA A ELABORAÇÃO DA DISSERTAÇÃO 1. INTRODUÇÃO A Dissertação é a apresentação escrita do trabalho de pesquisa desenvolvido no âmbito do Programa de

Leia mais

Um Modelo de Componentes de Software com Suporte a Múltiplas Versões

Um Modelo de Componentes de Software com Suporte a Múltiplas Versões Hugo Roenick Um Modelo de Componentes de Software com Suporte a Múltiplas Versões Dissertação de Mestrado Dissertação apresentada ao Programa de Pós graduação em Informática do Departamento de Informática

Leia mais

REALCE E SEGMENTAÇÃO DE IMAGENS UTILIZADAS EM MONITORAMENTO DE VAZAMENTO DE ÓLEO EM CAMPOS DE EXPLORAÇÃO ONSHORE

REALCE E SEGMENTAÇÃO DE IMAGENS UTILIZADAS EM MONITORAMENTO DE VAZAMENTO DE ÓLEO EM CAMPOS DE EXPLORAÇÃO ONSHORE UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE TECNOLOGIA DEPARTAMENTO DE ENGENHARIA DE TELEINFORMÁTICA CURSO DE GRADUAÇÃO EM ENGENHARIA DE TELEINFORMÁTICA REALCE E SEGMENTAÇÃO DE IMAGENS UTILIZADAS EM MONITORAMENTO

Leia mais

UBER: Uma ferramenta para realce de microcalcificações mamárias

UBER: Uma ferramenta para realce de microcalcificações mamárias Departamento de Sistemas e Computação FURB Curso de Ciência da Computação Trabalho de Conclusão de Curso 2013/2 UBER: Uma ferramenta para realce de microcalcificações mamárias Acadêmico: Jackson Krause

Leia mais

MundoGEOXperience - Maratona de Ideias Geográficas 07/05/2014

MundoGEOXperience - Maratona de Ideias Geográficas 07/05/2014 MundoGEOXperience - Maratona de Ideias Geográficas 07/05/2014 ANÁLISE DE TÉCNICAS PARA DETECÇÃO DE MUDANÇA UTILIZANDO IMAGENS DO SENSORIAMENTO REMOTO DESLIZAMENTOS EM NOVA FRIBURGO/RJ EM 2011 Trabalho

Leia mais

FEN- 06723 Processamento Digital de Imagens. Projeto 2 Utilização de máscaras laplacianas

FEN- 06723 Processamento Digital de Imagens. Projeto 2 Utilização de máscaras laplacianas FEN- 06723 Processamento Digital de Imagens Projeto 2 Utilização de máscaras laplacianas Marcelo Musci Mestrado Geomática/UERJ-2004 Abstract The Laplacian is also called as second difference function,

Leia mais

UM ESTUDO DE CASO SOBRE A INDEXAÇÃO AUTOMÁTICA DE DOCUMENTOS OFICIAIS DA UENP BASEADO EM LAYOUTS

UM ESTUDO DE CASO SOBRE A INDEXAÇÃO AUTOMÁTICA DE DOCUMENTOS OFICIAIS DA UENP BASEADO EM LAYOUTS UM ESTUDO DE CASO SOBRE A INDEXAÇÃO AUTOMÁTICA DE DOCUMENTOS OFICIAIS DA UENP BASEADO EM LAYOUTS Alexia Guilherme Bianque (PIBIC/CNPq), Ederson Marco Sgarbi (Orientador), a.g.bianque10@gmail.com.br Universidade

Leia mais

PROCESSAMENTO DE IMAGEM #01 TÓPICOS DESENVOLVIDOS NESTE MÓDULO

PROCESSAMENTO DE IMAGEM #01 TÓPICOS DESENVOLVIDOS NESTE MÓDULO PROCESSAMENTO DE IMAGEM #01 TÓPICOS DESENVOLVIDOS NESTE MÓDULO Que é Processamento Digital de Imagens (PDI) Quais as etapas fundamentais em um sistema de PDI Sensores CCD e CMOS Visão Humana x Visão de

Leia mais