Diego Martin Mancini Orientador: Prof. Paulo A. V. de Miranda Instituto de Matemática e Estatística Universidade de São Paulo

Documentos relacionados
Diego Martin Mancini. Orientador Prof. Dr. Paulo A. V. de Miranda. Trabalho de Formatura Supervisionado

Descritores de Imagens

TELEVISÃO DIGITAL LEEC 2006/2007

Detectando Bordas: Filtros Passa Alta

Processamento De Imagem. Descritores de Cor

AVALIAÇÃO QUALITATIVA DE DETECÇÃO DE BORDAS EM IMAGENS DE RADIOGRAFIA PERIAPICAIS

T4 Processamento de Imagem

Universidade Federal de Pernambuco Graduação em Engenharia da Computação Centro de Informática

Processamento de Imagens COS756 / COC603

T4.1 Processamento de Imagem

Capítulo III Processamento de Imagem

Processamento digital de imagens

Visão computacional. Juliana Patrícia Detroz Orientador: André Tavares Silva

Filtros espaciais. Processamento e Recuperação de Imagens Médicas. Prof. Luiz Otavio Murta Jr. Depto. De Computação e Matemática (FFCLRP/USP)

SEL-0339 Introdução à Visão Computacional. Aula 5 Segmentação de Imagens

[2CTA121] Processamento de Imagens em Alimentos: Conceitos e Aplicações

APLICAÇÃO DE TÉCNICAS DE PROCESSAMENTO DE IMAGENS DIGITAIS EM IMAGENS GERADAS POR ULTRA-SOM

Extração de características de imagens. Descritores de cor

Orientação de Bordas em Imagens Digitais: Abordagem por Análise de Vizinhança Local

Processamento Digital de Imagens. Análise de Imagens

Detecção e Correção Automáticas de Olhos Vermelhos

Aula 5 - Segmentação de Imagens

TE073 PDS II Programa de Graduação em Engenharia Elétrica

PMR2560 Visão Computacional Detecção de bordas. Prof. Eduardo L. L. Cabral

Descritores de Imagens

Quadro Segmentação de Imagens

Simulação Gráfica. Segmentação de Imagens Digitais. Julio C. S. Jacques Junior

PRÁTICA 5 Prof. Dr. Evandro Luis Linhari Rodrigues

Processamento de Imagens

GEOMETRIC PROPERTY BASED ELLIPSE DETECTION METHOD

TE073 PDS II Programa de Graduação em Engenharia Elétrica

Reconhecimento de texturas utilizando padrão binário local e classificador knn.

Processamento de Imagens Marcia A. S. Bissaco

Descritores de Imagem

CARACTERÍSTICAS DE IMAGENS: PONTOS E SUPERFÍCIES

Processamento de Imagens Digitais

Processamento Digital de Imagens

SIFT - Scale Invariant Feature Transform

UMA VISÃO SOBRE O PROCESSAMENTO DE IMAGENS. Rogério Vargas DCET UESC Home page: rogerio.in

UNIVERSIDADE ESTADUAL PAULISTA Campus de Sorocaba. Segmentação

Extração de objetos de interesse em imagens digitais utilizando a biblioteca de Visão Computacional OpenCV

Reconhecimento de palma de mão. Peterson Wagner Kava de Carvalho

Universidade Federal do Rio de Janeiro - IM/DCC & NCE

Image Descriptors: color

Rastreamento de objeto e estimativa de movimento

Descritores de Imagem (introdução)

Face Recognition using RGB-D Images

EXTRAÇÃO DE BORDAS EM IMAGEM DE ALTA RESOLUÇÃO UTILIZANDO TÉCNICAS DE PROCESSAMENTO DE IMAGEM

Filtros espaciais (suavizaçào)

O reconhecimento facial é dividido em três etapas: i) detecção da face, ii) extração de características e iii) reconhecimento da face.

Trabalho Final de Processamento de Imagens: Panografia

Usando MLP para filtrar imagens

SEL Visão Computacional. Aula 2 Processamento Espacial

IDENTIFICAÇÃO DE MARCADORES DE PAVIMENTAÇÃO NA ORIENTAÇÃO DE CEGOS. André Zuconelli 1 ; Manassés Ribeiro 2

Processamento de Imagens Termais Aplicado à Navegação Autônoma. Wanessa da Silva

FILTRAGEM DE IMAGEM NO DOMÍNIO ESPACIAL (Operações aritméticas orientadas à vizinhança)

Realce de Bordas em Imagens Digitais: Uma Abordagem por Números Fuzzy

Descritores de Imagem (exemplos)

2. Passos fundamentais para o processamento de imagens

APLICAÇÃO DE OPERADORES MORFOLÓGICOS PARA DETECÇÃO SEMI-AUTOMÁTICA DE POSTES

Objetivos. 1. O método desenvolvido usa características de pares de pixeis para fazer estatísticas e formar

Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação

Processamento de Imagens COS756 / COC603

Realce de imagens parte 2: ltragem espacial SCC5830/0251 Processamento de Imagens

Números Fuzzy em Processamento de Imagens Digitais e Suas Aplicações na Detecção de Bordas

fig.1 Programa implementado durante a realização do trabalho

SISTEMA AUTOMÁTICO PARA AVALIAÇÃO POSTURAL BASEADO EM DESCRITORES DE IMAGENS

Implementação do algoritmo SIFT para detecção de objetos em imagens.

Operações Pontuais. 1 operando. 2 operandos. Processamento e Análise de Imagem - A. J. Padilha - v ac

Processamento digital de imagens

Processamento de Imagem. Filtragem no Domínio Espacial Professora Sheila Cáceres

SEMINÁRIO Visão Computacional Aluno: Afonso Pinheiro

Processamento de Imagens

Fundamentos da Computação Gráfica

Visão Computacional. Alessandro L. Koerich. Programa de Pós-Graduação em Engenharia Elétrica Universidade Federal do Paraná (UFPR)

Processamento de Imagem. Prof. MSc. André Yoshimi Kusumoto

Segmentação de Imagens

UNIVERSIDADE ESTADUAL DO OESTE DO PARANÁ UNIOESTE CAMPUS UNIVERSITÁRIO DE CASCAVEL CURSO DE CIÊNCIA DA COMPUTAÇÃO LISTA DE EXERCÍCIOS

EXTRAÇÃO SEMI - AUTOMÁTICA DE FEIÇÕES LINEARES E A CALIBRAÇÃO DOS PARÂMETROS INTRÍNSECOS DE CÂMERAS Projeto de Pesquisa PIBIC/CNPq ( )

APLICAÇÃO DE OPERADORES MORFOLÓGICOS PARA DETECÇÃO SEMI-AUTOMÁTICA DE POSTES

Tracking de movimentos usando marcadores circulares

AUTOMATED ASSESSMENT OF BREAST TISSUE DENSITY IN DIGITAL MAMMOGRAMS

Álgebra Linear em Visão Computacional

DETECÇÃO DE BORDAS EM IMAGENS DIGITAIS

API para transformação de imagem em cartum utilizando plataforma ios. Acadêmico Christian Hess Orientador Dalton Solano dos Reis

Biometria: Processamento de Imagem para Reconhecimento de Padrões na Íris

Sensoriamento Remoto II

Extração de características utilizando filtros de Gabor aplicado a identificação de defeitos no couro bovino

SEL5886 Visão Computacional Prof. Dr. Marcelo Andrade da Costa Vieira

Lip Recognition. Victor Mocelin

Diagnóstico Médico de Imagem Auxiliado por Computador

Propriedades estatísticas de uma imagem

Filtragem de Imagens Fixas

PMR2560 Visão Computacional Detecção de cores e blobs. Prof. Eduardo L. L. Cabral

VISÃO COMPUTACIONAL PARA RECONHECIMENTO DE FACES APLICADO NA IDENTIFICAÇÃO E AUTENTICAÇÃO DE USUÁRIOS NA WEB. Márcio Koch

Uma Abordagem Eficiente para Recuperação de Imagens Médicas

Identificação de veículos utilizando técnicas de visão computacional

Faculdade de Engenharia da Universidade do Porto ANÁLISE DE IMAGENS PARA EXTRACÇÃO DE CONTORNOS. Relatório

2 SIFT (Scale Invariant Feature Transform)

SEL-0339 Introdução à Visão Computacional. Aula 2 Processamento Espacial (Parte 2)

Transcrição:

Estudo de comparação do descritor de imagens coloridas BIC empregando diferentes abordagens de classificação de detecção de bordas: Canny e Operador Laplaciano Diego Martin Mancini Orientador: Prof. Paulo A. V. de Miranda Instituto de Matemática e Estatística Universidade de São Paulo

Descritores Um descritor de imagem é definido como uma metodologia para comparar as imagens, usando um método computacional para extrair características das imagem. A metodologia de comparar as imagens pode ser, por exemplo, uma função de distância entre os histogramas das imagens. A extração de característica pode ser uma extração de cor.

BIC Proposto por Stehling, esse descritor de cores consiste em três passos: 1) Quantiza uniformemente o espaço de cores RGB em cores de 4x4x4=64 níveis (bins). 2) Classifica cada pixel da imagem em interior ou borda. 3) São construídos dois histogramas (um para interior e outro para borda) que são concatenados e dão origem a um vetor de extração de características de cor.

Imagens geradas pelo BIC Imagens geradas na 2º etapa do BIC.

BIC

Proposta do Trabalho Algumas soluções adotadas nas diferentes etapas do BIC não consideram algoritmos clássicos de processamento de imagens. Este trabalho tem como proposta realizar essa comparação com os algoritmos mainstream e testar, se de fato, o algoritmo BIC é tão eficaz quanto sua versão modificada. Foram utilizados os algoritmos de Detector de Bordas de Canny e Operador Laplaciano.

Variações do BIC Consiste em substituir o algoritmo de deteccção de interior/borda do BIC pelos algoritmos de detecção de bordas de Canny e o Operador Laplaciano. Foram utilizados uma janela (kernel) de 3x3 e o mesmo limiar (threshold) nos algoritmos de Canny e o Laplaciano.

Variações do BIC

Canny O detector de bordas de Canny segue três critérios: Boa detecção, boa localização e todas as bordas devem ser detectadas uma única vez. Aplica o filtro gaussiano para eliminar os ruídos. Utiliza o gradiente análogo ao de Sobel, usando dois limiares (threshold) superior e inferior no gradiente para verificar se o pixel é interior ou borda. Para ser considerado interior ou borda, deverá seguir os seguintes três critérios:

Canny O pixel é borda se valor do gradiente for maior que o limiar superior. Se o valor do gradiente do pixel é abaixo do limiar inferior, então o pixel é rejeitado (interior). Se o gradiente do pixel está entre os dois thresholds, então este pixel é aceito com borda se estiver conectado a um pixel que estiver acima do limiar superior.

Imagens geradas pelo Canny Imagens geradas na 2º etapa do BIC.

Operador Laplaciano Operador Laplaciano utiliza o operador de Sobel para classificar a intensidade do pixel. Por definição, o Sobel utiliza duas derivadas e somente a segunda derivada será utilizada para detectar de maneira única se o pixel é interior ou borda. O zero crossing será usado para detectar as bordas, utilizando uma janela (kernel) 3x3 e um limiar para detectar valores mínimos e máximos (polaridades).

Imagens geradas pelo Laplaciano Imagens geradas na 2º etapa do BIC.

Experimento Foram usado mais de 2200 imagens do site público ETH, com 54 classes, cada uma com 41 imagens. Utilizando os descritores, cada imagem é comparada com todas as imagens de todas as classes (inclusive a própria classe), usando a distância dlog. Calcula-se a curva da média dos gráficos de precision x recall, utilizando cada imagem da base como imagem de consulta.

Experimento Classe A Classe B

Experimento a1 a2 a3 b1 b2 b3

Experimento a1 a2 a3 b1 dlog(a1, a1) = 0 dlog(a1, a2) = 0,6 dlog(a1, a3) = 0,3 dlog(a1, b1) = 0,2 dlog(a1, b2) = 0,8 dlog(a1, b3) = 0,4 a1: a1, b1, a3, b3, a2, b2 b2 b3

Experimento na = # de acertos da classe ni = # de imagens até a i-ésima comparação N = # de imagens por classe Precision = na / ni Recall = na / N

Experimento na = # de acertos da classe ni = # de imagens até a i-ésima comparação N = # de imagens por classe Precision = na / ni Recall = na / N a1: a1, b1, a3, a2, b3, b2 a1: na = 1, ni = 1 => Precision = 1/1, Recall = 1/3 b1: na = 1, ni = 2 => Precision = 1/2, Recall = 1/3 a3: na = 2, ni = 3 => Precision = 2/3, Recall = 2/3 a2: na = 3, ni = 4 => Precision = 3/4, Recall = 3/3 b3: na = 3, ni = 5 => Precision = 3/5, Recall = 3/3 b2: na = 3, ni = 6 => Precision = 3/6, Recall = 3/3

Experimento Precision x Recall 1 0,9 0,8 0,7 Precision 0,6 0,5 0,4 0,3 0,2 0,1 0 0 0,1 0,2 0,3 0,4 0,5 Recall 0,6 0,7 0,8 0,9 1

Resultado

Conclusão Os resultados das variações do BIC/Canny e BIC/Laplaciano foram semelhantes ao descritor BIC original. O BIC/Laplaciano demonstrou uma menor acurácia do que o BIC/Canny e BIC.

Trabalhos Futuros Usar o conceito de detecção de bordas Fuzzy. No experimento, foram utilizados somente um limiar para o Canny e o Laplaciano, podendo ser testados mais variações de limiares para testar acurácia. Estudar a eficiência do BIC em termos de velocidade de processamento. Aumentar o número de imagens para o experimento.

Referências R. O. Stehling, M. A. Nascimento, and A. X. Falcão.A compact and efficent image retrieval approach based on border/interior pixel classification. CIKM 02 Proceedings of the eleventh international conference on Information and knowledge management, 2002. Wikipedia,https://en.wikipedia.org/wiki/Canny_edge_detector> Acessado em 08-2015. R. F. Gonzalez and R. E. Woods. Digital image processing. Pearson PrenticeHall, 2008. Zero crossing laplacian operator, http://fourier.eng.hmc.edu/e161/lectures/gradient/node7.html. Acessado em 10-2015

Obrigado!