Respostas do Estudo Dirigido do Capítulo 14 Classical pattern recognition and image matching"

Documentos relacionados
Capítulo 5: Aplicações da Derivada

Chow&Kaneko buscam as modas da imagem para separar os objetos. Admite que os tons na vizinhança de cada moda são do mesmo objeto.

Processamento digital de imagens. introdução

"SISTEMAS DE COTAGEM"

2 Texturas com Relevo e Equações de Pré Warping

Imagem e Gráficos. vetorial ou raster?

Exercícios Adicionais

Cap. 7 - Fontes de Campo Magnético

Curvas em coordenadas polares

Rugosidade. O supervisor de uma empresa verificou que. Um problema. Rugosidade das superfícies

Controlando o trabalho impresso 1

SEGEMENTAÇÃO DE IMAGENS. Nielsen Castelo Damasceno

L 276/4 PT Jornal Oficial da União Europeia. DECISÃO N. o 190. de 18 de Junho de 2003

Faculdade Sagrada Família

Projeção Perspectiva. Desenho Técnico I Profº Msc. Edgar Nogueira Demarqui

TOPOLOGIA DA IMAGEM DIGITAL

Transformada de Hough. Cleber Pivetta Gustavo Mantovani Felipe Zottis

Medição tridimensional

Encontrando a Linha Divisória: Detecção de Bordas

Aula 5 - Classificação

ESTEREOSCOPIA INTRODUÇÃO. Conversão de um par de imagens (a)-(b) em um mapa de profundidade (c)

Faculdade de Computação

Matemática SSA 2 REVISÃO GERAL 1

UMC Cotas em desenho técnico (Módulo 2) Componentes gráficos de uma cota: Linha de cota Linha de chamada Setas de cota

Cotagem de dimensões básicas

Universidade Federal de Goiás Instituto de Informática Processamento Digital de Imagens

Resolução de sistemas lineares

ESTUDO DAS PROJEÇÕES NOÇÕES ELEMENTARES 1. DEFINIÇÃO

Aula 17 GRANDEZAS ESCALARES E VETORIAIS. META Apresentar as grandezas vetoriais e seu signifi cado

DESENHO TÉCNICO. Apresentar de forma sintética, as normas e convenções usuais referente às

Cálculo em Computadores trajectórias 1. Trajectórias Planas. 1 Trajectórias. 4.3 exercícios Coordenadas polares 5

Fundamentos de Imagens Digitais. Aquisição e Digitalização de Imagens. Aquisição e Digitalização de Imagens. Aquisição e Digitalização de Imagens

Processamento Digital de Imagens

O MÉTODO HÚNGARO PARA RESOLUÇÃO DE PROBLEMAS DE OTIMIZAÇÃO

Potenciação no Conjunto dos Números Inteiros - Z

Ao se falar sobre fotografia cinematográfica estão envolvidos diversos elementos que devem ser levados em consideração:

PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO DEPARTAMENTO DE INFORMÁTICA PÓS GRADUAÇÃO EM INFORMÁTICA

N1Q1 Solução. a) Há várias formas de se cobrir o tabuleiro usando somente peças do tipo A; a figura mostra duas delas.

Lista 1 para a P2. Operações com subespaços

Desenho de máquinas. Aula 3

Analisador de Espectros

CINEMÁTICA VETORIAL. Observe a trajetória a seguir com origem O.Pode-se considerar P a posição de certo ponto material, em um instante t.

Aula 8 : Desenho Topográfico

QGIS 2.2 Modo de Edição: Edição de Feições de Polígono

Reconhecimento de Padrões Utilizando Filtros Casados

Modelagem Digital do Terreno

APLICAÇÕES DA DERIVADA

Capítulo 6 Transformação de tensões e critérios de falhas

MAT Cálculo Diferencial e Integral para Engenharia II

Sumário. 1. Instalando a Chave de Proteção Novas características da versão Instalando o PhotoFacil Álbum 4

AV1 - MA (b) Se o comprador preferir efetuar o pagamento à vista, qual deverá ser o valor desse pagamento único? 1 1, , , 980

Tomografia por emissão de pósitrons (PET) Pedro Bastos Costa

Dinâmica de um Sistema de Partículas Faculdade de Engenharia, Arquiteturas e Urbanismo FEAU

RECONHECIMENTO DE PLACAS DE AUTOMÓVEIS ATRAVÉS DE CÂMERAS IP

Conceitos Básicos de Desenho Técnico

COMPUTAÇÃO GRÁFICA. Rasterização e Preenchimento de Regiões. MARCO ANTONIO GARCIA DE CARVALHO Fevereiro de Computação Gráfica

Morfologia Matemática Binária

Programação em papel quadriculado

Elaboração de perfis longos dentro do projeto Memória Visual através da fotografia: revitalização do Cais Mauá

DESENHO TÉCNICO. Aula 06. Cotagem em Desenho Técnico

Bem-vindo ao curso delta Gerenciamento de peso para a versão 9.1. Este curso aborda a nova solução de peso introduzida nessa versão.

Exercícios Teóricos Resolvidos

Curso de Computação Gráfica (CG) 2014/2- Unidade 1- Modelagem de objetos. Exercício 1 (individual) - Entrega: quarta 13/08

SEGMENTAÇÃO DE IMAGENS EM PLACAS AUTOMOTIVAS

4 Experimentos Computacionais

Calculando distâncias sem medir

Root Locus (Método do Lugar das Raízes)

The Graphics Pipeline

INSTRUMENTOS USADOS Lápis e lapiseiras Os lápis médios são os recomendados para uso em desenho técnico, a seleção depende sobretudo de cada usuário.

Desenhando perspectiva isométrica

4Distribuição de. freqüência

)LJXUD8PGRVSDUHV'SDUDFRQYROXomRTXHWHPRPHVPRHIHLWRGR NHUQHOGD)LJXUD

Desenhando no Flash. Comece um novo arquivo novo, de tamanho 500 X 300 pixels.

APLICATIVOS GRÁFICOS (AULA 4)

UNESP DESENHO TÉCNICO: Fundamentos Teóricos e Introdução ao CAD. Parte 3/5: Prof. Víctor O. Gamarra Rosado

WEBGIS Sistema Informativo Territorial

Segmentação de Imagens de Placas Automotivas

Cálculo Numérico Faculdade de Engenharia, Arquiteturas e Urbanismo FEAU

FUNDAÇÃO ESCOLA TÉCNICA LIBERATO SALZANO VIEIRA DA CUNHA CURSO DE ELETRÔNICA E MECÂNICA

FONTES DE CAMPO MAGNÉTICO. Caracterizar e mostrar o campo magnético produzido por uma carga a velocidade constante.

Forma de Captura de Imagens Digitais:

INTRODUÇÃO À ENGENHARIA

GNUPLOT Uma breve introdução

Roteiro para Instrumentação da Técnica de Parafuso de Compressão

Sistemas Operacionais. Curso Técnico Integrado Profa: Michelle Nery

CAPÍTULO 6 TRANSFORMAÇÃO LINEAR

Computador E/S, Memória, Barramento do sistema e CPU Onde a CPU Registradores, ULA, Interconexão interna da CPU e Unidade de controle.

Departamento de Matemática - UEL Ulysses Sodré. Arquivo: minimaxi.tex - Londrina-PR, 29 de Junho de 2010.

Resolução dos Exercícios sobre Derivadas

Figure 2 - Nós folhas de uma árvore binária representando caracteres ASCII

APLICATIVOS GRÁFICOS (AULA 3)

TÉCNICAS DE PROGRAMAÇÃO

9. Derivadas de ordem superior

O ESPAÇO NULO DE A: RESOLVENDO AX = 0 3.2

Óptica Geométrica: Óptica de raios com matrizes

PRINCÍPIOS DE INFORMÁTICA PRÁTICA OBJETIVO 2. BASE TEÓRICA. 2.1 Definição de Planilha Eletrônica

1 Propagação de Onda Livre ao Longo de um Guia de Ondas Estreito.

Prof. Sérgio Viana. Estas notas de aula são destinadas aos alunos que. Gráfica, para um posterior estudo mais profundo.

Transcrição:

Respostas do Estudo Dirigido do Capítulo 14 Classical pattern recognition and image matching" 1 Com suas palavras explique o que é Reconhecimento de Padrões- RP. Quais são os fases clássicas que compõem a estrutura de sistema de RP. (1,0 pt) RP consiste em reconhecer objetos/texturas/modelos coisas que podem ser padronizáveis pelas suas imagens bidimensionais. Classicamente o RP usa métodos que têm 3 fases: pre-processar as imagens (eliminar, ruídos, aumentar o contraste, restaurar dados) extrair delas as caraterísticas relevantes (geralmente na forma de vetores de características) e finalmente alguma forma de classificação. 2 Dê exemplo de aplicações de Reconhecimento de Padrões- RP. Diga o que seria cada uma das 3 fases clássicas nos exemplos que você mencionou. (1,0 pt) Aplicação pre-processamento extração de caraterísticas Autenticidade de identificação das pinturas de um características das determinado pintor Reconhecimento de assinaturas em banco de dados bancário capturar as imagens digitalmente aumento do contraste realce das pinceladas segmentação da região de interesse binarização reposicionamento, enquadramento, rotação eliminação da dependência da caneta usada (fina, grossa, falhando, cor, etc.) pinceladas considerado: direcionalidade, textura, quantidade de tinta extração das caracteristicas estruturais, construção do vetor de características (assina tem inclinação, há formas ou letras com de simplificação usuais na escrita, identificação de detalhes exclusivos). classificação comparação entre detalhes do quadro e outros quadros de autoria comprovada do pintor comparação entre as diversas i de assinatura do mesmo cliente por distância Identificação de tamanho e tipo de frutas Transformação para os espaço de cores adequado. Extração do fundo Realce do contorno Associação de cores a batidas, partes estragadas e/ou pragas. Separação entre elementos Identificação de parâmetros relacionados às formas. Extração de medidas relativas aos tamanhos de objetos ou dos grãos (granulometria) Identificação de falhas relacionadas à variação cromática. Classificação por formas, tamanho e falhas

3 Quais os problemas apresentados por um sistema de OCR? Variabilidade de representação dos caracteres, justaposição, partes falhadas. Qual a diferença fundamental entre os códigos de barras e OCR? O primeiro foi elaborado para ser de fácil identificação por máquinas sem qualquer preocupação com a interpretação humana, o segundo identifica caracteres na forma que o ser humano também os lê. Examinando cheques bancários que você tenha (tente explicar com suas palavras) qual a solução encontrada, neste caso de cheques bancários, para agilizar a leitura dos dados: número do banco, agencia, conta e número do cheque? (1,2 pt) Para facilitar identificação deste padrões mas leitoras de cheques estes estão sempre posicionadas no mesmo local no cheque, e em todos os tipos de cheques. É também impresso de forma especial para a qual as leitoras já foram adequadas. 4 Quais as formas de RP por Matching? O Matching pode ser rígido ou flexível. Faça um algoritmo para a implementação de RP por Matching. Suponha que os padrões sejam as placas de sinalização das rodovias. Cada padrão sendo representado por uma matriz monocromática 15x15, T[i, j], supondo que os tons de cinza variem de 0 a 255. (1,8) Captura da Imagem Identificação da região da placa pela cor de suas bordas correções de posicionamento: rotação Eliminação da região exterior a região da placa na imagem conversão para o espaço YIQ Mudança de escala para que a região de interesse fique do tamanho dos templates:15x15 Atribuo a I[i,j] apenas dos dados do canal Y da região de 15x15 da placa aumento do contraste para cobrir toda a faixa de 0 a 255 uso de algoritmo de Casamento/matching entre a placa a ser identificada e os templates dos sinais já disponíveis no bando de dados identificação do melhor resultado pela busca do menor elemento do vetor Erros (o índice deste vetor corresponde a placa) algoritmo de Casamento/matching: Zero o vetor de Erros(imagem) /*neste vetor ficará armazenada a diferença entre a imagem em teste e a imagem correspondente a da posição de mesmo índice no banco de templates*/ Para cada template do banco de dados: Atribuo a T(i,j) os tons do padrão correspondente ao template da posição imagem Para i = 1 a 15 Para j = 1 a 15 Erro (Imagem)= Erro (Imagem)+ I(i,j)-T(i,j)

5 Descreva como pode ser a tomado de decisão nos sistemas de RP por extração de características. (0,4 pt) As formas mais simples são por vizinhos mais próximos (menor distancia) ou por clusterização através de funções discriminantes. Mas a medida que essas não resolverem existem diversas variações baseadas em árvores de decisão, heurísticas, inteligência artificial, redes neurais, lógicas fuzzy, etc. 6 Defina e exemplifique "image measurements". (0,4 pt) São conjunto de dados numéricos que são extraídos da imagem que façam sentido para diferenciar os padrões de determinada aplicação no reconhecimento por extração de características ou estrutural. Exemplo de dados podem ser obtidos são: perímetro do objeto, área do objeto, largura, retangularidade, excentricidade, momentos geométricos, momentos invariantes, número de furos, concavidades, número de partes retas, alongamento, identificação do contornos por chain code ou Fourier, assinaturas, posição do centroide, direção dos eixos principais. 7 Descreva um algoritmo para executar "chain code" baseado nos 8 vizinhos de uma imagem. Inclua o cálculo do perímetro, da derivada do contorno e da largura e comprimento da área do objeto neste algoritmo. Binarização da IMAGEM Detecção de contornos eliminação de falhas do contorno de modo que esse fique um caminho fechado varre-se a imagem de cima para baixo e da direita para a esquerda até encontrar o primeiro ponto do contorno continuando no mesmo sentido de varredura busco a direção do vizinho deste ponto armazeno o código deste vizinho enquanto não se chegar ao fim da imagem Quanto a imagem tiver sido toda escaneada, e todos os dados do seu chain code transformados em uma string, essa string será percorrida procurando fazendo-se ao mesmo tempo: 1- A armazenagem das diferenças entre os códigos: código da posição atual - código da próxima posição; 2- a conta quantos códigos foram registrados 3- a conta de quantos códigos há do tipo correspondente ao vizinho da direta; 4- a conta de quantos códigos há do tipo correspondente ao vizinho de baixo Estes dados são usados para fazer : 1- a string de código de derivadas; 2- o calculo do perímetro que corresponde ao numero de códigos multiplicado pelo comprimento de um pixel 3- o calculo da largura será a soma do numero dos vizinho da direta multiplicado pelo comprimento de um pixel 3- o calculo da altura será a soma do numero dos vizinho de baixo multiplicado pelo comprimento de um pixel

Como você pode usar a derivada para transformar o contorno descrito na forma digital dada para a vetorial? (2,2 pt) Depois de identificados os pontos onde há derivada diferente de zero, volta-se a imagem original e busca-se as posições (x,y) destes pontos. Estas posições correspondem a fim de trecho retos do objeto se forem armazenadas é possível representar o objeto na forma vetorial, unido-se estes pontos por linhas. 8 - O que são e porque são importantes as descrições invariantes? As descrições invariantes são muito importantes pois é muito complicado ajustar as características da imagem para as mesmas condições e a maioria das formas de casamento e extração de características de template são dependentes da posição do objeto, do seu angulo de rotação, da sua escala, da forma de amostragem, da escala desta amostragem (pontos por polegadas). Esta dependência é ainda pior na visão de máquina onde inclusive a perspectiva usada na captura deve ser levada em conta, bem como cobertura parcial de objetos. Descreva como é o mapeamento do contorno de um objeto digital na forma ( θ, r(θ) ), onde θ representa o ângulo que um ponto do contorno faz com um eixo horizontal passando pelo seu centróide, e r é a distância deste ponto ao centróide. Este mapeamento faz um gráfico 2D onde na horizontal é identificado um ponto do contorno do objeto pelo angulo que faz com a horizontal e na vertical a distância deste ponto ao centroide do objeto. Depois tal gráfico é usado para identificar os objetos registrados de mesma forma. Porque são também chamadas "signatures" essas representações? (0,8) Porque esse registros são invariantes para cada forma em função da sua escala, podendo serem associados às formas para identifica-las (como as assinaturas) e inclusive tem uma aparência de assinaturas 9- Quais as formas de limitar segmentos de imagens? As formas de limitar segmentos de imagens são envolvendo o segmento por um retângulo com eixos paralelos aos eixos da cena (em animação isto é chamado de AABB- axial aligned bouding box), envolvendo o segmento pelo menor retângulo possível cena (chamado de BB bouding box), ou definido uma envoltória convexa para o segmento. A técnica da envoltória convexa tem algumas variações como menor elipse envolvente e menor círculo.

Diga com suas palavras o que é convex hull de um objeto digital. É uma envoltória convexa para o segmento, a terceira técnica acima descrita. Consiste em envolver o objeto pela menor forma possível que seja convexa, ou seja uma forma ou figura do tipo que: ao se unir qualquer dois pontos da figura não se encontre nenhum ponto que não pertença ao interior dela. O que são momentos de uma imagem ou objeto digital? Momentos de uma imagem ou objeto digital também chamados momentos geométricos não expressões da forma: M p q = Σ i Σ j I(i,j) i p j q onde I(i,j) corresponde ao tom de cinza na imagem do pixel (i,j) (se a imagem for binarizada aos valores de 0 ou 1), (i,j) são as coordenadas horizontais e verticais de cada pixel da imagem, p e q são números naturais que se somados correspondem a ordem do momento. O que significa o momento de ordem zero, os momentos de ordem dois e momentos invariantes? O momento de ordem zero, M 00, corresponde a terem p e q, na expressão acima ambos os valores zero. Isso resulta na soma dos tons dos pixels da imagem. Se ela for binária e 1 representar o objeto essa soma corresponde a área do objeto. Os momentos de ordem dois podem ser obtidos considerando p=2,q=2 p=q=1 na expressão acima: M 02, M 20, M 11. Se a imagem for binária e 1 representar o objeto essa expressão corresponde aos momentos de inércia na horizontal, na vertical e ao produto de inércia do objeto. A soma da inércia horizontal e vertical de um objeto independe da orientação deste objeto em relação aos eixos horizontais e verticais. Corresponde a um invariante a rotação do objeto. Momentos invariantes são derivados dos anteriores que não mudam quando alguma coisa muda na forma de captura da cena. Por exemplo a área é teoricamente independente da posição e angulo que o sistema de eixos usado na captura (pela câmera por exemplo) fizer com o objeto. O mesmo ocorre com a soma dos momentos de inércia de ordem dois, comentadas anteriormente. Descreva como pode ser achado o sistema de eixos principal de um objeto digital? (1,2) Por definição da Física, sistema de eixos principal de um objeto são seus eixos paralelos às direções de menor e maior inércia. Inércias são as características obtidas pelos momento de ordem dois acima: p=2,q=0 e q=0, p=2 (M 02, M 20, ). Assim esses eixos podem ser achado buscando a direção de momentos de ordem dois máximas e mínimas. Essas correspondem a posições em que o produto de inércia ou seja o momento q=p=1 for nulo. A relação entre uma direção qualquer usada para calcular os momentos M 02, M 20, M 11 e a direção principal é dada pela relação: 2θ = arco tangente 2 M 11 / (M 02 - M 20 ) Assim o sistema de eixos principal de um objeto digital pode ser obtido calculando M 02, M 20, M 11, calculando angulo pela expressão anterior e obtendo sua orientação em relação a direção atual de captura.