Dado um conjunto de características, relativas a uma região (objecto), pretende-se atribuir uma classe essa região, seleccionada de um conjunto de classes cujas características são conhecidas O conjunto de características de uma região pode ser representado por um vector: x1 x2 Χ =... x n Exemplo: As características seleccionadas para representar um objecto influenciam fortemente a capacidade de separar os objectos pertencentes a cada classe Exemplo: Neste caso o vector de características pode ser uma amostragem de N pontos do contorno ou, como alternativa, podem-se utilizar N momentos estatísticos Visão por Computador 83 João Luís Sobral 2003
Reconhecimento de objectos Matching Cada classe é representada protótipos, sendo o reconhecimento efectuado de acordo com um critério de proximidade Distância mínima entre vectores Uma região é atribuída à classe cujo vector se encontra a menor distância: min X M, j=0.. K j X é um vector que representa a região a reconhecer Mj o protótipo de cada classe Podem ser utilizados vários protótipos por classe, neste caso, Mj representa a média das características dos protótipos A distância mínima é pouco adequada quando as médias dos protótipos de cada classe não estão claramente separadas ou quando os vários protótipos de cada classe não estão concentrados junto da média Tempate matching No caso de se pretender localizar um objecto particular (template) numa imagem pode ser utilizado um filtro, representando a imagem do objecto, o qual é subtraído à imagem, pixel a pixel, sendo a diferença d calculada por: dij (, ) = Ii ( xj, y) f( xy, ) x y em que d(i,j) representa a diferença para o ponto (i,j), x, y são as dimensões do filtro, f(x,y) representa os valores do filtro I(i,j) é o valor da imagem no ponto (i,j) Idealmente, o objecto é encontrado quando d=0, mas, devido à existência de ruído, são considerados valores próximos de 0 Podem existir problemas com a rotação e a escala dos objectos 2, Visão por Computador 84 João Luís Sobral 2003
Matching (cont) Correlação Semelhante à convolução, onde o kernel representa o padrão a ser encontrado, mas o kernel de convolução não é rodado: f ( s, t) w( x + s, y + c ( x, y) = t) s t O valor máximo representa ponto onde existe maior proximidade entre a imagem e o padrão A correlação é sensível à amplitude f e de w o que pode ser resolvido utilizando um coeficiente de correlação para normalização Os problemas de rotação e de escala são dificilmente resolvidos na correlação A correlação pode ser implementada directamente no domínio das frequências, utilizando um teorema semelhante ao da convolução: * f o w F. W, onde F* é o conjugado complexo Para máscaras de dimensão elevada é mais eficiente efectuar a correlação do domínio das frequências Pirâmides de resolução - Frequentemente, é mais viável estimar a presença ou posição de uma determinada característica numa imagem com resolução inferior. O resultado obtido pode depois ser refinado numa imagem de maior resolução Um caso simples para a diminuição da resolução da imagem é o cálculo da média de 4 pixels, obtendo uma diminuição de 4:1 Para evitar aliasing, na diminuição da resolução da imagem, deve utiliza-se um filtro graussiano seguido de uma amostragem da imagem Visão por Computador 85 João Luís Sobral 2003
Redes Neurais São baseadas numa estrutura e funcionamento que se acredita serem próximos do celebro humano As redes neurais são baseadas num processo de aprendizagem, onde a rede é treinada com um conjunto de padrões de cada classe Exemplo: Quando uma saída shape1... shape4 está activa a forma correspondente foi reconhecida Visão por Computador 86 João Luís Sobral 2003
Redes Neurais (cont) Exemplo (cont) Cada região foi representada pelo seu contorno e descrita pela assinatura normalizada do contorno, amostrada em 48 pontos (i.é., representada por um vector com 48 elementos) A rede foi treinada com várias formas, inicialmente sem ruído, e posteriormente com formas (10 por classe) alteradas através da introdução de um grau de ruído Posteriormente foi analisada a probabilidade de reconhecimento errado de uma forma, em função do seu grau de ruído e do grau de ruído das imagens utilizadas no processo de treino: Posteriormente analisou-se o efeito da utilização de mais imagens com ruído no processo de treino: Visão por Computador 87 João Luís Sobral 2003
Métodos estruturais Os métodos estruturais têm em consideração as relacionamentos estruturais inerentes nos objectos Matching shape numbers O grau de similaridade entre duas regiões é definido pelo maior número de curvatura para o qual os números de curvatura coincidem Reconhecimento de Strings O processo de reconhecimento é implementado por uma gramática, baseada num conjunto de símbolos primitivos Exemplo: S->aA A->bA A->bB B->c Visão por Computador 88 João Luís Sobral 2003