MORFOLOGIA MATEMÁTICA APLICADA A RECONHECIMENTO DE PLACAS DE AUTOMÓVEIS



Documentos relacionados
Processamento e Análise de Imagens (MC940) Análise de Imagens (MO445)

Processamento de Imagem Morfológica (Morfologia Matemática) Tsang Ing Ren UFPE - Universidade Federal de Pernambuco CIn - Centro de Informática

Simulação Gráfica. Morfologia Matemática. Julio C. S. Jacques Junior

MORFOLOGIA MATEMÁTICA. Adair Santa Catarina Curso de Ciência da Computação Unioeste Campus de Cascavel PR

Filtragem. pixel. perfil de linha. Coluna de pixels. Imagem. Linha. Primeiro pixel na linha

Filtragem Espacial. (Processamento Digital de Imagens) 1 / 41

Transformada de Hough. Cleber Pivetta Gustavo Mantovani Felipe Zottis

SEGMENTAÇÃO DE IMAGENS EM PLACAS AUTOMOTIVAS

29/08/2011. Radiologia Digital. Princípios Físicos da Imagem Digital 1. Mapeamento não-linear. Unidade de Aprendizagem Radiológica

PROCESSAMENTO DIGITAL DE IMAGENS

FILTRAGEM ESPACIAL. Filtros Digitais no domínio do espaço

)LJXUD8PGRVSDUHV'SDUDFRQYROXomRTXHWHPRPHVPRHIHLWRGR NHUQHOGD)LJXUD

RESUMO 2 - FÍSICA III

Tratamento da Imagem Transformações (cont.)

Processamento Digital de Imagens

Capítulo 7. Topologia Digital. 7.1 Conexidade

SEGEMENTAÇÃO DE IMAGENS. Nielsen Castelo Damasceno

Capítulo 1. x > y ou x < y ou x = y

Universidade Federal do Rio de Janeiro - IM/DCC & NCE

Introdução ao processamento de imagens e OCTAVE. Julio C. S. Jacques Junior juliojj@gmail.com

Capítulo 2. Álgebra e imagens binárias. 2.1 Subconjuntos versus funções binárias

Morfologia Matemática Binária

Objetivos. Apresentar as superfícies regradas e superfícies de revolução. Analisar as propriedades que caracterizam as superfícies regradas e

Universidade Federal de Goiás Instituto de Informática Processamento Digital de Imagens

UM TEOREMA QUE PODE SER USADO NA

SESSÃO 5: DECLINAÇÃO SOLAR AO LONGO DO ANO

CAP. I ERROS EM CÁLCULO NUMÉRICO

Capítulo 5 Filtragem de Imagens

Segmentação de Imagens

INE0003 FUNDAMENTOS DE MATEMÁTICA DISCRETA

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

Processamento de Imagem. Prof. MSc. André Yoshimi Kusumoto

MÉTODOS DISCRETOS EM TELEMÁTICA

Informática Aplicada a Radiologia

PARTE 2 FUNÇÕES VETORIAIS DE UMA VARIÁVEL REAL

SISTEMA DE DETECÇÃO DE FALHAS EM PEÇAS INDUSTRIAIS PLANAS ATRAVÉS DO RECONHECIMENTO VIA CONTORNO E/OU ESQUELETO MORFOLÓGICO

AULA 6 LÓGICA DOS CONJUNTOS

Matemática - UEL Compilada em 18 de Março de Prof. Ulysses Sodré Matemática Essencial:

6. Geometria, Primitivas e Transformações 3D

TOPOLOGIA DA IMAGEM DIGITAL

COMPUTAÇÃO GRÁFICA. Rasterização e Preenchimento de Regiões. MARCO ANTONIO GARCIA DE CARVALHO Fevereiro de Computação Gráfica

3.3 Espaço Tridimensional - R 3 - versão α 1 1

Soluções Inteligentes

Que imagens têm ou não têm simetria?

Projeto de Máquinas de Estado

Circuitos Combinacionais

RUÍDOS EM IMAGENS FILTRAGEM DE RUÍDOS. o Flutuações aleatórias ou imprecisões em dados de entrada, precisão numérica, arredondamentos etc...

Aula 5 - Classificação

Oficina de fotografia e tratamento de imagem. Facilitadora: Camila Silva Aula: 05

PROF. DR. JACQUES FACON

Nesta aula iremos continuar com os exemplos de revisão.

Redução de imagem no domínio espacial

2.1.2 Definição Matemática de Imagem

(b) Domínio espacial Reescalamento dos níveis de cinza Integração Diferenciação

CAPÍTULO 3 - TIPOS DE DADOS E IDENTIFICADORES

Introdução. A Informação e sua Representação (Parte III) Universidade Federal de Campina Grande Departamento de Sistemas e Computação

ICORLI. INSTALAÇÃO, CONFIGURAÇÃO e OPERAÇÃO EM REDES LOCAIS e INTERNET

Cálculo do conjunto paralelo

MÓDULO 6 INTRODUÇÃO À PROBABILIDADE

Computação Gráfica Interativa

Autómatos Finitos Determinísticos

Morfologia Matemática

Respostas do Estudo Dirigido do Capítulo 14 Classical pattern recognition and image matching"

3 Classificação Resumo do algoritmo proposto

Arquitetura de Rede de Computadores

Departamento de Matemática - UEL Ulysses Sodré. Arquivo: minimaxi.tex - Londrina-PR, 29 de Junho de 2010.

Introdução ao Processamento de Imagens

Exemplo de Subtração Binária

a 1 x a n x n = b,

Universidade Estadual de Santa Cruz. Departamento de Ciências Exatas e Tecnológicas. Especialização em Matemática. Disciplina: Estruturas Algébricas

O ESPAÇO NULO DE A: RESOLVENDO AX = 0 3.2

DATA WAREHOUSE. Introdução

2 Texturas com Relevo e Equações de Pré Warping

RECONHECIMENTO DE PLACAS DE AUTOMÓVEIS ATRAVÉS DE CÂMERAS IP

RELAÇÕES BINÁRIAS Produto Cartesiano A X B

Caracterização temporal de circuitos: análise de transientes e regime permanente. Condições iniciais e finais e resolução de exercícios.

4 Segmentação Algoritmo proposto

Teoria Princípio do Capacitor

Atividade: matrizes e imagens digitais

Encontrando a Linha Divisória: Detecção de Bordas

Universidade Federal de Alagoas Instituto de Matemática. Imagem. Prof. Thales Vieira

COMPUTAÇÃO GRÁFICA O QUE É?

Todos os exercícios sugeridos nesta apostila se referem ao volume 1. MATEMÁTICA I 1 FUNÇÃO DO 1º GRAU

Universidade Federal do ABC. Sinais Aleatórios. Prof. Marcio Eisencraft

MAT 461 Tópicos de Matemática II Aula 3: Resumo de Probabilidade

UNIVERSIDADE FEDERAL DO ESPÍRITO SANTO PROGRAMA DE EDUCAÇÃO TUTORIAL - MATEMÁTICA PROJETO FUNDAMENTOS DE MATEMÁTICA ELEMENTAR

Módulo 4. Construindo uma solução OLAP

Localização de placas em imagens de veículos. Resumo

Oficina de Multimédia B. ESEQ 12º i 2009/2010

Scale-Invariant Feature Transform

PALAVRAS-CHAVE: Massas Nodulares, Classificação de Padrões, Redes Multi- Layer Perceptron.

Reconhecimento de marcas de carros utilizando Inteligência Artificial. André Bonna Claudio Marcelo Basckeira Felipe Villela Lourenço Richard Keller

II. DEFINIÇÕES INICIAIS 1

Algoritmos e Estrutura de Dados III. Árvores

QFD: Quality Function Deployment QFD: CASA DA QUALIDADE - PASSO A PASSO

Banco de Dados. Álgebra Relacional. Prof. Enzo Seraphim

NOÇÕES DE ÁLGEBRA LINEAR

Fundamentos. Guillermo Cámara-Chávez

CONTROLE DE QUALIDADE e VALIDAÇÃO DE PRODUTO CARTOGRÁFICO

Trabalho compilado da Internet Prof. Claudio Passos. Sistemas Numéricos

Transcrição:

MORFOLOGIA MATEMÁTICA APLICADA A RECONHECIMENTO DE PLACAS DE AUTOMÓVEIS Paulo Madruga UNIBRATEC Av. Beira Mar, 220, Ap 111 Piedade J. dos Guararapes - PE madruga@unibratec.com.br Sérgio de Sá Leitão Paiva Júnior Unibratec Av. Ulisses Montarroos, 2531ap 201 J. dos Guararapes - PE sergio.paiva@unibratec.com.br RESUMO Este artigo tem como objetivo mostrar uma técnica de Processamento de imagens que seja capaz de detectar a placa de automóvel numa fotografia e reconhecer, ou seja, localizar num banco de dados, esta placa. A técnica descrita aqui envolve um processamento local da imagem processada através de filtros capazes de detectar bordas e utilização da morfologia matemática para reconhecimento das formas encontradas. PALAVRAS-CHAVE Segmentação de imagens, Morfologia Matemática, Processamento Digital de Imagens. 1. INTRODUÇÃO O processamento de imagens digitais consiste em retirar informações relevantes de uma ou várias imagens que, neste caso, servem como dados de entrada num sistema. No Processamento Digital de Imagens (PDI), importante subdivisão da área de Processamento Digital de Sinais, imagens de entrada são processadas, gerando imagens como produto final. O PDI pode incluir etapas de visão computacional e de computação gráfica. Desde que a entrada e a saída do sistema envolvam imagens, o trabalho global é fundamentalmente de PDI. O PDI é altamente multidisciplinar, envolvendo diversos aspectos e conceitos de ótica, eletrônica, matemática, estatística, fotografia e computação. Variadas técnicas de PDI são utilizadas em diversas aplicações como por exemplo: Processamento de imagens de satélites, imagens médicas em geral (retina, raio x, tomografia, etc), trânsito (detecção de placas de automóveis, etc). Detecção e reconhecimento automático de objetos em imagens digitais são muitas vezes complexos, pois dependem da natureza dos objetos e da forma como eles integram a imagem como um todo, mais é este um dos principais objetivos do processamento de imagens.

Mostraremos uma técnica de Processamento de imagens que seja capaz de detectar, isolando na imagem a placa de um automóvel numa fotografia e reconhecer, através da técnica de esqueletização, as letras e números desta placa. A técnica descrita aqui envolve um processamento local da imagem processada através de filtros capazes de detectar bordas e morfologia matemática para reconhecimento das formas encontradas. 2. EXTRAÇÃO DA IMAGEM DA PLACA A PARTIR DE UMA IMAGEM FOTOGRAFADA 2.1 Detecção de Bordas numa imagem digital A detecção de bordas de uma imagem é um caso particular de uma descontinuidade na imagem, fora a borda temos como descontinuidade pontos e linhas isoladas que podem compor a imagem, as vezes como um ruído. As principais técnicas de detecção de descontinuidade são baseadas no uso de uma máscara que é um procedimento onde é feita a soma dos produtos dos coeficientes pelos níveis de cor (ou cinza) contida em uma região englobada pela máscara. R = n i= 1 W i Z i Em que Zi é o nível de cor (ou cinza) e Wi é o coeficiente da máscara. Costumeiramente a resposta da máscara é computada com relação à posição central. 2.2 Operadores de gradiente Podemos definir o gradiente de uma imagem f(x,) no ponte (x,) como sendo o vetor: f G = G x f = f x x O vetor gradiente aponta na direção de mudança mais rápida de f na posição (x,). Em detecção de borda a magnitude deste vetor é um valor importante chamada de gradiente e denotada por f, em que: 2 2 [ G ] 1/ 2 x G f = mag( f ) = + Outro valor importante na detecção de bordas é a direção do vetor gradiente, que juntamente com o gradiente, pode ser utilizado para ligação de borda e detecção de fronteiras numa imagem. A direção do vetor gradiente em que o ângulo é medido em relação ao eixo x é dada por.

α( x, ) = tan 1 G G x É comum a prática de aproximar os valores de gradiente por valores absolutos: G Gx + G ou G max( Gx + G ) Particularmente os operadores de gradiente são implementados através de máscaras de convolução implementada de forma a percorrer todos os pixels da imagem e para cada pixel (x,) um valor associado ou operador, chamaremos de resposta da máscara, é medido e, posteriormente, classificado dentro de um determinado critério. A convolução é uma importante propriedade das transformadas de Fourier. Os operadores de gradiente são particularmente sensíveis a ruídos na imagem, pois eles impõem uma mudança brusca de intensidade de cor, como os operadores de gradiente são implementados através de convolução de máscaras, estes ruídos tem uma resposta alta quando aplicamos a máscara escolhida para a operação desejada. Dependendo do critério a ser utilizado para segmentação estes ruídos podem ser confundidos como parte da imagem, sendo então necessários outros métodos auxiliares para redução dos ruídos. 2.3 Ligação de bordas e Detecção de fronteiras As técnicas utilizadas para detectar bordas devem ser utilizadas junto com uma técnica que possa definir uma região limitada por estas bordas. Podemos então utilizar a magnitude do operador de gradiente juntamente com o ângulo do gradiente com o eixo x para criarmos uma condição que delimite uma determinada área na figura. Esta técnica é facilmente aplicada através de um processamento local dos pixels da figura, gerando uma imagem que corresponde à área da placa do veículo. A partir desta imagem aplicaremos as técnicas de morfologia matemática para tratamento desta imagem e aplicação do reconhecimento das letras e número da placa através do esqueleto morfológico previamente criado tanto das letras do alfabeto quanto dos números (de 0 a 9). Para entender como funcionará o reconhecimento das letras e números da placa do veículo, será anteriormente explicado operações utilizadas na morfologia matemática. 3. MORFOLOGIA MATEMÁTICA Apresentaremos aqui os fundamentos básicos da Morfologia Matemática. A notação que utilizaremos será a mesma adotada por [MARAGOS, P. & SCHAFER, R. W, 1986] é a seguinte: R = Conj. dos números reais; Z = Conj. de todos os inteiros; E = Espaço Euclidiano R 2 ou Z 2 ; X,Y,A,B,C,...:Subconjuntos. de E; Ø = Conj. vazio. X c : Conjunto complementar de X com respeito a E. x,,z,a,b,c,... : Elementos ou pontos de vetores de E; x : P : Conj. de pontos x satisfazendo a propriedade P. A B : O conjunto A e um subconjunto de B. U ( ) : Conj. união (interseção) A - B : Conjunto diferença entre A e B.

A Morfologia Matemática trata objetos bidimensionais numa imagem como conjuntos matemáticos no espaço Euclidiano E, o qual pode ser tanto o espaço contínuo R 2 como o espaço discreto Z 2. As mais simples transformações da Morfologia Matemática são a erosão, a dilatação, a abertura e o fechamento. Estas transformações são baseadas na adição e subtração de conjuntos de Minkowski. 3.1 A Adição de Minkowski A adição de Minkowski, A B, de dois conjuntos A e B, consiste de todos os pontos c que podem ser expressos como uma adição vetorial algébrica c = a + b, onde os vetores a e b pertencem aos conjuntos A e B, respectivamente. Se A b = { a + b : a A } denota a translação do conjunto A pelo vetor b, então a soma de Minkowski de A e B é igual ao conjunto união de todas as translações A b de A, onde o vetor b varre o conjunto B: A B = {a + b: a A, b B } = U A b 3.2 A Subtração de Minkowski A subtração de Minkowski de A e B, denotada como A B, é a operação dual da adição no conjunto de Minkowski com respeito à complementação: A B = (A c B) c = I A b 3.3 Transformações da Morfologia Matemática A erosão e a dilatação morfológicas são definidas, do ponto de vista geométrico, como operações que, respectivamente, encolhem e expandem um conjunto. Algebricamente, elas são idênticas à subtração e a adição de Minkowski, respectivamente, como veremos a seguir. 3.3.1 A Erosão Façamos o conjunto X representar uma região numa imagem binária, e o conjunto B, um elemento estruturador. O complementar X c de X representa o fundo na imagem. Nós denotamos por B s o conjunto simétrico de B com respeito à origem; i.e., B s é obtido pela rotação de B em 180 o no plano, de modo que B s = { - b: b B }. Então, a erosão de X por B é definida geometricamente como o conjunto daqueles pontos Z tais que a translação B z esteja contida no conjunto da imagem original X. Algebricamente, a erosão de X por B é igual à subtração de Minkowski de B s e X: X B s = {z : B z X} = I X b

3.3.2 A Dilatação A operação dual de erosão com respeito à complementação é a dilatação. A dilatação de X por B é definida geometricamente como o conjunto de todos aqueles pontos z tais que a translação B z intersecta X. Algebricamente, a dilatação de X por B é igual à soma de Minkowski de X e B s : X B s = {z : B z X Ø } = U X b Dilatar o objeto na imagem é equivalente a erodir o seu fundo.tanto a erosão como a dilatação são operações nãolineares, as quais são geralmente não inversíveis, e somente a dilatação é comutativa e associativa. 3.3.3 A Abertura e o Fechamento Outro par de transformações morfológicas duais são a abertura e o fechamento. Se nós erodirmos X por B, e então, dilatarmos a erosão X B s por B s nós geralmente não recuperaremos X, mas uma versão menos detalhada, e simplificada, de X. Este novo conjunto é chamada a abertura, X B, de X por B. Por dualidade, o fechamento, X B de X por B resulta da dilatação seguida da erosão. Assim, a abertura e o fechamento são definidos, respectivamente, como: X B = (X B s ) B X B = (X B s ) B Numa figura, a transformação de abertura suprime os cabos pontiagudos e corta os istmos estreitos de um objeto enquanto a transformação de fechamento preenche os golfos finos e os pequenos buracos. Estas operações podem ser usadas para resolver o problemas de descontinuidade nos filamentos ou para afilálos, de acordo com a nossa necessidade. Assim, se o elemento estruturador B tem uma forma regular, tanto a abertura como o fechamento podem ser pensados como sendo filtros que suavizam o contorno do objeto. Em ambos os casos, o resultado nos fornece uma eliminação daqueles detalhes da imagem que são menores que o elemento estruturador, sem uma distorção geométrica global das característica não suprimidas. Ambas as transformações são geralmente não-inversíveis. A abertura é sempre anti-extensiva, enquanto o fechamento é sempre extensivo, i.e., X b X X b. Tanto a abertura como o fechamento são transformações invariantes por translação e escala. Ademais, elas são idempotentes, i.e., (X b ) b = X b. 3.4 Implementando a Erosão e a Dilatação As relações mostrada para erosão e dilatação acima, nos fornecem maneiras práticas de implementar usando apenas lógica Booleana. Isto é, a erosão e a dilatação de X por B são algebricamente como a interseção e a união, respectivamente, de todas as translações X -b de X quando b varre B. O elemento estruturador B é um conjunto compacto, o que, para conjuntos discretos, significa que B contém um número finito de pontos. Assim, o número de translações requeridas de X é finito. Além do mais, composições paralelas e seriais da erosão e da dilatação podem ser exploradas para agilizar a implementação prática destas operações. Isto é, as leis de composição paralela permitem a formação de elementos

estruturadores mais complexos a partir da união e interseção de elementos mais simples. A lei de composição serial nos habilita a erodir e dilatar por elementos estruturadores bidimensionais usando somente elementos unidimensionais. Por exemplo, um quadrado 3 x 3 é obtido pela dilatação de um segmento horizontal por um segmento vertical de 3 píxeis cada. Portanto, a forma e o tamanho do elemento estruturador pode ser programado. 4. O RECONHECIMENTO A Morfologia Matemática pode ser utilizada para extrair informações a respeito da forma de um objeto numa imagem a partir da sua estrutura interna, ao transformá-la através de sua interação com outro objeto, chamado elemento estruturador, de forma e tamanho mais simples do que o objeto original. Informações sobre forma, tamanho, distribuição espacial, o quão concentrado é o objeto, a suavidade do seu contorno, e a sua orientação, podem ser obtidas pela transformação deste objeto usando diferentes elementos estruturadores. Existem duas formas de esqueletização. Lantuejoul[LANTUEJOUL, C., 1980] definiu um tipo particular de esqueleto, usando transformações da morfologia matemática, para aplicações na compressão de dados, com a intenção de que o objeto original pudesse ser reconstruído a partir do seu esqueleto. Este tipo de esqueleto também tem aplicações úteis para a representação e o reconhecimento de objetos, como empregado neste artigo. No caso de reconhecimento de letras e números de uma placa, utilizaremos o esqueleto morfológico para caracterização da estrutura geométrica interna de cada letra e cada número, de 0 a 9, para posteriormente utilizá-lo com fins de reconhecimento. Nossa estratégia é utilizar o esqueleto dos números e letras armazenando-os como a sua representação de forma, e, como critério de reconhecimento. Para tratarmos isoladamente cada parte conectada, ou seja, as letras e números, extrairemos uma parte conexa da imagem da placa, que obviamente será uma letra ou um número, sabendo que antes deste processo iremos tratar a imagem para extração de elementos menores que identificam o estado e a cidade do veículo. Para o reconhecimento de cada parte conectada, verifica-se o quão bem um esqueleto protótipo armazenado se encaixa na peça, efetuando-se a erosão morfológica da mesma com o simétrico do esqueleto do protótipo, e observandose o resíduo da operação. Se o objeto analisado é uma cópia exata do protótipo, o resíduo resultante irá consistir de uns poucos pontos, independentemente da posição da peça (pela invariância sob translações da erosão). Para a determinação de orientação, os eixos de alongamento, tanto do esqueleto quanto da peça analisada, são obtidos e rotacionados de modo que coincidam as suas orientações. A medida do ângulo de rotação dá a informação de orientação da peça reconhecida. Uma vez reconhecido, a seqüência das atuais 03 (três) letras e 04 (quatro) números, acessaremos o banco de dados para obter os demais dados do veículo, se for o caso, tal como é feito em departamentos de trânsito. A esqueletização proposta por Lantuejoul envolve a criação de subconjuntos de esqueletos que podem ser utilizados numa estratégia de reconhecimento multinível. Numa situação real, em que o contorno do objeto observado é em geral corrompido por ruídos ou falhas na digitalização ou binarização, caso tratemos a imagens com estes processos, é aconselhável desprezar os subconjuntos de esqueleto de ordem mais baixa, que corresponde aos detalhes mais finos do contorno. O critério de reconhecimento em cada etapa é estabelecido como um limiar no tamanho do resíduo deixado pela erosão pelos esqueletos parciais: resíduos menores que o limiar escolhido, denotam ocorrências do protótipo na imagem. 5. CONCLUSÃO A Morfologia Matemática oferece uma técnica eficiente de detecção de formas em imagens complexas como a tratada no artigo. Para implementação destas técnicas faz-se necessário a definição dos parâmetros do elemento estruturador e do esqueleto morfológico de cada objeto, neste caso letras e números, a serem reconhecidos. Um conjunto de operadores algébricos, tais como os da morfologia matemática é de muita utilidade porque composições destes operadores podem ser formadas as quais, quando agindo em formas complexas, são capazes de decompô-las em partes significativas, separando-as das partes restantes. Por exemplo, tal conjunto de operadores e suas composições permitem que formas originais sejam identificadas e reconstruídas tais como em [MADRUGA,1992] minorando sensivelmente o nível de distorções ocasionadas por ruídos. Além disso, elas permitem que cada forma seja decomposta em formas mais simples. Já que a forma é uma das informações extraídas em sistemas de visão artificial, não

é de surpreender a importância da matemática morfológica nestes sistemas. REFERÊNCIAS MADRUGA, Paulo. Um Sistema de Visão Binária Incorporando Múltiplas Representações.. 79 p. Dissertação (Mestrado em Ciência da Computação) Universidade Federal de Pernambuco, Pernambuco, 1992. MARAGOS, P. & SCHAFER, R. W. Morphological Skeleton Representation and Coding of Binar Images, IEEE Trans. ASSP, Vol ASSP-34, oct,. 1986. MATHERON. G. Random Sets and Integral Geometr, New York: Wile,. 1975. SERRA, J., From,. Mathematical Morpholog to Artificial Intelligence, Proceedings of the International Conference on Pattern Recognition. pp. 1336-1343. 1986. LANTUEJOUL, C. Issues in Digital Image Processing, R.M. Haralick and J.C. Simon eds., Sijthoff and Noordoff, The Netherlands, 1980.