3DODYUDVFKDYH Visão Computacional, Inteligência Artificial, Redes Neurais Artificiais.



Documentos relacionados
UM SISTEMA DE VISÃO PARA RECONHECIMENTO DE PEÇAS EM UM TABULEIRO DE XADREZ

SISTEMA ESTABILIZADOR DE PLANOS

Neste trabalho apresenta-se o projeto e detalhes de um protótipo de um sistema robótico utilizado

Otimização de Árvores Sintáticas aplicada à Detecção de Células Cancerígenas

Processamento digital de imagens. introdução

Planificação de. Aplicações Informáticas B

APLICATIVOS GRÁFICOS (AULA 4)

Ferramenta para detecção de fadiga em motoristas baseada no monitoramento dos olhos

Redes Neurais Artificiais: Funções de Base Radial

Desenvolvimento de Estratégia para Programação do Futebol de Robôs da Mauá

Aplicação de Redes Neurais Artificiais na Caracterização de Tambores de Rejeito Radioativo

Quais as diferenças entre os formatos de imagem PNG, JPG, GIF, SVG e BMP?

SEGMENTAÇÃO DE IMAGENS EM PLACAS AUTOMOTIVAS

WEBGIS Sistema Informativo Territorial

Tecnologias IXUS 210. Ecrã Táctil LCD PureColor II

4 Avaliação Experimental

IDENTIFICAÇÃO DE MARCADORES DE PAVIMENTAÇÃO NA ORIENTAÇÃO DE CEGOS

Segmentação de Imagens de Placas Automotivas

Respostas do Estudo Dirigido do Capítulo 14 Classical pattern recognition and image matching"

4 Experimentos Computacionais

Modelagem Digital do Terreno

Análise de Percolação em Barragem de Terra Utilizando o Programa SEEP/W

Classificação de Imagens

Imagem e Gráficos. vetorial ou raster?

Reconhecimento de Padrões Utilizando Filtros Casados

MAPA GEOIDAL DE CAMPINAS

ESTEREOSCOPIA INTRODUÇÃO. Conversão de um par de imagens (a)-(b) em um mapa de profundidade (c)

NATUREZA DO TRABALHO : PERÍCIA DE ENGENHARIA O USO DE ORTOIMAGENS EM PERÍCIAS DE ENGENHARIA

BIOSYS: sistema de captura e armazenamento de imagens para exames oftalmológicos em biomicroscópios - Fase 1 1

Desenvolvimento de um Sistema Híbrido para Rastreamento

Compositor de Impressão do QGIS

Morfologia Matemática Binária

2 Classificação de Imagens de Sensoriamento Remoto

Figura 5.1.Modelo não linear de um neurônio j da camada k+1. Fonte: HAYKIN, 2001

Rastreamento de Múltiplos. Objetos em Tempo Real

VÃOS DESNIVELADOS, UTILIZANDO PERFIL DE PROJETO DIGITAL, SOFTWARE EM AMBIENTE VISUAL E BASE DE DADOS RELACIONAL

A limiarização é uma das abordagens mais importantes de segmentação de imagens. A limiarização é um caso específico de segmentação.

FOTOGRAMETRIA DIGITAL. Rogério Mercandelle Santana Universidade Federal de Viçosa Departamento de Solos

ATENÇÃO: * Arquivos com tamanho superior a 500 KB NÃO SERÃO ACEITOS * SOMENTE serão aceitos documentos do formato: PDF

Redes Neurais Artificiais na Engenharia Nuclear 2 Aula-1 Ano: 2005

2 Texturas com Relevo e Equações de Pré Warping

RECONHECIMENTO DE ACORDES MUSICAIS: UMA ABORDAGEM VIA PERCEPTRON MULTICAMADAS

OBTENDO CONHECIMENTO A PARTIR DOS TWITTES PESSOAIS. FRANTZ, Miguel Airton 1 ; FROZZA, Angelo Augusto 2 Instituto Federal Catarinense, Camboriú/SC

Aula 2 Aquisição de Imagens

Detecção em tempo real de movimentos de olhos e boca em um vídeo em cores

Geração de mapas temáticos utilizando os programas GPS TrackMaker, Google Earth e Surfer

Computador E/S, Memória, Barramento do sistema e CPU Onde a CPU Registradores, ULA, Interconexão interna da CPU e Unidade de controle.

No manual da webcam, ele descobriu que seu sensor de imagem tem dimensão total útil de 2

REGISTRO DE PROJETOS

Inteligência Artificial. Minimax. Xadrez chinês. Xadrez chinês. Exemplos de Jogos. Exemplo de função de avaliação: Prof. Paulo Martins Engel

Controlando o trabalho impresso 1

O Gerenciamento de Documentos Analógico/Digital

Modelos Pioneiros de Aprendizado

Localização de placas em imagens de veículos. Resumo

Anais do IX Congresso Brasileiro de Redes Neurais / Inteligência Computacional (IX CBRN) Ouro Preto de Outubro de 2009

SADLD. Software. Manual de Operação. Sistema de Apoio ao Diagnóstico de Lesões Dentárias utilizando Espectroscopia Raman

RNAs, Classificação de Padrões e Motivação Geométrica. Conteúdo

ANEXO TÉCNICO CADERNO DE ESPECIFICAÇÕES TÉCNICAS PARA AQUISIÇÃO DE ELEVADOR CONVENCIONAL

Redes neurais aplicadas na identificação de variedades de soja

Como representar uma lente convergente e uma lente divergente.

Sensoriamento Remoto

SISTEMAS AVANÇADOS DE DETEÇÃO DE ARMADURAS EM ESTRUTURAS E EDIFICIOS DE BETÃO SÉRIE PROFOMETER PM MODELO PM-600 E PM-630

Tópicos de Ambiente Web Web Design

Encontrando a Linha Divisória: Detecção de Bordas

)LJXUD8PGRVSDUHV'SDUDFRQYROXomRTXHWHPRPHVPRHIHLWRGR NHUQHOGD)LJXUD

Operações Geométricas com Imagens

NBR 8196 (Ago 1992) Conceito Escala é a relação entre as medidas do desenho de um objeto e seu tamanho real:

XIX CONGRESSO DE PÓS-GRADUAÇÃO DA UFLA 27 de setembro a 01 de outubro de 2010

Palavras chave: defeitos de solda, pulso eco, redes neurais artificiais, transformada de wavelet

Manual de Utilização

DESENVOLVIMENTO DE UM MODELO COMPUTACIONAL DE EXPOSIÇÃO EXTERNA PARA ESTUDO DA DOSE DE ENTRADA NA PELE PARA RADIOGRAFIAS DE TÓRAX E COLUNA

Capítulo 2. VARIÁVEIS DO TIPO INTEIRO

Introdução. Capítulo. 1.1 Considerações Iniciais

O USO DO QR CODE NO ENSINO DA GEOGRAFIA

Você vai começar criando o fundo Após criar o fundo, você aplicará o resto dos gráficos e texto da publicidade.

PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO DEPARTAMENTO DE INFORMÁTICA PÓS GRADUAÇÃO EM INFORMÁTICA

Do neurônio biológico ao neurônio das redes neurais artificiais

CADERNOS DE INFORMÁTICA Nº 1. Fundamentos de Informática I - Word Sumário

Aula 5 - Classificação

Simulador de Redes Neurais Multiplataforma

UNIVERSIDADE FEDERAL DE LAVRAS PRÓ-REITORIA DE PÓS-GRADUAÇÃO COORDENADOR1A DE PÓS-GRADUAÇÃO STHCTOSBJSU DISCIPLINA

PLANO INTEGRADO DE TRANSPORTE URBANO DA REGIÃO METROPOLITANA DE CAMPINAS (PITU CAMPINAS)

Manual de Rotinas para Usuários. Advogados da União. Procuradoria da União no Estado do Ceará PU/CE SAPIENS. Sistema da AGU de Inteligência Jurídica

DESENVOLVIMENTO DE UM SISTEMA AUTOMATIZADO PARA INSPEÇÃO ULTRA-SÔNICA EM CASCO DE NAVIO

Introdução. Software (Parte I)

A solução que faltava para seu estúdio fotográfico

PREVISÃO DE TEMPERATURA ATRAVÉS DE REDES NEURAIS ARTIFICIAIS

Simulador Virtual para Treinamento em Visão de Máquina com LabVIEW

UNIVERSIDADE FEDERAL DO PAMPA ALEXANDRE AMARAL MOREIRA

Fundamentos de Imagens Digitais. Aquisição e Digitalização de Imagens. Aquisição e Digitalização de Imagens. Aquisição e Digitalização de Imagens

TRIANGULAÇÃO DE DELAUNAY COM RESTRIÇÃO EM IMAGENS BIDIMENSIONAIS

2.1.2 Definição Matemática de Imagem

Medição tridimensional

Este tutorial tem por objectivo explicar como trabalhar com o Microsoft Office PowerPoint.

Especificações / SCANNER

SEGEMENTAÇÃO DE IMAGENS. Nielsen Castelo Damasceno

Processamento Digital de Imagens

COMPUTAÇÃO GRÁFICA REPRESENTAÇÃO DE IMAGENS

Programa Olímpico de Treinamento. Aula 9. Curso de Combinatória - Nível 2. Tabuleiros. Prof. Bruno Holanda

Ao se falar sobre fotografia cinematográfica estão envolvidos diversos elementos que devem ser levados em consideração:

Transcrição:

80,7(0$'(9, 23$5$5(&21+(&,0(172'(3(d$(080 7$%8/(,52'(;$'5(= Sérgio Faustino Ribeiro Juracy Emanuel M. da França Marcelo Alves de Barros José Homero Feitosa Cavalcanti Universidade Federal da Paraíba CCT/COPIN/NEUROLAB-CT/DTM Av. Aprígio Veloso,882 Campus 58.109-970 Campina Grande, PB E-mail: homero@dsc.ufpb.br 5HVXPR Neste trabalho apresenta-se o projeto e o desenvolvimento de um sistema de visão para detectar as peças em um tabuleiro de xadrez. A posição das peças (presença, ou ausência de peças em cada casa do tabuleiro) é transformada numa matriz simbólica que será utilizada por um sistema de controle robótico. O sistema de visão utiliza como ferramenta Redes Neurais Artificiais. 3DODYUDVFKDYH Visão Computacional, Inteligência Artificial, Redes Neurais Artificiais.,1752'8d 2 O NEUROLAB (Laboratório de Redes Neurais Artificiais) está desenvolvendo um sistema robótico inteligente para o movimento de peças sobre um tabuleiro de xadrez, denominado AutoXad (Ferreira et ali, 1999). Na figura 1 apresenta-se a fotografia do AutoXad. O AutoXad é composto de um braço robótico, uma câmara digital QuickCam P/B (QuickCam User Guide, 1995) (ver esfera apontada por uma seta), um tabuleiro de xadrez, e um microcomputador PENTIUM utilizado para executar as tarefas de aquisição dos dados da câmara e de controle do sistema utilizando um Sistema Inteligente (Ferreira et ali, 1999). O sistema de visão utiliza um software, denominado NEUROMORFO, que realiza operações básicas de processamento de imagens tais como: cálculo de histograma, equalização, filtragem, binarização, extração de contorno (morfologia), etc (Harilack and Shapiro, 1992) (Pandya, 1995). Tais operações são realizadas sobre imagens armazenadas em arquivos do tipo BMP de 8 bits. Além disso, o NEUROMORFO é capaz de detectar as peças no tabuleiro de xadrez, utilizando redes neurais artificiais, e transferir esta informação (presença, ou ausência de peças em cada casa do tabuleiro), na forma de uma matriz simbólica, para o sistema de controle do robô.

'(&5,d 2'21(852025)2 )LJXUD AutoXad. A QuickCam possui foco de 45,5 cm para o infinito e está a uma altura de 45,7 cm em relação à superfície do tabuleiro. Cada casa do tabuleiro possui uma dimensão de 2,7cm x 2,7 cm, de tal forma que uma casa na imagem pode ser enquadrada por uma moldura de 27 x 27 pixels, havendo uma correspondência, aproximada, de 1 pixel na imagem capturada pela câmara para 1 mm na superfície do tabuleiro. Na figura 2 apresenta-se a tela principal do NEUROMORFO com uma imagem do tabuleiro de xadrez (formato BMP) obtida pela QuickCam. )LJXUD Tela principal do NEUROMORFO O laboratório é iluminado por três lâmpadas fluorescentes. A disposição do tabuleiro em relação às lâmpadas gera uma variação da luminosidade ao longo do mesmo tal que, as casas que estão próximas à parede no fundo da imagem, na figura 3, apresentam níveis de cinza menores que as que estão na frente. A equalização da imagem é feita através do espalhamento dos níveis de cinza, multiplicando-se cada nível por um fator obtido pela divisão entre 255 e o maior nível encontrado na imagem. Na figura 3 pode-se observar a sombra das peças ao longo do tabuleiro.

)LJXUD Imagem equalizada do tabuleiro de xadrez. A imagem do tabuleiro está contida num quadrado de 21mm de lado, e a imagem da QuickCam tem a dimensão 320 x 240 pixel, isto é, a imagem contém informações redundantes. Necessitou-se isolar o tabuleiro do restante da imagem. Para isto, desenhou-se (virtualmente no computador) uma grade com as dimensões aproximadas do tabuleiro (8 x 8 casas de 27 x 27 pixels cada) e ajustada manualmente sobre o mesmo. A grade possibilita ao NEUROMORFO reconhecer as coordenadas das casas do tabuleiro de xadrez. Na figura 4 é apresentada a imagem do tabuleiro de xadrez juntamente com a grade. Observe-se que, devido à distorção na imagem gerada pela QuickCam, a grade não fica perfeitamente ajustada sobre o tabuleiro (em particular nas bordas). Observe-se também que a região central das casas do tabuleiro é a que apresenta a menor distorção, isto é, possui as informações mais relevantes. )LJXUD O tabuleiro de xadrez com a grade Na figura 5 apresenta-se a imagem da ampliação ("zoom" de 300%) sobre a imagem de uma peça do tabuleiro localizada na posição 4D (quarta coluna a partir da esquerda e quarta linha a partir da base do tabuleiro de xadrez da figura 3). Convencionou-se como região central da casa do tabuleiro uma área de 9 x 9 pixels (cada casa possui uma dimensão de 27 x 27) deslocada em 9 pixels a partir das coordenadas da casa (ver quadrado central na figura 5). )LJXUD Ampliação da imagem de uma casa do tabuleiro Na figura apresenta-se a representação visual do conjunto de amostras extraídas do tabuleiro da figura 4, sendo que a ordem na qual a extração ocorre é da esquerda para a direita, e de cima para baixo.

)LJXUD Amostras extraídas do tabuleiro $1È/,('$,0$*(08$1'25('(1(85$,$57,),&,$, A análise da imagem da casa do tabuleiro feita na região central com 9 x 9 pixel (81 pixels) do quadrado da figura 5 foi feita utilizando redes neurais artificiais. Devido às características da rede neural utilizada na análise da imagem, decidiu-se reduzir a dimensão dos dados (81 pixels) a serem analisados. Calculou-se a média aritmética de cada linha da amostra de 9 X 9 pixel e obteve-se um vetor com nove valores. Este vetor foi aplicado à entrada da rede neural. Na figura 7 apresenta-se o conteúdo do vetor (valor numérico entre 0 e 255) das casas representadas por 8TD, 8CD e 8BD. Essas casas não contêm peça e portanto são claras, apresentando níveis altos de intensidade, principalmente por estarem numa das zonas mais iluminadas do tabuleiro. HPÃ3HoD )LJXUD Valores dos pixels de três casas sem peças do tabuleiro Na figura 8 mostra-se o conteúdo correspondente às três casas representadas por 7TD, 7CD e 7BD. As casas 7TD e 7BD estão ocupadas por uma peça, os níveis correspondentes à peça possuem valores muito baixos. A csa 7CD não é ocupada por uma peça. Ã ÃÃ &RPÃ3HoD )LJXUD Valores dos pixels de três casas do tabuleiro Utilizou-se uma rede neural multicamada (RNMC) (Humelhart, 198) com 3 camadas (figura 9). A RNMC possui 9 neurônios na camada de entrada, 8 neurônios na camada escondida, e 1 neurônio na camada de saída. Os 9 neurônios da camada de entrada possuem função de ativação linear, servindo apenas para transformar os valores da entrada em partes por unidade (peso igual a 255). Os demais neurônios da RNMC possuem função de ativação do tipo sigmóide. O treinamento dos parâmetros da rede (pesos, β, θ, σ) foi realizado usando o algoritmo da propagação retroativa do erro (APR). Tal função de ativação sigmóide é representada pela equação 1. :LQS ' / :RXW ' ' / / 7 )LJXUD Rede Neural Artificial Multicamada. Σ $35

Θ S(X i,θ,β,δ) = [1 + exp(-β(σx i WLQ L + δ))] (1) Atribuíram-se os valores 1 (um) quando há uma peça sobre a casa e 0 quando não há peça (ver Figura 10). O conjunto de valores utilizados no treinamento da RNMC foram escolhidos a partir das casas centrais do tabuleiro. A rede aprenderá através do conjunto de treinamento apresentado à mesma (conjunto de vetores representando padrões). A escolha de um conjunto de treinamento que represente de forma adequada o problema visado, e tenha um tamanho adequado, é de fundamental importância para o bom desempenho da rede. Considerando tal importância, foi utilizado um conjunto de quatro imagens básicas para realizar o treinamento da rede. Escolheram-se 4 imagens de casas como conjunto básico de treinamento. As casas foram: uma casa branca sem peça, uma casa branca com peça, uma casa preta sem peça, e uma casa preta com peça. A RNMC foi treinada durante 1000 iterações utilizando as 4 amostras básicas. A seguir, foi feito o teste com a imagem do tabuleiro de xadrez apresentado na figura 4. Na figura 10 apresenta-se o resultado da classificação das casas do tabuleiro. )LJXUD Classificação do tabuleiro efetuada pela RNMC &21&/8 2 A atual implementação do NEUROMORFO foi capaz de realizar a detecção das peças no tabuleiro com um grau de acerto em torno de 98%. Os erros se devem, possivelmente, às variações de iluminação no ambiente. Como se deseja um sistema robusto, está sendo analisado o uso do Sistema de Previsão Inteligente (SPI) (Melo et al, 1999) para atribuir tal robustez ao sistema. Esse novo sistema de visão poderá ser empregado em: orientação de robôs móveis, futebol de robôs, análise de imagens clínicas, etc. Futuramente, será utilizada uma versão adaptada do SPI para o reconhecimento do tipo das peças (pião, torre, cavalo, rei

e dama) sobre as casas do tabuleiro de xadrez. O NEUROMORFO foi escrito na linguagem C++ utilizando o C++ Builder da Borland. 5()(5Ç1&,$%,%/,2*5È),&$ Ferreira, C.N.M.A., Ferreira, J.R.S., Cavalcanti, J.H.F., Alsina, P.J., e Franca, J.E., 1999, Posicionamento Inteligente de um Braço Robótico COBEM 99 - Congresso Brasileiro de Engenharia Mecânica, Águas de Lindóia, SP. Harilack, R.M., e Shapiro, L.G., 1992, Computer and Robot Vision, Addison- Wesley Publishing Company. Humelhart, D.E. e Hinton, G.E. & Williams, R.J. 198, Learning Internal Representations by Error Propagation, Parallel Distributed Processing: Explorations in the Microstructures of Cognition. Vol 1, D.E. Humelhart & J.L. McClelland, Cambridge, MA: MIT Press, pp. 318-32. Melo, H., Cavalcanti, J.H.F., Silva, J.F., e Silva, V.P.R., 1999, Sistema de Previsão Inteligente, CBRN - IV Congresso Brasileiro de Redes Neurais, São José dos Campos SP. Pandya, A.S., e Macy, R.B., 1995, Pattern Recognition with Neural Networks in C++, CRC Press, e IEEE Press. QuickCam User Guide, 1995, Connectix Corporation, November.