Reconhecimento das Configurações de Mão da LIBRAS a Partir de Malhas 3D



Documentos relacionados
ANDRES JESSÉ PORFIRIO

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

Segmentação de imagens tridimensionais utilizando o sensor Microsoft Kinect

UNIVERSIDADE F EDERAL DE P ERNAMBUCO ANÁLISE DE UM MÉTODO PARA DETECÇÃO DE PEDESTRES EM IMAGENS PROPOSTA DE TRABALHO DE GRADUAÇÃO

Extração de Requisitos

Aula 6 Fundamentos da fotografia digital

Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados

2 Classificação de Imagens de Sensoriamento Remoto

Processamento de Imagem. Prof. MSc. André Yoshimi Kusumoto

UPS. Unidades de Alimentação Ininterrupta

Psicopedagogia Institucional

FORMAS DE COMUNICAÇÃO

A definição do escopo trata-se de um processo onde é realizada uma descrição detalhada do projeto e do produto a ser desenvolvido;

Guia Rápido. Copyright Todos os direitos reservados.

Prof. Daniel Hasse. Multimídia e Hipermídia

Exame de Fundamentos da ITIL

DESENVOLVIMENTO WEB DENTRO DOS PARADIGMAS DO HTML5 E CSS3

Gerador de Home-pages de apoio ao ensino utilizando princípios de Design de Interfaces

Introdução Ciclo de vida tradicional de desenvolvimento Prototipagem Pacotes de software Desenvolvimento de 4ª geração Terceirização

SEGMENTAÇÃO DE IMAGENS EM PLACAS AUTOMOTIVAS

Desenvolvimento do Módulo de Pré-processamento e Geração de Imagens de. Imagens de Teste do Sistema DTCOURO

Multimídia. Hardware/Software para Multimídia (Parte I) Sistemas Multimídia. Tópico. Hardware e Software para Multimídia

COMPUTAÇÃO GRÁFICA REPRESENTAÇÃO DE IMAGENS

Introdução. Capítulo. 1.1 Considerações Iniciais

Deficiência Visual. Eficiência Tátil Inteligência - Adaptações. V Compartilhando Eficiências. Seção de Educação Especial SEE - DE

36 Anais da Semana de Ciência e Tecnologia, Ouro Preto, v. 4, p , 2012.

ALFABETIZAÇÃO DE ESTUDANTES SURDOS: UMA ANÁLISE DE ATIVIDADES DO ENSINO REGULAR

Deficiência auditiva parcial. Annyelle Santos Franca. Andreza Aparecida Polia. Halessandra de Medeiros. João Pessoa - PB

Introdução à Computação

Educação especial: um novo olhar para a pessoa com deficiência

11 de maio de Análise do uso dos Resultados _ Proposta Técnica

Curso de planilhas eletrônicas na modalidade EAD: Um relato de experiência

Cálculo de volume de objetos utilizando câmeras RGB-D

GARANTIA DA QUALIDADE DE SOFTWARE

3 Classificação Resumo do algoritmo proposto

DEPARTAMENTO DE MATEMÁTICA E CIÊNCIAS EXPERIMENTAIS - Grupo 550 INFORMÁTICA Planificação Anual /Critérios de avaliação

TRANSIÇÃO DA ISO 9001:2000 PARA ISO 9001:2008 DOCUMENTO SUMÁRIO DE ALTERAÇÕES ALTERAÇÕES QUE PODEM AFECTAR O SISTEMA

Gerência de Redes NOC

Taxa de Gravação da Memória RAM (MegaBytes / segundo) G5 2.7 Ghz (Mac) Linux Kernel

O Experimento CMS Parte 2/2

LeYa Educação Digital

Plataforma Sentinela

PALAVRAS-CHAVE: Massas Nodulares, Classificação de Padrões, Redes Multi- Layer Perceptron.

Pesquisa e organização de informação

Permite a coleta de dados em tempo real dos processos de produção, possuindo, também, interfaces para a transferência dos dados para os sistemas

Referências internas são os artefatos usados para ajudar na elaboração do PT tais como:

AUTOR: DAVID DE MIRANDA RODRIGUES CONTATO: CURSO FIC DE PROGRAMADOR WEB VERSÃO: 1.0

HCT Compatibilidade Manual do Usuário

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

Reconhecimento de Objectos

27/06/14. Tabelas e Gráficos. Tabelas e Gráficos

Cálculo utilizando variáveis do tipo DATA

Aula 1 Dados & Informações & Indicadores

4 O Workflow e a Máquina de Regras

Servidor, Proxy e Firewall. Professor Victor Sotero

BRAlarmExpert. Software para Gerenciamento de Alarmes. BENEFÍCIOS obtidos com a utilização do BRAlarmExpert:

Aula 03 PowerPoint 2007

3 Um Framework Orientado a Aspectos para Monitoramento e Análise de Processos de Negócio

Análise de Dados do Financeiro

SUMÁRIO Acesso ao sistema... 2 Atendente... 3

Hardware (Nível 0) Organização. Interface de Máquina (IM) Interface Interna de Microprogramação (IIMP)

VERIFICAÇÃO FINAL DOCUMENTAÇÃO

PROCESSO DE DESENVOLVIMENTO DE SOFTWARE. Modelos de Processo de Desenvolvimento de Software

Sistemas Distribuídos. Professora: Ana Paula Couto DCC 064

Processamento digital de imagens. introdução

Ambiente Visual para o Desenvolvimento de Jogos Eletrônicos

SCPI 8.0. Guia Rápido. Parametrizando o Módulo CONTAS. Introdução. Informações da Entidade. Nesta Edição

3.º e 4.º Anos de Escolaridade Competências Conteúdos Sugestões metodológicas Articulações

TUTORIAL DE UTILIZAÇÃO. Rua Maestro Cardim, cj. 121 CEP São Paulo - SP (11)

Hardware & Software. SOS Digital: Tópico 2

Um Processo para Desenvolvimento de Aplicações Web Baseado em Serviços. Autores: Fábio Zaupa, Itana Gimenes, Don Cowan, Paulo Alencar e Carlos Lucena

SECRETARIA DA PRIMEIRA INSTÂNCIA

UTILIZAÇÃO E DESENVOLVIMENTO DE SOFTWARES EDUCACIONAIS PARA PESSOAS COM NECESSIDADES ESPECIAIS.

Certificação ISO. Dificuldades, vantagens e desvantagens. Marcelo Henrique Wood Faulhaber, Med. Pat. Clin., MBA

Procedimento de anexação de peças e envio

Prof. Marcelo Henrique dos Santos

Informática. Prof. Macêdo Firmino. Macêdo Firmino (IFRN) Informática Setembro de / 25

A Educação Bilíngüe. » Objetivo do modelo bilíngüe, segundo Skliar:

Desenvolvimento de Sistemas Orientados a Objetos com UML UP/RUP: Projeto

UFRN PS Letras Libras/Língua Portuguesa THE 1

2 Diagrama de Caso de Uso

Boletim Informativo Técnico BIT /2014

Apresentação do Sistema MakDutos

CHECK LIST DE AVALIAÇÃO DE FORNECEDORES Divisão:

Ambiente de Simulação Virtual para Capacitação e Treinamento na Manutenção de. Disjuntores de Subestações de Energia Elétrica,

CA Vida Companhia Seguros Vida. - Gestão Documental - Produtividade, Captura e Indexação

Prof. Marcelo Machado Cunha

Oficina de Multimédia B. ESEQ 12º i 2009/2010

HELPDESK. Guia do Usuário

Rastreando fluxos para detecção de eventos em redes

Para construção dos modelos físicos, será estudado o modelo Relacional como originalmente proposto por Codd.

AUTOMAÇÃO DE ESCRITÓRIOS ADE

VisTrails. Fernando Seabra Chirigati Aluno de Engenharia de Computação e Informação COPPE/UFRJ fernando_seabra@cos.ufrj.br

RECONHECIMENTO DE VOZ UTILIZANDO ARDUINO

As principais características da abordagem de um banco de dados versus a abordagem de processamento de arquivos são as seguintes:

março / 2002

04/08/2012 MODELAGEM DE DADOS. PROF. RAFAEL DIAS RIBEIRO, MODELAGEM DE DADOS. Aula 1. Prof. Rafael Dias Ribeiro. M.Sc.

Gerenciamento de software como ativo de automação industrial

Transcrição:

Reconhecimento das Configurações de Mão da LIBRAS a Partir de Malhas 3D Andres Jessé Porfirio Orientador: Prof. Dr. Daniel Weingaertner Universidade Federal do Paraná

Sumário Introdução Abordagem Baseada nos Parâmetros Globais Utilização de Malhas 3D Objetivos Resultados Considerações Finais

Introdução As línguas de sinais são as principais ferramentas de inclusão social dos surdos; Elas são utilizadas como meio de comunicação, obtenção de informações, educação, etc; A língua de sinais brasileira é chamada LIBRAS;

Introdução Ferramentas têm sido desenvolvidas para facilitar a utilização dos meios de comunicação digitais por deficientes auditivos, ex: Reconhecimento automático de sinais; Avatares animados em sistemas digitais; Além disso, ferramentas tradutoras podem favorecer a comunicação entre surdos e ouvintes que não compreendem a língua de sinais;

Introdução As principais abordagens utilizadas no reconhecimento de sinais são divididas quanto à forma de percepção: Abordagem visual; Abordagem sensorial;

Introdução Abordagem Visual: Baseia-se em imagens ou sequencias de vídeo do ator; Abordagem não invasiva: Não exige sensores acoplados ao ator; Mais fácil de ser aplicada em ambientes reais; Em alguns casos faz-se uso de acessórios como luvas; Maior dificuldade de obtenção das informações de movimento,dedos, entre outros: Necessidade de rastreamento, etc; segmentação de imagens,

Introdução Abordagem Sensorial: Faz uso de sensores acoplados ao corpo do ator: Abordagem invasiva: Acelerômetros, sensores de uso médico para captura de movimentos, etc; Dificulta utilização em ambientes reais; Pode causar desconforto ao ator; Alguns sensores são disponibilizados a preços altos;

Introdução Observações sobre os trabalhos encontrados na literatura: Luvas e sensores desconforto; limitam o uso, geram Vocabulários restritos e reconhecimento de letras do alfabeto não conferem poder de reconhecimento da língua como um todo; Artifícios úteis no contexto abordado, mas não para o reconhecimento de todas os sinais/sentenças de uma língua;

Abordagem Baseada nos Parâmetros Globais Parâmetros globais são as primitivas da língua: União de parâmetros globais - Sinal União de fonemas - Palavra A estrutura fonética da LIBRAS é composta por cinco parâmetros globais: Configuração de mão; Locação; Movimento; Orientação da palma da mão; Expressão facial.

Abordagem Baseada nos Parâmetros Globais LIBRAS não são meros gestos ou mímicas e não é uma soletração do Português; O uso da abordagem baseada em fonemas é mais adequada para o reconhecimento de sinais; O parâmetro abordado por este trabalho é a configuração de mão;

Abordagem Baseada nos Parâmetros Globais Figura 1: Configurações de Mão da LIBRAS [1].

Utilização de Malhas 3D Este trabalho difere de grande parte das publicações relacionadas: Reconhecimento a partir de malhas 3D e não imagens/vídeos 2D; Vantagens: Capacidade de identificar detalhes da mão e dedos independentemente da orientação da mão; Problemas de oclusão podem ser evitados; Invariância às condições de iluminação;

Utilização de Malhas 3D Parte-se do princípio de que a aquisição de malhas 3D em tempo real é um problema com solução em desenvolvimento: Novos sensores e técnicas estão sendo desenvolvidos e já apresentam resultados promissores (caso do LeapMotion Figura 2). Figura 2: LeapMotion.

Objetivos Principal: Reconhecer as configurações de mão da LIBRAS a partir de malhas 3D; Específicos: Capturar uma base de dados das configurações de mão da LIBRAS com o sensor Kinect; Gerar uma base de malhas 3D com o método da reconstrução por silhueta; Determinação e extração de características; Classificação das malhas 3D; Gerar uma base 2D das configurações de mão;

O trabalho foi desenvolvido conforme mostra a Figura 3: Figura 3: Etapas do desenvolvimento. em etapas,

de Softwares Auxiliares: NiCapture 1.3: Auxilia na captura de vídeos com o Kinect; Organiza a base no padrão CX_Y_Z: Ex: C5_3_2 são os dados do quinto ator, configuração de mão 3, segunda tomada. Armazena o esqueleto 3D (Figura 4), dispensando a calibração e rastreamento a cada futura execução do vídeo; Figura 4: Esqueleto 3D.

de Softwares Auxiliares: NiCapture 1.3: Armazena os vídeos no formato RGBDS Red, Green, Blue, Depth, Skeleton; Exibe controles de captura no Laptop e exemplos das cofigurações de mão no monitor auxiliar (Figura 5); Figura 5: Ambiente de Captura.

de Softwares Auxiliares: NiViewSKL 1.3.1: Reproduz os vídeos gerados pelo NiCapture 1.3; Converte um vídeo em uma sequencia de imagens 2D com a mão segmentada;

Captura da Base de Dados: A configuração das capturas pode ser vista na Figura 6: Figura 6: Configuração das Capturas.

Captura da Base de Dados: A sequencia de movimentos realizada pelo ator para cada configuração de mão pode ser vista na Figura 7: Figura 7: Sequencia de Movimentos das Capturas.

Seleção dos Quadros de Interesse: Este trabalho fez uso da reconstrução por silhueta baseada em duas imagens; Esta técnica requer como entrada duas visões da mão: frontal e lateral; A seleção dos quadros foi feita manualmente.

Correção de Ruídos: Através da análise das imagens foi constatado que grande parte possuía ruídos; Ruídos geram malhas incorretas, dificultando a classificação; Estas imagens foram submetidas à correção manual;

Correção de Ruídos: Principais tipos de ruídos: Segmentação (Figura 8). Figura 8: Ruído de Segmentação (a), Correção (b).

Correção de Ruídos: Principais tipos de ruídos: Rotação incorreta (Figura 9). Figura 9: Rotação Incorreta (a), Correção (b).

Correção de Ruídos: Principais tipos de ruídos: Aparecimento artefatos como a manga da blusa (Figura 10). Figura 10: Aparecimento da Manga da Blusa (a), Correção (b). de

Correção de Ruídos: Resultados da correção: 3 24 15 37 Figura 11: Exemplos de imagens corrigidas relativas às configurações de mão 3,15,24 e 37.

Reconstrução por Silhueta: Também conhecida como Shape From Sihouette ou Visual Hull Construction; A reconstrução é feita através da estimativa da malha 3D por meio de imagens de vários pontos de vista de um objeto (Figura 12); Figura 12: Reconstrução por Silhueta.

Reconstrução por Silhueta: Foi desenvolvido com base em dois conceitos: Produção do volume da silhueta; Diferença entre malhas;

Reconstrução por Silhueta: Produção do volume da silhueta (Figura 13): Figura 13: Produção da Silhueta.

Reconstrução por Silhueta: Diferença entre malhas (Figura 14): Figura 14: Diferença entre Malhas.

Reconstrução por Silhueta: Aplicação dos dois conceitos (Figura 15): Figura 15: Produção dos Volumes e Diferença entre Malhas.

Reconstrução por Silhueta: Após a reconstrução foi aplicado um filtro de suavização e reorganização poligonal (Figura 16): Figura 16: Pré-processamento da Malha.

Reconstrução por Silhueta: Exemplos de malhas 3D após pré-processamento (Figura 17): 24 3 15 37 Figura 17: Exemplos de malhas 3D referentes às configurações de mão 3, 15, 24 e 37.

Descritor Spherical Harmonics: Descritor de malhas 3D; Invariante à iluminação, translação, rotação e escala; Calculado com o auxílio de uma ferramenta desenvolvida por Michael Kazhdan [2].

Descritor Spherical Harmonics: Figura 18: Computação do Descritor Spherical Harmonics.

Classificação: Support Vector Machine SVM; Classificador que supervisionado; faz uso de aprendizado Objetivo principal a classificação de problemas com duas classes; Pode ser aplicado em conjuntos de dados não separáveis linermente; Utilizável em bases com multiplas classes através do uso da abordagem um-contra-um e pairwise [3].

Classificação: Utilização da biblioteca LibSVM; Configurações do SVM: Kernel Linear e Kernel RBF; Ranking 1, 3 e 5; Média de 10 execuções em cada configuração; Configuração da base de dados: 70% das instâncias para treino e 30% para testes. 10 subconjuntos de dados provenientes de divisões aleatórias 70/30.

Resultados Foram construídas duas bases de dados: HC-LIBRAS-RGBDS-2011: 5 atores; 2 tomadas por ator; 61 configurações de mão; Total: 610 vídeos. HC-LIBRAS-RGB-2011: Base complementar 2D; Imagens RGB extraídas da base RGBDS; Visão frontal da mão;

Resultados Foi construída uma base de malhas 3D: Para cada dupla de imagens frontal/lateral foi gerada uma malha 3D; Total: 610 malhas, 10 para cada configuração de mão da LIBRAS; Todas as malhas foram submetidas ao filtro de suavização; Resultado armazenado em dois formatos: Blend Blender 3D. Stanford PLY Formato de entrada da ferramenta que calcula o descritor Spherical Harmonics;

Resultados Classificação: Inicialmente os arquivos de assinatura foram convertidos para o formato da LibSVM; A base foi subdividida 10 vezes na proporção 70/30, gerando 10 subconjuntos de testes; O descritor Spherical Harmonics foi utilizado para formar o vetor de características;

Resultados Classificação: A Tabela 1 apresenta a média de 10 execuções do SVM com Kernel RBF: Tabela 1: SVM com Kernel RBF. A Tabela 2 apresenta a média de 10 execuções do SVM com Kernel Linear: Tabela 2: SVM com Kernel Linear.

Resultados Classificação: Análise das malhas que causaram erro de classificação: Figura 19: Configurações de mão parecidas.

Resultados Comparação com o trabalho mais similar encontrado na literatura: Foi efetuado o reconhecimento das configurações de mão relativas aos 10 dígitos: Figura 20: Configurações de mão e malhas 3D relativas aos 10 dígitos.

Resultados Comparação com o trabalho mais similar encontrado na literatura: A configuração de mão 25 se repete para os dígitos 6 e 9; A segunda ocorrência configuração de mão 60; foi substituída pela Têm-se então um problema com 10 classes, similar ao trabalho de Keskin [4];

Resultados Comparação com o trabalho mais similar encontrado na literatura: O autor Keskin [4] obteve uma taxa de acerto de 99.9%; O presente trabalho obteve uma taxa de 98.33% de acerto em condições similares às testadas por Keskin. A Tabela 3 mostra os resultados obtidos com este teste: Tabela 3: Resultados da classificação de malhas 3D com 10 classes.

Considerações Finais A utilização da abordagem baseada nos parâmetros globais é promissora e viável; Novas técnicas e dispositivos estão sendo desenvolvidos e, futuramente, viabilizarão o reconhecimento em ambientes reais; O reconhecimento de configurações de mão a partir de malhas 3D é uma alternativa às tecnicas clássicas que oferece benefícios como a invariância à orientação da mão e luminosidade;

Referências [1] Nelson Pimenta e Ronice Muller de Quadros. Curso LIBRAS 1 4a Edição. Editora Vozes, 2010. [2] Spherical Harmonics, Michael Kazhdan, disponível em http://www.cs.jhu.edu/ misha/harmonicsignatures/. Acesso em 10/02/13. [3] C. Chang e C. Lin. LIBSVM: A library for support vector machines. ACM Transactions on Intelligent Systems and Technology, 2:27:127:27, 2011. [4] C Keskin, F. Kiraç, Y. E. Kara, e L. Akarun. Real time hand pose estimation using depth sensors. ICCV Workshops, páginas 12281234. IEEE, 2011.