RECONHECIMENTO DE GÊNERO ATRAVÉS DA VOZ

Documentos relacionados
3 Redes Neurais Artificiais

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica

2. Redes Neurais Artificiais

Redes Neurais MLP: Exemplos e Características

Redes Neurais Artificial. Prática. Inteligência Artificial

Classificação de Padrões. Abordagem prática com Redes Neurais Artificiais

TÓPICOS EM INTELIGÊNCIA ARTIFICIAL Redes Neurais Artificiais

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica

INTELIGÊNCIA ARTIFICIAL

Introdução à Redes Neurais. Prof. Matheus Giovanni Pires EXA 868 Inteligência Artificial Não-Simbólica B Universidade Estadual de Feira de Santana

Redes Neurais Artificiais. Professor: Juan Moises Villanueva

Redes Neurais: MLP. Universidade Federal do Rio Grande do Norte Departamento de Engenharia de Computação e Automação

Introdução às Redes Neurais Artificiais

Redes Neurais Artificiais

3 INTELIGÊNCIA COMPUTACIONAL (IC)

SELEÇÃO DE VARIÁVEIS STEPWISE APLICADAS EM REDES NEURAIS ARTIFICIAIS PARA PREVISÃO DE DEMANDA DE CARGAS ELÉTRICAS

Fundamentos de Inteligência Artificial [5COP099]

Introdução às Redes Neurais Artificiais

Rede Perceptron. Capítulo 3

O uso de uma Rede Neural Artificial Supervisionada para obtenção do fator de carga de um alimentador.

Análise da Complexidade de Tempo e Espaço em Algoritmos para Classificação de Padrões em sinais de ECG

Primeiras Redes Neurais Artificiais: Perceptron e Adaline

Mineração de Dados aplicada a Gestão de Negócios. Aula 2. Prof. Dr. Sylvio Barbon Junior

Multi-Layer. Perceptrons. Algoritmos de Aprendizado. Perceptrons. Perceptrons

Redes Neurais Artificiais

Protótipo de Software para Reconhecimento de Impressões Digitais

Redes Neurais Artificiais

INF 1771 Inteligência Artificial

Redes Neurais Artificiais

UNIVERSIDADE FEDERAL DE LAVRAS DEPARTAMENTO DE CIÊNCIAS EXATAS (DEX) Estudo de Algoritmos de Aprendizado em Redes Neurais Artificiais

Redes neurais artificiais

Inteligência Artificial Redes Neurais

Redes Neurais Artificiais

REDES NEURAIS ARTIFICIAIS

Aula 1 Introdução - RNA

PREVISÃO CLIMÁTICA DE PRECIPITAÇÃO USANDO REDE NEURAL

Redes Neurais e Sistemas Fuzzy

Redes Neurais Artificial. Inteligência Artificial. Professor: Rosalvo Ferreira de Oliveira Neto

Usando MLP para filtrar imagens

Tópicos Especiais: Inteligência Artificial REDES NEURAIS

Multi-Layer. Perceptrons. Algoritmos de Aprendizado. Perceptrons. Perceptrons

Aula 7 RNA Redes Auto-Organizáveis de Kohonen

Redes Neurais Artificiais

Redes Neurais Artificiais Sistemas Inteligentes Especialização em Automação Industrial SISTEMAS INTELIGENTES PROFESSOR FLÁVIO MURILO

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica

Introdução a Redes Neurais Artificiais com a biblioteca Encog em Java

COMPARAÇÃO ENTRE DIFERENTES ESTRUTURAS DE REDES NEURAIS NO PROBLEMA PRESA-PREDADOR 1

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica

Introdução às Redes Neurais Artificiais

Classificação Linear. André Tavares da Silva.

Regra de Hebb Perceptron Delta Rule (Least Mean Square) Multi-Layer Perceptrons (Back Propagation) Hopfield Competitive Learning Radial Basis Function

Redes Neurais 1. Redes Neurais. cont.) Definição (cont( Definição. Histórico. Características básicas

Redes Neurais Artificiais

Redes Neurais Artificiais - Introdução. Visão Computacional

XIII Simpósio Brasileiro de Automação Inteligente Porto Alegre RS, 1 o 4 de Outubro de 2017

UM MODELO NEURAL PARA A PREVISÃO DA DEMANDA DE ENERGIA ELÉTRICA NA CIDADE DE FRANCA

Aprendizado de Máquinas. Multi-Layer Perceptron (MLP)

Redes Neurais: RBF. Universidade Federal do Rio Grande do Norte Departamento de Engenharia de Computação e Automação

JAI 6 - Deep Learning Teoria e Prática

5 RNA para Diagnóstico de Falhas em Turbinas a Gás

Inteligência Computacional

Avaliação de Desempenho de Redes LVQ em Comparação com Redes MLP com Backpropagation na Classificação de Cromossomos

Rede Neural Artificial Aplicada em um Reconhecimento Automático de Voz Independentemente do Locutor

Introdução às Redes Neurais Artificiais

APLICAÇÃO DE REDES NEURAIS ARTIFICIAIS PARA ESTIMAR MATRIZ ORIGEM-DESTINO DE CARGA

SEMINÁRIO DOS ARTIGOS:

PREVISÃO DE CASOS DE DENGUE EM ITAJAÍ SC UTILIZANDO REDES NEURAIS ARTIFICIAIS COM SAÍDAS RECORRENTES ÀS ENTRADAS

A evolução natural deu ao cérebro humano muitas características desejáveis que não estão presentes na máquina de von Neumann:

Redes Neurais. Motivação. Componentes do neurônio. Cérebro humano. Criar máquinas capazes de operar independentemente do homem:

Autor: Edroaldo Lummertz da Rocha Home page: edroaldo.wordpress.com

6 Aplicação da Metodologia Proposta

APRENDIZADO EM MODELOS CONEXIONISTAS

USO DE TÉCNICAS DE RECONHECIMENTO DE PADRÃO EM UM PROCESSO DE PRODUÇÃO DE ALUMINA PARA AUXÍLIO NO CONTROLE AMBIENTAL

Protótipo de Software de Reconhecimento de Voz Para Navegação em Jogos, Utilizando Rede Neural Artificial

CONCENTRAÇÃO DE GASES DISSOLVIDOS EM TRANSFORMADORES A ÓLEO UTILIZANDO REDES NEURAIS ARTIFICIAIS

XVII Congresso Nacional de Administração e Contabilidade - AdCont e 29 de outubro de Rio de Janeiro, RJ

serotonina (humor) dopamina (Parkinson) serotonina (humor) dopamina (Parkinson) Prozac inibe a recaptação da serotonina

Mineração de Dados em Biologia Molecular

INSTITUTO DE PÓS GRADUAÇÃO ICPG GESTÃO DA TECNOLOGIA DA INFORMAÇÃO

Implementação de um phmetro através de Redes Neurais Artificiais e Algoritmos Genéticos

Neurocomputação Parte 2

VRS usando redes neurais

Redes Neurais Pulsadas. João Fausto Lorenzato Robson David Montenegro Tarcísio Lucas

Redes Neurais Artificiais

Introdução às Redes Neurais Artificiais

Implementaça o de Rede Neural Artificial

Previsão de Cargas Elétricas através de um Modelo Híbrido de Regressão com Redes Neurais Artificiais

Multiple Layer Perceptron

Abordagem a um classificador de dígitos manuscritos baseado em redes neurais

Reconhecendo Instrumentos Musicais Através de Redes Neurais Artificiais

PREVISÃO DE DEMANDA DE CARGAS ELÉTRICAS POR SELEÇÃO DE VARIÁVEIS STEPWISE E REDES NEURAIS ARTIFICIAIS

CLASSIFICAÇÃO DE CROMATOGRAMAS GASOSOS DE ÓLEOS BASEADA EM REDES NEURAIS

Análise Quantitativa de Tecidos em Úlceras de Perna

CÁLCULO DO EQUILIBRIO DE TROCA-IÔNICA DO SISTEMA Na + -Pb 2+ -Cu 2+ USANDO REDES NEURAIS ARTIFICIAIS.

Décimo Quinto Encontro Regional Ibero-americano do CIGRÉ Foz do Iguaçu-PR, Brasil 19 a 23 de maio de 2013

TESTE DE TOPOLOGIAS DE REDES NEURAIS ARTIFICIAS NA DETECÇÃO DE FALTAS MONOFÁSICAS DE ALTA IMPEDÂNCIA EM SISTEMA DE DISTRIBUIÇÃO DE ENERGIA 1

Transcrição:

RECONHECIMENTO DE GÊNERO ATRAVÉS DA VOZ Marcela Ribeiro Carvalho marcela@enecar.com.br IFG/Câmpus Goiânia Hipólito Barbosa Machado Filho hipolito.barbosa@ifg.edu.br IFG/Câmpus Goiânia Programa Institucional de Bolsa de Iniciação em Desenvolvimento Tecnológico e Inovação /PIBITI, Edital 06/2013 Resumo O trabalho utiliza Rede Neural Artificial no procedimento do reconhecimento do gênero. A amostra é obtida capturando a voz dos participantes via microfone quando pronunciado "casa bonita". Deve aplicar sobre o sinal capturado a Transformada Rápida de Fourier - FFT para que o sinal esteja representado no domínio da frequência. Fora utilizado a Rede Backpropagation [1] aplicando a técnica de Levenberg-Marquardt para otimização de erros [1]. A utilização de RNA é atrativa devido a sua característica de aprendizagem e a Rede Backpropagation se destaca por permitir que sejam ajustados os pesos sinápticos através da retropropagação do erro. Efetuou-se o processamento com 1.000 e 3.000 pontos. Após o treinamento utilizando o toolbox de redes neurais do Matlab, é possível verificar a eficiência do grupo de voz de teste. O projeto é um estudo inicial sobre o reconhecimento da voz humana, que ao se expandir pode vir a se tornar prático em, por exemplo, bancos ou residências. Sua aplicação está relacionada a reforço de segurança, sendo um método a mais a limitar acesso de pessoas a determinados ambientes ou objetos. Palavras-Chave: Rede Neural, reconhecimento. 1

Objetivos O objetivo geral é criar um sistema capaz de reconhecer gênero através de padrões utilizando Redes Neurais Artificiais- RNA. Os objetivos específicos são: capturar e digitalizar amostras de voz de pessoas de ambos os gêneros para treinamento do RNA, analisar a sensibilidade dos parâmetros da matriz de entrada no RNA para o reconhecimento dos padrões das vozes, e determinar e comparar o resultado do processamento com 1.000 e 3.000 amostras. Justificativa/Fundamentação teórica Inicia-se o processamento de sinais obtendo amostras das vozes de pessoas escolhidas aleatoriamente no IFG Câmpus Goiânia. Para armazenamento dos dados, inicialmente capturados, utiliza-se o formato WaveformAudio File Format - WAV, que é um formato não comprimido, ou seja, permite qualidade máxima e não modifica nenhum bit do sinal original. Segundo Fausett [3], uma rede neural é um sistema de processamento de informação que possui algumas características de desempenho em comum com uma rede neural biológica. O RNA recebe entradas, integra-as segundo uma regra e fornece uma saída que é dada por uma função (de transferência) do valor integrado. Redes neurais artificiais processa a informação através de elementos simples denominados neurônios, cada neurônio aplica uma função de ativação (usualmente não linear) à soma dos produtos dos sinais de entrada com os respectivos pesos associados. 2

Dentre os vários modelos de redes neurais propostos, destacamos a Rede Perceptron de Múltiplas Camadas PMC, nesta utilizou o algoritmo de retropropagação do de erro chamada Rede Backpropagation. As redes PMC têm arquitetura feedforward de camadas múltiplas, ou seja, realiza um treinamento de forma supervisionada. Esta possui fluxo de dados em dois sentidos, na fase foward a rede recebe estímulos na entrada e apresenta os resultados na saída, já na fase backward, o algoritmo backpropagation efetua ajustes dos pesos sinápticos para a diminuição do erro quadrático. Para o aprendizado supervisionado os resultados finais são comparados a um valor padrão já estabelecido, desta forma nos é dado um erro, para este ser minimizado há a retropopagação, ou seja, o processo será repetido até a diminuição do erro. Dessa forma as vozes capturadas e tratadas pela FFT foram divididas em treinamento e teste, o aprendizado é realizado com as amostras de treinamento, já as amostras de teste servem para visualizar o quão eficiente fora o aprendizado. A FFT é necessária de modo que esta decompõe a matriz de um sinal de amplas frequências e fornece resultados com um padrão de leitura suficiente para a Rede Neural detectar e codificar. O método de ajuste dos pesos da rede PMC leva a rede a convergir lentamente, ocasionando maior esforço computacional. Para combater este problema utiliza o algoritmo de Levenberg-Marquardt LM, que é o método gradiente de segunda ordem [2], baseado no método dos mínimos quadrados para modelos não-lineares. Metodologia O procedimento para obter os resultados consiste inicialmente em coletar e armazenar as vozes, em seguida ocorre uma transformação para o domínio da 3

frequência com a execução da FFT. Após a transformação é executado o toolbox de redes neurais do Matlab utilizando o método Backpropagation. Os parâmetros de backpropagation são ajustados através da configuração da rede. A configuração de melhor resultado foi a de três camadas constituídas de 12, 2 e 1 neurônios respectivamente. A função de ativação foi a tangente sigmoide e na redução do erro aplicou-se o algoritmo de Levenberg-Marquardt. Resultados e discussão Como o objetivo foi a identificação do gênero, utilizou-se, no treinamento, para diferenciar o gênero, o target com valor 1 e 0 para vozes masculinas e femininas respectivamente. Foram utilizadas 22 vozes (8 vozes para treinamento e 14 vozes, de gênero desconhecido pela rede neural, para testes). Ao tratar as vozes é gerada uma matriz de pontos que excede a capacidade de execução da Rede Neural, portanto fora realizado dois testes com 1.000 e 3.000 pontos iniciais referentes a cada voz. Nos treinamentos o erro quadrático foi determinado em 10-5, entretanto, os erros médios quadráticos obtidos foram inferiores ao especificado, ou seja, o desempenho da rede neural no processo de treinamento foi melhor que o determinado. A rede neural utilizando sinais de 1.000 pontos teve 63,64% de acerto, já o uso de sinais com 3.000 pontos fora aproximadamente 81,81%. Considerações finais Os resultados obtidos surpreenderam, uma vez que as amostras não passaram por filtros para a retirada de ruídos, sons indesejáveis, e não foi utilizada nenhuma técnica adicional de processamento de voz. Foi observado que o processo de treinamento requer tempo considerável. Porém, uma vez realizada esta fase, o 4

teste de uma amostra é rápido. Consideramos então que o reconhecimento do gênero após o treinamento da rede é rápido e o seu resultado é eficiente. Referências [1] R. P. Lippmann. An Introduction to Computing with Neural Nets, IEEE ASSP Magazine, Vol. 3. No. 4, 1987, pp 4-22. [2] I. N. da Silva. D. H. Spatti, R. A. Flauzino. Redes Neurais Artificiais para engenharia e ciências aplicadas, Artliber, 2010, 399 p. [3] L. Fausett. Fundamentals of Neural Networks Architectures, Algorithms, and Applications Prentice Hall International, NJ, 1994, 461 p. 5