Palavras-chave: Processamento Digital de Sinais. Reconhecimento de Vogais. Frequências Formantes.
|
|
- Maria Fernanda Borja Valverde
- 6 Há anos
- Visualizações:
Transcrição
1 RECONHECIMENTO DE VOGAIS ATRAVÉS DE TÉCNICAS DE PROCESSAMENTO DIGITAL DE SINAIS E APRENDIZAGEM DE MÁQUINA Leonardo Dalla Porta Paim 1 ; Leonardo Gomes Tavares 2 RESUMO Este projeto busca desenvolver um sistema que seja capaz de reconhecer vogais faladas. Para isso é preciso identificar um padrão entre elas para que o sistema possa comparar o que foi dito com os dados coletados e catalogados. Estes dados são adquiridos através de gravações de áudio de vários locutores com pronuncias das sete vogais da língua portuguesa. Depois são calculadas as frequências formantes de cada áudio, que são usadas como parâmetros de identificação. As formantes são obtidas através de um método matemático chamado LPC (Linear Predictive Coding), que utiliza a transformada de Fourier. Por mais que o timbre de voz de cada pessoa é diferente, isso não interfere consideravelmente nos valores das formantes. Os testes comprovaram que as frequências de cada locutor ficam próximas aos dos outros. O processo de classificação utiliza um método de lógica conhecido como KNN (K Nearest Neighbors), ou os K vizinhos mais próximos. O sistema analisa as frequências do som captado e calcula a distância entre todos os dados mais relevantes. Em seguida, ele separa os k vizinhos, ou dados, mais próximos, nesse caso 100. O maior registro de certa vogal entre esses 100 dados indica qual vogal foi falada pelo locutor. Os resultados revelaram informações valiosas ao selecionar o padrão de reconhecimento, bem como no método de análise para a classificação das vogais. Palavras-chave: Processamento Digital de Sinais. Reconhecimento de Vogais. Frequências Formantes. INTRODUÇÃO Nos últimos anos a indústria tem procurado desenvolver produtos que interajam de uma forma mais natural possível com o usuário. Tanto que é cada vez mais comum encontrar smartphones ou tablets com telas sensíveis ao toque e, mais recentemente, com comando de voz. Mas esse tipo de tecnologia ainda têm sido muito utilizada apenas para questões de luxo, não visando muito o conforto ou um auxílio para as pessoas. Por sua vez, essas novas tecnologias têm ajudado muitas pessoas com deficiências físicas ou motoras a também terem a oportunidade de usufruir desses 1 Aluno do 3º ano do curso de Engenharia Elétrica da Universidade Positivo. leonardopaim@up.com.br. Voluntário do Programa de Iniciação Científica (PIC) da UP. 2 Professor do curso de Engenharia Elétrica da Universidade Positivo. Mestre em Engenharia Elétrica e Informática Industrial. leonardo.tavares@up.com.br
2 aparelhos. Analisando dessa forma, os comandos de voz ou toque deixam de ser luxo para serem considerados ferramentas importantes. Já que isso tem funcionado muito bem com aparelhos eletrônicos, agora os pesquisadores têm buscado formas de incluir essas tecnologias no dia a dia das pessoas, que estejam diretamente ligadas a tarefas essenciais. Visto que o comando de voz é a forma mais natural de uma pessoa interagir com outra, houve um aumento considerável em pesquisas nessa área. Mas, realizar um reconhecimento de voz não é uma tarefa trivial, pois envolve captar um sinal analógico, processá-lo para um sinal digital, e então fazer as operações de reconhecimento. Em vista disso, este projeto, realizado durante um período aproximado de um ano, buscou formas de realizar esse processo de captação e reconhecimento das sete vogais da língua portuguesa. 1 REVISÃO BIBLIOGRÁFICA 1.1 CARACTERÍSTICAS DOS SINAIS O som das palavras, ao ser analisado de forma matemática, é encarado como um sinal. Basicamente um sinal é uma função que representa e vincula informações sobre a natureza de um fenômeno físico. Todos os sinais possuem características específicas que os distinguem uns dos outros. Uma dessas características é a frequência do sinal, cuja unidade é Hertz (Hz). A frequência é o inverso do período do sinal, ou seja, o tempo em que ele leva para repetir um ciclo de comportamento. A figura 1 é a representação gráfica de uma função seno, a mais simples e conhecidas dentre os sinais. Como pode ser observado, duas divisões antes da divisão indicada como 8 segundos (s) o sinal passa a se repetir, ou seja, inicia-se um novo ciclo. A duração desses ciclos que é o período do sinal. Outra característica importante é a amplitude, ou seja, a altura do sinal. No caso da figura 1, a amplitude dessa senoide é de valor 1.
3 FIGURA 1 GRÁFICO DE UMA FUNÇÃO SENO FONTE: NIEDU (2013) 1.2 MÉTODOS DE ANÁLISE DO SOM Como o som produz um sinal analógico, há a necessidade de transformar esse sinal analógico para um sinal digital, pois somente nessa forma ele pode ser analisado. Um dos passos dessa transformação é realizar uma operação matemática no sinal conhecida como transformada de Fourier. Ela foi criada por um matemático francês chamado Jean-Baptiste Joseph Fourier que descobriu que qualquer sinal, não importa seu formato ou frequência, pode ser representado por uma soma de senos e cossenos de diferentes frequências. Dentre esse conjunto de senoides é possível identificar a frequência fundamental do sinal, que é a menor frequência dentre todas as senoides calculadas. Assim, ao receber o sinal de áudio, o processador realiza a transformada de Fourier nele, pois é muito mais fácil trabalhar com funções senoidais do que com o sinal original propriamente dito Reconhecimento de Voz
4 O som e a percepção dele pelo ser humano é algo que intriga muitos cientistas. Ainda não se sabe ao certo como o nosso cérebro consegue traduzir a vibração dos nossos ouvidos produzidos pelo som para uma forma em que entendemos o que significa esse barulho. Nos últimos anos muitos pesquisadores tem tentado desenvolver sistemas automatizados que sejam capazes de reconhecer o que uma pessoa diz. Recentemente houve grandes avanços significativos nessa área. Mas um dos maiores impedimentos ainda é desenvolver equipamentos que sejam capazes de fazerem esse reconhecimento facilmente, na verdade é um dos problemas mais complexos em que cientistas e engenheiros enfrentam (Bermúdez, et al). Criar um sistema que seja capaz de identificar um comando de mais de uma pessoa é um grande desafio, pois é necessário analisar a amplitude e a frequência geral de determinado comando, além de desenvolver um algoritmo que seja capaz de comparar as características de cada fonema. Como foi discutido anteriormente, um sinal é o resultado da soma de várias senoides de frequências diferentes. Assim o sinal da voz possui várias frequências além da frequência fundamental. Essas outras são chamadas de frequências formantes. Basicamente elas indicam em que frequências foram produzidos picos de energia. Na da figura 2 está sendo apresentado uma representação do sinal de uma vogal e as frequências formantes desse sinal. Como a posição dos formantes varia pouco de um locutor para outro, são eles que diferenciam uma vogal ou outras letras umas das outras. Existem vários métodos matemáticos para a identificação desses valores. Entre os mais conhecidos estão à análise linear e a logarítmica. O método logarítmico é muito eficaz e confiável por ser capaz de reconhecer uma largura de banda maior. Há fortes indícios que o sistema de percepção humano de som utiliza uma técnica similar a essa. A análise linear, no entanto, é mais simples e fácil de ser aplicada. Por mais que não seja a mais precisa, ela tem bons resultados. Em um estudo realizado em 1993, James Hilenbrand e Robert T. Gayvert, ao analisarem os mais comuns métodos de análise de frequência, perceberam que quando se trata de vogais a análise logarítmica não traz grandes vantagens sobre a linear. Neste mesmo estudo foi verificado que a forma mais eficaz de realizar o reconhecimento era por analisar as posições das frequências de forma separada,
5 em vez de analisar a distância entre os formantes, que era um dos métodos mais utilizados. FIGURA 2 REPRESENTAÇÃO DO SINAL SONORO COM SUAS RESPECTIVAS FORMANTES FONTE: O AUTOR (2013). As frequências formantes da figura 2 foram calculadas através de um método matemático chamado Codificação por Predição Linear (LPC). Ele leva em conta que a produção da voz é feita de forma linear, e trata os sinais dessa forma. Basicamente ele recebe o sinal original e estima os valores através de uma combinação linear de n amostras anteriores desse sinal. (COSTA, 2008, p. 77) Dentre todos os outros métodos matemáticos, a LPC é o mais confiável e eficaz para ser aplicado nesse tipo de análise.
6 1.3 MÉTODO DO VIZINHO MAIS PRÓXIMO Existem várias lógicas de programação para realizar a classificação de grupos distintos tanto em níveis fáceis de programação, como árvores de decisão, até métodos complexos como a de redes neurais, que tentam simular o funcionamento do cérebro humano. Entre elas há um método com uma confiabilidade similar a das redes neurais com uma facilidade da árvores. Este é o método do vizinho mais próximo. A classificação de uma nova informação é realizada considerando as classificações dos dados catalogados mais próximos desse sinal A EH E I OH O U A ser descoberto GRÁFICO 1 ILUSTRAÇÃO VIZINHO MAIS PRÓXIMO FONTE: O autor (2013) O gráfico 1 ilustra como é feita essa análise. Ele contém alguns 15 dos quase 380 dados obtidos. Supondo que a vogal que foi captada pelo sistema fique na posição do ponto bordô no gráfico. O algoritmo irá calcular a distância de todos os outros pontos com este dado que está sendo analisado. Em seguida ele analisa os k vizinhos mais próximos dessa ponto, onde k é um número inteiro qualquer. Depois é verificado quais são os grupos desses vizinhos. Supondo que fosse escolhido analisar os cinco vizinhos mais próximo. Ao
7 calcular as distâncias haveria como cinco vizinhos mais próximos quatro dados da vogal /o/ e um da vogal /u/. Como a vogal /o/ tem mais vizinhos próximos da que está sendo analisada, chega-se à conclusão de que a vogal que foi falada e captada pelo sistema foi /o/ O U A ser descoberto GRÁFICO 2 MÉTODO DO CÁLCULO DA DISTÂNCIA FONTE: O autor (2013) A forma com que são calculadas as distâncias entre a vogal falada com os dados obtidos é realizado através da distância euclidiana. A distância entre eles é a hipotenusa de um triângulo que pode ser formado entre os pontos, como pode ser observado no gráfico 2. De modo geral, a equação que encontra a distância entre as formantes é dada pela equação 1. d= (f1-f1 ) 2 +(f2-f2 ) 2 (1) Onde: d a distância entre os pontos, f1 valor da formante 1 da vogal a ser analisada,
8 f1 valor da formante 1 de um dos pontos do banco de dados, f2 - valor da formante 2 da vogal a ser analisada, f2 valor da formante 2 de um dos pontos do banco de dados. Quando há poucas informações sobre cada grupo pode não ser um método muito seguro. Mas, quando há um número considerável de dados, o método do k vizinho mais próximo (knn) é um excelente método de classificação. 2 PROCEDIMENTOS METODOLÓGICOS Para iniciar os testes foram gravadas as sete vogais da língua portuguesa (/a/, /eh/, /e/, /i/, /oh/, /o/ e /u/) para selecionar os padrões e métodos de classificação mais adequados. Dezoito voluntários homens pronunciaram três vezes as vogais. Os equipamentos utilizados para a captação e gravação do áudio foram: a) Mac Book Pro; b) Interface de gravação EDIROL F-101 com interface firewire; c) Microfone SHURE SM-57; d) Software AUDACITY Os dados foram captados numa frequência de amostragem de Hz numa resolução de gravação de 24 bits. Depois cada vogal foi salva em arquivos separados de áudio do tipo.wav. Após coletados os dados, eles foram analisados num algoritmo desenvolvido no software MATLAB 6.5 pela UCL Department of Phonetics and Linguistics. O algoritmo abre o arquivo de áudio e o analisa usando o método LPC, apresentando separadamente as posições das formantes. Depois de analisado, os dados são coletados, separados e catalogados de acordo com a vogal que representam. Os dados foram salvos num arquivo.txt. As sete primeiras linhas são as médias das formantes de cada vogal seguida do número que representa a vogal. A escolha do método de classificação ocorreu com o auxílio de um software chamado Weka produzido pela universidade de Waikato na Nova Zelândia. O Weka faz a mineração dos dados, ou seja, ele analisa o comportamento de vários métodos de classificação, entre eles as árvores de decisão, redes neurais e outros. O Weka possui os algoritmos de cada método e analisa o desempenho deles para o banco
9 de dados fornecido. O apêndice B apresenta o arquivo que foi utilizado para essa análise. Com base nesses dados foi desenvolvido o método do KNN para realizar o reconhecimento das vogais. O algoritmo recebe o sinal da vogal e extrai as suas formantes. Em seguida ele abre o banco de dados e calcula a distância de cada dado com a vogal captada e coloca os dados em ordem crescente da menor para a maior distância. Depois são analisados os grupos dos 100 dados (ou vizinhos) mais próximos. A análise é concluída analisando o grupo que possui mais dados próximos, que indica qual vogal foi falada. 3 RESULTADOS OBTIDOS No apêndice A é apresentada uma tabela com todos os dados coletados das vogais estudadas. O gráfico 3 é composto de todos os valores que foram obtidos. Nesse gráfico os pontos foram definidos na relação que há entre a primeira e segunda formante. No total, cada vogal tem 54 dados das formantes 1 e 2. Como pode ser observado no gráfico, as vogais possuem posições distintas, apesar de próximas, umas das outras. Isso comprova que as frequências formantes podem ser utilizadas para realizar a classificação de um sinal. Dentre todas as vogais, pode-se observar que a vogal /oh/ é a mais distinta das outras, pois suas posições são tão próximas que parecem haver poucos dados. No gráfico 4 é a representação das médias dos valores de cada vogal. Ao comparar ambos os gráficos nota-se mais claramente a distinção que há entre cada vogal com relação as suas frequências formantes. Os teste realizados no Weka foram conclusivos e surpreendentes. Utilizando um método de árvore de decisão, chamado no software como J48, automaticamente apenas as duas primeiras formantes das cinco foram analisadas. Esse método apresentou uma precisão de 82,857% de acerto. Outro método analisado foi o Multilayer Perceptron, que simula uma rede neural. Ao analisar as cinco formantes, o método teve uma precisão de 82,875%, similar ao J48. No entanto, ao utilizar apenas as três primeiras formantes a precisão aumentou para 94,285%.
10 F2 (Hz) Por fim, foi analisado o método do vizinho mais próximo, ou KNN. Esse método obteve uma precisão de 68,57% considerando as cinco formantes. Mas, ao analisar com as duas ou as três primeiras frequências formantes a precisão melhorou muito, chegando a 97,14% A EH Ê 1200 I OH 700 Ô F1 (Hz) U GRÁFICO 3 POSIÇÃO DAS FORMANTES (F2 X F1) DE TODAS AS VOGAIS CAPTURADAS FONTE: O autor (2013) A EH E I OH O U GRÁFICO 4 MÉDIAS DAS VOGAIS ANALISADAS (F2 X F1) FONTE: O autor (2013)
11 O sistema desenvolvido para realizar o reconhecimento é apresentado na figura 3 no apêndice C. Após clicar no botão Iniciar Teste uma pessoa deve falar no microfone uma das vogais. Em poucos segundos o sistema faz todos os cálculos e indica qual vogal foi falada e apresenta um gráfico com a posição das formantes. 4 CONCLUSÃO Neste estudo foi possível comprovar que as frequências formantes podem ser utilizadas como padrões para identificação de vogais com precisão. O mais interessante é que foi constatado que um número muito grande de informações confunde o sistema. De início foi decidido que seriam analisadas as cinco primeiras frequências formantes do sinal. Mas, os testes mostraram que tantas informações não trazem um resultado mais preciso, como era pensado anteriormente. Assim, pode-se dizer que ao estabelecer padrões para reconhecer vogais apenas as duas primeiras formantes são necessárias e relevantes, as demais não aumentam a precisão. De modo similar, os testes com o método do vizinho mais próximo foram satisfatórios. O algoritmo desenvolvido com esse método pôde identificar e classificar corretamente as vogais em quase todos os testes. A precisão do sistema desenvolvido foi similar aos valores obtidos nos testes com o Weka. De forma geral o projeto foi um sucesso. O sistema foi desenvolvido e está funcionando corretamente. Mas há ainda algumas melhorias que precisam ser implantadas. Há somente os dados para vozes masculinas. Como sugestão de trabalhos futuros é sugerida a expansão para vozes femininas para deixar o sistema mais completo. Além disso, há margens para melhora na implementação do KNN para deixá-lo mais preciso. E por fim, implementar uma análise em tempo real, ou seja, a medida que uma pessoa falar o sistema indique as vogais que ela disse, sem que haja a necessidade de pressionar um botão para iniciar o teste.
12 REFERÊNCIAS BERMÚDEZ, Jesús B.; SANCHO, Jesús B.; VILDA, Pedro G.. Reconocimiento de Voz y Fonética Acústica. Madrid: RA-MA, COSTA, Silvana L. N. C. Análise Acústica, Baseada no Modelo Linear de Produção da Fala, para Discriminação de Vozes Patológicas. 161 f. Tese (Doutorado em Engenharia Elétrica), Universidade Federal de Campina Grande, Campina Grande, HILLENBRAND, James; GAYVERT; Robert T. Vowel Classification Based on Fundamental Frequency and Formant Frequencies. Disponível: < Hillenbr0AndFormants.pdf> Acessado em: 20/02/2013. NIEDU, Guilherme. Biometria Impressão Vocal. Disponível em: < UCL Department of Phonetics and Linguistics. Lecture 10: Speech Signal Analysis. Disponível em: < Acessado em: 20/02/2013. VALENTIM, Amanda F.; CORTES, Marcela G.; GAMA, Ana Cristina C. Análise espectrográfica da voz: efeito do treinamento visual na confiabilidade da avaliação. Revista da Sociedade Brasileira de Fonoaudiologia, WEKA Waikato Environment for Knowledge Analysis. Weka. Disponível em: < Acesso em: mai
13 APÊNDICE A DADOS OBTIDOS DAS VOGAIS ANALISADAS A tabela a seguir apresenta todos os valores das formantes 1 e 2 obtidas das vogais que foram captadas nesse estudo. TABELA 1 DADOS OBTIDOS NESSE ESTUDO (continua) F1 F2 F3 DESCRIÇÃO 645,3 1229, ,77 A 570, , ,49 A 639, , ,18 A 700, , ,02 A 752, , ,09 A 681, , ,31 A 651, , ,99 A 672, , ,12 A 658, , ,02 A 618, , ,63 A 653, , ,72 A 645, ,4 2538,37 A 718, , ,6 A 684, , ,43 A 838, , ,05 A 840, ,4 2437,31 A 834, , ,95 A 715, ,2 2608,79 A 700, , ,31 A 693, , ,83 A 722, , ,21 A 725, , ,15 A 755, , ,23 A 426, , ,7 A 730, , ,3 A 712, , ,5 A 793, , ,6 A 800,2 1285, ,65 A 816, , ,98 A 698, , ,84 A 747, , ,02 A 764, ,5 2504,2 A 758, , ,74 A 776, , ,71 A 831, , ,39 A 832, , ,46 A 792,3 1440, ,93 A 843, , ,17 A
14 TABELA 1 DADOS OBTIDOS NESSE ESTUDO (continuação) F1 F2 F3 DESCRIÇÃO 695,7 1223, ,17 A 686, , ,07 A 685, , ,9 A 593, , ,2 A 605, , ,3 A 592, , ,86 A 698, ,1 2374,24 A 719, , ,22 A 713,6 1343, ,81 A 603, , ,31 A 634, , ,82 A 676, , ,67 A , ,76 A 740, , ,05 A 726, , ,08 A 448, , ,17 EH 466,9 1868, ,46 EH 459, , ,22 EH 462, , ,64 EH 455, , ,08 EH 476, , ,78 EH 539, , ,94 EH 535, , ,6 EH 530, ,2 2514,99 EH 520, , ,41 EH 525,8 1829, ,99 EH 545, , ,56 EH 514, , ,35 EH 494, , ,07 EH 531, , ,07 EH 535, , ,87 EH 548,9 2054, ,3 EH 556, , ,13 EH 473, , ,68 EH 473, , ,49 EH 464, , ,14 EH 450, , ,06 EH 442, , ,18 EH 448, , ,38 EH 466, , ,7 EH 468, , ,01 EH 444, , ,7 EH 475, , ,52 EH
15 TABELA 1 DADOS OBTIDOS NESSE ESTUDO (continuação) F1 F2 F3 DESCRIÇÃO 479,5 1956, ,87 EH 510, , ,52 EH 512, , ,3 EH 512, , ,66 EH 462,2 1929,7 2755,42 EH 553, , ,12 EH 542, , ,98 EH 536, , ,68 EH 521, , ,23 EH 518, , ,44 EH 495, ,2 EH 466, , ,42 EH 461, , ,59 EH 468, , ,88 EH 520, , ,75 EH 500, , ,36 EH 432, , ,39 EH 524,1 1766, ,37 EH 541, , ,2 EH 518, , ,37 EH 412, , ,35 EH 462, , ,25 EH 465, , ,56 EH 454,1 1947, ,94 EH 453, , ,16 EH 453, , ,42 EH 296, , ,71 E 305,3 2081, E 292, ,7 2736,63 E 293, , ,68 E 302,4 2015, ,22 E 296, , ,94 E 362, , ,02 E , ,02 E 348, , ,5 E 334, , ,7 E 333, , ,5 E 330,8 2039, ,6 E 330, , ,14 E 314, ,2 2709,26 E 316, , ,77 E 330, , ,66 E 313, , ,26 E
16 TABELA 1 DADOS OBTIDOS NESSE ESTUDO (continuação) F1 F2 F3 DESCRIÇÃO 310, , ,64 E 283, , ,15 E 301,3 2081, ,56 E 317, , ,08 E 325, , ,3 E 331, , ,52 E 323, , ,96 E 295, , ,22 E 301, , ,76 E 304, , ,12 E 340, , ,66 E 327, , ,83 E 320, , ,08 E 366, , ,88 E 379, , ,97 E 334, , ,89 E 324, , ,98 E 295, , ,06 E 326, , ,29 E 349, , ,57 E 329, , ,24 E 304, , ,73 E 311, , ,85 E 307, , ,91 E 351, , ,86 E 343, , ,39 E 336, , ,39 E 326, , ,15 E 338, , ,91 E 324, , ,69 E 302, , ,69 E 314, , ,79 E 317, , ,71 E 311, , ,29 E 311, , ,43 E 326, , ,56 E 232, , ,37 I 216, , ,24 I 230, , ,51 I 236, , ,91 I 229, , ,11 I 227, , ,66 I 293, , ,9 I
17 TABELA 1 DADOS OBTIDOS NESSE ESTUDO (continuação) F1 F2 F3 DESCRIÇÃO 283, , ,88 I 288, , ,63 I 242, , ,25 I 246, , ,26 I 258, , ,68 I 259, , ,42 I 252, , ,78 I 246, , ,18 I 247, , ,81 I 246, , ,17 I 247, , ,92 I 219, , ,44 I 218, ,1 2902,97 I 197, , I 187, , ,42 I 189, , ,53 I 218, , ,05 I 225, , ,15 I 224, , ,57 I 228, , ,97 I 237, , ,34 I 240, , ,7 I 255, ,3 2947,53 I 256, , ,3 I 241, , ,95 I 243, , ,24 I 235, , ,12 I 233, , ,81 I 236,4 1865, ,63 I 242, , ,45 I 249,3 1464, ,88 I 252, , ,47 I 250, , ,4 I 257, , ,36 I 263, ,8 3056,5 I 243, , ,76 I 238, , ,09 I 242, , ,78 I 247, , ,66 I 254,5 2201, ,85 I 245, ,5 2968,27 I 243,5 2070, ,79 I 242, , ,63 I
18 TABELA 1 DADOS OBTIDOS NESSE ESTUDO (continuação) F1 F2 F3 DESCRIÇÃO 253, , ,5 I 248, , ,34 I 257, , ,82 I 229, , ,66 I 487,48 833, ,57 OH 473,05 808, ,63 OH 521,51 873, ,07 OH 550,12 888, ,8 OH 535,6 925, ,36 OH 521,93 919, ,27 OH 576, ,4 2720,29 OH 557,41 958, ,07 OH 577,02 965,4 2782,54 OH 544,51 929, ,36 OH 554,09 940, ,97 OH 532,97 943, ,49 OH 529,1 796, ,35 OH , ,93 OH 546,6 847, ,48 OH 531,14 943,9 2512,81 OH 555,45 986, ,97 OH 591, , ,6 OH 489,76 747, ,9 OH 466,07 807, ,61 OH 469,52 842, ,75 OH 565,97 869, ,14 OH 580,14 843, ,66 OH 549,34 881, ,63 OH 462,55 790, ,78 OH 447,35 781, ,84 OH 491,72 836, ,75 OH 518,17 873, ,04 OH 534,22 854, ,23 OH 512,36 865, ,56 OH 548,49 894,4 2712,39 OH 563,96 888, ,16 OH 581,81 946, ,14 OH 537,27 907, ,71 OH 554,97 882, ,36 OH 537,25 856, ,48 OH 599,74 978, ,05 OH 574,26 974, ,76 OH 549,52 951, ,53 OH
19 TABELA 1 DADOS OBTIDOS NESSE ESTUDO (continuação) F1 F2 F3 DESCRIÇÃO 517,5 833,4 2416,29 OH 495,83 823, ,48 OH 500,82 849, ,18 OH 526,49 970, ,33 OH 513,23 972, ,64 OH 498,28 929, ,68 OH 530,64 935, ,99 OH 567,14 991, ,61 OH 532,07 948,3 2479,65 OH 541,22 921, ,04 OH 517,86 916, ,76 OH 511,48 930, ,12 OH 491,25 835, ,12 OH 489,05 805, ,03 OH 479,03 804, ,79 OH 282,22 653, ,58 O 284,53 690, ,99 O 288,47 637, ,6 O 352,64 801, ,08 O 322,96 745, ,28 O 324,29 668, ,99 O 366,48 801, ,48 O 374,02 792, ,18 O 395,51 815, ,87 O 341,23 772, ,35 O 348,47 780, O 336,44 756, ,59 O 328,11 682, ,1 O 323,64 691, ,44 O 327,28 676, ,05 O 328,89 821, ,21 O 338,76 818, ,3 O 355,19 813, ,88 O 339,69 741, ,21 O 293,98 639, ,45 O 267,97 586, ,28 O 301,06 644, ,48 O 286,23 655, ,17 O 271,76 615, ,89 O 311,71 641, ,86 O 245,69 344, ,6 O 142,68 348, ,55 O 304,39 635, ,79 O
20 TABELA 1 DADOS OBTIDOS NESSE ESTUDO (continuação) F1 F2 F3 DESCRIÇÃO 347,14 672, ,01 O 348,91 640, ,26 O 390,61 780, ,13 O 398,7 767, ,42 O 381,48 764, ,33 O 288,01 694, ,36 O 253,43 663, ,42 O 271,1 720, ,8 O 288,01 694, ,36 O 349,04 874,2 2320,26 O 363,18 854, ,82 O 379,26 864, ,38 O 334,15 755, ,75 O 330,8 780, ,14 O 360,48 718, ,13 O 407,12 789, ,52 O 409,32 795, ,42 O 374,76 746, ,19 O 349,12 755, ,89 O 377,75 785, ,36 O 354,56 749, ,52 O 343,29 737, ,11 O 327, ,31 O 297,2 708, ,13 O 336,87 711, ,64 O 340,9 712, ,16 O 316,23 705, ,48 O 218,9 706, ,35 U 201,48 656, ,97 U 202,5 673, ,01 U 230,81 641, ,84 U 229,81 568, ,42 U 224,27 633, ,09 U 253,98 719, ,01 U 264,27 752, ,71 U 260,58 707, ,13 U 211,04 494, ,17 U 234,73 702, ,41 U 253,36 651,8 2133,95 U 225,46 524, ,12 U 240,7 580, ,77 U 240,03 563, ,48 U 205,65 616, ,79 U
21 TABELA 1 DADOS OBTIDOS NESSE ESTUDO (conclusão) F1 F2 F3 DESCRIÇÃO 209,71 659,2 2285,38 U 204,58 700, ,16 U 221,37 606, ,77 U 233,84 689, ,03 U 214,72 542, ,87 U 157,4 446, ,8 U 167,74 497,3 2198,32 U 143,84 592, ,5 U 232,28 522, ,91 U 250,27 666, ,41 U 232,28 522, ,91 U 251,37 657, ,15 U 249,7 618, ,78 U 211,91 622,6 1374,19 U 251,34 744, ,12 U 230,51 655, ,91 U 225,13 597, ,6 U 208,15 602, ,71 U 221,77 655, ,63 U 208,14 632, ,54 U 214,53 682, ,92 U 143,04 600, ,83 U 248,98 640, ,45 U 279,12 787, ,53 U 226,26 645, ,2 U 221,14 494, ,25 U 221,12 516,7 2277,32 U 234,43 627, ,6 U 270,71 666, ,25 U 231, ,66 U 222,17 605, ,35 U 273,05 669, ,89 U , ,87 U 251,76 624, ,62 U 211,62 687, ,4 U 233,32 622, ,14 U 210,71 550, ,21 U FONTE: O autor (2013)
22 APÊNDICE B BASE DE DADOS WEKA A seguir é apresentado o banco de dados que foi utilizado. Conforme já mencionado, as sete primeiras linhas se referem as médias de cada vogal, sendo seguido de todos os dados. O banco foi elaborado da seguinte forma: as duas primeiras colunas são os valores das formantes 1 e 2, respectivamente. A última coluna é a classificação do dado de cada linha, ou seja, a indicação da vogal. Estabeleceu-se como padrão que as vogais fossem representadas pelos números de zero a seis, onde: /a/ é representado pelo 0, /eh/ sendo 1, /ê/ sendo 2, /i/ sendo 3, /oh/ sendo 4, /o/ sendo 5 e /u/ sendo 6. % Título: Listas das formantes das sete vogais % % Fontes: % (a) Leonardo Paim, Leonardo Tavares % (b) Data: fevereiro, f1 f2 f3 f4 f5 cluster 685.1,1289.8,2483.1,3492.2,3859.1, ,1284.1,2312.2,3543.6,3814.1, ,1317.2,2295.5,3459.9,4730.2,0 724,1275.5,2550.5,3453.6,3860.5, ,1345.6,2802.2,3638.2,4566.7, ,1869,2485,3543.3,4085.2,1 516,1810.7,2548.3,3296.2,3725.1, ,1839.4,2435.9,3536.4,4414,1 467,1828.3,2553.6,3297,3727.8, ,1909.2,2692.5,3522.4,3982, ,2034.8,2644.4,3425.4,4009.6, ,1997.9,2699.5,3256.6,3832.4,2 305,2048.2,2772.3,3671.2,4592.8, ,1931.5,2783.7,3266.2,3789.6, ,2131.5,2873.3,3376.6,3936, ,2090.4,2915.8,3378.3,3895.7, ,2078.3,3074.9,3528.8,3842.1, ,2143.9,3120.6,3737.3,4663.6, ,1981.5,3057,3363.8,4140.7, ,2293.1,3177.5,3626,4223.7, ,809.7,2440,3274.2,3919.5,4
23 538.7,840.2,2547.9,3861.7,3910.2, ,955.9,2398.6,3189.2,4130, ,840.6,2288.5,3331.3,3644.7, ,900.9,2708.7,3062.7,3609.7, ,580.6,2198.3,3191.9,3784.4, ,672.1,2626.5,3342.1,3854.6, ,760.5,2470.9,3280.3,4252.5, ,791.5,2116.7,3159.9,3634.8, ,738.4,2292.4,3113.8,3845.5, ,602.2,2194.7,3232.6,3781.7, ,541.5,2300.1,3178,3524.6, ,747.4,2363.8,3436.4,4294, ,673.5,1868,3097.6,3158, ,529.5,2162.5,3007.8,3851,6
24 APÊNDICE C TELA DO PROGRAMA DESENVOLVIDO FIGURA 3 CAPTURA DA TELA DO PROGRAMA DESENVOLVIDO FONTE: O autor (2013)
Tecnologias Computacionais Aplicadas À Análise De Sinais De Voz
Tecnologias Computacionais Aplicadas À Análise De Sinais De Voz Charles Alexandre Blumm, José Luis Gómez Cipriano Instituto de Ciências Exatas e Tecnológicas (ICET) Centro Universitário Feevale Campus
Leia maisProcessamento de Som com Escala de Mel para Reconhecimento de Voz
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO DEPARTAMENTO DE INFORMÁTICA Processamento de Som com Escala de Mel para Reconhecimento de Voz INF2608 FUNDAMENTOS DE COMPUTAÇÃO GRÁFICA Professor: Marcelo
Leia maisTransformada Discreta de Fourier
Processamento Digital de Sinais Transformada Discreta de Fourier Prof. Dr. Carlos Alberto Ynoguti Jean Baptiste Joseph Fourier Nascimento: 21 de março de 1768 em Auxerre, Bourgogne, França Morte: 16 de
Leia maisCaracterísticas dos sons das vogais do português falado no Brasil
Características dos sons das vogais do português falado no Brasil Benjamin Pereira dos Santos Siqueira benjamin_bps@hotmail.com Joyce Alvarenga de Faria joyce_alvar@hotmail.com Priscila Lemos Kallás Prof.
Leia maisMÁSCARAS DE ÁUDIO PARA EMULAÇÃO DE VOZ
MÁSCARAS DE ÁUDIO PARA EMULAÇÃO DE VOZ Acadêmico: Marcos Rodrigo da Silva Orientador: Paulo César Rodacki Gomes Sumário 2 Introdução Objetivo Fundamentação teórica Conceitos básicos Contexto atual do tema
Leia maisDETERMINAÇÃO DO GÊNERO DO LOCUTOR USANDO A TRANSFORMADA RÁPIDA DE FOURIER
Revista Ciências Exatas ISSN: 1516-893 Vol. 1 Nº. Ano 015 Natanael M. Gomes Universidade de Taubaté Marcio Abud Marcelino Universidade Estadual Paulista Universidade de Taubaté Francisco José Grandinetti
Leia maisTransformada Discreta de Fourier
Processamento Digital de Sinais Transformada Discreta de Fourier Prof. Dr. Carlos Alberto Ynoguti Jean Baptiste Joseph Fourier Nascimento: 21 de março de 1768 em Auxerre, Bourgogne, França Morte: 16 de
Leia maisREDES DE COMPUTADORES. Comunicação de Dados
Sinais Uma das funções mais importantes da camada física é converter informação em sinais eletromagnéticos para poder enviá-los num meio de transmissão. Sejam estas informações uma sequência de 1s e 0s
Leia maisDiferenças entre o Português Europeu e o Português Brasileiro: Um Estudo Preliminar sobre a Pronúncia no Canto Lírico
Diferenças entre o Português Europeu e o Português Brasileiro: Um Estudo Preliminar sobre a Pronúncia no Canto Lírico Marilda Costa, Luis M.T. Jesus, António Salgado, Moacyr Costa Filho UNIVERSIDADE DE
Leia maisUma proposta para o ensino dos modos normais das cordas vibrante
UNIVERSIDADE FEDERAL DO RIO DE JANEIRO Instituto de Física Programa de Pós-Graduação em Ensino de Física Mestrado Profissional em Ensino de Física Uma proposta para o ensino dos modos normais das cordas
Leia maisSobre o Livro. Todo o conteúdo foi preparado com muito carinho e com um desejo enorme de poder contribuir na melhora de seus trabalhos de gravação.
Sobre o Livro Este livro foi escrito com o objetivo de mostrar, de forma clara e objetiva, as etapas da produção de áudio. É destinado àqueles que querem executar trabalhos neste ramo ou àqueles que até
Leia maisINF 1771 Inteligência Artificial
INF 1771 Inteligência Artificial Aula 13 K-Nearest Neighbor (KNN) 2016.1 Prof. Augusto Baffa Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor
Leia maisREDES II. e Heterogêneas. Prof. Marcos Argachoy
Convergentes e Heterogêneas Prof. Marcos Argachoy REDES CONVERGENTES Cont./ Convergência Refere-se a redução para uma única conexão de rede, fornecendo todos os serviços, com conseqüente economia de escala.
Leia maisMineração de Dados em Biologia Molecular
Mineração de Dados em Biologia Molecular WEKA Tópicos Introdução Simuladores de MD Principais módulos André C. P. L. F. de Carvalho Monitor: Váléria Carvalho André Ponce de Leon de Carvalho 2 Usando MD
Leia maisTRANSMISSÃO DE DADOS
TRANSMISSÃO DE DADOS Aula 2: Dados e sinais Notas de aula do livro: FOROUZAN, B. A., Comunicação de Dados e Redes de Computadores, MCGraw Hill, 4ª edição Prof. Ulisses Cotta Cavalca
Leia maisPONTIFÍCIA UNIVERSIDADE CATÓLICA DO PARANÁ ENGENHARIA DE COMPUTAÇÃO. Smart Relay SISTEMA DE AUTOMAÇÃO POR COMANDO DE VOZ
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO PARANÁ ENGENHARIA DE COMPUTAÇÃO Smart Relay SISTEMA DE AUTOMAÇÃO POR COMANDO DE VOZ CURITIBA 2013 PONTIFÍCIA UNIVERSIDADE CATÓLICA DO PARANÁ ENGENHARIA DE COMPUTAÇÃO
Leia maisIdentificação de Pontos Perceptualmente Importantes (PIP) em séries temporais de tópicos extraídos de dados textuais
Universidade de São Paulo Biblioteca Digital da Produção Intelectual - BDPI Departamento de Ciências de Computação - ICMC/SCC Comunicações em Eventos - ICMC/SCC 2015 Identificação de Pontos Perceptualmente
Leia maisAPRENDIZAGEM INDUSTRIAL
CETEL- Centro Tecnológico de Eletroeletrônica César Rodrigues APRENDIZAGEM INDUSTRIAL Disciplina: Fundamentos de Telecomunicações SISTEMAS ELÉTRICOS ESPECTROS DE SINAIS Forma de Onda Forma de onda é a
Leia maisAVALIAÇÃO ESPECTRAL DE FRICATIVAS ALVEOLARES PRODUZIDAS POR SUJEITO COM DOWN
Página 235 de 511 AVALIAÇÃO ESPECTRAL DE FRICATIVAS ALVEOLARES PRODUZIDAS POR SUJEITO COM DOWN Carolina Lacôrte Gruba Marian Oliveira (Orientadora) Vera Pacheco Audinéia Ferreira da Silva RESUMO As fricativas
Leia maisImplementação de um protópito de uma interface para um controlador de cadeira. de rodas guiado pela direção do olhar.
Implementação de um protópito de uma interface para um controlador de cadeiras de rodas guiado pela direção do olhar. Vinícius Assis Saueia da Silva 18 de abril de 2005 1 Título Implementação de um protópito
Leia maisVisão Geral e Conceitos Básicos
Instituto Federal de Educação, Ciência e Tecnologia da Paraíba Programa de Pós-Graduação em Engenharia Elétrica Universidade Federal de Campina Grande Unidade Acadêmica de Sistemas e Computação Processamento
Leia maisAPLICAÇÃO DE ALGORITMO DE APRENDIZAGEM DE MÁQUINA NÃO-SUPERVISIONADO PARA CLASSIFICAÇÃO DE USUÁRIOS NA REDE SOCIAL ACADÊMICA SCIENTIA.
APLICAÇÃO DE ALGORITMO DE APRENDIZAGEM DE MÁQUINA NÃO-SUPERVISIONADO PARA CLASSIFICAÇÃO DE USUÁRIOS NA REDE SOCIAL ACADÊMICA SCIENTIA.NET Heloína Alves Arnaldo (bolsista do PIBIC/UFPI), Vinicius Ponte
Leia maisVOGAL [A] PRETÔNICA X TÔNICA: O PAPEL DA FREQUÊNCIA FUNDAMENTAL E DA INTENSIDADE 86
Página 497 de 658 VOGAL [A] PRETÔNICA X TÔNICA: O PAPEL DA FREQUÊNCIA FUNDAMENTAL E DA INTENSIDADE 86 Jaciara Mota Silva ** Taise Motinho Silva Santos *** Marian Oliveira **** Vera Pacheco ***** RESUMO:
Leia maisPADRÃO FORMÂNTICA DA VOGAL [A] REALIZADA POR CONQUISTENSES: UM ESTUDO COMPARATIVO
Página 47 de 315 PADRÃO FORMÂNTICA DA VOGAL [A] REALIZADA POR CONQUISTENSES: UM ESTUDO COMPARATIVO Tássia da Silva Coelho 13 (UESB) Vera Pacheco 14 (UESB) RESUMO Este trabalho visou a avaliar a configuração
Leia maisAprendizado de Máquina (Machine Learning)
Ciência da Computação Aprendizado de Máquina (Machine Learning) Aula 07 Classificação com o algoritmo knn Max Pereira Classificação com o algoritmo (knn) Um algoritmo supervisionado usado para classificar
Leia maisProf. Responsáveis Wagner Santos C. de Jesus
Disciplina Processamento de Sinais Curso Análise e Desenvolvimento de Sistemas Noção da Análise de Fourier e Análise Espectrográfica de sinais, Estudo de Caso do Processamento Sinais Aplicado a Imagens
Leia maisRECONHECIMENTO DE GÊNERO ATRAVÉS DA VOZ
RECONHECIMENTO DE GÊNERO ATRAVÉS DA VOZ Marcela Ribeiro Carvalho marcela@enecar.com.br IFG/Câmpus Goiânia Hipólito Barbosa Machado Filho hipolito.barbosa@ifg.edu.br IFG/Câmpus Goiânia Programa Institucional
Leia maisTranformada de Fourier. Guillermo Cámara-Chávez
Tranformada de Fourier Guillermo Cámara-Chávez O que é uma série de Fourier Todos conhecemos as funções trigonométricas: seno, cosseno, tangente, etc. O que é uma série de Fourier Essa função é periódica,
Leia maisMétodos Matemáticos e Computacionais em Música
Métodos Matemáticos e Computacionais em Música Luiz Velho, Paulo Cesar Carvalho, Sergio Krakowski, Marcelo Cicconet IMPA Processamento de Sinais Sonoros Luiz Velho Som - Sinal 1 D Música e Som Musica
Leia maisComo equalizar sem usar equalizadores. Equalizar Equalizador Conceitos
Em uma de minhas participações na AES, no ano de 2000, fiz uma apresentação cujo tema principal era FASE. Entretanto, falar exclusivamente de fase me parecia sem sentido e provavelmente se tornaria entediante.
Leia mais6 Aplicação da Metodologia Proposta
6 Aplicação da Metodologia Proposta 6.1 Introdução A utilização da metodologia Box & Jenkins para a identificação da estrutura adequada é tarefa difícil para um usuário sem conhecimento prévio. Por isso,
Leia maisParâmetros importantes de um Analisador de Espectros: Faixa de frequência. Exatidão (frequência e amplitude) Sensibilidade. Resolução.
Parâmetros importantes de um Analisador de Espectros: Faixa de frequência Exatidão (frequência e amplitude) Sensibilidade Resolução Distorção Faixa dinâmica Faixa de frequência: Determina as frequências
Leia maisComo medimos nosso SPL!
Como medimos nosso SPL! Descrevemos aqui a nossa técnica utilizada para medir o nível máximo de pressão sonora linear de uma caixa acústica autoamplificada, considerando informações precisas, repetíveis
Leia maisOndas sonoras. Qualidades fisiológicas de uma onda sonora
Ondas sonoras As ondas mecânicas que propiciam o fenômeno da audição aos seres vivos são chamadas de ondas sonoras. Como todas as ondas mecânicas, as ondas sonoras podem se propagar nos mais diversos meios,
Leia maisUNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica
REDES NEURAIS ARTIFICIAIS MÁQUINA DE VETOR DE SUPORTE (SUPPORT VECTOR MACHINES) Prof. Dr. André A. P. Biscaro 1º Semestre de 2017 Introdução Poderosa metodologia para resolver problemas de aprendizagem
Leia maisO áudio. O áudio. O áudio Wilson de Pádua Paula Filho 1. Propriedades físicas do som Representação digital do som Processamento digital de som
O áudio O áudio Representação digital do som Processamento digital de som As vibrações sonoras: propagam-se como ondas de pressão atmosférica; convertidas em sinais elétricos por transdutores; transdutores
Leia maisAprendizado de Máquina (Machine Learning)
Ciência da Computação (Machine Learning) Aula 07 Classificação com o algoritmo knn Max Pereira Classificação com o algoritmo k-nearest Neighbors (knn) Como os filmes são categorizados em gêneros? O que
Leia maisAula 1 - Apresentação do curso Sinais e Processamento de Sinais
Aula 1 - Apresentação do curso Sinais e Processamento de Sinais Bibliografia OPPENHEIM, A.V.; WILLSKY, A. S. Sinais e Sistemas, 2a edição, Pearson, 2010. ISBN 9788576055044. Páginas 1-5. HAYKIN, S. S.;
Leia maisPrincípios de Telecomunicações AULA 1. Elementos de um sistema de comunicações. Prof. Eng. Alexandre Dezem Bertozzi, Esp.
Princípios de Telecomunicações AULA 1 Elementos de um sistema de comunicações Prof. Eng. Alexandre Dezem Bertozzi, Esp. COMUNICAÇÃO TRANSMISSÃO DE INFORMAÇÃO DE UM PONTO A OUTRO, ATRAVÉS DE UMA SUCESSÃO
Leia maisRECONHECIMENTO DE FALANTE
MARCOS PAULO RIKI YANASE RECONHECIMENTO DE FALANTE Trabalho da disciplina de Processamento Digital de Sinais do curso de Engenharia Elétrica, Setor de Tecnologia da Universidade Federal do Paraná. Prof.
Leia maisLista de Exercícios GQ1
1 a QUESTÃO: Determine a Transformada Inversa de Fourier da função G(f) definida pelo espectro de amplitude e fase, mostrado na figura abaixo: 2 a QUESTÃO: Calcule a Transformadaa de Fourier do Sinal abaixo:
Leia maisTransformada de Fourier: fundamentos matemáticos, implementação e aplicações musicais
Transformada de Fourier: fundamentos matemáticos, implementação e aplicações musicais MAC 0337 Computação Musical Jorge H. Neyra-Araoz IME USP 22/11/2007 Resumo Série de Fourier para funções periódicas
Leia maisCOMPRESSÃO DE SINAIS DE ELETROMIOGRAFIA
Universidade de Brasília UnB Faculdade de Tecnologia FT Departamento de Engenharia Elétrica ENE COMPRESSÃO DE SINAIS DE ELETROMIOGRAFIA Marcus Vinícius Chaffim Costa 1, Alexandre Zaghetto 2, Pedro de Azevedo
Leia maisCaracterísticas acústicas das vogais e consoantes
Características acústicas das vogais e consoantes APOIO PEDAGÓGICO Prof. Cecília Toledo ceciliavstoledo@gmail. com http://fonologia.org/acustica.php Fonética acústica A Fonética acústica é um ramo da Fonética
Leia maisProcessamento Digital de Sinais. Aplicações da DFT. Prof. Dr. Carlos Alberto Ynoguti
Processamento Digital de Sinais Aplicações da DFT Prof. Dr. Carlos Alberto Ynoguti Aplicações da DFT Nesta seção iremos apresentar três aplicações bastante comuns da DFT: 1) Análise espectral de sinais
Leia maisCircuitos resistivos alimentados com onda senoidal
Circuitos resistivos alimentados com onda senoidal 3 3.1 Material resistores de 1 kω e 100 Ω. 3.2 Introdução Nas aulas anteriores estudamos o comportamento de circuitos resistivos com tensão constante.
Leia maisFaculdade de Computação
Faculdade de Computação Programação Procedimental 1 a Lista de Exercícios p/ Avaliação Prof. Cláudio C. Rodrigues Instruções: 1. Apresentar as soluções usando a linguagem C, quando for apropriado; 2. A
Leia maisUm Ambiente para Processamento Digital de Sinais Aplicado à Comunicação Vocal Homem-Máquina
Um Ambiente para Processamento Digital de Sinais Aplicado à Comunicação Vocal Homem-Máquina Márcio G. Passos e Patric L. Silva marcio_passos@yahoo.com.br e lacouth@gmail.com Silvana Luciene do N. Cunha
Leia maisAprendizado de Máquina
Aprendizado de Máquina Introdução ao WEKA Luiz Eduardo S. Oliveira Universidade Federal do Paraná Departamento de Informática http://web.inf.ufpr.br/luizoliveira Luiz S. Oliveira (UFPR) Aprendizado de
Leia maisInformática Parte 19 Prof. Márcio Hunecke
Escriturário Informática Parte 19 Prof. Márcio Hunecke Informática NOÇÕES DE ALGORITMOS DE APRENDIZADO O aprendizado automático, aprendizado de máquina (em inglês: "machine learning") ou aprendizagem
Leia maisRECONHECIMENTO DE TRAJETÓRIA COM REDES NEURAIS
1 RECONHECIMENTO DE TRAJETÓRIA COM REDES NEURAIS Giovanni Crestan Leonardo Enomoto Araki Thiago Antonio Grandi De Tolosa Wânderson de Oliveira Assis Wilson Carlos Siqueira Lima Júnior IMT Instituto Mauá
Leia maisDisciplina: Manipulação e Edição de Som, Vídeo e Imagem. Prof. Felipe Batistella Alvares
Instituto Federal do Rio Grande do Sul Curso Técnico em Suporte e Manutenção em Informática Disciplina: Manipulação e Edição de Som, Vídeo e Imagem Prof. Felipe Batistella Alvares Som - áudio -ELEMENTOS
Leia maisRedes Neurais no WEKA
Redes Neurais WEKA http://www.cs.waikato.ac.nz/ml/weka/ Redes Neurais no WEKA Introdução ao WEKA Base Benchmark Estudo de Casos Análise de Crédito Bancário 1 Redes Neurais no Weka WEKA (Waikaito Environment
Leia mais2ª. Competição Tecnológica (Outubro/2010)
2ª. Competição Tecnológica (Outubro/2010) DESCRIÇÃO A competição compreende duas fases e consiste na implementação de cinco aplicações, três na fase I e duas na fase II. Na fase I, os resultados obtidos
Leia maisAnálise Quantitativa de Tecidos em Úlceras de Perna
49 5 Análise Quantitativa de Tecidos em Úlceras de Perna A avaliação das áreas proporcionais de cada tecido interno das úlceras fornece informações importantes sobre seu estado patológico [BERRISS, 2000],
Leia maisTÍTULO: IDENTIFICAÇÃO DE CARACTERES APRESENTADOS A UMA CÂMERA POR MEIO DO MOVIMENTO DOS DEDOS DA MÃO DE UM SER HUMANO
Anais do Conic-Semesp. Volume 1, 2013 - Faculdade Anhanguera de Campinas - Unidade 3. ISSN 2357-8904 TÍTULO: IDENTIFICAÇÃO DE CARACTERES APRESENTADOS A UMA CÂMERA POR MEIO DO MOVIMENTO DOS DEDOS DA MÃO
Leia maisRedes Neurais. Motivação. Componentes do neurônio. Cérebro humano. Criar máquinas capazes de operar independentemente do homem:
Motivação M. Sc. Luiz Alberto lasf.bel@gmail.com Redes Neurais Criar máquinas capazes de operar independentemente do homem: Aprenda sozinha; Interagir com ambientes desconhecidos; Possa ser chamada de
Leia maisBrilliant Solutions for a Safe World
Componente Biométrico - Voz Componentes do lado do servidor (multi-plataforma): Licenças do Matching Server Licenças do Fast Voice Extractor Licenças do Voice Matcher Componentes do cliente para Windows,
Leia maisClassificação Automática de Gêneros Musicais
Introdução Método Experimentos Conclusões Utilizando Métodos de Bagging e Boosting Carlos N. Silla Jr. Celso Kaestner Alessandro Koerich Pontifícia Universidade Católica do Paraná Programa de Pós-Graduação
Leia maisIntrodução ao Reconhecimento. Prof. Dr. Geraldo Braz Junior
Introdução ao Reconhecimento Prof. Dr. Geraldo Braz Junior O que você vê? 2 Pergunta: Essa imagem tem um prédio? Classificação 3 Pergunta: Essa imagem possui carro(s)? Detecção de Objetos Vários 4 Pergunta:
Leia maisSISTEMA DE CONTROLE AUTOMATIZADO DE SIRENE ESCOLAR COM MÚLTIPLAS ENTRADAS E SAÍDAS DE ÁUDIO USANDO ARDUINO
Patrocínio, MG, outubro de 2016 ENCONTRO DE PESQUISA & EXTENSÃO, 3., 2016, Patrocínio. Anais... Patrocínio: IFTM, 2016. SISTEMA DE CONTROLE AUTOMATIZADO DE SIRENE ESCOLAR COM MÚLTIPLAS ENTRADAS E SAÍDAS
Leia maisRECONHECIMENTO DE COMANDOS DE VOZ BASEADO EM CODIFICAÇÃO LINEAR PREDITIVA E
RECONHECIMENTO DE COMANDOS DE VOZ BASEADO EM CODIFICAÇÃO LINEAR PREDITIVA E REDES NEURAIS ARTIFICIAS PARA APLICAÇÕES DE ACIONAMENTOS DE PROCESSOS INDUS- TRIAIS Resumo Diversos processos industriais requerem
Leia maisCircuitos resistivos alimentados com onda senoidal
Experimento 5 Circuitos resistivos alimentados com onda senoidal 5.1 Material Gerador de funções; osciloscópio; multímetro; resistor de 1 kω; indutores de 9,54, 23,2 e 50 mh. 5.2 Introdução Nas aulas anteriores
Leia maisESTUDO DE ALGORITMO DE SEGMENTAÇÃO DE FALA
ESTUDO DE ALGORITMO DE SEGMENTAÇÃO DE FALA Vinicius de Souza 1, Marcelo de Oliveira Rosa 2 1,2 Departamento Acadêmico de Eletrotécnica Campus Curitiba Universidade Tecnológica Federal do Paraná - UTFPR
Leia maisMódulo de Formação em Fundamentos de Sistemas Eletrônicos
em Fundamentos de Sistemas Eletrônicos Departamento de Engenharia de Sistemas Eletrônicos Escola Politécnica Universidade de São Paulo 05/09/2017 1 PSI/EPUSP O Curso de Eletrônica e Sistemas Estrutura
Leia maisFigura 1 Sinais e Transformadas de Fourier (HAYKIN; VAN VEEN, 2001).
Processamento Digital de Sinais Aula 3 Professor Marcio Eisencraft março 22 Aula 3 TFD: Transformada de Fourier Discreta Bibliografia OPPEHEIM, A. V.; SCHAFER, R W.; BUCK, J. R. Discrete-time signal processing,
Leia maisELETROTÉCNICA GERAL Unidade 08
UNIVERSIDADE FEDERAL DE PELOTAS FACULDADE DE ENGENHARIA AGRÍCOLA ELETROTÉCNICA GERAL Unidade 08 A base de tudo Tri (três) + gonos (lados) + metro (medida) Então Trigonometria = medida de triângulos Medida
Leia maisCircuitos resistivos alimentados com onda senoidal. Indutância mútua.
Capítulo 6 Circuitos resistivos alimentados com onda senoidal. Indutância mútua. 6.1 Material Gerador de funções; osciloscópio; multímetro; resistor de 1 kω; indutores de 9,54, 23,2 e 50 mh. 6.2 Introdução
Leia maisInformática. Aprendizado de Máquina. Professor Márcio Hunecke.
Informática Aprendizado de Máquina Professor Márcio Hunecke www.acasadoconcurseiro.com.br Informática Aula XX NOÇÕES DE ALGORITMOS DE APRENDIZADO O aprendizado automático, aprendizado de máquina (em inglês:
Leia maisAula 6: Entrada e Saída
Aula 6: Entrada e Saída Fernanda Passos Universidade Federal Fluminense Programação de Computadores IV Fernanda Passos (UFF) Entrada e Saída Programação de Computadores IV 1 / 29 Agenda 1 Revisão e Contexto
Leia maisInteligência Artificial
Universidade Federal de Campina Grande Departamento de Sistemas e Computação Pós-Graduação em Ciência da Computação Inteligência Artificial Aprendizagem (Redes Neurais - Complementar) Prof. a Joseana Macêdo
Leia maisInterface Homem- Computador 3 aula
Interface Homem- Computador 3 aula Esp. Suzana de Morais Santos Silva Instituto Federal de Educação Ciência e Tecnologia de Mato Grosso do Sul Campus Corumbá Psicologia, etnograia e semiótica Lei de Hick-Hyman
Leia maisAnalisador de Espectros
Analisador de Espectros O analisador de espectros é um instrumento utilizado para a análise de sinais alternados no domínio da freqüência. Possui certa semelhança com um osciloscópio, uma vez que o resultado
Leia mais5. Aplicação da Modelagem Proposta
Aplicação da Modelagem Proposta 5. Aplicação da Modelagem Proposta Na aplicação da modelagem proposta serão utilizados os dados de carga elétrica da LIGHT Serviços de Eletricidade S.A. (principal concessionária
Leia mais6 Análise dos Atributos de Voz em Reconhecimento Distribuído com a Utilização do Codec de Voz ITU-T G.723.1
6 Análise dos Atributos de Voz em Reconhecimento Distribuído com a Utilização do Codec de Voz ITU-T G.723.1 Neste capítulo serão examinados os sistemas de reconhecimento da Fig. 3.11, com exceção do reconhecedor
Leia maisCircuitos resistivos alimentados com onda senoidal
Circuitos resistivos alimentados com onda senoidal 5 5.1 Material Gerador de funções; osciloscópio; multímetro; resistor de 1 kω; indutores de 9,54, 23,2 e 50 mh. 5.2 Introdução Nas aulas anteriores estudamos
Leia mais7 Resultados e Discussão
114 7 Resultados e Discussão A fim de avaliar a importância da utilização de imagens polarizadas em medidas de textura, cujo processamento necessita de imagens nos dois modos de captura (campo claro e
Leia maisDETERMINAÇÃO EXPERIMENTAL DA VELOCIDADE DE UM PROJÉTIL UTILIZANDO UM PÊNDULO BALÍSTICO
DETERMINAÇÃO EXPERIMENTAL DA VELOCIDADE DE UM PROJÉTIL UTILIZANDO UM PÊNDULO BALÍSTICO Cezar Eduardo Pereira Picanço 1, Jane Rosa 2 RESUMO Este trabalho apresenta os resultados e procedimentos utilizados
Leia maisSumário Introdução Revisão de Números Complexos Programação em Delphi... 94
Sumário Introdução... 14 01.Revisão de Números Complexos... 15 01. Introdução... 15 02. Propriedades dos Números Complexos... 19 03. Conjugado de um Número Complexo... 21 04. Adição de Complexos... 22
Leia mais3B SCIENTIFIC PHYSICS
3B SCIENTIFIC PHYSICS Software de Fourier 1012587 Instruções de operação 06/11 MEC 1. Descrição Com este programa é possível produzir formas de ondas livremente definíveis, as quais são emitidas em forma
Leia maisProtótipo de Software de Reconhecimento de Voz Para Navegação em Jogos, Utilizando Rede Neural Artificial
Protótipo de Software de Reconhecimento de Voz Para Navegação em Jogos, Utilizando Rede Neural Artificial Orientando: Derlei Brancher Orientador: Prof. Jacques Robert Heckmann - Mestre 1. Introdução Roteiro
Leia maisSinais digitais e analógicos
Sinais digitais e analógicos Conhecer os conceitos básicos do processo de comunicação de dados e identificar sinais analógicos e digitais. Apesar de a maioria dos computadores não ser capaz de responder
Leia maisAmostras de Concreto Cilíndricas
Guia de Instruções de Medição com o Sonelastic para: Amostras de Concreto Cilíndricas ATCP Engenharia Física www.atcp.com.br São Carlos Brasil Índice 1. PREPARO DO CORPO DE PROVA CILÍNDRICO... 3 1.1. Colagem
Leia maisTópicos Especiais em Informática Fatec Indaiatuba 13/07/2017
Inteligência de Negócios Fatec Indaiatuba Prof. Piva Compreender as definições e conceitos básicos da Mineração de Dados (MD) Entender o processo KDD (Knowledge Discovery Data) e MD Descrever as etapas
Leia maisProjeto de pesquisa realizado no Grupo de Automação Industrial e Controle (GAIC) da UNIJUÍ. 2
COLETA DE DADOS EXPERIMENTAIS DO TEMPO DE VIDA DE BATERIAS DE LÍTIO-ÍON POLÍMERO ATRAVÉS DE UMA PLATAFORMA DE TESTES E MODELAGEM DOS DADOS UTILIZANDO A TEORIA DE IDENTIFICAÇÃO DE SISTEMAS 1 Eduardo Cardoso
Leia maisManual do Professor. Conferência Web
Manual do Professor Conferência Web SUMÁRIO 1. Acesso ao serviço de Conferência Web... 2 Página principal do serviço... 3 Login Conferência Web... 5 2. Ativando o microfone (caso seja Professor)... 7 3.
Leia maisCompressão de Textos. Introdução. Introdução. Introdução. O volume de informação textual disponível on-line é imenso:
Compressão de Textos Estrutura de Dados II Prof. Guilherme Tavares de Assis Universidade Federal de Ouro Preto UFOP Instituto de Ciências Exatas e Biológicas ICEB Departamento de Computação DECOM O volume
Leia maisCálculo da árvore binária de busca ótima usando MPI
Cálculo da árvore binária de busca ótima usando MPI 1. O Algoritmo Adriano Medeiros 1, André Murbach Maidl 1 1 Programação Concorrente/Paralela - PUC-Rio 1 adrimedeiros1@gmail.com, andremm@gmail.com O
Leia maisArquitetura de Computadores. Alberto Felipe Friderichs Barros
Arquitetura de Computadores Alberto Felipe Friderichs Barros Computação Ato ou efeito de computar: Cômputo, cálculo, contagem; Operação matemática ou lógica; Informática Do francês informatique, que por
Leia maisNome: Como soube do mestrado? Considere o arranjo de cargas sobre os vértices de um triângulo eqüilátero de lado a, como mostrado abaixo:
CENTRO BRASILEIRO DE PESQUISAS FISICAS VOCÊ DEVE ESCOLHER APENAS QUATRO ENTRE AS QUESTÕES PROPOSTAS Resolva cada questão em folha separada e identificada A prova é sem consulta e sem calculadora Nome:
Leia maisOBSERVAÇÕES ACÚSTICAS SOBRE AS VOGAIS ORAIS DA LÍNGUA KARO
ARAÚJO, Fernanda Oliveira. Observações acústicas sobre as vogais orais da língua Karo. Revista Virtual de Estudos da Linguagem ReVEL. Edição especial n. 1, 2007. ISSN 1678-8931 [www.revel.inf.br]. OBSERVAÇÕES
Leia mais7 Conclusão. 7.1 Principais Contribuições Originais
97 7 Conclusão Uma metodologia eficiente e segura é proposta para prever a propagação de trincas de fadiga sob carregamento de amplitude variável em estruturas bidimensionais com geometria 2D complexa.
Leia maisUniversidade de São Paulo Instituto de Ciências Matemáticas e de Computação
Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Francisco A. Rodrigues Departamento de Matemática Aplicada e Estatística - SME Conceitos básicos Classificação não-supervisionada:
Leia maisModems Baud rate e Bit rate
Na aula passada......conceituação básica de fibras ópticas SSC-0144 Redes de Alto Desempenho 2010 Vantagens & desvantagens tipos atenuação medidas de desempenho usos de fibras processo de fusão Provinha
Leia maisTransformada de Fourier. Theo Pavan e Adilton Carneiro TAPS
Transformada de Fourier Theo Pavan e Adilton Carneiro TAPS Análise de Fourier Análise de Fourier - representação de funções por somas de senos e cossenos ou soma de exponenciais complexas Uma análise datada
Leia maisInspiron 20. Série Visão. Especificações
Inspiron 20 Série 3000 Visão Copyright 2015 Dell Inc. Todos os direitos reservados. Este produto é protegido por leis de direitos autorais e propriedade intelectual dos EUA e internacionais. Dell TM e
Leia maisMineração de Dados para Detecção de Padrões de Mudança de Cobertura da Terra. Padrões e processos em Dinâmica de uso e Cobertura da Terra
Mineração de Dados para Detecção de Padrões de Mudança de Cobertura da Terra Padrões e processos em Dinâmica de uso e Cobertura da Terra Introdução 1 2 3 4 Capacidade de Armazenamento X Análise e Interpretação
Leia maisBoardmaker with Speaking Dynamically Pro
Boardmaker with Speaking Dynamically Pro Símbolos Pictográficos para a Comunicação (SPC) Os SPC foram criados no início dos anos 80 pela Terapeuta da Fala americana Roxanna Mayer Johnson e compõem atualmente
Leia mais