Sistema de Segmentação de Fala Baseado na Observação do Pitch

Tamanho: px
Começar a partir da página:

Download "Sistema de Segmentação de Fala Baseado na Observação do Pitch"

Transcrição

1 REVISTA DE TECNOLOGIA DA INFORMAÇÃO E COMUNICAÇÃO, VOL. 4, NÚMERO 1, JULHO DE Sistema de Segmentação de Fala Baseado na Observação do Pitch Raissa Bezerra Rocha, Virginio Velloso Freire, Francisco Madeiro, e Marcelo Sampaio de Alencar Universidade Federal de Campina Grande UFCG, Campina Grande, Brasil Universidade Federal de Sergipe UFS, São Cristóvão, Brasil Universidade de Pernambuco UPE, Recife, Brasil Instituto de Estudos Avançados em Comunicações Iecom s: {raissa, Resumo O artigo descreve um sistema de segmentação de fala implícito, que tem o objetivo de estimar as fronteiras entre fonemas de uma locução. Para encontrar as marcas de segmentação, o método proposto utiliza uma característica prosódica do sinal de voz, o pitch. Desta forma, o sistema percorre a locução a ser segmentada, calculando o pitch em cada janela de duração pré-definida. O resultado é uma matriz com os valores dos pitches, sendo possível observar regiões com valores pitches semelhantes e regiões com valores de pitches aleatórios, resultando na presença de fonemas sonoros e surdos, respectivamente. Assim, as marcas de segmentação são obtidas pela localização do ponto de transição entre as regiões. Palavras-chave Segementação de Fala, Pitch, Sons da Fala I. INTRODUÇÃO A fala é formada pela junção de pequenos sons denominados fones. Em diversas aplicações envolvendo processamento do sinal de voz, a segmentação é uma etapa fundamental no desenvolvimento do sistema de fala ou é utilizada para aumentar seu desempenho. Um sistema de segmentação de voz tem o objetivo de determinar as fronteiras que separam os elementos essenciais da fala, como palavras, sílabas ou fonemas de uma determinada locução. Eles podem ser usados para codificação de voz, como é o caso dos codificadores fonéticos, assim como em sistemas de reconhecimento automático e síntese de fala, entre outros. Nos sistemas de reconhecimento de fala, cujo objetivo é reconhecer cada palavra ou sentença pronunciada pelo orador, a segmentação torna-se importante para construir uma base de fala segmentada utilizada como ponto de partida para o treinamento dos modelos referentes às subunidades fonéticas, utilizada durante a fase de treinamento, como é o caso dos sistemas que utilizam Modelos de Markov Escondidos (Hidden Markov Models HMM). Caso contrário, na fase de treinamento, as locuções são segmentadas de maneira uniforme para gerar as primeiras estimativas que serão refinadas durante as próximas interações do treinamento [1], [2]. Os sistemas de síntese de voz ou conversão texto-fala (Text to Speech Synthesis TTS), que consistem em uma mudança de domínio da representação da informação da forma escrita Artigo recebido em 6 de fevereiro de Artigo aceito em 10 de julho de 2014 para a forma falada, podem ser divididos em duas etapas: análise do texto, que resulta na normalização e transcrição fonética do texto, e síntese do sinal de voz, que pode ser realizada, por exemplo, com a seleção e concatenação das unidades acústicas presentes em um banco de fala formado pela segmentação de uma base de dados [1]. Os codificadores fonéticos são caracterizados por representar o sinal de voz com baixa taxa de bits. Para alcançar esse objetivo, o sinal de fala, que consiste na entrada do emissor do codificador, deve ser segmentado foneticamente com o intuito de extrair de cada fonema informações prosódicas, como duração, energia, frequência fundamental, entre outros, e enviar estas informações ao receptor para realização da síntese do sinal de voz. Desta forma, o sistema de segmentação de fala afeta diretamente o desempenho dos codificadores fonéticos, visto que é necessária uma segmentação robusta para a extração exata dos parâmetros e para uma correta síntese no receptor [3]. Na literatura é possível encontrar algumas classificações para os sistemas de segmentação de fala. Os métodos de segmentação podem ser classificados de acordo com a presença ou ausência da categoria linguística e observações acústicas [4]. Entende-se por categoria linguística o conjunto de informações linguísticas, como a transcrição fonética da locução, que pode ou não ser apresentada como entrada para o sistema de segmentação. Por outro lado, as observações acústicas consistem em informações extraídas do sinal de fala, normalmente representadas por um vetor de parâmetros com informações do sinal de fala atribuídos a janelas de curto intervalo de tempo. Os sistemas de segmentação de fala podem ser classificados como segmentação implícita ou segmentação explícita. A segmentação implícita acontece quando a categoria linguística não é considerada no processo de segmentação, sendo consideradas apenas observações acústicas para o sistema gerar as fronteiras de segmentação. A segmentação explícita utiliza a transcrição fonética (informações linguísticas\ ) para gerar as marcas de segmentação. Desta forma, neste tipo de segmentação, as transcrições fonéticas da fala a ser segmentada devem ser antecipadamente geradas e utilizadas como entrada para o sistema de segmentação [1].

2 REVISTA DE TECNOLOGIA DA INFORMAÇÃO E COMUNICAÇÃO, VOL. 4, NÚMERO 1, JULHO DE Este trabalho propõe um sistema de segmentação automático implícito a ser aplicado aos sinais de voz com o objetivo de localizar as fronteiras de transição entre um fonema e outro. Para alcançar o objetivo de obter resultados mais próximos dos conseguidos em uma segmentação manual, o sistema proposto utiliza um parâmetro acústico do sinal de voz, o pitch. Assim, o sistema extrai de cada janela de duração prédefinida o valor do pitch e estima a marca de mudança entre os fonemas observando a mudança dos valores do pitch. O sistema de segmentação de fala proposto representa uma importante etapa no desenvolvimento de um codificador de voz fonético, que é utilizado no emissor do referido codificador para segmentar o sinal de fala e possibilitar a extração correta de características prosódicas, assim como é usado no receptor do codificador com o objetivo de segmentar a fala em unidades fonéticas, que têm uso na síntese por concatenação. Além dessa seção introdutória, o artigo está dividido em mais quatro seções. A Seção II apresenta a teoria relacionada a produção da fala, que é fundamental para o desenvolvimento de sistemas de processamento de voz, como um sistema de segmentação da fala. A Seção III descreve o sistema de segmentação de fala proposto neste artigo. A forma de avaliação do sistema de segmentação, bem como os resultados obtidos estão apresentados na Seção IV. Por fim, a Seção V expõe as conclusões e os trabalhos futuros. II. OS SONS DA FALA Os sinais de fala resultam de uma sequência de sons coordenados por regras de linguagem, que representam a mensagem a ser transmitida. A área científica que se dedica ao estudo da linguagem é denominada Linguística, e possui vários ramos, entre os quais a Fonética e a Fonologia. A Fonética concentra-se no estudo dos sons da fala e do modo como são produzidos e percebidos pelos ouvintes, enquanto a Fonologia procura caracterizar o sistema sonoro de uma língua, as regras subjacentes à combinação desses sons e o modo como esses sons exprimem distinções de significado. A fala é produzida por uma parte específica do corpo humano denominada aparelho fonador, sendo constituído de três partes: sistema respiratório, sistema fonatório e sistema articulatório. De forma geral, é possível classificar os sinais, de acordo com o processo de produção, como sonoros ou surdos. Na produção dos sons sonoros, o fluxo de ar vindo dos pulmões é controlado pela abertura das cordas vocais que podem ser tensionadas ou aproximadas sob o controle do locutor. A abertura entre as dobras vocais ou cordas vocais é denominada glote. No instante em que a glote está completamente fechada, o fluxo de ar vindo dos pulmões é interrompido, fazendo com que a pressão subglótica aumente até que as cordas vocais sejam separadas, liberando o ar pressionado, gerando um pulso de ar de curta duração. A pressão glótica é reduzida pelo escoamento do ar, possibilitando uma nova aproximação das cordas vocais. O processo de vibração das pregas vocais se repete de forma quase periódica, sendo possível a obtenção de ondas de pressão quase periódicas, representando a excitação para o trato vocal [5]. A Figura 1 ilustra ondas de pressão, denominadas impulsos glotais, que são moduladas pelas cavidades superiores até chegarem ao exterior com a forma de sons vozeados ou sonoros. O trato vocal tem a característica de agir como um ressonador, modificando o sinal de excitação (ondas de pressão), produzindo frequências de ressonância, denominadas formantes, que caracterizarão os diferentes sons sonoros [6], [5]. Fig. 1: Exemplo de impulsos glotais [7]. A taxa de vibração das pregas vocais depende das características do locutor, tais como: sexo, idade, comprimento do trato vocal, pressão do ar, entre outros fatores. Quanto mais rápida for a vibração, mais alta é a frequência fundamental e mais aguda será a voz. Exemplos desse casos são as vozes femininas e infantis (em torno de 240 Hz e 350 Hz, respectivamente). De modo semelhante, se as repetições forem produzidas de forma mais lenta, a voz resultante será mais grave, como a voz masculina (frequência fundamental em torno de Hz). A frequência média dos pulsos é denominada frequência fundamental de excitação, F 0 e o período fundamental (ou período do pitch), P 0, é dado por P 0 = 1 F 0 (1) O pitch de um estímulo sonoro representa a frequência, em Hz, de um tom senoidal que está afinado com o estímulo, segundo a percepção auditiva de um determinado indivíduo. Como, na percepção da voz, o pitch dos sons sonoros geralmente corresponde ao valor da frequência fundamental, os dois termos passaram a ser empregados indistintamente [5]. São exemplos de sons sonoros, as vogais, que representam o núcleo da sílaba, assim como algumas consoantes sonoras como os fones [b], [d], [g], [j], [v], [m], [n]. Diferentemente dos sons sonoros, em que, na sua produção, há uma vibração periódica das cordas vocais, os sons surdos são produzidos mediante uma constrição em algum ponto do trato vocal, geralmente próximo ao final da boca. Essa constrição provoca no ar expelido dos pulmões uma velocidade suficientemente alta para produzir uma turbulência, que gera um ruído de espectro largo, sendo usado como fonte de excitação na produção de tais sons. Algumas consoantes são exemplos de sons surdos. As consoantes do Português Brasileiro (PB) podem ser classificadas com base em quatro critérios: modo de articulação (plosivas, fricativas e líquidas (róticas e laterais)), quanto ao ponto de articulação (bilabiais, labiodentais, alveolares, palatais e velares), quanto ao papel das pregas vocais (sonoras e surdas) e quanto ao papel das cavidades bucal e nasal (consoantes orais e nasais) [4].

3 REVISTA DE TECNOLOGIA DA INFORMAÇÃO E COMUNICAÇÃO, VOL. 4, NÚMERO 1, JULHO DE III. SISTEMA PROPOSTO DE SEGMENTAÇÃO DO SINAL DE VOZ O sistema de segmentação de fala proposto, desenvolvido com uso do MatLab, é classificado como implícito, pois não utiliza a transcrição fonética para segmentar a fala, e tem o objetivo de obter os instantes iniciais e finais de cada fonema em uma locução. Diferentemente dos demais trabalhos encontrados na literatura sobre segmentação de fala, que utilizam métodos estatísticos, como os modelos de Markov escondidos, e sistemas de refinamento, em que é necessário o conhecimento prévio da transcrição fonética presente em uma locução, ou sistemas de refinamento mais complexos, o sistema proposto neste trabalho faz a segmentação da fala em fonemas mediante a observação de uma característica prosódica do sinal de voz, o pitch [8], [9], [4], [2], [10], [11], [12], [13], [14], [15]. O pitch representa um intervalo de tempo em que determinadas amostras do sinal se repetem, ou seja, um intervalo em que ocorre a excitação na produção de determinados sons. Essa periodicidade é resultante do movimento vibratório das cordas vocais na produção dos sons sonoros, resultando em uma excitação de pulsos periódica para gerar tais sons. Na produção dos sons surdos, é utilizada uma excitação ruidosa, não sendo possível encontrar uma periódicidade nesses sons, ou seja, não é possível encontrar valores de pitch para esses fones. Para encontrar as marcas de segmentação, o método calcula os valores do pitch em cada janela de 200 amostras, no decorrer da forma de onda de uma locução. Como resultado, fornece uma matriz com os valores dos pitches encontrados. A observação desta matriz permite a identificação de regiões de valores do pitch semelhantes, além de regiões de valores do pitch distintos, implicando a presença de fonemas sonoro e surdo, respectivamente. Para encontrar as marcas de segmentação entre dois fonemas adjacentes, a técnica usada identifica o ponto de transição entre as regiões da matriz que apresenta os pitches variáveis ou semelhantes, uma vez que essa mudança implica fonemas distintos. Essa identificação é realizada mediante a observação dos pitches adjacentes a partir de um pitch de referência. Na literatura, é possível encontrar algumas técnicas para determinação do pitch, como o método do cepstrum, o método da filtragem inversa e o método da autocorrelação, utilizado neste trabalho. Sabe-se que se um sinal for ciclo estacionário, sua função autocorrelação também será, apresentando o mesmo período. A base do método da autocorrelação consiste na análise de que a periodicidade do sinal de voz pode ser melhor observada com a função autocorrelação do sinal. Se forem encontrados picos periódicos na função autocorrelação, o sinal de voz é definido como sonoro, caso contrário é definido como não sonoro. A determinação do valor e da posição do pico da função autocorrelação estabelece a periodicidade do sinal de voz. Se a amplitude exceder um valor limiar, o trecho de voz é definido como vozeado e o valor do período do pitch é dado pela distância entre as amplitudes. A Figura 2 ilustra a função de autocorrelação obtida em um trecho de 20 ms do fonema [o], compreendido entre 50 ms e 70 ms do sinal, para uma voz feminina. Para este exemplo, o valor do período encontrado foi 4,58 ms, resultando em uma frequência fundamental de 218 Hz. Fig. 2: Exemplo da função da autocorrelação para o fonema [o] na determinação do pitch. A Figura 3 ilustra o processo de indentificação das fronteiras. Assim, o sistema compara pitches adjacentes, e computa a quantidade de pitches adjacentes iguais e diferentes. Se a quantidade de pitches vizinhos iguais for maior a três, o sistema identifica uma fronteira sonora. Se forem computados três ou mais pitches vizinhos diferentes, encontra-se uma fronteira surda. Fig. 3: Diagrama de blocos do sistema de segmentação de fala. IV. RESULTADOS A avaliação dos resultados obtidos por um sistema de segmentação de fala pode ser de forma subjetiva ou objetiva. Na avaliação subjetiva, os avaliadores escutam os segmentos de fala obtidos pelas marcas de segmentação. Na avaliação objetiva, as fronteiras de segmentação encontradas no sistema de segmentação automática são comparadas com as marcas de segmentação obtidas de forma manual. Neste caso, o erro entre tais fronteiras não deve ultrapassar 20 ms [4], [16], [1].

4 REVISTA DE TECNOLOGIA DA INFORMAÇÃO E COMUNICAÇÃO, VOL. 4, NÚMERO 1, JULHO DE Para testar o desempenho do sistema de segmentação proposto, foi realizada a avaliação objetiva. Assim, os valores das fronteiras obtidos pelo sistema de segmentação desenvolvido foram comparados aos resultados obtidos de forma manual. O banco de dados segmentado manualmente, construído pela referência [4], e cedido pela referência [17] para utilização neste trabalho, é composto por 200 frases, gravadas por um locutor paulista, do interior do Estado de São Paulo, não abordando, desta forma, os regionalismos do País, assim como os diferentes tipos de pronúcia para algumas locuções. As sentenças foram gravadas a uma taxa de 22,05 kamostras/s e quantizadas com 16 bits por amostra. As locuções têm, em média, três segundos e foram gravadas com o mínimo de ruído possível. Para realizar a avaliação objetiva foram selecionadas da base de voz, de forma aleatória, 18 palavras, resultando em 92 fronteiras. As Tabelas I a XVIII apresentam o resultado da segmentação. Nas referidas tabelas, a sigla refere-se a Sem Detecção. De acordo com as tabelas, 59 marcas de segmentação foram obtidas com um erro menor que 10 ms, consistindo em 64,1% do total de fronteiras, 20 fronteiras foram obtidas com erro entre 10 e 20 ms, consistindo em 21,7% das fronteiras. No geral, 85,8% de marcas de segmentação foram obtidas com erro menor que 20 ms. Além disso, oito (8,7 %) fronteiras foram obtidas com erros maior que 20 ms. Por fim, o sistema de segmentação não foi capaz de encontrar cinco (5,4 %) marcas de segemntação. TABELA I: Segmentação da palavra Afirmou. A-F F-I I-R R-M M-O O-U U-SIL TABELA II: Segmentação da palavra Aluno. A-L L-U U-N N-O 56 ms TABELA III: Segmentação da palavra Ano. A-N N-O TABELA IV: Segmentação da palavra Atitude. A-T T-I I-T T-U U-D D-E E-SIL TABELA V: Segmentação da palavra Avaliação. A-V V-A A-L L-I I-A A-Ç Ç-Ã Ã-O 30 ms 25 ms TABELA VI: Segmentação da palavra Cada. C-A A-D D-A TABELA VII: Segmentação da palavra Carla. C-A A-R R-L L-A 36 ms TABELA VIII: Segmentação da palavra Coração. C-O O-R R-A A-Ç Ç-Ã Ã-O 25 ms TABELA IX: Segmentação da palavra Educar. E-D D-U U-C C-A A-R 35 ms V. CONCLUSÕES E TRABALHOS FUTUROS Este artigo descreve um sistema de segmentação de fala baseado na estimação do pitch. Para encontrar as marcas de segmentação, o sistema calcula os valores de pitch em intervalos de duração pré-definidos, durante uma locução. Como resultado, o sistema de segmentação fornece uma matriz com os valores dos pitches encontrados na locução. A observação desta matriz permite a identificação de conjunto de valores de pitch semelhantes, além de conjunto de valores de pitch distintos, consistindo na identificação de fonemas sonoros e surdos,

5 REVISTA DE TECNOLOGIA DA INFORMAÇÃO E COMUNICAÇÃO, VOL. 4, NÚMERO 1, JULHO DE TABELA X: Segmentação da palavra Emocionantes. E-M M-O O-C C-I I-O O-N N-AN AN-T T-E E-S < 20 ms TABELA XI: Segmentação da palavra Encontros. EN-C C-O ON-T T-R R-O O-S S-SIL 16 ms 31 ms TABELA XII: Segmentação da palavra Escute. E-S S-C C-U U-T T-E TABELA XIII: Segmentação das palavras Fato. F-A A-T T-O < TABELA XIV: Segmentação das palavras País. P-A A-I I-S S-SIL TABELA XV: Segmentação da palavra Para. P-A A-R R-A A-SIL TABELA XVI: Segmentação da palavra Sido. S-I I-D D-O respectivamente. Para encontrar as marcas de segmentação entre fonemas adjacentes, o sistema identifica o ponto de transição entre as regiões que contém pitches de valores aleatórios e regiões com pitches de valores semelhantes, uma vez que essa mudança implica fonemas distintos. TABELA XVII: Segmentação da palavra Tenho. T-E E-N N-O 25 ms TABELA XVIII: Segmentação da palavra Tinha. T-I I-N N-A 16 ms O sistema de segmentação proposto foi avaliado mediante a segmentação de 18 locuções correspondente a pronúncia de palavras. Para verificar a sua robustez, os resultados obtidos foram comparados com marcas de segmentação obtidas de forma manual. O sistema se mostrou robusto, consiguindo obter 64,1% das marcas de segmentação com o erro abaixo de 10 ms e 85,8% das fronteiras com erro abaixo de 20 ms. No geral, o sistema foi capaz de detectar 94,6% das marcas de segmentação. Os resultados obtidos mostram que é possível realizar a segmentação fonética do sinal de fala utilizando o sistema proposto, uma vez que é possível verificar a mudança de um fonema para o outro mediante a alteração dos valores de pitch. O algoritmo de segmentação proposto apresenta uma complexidade inferior aos demais sistemas de segmentação encontrados na literatura. O seu desenvolvimento não depende de um banco de fala robusto para treinar modelos estatísticos, como é o caso dos sistemas que utilizam os modelos de Markov escondidos para a segmentação. Além disso, não se faz necessário o prévio conhecimento da transcrição fonética para a realização da segmentação. O sistema de segmentação proposto neste trabalho obteve resultados competitivos com outros sistemas já desenvolvidos, porém não utiliza nenhum sistema de refinamento dos resultados obtidos. Como proposta de trabalho futuro, pretende-se desenvolver um método de refinamento a ser utilizado no sistema proposto, com o objetivo de diminuir os erros na segmentação, aproximando os resultados das fronteiras obtidas com a segmentação automática as marcas identificadas na segmentação manual. Em seguida, pretende-se verificar o desempenho do sistema na segmentação de locuções de maior duração. Além disso, a avaliação do sistema com outras bases de voz, que incluam vozes de diferentes locutores do sexo masculino e feminino, além de bases cujo sinal de voz esteja corrompido pelo ruído, é também proposta para trabalhos futuros. AGRADECIMENTOS Os autores agradecem à Universidade Federal de Campina Grande (UFCG), à Universidade Federal de Sergipe (UFS), ao Instituto de Estudos Avançados em Comunicações (Iecom) e ao Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq) pelo suporte dado à pesquisa. REFERÊNCIAS [1] E. D. S. Paranaguá, Segmentação Automática do Sinal de Voz Para Sistemas de Conversão Texto-Fala, Tese de Doutorado, Universidade Federal do Rio de Janeiro, Março 2012.

6 REVISTA DE TECNOLOGIA DA INFORMAÇÃO E COMUNICAÇÃO, VOL. 4, NÚMERO 1, JULHO DE [2] S.Harish, P.Vijayalakshmi, and T. Nagarajan, Significance of Segmentation in Phoneme Based Tamil Speech Recognition System, [3] R. B. Rocha, Desenvolvimento de um Codificador de Voz Pessoal de Baixa Taxa Baseado em Modelos de Markov Escondidos. Dissertação de Mestrado, Universidade Federal de Campina Grande, Julho [4] A. M. Selmini, Sistema Baseado em Regras para o Refinamento da Segmentação Automática de Fala. Tese de Doutorado, Universidade Estadual de Campinas, Campinas, Brasil, Agosto de [5] J. M. Fechine, Reconhecimento Automático de Identidade Vocal Utilizando Modelagem Híbrida: Paramétrica e Estatística. Tese de Doutorado, Universidade Federal da Paraíba, Campina Grande, Brasil, [6] L. R. Rabiner and R. W. Schafer, Digital Processing of Speech Signals. New Jersey: Prentice Hall, [7] L. F. M. P. Coelho, Etiquetagem Automática de Sinais de Fala Segmentação e Classificação Fonética. Dissertação de Mestrado, Faculdade de Engenharia da Universidade do Porto, Porto, Portugal, Fevereiro de [8] S. S. Park and N. S. Kim, On Using Multiple Models of Automatic Speech Segmatation, IEEE Transaction on Audio, Speech, and Language Processing, vol. 15, no. 8, pp , November [9] K. Prahallad and A. W. Black, Segmentation of Monologues in Audio Books for Building Synthetic Voices, IEEE Transaction on Audio, Speech, and Language Processing, vol. 19, no. 5, pp , July [10] C. Lin and J. R. Jang, Automatic Phonetic Segmentation by Score Predictive Model for the Corpora of Mandarin Singing Voices, IEEE Transaction on Audio, Speech, and Language Processing, vol. 15, no. 7, pp , September [11] S. Brognaux, S. Roekhaut, T. Drugman, and R. Beaufort, Automatic Phone Alignment: A Comparison between Speaker-Independent Models and Models Trained on the Corpus to Align, Springer Berlin Heidelberg, vol. 7614, pp , [12] E. Akdemir and T. Çiloglu, Using Visual Information in Automatic Speech Segmentation, Signal Processing, Communications and Applications Conference, [13] H. Talea and K. Yaghmaie, Automatic Visual Speech Segmentation, Communitations Software and Networks (ICCSN), [14] B. Sudhakar and R. B. Raj, Automatic Speech Segmentation to Improve Speech Synthesis Performance, International Conference on Circuits, Power and Computer Technologies (ICCPCT 2013), pp , [15] D. C. Costa and G. A. M. Lopes and C. A. B. Mello and H. O. Viana, Speech and Phonema Segmantation Under Noisy Environment Through Spctrogram Image Analysis, IEEE International Conference on Systems, Man, and Cybernetics, pp , October [16] D. L. Toledano, Neural network boundary refining for automatic speech segmentation. Proceedings of the International Conference on Acoustic Speech and Signal Processing, June [17] E. D. S. Paranaguá, Reconhecimento de Locutores Utilizando Modelos de Markov Escondidos Contínuos. Dissertação de Mestrado, Instituto Militar de Engenharia, Rio de Janeiro, Brasil, Maio de 1997.

Codificadores de voz do MPEG-4. Eriko Porto eriko_porto@uol.com.br

Codificadores de voz do MPEG-4. Eriko Porto eriko_porto@uol.com.br Codificadores de voz do MPEG-4 Eriko Porto eriko_porto@uol.com.br Roteiro Introdução Waveform Codecs Source Codecs Hybrid Codecs Áudio no MPEG-4 Comparação entre alguns codecs Codificadores de Voz Introdução

Leia mais

Sons Vocais do Inglês Americano

Sons Vocais do Inglês Americano Sons Vocais do Inglês Americano Existem mais de 40 sons vocais no inglês americano que podem ser classificados de acordo com a forma básica em que são produzidos. Classe quanto á forma Vogais Fricativas

Leia mais

Codificadores de Voz em Baixas Taxas de Transmissão

Codificadores de Voz em Baixas Taxas de Transmissão Codificadores de Voz em Baixas Taxas de Transmissão Eider L. Oliveira Universidade Católica de Goiás Departamento de Engenharia Engenharia Elétrica - UCG E-mail:eider@ucg.br Resumo Este artigo descreve

Leia mais

Codificador de Voz Pessoal

Codificador de Voz Pessoal Codificador de Voz Pessoal Raissa Bezerra Rocha*, Gláucio Bezerra Rocha e **Marcelo Sampaio de Alencar *Aluna de Mestrado do Programa de Pós-Graduação em Engenharia Elétrica (UFCG/COPELE) **Professor do

Leia mais

Exp 8. Acústica da Fala

Exp 8. Acústica da Fala Exp 8. Acústica da Fala 1. Objetivos Estudar o modelo fonte-filtro da produção da fala; Medir os formantes e relacionar com manobras articulatórias em vogais e ditongos; Utilizar espectrografia de banda

Leia mais

[1] ALCAIM, A.. Processamento de Voz e Imagem. PUC Rio, 1999.

[1] ALCAIM, A.. Processamento de Voz e Imagem. PUC Rio, 1999. Referências Bibliográficas [1] ALCAIM, A.. Processamento de Voz e Imagem. PUC Rio, 1999. [2] ATAL, B.. Automatic Recognition of speakers from Their Voices. Proceeding of the IEEE, Vol. 64, No. 4, pp. 460-475,

Leia mais

Vetor Quantização e Aglomeramento (Clustering)

Vetor Quantização e Aglomeramento (Clustering) (Clustering) Introdução Aglomeramento de K-partes Desafios do Aglomeramento Aglomeramento Hierárquico Aglomeramento divisivo (top-down) Aglomeramento inclusivo (bottom-up) Aplicações para o reconhecimento

Leia mais

Novos Recursos e Utilização de Adaptação de Locutor no Desenvolvimento de um Sistema de Reconhecimento de Voz para o Português Brasileiro

Novos Recursos e Utilização de Adaptação de Locutor no Desenvolvimento de um Sistema de Reconhecimento de Voz para o Português Brasileiro Novos Recursos e Utilização de Adaptação de Locutor no Desenvolvimento de um Sistema de Reconhecimento de Voz para o Português Brasileiro Patrick Silva Nelson Neto Aldebaro Klautau Simpósio Brasileiro

Leia mais

UNIVERSIDADE ESTADUAL DE CAMPINAS. Instituto de Matemática, Estatística e Computação Científica

UNIVERSIDADE ESTADUAL DE CAMPINAS. Instituto de Matemática, Estatística e Computação Científica UNIVERSIDADE ESTADUAL DE CAMPINAS Instituto de Matemática, Estatística e Computação Científica Relatório Final - MS777 Modelagem matemático/probabilística dos módulos acústicos e de linguagem de sistemas

Leia mais

Processamento de Sinais Áudio-Visuais

Processamento de Sinais Áudio-Visuais Processamento de Sinais Áudio-Visuais Parte II Voz e Áudio Prof. Celso Kurashima Introdução à Engenharia da Informação Fevereiro/2011 1 Snapshot sinais no osciloscópio 2 1 processamento de voz e áudio

Leia mais

Um Método Simples e Eficiente para Detecção de Atividade de Voz Usando a Transformada Wavelet

Um Método Simples e Eficiente para Detecção de Atividade de Voz Usando a Transformada Wavelet Anais do CNMAC v.2 ISSN 984-82X Um Método Simples e Eficiente para de Atividade de Voz Usando a Transformada Wavelet Marco A. Q. Duarte Curso de Matemática, UUC, UEMS 7954-, Cassilândia, MS E-mail: marco@uems.br

Leia mais

RECONHECIMENTO DE AVES DE NOMES ONOMATOPÉICOS

RECONHECIMENTO DE AVES DE NOMES ONOMATOPÉICOS RECONHECIMENTO DE AVES DE NOMES ONOMATOPÉICOS Célio Seixo de BRITO Junior, Paulo César Miranda MACHADO Escola de Engenharia Elétrica e de Computação, UFG, 74001-970, Goiânia, GO Celiojunior01@gmail.com,

Leia mais

RECONHECIMENTO AUTOMÁTICO DE LOCUTOR E SUA APLICAÇÃO EM FONÉTICA FORENSE

RECONHECIMENTO AUTOMÁTICO DE LOCUTOR E SUA APLICAÇÃO EM FONÉTICA FORENSE RECONHECIMENTO AUTOMÁTICO DE LOCUTOR E SUA APLICAÇÃO EM FONÉTICA FORENSE José Antonio Apolinário Jr. Dirceu Gonzaga da Silva X Congresso Nacional de Fonética e Fonologia IV Congresso Internacional de Fonética

Leia mais

Evandro David Silva Paranaguá

Evandro David Silva Paranaguá SEGMENTAÇÃO AUTOMÁTICA DO SINAL DE VOZ PARA SISTEMAS DE CONVERSÃO TEXTO-FALA Evandro David Silva Paranaguá Tese de Doutorado apresentada ao Programa de Pós-graduação em Engenharia Elétrica, COPPE, da Universidade

Leia mais

ORIENTADOR(ES): KENNY VINENTE DOS SANTOS, LUIZ EDUARDO SALES E SILVA, WALDIR SABINO DA SILVA JUNIOR, WHEIDIMA CARNEIRO DE MELO

ORIENTADOR(ES): KENNY VINENTE DOS SANTOS, LUIZ EDUARDO SALES E SILVA, WALDIR SABINO DA SILVA JUNIOR, WHEIDIMA CARNEIRO DE MELO TÍTULO: FILTROS DIGITAIS APLICADOS PARA SEPARAÇÃO DE SINAIS DE ÁUDIO CATEGORIA: CONCLUÍDO ÁREA: ENGENHARIAS E ARQUITETURA SUBÁREA: ENGENHARIAS INSTITUIÇÃO: UNIVERSIDADE FEDERAL DO AMAZONAS AUTOR(ES): PAULA

Leia mais

ANÁLISE DE RECONHECEDOR DE FALA DEPENDENTE DE LOCUTOR QUANDO USADO PARA LOCUTORES NÃO TREINADOS

ANÁLISE DE RECONHECEDOR DE FALA DEPENDENTE DE LOCUTOR QUANDO USADO PARA LOCUTORES NÃO TREINADOS UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ CAMPUS CURITIBA CURSO SUPERIOR DE BACHARELADO EM ENGENHARIA ELÉTRICA GUILHERME ANTONIO PAVELSKI ANÁLISE DE RECONHECEDOR DE FALA DEPENDENTE DE LOCUTOR QUANDO USADO

Leia mais

2- Conceitos Básicos de Telecomunicações

2- Conceitos Básicos de Telecomunicações Introdução às Telecomunicações 2- Conceitos Básicos de Telecomunicações Elementos de um Sistemas de Telecomunicações Capítulo 2 - Conceitos Básicos de Telecomunicações 2 1 A Fonte Equipamento que origina

Leia mais

Diversidade. Linguística. na Escola Portuguesa. Projecto Diversidade Linguística na Escola Portuguesa (ILTEC)

Diversidade. Linguística. na Escola Portuguesa. Projecto Diversidade Linguística na Escola Portuguesa (ILTEC) Diversidade Linguística na Escola Portuguesa Projecto Diversidade Linguística na Escola Portuguesa (ILTEC) www.iltec.pt www.dgidc.min-edu.pt www.gulbenkian.pt Breve caracterização fonética de sons que

Leia mais

SINAIS COMUNICAÇÃO. Numa grande parte das situações, o sinal enviado comporta-se como uma onda.

SINAIS COMUNICAÇÃO. Numa grande parte das situações, o sinal enviado comporta-se como uma onda. SINAIS Um sinal é uma perturbação, ou seja, uma alteração de uma propriedade física. Um sinal mecânico é a alteração de uma propriedade física de um meio material (posição, densidade, pressão, etc.), enquanto

Leia mais

/z/ depois [+vozeado] Além disso As crianças generalizam automaticamente com base em traços elas não aprendem primeiro de uma base fonema por fonema

/z/ depois [+vozeado] Além disso As crianças generalizam automaticamente com base em traços elas não aprendem primeiro de uma base fonema por fonema Fonética e Fonologia 24.900: Introdução à Linguagem anotações das aulas: semana de 04 de Março de 2002 Conjunto de Problemas # 4: Para Segunda-feira, 11/03/02 Apostila sobre o principal para a identificação

Leia mais

SÍLABA TÔNICA NÃO FINAL E EM ONSET DE SÍLABA PÓS- TÔNICA FINAL

SÍLABA TÔNICA NÃO FINAL E EM ONSET DE SÍLABA PÓS- TÔNICA FINAL MEDIDAS DO VOT DE CONSOANTES OCLUSIVAS SURDAS EM ONSET DE SÍLABA TÔNICA NÃO FINAL E EM ONSET DE SÍLABA PÓS- TÔNICA FINAL EM DADOS DO DIALETO CURITIBANO VOICE ONSET TIME MEASUREMENT FOR VOICELESS PLOSIVES

Leia mais

Ruído. 1) Introdução. 2) Principais grandezas e parâmetros definidores do som

Ruído. 1) Introdução. 2) Principais grandezas e parâmetros definidores do som 1) Introdução A movimentação mecânica de cargas pode ser definida como o conjunto de ações, de materiais e de meios que permitem, de um modo planeado e seguro, movimentar cargas de um determinado local

Leia mais

Abordagem da vogal [e] sozinha e em base de ditongo a partir da análise experimental. Adriano de Souza Dias (UERJ e FEUDUC)

Abordagem da vogal [e] sozinha e em base de ditongo a partir da análise experimental. Adriano de Souza Dias (UERJ e FEUDUC) Abordagem da vogal [e] sozinha e em base de ditongo a partir da análise experimental. Adriano de Souza Dias (UERJ e FEUDUC) Introdução Este trabalho que desenvolvemos acerca da vogal [e] sozinha e em posição,

Leia mais

Gilliard Alan de Melo Lopes

Gilliard Alan de Melo Lopes Pós-Graduação em Ciência da Computação Segmentação de voz em ambientes ruidosos utilizando análise da imagem do espectrograma Por Gilliard Alan de Melo Lopes Dissertação de Mestrado Universidade Federal

Leia mais

Da Escrita à Fala - Da Fala à Escrita Isabel Trancoso, Luís Oliveira, João Neto M. Céu Viana INESC CLUL

Da Escrita à Fala - Da Fala à Escrita Isabel Trancoso, Luís Oliveira, João Neto M. Céu Viana INESC CLUL Da Escrita à Fala - Da Fala à Escrita Isabel Trancoso, Luís Oliveira, João Neto M. Céu Viana INESC CLUL 1. Introdução Numa exposição dedicada ao tema "A Escrita" que sentido fará incluir também "A Fala"?

Leia mais

Estudo do pré-vozeamento, frequência do burst e locus de F2 das oclusivas orais do português europeu 1. Introdução 2.

Estudo do pré-vozeamento, frequência do burst e locus de F2 das oclusivas orais do português europeu 1. Introdução 2. Estudo do pré-vozeamento, frequência do burst e locus de F2 das oclusivas orais do português europeu Marisa Lousada ; Paula Martins ; Luis M. T. Jesus Escola Superior de Saúde da Universidade de Aveiro

Leia mais

Objetivo. Letras. Análise Linguística? Em que consiste? Estruturas fonológicas da língua portuguesa. Prof a : Dr a. Leda Cecília Szabo

Objetivo. Letras. Análise Linguística? Em que consiste? Estruturas fonológicas da língua portuguesa. Prof a : Dr a. Leda Cecília Szabo Letras Prof a : Dr a. Leda Cecília Szabo Estruturas fonológicas da língua portuguesa Objetivo Entrar em contato com as características da análise fonológica. Conhecer os fonemas consonantais e vocálicos

Leia mais

Estudos Iniciais do Sistema didático para análise de sinais no domínio da frequência DSA-PC: tipos de janelas temporais.

Estudos Iniciais do Sistema didático para análise de sinais no domínio da frequência DSA-PC: tipos de janelas temporais. Estudos Iniciais do Sistema didático para análise de sinais no domínio da frequência DSA-PC: tipos de janelas temporais. Patricia Alves Machado Telecomunicações, Instituto Federal de Santa Catarina machadopatriciaa@gmail.com

Leia mais

Aníbal J. S. Ferreira, Ph. D. Faculdade de Engenharia da Universidade of Porto / SEEGNAL Research, Lda.

Aníbal J. S. Ferreira, Ph. D. Faculdade de Engenharia da Universidade of Porto / SEEGNAL Research, Lda. A importância na terapia da fala, na colocação da voz e no ensino do canto, do feedback visual de parâmetros extraídos por computador e em tempo-real, da voz falada ou cantada Aníbal J. S. Ferreira, Ph.

Leia mais

-~~ PROVA DE FÍSICA - 2º TRIMESTRE DE 2014 PROF. VIRGÍLIO

-~~ PROVA DE FÍSICA - 2º TRIMESTRE DE 2014 PROF. VIRGÍLIO COl.é. -~~ gio. da Vinci PROVA DE FÍSICA - 2º TRIMESTRE DE 2014 PROF. VIRGÍLIO NOME N 9 ANO --- Olá, caro(a) aluno(a). Segue abaixo uma serre de exercicres que têm, como base, o que foi trabalhado em sala

Leia mais

A música e a voz. A música e a voz. Síntese musical. A música e a voz. 2001 Wilson de Pádua Paula Filho. Tópicos: Definição:

A música e a voz. A música e a voz. Síntese musical. A música e a voz. 2001 Wilson de Pádua Paula Filho. Tópicos: Definição: A música e a voz Tópicos: A música e a voz Técnicas de síntese digital de som Definição: Técnicas de produção de seqüências de áudio a partir de uma seqüência de eventos musicais. Tipos de síntese: tempo

Leia mais

Prof. Daniel Hasse. Multimídia e Hipermídia

Prof. Daniel Hasse. Multimídia e Hipermídia Prof. Daniel Hasse Multimídia e Hipermídia AULA 02 Agenda: Algoritmos de Codificação/Decodificação; Codec de Áudio. Atividade complementar. Algoritmos de Codificação/Decodificação - Comunicação tempo real,

Leia mais

Questionário sobre o Ensino de Leitura

Questionário sobre o Ensino de Leitura ANEXO 1 Questionário sobre o Ensino de Leitura 1. Sexo Masculino Feminino 2. Idade 3. Profissão 4. Ao trabalhar a leitura é melhor primeiro ensinar os fonemas (vogais, consoantes e ditongos), depois as

Leia mais

2.1.2 Definição Matemática de Imagem

2.1.2 Definição Matemática de Imagem Capítulo 2 Fundamentação Teórica Este capítulo descreve os fundamentos e as etapas do processamento digital de imagens. 2.1 Fundamentos para Processamento Digital de Imagens Esta seção apresenta as propriedades

Leia mais

Sistema de Controle de Acesso Baseado no Reconhecimento de Faces

Sistema de Controle de Acesso Baseado no Reconhecimento de Faces Sistema de Controle de Acesso Baseado no Reconhecimento de Faces Access Control System Based on Face Recognition Tiago A. Neves, Welton S. De Oliveira e Jean-Jacques De Groote Faculdades COC de Ribeirão

Leia mais

Comunicação da informação a curta distância. FQA Unidade 2 - FÍSICA

Comunicação da informação a curta distância. FQA Unidade 2 - FÍSICA Comunicação da informação a curta distância FQA Unidade 2 - FÍSICA Meios de comunicação É possível imaginar como seria o nosso mundo sem os meios de comunicação de que dispomos? Os * * * * Aparelhos de

Leia mais

DO ANALÓGICO AO DIGITAL: CONCEITOS E

DO ANALÓGICO AO DIGITAL: CONCEITOS E DO ANALÓGICO AO DIGITAL: CONCEITOS E TÉCNICAS BÁSICASB Fernando Pereira Instituto Superior TécnicoT Digitalização Processo onde se expressa informação analógica de forma digital. A informação analógica

Leia mais

Modelando Novas Palavras

Modelando Novas Palavras Modelando Novas Palavras Introdução Modelando palavras fora do vocabulário (OOV Out Of- Vocabulary) Formulação Probabilística Métodos independentes do Domínio Conhecendo unidades de subpalavras OOV Modelos

Leia mais

RECONHECIMENTO DE PADRÕES RECONHECIMENTO DE VOZ

RECONHECIMENTO DE PADRÕES RECONHECIMENTO DE VOZ RECONHECIMENTO DE PADRÕES RECONHECIMENTO DE VOZ O ESQUEMA DE CLASSIFICAÇÃO É GERALMENTE BASEADO NA DISPONIBILIDADE DE UM CONJUNTO DE PADRÕES QUE FORAM ANTERIORMENTE CLASSIFICADOS, O "CONJUNTO DE TREINAMENTO";

Leia mais

UTILIZAÇÃO DE REDES NEURAIS ARTIFICIAIS NO RECONHECIMENTO DE VOGAIS

UTILIZAÇÃO DE REDES NEURAIS ARTIFICIAIS NO RECONHECIMENTO DE VOGAIS UTILIZAÇÃO DE REDES NEURAIS ARTIFICIAIS NO RECONHECIMENTO DE VOGAIS Nilmar de Souza (1) (nilmarufrb@gmail.com); Walter Gonçalves de Souza Filho (2) (waltersouzafilho@gmail.com); Micael Lima Conceição (3)

Leia mais

Codificação e modulação

Codificação e modulação TRABALHO DE REDES UNIVERSIDADE CATÓLICA DO SALVADOR CURSO: BACHARELADO EM INFORMÁTICA PROF.:MARCO ANTÔNIO C. CÂMARA COMPONENTES: ALUNO: Orlando dos Reis Júnior Hugo Vinagre João Ricardo Codificação e modulação

Leia mais

Fernando Babadopulos Terssetti

Fernando Babadopulos Terssetti Dissertação apresentada ao Curso de Pós-Graduação da Universidade Federal do ABC - UFABC como parte dos requisitos para a obtenção do título de Mestre em Engenharia da Informação. Fernando Babadopulos

Leia mais

Características do sinal de voz

Características do sinal de voz Características do sinal de voz Análise na freuência: a voz apresenta um conteúdo espectral ue vai de 0 Hz a 0 khz; os sons vozeados ou nasais (e.g. vogais e algumas consoantes j, l, m) apresentam um espectro

Leia mais

Errata. Livro: Transmissão Digital - Princípios e Aplicações Edição:1ª Código: 4391 Autores: Dayan Adionel Guimarães & Rausley Adriano Amaral de Souza

Errata. Livro: Transmissão Digital - Princípios e Aplicações Edição:1ª Código: 4391 Autores: Dayan Adionel Guimarães & Rausley Adriano Amaral de Souza Errata Livro: Transmissão Digital - Princípios e Aplicações Edição:1ª Código: 4391 Autores: Dayan Adionel Guimarães & Rausley Adriano Amaral de Souza Página 3 Primeiro parágrafo Excluir o seguinte texto

Leia mais

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ CÂMPUS CURITIBA CURSO DE ENGENHARIA DE CONTROLE E AUTOMAÇÃO

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ CÂMPUS CURITIBA CURSO DE ENGENHARIA DE CONTROLE E AUTOMAÇÃO UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ CÂMPUS CURITIBA CURSO DE ENGENHARIA DE CONTROLE E AUTOMAÇÃO ALEXANDRE PINTO DE LARA CARLA EDUARDA ORLANDO DE MORAES DESENVOLVIMENTO DE EQUIPAMENTO DE CAPTURA

Leia mais

CDI 20705 Comunicação Digital

CDI 20705 Comunicação Digital CDI Comunicação Digital DeModulação em Banda Base Digital Communications Fundamentals and Applications Bernard Sklar ª edição Prentice Hall Marcio Doniak www.sj.ifsc.edu.br/~mdoniak mdoniak@ifsc.edu.br

Leia mais

Construção de Aplicativos Usando PLN e Recursos para Reconhecimento e Síntese de Fala Disponibilizados pelo Projeto FalaBrasil da UFPA

Construção de Aplicativos Usando PLN e Recursos para Reconhecimento e Síntese de Fala Disponibilizados pelo Projeto FalaBrasil da UFPA Construção de Aplicativos Usando PLN e Recursos para Reconhecimento e Síntese de Fala Disponibilizados pelo Projeto FalaBrasil da UFPA Aldebaro Klautau Grupo FalaBrasil Laboratório de Processamento de

Leia mais

DESENVOLVIMENTO DE PROGRAMAS DE COMPUTADOR DEDICADOS AO ENSINO DE LIBRAS DE FORMA LÚDICA E BASEADOS EM TÉCNICAS MULTIMÍDIA

DESENVOLVIMENTO DE PROGRAMAS DE COMPUTADOR DEDICADOS AO ENSINO DE LIBRAS DE FORMA LÚDICA E BASEADOS EM TÉCNICAS MULTIMÍDIA DESENVOLVIMENTO DE PROGRAMAS DE COMPUTADOR DEDICADOS AO ENSINO DE LIBRAS DE FORMA LÚDICA E BASEADOS EM TÉCNICAS MULTIMÍDIA BOTARO, Cássio Oliveira 1 ALMEIDA, Matheus Henrique Nascimento 2 CORRÊA, Gean

Leia mais

Codificação neural. Natureza da Informação UFABC. Prof. João Henrique Kleinschmidt Material elaborado pelos professores de NI

Codificação neural. Natureza da Informação UFABC. Prof. João Henrique Kleinschmidt Material elaborado pelos professores de NI Codificação neural Natureza da Informação UFABC Prof. João Henrique Kleinschmidt Material elaborado pelos professores de NI 1 Princípios gerais do Sistema Nervoso Neurônio: unidade funcional do SNC Introdução

Leia mais

Oralidade e alfabetização. Linguagem Oral e escrita 1

Oralidade e alfabetização. Linguagem Oral e escrita 1 Oralidade e alfabetização Linguagem Oral e escrita 1 Para começar vamos definir alguns termos ligados à linguagem oral: Dialeto- vamos entender dialeto aqui como as variedades de uma língua (geográficas

Leia mais

O Ouvido Humano e a Audição

O Ouvido Humano e a Audição 36 Capítulo 4 O Ouvido Humano e a Audição Neste capítulo faremos um estudo sobre o ouvido humano, a fisiologia da audição e a sensibilidade do nosso sistema auditivo. 1. Conceitos básicos sobre a anatomia

Leia mais

SISTEMAS DE RECONHECIMENTO DE LOCUTOR INDEPENDENTE DE TEXTO

SISTEMAS DE RECONHECIMENTO DE LOCUTOR INDEPENDENTE DE TEXTO UNIVERSIDADE FEDERAL DE PERNAMBUCO GRADUAÇÃO EM ENGENHARIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA 2012.2 SISTEMAS DE RECONHECIMENTO DE LOCUTOR INDEPENDENTE DE TEXTO PROPOSTA DE TRABALHO DE GRADUAÇÃO Aluno:

Leia mais

Expressive Talking Heads: Um Estudo de Fala e Expressão Facial em Personagens Virtuais

Expressive Talking Heads: Um Estudo de Fala e Expressão Facial em Personagens Virtuais Expressive Talking Heads: Um Estudo de Fala e Expressão Facial em Personagens Virtuais Paula Salgado Lucena, Marcelo Gattass, Luiz Velho Departamento de Informática Pontifícia Universidade Católica do

Leia mais

5 (FGV-SP) A nota lá da escala cromática musical é tida como referência na afinação dos instrumentos. No violão comum de 6 cordas, a quinta corda

5 (FGV-SP) A nota lá da escala cromática musical é tida como referência na afinação dos instrumentos. No violão comum de 6 cordas, a quinta corda 1 - (UFSCAR-SP) Sabemos que, em relação ao som, quando se fala em altura, o som pode ser agudo ou grave, conforme a sua freqüência. Portanto, é certo afirmar que: a) o que determina a altura e a freqüência

Leia mais

Reconhecimento de Locutores em Língua Portuguêsa com Modelos de Redes Neurais e Gaussianos

Reconhecimento de Locutores em Língua Portuguêsa com Modelos de Redes Neurais e Gaussianos Proceedings of V Brazilian Conference on Neural Networks - V Congresso Brasileiro de Redes Neurais pp. 25-30, April 2-5, 2001, Centro de Convenções do Hotel Plaza Copacabana, Rio de Janeiro - Brazil Reconhecimento

Leia mais

Relatório Iniciação Científica

Relatório Iniciação Científica Relatório Iniciação Científica Ambientes Para Ensaios Computacionais no Ensino de Neurocomputação e Reconhecimento de Padrões Bolsa: Programa Ensinar com Pesquisa-Pró-Reitoria de Graduação Departamento:

Leia mais

DETECÇÃO DE VAZAMENTOS EM TUBULAÇÕES PREDIAIS DE GÁS ATRAVÉS DA ANÁLISE ESPECTRAL DE TRANSIENTES DE PRESSÃO

DETECÇÃO DE VAZAMENTOS EM TUBULAÇÕES PREDIAIS DE GÁS ATRAVÉS DA ANÁLISE ESPECTRAL DE TRANSIENTES DE PRESSÃO DETECÇÃO DE VAZAMENTOS EM TUBULAÇÕES PREDIAIS DE GÁS ATRAVÉS DA ANÁLISE ESPECTRAL DE TRANSIENTES DE PRESSÃO R. B. SANTOS 1, M.M. de F. SILVA e A. M. F. FILETI Universidade Estadual de Campinas, Faculdade

Leia mais

1 Problemas de transmissão

1 Problemas de transmissão 1 Problemas de transmissão O sinal recebido pelo receptor pode diferir do sinal transmitido. No caso analógico há degradação da qualidade do sinal. No caso digital ocorrem erros de bit. Essas diferenças

Leia mais

sobre a caracterização do sinal de voz envelhecida

sobre a caracterização do sinal de voz envelhecida Uma contribuição sobre a caracterização do sinal de voz envelhecida UFF - Universidade Federal Fluminense Engenharia de Telecomunicações Aluno: Marco Aurélio Botelho da Silva Orientadores: Edson Cataldo,D.Sc.

Leia mais

ANÁLISE!ACÚSTICA!DA!VIBRANTE!MÚLTIPLA!/r/!NO!ESPANHOL!E!EM! DADOS!DE!UM!APRENDIZ!CURITIBANO!DE!ESPANHOL!COMO!LÍNGUA! ESTRANGEIRA!

ANÁLISE!ACÚSTICA!DA!VIBRANTE!MÚLTIPLA!/r/!NO!ESPANHOL!E!EM! DADOS!DE!UM!APRENDIZ!CURITIBANO!DE!ESPANHOL!COMO!LÍNGUA! ESTRANGEIRA! Curitiba,Vol.2,nº2,jan.2jun.2014ISSN:231821028REVISTA(VERSALETE ANÁLISEACÚSTICADAVIBRANTEMÚLTIPLA/r/NOESPANHOLEEM DADOSDEUMAPRENDIZCURITIBANODEESPANHOLCOMOLÍNGUA ESTRANGEIRA ACOUSTIC(ANALYSIS(OF(THE(MULTIPLE(VIBRANT(/r/(IN(SPANISH(AND(

Leia mais

Tecnologias para pessoas com deficiência auditiva

Tecnologias para pessoas com deficiência auditiva Tecnologias para pessoas com deficiência auditiva ANTONIO BORGES TDD é a abreviatura de Telecommunications Device for the Deaf (Aparelho de telecomunicações para o surdo). O TDD é um sistema de comunicação

Leia mais

A expressão da atitude de CERTEZA em indivíduos com perda auditiva bilateral: análise prosódica.

A expressão da atitude de CERTEZA em indivíduos com perda auditiva bilateral: análise prosódica. A expressão da atitude de CERTEZA em indivíduos com perda auditiva bilateral: análise prosódica. Autores: Carla Aparecida de Vasconcelos Bruna Ferreira de Oliveira Sirley Alves Carvalho César Reis A partir

Leia mais

Codificador G729a orientado à avaliação da qualidade perceptual do sinal de voz

Codificador G729a orientado à avaliação da qualidade perceptual do sinal de voz Codificador G729a orientado à avaliação da qualidade perceptual do sinal de voz Flávio Luis Wisnevski e Rubem Dutra Ribeiro Fagundes Resumo Esta pesquisa tem como objetivo principal desenvolver um modelo

Leia mais

Sistemas e Conteúdos Multimédia. 4.4. Áudio. Nuno Miguel Gil Fonseca nuno.fonseca@estgoh.ipc.pt

Sistemas e Conteúdos Multimédia. 4.4. Áudio. Nuno Miguel Gil Fonseca nuno.fonseca@estgoh.ipc.pt Sistemas e Conteúdos Multimédia 4.4. Áudio Nuno Miguel Gil Fonseca nuno.fonseca@estgoh.ipc.pt O som é um fenómeno físico causado pela vibração da matéria (p. ex. a pele de um tambor) A vibração provoca

Leia mais

DESCRIÇÃO FONÉTICO-ACÚSTICA DAS FRICATIVAS NO PORTUGUÊS BRASILEIRO: CRITÉRIOS PARA COLETA DE DADOS E PRIMEIRAS MEDIDAS ACÚSTICAS

DESCRIÇÃO FONÉTICO-ACÚSTICA DAS FRICATIVAS NO PORTUGUÊS BRASILEIRO: CRITÉRIOS PARA COLETA DE DADOS E PRIMEIRAS MEDIDAS ACÚSTICAS DESCRIÇÃO FONÉTICO-ACÚSTICA DAS FRICATIVAS NO PORTUGUÊS BRASILEIRO: CRITÉRIOS PARA COLETA DE DADOS E PRIMEIRAS MEDIDAS ACÚSTICAS Ingrid SAMCZUK (Pontifícia Universidade Católica de São Paulo) ingridbs@uol.com.br

Leia mais

Experimentos com o Microfone de Tablets e Smartphones. Leonardo Pereira Vieira & Carlos Eduardo Aguiar

Experimentos com o Microfone de Tablets e Smartphones. Leonardo Pereira Vieira & Carlos Eduardo Aguiar UNIVERSIDADE FEDERAL DO RIO DE JANEIRO Instituto de Física Programa de Pós-Graduação em Ensino de Física Mestrado Prossional em Ensino de Física Experimentos com o Microfone de Tablets e Smartphones Leonardo

Leia mais

O que caracteriza um som?

O que caracteriza um som? O que caracteriza um som? As características de uma onda sonora são conectadas com os conceitos físicos originários da observação de Fenômenos Periódicos, tal como o Movimento Circular Uniforme (MCU) e

Leia mais

Um Framework para Desenvolvimento de Sistemas TTS Personalizados no Português do Brasil

Um Framework para Desenvolvimento de Sistemas TTS Personalizados no Português do Brasil Um Framework para Desenvolvimento de Sistemas TTS Personalizados no Português do Brasil Ericson Sarmento Costa, Anderson de Oliveira Monte, Nelson Neto, Aldebaro Klautau Universidade Federal do Pará -

Leia mais

Transmissão e comunicação de dados. Renato Machado

Transmissão e comunicação de dados. Renato Machado Renato Machado UFSM - Universidade Federal de Santa Maria DELC - Departamento de Eletrônica e Computação renatomachado@ieee.org renatomachado@ufsm.br 03 de Maio de 2012 Sumário 1 2 Modulação offset QPSK

Leia mais

5 A Utilização da Técnica do Espaço Nulo e dos Atributos Baseados na Escolha de Coeficientes de Autocorrelações

5 A Utilização da Técnica do Espaço Nulo e dos Atributos Baseados na Escolha de Coeficientes de Autocorrelações 5 A Utilização da Técnica do Espaço Nulo e dos Atributos Baseados na Escolha de Coeficientes de Autocorrelações Este capítulo apresenta uma nova proposta que consiste em empregar os atributos baseados

Leia mais

Análise Paramétrica de Sinais de Voz Baseada em Estimação Conjunta do Modelo Fonte-Filtro

Análise Paramétrica de Sinais de Voz Baseada em Estimação Conjunta do Modelo Fonte-Filtro XXX SIMPÓSIO BRASILEIRO DE TELECOMUNICAÇÕES - SBrT 2, 3-6 DE SETEMBRO DE 22, BRASÍLIA, DF Análise Paramétrica de Sinais de Voz Baseada em Estimação Conjunta do Modelo Fonte-Filtro Mário Uliani Neto, José

Leia mais

Espectro da Voz e Conversão A/D

Espectro da Voz e Conversão A/D INSTITUTO SUPERIOR TÉCNICO LICENCIATURA EM ENGENHARIA ELECTROTÉCNICA E DE COMPUTADORES GUIA DO 1º TRABALHO DE LABORATÓRIO DE SISTEMAS DE TELECOMUNICAÇÕES I Espectro da Voz e Conversão A/D Ano Lectivo de

Leia mais

3 Metodologia de Previsão de Padrões de Falha

3 Metodologia de Previsão de Padrões de Falha 3 Metodologia de Previsão de Padrões de Falha Antes da ocorrência de uma falha em um equipamento, ele entra em um regime de operação diferente do regime nominal, como descrito em [8-11]. Para detectar

Leia mais

Codificação de áudio para transmissão de voz em tempo real

Codificação de áudio para transmissão de voz em tempo real Luis Eduardo Pereira Bueno Codificação de áudio para transmissão de voz em tempo real Trabalho elaborado como parte da avaliação da disciplina Processamento Digital de Sinais, ministrada pelo prof. Marcelo

Leia mais

Processamento Auditivo (Central)

Processamento Auditivo (Central) Processamento Auditivo (Central) O QUE É PROCESSAMENTO AUDITIVO (CENTRAL)? É o conjunto de processos e mecanismos que ocorrem dentro do sistema auditivo em resposta a um estímulo acústico e que são responsáveis

Leia mais

RECEPTOR AM DSB. Transmissor. Circuito Receptor AM DSB - Profº Vitorino 1

RECEPTOR AM DSB. Transmissor. Circuito Receptor AM DSB - Profº Vitorino 1 RECEPTOR AM DSB Transmissor Circuito Receptor AM DSB - Profº Vitorino 1 O receptor super-heteródino O circuito demodulador que vimos anteriormente é apenas parte de um circuito mais sofisticado capaz de

Leia mais

COMPRESSÃO DE DADOS MULTIMÍDIA

COMPRESSÃO DE DADOS MULTIMÍDIA COMPRESSÃO DE DADOS MULTIMÍDIA Por que Compressão? Apesar da expansão das capacidade de comunicação e computação, a demanda das novas aplicações multimídia cresce rapidamente Custo de transmissão e armazenagem

Leia mais

CENTRO DE REFERÊNCIA EM DISTÚRBIOS DE APRENDIZAGEM

CENTRO DE REFERÊNCIA EM DISTÚRBIOS DE APRENDIZAGEM CENTRO DE REFERÊNCIA EM DISTÚRBIOS DE APRENDIZAGEM Terapia Fonoaudiológica com Ênfase na Estimulação do Processamento Auditivo Fonoaudióloga. Mestra. Adriana de Souza Batista Ouvir é... Habilidade que

Leia mais

Filtros de sinais. Conhecendo os filtros de sinais.

Filtros de sinais. Conhecendo os filtros de sinais. Filtros de sinais Nas aulas anteriores estudamos alguns conceitos importantes sobre a produção e propagação das ondas eletromagnéticas, além de analisarmos a constituição de um sistema básico de comunicações.

Leia mais

Sinal analógico x sinal digital. Sinal analógico. Exemplos de variações nas grandezas básicas. Grandezas básicas em sinais periódicos

Sinal analógico x sinal digital. Sinal analógico. Exemplos de variações nas grandezas básicas. Grandezas básicas em sinais periódicos Plano Redes de Computadores Transmissão de Informações nálise de Sinais ula 04 Introdução Dados, sinais e transmissão Sinal analógico x sinal digital Sinais analógicos Grandezas básicas Domínio tempo x

Leia mais

Efeito Doppler. Ondas eletromagnéticas para detecção de velocidade. Doppler Effect. Electromagnetic waves for speed detention

Efeito Doppler. Ondas eletromagnéticas para detecção de velocidade. Doppler Effect. Electromagnetic waves for speed detention Efeito Doppler Ondas eletromagnéticas para detecção de velocidade Doppler Effect Electromagnetic waves for speed detention Helton Maia, Centro Federal de Educação Tecnológica da Paraíba, Curso Superior

Leia mais

Esse barulho me deixa surda!

Esse barulho me deixa surda! Esse barulho me deixa surda! A UU L AL A Você já reparou na quantidade de ruídos ao seu redor? Basta ficar dez segundos prestando atenção aos sons para notar o som da TV, um carro passando, um cachorro

Leia mais

Nathalie Portugal Vargas

Nathalie Portugal Vargas Nathalie Portugal Vargas 1 Introdução Trabalhos Relacionados Recuperação da Informação com redes ART1 Mineração de Dados com Redes SOM RNA na extração da Informação Filtragem de Informação com Redes Hopfield

Leia mais

Voz: Atuação do Fonoaudiólogo e do Preparador Vocal

Voz: Atuação do Fonoaudiólogo e do Preparador Vocal Voz: Atuação do Fonoaudiólogo e do Preparador Vocal Apresentação: Millena Vieira (Fonoaudióloga) Joel Pinheiro (Preparador Vocal) Bárbara Camilo (3ºano) Daniele Istile (2º ano) Orientação: Profª Drª Kelly

Leia mais

UNIVERSIDADE PRESBITERIANA MACKENZIE ESCOLA DE ENGENHARIA ENGENHARIA ELÉTRICA FERNANDO CARRARA LOPEZ RENATO DALTO FANGANIELLO

UNIVERSIDADE PRESBITERIANA MACKENZIE ESCOLA DE ENGENHARIA ENGENHARIA ELÉTRICA FERNANDO CARRARA LOPEZ RENATO DALTO FANGANIELLO 0 UNIVERSIDADE PRESBITERIANA MACKENZIE ESCOLA DE ENGENHARIA ENGENHARIA ELÉTRICA FERNANDO CARRARA LOPEZ RENATO DALTO FANGANIELLO SÍNTESE E PREDIÇÃO DE SINAIS DE VOZ São Paulo 007 FERNANDO CARRARA LOPEZ

Leia mais

Ondas sonoras: Experimentos de Interferência e Ondas em Tubos

Ondas sonoras: Experimentos de Interferência e Ondas em Tubos Ondas sonoras: Experimentos de Interferência e Ondas em Tubos Relatório Final de Atividades apresentado à disciplina de F-809. Aluna: Cris Adriano Orientador: Prof. Mauro de Carvalho Resumo Este trabalho

Leia mais

Minuta de Norma AVALIAÇÃO DA EXPOSIÇÃO HUMANA À VIBRAÇÃO VISANDO O CONFORTO DA COMUNIDADE PREFÁCIO

Minuta de Norma AVALIAÇÃO DA EXPOSIÇÃO HUMANA À VIBRAÇÃO VISANDO O CONFORTO DA COMUNIDADE PREFÁCIO Minuta de Norma AVALIAÇÃO DA EXPOSIÇÃO HUMANA À VIBRAÇÃO VISANDO O CONFORTO DA COMUNIDADE PREFÁCIO As vibrações afetam as pessoas de muitas formas causando desconforto, problemas de saúde, diminuição da

Leia mais

ATIVIDADES FÍSICAS PARA SURDOS

ATIVIDADES FÍSICAS PARA SURDOS ATIVIDADES FÍSICAS PARA SURDOS Profª. Ms. * Introdução A deficiência auditiva traz algumas limitações para o desenvolvimento do indivíduo, uma vez que a audição é essencial para a aquisição da língua oral.

Leia mais

Introdução à Transmissão Digital. Funções básicas de processamento de sinal num sistema de comunicações digitais.

Introdução à Transmissão Digital. Funções básicas de processamento de sinal num sistema de comunicações digitais. Introdução à Transmissão Digital Funções básicas de processamento de sinal num sistema de comunicações digitais. lntrodução à transmissão digital Diferença entre Comunicações Digitais e Analógicas Comunicações

Leia mais

NORMA PARA CERTIFICAÇÃO E HOMOLOGAÇÃO DE TRANSMISSORES E TRANSCEPTORES MONOCANAIS ANALÓGICOS AM

NORMA PARA CERTIFICAÇÃO E HOMOLOGAÇÃO DE TRANSMISSORES E TRANSCEPTORES MONOCANAIS ANALÓGICOS AM ANEXO À RESOLUÇÃO N o 370, DE 13 DE MAIO DE 2004. NORMA PARA CERTIFICAÇÃO E HOMOLOGAÇÃO DE TRANSMISSORES E TRANSCEPTORES MONOCANAIS ANALÓGICOS AM 1. Objetivo Esta norma estabelece os requisitos técnicos

Leia mais

Descoberta de Domínio Conceitual de Páginas Web

Descoberta de Domínio Conceitual de Páginas Web paper:25 Descoberta de Domínio Conceitual de Páginas Web Aluno: Gleidson Antônio Cardoso da Silva gleidson.silva@posgrad.ufsc.br Orientadora: Carina Friedrich Dorneles dorneles@inf.ufsc.br Nível: Mestrado

Leia mais

Sensores Ultrasônicos

Sensores Ultrasônicos Sensores Ultrasônicos Introdução A maioria dos transdutores de ultra-som utiliza materiais piezelétricos para converter energia elétrica em mecânica e vice-versa. Um transdutor de Ultra-som é basicamente

Leia mais

4 Segmentação. 4.1. Algoritmo proposto

4 Segmentação. 4.1. Algoritmo proposto 4 Segmentação Este capítulo apresenta primeiramente o algoritmo proposto para a segmentação do áudio em detalhes. Em seguida, são analisadas as inovações apresentadas. É importante mencionar que as mudanças

Leia mais

I Seminário da Pós-graduação em Engenharia Elétrica

I Seminário da Pós-graduação em Engenharia Elétrica DESENVOLVIMENTO DE FERRAMENTAS COMPUTACIONAIS PARA ESTUDOS EM LINHAS SUBTERRÂNEAS DE DISTRIBUIÇÃO DE ENERGIA ELÉTRICA Danilo Sinkiti Gastaldello Aluno do Programa de Pós-Graduação em Engenharia Elétrica

Leia mais

Amostrador PAM A/D PCM D/A PAM Filtro. Figura 1 Digrama de Blocos PCM

Amostrador PAM A/D PCM D/A PAM Filtro. Figura 1 Digrama de Blocos PCM UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO DE TECNOLOGIA DEPARTAMENTO DE ENGENHARIA ELÉTRICA SISTEMAS DE TELECOMUNICAÇÕES I AULA PRÁTICA MODULAÇÃO POR AMPLITUDE DE PULSOS 1. Introdução Como o sinal

Leia mais

Pré-processamento de Sons para Reconhecimento Automático de Pássaros

Pré-processamento de Sons para Reconhecimento Automático de Pássaros Pré-processamento de Sons para Reconhecimento Automático de Pássaros Fernando Aparecido CARVALHO, Paulo César Miranda MACHADO Escola de Engenharia Elétrica e de Computação, UFG, Goiânia-GO 74001970 Email:

Leia mais

Ondas Estacionárias Apostila 2

Ondas Estacionárias Apostila 2 Ondas Estacionárias Apostila 2 1. (Uece 2015) Uma corda de violão vibra de modo que, num dado instante, a onda estacionária tenha duas cristas e três nós. Considere que o comprimento da corda vibrante

Leia mais

Quantização de Sinais de Fala Utilizando Redes Neurais Não-Supervisionadas

Quantização de Sinais de Fala Utilizando Redes Neurais Não-Supervisionadas Quantização de Sinais de Fala Utilizando Redes Neurais Não-Supervisionadas F. O. Simões 1, M. Uliani Neto 1, J. B. Machado 2, E. J. Nagle 1, L. de C. T. Gomes 1, F. O. Runstein 1 1 Fundação CPqD; 2 UNICAMP

Leia mais

Linguística P R O F A. L I L L I A N A L V A R E S F A C U L D A D E D E C I Ê N C I A D A I N F O R M A Ç Ã O

Linguística P R O F A. L I L L I A N A L V A R E S F A C U L D A D E D E C I Ê N C I A D A I N F O R M A Ç Ã O Linguística P R O F A. L I L L I A N A L V A R E S F A C U L D A D E D E C I Ê N C I A D A I N F O R M A Ç Ã O U N I V E R S I D A D E D E B R A S Í L I A Conceito Ciência que visa descrever ou explicar

Leia mais