Normalização do locutor em Sistemas de Reconhecimento de Fala para Usuários Crianças

Tamanho: px
Começar a partir da página:

Download "Normalização do locutor em Sistemas de Reconhecimento de Fala para Usuários Crianças"

Transcrição

1 Normalização do locutor em Sistemas de Reconhecimento de Fala para Usuários Crianças Ramon Mayor Martins Instituto Nacional de Telecomunicações Santa Rita do Sapucaí, Brasil Carlos Alberto Ynoguti Instituto Nacional de Telecomunicações Santa Rita do Sapucaí, Brasil ABSTRACT The automatic speech recognition technology has reached the maturity, and is now being successfully used in various applications, such as call centers, machine control, dictation, mobile phone applications, among others. However, the performance of such systems drops dramatically when used with children speakers, mainly because they have been designed for adult voices. In this paper, we investigate the performance improvement provided by the Vocal Tract Length Normalization technique in this scenario. Our results show a 3.07 % error rate reduction for a system trained with adult speakers and tested with children speakers. Author Keywords Automatic speech recognition; speaker normalization; vocal tract length normalization; children speech recognition. ACM Classification Keywords H.5.2. User Interfaces: Voice I/O INTRODUÇÃO Nos últimos anos, um progresso significativo foi alcançado em Sistemas de Reconhecimento de Fala, e vários sistemas foram criados e implantados para numerosas aplicações. A maior parte desses esforços de pesquisas, entretanto, foi devotada ao desenvolvimento dos sistemas voltados a locutores adultos. Recentemente, uma crescente atenção vem sendo dada à área das tecnologias de reconhecimento de fala para crianças, em uma variedade de cenários de aplicação como: tutores leitores, aprendizado de língua estrangeira, jogos, sites educacionais, aplicativos para celulares, entre outros [4]. Neste cenário, o desafio é então elevar o desempenho dos sistemas compatíveis de reconhecimento de fala infantil aos mesmos níveis atingidos pelos sistemas que lidam com a fala adulta [9]. Os reconhecedores automático de fala são classificadores, que mapeiam um sinal acústico (a fala) em seu equivalente Paste the appropriate copyright statement here. ACM now supports three different copyright statements: ACM copyright: ACM holds the copyright on the work. This is the historical approach. License: The author(s) retain copyright, but ACM receives an exclusive publication license. Open Access: The author(s) wish to pay for the work to be open access. The additional fee must be paid to ACM. This text field is large enough to hold the appropriate release statement assuming it is single spaced. escrito. Para isso são treinados usando-se gravações de vários locutores, até que aprendam este mapeamento. Em geral, usam-se locutores adultos para este fim, e este é um dos fatores responsáveis pelo fraco desempenho do reconhecimento de fala para crianças: as variabilidades acústicas entre locutores adultos e locutores crianças. O trato vocal, também denominado tubo acústico, é uma característica intrínseca do locutor. Este possui diferentes formas e comprimentos para cada pessoa, resultando locuções com diferentes características acústicas [3]. A estratégia mais utilizada para mitigar essa variabilidade é a Normalização de Comprimento do Trato Vocal (VTLN, em inglês) também conhecida como Normalização de Locutor [10] que, a grosso modo, tenta fazer com que todos os locutores pareçam ter mais ou menos a mesma voz para os sistemas de reconhecimento, ou seja, tenta normalizar a voz de todos os locutores para a de um locutor médio. Esta técnica tem sido bem sucedida, e é atualmente incorporada em quase todos os sistemas de reconhecimento automático de fala. Como a maioria dos sistemas de reconhecimento automático foi treinada com locutores adultos, esta técnica seria bastante útil para aumentar seu desempenho para locutores crianças. Desta forma, a principal contribuição deste trabalho é a investigação do ganho em desempenho de um sistema de reconhecimento automático de fala de um sistema treinado com vozes de locutores adultos e utilizado por locutores crianças. O restante deste trabalho é organizado da seguinte maneira: no Capítulo II será apresentada a técnica de Normalização de Comprimento do Trato Vocal (VTLN). No Capítulo III será demonstrado o processo de busca do fator de escalonamento ótimo utilizando HMM proposto por [5]. No Capítulo IV será avaliado o sistema e apresentado os procedimentos para o reconhecimento do sistema utilizando o fator de escalonamento ótimo. No Capítulo V serão apresentados os Resultados Finais do sistema normalizado com os fatores de escalonamento ótimo encontrados pelo método HMM e comparado com a Baseline (sistema sem normalização) em variadas misturas gaussianas. Finalmente no Capítulo VI são feitas as conclusões acerca do desempenho entre os sistemas. RECONHECIMENTO AUTOMÁTICO DE FALA O processo de reconhecimento de fala consiste em mapear um sinal acústico, capturado por um transdutor (usualmente um microfone ou um telefone) em um conjunto de palavras. 1

2 As etapas para converter um sinal acústico, capturado por um microfone, em seu correspondente escrito são resumidamente mostradas no diagrama abaixo: produzir suavização da amplitude do sinal amostrado, nos extremos do segmento de análise, dando maior ênfase às amostras localizadas no centro da janela. Desta forma, têm-se uma superposição entre os dados de análise de 2 janelas adjacentes. Este processo é realizado através de uma janela de Hamming, como mostra a Figura 3: Figure 1. Diagrama em blocos de um sistema de reconhecimento de fala. Após a fala ser digitalizada, passa pelo módulo de extração de parâmetros, que tem a função de fazer uma representação paramétrica da fala, com o duplo objetivo de reduzir a quantidade de informação a ser processada, e a de fazer uma representação que facilite o processo de classificação [8]. Os parâmetros mais utilizados para este fim são os melcepstrais [2], que tentam reproduzir a forma como o ouvido humano percebe os sons. O módulo de reconhecimento compara o sinal de voz parametrizado com os modelos acústicos previamente treinados e decide qual foi a palavra pronunciada. Pode também fazer uso do modelo de linguagem (se houver) para melhorar a taxa de acertos. A maioria dos sistemas de reconhecimento de fala atuais usa modelos ocultos de Markov (Hidden Markov Models, HMM) ou redes neurais artificiais para esta tarefa. Neste trabalho, a proposta é alterar o módulo de extração de parâmetros para aumentar a taxa de acertos de um sistema treinado com locutores adultos e testado com locutores crianças. Na próxima seção este módulo será apresentado em maiores detalhes para fornecer o embasamento teórico necessário à compreensão da proposta deste trabalho. MÓDULO DE EXTRAÇÃO DE PARÂMETROS O processo de extração de parâmetros pode ser resumidamente descrito através do diagrama de blocos da Figura 2: Figure 2. Diagrama de blocos do processo de parametrização do sinal de voz. Inicialmente o sinal de voz é passado por um filtro de préênfase com função de transferência (1 0,97z 1 ), que tem por função equalizar o conteúdo de frequências [8]. Depois, os parâmetros são calculados utilizando-se janelas de 25 ms, atualizadas a cada 10 ms. Este janelamento tem como função Figure 3. O processo de janelamento do sinal de voz. O processo de análise mel-cepstral, mostrado na Figura 4, consiste dos seguintes passos: para cada janela é realizada a análise cepstral, que consiste inicialmente em calcular o quadrado do módulo da FFT das amostras pertencentes à janela de análise. Em seguida, filtra-se este sinal por um banco de filtros triangulares na escala Mel. Posteriormente, calcula-se o logaritmo da energia na saída dos filtros e, por fim, calculase a IDCT (Inverse Discrete Cosine Transform) sobre estes valores, obtendo-se os parâmetros desejados [2]. Figure 4. Diagrama de blocos utilizado no cálculo dos parâmetros melcepstrais utilizando banco de filtros. O banco de filtros triangulares tem por função discretizar o espectro de frequências de forma similar à maneira como o aparelho auditivo humano processa os sinais. As frequências centrais dos filtros variam linearmente até a frequência de 1 khz e, a partir daí,crescem exponencialmente com um fator de 21/5, como mostrado na Tabela 1. Uma forma de implementação do banco de filtros, na escala Mel, é através de um conjunto de filtros passa-faixa triangulares, onde o k-ésimo filtro é construído na frequência central f(k), com sua faixa se estendendo da frequência f(k 1) à frequênciaf(k+1), de modo quef(k+1) não ultrapassasse fs/2. Na Figura 5 tem-se um exemplo de como seriam estes filtros para um sinal amostrado a 8 khz. Note que neste caso, seriam necessários 19 filtros. NORMALIZAÇÃO DE COMPRIMENTO DO TRATO VOCAL (VTLN) 2

3 Filtro Freq. Central (Hz) Filtro Freq. Central (Hz) Table 1. Frequências centrais dos filtros na escala mel. Figure 6. Efeito do valor de α na compressão ou expansão do banco de filtros mel. Figure 5. Banco de filtros na escala mel para uma frequência de amostragem de 8 khz Hz. O processo de normalização dos locutores é representado pela transformação dos parâmetros acústicos da fala. Essa transformação é executada por funções de escalonamento que buscam estimar a posição dos formantes de cada locutor para então minimizar as diferenças destes em relação a um locutor médio. As funções de escalonamento são obtidas através da compressão ou ampliação do espectro da fala [10]. Este processo é descrito em detalhes na seção a seguir. Transformação de Parâmetros Esta transformação dos parâmetros acústicos do sinal de fala é obtida através do escalonamento do eixo de frequências do banco de filtros mel através de um fator α, que representada a razão entre o comprimento do trato vocal do locutor sendo analisado e o comprimento do trato vocal utilizado como referência [5]. Ao final deste processo tem-se um novo banco de filtros, com frequências escalonadas segundo (1) onde: f: frequência original na escala Mel; α: fator de distorção; f = f β (1) β = 1/α: fator de escalonamento em frequência; f : frequência escalonada. Dependendo do fator de escalonamento utilizado, estas frequências podem ser expandidas (α < 1) ou comprimidas (α > 1), como mostra a Figura 6. Desta forma o objetivo da normalização de locutor é encontrar um valor de α que faça com que a saída do extrator de parâmetros seja semelhante ao de um locutor médio, para uma dada sentença. Vale comentar que locutores com trato vocal menor que o do locutor de referência (crianças, por exemplo) terão um valor ótimo de α menor que 1, enquanto que locutores com trato vocal maior que o do locutor de referência terão um valor ótimo de α maior que 1. A forma de escolher este fator de escalonamento é detalhada a seguir. Escolha do Fator Ótimo de Escalonamento O fator ótimo de escalonamento é aquele que maximiza a probabilidade de um conjunto de características acústicas de um determinado locutor em relação a um modelo acústico de referência [5]: onde: ˆα i = argmaxp (Xi α λ,w i ) (2) α X α i = { X α i,1,xα i,2,...,xα i,n} : é o conjunto de características acústicas de todas as N locuções do locutor i, escalonado deα. W i = {W i,1,w i,2,...,w i,n }: é o conjunto de transcrições de todas as N locuções associadas a um dado locutori. λ: é o modelo de referência. Com a métrica estabelecida em (2), a escolha pelo valor ótimo deαérealizada por meio de varredura em uma faixa de valores. Para sistemas treinados com homens e testados com crianças, o fator de escalonamento médio é de α = 0.70, que corresponde à razão (12/19), que é a razão entre o tamanho médio 3

4 treino teste homens muheres meninos meninas Table 2. Distribuição dos locutores de treinamento e teste para a base TIDIGITS. do comprimento vocal dos locutores crianças (12 cm) pelo comprimento médio do trato vocal dos locutores homens (19 cm) [10]. Desta forma, neste trabalho optou-se por fazer o processo de busca no intervalo de α [0,70;1,12], com passo de 0,02, onde o extremo superior do intervalo foi sugerido por [5]. APARATO EXPERIMENTAL Base de dados Para os testes foi utilizada a base de dados TIDIGITS [7]. O corpus foi coletado a uma taxa de amostragem de 20 khz, com uma resolução de 16 bits, em um ambiente com baixo ruído ambiental. Para estes testes as gravações tiveram suas frequências de amostragem abaixadas para 8 khz. Nesta base de dados há 326 locutores (111 homens, 114 mulheres, 50 meninos e 51 meninas), dividido em subconjuntos de treinamento e teste, conforme a Tabela 2 abaixo: Cada locutor desta base de dados registrou 77 gravações, divididas da seguinte maneira: 11 dígitos isolados (zero, oh, one, two, three, four, five, six, seven, eight and nine), cada um deles repetidos duas vezes; 11 sequências of 2, 3, 4, 5 e 7 dígitos O sinal de voz foi parametrizado por meio de 13 coeficientes mel-cepstrais, usando janelas de 25 ms, atualizadas a cada 10 ms. Um filtro de pré-ênfase com função de transferência (1 0.97z 1 ) e uma janela de Hamming foram aplicados ao sinal antes do cálculo dos parâmetros. Também a primeira e a sgunda derivadas destes parâmetros acústicos foram utilizadas, gerando vetores acústicos de dimensão 39. Sistema de reconhecimento de fala A suíte HTK [6], desenvolvida nauniversidade de Cambridge, e largamente utilizada nas pesquisas em reconhecimento de fala foi utilizada neste trabalho. Cada um dos dígitos foi modelado como uma concatenação de subunidades fonéticas, retiradas do dicionário fonético ARPAbet [1], e modeladas através de um HMM de 5 estados com arquitetura left-right (sendo que o primeiro e o último estado são não emissores). O htk também foi utilizado para fornecer as métricas (2). RESULTADOS EXPERIMENTAIS O cenário que se quer testar é o de um sistema de reconhecimento de fala treinado por locutores adultos e utilizado por locutores crianças, e medir a melhoria que a técnica de normalização de locutor pode fornecer a tal sistema. Tendo em vista que as aplicações envolvendo locutores crianças podem ir desde sistemas de aprendizado rodando em computadores pessoais (com grandes recursos disponíveis) a brinquedos movidos à pilha (com uma quantidade bastante limitada de recursos), foram realizados vários testes variandose o número de gaussianas nas misturas do HMM, para obter uma visão mais ampla do efeito da normalização. Testes iniciais Inicialmente treinou-se um sistema com os locutores adultos de ambos os sexos da base de treinamento e realizou-se um teste com os locutores crianças de teste, e os resultados podem ser vistos na curva superior da Figura 7. Nesta, WER (Word Error Rate) refere-se à taxa de erro de palavras, que é calculada como a razão entre o número de erros de reconhecimento e o número de palavras na sentença. Testes com normalização de locutor Em um segundo teste, as locuções dos locutores crianças passaram pelo processo de normalização antes de serem apresentados ao sistema de reconhecimento, cada qual com o respectivo valor ótimo para o coeficiente α, e os resultados são mostrados na na curva inferior da Figura 7. WER (%) Referência 7.28 Normalizado número de gaussianas Figure 7. Comportamento da curva da taxa de erro WER% o sistema de referência e o sistema normalizado, para diferentes números de gaussianas na mistura. ANÁLISE DOS RESULTADOS Analisando-se as curvas da Figura 7 pode-se observar que o processo de normalização de locutor leva a uma diminuição na taxa de erros. O ganho máximo foi de 3.86% para o sistema com 4 gaussianas, enquanto que o ganho mínimo foi de 2,81% para o sistema com 1 gaussiana. O ganho médio foi de 3,34%. O melhor desempenho foi alcançado com 64 gaussianas, quando o sistema normalizado apresentou uma taxa de erro de palavras de 1,88%, o que é um resultado muito bom, tendo em vista que trata-se de uma adaptação de um sistema treinado para adultos e utilizado por crianças. CONCLUSÕES Neste trabalho mostramos que é possível aumentar o desempenho de sistemas de reconhecimento automático de fala treinados com locutores adultos para uso com locutores crianças, usando a técnica de normalização de locutor. 4

5 O ganho médio obtido com tal procedimento é de 3,34% na taxa de erros de palavras, se compararmos um sistema adaptado com um sistema não adaptado, sendo que é possível alcançar uma taxa de erro de palavras de 1,88% em um cenário de reconhecimento de dígitos conectados, o que é um resultado muito bom, quando se compara aos resultados obtidos na literatura. Desse modo o método descrito nesse trabalho faculta sua aplicação em diversas áreas que visam a interação criançamáquina, como por exemplo, Sistemas de Reconhecimento de Fala embarcados em brinquedos, aplicativos para celulares, sites educacionais, entre outras aplicações. AGRADECIMENTOS Os autores gostariam de agradecer à Capes e à Fapemig pelo financiamento parcial desta pesquisa. REFERENCES 1. The cmu pronouncing dictionary Davis, S., and Mermelstein, P. Comparison of Parametric Representations for Monosyllabic Word Recognition in Continuously Spoken Sentences. IEEE Trans. Acoust., Speech, Signal Processing 28, 4 (1980), Deller Jr., J. R., Proakis, J. G., and Hansen, J. Discrete time processing of speech signals. MacMillan Publishing Company, Gerosa, M., Giuliani, D., Narayanan, S., and Potaminos, A. A review of asr technologies for children. In Proc. 2nd. Workshop on Child, Computer and Interaction (2009), Lee, L., and Rose, R. A Frequency Warping Approach to Speaker Normalization. IEEE Trans. Speech Audio Processing 6, 1 (1998), Leonard, R. G., and Doddington, G. Hidden markov model toolkit Leonard, R. G., and Doddington, G. Tidigits, Rabiner, L., and Juang, B.-H. Fundamentals of Speech Recognition. Prentice Hal, Russell, M., and D arcy, S. Challenges for computer recognition of children s speech. In Proc.of SLaTE (2007), Umesh, S., and Sanand, D. R. VTLN Using Analytically Determined Linear-Transformation on Conventional MFCC. IEEE Trans. Speech Audio Language Processing 20, 5 (2012),

3 Identificação de Locutor Usando Técnicas de Múltiplos Classificadores em Sub-bandas Com Pesos Não-Uniformes

3 Identificação de Locutor Usando Técnicas de Múltiplos Classificadores em Sub-bandas Com Pesos Não-Uniformes 3 Identificação de Locutor Usando Técnicas de Múltiplos Classificadores em Sub-bandas Com Pesos Não-Uniformes Neste capítulo, é apresentada uma nova proposta de combinação de múltiplos classificadores

Leia mais

3 Os Atributos MFCC e PNCC do Sinal de Voz

3 Os Atributos MFCC e PNCC do Sinal de Voz 3 Os Atributos MFCC e PNCC do Sinal de Voz No sinal de voz incorporam-se informações importantes do falante, que são altamente perceptíveis, tais como, dialeto, contexto, estilo de falar, estado emocional,

Leia mais

4 Resultados de Simulação e Avaliação das Técnicas Utilizadas para o Reconhecimento de Locutor Independente do Texto em Presença de Ruído

4 Resultados de Simulação e Avaliação das Técnicas Utilizadas para o Reconhecimento de Locutor Independente do Texto em Presença de Ruído 4 Resultados de Simulação e Avaliação das Técnicas Utilizadas para o Reconhecimento de Locutor Independente do Texto em Presença de Ruído Neste capítulo serão apresentadas, avaliadas e comparadas as técnicas

Leia mais

Reconhecimento de Locutor Usando Misturas de Gaussianas

Reconhecimento de Locutor Usando Misturas de Gaussianas Reconhecimento de Locutor Usando Misturas de Gaussianas Alessandra Adami Pinto Instituto Nacional de Telecomunicações alessandra@gec.inatel.br Carlos Alberto Ynoguti Instituto Nacional de Telecomunicações

Leia mais

RECONHECIMENTO DE FALANTE

RECONHECIMENTO DE FALANTE MARCOS PAULO RIKI YANASE RECONHECIMENTO DE FALANTE Trabalho da disciplina de Processamento Digital de Sinais do curso de Engenharia Elétrica, Setor de Tecnologia da Universidade Federal do Paraná. Prof.

Leia mais

LSF na Verificação de Orador

LSF na Verificação de Orador LSF na Verificação de Orador Hugo Cordeiro Carlos Meneses M2A/ISEL Grupo de Multimédia e Aprendizagem Automática Instituto Superior de Engenharia de Lisboa Rua Conselheiro Emídio Navarro nº1, 1950-062

Leia mais

Arquitetura Específica de Pré-processamento com Extração de Parâmetros Mel-cepstrais para um Sistema de Reconhecimento Automático de Voz

Arquitetura Específica de Pré-processamento com Extração de Parâmetros Mel-cepstrais para um Sistema de Reconhecimento Automático de Voz Arquitetura Específica de Pré-processamento com Extração de Parâmetros Mel-cepstrais para um Sistema de Reconhecimento Automático de Voz José Gómez-Cipriano, Roger Pizzato Nunes, Sergio Bampi, Dante Barone

Leia mais

O processo de filtragem de sinais pode ser realizado digitalmente, na forma esquematizada pelo diagrama apresentado a seguir:

O processo de filtragem de sinais pode ser realizado digitalmente, na forma esquematizada pelo diagrama apresentado a seguir: Sistemas e Sinais O processo de filtragem de sinais pode ser realizado digitalmente, na forma esquematizada pelo diagrama apresentado a seguir: 1 Sistemas e Sinais O bloco conversor A/D converte o sinal

Leia mais

RECONHECIMENTO DE GÊNERO ATRAVÉS DA VOZ

RECONHECIMENTO DE GÊNERO ATRAVÉS DA VOZ RECONHECIMENTO DE GÊNERO ATRAVÉS DA VOZ Marcela Ribeiro Carvalho marcela@enecar.com.br IFG/Câmpus Goiânia Hipólito Barbosa Machado Filho hipolito.barbosa@ifg.edu.br IFG/Câmpus Goiânia Programa Institucional

Leia mais

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica REDES NEURAIS ARTIFICIAIS AULA 03 Prof. Dr. André A. P. Biscaro 1º Semestre de 2017 INTRODUÇÃO Aprendizagem é um processo pelo qual os parâmetros livres de uma rede neural são adaptados através de um processo

Leia mais

Um Wrapper para Seleção de Eletrodos em Interfaces Cérebro Computador Baseadas em Imaginação de Movimento

Um Wrapper para Seleção de Eletrodos em Interfaces Cérebro Computador Baseadas em Imaginação de Movimento Um Wrapper para Seleção de Eletrodos em Interfaces Cérebro Computador Baseadas em Imaginação de Movimento Maria B Kersanach Luisa F S Uribe Thiago B S Costa Romis Attux 2015-2016 Interface Cérebro Computador:

Leia mais

Figura 1 Sinais e Transformadas de Fourier (HAYKIN; VAN VEEN, 2001).

Figura 1 Sinais e Transformadas de Fourier (HAYKIN; VAN VEEN, 2001). Processamento Digital de Sinais Aula 3 Professor Marcio Eisencraft março 22 Aula 3 TFD: Transformada de Fourier Discreta Bibliografia OPPEHEIM, A. V.; SCHAFER, R W.; BUCK, J. R. Discrete-time signal processing,

Leia mais

RECONHECIMENTO DE VOZ PARA PALAVRAS ISOLADAS

RECONHECIMENTO DE VOZ PARA PALAVRAS ISOLADAS UN IVERS ID ADE FEDER A L DE PERNAM B UCO GRADUAÇÃO EM ENGENHARIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA RECONHECIMENTO DE VOZ PARA PALAVRAS ISOLADAS TRABALHO DE GRADUAÇÃO Aluno: Anderson Gomes da Silva {ags@cin.ufpe.br}

Leia mais

Diferenças entre o Português Europeu e o Português Brasileiro: Um Estudo Preliminar sobre a Pronúncia no Canto Lírico

Diferenças entre o Português Europeu e o Português Brasileiro: Um Estudo Preliminar sobre a Pronúncia no Canto Lírico Diferenças entre o Português Europeu e o Português Brasileiro: Um Estudo Preliminar sobre a Pronúncia no Canto Lírico Marilda Costa, Luis M.T. Jesus, António Salgado, Moacyr Costa Filho UNIVERSIDADE DE

Leia mais

ESTUDO DE ALGORITMO DE SEGMENTAÇÃO DE FALA

ESTUDO DE ALGORITMO DE SEGMENTAÇÃO DE FALA ESTUDO DE ALGORITMO DE SEGMENTAÇÃO DE FALA Vinicius de Souza 1, Marcelo de Oliveira Rosa 2 1,2 Departamento Acadêmico de Eletrotécnica Campus Curitiba Universidade Tecnológica Federal do Paraná - UTFPR

Leia mais

Métodos Matemáticos e Computacionais em Música

Métodos Matemáticos e Computacionais em Música Métodos Matemáticos e Computacionais em Música Luiz Velho, Paulo Cesar Carvalho, Sergio Krakowski, Marcelo Cicconet IMPA Processamento de Sinais Sonoros Luiz Velho Som - Sinal 1 D Música e Som Musica

Leia mais

API para obtenção da Frequência de um Sinal de Som por meio da FFT em Java ME

API para obtenção da Frequência de um Sinal de Som por meio da FFT em Java ME API para obtenção da Frequência de um Sinal de Som por meio da FFT em Java ME Marcelo Ruaro Departamento de Engenharias e Ciência da Computação Universidade Regional Integrada do Alto Uruguai e das Missões

Leia mais

MÉTODOS DE INTERPOLAÇÃO PARA RECONSTRUÇÃO DE DADOS FALTANTES EM SISTEMAS ROBUSTOS DE RECONHECIMENTO AUTOMÁTICO DE FALA

MÉTODOS DE INTERPOLAÇÃO PARA RECONSTRUÇÃO DE DADOS FALTANTES EM SISTEMAS ROBUSTOS DE RECONHECIMENTO AUTOMÁTICO DE FALA MÉTODOS DE INTERPOLAÇÃO PARA RECONSTRUÇÃO DE DADOS FALTANTES EM SISTEMAS ROBUSTOS DE RECONHECIMENTO AUTOMÁTICO DE FALA ELAINE PEREIRA LIMA SCARTEZZINI JULHO/ 2015 MÉTODOS DE INTERPOLAÇÃO PARA RECONSTRUÇÃO

Leia mais

Parâmetros importantes de um Analisador de Espectros: Faixa de frequência. Exatidão (frequência e amplitude) Sensibilidade. Resolução.

Parâmetros importantes de um Analisador de Espectros: Faixa de frequência. Exatidão (frequência e amplitude) Sensibilidade. Resolução. Parâmetros importantes de um Analisador de Espectros: Faixa de frequência Exatidão (frequência e amplitude) Sensibilidade Resolução Distorção Faixa dinâmica Faixa de frequência: Determina as frequências

Leia mais

I-8 Digitalização e Reconstrução

I-8 Digitalização e Reconstrução I-8 Digitalização e Reconstrução Comunicações (15 de novembro de 2016) ISEL - ADEETC - Comunicações 1 Sumário 1. Enquadramento em SCD Transmissão de sinal analógico sobre SCD 2. Teorema da Amostragem Ritmo

Leia mais

INF Fundamentos da Computação Gráfica Professor: Marcelo Gattass Aluno: Rogério Pinheiro de Souza

INF Fundamentos da Computação Gráfica Professor: Marcelo Gattass Aluno: Rogério Pinheiro de Souza INF2608 - Fundamentos da Computação Gráfica Professor: Marcelo Gattass Aluno: Rogério Pinheiro de Souza Trabalho 02 Visualização de Imagens Sísmicas e Detecção Automática de Horizonte Resumo Este trabalho

Leia mais

MÉTODOS QUANTITATIVOS PARA CIÊNCIA DA COMPUTAÇÃO EXPERIMENTAL

MÉTODOS QUANTITATIVOS PARA CIÊNCIA DA COMPUTAÇÃO EXPERIMENTAL MÉTODOS QUANTITATIVOS PARA CIÊNCIA DA COMPUTAÇÃO EXPERIMENTAL Pedro Henrique Bragioni Las Casas Pedro.lascasas@dcc.ufmg.br Apresentação baseada nos slides originais de Jussara Almeida e Virgílio Almeida

Leia mais

Simplificações para Redução do Custo Computacional da Pré-ênfase de Voz na Plataforma Arduino

Simplificações para Redução do Custo Computacional da Pré-ênfase de Voz na Plataforma Arduino Computer on the Beach 2015 - Artigos Completos 289 Simplificações para Redução do Custo Computacional da Pré-ênfase de Voz na Plataforma Arduino Emerson B. da Cunha 1, Pedro Ítalo R. Albuquerque 1, Daniella

Leia mais

Rede RBF (Radial Basis Function)

Rede RBF (Radial Basis Function) Rede RBF (Radial Basis Function) André Tavares da Silva andre.silva@udesc.br Roteiro Introdução à rede neural artificial RBF Teorema de Cover da separabilidade de padrões RBF x MLP RBF Função de ativação

Leia mais

Filtros de Média Movente

Filtros de Média Movente Processamento Digital de Sinais Filtros de Média Movente Prof. Dr. Carlos Alberto Ynoguti Características É o filtro ótimo para a tarefa de remover ruído aleatório de um sinal, e manter uma resposta a

Leia mais

Redes Neurais Convolucionais

Redes Neurais Convolucionais André Gustavo Hochuli Orientador: Prof. Dr. Luiz Eduardo Soares de Oliveira Programa de Pós-Graduação em Informática Departamento de Informática UFPR http://www.inf.ufpr.br/aghochuli/caffe/ Redes Neurais

Leia mais

Um Ambiente para Processamento Digital de Sinais Aplicado à Comunicação Vocal Homem-Máquina

Um Ambiente para Processamento Digital de Sinais Aplicado à Comunicação Vocal Homem-Máquina Um Ambiente para Processamento Digital de Sinais Aplicado à Comunicação Vocal Homem-Máquina Márcio G. Passos e Patric L. Silva marcio_passos@yahoo.com.br e lacouth@gmail.com Silvana Luciene do N. Cunha

Leia mais

Transformada Discreta de Fourier

Transformada Discreta de Fourier Processamento Digital de Sinais Transformada Discreta de Fourier Prof. Dr. Carlos Alberto Ynoguti Jean Baptiste Joseph Fourier Nascimento: 21 de março de 1768 em Auxerre, Bourgogne, França Morte: 16 de

Leia mais

ALEXANDRE TEIXEIRA MAFRA RECONHECIMENTO AUTOMÁTICO DE LOCUTOR EM MODO INDEPENDENTE DE TEXTO POR SELF-ORGANIZING MAPS

ALEXANDRE TEIXEIRA MAFRA RECONHECIMENTO AUTOMÁTICO DE LOCUTOR EM MODO INDEPENDENTE DE TEXTO POR SELF-ORGANIZING MAPS ALEXANDRE TEIXEIRA MAFRA RECONHECIMENTO AUTOMÁTICO DE LOCUTOR EM MODO INDEPENDENTE DE TEXTO POR SELF-ORGANIZING MAPS Dissertação apresentada à Escola Politécnica da Universidade de São Paulo para obtenção

Leia mais

Processamento Digital de Sinais. Aplicações da DFT. Prof. Dr. Carlos Alberto Ynoguti

Processamento Digital de Sinais. Aplicações da DFT. Prof. Dr. Carlos Alberto Ynoguti Processamento Digital de Sinais Aplicações da DFT Prof. Dr. Carlos Alberto Ynoguti Aplicações da DFT Nesta seção iremos apresentar três aplicações bastante comuns da DFT: 1) Análise espectral de sinais

Leia mais

Reconhecimento de voz utilizando Wavelet e Classificador Neural

Reconhecimento de voz utilizando Wavelet e Classificador Neural Reconhecimento de voz utilizando Wavelet e Classificador Neural Oséas Pereira Rocha CEFETCAMPOS Centro Federal de Educação Tecnológica de Campos Rua Dr Siqueira 273, Bairro Dom Bosco, Campos dos Goytacazes,

Leia mais

Codificador de Voz Pessoal

Codificador de Voz Pessoal Codificador de Voz Pessoal Raissa Bezerra Rocha*, Gláucio Bezerra Rocha e **Marcelo Sampaio de Alencar *Aluna de Mestrado do Programa de Pós-Graduação em Engenharia Elétrica (UFCG/COPELE) **Professor do

Leia mais

Novos Recursos e Utilização de Adaptação de Locutor no Desenvolvimento de um Sistema de Reconhecimento de Voz para o Português Brasileiro

Novos Recursos e Utilização de Adaptação de Locutor no Desenvolvimento de um Sistema de Reconhecimento de Voz para o Português Brasileiro Novos Recursos e Utilização de Adaptação de Locutor no Desenvolvimento de um Sistema de Reconhecimento de Voz para o Português Brasileiro Patrick Silva Nelson Neto Aldebaro Klautau Simpósio Brasileiro

Leia mais

Transformada de Discreta de Co senos DCT

Transformada de Discreta de Co senos DCT Transformada de Discreta de Co senos DCT O primeiro passo, na maioria dos sistemas de compressão de imagens e vídeo, é identificar a presença de redundância espacial (semelhança entre um pixel e os pixels

Leia mais

DETERMINAÇÃO DO GÊNERO DO LOCUTOR USANDO A TRANSFORMADA RÁPIDA DE FOURIER

DETERMINAÇÃO DO GÊNERO DO LOCUTOR USANDO A TRANSFORMADA RÁPIDA DE FOURIER Revista Ciências Exatas ISSN: 1516-893 Vol. 1 Nº. Ano 015 Natanael M. Gomes Universidade de Taubaté Marcio Abud Marcelino Universidade Estadual Paulista Universidade de Taubaté Francisco José Grandinetti

Leia mais

Introdução a aquisição e processamento de sinais

Introdução a aquisição e processamento de sinais TAPS Introdução a aquisição e processamento de sinais Prof. Theo Z. Pavan Departamento de Física - Faculdade de Filosofia, Ciências e Letras de Ribeirão Preto-USP Roteiro Aquisição de sinais e frequência

Leia mais

Princípios de Telecomunicações. PRT60806 Aula 19: Modulação por Código de Pulso (PCM) Professor: Bruno Fontana da silva 2014

Princípios de Telecomunicações. PRT60806 Aula 19: Modulação por Código de Pulso (PCM) Professor: Bruno Fontana da silva 2014 1 Princípios de Telecomunicações PRT60806 Aula 19: Modulação por Código de Pulso (PCM) Professor: Bruno Fontana da silva 2014 Bloco de Comunicação Genérico Emissor sinais analógicos x sinais digitais Sinais

Leia mais

IMPLEMENTAÇÃO DO FREx_SVM: MÁQUINAS DE VETOR SUPORTE PARA CLASSIFICAÇÃO EM MÚLTIPLAS CLASSES

IMPLEMENTAÇÃO DO FREx_SVM: MÁQUINAS DE VETOR SUPORTE PARA CLASSIFICAÇÃO EM MÚLTIPLAS CLASSES IMPLEMENTAÇÃO DO FREx_SVM: MÁQUINAS DE VETOR SUPORTE PARA CLASSIFICAÇÃO EM MÚLTIPLAS CLASSES Aluno: Aarão Irving Manhães Marins Orientador: Marley Maria Bernardes Rebuzzi Vellasco Introdução A máquina

Leia mais

UNIVERSIDADE ESTADUAL DE CAMPINAS. Instituto de Matemática, Estatística e Computação Científica

UNIVERSIDADE ESTADUAL DE CAMPINAS. Instituto de Matemática, Estatística e Computação Científica UNIVERSIDADE ESTADUAL DE CAMPINAS Instituto de Matemática, Estatística e Computação Científica Relatório Final - MS777 Modelagem matemático/probabilística dos módulos acústicos e de linguagem de sistemas

Leia mais

O Manual do sam. Peter H. Grasch

O Manual do sam. Peter H. Grasch Peter H. Grasch 2 Conteúdo 1 Introdução 5 1.1 Fundo............................................. 5 1.1.1 Testes efectivos................................... 5 2 Usar o sam 6 2.1 Ficheiros de entrada &

Leia mais

Reconhecimento de Padrões

Reconhecimento de Padrões Reconhecimento de Padrões André Tavares da Silva andre.silva@udesc.br Roteiro da aula Conceitos básicos sobre reconhecimento de padrões Visão geral sobre aprendizado no projeto de classificadores Seleção

Leia mais

CONVERSORES AD/DA (ÁUDIO CODEC)

CONVERSORES AD/DA (ÁUDIO CODEC) MICROPROCESSADORES II (EMA864315) CONVERSORES AD/DA (ÁUDIO CODEC) 1 O SEMESTRE / 2017 Alexandro Baldassin MOTIVAÇÃO Sistemas digitais são usados para processar informação Informação no mundo real é analógica

Leia mais

Processamento Digital de Sinais. Conversão A/D e D/A. Prof. Dr. Carlos Alberto Ynoguti

Processamento Digital de Sinais. Conversão A/D e D/A. Prof. Dr. Carlos Alberto Ynoguti Processamento Digital de Sinais Conversão A/D e D/A Prof. Dr. Carlos Alberto Ynoguti Introdução A maioria dos sinais encontrados na natureza é contínua Para processá-los digitalmente, devemos: Converter

Leia mais

Aula 22. Conversão Sigma-Delta (continuação)

Aula 22. Conversão Sigma-Delta (continuação) Aula 22 Conversão Sigma-Delta (continuação) A estrutura mostrada na figura A.22.1 é chamado modulador Sigma-Delta (Σ- ). Esta estrutura, além de ser mais simples, pode ser considerada como uma versão suavizada

Leia mais

I-7 Digitalização e Reconstrução

I-7 Digitalização e Reconstrução I-7 Digitalização e Reconstrução (29 Novembro 2010) 1 Sumário 1. Teorema da Amostragem 1. Ritmo de Nyquist 2. Amostragem Ideal e Natural (análise no tempo e na frequência) 1. Sinais Passa Baixo 2. Sinais

Leia mais

1 O esquema de Alamouti: Diversidade na transmissão

1 O esquema de Alamouti: Diversidade na transmissão 1 O esquema de Alamouti: Diversidade na transmissão 1.1 O Caso de uma antena receptora A Figura?? mostra a representação em banda básica do esquema de Alamouti com diversidade na transmissão. O esquema

Leia mais

Uma Introdução a SVM Support Vector Machines. Obs: Baseada nos slides de Martin Law

Uma Introdução a SVM Support Vector Machines. Obs: Baseada nos slides de Martin Law Uma Introdução a SVM Support Vector Machines Obs: Baseada nos slides de Martin Law Sumário Historia das SVMs Duas classes, linearmente separáveis O que é um bom limite para a decisão? Duas classes, não

Leia mais

Curso de Engenharia Elétrica Processamento Digital de Sinais II Exercícios sobre filtros não recursivos Data de entrega: 17/11/2015

Curso de Engenharia Elétrica Processamento Digital de Sinais II Exercícios sobre filtros não recursivos Data de entrega: 17/11/2015 Curso de Engenharia Elétrica Processamento Digital de Sinais II Exercícios sobre filtros não recursivos Data de entrega: 17/11/2015 1) Projete um filtro FIR passa baixas de 3 etapas com frequência de corte

Leia mais

Robustez ao Ruído e Confiança na Pontuação

Robustez ao Ruído e Confiança na Pontuação Professor: T. J. Hazen Manejando variabilidade nas condições acústicas Compensação do Canal Compensação do ruído de fundo Principais ruídos e artefatos não vocais Calculando e aplicando pontuação confiável

Leia mais

Processamento Digital de Sinais. Conversão A/D e D/A. Prof. Dr. Carlos Alberto Ynoguti

Processamento Digital de Sinais. Conversão A/D e D/A. Prof. Dr. Carlos Alberto Ynoguti Processamento Digital de Sinais Conversão A/D e D/A Prof. Dr. Carlos Alberto Ynoguti Introdução A maioria dos sinais encontrados na natureza é contínua Para processá los digitalmente, devemos: Converter

Leia mais

Lição de Processamento Digital de Sinais. Operação de Zooming em Processamento de Imagem. Rui Jesus

Lição de Processamento Digital de Sinais. Operação de Zooming em Processamento de Imagem. Rui Jesus Lição de Processamento Digital de Sinais Operação de Zooming em Processamento de Imagem Rui Jesus ISEL, Julho 22 .INTRODUÇÂO. Enquadramento Esta lição destina-se aos alunos da disciplina de Processamento

Leia mais

Introdução a filtros digitais. Theo Pavan e Adilton Carneiro TAPS

Introdução a filtros digitais. Theo Pavan e Adilton Carneiro TAPS Introdução a filtros digitais Theo Pavan e Adilton Carneiro TAPS Filtro anti-aliasing Com um sinal já digitalizado não é possível distinguir entre uma frequência alias e uma frequência que realmente esteja

Leia mais

Instituto de Ciências Exatas e Tecnológicas - Centro Universitário Feevale; 2 Instituto de Informática - Universidade Federal do Rio Grande do Sul.

Instituto de Ciências Exatas e Tecnológicas - Centro Universitário Feevale; 2 Instituto de Informática - Universidade Federal do Rio Grande do Sul. Técnicas para a implementação de sistemas de reconhecimento automático de voz José Luis Gómez Cipriano 1, 2, Roger Pizzatto Nunes 2, Dante Augusto Couto Barone 2 1 Instituto de Ciências Exatas e Tecnológicas

Leia mais

5 Análise Experimental

5 Análise Experimental 5 Análise Experimental 5.1. Base de dados para testes Foram gravados diversos vídeos que serviram para realizar os testes realizados nesta dissertação. Cada um dos vídeos gerados para medir qualidade da

Leia mais

Paradigmas de Aprendizagem

Paradigmas de Aprendizagem Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCA UFES Departamento de Computação Paradigmas de Aprendizagem Redes Neurais Artificiais Site: http://jeiks.net E-mail: jacsonrcsilva@gmail.com

Leia mais

Formatos de Áudio e Vídeo Digital Introdução ao Áudio Digital

Formatos de Áudio e Vídeo Digital Introdução ao Áudio Digital Redes Multimídia 2016.2 Formatos de Áudio e Vídeo Digital Curso Superior de Tecnologia em Sistemas para Internet Turma: TEC.SIS.4T Redes Multimídia Conteúdo Programático :: 1 a Unidade 1. Aplicações multimídia

Leia mais

SISTEMA DE PRÉ-PROCESSAMENTO PARA O RECONHECIMENTO AUTOMÁTICO DE VOZ UTILIZANDO FPGAS

SISTEMA DE PRÉ-PROCESSAMENTO PARA O RECONHECIMENTO AUTOMÁTICO DE VOZ UTILIZANDO FPGAS SISTEMA DE PRÉ-PROCESSAMENTO PARA O RECONHECIMENTO AUTOMÁTICO DE VOZ UTILIZANDO FPGAS José L. Gómez-Cipriano, Roger Pizzato Nunes, Dante A.Couto Barone, Sergio Bampi Instituto de Informática Universidade

Leia mais

I-2 Sinais: classificação, propriedades e operações

I-2 Sinais: classificação, propriedades e operações I-2 Sinais: classificação, propriedades e operações Comunicações (24 de março de 2017) ISEL - ADEETC - Comunicações 1 Sumário 1. Classificação de sinais 2. Sinais contínuos e discretos 3. Sinais não periódicos

Leia mais

VISÃO COMPUTACIONAL PARA RECONHECIMENTO DE FACES APLICADO NA IDENTIFICAÇÃO E AUTENTICAÇÃO DE USUÁRIOS NA WEB. Márcio Koch

VISÃO COMPUTACIONAL PARA RECONHECIMENTO DE FACES APLICADO NA IDENTIFICAÇÃO E AUTENTICAÇÃO DE USUÁRIOS NA WEB. Márcio Koch VISÃO COMPUTACIONAL PARA RECONHECIMENTO DE FACES APLICADO NA IDENTIFICAÇÃO E AUTENTICAÇÃO DE USUÁRIOS NA WEB Márcio Koch Orientador: Jacques Robert Heckmann ROTEIRO Introdução Objetivos do trabalho Fundamentação

Leia mais

IDENTIFICAÇÃO DE LOCUTOR: OTIMIZAÇÃO DO NÚMERO DE COMPONENTES GAUSSIANAS. Ricardo José da Rocha Cirigliano

IDENTIFICAÇÃO DE LOCUTOR: OTIMIZAÇÃO DO NÚMERO DE COMPONENTES GAUSSIANAS. Ricardo José da Rocha Cirigliano IDENTIFICAÇÃO DE LOCUTOR: OTIMIZAÇÃO DO NÚMERO DE COMPONENTES GAUSSIANAS Ricardo José da Rocha Cirigliano DISSERTAÇÃO SUBMETIDA AO CORPO DOCENTE DA COORDENAÇÃO DOS PROGRAMAS DE PÓS-GRADUAÇÃO DE ENGENHARIA

Leia mais

Análise de Sinais e Sistemas

Análise de Sinais e Sistemas Universidade Federal da Paraíba Departamento de Engenharia Elétrica Análise de Sinais e Sistemas Luciana Ribeiro Veloso luciana.veloso@dee.ufcg.edu.br ANÁLISE DE SINAIS E SISTEMAS Ementa: Sinais contínuos

Leia mais

A entrega deve ter um relatório em PDF e os arquivos.m (devidamente comentados). Os códigos devem ser referenciados no relatório.

A entrega deve ter um relatório em PDF e os arquivos.m (devidamente comentados). Os códigos devem ser referenciados no relatório. ESCOLA POLITÉCNICA DA UNIVERSIDADE DE SÃO PAULO Departamento de Engenharia Mecatrônica Sistemas Dinâmicos II para Mecatrônica Profs. Larissa Driemeier e Marcilio Alves Usando Exercícios a seguir devem

Leia mais

Princípios de Comunicação: Simulação /2

Princípios de Comunicação: Simulação /2 Princípios de Comunicação: Simulação 2 2015/2 18 de Novembro de 2015 Instruções 1. A simulação poderá ser feita em Matlab, Scilab ou C++; 2. A simulação deve ser entregue sob a forma de relatório em formato

Leia mais

Osciloscópio Digital. Diagrama em blocos:

Osciloscópio Digital. Diagrama em blocos: Osciloscópio Digital Neste tipo de osciloscópio, o sinal analógico de entrada é inicialmente convertido para o domínio digital através de um conversor A/D rápido, sendo em seguida armazenado em uma memória

Leia mais

Estudo da Produção de Oclusivas do Português Europeu

Estudo da Produção de Oclusivas do Português Europeu Estudo da Produção de Oclusivas do Português Europeu Dissertação apresentada à Universidade de Aveiro para obtenção do Grau de Mestre em Ciências da Fala e da Audição Marisa Lobo Lousada Orientador: Professor

Leia mais

Ferramenta Computacional para o Estudo de Seqüências de Treinamento em Equalizadores LMS

Ferramenta Computacional para o Estudo de Seqüências de Treinamento em Equalizadores LMS Ferramenta Computacional para o Estudo de Seqüências de Treinamento em es LMS Luciano L. Mendes Departamento de Eletrônica e Eletrotécnica Instituto acional de Telecomunicações Santa Rita do Sapucaí, MG

Leia mais

I-2 Sinais: classificação, propriedades e operações

I-2 Sinais: classificação, propriedades e operações I-2 Sinais: classificação, propriedades e operações Comunicações (30 de setembro de 2016) ISEL - ADEETC - Comunicações 1 Sumário 1. Classificação de sinais 2. Sinais contínuos e discretos 3. Sinais não

Leia mais

Algoritmos de Aprendizado. Formas de Aprendizado. Aprendizado Batch x Incremental. Aprendizado Batch x Incremental

Algoritmos de Aprendizado. Formas de Aprendizado. Aprendizado Batch x Incremental. Aprendizado Batch x Incremental Algoritmos de Aprendizado Regra de Hebb Perceptron Delta Rule (Least Mean Square Back Propagation Formas de Aprendizado Existe dois métodos básicos de aplicação do algoritmo Back Propagation: Aprendizado

Leia mais

Analisador de Espectros

Analisador de Espectros Analisador de Espectros O analisador de espectros é um instrumento utilizado para a análise de sinais alternados no domínio da freqüência. Possui certa semelhança com um osciloscópio, uma vez que o resultado

Leia mais

TRANSMISSÃO DE DADOS

TRANSMISSÃO DE DADOS TRANSMISSÃO DE DADOS Aula 2: Dados e sinais Notas de aula do livro: FOROUZAN, B. A., Comunicação de Dados e Redes de Computadores, MCGraw Hill, 4ª edição Prof. Ulisses Cotta Cavalca

Leia mais

Capítulo III Processamento de Imagem

Capítulo III Processamento de Imagem Capítulo III Processamento de Imagem Proc. Sinal e Imagem Mestrado em Informática Médica Miguel Tavares Coimbra Resumo 1. Manipulação ponto a ponto 2. Filtros espaciais 3. Extracção de estruturas geométricas

Leia mais

FFTranscriber: Software para Transcrição Otimizado para Aplicações Forenses

FFTranscriber: Software para Transcrição Otimizado para Aplicações Forenses FFTranscriber: Software para Transcrição Otimizado para Aplicações Forenses Renan Moura, Nelson Neto, Carlos Patrick, Pedro Batista e Aldebaro Klautau Laboratório de Processamento de Sinais Universidade

Leia mais

Descritores de Imagem

Descritores de Imagem Descritores de Imagem André Tavares da Silva 31 de março de 2014 1 Descritores de imagem (continuação) 1.1 Frameworks de detecção de objetos SIFT (scale-invariant features transform) (Lowe, 1999) SIFT

Leia mais

Inteligência Artificial

Inteligência Artificial Inteligência Artificial Aula 14 Aprendizado de Máquina Avaliação de s Preditivos (Classificação) Hold-out K-fold Leave-one-out Prof. Ricardo M. Marcacini ricardo.marcacini@ufms.br Curso: Sistemas de Informação

Leia mais

3 Extração de Regras Simbólicas a partir de Máquinas de Vetores Suporte 3.1 Introdução

3 Extração de Regras Simbólicas a partir de Máquinas de Vetores Suporte 3.1 Introdução 3 Extração de Regras Simbólicas a partir de Máquinas de Vetores Suporte 3.1 Introdução Como já mencionado na seção 1.1, as SVMs geram, da mesma forma que redes neurais (RN), um "modelo caixa preta" de

Leia mais

FILTROS ESPACIAIS PASSA-BAIXA

FILTROS ESPACIAIS PASSA-BAIXA UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL PROGRAMA DE PÓS-GRADUAÇÃO EM COMPUTAÇÃO CMP65 - INTRODUÇÃO AO PROCESSAMENTO DE IMAGENS PROFESSOR JACOB SCARCHANSKI FILTROS ESPACIAIS PASSA-BAIXA POR DANIEL NEHME

Leia mais

3º Trabalho de Laboratório Objectivo Geral: Largura de banda de impulsos; Espectros de sinais básicos; Propriedades da transformada de Fourier.

3º Trabalho de Laboratório Objectivo Geral: Largura de banda de impulsos; Espectros de sinais básicos; Propriedades da transformada de Fourier. Departamento de Engenharia Electrotécnica Secção de Telecomunicações Mestrado integrado em Engenharia Electrotécnica e de Computadores Licenciatura em Engenharia Informática Grupo: nº e 3º Trabalho de

Leia mais

Reconhecimento de Tipos de Movimento Humano baseados no método GMM.

Reconhecimento de Tipos de Movimento Humano baseados no método GMM. Reconhecimento de Tipos de Movimento Humano baseados no método GMM. C.Gonçalves 1 ; L.A.Pereira; J.C.Pizolato, Jr.; A.Gonzaga. Escola de Engenharia de São Carlos-EESC-USP Av. Trab. São-Carlense, 400 CP

Leia mais

Reconhecimento da voz baseado em segmento

Reconhecimento da voz baseado em segmento Reconhecimento da voz baseado em segmento Introdução Pesquisando gráficos baseados no espaço de observações Modelamento antifonema Modelamento Near -miss Modelamento por marcas Modelamento fonológico 1

Leia mais

6LVWHPDGH6LPXODomRSDUD2EWHQomRGH'DGRV

6LVWHPDGH6LPXODomRSDUD2EWHQomRGH'DGRV 38 6LVWHPDGH6LPXODomRSDUD2EWHQomRGH'DGRV O sistema de identificação e localização de faltas utilizando RNAs necessita de um conjunto de registros de curto-circuito em diversas situações diferentes, para

Leia mais

Sistemas de Telecomunicações Definidos por Software & Processamento de Sinal em Tempo Real

Sistemas de Telecomunicações Definidos por Software & Processamento de Sinal em Tempo Real Sistemas de Telecomunicações Definidos por Software & Processamento de Sinal em Tempo Real 1 Filtros Adaptativos Filtros adaptativos são solução atractiva em ambientes com estatística desconhecida e variável

Leia mais

ROLETA RUSSA Jogo de Perguntas e Respostas com Reconhecimento de Fala

ROLETA RUSSA Jogo de Perguntas e Respostas com Reconhecimento de Fala UNIVERSIDADE DE SÃO PAULO ESCOLA POLITÉCNICA LUÍS GUSTAVO LUDESCHER RAPHAEL MIELLE TRINTINALIA VITOR ARAUJO ROMERA ROLETA RUSSA Jogo de Perguntas e Respostas com Reconhecimento de Fala São Paulo 2009 LUÍS

Leia mais

Filtros Digitais. Filtros básicos, parâmetros no domínio do tempo e frequência, classificação de filtros

Filtros Digitais. Filtros básicos, parâmetros no domínio do tempo e frequência, classificação de filtros Filtros Digitais Filtros básicos, parâmetros no domínio do tempo e frequência, classificação de filtros Filtros são usados basicamente para dois propósitos: Separação de sinais combinados; Restauração

Leia mais

Rede Neural Artificial Aplicada em um Reconhecimento Automático de Voz Independentemente do Locutor

Rede Neural Artificial Aplicada em um Reconhecimento Automático de Voz Independentemente do Locutor PAPER 131 Rede Neural Artificial Aplicada em um Reconhecimento Automático de Voz Independentemente do Locutor Luiz Eduardo da SILVA 1, Germano LAMBERT-TORRES 2, Wagner S. VIEIRA 2, Ciro R. SANTOS 2, Rômulo

Leia mais

Simulação MATLAB - Transmissão PCM em Banda Base e Diagrama de Olho. Testar o efeito de filtros sem ISI no espectro e na curva BERXE b /N 0.

Simulação MATLAB - Transmissão PCM em Banda Base e Diagrama de Olho. Testar o efeito de filtros sem ISI no espectro e na curva BERXE b /N 0. Simulação MATLAB - Transmissão PCM em Banda Base e Diagrama de Olho Objetivos Simular a taxa de erro binário em função de E b /N 0 para diferentes modulações PCM e comparar com a teoria Testar o efeito

Leia mais

6 Estudo de Casos e Resultados

6 Estudo de Casos e Resultados 6 Estudo de Casos e Resultados 6.1 Previsão da Volatilidade por Redes Neurais Artificiais Para a avaliação do modelo proposto, foram feitos testes para analisar o resultado da rede neural como instrumento

Leia mais

3 Redes Neurais Artificiais

3 Redes Neurais Artificiais 3 Redes Neurais Artificiais 3.1. Introdução A capacidade de implementar computacionalmente versões simplificadas de neurônios biológicos deu origem a uma subespecialidade da inteligência artificial, conhecida

Leia mais

Processamento de Imagem. Histograma da Imagem Professora Sheila Cáceres

Processamento de Imagem. Histograma da Imagem Professora Sheila Cáceres Processamento de Imagem Histograma da Imagem Professora Sheila Cáceres Histograma É a distribuição de frequência dos níveis de cinza da imagem onde cada entrada no eixo x representa o nível de cinza específico

Leia mais

Processamento Digital de Sinais

Processamento Digital de Sinais Processamento Digital de Sinais Carlos Alexandre Mello Carlos Alexandre Mello cabm@cin.ufpe.br 1 Sinais Digitais Um sinal pode ser entendido como uma função que carrega uma informação Sinal de voz O sinal

Leia mais

RESUMO. Palavras chave: Tecnologia Assistiva. Deficiência auditiva. Detecção de Choro. INTRODUÇÃO

RESUMO. Palavras chave: Tecnologia Assistiva. Deficiência auditiva. Detecção de Choro. INTRODUÇÃO TECNOLOGIA ASSISTIVA: USO DE PROCESSAMENTO DE SINAIS E TRANSMISSÃO SEM FIO PARA O AUXILIO DE MÃES E PAIS PORTADORES DE NECESSIDADES ESPECIAIS (DEFICIÊNCIA AUDITIVA) ANÁLISE DO SINAL (CHORO) PEREIRA DA

Leia mais

Conceitos Básicos de Áudio Digital

Conceitos Básicos de Áudio Digital Aula 07 Conceitos Básicos de Áudio Digital Diogo Pinheiro Fernandes Pedrosa Universidade Federal do Rio Grande do Norte Departamento de Ciências Exatas e Naturais Ciência da Computação Som Conceitos Iniciais

Leia mais

XIV CONGRESSO NACIONAL DE ESTUDANTES DE ENGENHARIA MECÂNICA Universidade Federal de Uberlândia Faculdade de Engenharia Mecânica

XIV CONGRESSO NACIONAL DE ESTUDANTES DE ENGENHARIA MECÂNICA Universidade Federal de Uberlândia Faculdade de Engenharia Mecânica XIV CONGRESSO NACIONAL DE ESTUDANTES DE ENGENHARIA MECÂNICA Universidade Federal de Uberlândia Faculdade de Engenharia Mecânica DESENVOLVIMENTO DE UM PROGRAMA PARA CÁLCULO DO TEMPO DE REVERBERAÇÃO EM AMBIENTES

Leia mais

Protótipo de Software de Reconhecimento de Voz Para Navegação em Jogos, Utilizando Rede Neural Artificial

Protótipo de Software de Reconhecimento de Voz Para Navegação em Jogos, Utilizando Rede Neural Artificial Protótipo de Software de Reconhecimento de Voz Para Navegação em Jogos, Utilizando Rede Neural Artificial Orientando: Derlei Brancher Orientador: Prof. Jacques Robert Heckmann - Mestre 1. Introdução Roteiro

Leia mais

2 Reconhecimento Facial

2 Reconhecimento Facial 2 Reconhecimento Facial Em termos gerais, o reconhecimento facial é o processo pelo qual se mede o grau de similaridade entre duas imagens faciais com o proposito de identificar a um indivíduo ou de verificar

Leia mais

MAS 160/510 Conjunto de Problema Nove

MAS 160/510 Conjunto de Problema Nove MAS 160/510 Conjunto de Problema Nove 1. Modulação Digital O sistema Quaternário de Manipulação de Comutação de Fase na figura é usado para transmitir dados através de um canal (barulhento). O gerador

Leia mais

Aula 07 Propriedades da resposta ao impulso

Aula 07 Propriedades da resposta ao impulso Aula 07 Propriedades da resposta ao impulso Bibliografia OPPENHEIM, A.V.; WILLSKY, A. S. Sinais e Sistemas, a edição, Pearson, 00. ISBN 9788576055044. Páginas 6-69. HAYKIN, S. S.; VAN VEEN, B. Sinais e

Leia mais

Máquinas de Vetores de Suporte Aplicadas à Classificação de Defeitos em Couro Bovino

Máquinas de Vetores de Suporte Aplicadas à Classificação de Defeitos em Couro Bovino Máquinas de Vetores de Suporte Aplicadas à Classificação de Defeitos em Couro Bovino Ricardo Cezar Bonfim Rodrigues 24 de abril de 2006 1 Antecedentes e Justificativa Hoje, em diversos processos industriais,

Leia mais

STV 15 SET na figura acima a freqüência das variações do sinal de onda quadrada da câmera mostradas no topo do padrão xadrez é de 0,11 MHz

STV 15 SET na figura acima a freqüência das variações do sinal de onda quadrada da câmera mostradas no topo do padrão xadrez é de 0,11 MHz STV 15 SET 2008 1 FREQÜÊNCIAS DE VÍDEO ASSOCIADAS COM A VARREDURA HORIZONTAL no padrão xadrez da figura acima, o sinal de onda quadrada no topo representa as variações do sinal da câmera do sinal composto

Leia mais

Conversor A/D por aproximações sucessivas

Conversor A/D por aproximações sucessivas Conversor A/D por aproximações sucessivas É baseado no mesmo princípio do A/D de rampa digital, onde o sinal analógico de entrada i é comparado sucessivamente com a saída analógica do conversor D/A acoplado

Leia mais

Tecnologias de Reabilitação Aplicações de Processamento de Sinal

Tecnologias de Reabilitação Aplicações de Processamento de Sinal Tecnologias de Reabilitação Aplicações de Processamento de Sinal JPT 1 Aparelho Fonador Humano Modelo de Produção da Fala Frequência Fundamental F0 Formantes Sinal de Fala recolha (filtro anti-aliasing,

Leia mais