ESTUDO DE ALGORITMO DE SEGMENTAÇÃO DE FALA
|
|
- Vitorino Ventura Costa
- 7 Há anos
- Visualizações:
Transcrição
1 ESTUDO DE ALGORITMO DE SEGMENTAÇÃO DE FALA Vinicius de Souza 1, Marcelo de Oliveira Rosa 2 1,2 Departamento Acadêmico de Eletrotécnica Campus Curitiba Universidade Tecnológica Federal do Paraná - UTFPR Av. Sete de Setembro, 3165, Rebouças, CEP Curitiba, Paraná, Brasil viniciusdesouza1991@gmail.com, mrosa@utfpr.edu.br Resumo Neste artigo propomos um algoritmo simples baseado na quantidade de energia por janela de sinais de fala para determinar os intervalos em que há informação útil a ser analisada. Tal segmentação possibilita economia de processamento em trechos contendo apenas ruído em aplicações como reconhecimento de fala e identificação de falante. Palavras-chave: segmentação de fala; processamento digital de sinais. Abstract In this paper, we propose a simple energy-based algorithm which uses only the energy along speech signals to set up the intervals where there is useful information to be analyzed. Such a segmentation allows avoid processing segments that have only noise in applications such as speech recognition or speaker identification. Keywords: speech segmentation; digital signal processing. INTRODUÇÃO Estimadores de segmentos, em processamento de sinais de voz, consistem em algoritmos que têm como objetivo a segmentação de um sinal de acordo com um critério preestabelecido, visando uma aproximação do resultado desejado. O objetivo do algoritmo do artigo é detectar a presença de fala em um ambiente com ruído e detectar o início e o fim dessa fala, possibilitando manter em um mínimo a quantidade de informação processada [1]. No trabalho em questão foram utilizados diferentes sinais de voz, frases ou palavras isoladas, para se realizar os testes do algoritmo e para se analisar os resultados. Estes sinais de voz provêm de um banco de dados fornecido pelo professor, dos quais dois foram os principais: uma gravação conténdo a palavra ligar, e outra gravação conténdo a frase e nosso destino é o de continuar crescendo. Ambos correspondem à voz da mesma mulher e possuem frequência de amostragem de Hz. Algumas ferramentas aprendidas no início do estudo, também foram largamente utilizadas durante todo o desenvolvimento do algoritmo do estimador de segmentos, assim como o programa MATLAB.
2 METODOLOGIA A separação do ruído ambiente da fala pode ser resolvido apenas com um teste da energia do sinal quando há uma razão sinal para ruído alta. Mas na maioria das vezes essa razão não é suficiente e a energia dos fricativos fracos (como /f/ em faca ) não excede a energia do ruído. Para se contornar este problema utiliza-se a ZCR. O algoritmo-base [1] faz uso desses dois critérios e analisa o ruído inicial para fazer medições da energia em pequenos intervalos e da ZCR. Essas medições iniciais são úteis para identificar o ruído do ambiente e depois procurar qualquer alteração nesses dados, o que indica fala. O artigo-base ainda indica quais são os principais fonemas que causam problemas, o que foi confirmado depois durante o desenvolvimento dos trabalhos de iniciação científica. São eles: - Fricativos fracos (/f, th, h/) - Plosivos fracos (/p, t, k/) - Nasais Uma localização eficiente dos pontos de início e fim de uma palavra é útil, em especial, em programas de reconhecimento de palavras. A janela utilizada no algoritmo-base para medições de energia e ZCR é de 10ms e as gravações estão em uma frequência de amostragem de 10kHz. É aplicado ao sinal um filtro passa-banda com frequências de corte de 100Hz e 4kHz. Assume-se que nos primeiros 100ms não há fala e, portanto, são feitas as medições iniciais para se definir os thresholds. Os thresholds referentes à energia são definidos como ITL (inferior) e ITU (superior), com as seguintes fórmulas: Onde IMX é a energia de pico e IMN é a energia do silêncio. O algoritmo começa a procurar algum ponto onde a energia excede ITL, a partir desse ponto o algoritmo verifica se a energia continua subindo até exceder ITU ou se desce novamente abaixo de ITL. No primeiro caso há a colocação do ponto de início, no segundo o algoritmo ignora o ponto em questão. Depois o mesmo processo é repetido, mas com sentido contrário, partindo do final para o começo. Há também o cálculo do threshold IZCT referente à ZCR, que é o mínimo entre IF e a média de IZC mais duas vezes o desvio padrão. Este cálculo da ZCR será mostrado no algoritmo no próximo capítulo. Depois de encontrados os thresholds e realizadas as estimativas por energia, encontramse dois pontos: N1 (inicial) e N2 (final). Em um intervalo de N1-25 e N2+25, se a ZCR excede o threshold IZCT pelo menos três vezes, o ponto N1 é deslocado para a primeira vez em que ZCR excede IZCT. O mesmo é feito no sentido oposto para N2. Segundo o artigo, os resultados se aproximaram do esperado, resultando em um algoritmo simples, relativamente eficiente e robusto, podendo ser utilizado em vários ambientes. Algoritmo Adaptado. Primeiramente, nos trabalhos de iniciação científica, o algoritmo-base foi implementado. Mas como o interesse da iniciação científica foi um estimador de segmentos, foi realizada uma adaptação do algoritmo-base. Ao invés de procurar o início e o fim da fala na gravação, tentou-se encontrar o início e o fim dos segmentos que compõe a gravação (palavras, fonemas). A principal adaptação foi modificar a maneira em que se encontra o ponto final, que no primeiro apenas se invertia o sentido de procura dos thresholds. E no algoritmo adaptado se inverte a ordem em que os thresholds são cruzados, ou seja, a energia cruza os thresholds em sentido de decrescimento. Tornou-se opcional a utilização do cálculo do ZCR e a utilização do filtro passa-banda e se tornou possível a escolha da janela e do passo com os quais são realizados os cálculos.
3 O algoritmo adaptado resulta em uma matriz (pontos) com número de linhas igual ao número de segmentos e duas colunas. Onde cada linha apresenta, respectivamente, o ponto inicial e final de cada segmento. Foi desenvolvido também um algoritmo que varia a janela com a qual são realizados todos os cálculos, para se analisar o que a mudança da janela acarreta de mudança no resultado. RESULTADOS E DISCUSSÃO Variando-se o tamanho da janela e aplicando-se o algoritmo adaptado, foram construídas duas tabelas (uma para a palavra ligar e outra para a frase e nosso destino é o de continuar crescendo ). Na confecção das tabelas não foram utilizados os cálculos referentes à taxa de cruzamentos de zero (ZCR), pois os resultados derivados da ZCR não foram satisfatórios. Portanto as tabelas abaixo são baseadas apenas na taxa de energia por janela. Tabela 1. Segmentação da palavra ligar com variação da janela e do passo utilizados no cálculo da energia Janela (ms) Passo (ms) Início (ms) Fim (ms) Duração (ms) Palavra Ruído 3 1, , , , , , , Ruído
4 , , Pode-se notar na tabela que quando uma janela pequena é utilizada, os thresholds do algoritmo são ultrapassados com os ruídos. Por exemplo, quando as janelas de 2ms e 3ms foram utilizadas, o algoritmo registrou dois intervalos que contém apenas ruído, o que não é interessante para a finalidade do algoritmo. Por outro lado, nota-se também que a partir de 4ms de janela, todos os resultados são bastante semelhantes. Se o tamanho da janela continuasse aumentando, provavelmente chegaria um momento em que o intervalo li e o intervalo gar seriam unidos em um intervalo só. O que mostraria que também não é interessante a utilização de uma janela muito grande. Tabela 2. Segmentação da frase e o nosso destino é o de continuar crescendo com variação da janela e do passo utilizados no cálculo da energia Janela (ms) Passo (ms) Início (ms) Fim (ms) Duração (ms) Palavra , Ruído "e nosso" "destino" "é o de" Ruído Ruído "co" "ti" "nuar" Ruído "cre" "s" "endo" Ruído "e nosso destino" "é o de" Ruído "co" "ti" "nuar" Ruído
5 , , "cre" "s" "endo" "e nosso destino" "é o de" Ruído "co" "ti" "nuar" Ruído "cre" "s" "endo" "e nosso destino" "é o de" Ruído "co" "ti" "nuar" "cre" "s" "endo" "e nosso destino" "é o de" "co" "ti" "nuar" "cre" "s" "endo" "e nosso destino" "é o de" Ruído "co" "ti" "nuar" "cre" "s" "endo" "e nosso destino é o de" "co" "ti" "nuar" "cres" "endo"
6 9 4, , , , , "e nosso destino é o de" "co" "tinuar" "cres" "endo" "e nosso destino é o de" "co" "tinuar" "cres" "endo" "e nosso destino é o de" "co" "tinuar" "cres" "endo" "e nosso destino é o de" "co" "tinuar" "cres" "endo" "e nosso destino é o de" "co" "tinuar" "cres" "endo" "e nosso destino é o de" "co" "tinuar" "cres" "endo" "e nosso destino é o de" "co" "tinuar" "cres" "endo" "e nosso destino é o de" "co" "tinuar" "cres" "endo" "e nosso destino é o de" "co" "tinuar" "cres" "endo"
7 , "e nosso destino é o de" "co" "tinuar" "crescendo" "e nosso destino é o de" "co" "tinuar" "cres" "endo" "e nosso destino é o de" "co" "tinuar" "crescendo" A palavra ligar é falada com bastante clareza e pausadamente, ao contrário da frase e o nosso destino é o de continuar crescendo. Devido a esses fatores principalmente, a segmentação deste sinal ficou muito mais difícil. Além do fato de o segundo sinal conter várias palavras que são emendadas ao falar. Novamente as janelas menores acusaram intervalos que não continham palavras, e, sim, ruído. Com a janela de 2ms, quatro intervalos registram apenas ruído e com a de 3ms, são três intervalos. Dois intervalos para a janela de 4ms e um intervalo com a janela de 5ms. Apresentando uma diminuição bastante linear de acordo com a variação da janela. Indicando novamente que janelas pequenas dificultam a segmentação do sinal. Neste caso (Tabela 2), fica evidente que a utilização de janelas muito grandes atrapalha na segmentação. Por exemplo, com janela de 20ms nota-se que o primeiro intervalo contém e nosso destino é o de, mostrando que o algoritmo não consegue separar estas palavras. Ao observar a Tabela 2, percebe-se que o algoritmo encontra dificuldade em reconhecer fonemas plosivos e fricativos fracos, como o artigo-base já havia informado. Por exemplo, mesmo com a janela de 20ms a palavra continuar é separada em co e tinuar, perdendo o n. Isso ocorre devido ao fato de estes fonemas nasais terem baixa energia e, principalmente, porque o plosivo t se caracteriza por uma pausa na vibração das cordas vocais. O mesmo ocorre com a palavra crescendo com janela de 19ms, onde há a separação dos fonemas cres e endo. Isso ocorre porque o fonema s possui baixa energia, pelo mesmo motivo, não há vibração das cordas vocais quando se reproduz o som desta letra. Na primeira tabela também se observa a separação de li e gar. A explicação disso é que o fonema g é caracterizado por uma pausa na vibração das cordas vocais referentes à vogal i, provocando um corte da energia. CONCLUSÕES Os testes realizados revelaram que o algoritmo desenvolvido ao longo do semestre atingiu parcialmente os objetivos iniciais. Um deles, manter em um mínimo a quantidade de informação processada, foi atingido com sucesso. O processo consegue eliminar as partes do sinal que possuem apenas ruído e deixar somente as partes do sinal que contém fala. Verificou-se reduções de 62% e 86% na quantidade de informação processada nos sinais. Assim, aumentando a velocidade e eficiência de outros processos que possam ser realizados com os sinais.
8 O algoritmo é pouco eficiente na separação de palavras, pois encontra dificuldade em reconhecer fricativos fracos, plosivos e nasais, principalmente quando a frase não é falada pausadamente e com clareza. Isso ocorre porque o processamento do sinal é baseado apenas em medidas de energia. Lembrando que os testes realizados com a taxa de cruzamento de zeros não apresentaram resultados satisfatórios e, por isso, não foi utilizada. No decorrer dos trabalhos da iniciação científica foram apresentadas várias ferramentas utilizadas no processamento de sinais de som e, também, métodos frequentemente utilizados. Conceitos acerca deste assunto tornaram-se mais claros e foram aprofundados. Problemas foram encontrados e contornados, resultando em um aprendizado ainda maior.. AGRADECIMENTOS Os autores agradecem à Fundação Araucária pelo subsídio financeiro fornecido na forma de bolsa de iniciação científica. REFERÊNCIAS [1] RABINER, L. R.; SAMBUR, M. R. An Algorithm for Determining the Endpoints of Isolated Utterances. The Bell System Technical Journal, v. 54, p , 1975.
Curso de Engenharia Elétrica Processamento Digital de Sinais II Exercícios sobre filtros não recursivos Data de entrega: 17/11/2015
Curso de Engenharia Elétrica Processamento Digital de Sinais II Exercícios sobre filtros não recursivos Data de entrega: 17/11/2015 1) Projete um filtro FIR passa baixas de 3 etapas com frequência de corte
Leia mais7 Extração de Dados Quantitativos
Capítulo 7 - Extração de Dados Quantitativos 119 7 Extração de Dados Quantitativos A técnica de medição desenvolvida e descrita nos capítulos anteriores produz como resultado a variação temporal da espessura
Leia maisParâmetros importantes de um Analisador de Espectros: Faixa de frequência. Exatidão (frequência e amplitude) Sensibilidade. Resolução.
Parâmetros importantes de um Analisador de Espectros: Faixa de frequência Exatidão (frequência e amplitude) Sensibilidade Resolução Distorção Faixa dinâmica Faixa de frequência: Determina as frequências
Leia maisCaracterísticas acústicas das vogais e consoantes
Características acústicas das vogais e consoantes APOIO PEDAGÓGICO Prof. Cecília Toledo ceciliavstoledo@gmail. com http://fonologia.org/acustica.php Fonética acústica A Fonética acústica é um ramo da Fonética
Leia maisRastreamento de objeto e estimativa de movimento
Hiroito Watanabe Rastreamento de objeto e estimativa de movimento Brasil 2015 Hiroito Watanabe Rastreamento de objeto e estimativa de movimento Relatório do trabalho 2 da disciplina de Processamento Digital
Leia maisRECONHECIMENTO DE GÊNERO ATRAVÉS DA VOZ
RECONHECIMENTO DE GÊNERO ATRAVÉS DA VOZ Marcela Ribeiro Carvalho marcela@enecar.com.br IFG/Câmpus Goiânia Hipólito Barbosa Machado Filho hipolito.barbosa@ifg.edu.br IFG/Câmpus Goiânia Programa Institucional
Leia maisCepstrum. Walter Roberto Godefroid Steiger
Walter Roberto Godefroid Steiger Cepstrum Trabalho apresentado como parte da avaliação da disciplina Processamento Digital de Sinais, do Departamento de Engenharia elétrica da Universidade Federal do Paraná.
Leia maisExtração de objetos de interesse em imagens digitais utilizando a biblioteca de Visão Computacional OpenCV
Extração de objetos de interesse em imagens digitais utilizando a biblioteca de Visão Computacional OpenCV Izadora Aparecida RAMOS 1,3,4 ; Servílio Souza de ASSIS 1,3,4 ; Bruno Alberto Soares OLIVEIRA
Leia maisA área de estudo está localizada no campus da Universidade de São Paulo, na região
64 3.2 TESTES SOBRE DADOS REAIS 3.2.1 Área de estudo A área de estudo está localizada no campus da Universidade de São Paulo, na região centro-oeste da cidade de São Paulo-SP, na borda da Bacia Sedimentar
Leia maisFonética acústica: Propriedades suprassegmentais APOIO PEDAGÓGICO. KENT, Ray, READ, Charles. Análise acústica da Fala São Paulo : Cortez, 2015
Fonética acústica: Propriedades suprassegmentais KENT, Ray, READ, Charles. Análise acústica da Fala São Paulo : Cortez, 2015 APOIO PEDAGÓGICO Prof. Cecília Toledo ceciliavstoledo@gmail. com Segmentos da
Leia maisUm Ambiente para Processamento Digital de Sinais Aplicado à Comunicação Vocal Homem-Máquina
Um Ambiente para Processamento Digital de Sinais Aplicado à Comunicação Vocal Homem-Máquina Márcio G. Passos e Patric L. Silva marcio_passos@yahoo.com.br e lacouth@gmail.com Silvana Luciene do N. Cunha
Leia maisMÉTODOS QUANTITATIVOS PARA CIÊNCIA DA COMPUTAÇÃO EXPERIMENTAL
MÉTODOS QUANTITATIVOS PARA CIÊNCIA DA COMPUTAÇÃO EXPERIMENTAL Pedro Henrique Bragioni Las Casas Pedro.lascasas@dcc.ufmg.br Apresentação baseada nos slides originais de Jussara Almeida e Virgílio Almeida
Leia maisGuiões dos Trabalhos Práticos
UNIVERSIDADE NOVA DE LISBOA FACULDADE DE CIÊNCIAS E TECNOLOGIA SECÇÃO DE MATERIAIS ELECTROACTIVOS DEPARTAMENTO DE CIÊNCIA DOS MATERIAIS LICENCIATURA EM ENG.ª FÍSICA Acústica Aplicada Guiões dos Trabalhos
Leia maisFigura 1 Sinais e Transformadas de Fourier (HAYKIN; VAN VEEN, 2001).
Processamento Digital de Sinais Aula 3 Professor Marcio Eisencraft março 22 Aula 3 TFD: Transformada de Fourier Discreta Bibliografia OPPEHEIM, A. V.; SCHAFER, R W.; BUCK, J. R. Discrete-time signal processing,
Leia maisINF Fundamentos da Computação Gráfica Professor: Marcelo Gattass Aluno: Rogério Pinheiro de Souza
INF2608 - Fundamentos da Computação Gráfica Professor: Marcelo Gattass Aluno: Rogério Pinheiro de Souza Trabalho 02 Visualização de Imagens Sísmicas e Detecção Automática de Horizonte Resumo Este trabalho
Leia maisTecnologias Computacionais Aplicadas À Análise De Sinais De Voz
Tecnologias Computacionais Aplicadas À Análise De Sinais De Voz Charles Alexandre Blumm, José Luis Gómez Cipriano Instituto de Ciências Exatas e Tecnológicas (ICET) Centro Universitário Feevale Campus
Leia maisIMPLEMENTAÇÃO DE SISTEMA DE ATITUDE EM DSP
Anais do 15 O Encontro de Iniciação Científica e Pós-Graduação do ITA XV ENCITA / 2009 Instituto Tecnológico de Aeronáutica São José dos Campos SP Brasil Outubro 19 a 21 2009. IMPLEMENTAÇÃO DE SISTEMA
Leia maisProcessamento Digital de Sinais. Aplicações da DFT. Prof. Dr. Carlos Alberto Ynoguti
Processamento Digital de Sinais Aplicações da DFT Prof. Dr. Carlos Alberto Ynoguti Aplicações da DFT Nesta seção iremos apresentar três aplicações bastante comuns da DFT: 1) Análise espectral de sinais
Leia maisT4.1 Processamento de Imagem
T4.1 Processamento de Imagem Proc. Sinal e Imagem Mestrado em Informática Médica Miguel Tavares Coimbra Resumo 1. Manipulação ponto a ponto 2. Filtros espaciais 3. Extracção de estruturas geométricas 4.
Leia maisQuantificação da Vibração Cumulada das Pregas Vocais com Aplicação de Acelerômetro
https://eventos.utfpr.edu.br//sicite/sicite2017/index Quantificação da Vibração Cumulada das Pregas Vocais com Aplicação de Acelerômetro RESUMO Letícia Veiga Cena da Silva leticiaveigacs@gmail.com Universidade
Leia maisProcessamento de Som com Escala de Mel para Reconhecimento de Voz
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO DEPARTAMENTO DE INFORMÁTICA Processamento de Som com Escala de Mel para Reconhecimento de Voz INF2608 FUNDAMENTOS DE COMPUTAÇÃO GRÁFICA Professor: Marcelo
Leia maisCapítulo III Processamento de Imagem
Capítulo III Processamento de Imagem Proc. Sinal e Imagem Mestrado em Informática Médica Miguel Tavares Coimbra Resumo 1. Manipulação ponto a ponto 2. Filtros espaciais 3. Extracção de estruturas geométricas
Leia maisModos Normais de Vibração. Ressonância num Tubo Fechado
Modos Normais de Vibração. Ressonância num Tubo Fechado Prof. Niels Fontes Lima Instituto Federal de Educação, Ciência e Tecnologia da Bahia Determinação da resposta de um tubo fechado em ambas extremidades
Leia maisdetecção de voz cantada em sinais de áudio polifônicos
detecção de voz cantada em sinais de áudio polifônicos Aplicações, Abordagens e Desafios Shayenne Moura 23. April 2018 Instituto de Matemática e Estatística Universidade de São Paulo o problema Detecção
Leia maisProcessamento Digital de Imagens
Ciência da Computação Processamento Digital de Imagens Tópicos Detecção de Pontos Isolados Detecção de Linhas Prof. Sergio Ribeiro 2 Operações lógicas e aritméticas orientadas a vizinhança utilizam o conceito
Leia maisProcessamento de sinais digitais
Processamento de sinais digitais Aula 1: Filtros digitais silviavicter@iprj.uerj.br Tópicos Definição de um filtro digital Anatomia de um filtro digital Descrição no domínio da frequência de sinais e sistemas
Leia maisSIM 15/16 T7 Processamento de Sinal e Imagem Médica. Miguel Tavares Coimbra
SIM 15/16 T7 Processamento de Sinal e Imagem Médica Miguel Tavares Coimbra Para quê processar sinais? Processamento de Dados Dados Factos Mensuráveis Ausência de significado Processamento Informação Dados
Leia maisDesenvolvimento de Aplicativo de Aquisição e Processamento de Voz. Development of a mobile Application to Acquisition and Voice Processing RESUMO
Desenvolvimento de Aplicativo de Aquisição e Processamento de Voz https://eventos.utfpr.edu.br//sei/sei2018 Development of a mobile Application to Acquisition and Voice Processing Autor Pedro Henrique
Leia maisRECONHECIMENTO DE FALANTE
MARCOS PAULO RIKI YANASE RECONHECIMENTO DE FALANTE Trabalho da disciplina de Processamento Digital de Sinais do curso de Engenharia Elétrica, Setor de Tecnologia da Universidade Federal do Paraná. Prof.
Leia maisMouseCam: aplicação de controle do mouse via câmera
MouseCam: aplicação de controle do mouse via câmera Introdução ao Processamento de Imagens COS756 PESC/COPPE/UFRJ 2013 1 Renan Garrot garrot@cos.ufrj.br 1. Introdução O processo de tracking por vídeo consiste
Leia maisAVALIAÇÃO DA ESTIMATIVA DE PARÂMETROS PARA MODELOS AR2D APLICADOS NA EXTRAÇÃO DE ATRIBUTOS DE TEXTURA EM IMAGENS DE SENSORIAMENTO REMOTO
AVALIAÇÃO DA ESTIMATIVA DE PARÂMETROS PARA MODELOS AR2D APLICADOS NA EXTRAÇÃO DE ATRIBUTOS DE TEXTURA EM IMAGENS DE SENSORIAMENTO REMOTO GUSTAVO TADEU ZANIBONI 1 LUCIANO VIEIRA DUTRA 1 1 INPE - Instituto
Leia maisUm Novo Filtro para a Norma ABNT 10303
Um Novo Filtro para a Norma ABNT 0303 André Luís Dalcastagnê andre@linse.ufsc.br LINSE: Circuitos e Processamento de Sinais Departamento de Engenharia Elétrica, UFSC Campus Universitário, 88040-900 - Florianópolis
Leia mais6. Conclusões Estatística do sinal
6. Conclusões Ao longo deste trabalho, foram descritas as características principais do sistema WiMAX e da tecnologia OFDM, a fim de contextualizá-los, uma vez que um sinal baseado nessas características
Leia maisTE073 PDS II Programa de Graduação em Engenharia Elétrica
TE073 PDS II Programa de Graduação em Engenharia Elétrica Prof. Alessandro Zimmer zimmer@eletrica.ufpr.br www.eletrica.ufpr.br/~zimmer/te073 Processamento Digital de Imagens PDI: Segmentação Os algoritmos
Leia maisAMOSTRAGEM. Larissa Driemeier
AMOSTRAGEM Larissa Driemeier LIVRO TEXTO Essa aula é baseada nos livros: [1] [2] [3] INTRODUCTION TO Signal Processing Sophocles J. Orfanidis Rutgers University http://www.ece.rutgers.edu/~orfanidi/intro2sp
Leia maisp TPP = (6.1) e a rajada de perda de pacote é medida pela Comprimento Médio da Rajada (CMR ) que é dada por
6 Perdas de Pacotes O problema de perda de pacotes em rajadas nas redes IP e redes móveis é um dos fatores mais importantes a serem considerados na análise de sistemas de reconhecimento de voz distribuídos.
Leia maisImplementação de algoritmos de processamento em FPGA para reconstrução de imagens biomédicas por ultrassom
https://eventos.utfpr.edu.br//sicite/sicite2017/index Implementação de algoritmos de processamento em FPGA para reconstrução de imagens biomédicas por ultrassom RESUMO Samuel Leme de Almeida Leite Samuel.lemeleite@gmail.com
Leia maisAUTENTICAÇÃO DE IMPRESSÕES DIGITAIS
AUTENTICAÇÃO DE IMPRESSÕES DIGITAIS Felipe Negreiros Pedrosa- IC Aluno de graduação do curso de Eng. de Computação do Instituto Tecnológico de Aeronáutica Bolsista PIBIC-CNPQ; Brasil; e-mail: felipe.pedrosa@gmail.com
Leia mais1 RESUMO. Palavras-chave: Controle, encoders, motor CC. 2 INTRODUÇÃO
1 RESUMO Na sociedade moderna se tornou cada vez mais presente e necessário meios de controlar dispositivos levando em consideração precisões maiores e perdas menores. Em diversos cenários o controle de
Leia maisAPI para obtenção da Frequência de um Sinal de Som por meio da FFT em Java ME
API para obtenção da Frequência de um Sinal de Som por meio da FFT em Java ME Marcelo Ruaro Departamento de Engenharias e Ciência da Computação Universidade Regional Integrada do Alto Uruguai e das Missões
Leia maisMAS 160/510 Conjunto de Problema Nove
MAS 160/510 Conjunto de Problema Nove 1. Modulação Digital O sistema Quaternário de Manipulação de Comutação de Fase na figura é usado para transmitir dados através de um canal (barulhento). O gerador
Leia maisTecnologias de Reabilitação Aplicações de Processamento de Sinal
Tecnologias de Reabilitação Aplicações de Processamento de Sinal JPT 1 Aparelho Fonador Humano Modelo de Produção da Fala Frequência Fundamental F0 Formantes Sinal de Fala recolha (filtro anti-aliasing,
Leia maisSEL-0339 Introdução à Visão Computacional. Aula 5 Segmentação de Imagens
Departamento de Engenharia Elétrica - EESC-USP SEL-0339 Introdução à Visão Computacional Aula 5 Segmentação de Imagens Prof. Dr. Marcelo Andrade da Costa Vieira Prof. Dr. Adilson Gonzaga Segmentação de
Leia maisSistema de Segmentação de Fala Baseado na Observação do Pitch
1 Sistema de Segmentação de Fala Baseado na Observação do Pitch Raissa Bezerra Rocha, Virginio Velloso Freire, Francisco Madeiro, e Marcelo Sampaio de Alencar Universidade Federal de Campina Grande UFCG
Leia maisA codificação primária é a representação digital de um canal de voz, sem a inclusão de bits de sincronismo e de verificação de paridade.
A codificação primária é a representação digital de um canal de voz, sem a inclusão de bits de sincronismo e de verificação de paridade. 50 8.1. Formas de representação digital do sinal de voz Há várias
Leia maisT4 Processamento de Imagem
T4 Processamento de Imagem Proc. Sinal e Imagem Mestrado em Informática Médica Hélder Filipe Pinto de Oliveira Resumo 1. Manipulação ponto a ponto 2. Conetividade 3. Filtros espaciais 4. Extração de estruturas
Leia maisAbordagem para Extração Automática de Características para Reconhecimento de Aves Tinamidae Baseada em Análise Espectral
Abordagem para Extração Automática de Características para Reconhecimento de Aves Tinamidae Baseada em Análise Espectral Paulo Francisco da CONCEIÇÃO Escola de Engenharia Elétrica e de Computação pfrancisco43@gmail.com
Leia maisMODULAÇÃO POR CÓDIGO DE PULSO PCM
Instituto Federal de Santa Catarina Curso Técnico Integrado em Telecomunicações PRT- Princípios de Telecomunicações MODULAÇÃO POR CÓDIGO DE PULSO PCM Prof. Deise Monquelate Arndt Fontes: Princípios de
Leia maisComo equalizar sem usar equalizadores. Equalizar Equalizador Conceitos
Em uma de minhas participações na AES, no ano de 2000, fiz uma apresentação cujo tema principal era FASE. Entretanto, falar exclusivamente de fase me parecia sem sentido e provavelmente se tornaria entediante.
Leia maisProcessamento Digital de Sinais. Aplicações da DFT. Prof. Dr. Carlos Alberto Ynoguti
Processamento Digital de Sinais Aplicações da DFT Prof. Dr. Carlos Alberto Ynoguti Aplicações da DFT Nesta seção iremos apresentar três aplicações bastante comuns da DFT: 1) Análise espectral de sinais
Leia maisSEL5886 Visão Computacional Prof. Dr. Marcelo Andrade da Costa Vieira
SEL5886 Visão Computacional Prof. Dr. Marcelo Andrade da Costa Vieira Prática 2 Processamento no Domínio do Espaço Instruções: Essa prática consiste de 12 exercícios (E_1 a E_12). Deve ser gerado um arquivo
Leia mais3 Identificação de Locutor Usando Técnicas de Múltiplos Classificadores em Sub-bandas Com Pesos Não-Uniformes
3 Identificação de Locutor Usando Técnicas de Múltiplos Classificadores em Sub-bandas Com Pesos Não-Uniformes Neste capítulo, é apresentada uma nova proposta de combinação de múltiplos classificadores
Leia maisDETECÇÃO E CORREÇÃO AUTOMÁTICA DE OLHOS VERMELHOS EM FOTOGRAFIAS
UNIVERSIDADE FEDERAL DO PARANÁ PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA TE 810 PROCESSAMENTO DIGITAL DE SINAIS DETECÇÃO E CORREÇÃO AUTOMÁTICA DE OLHOS VERMELHOS EM FOTOGRAFIAS Trabalho apresentado
Leia maisVOGAL [A] PRETÔNICA X TÔNICA: O PAPEL DA FREQUÊNCIA FUNDAMENTAL E DA INTENSIDADE 86
Página 497 de 658 VOGAL [A] PRETÔNICA X TÔNICA: O PAPEL DA FREQUÊNCIA FUNDAMENTAL E DA INTENSIDADE 86 Jaciara Mota Silva ** Taise Motinho Silva Santos *** Marian Oliveira **** Vera Pacheco ***** RESUMO:
Leia maisProcessamento digital de imagens
Processamento digital de imagens Agostinho Brito Departamento de Engenharia da Computação e Automação Universidade Federal do Rio Grande do Norte 6 de outubro de 2016 Segmentação de imagens A segmentação
Leia maisPSI2651 PROCESSAMENTO, ANÁLISE E SÍNTESE DE IMAGENS. 1 o período de 2005 LISTA DE EXERCÍCIOS
PSI PROCESSAMENTO, ANÁLISE E SÍNTESE DE IMAGENS o período de LISTA DE EXERCÍCIOS ) Considerando imagens do tipo da figura abaixo. Descreva um procedimento que identifique quantas células com furo e quantas
Leia maisDETERMINAÇÃO DO GÊNERO DO LOCUTOR USANDO A TRANSFORMADA RÁPIDA DE FOURIER
Revista Ciências Exatas ISSN: 1516-893 Vol. 1 Nº. Ano 015 Natanael M. Gomes Universidade de Taubaté Marcio Abud Marcelino Universidade Estadual Paulista Universidade de Taubaté Francisco José Grandinetti
Leia maisMétodos Não Paramétricos
Modelação, Identificação e Controlo Digital Métodos Não Paramétricos 1 Métodos Não Paramétricos Estimação da resposta impulsiva e da resposta em frequência Análise espectral e métodos de correlação J.
Leia mais7 Medição da Velocidade do Vento em um Túnel de Vento utilizando Fusão de Dados: Resultados Experimentais
7 Medição da Velocidade do Vento em um Túnel de Vento utilizando Fusão de Dados: Resultados Experimentais 7. Introdução este capítulo apresentam-se experimentos de laboratório realizados em um túnel de
Leia mais3 REDES CLÁSSICAS PERCEPTRON E ADALINE
w b Professor José Gomes de Carvalho Jr. 3 REDES CLÁSSICAS PERCEPTRON E ADALINE 3.-Redes com funções de ativação de limiar Uma rede simples de uma camada, consiste em um ou mais neurônios de saída j conectados
Leia maisDescritores de Imagens
Descritores de Imagens André Tavares da Silva PPGCA/UDESC Outubro de 2017 André Tavares da Silva (PPGCA/UDESC) Descritores de Imagens Outubro de 2017 1 / 18 Descritores Locais e Frameworks SIFT SURF Viola-Jones
Leia maisMétodos Não Paramétricos
Modelação, Identificação e Controlo Digital Métodos ão Paramétricos 1 Métodos ão Paramétricos Estimação da resposta impulsiva e da resposta em frequência Análise espectral e métodos de correlação J. Miranda
Leia maisEstimativa do comportamento vocálico de locutores
Estimativa do comportamento vocálico de locutores E.L. Fernandes da Silva, H. M. de Oliveira Universidade Federal de Pernambuco - UFPE Centro de Tecnologia e Geociencias, Recife. E-mail: lizandra_fernandes@hotmail.com
Leia maisDiego Martin Mancini Orientador: Prof. Paulo A. V. de Miranda Instituto de Matemática e Estatística Universidade de São Paulo
Estudo de comparação do descritor de imagens coloridas BIC empregando diferentes abordagens de classificação de detecção de bordas: Canny e Operador Laplaciano Diego Martin Mancini Orientador: Prof. Paulo
Leia maisImplementação de códigos no Matlab para detecção de falhas em cordão de soldas. Adailton Turczen de Melo Andrine M. Varela da Cruz Wallace Griz Ayres
Implementação de códigos no Matlab para detecção de falhas em cordão de soldas Adailton Turczen de Melo Andrine M. Varela da Cruz Wallace Griz Ayres Departamento Acadêmico de Eletrônica (DAELN) - Universidade
Leia maisCompressão de Áudio Digital. Aluno: Marcio Masaki Tomiyoshi Supervisor: Marcelo Gomes de Queiroz
Compressão de Áudio Digital Aluno: Marcio Masaki Tomiyoshi Supervisor: Marcelo Gomes de Queiroz Introdução Motivações Com perdas (lossy) o MP3 Sem perdas (lossless) o FLAC Representação Digital do Som
Leia maisEN3604 FILTRAGEM ADAPTATIVA
EN3604 FILTRAGEM ADAPTATIVA Introdução Filtros adaptativos, os quais têm como meta transformar os sinais portadores de informação em versões limpas ou melhoradas, ajustam suas características de acordo
Leia maisCurso de Engenharia Elétrica Processamento Digital de Sinais II Projeto 1 Filtro eliminador de ruído elétrico para sinais de EletroEncefaloGrama (ECG)
Curso de Engenharia Elétrica Processamento Digital de Sinais II Projeto 1 Filtro eliminador de ruído elétrico para sinais de EletroEncefaloGrama (ECG) Devido ao uso generalizado de equipamentos elétricos
Leia maisIntrodução a filtros digitais. Theo Pavan e Adilton Carneiro TAPS
Introdução a filtros digitais Theo Pavan e Adilton Carneiro TAPS Filtro anti-aliasing Com um sinal já digitalizado não é possível distinguir entre uma frequência alias e uma frequência que realmente esteja
Leia maisFormatos de Áudio e Vídeo Digital Introdução ao Áudio Digital
Redes Multimídia 2016.2 Formatos de Áudio e Vídeo Digital Curso Superior de Tecnologia em Sistemas para Internet Turma: TEC.SIS.4T Redes Multimídia Conteúdo Programático :: 1 a Unidade 1. Aplicações multimídia
Leia mais1 Introdução. 2 Especificação
Bacharelado em Ciência da Computação DINF / UFPR CI067 - Oficina de Computação 2. semestre 2012 Prof. Luiz Eduardo S. de Oliveira Prof. Diego Roberto Antunes 29/11/2012 Releases - Histórico: r0 29/11/2012
Leia maisUniversidade Católica Dom Bosco
Universidade Católica Dom Bosco Centro de Ciências Exatas e Tecnológicas Curso de Engenharia de Computação Segmentação e Reconhecimento Baseado em Textura: Técnicas e Ferramentas Wagner Beloti Leal Prof.
Leia maisAnálise Estatística de Sistemas de Comunicação Digitais Usando o Diagrama de Olho
Análise Estatística de Sistemas de Comunicação Digitais Usando o Diagrama de Olho MSc UERJ-FEN-DETEL Análise Estatística de Sistemas de Comunicação Digitais Os sistemas de comunicação digital operam com
Leia maisPRÁTICA 5 Prof. Dr. Evandro Luis Linhari Rodrigues
PRÁTICA 5 Prof. Dr. Evandro Luis Linhari Rodrigues Além da solução usando Matlab, todos os exercícios deverão ser implementados também usando Python e OpenCV. Segmentação de Imagens Parte 1. 1) Detecção
Leia maisAGG0330 Processamento de Sinais Digitais
AGG0330 Processamento de Sinais Digitais www.iag.usp.br/~agg330 Liliana Alcazar Diogo liliana.diogo@iag.usp.br & Marcelo Bianchi m.bianchi@iag.usp.br 2017 AGG0330 Processamento de sinais digitais Teoria
Leia maisINICIAÇÃO CIENTÍFICA: INSTRUMENTOS DIGITAIS E TEOREMA DA AMOSTRAGEM
INICIAÇÃO CIENTÍFICA: INSTRUMENTOS DIGITAIS E TEOREMA DA AMOSTRAGEM Daniele de Moraes A. Barbosa dmoraes.barbosa@hotmail.com Faculdade de Engenharia Elétrica e de Computação FEEC Universidade Estadual
Leia maisEDO - PVI por método de Euler
EDO - PVI por método de Euler André Scarmagnani 1, Isaac da Silva 1, Valmei A. Junior 1 1 UDC ANGLO - Faculdade Anglo Americano (FAA) Av.Paraná, 5661, CEP: 85868-030 - Foz do Iguaçu - PR - Brasil andre-scar@hotmail.com,
Leia maisProcessamento Digital de Voz
Processamento Digital de Voz Carlos Alexandre Mello 1 Introdução A Natureza do Som O som é uma vibração que se propaga através do ar (através das moléculas de ar) que passa a vibração para frente até nossos
Leia maisModelagem em Experimentos Mistura-Processo para Otimização de Processos Industriais 15
Modelagem em Experimentos Mistura-Processo para Otimização de Processos Industriais 15 1 Introdução Na indústria moderna há uma contínua busca da otimização dos níveis de produção e da melhoria da qualidade
Leia maisLição de Processamento Digital de Sinais. Operação de Zooming em Processamento de Imagem. Rui Jesus
Lição de Processamento Digital de Sinais Operação de Zooming em Processamento de Imagem Rui Jesus ISEL, Julho 22 .INTRODUÇÂO. Enquadramento Esta lição destina-se aos alunos da disciplina de Processamento
Leia maisDETECÇÃO DO COMPLEXO QRS UTILIZANDO FPGA Detection of QRS Complex Using
DETECÇÃO DO COMPLEXO QRS UTILIZANDO FPGA Detection of QRS Complex Using Alexandre Tomazati OLIVEIRA Faculdade de Jaguariúna RESUMO: Este artigo descreve um sistema microcontrolado implementado em FPGA
Leia maisSIM 16/17 T6 Processamento de Sinal e Imagem Médica. Hélder Filipe Pinto de Oliveira
SIM 16/17 T6 Processamento de Sinal e Imagem Médica Hélder Filipe Pinto de Oliveira Resumo Sinal e Imagem Médica Sinal Digital Processamento de Sinal Processamento de Imagem Sinal e Imagem na Medicina
Leia maisProf. MSc. David Roza José 1/37
1/37 Métodos Abertos Objetivos: Reconhecer as diferenças entre os métodos intervalados e abertos para a localização de raízes; Compreender o método da iteração de ponto-fixo e avaliar suas características
Leia maisImplementação de algoritmo de tratamento de imagens para detecção de falhas em cordão de solda. Rafael Marques Ilivinski
Implementação de algoritmo de tratamento de imagens para detecção de falhas em cordão de solda Rafael Marques Ilivinski Departamento Acadêmico de Eletrônica (DAELN) - Universidade Tecnológica Federal do
Leia maisProva de seleção para o Mestrado Profissional em Ensino de Física Ingresso em Nome completo do Candidato:
Universidade Federal do Rio Grande do Sul Instituto de Física Programa de Pós-Graduação em Ensino de Física Prova de seleção para o Mestrado Profissional em Ensino de Física Ingresso em 2015-1 Nome completo
Leia maisIDENTIFICAÇÃO DE MARCADORES DE PAVIMENTAÇÃO NA ORIENTAÇÃO DE CEGOS. André Zuconelli 1 ; Manassés Ribeiro 2
IDENTIFICAÇÃO DE MARCADORES DE PAVIMENTAÇÃO NA ORIENTAÇÃO DE CEGOS André Zuconelli 1 ; Manassés Ribeiro 2 INTRODUÇÃO As tecnologias assistivas têm a finalidade de auxiliar pessoas com deficiência a alcançar
Leia maisRECONHECIMENTO FACIAL UTILIZANDO EIGENFACES
Universidade Federal do Rio de Janeiro Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia Programa de Engenharia de Sistemas e Computação Rio de Janeiro, RJ Brasil RECONHECIMENTO
Leia maisé a distância entre um determinado ponto da linha
Erro de Minimização O algoritmo do erro de minimização para efectuar a auto-localização de robôs foi desenvolvido de forma a superar os problemas existentes nas três abordagens identificadas, no sentido
Leia maisPONTIFÍCIA UNIVERSIDADE CATÓLICA DO PARANÁ ENGENHARIA DE COMPUTAÇÃO. Smart Relay SISTEMA DE AUTOMAÇÃO POR COMANDO DE VOZ
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO PARANÁ ENGENHARIA DE COMPUTAÇÃO Smart Relay SISTEMA DE AUTOMAÇÃO POR COMANDO DE VOZ CURITIBA 2013 PONTIFÍCIA UNIVERSIDADE CATÓLICA DO PARANÁ ENGENHARIA DE COMPUTAÇÃO
Leia maisExperiência: CIRCUITOS INTEGRADORES E DERIVADORES COM AMPOP
( ) Prova ( ) Prova Semestral ( ) Exercícios ( ) Prova Modular ( ) Segunda Chamada ( ) Exame Final ( ) Prática de Laboratório ( ) Aproveitamento Extraordinário de Estudos Nota: Disciplina: Turma: Aluno
Leia maisANÁLISE DA LARGURA DE BANDA DOS SINAIS ELÉTRICOS ADQUIRIDOS POR UMA UNIDADE REMOTA DE AQUISIÇÃO DE DADOS (URAD).
ANÁLISE DA LARGURA DE BANDA DOS SINAIS ELÉTRICOS ADQUIRIDOS POR UMA UNIDADE REMOTA DE AQUISIÇÃO DE DADOS (URAD). Camila S. Gehrke, Mauricio de Campos, Fabiano Salvadori. Universidade do Noroeste do Estado
Leia maisModelagem matemática do estimador de estados dos mínimos quadrados ponderados usando a ferramenta AMPL
https://eventos.utfpr.edu.br//sicite/sicite2017/index Modelagem matemática do estimador de estados dos mínimos quadrados ponderados usando a ferramenta AMPL RESUMO Pamela Maria Alves dos Santos pamelas@alunos.utfpr.edu.br
Leia mais7 INTERPRETAÇÃO E ANÁLISE DOS DADOS
Capítulo 7 Interpretação e Análise dos Dados 11 7 INTERPRETAÇÃO E ANÁLISE DOS DADOS 7.1 EFICIÊNCIA DO MÉTODO DESENVOLVIDO O comportamento do sistema sem fios no que diz respeito à eficiência do método
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Introdução + Estudo de Caso Introdução Percepção de máquina Um
Leia maisUtilização do solidthinking Embed em projetos de controle para sistemas embarcados utilizando técnica de controle adaptativo por modelo de referência.
Utilização do solidthinking Embed em projetos de controle para sistemas embarcados utilizando técnica de controle adaptativo por modelo de referência. Rodrigo de J. Macedo Resumo Apresenta-se, neste artigo,
Leia maisP7 Ondas estacionárias, ressonância e produção da voz. Ficha resolvida
P7 Ondas estacionárias, ressonância e produção da voz Ficha resolvida 1. Numa onda estacionária numa coluna fechada numa das extremidades a) O número de nodos é sempre inferior ao número de antinodos b)
Leia maisCaracterísticas dos sons das vogais do português falado no Brasil
Características dos sons das vogais do português falado no Brasil Benjamin Pereira dos Santos Siqueira benjamin_bps@hotmail.com Joyce Alvarenga de Faria joyce_alvar@hotmail.com Priscila Lemos Kallás Prof.
Leia maisDEFEITOS EM IMAGENS RADIOGRÁFICAS DE JUNTAS SOLDADAS EM TUBULAÇÕES: SEGMENTAÇÃO E EXTRAÇÃO DE DEFEITOS
DEFEITOS EM IMAGENS RADIOGRÁFICAS DE JUNTAS SOLDADAS EM TUBULAÇÕES: SEGMENTAÇÃO E EXTRAÇÃO DE DEFEITOS * Aluno do curso Tecnologia em Sistemas de Telecomunicações da UTFPR jvrsschaid@gmail.com ** Aluno
Leia maisModulação SSB e Transmissão Digital
Modulação SSB e Transmissão Digital 1 Modulação em SSB Vimos que na modulação AM, a portadora é mantida e o sinal modulante produz dois sinais laterais com a informação que estamos transmitindo. Fig. 1
Leia maisTrabalhos de Processamento Digital de Sinais
1 Universidade Federal de Uberlândia Trabalhos de Processamento Digital de Sinais Prof. Alan Petrônio Pinheiro Faculdade de Engenharia Elétrica Curso de Engenharia Eletrônica e de Telecomunicações (campus
Leia mais