Características do sinal de voz



Documentos relacionados
Características do sinal de voz

Características do sinal de voz

2- Conceitos Básicos de Telecomunicações

Camada Física. Camada Física

DO ANALÓGICO AO DIGITAL: CONCEITOS E

Amostragem e PCM. Edmar José do Nascimento (Princípios de Comunicações) edmar.nascimento

Sinal analógico x sinal digital. Sinal analógico. Exemplos de variações nas grandezas básicas. Grandezas básicas em sinais periódicos

Codificação de áudio para transmissão de voz em tempo real

Escola Superior de Tecnologia e Gestão Instituto Politécnico de Bragança Março de 2006

Modulação por Pulsos

Comunicação de Dados. Aula 4 Conversão de Sinais Analógicos em digitais e tipos de transmissão

Introdução à Transmissão Digital. Funções básicas de processamento de sinal num sistema de comunicações digitais.

1 Transmissão digital em banda base

Conversores D/A e A/D

2 Serviços em Telecomunicações

Amostragem e Conversão A/D

Teoria das Comunicações Prof. André Noll Barreto. Prova /1 (02/07/2015)

Espectro da Voz e Conversão A/D

Recomendação H.261 para serviços audiovisuais a taxas de transmissão p*64 kbit/s

Redes de Computadores

Multiplexação. Multiplexação. Multiplexação - FDM. Multiplexação - FDM. Multiplexação - FDM. Sistema FDM

1 Modulação digital para comunicações móveis

Ruído. 1) Introdução. 2) Principais grandezas e parâmetros definidores do som

Oficina de Multimédia B. ESEQ 12º i 2009/2010

Formatação e Modulação em Banda Básica

Fundamentos de Telecomunicações

1 Problemas de transmissão

NASCE A ERA DA COMUNICAÇÃO ELÉCTROMAGNÉTICA

Transmissão de Dados

PROJETO DE REDES

Tratamento do sinal Prof. Ricardo J. Pinheiro

Redes de Computadores

Princípios de Telecomunicações. PRT60806 Aula 19: Modulação por Código de Pulso (PCM) Professor: Bruno Fontana da silva 2014

Prof. Daniel Hasse. Multimídia e Hipermídia

Rede Telefónica Pública Comutada - Principais elementos -

EXERCíCIOS CAPÍTULOS 3 E 4

Fundamentos de Telecomunicações

Electrónica dos Sistemas Embebidos. Guia de Laboratório II

UFSM-CTISM. Teoria da Comunicação Aula-01

Redes de computadores N Laboratório 01. Luiza Eitelvein

Ligação à Internet. Conceitos de Sistemas Informáticos. Grupo de Comunicações por Computador Departamento de Informática Universidade do Minho

Aula 18. Sistemas de conversão AD e DA

Conversão Digital Analógico e Analógico Digital. Disciplina: Eletrônica Básica Prof. Manoel Eusebio de Lima

Aula de Hoje. Sistemas e Sinais Sinais e Sistemas. Sinal em Tempo Contínuo. Sinal Acústico

RUÍDOS EM IMAGENS FILTRAGEM DE RUÍDOS. o Flutuações aleatórias ou imprecisões em dados de entrada, precisão numérica, arredondamentos etc...

Aquisição de Dados. Aquisição de Dados. Centro de Pesquisas de Energia Elétrica. Apresentador: André Tomaz de Carvalho Área: DLE

MODULAÇÃO POR CÓDIGO DE PULSO PCM

Telefonia: A Convergência de Voz em Dados

Amostrador PAM A/D PCM D/A PAM Filtro. Figura 1 Digrama de Blocos PCM

INSTRUMENTAÇÃO INDUSTRIAL 1. INTRODUÇÃO / DEFINIÇÕES

Analisador de Espectros

Parte 02 Multiplexação Analógica e Digital no STFC. Prof. Rafael Saraiva Campos 2013/1

Redes de Computadores

TRANSMISSÃO DE DADOS

Introdução ao Ruído. Vibrações e Ruído (10375) 2014 Pedro V. Gamboa. Departamento de Ciências Aeroespaciais

UFSM-CTISM. Comunicação de Dados Capacidade de canal Aula-12

Fonte: Ruído e a Cidade Instituto do Ambiente

Comunicação de Dados. Aula 5 Transmissão Analógica

Redes de Computadores sem Fio

Redes de Telecomunicações. Redes de acesso

Sistemas de Comunicação Óptica

Exp 8. Acústica da Fala

Errata. Livro: Transmissão Digital - Princípios e Aplicações Edição:1ª Código: 4391 Autores: Dayan Adionel Guimarães & Rausley Adriano Amaral de Souza

Formatação de fonte. PCM ( Pulse Code Modulation )

Multimédia, Qualidade de Serviço (QoS): O que são?

Redes de Computadores. Comunicação de Dados e Representação de Sinais Analógicos e Digitais Aula 02 Profa. Priscila Solís Barreto

Apostila Básica sobre transmissão de TV Digital Padrão Brasileiro

RCO2. Introdução à camada física

1 Moldando Pulso para reduzir a largura de banda

ni.com Série de conceitos básicos de medições com sensores

CDI Comunicação Digital

Redes de Computadores. Redes de Computadores ADSL / XDSL. Protocolos de Redes. Aula 9 ADSL FACULDADE PITÁGORAS DE TECNOLOGIA

COMPRESSÃO DE DADOS MULTIMÍDIA

Sistemas de Telecomunicações I

Aspectos da infraestrutura das redes telefónicas - Rede de acesso -

WDM e suas Tecnologias

Telefone e Lacete de Assinante Analógico

Considerações Finais. Capítulo Principais conclusões

Video Lecture RF. Laps

TE060 Princípios de Comunicação. Sistemas de Comunicação Digital Notes. Por quê Digital? Notes. Notes. Evelio M. G. Fernández. 5 de novembro de 2013

Análise de parâmetros ultra-sónicos no domínio da frequência

Terminologias Sinais Largura de Banda de Dados Digitais. Sinais e Espectro

Enunciados de Problemas

Plano Temático. 1. Introdução

Multiplexador. Permitem que vários equipamentos compartilhem um único canal de comunicação

Duração do Teste: 2h.

X??? Digital Subscriber Line

SISTEMA DE TREINAMENTO EM COMUNICAÇÃO DIGITAL Modelo: ED-2970

05 - Camada de Física. 10 de novembro de 2014

Sensores Ultrasônicos

Concurso Público para Cargos Técnico-Administrativos em Educação UNIFEI 13/06/2010

Como em AM e FM, a portadora é um sinal senoidal com frequência relativamente alta;

SOLUÇÃO DE TELEMETRIA PARA SANEAMENTO

UNIVERSIDADE CATÓLICA DE PETRÓPOLIS CENTRO DE ENGENHARIA E COMPUTAÇÃO

UNIDADE I Aula 6 Taxas de Transmissão Máxima em um Canal: Teorema de Nyquist e Teorema de Shannon. Fonte: Rodrigo Semente

TECNOLOGIAS xdsl para pares de cobre

Transmissão Digital e Analógica

Transcrição:

Características do sinal de voz Análise na freuência: a voz apresenta um conteúdo espectral ue vai de 0 Hz a 0 khz; os sons vozeados ou nasais (e.g. vogais e algumas consoantes j, l, m) apresentam um espectro discreto com uma freuência fundamental de 00 a 00 Hz nos homens e 00 a 400 Hz nas mulheres; os sons não vozeados (e.g. f, s, p, ch) ue são gerados pelo fluxo de ar na boca modulado pelos maxilares, língua e lábios apresentam uma variação aleatória. O seu espectro é contínuo; as freuências mais baixas transportam a energia do sinal e as mais elevadas a emoção. Energia (db) 5 5 Discurso de voz básico Emoção 500 3500 Hz

Características do sinal de voz (cont.) Análise no tempo: várias sílabas por segundo; a fala concentra-se em intervalos de duração aleatória (com média de cerca de seg.) separados por intervalos de duração aleatória (superior a 00 ms, uando se está a falar) variação temporal bastante irregular e aleatória; o sinal de voz só está presente, em média, em 40% do tempo. Pode-se aproveitar este facto para intercalar outras conversações (sistema TASI - time assignement speech interpolation).

Caracterização do sistema auditivo Um indivíduo normal com idade compreendida entre os 8 e 5 anos é capaz de detectar sons puros entre 0 Hz e 0 khz; Com a idade, o limite superior da freuência audível reduz-se significativamente, e.g. em média um homem de 65 anos tem a 8 khz uma perda de sensibilidade de 40 db; A sensibilidade do ouvido varia com a freuência e com a intensidade sonora. Este aspecto terá de se reflectir na análise do desempenho das redes telefónicas, em particular na medida da potência do ruído: potência psofométrica (dbmp) Ruído branco (0-4000Hz) -3.6dB; (300-3400Hz) -.5dB O ouvido tem uma elevada gama dinâmica, com valores ue podem ir acima dos 00 db. Para uma boa reprodução basta valores da ordem dos 30 db.

Banda de freuências normalizada para a voz As recomendações G.3 e G.5 do ITU-T indicam a banda atribuída ao sinal de voz de 300-3400 Hz; Nos EUA a banda de freuências atribuída para um canal de voz é 00-300 Hz; Estas larguras de banda resultam de um compromisso entre o ue os assinantes telefónicos pretendem e o ue lhes pode ser fornecido economicamente. Largura de banda total, 4 khz Banda de guarda Banda de guarda Banda dos sinais de voz humana 300 3400 Hz

Transmissão digital de sinais analógicos Transforma o sinal da fonte num sinal eléctrico Fonte de informação e.g. pessoa a falar Transdutor Amostrador Quantificador Codificador de fonte e.g. microfone Fluxo de bits codificados Destino Transdutor Conversor D/A Descodificador de fonte e.g. ouvido da pessoa e.g. auscultador

Entrada analógica s(t) PCM - Pulse Code Modulation - Diagrama de blocos - Circuito de amostragem e retenção s(it) Conversão das amostras num conjunto de amplitudes discretaserro de uantificação F Hz f s = F Filtro passa-baixo Quantificador de L níveis Filtro passa-baixo Codificador Canal de tx Descodificador s(t) (estimativa) Palavras de N b bits, N b =log L F Hz

PCM - Pulse Code Modulation - Exemplo - Sinal original 4. 4.6 Resultado da amostragem.4 3.3...8.4 3.0 Resultado da uantificação pelo inteiro mais próximo Resultado da codificação (palavra binária), i.e. sinal PCM T s 4 3 3 3 00 0 00 00 00 0 00 0 0 5

Amostragem A base do PCM começa com o Teorema da Amostragem: Um sinal de banda limitada pode ser representado pelas suas amostras obtidas a um ritmo f s ue deve ser pelo menos igual ao dobro da freuência máxima presente no sinal (F), i.e. f s F. Domínio do tempo: g(t) Transformada de Fourier Domínio da freuência: G(f) Se f s = F (Ritmo de Nyuist): g s (t) t -F F f G s (f) Resposta do filtro do receptor T s t Considerações: f s =/T s Sinal g(t) tem uma largura de banda finita (F Hz) - Na prática não se verificaaliasing As amostras são retiradas com pulsos de largura infinitésimal Filtro passa-baixo ideal -f s -f s -F 0 F f s f s f

Quantificação A uantificação converte um sinal contínuo em amplitude num sinal discreto em amplitude. Notar ue o processo de amostragem converte um sinal contínuo no tempo num sinal discreto no tempo - Pulse Amplitude Modulation (PAM). Característica do uantificador linear ou uniforme: Característica do erro: y=f(x), saída Característica ideal Erro = y-x = ε O erro está limitado a / y i x 0 x x x i- x i x, entrada x 0 x N x limiares de decisão Erro de sobrecarga Erro de uantificação Erro de sobrecarga NOTA: Quando o valor de entrada está entre x i- e x i o uantificador irá produzir o valor y i

Ruído de uantificação O desempenho de um uantificador pode ser descrito pela relação sinal-ruído de uantificação; A potência de ruído de uantificação é descrita em termos estatísticos através do erro uadrático médio: n < ε >= ε p ( ε ) d ε =< + Para uma distribuição uniforme do erro em cada intervalo de uantificação de largura ; ε + >= ε dε = Para um uantificador linear, todos os intervalos de uantificação apresentam o mesmo erro uadrático médio. / p(ε ) -/ 0 / ε

Cálculo da relação sinal-ruído de uantificação Assume-se ue o sinal de entrada é uma sinusóide com amplitude A, logo a potência média desse sinal vem s =< x t >= A A relação sinal-ruído de uantificação, em db: S N Para PCM uniforme não inferior a 6dB Número de intervalos de uantificação para uma gama de uantificação de -A max a A max : A A A Número de bits por amostra: s A = 0log = = 0 0log + 0 7.78 0log n L = ( ) ( ) = 0 max max L= N =log N b b L A max

Cálculo da relação sinal-ruído de uantificação (cont.) Relação sinal-ruído de uantificação em termos do número de bits, N b S N =.76+ 6.0N b + 0log 0 A A max Para um determinado nº de bits por amostra constante a relação sinalruído de uantificação depende da amplitude A do sinal a uantificar: sinais com baixa amplitude têm uma relação S/N baixa, enuanto os sinais com amplitude elevada apresentam S/N elevadas; sinais com elevadas amplitudes têm pouca probabilidade de ocorrer e os sinais com baixas amplitudes ocorrem mais freuentemente. PCM uniforme é pouco eficiente.

Gama dinâmica Conceito: Relação entre a amplitude máxima, A max, e a amplitude mínima, A min, em ue o sistema deve ser capaz de funcionar com a ualidade mínima A GD = 0 log 0 A Se se uiser assegurar uma ualidade S/N para toda a gama dinâmica, então o nº de bits necessário deve verificar S N =.76 + 6. 0N O sistema telefónico deve ser capaz de transmitir uma elevada gama de amplitudes, i.e. deve ter uma gama dinâmica elevada (30 db é um valor típico). max min b GD

Quantificação não-uniforme S =.76 + 6. 0Nb GD N gamas dinâmicas elevadas exigem um nº de bits por amostra, N b, elevado para garantir uma S/N especificada; Com uantificação uniforme Exemplo: GD = 50 db, S/N = 30 db 3 bits/amostra a S/N resultante é demasiado elevada para sinais fortes; clientes diferentes são servidos com ualidade diferente. Solução: Quantificação não-uniforme Para se obter S/N independente da amplitude do sinal, o intervalo de uantificação deve ser proporcional à amplitude do sinal.

Quantificação não-uniforme (cont.) Solução: dividir a amplitude do sinal de entrada em intervalos nãouniformes, i.e. intervalos de uantificação mais largos para os sinais de amplitudes elevadas e intervalos mais estreitos para amplitudes baixas S/N constante para uma característica de uantificação apropriada. Característica do uantificador não-uniforme: Saída, F(x) Como se realiza esta função? Possível solução: compressão das amostras seguida de uantificação linear. x j- x j Entrada, x

Implementação do uantificador não-uniforme Emissor: Receptor: F(x) F - (x) x y Quantificador Descodificador linear linear y x Compressor Característica normalizada do compressor (só valores positivos): F(x) = y Expansor L níveis na gama de - a : = /L NOTA: x i - /δx i x x i - /δx i Este sinal x vai ser representado pela amplitude uantificada x i 0 δx i x i x i - δx i / x i + δx i / x Declive da característica do compressor (L elevado, 0, δx i 0) dx δ x i = L dy

Potência do ruído de uantificação não-uniforme O erro uadrático médio total é dado, em termos estatísticos, por n =< ε >= L i= x + δ x i i i ( xi x) p( x) dx p( xi ) x δ x i= i i L δ x δ x i i ε dε i ε i é o erro de uantificação do intervalo i n = L i= p NOTA: no caso da uantificação uniforme δx i = resultando em n = / Contribuição de cada intervalo de uantificação ( ) ( ) ( ) i i x = p( x ) δ x = p( x ) δ xi i 3 L L δ x δ x dx i i i= 3L i= dy Probabilidade do sinal x estar no i-ésimo intervalo δ x i = L No caso em ue L é elevado ( δ 0): x i n = 3L Assume-se ue a fdp de x é constante em cada intervalo dx dy i dx dy p( x)dx O ruído de uantificação depende da estatística do sinal analógico a discretizar

Relação sinal-ruído de uantificação Potência do sinal (também depende da estatística do sinal): s =< x >= x p ( x) dx Relação sinal-ruído de uantificação: Tem interesse em definir-se uma relação sinal-ruído de uantificação independente (da estatística) do sinal de entrada: Resolução da e. diferencial: dy = x = y = y + ln x dx kx k s n dx dy = 3L = kx x p dx dy s n ( x) dx p( x)dx = 3L k Relação sinal-ruído proporcional ao uadrado do nº de níveis melhoria de 6 db por cada bit a mais na codificação = Compressão logarítmica: característica irrealizável devido à assimptota vertical para x = 0

Ganho de compressão / Vantagem de compressão Ganho de compressão, relativamente à uantificação uniforme, g c Relação sinal-ruído de uantificação não-uniforme: s n n u = 3L dx dy p( x)dx Relação sinal-ruído de uantificação uniforme, dy/dx = : g c = ( s n ) n ( s n ) u u = Vantagem de compressão, v c = ganho de compressão para sinais (muito) fracos lim x 0 p s dx dy ( x) = δ ( x) p( x)dx v c = lim g x 0 s n u =3L s Depende (da estatística) do sinal e da característica do compressor c dy = lim x 0 dx Depende unicamente da característica do compressor

PCM não-linear (leis A e µ) Duas implementações de características de compressão logarítmicas na Europa: lei A ( ) sgn Ax x 0 x ( ) + ln A A A y = Vc = 0log0 ( ) + + ln Ax ln A sgn( x) = = x Vc 4dB( A 87.6) + ln( A) A Melhoria de 4 db na zona das baixas amplitudes em relação à uantificação uniforme nos EUA e Japão: lei µ (µ define o grau de compressão e µ = 55 é um valor típico) ln ( + µ x ) µ y = sgn( x) Vc = 0log0 ln ( + µ ) ln ( + µ ) Vc = 33.3dB( µ = 55)

Quantificação não uniforme usada para a voz Numa GD de 40 db a lei µ tem uma S/N mais uniforme ue a lei A. 40 Lei µ - 8 bits Lei A - 8 bits 33 db Relação sinal-ruído de uantificação, S/N (db) 30 0 0 Limites especificados na Rec. G.7 da ITU-T com ruído gaussiano à entrada 0-60 -50-40 -30-0 -0 Nível de entrada (dbm 0 ) 0

Técnicas de uantificação não-uniforme Compressão e expansão logaritmica analógica (e.g. díodos) seguida de uantificação uniforme com 8 bits, dificuldade em garantir a reciprocidade exacta das características de compressão e expansão. Compressão aproximada por uma característica segmentada (e perfeitamente adaptada ao processamento digital), PCM segmentado de 3 segmentos usando a lei A; PCM segmentado de 5 segmentos usando a lei µ.

PCM segmentado de 3 segmentos (lei A, A = 87.6, 8 bits) y : :4 Nº do segmento 7 6 Segmento central com declive 6 e redução do declive vezes de cada segmento para o seguinte : 5 Intervalos de uantificação com largura menor do ue com uantificação linear : 4: 8: 6: : V c = 4 db (6 ) 4 3 Largura do intervalo de uantificação aumenta vezes de um segmento para o seguinte Intervalos de uantificação com largura maior do ue com uantificação linear 6: /64 /3 /8 /4 /6 / x

Tabela de codificação da lei A segmentada Nº do segmento gama do sinal dimensão do passo código do segmento código de uantificação 0-0000 -4 000 000 30-3 3-34 0000 00 6-64 64-68 0000 4 00 4-8 8-36 0000 3 8 0 48-56 56-7 0000 4 6 00 496-5 5-544 0000 5 3 0 99-04 04-088 0000 6 64 0 984-048 048-76 0000 7 8 3968-4096 P Estrutura da palavra PCM S Polaridade da amostra 0 - positiva - negativa Identificador de segmento (de 000 a ) Q Identificador do intervalo (dentro do segmento) (de 0000 a )

Reuisitos do sinal de voz / Parâmetros típicos do PCM para a voz Reuisitos para transmissão de voz: Testes demonstraram ue para garantir uma boa ualidade de transmissão de voz é necessário garantir S 35 db N Esta condição deve ser respeitada para uma gama dinâmica da ordem dos 30 db. Características do sistema PCM para a voz: Freuência de amostragem: 8000 amostras/s Quantificação não uniforme com L = 56 níveis; Compressão segundo a lei A com 3 segmentos (Europa) ou lei µ (EUA e Japão) com 5 segmentos; palavras PCM de 8 bits; Ritmo binário: 64 kbit/s. db

Multiplexagem no tempo (Time-Division Multiplexing, TDM) Canal Canal Multiplexer TDM Trama......... Bits Canal Canal Sincr. é o mais peueno grupo de bits contendo pelo menos amostra de cada canal mais os bits de sincronização Canal Bits Canal K Sincr. Demultiplexer TDM Canal Canal Canal K Exemplo: Estrutura da trama para 4 canais (DS-) 93 bits em 5 µs (i.e. 8000 tramas/s) r b =.544 Mbps Canal K b b... b8 b b... b8... b b... b8 Fb Ver Carlson, Cap..5! Canal Canal Canal 4 Frame bit (Sincronização)

Multiplexagem de canais PCM e hieraruias adoptadas pelo ITU-T ª hieraruia ª hieraruia 3ª hieraruia 4ª hieraruia 048 (30) x4 8448 (0) x4 34368 (480) x4 3964 (90) Europa E-x (European-x) E-,, E-4 5ª hieraruia x5 3064 (480) x3 9778 (440) x4 3900 (5760) 544 (4) x4 63 (96) Japão (NTT) NOTA: Os valores entre parêntesis indicam o nº de canais de 64 kbit/s disponíveis e os outros estão em kbit/s. x7 44736 (67) x6 7476 (403) EUA (AT&T) DS-x (Digital Signal-x) DS-,, DS-4 Tx (Transmission lines x) T,, T4