Características do sinal de voz Análise na freuência: a voz apresenta um conteúdo espectral ue vai de 0 Hz a 0 khz; os sons vozeados ou nasais (e.g. vogais e algumas consoantes j, l, m) apresentam um espectro discreto com uma freuência fundamental de 00 a 00 Hz nos homens e 00 a 400 Hz nas mulheres; os sons não vozeados (e.g. f, s, p, ch) ue são gerados pelo fluxo de ar na boca modulado pelos maxilares, língua e lábios apresentam uma variação aleatória. O seu espectro é contínuo; as freuências mais baixas transportam a energia do sinal e as mais elevadas a emoção. Energia (db) 5 5 Discurso de voz básico Emoção 500 3500 Hz
Características do sinal de voz (cont.) Análise no tempo: várias sílabas por segundo; a fala concentra-se em intervalos de duração aleatória (com média de cerca de seg.) separados por intervalos de duração aleatória (superior a 00 ms, uando se está a falar) variação temporal bastante irregular e aleatória; o sinal de voz só está presente, em média, em 40% do tempo. Pode-se aproveitar este facto para intercalar outras conversações (sistema TASI - time assignement speech interpolation).
Caracterização do sistema auditivo Um indivíduo normal com idade compreendida entre os 8 e 5 anos é capaz de detectar sons puros entre 0 Hz e 0 khz; Com a idade, o limite superior da freuência audível reduz-se significativamente, e.g. em média um homem de 65 anos tem a 8 khz uma perda de sensibilidade de 40 db; A sensibilidade do ouvido varia com a freuência e com a intensidade sonora. Este aspecto terá de se reflectir na análise do desempenho das redes telefónicas, em particular na medida da potência do ruído: potência psofométrica (dbmp) Ruído branco (0-4000Hz) -3.6dB; (300-3400Hz) -.5dB O ouvido tem uma elevada gama dinâmica, com valores ue podem ir acima dos 00 db. Para uma boa reprodução basta valores da ordem dos 30 db.
Banda de freuências normalizada para a voz As recomendações G.3 e G.5 do ITU-T indicam a banda atribuída ao sinal de voz de 300-3400 Hz; Nos EUA a banda de freuências atribuída para um canal de voz é 00-300 Hz; Estas larguras de banda resultam de um compromisso entre o ue os assinantes telefónicos pretendem e o ue lhes pode ser fornecido economicamente. Largura de banda total, 4 khz Banda de guarda Banda de guarda Banda dos sinais de voz humana 300 3400 Hz
Transmissão digital de sinais analógicos Transforma o sinal da fonte num sinal eléctrico Fonte de informação e.g. pessoa a falar Transdutor Amostrador Quantificador Codificador de fonte e.g. microfone Fluxo de bits codificados Destino Transdutor Conversor D/A Descodificador de fonte e.g. ouvido da pessoa e.g. auscultador
Entrada analógica s(t) PCM - Pulse Code Modulation - Diagrama de blocos - Circuito de amostragem e retenção s(it) Conversão das amostras num conjunto de amplitudes discretaserro de uantificação F Hz f s = F Filtro passa-baixo Quantificador de L níveis Filtro passa-baixo Codificador Canal de tx Descodificador s(t) (estimativa) Palavras de N b bits, N b =log L F Hz
PCM - Pulse Code Modulation - Exemplo - Sinal original 4. 4.6 Resultado da amostragem.4 3.3...8.4 3.0 Resultado da uantificação pelo inteiro mais próximo Resultado da codificação (palavra binária), i.e. sinal PCM T s 4 3 3 3 00 0 00 00 00 0 00 0 0 5
Amostragem A base do PCM começa com o Teorema da Amostragem: Um sinal de banda limitada pode ser representado pelas suas amostras obtidas a um ritmo f s ue deve ser pelo menos igual ao dobro da freuência máxima presente no sinal (F), i.e. f s F. Domínio do tempo: g(t) Transformada de Fourier Domínio da freuência: G(f) Se f s = F (Ritmo de Nyuist): g s (t) t -F F f G s (f) Resposta do filtro do receptor T s t Considerações: f s =/T s Sinal g(t) tem uma largura de banda finita (F Hz) - Na prática não se verificaaliasing As amostras são retiradas com pulsos de largura infinitésimal Filtro passa-baixo ideal -f s -f s -F 0 F f s f s f
Quantificação A uantificação converte um sinal contínuo em amplitude num sinal discreto em amplitude. Notar ue o processo de amostragem converte um sinal contínuo no tempo num sinal discreto no tempo - Pulse Amplitude Modulation (PAM). Característica do uantificador linear ou uniforme: Característica do erro: y=f(x), saída Característica ideal Erro = y-x = ε O erro está limitado a / y i x 0 x x x i- x i x, entrada x 0 x N x limiares de decisão Erro de sobrecarga Erro de uantificação Erro de sobrecarga NOTA: Quando o valor de entrada está entre x i- e x i o uantificador irá produzir o valor y i
Ruído de uantificação O desempenho de um uantificador pode ser descrito pela relação sinal-ruído de uantificação; A potência de ruído de uantificação é descrita em termos estatísticos através do erro uadrático médio: n < ε >= ε p ( ε ) d ε =< + Para uma distribuição uniforme do erro em cada intervalo de uantificação de largura ; ε + >= ε dε = Para um uantificador linear, todos os intervalos de uantificação apresentam o mesmo erro uadrático médio. / p(ε ) -/ 0 / ε
Cálculo da relação sinal-ruído de uantificação Assume-se ue o sinal de entrada é uma sinusóide com amplitude A, logo a potência média desse sinal vem s =< x t >= A A relação sinal-ruído de uantificação, em db: S N Para PCM uniforme não inferior a 6dB Número de intervalos de uantificação para uma gama de uantificação de -A max a A max : A A A Número de bits por amostra: s A = 0log = = 0 0log + 0 7.78 0log n L = ( ) ( ) = 0 max max L= N =log N b b L A max
Cálculo da relação sinal-ruído de uantificação (cont.) Relação sinal-ruído de uantificação em termos do número de bits, N b S N =.76+ 6.0N b + 0log 0 A A max Para um determinado nº de bits por amostra constante a relação sinalruído de uantificação depende da amplitude A do sinal a uantificar: sinais com baixa amplitude têm uma relação S/N baixa, enuanto os sinais com amplitude elevada apresentam S/N elevadas; sinais com elevadas amplitudes têm pouca probabilidade de ocorrer e os sinais com baixas amplitudes ocorrem mais freuentemente. PCM uniforme é pouco eficiente.
Gama dinâmica Conceito: Relação entre a amplitude máxima, A max, e a amplitude mínima, A min, em ue o sistema deve ser capaz de funcionar com a ualidade mínima A GD = 0 log 0 A Se se uiser assegurar uma ualidade S/N para toda a gama dinâmica, então o nº de bits necessário deve verificar S N =.76 + 6. 0N O sistema telefónico deve ser capaz de transmitir uma elevada gama de amplitudes, i.e. deve ter uma gama dinâmica elevada (30 db é um valor típico). max min b GD
Quantificação não-uniforme S =.76 + 6. 0Nb GD N gamas dinâmicas elevadas exigem um nº de bits por amostra, N b, elevado para garantir uma S/N especificada; Com uantificação uniforme Exemplo: GD = 50 db, S/N = 30 db 3 bits/amostra a S/N resultante é demasiado elevada para sinais fortes; clientes diferentes são servidos com ualidade diferente. Solução: Quantificação não-uniforme Para se obter S/N independente da amplitude do sinal, o intervalo de uantificação deve ser proporcional à amplitude do sinal.
Quantificação não-uniforme (cont.) Solução: dividir a amplitude do sinal de entrada em intervalos nãouniformes, i.e. intervalos de uantificação mais largos para os sinais de amplitudes elevadas e intervalos mais estreitos para amplitudes baixas S/N constante para uma característica de uantificação apropriada. Característica do uantificador não-uniforme: Saída, F(x) Como se realiza esta função? Possível solução: compressão das amostras seguida de uantificação linear. x j- x j Entrada, x
Implementação do uantificador não-uniforme Emissor: Receptor: F(x) F - (x) x y Quantificador Descodificador linear linear y x Compressor Característica normalizada do compressor (só valores positivos): F(x) = y Expansor L níveis na gama de - a : = /L NOTA: x i - /δx i x x i - /δx i Este sinal x vai ser representado pela amplitude uantificada x i 0 δx i x i x i - δx i / x i + δx i / x Declive da característica do compressor (L elevado, 0, δx i 0) dx δ x i = L dy
Potência do ruído de uantificação não-uniforme O erro uadrático médio total é dado, em termos estatísticos, por n =< ε >= L i= x + δ x i i i ( xi x) p( x) dx p( xi ) x δ x i= i i L δ x δ x i i ε dε i ε i é o erro de uantificação do intervalo i n = L i= p NOTA: no caso da uantificação uniforme δx i = resultando em n = / Contribuição de cada intervalo de uantificação ( ) ( ) ( ) i i x = p( x ) δ x = p( x ) δ xi i 3 L L δ x δ x dx i i i= 3L i= dy Probabilidade do sinal x estar no i-ésimo intervalo δ x i = L No caso em ue L é elevado ( δ 0): x i n = 3L Assume-se ue a fdp de x é constante em cada intervalo dx dy i dx dy p( x)dx O ruído de uantificação depende da estatística do sinal analógico a discretizar
Relação sinal-ruído de uantificação Potência do sinal (também depende da estatística do sinal): s =< x >= x p ( x) dx Relação sinal-ruído de uantificação: Tem interesse em definir-se uma relação sinal-ruído de uantificação independente (da estatística) do sinal de entrada: Resolução da e. diferencial: dy = x = y = y + ln x dx kx k s n dx dy = 3L = kx x p dx dy s n ( x) dx p( x)dx = 3L k Relação sinal-ruído proporcional ao uadrado do nº de níveis melhoria de 6 db por cada bit a mais na codificação = Compressão logarítmica: característica irrealizável devido à assimptota vertical para x = 0
Ganho de compressão / Vantagem de compressão Ganho de compressão, relativamente à uantificação uniforme, g c Relação sinal-ruído de uantificação não-uniforme: s n n u = 3L dx dy p( x)dx Relação sinal-ruído de uantificação uniforme, dy/dx = : g c = ( s n ) n ( s n ) u u = Vantagem de compressão, v c = ganho de compressão para sinais (muito) fracos lim x 0 p s dx dy ( x) = δ ( x) p( x)dx v c = lim g x 0 s n u =3L s Depende (da estatística) do sinal e da característica do compressor c dy = lim x 0 dx Depende unicamente da característica do compressor
PCM não-linear (leis A e µ) Duas implementações de características de compressão logarítmicas na Europa: lei A ( ) sgn Ax x 0 x ( ) + ln A A A y = Vc = 0log0 ( ) + + ln Ax ln A sgn( x) = = x Vc 4dB( A 87.6) + ln( A) A Melhoria de 4 db na zona das baixas amplitudes em relação à uantificação uniforme nos EUA e Japão: lei µ (µ define o grau de compressão e µ = 55 é um valor típico) ln ( + µ x ) µ y = sgn( x) Vc = 0log0 ln ( + µ ) ln ( + µ ) Vc = 33.3dB( µ = 55)
Quantificação não uniforme usada para a voz Numa GD de 40 db a lei µ tem uma S/N mais uniforme ue a lei A. 40 Lei µ - 8 bits Lei A - 8 bits 33 db Relação sinal-ruído de uantificação, S/N (db) 30 0 0 Limites especificados na Rec. G.7 da ITU-T com ruído gaussiano à entrada 0-60 -50-40 -30-0 -0 Nível de entrada (dbm 0 ) 0
Técnicas de uantificação não-uniforme Compressão e expansão logaritmica analógica (e.g. díodos) seguida de uantificação uniforme com 8 bits, dificuldade em garantir a reciprocidade exacta das características de compressão e expansão. Compressão aproximada por uma característica segmentada (e perfeitamente adaptada ao processamento digital), PCM segmentado de 3 segmentos usando a lei A; PCM segmentado de 5 segmentos usando a lei µ.
PCM segmentado de 3 segmentos (lei A, A = 87.6, 8 bits) y : :4 Nº do segmento 7 6 Segmento central com declive 6 e redução do declive vezes de cada segmento para o seguinte : 5 Intervalos de uantificação com largura menor do ue com uantificação linear : 4: 8: 6: : V c = 4 db (6 ) 4 3 Largura do intervalo de uantificação aumenta vezes de um segmento para o seguinte Intervalos de uantificação com largura maior do ue com uantificação linear 6: /64 /3 /8 /4 /6 / x
Tabela de codificação da lei A segmentada Nº do segmento gama do sinal dimensão do passo código do segmento código de uantificação 0-0000 -4 000 000 30-3 3-34 0000 00 6-64 64-68 0000 4 00 4-8 8-36 0000 3 8 0 48-56 56-7 0000 4 6 00 496-5 5-544 0000 5 3 0 99-04 04-088 0000 6 64 0 984-048 048-76 0000 7 8 3968-4096 P Estrutura da palavra PCM S Polaridade da amostra 0 - positiva - negativa Identificador de segmento (de 000 a ) Q Identificador do intervalo (dentro do segmento) (de 0000 a )
Reuisitos do sinal de voz / Parâmetros típicos do PCM para a voz Reuisitos para transmissão de voz: Testes demonstraram ue para garantir uma boa ualidade de transmissão de voz é necessário garantir S 35 db N Esta condição deve ser respeitada para uma gama dinâmica da ordem dos 30 db. Características do sistema PCM para a voz: Freuência de amostragem: 8000 amostras/s Quantificação não uniforme com L = 56 níveis; Compressão segundo a lei A com 3 segmentos (Europa) ou lei µ (EUA e Japão) com 5 segmentos; palavras PCM de 8 bits; Ritmo binário: 64 kbit/s. db
Multiplexagem no tempo (Time-Division Multiplexing, TDM) Canal Canal Multiplexer TDM Trama......... Bits Canal Canal Sincr. é o mais peueno grupo de bits contendo pelo menos amostra de cada canal mais os bits de sincronização Canal Bits Canal K Sincr. Demultiplexer TDM Canal Canal Canal K Exemplo: Estrutura da trama para 4 canais (DS-) 93 bits em 5 µs (i.e. 8000 tramas/s) r b =.544 Mbps Canal K b b... b8 b b... b8... b b... b8 Fb Ver Carlson, Cap..5! Canal Canal Canal 4 Frame bit (Sincronização)
Multiplexagem de canais PCM e hieraruias adoptadas pelo ITU-T ª hieraruia ª hieraruia 3ª hieraruia 4ª hieraruia 048 (30) x4 8448 (0) x4 34368 (480) x4 3964 (90) Europa E-x (European-x) E-,, E-4 5ª hieraruia x5 3064 (480) x3 9778 (440) x4 3900 (5760) 544 (4) x4 63 (96) Japão (NTT) NOTA: Os valores entre parêntesis indicam o nº de canais de 64 kbit/s disponíveis e os outros estão em kbit/s. x7 44736 (67) x6 7476 (403) EUA (AT&T) DS-x (Digital Signal-x) DS-,, DS-4 Tx (Transmission lines x) T,, T4