PERCEPÇÃO AUDITIVA E COMPRESSÃO DE ÁUDIO
|
|
|
- Rachel Neiva Lencastre
- 9 Há anos
- Visualizações:
Transcrição
1 PERCEPÇÃO AUDITIVA E COMPRESSÃO DE ÁUDIO PTC PRINCÍPIOS DE TELEVISÃO DIGITAL Guido Stolfi EPUSP 10 / Transmissão de Áudio na TV Analógica e Digital Na televisão analógica, a informação de áudio é transmitida por uma portadora independente, modulada em FM. Para esta portadora estão reservadas cerca de 1/12 da banda e 1/30 da potência total do canal (fig. 1.1). Com este processo, a resposta em frequência do canal de áudio é limitada em cerca de 13 khz, e a relação Sinal/Ruído não passa de 60 db. A transmissão de som estereofônico (2 canais) é feita por um processo de multiplexação, descrito no item 1.1 a seguir. Já no caso da televisão digital, a simples amostragem e quantização do sinal de áudio resultará em uma taxa de bits que não pode ser considerada desprezível em relação à taxa do vídeo comprimido. Por exemplo: para um áudio qualidade CD, os requisitos são: 2 canais de áudio, com resposta de 20 khz Frequência de Amostragem de 44,1 khz Quantização com 16 bits (relação sinal/ruído da ordem de 100 db) Isso resulta em 2 x 16 x 44,1 = 1,41 Mbits por segundo. Lembramos que uma imagem de TV convencional ( standard definition ) pode ser comprimida satisfatoriamente para uma taxa de 2 Mbits/s, pouco maior do que a taxa bruta do áudio. Além disso, para a TV de alta definição, é razoável supor que o áudio deve ser transportado com um padrão de maior qualidade. Para o sistema 5.1 canais, utilizado em salas de cinema, a situação envolve: 5 canais principais (Direito, esquerdo, central, traseiro esquerdo e traseiro direito) 1 canal de baixa frequência para sub-graves Frequência de amostragem de 48 khz para os canais principais Quantização nativa com 24 bits A taxa total será 5,1 x 48 x 24 = 5,88 Mb/s, que representa mais que ¼ da capacidade de um canal de transmissão adequado para TV digital. Percebemos então a necessidade de desenvolver um processo de compressão para o áudio. Da mesma forma que procedemos para a imagem, devemos então estudar as características da audição humana, procurando por situações em que seja possível remover informações redundantes de forma imperceptível. Fig Canal de TV Analógica (portadora de áudio à direita)
2 1.1 Sistema BTSC A transmissão de som estereofônico na TV analógica é feita por um processo semelhante ao de radiodifusão de FM estéreo (Sistema BTSC, Broadcast Television Systems Commitee, figura 1.2). L R 13.5 khz L+R L-R Pré-ênfase 75 us Compressor (DBX) DSB Pilôto p/ modulador F.M khz khz Fig Áudio estereofônico em TV analógica - Sistema BTSC Neste sistema, os canais L e R, limitados em banda até cerca de 13 khz, são somados, sofrem uma pré-ênfase em altas frequências e compõem o sinal de banda base (L+R), que será modulado em FM sobre a portadora de áudio, com desvio máximo de 25 khz. Este sinal é compatível com a transmissão monofônica. Já a diferença (L-R) é multiplicada por uma subportadora, cuja frequência é o dobro da frequência de varredura horizontal da TV (2f h ), gerando um sinal em DSB-SC (banda lateral dupla com portadora suprimida). Antes disso, o sinal (L-R) é comprimido por um sistema denominado DBX (equivalente a um controle automático de ganho com compressão de 2:1), de modo a restringir a faixa dinâmica em 50%, garantindo assim uma melhor relação Sinal/Ruído deste sinal. Para facilitar a demodulação e indicar ao receptor a existência de um sinal estereofônico, é inserido um piloto na frequência de khz (f H ). Lembramos que na radiodifusão FM estéreo, não é usado o compressor, e as frequências da sub-portadora e do piloto são respectivamente 38 e 19 khz. O sistema BTSC admite ainda um canal secundário, ou SAP - Secondary Audio Program - transportado por uma sub-portadora em 5f h, modulada em frequência com desvio de 10 khz. O espectro resultante do sinal BTSC está esquematizado na figura 1.3. L+R L-R SAP (FM) fh 2fh khz khz ~5 fh 68.67~88.67 khz Fig Espectro de banda base do sinal de áudio estereofônico BTSC Princípios de Televisão Digital EPUSP
3 2. Percepção Auditiva: o Ouvido Humano A figura 2.1 mostra um corte do ouvido humano, cuja estrutura pode ser classificada em 3 partes: O Ouvido Externo é composto pela orelha e pelo canal auditivo, e possui funções de filtragem que aumentam a sensibilidade e auxiliam na localização espacial da fonte sonora. O canal auditivo comporta-se como um tubo sintonizado, com picos de resposta em torno de 4 khz e 12 khz, correspondentes às ressonâncias de 1/4 de onda e 3/4 de onda. Já a orelha proporciona uma resposta em frequência diferente, dependendo do ângulo de incidência vertical (elevação) do som; a "assinatura espectral" proporcionada sobre o som recebido permite ao cérebro identificar a origem do som no sentido vertical. No Ouvido Médio é feita uma adaptação de impedância acústica (ou seja, da relação entre pressão e deslocamento) entre o ar e o meio aquoso que preenche o Ouvido Interno. O tímpano consiste de uma membrana elástica, com área aproximada de 60 a 80 mm2. Os ossículos intermediários (martelo, bigorna e estribo) formam uma alavanca que acopla as vibrações do tímpano para a janela oval, cuja área é de 2 mm2. A diferença das áreas, juntamente com o fator de alavanca dos ossos transmissores, proporciona uma variação de impedância da ordem de 4000 vezes, bastante próxima da relação entre as impedâncias acústicas do ar e da água. Aos ossículos intermediários estão acoplados músculos tensores, que podem atenuar a transmissão de vibrações (especialmente em baixas frequências, onde a atenuação pode atingir 30 db). Estes músculos proporcionam uma compressão da faixa dinâmica da percepção sonora, além de agirem como proteção reflexa contra sons de alta intensidade. O Ouvido Interno compõe-se basicamente da cóclea, que consiste de uma cavidade cônica, enrolada na forma de um caracol, preenchida por um meio aquoso (fig. 2.2). Distendida, a cóclea teria comprimento aproximado de 2 a 3 cm. Apresenta-se dividida longitudinalmente em duas câmaras através da membrana basilar, sobre a qual estão distribuídos os Órgãos de Corti, que são, efetivamente, sensores de vibração ligados a terminações nervosas. A figura 2.3 mostra um corte transversal da cóclea; na fig. 2.4 são apresentados em detalhe os órgãos de Corti. lóbulo temporal martelo bigorna canais semicirculares janela oval nervo cóclea orelha osso da têmpora canal auditivo tímpano estribo janela circular trompa auditiva Fig Estrutura do Ouvido Humano Princípios de Televisão Digital EPUSP
4 A figura 2.5 esquematiza a estrutura do ouvido. As vibrações sonoras incidentes no tímpano são acopladas à cóclea pela janela oval, e propagamse pelo meio aquoso. A janela circular atua como uma terminação, permitindo que o líquido no interior da cóclea vibre livremente. Devido ao formato cônico da cavidade, e à variação de espessura, largura e elasticidade da membrana basilar, a cóclea apresenta pontos de ressonância distribuídos ao longo do seu comprimento; assim sendo, sons com frequências da ordem de 15 khz provocam vibração da membrana basilar apenas na região próxima às janelas, enquanto sons de menos de 100 Hz ressoam na extremidade oposta. Fig. 2.2 Estrutura da Cóclea A cóclea opera então como um analisador de espectro, ou um banco de filtros seletivos distribuídos. O ouvido normal é assim capaz de distinguir sons com frequências entre 20 Hz e 20 khz, embora a resposta para altas frequências diminua acentuadamente com a idade. Cerca de 50% das pessoas não ouvem acima de 15 khz. Fig Seção da Cóclea Fig. 2.4 Órgão de Corti ~3 cm ~2,2 cm canal cóclea Membrana Basilar Órgãos de Corti Janelas nervos 15k 4k 1k Hz Fig Representação Esquemática do Ouvido Humano Princípios de Televisão Digital EPUSP
5 2.1 Órgãos de Corti Os Órgãos de Corti contêm células transdutoras de vibração (células ciliares). Estas células estão assentadas na membrana basilar e possuem prolongamentos (cílios), que se apóiam na Membrana Tectorial. A vibração desses cílios, provocada pelo deslocamento relativo entre as membranas basilar e tectorial (fig. 2.6), provoca por sua vez a entrada, na célula, de íons presentes na solução aquosa externa. Ocorre então uma alteração do potencial elétrico na célula, que provoca disparos nas terminações nervosas. A diferença de potencial entre o interior da célula de Corti e o meio aquoso externo é da ordem de 150mV, em repouso. Um deslocamento dos cílios da ordem de 0,1 nanômetro pode ser suficiente para disparar um impulso nervoso. Fig. 2.6 Transdução de Movimento nas Células Ciliares A figura 2.7 mostra a disposição das células de Corti, após a retirada da membrana tectorial. As células Internas, em número de 3500 aproximadamente, são os sensores propriamente ditos. Cada uma das células liga-se, em média, a cerca de 8 fibras nervosas aferentes (que levam estímulos nervosos ao córtex cerebral). Apenas 10% das cerca de fibras aferentes provêm das células Externas; estas, no entanto, recebem a quase totalidade das fibras eferentes (que recebem sinais provenientes do cérebro). Aparentemente, as células Externas são transdutores ou atuadores que modulam, de alguma forma ainda não totalmente conhecida, a resposta e a sensibilidade das células Internas. Danos às células externas estão associados à perda de seletividade e de faixa dinâmica na audição. Fig Células de Corti Internas (esq.) e Externas (3 fileiras à dir.) 2.2 Seletividade e Bandas Críticas A seletividade, ou seja, a resposta em frequência de cada célula sensorial e de suas respectivas terminações nervosas, varia com a posição da mesma em relação à cóclea. Na figura 2.8 (a) temos as respostas em frequência devidas à ressonância mecânica da membrana basilar. As células ciliares externas influem na seletividade total da cóclea, através de um processo de realimentação ativa, aumentando a seletividade da resposta neural. Na figura 2.8 (b) temos a resposta em frequência medida em fibras nervosas avulsas do nervo auditivo. Princípios de Televisão Digital EPUSP
6 A seletividade aparente do nosso ouvido é da ordem de 100 Hz para frequências até 500 Hz, e entre 1/6 e 1/3 de oitava para frequências superiores. Essas faixas de seletividade são denominadas de Bandas Críticas, e estão relacionadas indiretamente com a capacidade do ouvido de discernir sons de amplitudes e frequências diferentes. Fig Seletividade Típica da Membrana Basilar (a) e das Células Ciliares (b) Fig Larguras das Bandas Críticas do Ouvido Humano, Comparadas com a Escala Musical A Fig. 2.9 mostra as larguras das bandas críticas para o ouvido humano em função da frequência. Nota-se que a seletividade é praticamente constante (correspondendo a um atraso de grupo constante) dentro das frequências fundamentais da maioria dos instrumentos musicais. A compreensão do significado das bandas críticas pode ser facilitada analisando um método utilizado para determinação experimental das suas larguras. Este método é esquematizado na figura 2.10, onde se utiliza um estímulo sonoro na forma de um ruído de banda estreita, com frequência central e potência constantes, porém com largura de banda variável. À medida que a largura de banda é aumentada, a sensação subjetiva de intensidade sonora permanece constante até que seja excedida a largura da banda crítica. A partir desse ponto, ocorre uma sensação de aumento de volume sonoro, apesar da potência permanecer constante. A ideia é que a banda crítica define uma vizinhança espectral, dentro da qual as informações são combinadas em uma única sensação de volume. Sons fora dessa banda contribuem de forma independente, resultando em uma sensação maior de volume. Princípios de Televisão Digital EPUSP
7 Nivel Sonoro Potência Constante Bc Largura de Banda Fig Determinação das Bandas Críticas 3. Sensibilidade da Audição O ouvido apresenta resposta perceptual aproximadamente logarítmica, tanto na distinção de frequências como na de intensidade sonora. O limiar inferior de audibilidade para um ouvido normal corresponde a uma amplitude de pressão sonora de 20 Pa r.m.s. (210-5 N/m2) na frequência de 1 khz (aproximadamente 1 pw/m2). Já o limiar de desconforto é atingido com pressões sonoras de vezes maiores (Tabela 3.1). É conveniente então medir o nível de pressão sonora em escala logarítmica, sendo então definida a unidade db SPL ("Sound Pressure Level") como p Pressão Sonora 20log ( dbspl) onde po 20Pa p o r.m.s. db SPL db SPL Foguete 195 Conversação 65 Avião a jato 155 Restaurante 60 Limiar de dor 140 Residência urbana 40 Limiar de desconforto 120 = 1 W/m 2 Casa de campo 30 Orquestra fortíssimo 110 Orquestra pianíssimo 30 Rebitadeira 100 Estúdio de gravação 20 Fábrica 78 Folhagens na brisa 10 Tráfego pesado 68 Limiar de audição 0 = 1pW/m 2 Escritório ruidoso 65 Ruído térmico do ar 10 db Tabela Exemplos de Situações Sonoras Por outro lado, a resposta em frequência do ouvido não é plana, nem linear (varia com a intensidade sonora). Define-se então Volume Sonoro ( Loudness ) como representando a Princípios de Televisão Digital EPUSP
8 grandeza subjetiva associada à percepção sensorial da intensidade de um som. O Volume Sonoro é expresso em Phons, sendo que o nível em Phons é numericamente igual à pressão sonora em db SPL na frequência de 1 khz. A resposta em frequência do ouvido, para vários níveis de Volume Sonoro, foi estudada por Fletcher e Munson em 1933, e posteriormente por Robinson e Dadson, sendo as curvas médias da figura 3.1 adotadas como recomendação pelo ISO. Fig Curvas de Igual Volume Sonoro para Tons Senoidais (Rossing ) Pelas curvas, nota-se que a sensibilidade é bastante reduzida para baixas frequências com baixas amplitudes, rejeitando assim sons produzidos pelo próprio corpo humano e, em particular, pela circulação sanguínea no ouvido interno. A sensibilidade atinge um pico em 4 khz (frequência de ressonância do canal auditivo), decrescendo novamente até um segundo pico em 12 khz (também devido ao canal auditivo). Acima de 15 khz a resposta é variável de indivíduo para indivíduo, e bastante atenuada. As curvas da fig. 3.1 parecem indicar que um sistema de reprodução sonora deveria responder de 20 a Hz (o que é verdade), e proporcionar uma faixa dinâmica ou relação sinal/ruído maior que 120 db. No entanto, este requisito não corresponde à realidade por duas razões: O nível de ruído ambiente em uma residência é de aproximadamente 40 db SPL; mesmo em um estúdio de gravação é de pelo menos 20 db SPL (Tabela 3.1). O nível de 120 db SPL corresponde ao limiar de desconforto; experimentalmente determinou-se que as regiões confortáveis para audição de música ou voz abrangem faixas dinâmicas respectivamente de 70 db e 30 db (Fig. 3.2). Considerando um nível de ruído de fundo de 10 db SPL (inaudível mesmo em condições de estúdio), percebe-se que uma relação S/R de 90 db é satisfatória para um sistema de Princípios de Televisão Digital EPUSP
9 transmissão de áudio de alta qualidade. No caso do CD, por exemplo, a quantização com 16 bits proporciona uma relação S/R da ordem de 100 db. Fig Faixa dinâmica para Audição de Música e Voz 3.1 Percepção de Direção Dois mecanismos básicos atuam na percepção da direção de uma fonte sonora. Para frequências baixas, até cerca de 1 khz, a diferença de fase entre as frentes de onda recebidas nos dois ouvidos fornece indicação de direção (fig. 3.3-a). Para frequências altas, é a diferença de amplitude nos dois ouvidos, provocada pela sombra acústica projetada pela cabeça, que fornece indicação de direção (fig. 3.3-b). Ambiguidades entre sons frontais e posteriores são resolvidos por movimentos da cabeça; portanto, a localização espacial do som é prejudicada quando são usados fones de ouvido. A percepção de direção no sentido vertical é em parte proporcionada pelo pavilhão auricular, cuja estrutura imprime uma assinatura espectral ao som recebido, conforme sua elevação. Fig. 3.3 (a) diferenças de fase (b) diferenças de intensidade Princípios de Televisão Digital EPUSP
10 3.2 Percepção de Ambiente Reflexões múltiplas nas paredes, piso e outros elementos de um ambiente trazem ao ouvido pistas que permitem identificar algumas características desse ambiente. Por exemplo, o atraso temporal entre o som direto e a primeira reflexão subsequente (fig. 3.4) fornece à audição uma idéia do tamanho do ambiente. O tempo de decaimento, a relação entre o decaimento em altas e baixas frequências, etc., trazem informações sobre o tipo de ambiente e dos materiais e revestimentos envolvidos. Som direto Fig. 3.4 Percepção de Ambiente Primeiro eco 4. Mascaramento A faixa dinâmica de 120 db do ouvido humano representa a relação entre os níveis de audibilidade e de desconforto para sons individuais. No entanto, quando dois sons de intensidades e frequências diferentes são combinados simultaneamente, ocorre o fenômeno de mascaramento, que pode ser descrito como um deslocamento relativo do limiar de Audibilidade, provocado pela presença de tons de maior intensidade. Vários experimentos foram feitos para determinar e modelar as características do mascaramento; algumas conclusões obtidas são as seguintes: Tons senoidais com frequências próximas são mascarados mais do que tons em frequências distantes entre si; Um tom senoidal mascara mais fortemente outros tons de frequências mais altas do que tons de frequências inferiores; Quanto maior a amplitude do tom, maior a banda de frequências mascaradas por ele; Ruído de banda estreita apresenta características de mascaramento similares às dos tons senoidais; Ruído branco mascara tons senoidais de todas as frequências igualmente e de forma linear; O mascaramento provocado por um tom mais intenso permanece por um tempo de 20 a 30 ms após a interrupção do tom (mascaramento temporal); Um tom pode ser mascarado por um outro som de intensidade maior emitido até 10 ms após o primeiro (mascaramento temporal retroativo). A figura 4.1 mostra o limiar de mascaramento para um tom senoidal de 1200 Hz a 80 Phons. Nota-se a presença de picos no nível de mascaramento nas frequências próximas a 2400 e 3600 Hz; estes picos sugerem que o ouvido humano gera internamente distorções harmônicas que interferem com os sons captados. Princípios de Televisão Digital EPUSP
11 Dentro de uma faixa comparável à banda crítica, o mascaramento atinge níveis até 20 db abaixo do sinal interferente. Em frequências muito próximas à do sinal interferente (e de suas harmônicas), a sensibilidade melhora um pouco devido à percepção de batimentos, na forma de variações de amplitude do sinal percebido. Fig Mascaramento para Tom Senoidal A assimetria do mascaramento em função da frequência pode ser explicada pelo padrão de vibração da membrana basilar (figura 4.2); devido à sua assimetria, tons de baixa frequência (f1) mascaram mais fortemente os de alta frequência (f2) do que o inverso. No caso (b), o tom f1 de maior amplitude mascara completamente o tom f2; já no caso (c), um som de frequência f2, mesmo de maior amplitude, não consegue encobrir o som f1. Janela Oval 15 khz f2 f 1 60Hz (a) f2 f 1 (b) f2 f 1 (c) Fig Resposta da Membrana Basilar para 2 Tons Senoidais Para sinais de mascaramento constituídos de ruído de banda estreita (Fig. 4.3), os efeitos de batimento desaparecem, mantendo-se semelhantes, no entanto, os efeitos da distorção no ouvido interno (para níveis mais elevados) e da assimetria em frequência do mascaramento. Princípios de Televisão Digital EPUSP
12 Fig Mascaramento para Ruído de Banda Estreita A figura 4.4 mostra famílias de curvas de mascaramento para tons senoidais, ruído de banda estreita e banda larga, para várias frequências e amplitudes. Por exemplo, no gráfico referente a um tom senoidal de 200 Hz, a curva correspondente a um tom de volume sonoro igual a 99dB (Phons) indica que um tom de 1 khz só será percebido se estiver acima de 62 db. Em outras palavras, a presença de um tom de 200 Hz, com amplitude de 99 db, faz com que a faixa dinâmica da audição seja restrita a (99-62) = 37 db na banda de 200 a 1000 Hz aproximadamente. Esta característica da audição é bastante explorada pelos processos de compressão de áudio. Fig Curvas de Mascaramento (Fletcher & Munson) Princípios de Televisão Digital EPUSP
13 5. Codificação por Sub-Bandas A maioria dos métodos eficientes de compressão de áudio explora o mascaramento através da subdivisão do espectro em sub-bandas. A idéia geral é decompor o sinal por um banco de filtros passa-banda (fig. 5.1), possivelmente relacionados às bandas críticas de audibilidade, de modo que na saída de cada filtro tenhamos um sinal de banda estreita, cuja amplitude será via de regra menor que a do sinal original. A seguir, é feita uma estimativa de mascaramento, baseada no espectro do sinal original, de modo que para cada sub-banda é determinada a relação Sinal/Ruído necessária para reproduzir o respectivo sinal filtrado. Então, o sinal de cada sub-banda é quantizado com um número de bits suficiente, de modo que o ruído de quantização esteja abaixo da relação S/R exigida para aquela banda. Fig Análise de um Sinal por Sub-Bandas A figura 5.3 mostra um diagrama de blocos do codificador de áudio descrito no padrão MPEG; neste caso, o sinal original é analisado por um banco de 32 filtros (fig. 5.2). Supondo por exemplo uma digitalização a 48 khz, a banda de cada filtro será de 1/32 x 24 khz = 750 Hz. As saídas dos filtros são sub-amostradas (decimadas), de modo que a taxa de amostras original (48 khz) é decomposta em 32 sinais amostrados em 1500 Hz. Uma vez que as respostas dos filtros se superpõem parcialmente, ocorrerá rebatimento espectral ("aliasing"), e um tom dentro de uma sub-banda provocará aparecimento de espúrios nas sub-bandas adjacentes. No entanto, os filtros usados são projetados com simetria da resposta em fase, de modo que os espúrios gerados por uma banda teoricamente se cancelam com os espúrios gerados pelas bandas adjacentes no decodificador. Estes filtros são conhecidos por QMF ("Quadrature Mirror Filters") Fig Respostas do banco de Filtros MPEG A determinação do nível de mascaramento é feita por um Modelo Psico-acústico, a partir do espectro obtido por uma FFT de 512 ou 1024 pontos. Embora o detalhamento do modelo não esteja especificado no padrão MPEG, sua operação segue o esquema geral da figura 5.4. Princípios de Televisão Digital EPUSP
14 BANCO DE FILTROS 1 AMOSTRADORES QUANTIZADORES Q1 2 Q2 AMOSTRADOR PCM ÁUDIO Fa 3 4 Q3 Q4 FLUXO DE DADOS CODIFICADOS 32 Q32 Fa/32 MODELO SUB- PSICO- ACÚSTICO ALOCAÇÃO DE BITS FORMATADOR DADOS AUXILIARES Fig Estrutura do Codificador MPEG-Áudio Cálculo do Limiar Absoluto Tonal Limiar Tonal PCM FFT Separador Não- Tonal Funções de Mascaramento Limiar mínimo Não-Tonal M(n) Cálculo da Potência por Banda SPL(n) SMR(n) Fig Exemplo de Estrutura de Modelo Psico-Acústico MPEG Princípios de Televisão Digital EPUSP
15 As tarefas envolvidas na codificação seriam as seguintes: 1. Medida do Espectro (por FFT) do sinal completo, dentro de um certo intervalo de tempo (quadro de amostras); 2. Determinação, para cada sub-banda n, do nível de potência sonora SPL(n); 3. Cálculo do limiar absoluto por banda, correspondente ao limiar de audibilidade; 4. Separação entre sinais tonais e não-tonais para escolha do padrão de mascaramento (esta separação pode ser feita pelo fator de crista, ou seja, pela relação entre valor de pico e valor r.m.s. por sub-banda. Sinais tonais apresentam fator de crista menor que sinais não-tonais ou ruído); 5. Cálculo do efeito de mascaramento devido às componentes tonais, dentro e fora da subbanda, considerando ainda mascaramento temporal (podem ser usadas tabelas baseadas nas curvas de mascaramento); 6. Idem para as componentes não-tonais (usando tabelas diferentes); 7. Cálculo do limiar de audibilidade total, considerando as contribuições do limiar absoluto e dos efeitos de mascaramento tonais e não-tonais (figura 5.5); 8. Cálculo do valor mínimo (em função da frequência) do limiar total dentro de cada subbanda, obtendo o nível de mascaramento M(n) ; 9. Cálculo da Relação Sinal / Mascaramento SMR(n) (Signal-to-Mask Ratio), como apresentado na Fig. 5.6; 10. Alocação de Bits para quantização de cada sub-banda, em função da SMR(n) e da porcentagem de ocupação do canal de saída; 11. Formatação do fluxo de dados, incluindo conjuntos de amostras, fator de escala e quantidade de bits alocados para cada sub-banda. SMR Mascaramento tonal Mascaramento não-tonal Limiar Absoluto Limiar Total Fig Cálculo do Limiar de Mascaramento Total freq. Princípios de Televisão Digital EPUSP
16 Amplitude de Pico na Banda Sinal de Áudio SMR(n) Mascaramento Total Limiar de Ruído de Quantização na Banda n Fig. 5.6 Relação Sinal / Mascaramento Dentro de Uma Banda 6. Padrões de Compressão de Áudio 6.1 Padrões MPEG O padrão MPEG-1 de compressão de áudio (ISO / IEC Parte 3) especifica 3 níveis de desempenho, associados basicamente à complexidade do modelo psico-acústico e dos bancos de filtros. Já o padrão MPEG-2 (ISO Parte 3) estende a codificação para sistemas com 5.1 canais, adequados para "Home Theater" com "Qualidade Cinema". A maioria dos sistemas trabalha com taxa de bits constante na saída, ao contrário do que ocorre com a compressão de vídeo. Algumas características de cada sistema são apresentadas a seguir: MPEG-1 Nível I: Codificação feita em Quadros de 12 amostras por sub-banda (384 amostras e 32 subbandas); Para cada quadro permanecem constantes os fatores de escala e alocações de bits por amostra por banda; Aceita taxas de amostragem de 32kHz, 44.1 khz ou 48 khz para um ou dois canais independentes ou associados; O padrão MPEG-1 Nível I é usado no DCC (Digital Compact Cassette) com o nome de PASC (Precision Audio Sub-band Coding) MPEG-1 Nível II (MUSICAM): Codificação em Quadros de 3 12 amostras por sub-banda (1152 amostras) proporcionando menor "overhead" na transmissão; A análise de espectro para o modelo psico-acústico é feita com FFT de 1024 pontos; Admite codificação estatística agrupando 3 amostras consecutivas em um único código; MPEG-1 Nível III (MP3): Codificação em Quadros de 3 12 amostras por sub-banda (1152 amostras); Usa um modelo psico-acústico mais elaborado; Princípios de Televisão Digital EPUSP
17 Utiliza transformada de cossenos (DCT) para subdividir as Sub-bandas em 6 ou 18 subsub-bandas, proporcionando redução de "Aliasing" entre sub-bandas; Efetua aplicação de janelas temporais curtas (6 amostras) ou longas (18 amostras) antes da DCT; Pode usar Quantizador não-linear : Y=Q(X0.75); Adota fator de escala válido por bandas; Aplica codificação de Huffman nas amostras quantizadas; Utiliza Memória Elástica ("Buffer") para regularizar a taxa média de bits; Implementa um controle de taxa de compressão baseado na ocupação do "Buffer"; MPEG-2 (Níveis I, II, III): Suporte para 5.1 canais (HDTV), com predição adaptativa dos canais adicionais baseada nos canais L e R; Prevê suporte para até 7 canais adicionais de voz (multilingual); Codificação e decodificação compatível com MPEG-1 (sintaxe inclui um fluxo de dados compatível com MPEG-1 carregando os canais L e R); Aceita outras taxas de amostragem (16, e 24 khz) Estrutura de Pacotes de Dados MPEG-1 A figura 6.1 apresenta a estrutura dos pacotes de transporte de dados para o padrão MPEG-1, bem como o detalhamento do cabeçalho. Cabeçalho CRC Alocação de bits Fatores de escala Amostras Dados auxiliares Sincronismo 11 = MPEG-1 10 = MPEG-2 01 = Reserv. 00 = MPEG V = Layer I 10 = Layer II 01 = Layer III 1 = Sem CRC 0 = Com CRC Taxa de bits 11 = Reserv. 10 = 32k 01 = 48k 00 = 44.1k Enchimento Uso privado 00,01,10 = Estéreo 11 = Mono Extensões (modo Estéreo 01) Fig. 6.1 Pacote de Dados MPEG-1 Áudio 11 = CCITT J = Reserv. 01 = 50/15 s 00 = s/ ênfase 1 = Original 0 = Cópia 1 = c/ Copyright 0 = s/ Copyrighy O sincronismo do pacote é feito por uma sequência de 11 bits consecutivos iguais a 1. Em seguida, 4 bits definem o padrão e o nível da implementação. A existência de CRC, após o cabeçalho, é sinalizada por mais um bit. Em seguida é informada a taxa de bits, através de índice em para uma tabela, que depende do padrão e do nível. Um Princípios de Televisão Digital EPUSP
18 campo de 2 bits seleciona a taxa de amostragem. Finalmente, o último byte traz informações de número de canais, registro de Copyright, identificação de original ou cópia e uso de préênfase em altas frequências. Após o cabeçalho (e CRC opcional), há um campo que define a alocação de bits para cada banda. As sub-bandas são separadas em 3 grupos (Low, Mid e High), sendo que para cada grupo os campos correspondentes selecionam os seguintes quantizadores: Bandas Low : 4 bits por banda selecionam 1 entre 15 quantizadores possíveis, variando de 3 a níveis de quantização; Bandas Mid : 3 bits por banda, selecionam um de 7 quantizadores; Bandas High : 2 bits por banda, selecionam um de 3 quantizadores possíveis. Em seguida, há um campo com os fatores de escala (ganhos), ocupando 6 bits para cada banda. Os ajustes de ganho cobrem uma faixa dinâmica de 120 db. 6.2 Sony ATRAC (Adaptive Transform Acoustic Coder): A gravação magneto-óptica Mini-Disc utiliza o algoritmo denominado ATRAC, que aplica uma combinação de codificação por sub-bandas com transformada DCT (Fig. 6.1). Fig Codificador ATRAC (Sony) O sinal de áudio, quantizado em 16 bits a 44.1 khz, é separado em 3 bandas (0 a 5.5, 5.5 a 11 e 11 a 22 khz) por dois bancos de filtros QMF. O sinal de cada banda é dividido em blocos com duração variável de 1.45 a 11.6 ms, os quais são decompostos em coeficientes através de uma transformada DCT modificada. Os coeficientes são então reagrupados em 52 bandas de frequência com larguras variáveis, aproximadamente de acordo com as larguras das bandas críticas de audibilidade. Os coeficientes são compandidos e quantizados de acordo com um modelo de mascaramento auditivo. O tamanho do bloco é independente para cada uma das três bandas, sendo escolhido em função da existência de transientes no sinal de áudio. Princípios de Televisão Digital EPUSP
19 6.3 Codificador Dolby AC-3: O padrão AC-3 (adotado para o sistema de radiodifusão HDTV e para o sistema DVD nos EUA) baseia-se na codificação de uma representação do sinal de áudio no domínio da frequência (Fig. 6.2). O sinal de áudio é amostrado a 48, 44.1 ou 32 khz, sendo que a taxa de amostragem é sincronizada com um sinal de 27 MHz que é usado também na amostragem do sinal de vídeo. O sinal de áudio é codificado em quadros de 1536 amostras, separadas em 6 blocos de 512 amostras com superposição de 50%; cada um destes blocos é multiplicado por uma janela temporal e transformado em coeficientes no domínio da frequência através de uma transformada DCT (Fig. 6.3). Devido ao formato da janela temporal, os coeficientes são correlacionados entre si e podem ser decimados na razão de 2:1, restando assim 256 coeficientes para cada bloco. Ainda devido à janela, os blocos se superpõem no receptor, cancelando no domínio do tempo os espúrios causados pela DCT. Os coeficientes X(k) são obtidos a partir das amostras x(n) por: 511 Xk 1 2 x n J n n k k 256 n ( ) ( )cos ( )( ) ( ) 0 onde J(n) é a janela temporal (obtida de uma tabela). Os coeficientes são representados em ponto flutuante, obtendo-se um expoente e uma mantissa para cada um. Os expoentes definem uma representação aproximada do espectro do sinal, em escala logarítmica, denominado de Envoltória Espectral. Antes da codificação de um quadro completo, os expoentes dos seis blocos são examinados quanto às variações de um bloco para outro. Havendo variações significativas entre blocos sucessivos, são formadas envoltórias espectrais válidas para grupos de blocos dentro dos quais as diferenças são menores. Além disso, como os expoentes de coeficientes consecutivos geralmente diferem entre si por valores até +/- 2, os expoentes são codificados de forma diferencial. A codificação da envoltória espectral ocupa assim cerca de 0,3 a 0,4 bits por amostra. PCM JANELA TEMPORAL DCT DECIMAÇÃO PONTO FLUTUANTE EXPOENTES ENVOLTÓRIA ESPECTRAL MANTISSA CABEÇALHO QUANTI- ZAÇÃO ALOCAÇÃO DE BITS MANTISSAS QUANTIZADAS FORMATAÇÃO DE QUADRO AC-3 Fig Codificação de Áudio Dolby AC-3 Princípios de Televisão Digital EPUSP
20 Fig Janelas Temporais Superpostas para DCT (AC-3) Baseando-se na envoltória espectral, o algoritmo de alocação de bits determina a precisão necessária para a quantização de cada mantissa. Um modelo psico-acústico determina uma curva de mascaramento para cada bloco; subtraindo esta curva da envoltória espectral, obtémse a relação S/R necessária para cada coeficiente em função da frequência. Quando o sistema encontra transientes impulsivos, pode ocorrer um fenômeno de espalhamento do ruído de quantização: o modelo psico-acústico calcula a relação S/R baseando-se na amplitude máxima do transiente, alocando então parâmetros de quantização que podem resultar em ruído elevado. Como esse ruído vale para todo o bloco (5,33ms), pode ser audível em certas condições, especialmente quando o transiente ocorre no final do bloco. Nesses casos, pode ser vantajoso subdividir o bloco de 512 amostras em 2 blocos de 256 amostras; desta forma, o espalhamento de ruído é reduzido. Além disso, o codificador pode utilizar o recurso de Acoplamento, que consiste em combinar as altas frequências de dois ou mais canais em um único canal conjunto. O codificador transmite então coordenadas de acoplamento, que indicam as atenuações que devem ser aplicadas ao canal conjunto para reconstruir os canais independentes no receptor. Este recurso baseia-se no fato de que a percepção de direção de uma fonte sonora, em altas frequências, deve-se mais à diferença de amplitude do que à forma de onda específica recebida por cada ouvido. Os canais codificados são combinados em Quadros AC-3 (Fig. 6.4), correspondentes a 1536 amostras. Os quadros são compostos de: Palavra de sincronismo: 16 bits de Sinc (0B77h), 16 bits de CRC (válido para 5/8 do quadro), mais 8 bits definindo taxa de amostragem (48,44.1 ou 32 khz) e tamanho do quadro e taxa de transmissão (32 a 640 kb/s) CRC AB S BSI Fig Formatação do Quadro AC-3 AUX Parâmetros descritivos do serviço fornecido (BSI - Bit Stram Information): Identificador de padrão AC-3 (5 bits), tipo de serviço (ver detalhamento do tipo de serviço adiante), número de canais (1 a 5), presença de canal de baixa-frequência, informações de língua, compressão de faixa dinâmica, nível de referência de volume (nível de diálogos), proteção contra cópias, time code (28 bits); Codificação dos 6 blocos de áudio: informações de acoplamento, subdivisão de blocos, faixa dinâmica; envoltórias espectrais (expoentes); parâmetros para o algoritmo de alocação de bits no decodificador; mantissas (quantizadas com 0 a 16 bits); Princípios de Televisão Digital EPUSP
21 Dados auxiliares (normalmente não utilizados); CRC2 para detecção de erros (16 bits), válido para o quadro inteiro. 6.4 Tipos de Serviços de Áudio Suportados pelo Padrão AC-3: Este padrão admite vários serviços de áudio para diferentes aplicações, sendo que cada serviço é codificado em quadros AC-3 independentes, porém fornecidos sequencialmente no mesmo bit stream. Há 2 tipos de Serviços Principais e 6 tipos de Serviços Associados: Complete Main Audio Service (CM) : Diálogo, Música e Efeitos ; 1 a 5.1 Canais, podendo ser codificado em múltiplas línguas; Main Audio Service, Music and Effects (ME) : Música e Efeitos sem Diálogo, podendo ser combinado com áudio proveniente do Serviço D; Visually Impaired (VI) : Descrição narrativa da informação visual, destinada a atender deficientes visuais; 1 Canal de áudio que pode ser combinado com o Serviço CM; Hearing Impaired (HI) : Apenas canal de Diálogo, processado p/ maior inteligibilidade, destinado a deficientes auditivos; Dialogue (D) : Diálogo a ser combinado com áudio proveniente do Serviço ME; pode ser fornecido em várias línguas e codificado em 1 canal (Central) ou 2 canais; Commentary (C) : Comentários opcionais ao Programa Visual; pode ser fornecido como 1 canal a ser combinado ao serviço ME; Emergency (E) : Canal de maior prioridade, admite inserção de mensagens de emergência, sobrepondo-se aos outros serviços; Voice-Over (VO) : 1 canal de áudio, que permite inserções de voz a serem superpostas a um serviço já codificado, sem a necessidade de que o áudio original seja decodificado, misturado com a inserção e re-codificado novamente. 7. MPEG-2 AAC (Advanced Audio Coding) O padrão AAC, desenvolvido como extensão para compressão de áudio em MPEG-2 e MPEG- 4, apresenta ferramentas adicionais que permitem melhora na qualidade da codificação e redução de até 50% na taxa de bits. A figura 7.1 apresenta um diagrama de blocos do processo de codificação MPEG-2 AAC. Entre os recursos introduzidos neste processo, temos: Codificação para 1 a 48 canais de áudio; Taxas de amostragem de 8 a 96 khz; Banco de filtros implementado por Transformada Discreta de Cossenos, similar ao Dolby AC-3, com 1024 pontos; Utilização de preditor linear (LPC) e equalização para Noise Shaping adaptativa; Possibilidade de utilização de replicação espectral. O conceito de replicação espectral envolve a síntese, no receptor, de componentes espectrais (harmônicas ou ruído) que foram suprimidas no codificador pelo filtro anti-aliasing, por ocasião da amostragem. Princípios de Televisão Digital EPUSP
22 Áudio Digital Controle de Ganho Modelo de Percepção Auditiva Banco de Filtros (DCT) Noise Shaping temporal Acoplamento Entre bandas M Espectro do quadro anterior Preditor Espectral Estereofonia e canal central U X Fluxo de Dados Fatores de Escala Controle de Taxa de Compressão Quantizador Compactação Fig. 7.1 Diagrama de Blocos do Codificador AAC Estes recursos são utilizados pelo codificador destinado à compressão de áudio genérico (música, trilha sonora etc.) denominado Natural Audio Coding. O padrão MPEG-4 admite outros codificadores com ferramentas adequadas para aplicações específicas, como compressão de voz humana ( Vocoder, HVXC, HINL, CELP), síntese de instrumentos musicais (MIDI), etc. De acordo com o diagrama apresentado, o sinal de áudio digitalizado é analisado segundo um modelo perceptual, o qual controla os parâmetros dos demais blocos. A sequência de processamento das amostras de áudio é a seguinte: Controle de Ganho: nesta etapa, o sinal é separado em 4 bandas de frequência, sendo aplicado um ganho individual para as 3 bandas superiores, de modo a equalizar a energia nessas regiões do espectro (fig. 7.2); Banco de Filtros: Aplica-se uma janela temporal longa ou curta (dependendo da existência de transientes), e a seguir é feita uma decomposição espectral usando Transformada Discreta de Cossenos, com 2048 ou 256 pontos (de acordo com o comprimento da janela temporal). As amostras são decimadas, resultando em 1024 ou 128 coeficientes espectrais. A figura 7.3 apresenta exemplos de janelas longas e curtas intercaladas. Princípios de Televisão Digital EPUSP
23 (0-24 khz) LP LP HP (0-6 khz) (6-12 khz) HP LP HP (12-18 khz) (18-24 khz) Controle de Ganho (Coeficientes) Fig. 7.2 Controle de Ganho por Bandas 1 Frame (1024 Amostras) Janelas Longas DCT Longa (2048 Amostras) Janelas Curtas DCT Transição (2048 Amostras) 8 DCTs Curtas (256 Amostras) DCT Transição (2048 Amostras) Fig. 7.3 Janelas Longas e Curtas Noise Shaping Temporal (TNS): Este bloco aplica uma pré-ênfase antes da quantização, que deverá ser compensada com uma de-ênfase no receptor. Desta forma, o erro de quantização nas componentes de menor amplitude será reduzido em relação ao das componentes de maior amplitude (fig. 7.4). A forma do filtro de pré-ênfase é obtida a partir do espectro de um frame, utilizando-se um filtro passa-baixas no domínio do espectro para gerar uma curva que representa a envoltória espectral média. Preditor Espectral: este bloco efetua a codificação das diferenças espectrais entre o quadro atual e o espectro quantizado do quadro anterior. Cada coeficiente espectral é tratado por um filtro de predição de segunda ordem (fig. 7.5). Fatores de Escala: As amostras obtidas do preditor são ajustadas por fatores de escala, válidos para cada frame e grupo de frequências, com resolução de 1,5 db, de modo a ajustar o fundo de escala do quantizador. Os fatores de escala são codificados de forma diferencial em relação aos fatores usados no quadro anterior. Princípios de Televisão Digital EPUSP
24 Quantizador Não-Linear: Após ajuste de escala, os coeficientes são processados por uma função não-linear da forma y = x 0,75 e então quantizados com um número variável de níveis. A figura 7.6 esquematiza os fatores de escala e o quantizador não-linear. Compactação: A associação de um Fator de Escala e do respectivo Quantizador constitui um símbolo, que é codificado conjuntamente usando um dicionário de Huffman. Os coeficientes quantizados são por sua vez agrupados em 2 ou 4 valores para cada símbolo, e codificados utilizando um dicionário escolhido entre 11 tabelas possíveis. Espectro do Sinal Envoltória Espectral Equalização (Pré-ênfase) F 1/x Filtro no Domínio Da Frequência Quantizador Q Fig. 7.4 Noise Shaping Temporal (TNS) Sinal com Noise Shaping Filtro de 2 a Ordem Filtro de 2 a Ordem Espectro de Entrada Erro Espectral Coeficientes Espectrais P/ Quantizador Espectro Quantizado Do Frame Anterior Filtro de 2 a Ordem Fig. 7.5 Preditor Espectral Princípios de Televisão Digital EPUSP
25 Coeficiente Espectral Coeficiente Quantizado X 0,75 Q X 1,33 (Restauração no Decodificador) Fator de Escala (Frame / Frequência) Quantizador (Frame / Frequência) Fig. 7.6 Fatores de Escala e Quantizador Não Linear 8. Desempenho dos Processos de Compressão de Áudio: A tabela abaixo apresenta o desempenho de alguns processos de compressão, com parâmetros ajustados para qualidade próxima à de CD. Padrão de Compressão Canais Taxa Média de Compressão Taxa Original Taxa Comprimida Atraso A/D/A MPEG-1 / I 2 4:1 1,41 Mb/s 384 kb/s 19 ms ATRAC 2 5:1 1,41 Mb/s 292 kb/s MPEG-1 / II (MUSICAM) 2 6:1 1,54 Mb/s 256 kb/s > 40 ms MPEG-1 / III 2 8:1 1,41 Mb/s 128 kb/s > 80 ms MPEG-2 / III :1 3,53 Mb/s 384 kb/s Dolby AC :1 3,53 Mb/s 290 kb/s 45 ms MPEG-2 AAC : Mb/s 196 kb/s > 80 ms Princípios de Televisão Digital EPUSP
26 9. Referências: A. J. M. Hotsma, T. D. Rossing, W. M. Wagenaars: Auditory Demonstrations (CD); IPO/Philips, 1987 Advanced Television Systems Commitee: Digital Audio Compression Standard; 1995 F. Alton Everest: The Master Handbook of Acoustics; TAB Books, 1994 Harry F. Olson: Elements of Acoustical Engineering; D. Van Nostrand Co., 1947 (figs. 3.2, 4.4) Jerry Whitaker: DTV - The Revolution in Electronic Imaging; McGraw-Hill, 1998 John Watkinson: Compression in Video & Audio; Focal Press, 1995 Ken C. Pohlmann: Principles of Digital Audio; Sams/MacMillan,1990 Richard M. Warren: Auditory Perception - A New Analysis And Synthesis ; Cambridge,1999 (fig. 2.7, 4.3) Thomas D. Rossing: The Science of Sound ; Addison-Wesley, 1990 (figs. 2.9, 3.1) NAB Engineering Handbook; National Association of Broadcasters, 1999 E. Bruce Goldstein: Sensation & Perception; Brooks/Cole, 1999 (figs. 2.2, 2.3, 2.4, 2.6) ISO/IEC FCD Subpart 2: Information Technology - Very Low Bitrate Audio-Visual Coding; ISO Princípios de Televisão Digital EPUSP
Percepção Auditiva. PTC2547 Princípios de Televisão Digital. Guido Stolfi 10 / EPUSP - Guido Stolfi 1 / 67
Percepção Auditiva PTC2547 Princípios de Televisão Digital Guido Stolfi 10 / 2015 EPUSP - Guido Stolfi 1 / 67 Som e Percepção Auditiva Fisiologia do Ouvido Humano Acústica Física Mascaramento Voz Humana
PERCEPÇÃO AUDITIVA E COMPRESSÃO DE ÁUDIO
PERCEPÇÃO AUDITIVA E COMPRESSÃO DE ÁUDIO PRINCÍPIOS DE TELEVISÃO DIGITAL Guido Stolfi 2008 4 1. Transmissão de Áudio na TV A qualidade de imagem que é proporcionada pela televisão digital demanda um padrão
PTC3452 Exercícios sobre Codificação perceptual de Áudio e Vídeo 11/2017 G. S.
PTC3452 Exercícios sobre Codificação perceptual de Áudio e Vídeo /207 G. S. ) O padrão ao lado representa um bloco de 8x8 elementos de imagem. Os elementos pretos possuem intensidade -27 e os elementos
O áudio. O áudio. O áudio Wilson de Pádua Paula Filho 1. Propriedades físicas do som Representação digital do som Processamento digital de som
O áudio O áudio Representação digital do som Processamento digital de som As vibrações sonoras: propagam-se como ondas de pressão atmosférica; convertidas em sinais elétricos por transdutores; transdutores
Modems Baud rate e Bit rate
Na aula passada......conceituação básica de fibras ópticas SSC-0144 Redes de Alto Desempenho 2010 Vantagens & desvantagens tipos atenuação medidas de desempenho usos de fibras processo de fusão Provinha
Compressão de Imagens: Padrão JPEG
Compressão de Imagens: Padrão JPEG PTC2547 Princípios de Televisão Digital Guido Stolfi 09/2017 EPUSP - Guido Stolfi 1 / 75 Temas Abordados Justificativas para Compressão de Imagens Codificador JPEG Transformada
Compressão de Áudio MPEG AAC
Compressão de Áudio MPEG AAC PTC2547 Princípios de Televisão Digital Guido Stolfi EPUSP - 2016 EPUSP - Guido Stolfi 1 / 48 Tópicos Abordados MPEG-2 AAC Advanced Audio Coding Blocos Funcionais MPEG-4 AAC
Universidade de São Paulo Instituto de Física de São Carlos - IFSC. FFI0210 Acústica Física. Sistema auditivo. Prof. Dr.
Universidade de São Paulo Instituto de Física de São Carlos - IFSC FFI0210 Acústica Física Sistema auditivo Prof. Dr. José Pedro Donoso Agradescimentos Os docentes da disciplina gostariam de expressar
Conceitos Básicos de Áudio Digital
Aula 07 Conceitos Básicos de Áudio Digital Diogo Pinheiro Fernandes Pedrosa Universidade Federal do Rio Grande do Norte Departamento de Ciências Exatas e Naturais Ciência da Computação Som Conceitos Iniciais
Sistema Auditivo Humano
Sistema Auditivo Humano Tecnologias de Reabilitação Aplicações de Processamento de Sinal Constituição do Ouvido Humano JPT 2 1 Constituição do Ouvido Humano JPT 3 Constituição do Ouvido Humano O ouvido
LCS E P U S P. Codificação Perceptual de Vídeo e Áudio. Guido Stolfi 2017 PTC3452. EPUSP - Guido Stolfi 1 / 125
Codificação Perceptual de Vídeo e Áudio Guido Stolfi 2017 PTC3452 EPUSP - Guido Stolfi 1 / 125 Tópicos Abordados Comunicações Digitais Codificação Adaptada à Fonte Necessidade de Compressão de Dados Codificação
Teoria das Comunicações
1 - Introdução Enlace de um Sistema de Comunicação fonte mensagem transdutor Transmissor Modulador canal ruído receptor transdutor destino mensagem (estimada) sinal de entrada sinal com distorção sinal
Parte 02 Multiplexação Analógica e Digital no STFC. Prof. Rafael Saraiva Campos 2013/1
Parte 02 Multiplexação Analógica e Digital no STFC Prof. Rafael Saraiva Campos 2013/1 Multiplexação STFC (1/2) 1. Multiplexação Definição 2. Multiplexação no STFC Linhas Tronco Linhas de Assinante (em
Universidade de São Paulo Faculdade de Arquitetura e Urbanismo Departamento de Tecnologia da Arquitetura
Universidade de São Paulo Faculdade de Arquitetura e Urbanismo Departamento de Tecnologia da Arquitetura AUT 0278 - Desempenho Acústico, Arquitetura e Urbanismo Som Ranny L. X. N. Michalski e-mail: [email protected]
Princípios de Telecomunicações AULA 1. Elementos de um sistema de comunicações. Prof. Eng. Alexandre Dezem Bertozzi, Esp.
Princípios de Telecomunicações AULA 1 Elementos de um sistema de comunicações Prof. Eng. Alexandre Dezem Bertozzi, Esp. COMUNICAÇÃO TRANSMISSÃO DE INFORMAÇÃO DE UM PONTO A OUTRO, ATRAVÉS DE UMA SUCESSÃO
Analisador de Espectros
Analisador de Espectros O analisador de espectros é um instrumento utilizado para a análise de sinais alternados no domínio da freqüência. Possui certa semelhança com um osciloscópio, uma vez que o resultado
ANATOMIA FUNCIONAL DA ORELHA. (a nova nomenclatura substitui o termo ouvido por orelha)
ANATOMIA DA ORELHA ANATOMIA FUNCIONAL DA ORELHA (a nova nomenclatura substitui o termo ouvido por orelha) O aparelho auditivo humano e dos demais mamíferos é formado pela orelha externa, a orelha média
Métodos Matemáticos e Computacionais em Música
Métodos Matemáticos e Computacionais em Música Luiz Velho, Paulo Cesar Carvalho, Sergio Krakowski, Marcelo Cicconet IMPA Processamento de Sinais Sonoros Luiz Velho Som - Sinal 1 D Música e Som Musica
29/05/14. Anatomo-fisiologia da audição. Revisão. Orelha externa. Orelha externa. Pavilhão. Pavilhão
Anatomo-fisiologia da audição Pavilhão Pavilhão Concentração da energia sonora na entrada do conduto Localização de fontes sonoras no eixo sagital- mediano Ressonância Ressonância da orelha externa Ressonância
Compressão de áudio. Marcio Dahia e Geber Ramalho
Compressão de áudio Marcio Dahia e Geber Ramalho O que é compressão de dados? Processo de codificar uma mensagem a fim de reduzir o número de bits necessários para representá-la 2 tipos de compressão Sem
SEL 0412 Tecnologia Digital Teoria
SEL 0412 Tecnologia Digital Teoria Aquisição de Dados Profa. Tania Regina Tronco Conceito É a coleta de informações para fins de análise dos dados e consequente controle e monitoramento de um processo;
Parâmetros importantes de um Analisador de Espectros: Faixa de frequência. Exatidão (frequência e amplitude) Sensibilidade. Resolução.
Parâmetros importantes de um Analisador de Espectros: Faixa de frequência Exatidão (frequência e amplitude) Sensibilidade Resolução Distorção Faixa dinâmica Faixa de frequência: Determina as frequências
Psicoacústica. S = k. I / I. S = k. log I. Onde S é a sensação, I a intensidade do estímulo e k uma constante.
41 Capítulo 5 Psicoacústica A Psicoacústica estuda as sensações auditivas para estímulos sonoros. Trata dos limiares auditivos, limiares de dor, percepção da intensidade de da freqüência do som, mascaramento,
Ondas Sonoras. Profo Josevi Carvalho
Ondas Sonoras Profo Josevi Carvalho INTRODUÇÃO É o ramo da Física que interpreta o comportamento das ondas sonoras audíveis frente aos diversos fenômenos ondulatórios. ONDA SONORA: Onda mecânica, longitudinal
Comunicações Digitais
1 - Introdução Enlace de um Sistema de Comunicação fonte mensagem transdutor Transmissor Modulador canal ruído receptor transdutor destino mensagem (estimada) sinal de entrada sinal com distorção sinal
Universidade de Pernambuco Escola Politécnica de Pernambuco
Universidade de Pernambuco Escola Politécnica de Pernambuco TV Analógica e Digital Codificação de Fonte Prof. Márcio Lima E-mail:[email protected] 12.06.2014 Introdução A principal função de um sistema
MODULAÇÃO POR CÓDIGO DE PULSO PCM
Instituto Federal de Santa Catarina Curso Técnico Integrado em Telecomunicações PRT- Princípios de Telecomunicações MODULAÇÃO POR CÓDIGO DE PULSO PCM Prof. Deise Monquelate Arndt Fontes: Princípios de
06/01/2011. Audição no útero materno. Os primeiros sons que você já escutou. Pedro de Lemos Menezes. Anatomo-fisiologia da audição.
Audição no útero materno Os primeiros sons que você já escutou Pedro de Lemos Menezes Anatomo-fisiologia da audição Orelha externa Pavilhão Orelha externa Orelha externa Pavilhão Ressonância Concentração
Receptores. Estímulo SNC. Células ciliadas da cóclea CODIFICAÇÃO TRANSDUÇÃO NVIII
SISTEMA AUDITIVO Estímulo Receptores NVIII SNC Som Células ciliadas da cóclea CODIFICAÇÃO TRANSDUÇÃO Fisiologia Básica, R. Curi, J. Procópio Som Ondas Sonoras Ondas Sonoras Espectro Audível 20-20.000 Hz
Apresentação... 1 Introdução... 1
Apresentação O objetivo principal deste texto é servir como material básico para uma disciplina introdutória sobre sistemas de comunicações em um curso de Engenharia Elétrica. Ele tem abrangência limitada,
Aula 22. Conversão Sigma-Delta (continuação)
Aula 22 Conversão Sigma-Delta (continuação) A estrutura mostrada na figura A.22.1 é chamado modulador Sigma-Delta (Σ- ). Esta estrutura, além de ser mais simples, pode ser considerada como uma versão suavizada
Ondas sonoras. Qualidades fisiológicas de uma onda sonora
Ondas sonoras As ondas mecânicas que propiciam o fenômeno da audição aos seres vivos são chamadas de ondas sonoras. Como todas as ondas mecânicas, as ondas sonoras podem se propagar nos mais diversos meios,
Parte 1: Conceitos básicos sobre o som
Page 1 of 5 Parte 1: Conceitos básicos sobre o som por Miguel Ratton A contínua evolução dos sistemas de sonorização vem permitindo produzir cada vez melhor todos os níveis sonoros. Com a ampliação da
CURCEP 2015 ACÚSTICA
CURCEP 2015 ACÚSTICA FÍSICA B PROF.: BORBA INTRODUÇÃO É o segmento da Física que interpreta o comportamento das ondas sonoras audíveis frente aos diversos fenômenos ondulatórios. ONDA SONORA: Onda mecânica,
Síntese de Áudio. CIC Prof. Márcio Brandão
Síntese de Áudio CIC 111513 Prof. Márcio Brandão ([email protected]) Sistemas de áudio digital n Análise Sistemas de áudio digital n Síntese Sistemas de áudio digital n Processamento Histórico Linguagens
Medidas da Onda Sonora Prof. Theo Z. Pavan
Medidas da Onda Sonora Prof. Theo Z. Pavan Física Acústica Aula 8 Energia transportada pelas ondas Ondas transportam energia. Intensidade I de uma onda: Potência transportada por unidade de área perpendicular
Processamento digital de imagens
Processamento digital de imagens Agostinho Brito Departamento de Engenharia da Computação e Automação Universidade Federal do Rio Grande do Norte 23 de novembro de 2016 Compressão de imagens engloba técnicas
Osciloscópio Digital. Diagrama em blocos:
Osciloscópio Digital Neste tipo de osciloscópio, o sinal analógico de entrada é inicialmente convertido para o domínio digital através de um conversor A/D rápido, sendo em seguida armazenado em uma memória
Modulação SSB e Transmissão Digital
Modulação SSB e Transmissão Digital 1 Modulação em SSB Vimos que na modulação AM, a portadora é mantida e o sinal modulante produz dois sinais laterais com a informação que estamos transmitindo. Fig. 1
Radiodifusão de TV. PTC2547 Princípios de Televisão Digital. Guido Stolfi EPUSP 10/2016. Ref.: NAB Engineering Handbook Guido Stolfi - PTC / 60
Radiodifusão de TV PTC2547 Princípios de Televisão Digital Guido Stolfi EPUSP 10/2016 Ref.: NAB Engineering Handbook Guido Stolfi - PTC2547-1 / 60 Tópicos Abordados Características Relevantes dos Receptores
Sistemas de Radiodifusão de Áudio Digital
Sistemas de Radiodifusão de Áudio Digital PTC2547 EPUSP 2016 Guido Stolfi PTC2547 - Guido Stolfi 1 / 55 Sistemas de Radiodifusão de Áudio Digital Eureka 147 Digital Audio Broadcasting DRM Digital Radio
Teoria para Laboratório 1º Bimestre
Teoria para Laboratório 1º Bimestre Prof.ª Irene 1 MODULAÇÃO As modulações utilizadas para a transmissão de informações são múltiplas. Em radiofreqüência, as mais coerentes são modulação em amplitude,
Medidas da Onda Sonora Prof. Theo Z. Pavan
Medidas da Onda Sonora Prof. Theo Z. Pavan Física Acústica Aula 8 Energia transportada pelas ondas Ondas transportam energia. Intensidade I de uma onda: Potência transportada por unidade de área perpendicular
Compressão MP3. Algoritmos e Estruturas de Dados
Algoritmos e Estruturas de Dados Compressão MP3 Autores: Anderson Braga de Avila, Felipe Leivas Teixeira Patrícia Teixeira Davet e Thiago Ferreira Pontes Professor: Marilton Sanchotene de Aguiar Instituição:
1 T. Ondas acústicas ONDAS. Formalismo válido para diversos fenómenos: o som e a luz, por exemplo, relacionados com dois importantes sentidos.
Ondas acústicas ONDAS Formalismo válido para diversos fenómenos: o som e a luz, por exemplo, relacionados com dois importantes sentidos. Descrição válida para fenómenos periódicos ALGUNS CONCEITOS RELACIONADOS
Profa Silvia Mitiko Nishida Depto de Fisiologia FISIOLOGIA DA AUDIÇÃO
Profa Silvia Mitiko Nishida Depto de Fisiologia FISIOLOGIA DA AUDIÇÃO FISIOLOGIA DA AUDIÇAO Porém não me foi possível dizer às pessoas: Falem mais alto, gritem, porque sou surdo...ai de mim! Como poderia
O Ouvido Humano e a Audição
36 Capítulo 4 O Ouvido Humano e a Audição Neste capítulo faremos um estudo sobre o ouvido humano, a fisiologia da audição e a sensibilidade do nosso sistema auditivo. 1. Conceitos básicos sobre a anatomia
Transmissor Típico MEDIDAS EM TRANSMISSORES DE RÁDIOFREQUÊNCIA. Prof. Francisco Alegria. Sistemas de Medida em Radiofrequência.
Sistemas de Medida em Radiofrequência MEDIDAS EM TRANSMISSORES DE RÁDIOFREQUÊNCIA Prof. Francisco Alegria Dezembro de 2003 Transmissor Típico Agilent 26 de julho de 2005 Medidas em Transmissores de RF
Duração do Teste: 2h.
Telecomunicações e Redes de Computadores Licenciatura em Engenharia e Gestão Industrial Prof. João Pires 1º Teste, 2007/2008 30 de Abril de 2007 Nome: Número: Duração do Teste: 2h. A prova é composta por
Neurofisiologia da Audição
Universidade de São Paulo Faculdade de Medicina de Ribeirão Preto Fisiologia Humana - RFM 0006 Neurofisiologia da Audição Willian Lazarini Lopes, MSc. Doutorando em Neurologia/Neurociências Laboratório
PRINCÍPIOS DE COMUNICAÇÃO
PRINCÍPIOS DE COMUNICAÇÃO MODULAÇÃO DE PULSO Evelio M. G. Fernández - 2011 Sistemas de Comunicações Digitais Sistema digital no sentido de utilizar uma seqüência de símbolos pertencentes a um conjunto
Compressão de Imagens. Lilian Nogueira de Faria (Bolsista)...DPI/INPE Leila Maria Garcia Fonseca (Coordenadora)...DPI/INPE
Compressão de Imagens Lilian Nogueira de Faria (Bolsista)...DPI/INPE Leila Maria Garcia Fonseca (Coordenadora)...DPI/INPE Imagens digitais necessitam de grande quantidade de espaço para armazenamento e
Fundamentos da Compressão de Vídeo
Sistemas de Telecomunicações 2007-2008 Televisão Digital Fundamentos da Compressão de Vídeo Rui Marcelino Abril 2008 Engenharia Electrica e Electrónica - TIT Sumário 1. Motivação para Compressão de Vídeo
I-8 Digitalização e Reconstrução
I-8 Digitalização e Reconstrução Comunicações (15 de novembro de 2016) ISEL - ADEETC - Comunicações 1 Sumário 1. Enquadramento em SCD Transmissão de sinal analógico sobre SCD 2. Teorema da Amostragem Ritmo
4 Multiplexação TDM/WDM
4 Multiplexação TDM/WDM A multiplexação de sensores utilizando a técnica de TDM possibilita a interrogação de vários sensores por fibra. No entanto, o número de sensores a serem interrogados é limitado
PRESSÃO SONORA MOLÉCULAS DE AR AR P5. P at. = S n Pi i=1 PRESSÃO ATMOSFÉRICA PRESSÃO SONORA P.S. (ESTIMULO) (EFEITO) + ΔP. P.S. = P at GERAÇÃO DO SOM
PRESSÃO SONORA MOLÉCULAS DE AR AR P5 P3 P7 P8 P2 Pn P6 P4 P at P1 P at = S n Pi i=1 PRESSÃO ATMOSFÉRICA PRESSÃO SONORA ΔP AR C R C R P.S. (ESTIMULO) +P t (EFEITO) -P P.S. = P at + ΔP GERAÇÃO DO SOM 1 A
I-7 Digitalização e Reconstrução
I-7 Digitalização e Reconstrução (29 Novembro 2010) 1 Sumário 1. Teorema da Amostragem 1. Ritmo de Nyquist 2. Amostragem Ideal e Natural (análise no tempo e na frequência) 1. Sinais Passa Baixo 2. Sinais
Formatos de Áudio e Vídeo Digital Introdução ao Áudio Digital
Redes Multimídia 2016.2 Formatos de Áudio e Vídeo Digital Curso Superior de Tecnologia em Sistemas para Internet Turma: TEC.SIS.4T Redes Multimídia Conteúdo Programático :: 1 a Unidade 1. Aplicações multimídia
I-11 Digitalização e Reconstrução
I-11 Digitalização e Reconstrução Comunicações ( de novembro de 017) ISEL - ADEETC - Comunicações 1 Sumário 1. Enquadramento em SCD Transmissão de sinal analógico sobre SCD. Teorema da Amostragem Ritmo
Transformada de Discreta de Co senos DCT
Transformada de Discreta de Co senos DCT O primeiro passo, na maioria dos sistemas de compressão de imagens e vídeo, é identificar a presença de redundância espacial (semelhança entre um pixel e os pixels
TE060 Princípios de Comunicação. Sistemas de Comunicação Digital Notes. Por quê Digital? Notes. Notes. Evelio M. G. Fernández. 5 de novembro de 2013
TE060 Princípios de Comunicação Modulação de Pulso 5 de novembro de 2013 Sistemas de Comunicação Digital Sistema digital no sentido de utilizar uma sequência de símbolos pertencentes a um conjunto finito
Camada Física. Camada Física
Camada Física Camada Física lida com a transmissão pura de bits definição do meio físico, níveis de tensão, duração de um bit, taxa de transmissão,comprimento máximo, construção dos conectores Camada Física
Princípios de Telecomunicações. PRT60806 Aula 19: Modulação por Código de Pulso (PCM) Professor: Bruno Fontana da silva 2014
1 Princípios de Telecomunicações PRT60806 Aula 19: Modulação por Código de Pulso (PCM) Professor: Bruno Fontana da silva 2014 Bloco de Comunicação Genérico Emissor sinais analógicos x sinais digitais Sinais
Modulação Analógica. Modulação AM (Amplitude Modulation)
INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DE SANTA CATARINA CAMPUS SÃO JOSÉ Componente Curricular: Cabeamento estruturado Professora: Ramon Mayor Martins Aluno: João Pedro Menegali Salvan Bitencourt;
ANALISADOR DE ESPECTROS
Sistemas de Medida em Radiofrequência ANALISADOR DE ESPECTROS Prof. Francisco Alegria Outubro de 2003 Analisador de Espectros Visualização e análise de um sinal no domínio da frequência. Determinação do
Os sons e a audição. Breve descrição da forma como percebemos os sons e de como funciona a audição
Os sons e a audição 1 Breve descrição da forma como percebemos os sons e de como funciona a audição Esta brochura é o número 1 de uma série da Widex sobre audição e aparelhos auditivos. O que são sons?
Considerações gerais sobre medidas elétricas
Considerações gerais sobre medidas elétricas Medidas de distorções, ruído e relação sinal/ruído (S/N) Distorção e ruído estão presentes em qualquer sistema físico real e normalmente contribuem para a deterioração
04/03/2013. Transmissão de dados. Transmissão por rádio Frequência
Transmissão de dados Transmissão por rádio Frequência 1 Fundamentos de Rádio freqüência Toda a transmissão e recepção de sinais no mundo wireless se baseia em Rádio Freqüência (RF). Esses sinais são então
PROCEDIMENTO DE MEDIÇÃO DE RUIDO EM AMBIENTES INTERNOS.
PROCEDIMENTO DE MEDIÇÃO DE RUIDO EM AMBIENTES INTERNOS. Prof. Msc. Lucas C. Azevedo Pereira ALTAMIRA/PA 04 de novembro de 2016 A ACÚSTICA é a ciência do som, incluindo sua produção, transmissão e efeitos.
29/05/14. Psicoacústica. Conceito. Psicoacústica. Psicoacústica. Lei de Weber-Fechner. Lei de Weber-Fechner
Conceito A refere-se ao estudo da percepção do estímulo acústico que chega a um indivíduo, diferenciando-se do estímulo físico e se aproximando da resposta psicológica dada a este estímulo A faz uma relação
REDES II. e Heterogêneas. Prof. Marcos Argachoy
Convergentes e Heterogêneas Prof. Marcos Argachoy REDES CONVERGENTES Cont./ Convergência Refere-se a redução para uma única conexão de rede, fornecendo todos os serviços, com conseqüente economia de escala.
Uma abordagem educacional para o estudo de OFDM
Uma abordagem educacional para o estudo de OFDM Bruno A. Pereira 1, Henrique T. Kuehne 2, Luciano L. Mendes 3 e José S. G. Panaro 4 Resumo O objetivo deste artigo é apresentar um conjunto de ferramentas
FÍSICA. Oscilação e Ondas. Acústica. Prof. Luciano Fontes
FÍSICA Oscilação e Ondas Acústica Prof. Luciano Fontes ACÚSTICA = É o estudo das ondas sonoras. Ondas sonoras são mecânicas, longitudinais e tridimensionais; Ondas sonoras não se propagam no vácuo; VELOCIDADE
Processamento de Imagem. Prof. MSc. André Yoshimi Kusumoto
Processamento de Imagem Prof. MSc. André Yoshimi Kusumoto [email protected] Definição Compressão de Imagem Formas de diminuir a área de armazenamento dos dados, reduzindo a quantidade de bits
Processamento Digital de Imagens
Ciência da Computação Processamento Digital de Imagens Prof. Sergio Ribeiro Tópicos Introdução Espectro Eletromagnético Aquisição e Digitalização de Imagens Efeitos da Digitalização Digitalização Sensoriamento
Processamento Digital de Imagens
1 Ciência da Computação Processamento Digital de Imagens Prof. Sergio Ribeiro Tópicos Introdução Espectro Eletromagnético Aquisição e de Imagens Sensoriamento Remoto 2 Introdução Espectro Eletromagnético
1.1 Breve Histórico OFDM
1 Introdução 1.1 Breve Histórico OFDM O OFDM, do inglês Orthogonal Frequency Division Multiplexing, que pode ser visto como uma evolução do FDM (Frequency Division Multiplexing), é uma técnica de transmissão
Lista de Exercícios GQ1
1 a QUESTÃO: Determine a Transformada Inversa de Fourier da função G(f) definida pelo espectro de amplitude e fase, mostrado na figura abaixo: 2 a QUESTÃO: Calcule a Transformadaa de Fourier do Sinal abaixo:
