COMPRESSÃO DE DADOS MULTIMÍDIA



Documentos relacionados
Prof. Daniel Hasse. Multimídia e Hipermídia

ESTRUTURAS DE DADOS II

Codificação de áudio para transmissão de voz em tempo real

Redes de Computadores

Codificação/Compressão de Vídeo. Tópico: Vídeo (Codificação + Compressão)

Compressão com perdas

Multiplexador. Permitem que vários equipamentos compartilhem um único canal de comunicação

DO ANALÓGICO AO DIGITAL: CONCEITOS E

3 Qualidade de serviço na Internet

Introdução à Transmissão Digital. Funções básicas de processamento de sinal num sistema de comunicações digitais.

Codificadores de voz do MPEG-4. Eriko Porto

3 PROCESSOS DE COMPRESSÃO

Informática. Prof. Macêdo Firmino. Macêdo Firmino (IFRN) Informática Setembro de / 16

Oficina de Multimédia B. ESEQ 12º i 2009/2010

3 Classificação Resumo do algoritmo proposto

Padrões ITU-T H.261 e H.263

2- Conceitos Básicos de Telecomunicações

Recomendação H.261 para serviços audiovisuais a taxas de transmissão p*64 kbit/s

Módulo 6 Compressão de Imagem e Som

UNIVERSIDADE CATÓLICA DE PETRÓPOLIS CENTRO DE ENGENHARIA E COMPUTAÇÃO

Camada Física. Camada Física

Multimédia, Qualidade de Serviço (QoS): O que são?

Comunicação de Dados. Aula 4 Conversão de Sinais Analógicos em digitais e tipos de transmissão

Sinal analógico x sinal digital. Sinal analógico. Exemplos de variações nas grandezas básicas. Grandezas básicas em sinais periódicos

PROJETO DE REDES

FUNDAMENTOS DE HARDWARE CD-ROM. Professor Carlos Muniz

Sistemas e Conteúdos Multimédia Áudio. Nuno Miguel Gil Fonseca nuno.fonseca@estgoh.ipc.pt

Conversores D/A e A/D

Strings (Compressão) Estrutura de Dados II Jairo Francisco de Souza

Redes de computadores N Laboratório 01. Luiza Eitelvein

1 Problemas de transmissão

Tecnologia PCI express. Introdução. Tecnologia PCI Express

2. O que é Redundância de código ou informação? Como a compressão Huffman utiliza isso? Você conhece algum formato de imagem que a utiliza?(1.

1 Modulação digital para comunicações móveis

Prof. Aleksander S. Paterno

Compressão de Imagens

ESCOLA SECUNDÁRIA FONTES PEREIRA DE MELO Aplicações Informáticas B. 2006/2007 Grupo II

Sistemas Multimédia. Ano lectivo Aula 11 Conceitos básicos de Audio Digital. MIDI: Musical Instrument Digital Interface

Introdução à Tecnologia Web HTML HyperText Markup Language XHTML extensible HyperText Markup Language Formatos de Imagens

Unidade 2. Largura de Banda e Throughput

ICORLI. INSTALAÇÃO, CONFIGURAÇÃO e OPERAÇÃO EM REDES LOCAIS e INTERNET

Informática Aplicada a Radiologia

Você pode dizer isso de novo! Compressão de Texto

Hit dos Bits. Série Matemática na Escola

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

Mídias Contínuas. Mídias Contínuas

Representação de Informação -- Texto -- Representação de Informação. Representação de Caracteres

Introdução ao Aúdio Digital

Telecomunicações CONCEITOS DE COMUNICAÇÃO

Teoria das Comunicações Prof. André Noll Barreto. Prova /1 (02/07/2015)

ANÁLISE E IMPLEMENTAÇÃO DE ALGORITMOS DE COMPRESSÃO DE DADOS. Maria Carolina de Souza Santos 1 Orientador: Prof.º Ms.

Redes de Computadores sem Fio

Aula 2 Modelo Simplificado de Computador

Fotografia Digital Obtenção da Imagem e Impressão

Fundamentos de Hardware

Amostragem e PCM. Edmar José do Nascimento (Princípios de Comunicações) edmar.nascimento

Instituto Superior Técnico. 19 de Janeiro de Parte I

1 Transmissão digital em banda base

Conteúdo. SCC5909 Fundamentos de Multimídia. Ementa do Curso. 1. Apresentação da Disciplina. Ementa do Curso. Ementa do Curso

O modelo ISO/OSI (Tanenbaum,, 1.4.1)

UFSM-CTISM. Teoria da Comunicação Aula-01

3. Arquitetura Básica do Computador

Backup. Permitir a recuperação de sistemas de arquivo inteiros de uma só vez. Backup é somente uma cópia idêntica de todos os dados do computador?

Comunicação de Dados. Aula 5 Transmissão Analógica

Nenhum dado é perdido durante o processo de compressão. Preserva todas as informações que permitirão a reconstrução exata da imagem. Reversível.

Voz sobre ATM. Prof. José Marcos C. Brito

Memória cache. Prof. Francisco Adelton

Tratamento do sinal Prof. Ricardo J. Pinheiro

Módulo 8 Ethernet Switching

Barramento. Barramentos. Barramento. Barramento

Como em AM e FM, a portadora é um sinal senoidal com frequência relativamente alta;

O que caracteriza um som?

INTRODUÇÃO BARRAMENTO PCI EXPRESS.

PAPEL BRANCO. Padrão de compactação de vídeo H.264. Novas possibilidades em vigilância por vídeo.

Exercício 8 Busca de Músicas

Exercícios Rede de Computadores I (27/05/2006)

4 Arquitetura básica de um analisador de elementos de redes

1 Introduc ao 1.1 Hist orico

Codificação de Vídeo em MPEG-4

MÓDULO 7 Modelo OSI. 7.1 Serviços Versus Protocolos

4 Segmentação Algoritmo proposto

O padrão MPEG para compressão de Vídeo

A música e a voz. A música e a voz. Síntese musical. A música e a voz Wilson de Pádua Paula Filho. Tópicos: Definição:

FCA - Editora de Informática 1

Fundamentos de Sistemas Multimídia Part 1 Aquisição, Codificação e Exibição de Dados

Codec. Finalização de audiovisual. Bit Rate (Taxa de Bits) formatos de exportação. Pro res. ProRes 16/05/13. Sigla de COmpressor/DEcompressor.

B. Piropo. Arquitetura, Organização e Hardware de Computadores - Prof. B. Piropo

TRANSMITINDO CONHECIMENTO ON-LINE

Capítulo I : Noções Gerais

Novo cabo HDMI AVIS da Discabos

Pré-requisitos para Instalação Física e Lógica do SISLOC

Evolução na Comunicação de

Organização e Arquitetura de Computadores I

Espectro da Voz e Conversão A/D

Transcrição:

COMPRESSÃO DE DADOS MULTIMÍDIA

Por que Compressão? Apesar da expansão das capacidade de comunicação e computação, a demanda das novas aplicações multimídia cresce rapidamente Custo de transmissão e armazenagem tem de ser reduzido Baixa velocidade dos dispositivos de armazenagem limita as apresentações de mídias dependentes do tempo (vídeo, principalmente) Definir padrões para facilitar interoperabilidade e implementação em hardware

Por que Compressão? Os objetos multimídia podem requerer uma banda passante de rede não disponível Imagem: 18,9Mbits para imagem 1024 768 a 24bpp ~2,5Mbits para imagem VGA a 8bpp Áudio: 64 Kbps (voz, mono, qualidade de telefone) 1,4 Mbps (música, estéreo, qualidade de CD) Vídeo: ~ 332 Mbps para um vídeo YC R C B 4:2:2 Tarifas pela quantidade de dados transmitidos (ou tempo de conexão) menor quantidade de dados enviados na rede, menor custo

Por que Compressão? Armazenamento CD-ROM padrão: 640-700 MB DVD padrão: 4.7 GB ou 8.5 GB (1 ou 2 camadas) Taxa de transmissão CD-ROM padrão: 156 Kb/s atualmente > 52x = 8 Mb/s DVD padrão: 1.32 MBps (1x) atualmente > 26.4 MBps (20x) Ethernet: > 10 Mbps

Compressão: Princípios Compressão: codificação de um conjunto de dados de forma a gerar um código final menor que o fonte Quando sabe-se que um dado possui 50% de informação redundante, por que pagar por essa informação? Se a voz humana só produz sons entre 2 e 5.5 Khz, por que transmitir som considerando a largura de 20KHz? Se o uso de vogais é maior em português, por que não codificá-las com menos bits ao invés dos 8 em ASCII?

Compressão : Princípios Remoção de redundância (correlação) dos dados Aproveitar-se da forma como o homem interpreta os dados Ex: Amostras adjacentes de áudio, remoção de silêncio, similaridade entre linhas scanneadas ou amostradas na imagem digital, similaridade entre regiões em um vídeo Representação da informação sob diferentes códigos Estatística Codificação

Algoritmos de Compressão Duas classes de algoritmos de compressão digital: Algoritmos sem perda de informação (lossless) Apenas redundância (estatística) dos dados Codificação por entropia: dados são uma seqüência de bits Entropia = a média mínima de bits necessários para transmitir uma determinada seqüência de dados Algoritmos com perda de informação (lossy) Redundância (estatística) + percepção humana Codificação na fonte : distinção dos dados relevantes e não relevantes através de processsamento na origem

Compressão sem perdas (entropy coding)

Primórdios: Código Morse A._ B _ C _.._.. D _.. E. F.._. G. H. I.. J. K _._ L._.. M N _. O P._.. Q._ R._. S T.. U.._ V _ W. X _.._ Y _. Z.. 1. 2.. 3 4._ 5. 6 _. 7 8.. 9 _... 0 Ponto._._._ Vírgula..

Repetição de Série Conhecida por Run-Length Encoding (RLE) Técnica que substitui uma seqüência longa de símbolos por um código curto com o número de ocorrências e o valor do símbolo Método transmissão seqüencial: codifica durante a Ex: Facsimile : uma linha branca/preta representada por um código seguido do no. de elementos brancos/pretos Regiões de cores semelhantes numa imagem Recomendação T4 CCITT (ITU-T) para facsimiles

Exemplo RLE 2/3 dos bits originais

Mapeamento de Diferença Identificar as diferenças entre símbolos consecutivos e armazenar (transmitir) o valor Usar símbolos de referência para calcular os valores reais a partir das diferenças (MPEG faz isso...)

Codificação por Transformada Transforma a informação original de um formato para outro mais apropriado para compressão Não traz perdas, mas os valores abaixo de certo limiar, podem ser desprezados na codificação Exemplo: DCT transforma uma matriz de pixels (imagem) em uma matriz equivalente de componentes de freqüências espaciais Freqüência espacial: taxa de mudança na magnitude dos valores dos pixels na matriz da imagem Componentes de alta freqüência podem ser desprezadas, pois não são captadas pelo sistema visual humano JPEG e MPEG se utilizam desta observação

Codificação Huffman David Huffman (1952) Usado pesadamente na compressão de textos Códigos de tamanho variável associados à freqüência de ocorrência do símbolo nos dados Uma árvore binária de construção bottom-up é usada para a codificação (decodificação), evitando ambigüidades

Codificação de Huffman A informação a ser comprimida é analisada e uma árvore desbalanceada é construída baseada na freqüência relativa de cada caractere (Árvore do Código de Huffman). A Árvore do Código de Huffman é uma árvore digital binária (0 e 1 para cada sub-árvore). Símbolos codificados nas folhas e o caminho da raiz até uma folha indica a seqüência de bits que representa o símbolo.

Codificação Huffman

Codificação Huffman

Codificação Huffman Apenas os símbolos usados são codificados... Tipicamente: 30 a 55 de compressão Variação das tabelas de código para melhor desempenho : Língua, aplicações, etc. Problemas: Exige o envio de uma tabela de código e um tempo de codificação alto!

Codificação por Dicionário Lempel e Ziv (1970) : LZ77 e LZ78 (patente) Símbolos são lidos e comparados com entradas de um dicionário (tabela hash) : se o símbolo existe, a posição da tabela é gerada como saída O resultado da compressão é o próprio dicionário combinado com os dados Os dados podem ser comprimidos on-the-fly sem a necessidade de geração de tabelas e de maneira dinâmica

Métodos de Dicionário: Dois grupos 1o. grupo: 1. Verifica se a seqüência que deve ser comprimida já apareceu anteriormente; 2. Ao invés de repeti-la, define um ponteiro para essa ocorrência na própria seqüência 2o. grupo: 1. Cria um dicionário de frases que ocorrem na seqüência de entrada; 2. Quando a frase é novamente encontrada, simplesmente o índice da frase no dicionário é codificada.

Exemplos

Passo a passo

Passo a passo

Passo a passo

Decodificação

Lempel-Ziv

COMPRESSÃO DE ÁUDIO DIGITAL

0100 0011 0010 0001 0000 1001 1010 1011 1100 PCM Erro de Quantização (ruído) Cada valor de amostra representado por n bits Cada bit de resolução soma 6 db a faixa do sinal Número de bits depende da relação sinal/ruído (SNR) n = SNR 4.77 6.02

Amostragem Não-Linear Com 8 bits por amostra, um sinal de ruído poderia ser identificado Em particular, não estariam sendo bem codificados os valores para baixas amplitudes Uma solução é amostrar mais densamente as baixas amplitudes e menos densamente as amplitudes mais altas menos bits no total! Este é exatamente o comportamento da escala logarítmica

m-law companding (ITU Rec. G.711) Quantização não-linear da amplitude do sinal O número de bits diminui logaritmicamente com o nível do sinal amostrado Amostras de baixa amplitude são amostradas com maior precisão que as de alta amplitude Isso porque os humanos são menos sensíveis a mudanças de intensidade (loudness) do som que em relação a períodos de silêncio

Differential PCM DPCM Explora a redundância temporal das amostras A diferença entre 2 amostras consecutivas de n-bits podem ser representadas com menos de n-bits Transmissão da diferença ao invés da amostra

Problemas do DPCM As diferenças em sinais de alta-freqüência não podem (próximas a Nyquist) não podem ser representadas em poucos bits! O erro introduzido leva a sérias distorções do sinal em freqüências mais altas

Adaptive DPCM ADPCM Usa menos bits para codificar as diferenças entre altas-freqüências e mais bits para diferenças entre amostras de baixas-freqüências Usa os valores das amostras anteriores para estimar as mudanças seguintes no sinal

Compressão de Voz APC (Adaptive Predictive Coding) Sinal de áudio dividido em pequenos segmentos de comprimento fixo, cada um analisado separadamente. Um conjunto de coeficientes otimizado para cada segmento é selecionado ( 8Kbps com qualidade aceitável ) LPC (Linear Predictive Coding) Analisar a onda do sinal de áudio para identificar um conjunto de características de percepção do sinal, as quais são quantizadas e utilizadas para gerar um sinal sonoro comparável ao sinal original (som sintético, mas inteligível e taxas de 1.2 a 2.4 Kbps) CELP (Code Excited LPC) Evolução do LPC, utilizando um conjunto limitado de segmentos (waveform templates). Cada amostra digitalizada que compõe uma template é codificada por diferença. A template que codifica um segmento é escolhida de modo que a diferença tenha um erro de quantização mínimo (recom. ITU-T G.728, G.729, G.729(A) e G.723.1) Geralmente usados em telefonia!

MP3: MPEG Layer 3 Portável, independente de plataforma, padrão de facto para áudio de qualidade na Internet Mantém arquivos de som de 16 bits 44.1 KHz (sem ruídos, perda de faixa dinâmica ou da resposta em freqüência) Modelo de codificação perceptual que simula os dados perdidos na compressão: Até 12:1 de compressão sem perdas significantes

Codificação Perceptual Modelo Psicoacústico - Mascaramento de Frequência A sensibilidade da audição humana muda conforme a amplitude relativa do sinal A fig. mostra como a sensibilidade muda na vizinhança de um som de amplitude alta, caso no qual o som A não será escutado, embora ele o fosse se ocorresse sozinho.

Codificação Perceptual O efeito varia de acordo com a frequência em questão. A largura das curvas de frequência (largura de banda crítica - LBC) define a faixa de frequências afetadas pelo mascaramento resultante de um dado sinal. Frequências abaixo de 500Hz a LBC é de 100Hz. Frequências acima de 500Hz a LBC aumenta de forma quase linear em múltiplos de 100Hz. Um sinal de 1kHz (2x500) teria uma LBC de 200Hz (2x100) enquanto que um sinal de 5kHz (10x500) teria uma LBC de 1kHz (10x100). As frequências afetadas podem ser calculadas e eliminadas do código a ser enviado.

Mascaramento de Frequência

Codificação Perceptual Modelo Psicoacústico - Mascaramento Temporal Após escutar um som alto, o ouvido humano fica surdo a sons mais baixos por um intervalo de tempo mascaramento temporal. Depois que um som alto termina são necessários alguns décimos de segundo para o ouvido humano se recuperar e a amplitude do sinal ouvido reduza. Neste intervalo de tempo o ser humano é incapaz de escutar sons com amplitude abaixo de um certo limite. Tais sons não precisam, portanto, ser transmitidos.

Mascaramento Temporal

MPEG Layer 3 Qualidade banda modo Bitrate (Kbps) compressão Telefone 2.5 khz mono 8 96:1 Melhor que OC 4.5 khz mono 16 48:1 Melhor que AM 7.5 khz mono 32 24:1 Similar a FM 11 khz stereo 56...64 26...24:1 Similar a CD 15 khz stereo 96 16:1 Melhor que CD 15 khz stereo 112..128k 14..12:1