Redes Multimídia 2016.2 Formatos de Áudio e Vídeo Digital Compactação de Vídeo Curso Superior de Tecnologia em Sistemas para Internet Turma: TEC.SIS.4T
Redes Multimídia Conteúdo Programático :: 1 a Unidade 1. Aplicações multimídia sobre redes; 2. Formatos de áudio e vídeo digital 2.1. Introdução ao áudio digital; 2.2. Compactação de áudio; 2.3. Introdução ao vídeo 2.3.1. Sistemas analógicos; 2.3.2. Sistemas digitais; 2.4. Compactação de vídeo 2.4.1. Padrão JPEG; 2.4.2. Padrão MPEG; 3. Fluxo contínuo de áudio e vídeo na Internet.
Contextualização Tratamento de Imagens e Vídeos Vídeos e imagens digitais puros são codificados em PCM Vetores (bi-dimensionais) de pixels Técnicas de compressão são baseadas na alta redundância das imagens e vídeos Certas áreas das figuras são uniformemente coloridas ou altamente correlatas (podendo formar padrões) Redundância espacial ou correlação espacial; Removida tanto quanto possível para uma certa qualidade de apresentação Não existem tantas diferenças entre quadros de um vídeo Redundância temporal ou correlação temporal Alta taxa de compressão
Vídeos e Imagens Técnica de Truncagem Consiste em truncar dados arbitrariamente baixando o número de bits por pixel Eliminação de bits menos significativos de cada pixel Exemplo: imagens coloridas true-color (24bits/pixel) podem ser reduzidas para high-color (16bits/pixel) Técnica é atrativa pois ela é simples e fácil de implementar
Vídeos e Imagens Codificação Preditiva DPCM (PCM diferencial) Técnica mais simples de codificação preditiva; Compacta pixel adjacentes e apenas as diferenças são usadas O valor da diferença tem alta probabilidade de ser menor que o valor do pixel; Na descompressão Informações da diferença são usadas para modificar o pixel anterior ADPCM (DPCM adaptativo) Implementação mais comum é variar o tamanho do passo a partir das diferenças de bits Exemplo: se um passo preto-para-branco for detectado, pode-se aumentar o passo de quantificação antes desse passo chegar
Vídeos e Imagens Preenchimento Condicional Explora redundância temporal em vídeos Animações de imagens implica que pixels na imagem anterior estão em diferentes posições quando comparados à imagem atual; Imagem é segmentada em áreas estacionárias e áreas com movimentos São transmitidos apenas os dados de áreas com movimentos Detector de movimento localiza diferenças interquadros significantes
Vídeos e Imagens Estimativa e Compensação de Movimento Imagens são divididas em blocos de tamanhos fixos Procura uma relação para cada bloco na imagem anterior; Deslocamento entre estes dois blocos é chamado de vetor de movimento; A diferença entre blocos é obtida calculando diferenças pixel a pixel; O vetor de movimento e a diferença de bloco são codificados e transmitidos
Vídeos e Imagens Formatos (de imagens) disponíveis: Várias técnicas e produtos para compressão de imagens estão disponíveis; Padrões promovem a compatibilidade entre diferentes equipamentos/ aplicações (interoperabilidade); Exemplos de formatos de imagens: PCX: usado para aplicativos gráficos mais antigos (256 cores); GIF: usado para distribuição comercial de imagens sem perda (256 cores); BMP: padrão especificado/utilizado por padrão pelo Windows; TGA: usado pelos adaptadores gráficos Targa e por programas de animação e processamento de vídeo
Vídeos e Imagens Principais Formatos (de vídeos) disponíveis:
Vídeos e Imagens Principais Padrões: TIFF: padrão independente de fabricante para imagens PNG: padrão de imagem alternativo ao GIF ISO JPEG: para compressão de imagens ISO JBIG: para compressão sem perda de imagens bi-níveis (1bit/pixel) para transmissão de fac-símile ITU-TS H.261: para aplicações com tráfego multimídia c/taxas de bits múltiplos de 64kbps ITU-TS H.263: para aplicações com tráfego multimídia c/taxas abaixo de 64kbps ISO MPEG: para compressão de vídeo e áudio associados
Padrão JPEG Principal padrão para compressão de imagens
Padrão JPEG Principais Características JPEG = Colaboração entre ISO/IEC e ITU-TS (1992) Uma das melhores tecnologias de compressão de imagens; Implementado em software e hardware; Codificação/decodificação JPEG tempo-real tem sido implementada para vídeo (Motion JPEG ou MJPEG). Compressão parametrizável JPEG cobre grandes faixas de qualidades de imagens e permite especificar o comportamento do codificador a partir de parâmetros; Quatro modos de operação Codificação sequencial (baseline); Codificação progressiva; Codificação sem perda; Codificação hierárquica.
Padrão JPEG Modos de Operação Codificação sequencial (baseline) Suportado por todas as implementações JPEG; Modo com perdas baseado em DCT (Discret Cosine Transform); Componentes de imagens são codificados em uma única varredura da esquerda para direita de cima para baixo; Codificação progressiva Com perdas baseado em DCT expandido; Fornece avanços ao modo baseline; Varreduras sucessivas Imagem é codificadas em varreduras múltiplas para produzir uma imagem de maneira rápida e rústica quando a largura de banda é baixa.
Padrão JPEG Modos de Operação Codificação sem perda Reprodução é exata; Necessárias em aplicações que não toleram perdas; Codificação hierárquica Oferece uma codificação progressiva que aumenta de resolução espacial entre estágios progressivos; Versões podem ser acessadas sem a necessidade de descompactar a imagem na resolução completa; Taxa de compressão é mais baixa que ter uma resolução única.
Padrão JPEG Algoritmo de Compressão JPEG Decomposição da imagem em blocos 8x8 pixels Transformação discreta de cosseno (DCT) dos blocos Blocos 8x8 são transformados no domínio da frequência usando a transformada DCT; Separação das componentes de baixa e de alta frequências presentes numa imagem; Seleção dos componentes de alta frequência de acordo com a qualidade pretendida para imagem comprimida Quanto maior a taxa de compressão escolhida mais componentes de alta frequência são desprezados; Leva ao aparecimento do efeito de bloco, ou seja, perda da definição nos contornos da imagem
Padrão JPEG Algoritmo JPEG: Coeficientes DCT Sinal discreto de 64 pontos (um para cada bloco) = 0 a 63; Função de duas dimensões espaciais (componentes X e Y); Ordenados em uma sequência zig-zag para obter uma sequência unidimensional de dados para ser usado na codificação por entropia; Objetivo da sequência zig-zag: Ordenar os coeficiente em ordem decrescente de frequência espectral: Coeficientes de alta frequências (no canto direito inferior) tem valores mais próximos de zero, levando a uma maior eficiência da codificação por entropia.
Padrão JPEG Algoritmo JPEG: Codificação por Entropia JPEG define dois métodos de codificação por entropia: Codificação de Huffman Única especificada no modo baseline Codificação aritmética Normalmente 10% mais eficiente que a Codificação de Huffman
Padrão JPEG Taxa de Compressão do JPEG Quanto maior for a taxa maior será o número de componente de alta frequência desprezados; Levando ao aparecimento do efeito de bloco (perda de definição nos contornos das imagens). Valores médios: Taxa de compressão 10:1 a 20:1 Alta qualidade de imagem Taxa de compressão 30:1 a 50:1 Média qualidade de imagem Taxa de compressão 60:1 a 100:1 Baixa qualidade de imagem
Padrão JPEG Padrão de Compressão do JPEG JPEG foi desenvolvido (a priori) para imagens fotográficas Apresenta ótimas taxas de compressão para imagens fotográficas naturais com vários tons de cinza; Qualidade diminui consideravelmente quando aplicado a: Imagens gráficas com contornos e áreas bem definidas de cor; Imagens com textos, logotipos Para imagens gráficas e/ou textos JPEG introduz ruídos nas zonas de imagens compostas por cores sólidas, distorcendo o aspecto geral da imagem; Imagem PNG ou GIF compactam mais eficazmente que JPEG e apresentam uma melhor definição dos contornos do texto
Padrão MPEG Principal padrão para compressão de vídeos (e áudios associados)
Padrão MPEG ISO/IEC MPEG Motion Picture Expert Group Grupo de padrões de representação codificada de vídeos, áudios e suas combinações. Vídeo e áudio armazenados e recuperados em Digital Storage Media CDs/DVDs, drives de fita, HDs, drives óticos e canais de telecomunicações (redes de longa distância, locais, etc)
Padrão MPEG MPEG: Características MPEG usa Compressão Interquadros Obtém taxas de compressão de até 200:1 através do armazenamento apenas das diferenças entre quadros sucessivos Define mais que a compressão de vídeo Compressão de áudio associado e sincronização áudio-visual não podem ser independentes da compressão de vídeo Especificações MPEG também incluem um algoritmo para compressão de áudio: Taxas de 5:1 a 10:1
Padrão MPEG Família MPEG MPEG-1 (1993) Vídeo com qualidade VHS 360x280 píxeis com 30 quadros por seg. na taxa de 1.5Mbps Conhecido como padrão MPEG MPEG-2 (1994) Vídeo com qualidade de televisão digital (CCIR 601) 720x240 píxeis com 30 quadros por seg. na taxa entre 2 a 10Mbps MPEG-3 vídeo com qualidade HDTV na taxa de 40Mbps Desenvolvimento interrompido MPEG-4 (1998) Codificação para audiovisual com muito baixa taxa de transmissão variando de 4,8 a 64Kbps MPEG-7 (2001) Interface de descrição de conteúdo multimídia: um padrão de descrição de dados multimídia (informações áudio-visuais) Dentre outros recursos, permite busca e filtragem
Padrão MPEG Componentes (partes) do MPEG MPEG-Vídeo Compressão de sinais de vídeo MPEG-Áudio Compressão de sinal de áudio digital MPEG-Sistemas Sincronização e multiplexação de fluxos de áudio e vídeo compactados Conformidade Especifica procedimentos para determinar as características dos fluxos codificados e para testar a conformidade com os requisitos identificados no áudio, vídeo e sistemas