Padrões ITU-T H.261 e H.263 Acadêmicos: Orlando L. Pelosi Jr. Rodrigo Matheus da Costa Vinicius Mariano de Lima Professor: Prof. Adair Santa Catarina
Vídeo Digital Vídeos são compostos por frames que contém áudio e imagens Filmes rodam a 24 fps O padrão de TV NTSC utiliza aproximadamente 30 fps O ideal é produzir animações de no mínimo 15 fps Frame rate Suave a animação Poder de processamento Largura de banda 2
Compressão de Vídeo Principais razões para a compressão de vídeo digital: Vídeo sem compressão -> grande quantidade de dados Imagem colorida 800x320 pix, 24 bits/pix -> 6.3 Mbits SDTV 720x480, 30Hz, 16 bits/pix -> 166 Mbit/s HDTV 1920x1080, 30Hz, 16 bits/pix -> 1Gbit/s Comunicação e capacidade de armazenamento Largura de banda via cabo ou satélites : 38 Mbit/s ADSL : 1 to 8 Mbit/s Capacidade DVD : 5 to 8 GB Redundância que os dados em si apresentam Ex: Frames de um vídeo 3
Compressão de Vídeo Compressão de Vídeo está presente em qualquer lugar atualmente: Transmissão de TV via cabos e satélites, CD-ROM, DVD, Blu-ray, Video-telefonia and teleconferências, Streaming na Internet (VoD, IPTV), Vídeo em celulares. 4
Compressão de Vídeo Duas organizações dominam os padrões de compressão de vídeo: ITU-T Video Coding Experts Group (VCEG) International Telecommunications Union Telecommunications Standardization Sector Imagens em movimento geradas em tempo real ISO/IEC Moving Picture Experts Group (MPEG) International Standardization Organization and International Electrotechnical Commission Imagens em movimentos pré-armazenadas 5
Compressão de Vídeo Padrões ITU-T H.261, H.263 e H.264 6
Padrões ITU-T Codificadores híbridos baseados na DCT (Transformada Discreta do Cosseno) e em codificação preditiva com compensação de movimento. Codificação preditiva com compensação de movimento Explora a alta relação que existe entre frames consecutivos Ex: O fundo de uma aplicação de vídeo-conferência Apenas a diferença entre a previsão e o valor real da amostra é codificada, armazenada e transmitida 7
Padrões ITU-T Codificação DCT Toma um conjunto de pontos no domínio espacial e os transforma em uma representação equivalente no domínio da freqüência Cada pixel é transformado em um coeficiente de energia dependendo de sua cor Nota-se que a maior parte da energia concentra-se em poucas amostras 8
Padrões ITU-T Codificação DCT Excelente grau de descorrelação entre os pixels e fácil implementação Divisão da imagem em blocos de 8 x 8 A transformada é então aplicada a cada bloco São quantizados os coeficientes de maior energia, para serem transmitidos e/ou armazenados 9
H.261 Projetado serviços de videotelefonia e videoconferência sobre linhas ISDN com capacidade de largura de banda múltipla de: p * 64 Kbps, (p = 1, 2,..., 30) Taxa de 64 kbps 1.920 Kbps Suporta dois formatos de imagem: CIF (352 x 288 para a luminância e 176 x144 para as crominâncias) 30 fps QCIF (176 x144 para a luminância e 88 x 72 para as crominâncias) 15 fps 10
H.261 11
H.261 Macroblocos de 16 x 16 pixels Duas formas de codificação: Intra-code frames e Inter-code frames Intra-code Frames (I-frames) São codificados sem nenhuma referência a outros quadros Cada quadro é tratado como uma imagem independente sendo Y, Cb e Cr codificados usando o algoritmo JPEG. Aparecem no stream de saída em intervalos regulares Três quadros P entre dois quadros I 12
H.261 O processamento efetuado pelo codificador de I- frames é quase idêntico ao da codificação JPEG H.261 utiliza o mesmo valor de quantização para todos os coeficientes. Altera o valor de quantização para alcançar a taxa de bits objetivo. 13
H.261 Inter-code Frames (P-frames) São codificados em relação ao conteúdo de um quadro I anterior Utilizam combinação de estimativa e compensação de movimento Assim alcançam maiores taxas de compressão do que quadros I Desempenho: taxa de compressão entre 20:1 e 30:1 I P P P I P P J P E G J P E G P I J P E G Na codificação de P-frames, são enviadas as diferenças de valores entre dois frames, em vez de dados sobre a imagem, como é feito no caso da codificação de I-frames 14
H.261 15
H.261 As diferenças entre frames consecutivos são reduzidas. 16
H.261 Vantagens: Realiza compressão em menor tempo Baixo atraso o Cada quadro é codificado assim que chega Necessita de apenas um pequena porção de bits no buffer para produzir uma saída a uma taxa de bits constante. Desvantagem: Não suporta operações de avanço e retrocesso. Produz efeito de blocos (blocking artifacts) Diferentes limites de quantificação para os vários macroblocos 17
H.263 Baseado no padrão H.261 mas com qualidade superior Projetado para redes com baixas taxas de transmissões (< 64 kbps) Redes sem fio e PSTN (Rede telefônica pública comutada) H.263 inclui um conjunto de opções avançadas de codificação que permitem uma taxa de compressão extremamente alta. O padrão não limita o número de quadros entre quadros I sucessivos. 18
H.263 Em adição ao QIF e QCIF, o padrão H.263 também suporta os seguintes formatos de imagem: SQCIF (128x96 para a luminância e 64x68 para as crominâncias) 4CIF (704x576 para a luminância e 356x288 para as crominâncias. 16CIF (1408x1152 para a luminância e 704x576 para as crominâncias) Além dos quadros I-frames e P-frames, o padrão H.263 possui quadros do tipo B e PB. 19
H.263 Bidirectional Frames (B-Frames) São codificados em relação ao conteúdo de um quadro I ou de um quadro P anterior e de um posterior. Envolve o processamento de 3 quadros: o quadro I ou P anterior, o quadro atual e o quadro I ou P posterior. Todos não codificados. Aumento no tempo (delay) para codificação e decodificação. É o tempo de esperar o próximo quadro I ou P. Provêem alta taxa de compressão: entre 30:1 e 50:1. Não propagam erros. 20
H.263 Predictive Bidirectional Frames (PB-Frames) Não é propriamente um novo tipo de frame Resulta da combinação de frames P e B seguidos que são codificadas como um só Aumenta a taxa de frames sem comprometer a taxa de transferência 21
H.263 Vetores de Movimento sem limitação Não são limitados em tamanho (procura é efetuada na vizinhança do macrobloco) Pode ocorrer do macrobloco encontrado sair fora do frame Resistência ao erro Número de frames entre dois I-Frames não é especificado pode ser elevado Erros podem propagar-se a outras áreas da frame Esquemas de resistência ao erro são fundamentais Decodificador deverá identificar um erro e corrigi-lo 22
H.263 Vantagens Vetores de movimento irrestritos Precisão de meio pixel na compensação de movimento Suporta operações de avanço e retrocesso Codificação preditiva avançada o Utiliza 4 8x8 macroblocos ao invés de 1 16x16 o Melhor detalhes 23
H.264 Também conhecido como MPEG-4 Part 10 e AVC (Advanced Video Coding) Famoso por alcançar altas taxas de compressão Mais avançado padrão de compressão disponível atualmente. Utiliza técnicas de compressão não disponíveis em MPEG2, MPEG4 e H.263 24
H.264 Qualidade de vídeo mais alta numa dada taxa de bits MPEG 2 / H.262 H.264 Redução de pixels escuros e na banda de cores 25
H.264 Aplicação em TVs High Definition 26
H.264 Capacidade de armazenamento menor 27
H.264 Comparação: Frame Original (40Mb) 4CIF(704x57 6) Frame H.264 (1.4Mb) Frame MPeg4 (1.4Mb) 28
H.264 Codificador extremamente escalonável. 29
H.264 Aplicação: Broadcast; DVD; Videoconferência; Vídeo em demanda; Transmissão e mensagens multimídia 30
Referências BRIAND G. et all Video Compression and Streaming, Brussels, November 23rd, 2005. COUTINHO P. Tecnologia Multimedia, Escola de EngenhariaUniversidade do Minho GOULARTE R. Codificação e Compressão de Vídeo, Instituto de Ciências Matemáticas e de Computação ICMC. HANDLEY M. H.261 Video MOHAMADI M.B., JAFARI A. R. H.263 Family Overview RICHARDSON E. G. H.264 / MPEG-4 Part 10 White Paper http://www.compression-links.info/h.261_h.263 31