Redução Espacial de Vídeo Digital para TV Móvel Utilizando Wavelets



Documentos relacionados
Transcodificação de vídeo digital para receptores portáteis

FILTRAGEM ESPACIAL. Filtros Digitais no domínio do espaço

Filtragem. pixel. perfil de linha. Coluna de pixels. Imagem. Linha. Primeiro pixel na linha

Conforme explicado em 2.4.3, o sinal de voz x(n) às vezes é alterado com a adição de ruído r(n), resultando num sinal corrompido y(n).

Universidade Federal do Rio de Janeiro - IM/DCC & NCE

Codificação/Compressão de Vídeo. Tópico: Vídeo (Codificação + Compressão)

)LJXUD8PGRVSDUHV'SDUDFRQYROXomRTXHWHPRPHVPRHIHLWRGR NHUQHOGD)LJXUD

DO ANALÓGICO AO DIGITAL: CONCEITOS E

Filtragem Espacial. (Processamento Digital de Imagens) 1 / 41

Operações Algébricas e Lógicas. Guillermo Cámara-Chávez

CorelDRAW UM PROGRAMA DE DESIGN

Processamento de Imagem. Prof. MSc. André Yoshimi Kusumoto

RUÍDOS EM IMAGENS FILTRAGEM DE RUÍDOS. o Flutuações aleatórias ou imprecisões em dados de entrada, precisão numérica, arredondamentos etc...

Redução de imagem no domínio espacial

Brasília Novembro de Ministério das Comunicações

Avaliação da Qualidade de Vídeos Transcodificados após a Transmissão

O ESPAÇO NULO DE A: RESOLVENDO AX = 0 3.2

a 1 x a n x n = b,

Informática Aplicada a Radiologia

Recomendação H.261 para serviços audiovisuais a taxas de transmissão p*64 kbit/s

29/08/2011. Radiologia Digital. Princípios Físicos da Imagem Digital 1. Mapeamento não-linear. Unidade de Aprendizagem Radiológica

Comparação entre a Máscara de Nitidez Cúbica e o Laplaciano para Realce de Imagens Digitais

Características do vídeo. Aquisição, síntese, edição e reprodução de vídeo. Características do vídeo analógico. Características do vídeo analógico

FUNDAMENTOS DE TV DIGITAL. Objetivos do Sistema Digital. Digital. Comparação. (NTSC x ATSC) Transmissão simultânea de várias programações

FILTRAGEM NO DOMÍNIO DAS FREQUÊNCIAS (TRANSFORMADA DE FOURIER) Daniel C. Zanotta 04/06/2015

Trabalho 2 Fundamentos de computação Gráfica

Capítulo 5 Filtragem de Imagens

1 Transmissão digital em banda base

3 Qualidade de serviço na Internet

Fundamentos de Hardware

UNIVERSIDADE DO EXTREMO SUL CATARINENSE. Correção geométrica de imagens

ESTRUTURAS DE DADOS II

6. Geometria, Primitivas e Transformações 3D

Universidade Federal de Alagoas Instituto de Matemática. Imagem. Prof. Thales Vieira

ipea A ESCOLARIDADE DOS PAIS E OS RETORNOS À EDUCAÇÃO NO MERCADO DE TRABALHO 1 INTRODUÇÃO 2 DADOS

29/08/2011. Radiologia Digital. Princípios Físicos da Imagem Digital. Unidade de Aprendizagem Radiológica. Professor Paulo Christakis

Capítulo 3. Avaliação de Desempenho. 3.1 Definição de Desempenho

Filtros de sinais. Conhecendo os filtros de sinais.

Filtragem no Domínio da Frequência

5 A Utilização da Técnica do Espaço Nulo e dos Atributos Baseados na Escolha de Coeficientes de Autocorrelações

Transmissão e comunicação de dados. Renato Machado

GARANTIA DA QUALIDADE DE SOFTWARE

3 Classificação Resumo do algoritmo proposto

FEN Processamento Digital de Imagens. Projeto 2 Utilização de máscaras laplacianas

PROJETO DE REDES

Estudos Iniciais do Sistema didático para análise de sinais no domínio da frequência DSA-PC: tipos de janelas temporais.

EXERCÍCIOS RESOLVIDOS

Cálculo de volume de objetos utilizando câmeras RGB-D

Padrões ITU-T H.261 e H.263

Conversores D/A e A/D

1 Modulação digital para comunicações móveis

UNIVERSIDADE FEDERAL DE UBERLÂNDIA FACULDADE DE CIÊNCIAS INTEGRADAS DO PONTAL

5 SIMULAÇÃO DE UM SISTEMA WDM DE DOIS CANAIS COM O SOFTWARE VPI

1 Moldando Pulso para reduzir a largura de banda

[a11 a12 a1n 4. SISTEMAS LINEARES 4.1. CONCEITO. Um sistema de equações lineares é um conjunto de equações do tipo

1. NÍVEL CONVENCIONAL DE MÁQUINA

2- Conceitos Básicos de Telecomunicações

PROCESSAMENTO DIGITAL DE IMAGENS

Aplicações de Escritório Electrónico

:: Telefonia pela Internet

Universidade Federal de Goiás Instituto de Informática Processamento Digital de Imagens

EE210 Sistemas de Comunicação II 2ª Avaliação (PV2) 22/04/ h30min Profs. Dayan A. Guimarães e Rausley A. A. de Souza. Aluno(a): Matrícula.

Processamento digital de imagens. introdução

AMBIENTE PARA AUXILIAR O DESENVOLVIMENTO DE PROGRAMAS MONOLÍTICOS

Atividade: matrizes e imagens digitais

Disciplina: Processamento Digital de Sinais Aula 04 - Análise Tempo-Frequência

2.1.2 Definição Matemática de Imagem

Tópico 11. Aula Teórica/Prática: O Método dos Mínimos Quadrados e Linearização de Funções

A. MANUAL DO MÓDULO ATFAR DO ECGLAB

4 Segmentação Algoritmo proposto

Compressão de Imagens

Tabela de Símbolos. Análise Semântica A Tabela de Símbolos. Principais Operações. Estrutura da Tabela de Símbolos. Declarações 11/6/2008

2. O que é Redundância de código ou informação? Como a compressão Huffman utiliza isso? Você conhece algum formato de imagem que a utiliza?(1.

Classificação da imagem (ou reconhecimento de padrões): objectivos Métodos de reconhecimento de padrões

Codificação de Canal

ANÁLISE E IMPLEMENTAÇÃO DE ALGORITMOS DE COMPRESSÃO DE DADOS. Maria Carolina de Souza Santos 1 Orientador: Prof.º Ms.

Faculdade de Engenharia Optimização. Prof. Doutor Engº Jorge Nhambiu

UNIVERSIDADE CATÓLICA DE PETRÓPOLIS CENTRO DE ENGENHARIA E COMPUTAÇÃO

(b) Domínio espacial Reescalamento dos níveis de cinza Integração Diferenciação

COMPUTAÇÃO GRÁFICA REPRESENTAÇÃO DE IMAGENS

Organização e Arquitetura de Computadores I

Introdução à Transmissão Digital. Funções básicas de processamento de sinal num sistema de comunicações digitais.

Prof. Daniel Hasse. Multimídia e Hipermídia

Aula 8 Circuitos Integrados

Os caracteres de escrita

Um Método Simples e Eficiente para Detecção de Atividade de Voz Usando a Transformada Wavelet

PROF. DR. JACQUES FACON

Cálculo Numérico Aula 1: Computação numérica. Tipos de Erros. Aritmética de ponto flutuante

APLICATIVOS GRÁFICOS (AULA 3)

Avaliação de qualidade de vídeo sobre uma rede IP usando métricas objetivas

Somatórias e produtórias

Abordagem de Processo: conceitos e diretrizes para sua implementação

MÓDULO 7 Modelo OSI. 7.1 Serviços Versus Protocolos

Oficina de Multimédia B. ESEQ 12º i 2009/2010

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

Projetos. Universidade Federal do Espírito Santo - UFES. Mestrado em Informática 2004/1. O Projeto. 1. Introdução. 2.

Sistema de Monitoração Remota de Baixo Custo Baseado em Vídeo Digital

RECEPTOR AM DSB. Transmissor. Circuito Receptor AM DSB - Profº Vitorino 1

Software de Imagem via Celular (SIC) baseado no sistema operacional Windows Mobile

Transcrição:

Redução Espacial de Vídeo Digital para TV Móvel Utilizando Wavelets Josiel do Nascimento Cruz, Leonardo Araújo Cartaxo da Costa, Mauricio Wanderley de Freitas Ferreira, Vinícius Fernandes de Sousa, Carlos Danilo Miranda Regis Instituto Federal De Educação Ciências e Tecnologias da Paraíba - IFPB Campina Grande, Brasil Resumo No atual cenário das telecomunicações, a tecnologia dos telefones celulares torna possível não apenas a visualização de vídeos armazenados, mas também da Televisão Móvel, que torna possível assistir a programas de televisão no telefone celular. Uma solução para transmissão do conteúdo da televisão para receptores móveis é a utilização de transcodificadores de vídeo. Este trabalho apresenta os resultados de um sistema de transcodificação espacial de vídeo CIF para obter vídeos QCIF utilizando wavelet. Palavras-Chave Transcodificação de Vídeo, Wavelet, Compressão de Vídeo. Abstract In today s telecommunications, mobile phone technology makes it possible not only to display videos stored, but also of Mobile TV, which makes it possible to watch television programs on mobile phone. A solution for transmission of television content to mobile receivers is the use of video transcoders. This paper shows the results of a system of space transcoding video CIF for QCIF video using wavelet. I. INTRODUÇÃO O ISDB-Tb (Integrated Services Digital Broadcasting Terrestrial Built-in), o padrão brasileiro de televisão digital, prevê a recepção de sinais de vídeo em vários formatos tanto por receptores fixos como móveis. Esses sinais de vídeo apresentam vários formatos de resoluções (espacial e temporal), codificação e taxa de bits. O conteúdo dos vídeos devem ser reproduzidos nos mais diferentes tipos de receptores, que vão desde as convencionais televisões a PDAs, Ipods e celulares [1]. O tipo da transmissão afeta diretamente a taxa com que os bits são transmitidos, podendo reduzir a satisfação dos usuários. Isso pode ocorrer dependendo do tipo de transmissão e do número de bits do vídeo, já que pode apresentar uma reprodução dos vídeos com pausas. Para minimizar esse efeito pode se obter vídeos de diferentes configurações para atender as imposições de todos os tipos de transmissão e recepção. Entretanto, isso necessitaria de um grande espaço de armazenamento, bem como grande custos de produção, tornando assim, esse tipo de abordagem inviável. Uma outra solução seria a utilização do transcodificadores de vídeo, que são sistemas capazes de converter uma sequência de vídeo em outra usando parâmetros diferentes (codificação, resolução temporal, resolução espacial e/ou taxa de bits) []. Nessa alternativa, apenas é armazenado o conteúdo de resolução máxima, implicando assim em uma economia de espaço e tempo de produção. Quando necessário, o transcodificador pode reduzir a resolução ou taxa de bits, ou ainda modificar o padrão de compressão do vídeo. Uma outra vantagem do uso do transcodificador é que os dispositivos móveis apresentam diversas limitações como: duração da bateria, menor capacidade de processamento, menor capacidade de memória e tamanho reduzido do display, quando comparado com os aparelhos de TV tradicionais []. O objetivo deste trabalho é obter um sistema de transcodificação de sinais de vídeo, de maneira a ter sequências de vídeo adequadas para receptores móveis. O transcodificador muda a resolução espacial de um sinal de vídeo digital no formato CIF (5 88, pixels) para o formato QCIF (176 144, pixels). O sistema de transcodificação proposto converte o vídeo para resolução espacial menor, utilizando a transformada Wavelet. II. TIPOS DE TRANSCODIFICAÇÃO A transcodificação pode ser classificada como homogênea, heterogênea e funções adicionais. A transcodificação homogênea realiza a conversão da taxa de bits, da resolução espacial, da resolução temporal e mudanças da codificação VBR (Variable Bit-Rate) para CBR (Constant Bit-Rate) ou seja modifica um conjunto de parâmetros do vídeo sem modificar o seu padrão de compressão. Entretanto a transcodificação heterogênea realiza a conversão de padrões de compressão ou a conversão entre os formatos entrelaçado e progressivo [4]. Além desses dois tipos, existe um outro tipo de transcodificação que consiste em incluir funções adicionais à sequência de vídeo codificada, como proporcionar resistência a erros (error resilience) e adicionar logomarcas ou marcas d água invisíveis.um diagrama com os vários tipos de transcodificação é apresentado na Figura 1. Fig. 1. Diagrama dos possíveis tipos de transcodificação.

A. Transcodificação Espacial O objetivo na transcodificação da resolução espacial é reduzir ou aumentar a resolução espacial do vídeo utilizando técnicas como subamostragem/superamostragem, filtragem, etc. Uma possível aplicação da redução de resolução espacial é a conversão de um vídeo em HDTV com resolução 190 104i, Pixels, (i sendo o padrão entrelaçado) para um em SDTV que tem resolução 70 84, pixels, como apresentado em [5]. Nesse caso pode-se usar as técnicas de filtragem, subamostragem e superamostragem. Como o fator de conversão não é inteiro (190 : 70 = 104 : 84 = 8 : ), o vídeo passa por um subamostrador e um superamostrador em cascata.um filtro é utilizado entre o subamostrador e o superamostrador para garantir que os sinais resultantes não tenham distorção (aliasing). A seguir é feita uma breve descrição das técnicas de redução de resolução espacial no domínio dos pixels. Superamostragem e Subamostragem: essas são técnicas para reduzir a resolução espacial, tanto na direção horizontal quanto na vertical. O superamostrador é utilizado para aumentar a taxa de amostragem de uma sequência por um fator inteiro L > 1, enquanto que o subamostrador é utilizado para diminuir a taxa de amostragem por um fator inteiro S > 1 [6]. Filtragem: podem ser usados os filtros passa-baixa da média, mediana, moda, sigma e etc []: Média dos pixels: o cálculo da média é uma técnica para redução da resolução espacial. Nessa técnica substitui-se os valores do bloco M M do quadro do vídeo por um único pixel cujo valor corresponde à média aritmética dos pixels dentro do bloco M M. Calcular a média de pixels é um dos métodos mais simples, entretanto essa técnica pode adicionar um alto nível de borrado ao quadro. Mediana: a técnica da mediana consiste na substituição de um conjunto de pixels pela mediana de um bloco M M. Para o cálculo da mediana é feita uma reorganização dos valores dos pixels do bloco M M de forma crescente. III. TRANSFORMADA WAVELETS As Wavelets são funções matemáticas que contém determinadas propriedades, tornando-as adequadas para decomposição de uma determinada função em outra[7]. Uma propriedade matemática que faz com que a Transformada Wavelet seja uma ferramenta eficiente no processamento de imagens é a análise de multirresolução que, ao ser aplicado em um sinal, evidência seus detalhes. A análise de multirresolução, também conhecida como Algoritmo Piramidal de Mallat [7], é um método proposto para implementar a Transformada Wavelet discreta, este método refere-se ao procedimento de se obter aproximações e detalhes de uma imagem. Uma aproximação consiste em uma representação de baixa frequência da imagem original, enquanto que um detalhe é a diferença entre duas aproximações sucessivas da imagem original [7]. O método proposto por Mallat aborda técnicas de filtragem, em que os filtros mais utilizados no processamento das imagens podem ser considerados como um divisor da imagens em duas partes iguais: filtro passa-baixa (H(t)) e o filtro passaalta (G(t)). O filtro passa-baixa H(t) em uma imagem tem o efeito de suavizar a imagem e reduzir o número de níveis de cinza. A suavização tende a minimizar os ruídos e apresenta o efeito de borramento da imagem. Já o filtro passa-alta G(t) tende a realçar os detalhes, isto é, as transições entre regiões diferentes se tornam mais nítidas [7]. No final do processo são geradas as saídas C 1 [t], que representa os componentes de baixa frequência, e D 1 [t], que representa os componentes de alta frequência. Este processo pode ser repetido quantas vezes forem necessárias. As funções wavelets, denotada por ψ(t), são definidas como um conjunto de funções originadas através das operações matemáticas de translação e escalonamento da função escala, com propriedades particulares que as tornam adequadas para servirem de base para a decomposição de outras funções [8]. A função escala é uma função básica denotada por φ, tendo como funções básicas associadas: φ j i (t) = φ(j t i), i = 0,..., j 1 (1) sendo: φ : função escala; i: deslocamento; j: escala t: tempo. Para que uma função seja considerada uma wavelet é preciso satisfazer as seguintes condições básicas e necessárias: 1) que ψ(t) L (R), ou seja, a função pertença ao espaço das funções de quadrado integrável ou, ainda, o espaço das funções de energia, no sentido que: ψ(t) dt <. () ) que sua Transformada de Fourier Ψ(ω) satisfaça a condição de admissibilidade: C ψ = Ψ(ω) dω <. () ω Segue da condição de admissibilidade que: lim ω 0 Ψ(ω) = 0. (4) Assim, se Ψ(ω) é contínua então, Ψ(0) = 0, ou seja, = 0. O escalonamento utilizado na Transformada Wavelet tem o mesmo significado da escala utilizada nos mapas geográficos, onde as escalas maiores fornecem visões globais enquanto que as menores nos permitem observar os detalhes. Escalas grandes permitem analisar os trechos longos do sinal, enquanto que escalas menores permitem analisar trechos mais curtos de forma mais detalhada. A seguir temos as principais funções wavelets.

1) Wavelet Chapéu Mexicano (Mexican Hat Wavelet): Esta wavelet é a derivada segunda da função gaussiana f(t) = e 1 t, pertence a família de wavelets não ortogonais e é definida como [9], na Figura temos a sua representação: ψ(t) = π 0,5 (1 t )e 0,5t (5) Esta wavelet é muito utilizada principalmente na detecção de bordas. de Db a Db10, onde N representa o número de momentos nulos que a função wavelet de Daubechies possui. A seguir é apresentado um exemplo da wavelet mais simples de Daubechies, a Db4, gerada a partir de apenas quatro coeficientes. ( 1 + (h 0, h 1, h, h ) = 4, + 4, 4, 1 ) 4 (8) A partir desses coeficientes pode-se construir a função escala: φ(t) = N 1 h k φ(t k) (9) k=0 e calcular g n : Fig.. Visualização da wavelet Chapéu Mexicano (Mexican Hat). ) Wavelet de Morlet: A wavelet de Morlet pertence a família de wavelets não ortogonais e é definida como [9]: ψ(t) = π 1 que é geralmente aproximado por 1 4 ω (e iω 0t e 0 )e 1 t (6) ψ(t) = π 1 4 e iω 0t e 1 t, para ω 0 5 (7) e é muito utilizado no estudo de sinais geofísicos, a Figura representa graficamente a função wavelet de Morlet. Fig.. Função wavelet de Morlet. ) Wavelet de Daubechies: Ingrid Daubechies propôs um procedimento para construção das bases ortonormais ao invés de construir a wavelet e a função escala através de um subespaço V j [8]. Esse procedimento representa as funções φ e ψ através dos coeficientes dos filtros h k e g k, que são respectivamente os filtros passa-baixa e passa-alta. Quanto maior o número de coeficientes, mais suave será a wavelet. A função wavelet Daubechies DbN possui uma família composta por 9 membros, ( 1 (g 0, g 1, g, g ) = 4, + 4, + 4, 1 ) 4 (10) Assim, a wavelet de Daubechies é dada por: ψ(t) = N 1 g k φ(t k) (11) k=0 Portanto, a matriz A representa os coeficientes da wavelet de Daubechies (Db4) na decomposição de um sinal A = c 0 c 1 c c c c c 1 c 0 c 0 c 1 c c c c c 1 c 0 c 0 c 1 c c c c c 1 c 0 c c c 0 c 1 c 1 c 0 c c Observa-se que as linhas ímpares contêm os coeficientes correspondentes à filtragem passa-baixa que suaviza os dados enquanto que as linhas pares correspondem à filtragem passaalta que captura os detalhes que a filtragem passa-baixa perdeu. Já a reconstrução do sinal é representada pela matriz B, que é a transposta da função A: B = c 0 c c c 1 c 1 c c c 0 c c 1 c 0 c c c 0 c 1 c c c 1 c 0 c c c 0 c 1 c c c 1 c 0 c c c 0 c 1 c

4) Transformada Wavelet de Haar: A Transformada de Haar (TH) é uma da mais simples e básicas transformações, ela decompõe cada sinal em duas componentes, uma chamada de média (aproximação) e outra conhecida como diferença (detalhes) [10]. Uma fórmula precisa para os primeiros valores do subsinal de aproximação, a = (a 1, a,..., a N/ ), em um nível com sinal de tamanho N, isto é, f = (f 1, f,..., f N ) é: a n = f n 1 + f n, n = 1,,,..., N/, (1) e os primeiros valores do subsinal de detalhe, d = (d 1, d,..., d N/ ), no mesmo nível é dado como: d n = f n 1 f n, n = 1,,,..., N/, (1) O processo de aplicação da Transformada de Haar pode ser melhor explicado com a ajuda de um exemplo simples, como mostrado a seguir. Tomamos com exemplo um bloco de imagem 4X4: I = 1 4 4 7 8 6 1 8 5 4 7 Aplicando a Transformada de Haar ao longo da primeira linha, 1 os coeficientes de aproximação são: (1 + ) e 1 ( + 4) 1 e os coeficientes de detalhes são: 1 (1 ) e ( 4). A mesma transformada é aplicada para as outras linhas do bloco I. Ao término da aplicação da transformada nas linhas, o resultado é mostrado abaixo, onde as duas primeiras colunas correspondem aos coeficientes de aproximação e as duas últimas coluna aos de detalhes. 7 : -1-1 7 15 : 1-1 1 8 9 : 4-7 7 11 : - - Após aplicar a Transformada de Haar em todas as linhas, aplica-se da mesma forma nas colunas, resultando na matriz abaixo. Que é igual a: 1 10 : 0-15 0 : 1-10...... :...... -4-8 : -4 0 1 - : 7-4 5 11 : 0-1 7,5 10 : 0,5-5...... :...... - -4 : - 0 0,5-1 :,5 - Da matriz final resultante acima, temos quatro sub-bandas: A= 5 11 7,5 10, H = 0-1 0,5-5, V = - -4 0,5-1 e D = - 0,5 - Cada sub-banda A, H, V e D possuem dimensões de (numero de linhas)/ x (numero de colunas)/, e correspondem respectivamente aos coeficientes de aproximação, de detalhe horizontal, detalhe vertical e detalhe diagonal. Podese avançar um nível de decomposição repetindo o processo na sub-banda de aproximação. 5) Transformada Rápida de Haar: A transformada rápida consiste na decomposição da imagem em duas componentes: uma de média (aproximação) e outra referente a diferença (detalhes) [11]. Para duas amostras f n 1 e f n (vizinhas) é aplicada uma transformada linear para gerar valores a n (aproximação) e d n (detalhes), sendo que a aproximação é representada pela equação: a n = (f n 1 + f n )/, n = 1,,,..., N/. (14) e o detalhe é baseado na amostra f n 1, com a seguinte equação: d n = f n1 f n, n = 1,,,..., N/. (15) A generalização para uma imagem digital se dá com o cálculo das duas componentes citadas, para cada par de pixels da imagem. Quanto as componentes obtidas, pode-se dizer que os valores de média representam as componentes de baixa frequência da imagem e os valores obtidos como diferença, isolam as componentes de alta frequência (detalhes da imagem). A transformada inversa de Haar é responsável pela reconstrução da imagem original onde, para os pixels descritos anteriormente, f n 1 e f n, obtêm-se através das seguintes equações: f n 1 = a n + d n, n = 1,,,..., N/. (16) f n = a n d n, n = 1,,,..., N/. (17) em que a n e d n são passados como parâmetro para reconstrução. IV. MÉTODOS DE AVALIAÇÃO A qualidade do vídeo pode ser medida utilizando métricas de qualidade objetivas ou de forma subjetiva por meio de experimentos com observadores humanos. As métricas objetivas como SNR (Signal to Noise Ratio), PSNR (Peak Signal to Noise Ratio) ou MSE (Mean Squared Error) fazem medições em tempo real, comparando a imagem sob teste com a imagem original. Essas medidas mostram resultados não coerentes com a percepção de observadores humanos, por consistirem de uma comparação matemática entre o sinal original e o sinal processado. Por exemplo, um quadro deslocado de um pixel tem uma PSNR baixa, mas um

observador não nota a diferença entre a imagem deslocada e a original. Para avaliação dos sistemas, é comum o uso da PSNR, ou da WSNR (Weighted Signal to Noise Ratio). A PSNR é definida pela Equação 18 para vídeos codificados com 8 bits. PSNR = 10 log 10 [ 55 MSE ] (18) O MSE é dado pelo valor médio dos erros quadráticos entre os pixels do quadro original e do quadro decodificado. O MSE é dado pela seguinte equação MSE = 1 (f(x, y, k) h(x, y, k)), (19) P k x,y sendo P o número total de pixels, x e y os índices das linhas e colunas, respectivamente, k o número de quadros, f e h representando o quadro original e o modificado, respectivamente. Testes mostram que há pouca correlação de medidas baseadas no MSE e PSNR com as observações subjetivas [1]. Assim, nas três últimas décadas, tem-se estudado maneiras de medir a qualidade de vídeo e de imagens objetivamente de forma que essas métricas levem em consideração as características do sistema visual humano (HVS Human Visual System). Em [1] são apresentadas diversas outras métricas, dentre elas pode-se citar a métrica de similaridade estrutural (SSIM Structural Similarity). O SSIM é um algoritmo que utiliza a estatística da imagem para a avaliação de qualidade de imagens usando janelas. Os índices SSIM são calculados pelas janelas deslizantes, que se movem pixel-a-pixel do topo esquerdo até o canto inferior direito do quadro. Em [14] é proposta uma indexação da imagem, na qual f e h são dois sinais não negativos alinhados um com o outro, e existem média e desvio padrão dos sinais f e h, µ f, µ h, σ f, σ h e σ fh. A média e o desvio padrão são considerados estimativas aproximadas da luminância e do contraste do sinal. A similaridade indexada da medida entre f e h é dada em [14] e corresponde a 4µ f µ h σ fh S(f, h) = l(f, h) c(f, h) s(f, h) = (µ f + µ h )(σ f + σ h ) (0) O problema com a Equação 0 é que quando (µ f +µ h )(σ f + σh ) for igual a zero a medida resultante não está definida. Por esse motivo uma modificação da Equação 0 é realizada, resultando na seguinte equação SSIM(f, h) = (µ f µ h + C 1 )(σ fh + C ) (µ f + µ h + C 1)(σ f + σ h + C ) em que as constantes C 1 e C, são dadas por: (1) C 1 = (K 1 B), C = (K B), () em que B é o valor dinâmico do pixel (para 8 bits/pixel, B = 55), K 1 e K são duas constantes pequenas, dadas por K 1 = 0, 01 e K = 0, 0, respectivamente, para este trabalho [1]. O SSIM tem as seguintes propriedades: 1) SSIM (f, h) = SSIM (h, f); ) SSIM (f, h) 1; ) SSIM (f, h) = 1, se e somente se f = h. V. SISTEMA PROPOSTO A técnica para redução da resolução espacial tanto na posição vertical quanto na posição horizontal no domínio dos pixels é mostrada na Figura 4. Fig. 4. Interpolador fracional com taxa de L/S. O sistema de transcodificação proposto realiza a conversão da resolução espacial, no domínio dos pixels, de vídeos com resolução CIF (Common Intermediate Format - 5 88 pixels) para vídeos QCIF (Quarter Common Intermediate Format - 176 144 pixels). Para isto, foi aplicado o subamostrador com valor e um superamostrador com fator 1, como ilustrado na Figura 4 (L = 1, S = ), em que h(v) representa um filtro passa-baixa. Esses fatores foram escolhidos de acordo com a taxa de redução espacial dos vídeos (5/176 = 88/144 = ) e os filtros são posicionados entre o superamostrador e o subamostrador para garantir que o sinal de saída não apresente aliasing [5]. Foram escolhidos os formatos CIF e QCIF por existirem vídeos de testes em ambos os formatos. Esses vídeos são necessários para que possa realizar os testes subjetivos. Um outro ponto na escolha desses formatos é que para mudar do formato SDTV para CIF também é usado o subamostrados =1 e o subamostrador com S=. Os filtros, h(v), utilizados neste trabalho foram construídos usado o algorítimos de Wavelet de Haar e o algorítimo de Haar rápida. VI. RESULTADOS Esta seção apresenta os resultados da avaliação da transcodificação usando dois filtros realizados com algoritmos de Wavelets, sendo o primeiro a transformada de Haar e o segundo a Transformada Haar Rápida. Os vídeos originais usados nos testes foram Mobile, News e Container. Cada um dos vídeos tinha dez segundos e estão disponíveis para download publico. Estes vídeos foram escolhidos porque contem uma boa mistura de textura, movimento e cores. A Tabela I e a Figura 5 mostram o resultado do PSNR obtido pelos vídeos transcodificados pela Transformada Wavelet utilizando a matriz A. O video Mobile mostrou o pior resultado obtido por ser o video com mais textura. Gráfico da avaliação dos vídeos transcodificados espacialmente usando a PSNR, em que os valores 1, e representam os vídeos News, Container e Mobile, respectivamente:

TABELA I RESULTADOS DA TRANSCODIFICAÇÃO ESPACIAL COM A PSNR. Filtro News Mobile Container Haar Normal 6,009 19,8747 4,878 Haar rápida 4,4056,949,45 Fig. 6. Resultados da transcodificação espacial com a SSIM. Fig. 5. Resultados da transcodificação espacial com a PSNR. O vídeo News obteve os melhores resultados de PSNR utilizando ambos os filtros de Haar e Haar rápida (superior a 0 db),em todos os vídeos utilizados a transcodificação usando wavelet, a Haar rápida obteve o melhor desempenho. A Tabela II e a Figura 6 mostram os resultados do obtido pelos vídeos transcodificados pela transformada wavelet utilizando a métricca SSIM. TABELA II RESULTADOS DA TRANSCODIFICAÇÃO ESPACIAL COM A SSIM. Filtro News Mobile Container Haar Normal 0,9505 0,770 0,914 Haar Rapida 0,986 0,881 0,9640 Gráfico da avaliação dos vídeos transcodificados espacialmente usando a SSIM, onde os valores 1, e representam os vídeos News,Container e Mobile, respectivamente: Os resultados encontrados com o filtro Haar rápida foram superiores aos melhores resultados obtidos no artigo []. Os resultados encontrados foram superiores nas duas métricas, PSNR e SSIM e no tempo gasto para a realização da redução espacial. VII. CONCLUSÕES Neste artigo apresentamos uma avaliação da qualidade objetiva de vídeos transcodificados utilizando wavelet. A operação consistiu em transcodificar os quadros de vídeo usando dois filtros Wavelet: Transformada Haar Rápida e Transformada Haar. A avaliação da qualidade objetiva dos vídeos utilizou os métodos PSNR e SSIM em que em ambos os casos foram obtidos bons resultados. A Transformada Haar Rápida apresentou os melhores resultados principalmente na comparação com a PSNR. REFERÊNCIAS [1] M. S. Alencar, Digital Television Systems. Cambridge Univ Press, 009. [] C. Regis, D. Morais, M. Alencar, and M. Farias, Objective and subjective assessment of space-transcoded videos for mobile receivers, in IEEE International Symposium on Broadband Multimedia Systems and Broadcasting, 009. BMSB 09., May 009, pp. 1 6. [] R. C. D., R. R. Rocha, F. M., and A. M. S., Objective and subjective evaluation of space-transcoded videos for mobile receivers, in Journal of Communications Software and Systems JCOMSS, vol. 6, no., 010. [4] I. Ahmad, X. Wei, Y. Sun, and Y.-Q. Zhang, Video transcoding: an overview of various techniques and research issues, IEEE Transactions on Multimedia, vol. 7, no. 5, pp. 79 804, Oct. 005. [5] J. Xin, M.-T. Sun, B.-S. Choi, and K.-W. Chun, An HDTV-to-SDTV spatial transcoder, IEEE Transactions on Circuits and Systems for Video Technology, vol. 1, no. 11, pp. 998 1008, Nov. 00. [6] P. P. Vaidyanathan, Multirate systems and filter banks. New Jersey: Prentice Hall/Englewood Cliffs, 199. [7] J. F. D. SILVA, Sistema de armazenamento de imagens comprimidas atraves da transformada wavelet, Dissertaçã de Mestrado, Universidade Estadual Paulista, junho 008. [8] R. D. da Silva, Sistema de armazenamento de imagens comprimidas atraves da transformada wavelet, Dissertação de Mestrado, Universidade Estadual Paulista Júlio de Mesquita Filho, Ilha Solteira - SP, Brasil, 008. [9] J. M. B. Protázio, Análise wavelet aplicada a sinais geofísicos, Master Thesis, Universidade Estadual de Campinas, Campinas, Brasil, Fevereiro 00. [10] A. Bhardwaj and R. Ali, Image compression using modified fast haar wavelet transform, World Applied Sciences Journal, 009. [11] E. J. Stollnitz, T. D. Derose, and D. H.Salesin, Wavelets for Computer Graphics: Theory and Applications. Morgan Kaufmann publishers, 1996. [1] Z. Wang, A. C. Bovik, H. R. Sheikh, and E. P. Simoncelli, Image Quality Assessment: from Error Visibility to Structural Similarity, IEEE Transactions on Image Processing, vol. 1, no. 4, pp. 600 61, 004. [1] G. Muntean, P. Perry, and L. Murphy, Objective and Subjective Evaluation of QOS Video Streaming over Broadband Networks, IEEE Electronic Transactions on Network and Service Management, vol., no. 1, pp. 19 8, Novenbro 005. [14] Z. Wang and A. Bovik, A Universal Image Quality Index, Signal Processing Letters, IEEE, vol. 9, no., pp. 81 84, Mar 00.