Avaliação da Qualidade de Fluxo de Vídeo em uma Rede Sem Fio Rafael Leite 1, Edjair Mota 1 Email: {rlms, edjair}@dcc.ufam.edu.br 1 Departamento de Ciência da Computação Universidade Federal do Amazonas Grupo de Redes de Computadores e Multimídia(GRCM) Manaus Amazonas Brasil Abstract. In this work, we observe the behavior of video transmission over a wireless network whose caracteristics of the backbone are manipuled by means of a network emulator called NISTnet. To measure the quality of the video broadcast, we used a tool called VQM (video quality measurement), and as we ll see, its techniques used to estimate the video quality based in comparisons between the original and the processed (transmitted) video make impossible a real-time measurement, since all the video must be sent to the receiver in order to process the video quality coeficient. Resumo. Neste trabalho observamos como se comporta a transmissão de vídeo em uma rede sem fio cujas características do backbone são manipuladas através de um emulador de rede chamado NISTnet. Para medir a qualidade do vídeo transmitido, utilizamos uma ferramenta chamada VQM ( video quality measurement ) e, como veremos, as técnicas utilizadas para estimar a qualidade de vídeo baseadas em comparações entre o vídeo original e o processado (transmitido), nos impossibilita uma medição em tempo real, já que todo vídeo deve ser transmitido para o receptor para que haja o processamento do coeficiente de qualidade de vídeo. 1. Introdução Quando falamos de Internet, estamos falando não mais apenas de serviços de e-mail e páginas html estáticas, mas também de serviços complexos, com interatividade entre o usuário e o mundo web. A web 2.0 trouxe consigo serviços essenciais para a comunicação como a conhecemos hoje. Serviços como a telefonia IP e vídeoconferência estão gerando cada vez mais demanda e isso torna a mesma infra-estrutura da Internet de antigamente um pouco inadequada, pois esta não foi projetada visando esses tipos de serviços. Com base nisso, este artigo trata sobre o impacto na qualidade do vídeo transmitido via fluxo em uma rede sem fio. Os desafios nessas redes se dão, entre outros, pela limitação de banda e pela interferência à qual esse tipo de rede está sujeita. O objetivo desse trabalho é testar, avaliar e comprovar a viabilidade de um serviço de fluxo de vídeo em uma rede sem fio emulada. O artigo está organizado da seguinte forma: a seção 2 faz um breve relato de alguns trabalhos publicados nessa área, seus principais experimentos e resultados; a seção 3 resume alguns fundamentos importantes de vídeo; a seção 4 disserta sobre a ferramenta de medição de qualidade de vídeo VQM [Wolf and Pinson 2002], assim como algumas
técnicas utilizadas por ela para estimar a qualidade; logo após os resultados são apresentados seguidos de uma conclusão e uma discussão sobre as tendências e desafios na área. 2. Trabalhos Relacionados Vários trabalhos têm sido propostos com o objetivo de descrever métodos objetivos de estimação de qualidade de vídeo sob vários aspectos. Em [Wang et al. 2003] é feita uma avaliação de qualidade do vídeo observando aspectos da camada de aplicação, utilizando o programa WMP ( Windows Media Player ) como servidor e receptor de um fluxo de vídeo em uma rede emulada com o NISTnet [Carson and Santay 2003] como ilustra a figura 1. O Experimento se baseou em variar os aspectos da rede permitidos pelo NISTnet, tais como banda, atraso e perda, para se observar como se comportam algumas características da aplicação, como: quantidade, tempo e probabilidade de rebuferização ( rebuffering ) que são essenciais para a qualidade do vídeo transmitido. Figura 1. cenário do experimento usando NISTnet Em [Li et al. 2005], o objetivo do trabalho foi investigar formas de melhor adaptar transmissão de vídeo para um canal sem fio à medida que ele degrada. O cenário do experimento foi uma WLAN com vários pontos de acesso (AP) interligados por um único enlace cabeado comunicando com o servidor de vídeo, como podemos observar na figura 2. O objetivo do experimento foi avaliar o desempenho de um fluxo de vídeo obtendo valores do ponto de vista das camadas de aplicação, rede e enlace. Sob a perspectiva da aplicação, os aspectos observados foram as taxas de quadros, taxa de codificação e quantidade de quadros perdidos. Já no nível de rede, foram analisadas a vazão, o tempo de ida e volta RTT ( round trip time ) e a taxa de perda de pacotes. Por fim, na visão da camada de enlace as variáveis de interesse foram capacidade, força do sinal e retransmissões de quadros. Figura 2. cénario de experimento da WLAN
O objetivo final foi avaliar o comportamento do fluxo de vídeo variando alguns fatores como os protocolos TCP e UDP, sob várias condições de receptividade de sinal. O estudo concluiu que para locais em que a receptividade era boa, não houve muitas diferenças de desempenho da aplicação de vídeo, todavia, para locais de menor força de sinal, o TCP obteve resultados significativos em relação ao UDP. Segundo os autores, esse comportamento se deve ao fato de que o protocolo TCP possui mecanismos de retransmissão, fazendo com que os pacotes perdidos por conseqüência da baixa comunicação fossem retransmitidos com sucesso, melhorando assim o desempenho final da aplicação. Nossa proposta se baseia em testar o comportamento de um fluxo de vídeo em um cenário semelhante ao trabalho em [Wang et al. 2003], mas utilizando enlaces sem fio emulados como descrito em [Li et al. 2005]. Utilizando a ferramenta de emulação de rede NISTnet, investigamos a qualidade de vídeo transmitido via fluxo com a ajuda da ferramenta VQM [Wolf and Pinson 2002]. Os resultados deste trabalho nos permitirão analisar o mesmo problema sob outro ponto de vista. 3. Vídeo sobre IP 3.1. Conceitos Básicos Vídeos digitais são compostos de uma seqüência de imagens. Cada Imagem é constituída por um conjunto de pixels ( picture elements ), que possuem valores numéricos que representam a informação sobre a crominância e a luminância. Os valores da crominância dão informações sobre a porção colorida da imagem, que se baseia no sistema de cores RGB ( Red Green Blue ). A Luminância é a porção do brilho da imagem, nos dando a noção de formas da imagem. Para avaliação da qualidade do vídeo, a luminância é a informação de maior importância, dado que o sistema ocular humano é mais sensível em reconhecer formas à cores de uma imagem. 3.2. Compressão de Vídeo O propósito de comprimir vídeo é minimizar a quantidade total requerida de espaço de armazenamento e otimizar o uso da banda em uma rede. O principal aspecto explorado pelos pesquisadores nessa área é o fato de que imagens adjacentes em um vídeo são muito parecidas, possuindo apenas alguns poucos pixels de diferença. Baseado nisso, o grupo MPEG ( Moving Picture Experts Group ) desenvolveu um método de compressão que utiliza a DCT ( Discrete Cossine Transformation ) que comprime uma imagem e transforma em intra quadros ( I-frames ). Esses quadros são os primeiros em uma GOP ( Group of Pictures ) que são constituídas por outros tipos de quadros: os quadros preditivos ( P-frames ) e os bidirecioanis ( B-frames ). Os Quadros preditivos são gerados pelo cálculo das variações da imagem original de um vídeo e outra imagem não adjacente do mesmo em uma seqüência de quadros. Logo, os quadros preditivos apenas guardam informações sobre a diferença dos frames, sendo este tipo de quadro dependente de um intra quadro anterior ou um outro quadro preditivo. Os quadros bidirecionais são calculados baseados nos quadros I e P imediatamente anteriores e posteriores. Figura 3 mostra um exemplo de um GOP. Um GOP começa com um quadro I e termina antes do próximo. O desempenho em uma rede e o tamanho do vídeo comprimido depende diretamente do tamanho do GOP, pois, o maior quadro em um vídeo comprimido são os quadros I, sendo assim
Figura 3. referências temporais entres os quadros I, P e B GOPs menores implicam em maior número de quadros I para comprimir o vídeo, e então maior o vídeo comprimido será, requerindo mais disponibilidade de banda e espaço de armazenamento. 4. Qualidade de vídeo Quando falamos em qualidade de vídeo, neste trabalho, estamos nos referindo à sua reprodução em tempo real no receptor o mais fiel possível ao original no transmissor. Diferentemente de falarmos em qualidade de vídeo que é produzido por alguma câmera localmente, baseado apenas na percepção humana em tempo real. Como veremos, o conceito de qualidade de vídeo abordado neste trabalho advém da comparação entre o vídeo original e o processado (transmitido), nos remetendo a uma análise restrita que necessita de duas fontes, inviabilizando uma análise em tempo real como acontece, por exemplo, com o modelo E e o MOS ( Most Opinion Score ) para VoIP [de Carvalho 2004]. Algumas técnicas são utilizadas para amenizar os efeitos negativos referentes à rede, dentre eles, a mais comum é a de buferização ( buffering ). Ela consiste em armazenar temporariamente uma certa quantidade de dados a fim de tomar alguma ação antes de apresentar o vídeo. Ações essas como a de remontar a imagem devido ao embaralhamento dos pacotes ou de transmitir alguma informação na rede; dependendo da rede, esse buffer pode ser muito grande ou muito pequeno. Em [Wang et al. 2003] a avaliação de qualidade do vídeo apresentado foi com base principalmente no aspecto de buferização, visto que em uma apresentação de vídeo é de vital importância que o vídeo não seja interrompido por muito tempo ou por várias vezes. 4.1. VQM A ferramenta VQM é definida pelo padrão ANSI T 1.801.03 2003, atualmente adotado como padrão objetivo de qualidade de vídeo. Suas técnicas levam em consideração aspectos perceptuais de falhas de vídeo tais como atenuação, movimento não natural, ruídos globais, distorção de bloco e distorção de cor, diferentemente da técnica citada na seção anterior. Seu processamento toma como entrada o vídeo original e o vídeo processado e procede com os seguintes passos: Calibração: é feito uma calibração do vídeo processado para que ele esteja alinhado temporal e espacialmente com o vídeo original, assim como o contraste e o brilho.
Extração de características de qualidade: nesse passo acontece a extração de um conjunto de métricas referentes às mudanças ocorridas entre o vídeo processado e o original no quesito temporal, espacial e crominântico através de funções matemáticas nas várias sub-regiões do vídeo em questão. Cálculo dos parâmetros de qualidade: esse passo calcula as diferenças entre as características extraídas do passo anterior entre o vídeo original e o processado. Cálculo do VQM: nesse passo, o cálculo da qualidade do vídeo é feita utilizando uma combinação linear dos passos anteriores. Para o cálculo, pode-se utilizar um de vários modelos que são baseados em certos critérios de otimização para um caso específico, são eles: Televisão, Videoconferência, Geral, Desenvolvedor e PSNR ( Peak Signal-to-Noise Ratio ). Para este artigo utilizamos o modelo geral, pois sua utilização é permitida para estudos e publicações. O valor da métrica próximo de 0 siginifica que o vídeo processado não difere muito do original, quanto mais próximo de 1 mais degradado está o vídeo. Em algumas análises, valores maiores que 1 podem ser obtidos, significando que o vídeo está extremamente distorcido. Detalhes sobre as técnicas de cada um dos passos citados podem ser encontrados no relatório técnico [Wolf and Pinson 2002]. Neste trabalho, utilizamos o modelo geral, cujo cálculo consiste em uma combinação linear entre sete parâmetros. Quatro deles são extraídos de características do gradiente espacial do sinal de luminância, dois deles são extraídos do vetor formado pelos sinais de crominância azul e vermelho e um parâmetro é baseado nas caracteríscas de contraste e informação temporal absoluta, ambas extraídas do sinal de luminância [Wolf and Pinson 2002]. 5. Projeto de experimentos Para a realização dos experimentos utilizamos um cenário igual ao descrito na seção 2 utilizado por [Wang et al. 2003]. Nosso principal diferencial é que utilizamos software livre, tal como o VLC para realizar o streaming de vídeo, e utilizamos uma banda de 54 mbps para emular uma rede sem fio no padrão 802.11g no emulador NISTnet. O vídeo utilizado foi um clipe de música com duração de 2 minutos e 28 segundos Nosso objetivo é utilizar a ferramenta de avaliação de qualidade de vídeo VQM e, para isso, tivemos que obter as amostras dos vídeos transmitidos salvos em arquivo para posterior avaliação. Nesse aspecto, nosso experimento se diferencia de [Wang et al. 2003] pois sua análise era feita em tempo real sem necessidade de armazenamento em disco. A análise se baseia na variação dos principais aspectos que influenciam a qualidade do vídeo em uma rede, tais como atraso, perda e jitter, como já foi discutido anteriormente. Para isso variamos, através do NISTnet, a perda em dez níveis: de 1% a 10% e o atraso em três níveis: 1, 5 e 10 milisegundos, sendo que para configuração de jitter acrescentamos uma variação de atraso de 50%, ou seja, para um atraso de 10 milisegundos a variação de atraso fica entre 5 e 15 milisegundos. Para cada configuração de níveis foram feitas 5 repetições, totalizando 150 transmissões de fluxo de vídeo, e para cada uma, foi feita uma média aritmética das amostras dos resultados da avaliação do VQM.
6. Análise de Resultados Para as avaliações da qualidade do vídeo transmitido e o original, a ferramenta VQM nos solicita alguns parâmetros de entrada; esses parâmetros dizem respeito à utilização de calibração e modelo. Utilizamos então o parâmetro de calibração desativado, pois nossos vídeos eram alinhados temporal e espacialmente e, como parâmetro de modelo, utilizamos o modelo geral. O gráfico abaixo (figura4) expõe os resultados obtidos: Figura 4. gráfico com os resultados obtidos O gráfico ressalta que a qualidade do vídeo (representado pelo eixo y) degrada em canais ruidosos com maior taxa de perda de pacotes (representado pelo eixo x). Esse comportamento acontece principalmente por causa da perda e/ou chegada fora do tempo dos quadros I que encabeçam as GOPs. Para comparar o impacto do atraso na qualidade, fizemos as médias dos coeficientes com relação às perdas para cada atraso. Os valores estão expressos no gráfico abaixo (figura 5). Figura 5. gráfico com os resultados obtidos Semelhante ao gráfico anterior, a figura 6 contém o gráfico com as médias dos coeficientes com relação aos atrasos para cada valor de perda. Com os gráficos apresentados, podemos analisar que tanto o atraso como a perda prejudicam a qualidade do vídeo apresentado, dado que a perda prejudica a decodificação por quadros I e consequentemente todos os outros referenciados a eles, e o atraso e jitter
Figura 6. gráfico com os resultados obtidos inserem o desordenamento de pacotes, prejudicando a apresentação do quadro na hora que deve ser mostrado. Por se tratar de um clipe musical, um comportamento de mudança de cenário muito freqüente pode ser observado, o que contribui para codificação de quadros I mais intensa, aumentando, assim, o número de GOPs. Esse comportamento sugere que para um canal susceptível a erros, a qualidade do vídeo degrada com o aumento da porcentagem da perda de pacotes, visto que a probabilidade de perda de pacotes contendo quadros I aumenta. 7. Conclusão e trabalhos futuros Através desse trabalho concluímos que os parâmetros de redes como jitter, atraso e perda de pacotes influenciam de forma negativa na qualidade do vídeo. No entanto, nossa observação foi uma abordagem offline porém automatizada, enquanto que o trabalho relacionado citado foi uma observação em tempo real utilizando o critério de rebuferização. Temos então que uma avaliação intermediária que englobe os dois aspectos, tanto a avaliação em tempo real quanto os parâmetros analisados pelo VQM, traga uma eficiência e comodidade maior, além de uma correlação mais apurada com o método subjetivo na avaliação da qualidade do vídeo transmitido em uma rede IP. Para redes sem fio a aplicação se mostrou um pouco deficiente, dado que os valores de degradação ficaram muito distantes do ideal, o que demanda uma perquisa maior para prover melhorias nesse tipo de rede e na aplicação em questão. Um dos principais problemas que podemos notar em redes sem fio é sua limitação de banda e as interferências inerentes a elas, cujos espectos influenciam no agravamento das perdas e, conseqüentemente, na deficiência da qualidade de serviço. Um grande avanço nessa área seria uma ferramenta que pudesse avaliar a qualidade do vídeo em tempo real, levando em consideração todos os aspectos envolvidos na transmissão do fluxo de vídeo, assim como o modelo E é para a telefonia IP, cuja aplicação é largamente utilizada em pesquisas para vários propósitos. Referências Carson, M. and Santay, D. (2003). SIGCOMM, 33. Nist net a linux-based network emulation tool.
de Carvalho, L. S. G. (2004). Implementação do modelo e para avaliação objetiva da qualidade da fala em redes de comunicação voip. Master s thesis, Universidade Federal do Amazonas. Li, F., Chung, J., Li, M., Wu, H., Claypool, M., and Kinicki, R. (Thursday, March 31, 2005). Application, network and link layer measurements of streaming video over a wireless campus network. In Passive and Active Network Measurement. Springer Berlin / Heidelberg. Wang, Z., Banerjee, S., and Jamin, S. (2003). Studying streaming video quality: from an application point of view. In MULTIMEDIA 03: Proceedings of the eleventh ACM international conference on Multimedia, pages 327 330, New York, NY, USA. ACM. Wolf, S. and Pinson, M. (2002). Video quality measurement techniques. Technical report, National Telecommunications and Information Administration.