Uma abordagem simplificada para composição de imagens

Documentos relacionados
Introdução ao Processamento de Imagens Digitais Aula 01

Os computadores processam dados digitais ou discretos. Os dados são informação representada num sistema digital de símbolos.

Como capturar imagens de alta resolução?

Mídias Discretas. Introdução à Ciência da Informação

Princípios sobre imagens digitais

RESOLUÇÃO. RESOLUÇÃO DE UMA IMAGEM - A resolução é a medida do detalhe de uma imagem que um dispositivo pode capturar ou reproduzir.

Introdução Geral a Computação Gráfica. Universidade Católica de Pelotas Curso de Engenharia da Computação Disciplina de Computação Gráfica

DETECÇÃO DE CORES DE SOLUÇÕES QUÍMICAS PARA PESSOAS COM NENHUMA OU BAIXA VISÃO UTILIZANDO OPENCV

UNIVERSIDADE FEDERAL FLUMINENSE Pedro Martins Menezes. Um estudo dos estágios dos pipelines gráficos

Imagem bitmap. Gráfico vetorial. gráficos vetoriais

Aquisição e Tratamento de Imagem Estática (Mapa de Bits) Tecnologias da Informação e Comunicação

1. Introdução. Figura 1 - Space Invaders (a) e Super Mario Bros(b). 1 Universidade de Cruz Alta

Prof. Fabiano Taguchi

Aplicações Informáticas B 12º Ano

Imagem Digital. Claudio Carvilhe

Introdução a Análise de Imagens Digitais

GUIA DE PREPARAÇÃO DE ARQUIVOS PARA IMPRESSÃO OFFSET.

TEORIA DE CORES ALEXANDRE KEESE

Modelo RGB - Aplicações

Processamento Digital de Imagens

Processamento Digital de Imagens

Padrões e Tipos de Dados de Mídia. Imagem

Multimídia. Conceitos Básicos (Parte I)

INTRODUÇÃO AO DESENVOLVIMENTO WEB. PROFª. M.Sc. JULIANA H Q BENACCHIO

Universidade do Estado de Minas Gerais Curso de Sistemas de Informações. Multimídia. A Imagem (Parte I)

Representação da Informação Imagem e Vídeo

Cores em Imagens e Vídeo

Ciências da Computação Disciplina:Computação Gráfica

FUNDAMENTOS DA COMPUTAÇÃO GRÁFICA

Computação Gráfica Síntese de Cores

Computação e Imagens: PI, CG e Visualização. Computação Visual

Rendering de Polígonos. Determinação de Superfícies Visíveis. Back Face Culling. Back Face Culling. Back Face Culling. Back Face Culling.

Introdução. 1 Introdução

FUNDAMENTOS DA ELABORAÇÃO

5 Resultados Resolução das Imagens e tamanhos das cenas

Representação da Informação

Processamento Digital de Imagens

Introdução ao Processamento e Síntese de imagens -Linhas e superfícies escondidas

Desde o surgimento dos primeiros jogos eletrônicos em meados dos anos 50, uma infinidade de aparatos eletrônicos foram desenvolvidos, principalmente

Sistemas de Cores. Leandro Tonietto Processamento Gráfico Jogos Digitais set-09

Processamento de Imagem. A Imagem digital Professora Sheila Cáceres

Computaçã. Visão Geral. Sistema Gráfico. Computação Gráfica. Pixels. Sistema Gráfico e o Frame Buffer. Introdução à Computação Gráfica

Motivação Por que estudar?

INTERPOLAÇÃO LINEAR E BILINEAR: APLICAÇÃO EM TRANSFORMAÇÕES GEOMÉTRICAS DE IMAGEM INTRODUÇÃO

METODOLOGIA PARA A QUANTIZAÇÃO DE CORES PELO MÉTODO SMCb: INTRODUÇÃO E EXEMPLOS DE RESULTADOS

Corel Draw. Editoração Gráfica. Professor: Jarbas Araújo CENTRO EDUCACIONAL RADIER.

4 Análise de Dados. 4.1.Procedimentos

VISÃO DIGITAL, OS OLHOS DO FUTURO

Rastreamento de objeto e estimativa de movimento

Prof. Fernando V. Paulovich 3 de agosto de SCC Computação Gráca

3 Trabalhos Relacionados

UNIVERSIDADE ESTADUAL DO OESTE DO PARANÁ UNIOESTE CAMPUS UNIVERSITÁRIO DE CASCAVEL CURSO DE CIÊNCIA DA COMPUTAÇÃO LISTA DE EXERCÍCIOS

PEF 5743 Computação Gráfica Aplicada à Engenharia de Estruturas

3 Trabalhando com imagens digitais

RECONHECIMENTO FACIAL UTILIZANDO EIGENFACES

Processamento Digital de Imagens

Processamento Digital de Imagens

Fundamentos sobre. Universidade Federal do Rio de Janeiro - IM/DCC & NCE. Antonio G. Thomé Sala AEP/1033. Processamento de Imagens

PROCESSAMENTO DE IMAGENS COLORIDAS

PROCESSAMENTO DE IMAGENS. Eduardo Ribeiro

MouseCam: aplicação de controle do mouse via câmera

UNESP - Universidade Estadual Paulista Júlio de Mesquita Filho

Compressão de Textos. Introdução. Introdução. Introdução. O volume de informação textual disponível on-line é imenso:

Introdução à Computação Gráfica. Claudio Esperança Paulo Roma Cavalcanti

Qualidade Radiométrica das Imagens Sensor ADS40

VERIFICAÇÃO QUALITATIVA DE DEPÓSITOS POR BRASAGEM VIA PROCESSAMENTO DE IMAGEM

Projeto - Sistema Multimídia 2014/2 Etapa 01 (N2)

APLICAÇÃO DA VISÃO COMPUTACIONAL PARA SEGMENTAÇÃO DE OBJETOS EM IMAGENS CAPTURADAS POR EQUIPAMENTOS MÓVEIS.

Dermanostic: um método para normalização da iluminação em imagens de lesões cutâneas

5 Resultados, Conclusões e Trabalhos Futuros

CARTOGRAFIA TEMÁTICA Teoria das cores. Prof. Luciene S. Delazari Departamento de Geomática Curso de Engenharia Cartográfica e de Agrimensura

Mudanças de Coordenadas em Sistemas de Cores

UNESP - Universidade Estadual Paulista Júlio de Mesquita Filho

As imagens. As imagens. Representação digital de imagens. As imagens Wilson de Pádua Paula Filho 1

Processamento Digital de Imagens

ESCOLA SECUNDÁRIA DR. SOLANO DE ABREU ABRANTES ACTIVIDADES ESTRATÉGIAS. Apresentação

Diagramas e Camadas Representação e Linguagem em Arquitetura ARQ1342 Tópicos Especiais em Arquitetura XXVII Prof. Gabriel Duarte

Escola Secundária de Caldas das Taipas

Tutorial de Instalação Plataforma de Mídia Digital Interativa

PROCESSAMENTO DE IMAGENS COLORIDAS. Nielsen Castelo Damasceno

ESTUDO DE TÉCNICAS PARA SOLUÇÃO DE PROBLEMAS DE PROCESSAMENTO DE IMAGENS UTILIZANDO A LINGUAGEM PYTHON

5 Resultados Experimentais

Ficha de trabalho Nº 1 Utilizar adequadamente o computador e/ou dispositivos similares que processem dados.

Tópicos Especiais em Engenharia de Software (Jogos II)

As comunicações à distância estão crescendo consideravelmente pelo uso de aplicações através da Internet e de ambientes virtuais, tais como:

informação enviada (ex. Facebook) ou que a rede social utilize essa informação para sugerir locais de interesse próximos ao usuário (ex. Foursquare).

António Costa. Paulo Roma Cavalcanti

5 Integrando objetos sintéticos à cena real

Tratamento da Imagem Transformações (cont.)

The Helium Frog Animator Manual e Guia de exploração do The Helium Frog Animator para utilização em contexto de Educação Visual e Tecnoló gica

Monitores. Tipos de conexões:

Reconhecimento de texturas utilizando padrão binário local e classificador knn.

Imagem e Gráficos. vetorial ou raster?

Processamento de áudio em tempo real utilizando dispositivos não convencionais:

Processamento Digital de Imagens. Cor

Osciloscópio Digital. Diagrama em blocos:

Esse tipo de visualização sempre exige uma preocupação adicional com eficiência pois o número de polígonos necessário para representar fielmente a

ESPECIFICAÇÕES PARA ENTREGA DE CONTEÚDO, CODIFICAÇÃO DE LONGA, MÉDIA, CURTA E TRAILERS

Transcrição:

Adriano M. Rocha 1 Amanda C.D. Resende 1 Cleriston A. Dantas 1 Vinicius R.L.de Mendonça 1 Elaine A. de Oliveira 1 Rafael R. dos Reis 1 Allan de Oliveira 1 Marcos A. Batista 1 Resumo: O chroma key pode ser definido como uma técnica de processamento de imagens utilizada com o objetivo de realizar a substituição do plano de fundo de uma imagem por outra imagem ou vídeo. Essa técnica é comumente utilizada pelas mídias visuais como o cinema e a televisão. Este trabalho propõe um novo algoritmo para a utilização do chroma key com uso do fundo azul, caracterizado pela simplicidade e facilidade de implementação. Tal algoritmo não utiliza uma variável dedicada para o cálculo da transparência, o que difere das demais abordagens clássicas citadas no trabalho. Abstract: The chroma key can be defined as an image processing technique used in order to accomplish the replacement of the background of an image with another image or video. This technique is commonly used by visual media like cinema and television. This paper proposes a new algorithm for use with the use of chroma key blue background, characterized by simplicity and ease of implementation. Such an algorithm does not use a dedicated variable for the calculation of transparency, which differs from other approaches cited in the classic work. 1 Introdução O método chroma key foi desenvolvido na década de 30, sendo utilizado pela primeira vez na criação de efeitos do filme O Ladrão de Bagdá (The Thief of Bagdad), onde duas imagens analógicas foram sobrepostas, fazendo vazar partes de uma imagem sobre a outra. O crédito da criação deste método foi atribuído a Lawrence W. Butler, diretor de efeitos especiais do filme, que foi vencedor do Oscar nesta categoria [?]. Em 1950 a Warner Bros 1 Universidade Federal de Goiás - Campus Catalão, UFG - CAC, CEP: 75704-020 {adriano.elfblend, amandadavi7,cleriston.tato, vrlm.bytes, elaine.aires, rafabastistajc, allan.comp.ufg@gmail.com}

Entertainment, interessada na utilização de métodos do tipo começou o desenvolvimento de técnicas nesta subárea de pesquisa. O primeiro filme a empregar a técnica com o fundo azul foi O Velho e o Mar (The Old Man and The Sea) da Warner Bros Entertainment em 1958. Nos dias atuais essa técnica é comumente utilizada pelas mídias visuais como o cinema e a televisão. Devido a popularização da tecnologia, (computadores e câmeras digitais), a sua utilização se expande para fora dos estúdios, sendo usada por estudantes, professores e outras pessoas interessadas que não estão relacionadas a esse meio. O chroma key pode ser definido como uma técnica de processamento de imagens utilizada com o objetivo de realizar a substituição do plano de fundo de uma imagem por outra imagem ou vídeo. Estes conceitos serão melhores aprofundados nas próximas seções deste trabalho. Na seção 2 são abordados os conceitos básicos para melhor compreensão do trabalho. Inicialmente é definido o conceito de imagem em um sentido amplo, após delimita-se o estudo das imagens digitais e a sua composição (pixels). Além de imagem, são definidos o Canal Alfa, Padrão RGB e Chroma Key e uma breve apresentação da biblioteca OpenCV. Na seção 3 realiza-se uma pesquisa do estado da arte de métodos que fazem uso do chroma key e dos fundos azuis. Entre os autores estudados pode-se destacar Vhalos pelos vários trabalhos publicados na área, dentre eles tem-se o publicado em 1964 que realiza uma composição de imagens com a utilização de retroprojeção, posteriormente é alcançado um melhoramento da técnica. Além de Vhalos, outros autores estudados são Smith e Bin, Mishima, Chuang, Forsyth and Zisserman e Ley. Na seção 4 é explicado o algoritmo desenvolvido que não necessita de uma variável exclusiva para o cálculo da transparência, sendo essa uma característica que o diferencia das abordagens clássicas. No desenvolvimento utiliza-se a biblioteca OpenCV integrada a linguaguem C. A razão da utilização é a sua rápida comunicação com o hardware, consequentemente a composição é realizada em tempo real. Na seção 5 são apresentados os resultados da aplicação do algoritmo em dois contextos: estático e dinâmico. No primeiro contexto, o participante interage com um fundo azul que será sobreposto por uma única imagem pela captura da cena pela webcam integrada ao notebook utilizado no experimento. No outro contexto, utiliza-se uma câmera digital para subsituir a webcam, primeiro realiza-se a gravação de um vídeo no qual participante interage com o fundo azul, posteriormente o algoritmo o quebra em frames para aplicação do vídeo. Em ambos casos a imagem para composição possue a mesma dimensão da qual será sobreposta. Para finalizar tem-se a seção 6, a conclusão. 2 RITA Volume VIII Número 1 2001

2 Conceitos Básicos A imagem consiste na representação gráfica ou fotográfica de um objeto ou pessoa, podendo ser um desenho, um reflexo na água ou até mesmo uma representação mental. Nesse contexto, apresentam-se as imagens digitais, que constituem na representação de uma imagem bidimensional utilizando números binários codificados de modo a tolerar seu armazenamento, transferência, impressão ou reprodução, e seu processamento por meios eletrônicos. Uma imagem digital é uma representação discreta constituída por pixels. 2.1 Padrão RGB O pixel (abreviatura para Picture Element, ou seja, elemento de imagem) consiste no menor componente da imagem digital, e cada um desses pontos contém informações que definem as suas características (cor e intensidade). Quanto mais pixel por polegada tiver uma imagem melhor será a sua qualidade. Esta resolução é a representação dos detalhes que um dispositivo pode capturar ou reproduzir, sendo medida em DPI ( Dots Per Inch ou pontos por polegada). O modelo RGB descreve as cores como uma combinação das três cores primárias: vermelha (Red), verde (Green) e azul (Blue). A finalidade principal do sistema RGB é a reprodução de cores em dispositivos eletrônicos como monitores de TV e computador, scanners e câmeras digitais, assim como na fotografia tradicional. O modelo de cores RGB permite a representação de grande porcentagem do espectro visível misturando-se luz vermelha, verde e azul em diferentes proporções e intensidades. Imagens RGB reproduzem até 16,7 milhões de cores. As cores são criadas adicionando luz a cada uma das cores intermediárias no processo. A cada uma das três cores do RGB é atribuído um valor numérico de 0 a 255, portanto quanto mais altos os valores, maior é a quantidade de luz branca, o que resulta em cores mais claras. Como o modelo RGB é aditivo, a cor branca corresponde à representação simultânea das três cores primárias (255,255,255), enquanto a cor preta corresponde à ausência das mesmas (0,0,0) [?]. Apesar do formato de imagem RGB mais utilizado empregar Color Depth 2 de 24 bits, é possível acrescentar um canal a mais neste sistema (de 8 bits, como os demais), criando-se assim o formato RGB com Color Depth de 32 bits. Este canal adicional não é usado para representar cores, mas para informar o grau de opacidade e transparência que o pixel deve ter quando a imagem ao qual ele pertence é sobreposta à outra imagem. O sistema recebe o nome de RGBA, onde o A representa o nome deste canal adicional, o qual é denominado de Canal Alfa ou Alpha Channel. 2 Em português, profundidade de cor, corresponde ao parâmetro que determina quantos bits são necessários para representar cores distintas. RITA Volume VIII Número 1 2001 3

2.2 Canal Alfa O Canal Alfa permite dar forma e transparência a elementos de uma imagem associando os conceitos de cor e opacidade. A imagem passa a ser tratada como um conjunto de quatro informações: vermelho, verde, azul e opacidade (R;G;B;α) [?]. Para uma imagem descrita com 8 bits por componente de cor, o Canal Alfa também apresenta 8 bits, que resultará em uma imagem com 32 bits por pixel. O pixel α assumindo o valor 0 é completamente transparente e com 255, completamente opaco. As cores intermediárias indicam transparência parcial [?]. A fórmula para composição pode ser reescrita em função do Canal Alfa, e a imagem final é obtida por h = αf (255 α)g + 255 255 (1) onde o pixel f representa o primeiro plano, o pixel g o plano de fundo, α tem valor 0 quando o pixel da imagem é totalmente transparente e α é 255 quando o pixel é opaco, os valores intermediários representam o percentual de contribuição de cor de cada imagem para o pixel, na composição final. Para compor duas imagens, onde cada pixel da imagem f 1 tem a representação de cor e seu Canal Alfa c 1 = (r 1 ; g 1 ; b 1 ; α 1 ) e da imagem f 2 em c 2 = (r 2 ; g 2 ; b 2 ; α 2 ). Onde o pixel final será c f = (r f ; g f ; b f ; α f ), podendo-se escrever c f = c 1 op c 2, onde op é um operador de composição que vai definir formas distintas de compor as imagens. O operador over, por exemplo, faz a imagem do primeiro plano sobrepor-se à imagem de fundo. O operador inside faz a imagem f 2 agir como uma máscara para f 1, e f 1 mostra somente a área onde é visível em f 2. Esses operadores descrevem operações variadas não comutativas e são designadas Alpha Blending. Os detalhes dessas operações encontram-se em [?]. 2.3 O que é Chroma Key O chroma key consiste em uma técnica de efeito visual com o objetivo de realizar a substituição da cor do plano de fundo de uma imagem por outra imagem ou vídeo. Essa técnica tem sido bastante utilizada na televisão, como por exemplo, na previsão do tempo em telejornais e em gravações de cenas de telenovelas, e no cinema em cenas com efeitos especiais que necessitam de tratamento computacional. A cor utilizada como plano de fundo deve ser padrão, sendo o azul e o verde as mais empregadas. A cor azul é mais utilizada por ser mais distante do tom da pele [?], o que 4 RITA Volume VIII Número 1 2001

simplifica o processo de identificação do plano de fundo. Porém, em alguns casos a cor verde pode ser preferida, devido ao fato de diversas câmeras digitais reterem mais detalhes no canal de cor verde, além deste necessitar de menos luz do que o canal azul [?]. Em técnicas comuns para a composição de imagem digital, um elemento de primeiro plano é extraído de uma imagem de fundo B, estimando uma cor F e opacidade α para o objeto em primeiro plano para cada pixel. O valor de α (entre 0 e 255) descreve a transparência do elemento do primeiro plano, bem como o desfoque de movimento e cobertura parcial de um pixel do plano de fundo em torno do contorno dos objetos em primeiro plano. Este processo é resumido pela equação 1 da composição clássica introduzida em [?]. Uma das desvantagens conhecidas é a questão da movimentação, o ator que faz parte da cena do primeiro plano não pode fazer movimentos bruscos, pois isso pode causar o problema de blue-spill, ou derramamento de azul, que consiste na contaminação da cor do objeto em primeiro plano pela cor de fundo [?]. Outra desvantagem é a questão da luminosidade, dependendo da sombra ou reflexo que for formada, a identificação da cor azul se torna um problema, causando variações na imagem composta. 2.4 OpenCV O OpenCV é uma biblioteca open source de visão computacional escrita em C e C++ que roda nas plataformas Linux, Windows e Mac OS X. Há desenvolvimento ativo em interfaces para Python, Ruby, Matlab e outras linguagens. Ele é projetado para eficiência computacional e com um foco em aplicações de tempo real. A biblioteca contém mais de 500 funções que abragem muitas áreas, como, calibração de câmera, robótica, segurança entre outras. Essas e outras informações estão disponíveis em [?]. Por ter o licenciamento livre, há uma diversificada comunidade que a utilizam, dentre elas pessoas de grandes empresas (IBM, Microsoft, Intel, Sony e Google) e centros de pesquisas (Stanford, MIT, Cambridge). É possível encontrar fóruns de discussões 3, no qual usuários postam perguntas e tiram suas dúvidas. Ele é popular em todo o mundo, com grandes usuários na China, Japão, Rússia, Europa e Israel [?]. Neste trabalho ele foi utilizado, disponível on-line 4, integrado ao IDE DEVC++, pois possibilita o processamento de imagens em tempo real, consistindo em uma abordagem apropriada para este trabalho, pois, a utilização da webcam permite a visualização da interação do objeto com o plano de fundo. Além disso, foi utilizada a linguagem C, que tem como características a rapidez e a flexibilidade, apresentando-se como boa alternativa para a manipulação de imagens em tempo real. 3 http://groups.yahoo.com/group/opencv 4 http://opencv.willowgarage.com/wiki/ RITA Volume VIII Número 1 2001 5

3 Trabalhos Relacionados Nesta seção é apresentada o estado da arte dos métodos chroma key e dos fundos azuis. O emprego dessas técnicas se encontra difundida nos meios de televisão através da produção de vídeos sobre a previsão do tempo, programas de entretenimento, cenas de novelas que requerem os efeitos visuais obtidos através dessa técnica, já no cinema, quando se deseja fazer a cena de explosões, em ambiente fictícios, em cenas onde os atores não podem estar no local da gravação ou mesmo quando o ambiente é gerado por computador. No entanto, são necessárias melhorias nos aspectos relacionados a iluminação e a movimentação. Em 1964, Vlahos teve seu trabalho sobre composição de imagens patenteado, podendo ser considerado um dos primórdios desta técnica. Neste trabalho foi proposto a substituição da técnica de composição conhecida como retroprojeção, que consiste em projetar o primeiro plano em uma tela, na qual o plano de fundo era executado. O resultado da composição apresentava problemas como perda de definição, a dessaturação da cor e o tamanho limitado das telas de projeção. Como solução desses problemas Vlahos propôs a utilização de mattes, que constituem em contornos com partes opacas que cobriam a parte do primeiro plano onde a porção referente ao fundo era praticamente transparente [?]. Posteriormente em 1971, Vlahos pantenteou outro trabalho intitulado Eletronic Composite Photography. Nesse trabalho é utilizado uma técnica eletrônica para o registro do primeiro plano e do segundo plano isoladamente, que depois são combinados para geração de uma cena composta pela sobreposição dos objetos do primeiro plano sobre os objetos do plano de fundo. Tal método permite que os objetos do plano de fundo pudessem ser vistos de forma bem mais realista através do primeiro plano, que era parcialmente ou totalmente transparente [?]. Em 1977, Vlahos patenteou outro trabalho que apresenta melhorias ao trabalho publicado em 1971. Nesse trabalho, a cena do primeiro plano é primeiramente registrada com a incidência de uma luz de suporte em uma cor definida, sendo geralmente utilizada as cores primárias. Os objetos localizados em primeiro plano são diferenciados dos objetos em plano de fundo pela discriminação da cor primária utilizada [?]. [?] apresentam uma abordagem baseada no método proposto por [?]. A técnica utiliza métodos matemáticos para a representação da composição de imagens através do seguinte modelo: uma imagem localizada no primeiro plano e uma cor de apoio (plano de fundo) são linearmente combinados utilizando o canal alfa na imagem desejada para a realização da composição. [?] apresenta uma abordagem geométrica para composição de fundo azul. Essa técnica utiliza o espaço RGB (Red, Green, Blue) como base, nesse espaço são desenhados dois poliedros, de modo que os mesmos ficam centralizados no valor médio do plano de fundo B, 6 RITA Volume VIII Número 1 2001

isso faz com que se tenha pixels do primeiro plano dentro de um poliedro e os pixels do plano de fundo ficam dentro do outro. [?] propôs uma abordagem com um framework que utiliza algoritmos de visão computacional para o tratamento do plano de fundo utilizando as seguintes variáveis: cálculo do fluxo ótico, estimativa do plano de fundo e técnicas naturais para composição de imagens. Em outro trabalho é utilizado a técnica de iluminação mútua descrita por [?]. Segundo esta técnica os objetos em primeiro plano sofrem influência tanto das fontes de luz quanto de outros objetos presentes no ambiente. A iluminação no objeto é a soma da iluminação resultante da fonte de luz com a iluminação resultante de luz refletida fora do plano de fundo [?]. [?] utilizam Graphics Processing Unit (GPU) para obter melhores resultados na composição das imagens. As GPUs consistem em ótimas soluções para aplicações que necessitam de grandes bandas de dados e da realização de altas taxas de cálculos aritméticos. O algoritmo é composto das seguintes etapas: carregar imagem na GPU, selecionar uma subamostra da imagem, colocar a composição com o chroma key e dilatá-la. Posteriormente, realiza-se a correção na iluminação das cores dos objetos em primeiro plano, a separação do filtro de Gauss, composição do primeiro plano com o plano de fundo e a recuperação da imagem. 4 Abordagem Proposta Propomos um algoritmo que monta uma imagem de saída com os pixels da imagem de fundo correspondente aos pixels azuis da imagem de entrada, além de obter os pixels não azuis da imagem de entrada. É importante ressaltar que este algoritmo não foi baseado em nenhum algoritmo clássico, mas realiza a mesma função. Na subseção 4.1 é apresentado o algoritmo proposto. RITA Volume VIII Número 1 2001 7

4.1 Algoritmo Código 1 Algoritmo carregaimagem ( imagem_entrada ) carregaimagem ( imagem_fundo ) p e r c o r r a imagem_entrada v a r i a n d o i, j rgb < imagem_entrada ( i, j ) vermelho < rgb ( 1 ) v e r d e < rgb ( 2 ) a z u l < rgb ( 3 ) SE ( ( a z u l vermelho ) > v a l o r _ l i m i t e E ( a z u l v e r d e ) > v a l o r _ l i m i t e ) ENTAO imagem_saida ( i, j ) = imagem_fundo ( i, j ) SENAO imagem_saida ( i, j )< imagem_entrada ( i, j ) FIMSENAO O algoritmo 1 funciona da seguinte maneira: para imagens estáticas é carregado uma imagem de fundo e obtido os frames da webcam (a imagem de entrada), após isso é percorrida a matriz de pixels da imagem de entrada, para cada pixel é armazenado os valores dos canais vermelho, verde e azul em suas respectivas variáveis. Em seguida é verificado se o resultado da subtração entre o valor do canal azul pelo canal vermelho é maior do que o valor limite, também é verificado se o resultado entre a subtração do valor do canal azul pelo valor do canal verde é maior do que o valor limite. Caso essa condição seja verdadeira, o pixel da imagem de saída na posição (i, j) recebe o pixel da imagem de fundo na posição (i, j). Caso ela seja falsa, a imagem de saída na posição (i, j) recebe o pixel da imagem de entrada na posição (i, j). 8 RITA Volume VIII Número 1 2001

Já na manipulação de imagens dinâmicas, o algoritmo aplicado é o mesmo, o que difere nas duas aplicações é o tipo de imagem de fundo, sendo nas dinâmicas, vídeos, quebrados em frames. O valor da variável valor_limite tem que ser ajustada conforme a iluminação do ambiente, pois esta modifica a tonalidade da cor azul da imagem de entrada. Neste trabalho foi atribuído o valor 30 à variável valor_limite, conforme o ambiente de gravação das imagens de entrada, apresentando bons resultados, como será mostrado na seção 5. Foi verificado durante o desenvolvimento do trabalho que os pixels de tons mais claros da imagem de entrada estavam sendo substituídos pelos pixels da imagem de fundo, isso acontece porque nesses tons o valor do canal azul é maior do que os valores dos canais verde e vermelho. Então foi observado que o resultado da diferença do valor do canal azul pelo valor do canal vermelho e o resultado da diferença do valor do canal azul pelo valor do canal verde é pequeno, nesse caso menor do que 30. Uma observação que deve-se fazer é que as imagens de entrada e de fundo devem ter a mesma resolução, pois se uma for maior que a outra, o algoritmo pode tentar obter um pixel em espaço vazio, resultado em erros, ou não mostrar a imagem de fundo completamente na imagem de saída. O algoritmo apresentado, difere-se dos algoritmos clássicos, por não usar uma variável dedicada ao cálculo da transparência, utiliza-se somente a substituição do pixel azul da imagem de entrada pelo pixel correspondente da imagem de fundo, substitui-se diretamente no pixel. Outra diferença é a ausência da necessidade que o fundo possua uma cor uniforme, o algoritmo apresentado trabalha com vários tons de azul. 5 Resultados A técnica é aplicada em dois contextos: um utilizando como imagem de fundo imagens estáticas e outra aplicando a abordagem com fundos dinâmicos (vídeos existentes). A aplicação demonstrou. A seguir, são apresentados na tabela 1, os principais pontos da caracterização da aplicabilidade da abordagem proposta. RITA Volume VIII Número 1 2001 9

Tabela 1. Síntese das características e comentários dos experimentos realizados Características Recursos Dificuldades Imagens utilizadas como plano de fundo Comentário A realização dos experimentos ocorreram nas dependências da universidade sem a utilização de iluminação artificial. O tecido utilizado como plano de fundo foi o TNT (tecido não tecido) na cor azul royal. Na primeira etapa do experimento para composição de imagens estáticas utilizou-se webcam com resolução de 1.2 megapixels integrada ao notebook. Posteriormente, utilizou-se uma câmera digital com resolução de 10 megapixels para composição com fundo dinâmico. O algoritmo necessita ser configurado para composição da imagem final conforme o ambiente utilizado para realização do experimento. Outra dificuldade encontrada foi o tratamento de movimentos bruscos. As imagens utilizadas como plano de fundo estático e dinâmico foram retiradas da internet, em sites como o Google e YouTube. A princípio foram utilizados recursos e ambientes não apropriados para um experimento qualificativo. A maior dificuldade no desenvolvimento deste trabalho foi a limitação de recursos financeiros para adquirir materiais apropriados, por exemplo, o tecido adquirido não é considerado adequado. Contudo obtiveram-se resultados satisfatórios, apresentados nas subseções seguintes. 5.1 Resultados com fundos estáticos Nesta seção é apresentado os resultados obtidos e destaca os aspectos acima citados, como recursos, ambiente, imagens, entre outros. É importante ressaltar que os resultados com imagens estáticas, foram obtidos a partir de uma webcam, gerando o vídeo final em tempo real. 10 RITA Volume VIII Número 1 2001

(a) Fundo Estático (b) Resultado Final Figura 1. Aplicando-se a abordagem com uma imagem estática, a aluna faz uma interação com um fundo estático, definido pela tabela de um campeonato esportivo, primeiramente foi definido a imagem que seria o fundo, fazendo a montagem da tabela sobre uma imagem já existente de um cenário, que pode ser visualizado na figura 1.a. A gravação foi realizada em um ambiente sem luz adequada, presente nela, somente a luz fluorescente disponivel na sala, após a preparação do ambiente e o posicionamento da câmera, realizou-se a gravação deste exemplo. Uma dificuldade encontrada na produção desse vídeo, foi o problema de apontar para a localização exata dos times na tabela, a figura 1.b, mostra o resultado final desse experimento. Um outro exemplo com imagens estáticas, pode-se ver na figura 2, aqui foi simulada uma mágica, onde uma cabeça era levitada e movimentada com gestos. O ambiente de gravação, foi o mesmo do exemplo acima, a aluna era envolvida pelo pano azul, deixando somente a cabeça de fora, e assim executado e gravado a magia, não se obteve muitas dificudades na elaboração deste vídeo. A imagem de fundo pode ser vista na figura 2.a e o resultado final na figura 2.b. RITA Volume VIII Número 1 2001 11

(a) 1 Fundo estático (b) 2 Imagem gerada a partir do algoritmo Figura 2. Para dar a ilusão de que uma aluna e seu cachorro estarem sentados na neve, gerando uma interação maior com o cenário virtual, foi produzido este terceiro exemplo, aqui algumas cadeiras foram revestidas com pano azul, para dar a impressão de estarem realmente sentados na neve, figura 3.b. (a) 1 Fundo estático (b) 2 Imagem gerada a partir do algoritmo Figura 3. Na figura 4, percebe-se que há uma transformação de imagem na perna do aluno devido ao tom de azul da calça estar provavelmente muito próximas das faixas de valores definidas no algoritmo. A produção deste exemplo foi semelhante ao do terceiro, apresentado anteriormente, o aluno sentado em cadeiras revestidas com pano azul. 12 RITA Volume VIII Número 1 2001

(a) 1 Fundo estático (b) 2 Imagem gerada a partir do algoritmo Figura 4. Um fator expressivo seria que, na produção de filmes com fundos estáticos, como forma de retorno o ator pode se ver na tela do computador o qual está instalado a webcam e interage com a filmagem em tempo real. Isso se explica pelo fato da gravação ser um recurso utilizado da webcam. Outro característica de suma importância que pode ser verificado em cada resultado final é que, com relação ao fundo estático obtido há uma perda perceptível na qualidade da imagem após a compilação do algoritmo com a imagem. Isso se explica pelo fato de que a webcam utilizada em questão ter uma resolução 480x320 pixels, ou seja, as imagens obtidas maiores que a resolução da câmera deve ser compridas para não haver cortes na produção, consequentemente há uma perda de qualidade da imagem. Vários experimentos diferentes foram produzidos, na realização de uma busca pela faixa de valores ideal para transformação do canal alpha, além da intenção da criação de filmes com criatividade, respeitando os limites que a abordagem tem. 5.2 Resultados com fundos dinâmicos Denomina-se imagens com fundos dinâmicos, os vídeos produzidos em que o fundo não é somente uma imagem estática, mas sim ou segundo vídeo, os resultados podem ser melhores vistos nos vídeos gerados. Faz-se uso do mesmo algoritmo das imagens estáticas, com uma única diferença, são carregados vídeos para compor o fundo, em seguida são separados em frames. Após essa separação, os frames são integrados ao plano de fundo pelo canal alfa para produção de vídeos com imagens dinâmicas. Ao contrário das imagens da abordagem com imagens estáticas, aqui não se utiliza a webcam para geração das imagens em tempo real. Primeiramente são gravados os vídeos e posteriormente são compostos com o primeiro plano utilizando o algoritmo anteriormente RITA Volume VIII Número 1 2001 13

mostrado. As imagens foram feitas com uma câmera comum com resulução de 320x240 pixels, menores do que a da webcam. Para uma melhor compreensão do que se foi feito, obtemos as seguintes imagens de projetos e de produtos finais de cada utilização. (a) Fundo dinâmico (b) Ambiente a ser transformado (c) Resultado final Figura 5. Pode-se observar no exemplo da figura 5, onde a figura 5.a, representa o fundo dinâmico, inicialmente, um vídeo de um aluno tocando e cantando, que quebrado em frames para logo em seguida ser composto juntamente com a figura 5.b, o ambiente onde ocorre as transformações do azul no canal alfa, e como resultado final obtém a 5.c composta pelo fundo dinâmico em junção com o ambiente transformado. Neste vídeo houve nenhuma dificuldade em produzí-lo, visto que somente houve a junção dos dois vídeos. O vídeo produzido pode ser visualizado no link. Cada aluno realizou uma composição diferente, no objetivo de conseguir vários cená- 14 RITA Volume VIII Número 1 2001

rios distintos para verificação das limitações da técnica. Por exemplo, tem-se na criação de filmes com mais de um personagem sem os dois estarem presentes nas cenas, ou até mesmo dois atores serem a mesma pessoa como no caso das figuras 5.a, 5.b e 5.c. Em torno da finalidade de um personagem estar na mesma cena duas vezes, foi produzido então um filme onde tentamos alcançar a interatividade do personagem com ele mesmo, figuras 6.a, 6.b e 6.c. Este exemplo, que sem dúvida foi o mais trabalhoso dos aqui apresentados, pois necessitava de um maior sincronísmo e distâncias onde a pessoa do lado direito não sobreposse o da direita, para dar a impressão de que o mesmo ator contracenasse com si mesmo, foram gravados vários vídeos até a versão final. Um truque que é possível notar nas figuras é o pano no centro da imagem, usado para marcação do limite em que a aluna poderia esticar o braço, um aluno estava escondido segurando o mesmo. (a) d) Lado Esquerdo (b) Lado Direito (c) Interação Virtual Figura 6. Nas figuras 7.a, 7.b e 7c, o ator contracena com o fundo, participando de uma suposta corrida, também não houve muita dificuldade para gerar o vídeo final. O resultado está à disposição no link: LINK. RITA Volume VIII Número 1 2001 15

(a) Fundo dinâmico (b) Ambiente a ser transformado (c) Resultado final Figura 7. Um dos experimentos de maior produção é demonstrado a seguir pela figura 8. Nesse experimento, os alunos tiveram a ideia de interagir com um filme já existente de forma a ser um coadjuvante do filme em questão. A cena proposta pela imagem 8.a foi retirada do filme Os Smurfs, da distribuidora Sony Pictures, dirigido por Raja Gosnell, no ano de 2011. Além da forma de que o aluno sai entre os planos de fundo, como pode ser visualizado na figura 8.b, na intenção de dar sensação de estar por atrás de um objeto da cena utilizada. A produção final pode ser visualizada no site: LINK. 16 RITA Volume VIII Número 1 2001

(a) Fundo dinâmico (b) Ambiente a ser transformado (c) Resultado final Figura 8. Um aspecto muito relevante é a perda de qualidade dos fundos utilizados tanto na abordagem com imagens estáticas quanto com imagens dinâmicas. No primeiro uso da abordagem, caso de fundos estáticos, há uma grande perda de qualidade já explicada anteriormente no resultado final com relação ao fundo utilizado. Porém, quando se aborda com fundos dinâmicos, não há perda de qualidade, pois não é necessário nenhum tipo de alteração do fundo dinâmico, fator relevante na abordagem, que diferencia nossa abordagem quando comparadas com outras abordagens existentes. 6 Conclusão Neste trabalho foi apresentada a evolução da técnica de Chroma Key pela pesquisa do estado do arte e a compreensão de conceitos importantes para sua melhor entendimento. Essa pesquisa é importante para permitir mostrar o diferencial do algoritmo desenvolvido em relação aqueles baseados em abordagens clássicas. O algoritmo proposto mais compreensível e simples de ser implementado. Não é RITA Volume VIII Número 1 2001 17

necessário uma variável exclusiva para o cálculo da transparência, a composição é realizada por meio da identificação do valor RGB de cada pixel da imagem de primeiro plano e em seguida se compara com um valor limite definido manualmente para assim ter o resultado. O valor limite é configurado de acordo com a iluminação do ambiente porque isso influência diretamente no resultado. Essa configuração em outras técnicas é realizada pelo próprio algoritmo que identifica o ambiente e configura as variáveis. Conclui-se portanto que o novo algoritmo proposto, mesmo com recurso escassos obteve resultados satisfatórios, como a não utilização de um padrão específico de azul, e sim uma variação em uma determinada faixa da cor, ressaltando que por esse motivo, as sombras formadas pelas dobras do tecido azul utilizado, não interferem substancialmente no resultado final do produto. Para trabalhos futuros pretende-se utilizar a técnica desenvolvida em uma abordagem lúdica para tornar a aprendizagem em sala de aula mais atrativa. Elas geralmente são caracterizadas como ambientes poucos atrativos porque o profissional responsável geralmente restringe à utilizar métodos como, quadro negro e o livro didático, esquecendo de utilizar recursos tecnologicos presentes no cotidiano dos seus alunos como os computadores e os celulares. A utilização do Chroma key e as telas azuis pode ser uma solução para esse problema. Por exemplo, um professor de biologia utilizando essa técnica para projetar o sistema esquelético no corpo de um aluno, apesar do conceito lúdico estar relacionado a brincadeiras e o jogos, pode-se dizer essa nova forma utilização permite tornar uma aula mais divertida para aluno. 18 RITA Volume VIII Número 1 2001