2. O que é Redundância de código ou informação? Como a compressão Huffman utiliza isso? Você conhece algum formato de imagem que a utiliza?(1.



Documentos relacionados
Compressão de Imagens

Compressão com perdas

Codificação/Compressão de Vídeo. Tópico: Vídeo (Codificação + Compressão)

Thales Trigo. Formatos de arquivos digitais

Introdução à Tecnologia Web HTML HyperText Markup Language XHTML extensible HyperText Markup Language Formatos de Imagens

ESTRUTURAS DE DADOS II

Nenhum dado é perdido durante o processo de compressão. Preserva todas as informações que permitirão a reconstrução exata da imagem. Reversível.

APLICATIVOS GRÁFICOS (AULA 4)

Processamento de Imagem. Prof. MSc. André Yoshimi Kusumoto

3 Classificação Resumo do algoritmo proposto

Colorindo com Números Representação de Imagens

Atividade: matrizes e imagens digitais

Imagem digital. Unidade 3

Universidade Federal de Alagoas Instituto de Matemática. Imagem. Prof. Thales Vieira

4 Segmentação Algoritmo proposto

ferramentas da imagem digital

Informática Aplicada a Radiologia

Filtragem. pixel. perfil de linha. Coluna de pixels. Imagem. Linha. Primeiro pixel na linha

Formatos de Imagem PNG. Universidade Federal de Minas Gerais. Bruno Xavier da Silva. Guilherme de Castro Leite. Leonel Fonseca Ivo

COMPUTAÇÃO GRÁFICA RESOLUÇÃO

ATENÇÃO: * Arquivos com tamanho superior a 500 KB NÃO SERÃO ACEITOS * SOMENTE serão aceitos documentos do formato: PDF

Conversores D/A e A/D

DO ANALÓGICO AO DIGITAL: CONCEITOS E

Trabalho 2 Fundamentos de computação Gráfica

Utilização do Sistema Multimédia. 2. Formatos de ficheiros 2.1. Compressão 2.2. Formatos mais comuns 2.3 Captura de imagens. 2. Formatos de ficheiros

Padrões ITU-T H.261 e H.263

Admistração de Redes de Computadores (ARC)

Informática. Prof. Macêdo Firmino. Macêdo Firmino (IFRN) Informática Setembro de / 16

Figura 1: Formato matricial de uma imagem retangular. Figura 2: Ampliação dos pixels de uma imagem

Aula 2 Aquisição de Imagens

Fotografia Digital Obtenção da Imagem e Impressão

COMPRESSÃO DE DADOS MULTIMÍDIA

Universidade Federal de Goiás Instituto de Informática Processamento Digital de Imagens

Técnicas de Cartografia Digital

APLICATIVOS GRÁFICOS (AULA 3)

Chow&Kaneko buscam as modas da imagem para separar os objetos. Admite que os tons na vizinhança de cada moda são do mesmo objeto.

RAID. Propõe o aumento da confiabilidade e desempenho do armazenamento em disco. RAID (Redundant Array of Independent Disks )

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

Matemática Financeira II

Universidade Federal do Rio de Janeiro - IM/DCC & NCE

H.264: UMA BREVE DISCUSSÃO ACERCA DA CODIFICAÇÃO DE VÍDEO

Clip-art Retrieval using Sketches PTDC/EIA-EIA/108077/2008

Departamento de Matemática - UEL Ulysses Sodré. Arquivo: minimaxi.tex - Londrina-PR, 29 de Junho de 2010.

Aula de Hoje. Sistemas e Sinais Sinais e Sistemas. Sinal em Tempo Contínuo. Sinal Acústico

Aquisição e Representação da Imagem Digital

O que é RAID? Tipos de RAID:

Respostas do Estudo Dirigido do Capítulo 14 Classical pattern recognition and image matching"

Classificação da imagem (ou reconhecimento de padrões): objectivos Métodos de reconhecimento de padrões

Formatos Imagem. Apontamentos CG + Edward Angel, Sec Instituto Superior Técnico Computação Gráfica 2009/2010

)LJXUD8PGRVSDUHV'SDUDFRQYROXomRTXHWHPRPHVPRHIHLWRGR NHUQHOGD)LJXUD

5 Equacionando os problemas

UFGD FCA PROF. OMAR DANIEL BLOCO 6 CLASSIFICAÇÃO DE IMAGENS

Correlação e Regressão Linear

a 1 x a n x n = b,

CorelDRAW UM PROGRAMA DE DESIGN

FILTRAGEM NO DOMÍNIO DAS FREQUÊNCIAS (TRANSFORMADA DE FOURIER) Daniel C. Zanotta 04/06/2015

Fotografia digital. Aspectos técnicos

Sistemas e Conteúdos Multimédia Imagem. Nuno Miguel Gil Fonseca nuno.fonseca@estgoh.ipc.pt

SEGMENTAÇÃO DE IMAGENS EM PLACAS AUTOMOTIVAS

FORMATOS DE ARQUIVOS FORMATOS DE ARQUIVOS NATIVOS FORMATOS DE ARQUIVOS GENÉRICOS. Produção Gráfica 2 A R Q U I V O S D I G I T A I S -

Sistema de Numeração e Conversão entre Sistemas. Prof. Rômulo Calado Pantaleão Camara. Carga Horária: 60h

Tópicos Especiais em Informática

Função. Definição formal: Considere dois conjuntos: o conjunto X com elementos x e o conjunto Y com elementos y. Isto é:

Figure 2 - Nós folhas de uma árvore binária representando caracteres ASCII

Redução de imagem no domínio espacial

Processamento de Imagem. Representação, Armazenamento e Formato de imagens Professora Sheila Cáceres

Quais as diferenças entre os formatos de imagem PNG, JPG, GIF, SVG e BMP?

PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO DEPARTAMENTO DE INFORMÁTICA PÓS GRADUAÇÃO EM INFORMÁTICA

Aula 3 - Registro de Imagem

Processamento de histogramas

Trabalho Prático n. 2

Setores Trilhas. Espaço entre setores Espaço entre trilhas

Programação em papel quadriculado

Simetria de Figuras Planas e Espaciais

Manual Sistema MLBC. Manual do Sistema do Módulo Administrativo

Ciências da Computação Disciplina:Computação Gráfica

29/08/2011. Radiologia Digital. Princípios Físicos da Imagem Digital 1. Mapeamento não-linear. Unidade de Aprendizagem Radiológica

Análise de Algoritmos: Melhor caso, pior caso, caso médio

Representação de Informação -- Texto -- Representação de Informação. Representação de Caracteres

Tratamento da Imagem Transformações (cont.)

UNIVERSIDADE CATÓLICA DE PETRÓPOLIS CENTRO DE ENGENHARIA E COMPUTAÇÃO

Você pode dizer isso de novo! Compressão de Texto

Projeção ortográfica de modelos com elementos paralelos e oblíquos

Manual Processamento de Imagem. João L. Vilaça

VCA Treinamento em Algoritmo

Fundamentos de Imagens Digitais. Aquisição e Digitalização de Imagens. Aquisição e Digitalização de Imagens. Aquisição e Digitalização de Imagens

Módulo 4. Construindo uma solução OLAP

PLANO DE ESTUDOS DE MATEMÁTICA 8.º ANO

Análise e Complexidade de Algoritmos

SUMÁRIO 1. AULA 6 ENDEREÇAMENTO IP:... 2

Título: Sistemas Lineares no CAp UFRJ: Interpretações Algébrica e Gráfica

COMPUTAÇÃO GRÁFICA REPRESENTAÇÃO DE IMAGENS

SESSÃO 5: DECLINAÇÃO SOLAR AO LONGO DO ANO

Métodos Matemáticos para Gestão da Informação

Cotagens especiais. Você já aprendeu a interpretar cotas básicas

ANÁLISE E IMPLEMENTAÇÃO DE ALGORITMOS DE COMPRESSÃO DE DADOS. Maria Carolina de Souza Santos 1 Orientador: Prof.º Ms.

RAID Redundat Arrays of Inexpensive Disks

Criminalidade. Luciano Nakabashi Juliano Condi

Miguel Nascimento Nº TIM LTM 12 Janeiro 2011

Transcrição:

Respostas do Estudo Dirigido Cap. 26 - Reducing the information:... ou Image Compression 1. Para que serve comprimir as imagens? Que aspectos estão sendo considerados quando se fala de: Compression Rate, Lossy Compression, Lossless Compression, Simetria e Assimetria (1.0) Compressão torna mais eficiente a transmissão e armazenamento dos arquivos de imagens e vídeos. Compression rate ou Bit rate - é a relação entre o tamanho do arquivo antes e depois da compressão. A unidade usual é o número de bits por pixel que a imagem pode ser representada depois de comprimida. Assim se um arquivo de imagem em 256 tons de cinza for representado com uma taxa sem compressão de 1 byte por pixel, ele teria um bit rate de 8 bits por pixel. Se ele for comprimido ficando 50% menor, seu bit rate deve ter ficado em 4 bits por pixel. Lossy compression - é o tipo de compressão em que alguma perda é tolerada ou admissível. Sendo o oposto de Lossless compression, que é uma compressão sem perdas. Por exemplo se você quer identificar um conjunto de produtos por fotos em um site, perdas são admissíveis na armazenagem do banco de imagem deste site e você pode usar um formato com perdas como o JPEG. Mas se quer fazer o controle de qualidade de um tecido, as perdas podem mascarar os resultados bons ou ruins e perdas não podem ser toleradas antes da análise. Simetria ou assimetria estão relacionadas a diferença do tempo de codificação e decodificação e sua admissibilidade na aplicação. Assim uma técnica simétrica se refere ao tempo de compressão e descompressão ser praticamente o mesmo. Exemplo de técnicas simétricas seriam as baseadas em DCT, como o JPEG. O MPEG e a fractal são assimétricas. As técnica simétrica usam algoritmos de praticamente mesma complexidade computacional na codificação e decodificação. A compressão fractal é a mais assimétrica entre as usadas atualmente pois requer muito tempo de busca dos pares ótimos de similaridade. Já uma aplicação assimétrica seria uma em que pode ter tempo de compressão muito maior que o descompressão, exemplo desta são os processos de gravação em CD-Rom, ou constituição da população de um banco de dados. A maioria das aplicação precisam de simetria 2. O que é Redundância de código ou informação? Como a compressão Huffman utiliza isso? Você conhece algum formato de imagem que a utiliza?(1.0) Redundância se refere principalmente ao fato de que sempre que se usar tamanho de código constante muito do espaço é perdido em zeros. Por exemplo com o uso de um byte para representar qualquer tom de cinza, nos tons zero e um, 7 bits são perdidos com zeros. Se estes forem os tons predominantes na imagem, muito espaço desnecessário é perdido em zeros. A compressão Huffman usa uma estatística sobre o tipo de coisa a ser codificada de modo a associar o valor que aparecer mais ao zero, o segundo que mais aparecer ao um e assim sucessivamente. Depois é considerado um código de tamanho variável e unicamente decoficável. O formato TIFF permite sua utilização dependendo do tipo de imagens usado. Por exemplo o TIFF nos faxes associa linhas em branco ao zero. O JEPG também a usa em uma de suas etapas.

3. O que significa codificação RLE? Que formatos de arquivos de imagem que o utilizam? (0.5) Run Length Encoding é uma das formas mais simples de compressão de imagens sem perdas. Nela é descrito o número de pixels consecutivos de mesmo código. Por exemplo em uma imagem onde há 20 pixels do tons 240, ao invés de codificar: 240 240..., isto é 20 vezes o código da cor, é descrito de alguma forma que há 20 pixels da cor 240. Esta técnica é uma das mais freqüentes em formatos de imagens sem perda. É usada no formato PCX e BMP e aplicável principalmente a desenho onde há pouca variação dos tons de grandes áreas. Em imagens fotográficas (sem posterização) e do mundo real cada pixel tem valor diferente do seguinte de modo que quase não há vantagens em sua utilização. 4. Fale de algumas características dos chamados "Predictive coding". (0.5) Estes também exploram a redundância ou similaridade entre pixels adjacentes. É principalmente usado na codificação entre frames em videos e movies. 5. Porque em imagens a codificação com perdas é possível de ser usada? Em que casos não pode ser usada? Como o erro do processo pode ser medido? (1.0) A codificação com perdas é possível de ser usada principalmente pelo fato que para o visualizador humano é impossível ver sem reconhecer/interpretar a cena e que mesmo suprimindo diferentes níveis de detalhes uma cena reconhecida é interpretada de mesma maneira quanto for suprimindo alguns detalhes em diferentes níveis. Pode ser usada sempre que o detalhe não for a coisa principal buscada na imagem e até um nível em que a perda da qualidade não deixar desconfortável o visualizador. Pelo fato que só a taxa de compressão (bit rate) e o tempo do processo não medem a qualidade da imagem resultante para o visualizador humano, que devem ser medido os erros resultantes do processo. Os erros podem e devem ser avaliados, para uma melhor qualificação das técnicas usadas, de forma qualitativas ou quantitativas. As formas qualitativas se baseiam nas diferenças entre as imagens antes da compressão e depois de comprimidas e restauradas. Neste caso é gerada uma outra imagem por diferenças entre as imagens (cada pixel delas) antes da compressão e depois, que permite ver em que regiões os erros são maiores e mais freqüentes. Nesta imagem do erro é muito importante usar escalas amplificadoras para que essas diferenças possam ser vistas adequadamente. A figura abaixo mostra a imagem Lena antes e depois da compressão Fractal, e duas formas de avaliar qualitativamente onde ocorreram as perdas. Na terceira coluna é usada a expressão : 5. e(x, y) e na quarta 5. e(x, y) / 2 + 127, onde e(x,y) = ( F(x,y) - A(x,y) ), F é a imagem final e A a imagem antes do processo.

As formas de quantificar os erros geram números ou erros médio entre as imagens antes e depois. O mais comum é o erro médio quadrático, que faz um somatório entre a diferença de cada pixel das imagens elevado ao quadrado, depois desse número é extraída a raiz quadrada e divide-se, para ter uma média, pelo número de pixels somados. Mas outros quantificações de erros comuns são a relação sinal ruído e a relação sinal ruído de pico. Nos erros médios quanto maior o erro pior a imagem, nas relações quanto maior o índice melhor a imagem. Estas expressão são: e(x,y) = ( F(x,y) - A(x,y) ) e rms = 1/N 2 ( Σ x=i N Σ y=i N [ e(x,y) ] 2 ) 0.5 SNR rms = 1/N 2 Σ x=i N Σ y=i N [ A(x,y) ] 2 / Σ x=i N Σ y=i N [ e(x,y) ] 2 PSNR = 20 log 10 [( 2 p 1 ) / e rms ] 6. O que são "blocking artefacts" e porque eles podem ser tão freqüentes nos codificações que usam DCT ou Transformadas Discretas de Cosenos? (0.5) Diversas técnicas de compressão partem de uma etapa inicial em que a imagem a ser comprimida é dividida em blocos que são analisados/comprimidos em paralelos, ou seja a imagem a ser comprimida é blocada. Os blocos são sempre de mesmo tamanho, o que faz com que surjam linhas horizontais e verticais nos seus limites mais visíveis se alta compressão e perdas forem usadas. Nestas compressões, também em técnicas e processo de detecção de contornos ou outras que realçam detalhes ou o contraste na imagem, a visibilidade dos blocos se torna aparente. Esta aparência é o que são os "blocking artefacts". São freqüentes nas codificações que usam DCT ou Transformadas Discretas de Cosenos ( o JPEG usa blocos de 8 x 8 pixels ) bem como nas fractais (onde os blocos são de tamanho variáveis) pois essas compressões usam blocar a imagem. 7. Na pagina 714 de Alan & Policarpo ( 1998) a imagem da "Candelária" é usada para comparar duas formas de compressão que usam DCT e wavelets. Resuma com suas palavras o que o autor deseja mostrar. (0.5) O autor deseja mostrar, principalmente, as diferenças qualitativas entre as técnicas wavelets e JPEG na transmissão progressiva. Nas duas formas de compressão ficam evidente o que são os "blocking artefacts" tão freqüentes nas codificações. É interessante notar que, ao serem comparadas as técnicas, qualitativamente, é importante manter o mesmo padrão de bit rate. Neste caso, de descompressão progressiva, a mesma percentagem de sinal na restauração também deve ser mantida. Ou seja deve ser usado o "espírito cientifico" de na comparação mudar apenas uma variável em cada etapa. 8. O que é a base fundamental do modelo de compressão JPEG? Que valores são armazenados e em que forma são eliminados para diminuir o arquivo? Como pode ser relacionado esse modelo com o sistema visual humano? O que é Image Domain e Transform Domain? (1.0) A base até o JPEG 2000 do padrão JPEG é a transformada discreta de cosenos: DCT. JPEG 2000 passou a usar também wavelets. A imagem inicialmente é blocada. É sempre considerado colorida

em true color, sendo então transformada do espaço de cores RGB para o YIQ. O canal Y é codificado com mais detalhes que os demais. Para diminuir os arquivos os blocos da imagem passam, na realidade, por mais de uma etapa de compressão. Depois de transformado para o domínio da freqüência, os coeficientes da DCT são codificados em um esquema diferenciado de acordo com sua ordenação, pois decaem de importância neste domínio de acordo com seu afastamento da primeira posição. É nesta etapa que ocorre a perda na codificação. Os coeficientes restantes sofrem codificação Huffman de tamanho variável. Estes últimos é que geram o arquivo armazenado. O sistema visual humano responde diferente a diferente freqüências espaciais, sendo maior entre 4 e 8 ciclos por grau. Neste caso Image Domain é o domínio espacial da imagem interpretável pelos olhos humanos. Transform Domain será a forma de representação em bases de cosenos, isso é a freqüência das ondas cosenoidais usadas. 9. Como se chega a Compressão Fractal? O que é IFS? Que dados são armazenados nesta forma de compressão? Como esta forma de compressão pode ser automatizada? (3.0) A compressão fractal é baseada em funções matemáticas que indicam a relação de semelhança entre uma parte e outra da imagem. Sua base fundamental é o "Teorema da Colagem", desenvolvido por Barnsley. Este teorema diz que se você "cobrir" um desenho com pequenas cópias reduzidas dele mesmo e achar a relação (na realidade a transformação afim) que transforma cada parte maior na parte reduzida, ao usar estas relações um sistema de funções iterativo (IFS- Iterated function system) refará o desenho. A prova deste teorema indica, inclusive, qual a taxa de erro que se terá se estas coberturas forem melhor ou pior feitas e se forem usadas mais ou menos copias. Indica ainda que o resultado independe da forma geométrica que você usar para cobrir as partes, o importante são as equações armazenadas. Estas equações sempre reproduzem a mesma figura. Além disso pequenas variações no código produzem pequenas variações no resultado, o que permite o uso desta técnica em animações. Sistema de funções iterativo (IFS- Iterated function system) é o conjunto de transformações que representa a figura na forma comprimida e é usado iterativamente depois na sua descompressão para voltar ao domínio espacial onde a figura é identificável pelos olhos humanos. Nesta compressão são armazenados os números que representam estas transformações. Cada transformação afim, em objetos 2D, pode ser representadas por 6 números reais. Quatro destes números indicam os valores de uma matriz 2x2 que pode produzir mudança de escala, reflexões, cisalhamentos e rotação nas figuras. Dois destes números correspondem as translações na horizontal e vertical, ou seja permitem calcular a nova posição do objeto. Assim o que é armazenado na Transformação Fractal são esses 6 coeficientes das funções de duas variáveis. Um conjunto de 6 números para cada copia que será considerada. As figuras que seguem ajudam a entender esse processo. Estas figuras foram obtidas de (http://www.ic.uff.br/~aconci/compression)

A automatização desta forma de compressão baseia-se na identificação automática nas imagens do que seriam as transformações afins que levam ao IFS. Como diferentemente de desenhos imagens adquiridas do mundo real são geralmente retângulos capturados com pixels em diferentes tons e cores, a cobertura é sempre feita por blocos que cobrem esse retângulos no domínio da Imagem. A cada retângulo ou bloco da imagem a ser comprimido será buscado na imagem um outro bloco/retângulo de tamanho maior do qual o retângulo/bloco em será uma copia reduzida. A transformação que leva um no outro é que será comprimida para passar a representar esse bloco. A técnica e seu resultado tem diferentes variações de acordo com a forma como estes blocos são grupados. Há ainda variações que buscam regiões de formas e tamanho diversos e diferentes técnicas que otimizam o tempo de busca baseadas em diferentes heurísticas ou inteligências.

10. O que é mais importante na compressão de filmes ou movies? Que estratégias podem ser usadas nestas aplicações? Para que pode ser usada? Como é a organização dos frames no MPEG?(1.0) Esses processos são geralmente assimétricos e são considerados muitos quadros em um determinado tempo não apenas uma imagem. Pode ser explorado a redundância entre frames (ou temporal redundancy) e fato de que o olho humano: (1) integra no tempo as variações, (2) sempre interpreta o que vê, (3) se concentra mais no que variou do que no fundo parado; (4) nas figuras humanas o rosto e neste as áreas de olhos e boca sempre chamam mais a atenção. Usa um modelo semelhante ao JPEG para os quadros. Podem ser usadas técnicas de previsão e compensação do movimento (motion compensation). Os frames são de 3 tipos: Preditores, Bidirecionais e Intra código. Preditores contem informação sobre o movimento. Intra código são codificados sem referência a outros frames, e usados no inicio do processo. Bidirecionais são interpolados entre frames a partir dos mais próximos.