Tópicos sobre Teoria da informação e codificação de fonte



Documentos relacionados
Instituto Superior Técnico. 19 de Janeiro de Parte I

Redes Neuronais e Aprendizagem Automática 1

Prof. Aleksander S. Paterno

DO ANALÓGICO AO DIGITAL: CONCEITOS E

ANÁLISE E IMPLEMENTAÇÃO DE ALGORITMOS DE COMPRESSÃO DE DADOS. Maria Carolina de Souza Santos 1 Orientador: Prof.º Ms.

ESTRUTURAS DE DADOS II

Teoria das Comunicações Prof. André Noll Barreto. Prova /1 (02/07/2015)

Fabio Bento

LÓGICA DE PROGRAMAÇÃO PARA ENGENHARIA INTRODUÇÃO À ORGANIZAÇÃO DE COMPUTADORES

SISTEMAS DIGITAIS Prof. Ricardo Rodrigues Barcelar

Representação de Dados

Sinal analógico x sinal digital. Sinal analógico. Exemplos de variações nas grandezas básicas. Grandezas básicas em sinais periódicos

SM - Sistemas Multimédia CODIFICAÇÃO DE FONTE (parte 2) 4.º / 6.º semestre LEIC (verão 2016/2017)

Compressão de Imagens. Lilian Nogueira de Faria (Bolsista)...DPI/INPE Leila Maria Garcia Fonseca (Coordenadora)...DPI/INPE

Codificação/Compressão de Vídeo. Tópico: Vídeo (Codificação + Compressão)

Universidade Federal de Alagoas Instituto de Matemática. Imagem. Prof. Thales Vieira

UFSM-CTISM. Teoria da Comunicação Aula-01

Introdução à Programação 2006/07. Computadores e Programação

Sistemas de Numeração

Escola Secundária c/3º CEB José Macedo Fragateiro. Curso Profissional de Nível Secundário. Componente Técnica. Disciplina de

Nenhum dado é perdido durante o processo de compressão. Preserva todas as informações que permitirão a reconstrução exata da imagem. Reversível.

Compressão com perdas

Aritmética Binária e. Bernardo Nunes Gonçalves

Árvores. Algoritmos e Estruturas de Dados 2005/2006

Representação Binária de Dados

1 Problemas de transmissão

Introdução à Organização de Computadores Memória Principal

Introdução à Transmissão Digital. Funções básicas de processamento de sinal num sistema de comunicações digitais.

Aula 01 Parte 03 Computadores e Algoritmos. Prof. Filipe Wall Mutz

2. O que é Redundância de código ou informação? Como a compressão Huffman utiliza isso? Você conhece algum formato de imagem que a utiliza?(1.

COMPRESSÃO DE DADOS MULTIMÍDIA

Aula 2 Aquisição de Imagens

ARQUITETURA DE COMPUTADORES. Sistemas de Numeração. 1 Arquitetura de Computadores

ICC - Aula 6. Ivan da Silva Sendin. November 17, Bits, portas logicas, flip-flops,... Numeros e Simbolos Exercicios

Representação Binária de Números

Informática. Prof. Macêdo Firmino. Macêdo Firmino (IFRN) Informática Setembro de / 16

Capítulo 1. Introdução. 1.1 Sistemas numéricos

Sistemas de Numerações.

Disciplina: : ELETRÔNICA DIGITAL

Possui como idéia central a divisão de um universo de dados a ser organizado em subconjuntos mais gerenciáveis.

Informática Aplicada à Química. Sistemas de Numeração Representação de Dados

Sistemas Numéricos bit / Byte BIT BYTE. Prof. Celso Candido ADS / REDES / ENGENHARIA

Sistemas de Numeração

Televisão Digital. Codificação de Entropia Códigos de Huffman. Hélio Manuel Gonçalves Jaco

Sistema de Numeração e Códigos. Sistemas de Informação CPCX UFMS Prof. Renato F. dos Santos

Atividade prática: Rodando o programa SOMA

Sistema de Numeração e Conversão entre Sistemas. Prof. Rômulo Calado Pantaleão Camara. Carga Horária: 60h

EE210 Sistemas de Comunicação II 2ª Avaliação (PV2) 22/04/ h30min Profs. Dayan A. Guimarães e Rausley A. A. de Souza. Aluno(a): Matrícula.

Circuitos Digitais. Conteúdo. Sistema de Numeração e Códigos :: Conversões de Binário para Decimal SISTEMA DE NUMERAÇÃO E CÓDIGOS

Fundamentos da Compressão de Vídeo

Tabela de símbolos: tabelas de espalhamento

Lista de Exercícios Sistemas de Numeração

Aquisição e Representação da Imagem Digital

FCA - Editora de Informática 1

Ano letivo: 2012/2013. Sistemas de numeração. Pág.: 1/11. Escola profissional de Fafe SDAC. Trabalho elaborado por: Ana Isabel, nº905 TURMA 7.

Curso: Técnico de Informática Disciplina: Redes de Computadores. 1- Apresentação Binária

SISTEMAS DE UNIDADES DO COMPUTADOR

Projeto e Desenvolvimento de Algoritmos

Organização de Computadores

Representação de Dados e Sistemas de Numeração

Redes de computadores N Laboratório 01. Luiza Eitelvein

INFORMAÇÃO PROVA FINAL DE CICLO A NÍVEL DE ESCOLA. Aplicações Informáticas B 12º Ano - Prova /2015

Errata. Livro: Transmissão Digital - Princípios e Aplicações Edição:1ª Código: 4391 Autores: Dayan Adionel Guimarães & Rausley Adriano Amaral de Souza

Sistemas de Numeração. Engenharia da Computação 3 Período Alex Vidigal Bastos

Aula 5. Simplificação de funções lógicas (cont.) Sistemas de numeração

INSTRUMENTAÇÃO INDUSTRIAL 1. INTRODUÇÃO / DEFINIÇÕES

Segundo Exame e Repescagem de Testes. Mestrado em Engenharia Electrotécnica e de Computadores, IST 25 de Janeiro de 2014

Aula 04. Código BCD, Códigos Alfa-numéricos e Sistemas de Detecção de Erros

Trabalho compilado da Internet Prof. Claudio Passos. Sistemas Numéricos

Aula de Hoje. Sistemas e Sinais Sinais e Sistemas. Sinal em Tempo Contínuo. Sinal Acústico

Conversores D/A e A/D

Hardware de Computadores

As fases na resolução de um problema real podem, de modo geral, ser colocadas na seguinte ordem:

Sistema de Numeração e Conversão entre Sistemas. Prof. Rômulo Calado Pantaleão Camara. Carga Horária: 60h

Transmissão de Dados

Processamento Digital de Imagens

Sistemas de Numeração

Compressão de Imagens

Escola Superior de Tecnologia e Gestão Instituto Politécnico de Bragança Março de 2006

Adriano Mauro Cansian 2

Conteúdo. SCC5909 Fundamentos de Multimídia. Ementa do Curso. 1. Apresentação da Disciplina. Ementa do Curso. Ementa do Curso

Capítulo II Imagem Digital

Tecnologias Multimédia

ORGANIZAÇÃO BÁSICA DE COMPUTADORES E LINGUAGEM DE MONTAGEM. Conceitos Básicos ORGANIZAÇÃO BÁSICA DE COMPUTADORES E LINGUAGEM DE MONTAGEM

Algoritmos e Programação _ Departamento de Informática

UNIBRATEC Ensino Superior e Técnico em Informática DHD Desenvolvimento em Hardware

Segue-se o estudo da forma como os computadores armazenam e acedem às informações contidas na sua memória.

TIC TECNOLOGIAS DA INFORMAÇÃO (TI) TECNOLOGIAS ORIGEM DA PALAVRA

1 Transmissão digital em banda base

Álgebra de Boole. Sistema de Numeração e Códigos. Prof. Ubiratan Ramos

Vetor Quantização e Aglomeramento (Clustering)

Pesquisa Sequencial e Binária. Introdução à Programação SI2

II-6 Análise de Ruído e Capacidade de Canal

2. Execução do algoritmo de Huffman para construção de uma árvore binária (árvore de Huffman).

Busca. Pesquisa sequencial

Estrutura de Dados. Ricardo José Cabeça de Souza Parte 1

REPRESENTAÇÃO DE DADOS E SISTEMAS DE NUMERAÇÃO

Sistemas Multimédia. Ano lectivo Aula 9 Representações de dados para gráficos e imagens

ORGANIZAÇÃO DE COMPUTADORES MÓDULO 13

Capítulo I : Noções Gerais

Transcrição:

Tópicos sobre Teoria da informação e codificação de fonte Processamento Digital de Sinal II Artur Ferreira e Paulo Marques ( Dezembro 2003 )

Tópicos a abordar 1. Teoria da informação Informação própria Entropia 2. Codificação de fonte Código de Huffman Teorema da codificação de fonte Eficiência do código 4. Análise de resultados 2

Codificação de fonte Codificação de fonte - source coding descrição de acontecimentos produzidos por determinada fonte procura-se minimizar o comprimento médio do código cada símbolo é representado por um código Fonte símbolos Codificação de fonte códigos 3

Medidas da teoria da informação Seja X uma variável aleatória discreta com concretizações A informação própria de cada concretização é dada por: A entropia de X é o valor esperado (médio) da informação própria de cada concretização: 4

Entropia de fonte binária sem memória Considerando uma fonte binária, em que um dos símbolos tem probabilidade ae o outro tem 1-a tem-se A situação em que os dois símbolos são equiprováveis, corresponde à máxima incerteza/expectativa 5

Limites de variação da entropia Para uma v.a. discreta X com N com concretizações a entropia varia entre os seguintes limites: O limite inferior é obtido quando um dos símbolos tem probabilidade 1 O limite superior acontece quando os símbolos são equiprováveis (distribuição uniforme) 6

Cálculos de entropia Fonte quaternária (quatro símbolos) A probabilidade de cada símbolo é dada por tem-se Considerando agora tem-se 7

Teorema da codificação de fonte Também conhecido como 1º Teorema de Shannon (noiseless coding theorem): É possível codificar, sem distorção, uma fonte de entropia H bit/símbolo, usando em média N=H+ε bits por símbolo, em que ε é uma quantidade arbitrariamente pequena. A eficiência da codificação é dada por: em que N é o comprimento médio das palavras de código e H(X) é a entropia da fonte. 8

Codificação Entrópica O objectivo da codificação entrópica (de fonte) consiste em codificar uma fonte por forma a que o seu bit rate médio seja H bits/símbolo. Eficiência dum código com N bits por símbolo aplicado a uma fonte de entropia H: Em 1952, D. Huffman propôs um algoritmo de codificação que atribui códigos de comprimento variável aos símbolos da fonte O comprimento da palavra de código que representa um dado símbolo, é função da quantidade da informação associada ao símbolo 9

Comprimento médio O comprimento médio das palavras de um código define-se como: N =E [l x i ]= x i p x i l x i [digit / symbol ] em que l(x i ) é o comprimento da palavra de código que representa o símbolo x i Representa o número médio de dígitos utilizado para representar cada símbolo da fonte. 10

Análise do comprimento médio Fonte quaternária símbolos probabilidades entropia Estabelecem-se dois códigos para os símbolos desta fonte: com comprimento médio N=2.0833 e eficiência de 94.08 % com comprimento médio N=2.25 e eficiência de 87.11 % 11

Algoritmo de codificação de Huffman Ordenar os símbolos por probabilidade decrescente e considerá-los como nós duma árvore Enquanto houver mais do que um nó: Agrupar os dois nós de menor probabilidade e formar um novo nó com probabilidade igual à soma dos dois nós que se agruparam; Arbitrariamente atribuir os códigos 0 e 1 a cada ramo dos nós que se juntaram O código de cada símbolo obtém-se pela leitura sequencial da raiz até ao nó final a que pertence o símbolo em causa 12

Código óptimo e ideal O código de Huffman, é óptimo porque garante que No caso em que N=H(X) o código diz-se ideal Exemplo de código de Huffman: a 3/8 1 a 1 b 1/4 1 b 01 c 1/4 1 0 0 5/8 c 001 d 1/8 0 3/8 d 000 13

Análise de resultados de codificação 14

Medidas de avaliação Taxa de compressão Razão de compressão Percentagem removida Bits por pixel (byte) em que d c é a dimensão em bytes da imagem codificada e d o é a dimensão em bytes da imagem original. 15

Medidas de avaliação Distorção Relação sinal/ruído (SNR signal to noise ratio) P x é a potência da imagem original, P r é a potência do ruído (erro) 16

Medidas de avaliação Nalguns casos, na SNR usa-se apenas a potência AC da imagem, como potência do sinal: onde m x é o valor médio da imagem original. 17

Huffman sobre Calgary Corpus FILENAME ORIGINAL PACKED REM.PERC.(%) BITS/BYTE ENTROPY -------------------------------------------------------------------------------------------------------------------------------------------------- bib 111261 72933 34.4 5.24 5.20 book1 768771 440041 42.8 4.58 4.52 book2 610856 369216 39.6 4.86 4.79 geo 102400 73394 28.3 5.73 5.64 news 377109 246793 34.6 5.24 5.18 obj1 21504 16415 23.7 6.11 5.94 obj2 246814 195180 20.9 6.33 6.26 paper1 53161 33491 37.0 5.04 4.98 paper2 82199 47833 41.8 4.66 4.60 paper3 46526 27415 41.1 4.71 4.66 paper4 13286 7966 40.0 4.80 4.69 paper5 11954 7549 36.8 5.05 4.93 paper6 38105 24165 36.6 5.07 5.00 pic 513216 122039 76.2 1.90 1.21 progc 39611 26042 34.3 5.26 5.19 progl 71646 43217 39.7 4.83 4.77 progp 49379 30456 38.3 4.93 4.86 trans 93695 65414 30.2 5.59 5.53 -------------------------------------------------------------------------------------------------------------------------------------------- AVERAGE 180639 102753 37.6 4.99 4.89 Calgary Corpus: conjunto normalizado de ficheiros de teste http://corpus.canterbury.ac.nz/descriptions/#calgary 18

Huffman sobre Canterbury Corpus FILENAME ORIGINAL PACKED REM.PERC.(%) BITS/BYTE ENTROPY ----------------------------------------------------------------------------------------------------------------------------------------------- alice29.txt 152089 88116 42.1 4.64 4.56 asyoulik.txt 125179 76010 39.3 4.86 4.80 cp.html 24603 16306 33.7 5.30 5.23 fields.c 11150 7139 36.0 5.12 5.00 grammar.lsp 3721 2271 39.0 4.88 4.63 kennedy.xls 1029744 503121 51.1 3.91 3.57 lcet10.txt 426754 251544 41.1 4.72 4.67 plrabn12.txt 481861 276890 42.5 4.60 4.53 ptt5 513216 122039 76.2 1.90 1.21 sum 38240 26455 30.8 5.53 5.32 xargs.1 4227 2706 36.0 5.12 4.89 -------------------------------------------------------------------------------------------------------------------------- AVERAGE 255526 124782 42.5 4.60 4.40 Canterbury Corpus: conjunto normalizado de ficheiros de teste http://corpus.canterbury.ac.nz/descriptions/#cantrbry 19

Codificação da imagem lena Lena 256x256 Codificador Taxa de compressão [ bpp ] Relação sinal/ruído SNR [db] Huffman 7.51 infinita Huffman Adaptativo 7.49 infinita Aritmético 7.48 infinita Aritmético ordem 1 6.26 infinita JPEG 2.07 26.16 JPEG 1.42 22.77 H(X) = 7.46 bit / símbolo JPEG 0.96 19.92 H(X,Y)/2 = 6.22 bit / símbolo JPEG JPEG 0.85 0.63 19.09 17.32 JPEG 0.35 13.68 20

Codificação JPEG imagem lena Original 2.07 bpp 26.16 db 0.96 bpp 19.92 db 0.85 bpp 19.09 db 0.63 bpp 17.32 db 0.35 bpp 13.68 db 21

Uso do PSPro Conversão para formato JPEG 22