Vetor Quantização e Aglomeramento (Clustering)

Documentos relacionados

Agrupamento de dados

Aprendizagem de Máquina

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas

INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática. (1) Data Mining Conceitos apresentados por

MLP (Multi Layer Perceptron)

SUMÁRIO. Introdução... 3

Prof. Júlio Cesar Nievola Data Mining PPGIa PUCPR

Aprendizagem de Máquina. Ivan Medeiros Monteiro

Reconhecimento de Locutor pela Voz usando o Classificador Polinomial e Quantização Vetorial

PLANO DE ENSINO. Mestrado em Matemática - Área de Concentração em Estatística

Reconhecimento de Padrões

A Otimização Colônia de Formigas

Novos Recursos e Utilização de Adaptação de Locutor no Desenvolvimento de um Sistema de Reconhecimento de Voz para o Português Brasileiro

Factor Analysis (FACAN) Abrir o arquivo ven_car.sav. Clique Extraction. Utilizar as 10 variáveis a partir de Vehicle Type.

Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados

Recuperação de Informação em Bases de Texto. Aula 10

DO ANALÓGICO AO DIGITAL: CONCEITOS E

Codificadores de voz do MPEG-4. Eriko Porto

Clustering: K-means and Aglomerative

Projeto de Redes Neurais e MATLAB

Sons Vocais do Inglês Americano

Computação Paralela. Desenvolvimento de Aplicações Paralelas João Luís Ferreira Sobral Departamento do Informática Universidade do Minho.

Introdução ao Reconhecimento Automático da Voz (RAV)

Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU

Redes Neurais. Mapas Auto-Organizáveis. 1. O Mapa Auto-Organizável (SOM) Prof. Paulo Martins Engel. Formação auto-organizada de mapas sensoriais

Algoritmos de Agrupamento - Aprendizado Não Supervisionado. Fabrício Jailson Barth

Geração de código. Ivan Ricarte INTRODUÇÃO À COMPILAÇÃO

Cadeias de Markov. Geovany A. Borges

Tópicos sobre Teoria da informação e codificação de fonte

UNIVERSIDADE ESTADUAL DE CAMPINAS. Instituto de Matemática, Estatística e Computação Científica

3. REDES DE CAMADA ÚNICA

Matlab - Neural Networw Toolbox. Ana Lívia Soares Silva de Almeida

Classificação de Imagens

Classificação da imagem (ou reconhecimento de padrões): objectivos Métodos de reconhecimento de padrões

Inteligência Computacional Aplicada a Engenharia de Software

6 Construção de Cenários

IA Colônia de Formigas. Prof. Ricardo Britto DIE-UFPI

Roteamento em Redes de Computadores

Complemento IV Introdução aos Algoritmos Genéticos

A Preparação dos Dados

Aula 2 Modelo Simplificado de Computador

Engenharia de Software. Parte I. Introdução. Metodologias para o Desenvolvimento de Sistemas DAS

Universidade Federal de Alagoas Instituto de Matemática. Imagem. Prof. Thales Vieira

4 Avaliação Econômica

Processamento de Imagem. Prof. MSc. André Yoshimi Kusumoto

Artigo elaborado por C. Magno Xavier (M.Sc., PMP) Como criar uma WBS

Tabela de Símbolos. Análise Semântica A Tabela de Símbolos. Principais Operações. Estrutura da Tabela de Símbolos. Declarações 11/6/2008

Clustering - agrupamento. Baseado no capítulo 8 de. Introduction to Data Mining

Aprendizagem de Máquina

Palavras-Chaves: Agrupamento Hierárquico; Acordo de Resultados.

Lista de Exercícios. Vetores

Curso: Redes II (Heterogênea e Convergente) Tema da Aula: Características Roteamento

Diagrama de transição de Estados (DTE)

UFGD FCA PROF. OMAR DANIEL BLOCO 6 CLASSIFICAÇÃO DE IMAGENS

Aula 04. Código BCD, Códigos Alfa-numéricos e Sistemas de Detecção de Erros

O Software Face Match

Pré processamento de dados II. Mineração de Dados 2012

1. Sistemas de numeração

EA075 Conversão A/D e D/A

Inteligência de Enxame: ACO

EE210 Sistemas de Comunicação II 2ª Avaliação (PV2) 22/04/ h30min Profs. Dayan A. Guimarães e Rausley A. A. de Souza. Aluno(a): Matrícula.

5.7 Amostragem e alguns teoremas sobre limites

Formatos de Imagem PNG. Universidade Federal de Minas Gerais. Bruno Xavier da Silva. Guilherme de Castro Leite. Leonel Fonseca Ivo

Reconhecimento de Objectos

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

Multiplexador. Permitem que vários equipamentos compartilhem um único canal de comunicação

Análise e Complexidade de Algoritmos

FERRAMENTA PARA O ENSINO DE QUANTIZAÇÃO VETORIAL EM CURSOS DE ENGENHARIA ELÉTRICA

Errata. Livro: Transmissão Digital - Princípios e Aplicações Edição:1ª Código: 4391 Autores: Dayan Adionel Guimarães & Rausley Adriano Amaral de Souza

Análise de Regressão. Tópicos Avançados em Avaliação de Desempenho. Cleber Moura Edson Samuel Jr

RAV para Sistemas de Diálogo

Aula 20. Roteamento em Redes de Dados. Eytan Modiano MIT

Simulação Transiente

ADM041 / EPR806 Sistemas de Informação

ISO/IEC 12207: Gerência de Configuração

UNIVERSIDADE DE SÃO PAULO. Faculdade de Arquitetura e Urbanismo

Aprendizagem de Máquina

29/08/2011. Radiologia Digital. Princípios Físicos da Imagem Digital. Unidade de Aprendizagem Radiológica. Professor Paulo Christakis

ESTRUTURAS DE DADOS II

Protocolo em Rampa Manual de Referência Rápida

Aula 04 Método de Monte Carlo aplicado a análise de incertezas. Aula 04 Prof. Valner Brusamarello

Algoritmos Genéticos (GA s)

Jogo de balanceamento de carga

DESENVOLVIMENTO DE UM SOFTWARE NA LINGUAGEM R PARA CÁLCULO DE TAMANHOS DE AMOSTRAS NA ÁREA DE SAÚDE

ADMINISTRAÇÃO DOS RECURSOS DE DADOS

Backup. Permitir a recuperação de sistemas de arquivo inteiros de uma só vez. Backup é somente uma cópia idêntica de todos os dados do computador?

O QUE É E COMO FUNCIONA O CREDIT SCORING PARTE I

Java. Marcio de Carvalho Victorino

Aprendizagem de Máquina

Técnicas de Clustering: Algoritmos K-means e Aglomerative

2. Método de Monte Carlo

Inteligência de Enxame: PSO

4 Avaliação Experimental

Codificação de Canal

Instituto Superior Técnico. 19 de Janeiro de Parte I

1 Transmissão digital em banda base

AGRUPAMENTO DE DADOS SEMI-SUPERVISIONADO NO CONTEXTO DE APRENDIZADO DE MÁQUINA

SMCB: METODOLOGIA PARA A QUANTIZAÇÃO DE CORES EM IMAGENS FACIAIS

Transcrição:

(Clustering) Introdução Aglomeramento de K-partes Desafios do Aglomeramento Aglomeramento Hierárquico Aglomeramento divisivo (top-down) Aglomeramento inclusivo (bottom-up) Aplicações para o reconhecimento da voz 1

Modelamento Acústico Representação do Sinal Vetor Quantização Forma de Onda Vetores Característicos Símbolos Representação do Sinal produz seqüência de vetor características, Seqüências multi- dimensionais podem ser processadas por: Métodos que modelam diretamente espaço contínuo; Quantização e modelamento de símbolos discretos; Principais vantagens e desvantagens da quantização: Redução no armazenamento e nos custos computacionais; Potencial perda de informação devido à quantização; 2

Vetor Quantização (VQ) Usado na compressão do sinal, codificação da voz e imagem. Transmissão da informação mais eficiente que a quantização escalar (pode obter menos que 1 bit/parâmetro). Usado para modelamento acústico discreto desde os primórdios dos anos 80. Baseado em algoritmos padrões de aglomeramento: Aglomerados individuais centralizados são denominados de codewords. Um conjunto de aglomerados centralizados é denominado de codebook. VQ básico é um aglomerado de K- partes. VQ binário é uma forma de aglomeramento top-down (usado para quantização eficiente). 3

VQ & Aglomeramento Aglomeramento é um exemplo de conhecimento não supervisionado. Número e forma das classes {C i } desconhecida. Amostras de dados disponíveis {x i } não são classificadas. Útil para descobrir estrutura de dados antes da classificação ou adaptação dos classificadores. Resulta fortemente dependente do algoritmo de aglomeramento. 4

Exemplo de Modelamento Acústico 5

Desafios do Aglomeramento O que define um aglomerado? Existe um protótipo representando cada aglomerado? Como é definido um membro associado a um determinado aglomerado? O que é a distância métrica, d(x; y)? Quantos aglomerados existem? O número de aglomerados é escolhido antes do aglomeramento? Quanto bem os aglomerados representam dados não vistos? Como um novo dado é atribuído para um dado aglomerado? 6

Aglomeramento de K-Partes Usado para agrupar dados em K aglomerados, {C 1,...,C K } Cada aglomerado é representado por meio de dados atribuídos O algoritmo converge de forma iterativa para um ótimo local: Seleciona K aglomerados médios iniciais, {µ 1,, µ K }. Calcula iterativamente até o critério de termino ser satisfeito: 1. Atribui cada amostra de dados para o aglomerado mais próximo. x C i ; d(x;µ i ) d(x;µ j ); i j 1. Atualiza as K médias a partir das amostras atribuídas. µ i = E(x); x C i ;1 i K Quantizado vizinho mais próximo usado para dados não vistos. 7

K-Partes Exemplo: K = 3 Seleção aleatória 3 amostras de dados para medias iniciais. Distância métrica Euclidiana entre médias e amostras. 8

Propriedades do K-Partes Geralmente usado com uma distância métrica Euclidiana d(x;µ i ) = x - µ i 2 = (x - µ i ) t (x - µ i ) A distorção, D, é a soma do erro quadrático D = K i= 1 x C i x 2 µ D decresce entre a n th e n + 1 st iteração D(n + 1) D(n) Também conhecido como Isodata, ou algoritmo de Lloyd generalizado. Semelhanças com o algoritmo Maximização-Expectativa para conhecimento de parâmetros a partir de dados não classificados. 9

Aglomeramento K-Partes: Inicialização K-partes converge para um ótimo local. Ótimo Global não é garantido. Escolha inicial pode influenciar o resultado final. K-partes inicial pode ser escolhido aleatoriamente. Aglomeramento pode ser repetido múltiplas vezes. Estratégias Hierárquicas são freqüentemente utilizadas para iniciar os aglomerados. Top-down (divisiva) (ex., binary VQ). Bottom-up (inclusiva). 10

Aglomeramento K- Partes: Critério de Término Muitos critérios podem ser utilizados para terminar K-partes: Não há mudança nas atribuições dos dados. Máximo número de iterações foi excedido. Mudança na distorção total, D, cai abaixo de um limiar. 1 ( + 1) ( ) D n D n < T 11

Exemplo de Aglomeramento Acústico 12 aglomerados, iniciados com aglomeramento inclusivo. Representação Espectral baseada no modelo de audição. 12

Desafios do Aglomeramento: Número de Aglomerados Em geral, o número de aglomerados é desconhecido. Depende do critério de aglomeramento, espaço, computação ou requisitos de distorção ou métricas de reconhecimento 13

Desafios do Aglomeramento: Critério de Aglomeramento O critério utilizado em particionar os dados em aglomerados tem um papel importante na determinação do resultado final. 14

Desafios do Aglomeramento: Distância Métrica A distância métrica geralmente tem as seguintes propriedades: 1. 0 d(x; y) 2. d(x; y) = 0 if x = y 3. d(x; y) = d(y; x) 4. d(x; y) d(x; z) + d(y; z) 5. d(x + z; y + z) = d(x; y) (invariante) Na prática,a distância métrica pode não seguir algumas destas propriedades mas são uma medida das dissimilaridades. 15

Desafios do Aglomeramento: Distância Métrica Distância métrica influencia fortemente a forma dos aglomerados: Produto escalar normalizado: Euclidiana: x - µ i 2 = (x - µi) t (x - µ i ) Euclidiana pesada: (x - µi) t W(x - µ i ) (ex., W = -1 ) Distância Mínima (cadeia): min d(x; x i ); x i C i Representação específica... x t x y y 16

Desafios do Aglomeramento: Impacto da Escala A escala das dimensões do vetor característica pode influenciar significativamente os resultados do aglomeramento. A escala pode ser utilizada para normalizar dimensões e portanto uma simples distância métrica é um critério razoável para a similaridade. 17

Desafios do Aglomeramento: Treinamento e Teste de Dados O desempenho do treinamento de dados pode ser arbitrariamente bom ex., lim D = 0 k Teste independente dos dados é necessário para medir o desempenho. Desempenho pode ser medido pela distorção, D, ou alguma outra métrica de reconhecimento de voz relevante. Treinamento robusto irá degradar minimamente durante o teste Bons dados de treinamento casam bastante bem com as condições do teste. Dados de Desenvolvimento são freqüentemente utilizados para refinamentos, pois através testes iterativos podem implicitamente se tornar uma forma de dados de treinamento. k 18

Critério de Avaliação Alternativo: Exemplo LPC VQ Autumn (Outono) Autumn LPC (tamanho codebook = 1024) 19

Aglomeramento Hierárquico Aglomere os dados em uma estrutura de classes hierárquicas. Top-down (divisiva) ou bottom-up (inclusiva). Freqüentemente baseado na formulação stepwise-optimal, ou greedy. Estrutura Hierárquica útil para supor classes. Usado para iniciar algoritmos de aglomeramento tais como K- partes. 20

Aglomeramento Divisivo Cria hierarquia dividindo sucessivamente os aglomerados em grupos menores. Em cada iteração, um ou mais dos existentes aglomerados são divididos para formar novos aglomerados. O processo é repetido até que um critério de término seja atingido. Técnicas divisivas podem incorporar heurísticas de cortes e de união para melhorar o resultado final. 21

Exemplo de Aglomeramento Divisivo Não-Uniforme 22

Exemplo de Aglomeramento Divisivo Uniforme 23

Desafios no Aglomeramento Divisivo Inicialização de novos aglomerados: Seleção Aleatória a partir de amostras de aglomerados; Seleção de membros amostra distantes do centro; Perturba dimensão de máxima variância; Perturba todas as dimensões ligeiramente. Estruturas Árvore Uniforme ou não-uniforme. Corte de Aglomerados (devido a uma pobre expansão). Atribuição de Aglomerado (distância métrica). Critério de Término: Decréscimo na taxa de distorção; Não pode aumentar o tamanho do aglomerado. 24

Exemplo de Aglomeramento Divisivo: VQ Binário Freqüentemente usado para criar codebook de tamanho M = 2 B (B bit codebook, codebook tamanho M). É utilizado o aglomeramento divisivo binário uniforme. Em cada iteração cada aglomerado é dividido em dois: + µ i = µ i µ i = µ i ( 1+ ) ( 1 ) K-partes é utilizado para determinar o centróide do aglomerado. Também conhecido como algoritmo LBG (Linde, Buzo, Gray). Uma versão mais eficiente faz K-partes somente entre cada divisão binária, e mantém a árvore para uma procura eficiente. 25

Aglomeramento Inclusivo Estruture N amostras ou inicie aglomerados em uma hierarquia; Em cada iteração, os aglomerados mais semelhantes são reunidos para formar um novo aglomerado; Após N -1 iterações, a hierarquia é completada; A estrutura é apresentada na forma de um dendrograma; Levando em consideração o grau de semelhança quando novos aglomerados são criados, o dendrograma pode freqüentemente fornecer ajuda no agrupamento natural dos dados. 26

Dendrograma Exemplo (Uma Dimensão) 27

Desafios com o Aglomeramento Inclusivo Medindo distâncias entre aglomerados C i e C j com número respectivo de tokens n i e n j. Distância média: 1 n n i j ij d ( x, x ) i j Máxima distância (compacta): max d, ij ( x x ) i j Mínima distância (cadeia): ( x x ) min d, ij i j Distância entre dois vetores representativos de cada aglomerado tal como suas médias: d(µ i ;µ j ). 28

Aglomeramento Stepwise-Optimal Comum para minimizar o incremento na distorção total em cada interação de junção: stepwise-optimal ou greedy. A cada iteração, juntar os dois aglomerados que produzem o menor aumento na distorção. Distância métrica para minimizar a distorção, D, é: n n n i i j + n j µ + µ i j Tende a combinar pequenos aglomerados com grandes aglomerados antes de juntar aglomerados de tamanho similar. 29

Aglomeramento por Segmentação 30

Aglomeramento de pessoas falando 23 mulheres e 53 homens falando a partir do TIMIT corpus. Vetor baseado na media de F1 e F2 para 9 vogais. Distância d(c i ;C j ) é a media das distâncias entre membros. 31

Velar Oclusiva Alofônica 32

Velar Oclusiva Alofônica (continuação) 33

Hierarquia Acústica - Fonética Aglomeramento das distribuições fonéticas ao longo de 12 aglomerados. 34

Aglomeramento de Palavras 35

Aplicações VQ Normalmente usada para reduzir a computação. Pode ser utilizada sozinha para a classificação. Usada em dynamic time warping (DTW) e discrete hidden Markov models (HMMs). Codebooks Multiplos são usados quando espaços são estatisticamente independentes (product codebooks). Codebooks Matrizes são às vezes utilizados para capturar a correlação entre quadros sucessivos. Usado para estimação semi-paramétrica da densidade (ex., misturas semi-contínuas). 36

Referências Huang, Acero, and Hon, Spoken Language Processing, Prentice- Hall, 2001. Duda, Hart and Stork, Pattern Classification, John Wiley & Sons, 2001. A. Gersho and R. Gray, Vector Quantization and Signal Compression, Kluwer Academic Press, 1992. R. Gray, Vector Quantization, IEEE ASSP Magazine, 1(2), 1984. A. Juang, D. Wang, A. Gray, Distortion Performance of Vector Quantization for LPC Voice Coding, IEEE Trans ASSP, 30(2), 1982. J. Makhoul, S. Roucos, H. Gish, Vector Quantization in Speech Coding, Proc. IEEE, 73(11), 1985. L. Rabiner and B. Juang, Fundamentals of Speech Recognition, Prentice-Hall, 1993. 37