Hidden Markov Models. Renato Assunção DCC - UFMG

Documentos relacionados
Intervalo de Confiança para a Diferença entre Duas Médias Amostrais

Intervalo de Confiança para a Variância de uma População Distribuída Normalmente. Pode-se mostrar matematicamente que a variância amostral,

Teste para Médias: duas amostras independentes

Tabela Periódica Princípio de Exclusão de Pauli

Resolução do exame de 1 a época

Bioestatística e Computação I

8 Equações de Estado

1 Inferência Estatística - Teoria da Estimação

Um exemplo de TCM (Trellis Coded Modulation) - versão draft

Probabilidade e Estatística

INTERVALO DE CONFIANÇA

Universidade Cruzeiro do Sul. Campus Virtual Unidade I: Unidade: Medidas de Dispersão

Medida do Tempo de Execução de um Programa. Bruno Hott Algoritmos e Estruturas de Dados I DECSI UFOP

Física Atómica e Nuclear Capítulo 7. Átomos Multilelectrónicos.

02/02/2017. Intervalo de Confiança. Bioestatística. Universidade Estadual do Oeste do Paraná - Unioeste. Curso de Nutrição

Medidas e algarismos significativos

WinCC Basic / Comfort / Advanced V1X

1 Jogos Estáticos de Informação Incompleta

Modelos de Markov Ocultos no Reconhecimento da Língua LIBRAS

Telecomunicações 2 ( ) Exame de Época Normal ( ) Resolução. f m R b R s R α Cosseno 2B1Q elevado, α B m B PCM B s B α

IV.4 Análise de Dados da Avaliação

Denomina F a variável aleatória definida pelo quociente: F = n

Amostragem de Sinais

n Obtido através desvio padrão da população (σ)

MOQ-12 Cadeias de Markov

Estatística: Aplicação ao Sensoriamento Remoto SER ANO Intervalo de Confiança

Cálculo Numérico / Métodos Numéricos. Solução de equações polinomiais Briot-Ruffini-Horner

Aula 08 Equações de Estado (parte I)

Projeto do compensador PID no lugar das raízes

1 Jogos Estáticos de Informação Incompleta

4. CONTROLE PID COM O PREDITOR DE SMITH

TRANSPORTES. Sessão Prática 5 Geração de Tráfego e Estacionamento

3 Critérios de Confiabilidade

Revisão de Alguns Conceitos Básicos da Física Experimental

Objetivo: mostrar como configurar troca dados entre dois controladores usando PN/PN Coupler.

Despertando o(a) Discente Ativo(a)

2. Apresentação da IHM Basic Operator Panel (BOP)

Modelação e Simulação Problemas - 4

A notação utilizada na teoria das filas é variada mas, em geral, as seguintes são comuns:

Representação de Modelos Dinâmicos em Espaço de Estados Graus de Liberdade para Controle

Metropolis-Hastings. Renato Assunção DCC - UFMG

Computação Gráfica. Ponto, Linha, Vetor e Matriz

Aula de Hoje. Processamento Estatístico da Linguagem Natural. Classificação Seqüencial. HMMs e MEMMs. Cadeias de Markov. Especificação Formal

06/02/2017. Teste de Hipóteses. Principais Conceitos. Teste de Hipóteses. Tipos de Erros. Tipos de Testes. Bioestatística

Controle de Processos

CAPÍTULO 4. Movimento Variado. Introdução. 2-Aceleração Escalar Média

Controle de Sistemas. Desempenho de Sistemas de Controle. Renato Dourado Maia. Universidade Estadual de Montes Claros. Engenharia de Sistemas

SISTEMA DE POTÊNCIA. Pd(s) Figura 1. , variando entre [ 0 e + ] K = Real. Figura 2

AMBIENTE COMPUTACIONAL PARA ESTUDO DE ACIONAMENTO DE MOTORES DE PASSO

MECÂNICA DO CONTÍNUO. Tópico 2. Cont. Elasticidade Linear Cálculo Variacional

Condução de calor numa barra semi-infinita

Estatística Aplicada I

Fluxo Máximo em Redes Letícia Rodrigues Bueno

Propriedade Markoviana

Retroacção Linear de Variáveis de Estado

Planeamento e Gestão da Mobilidade Urbana. Sessão 5: Estacionamento (agradecimentos: Prof Picado Santos por parte dos slides desta aula)

Inferência Estatística

Cálculo Diferencial e Integral II. Lista 8 - Exercícios/ Resumo da Teoria

UMA CONTRIBUIÇÃO AO ESTUDO DE FILTROS DIGITAIS NÃO RECURSIVOS (FIR) UTILIZANDO A JANELA DE KAISER

Modelagem e Avaliação de Desempenho

Plano. Aspectos Relevantes de HMMs. Teoria de HMMs. Introdução aos Modelos Escondidos de Markov

Objetivos da quinta aula da unidade 5. Evocar os conceitos de potência e rendimento de uma máquina

Algoritmos e Programação

Markov random field - MRF. Renato Assunção DCC-UFMG A partir de material de J. Chang

QUESTÃO 21 ITAIPU/UFPR/2015

CAPÍTULO 10 Modelagem e resposta de sistemas discretos

Universidade Salvador UNIFACS Cursos de Engenharia Métodos Matemáticos Aplicados / Cálculo Avançado / Cálculo IV Profa: Ilka Rebouças Freire

Análise e Processamento de BioSinais. Mestrado Integrado em Engenharia Biomédica. Faculdade de Ciências e Tecnologia. Universidade de Coimbra

Aprendizagem de Máquina

Fundamentos de Telecomunicações

Capítulo Lei de Planck

Desenvolvimento de um Modelo Matemático com Atrito Não Linear para o Pêndulo Simples

UNIVERSIDADE GAMA FILHO PROCET DEPARTAMENTO DE ENGENHARIA CONTROLE E AUTOMAÇÃO. Professor Leonardo Gonsioroski

1 Transformada de Laplace de u c (t)

UMA APLICAÇÃO DE SISTEMAS DE CLASSIFICAÇÃO KNN PARA A IDENTIFICAÇÃO AUTOMÁTICA DE MODELOS ARMA SAZONAIS E NÃO SAZONAIS

Algoritmos e Programação

Inferência para CS Modelos univariados contínuos

Função de Transferência. Função de Transferência

Aula de Hoje. Processamento Estatístico da Linguagem Natural. Decodificação. Decodificação. A treliça do algoritmo Viterbi

Sobre a estimação de limiares em processos contínuos com regimes

Misturas e Algoritmo EM

1/7 1/ se hoje não chove, amanhã não vai chover com probabilidade p 00 = 6/7;

Teoria dos Grafos Aula 22

Refletores de Householder e Fatoração QR

Teoria de Filas Aula 10

Espaço amostral Ω: Conjunto enumerável de todos os possíveis resultados de um experimento aleatório. um evento elementar. E = E[X j ] X j.

Estudo da produção de álcool via séries temporais

ESTATÍSTICA. Turma Valores Intervalo A [4,8] B 4 4 4,2 4,3 4, [4,8]

Primeiro Exercício programa: Como o Google ordena páginas. MAP-2121 para EPUSP

Estrutura de Dados e Algoritmos e Programação e Computadores II. Aula 11: Introdução aos Grafos

Carregamentos de Amplitudes Variável. Waldek Wladimir Bose Filho, PhD NEMAF Núcleo de Ensaio de Materiais e Análise de Falhas

Microeconomia 1 Professor: Carlos Eugênio Monitor: Bruno Lund Gabarito da 6 a Lista de Exercícios

TRANSFORMADA DE LAPLACE. Revisão de alguns: Conceitos Definições Propriedades Aplicações

Aula 7 - Acionamento de Motores CA AC Electric Motor Drives

Objetivo: Mostrar os principais passos de configuração de contagem rápida usando STEP 7 V1X e módulo DI HS do ET 200SP (6ES BF00-0DA0).

Suponha ser possível determinar um modelo de regressão. Considere um experimento fatorial com fatores testados a l

Tópicos Especiais em Inteligência Artificial COS746. Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro

COMO FUNCIONA A SIMULAÇÃO

COMO FUNCIONA A SIMULAÇÃO

Sinais e Sistemas Mecatrónicos

Transcrição:

Hidden Markov Model Renato Aunção DCC - UFMG

Proceo Etocático Proceo etocático e uma coleção de variávei aleatória: {X i, i {0,, 2,...}} I e chamado de conjunto-índice: e o conjunto que indexa a variávei aleatória Em geral, I = tempo X i e a variável que foi medida no tempo t=i A variávei ão dicreta e podem aumir o valore {, 2,..., k} = epaço de etado X i = j ignifica que o proceo tinha valor (ou etado) j no tempo i

Trajetória ou configuraçõe Um caminho epecifico e chamado de trajetória. Por exemplo, X =, X 2 =4,..., X m =2 e uma trajetória 4 trajetória: proceo.0.5 2.0 2.5 3.0 proceo.0.5 2.0 2.5 3.0 0 0 20 30 40 50 tempo 0 0 20 30 40 50 tempo proceo.0.5 2.0 2.5 3.0 proceo.0.5 2.0 2.5 3.0 0 0 20 30 40 50 tempo 0 0 20 30 40 50 tempo

Probabilidade Qual a probabilidade de uma certa trajetória? Numa equencia de m variávei aleatória, cada uma com k valore, temo k m trajetória poívei. Preciamo de um truque para atribuir probabilidade a toda eta k m trajetória. O truque mai uado e o modelo de Markov. O futuro depende do que aconteceu no paado e no preente: com Markov, abendo o preente, podemo ignorar o paado. Em palavra: a trajetória futura não depende de COMO o proceo chegou onde ele etá, depende apena de ONDE ele etá.

Propriedade de Markov Um proceo tem a propriedade de Markov e etado 0 2 4 6 8 0 2? 0 0 20 30 40 50 tempo

Cadeia de Markov Quando o proceo etocático tem um conjunto índice dicreto {0,, 2, 3,...} e poui a propriedade de Markov, ele e chamado de CADEIA DE MARKOV. A probabilidade P(X j = x X j- = x * ) e chamada de probabilidade de tranição. E a chance de fazer a tranição do etado x* no tempo j- para o etado x no tempo j. Eta probabilidade de tranição pode variar no tempo: pode er mai fácil paar de x * x no inicio do que no final. P(X j = x X j- = x * ) = q j (x x* )

Calculo da probabilidade com Markov Temo então Valido empre Markov

Cadeia de Markov HOMOGENEAS E quando a probabilidade de tranição e contante no tempo. P(X j = x X j- = x * ) = q j (x x* ) = q(x x* ) Matriz de tranição: matriz k x k com o valore da probabilidade de tranição q(x* x) M q( ) q( 2) q( k ) q( k) q(2 ) q(2 2) q(2 k ) q(2 k) q( k ) q( k 2) q( k k ) q( k k) q( k ) q( k 2) q( k k ) q( k k)

Matriz de tranição M Propriedade de M: Elemento q(i j) etão entre 0 e Elemento omam ao longo da linha: M. = onde =(,,.., ) t M q( ) q( 2) q( k ) q( k) q(2 ) q(2 2) q(2 k ) q(2 k) q( k ) q( k 2) q( k k ) q( k k) q( k ) q( k 2) q( k k ) q( k k)

Probabilidade com Markov homogêneo Seja q(j) = P(X = j), a ditribuição de probabilidade para o etado INICIAL da cadeia Temo então

Markov e um modelo gerador Generative model: modelo para toda a variávei envolvida, tanto a evidencia conhecida e fixa quanto a variávei deconhecida. Ito ignifica que podemo imular varia intancia do proceo. A cadeia de Markov pode er imulada com facilidade.

Markov: Um modelo gerador Uma equencia x, x 2,..., x m pode er gerada pelo algoritmo: Gere x da ditribuição inicial q(i) Para j=2,..,m Gere x j da ditribuição q(x x j- ) Em R, por exemplo: mat = matrix(c(0.8,0.,0.,0.4,0.5,0.,0.2,0.7,0.), ncol=3, byrow=t) x[] = ample(3,, prob=c(/3, /3, /3)) for(i in 2:5) x[i] = ample(3,, prob=mat[x[i-],])

Hidden Markov model Cadeia de Markov econdida

Modelando PARES de equencia Em varia aplicaçõe, temo uma equencia LATENTE (não-obervada). Obervamo uma outra equencia que e a latente mai algum ruído Exemplo: Part of peech tagging (equitagem gramatical??) em proceamento de linguagem natural: a cada palavra de um texto atribuir uma categoria gramatical: ubtantivo, verbo, prepoicao, adverbio, etc. Dua equencia: a palavra do texto A etiqueta gramaticai

Outro Exemplo Speech Recognition (reconhecimento de fala): paar de uma equencia acútica ( obervada ) para uma equencia de palavra E a aplicação onde naceu HMM.

Modelo para pare de equencia Temo DUAS equencia de variávei aleatória: X,..., X m S,..., S m Cada X i correponde a uma obervação, uma evidencia de fato medida. Cada S i e um etado latente que gerou a obervação. NÃO E CONHECIDO Vamo upor que S i {, 2,.., k} e X i {, 2,.., o} Como calcular

Modelo gráfico para HMM Independência condicional: O etado latente S i formam uma cadeia de Markov A obervaçõe X i dependem apena de S i, o etado latente no memo momento i

Calculando probabilidade Pela definição de probabilidade condicional: Supoição : o etado S i formam cadeia de Markov

Calculando probabilidade Novamente pela definição de probabilidade condicional: Supoição 2: X i depende apena de S i

Hidden Markov Model - HMM A probabilidade deejada fica igual a: Para implificar a notação: t() = P(S = ) = ditribuição inicial t( ) = P(S j = S j- =) tranição e(x ) = P(X j =x S j =) Ditribuição da emião do inal Então

HMM e um modelo gerador Sequencia S...S m e X...X m ão gerada pelo eguinte proceo: Gere S de acordo com a ditribuição t(). Gere X de acordo com a emião e(x ) onde e o valor gerado no pao anterior for j=2,...,m Gere j a partir da ditribuição t( j- ) Gere x j a partir da ditribuição e(x j )

Etimação de parâmetro Amotra de treinamento com n pare de equencia S e X de comprimento m, AMBAS OBSERVADAS Ito e, temo X i,j e S i,j para i =,...,n e j=,..., m Defina count(i, ) como o numero de veze que o etado eguiu o etado na amotra de treinamento Onde [[A]] = e A e verdade e 0 e A e falo Etimativa de t( ) ^

Parâmetro da ditribuição inicial Defina count(i,) como e o etado e o etado inicial da equencia i, e como 0 cao contrario: Etimativa de t() ^

Parâmetro da Emião Defina count(i, x) como o numero d veze que o etado eta pareado com a obervação x: Etimativa de e( x): ^

Uo do modelo HMM Dada uma equencia obervada X,..., X m, qual a probabilidade da equencia latente S,..., S m p(,..., m x,...,x m ) = p(,..., m, x,...,x m )/ p(x,...,x m ) α p(,..., m, x,...,x m ) Objetivo: dada uma equencia obervada X,..., X m, obter a equencia latente mai provável: ALGORITMO DE VITERBI

Algoritmo de Viterbi Objetivo: dada uma equencia obervada X,..., X m, obter a equencia latente mai provável O algoritmo de Viterbi e um algoritmo de programação dinâmica. Etrutura báica: = matriz m x k (comprimento da equencia veru no. de etado) [j,] = max,..,j- {P(x,..., x j-, x j,,..., j-, S j =) Ito e, [j,] = valor máximo da probabilidade de toda a equencia de etado que terminam no etado no tempo j

Algoritmo de Viterbi [j,] = valor máximo da probabilidade de toda a equencia de etado que terminam no etado no tempo j Todo o cálculo conideram também x,...,x j Como calcular? [,] = t()e(x ) Ito e correto: e tempo=, o conjunto da equencia de etado de comprimento que terminam em e unitário: apena a equencia. Então a probab máxima e a probab da equencia, que o valor t()e(x )

Algoritmo de Viterbi Tendo [,], paamo a obter o demai iterativamente. Para j=2: Para j=3 ) ( ) ( ] [, max ) ( ) ( ) ( ) ( max ),,, ( max ] [2, 2 2 2 x e t x e t x e t x x p ) ( ) ( ] [2, max ) ( ) ( ) ( ) ( ) ( ) ( max ),,,,, ( max ] [3, 3 2 2 3 2 2 2 2, 3 2 2, 2 2 2 x e t x e t x e t x e t x x x p

Algoritmo de Viterbi De forma geral, queremo Ao invé de coniderar todo a combinaçõe de etado,..., j-, ito e calculado pelo algoritmo de Viterbi: Inicialização Para j=2,...,m e para =,.., k Temo então Ordem O(mk 2 )

Viterbi: hortet-path algorithm Sequencia x,...,x m eta fixada Grafo com vértice (j,) para j=,..,m e =,..,k Nó fonte rotulado como 0 Areta direcionada de 0 para [,] com peo t()e(x ) Para j=2,..m, e etado, temo areta de (j-,) para (j, ) com peo t( )e(x j ) Peo de um caminho e o produto do peo da areta. [j,] e o peo máximo do caminho de 0 a (j,)

Viterbi: backpointer Inicialização: para =,..., k calcule Para j=2,...,m e para =,...,k e A entrada bp[j,] ão o backpointer que no permitem recuperar a identidade da equencia de etado com probabilidade maxima

Viterbi: backpointer A probabilidade maxima obre toda a equencia de etado e dada por Para recuperar a identidade da equencia de probabilidade máxima, faca o eguinte: Para j=m Para j=m,...,2 Eta equencia de etado,.., m e a deejada, aquela =

Pacote em R pir (linear tate pace model, Kalman filter) hmm.dicnp (dicrete-tate HMM with dicrete bervation) HiddenMarkov (dicrete-tate HMM with continuou obervation) RHmm (dicrete-tate HMM, but eem buggy and untable).