Métodos de programação dinâmica para solução de problemas de planejamento probabilístico

Tamanho: px
Começar a partir da página:

Download "Métodos de programação dinâmica para solução de problemas de planejamento probabilístico"

Transcrição

1 Métodos de programação dinâmica para solução de problemas de planejamento probabilístico Renato Schattan Pereira Coelho e Leliane Nunes de Barros (Orientadora) Universidade de São Paulo (USP), Brasil fena@cecm.usp.br, leliane@ime.usp.br 1. Introdução Quando estudamos a tomada automática de decisão um problema comum é o de ir de uma conguração inicial do mundo para uma conguração desejada com o menor custo esperado. Se queremos resolver um problema deste tipo costumamos usar um modelo chamado de caminho estocástico mínimo (Shortest Stochastic Path - SSP). Este modelo é baseado nos Processos markovianos de decisão (Markov Decision Processes - MDP), com algumas diferenças que o tornam mais interessante computacionalmente e mais natural para modelar este tipo de problema. Neste artigo revisaremos os algoritmos que representam o estado da arte na resolução deste tipo de problema e apontaremos o caminho que está sendo seguido nesta pesquisa. A base para os algoritmos é o Real-Time Dynamic Programming (RTDP), que apresenta uma tática eciente para atualização assíncrona do valor dos estados. A partir desta tática, surgem dois algoritmos: o Labeled Real- Time Dynamic Programming (LRTDP), que apresenta uma maneira interessante de marcar os estados para aumentar a velocidade de convergência do algoritmo e o Bounded Real-Time Dynamic Programming (BRTDP), que utiliza duas heurísticas para ajudar na escolha dos estados que dever atualizados e para saber quando a política convergiu. 2. Caminho estocástico mínimo Baseado em um modelo muito conhecido, o dos MDPs (uma boa descrição deste modelo pode ser encontrada em [7]), foi criado um modelo chamado SSP, que nos dá uma base formal para os problemas em que estamos interessados (ir de um conjunto de estados a outro com o menor custo esperado). Este modelo tem as seguintes características [2]: M1 - Um conjunto de estados (S) nito ou contável M2 - Um estado inicial s 0 S 1 M3 - Um conjunto não vazio de estados meta, S G S M4 - Os estados em S G são absorventes, ou seja, as ações tomadas nestes estados não têm custo e não levam para estados fora deste conjunto M5 - Um conjunto de ações A e subconjuntos de ações A(s) denidos para todos os estados s S M6 - Distribuições de probabilidades P ( s, a) sobre os estados pertencentes a S dado que uma ação a A(s) foi tomada no estado s S. M7 - Um custo, c(a, s), não negativo associado a se executar a ação a no estado s M8 - Os estados são totalmente observáveis Neste modelo, o tempo é discreto e o agente deve escolher uma ação em cada instante do tempo. Também é importante, para garantir propriedades dos algoritmos, que todos os estados tenham uma probabilidade não nula de alcançar algum estado meta. Dado este modelo, o objetivo do agente é escolher, para cada estado alcançável a partir dos estados iniciais, a ação que minimiza o valor esperado dos caminhos até algum estado meta. Isto equivale a criar uma política, ou seja, uma função π : S A que associa a cada estado a melhor ação. Dado um problema modelado desta maneira podemos calcular recursivamente o custo esperado da execução de uma política a partir de um estado até a meta (V π (s)) 2 como: V π (s) = c(π(s), s) + P (s s, π(s)) V π (s ) O valor ótimo de um estado (V (s)) é o único ponto xo da equação de Bellman [9]: V (s) = min (c(a, s) + s S P (s s, a) V (s )) 1 Podemos estender a denição para um conjunto não vazio de estados S 0 S, sem grandes mudanças nos algoritmos. 2 Neste texto, para simplicar, chamaremos o custo esperado de um caminho a partir de um estado até a meta de valor de um estado. 95

2 Assim, a política ótima (π (s)) é dada por: π (s) = argmin(c(a, s) + P (s s, a) V (s )) s S Pela denição, V π (s) = V (s) = 0, para todo estado pertencente a S G. Este valor pode ser usado como base da recursão no cálculo dos valores dos outros estados. Abaixo veremos os algoritmos que são considerados como estado da arte para a resolução de problemas neste modelo. Todos eles 3. Programação dinâmica em tempo real A base para os algoritmos que representam o estado da arte na resolução de SSPs é o Real-Time Dynamic Programming (RTDP) [1], que é uma maneira eciente de atualizar os valores dos estados de maneira assíncrona. Como utilizaremos os valores dos estados muitas vezes, todos os algoritmos utilizam a técnica de programação dinâmica, armazenando o último valor calculado para um estado em V π (s). A idéia básica do RTDP é fazer várias simulações da execução da política e atualizar o valor dos estados ao mesmo tempo em que a política é atualizada. A política escolhida pelos algoritmos é a política gulosa (π V ), dada por: Se os valores dos estados forem inicializados de maneira correta, um número sucientemente grande de simulações nos deixará com V π (s) = V (s). No artigo original [1] não se deniu uma condição de parada para esta técnica, entretanto, para que pudesser realizadas comparações com outros algoritmos, considera-se que o algoritmo pára quando o estado inicial já convergiu. A convergência de um estado será discutida adiante. 4. Programação dinâmica em tempo real com marcações O que torna o RTDP tão poderoso é também sua grande falha. Escolher o estado que terá seu valor atualizado de acordo com P ( s, a) faz com que o valor de V π (s) se aproxime rapidamente de V (s). Entretanto, a convergência do algoritmo é muito lenta, dado que os estados que têm pouca probabilidade de serem alcançados demoram para ter seu valor atualizado e, consequentemente, demoram para convergir. A maneira encontrada pelo Labeled Real-Time Dynamic Programming (LRTDP) [2] para aumentar a velocidade de convergência do RTDP é marcar como resolvidos os estados que já tenham um valor sucientemente próximo ao valor ótimo. Para isto utilizamos o erro de Bellman, denido como: π V := argmin(c(a, s) + P (s s, a) V π (s )) s S Cada simulação começa no estado inicial e pára quando chega a algum estado meta. Dado um estado, o próximo estado a ser visitado é dado diretamente por P ( s, π V (s)). O valor de V π (s) é atualizado de acordo com a nova política antes de se passar para o próximo estado. Esta maneira de escolher quais estados terão seu valor atualizado é muito poderosa porque os estados que inuenciam mais no valor da esperança são atualizados mais vezes. Este algoritmo tem algumas propriedades interessantes [1]: Cada uma das simulações termina em um número nito de passos. Se os valores de V π (s) forem monotônicos e admissíveis (menores que V (s)) quando inicializados, essas propriedades se mantêm ao longo das atualizações dos valores de V π (s). As atualizações de um estado não diminuem o valor de V π (s). E(s) := V π (s) min (c(a, s)+ P (s s, a) V π (s )) que representa a diferença entre o valor armazenado para um estado e o novo valor que será obtido através da escolha gulosa de ação. Embora para SSPs não haja uma maneira fácil de calcular a distância entre o valor ótimo de um estado e o valor atual a partir do erro de Bellman, ele nos indica quando a função não está variando muito. Assim, o LRTDP marca os estados como resolvidos quando o erro de Bellman é menor do que algum ɛ > 0 para o estado e para todos os estados alcançáveis a partir dele através da política gulosa. Se, ao nal da execução do algoritmo, o valor encontrado para os estados estiver muito longe do valor ótimo, podemos rodar novamente o algoritmo com um ɛ menor que o inicial. A existência de loops impossibilita uma tática mais intuitiva, que marque os estados como resolvidos quando os seus sucessores já tiverem sido marcados, uma vez que este esquema deixaria de marcar alguns estados que já tivessem convergido. Para tentar marcar um estado como resolvido o LRTDP usa o método checksolved 1. Esse método 96

3 faz uma busca em profundidade nos estados que podem ser alcançados, através da política gulosa, a partir do estado que se está testando. Quando visitamos um estado temos três situações possíveis: o estado pode ser um estado meta, o erro de Bellman do estado pode ser menor ou igual a ɛ ou o erro de Bellman pode ser maior do que ɛ. Quando a busca encontra um estado meta ela termina a busca naquele ramo e muda de ramo. Quando a busca encontra estados que tenham o erro de Bellman menor ou igual a ɛ ela põe seus sucessores em uma pilha e continua a busca naquele ramo. E quando a busca encontra um estado que tenha o erro de Bellman maior do que ɛ o algoritmo sabe que o estado estudado não convergiu, mas por questões de eciência ele continua a busca em outro ramo. Assim, após uma chamada à checksolved temos duas possibilidades: ou nenhum dos estados visitados tinha o erro de Bellman maior do que ɛ e então, por denição, o estado e todos os seus sucessores convergiram e poder marcados ou existia pelo menos um estado com erro de Bellman maior do que ɛ e, quando os valores dos estados forem atualizados na ordem reversa em que foram visitados, pelo menos um estado (o que tinha erro de Bellman maior do que ɛ) terá seu valor modicado em mais do que ɛ. Dessa maneira, podemos resolver um SSP simplesmente chamando a função checksolved para o estado inicial até que ele tenha convergido. Este método não fará mais do que ɛ 1 s S V (s) h(s) chamadas à função checksolved, em que h(s) é a heurística utilizada para inicializar os valores de V π (s). Entretanto, como o estado inicial está muito longe da meta, ele demora para convergir e não podemos marcar os outros estados como resolvidos até que ele tenha convergido. Assim, não aproveitamos o esquema de rotulação dos estados. Por esta razão o LRTDP implementa um outro método (LRTDPTrial 2) que é muito similar às simulações realizadas pelo RTDP. Existem duas diferenças: os estados visitados são guardados em uma pilha e, quando a simulação atinge um estado meta ou um estado que já tenha convergido,a simulação pára e chama-se o método checksolved para os estados, enquanto eles são desempilhados. Quando algum estado retorna falso outra simulação é iniciada. Utilizando estes dois métodos temos uma maneira eciente de vericar se os estados já convergiram e conseguimos aumentar a velocidade de convergência do algoritmo, já que os estados com pouca probabilidade de serem alcançados serão visitados nas chamadas à checksolved Algoritmo 1: checksolved Entrada: Um SSP, ɛ,s Saída: Verdadeiro se s tiver convergido, falso c.c. resposta = verdadeiro aberto = P ilhav azia fechado = P ilhav azia se s.m arcado então aberto.push(s) enquanto aberto P ilhav azia faça s = aberto.pop() f echado.push(s) //verica o erro de Bellman se s.erro(a) > ɛ então resposta = falso continue //expande o estado a = s.acaogulosa() para todo s tal que P (s s, a) > 0 faça se s.marcado e Em(s, aberto f echado) então aberto.push(s ) m para todo se resposta = verdadeiro então //marca os estados alcançáveis a partir da política gulosa para todo s fechado faça s.m arcado = verdadeiro m para todo senão enquanto fechado P ilhav azia faça s = fechado.pop() s.update() Resultado: resposta 97

4 Algoritmo 2: RTDPTrial Entrada: Um SSP, ɛ,s visitados = P ilhav azia enquanto s.m eta() faça //põe o estado na pilha visitados.push(s) //simula a execução da política gulosa e atualiza o estado a = s.acaogulosa() s.update() s = s.escolhap roximoestado(a) enquanto visitados P ilhav azia faça s = visitados.pop() se checksolved(s, ɛ) então break Programação dinâmica em tempo real com limitantes A principal característica do Bounded Real-Time Dynamic Programming (BRTDP) [8] é manter duas heurísticas do valor do estado, uma inferior (V L (s), similar à V π (s)) e uma superior (V U (s)). Utilizando estas duas heurísticas e analisando a diferença entre elas o algoritmo consegue: melhorar a maneira de selecionar os estados que terão seus valores atualizados, facilitar a vericação da distância entre o valor da heurística e o valor ótimo do estado e diminuir o número de estados que precisar visitados. Neste algoritmo o conceito de convergência de um estado é diferente do utilizado no LRTDP. Neste caso, consideramos que um estado convergiu quando a diferença entre a heurística superior e a inferior é menor do que algum ɛ > 0. Neste caso sabemos que quando um estado convergiu a nossa estimativa do valor do estado não tem um erro maior do que ɛ em relação ao valor ótimo. O BRTDP utiliza um algoritmo muito parecido com o do RTDP. A sua principal função é uma simulação da execução da política gulosa (em relação à heurística inferior). Entretanto, a escolha do próximo estado a ser atualizado é feita através do valor normalizado de P (s s, a) (V U (s ) V L (s )) e a simulação pára quando se atinge um estado meta ou quando se atinge um estado que já tenha convergido. O algoritmo pára de fazer simulações quando o estado inicial já convergiu, ou seja, V U (s 0 ) V L (s 0 ) < ɛ. As atualizações de V U (s) e V L (s) são feitas da mesma maneira que as atualizações de V π (s), isto é: V U (s) = min (c(a, s) + P (s s, a) V U (s )) V L (s) = min (c(a, s) + P (s s, a) V L (s )) Assim como no RTDP e no LRTDP as atualizações dos estados preservam a monotonicidade e a admissibilidade das heurísticas, o que nos mostra que o algoritmo pára após um número nito de simulações e que ele não precisa visitar todos os estados em S e, muitas vezes, também não precisa visitar todos os estados alcançáveis a partir de s 0 seguindo a política gulosa (principalmente quando há uma probabilidade muito baixa de transição para estes estados) [8]. O ponto fraco deste algoritmo é o cálculo da heurística superior. É muito fácil calcular uma heurística inferior para V (s), por exemplo, tomando h(s) = 0 ou h(s) = min c(a, s). Entretanto, o cálculo de uma heurística superior pode fazer com que o algoritmo tenha que visitar todo o espaço de estados [8]. Assim, muitas vezes o custo de se calcular uma heurística superior é maior do que os ganhos de se utilizar o BRTDP. 6. Considerações nais Neste artigo mostramos um modelo muito interessante, o SSP, que modela de maneira eciente os problemas nos quais queremos ir de uma conguração inicial a uma conguração nal do mundo com o menor custo esperado. Modelar o problema desta maneira possibilita que, muitas vezes, nem todos os estados do mundo sejam visitados, gerando uma grande economia de tempo em relação aos resolvedores de MDPs. Entretanto, frequentemente temos diculdades em modelar um problema com probabilidades precisas de transição. Por isso, nesta iniciação cientíca o aluno está estudando um modelo recentemente criado [5] que estende o SSP ao possibilitar que sejam fornecidos intervalos de probabilidade para as transições entre estados. Durante a iniciação cientíca pretendemos adaptar o LRTDP para que ele resolva problemas deste novo modelo SSPST (Shortest Stochastic Path with Set Transitions ). O RTDP apresenta uma técnica muito importante e atualmente bastante difundida para escolher quais estados devem ter seu valor atualizado. Entretanto, esta mesma tática faz com que ele tenha uma convergência demorada. Assim, se quisermos impor um limite curto de tempo para processamento, o RTDP pode nos dar uma resposta melhor que os outros algoritmos, mas se quisermos uma resposta ótima (ou 98

5 sub-ótima) o RTDP levará mais tempo do que os outros algoritmos. O LRTDP se aproveita da técnica do RTDP e implementa uma função que marca os estados como resolvidos para que eles não preciser visitados novamente. Essa função gera um pequeno overhead e, por isso, o LRTDP costuma devolver políticas um pouco piores do que o RTDP, quando o tempo de execução é curto. Entretanto, a velocidade de convergência é extremamente maior do que a do RTDP. O BRTDP tem três propriedades interessantes: a facilidade de vericar se um estado convergiu ou não; o número reduzido de estados que precisar visitados (mesmo quando comparado com o RTDP e o LRTDP que também não precisam visitar todo o espaço de estados); e a técnica aprimorada de seleção de estados que dever atualizados, que favorece os estados sobre os quais se tem pouca informação, além dos que têm grande probabilidade de serem alcançados. Apesar destas propriedades, o custo de se calcular uma heurística superior pode facilmente fazer com que o algoritmo deixe de ser interessante quando comparado com os outros. Esta pesquisa conta com o apoio da FAPESP através do processo 2008/ [9] Richard E. Bellman, Dynamic Programming, Princeton University Press, [10] Stuart Russel and Peter Norvig, Articial Intelligence: A Modern Approach, Prentice Hall, Englewood Clis, New Jersey, Referências [1] Andrew G. Barto, Steven J. Bradtke, and Satinder P. Singh, Learning to Act Using Real-Time Dynamic Programming, Articial Intelligence 72 (1995), [2] Blai Bonet and Héctor Gener, Labeled RTDP: Improving the Convergence of Real-Time Dynamic Programming, International Conference on Automated Planning and Scheduling, 2003, pp [3] Craig Boutilier, Thomas Dean, and Steve Hanks, Decision-Theoretic Planning: Structural Assumptions and Computational Leverage, Journal of Articial Intelligence Research 11 (1999), 194. [4] Dana S. Nau, Malik Ghallab, and Paolo Traverso, Automated Planning: Theory and Practice, Morgan Kaufmann Publishers, [5] Felipe W. Trevizan, Fabio G. Cozman, and Leliane N. Barros, Planning under Risk and Knightian Uncertainty, International Joint Conference on Articial Intelligence, 2007, pp [6] Felipe W. Trevizan, Um modelo unicado para planejamento sob incerteza, Instituto de Matemática e Estatística, São Paulo, [7] Martin L. Puterman, Markov Decision Processes - Discrete Stochastic Dynamic Programming, John, Wyley and Sons, Inc., [8] H. Brendan McMahan, Maxim Likhachev, and Georey J. Gordon, Bounded Real-Time Dynamic Programming: RTDP with monotone upper bounds and performance guarantees, International Conference on Machine Learning, 2005, pp

Renato S. P. Coelho, Dra. Leliane Nunes de Barros

Renato S. P. Coelho, Dra. Leliane Nunes de Barros USO DO ERRO DE BELLMAN PARA ACELERAR A CONVERGÊNCIA DA PROGRAMAÇÃO DINÂMICA EM TEMPO REAL Renato S. P. Coelho, Dra. Leliane Nunes de Barros Pró Reitoria de Graduação USP Rua da Reitoria, Favo 22 - Cidade

Leia mais

IA - Planejamento II

IA - Planejamento II PO IA - Planejamento II Professor Paulo Gurgel Pinheiro MC906A - Inteligência Articial Instituto de Computação Universidade Estadual de Campinas - UNICAMP 16 de Novembro de 2010 1 / 48 PO http://www.ic.unicamp.br/

Leia mais

Processo de Decisão Markoviano com Transição Valorada por Conjunto modelado como um Jogo Alternado de Soma Zero

Processo de Decisão Markoviano com Transição Valorada por Conjunto modelado como um Jogo Alternado de Soma Zero Processo de Decisão Markoviano com Transição Valorada por Conjunto modelado como um Jogo Alternado de Soma Zero Leliane Nunes de Barros 1, Fábio de Oliveira Franco 1 e Karina Valdivia Delgado 2 1 Instituto

Leia mais

Programa: Ciência da Computação Orientadora: Prof ạ Dr ạ Leliane Nunes de Barros

Programa: Ciência da Computação Orientadora: Prof ạ Dr ạ Leliane Nunes de Barros Aprendizado por reforço em lote: um estudo de caso para o problema de tomada de decisão em processos de venda Denis Antonio Lacerda Dissertação apresentada ao Instituto de Matemática e Estatística da Universidade

Leia mais

IA - Planejamento I. Professor Paulo Gurgel Pinheiro. 11 de Novembro de 2010

IA - Planejamento I. Professor Paulo Gurgel Pinheiro. 11 de Novembro de 2010 IA - I Professor Paulo Gurgel Pinheiro MC906A - Inteligência Articial Instituto de Computação Universidade Estadual de Campinas - UNICAMP 11 de Novembro de 2010 1 / 54 http://www.ic.unicamp.br/ pinheiro/

Leia mais

Aprendizado por Árvores de Decisão

Aprendizado por Árvores de Decisão Universidade Federal de Santa Maria Departamento de Eletrônica e Computação Prof. Cesar Tadeu Pozzer Disciplina de Programação de Jogos 3D E-mail: pozzer@inf.ufsm.br Período: 2006/01 Aprendizado por Árvores

Leia mais

Busca Heurística - Informada

Busca Heurística - Informada Busca Heurística - Informada Estratégias de Busca Exaustiva (Cega) encontram soluções para problemas pela geração sistemática de novos estados, que são comparados ao objetivo; são ineficientes na maioria

Leia mais

Projeto de Escalonamento Alocação de médicos

Projeto de Escalonamento Alocação de médicos Projeto de Escalonamento Alocação de médicos Atol Fortin de Oliveira 15 de dezembro de 2009 1 Sumário 1 Introdução 3 2 O Problema 4 2.1 Especicação do problema................... 4 2.2 Resumo das variáveis

Leia mais

Inteligência Artificial

Inteligência Artificial Inteligência Artificial Aula 3 Métodos de Busca para Resolução de Problemas Busca Informada Heurísticas Busca Gulosa Busca A* Busca Local Prática #2 Prof. Ricardo M. Marcacini ricardo.marcacini@ufms.br

Leia mais

3 Aprendizado por reforço

3 Aprendizado por reforço 3 Aprendizado por reforço Aprendizado por reforço é um ramo estudado em estatística, psicologia, neurociência e ciência da computação. Atraiu o interesse de pesquisadores ligados a aprendizado de máquina

Leia mais

lnteligência Artificial Introdução ao Processo Decisório de Markov

lnteligência Artificial Introdução ao Processo Decisório de Markov lnteligência Artificial Introdução ao Processo Decisório de Markov Aprendizado - paradigmas Aprendizado supervisionado O crítico comunica a EA o erro relativo entre a ação que deve ser tomada idealmente

Leia mais

Análise e Projeto de Algoritmos

Análise e Projeto de Algoritmos Análise e Projeto de Algoritmos Profa. Sheila Morais de Almeida DAINF-UTFPR-PG junho - 2018 Sheila Almeida (DAINF-UTFPR-PG) Análise e Projeto de Algoritmos junho - 2018 1 / 40 Este material é preparado

Leia mais

Planejamento para fundições: uma aplicação do método das K-melhores mochilas. 1 Introdução

Planejamento para fundições: uma aplicação do método das K-melhores mochilas. 1 Introdução Planejamento para fundições: uma aplicação do método das K-melhores mochilas Murilo S. Pinheiro, Franklina M.B. Toledo, Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, Av.

Leia mais

Aprendizado por reforço em lote para o problema de tomada de decisão em processos de venda

Aprendizado por reforço em lote para o problema de tomada de decisão em processos de venda Aprendizado por reforço em lote para o problema de tomada de decisão em processos de venda Denis Antonio Lacerda e Leliane Nunes de Barros Departamento de Ciência da Computação, IME/USP denis@ime.usp.br,

Leia mais

Inteligência Artificial - IA. Resolução de problemas por meio de busca

Inteligência Artificial - IA. Resolução de problemas por meio de busca Resolução de problemas por meio de busca 1 Agente reativo - definido por ação reação Agente de resolução de problemas (ou baseado em objetivos) encontra sequencias de ações que leva ao estado desejável.

Leia mais

9 Conclusões e Sugestões para Trabalhos Futuros

9 Conclusões e Sugestões para Trabalhos Futuros 9 Conclusões e Sugestões para Trabalhos Futuros O extenso horizonte do planejamento da operação e a estocasticidade das afluências futuras tornam o problema de planejamento da operação energética do sistema

Leia mais

Planejamento probabilístico como busca num espaço de transição de estados

Planejamento probabilístico como busca num espaço de transição de estados Planejamento probabilístico como busca num espaço de transição de estados Daniel Javier Casani Delgado Dissertação apresentada ao Instituto de Matemática e Estatística da Universidade de São Paulo para

Leia mais

MPE(S)- Metodologias de Planeamento e Escalonamento Planning and Scheduling Methodologies

MPE(S)- Metodologias de Planeamento e Escalonamento Planning and Scheduling Methodologies MPE(S)- Metodologias de Planeamento e Escalonamento Planning and Scheduling Methodologies Eugénio Oliveira / Henrique L. Cardoso {eco, hlc}@fe.up.pt Sítio web institucional Sítio web específico: http://paginas.fe.up.pt/~eol/prodei/mpe1415_eng.htm

Leia mais

Programação Dinâmica I SCC0210 Algoritmos Avançados (2/2011) Lucas Schmidt Cavalcante

Programação Dinâmica I SCC0210 Algoritmos Avançados (2/2011) Lucas Schmidt Cavalcante Programação Dinâmica I SCC0210 Algoritmos Avançados (2/2011) Lucas Schmidt Cavalcante Introdução Soma máxima de uma subsequência contígua Problema do troco Quantidade de formas de dar troco Problema da

Leia mais

Branch and Bound - Ramicar e Limitar

Branch and Bound - Ramicar e Limitar Programação Linear Inteira Branch and Bound Haroldo Gambini Santos Universidade Federal de Ouro Preto - UFOP 30 de agosto de 2011 1 / 19 Branch and Bound - Ramicar e Limitar Idéia Básica O algoritmo roda

Leia mais

Aprendizado por Reforço

Aprendizado por Reforço Aprendizado por Reforço Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Aprendizado por Reforço 2. Q-Learning 3. SARSA 4. Outras ideias 1 Aprendizado por Reforço Problemas de decisão

Leia mais

Tópicos Especiais em Otimização

Tópicos Especiais em Otimização Tópicos Especiais em Otimização ivo.junior@ufjf.edu.br Juiz de Fora, 05 de Maio de 2016 Introdução Qual a diferença entre inteligência: ARTIFICIAL E COMPUTACIONAL? ARTIFICIAL: É a ciência que tenta compreender

Leia mais

3. Resolução de problemas por meio de busca

3. Resolução de problemas por meio de busca Inteligência Artificial - IBM1024 3. Resolução de problemas por meio de busca Prof. Renato Tinós Local: Depto. de Computação e Matemática (FFCLRP/USP) 1 Principais Tópicos 3. Resolução de problemas por

Leia mais

Inteligência Artificial

Inteligência Artificial Contextualizando Inteligência Artificial Buscas Onde podemos usar a IA Problemas que não possuem soluções algortimicas Problemas que possuem soluções algoritimicas, mas são impraticáveis (Complexidade,

Leia mais

Busca com informação e exploração. Inteligência Artificial. Busca pela melhor escolha. Romênia com custos em km. Busca com informação (ou heurística)

Busca com informação e exploração. Inteligência Artificial. Busca pela melhor escolha. Romênia com custos em km. Busca com informação (ou heurística) Inteligência Artificial Aula 5 Profª Bianca Zadrozny http://www.ic.uff.br/~bianca/ia Busca com informação e exploração Capítulo 4 Russell & Norvig Seção 4.1 Busca com informação (ou heurística) Utiliza

Leia mais

Metodologia de inversão

Metodologia de inversão 6 Metodologia de inversão Nesta tese, a transformação de velocidades em pressão de poros é encarada como um problema de inversão. Pela natureza do problema, essa transformação apresenta caráter não único

Leia mais

Jogos markovianos alternados sob incerteza. Fábio de Oliveira Franco

Jogos markovianos alternados sob incerteza. Fábio de Oliveira Franco Jogos markovianos alternados sob incerteza Fábio de Oliveira Franco DISSERTAÇÃO APRESENTADA AO INSTITUTO DE MATEMÁTICA E ESTATÍSTICA DA UNIVERSIDADE DE SÃO PAULO PARA OBTENÇÃO DO TÍTULO DE MESTRE EM CIÊNCIAS

Leia mais

Resolução de Problemas: Busca Heurística

Resolução de Problemas: Busca Heurística Resolução de Problemas: Busca Heurística Aula 3 - Inteligência Artificial Busca Heurística Duas variações: Busca usando heurística (não numérica). Busca usando funções de avaliação e funções de custo.

Leia mais

Busca com informação e exploração. Inteligência Artificial

Busca com informação e exploração. Inteligência Artificial Busca com informação e exploração (Capítulo 4 - Russell) Inteligência Artificial Professor: Rosalvo Ferreira de Oliveira Neto Estrutura Busca pela melhor escolha Busca gulosa pela melhor escolha Busca

Leia mais

UMA INTRODUÇÃO AOS ALGORITMOS GENETICOS

UMA INTRODUÇÃO AOS ALGORITMOS GENETICOS UMA INTRODUÇÃO AOS ALGORITMOS GENETICOS Uma visão geral dos GAs Um algoritmo genético é uma classe de algoritmo de busca. O algoritmo procura uma solução dentro de um espaço para um problema de otimização.

Leia mais

Técnicas Inteligência Artificial

Técnicas Inteligência Artificial Universidade do Sul de Santa Catarina Ciência da Computação Técnicas Inteligência Artificial Aula 03 Métodos de Busca Prof. Max Pereira Solução de Problemas como Busca Um problema pode ser considerado

Leia mais

3. Resolução de problemas por meio de busca

3. Resolução de problemas por meio de busca Inteligência Artificial - IBM1024 3. Resolução de problemas por meio de busca Prof. Renato Tinós Local: Depto. de Computação e Matemática (FFCLRP/USP) 1 Principais Tópicos 3. Resolução de problemas por

Leia mais

PROCESSOS DE DECISÃO MARKOVIANOS COM PROBABILIDADES IMPRECISAS: UMA SOLUÇÃO COM PROGRAMAÇÃO EM DOIS NÍVEIS 1

PROCESSOS DE DECISÃO MARKOVIANOS COM PROBABILIDADES IMPRECISAS: UMA SOLUÇÃO COM PROGRAMAÇÃO EM DOIS NÍVEIS 1 PROCESSOS DE DECISÃO MARKOVIANOS COM PROBABILIDADES IMPRECISAS: UMA SOLUÇÃO COM PROGRAMAÇÃO EM DOIS NÍVEIS Author(s): Karina Valdivia Delgado Leliane Nunes de Barros This work was supported by Fapesp Project

Leia mais

Aula 14. Aula de hoje. Aula passada

Aula 14. Aula de hoje. Aula passada Aula 14 Aula passada Autovalores, autovetores, decomposição Convergência para estacionaridade Tempo de mistura Spectral gap Tempo de mistura de passeios aleatórios Aula de hoje Caminho amostral Teorema

Leia mais

5 VNS com Filtro e Reconexão por Caminhos

5 VNS com Filtro e Reconexão por Caminhos 5 VNS com Filtro e Reconexão por Caminhos A metaheurística VNS (Variable Neighborhood Search) foi proposta por Mladenović e Hansen [40] e possui como idéia básica a mudança de vizinhanças realizada da

Leia mais

Métodos Numéricos. Professor Tenani - 9 de Agosto de 2015

Métodos Numéricos. Professor Tenani -  9 de Agosto de 2015 Métodos Numéricos Professor Tenani - www.professortenani.com.br 9 de Agosto de 2015 Métodos Numéricos Professor Tenani - www.professortenani.com.br 1 / 51 Índice Métodos Numéricos Professor Tenani - www.professortenani.com.br

Leia mais

Inteligência Artificial

Inteligência Artificial Inteligência Artificial Aula 6 Algoritmos Genéticos M.e Guylerme Velasco Roteiro Introdução Otimização Algoritmos Genéticos Representação Seleção Operadores Geneticos Aplicação Caixeiro Viajante Introdução

Leia mais

6 Aplicação do Modelo de Geração de Cenários

6 Aplicação do Modelo de Geração de Cenários 6 Aplicação do Modelo de Geração de Cenários 6.. Considerações Iniciais Os cenários de energia natural afluente, que são utilizados durante as simulações forward e backward do processo de definição da

Leia mais

Tópicos Especiais: Inteligência Artificial BUSCA COM INFORMAÇÃO E EXPLORAÇÃO

Tópicos Especiais: Inteligência Artificial BUSCA COM INFORMAÇÃO E EXPLORAÇÃO Tópicos Especiais: Inteligência Artificial BUSCA COM INFORMAÇÃO E EXPLORAÇÃO Material baseado e adaptado do Cap. 4 do Livro Inteligência Artificial de Russell & Norvig Bibliografia Inteligência Artificial

Leia mais

Prof. Lorí Viali, Dr. PUCRS FAMAT: Departamento de Estatística. Curso: Engenharia de Produção

Prof. Lorí Viali, Dr. PUCRS FAMAT: Departamento de Estatística. Curso: Engenharia de Produção Considere a função f(x). Para algum x a f (x) pode não existir. Suponha que se queira resolver o seguinte PPNL: Max f(x) s. a a x b Pode ser que f (x) não exista ou que seja difícil resolver a equação

Leia mais

Considere a função f(x). Para algum x a f (x) pode não existir. Suponha que. Max f(x) s. a a x b

Considere a função f(x). Para algum x a f (x) pode não existir. Suponha que. Max f(x) s. a a x b Considere a função f(x). Para algum x a f (x) pode não existir. Suponha que se queira resolver o seguinte PPNL: Max f(x) s. a a x b Pode ser que f (x) não exista ou que seja difícil resolver a equação

Leia mais

1. Computação Evolutiva

1. Computação Evolutiva Computação Bioinspirada - 5955010-1 1. Computação Evolutiva Prof. Renato Tinós Depto. de Computação e Matemática (FFCLRP/USP) 1 1.7. Outras Metaheurísticas Populacionais 1.7.1. Metaheurísticas Populacionais

Leia mais

Busca Heurística. Profa. Josiane M. P. Ferreira

Busca Heurística. Profa. Josiane M. P. Ferreira Busca Heurística Profa. Josiane M. P. Ferreira Texto base: Stuart Russel e Peter Norving - Inteligência Artificial David Poole, Alan Mackworth e Randy Goebel - Computational Intelligence A logical approach

Leia mais

Algoritmos e Estruturas de Dados II

Algoritmos e Estruturas de Dados II Algoritmos e Estruturas de Dados II Grafos VI: Grafos Ponderados & Caminhos Mínimos (Bellman-Ford) Ricardo J. G. B. Campello Parte deste material é baseado em adaptações e extensões de slides disponíveis

Leia mais

Algoritmos Genéticos

Algoritmos Genéticos Algoritmos Genéticos Roteiro Introdução Algoritmos Genéticos Otimização Representação Seleção Operadores Genéticos Aplicação Caixeiro Viajante Introdução Algoritmos Genéticos (AGs), são métodos de otimização

Leia mais

Resumo. Como um agente busca de seqüência de ações para alcançar seus objetivos.

Resumo. Como um agente busca de seqüência de ações para alcançar seus objetivos. Resumo Inteligência Artificial Russel e Norvig Capítulos 3,4 e 5 Prof. MsC Ly Freitas UEG Resolução de problemas por meio de busca Como um agente busca de seqüência de ações para alcançar seus objetivos.

Leia mais

3 Filtro de Kalman Discreto

3 Filtro de Kalman Discreto 3 Filtro de Kalman Discreto As medidas realizadas por sensores estão sujeitas a erros, como pode ser visto no Capítulo 2. Os filtros são aplicados aos sinais medidos pelos sensores para reduzir os erros,

Leia mais

lnteligência Artificial

lnteligência Artificial lnteligência Artificial Busca Heurística - Informada Estratégias de Busca Heurística Usam conhecimento específico do problema na busca da solução Mais eficientes que busca não informada Busca Informada

Leia mais

3 Trabalhos Relacionados

3 Trabalhos Relacionados 3 Trabalhos Relacionados Este capítulo apresenta, em linhas gerais, dois trabalhos relacionados que contribuíram de alguma forma para a concepção e desenvolvimento do método de verificação de sistemas

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial INF 1771 Inteligência Artificial Apresentação da Disciplina Edirlei Soares de Lima O que é Inteligência Artificial? O que é Inteligência Artificial? Área de pesquisa que tem como

Leia mais

Planejamento probabilístico usando programação dinâmica assíncrona e fatorada. Mijail Gamarra Holguin

Planejamento probabilístico usando programação dinâmica assíncrona e fatorada. Mijail Gamarra Holguin Planejamento probabilístico usando programação dinâmica assíncrona e fatorada Mijail Gamarra Holguin Dissertação apresentada ao Instituto de Matemática e Estatística da Universidade de São Paulo Programa:

Leia mais

Lista de Exercícios 07 Introdução à Ciência de Computação II (SCC0201/501)

Lista de Exercícios 07 Introdução à Ciência de Computação II (SCC0201/501) Lista de Exercícios 07 Introdução à Ciência de Computação II (SCC0201/501) Prof. Moacir P. Ponti Jr. 24 de novembro de 2010 1 Hashing 1. Suponha uma tabela hash de tamanho 10 com endereçamento aberto para

Leia mais

Um Algoritmo Genético com Aprendizado por Reforço Simples aplicado ao problema do Mundo de Grid

Um Algoritmo Genético com Aprendizado por Reforço Simples aplicado ao problema do Mundo de Grid 1 Um Algoritmo Genético com Aprendizado por Reforço Simples aplicado ao problema do Mundo de Grid Luciana Conceição Dias Campos Resumo Este trabalho consiste da aplicação de um algoritmo genético ao método

Leia mais

Jogos. Geralmente o oponente tentará, na medida do possível, fazer o movimento menos benéfico para o adversário.

Jogos. Geralmente o oponente tentará, na medida do possível, fazer o movimento menos benéfico para o adversário. Jogos Os jogos tem atraído a atenção da humanidade, às vezes de modo alarmante, desde a antiguidade. O que o torna atraente para a IA é que é uma abstração da competição (guerra), onde se idealizam mundos

Leia mais

Busca em Espaço de Estados a

Busca em Espaço de Estados a Busca em Espaço de Estados a Fabrício Jailson Barth BandTec Agosto de 2012 a Slides baseados no material do Prof. Jomi F. Hübner (UFSC) Introdução 2 Agente orientado a meta O projetista não determina um

Leia mais

Otimização em Colônias de Formigas. Prof. Eduardo R. Hruschka (Slides adaptados dos originais elaborados pelo Prof. André C. P. L. F.

Otimização em Colônias de Formigas. Prof. Eduardo R. Hruschka (Slides adaptados dos originais elaborados pelo Prof. André C. P. L. F. Otimização em Colônias de Formigas Prof. Eduardo R. Hruschka (Slides adaptados dos originais elaborados pelo Prof. André C. P. L. F. de Carvalho) Principais tópicos Introdução Colônias de Formigas Formação

Leia mais

Problema do Caminho Mínimo

Problema do Caminho Mínimo Departamento de Engenharia de Produção UFPR 63 Problema do Caminho Mínimo O problema do caminho mínimo ou caminho mais curto, shortest path problem, consiste em encontrar o melhor caminho entre dois nós.

Leia mais

Introdução aos Algoritmos Genéticos

Introdução aos Algoritmos Genéticos Introdução aos Algoritmos Genéticos Prof. Matheus Giovanni Pires EXA 868 Inteligência Artificial Não-Simbólica B Universidade Estadual de Feira de Santana 2 Algoritmos Genéticos: Introdução Introduzidos

Leia mais

Pesquisa Operacional Introdução. Profa. Alessandra Martins Coelho

Pesquisa Operacional Introdução. Profa. Alessandra Martins Coelho Pesquisa Operacional Introdução Profa. Alessandra Martins Coelho julho/2014 Operational Research Pesquisa Operacional - (Investigação operacional, investigación operativa) Termo ligado à invenção do radar

Leia mais

Aula 12: Programação Inteira

Aula 12: Programação Inteira Aula 12: Programação Inteira Otimização Linear e Inteira Túlio A. M. Toffolo http://www.toffolo.com.br BCC464/PCC174 2018/2 Departamento de Computação UFOP Aula de Hoje 1 Programação Inteira: A Formulação

Leia mais

Técnicas de Projeto de Algoritmos

Técnicas de Projeto de Algoritmos UNIVERSIDADE NOVE DE JULHO - UNINOVE Pesquisa e Ordenação Técnicas de Projeto de Algoritmos Material disponível para download em: www.profvaniacristina.com Profa. Vânia Cristina de Souza Pereira 03 _ Material

Leia mais

Teoria da Computação. Complexidade computacional classes de problemas

Teoria da Computação. Complexidade computacional classes de problemas Teoria da Computação Complexidade computacional classes de problemas 1 Universo de problemas Problemas indecidíveis ou não-computáveis Não admitem algoritmos Problemas intratáveis Não admitem algoritmos

Leia mais

Métodos de Busca Informada (best first search) Capítulo 4 Parte I

Métodos de Busca Informada (best first search) Capítulo 4 Parte I Métodos de Busca Informada (best first search) Capítulo 4 Parte I Leliane Nunes de Barros leliane@ime.usp.br Busca não informada: geração sistemática de estados Busca em profundidade: boa quando não se

Leia mais

ALGORITMOS AVANÇADOS UNIDADE I Análise de Algoritmo - Notação O. Luiz Leão

ALGORITMOS AVANÇADOS UNIDADE I Análise de Algoritmo - Notação O. Luiz Leão Luiz Leão luizleao@gmail.com http://www.luizleao.com Conteúdo Programático 1.1 - Algoritmo 1.2 - Estrutura de Dados 1.2.1 - Revisão de Programas em C++ envolvendo Vetores, Matrizes, Ponteiros, Registros

Leia mais

Recursividade, Tentativa e Erro

Recursividade, Tentativa e Erro Recursividade, Tentativa e Erro Túlio Toffolo www.toffolo.com.br Marco Antônio Carvalho marco.opt@gmail.com BCC402 Aula 07 Algoritmos e Programação Avançada Na aula anterior Prova 2 Na aula de hoje Técnicas

Leia mais

Redes de Computadores III / /

Redes de Computadores III / / Redes de Computadores III / / Aula : Algoritmo Vetor de Distância Professor: Eraldo Silveira e Silva eraldo@ifsc.edu.br 1 Objetivos da Aula Apresentar o algoritmo vetor de distâncias; Discutir algumas

Leia mais

Uma Introdução à Busca Tabu André Gomes

Uma Introdução à Busca Tabu André Gomes Uma Introdução à Busca Tabu André Gomes Departamento de Ciência da Computação, Instituto de Matemática e Estatística, Universidade de São Paulo, SP, Brasil Novembro de 2009 INTRODUÇÃO Método de Busca Local

Leia mais

Inteligência Artificial. Estratégias de Busca Outros. Huei Diana Lee

Inteligência Artificial. Estratégias de Busca Outros. Huei Diana Lee Inteligência Artificial Estratégias de Busca Outros Huei Diana Lee Redução de Problemas Até então consideramos estratégias para as quais o espaço de busca é representado por meio de Grafos OU Objetivo:

Leia mais

ESTATÍSTICA COMPUTACIONAL

ESTATÍSTICA COMPUTACIONAL ESTATÍSTICA COMPUTACIONAL Ralph dos Santos Silva Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Considere o problema de encontrar o valor que

Leia mais

Otimização por Colônia de Formigas (ACO)

Otimização por Colônia de Formigas (ACO) Otimização por Colônia de Formigas (ACO) Inspiração Biológica Proposto por Dorigo e Gambardella em 1997 ACO (Ant Colony Optimization) Principal aplicação no PCV Programação do algoritmo Inspiração Biológica

Leia mais

DESENVOLVIMENTO DE UM MÓDULO DE PROGRAMAÇÃO LINEAR NO PROGRAMA OPTIMI

DESENVOLVIMENTO DE UM MÓDULO DE PROGRAMAÇÃO LINEAR NO PROGRAMA OPTIMI DESENVOLVIMENTO DE UM MÓDULO DE PROGRAMAÇÃO LINEAR NO PROGRAMA OPTIMI BIONDI C. O.¹, VIANNA S. S. V. 2, RODRIGUES M. T. M.³ 1 Universidade Estadual de Campinas, Departamento de Engenharia de Sistemas Químicos

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 24 Aprendizado Por Reforço Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor (KNN).

Leia mais

Aprendizado por Reforço

Aprendizado por Reforço Aprendizado por Reforço SCC5865-Robótica Roseli A F Romero Introdução O modelo padrão de aprendizado por reforço Aprendizado por Reforço Formalmente, o modelo consiste de: Um conjunto discreto de estados

Leia mais

Pesquisa Operacional Introdução. Profa. Alessandra Martins Coelho

Pesquisa Operacional Introdução. Profa. Alessandra Martins Coelho Pesquisa Operacional Introdução Profa. Alessandra Martins Coelho agosto/2013 Operational Research Pesquisa Operacional - (Investigação operacional, investigación operativa) Termo ligado à invenção do radar

Leia mais

Algoritmos para resolução de problemas de minimização irrestrita

Algoritmos para resolução de problemas de minimização irrestrita Algoritmos para resolução de problemas de minimização irrestrita Marina Andretta ICMC-USP 10 de agosto de 2010 Marina Andretta (ICMC-USP) sme0212 - Otimização não-linear 10 de agosto de 2010 1 / 16 Algoritmos

Leia mais

Teoria dos Grafos Aula 22

Teoria dos Grafos Aula 22 Teoria dos Grafos Aula 22 Aula passada Caminho mais curto entre todos os pares Algoritmo de Floyd Warshall Programação dinâmica Aula de hoje Caminho mais curto Algoritmo de Bellman Ford Melhorias Caminho

Leia mais

Universidade de São Paulo - USP. Instituto de Física de São Carlos - IFSC. Programação de Alto Desempenho. Prática 1. André de Freitas Smaira

Universidade de São Paulo - USP. Instituto de Física de São Carlos - IFSC. Programação de Alto Desempenho. Prática 1. André de Freitas Smaira Universidade de São Paulo - USP Instituto de Física de São Carlos - IFSC Programação de Alto Desempenho Prática 1 Aluno: André de Freitas Smaira 1 Otimização pelo Compilador Atualmente, os compiladores

Leia mais

3. Resolução de problemas por meio de busca

3. Resolução de problemas por meio de busca Inteligência Artificial - IBM1024 3. Resolução de problemas por meio de busca Prof. Renato Tinós Local: Depto. de Computação e Matemática (FFCLRP/USP) 1 Principais Tópicos 3. Resolução de problemas por

Leia mais

Vários modelos: um SAD pode incluir vários modelos, cada um representando uma parte diferente do problema de tomada de decisão Categorias de modelos

Vários modelos: um SAD pode incluir vários modelos, cada um representando uma parte diferente do problema de tomada de decisão Categorias de modelos MODELAGEM E ANÁLISE Modelagem Questões atuais de modelagem Vários modelos: um SAD pode incluir vários modelos, cada um representando uma parte diferente do problema de tomada de decisão Categorias de modelos

Leia mais

Inteligência Computacional

Inteligência Computacional Rafael D. Ribeiro, M.Sc. rafaeldiasribeiro@gmail.com http://www.rafaeldiasribeiro.com.br Agente: É um elemento qualquer capaz de perceber seu ambiente por meio de sensorese de agir sobre este ambiente

Leia mais

Agentes baseados em metas Capítulo 3 Parte I

Agentes baseados em metas Capítulo 3 Parte I Agentes baseados em metas Capítulo 3 Parte I Leliane Nunes de Barros leliane@ime.usp.br Agente reativo simples também chamado de agente situado ou agente estímulo-resposta reage a estímulos do ambiente

Leia mais

Marina Andretta. 17 de setembro de Baseado no livro Numerical Optimization, de J. Nocedal e S. J. Wright.

Marina Andretta. 17 de setembro de Baseado no livro Numerical Optimization, de J. Nocedal e S. J. Wright. Métodos de regiões de confiança Marina Andretta ICMC-USP 17 de setembro de 2014 Baseado no livro Numerical Optimization, de J. Nocedal e S. J. Wright. Marina Andretta (ICMC-USP) sme0212 - Otimização não-linear

Leia mais

7 Desempenho dos Algoritmos de uma Classe de Usuários em Relação à Distribuição que Representa o Tempo de Permanência do Usuário na Célula

7 Desempenho dos Algoritmos de uma Classe de Usuários em Relação à Distribuição que Representa o Tempo de Permanência do Usuário na Célula 7 Desempenho dos Algoritmos de uma Classe de Usuários em Relação à Distribuição que Representa o Tempo de Permanência do Usuário na Célula Neste capítulo os sete algoritmos de controle de admissão propostos

Leia mais

6 Estudo de Casos: Valor da Opção de Investimento em Informação por Aproximação com Números Fuzzy 6.1. Introdução

6 Estudo de Casos: Valor da Opção de Investimento em Informação por Aproximação com Números Fuzzy 6.1. Introdução 6 Estudo de Casos: Valor da Opção de Investimento em Informação por Aproximação com Números Fuzzy 6.1. Introdução Este capítulo apresenta o segundo estudo de casos, no qual também são empregados números

Leia mais

Modelagem e Análise de Sistemas de Computação Aula 20

Modelagem e Análise de Sistemas de Computação Aula 20 Modelagem e Análise de Sistemas de Computação Aula 20 Aula passada Lei dos grandes números Calculando integrais Gerando outras distribuições Método da transformada inversa Aula de hoje Simulando uma fila

Leia mais

Modelos matemáticos para resolução de problemas de afectação de operações a recursos produtivos

Modelos matemáticos para resolução de problemas de afectação de operações a recursos produtivos Métodos de Análise de Sistemas Produtivos Modelos matemáticos para resolução de problemas de afectação de operações a recursos produtivos 17 de Maio de 2002 Alunos: Álvaro Magalhães Bernardo Ribeiro João

Leia mais

Busca Cega (Exaustiva) e Heurística. Busca Aula 2

Busca Cega (Exaustiva) e Heurística. Busca Aula 2 Busca Cega (Exaustiva) e Heurística Busca Aula 2 Ao final desta aula a gente deve saber: Conhecer as várias estratégias de realizar Busca não-informada (Busca Cega) Determinar que estratégia se aplica

Leia mais

Inteligência Artificial - IA

Inteligência Artificial - IA Busca sem informação Estratégias para determinar a ordem de expansão dos nós: 1. Busca em extensão 2. Busca de custo uniforme 3. Busca em profundidade 4. Busca com aprofundamento iterativo Direção da expansão:

Leia mais

Busca com informação e exploração. Capítulo 4 Russell & Norvig Seção 4.1

Busca com informação e exploração. Capítulo 4 Russell & Norvig Seção 4.1 Busca com informação e exploração Capítulo 4 Russell & Norvig Seção 4.1 1 Busca com informação (ou heurísica) UIliza conhecimento específico sobre o problema para encontrar soluções de forma mais eficiente

Leia mais

Busca com informação e exploração. Capítulo 4 Russell & Norvig Seção 4.2 e 4.3

Busca com informação e exploração. Capítulo 4 Russell & Norvig Seção 4.2 e 4.3 Busca com informação e exploração Capítulo 4 Russell & Norvig Seção 4.2 e 4.3 1 Revisão da aula passada: Busca A * Idéia: evitar expandir caminhos que já são caros Função de avaliação f(n) = g(n) + h(n)

Leia mais

Redes Neurais (Inteligência Artificial)

Redes Neurais (Inteligência Artificial) Redes Neurais (Inteligência Artificial) Apresentação da Disciplina Edirlei Soares de Lima O que é Inteligência Artificial? O que é Inteligência Artificial? Área de pesquisa que tem

Leia mais

Visão Geral Definições Resultados. Mecanismos Online. Fabio Alexandre Campos Tisovec

Visão Geral Definições Resultados. Mecanismos Online. Fabio Alexandre Campos Tisovec Instituto de Matemática e Estatística - Universidade de São Paulo June 17, 2013 Conteúdo 1 2 3 Conteúdo 1 2 3 Conteúdo 1 2 3 1 2 3 Caracterização do Problema Problemas considerados: Conjunto de jogadores

Leia mais

Complexidade de Tempo e Espaço

Complexidade de Tempo e Espaço Complexidade de Tempo e Espaço Profa. Sheila Morais de Almeida DAINF-UTFPR-PG junho - 2018 Sheila Almeida (DAINF-UTFPR-PG) Complexidade de Tempo e Espaço junho - 2018 1 / 43 Este material é preparado usando

Leia mais

An adaptive Metropolis algorithm

An adaptive Metropolis algorithm An adaptive Metropolis algorithm 4 de outubro de 2018 Autores: Heikki Haario, Eero Saksman and Johanna Tamminen Apresentação: Luiza Sette C. Piancastelli, Thaís Pacheco Menezes Disciplina: Métodos Computacionais

Leia mais

Transparências de apoio à lecionação de aulas teóricas. c 2012, 2011, 2009, 1998 José Fernando Oliveira, Maria Antónia Carravilla FEUP

Transparências de apoio à lecionação de aulas teóricas. c 2012, 2011, 2009, 1998 José Fernando Oliveira, Maria Antónia Carravilla FEUP Programação Linear Transparências de apoio à lecionação de aulas teóricas Versão 4 c 2012, 2011, 2009, 1998 José Fernando Oliveira, Maria Antónia Carravilla FEUP Programação Linear Problema de planeamento

Leia mais

Buscas Informadas ou Heurísticas - Parte I

Buscas Informadas ou Heurísticas - Parte I Buscas Informadas ou Heurísticas - Parte I Prof. Cedric Luiz de Carvalho Instituto de Informática - UFG Graduação em Ciência da Computação / 2006 BUSCAS INFORMADAS OU HEURÍSTICAS Consideram a probabilidade

Leia mais

Juliana Kaizer Vizzotto. Universidade Federal de Santa Maria. Disciplina de Teoria da Computação

Juliana Kaizer Vizzotto. Universidade Federal de Santa Maria. Disciplina de Teoria da Computação Universidade Federal de Santa Maria Disciplina de Teoria da Computação Quais são as capacidades e limitações fundamentais dos computadores? Funções Computáveis Algoritmo: descrição finitade uma computação

Leia mais