lnteligência Artificial Introdução ao Aprendizado por Reforço (Reinforcement Learning)
|
|
- Luiz Guilherme Furtado Osório
- 4 Há anos
- Visualizações:
Transcrição
1 lnteligência Artificial Introdução ao Aprendizado por Reforço (Reinforcement Learning)
2 Processo Decisório de Markov e Aprendizado por Reforço Quando falamos sobre Processo decisório de Markov e formalizamos o problema como uma tupla <S,A,p,r>. Assumimos que nós sabiamos S,A, p e r e então buscamos uma solução ótima, isto é, uma função ou política que tivesse o maior retorno esperado. Em aprendizado por reforço (Reinforcement Learning), nós queremos um agente que tenha um bom desempenho em um mundo MDP, mas que começa sem saber nada sobre p ou r
3 Como resolver o problema sem p e r? Idéias? Opção A: Aprender p e r e depois utilizar as técnicas conhecidas para encontrar a função de valor e assim a política ótima Opção B: Estimar a função de valor diretamente sem explicitamente calcular p ou r.
4 Como descobrir políticas sem conhecer as probabilidades e retornos
5 Estimativa de Parâmetros
6 Problemas com Estimativa de Parâmetros
7 Estimar a função de valor diretamente
8 Como escolher as ações?
9 Exemplo: Caça-níqueis (Armed bandit)
10 Opções. Agir aleatoriamente? Mudar de máquina a cada vez que perder? Melhor que aleatório, mas não é ótimo Estimar as probabilidades de cada máquina através de contagem e depois permanece na melhor. Como estimar?
11 Estratégias
12 Alguns Resultados com E-greedy
13 Lembrando MDP e definindo Função Q..
14 PDM e Aprendizado por Reforço
15 Exemplo
16 Um algoritmo para o aprendizado da Função Q (Q-Learning) O algoritmo Q-Learning (Watkins, 1989) baseia-se em simulações de Monte Carlo e no algoritmo Robbins- Monro Simulações Monte-Carlo baseiam-se na amostragem de estados para estimar seus valores (abordagem força bruta) Algoritmo Robbins-Monro permite aprender uma função onde um de seus parâmetros é uma variável aleatória com distribuição de probabilidade conhecida, utilizando uma taxa de aprendizagem α que se altera ao longo do tempo segundo certas condições. Maiores informações sobre a dedução do Q-Learning, Monte Carlo e Robbins-Monro podem ser obtidas em: Reinforcement Learning: An Introduction, Sutton,R. and Barko,A. MIT Press. 1998
17 Q-Learning
18 Taxa de Aprendizado e Convergência
19 Taxa de Aprendizado e Convergência
20 Algoritmo Q-Learning
21 Um exemplo bastante simples
22 Exemplos de aplicações
23 Problemas com Q-Learning
24 Problemas com Q-Learning - 2
25 Q-Learning: Exercício
26 Outro algoritmo para RL: SARSA
27 Q-Learning x SARSA Q-Learning é o método mais usado É do tipo off-policy (não é necessário seguir uma política) Sarsa Por eliminar o uso de uma função de maximização, tende a ser mais rápido que Q-Learning, quando há grande número de ações possíveis Tem basicamente as mesmas condições de convergência Permite descontar diferenças temporais gerando um Sarsa(λ) similar a algoritmos TD(λ)
28 Conclusões sobre Aprendizado por Reforço Aprendizado por reforço permite que se aprenda a política ótima, mesmo sem saber previamente a função de probabilidade de transição (p) ou a função de recompensa imediata (r) Aprendizado por reforço é uma tecnologia promissora, há muita pesquisa sendo feita na área e também aplicações real world Mais referências: Reinforcement Learning: An Introduction, Sutton,R. and Barko,A. MIT Press Bertsekas,D. and Tsitsiklis, J.N. Neurodynamic programming. Athena Scientifc. Belmont. Massachusetts. 1996
CES Modelos Probabilísticos em Grafos Introdução a Modelo Decisório de Markov
CES -161 - Modelos Probabilísticos em Grafos Introdução a Modelo Decisório de Markov Prof. Paulo André Castro www.comp.ita.br/~pauloac pauloac@ita.br Sala 110, IEC-ITA Aprendizado - paradigmas Aprendizado
Leia maisCES Modelos Probabilísticos em Grafos Introdução a Modelo Decisório de Markov
CES -161 - Modelos Probabilísticos em Grafos Introdução a Modelo Decisório de Markov Prof. Paulo André Castro www.comp.ita.br/~pauloac pauloac@ita.br Sala 110, IEC-ITA Aprendizado - paradigmas Aprendizado
Leia maisCEFET/RJ Inteligência Artificial (2018.1) Prof. Eduardo Bezerra Lista de exercícios 04
. CEFET/RJ Inteligência Artificial (2018.1) Prof. Eduardo Bezerra (ebezerra@cefet-rj.br) Lista de exercícios 04 Créditos: essa lista de exercícios contém a tradução dos exercícios disponibilizados na disciplina
Leia mais3 Aprendizado por reforço
3 Aprendizado por reforço Aprendizado por reforço é um ramo estudado em estatística, psicologia, neurociência e ciência da computação. Atraiu o interesse de pesquisadores ligados a aprendizado de máquina
Leia maislnteligência Artificial Introdução ao Processo Decisório de Markov
lnteligência Artificial Introdução ao Processo Decisório de Markov Aprendizado - paradigmas Aprendizado supervisionado O crítico comunica a EA o erro relativo entre a ação que deve ser tomada idealmente
Leia maisAprendizado por Reforço
Aprendizado por Reforço SCC5865-Robótica Roseli A F Romero Introdução O modelo padrão de aprendizado por reforço Aprendizado por Reforço Formalmente, o modelo consiste de: Um conjunto discreto de estados
Leia maisAprendizagem por Reforço
Aprendizagem por Reforço Motivação! Como um agente aprende a escolher ações apenas interagindo com o ambiente? n n Muitas vezes, é impraticável o uso de aprendizagem supervisionada w Como obter exemplos
Leia maisAprendizado por Reforço
Aprendizado por Reforço Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Aprendizado por Reforço 2. Q-Learning 3. SARSA 4. Outras ideias 1 Aprendizado por Reforço Problemas de decisão
Leia maisAprendizado por Reforço para um Sistema Tutor Inteligente sem Modelo
Aprendizado por Reforço para um Sistema Tutor Inteligente sem Modelo Explícito do Aprendiz Marcus Vinícius Carvalho Guelpeli Divisão de Ciência da Computação Instituto Tecnológico de Aeronáutica São José
Leia maisAula 17. Aula de hoje. Aula passada. Problemas Monte Carlo na moda Caminho trilhado Desafios à frente Avaliação
Aula 17 Aula passada Otimização Caixeiro viajante Hill Climbing Distribuição de Boltzman Simulated Annealing De volta ao caixeiro Aula de hoje Problemas Monte Carlo na moda Caminho trilhado Desafios à
Leia mais2 Aprendizado de Máquina
2 Aprendizado de Máquina Desde que os computadores foram inventados, sempre nos perguntamos se eles poderiam ser feitos para aprender. Se pudéssemos compreender como programá-los para aprender e melhorar
Leia maisAprendizado por reforço em lote para o problema de tomada de decisão em processos de venda
Aprendizado por reforço em lote para o problema de tomada de decisão em processos de venda Denis Antonio Lacerda e Leliane Nunes de Barros Departamento de Ciência da Computação, IME/USP denis@ime.usp.br,
Leia maisUm Algoritmo Genético com Aprendizado por Reforço Simples aplicado ao problema do Mundo de Grid
1 Um Algoritmo Genético com Aprendizado por Reforço Simples aplicado ao problema do Mundo de Grid Luciana Conceição Dias Campos Resumo Este trabalho consiste da aplicação de um algoritmo genético ao método
Leia maisUtilização de Aprendizagem por Reforço para Modelagem Autônoma do Aprendiz em um Tutor Inteligente
Utilização de Aprendizagem por Reforço para Modelagem Autônoma do Aprendiz em um Tutor Inteligente Modalidade Artigo Completo Marcus V. C. Guelpeli 1, Carlos H. C. Ribeiro 1 e Nizam Omar 2 1 Divisão de
Leia maisINF 1771 Inteligência Artificial
Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 24 Aprendizado Por Reforço Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor (KNN).
Leia maisCENTRO UNIVERSITÁRIO DA FEI DANILO HERNANI PERICO USO DE HEURÍSTICAS OBTIDAS POR MEIO DE DEMONSTRAÇÕES PARA ACELERAÇÃO DO APRENDIZADO POR REFORÇO
CENTRO UNIVERSITÁRIO DA FEI DANILO HERNANI PERICO USO DE HEURÍSTICAS OBTIDAS POR MEIO DE DEMONSTRAÇÕES PARA ACELERAÇÃO DO APRENDIZADO POR REFORÇO São Bernardo do Campo 2012 DANILO HERNANI PERICO Uso de
Leia maisReinforcement Learning
Reinforcement Learning (Aprendizado por Reforço) Karla Figueiredo DEE/PUC-Rio 1 Sumário Introdução Motivação Histórico Conceitos básicos Fundamentos Teóricos Processos de Decisão de Markov Propriedade
Leia maisAPLICAÇÃO DO ALGORITMO SARSA NA COLETA DE LIXO - ESTUDO DO PARÂMETRO ALPHA 1
APLICAÇÃO DO ALGORITMO SARSA NA COLETA DE LIXO - ESTUDO DO PARÂMETRO ALPHA 1 Darlinton Prauchner 2, Rogério Martins 3, Edson Padoin 4. 1 Trabalho de conclusão de curso realiazado no curso de Ciência da
Leia maisUso de Heurísticas para a Aceleração do Aprendizado por
Uso de Heurísticas para a Aceleração do Aprendizado por Reforço Reinaldo A. C. Bianchi 1,2, Anna H. R. Costa 1 1 Laboratório de Técnicas Inteligentes Escola Politécnica da Universidade de São Paulo Av.
Leia maisUSO DE HEURÍSTICAS OBTIDAS POR MEIO DE DEMONSTRAÇÕES PARA ACELERAÇÃO DO APRENDIZADO POR REFORÇO
USO DE HEURÍSTICAS OBTIDAS POR MEIO DE DEMONSTRAÇÕES PARA ACELERAÇÃO DO APRENDIZADO POR REFORÇO DANILO H. PERICO, REINALDO A. C. BIANCHI Centro Universitário da FEI, Av. Humberto de Alencar Castelo Branco,
Leia maisAula 14. Aula de hoje. Aula passada
Aula 14 Aula passada Autovalores, autovetores, decomposição Convergência para estacionaridade Tempo de mistura Spectral gap Tempo de mistura de passeios aleatórios Aula de hoje Caminho amostral Teorema
Leia maisUso de Heurísticas para a Aceleração do Aprendizado por Reforço
Proceedings of the International Joint Conference IBERAMIA/SBIA/SBRN 2006-5th Best MSc dissertation/phd thesis contest (CTDIA 2006), Ribeirão Preto, Brazil, October 23 28, 2006. CD-ROM. ISBN 85-87837-11-7
Leia maisPrograma: Ciência da Computação Orientadora: Prof ạ Dr ạ Leliane Nunes de Barros
Aprendizado por reforço em lote: um estudo de caso para o problema de tomada de decisão em processos de venda Denis Antonio Lacerda Dissertação apresentada ao Instituto de Matemática e Estatística da Universidade
Leia maisTópicos Especiais em Inteligência Artificial COS746. Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro
Tópicos Especiais em Inteligência Artificial COS746 Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro Agradecimento Copiado dos slides de Mark Craven/C. David Page para BMI/CS 576,
Leia maisUTILIZAÇÃO DE APRENDIZADO POR REFORÇO PARA APRENDER A ESTRATÉGIA DO JOGO DA VELHA
Anais do 12 O Encontro de Iniciação Científica e Pós-Graduação do ITA XII ENCITA / 2006 Instituto Tecnológico de Aeronáutica São José dos Campos SP Brasil Outubro 16 a19 2006 UTILIZAÇÃO DE APRENDIZADO
Leia maisIA - Planejamento II
PO IA - Planejamento II Professor Paulo Gurgel Pinheiro MC906A - Inteligência Articial Instituto de Computação Universidade Estadual de Campinas - UNICAMP 16 de Novembro de 2010 1 / 48 PO http://www.ic.unicamp.br/
Leia maisSEMÁFORO INTELIGENTE UMA APLICAÇÃO DE APRENDIZAGEM POR REFORÇO
Anais do XIX Congresso Brasileiro de Automática, CBA 2012. SEMÁFORO INTELIGENTE UMA APLICAÇÃO DE APRENDIZAGEM POR REFORÇO GABRIEL M. COSTA, GUILHERME S. BASTOS Centro de Referência em Tecnologias da Informação,
Leia maisAprendizado por Reforço usando Aproximação
Aprendizado por Reforço usando Aproximação de Funções Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Aproximação de Funções 2. Do the evolution 1 Aproximação de Funções Função Utilidade
Leia maisAprendizado de Máquina
Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCENS UFES Departamento de Computação Aprendizado de Máquina Inteligência Artificial Site: http://jeiks.net E-mail: jacsonrcsilva@gmail.com
Leia maisOTIMIZAÇÃO DE PORTFÓLIO PARA UMA CARTEIRA DE CRIPTOMOEDAS: UMA ABORDAGEM EM REINFORCEMENT LEARNING
OTIMIZAÇÃO DE PORTFÓLIO PARA UMA CARTEIRA DE CRIPTOMOEDAS: UMA ABORDAGEM EM REINFORCEMENT LEARNING Daniel Barra Ciências Econômicas Centro Sócio Econômico Tópicos Introdução ao trabalho Uma breve introdução
Leia maisSEMÁFORO INTELIGENTE - INTEGRAÇÃO DE APRENDIZAGEM POR REFORÇO E A TÉCNICA CMAC
SEMÁFORO INTELIGENTE - INTEGRAÇÃO DE APRENDIZAGEM POR REFORÇO E A TÉCNICA CMAC Felipe Lira Santana Silva, Gabriel Melo Costa, Guilherme Sousa Bastos Instituto de Engenharia de Sistemas e Tecnologias da
Leia maisAprendizado Bayesiano Anteriormente...
Aprendizado Bayesiano Anteriormente... Conceito de Probabilidade Condicional É a probabilidade de um evento A dada a ocorrência de um evento B Universidade de São Paulo Instituto de Ciências Matemáticas
Leia maisAprendizagem de Máquinas
Universidade Federal do Rio Grande do Norte Departamento de Engenharia de Computação e Automação Aprendizagem de Máquinas DCA0121 Inteligência Artificial Aplicada Heitor Medeiros 1 Aprendizagem de Máquinas
Leia maisProcessos de Decisão de Markov
Universidade Federal do ABC Bacharelado em Ciência e Tecnologia Disciplina de Inteligência Artificial - Prof. Jerônimo Pellegrini André Filipe de Moraes Batista DIURNO 2008.2 Processos de Decisão de Markov
Leia maisINF 1771 Inteligência Artificial
INF 1771 Inteligência Artificial Aula 11 Aprendizado de Máquina Edirlei Soares de Lima Agentes Vistos Anteriormente Agentes baseados em busca: Busca cega Busca heurística Busca local
Leia maisCEFET/RJ Inteligência Artificial (2017.2) Professor: Eduardo Bezerra Lista de exercícios 03
. CEFET/RJ Inteligência Artificial (2017.2) Professor: Eduardo Bezerra (ebezerra@cefet-rj.br) Lista de exercícios 03 Créditos: essa lista de exercícios contém a tradução dos exercícios disponibilizados
Leia maisAPRENDIZADO POR REFORÇO MULTIAGENTE MULTIOBJETIVO ACELERADO POR HEURÍSTICAS APLICADO AO PROBLEMA DA PRESA E PREDADOR Leonardo A. Ferreira, Carlos H. C. Ribeiro, Reinaldo A. C. Bianchi Centro Universitário
Leia maisAprendizado de Máquina
Aprendizado de Máquina Introdução Luiz Eduardo S. Oliveira Universidade Federal do Paraná Departamento de Informática http://lesoliveira.net Luiz S. Oliveira (UFPR) Aprendizado de Máquina 1 / 19 Introdução
Leia maisAPRENDIZAGEM POR REFORÇO PARA TIMES DE ROBÔS. Carlos Henrique Costa Ribeiro PQ Lucas Heitzmann Gabrielli IC
PRENDIZGEM POR REFORÇO PR TIMES DE ROÔS arlos Henrique osta Ribeiro PQ Lucas Heitzmann Gabrielli I Resumo: Times de robôs autônomos podem propiciar uma forma mais eficiente de solução de tarefas complexas
Leia maisEmerson de Oliveira Antunes Samir Elias Hachem Kerbage
MINISTÉRIO DA DEFESA EXÉRCITO BRASILEIRO DEPARTAMENTO DE CIÊNCIA E TECNOLOGIA INSTITUTO MILITAR DE ENGENHARIA Seção de Engenharia de Computação / SE 8 Emerson de Oliveira Antunes Samir Elias Hachem Kerbage
Leia maisDARLINTON CARLOS KRUPP PRAUCHNER
1 DARLINTON CARLOS KRUPP PRAUCHNER APLICAÇÃO DO ALGORÍTMO DE INTELIGÊNCIA ARTIFICIAL SARSA(λ) À ROBÓTICA NA TAREFA DE COLETA DE LIXO Ijuí 2014 2 DARLINTON CARLOS KRUPP PRAUCHNER APLICAÇÃO DO ALGORÍTMO
Leia maisINF 1771 Inteligência Artificial
Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 14 Aprendizado de Máquina Agentes Vistos Anteriormente Agentes baseados em busca: Busca cega Busca heurística Busca local
Leia maisAnálise Funcional Comparativa de Algoritmos de Aprendizagem por Reforço
INSTITUTO SUPERIOR DE ENGENHARIA DE LISBOA Departamento de Engenharia de Electrónica e Telecomunicações e de Computadores Análise Funcional Comparativa de Algoritmos de Aprendizagem por Reforço João Manuel
Leia maisESTATÍSTICA COMPUTACIONAL
ESTATÍSTICA COMPUTACIONAL Ralph dos Santos Silva Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Considere o problema de encontrar o valor que
Leia maisAprendizado por Reforço Multiagente: Uma Avaliação de Diferentes Mecanismos de Recompensa para o Problema de Aprendizado de Rotas
UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL INSTITUTO DE INFORMÁTICA PROGRAMA DE PÓS-GRADUAÇÃO EM COMPUTAÇÃO RICARDO GRUNITZKI Aprendizado por Reforço Multiagente: Uma Avaliação de Diferentes Mecanismos
Leia maisAprendizado, minimização do arrependimento e equilíbrio (Learning, Regret Minimization, and Equilibria)
Aprendizado, minimização do arrependimento e equilíbrio (Learning, Regret Minimization, and Equilibria) Victor Alberto Romero Instituto de Matemática e Estatística Universidade de São Paulo Teoria dos
Leia maisINF 1771 Inteligência Artificial
INF 1771 Inteligência Artificial Aula 18 Aprendizado Por Reforço Edirlei Soares de Lima Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor (KNN).
Leia maisAprendizagem de máquina
Aprendizagem de máquina Introdução Objetivos Fornecer o ferramental necessário ao entendimento e ao projeto de sistemas baseados em aprendizagem. A disciplina cobre os principais tópicos da aprendizagem
Leia maisCONTROLE REGIONAL DE TENSÃO UTILIZANDO LÓGICA FUZZY E APRENDIZADO POR REFORÇO. Alessandro Bulhões Marques
COPPE/UFRJ CONTROLE REGIONAL DE TENSÃO UTILIZANDO LÓGICA FUZZY E APRENDIZADO POR REFORÇO Alessandro Bulhões Marques Tese de Doutorado apresentada ao Programa de Pós-graduação em Engenharia Elétrica, COPPE,
Leia maisPROCESSO SELETIVO N 42/2019 PROVA 2 - CONHECIMENTOS ESPECÍFICOS
PROCESSO SELETIVO N 42/2019 PROVA 2 - CONHECIMENTOS ESPECÍFICOS LEIA ATENTAMENTE AS INSTRUÇÕES ABAIXO 1. Você recebeu do fiscal o seguinte material: (a) Este caderno, com o enunciado das 20 (vinte) questões
Leia maisAPRENDIZAGEM DA NAVEGAÇÃO EM ROBÔS MÓVEIS A PARTIR DE MAPAS OBTIDOS AUTONOMAMENTE
APRENDIZAGEM DA NAVEGAÇÃO EM ROBÔS MÓVEIS A PARTIR DE MAPAS OBTIDOS AUTONOMAMENTE Sildomar T. Monteiro e Carlos H. C. Ribeiro Divisão de Ciência da Computação Instituto Tecnológico de Aeronáutica Praça
Leia maisEstatística e Modelos Probabilísticos - COE241
Estatística e Modelos Probabilísticos - COE241 Aula passada Algoritmo para simular uma fila Medidas de interesse Média amostral Aula de hoje Teorema do Limite Central Intervalo de Confiança Variância amostral
Leia maisAprendizado de Máquina (Machine Learning)
Ciência da Computação (Machine Learning) Aula 01 Motivação, áreas de aplicação e fundamentos Max Pereira Nem todo conhecimento tem o mesmo valor. O que torna determinado conhecimento mais importante que
Leia maisInteligência nos Negócios (Business Inteligente)
Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 6) Fundamentação da disciplina Analise de dados Decisões
Leia maisAvaliando Hipóteses. George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE
Avaliando Hipóteses George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE Pontos importantes Erro da Amostra e Erro Real Como Calcular Intervalo de Confiança Erros de hipóteses Estimadores Comparando
Leia maisAprendizado por Reforço Multiagente: Uma Avaliação de Diferentes Mecanismos de Recompensa para o Problema de Aprendizado de Rotas
UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL INSTITUTO DE INFORMÁTICA PROGRAMA DE PÓS-GRADUAÇÃO EM COMPUTAÇÃO RICARDO GRUNITZKI Aprendizado por Reforço Multiagente: Uma Avaliação de Diferentes Mecanismos
Leia maisUMA INTRODUÇÃO AOS ALGORITMOS GENETICOS
UMA INTRODUÇÃO AOS ALGORITMOS GENETICOS Uma visão geral dos GAs Um algoritmo genético é uma classe de algoritmo de busca. O algoritmo procura uma solução dentro de um espaço para um problema de otimização.
Leia maisAprendizado por Árvores de Decisão
Universidade Federal de Santa Maria Departamento de Eletrônica e Computação Prof. Cesar Tadeu Pozzer Disciplina de Programação de Jogos 3D E-mail: pozzer@inf.ufsm.br Período: 2006/01 Aprendizado por Árvores
Leia maisModelagem e Análise de Sistemas de Computação Aula 19
Modelagem e Análise de Sistemas de Computação Aula 19 Aula passada Intro a simulação Gerando números pseudo-aleatórios Aula de hoje Lei dos grandes números Calculando integrais Gerando outras distribuições
Leia maisAlgoritmo Genético. Inteligência Artificial. Professor: Rosalvo Ferreira de Oliveira Neto
Algoritmo Genético Inteligência Artificial Professor: Rosalvo Ferreira de Oliveira Neto Estrutura 1. Introdução 2. Conceitos Básicos 3. Aplicações 4. Algoritmo 5. Exemplo Introdução São técnicas de busca
Leia maisAprendizado de Máquina
Aprendizado de Máquina Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Introdução 1 Introdução Aprendizado de Máquina Extração de conhecimento. Automatização de tarefas. Tomada de Decisões.
Leia maisAprendizado Bayesiano
Aprendizado Bayesiano Marcelo K. Albertini 3 de Julho de 2014 2/1 Conteúdo Aprendizado Naive Bayes Exemplo: classificação de texto Redes Bayesiana Algoritmo EM Regressão probabiĺıstica 3/1 Classificador
Leia maisAGA Análise de Dados em Astronomia I 8. Inferência Bayesiana e MCMC
1 / 1 AGA 0505- Análise de Dados em Astronomia I 8. Inferência Bayesiana e MCMC Laerte Sodré Jr. 1o. semestre, 2018 2 / 1 Inferência Bayesiana inferência bayesiana consideremos um conjunto de dados D que
Leia maisAula de Hoje. Processamento Estatístico da Linguagem Natural. Classificação Seqüencial. HMMs e MEMMs. Cadeias de Markov. Especificação Formal
Processamento Estatístico da Linguagem Natural Aula 13 Professora Bianca (Sala 302 Bloco E) bianca@ic.uff.br http://www.ic.uff.br/~bianca/peln/ Aula de Hoje Cap. 6 Jurafsky & Martin Hidden Markov and Maximum
Leia maisMAT 1514 A Matemática na Educação Básica. Profa. Daniela Mariz Sala 108 Bloco A
MAT 1514 A Matemática na Educação Básica Profa. Daniela Mariz Sala 108 Bloco A e-mail: danim@ime.usp.br www.ime.usp.br/~danim OBJETIVOS Esclarecer a importância da Matemática na Educação Básica. Discussão
Leia maisTeoria dos Jogos Algorítmica Maximização de Lucros no Design de Mecanismos
Teoria dos Jogos Algorítmica Maximização de Lucros no Design de Mecanismos Luis Gustavo Rocha Vianna. Instituto de Matemática e Estatística IME Universidade de São Paulo USP Maximização de Lucros Design
Leia maisUma Arquitetura para Síntese de Imagens Fotorrealistas Baseada em Técnicas de Monte Carlo. Otávio de Pinho Forin Braga
Uma Arquitetura para Síntese de Imagens Fotorrealistas Baseada em Técnicas de Monte Carlo Otávio de Pinho Forin Braga Imagens Fotorrealistas Imagens indistinguíveis das de uma câmera real Gerando Imagens
Leia maisMetodologia de inversão
6 Metodologia de inversão Nesta tese, a transformação de velocidades em pressão de poros é encarada como um problema de inversão. Pela natureza do problema, essa transformação apresenta caráter não único
Leia maisCadeias de Markov. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo
Cadeias de Markov Ricardo Ehlers ehlers@icmc.usp.br Departamento de Matemática Aplicada e Estatística Universidade de São Paulo Capitulos 3 e 4 Taylor & Karlin 1 / 71 Cadeias de Markov Seja X 0, X 1,...
Leia maisColóquio Brasileiro de Matemática - Exercícios de Algoritmos Randomizados
olóquio Brasileiro de Matemática - Exercícios de Algoritmos Randomizados apítulo 1 Exercício 2. onsidere os seguintes eventos associados a uma execução do algoritmo que consiste na aplicação do exame de
Leia maisFUNDAÇÃO GETULIO VARGAS ESCOLA DE ECONOMIA DE SÃO PAULO DERIVAÇÃO DE MODELOS DE TRADING DE ALTA FREQUÊNCIA EM JUROS UTILIZANDO APRENDIZADO POR REFORÇO
FUNDAÇÃO GETULIO VARGAS ESCOLA DE ECONOMIA DE SÃO PAULO UIRÁ CAIADO DE CASTRO DERIVAÇÃO DE MODELOS DE TRADING DE ALTA FREQUÊNCIA EM JUROS UTILIZANDO APRENDIZADO POR REFORÇO SÃO PAULO 2017 UIRÁ CAIADO DE
Leia maisClassificação Linear. André Tavares da Silva.
Classificação Linear André Tavares da Silva andre.silva@udesc.br Roteiro Introduzir os o conceito de classificação linear. LDA (Linear Discriminant Analysis) Funções Discriminantes Lineares Perceptron
Leia maisEAD Simulação. Aula 2 Parte 1: Modelos & Simulação. Profa. Dra. Adriana Backx Noronha Viana
EAD0652 - Simulação Aula 2 Parte 1: Modelos & Simulação Profa. Dra. Adriana Backx Noronha Viana Introdução Modelagem e simulação: ferramentas empregadas na análise de sistemas complexos. Passos no desenvolvimento
Leia maisAprendizado por Reforço utilizando Tile Coding em Cenários Multiagente
UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL INSTITUTO DE INFORMÁTICA PROGRAMA DE PÓS-GRADUAÇÃO EM COMPUTAÇÃO SAMUEL JUSTO WASKOW Aprendizado por Reforço utilizando Tile Coding em Cenários Multiagente Dissertação
Leia maisAplicação do algoritmo sarsa à coleta de lixo
Aplicação do algoritmo sarsa à coleta de lixo Avaliação de parâmetros Darlinton Carlos Krupp Prauchner, Rogério Samuel de Moura Martins, Edson Luiz Padoin Departamento de Ciências Exatas e Engenharias
Leia maisMáquinas de Vetores de Suporte
Máquinas de Vetores de Suporte Marcelo K. Albertini 14 de Setembro de 2015 2/22 Máquinas de Vetores de Suporte Support Vector Machines (SVM) O que é? Perceptron revisitado Kernels (núcleos) Otimização
Leia mais4 Análise de Confiabilidade em Sistemas de Potência
4 Análise de Confiabilidade em Sistemas de Potência 4.. Introdução Qualquer sistema de potência está sujeito à falhas em seus equipamentos, que muitas vezes não podem ser previstas. Estas falhas podem
Leia maisClassificação de Padrões. Abordagem prática com Redes Neurais Artificiais
Classificação de Padrões Abordagem prática com Redes Neurais Artificiais Agenda Parte I - Introdução ao aprendizado de máquina Parte II - Teoria RNA Parte III - Prática RNA Parte IV - Lições aprendidas
Leia maisCONSTRUÇÃO AUTOMÁTICA DE OPERADORES MORFOLÓGICOS UTILIZANDO PROGRAMAÇÃO GENÉTICA.
CONSTRUÇÃO AUTOMÁTICA DE OPERADORES MORFOLÓGICOS UTILIZANDO PROGRAMAÇÃO GENÉTICA. Emerson Carlos Pedrino * e-mail: ecpedrin@sel.eesc.sc.usp.br Valentin Obac Roda ** e-mail: valentin@sel.eesc.sc.usp.br
Leia maisAlgoritmos Genéticos. Pontos fracos dos métodos tradicionais. Características de alguns problemas. Tamanho do espaço de busca- Ex. caixeiro viajante:
Algoritmos Genéticos Prof. Luis Otavio Alvares INE/UFSC Características de alguns problemas Tamanho do espaço de busca- Ex. caixeiro viajante: 10 cidades: 181.000 soluções 20 cidades: 10.000.000.000.000
Leia maisGestão de Riscos e Investimentos
Existem duas abordagens gerais para calcular o VAR 1. Avaliação Local (local valuation) Métodos que vimos até agora São procedimentos em geral analíticos Baseiam-se no valor inicial do instrumento ou carteira
Leia maisa) Defina em Prolog iguais/1, um predicado que recebe um estado do jogo e que verifica que todas as pilhas têm o mesmo número de peças.
Introdução à Inteligência Artificial 2ª Época 29 Janeiro 2015 Nº Aluno: Nome Completo: Exame com consulta. Responda às perguntas nesta própria folha, nos espaços indicados. (I) O jogo do Nim (também chamado
Leia maisDistribuições Amostrais
Distribuições Amostrais 1 Da população, com parâmetro, retira-se k amostras de tamanho n e calcula-se a estatística. Estas estatísticas são as estimativas de. As estatísticas, sendo variáveis aleatórias,
Leia mais3. Resolução de problemas por meio de busca
Inteligência Artificial - IBM1024 3. Resolução de problemas por meio de busca Prof. Renato Tinós Local: Depto. de Computação e Matemática (FFCLRP/USP) 1 Principais Tópicos 3. Resolução de problemas por
Leia maisCadeias de Markov em Tempo Continuo
Cadeias de Markov em Tempo Continuo Ricardo Ehlers ehlers@icmc.usp.br Departamento de Matemática Aplicada e Estatística Universidade de São Paulo Capitulos 6 Taylor & Karlin 1 / 44 Análogo ao processo
Leia maisModelagem e Simulação de um Sistema de Aprendizado de Reforço para Robôs
Modelagem e Simulação de um Sistema de Aprendizado de Reforço para Robôs André Luiz Carvalho Ottoni (UFSJ) andreottoni@ymail.com Rubisson Duarte Lamperti (UFSJ) duartelamperti@yahoo.com.br Erivelton Geraldo
Leia maisControle Preditivo com Aprendizado por Reforço para Produção de Óleo em Poços Inteligentes
Alvaro Gustavo Talavera Lopez Controle Preditivo com Aprendizado por Reforço para Produção de Óleo em Poços Inteligentes Dissertação de Mestrado Dissertação apresentada como requisito parcial para obtenção
Leia maisInteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo]
Inteligência Artificial Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo] Aprendizagem de Máquina Área da Inteligência Artificial cujo objetivo é o desenvolvimento de técnicas computacionais sobre
Leia maisOnline Learning of Abstract Stochastic Policies with Monte Carlo
Online Learning of Abstract Stochastic Policies with Monte Carlo M. L. Koga, V. F. da Silva e A. H. R. Costa 1 Abstract When an autonomous agent faces many different, but related tasks, obtaining abstract
Leia maisAlgoritmos Genéticos. Princípio de Seleção Natural. Sub-áreas da Computação Evolutiva. Idéias básicas da CE. Computação Evolutiva
Computação Evolutiva Algoritmos Genéticos A computação evolutiva (CE) é uma área da ciência da computação que abrange modelos computacionais inspirados na Teoria da Evolução das Espécies, essencialmente
Leia maisInteligência Artificial
Universidade Federal de Campina Grande Departamento de Sistemas e Computação Pós-Graduação em Ciência da Computação Inteligência Artificial Aprendizagem (Redes Neurais - Complementar) Prof. a Joseana Macêdo
Leia mais3 Processos Estocásticos
3 Processos Estocásticos Os processos estocásticos abordados nesta dissertação são conhecidos como movimento browniano (MB) e movimento de reversão à média (MRM). O capítulo terá como objetivo a apresentação
Leia maisAULA 7 - Inferência em MQO: ICs e Testes de
AULA 7 - Inferência em MQO: ICs e Testes de Hipóteses Susan Schommer Econometria I - IE/UFRJ Nosso primeiro objetivo aqui é relembrar a diferença entre estimação de ponto vs estimação de intervalo. Vamos
Leia maisTécnicas de Concepção de Algoritmos: Branch and Bound
Técnicas de Concepção de Algoritmos: R. Rossetti, A.P. Rocha, A. Pereira, P.B. Silva, T. Fernandes FEUP, MIEIC, CAL, 2010/2011 1 O que é? BB ou B&B é uma técnica de concepção de algoritmos genérica para
Leia maisRedes Neurais Artificiais
Redes Neurais Artificiais Marcelo K. Albertini 24 de Julho de 2014 2/34 Conteúdo Perceptron Gradiente descendente Redes multicamadas Retropropagação de erros 3/34 Modelos conexionistas Humanos Tempo de
Leia maisAlgoritmos de Aprendizado. Formas de Aprendizado. Aprendizado Batch x Incremental. Aprendizado Batch x Incremental
Algoritmos de Aprendizado Regra de Hebb Perceptron Delta Rule (Least Mean Square Back Propagation Formas de Aprendizado Existe dois métodos básicos de aplicação do algoritmo Back Propagation: Aprendizado
Leia maisAprendizado Bayesiano
Aprendizado Bayesiano Marcelo K. Albertini 26 de Junho de 2014 2/20 Conteúdo Teorema de Bayes Aprendizado MAP Classificador ótimo de Bayes 3/20 Dois papéis para métodos bayesianos Algoritmos de aprendizado
Leia maisQoS Control for Sensor Networks Ranjit Iyer Leonard Kleinrock. Aluno: Eduardo Hargreaves Professor: Luís Felipe M. de Moraes
QoS Control for Sensor Networks Ranjit Iyer Leonard Kleinrock Aluno: Eduardo Hargreaves Professor: Luís Felipe M. de Moraes Introdução As Redes de Sensores têm características bem particulares entre elas:
Leia mais