lnteligência Artificial Introdução ao Aprendizado por Reforço (Reinforcement Learning)

Tamanho: px
Começar a partir da página:

Download "lnteligência Artificial Introdução ao Aprendizado por Reforço (Reinforcement Learning)"

Transcrição

1 lnteligência Artificial Introdução ao Aprendizado por Reforço (Reinforcement Learning)

2 Processo Decisório de Markov e Aprendizado por Reforço Quando falamos sobre Processo decisório de Markov e formalizamos o problema como uma tupla <S,A,p,r>. Assumimos que nós sabiamos S,A, p e r e então buscamos uma solução ótima, isto é, uma função ou política que tivesse o maior retorno esperado. Em aprendizado por reforço (Reinforcement Learning), nós queremos um agente que tenha um bom desempenho em um mundo MDP, mas que começa sem saber nada sobre p ou r

3 Como resolver o problema sem p e r? Idéias? Opção A: Aprender p e r e depois utilizar as técnicas conhecidas para encontrar a função de valor e assim a política ótima Opção B: Estimar a função de valor diretamente sem explicitamente calcular p ou r.

4 Como descobrir políticas sem conhecer as probabilidades e retornos

5 Estimativa de Parâmetros

6 Problemas com Estimativa de Parâmetros

7 Estimar a função de valor diretamente

8 Como escolher as ações?

9 Exemplo: Caça-níqueis (Armed bandit)

10 Opções. Agir aleatoriamente? Mudar de máquina a cada vez que perder? Melhor que aleatório, mas não é ótimo Estimar as probabilidades de cada máquina através de contagem e depois permanece na melhor. Como estimar?

11 Estratégias

12 Alguns Resultados com E-greedy

13 Lembrando MDP e definindo Função Q..

14 PDM e Aprendizado por Reforço

15 Exemplo

16 Um algoritmo para o aprendizado da Função Q (Q-Learning) O algoritmo Q-Learning (Watkins, 1989) baseia-se em simulações de Monte Carlo e no algoritmo Robbins- Monro Simulações Monte-Carlo baseiam-se na amostragem de estados para estimar seus valores (abordagem força bruta) Algoritmo Robbins-Monro permite aprender uma função onde um de seus parâmetros é uma variável aleatória com distribuição de probabilidade conhecida, utilizando uma taxa de aprendizagem α que se altera ao longo do tempo segundo certas condições. Maiores informações sobre a dedução do Q-Learning, Monte Carlo e Robbins-Monro podem ser obtidas em: Reinforcement Learning: An Introduction, Sutton,R. and Barko,A. MIT Press. 1998

17 Q-Learning

18 Taxa de Aprendizado e Convergência

19 Taxa de Aprendizado e Convergência

20 Algoritmo Q-Learning

21 Um exemplo bastante simples

22 Exemplos de aplicações

23 Problemas com Q-Learning

24 Problemas com Q-Learning - 2

25 Q-Learning: Exercício

26 Outro algoritmo para RL: SARSA

27 Q-Learning x SARSA Q-Learning é o método mais usado É do tipo off-policy (não é necessário seguir uma política) Sarsa Por eliminar o uso de uma função de maximização, tende a ser mais rápido que Q-Learning, quando há grande número de ações possíveis Tem basicamente as mesmas condições de convergência Permite descontar diferenças temporais gerando um Sarsa(λ) similar a algoritmos TD(λ)

28 Conclusões sobre Aprendizado por Reforço Aprendizado por reforço permite que se aprenda a política ótima, mesmo sem saber previamente a função de probabilidade de transição (p) ou a função de recompensa imediata (r) Aprendizado por reforço é uma tecnologia promissora, há muita pesquisa sendo feita na área e também aplicações real world Mais referências: Reinforcement Learning: An Introduction, Sutton,R. and Barko,A. MIT Press Bertsekas,D. and Tsitsiklis, J.N. Neurodynamic programming. Athena Scientifc. Belmont. Massachusetts. 1996

CES Modelos Probabilísticos em Grafos Introdução a Modelo Decisório de Markov

CES Modelos Probabilísticos em Grafos Introdução a Modelo Decisório de Markov CES -161 - Modelos Probabilísticos em Grafos Introdução a Modelo Decisório de Markov Prof. Paulo André Castro www.comp.ita.br/~pauloac pauloac@ita.br Sala 110, IEC-ITA Aprendizado - paradigmas Aprendizado

Leia mais

CES Modelos Probabilísticos em Grafos Introdução a Modelo Decisório de Markov

CES Modelos Probabilísticos em Grafos Introdução a Modelo Decisório de Markov CES -161 - Modelos Probabilísticos em Grafos Introdução a Modelo Decisório de Markov Prof. Paulo André Castro www.comp.ita.br/~pauloac pauloac@ita.br Sala 110, IEC-ITA Aprendizado - paradigmas Aprendizado

Leia mais

CEFET/RJ Inteligência Artificial (2018.1) Prof. Eduardo Bezerra Lista de exercícios 04

CEFET/RJ Inteligência Artificial (2018.1) Prof. Eduardo Bezerra Lista de exercícios 04 . CEFET/RJ Inteligência Artificial (2018.1) Prof. Eduardo Bezerra (ebezerra@cefet-rj.br) Lista de exercícios 04 Créditos: essa lista de exercícios contém a tradução dos exercícios disponibilizados na disciplina

Leia mais

3 Aprendizado por reforço

3 Aprendizado por reforço 3 Aprendizado por reforço Aprendizado por reforço é um ramo estudado em estatística, psicologia, neurociência e ciência da computação. Atraiu o interesse de pesquisadores ligados a aprendizado de máquina

Leia mais

lnteligência Artificial Introdução ao Processo Decisório de Markov

lnteligência Artificial Introdução ao Processo Decisório de Markov lnteligência Artificial Introdução ao Processo Decisório de Markov Aprendizado - paradigmas Aprendizado supervisionado O crítico comunica a EA o erro relativo entre a ação que deve ser tomada idealmente

Leia mais

Aprendizado por Reforço

Aprendizado por Reforço Aprendizado por Reforço SCC5865-Robótica Roseli A F Romero Introdução O modelo padrão de aprendizado por reforço Aprendizado por Reforço Formalmente, o modelo consiste de: Um conjunto discreto de estados

Leia mais

Aprendizagem por Reforço

Aprendizagem por Reforço Aprendizagem por Reforço Motivação! Como um agente aprende a escolher ações apenas interagindo com o ambiente? n n Muitas vezes, é impraticável o uso de aprendizagem supervisionada w Como obter exemplos

Leia mais

Aprendizado por Reforço

Aprendizado por Reforço Aprendizado por Reforço Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Aprendizado por Reforço 2. Q-Learning 3. SARSA 4. Outras ideias 1 Aprendizado por Reforço Problemas de decisão

Leia mais

Aprendizado por Reforço para um Sistema Tutor Inteligente sem Modelo

Aprendizado por Reforço para um Sistema Tutor Inteligente sem Modelo Aprendizado por Reforço para um Sistema Tutor Inteligente sem Modelo Explícito do Aprendiz Marcus Vinícius Carvalho Guelpeli Divisão de Ciência da Computação Instituto Tecnológico de Aeronáutica São José

Leia mais

Aula 17. Aula de hoje. Aula passada. Problemas Monte Carlo na moda Caminho trilhado Desafios à frente Avaliação

Aula 17. Aula de hoje. Aula passada. Problemas Monte Carlo na moda Caminho trilhado Desafios à frente Avaliação Aula 17 Aula passada Otimização Caixeiro viajante Hill Climbing Distribuição de Boltzman Simulated Annealing De volta ao caixeiro Aula de hoje Problemas Monte Carlo na moda Caminho trilhado Desafios à

Leia mais

2 Aprendizado de Máquina

2 Aprendizado de Máquina 2 Aprendizado de Máquina Desde que os computadores foram inventados, sempre nos perguntamos se eles poderiam ser feitos para aprender. Se pudéssemos compreender como programá-los para aprender e melhorar

Leia mais

Aprendizado por reforço em lote para o problema de tomada de decisão em processos de venda

Aprendizado por reforço em lote para o problema de tomada de decisão em processos de venda Aprendizado por reforço em lote para o problema de tomada de decisão em processos de venda Denis Antonio Lacerda e Leliane Nunes de Barros Departamento de Ciência da Computação, IME/USP denis@ime.usp.br,

Leia mais

Um Algoritmo Genético com Aprendizado por Reforço Simples aplicado ao problema do Mundo de Grid

Um Algoritmo Genético com Aprendizado por Reforço Simples aplicado ao problema do Mundo de Grid 1 Um Algoritmo Genético com Aprendizado por Reforço Simples aplicado ao problema do Mundo de Grid Luciana Conceição Dias Campos Resumo Este trabalho consiste da aplicação de um algoritmo genético ao método

Leia mais

Utilização de Aprendizagem por Reforço para Modelagem Autônoma do Aprendiz em um Tutor Inteligente

Utilização de Aprendizagem por Reforço para Modelagem Autônoma do Aprendiz em um Tutor Inteligente Utilização de Aprendizagem por Reforço para Modelagem Autônoma do Aprendiz em um Tutor Inteligente Modalidade Artigo Completo Marcus V. C. Guelpeli 1, Carlos H. C. Ribeiro 1 e Nizam Omar 2 1 Divisão de

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 24 Aprendizado Por Reforço Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor (KNN).

Leia mais

CENTRO UNIVERSITÁRIO DA FEI DANILO HERNANI PERICO USO DE HEURÍSTICAS OBTIDAS POR MEIO DE DEMONSTRAÇÕES PARA ACELERAÇÃO DO APRENDIZADO POR REFORÇO

CENTRO UNIVERSITÁRIO DA FEI DANILO HERNANI PERICO USO DE HEURÍSTICAS OBTIDAS POR MEIO DE DEMONSTRAÇÕES PARA ACELERAÇÃO DO APRENDIZADO POR REFORÇO CENTRO UNIVERSITÁRIO DA FEI DANILO HERNANI PERICO USO DE HEURÍSTICAS OBTIDAS POR MEIO DE DEMONSTRAÇÕES PARA ACELERAÇÃO DO APRENDIZADO POR REFORÇO São Bernardo do Campo 2012 DANILO HERNANI PERICO Uso de

Leia mais

Reinforcement Learning

Reinforcement Learning Reinforcement Learning (Aprendizado por Reforço) Karla Figueiredo DEE/PUC-Rio 1 Sumário Introdução Motivação Histórico Conceitos básicos Fundamentos Teóricos Processos de Decisão de Markov Propriedade

Leia mais

APLICAÇÃO DO ALGORITMO SARSA NA COLETA DE LIXO - ESTUDO DO PARÂMETRO ALPHA 1

APLICAÇÃO DO ALGORITMO SARSA NA COLETA DE LIXO - ESTUDO DO PARÂMETRO ALPHA 1 APLICAÇÃO DO ALGORITMO SARSA NA COLETA DE LIXO - ESTUDO DO PARÂMETRO ALPHA 1 Darlinton Prauchner 2, Rogério Martins 3, Edson Padoin 4. 1 Trabalho de conclusão de curso realiazado no curso de Ciência da

Leia mais

Uso de Heurísticas para a Aceleração do Aprendizado por

Uso de Heurísticas para a Aceleração do Aprendizado por Uso de Heurísticas para a Aceleração do Aprendizado por Reforço Reinaldo A. C. Bianchi 1,2, Anna H. R. Costa 1 1 Laboratório de Técnicas Inteligentes Escola Politécnica da Universidade de São Paulo Av.

Leia mais

USO DE HEURÍSTICAS OBTIDAS POR MEIO DE DEMONSTRAÇÕES PARA ACELERAÇÃO DO APRENDIZADO POR REFORÇO

USO DE HEURÍSTICAS OBTIDAS POR MEIO DE DEMONSTRAÇÕES PARA ACELERAÇÃO DO APRENDIZADO POR REFORÇO USO DE HEURÍSTICAS OBTIDAS POR MEIO DE DEMONSTRAÇÕES PARA ACELERAÇÃO DO APRENDIZADO POR REFORÇO DANILO H. PERICO, REINALDO A. C. BIANCHI Centro Universitário da FEI, Av. Humberto de Alencar Castelo Branco,

Leia mais

Aula 14. Aula de hoje. Aula passada

Aula 14. Aula de hoje. Aula passada Aula 14 Aula passada Autovalores, autovetores, decomposição Convergência para estacionaridade Tempo de mistura Spectral gap Tempo de mistura de passeios aleatórios Aula de hoje Caminho amostral Teorema

Leia mais

Uso de Heurísticas para a Aceleração do Aprendizado por Reforço

Uso de Heurísticas para a Aceleração do Aprendizado por Reforço Proceedings of the International Joint Conference IBERAMIA/SBIA/SBRN 2006-5th Best MSc dissertation/phd thesis contest (CTDIA 2006), Ribeirão Preto, Brazil, October 23 28, 2006. CD-ROM. ISBN 85-87837-11-7

Leia mais

Programa: Ciência da Computação Orientadora: Prof ạ Dr ạ Leliane Nunes de Barros

Programa: Ciência da Computação Orientadora: Prof ạ Dr ạ Leliane Nunes de Barros Aprendizado por reforço em lote: um estudo de caso para o problema de tomada de decisão em processos de venda Denis Antonio Lacerda Dissertação apresentada ao Instituto de Matemática e Estatística da Universidade

Leia mais

Tópicos Especiais em Inteligência Artificial COS746. Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro

Tópicos Especiais em Inteligência Artificial COS746. Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro Tópicos Especiais em Inteligência Artificial COS746 Vítor Santos Costa COPPE/Sistemas Universidade Federal do Rio de Janeiro Agradecimento Copiado dos slides de Mark Craven/C. David Page para BMI/CS 576,

Leia mais

UTILIZAÇÃO DE APRENDIZADO POR REFORÇO PARA APRENDER A ESTRATÉGIA DO JOGO DA VELHA

UTILIZAÇÃO DE APRENDIZADO POR REFORÇO PARA APRENDER A ESTRATÉGIA DO JOGO DA VELHA Anais do 12 O Encontro de Iniciação Científica e Pós-Graduação do ITA XII ENCITA / 2006 Instituto Tecnológico de Aeronáutica São José dos Campos SP Brasil Outubro 16 a19 2006 UTILIZAÇÃO DE APRENDIZADO

Leia mais

IA - Planejamento II

IA - Planejamento II PO IA - Planejamento II Professor Paulo Gurgel Pinheiro MC906A - Inteligência Articial Instituto de Computação Universidade Estadual de Campinas - UNICAMP 16 de Novembro de 2010 1 / 48 PO http://www.ic.unicamp.br/

Leia mais

SEMÁFORO INTELIGENTE UMA APLICAÇÃO DE APRENDIZAGEM POR REFORÇO

SEMÁFORO INTELIGENTE UMA APLICAÇÃO DE APRENDIZAGEM POR REFORÇO Anais do XIX Congresso Brasileiro de Automática, CBA 2012. SEMÁFORO INTELIGENTE UMA APLICAÇÃO DE APRENDIZAGEM POR REFORÇO GABRIEL M. COSTA, GUILHERME S. BASTOS Centro de Referência em Tecnologias da Informação,

Leia mais

Aprendizado por Reforço usando Aproximação

Aprendizado por Reforço usando Aproximação Aprendizado por Reforço usando Aproximação de Funções Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Aproximação de Funções 2. Do the evolution 1 Aproximação de Funções Função Utilidade

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCENS UFES Departamento de Computação Aprendizado de Máquina Inteligência Artificial Site: http://jeiks.net E-mail: jacsonrcsilva@gmail.com

Leia mais

OTIMIZAÇÃO DE PORTFÓLIO PARA UMA CARTEIRA DE CRIPTOMOEDAS: UMA ABORDAGEM EM REINFORCEMENT LEARNING

OTIMIZAÇÃO DE PORTFÓLIO PARA UMA CARTEIRA DE CRIPTOMOEDAS: UMA ABORDAGEM EM REINFORCEMENT LEARNING OTIMIZAÇÃO DE PORTFÓLIO PARA UMA CARTEIRA DE CRIPTOMOEDAS: UMA ABORDAGEM EM REINFORCEMENT LEARNING Daniel Barra Ciências Econômicas Centro Sócio Econômico Tópicos Introdução ao trabalho Uma breve introdução

Leia mais

SEMÁFORO INTELIGENTE - INTEGRAÇÃO DE APRENDIZAGEM POR REFORÇO E A TÉCNICA CMAC

SEMÁFORO INTELIGENTE - INTEGRAÇÃO DE APRENDIZAGEM POR REFORÇO E A TÉCNICA CMAC SEMÁFORO INTELIGENTE - INTEGRAÇÃO DE APRENDIZAGEM POR REFORÇO E A TÉCNICA CMAC Felipe Lira Santana Silva, Gabriel Melo Costa, Guilherme Sousa Bastos Instituto de Engenharia de Sistemas e Tecnologias da

Leia mais

Aprendizado Bayesiano Anteriormente...

Aprendizado Bayesiano Anteriormente... Aprendizado Bayesiano Anteriormente... Conceito de Probabilidade Condicional É a probabilidade de um evento A dada a ocorrência de um evento B Universidade de São Paulo Instituto de Ciências Matemáticas

Leia mais

Aprendizagem de Máquinas

Aprendizagem de Máquinas Universidade Federal do Rio Grande do Norte Departamento de Engenharia de Computação e Automação Aprendizagem de Máquinas DCA0121 Inteligência Artificial Aplicada Heitor Medeiros 1 Aprendizagem de Máquinas

Leia mais

Processos de Decisão de Markov

Processos de Decisão de Markov Universidade Federal do ABC Bacharelado em Ciência e Tecnologia Disciplina de Inteligência Artificial - Prof. Jerônimo Pellegrini André Filipe de Moraes Batista DIURNO 2008.2 Processos de Decisão de Markov

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial INF 1771 Inteligência Artificial Aula 11 Aprendizado de Máquina Edirlei Soares de Lima Agentes Vistos Anteriormente Agentes baseados em busca: Busca cega Busca heurística Busca local

Leia mais

CEFET/RJ Inteligência Artificial (2017.2) Professor: Eduardo Bezerra Lista de exercícios 03

CEFET/RJ Inteligência Artificial (2017.2) Professor: Eduardo Bezerra Lista de exercícios 03 . CEFET/RJ Inteligência Artificial (2017.2) Professor: Eduardo Bezerra (ebezerra@cefet-rj.br) Lista de exercícios 03 Créditos: essa lista de exercícios contém a tradução dos exercícios disponibilizados

Leia mais

APRENDIZADO POR REFORÇO MULTIAGENTE MULTIOBJETIVO ACELERADO POR HEURÍSTICAS APLICADO AO PROBLEMA DA PRESA E PREDADOR Leonardo A. Ferreira, Carlos H. C. Ribeiro, Reinaldo A. C. Bianchi Centro Universitário

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina Introdução Luiz Eduardo S. Oliveira Universidade Federal do Paraná Departamento de Informática http://lesoliveira.net Luiz S. Oliveira (UFPR) Aprendizado de Máquina 1 / 19 Introdução

Leia mais

APRENDIZAGEM POR REFORÇO PARA TIMES DE ROBÔS. Carlos Henrique Costa Ribeiro PQ Lucas Heitzmann Gabrielli IC

APRENDIZAGEM POR REFORÇO PARA TIMES DE ROBÔS. Carlos Henrique Costa Ribeiro PQ Lucas Heitzmann Gabrielli IC PRENDIZGEM POR REFORÇO PR TIMES DE ROÔS arlos Henrique osta Ribeiro PQ Lucas Heitzmann Gabrielli I Resumo: Times de robôs autônomos podem propiciar uma forma mais eficiente de solução de tarefas complexas

Leia mais

Emerson de Oliveira Antunes Samir Elias Hachem Kerbage

Emerson de Oliveira Antunes Samir Elias Hachem Kerbage MINISTÉRIO DA DEFESA EXÉRCITO BRASILEIRO DEPARTAMENTO DE CIÊNCIA E TECNOLOGIA INSTITUTO MILITAR DE ENGENHARIA Seção de Engenharia de Computação / SE 8 Emerson de Oliveira Antunes Samir Elias Hachem Kerbage

Leia mais

DARLINTON CARLOS KRUPP PRAUCHNER

DARLINTON CARLOS KRUPP PRAUCHNER 1 DARLINTON CARLOS KRUPP PRAUCHNER APLICAÇÃO DO ALGORÍTMO DE INTELIGÊNCIA ARTIFICIAL SARSA(λ) À ROBÓTICA NA TAREFA DE COLETA DE LIXO Ijuí 2014 2 DARLINTON CARLOS KRUPP PRAUCHNER APLICAÇÃO DO ALGORÍTMO

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 14 Aprendizado de Máquina Agentes Vistos Anteriormente Agentes baseados em busca: Busca cega Busca heurística Busca local

Leia mais

Análise Funcional Comparativa de Algoritmos de Aprendizagem por Reforço

Análise Funcional Comparativa de Algoritmos de Aprendizagem por Reforço INSTITUTO SUPERIOR DE ENGENHARIA DE LISBOA Departamento de Engenharia de Electrónica e Telecomunicações e de Computadores Análise Funcional Comparativa de Algoritmos de Aprendizagem por Reforço João Manuel

Leia mais

ESTATÍSTICA COMPUTACIONAL

ESTATÍSTICA COMPUTACIONAL ESTATÍSTICA COMPUTACIONAL Ralph dos Santos Silva Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Considere o problema de encontrar o valor que

Leia mais

Aprendizado por Reforço Multiagente: Uma Avaliação de Diferentes Mecanismos de Recompensa para o Problema de Aprendizado de Rotas

Aprendizado por Reforço Multiagente: Uma Avaliação de Diferentes Mecanismos de Recompensa para o Problema de Aprendizado de Rotas UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL INSTITUTO DE INFORMÁTICA PROGRAMA DE PÓS-GRADUAÇÃO EM COMPUTAÇÃO RICARDO GRUNITZKI Aprendizado por Reforço Multiagente: Uma Avaliação de Diferentes Mecanismos

Leia mais

Aprendizado, minimização do arrependimento e equilíbrio (Learning, Regret Minimization, and Equilibria)

Aprendizado, minimização do arrependimento e equilíbrio (Learning, Regret Minimization, and Equilibria) Aprendizado, minimização do arrependimento e equilíbrio (Learning, Regret Minimization, and Equilibria) Victor Alberto Romero Instituto de Matemática e Estatística Universidade de São Paulo Teoria dos

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial INF 1771 Inteligência Artificial Aula 18 Aprendizado Por Reforço Edirlei Soares de Lima Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor (KNN).

Leia mais

Aprendizagem de máquina

Aprendizagem de máquina Aprendizagem de máquina Introdução Objetivos Fornecer o ferramental necessário ao entendimento e ao projeto de sistemas baseados em aprendizagem. A disciplina cobre os principais tópicos da aprendizagem

Leia mais

CONTROLE REGIONAL DE TENSÃO UTILIZANDO LÓGICA FUZZY E APRENDIZADO POR REFORÇO. Alessandro Bulhões Marques

CONTROLE REGIONAL DE TENSÃO UTILIZANDO LÓGICA FUZZY E APRENDIZADO POR REFORÇO. Alessandro Bulhões Marques COPPE/UFRJ CONTROLE REGIONAL DE TENSÃO UTILIZANDO LÓGICA FUZZY E APRENDIZADO POR REFORÇO Alessandro Bulhões Marques Tese de Doutorado apresentada ao Programa de Pós-graduação em Engenharia Elétrica, COPPE,

Leia mais

PROCESSO SELETIVO N 42/2019 PROVA 2 - CONHECIMENTOS ESPECÍFICOS

PROCESSO SELETIVO N 42/2019 PROVA 2 - CONHECIMENTOS ESPECÍFICOS PROCESSO SELETIVO N 42/2019 PROVA 2 - CONHECIMENTOS ESPECÍFICOS LEIA ATENTAMENTE AS INSTRUÇÕES ABAIXO 1. Você recebeu do fiscal o seguinte material: (a) Este caderno, com o enunciado das 20 (vinte) questões

Leia mais

APRENDIZAGEM DA NAVEGAÇÃO EM ROBÔS MÓVEIS A PARTIR DE MAPAS OBTIDOS AUTONOMAMENTE

APRENDIZAGEM DA NAVEGAÇÃO EM ROBÔS MÓVEIS A PARTIR DE MAPAS OBTIDOS AUTONOMAMENTE APRENDIZAGEM DA NAVEGAÇÃO EM ROBÔS MÓVEIS A PARTIR DE MAPAS OBTIDOS AUTONOMAMENTE Sildomar T. Monteiro e Carlos H. C. Ribeiro Divisão de Ciência da Computação Instituto Tecnológico de Aeronáutica Praça

Leia mais

Estatística e Modelos Probabilísticos - COE241

Estatística e Modelos Probabilísticos - COE241 Estatística e Modelos Probabilísticos - COE241 Aula passada Algoritmo para simular uma fila Medidas de interesse Média amostral Aula de hoje Teorema do Limite Central Intervalo de Confiança Variância amostral

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação (Machine Learning) Aula 01 Motivação, áreas de aplicação e fundamentos Max Pereira Nem todo conhecimento tem o mesmo valor. O que torna determinado conhecimento mais importante que

Leia mais

Inteligência nos Negócios (Business Inteligente)

Inteligência nos Negócios (Business Inteligente) Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 6) Fundamentação da disciplina Analise de dados Decisões

Leia mais

Avaliando Hipóteses. George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE

Avaliando Hipóteses. George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE Avaliando Hipóteses George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE Pontos importantes Erro da Amostra e Erro Real Como Calcular Intervalo de Confiança Erros de hipóteses Estimadores Comparando

Leia mais

Aprendizado por Reforço Multiagente: Uma Avaliação de Diferentes Mecanismos de Recompensa para o Problema de Aprendizado de Rotas

Aprendizado por Reforço Multiagente: Uma Avaliação de Diferentes Mecanismos de Recompensa para o Problema de Aprendizado de Rotas UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL INSTITUTO DE INFORMÁTICA PROGRAMA DE PÓS-GRADUAÇÃO EM COMPUTAÇÃO RICARDO GRUNITZKI Aprendizado por Reforço Multiagente: Uma Avaliação de Diferentes Mecanismos

Leia mais

UMA INTRODUÇÃO AOS ALGORITMOS GENETICOS

UMA INTRODUÇÃO AOS ALGORITMOS GENETICOS UMA INTRODUÇÃO AOS ALGORITMOS GENETICOS Uma visão geral dos GAs Um algoritmo genético é uma classe de algoritmo de busca. O algoritmo procura uma solução dentro de um espaço para um problema de otimização.

Leia mais

Aprendizado por Árvores de Decisão

Aprendizado por Árvores de Decisão Universidade Federal de Santa Maria Departamento de Eletrônica e Computação Prof. Cesar Tadeu Pozzer Disciplina de Programação de Jogos 3D E-mail: pozzer@inf.ufsm.br Período: 2006/01 Aprendizado por Árvores

Leia mais

Modelagem e Análise de Sistemas de Computação Aula 19

Modelagem e Análise de Sistemas de Computação Aula 19 Modelagem e Análise de Sistemas de Computação Aula 19 Aula passada Intro a simulação Gerando números pseudo-aleatórios Aula de hoje Lei dos grandes números Calculando integrais Gerando outras distribuições

Leia mais

Algoritmo Genético. Inteligência Artificial. Professor: Rosalvo Ferreira de Oliveira Neto

Algoritmo Genético. Inteligência Artificial. Professor: Rosalvo Ferreira de Oliveira Neto Algoritmo Genético Inteligência Artificial Professor: Rosalvo Ferreira de Oliveira Neto Estrutura 1. Introdução 2. Conceitos Básicos 3. Aplicações 4. Algoritmo 5. Exemplo Introdução São técnicas de busca

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Introdução 1 Introdução Aprendizado de Máquina Extração de conhecimento. Automatização de tarefas. Tomada de Decisões.

Leia mais

Aprendizado Bayesiano

Aprendizado Bayesiano Aprendizado Bayesiano Marcelo K. Albertini 3 de Julho de 2014 2/1 Conteúdo Aprendizado Naive Bayes Exemplo: classificação de texto Redes Bayesiana Algoritmo EM Regressão probabiĺıstica 3/1 Classificador

Leia mais

AGA Análise de Dados em Astronomia I 8. Inferência Bayesiana e MCMC

AGA Análise de Dados em Astronomia I 8. Inferência Bayesiana e MCMC 1 / 1 AGA 0505- Análise de Dados em Astronomia I 8. Inferência Bayesiana e MCMC Laerte Sodré Jr. 1o. semestre, 2018 2 / 1 Inferência Bayesiana inferência bayesiana consideremos um conjunto de dados D que

Leia mais

Aula de Hoje. Processamento Estatístico da Linguagem Natural. Classificação Seqüencial. HMMs e MEMMs. Cadeias de Markov. Especificação Formal

Aula de Hoje. Processamento Estatístico da Linguagem Natural. Classificação Seqüencial. HMMs e MEMMs. Cadeias de Markov. Especificação Formal Processamento Estatístico da Linguagem Natural Aula 13 Professora Bianca (Sala 302 Bloco E) bianca@ic.uff.br http://www.ic.uff.br/~bianca/peln/ Aula de Hoje Cap. 6 Jurafsky & Martin Hidden Markov and Maximum

Leia mais

MAT 1514 A Matemática na Educação Básica. Profa. Daniela Mariz Sala 108 Bloco A

MAT 1514 A Matemática na Educação Básica. Profa. Daniela Mariz Sala 108 Bloco A MAT 1514 A Matemática na Educação Básica Profa. Daniela Mariz Sala 108 Bloco A e-mail: danim@ime.usp.br www.ime.usp.br/~danim OBJETIVOS Esclarecer a importância da Matemática na Educação Básica. Discussão

Leia mais

Teoria dos Jogos Algorítmica Maximização de Lucros no Design de Mecanismos

Teoria dos Jogos Algorítmica Maximização de Lucros no Design de Mecanismos Teoria dos Jogos Algorítmica Maximização de Lucros no Design de Mecanismos Luis Gustavo Rocha Vianna. Instituto de Matemática e Estatística IME Universidade de São Paulo USP Maximização de Lucros Design

Leia mais

Uma Arquitetura para Síntese de Imagens Fotorrealistas Baseada em Técnicas de Monte Carlo. Otávio de Pinho Forin Braga

Uma Arquitetura para Síntese de Imagens Fotorrealistas Baseada em Técnicas de Monte Carlo. Otávio de Pinho Forin Braga Uma Arquitetura para Síntese de Imagens Fotorrealistas Baseada em Técnicas de Monte Carlo Otávio de Pinho Forin Braga Imagens Fotorrealistas Imagens indistinguíveis das de uma câmera real Gerando Imagens

Leia mais

Metodologia de inversão

Metodologia de inversão 6 Metodologia de inversão Nesta tese, a transformação de velocidades em pressão de poros é encarada como um problema de inversão. Pela natureza do problema, essa transformação apresenta caráter não único

Leia mais

Cadeias de Markov. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Cadeias de Markov. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo Cadeias de Markov Ricardo Ehlers ehlers@icmc.usp.br Departamento de Matemática Aplicada e Estatística Universidade de São Paulo Capitulos 3 e 4 Taylor & Karlin 1 / 71 Cadeias de Markov Seja X 0, X 1,...

Leia mais

Colóquio Brasileiro de Matemática - Exercícios de Algoritmos Randomizados

Colóquio Brasileiro de Matemática - Exercícios de Algoritmos Randomizados olóquio Brasileiro de Matemática - Exercícios de Algoritmos Randomizados apítulo 1 Exercício 2. onsidere os seguintes eventos associados a uma execução do algoritmo que consiste na aplicação do exame de

Leia mais

FUNDAÇÃO GETULIO VARGAS ESCOLA DE ECONOMIA DE SÃO PAULO DERIVAÇÃO DE MODELOS DE TRADING DE ALTA FREQUÊNCIA EM JUROS UTILIZANDO APRENDIZADO POR REFORÇO

FUNDAÇÃO GETULIO VARGAS ESCOLA DE ECONOMIA DE SÃO PAULO DERIVAÇÃO DE MODELOS DE TRADING DE ALTA FREQUÊNCIA EM JUROS UTILIZANDO APRENDIZADO POR REFORÇO FUNDAÇÃO GETULIO VARGAS ESCOLA DE ECONOMIA DE SÃO PAULO UIRÁ CAIADO DE CASTRO DERIVAÇÃO DE MODELOS DE TRADING DE ALTA FREQUÊNCIA EM JUROS UTILIZANDO APRENDIZADO POR REFORÇO SÃO PAULO 2017 UIRÁ CAIADO DE

Leia mais

Classificação Linear. André Tavares da Silva.

Classificação Linear. André Tavares da Silva. Classificação Linear André Tavares da Silva andre.silva@udesc.br Roteiro Introduzir os o conceito de classificação linear. LDA (Linear Discriminant Analysis) Funções Discriminantes Lineares Perceptron

Leia mais

EAD Simulação. Aula 2 Parte 1: Modelos & Simulação. Profa. Dra. Adriana Backx Noronha Viana

EAD Simulação. Aula 2 Parte 1: Modelos & Simulação. Profa. Dra. Adriana Backx Noronha Viana EAD0652 - Simulação Aula 2 Parte 1: Modelos & Simulação Profa. Dra. Adriana Backx Noronha Viana Introdução Modelagem e simulação: ferramentas empregadas na análise de sistemas complexos. Passos no desenvolvimento

Leia mais

Aprendizado por Reforço utilizando Tile Coding em Cenários Multiagente

Aprendizado por Reforço utilizando Tile Coding em Cenários Multiagente UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL INSTITUTO DE INFORMÁTICA PROGRAMA DE PÓS-GRADUAÇÃO EM COMPUTAÇÃO SAMUEL JUSTO WASKOW Aprendizado por Reforço utilizando Tile Coding em Cenários Multiagente Dissertação

Leia mais

Aplicação do algoritmo sarsa à coleta de lixo

Aplicação do algoritmo sarsa à coleta de lixo Aplicação do algoritmo sarsa à coleta de lixo Avaliação de parâmetros Darlinton Carlos Krupp Prauchner, Rogério Samuel de Moura Martins, Edson Luiz Padoin Departamento de Ciências Exatas e Engenharias

Leia mais

Máquinas de Vetores de Suporte

Máquinas de Vetores de Suporte Máquinas de Vetores de Suporte Marcelo K. Albertini 14 de Setembro de 2015 2/22 Máquinas de Vetores de Suporte Support Vector Machines (SVM) O que é? Perceptron revisitado Kernels (núcleos) Otimização

Leia mais

4 Análise de Confiabilidade em Sistemas de Potência

4 Análise de Confiabilidade em Sistemas de Potência 4 Análise de Confiabilidade em Sistemas de Potência 4.. Introdução Qualquer sistema de potência está sujeito à falhas em seus equipamentos, que muitas vezes não podem ser previstas. Estas falhas podem

Leia mais

Classificação de Padrões. Abordagem prática com Redes Neurais Artificiais

Classificação de Padrões. Abordagem prática com Redes Neurais Artificiais Classificação de Padrões Abordagem prática com Redes Neurais Artificiais Agenda Parte I - Introdução ao aprendizado de máquina Parte II - Teoria RNA Parte III - Prática RNA Parte IV - Lições aprendidas

Leia mais

CONSTRUÇÃO AUTOMÁTICA DE OPERADORES MORFOLÓGICOS UTILIZANDO PROGRAMAÇÃO GENÉTICA.

CONSTRUÇÃO AUTOMÁTICA DE OPERADORES MORFOLÓGICOS UTILIZANDO PROGRAMAÇÃO GENÉTICA. CONSTRUÇÃO AUTOMÁTICA DE OPERADORES MORFOLÓGICOS UTILIZANDO PROGRAMAÇÃO GENÉTICA. Emerson Carlos Pedrino * e-mail: ecpedrin@sel.eesc.sc.usp.br Valentin Obac Roda ** e-mail: valentin@sel.eesc.sc.usp.br

Leia mais

Algoritmos Genéticos. Pontos fracos dos métodos tradicionais. Características de alguns problemas. Tamanho do espaço de busca- Ex. caixeiro viajante:

Algoritmos Genéticos. Pontos fracos dos métodos tradicionais. Características de alguns problemas. Tamanho do espaço de busca- Ex. caixeiro viajante: Algoritmos Genéticos Prof. Luis Otavio Alvares INE/UFSC Características de alguns problemas Tamanho do espaço de busca- Ex. caixeiro viajante: 10 cidades: 181.000 soluções 20 cidades: 10.000.000.000.000

Leia mais

Gestão de Riscos e Investimentos

Gestão de Riscos e Investimentos Existem duas abordagens gerais para calcular o VAR 1. Avaliação Local (local valuation) Métodos que vimos até agora São procedimentos em geral analíticos Baseiam-se no valor inicial do instrumento ou carteira

Leia mais

a) Defina em Prolog iguais/1, um predicado que recebe um estado do jogo e que verifica que todas as pilhas têm o mesmo número de peças.

a) Defina em Prolog iguais/1, um predicado que recebe um estado do jogo e que verifica que todas as pilhas têm o mesmo número de peças. Introdução à Inteligência Artificial 2ª Época 29 Janeiro 2015 Nº Aluno: Nome Completo: Exame com consulta. Responda às perguntas nesta própria folha, nos espaços indicados. (I) O jogo do Nim (também chamado

Leia mais

Distribuições Amostrais

Distribuições Amostrais Distribuições Amostrais 1 Da população, com parâmetro, retira-se k amostras de tamanho n e calcula-se a estatística. Estas estatísticas são as estimativas de. As estatísticas, sendo variáveis aleatórias,

Leia mais

3. Resolução de problemas por meio de busca

3. Resolução de problemas por meio de busca Inteligência Artificial - IBM1024 3. Resolução de problemas por meio de busca Prof. Renato Tinós Local: Depto. de Computação e Matemática (FFCLRP/USP) 1 Principais Tópicos 3. Resolução de problemas por

Leia mais

Cadeias de Markov em Tempo Continuo

Cadeias de Markov em Tempo Continuo Cadeias de Markov em Tempo Continuo Ricardo Ehlers ehlers@icmc.usp.br Departamento de Matemática Aplicada e Estatística Universidade de São Paulo Capitulos 6 Taylor & Karlin 1 / 44 Análogo ao processo

Leia mais

Modelagem e Simulação de um Sistema de Aprendizado de Reforço para Robôs

Modelagem e Simulação de um Sistema de Aprendizado de Reforço para Robôs Modelagem e Simulação de um Sistema de Aprendizado de Reforço para Robôs André Luiz Carvalho Ottoni (UFSJ) andreottoni@ymail.com Rubisson Duarte Lamperti (UFSJ) duartelamperti@yahoo.com.br Erivelton Geraldo

Leia mais

Controle Preditivo com Aprendizado por Reforço para Produção de Óleo em Poços Inteligentes

Controle Preditivo com Aprendizado por Reforço para Produção de Óleo em Poços Inteligentes Alvaro Gustavo Talavera Lopez Controle Preditivo com Aprendizado por Reforço para Produção de Óleo em Poços Inteligentes Dissertação de Mestrado Dissertação apresentada como requisito parcial para obtenção

Leia mais

Inteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo]

Inteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo] Inteligência Artificial Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo] Aprendizagem de Máquina Área da Inteligência Artificial cujo objetivo é o desenvolvimento de técnicas computacionais sobre

Leia mais

Online Learning of Abstract Stochastic Policies with Monte Carlo

Online Learning of Abstract Stochastic Policies with Monte Carlo Online Learning of Abstract Stochastic Policies with Monte Carlo M. L. Koga, V. F. da Silva e A. H. R. Costa 1 Abstract When an autonomous agent faces many different, but related tasks, obtaining abstract

Leia mais

Algoritmos Genéticos. Princípio de Seleção Natural. Sub-áreas da Computação Evolutiva. Idéias básicas da CE. Computação Evolutiva

Algoritmos Genéticos. Princípio de Seleção Natural. Sub-áreas da Computação Evolutiva. Idéias básicas da CE. Computação Evolutiva Computação Evolutiva Algoritmos Genéticos A computação evolutiva (CE) é uma área da ciência da computação que abrange modelos computacionais inspirados na Teoria da Evolução das Espécies, essencialmente

Leia mais

Inteligência Artificial

Inteligência Artificial Universidade Federal de Campina Grande Departamento de Sistemas e Computação Pós-Graduação em Ciência da Computação Inteligência Artificial Aprendizagem (Redes Neurais - Complementar) Prof. a Joseana Macêdo

Leia mais

3 Processos Estocásticos

3 Processos Estocásticos 3 Processos Estocásticos Os processos estocásticos abordados nesta dissertação são conhecidos como movimento browniano (MB) e movimento de reversão à média (MRM). O capítulo terá como objetivo a apresentação

Leia mais

AULA 7 - Inferência em MQO: ICs e Testes de

AULA 7 - Inferência em MQO: ICs e Testes de AULA 7 - Inferência em MQO: ICs e Testes de Hipóteses Susan Schommer Econometria I - IE/UFRJ Nosso primeiro objetivo aqui é relembrar a diferença entre estimação de ponto vs estimação de intervalo. Vamos

Leia mais

Técnicas de Concepção de Algoritmos: Branch and Bound

Técnicas de Concepção de Algoritmos: Branch and Bound Técnicas de Concepção de Algoritmos: R. Rossetti, A.P. Rocha, A. Pereira, P.B. Silva, T. Fernandes FEUP, MIEIC, CAL, 2010/2011 1 O que é? BB ou B&B é uma técnica de concepção de algoritmos genérica para

Leia mais

Redes Neurais Artificiais

Redes Neurais Artificiais Redes Neurais Artificiais Marcelo K. Albertini 24 de Julho de 2014 2/34 Conteúdo Perceptron Gradiente descendente Redes multicamadas Retropropagação de erros 3/34 Modelos conexionistas Humanos Tempo de

Leia mais

Algoritmos de Aprendizado. Formas de Aprendizado. Aprendizado Batch x Incremental. Aprendizado Batch x Incremental

Algoritmos de Aprendizado. Formas de Aprendizado. Aprendizado Batch x Incremental. Aprendizado Batch x Incremental Algoritmos de Aprendizado Regra de Hebb Perceptron Delta Rule (Least Mean Square Back Propagation Formas de Aprendizado Existe dois métodos básicos de aplicação do algoritmo Back Propagation: Aprendizado

Leia mais

Aprendizado Bayesiano

Aprendizado Bayesiano Aprendizado Bayesiano Marcelo K. Albertini 26 de Junho de 2014 2/20 Conteúdo Teorema de Bayes Aprendizado MAP Classificador ótimo de Bayes 3/20 Dois papéis para métodos bayesianos Algoritmos de aprendizado

Leia mais

QoS Control for Sensor Networks Ranjit Iyer Leonard Kleinrock. Aluno: Eduardo Hargreaves Professor: Luís Felipe M. de Moraes

QoS Control for Sensor Networks Ranjit Iyer Leonard Kleinrock. Aluno: Eduardo Hargreaves Professor: Luís Felipe M. de Moraes QoS Control for Sensor Networks Ranjit Iyer Leonard Kleinrock Aluno: Eduardo Hargreaves Professor: Luís Felipe M. de Moraes Introdução As Redes de Sensores têm características bem particulares entre elas:

Leia mais