INVESTIGAÇÃO E IMPLEMENTAÇÃO DE UM SISTEMA INTELIGENTE COM APRENDIZAGEM POR REFORÇO

Tamanho: px
Começar a partir da página:

Download "INVESTIGAÇÃO E IMPLEMENTAÇÃO DE UM SISTEMA INTELIGENTE COM APRENDIZAGEM POR REFORÇO"

Transcrição

1 Anais do XVIII Encontro de Iniciação Científica e Pós-Graduação do ITA XVIII ENCITA / 212 Instituto Tecnológico de Aeronáutica São José dos Campos SP Brasil 17 de outubro de 212 INVESTIGAÇÃO E IMPLEMENTAÇÃO DE UM SISTEMA INTELIGENTE COM APRENDIZAGEM POR REFORÇO Victor Ribeiro Moura Instituto Tecnológico de Aeronáutica H8B apto. 21 CTA São José dos Campos/SP Bolsista PIBIC-CNPq vicrmoura@gmail.com Caio Henrique Coutinho Instituto Tecnológico de Aeronáutica Rua José Antônio de Oliveira 173 Jardim Morumbi São José dos Campos/SP caiohcoutinho@gmail.com Adilson Marques da Cunha Instituto Tecnológico de Aeronáutica Divisão de Ciência da Computação Praça Marechal Eduardo Gomes São José dos Campos/SP cunha.adilsonmarques2@gmail.com Resumo. Embora a inteligência artificial se apresente hoje como uma área da computação em expansão existe a necessidade de se criar formas rápidas e práticas de se aplicar suas técnicas em problemas diversos. Este projeto criou uma espécie de sistema inteligente sob a forma de uma biblioteca de código. Ela recebe um conjunto de classes pré-definidas e por meio de experimentos repetidos executa o treinamento de Redes Neurais que avaliam o valor de cada ação em dado estado para que se escolha a melhor. Este treinamento se executa a partir da técnica de aprendizagem por reforço SARSA. A construção do sistema inteligente realizou-se com êxito os testes com o Jogo da velha mostraram seu funcionamento e eficiência e o estudo de caso realizado no domínio do futebol de Robô mostrou sua capacidade de convergência embora tenha se observado o fenômeno de underfitting neste último caso. Palavras chave: SARSA Aprendizagem por Reforço Inteligência Artificial Sistemas Inteligentes. 1. Introdução O tema proposto para este trabalho de Iniciação Científica (IC) encontra-se relacionado com uma das áreas da computação em maior evidência atualmente a aprendizagem de máquina. A aprendizagem por reforço representa um de seus métodos baseada na tentativa e erro em que o supervisor fornece ao agente apenas informações sobre o resultado de suas ações satisfatórias ou não (Russell e Norvig 23). A aplicabilidade deste método se dá especificamente em ambientes com as propriedades de Markov ou seja se cada um de seus estados depende apenas do progresso realizado em um conjunto finito de estados anteriores (Russell e Norvig 23). Com esta característica encontram-se diversas questões especialmente as de robótica tanto em baixo nível como equilíbrio e movimentação quanto em alto nível como planejamento e coordenação de agentes múltiplos. Dessa forma o desenvolvimento de modos de aplicação do aprendizado por reforço em sistemas com Inteligência Artificial (IA) é condição necessária para o desenvolvimento de plataformas autônomas. De certo modo existe uma carência por mecanismos e ferramentas práticas para se aplicar tal conceito em problemas diversos obtendo-se resultados rápidos e eficientes. Com isto a criação de um sistema inteligente para aplicação de métodos de IA cumpriria este papel. Este trabalho de Iniciação Científica (IC) tem por objetivo desenvolver um método e/ou uma técnica para aplicabilidade da aprendizagem por reforço em um sistema inteligente de modo que ele possa aperfeiçoar sua precisão na resolução de problemas específicos. Dentre os algoritmos de aprendizagem por reforço dá-se o nome de State-Action-Reward-State-Action (SARSA) ou Modified Connectionist Q-Learning (MCQ-L) ao algoritmo que aplicado na forma proposta por (Rummery 1994) associa a cada ação uma rede neural. Esta recebe como entrada as variáveis de estado e retorna o valor real Q uma função de valor do par estado-ação. A rede é treinada iterativamente. Os passos do algoritmo podem ser observados na Figura 1.

2 1.!! = ; 2.! = ; 3. Selecionar ação!! ; 4. Se! > realizar as correções de peso:!! =!!!! +!.!!!! +!!!!!!!.!!!! ; 5. Calcular!!! com respeito apenas à ação!! ; 6.!! =!!! +!"!!!! ; 7. Executar!! e receber! ; 8. Se o estado final não foi atingido!! + 1 e ir para o passo 3. Figura 1. Algoritmo SARSA (Rummery 1994). 2. Material e Métodos Inicialmente realizou-se uma pesquisa literária para a obtenção de conhecimentos básicos sobre métodos técnicas e ferramentas de IA. Dentre os principais assuntos pesquisados incluíram-se: sistemas inteligentes redes neurais artificiais aprendizagem de máquina e aprendizagem por reforço. Além disto buscaram-se formas de aplicação destas técnicas com praticidade para que elas pudessem ser utilizadas em diversos domínios e testadas em problemas concretos e em diferentes níveis de complexidade. Esta pesquisa de IC compõe-se de três fases: Pesquisa Bibliográfica e Capacitação realizada nos dois primeiros bimestres; Desenvolvimento do método e elaboração de um sistema inteligente proposto nos dois próximos bimestres; e Aplicação do sistema em um estudo de caso atividade realizada nos últimos dois bimestres. A primeira fase englobou a reunião de um apanhado de técnicas recentes algoritmos importantes e dados bibliográficos relevantes ao estudo. A segunda referiu-se ao desenvolvimento e implementação do método para a utilização da técnica de aprendizado por reforço SARSA em um sistema inteligente. Finalmente na última fase aplicou-se a técnica em um estudo de caso no domínio dos jogos para aperfeiçoar a técnica de roubada de bola de um robô em uma simulação de futebol. Dessa forma ao fim deste ano de trabalho dispõe-se de conhecimentos e de prática nos aspectos explorados durante a pesquisa. Dentre eles: a realização de inferências em sistemas inteligentes; a construção e o treinamento de redes neurais artificiais; a aplicação de aprendizado por reforço utilizando-se de algoritmos como Q-Learning e SARSA; a criação de bibliotecas em C++; e a utilização do servidor RCSoccerSim (Chen et. al 22) empregado no estudo de caso. 3. Resultados e Discussão Ao longo desta seção discutiram-se os resultados obtidos durante a segunda e a terceira fase do projeto que se referem ao desenvolvimento do sistema inteligente e seu teste Desenvolvimento do Método Como descrito na seção 1 esta pesquisa de IC teve como objetivo a criação de uma forma prática para a aplicação de métodos de aprendizagem de máquina dentro do escopo dos problemas com a propriedade Markoviana Requisitos do Sistema Inteligente Para que se pudesse definir o formato desse sistema inteligente especificaram-se inicialmente alguns requisitos: Portabilidade; Facilidade de entendimento e uso; Abrangência com relação aos tipos de problemas; Eficiência; e Implementação de método de aprendizagem por reforço. O método escolhido baseou-se na criação de uma biblioteca em C++ de modo que funcionasse como um sistema inteligente. Isto porque o formato de biblioteca garante elevada portabilidade. Além disto a implementação em C++ contribui para a facilidade de entendimento e uso visto que esta constitui uma linguagem bastante utilizada e conhecida no meio da computação.

3 Além disso optou-se pelo algoritmo SARSA de aprendizagem por reforço uma vez que ele cobre de forma eficiente abrangente quantidade de problemas em IA aqueles caracterizados por ambientes contínuos com a propriedade de Markov Estrutura e Implementação do Sistema Inteligente Um dos primeiros passos para a construção de uma forma adaptável de aplicação do algoritmo foi a escolha da estrutura do sistema inteligente. A estrutura adotada esquematiza-se de acordo com a Figura 2. Percepção) (classe) Percep&on)) Ambiente) Agente)(classes)SARSA)e) NeuralNetwork)) Ação)(classe) Ac&on)) Figura 2. Estrutura adotada para o sistema inteligente. Conforme a Figura 2 verifica-se que o sistema se compõe de quatro classes em C++: Action Perception SARSA e NeuralNetwork. As duas últimas constituem o processo de aprendizagem do agente enquanto as duas primeiras são responsáveis pela interação deste com o ambiente. A classe Action implementa os comandos básicos necessários às ações desempenhadas pelo agente. Já a classe Perception recebe as percepções do ambiente realizadas pelo agente transformando-as em entradas para as redes neurais. A classe SARSA centraliza a tomada de decisões de acordo com o algoritmo de aprendizagem. Finalmente a classe NeuralNetwork constitui-se dos métodos e estruturas de uma rede neural feedforward à qual cada ação se associa. O código fonte encontra-se disponível e pode ser obtido no seguinte endereço eletrônico < Uso do Sistema Inteligente Para utilizar o sistema inteligente cabe ao usuário definir o ambiente os sensores e as ações disponíveis. Desta forma faz-se necessário implementar: O ambiente que deve ser alterado a cada ação executada e progredir de forma cíclica ou não; A classe MyPerception derivada da Perception que completa seus métodos virtuais os quais transformam as leituras dos sensores em entradas para as redes neurais; e As classes correspondentes a cada ação disponível herdando da classe Action e implementando seus métodos virtuais os quais executam e fazem as verificações necessárias às ações. 3. Para que se dê o processo de aprendizagem deve-se inicializar e iterar conforme a estrutura apresentada na Figura

4 // Inicialização SARSA* brain; MyPerception perception; vector<action*allocator<action*> > actionarray; ////// Inicializar ações no vetor de ações brain = new SARSA(&perception actionarray); brain->setparameters(alpha lambda gamma numberhiddenunits tempini tempfim numiterations); // No início de cada episódio brain->initepisode(); // Em cada iteração perception.setinputs(); if(train){ perception.setreward(); action = brain->learningiteration(); } else action = brain->choosebestaction(); if (action>=) actionarray[action]->execute(); // Finalização brain->saveweights(); Figura 3. Estrutura a ser aplicada para a utilização do algoritmo Teste do Sistema Inteligente Jogo da Velha Para que o funcionamento do sistema inteligente fosse testado e se pudesse exemplificar sua aplicação ele foi aplicado em um experimento envolvendo o aprendizado do Jogo da velha. Este jogo se baseia nas seguintes regras (< Acesso em: 2 de junho de 212): O tabuleiro forma-se por uma matriz de três linhas por três colunas; Dois jogadores escolhem uma marcação cada um geralmente um círculo (O) e um xis (X); Os jogadores jogam alternadamente uma marcação por vez em uma lacuna que esteja vazia; e Objetiva-se conseguir três círculos ou três xis em linha quer horizontal vertical ou diagonal e ao mesmo tempo quando possível impedir o adversário de ganhar na próxima jogada. Figura 4. Exemplo de partida do Jogo da Velha em que o jogador com xis (X) é vencedor. (< Acesso em: 2 de junho de 212). Para que o sistema inteligente pudesse aprender uma política ótima para o jogo implementaram-se: a classe Mark derivada de Action; a classe MyPerception derivada de Perception; e o programa TicTacToe que simula o jogo e o adversário possibilitando o treinamento do agente. O código fonte pode ser encontrado no seguinte endereço eletrônico < Basicamente o programa TicTacToe define o adversário os parâmetros de treinamento o número de iterações e simula as partidas alternando quem as inicia. Em cada rodada ele aciona o respectivo jogador o qual escolhe uma ação segundo sua política de jogo.

5 O conjunto de ações possíveis se caracteriza pela marcação de posições livres do tabuleiro. Cada ação recebe uma rede neural a qual avalia o valor de realizá-la no estado atual. O tabuleiro constitui-se de uma matriz 3x3 de inteiros com os valores: para espaço vazio; 1 para o primeiro jogador; e 2 para o segundo. Estes valores por meio das funções de percepção são transmitidos como entrada para as redes neurais. O adversário empregado no aprendizado foi escolhido de duas formas. Primeiramente realizou-se treinamento contra um adversário baseado numa política simples que executa uma entre três ações na seguinte ordem de prioridade: marcar se for possível uma fileira para vencer; marcar caso seja necessário uma fileira para não perder; e marcar uma posição aleatória. Em seguida realizou-se um treinamento contra outro aprendiz. As recompensas/penalidades fixadas consistiram em: -1 para derrota; para empate; e 1 para vitória. Contra o primeiro adversário testaram-se diversas configurações para os parâmetros do algoritmo quais sejam a taxa de aprendizagem (α) o fator de desconto (γ) o parâmetro de elegibilidade (λ) o número de células na camada intermediária das redes neurais e a temperatura da distribuição de Boltzmann. Nota-se nas Figuras de 5 a 9 a relação entre os parâmetros e as médias de vitórias empates e derrotas. 5 5 Média de partidas alpha Figura 5. Média de partidas em função do parâmetro alpha variando-se os outros parâmetros..7.6 Média de partidas Temperatura Figura 6. Média de partidas em função do parâmetro temperatura variando-se os outros parâmetros.

6 5 5 Média de Partidas lambda Figura 7. Média de partidas em função do parâmetro lambda variando-se os outros parâmetros..7.6 Média de partidas gamma Figura 8. Média de partidas em função do parâmetro gamma variando-se os outros parâmetros..7.6 Média de partidas Número de células Figura 9. Média de partidas em função do número de células intermediárias na rede neural variando-se os outros parâmetros.

7 A partir dos dados obtidos pode-se inferir que a configuração com maior quociente entre o número de vitórias e o número de derrotas encontra-se próxima àquela com! =!! =.8! =.8 4 células na camada intermediária de cada rede neural e.7 para a temperatura de Boltzmann. Para esta configuração a convergência do algoritmo pode ser observada na Figura Média de Partidas Número de Iterações x 1 4 Figura 1. Média de partidas em função do número de iterações para a configuração que maximiza o quociente entre o número de vitórias e o número de derrotas. Esta mesma configuração foi empregada para o treinamento entre dois aprendizes para o que se chegou ao resultado representado na Figura 11 em que o jogador 1 inicia o primeiro jogo do Jogador 1 do Jogador 2.7 Média de Partidas Número de Iterações x 1 4 Figura 11. Média de partidas em função do número de iterações para a mesma configuração da Figura 1 mas entre dois aprendizes. Nota-se que esta configuração de parâmetros parece não ter gerado convergência para a política ótima do jogo na qual ambos minimizariam a média de derrotas o que por conseguinte maximizaria a média de empates. 3.2 Estudo de Caso Simulador de Futebol em duas Dimensões Esta subseção se refere à aplicação do sistema inteligente a um estudo de caso e à análise de seus resultados.

8 3.2.1 Requisitos e Escolha do Estudo de Caso A busca por um problema específico para a realização de um estudo de caso levou em consideração dois fatores: A complexidade do problema que deveria ser suficiente para colocar em prova a capacidade de convergência e aperfeiçoamento do algoritmo; e O caráter realístico do problema simulando por exemplo uma aplicação real em robótica. Dessa forma após um período de pesquisas decidiu-se pela utilização do sistema para o treinamento de um time de futebol de robôs em uma plataforma de simulação com duas dimensões. Isto porque como será mais bem detalhada a seguir esta aplicação mostrou-se conveniente interessante e desafiadora Robocup Soccer2D Como uma renomada competição mundial de robótica a RoboCup possui foco em futebol de robôs e ocorre anualmente envolvendo diversas categorias com robôs simulados e reais. Ela tem por objetivo a promoção do desenvolvimento da robótica e da IA de tal forma que na metade do século 21 um time de robôs autônomos vença a última seleção campeã da Copa do Mundo de futebol humano (< Acesso em: 5 de fevereiro de 212). Em uma de suas categorias a chamada RoboCup Soccer Simulation League 2D competem times de simulação de futebol de robôs autônomos em duas dimensões. As características e a forma de utilização do servidor de simulação (RCSoccerSim) encontram-se em (Chen et. al 22). A Figura 12 ilustra uma partida nele simulada. Figura 12. Campo do Simulador RCSoccerSim (< Field.jpg>. Acesso em: 1 de fevereiro de 212). Aplicando-se o sistema inteligente criado esta pesquisa de IC realizou um estudo de caso para aperfeiçoar a aptidão de roubada de bola de um time-base dessa categoria conhecido como Agent2d (Akiyama et al. 27). A aplicação baseou-se nos testes realizados em (Gabel et al. 28). Dentre os desafios encontrados neste estudo de caso encontram-se as dificuldades práticas de manipulação do servidor e do código do time-base. Além disto este problema se apresenta como uma tarefa complexa para o algoritmo devido a sua alta dimensionalidade às incertezas (o simulador impõe incertezas e limitações na realização das ações e nos dados por ele fornecidos) e ao caráter multi-agente da tarefa Estrutura e Implementação do Estudo de Caso A aprendizagem consistiu basicamente da repetição exaustiva de episódios em que um agente disputa a bola com o adversário. Em cada episódio inicializa-se o ambiente da seguinte forma: Marcador no centro de uma das quatro possíveis configurações representadas na Figura 13 com orientação aleatória; Atacante com uma posição e orientação randômica em torno do centro da configuração dentro do semicírculo de raio 3 metros entre o marcador e o gol ou dentro do semicírculo de raio 5 metros com o marcador entre ele e o gol; e Bola dentro da região em que o atacante pode chutar com o vetor velocidade escolhido aleatoriamente.

9 Figura 13. Possíveis configurações iniciais para o treinamento (Gabel et al. 28). As ações possíveis para o agente (marcador) são: girar em ângulos múltiplos de 15 e mover-se com 5 possíveis valores de velocidade. Tais ações ocorrem de forma inexata bem como se medem a posição orientação e velocidade de todos os componentes do treinamento com erros. Desta forma fixaram-se as seguintes entradas para as redes neurais: Distância para o oponente; Ângulo relativo ao oponente; Módulo da velocidade do oponente; Módulo da velocidade do agente; Distância do agente para a bola; Ângulo do agente relativo à bola; Ângulo do oponente em relação à reta que liga o agente ao centro do gol; e Ângulo entre os segmentos que ligam o oponente ao agente e o oponente ao gol. Cada episódio pode acabar: com vitória se o marcador dominar a bola ou se ele puder alcançá-la em tempo menor que o adversário ou se a probabilidade dele conseguir tomá-la for maior ou igual a 75%; com derrota se o adversário se afastar mais de 7 metros do marcador ou se o episódio durar mais que 35 ciclos ou se a probabilidade do adversário marcar um gol for maior que 5%. No primeiro caso fixou-se a recompensa recebida em +1 enquanto que no segundo em -1. Ainda em cada ciclo o agente é recompensado por sua proximidade à bola segundo a função:!! ! 1!"!!!!"#$â!"#!!!"é!!!!"#$!!"#!!"#$%!!"#!1!!"#$%&!"!!!!"#$â!"#$!!!!"é!!!!"#$!!"#!!"#$%!!"!!"#$%!!!1!!"#$%&!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!(1) Seguindo as instruções de uso do sistema inteligente como exposto e exemplificado nas seções anteriores utilizaram-se as classes básicas do sistema combinadas com a simulação do ambiente realizada pelo servidor (Chen et. al 22) a classe MyPerception e as classes para as ações possíveis Resultados Alcançados Após a execução do algoritmo com diversas combinações de parâmetros verificou-se que uma combinação que fornecia uma maior quantidade de roubadas de bola foi! =.95!! =.99! = 6 células na camada intermediária de cada rede neural e para a temperatura de Boltzmann. Para esta configuração a convergência pode ser verificada a partir da Figura 14.

10 - - Recompensa Média Número de Iterações Figura 14. Recompensa média recebida pelo marcador em função do número de iterações. Observando o resultado ao final do treinamento verificou-se que o aprendiz não apresentou desempenho satisfatório. Isto porque como se pode observar na Figura 15 a quantidade de derrotas permaneceu muito alta (superior a 8%) e a recompensa média embora tenha aumentado durante os treinamentos convergiu para um mínimo local de valor negativo..9.8 Média de Partidas Número de Iterações Figura 15. Média de partidas em função do número de iterações para um conjunto de parâmetros escolhido por meio de testes. Isso caracterizou a ocorrência do fenômeno de underfitting significando que o modelo desempenhou-se de forma muito simplista durante o processo de aprendizagem. Isto é ele não foi capaz de distinguir padrões importantes a partir de seu treinamento. Algumas possíveis explicações para esse underfitting podem ser: A necessidade de critérios mais apurados para a escolha dos parâmetros podendo-se aplicar algum método de otimização; Baixa quantidade de iterações; A escolha de uma função de recompensa cuja minimização não resulta no desempenho esperado para o que seria necessária outra função de recompensa; e O método de inteligência artificial proposto não foi capaz de lidar com o grau de complexidade do problema ou com os erros injetados pelo servidor.

11 4. Conclusões e Recomendações Esta pesquisa em nível de Iniciação Científica realizou-se com êxito de acordo com os termos da proposta de trabalho. Ao fim de dois semestres o bolsista familiarizou-se com as fontes bibliográficas concernentes ao tema capacitou-se nos métodos necessários ao desenvolvimento do projeto envolvendo: a utilização de bibliotecas em C++; a aplicação de artifícios de Inteligência Artificial (IA); e a aprendizagem de máquina. Assim pode-se desenvolver e aplicar a técnica proposta que se baseia na criação de um sistema inteligente para treinar redes neurais de modo a se aprender políticas ótimas em espaços Markovianos. Além disso o bolsista entrou em contato com a plataforma de simulação de futebol em duas dimensões utilizada para o estudo de caso na etapa final do projeto em que se verificou a capacidade de convergência do algoritmo. Todavia devido à elevada complexidade da tarefa e a outros possíveis fatores descritos na seção o modelo desempenhou-se de forma muito simplista durante o processo de aprendizagem. Dessa forma a construção do sistema inteligente constituiu apenas um primeiro passo para a construção de formas mais simples e rápidas de se utilizar algoritmos de IA. Recomenda-se como continuação deste trabalho de pesquisa que o algoritmo implementado seja submetido à otimização de seus parâmetros a um maior número de iterações e que sua função de recompensa possa vir a ser remodelada. Assim resolver-se-iam os problemas detectados no estudo de caso. Sugere-se para trabalhos futuros a expansão do sistema inteligente com a implementação de novos algoritmos de IA como por exemplo métodos de planejamento e localização para agentes os quais poderiam ainda ser aplicados ao estudo de caso de futebol de robôs. 5. Agradecimentos O autor deste trabalho de Iniciação Científica agradece às pessoas envolvidas no Projeto e diretamente ligadas a ele: ao Prof. Dr. Adilson Marques da Cunha; e ao Aluno de Pós-Graduação do ITA Caio Henrique Coutinho. Até este momento essas pessoas forneceram a oportunidade de aquisição de muitos conhecimentos nas áreas de IA Sistemas Inteligentes e Métodos de Aprendizagem. Agradece-se também ao CNPq que vinculado ao Ministério da Ciência e Tecnologia (MCT) apoia a pesquisa brasileira e contribui diretamente para a formação de jovens pesquisadores investindo e promovendo o aumento da produção de conhecimento e gerando novas oportunidades para universitários desejosos em iniciar uma vida de pesquisa e desenvolvimento nas diversas áreas do conhecimento. 6. Referências Russell D.E. e Norvig P. 23 Artificial Intelligence: a modern approach 2nd ed. Prentice-Hall. Chen M. Foroughi E. Heintz F. Huang Z. Kapetanakis S. Kostiadis K. Kummeneje J. Noda I. Obst O. Riley P. Steffens T. Wang Y. e Yin X. 22 User s Manual: RoboCup Soccer Server for Soccer Server Version 7.7 and Later The RoboCup Federation. Rummery G. e Niranjan M On-line Q-learning using Connectionist systems technical report no. 166 University of Cambridge Engineering Department. Akiyama H. Shimora H. e Noda I. 27 Helios27 team description The RoboCup Federation. Gabel T. Reidmiller M. e Trost F. 28 A Case Study on Improving Defense Behavior in Soccer Simulation 2D: The NeuroHassle Approach The RoboCup Federation.

Desenvolvimento de Estratégia para Programação do Futebol de Robôs

Desenvolvimento de Estratégia para Programação do Futebol de Robôs Anais do XXVI Congresso da SBC EnRI l III Encontro de Robótica Inteligente 14 a 0 de julho de 006 Campo Grande, MS Desenvolvimento de Estratégia para Programação do Futebol de Robôs Wânderson O. Assis,

Leia mais

UTILIZAÇÃO DE APRENDIZADO POR REFORÇO PARA APRENDER A ESTRATÉGIA DO JOGO DA VELHA

UTILIZAÇÃO DE APRENDIZADO POR REFORÇO PARA APRENDER A ESTRATÉGIA DO JOGO DA VELHA Anais do 12 O Encontro de Iniciação Científica e Pós-Graduação do ITA XII ENCITA / 2006 Instituto Tecnológico de Aeronáutica São José dos Campos SP Brasil Outubro 16 a19 2006 UTILIZAÇÃO DE APRENDIZADO

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Relatório: Rede Neural para tomada de decisão Christian Diego Alves Daniel cdad Icamaan Botelho Viegas da Silva - ibvs Recife, 30 de Julho de 2007. 1. Introdução A Robocup é um

Leia mais

Modelagem e Simulação de um Sistema de Aprendizado de Reforço para Robôs

Modelagem e Simulação de um Sistema de Aprendizado de Reforço para Robôs Modelagem e Simulação de um Sistema de Aprendizado de Reforço para Robôs André Luiz Carvalho Ottoni (UFSJ) andreottoni@ymail.com Rubisson Duarte Lamperti (UFSJ) duartelamperti@yahoo.com.br Erivelton Geraldo

Leia mais

Simulação de Futebol de Robôs

Simulação de Futebol de Robôs Departamento de Engenharia Elétrica Simulação de Futebol de Robôs Aluna: Bianca Burgos Maron Orientadora: Marley Vellasco Introdução A inteligência computacional e suas aplicações em robôs inteligentes

Leia mais

RobotBulls Robotics Team Description 2015 (2D)

RobotBulls Robotics Team Description 2015 (2D) RobotBulls Robotics Team Description 2015 (2D) Alexandre Baratella Lugli, Haroldo Manoel Dornelas, Leonardo de Oliveira Saldanha e Wanderson Eleutério Saldanha. Av. João de Camargo, 510, Santa Rita do

Leia mais

Desenvolvimento de um time de futebol robótico para o RoboCup 2D

Desenvolvimento de um time de futebol robótico para o RoboCup 2D Desenvolvimento de um time de futebol robótico para o RoboCup 2D Rodrigo Mendes Garcês 1,Jamesson Amaral Gomes 1, Geraldo Braz Júnior 1, Alexandre César Muniz de Oliveira 1, Luciano Reis Coutinho 1, Paulo

Leia mais

Fabrício Jailson Barth BandTec

Fabrício Jailson Barth BandTec Introdução à Inteligência Artificial Fabrício Jailson Barth fabricio.barth@bandtec.com.br BandTec 1 o semestre de 2012 Objetivos e Sumário O que é Inteligência Artificial (IA)? Objetivos da IA. Influência

Leia mais

Fundamentos de Inteligência Artificial [5COP099]

Fundamentos de Inteligência Artificial [5COP099] Fundamentos de Inteligência Artificial [5COP099] Dr. Sylvio Barbon Junior Departamento de Computação - UEL 1 o Semestre Assunto Aula 7 Algoritmos de Busca Competitiva 2 de 20 Sumário Introdução Busca Competitiva

Leia mais

IMPLEMENTAÇÃO DE SISTEMA DE ATITUDE EM DSP

IMPLEMENTAÇÃO DE SISTEMA DE ATITUDE EM DSP Anais do 15 O Encontro de Iniciação Científica e Pós-Graduação do ITA XV ENCITA / 2009 Instituto Tecnológico de Aeronáutica São José dos Campos SP Brasil Outubro 19 a 21 2009. IMPLEMENTAÇÃO DE SISTEMA

Leia mais

3 Aprendizado por reforço

3 Aprendizado por reforço 3 Aprendizado por reforço Aprendizado por reforço é um ramo estudado em estatística, psicologia, neurociência e ciência da computação. Atraiu o interesse de pesquisadores ligados a aprendizado de máquina

Leia mais

UAISOCCER2D - TEAM DESCRIPTION PAPER CBR 2013

UAISOCCER2D - TEAM DESCRIPTION PAPER CBR 2013 UAISOCCER2D - TEAM DESCRIPTION PAPER CBR 2013 André Luiz Carvalho Ottoni, Erivelton Geraldo Nepomuceno, Marcos Santos de Oliveira, Rubisson Duarte Lamperti, Eduardo Bento Pereira, Emerson Santos Silva,

Leia mais

Implementação e Avaliação do Algoritmo MCTS-UCT para o jogo Chinese Checkers. Jhonny Moreira

Implementação e Avaliação do Algoritmo MCTS-UCT para o jogo Chinese Checkers. Jhonny Moreira Implementação e Avaliação do Algoritmo MCTS-UCT para o jogo Chinese Checkers Jhonny Moreira Introdução Introdução Na área da inteligência artificial (IA), a motivação é conseguir colocar os computadores

Leia mais

Um Algoritmo Genético com Aprendizado por Reforço Simples aplicado ao problema do Mundo de Grid

Um Algoritmo Genético com Aprendizado por Reforço Simples aplicado ao problema do Mundo de Grid 1 Um Algoritmo Genético com Aprendizado por Reforço Simples aplicado ao problema do Mundo de Grid Luciana Conceição Dias Campos Resumo Este trabalho consiste da aplicação de um algoritmo genético ao método

Leia mais

Campeonato de Gamão. 1. Regras. 2. Servidor

Campeonato de Gamão. 1. Regras. 2. Servidor Campeonato de Gamão 1. Regras O campeonato de gamão será disputado de acordo com as regras tradicionais do jogo, facilmente encontradas na Internet. As duas cores tradicionais das pedras do jogo serão

Leia mais

Aprendizado por Reforço

Aprendizado por Reforço Aprendizado por Reforço Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Aprendizado por Reforço 2. Q-Learning 3. SARSA 4. Outras ideias 1 Aprendizado por Reforço Problemas de decisão

Leia mais

Figura: Capa do Livro Hamburger, H., Richards, D. Logic and Language Models for Computer Science, Prentice Hall.

Figura: Capa do Livro Hamburger, H., Richards, D. Logic and Language Models for Computer Science, Prentice Hall. Figura: Capa do Livro Hamburger, H., Richards, D. Logic and Language Models for Computer Science, Prentice Hall. Universidade Federal de Campina Grande Departamento de Sistemas e Computação Curso de Bacharelado

Leia mais

Framework para o Desenvolvimento de Agentes para a Robocup: o Módulo de Definição de Áreas de Atuação

Framework para o Desenvolvimento de Agentes para a Robocup: o Módulo de Definição de Áreas de Atuação Framework para o Desenvolvimento de para a Robocup: o Módulo de Definição de Áreas de Atuação Andre Zanki Cordenonsi, Alisson Moscato Loy, Guilherme Dhein, Leone Francisco Petry Cesca Centro Universitário

Leia mais

TDP do time RECIFE SOCCER Futebol SPL

TDP do time RECIFE SOCCER Futebol SPL 1 TDP do time RECIFE SOCCER Futebol SPL Gabriel Alves da Silva 1, Paulo Martins Monteiro 2, Pedro Ferreira da Silva Junior 3, Simone Gomes Zelaquett 4, Tasso Luís Oliveira de Moraes 5. Resumo Este artigo

Leia mais

APLICAÇÃO DO ALGORITMO SARSA NA COLETA DE LIXO - ESTUDO DO PARÂMETRO ALPHA 1

APLICAÇÃO DO ALGORITMO SARSA NA COLETA DE LIXO - ESTUDO DO PARÂMETRO ALPHA 1 APLICAÇÃO DO ALGORITMO SARSA NA COLETA DE LIXO - ESTUDO DO PARÂMETRO ALPHA 1 Darlinton Prauchner 2, Rogério Martins 3, Edson Padoin 4. 1 Trabalho de conclusão de curso realiazado no curso de Ciência da

Leia mais

Implementação de um Time para a categoria RoboCup Soccer Simulation 3D

Implementação de um Time para a categoria RoboCup Soccer Simulation 3D Anais do XXVI Congresso da SBC EnRI l III Encontro de Robótica Inteligente 14 a 20 de julho de 2006 Campo Grande, MS Implementação de um Time para a categoria RoboCup Soccer Simulation 3D Luiz Antonio

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 24 Aprendizado Por Reforço Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor (KNN).

Leia mais

8.1 Principais Resultados

8.1 Principais Resultados 8 Conclusões Nesta dissertação, descrevemos um sistema multi-agente para negociação em leilões simultâneos de bens relacionados. Quando falamos de agentes de negociação nos referimos ao software que negocia

Leia mais

Sistema de Reconhecimento de Robôs da categoria Small Size de Futebol de Robôs da FEI RoboFEI

Sistema de Reconhecimento de Robôs da categoria Small Size de Futebol de Robôs da FEI RoboFEI Projeto de iniciação científica Sistema de Reconhecimento de Robôs da categoria Small Size de Futebol de Robôs da FEI RoboFEI Orientador: Flavio Tonidandel Departamento: Ciência da Computação Candidato:

Leia mais

C o m p u t a ç ã o M ó v e l. André Siqueira Ruela

C o m p u t a ç ã o M ó v e l. André Siqueira Ruela C o m p u t a ç ã o M ó v e l André Siqueira Ruela Sumário Revisão sobre AGs. Codificação de uma Rede Neural. AG em treinamento supervisionado. AG em treinamento não supervisionado. Revisão: Algoritmos

Leia mais

Instituto de Informática. Departamento de Informática Aplicada

Instituto de Informática. Departamento de Informática Aplicada UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL Instituto de Informática Departamento de Informática Aplicada INF01048 Inteligência Artificial Prof. Paulo Martins Engel Trabalho Prático - Relatório Final Carlos

Leia mais

Fundamentos de Inteligência Artificial [5COP099]

Fundamentos de Inteligência Artificial [5COP099] Fundamentos de Inteligência Artificial [5COP099] Dr. Sylvio Barbon Junior Departamento de Computação - UEL 1 o Semestre Assunto Aula 2 Agentes Inteligentes 2 de 22 Sumário Introdução Propriedades dos Agentes

Leia mais

Trabalho Prático 2 Mundo dos Blocos Alocação Dinâmica / Listas Encadeadas

Trabalho Prático 2 Mundo dos Blocos Alocação Dinâmica / Listas Encadeadas Disciplina: Algoritmos e Estrutura de Dados I CIC / 9 Trabalho Prático Mundo dos Blocos Alocação Dinâmica / Listas Encadeadas Valor:,5 pontos (5% da nota total) Documentação não-latex: -, pontos Impressão

Leia mais

Redes Neurais Artificiais Aplicadas ao Jogo da Velha 3D em Pinos

Redes Neurais Artificiais Aplicadas ao Jogo da Velha 3D em Pinos Redes Neurais Artificiais Aplicadas ao Jogo da Velha 3D em Pinos TCC - Jan/09 Daniel Tré - ISTCCP Redes Neurais Artificiais Aplicadas ao Jogo da Velha 3D em Pinos p. 1/2 O que são Redes Neurais Artificiais

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial INF 1771 Inteligência Artificial Aula 18 Aprendizado Por Reforço Edirlei Soares de Lima Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor (KNN).

Leia mais

APLICAÇÃO DE REDES NEURAIS RECORRENTES EM AMBIENTES PARCIALMENTE OBSERVÁVEIS 1

APLICAÇÃO DE REDES NEURAIS RECORRENTES EM AMBIENTES PARCIALMENTE OBSERVÁVEIS 1 APLICAÇÃO DE REDES NEURAIS RECORRENTES EM AMBIENTES PARCIALMENTE OBSERVÁVEIS 1 Eldair Fabrício Dornelles 2, Henrique Augusto Richter 3, Márcia Da Silva 4, Rogério Samuel De Moura Martins 5, Sandro Sawicki

Leia mais

Processo para o ensino e desenvolvimento do futebol e futsal: ESTÁGIOS DE INICIANTES, AVANÇADOS E DE DOMÍNIO

Processo para o ensino e desenvolvimento do futebol e futsal: ESTÁGIOS DE INICIANTES, AVANÇADOS E DE DOMÍNIO Processo para o ensino e desenvolvimento do futebol e futsal: ESTÁGIOS DE INICIANTES, AVANÇADOS E DE DOMÍNIO Processo para o ensino do futebol/ futsal A metodologia para o ensino do futebol até a especialização

Leia mais

Futebol de robôs: relatório final

Futebol de robôs: relatório final Universidade Federal do Rio Grande do Sul Instituto de Informática Redes Neurais e Sistemas Fuzzy INF01036 Futebol de robôs: relatório final Christian Northfleet 141976 Márcio de Oliveira 171485 4 de Dezembro

Leia mais

5 Estudo de Caso e Resultados

5 Estudo de Caso e Resultados 5 Estudo de Caso e Resultados 5.1. Introdução Finalizado o desenvolvimento da ferramenta, é indispensável testar suas funcionalidades e a eficácia da aplicação conjunta dos seus módulos de geração de experimentos

Leia mais

RECONHECIMENTO DE CARACTERES EM PLACAS AUTOMOTIVAS UTILIZANDO REDES NEURAIS

RECONHECIMENTO DE CARACTERES EM PLACAS AUTOMOTIVAS UTILIZANDO REDES NEURAIS RECONHECIMENTO DE CARACTERES EM PLACAS AUTOMOTIVAS UTILIZANDO REDES NEURAIS Eduarda Gonçalves Dias 1 ; Wanderson Rigo 2 ; Manassés Ribeiro 3 INTRODUÇÃO Os sistemas de visão artificial vêm auxiliando o

Leia mais

Jogos com Oponentes. March 7, 2018

Jogos com Oponentes. March 7, 2018 Jogos com Oponentes March 7, 2018 Jogos com Oponentes ˆ Problemas de busca: não assumem a presença de um oponente ˆ Jogos: oponente INCERTEZA! ˆ Incerteza porque não se conhece as jogadas exatas do oponente

Leia mais

Ítalo Eber de Souza Moraes.

Ítalo Eber de Souza Moraes. Ítalo Eber de Souza Moraes italoe@gmail.com Introdução Inteligência artificial aplicada a jogos apresenta um montante extraordinário de desafios que se relacionam aos objetivos de proporcionar fidelidade

Leia mais

Classificação de Padrões. Abordagem prática com Redes Neurais Artificiais

Classificação de Padrões. Abordagem prática com Redes Neurais Artificiais Classificação de Padrões Abordagem prática com Redes Neurais Artificiais Agenda Parte I - Introdução ao aprendizado de máquina Parte II - Teoria RNA Parte III - Prática RNA Parte IV - Lições aprendidas

Leia mais

Cada jogador possui a visão do jogo, conforme ilustrado na Figura 3, que pode ser alterada e programada pelo desenvolvedor.

Cada jogador possui a visão do jogo, conforme ilustrado na Figura 3, que pode ser alterada e programada pelo desenvolvedor. Robotbulls Robotics Descrição da Equipe 2014* Alexandre Baratella Lugli. Av. João de Camargo, 510, Santa Rita do Sapucaí/MG. National Telecommunication Institute - INATEL, Department Industrial Automation

Leia mais

Computação Evolutiva Eduardo do Valle Simões Renato Tinós ICMC - USP

Computação Evolutiva Eduardo do Valle Simões Renato Tinós ICMC - USP Computação Evolutiva Eduardo do Valle Simões Renato Tinós ICMC - USP 1 Principais Tópicos Introdução Evolução Natural Algoritmos Genéticos Aplicações Conclusão 2 Introdução http://www.formula-um.com/ Como

Leia mais

Microsoft Faculty Connection

Microsoft Faculty Connection Microsoft Faculty Connection Plataforma de Jogos como Ferramenta Multidisciplinar Prof. Dr. LucianoAntonio Digiampietri EACH-USP Roteiro Introdução Objetivos Detalhamentodo Projeto Conclusões Introdução

Leia mais

GarrinchaBot: Uma proposta de robô para Robocup Small size League

GarrinchaBot: Uma proposta de robô para Robocup Small size League Anais do 15 O Encontro de Iniciação Científica e Pós-Graduação do ITA XV ENCITA / 2009 Instituto Tecnológico de Aeronáutica São José dos Campos SP Brasil Outubro 19 a 22 2009. GarrinchaBot: Uma proposta

Leia mais

Simulação do Jogo Tic-Tac-Toe com o uso de Técnicas de Inteligência Artificial

Simulação do Jogo Tic-Tac-Toe com o uso de Técnicas de Inteligência Artificial STIN Simpósio de Tecnologia da Informação da Região Noroeste do RS 163 Simulação do Jogo Tic-Tac-Toe com o uso de Técnicas de Inteligência Artificial Aluísio de Ávila, Angélica Caetane Pelizza, Bruno Barbosa

Leia mais

Implementando um controlador difuso para ajuste de condução da bola do Agente do MecaTeam

Implementando um controlador difuso para ajuste de condução da bola do Agente do MecaTeam Implementando um controlador difuso para ajuste de condução da bola do Agente do MecaTeam Orivaldo Vieira Santana Júnior e Robson Rodrigo Tenório Gonzaga 1 Universidade Federal da Bahia (UFBA) Departamento

Leia mais

PMR Computação para Mecatrônica

PMR Computação para Mecatrônica PMR3201 - Computação para Mecatrônica Prof. Thiago de Castro Martins Prof. Newton Maruyama Prof. Marcos de S.G. Tsuzuki Monitor: Pietro Teruya Domingues Exercício Programa 2 - Versão 2017 Resolvendo o

Leia mais

Computação I - Python Aula 1 - Teórica: Introdução

Computação I - Python Aula 1 - Teórica: Introdução Computação I - Python Aula 1 - Teórica: Introdução João C. P. da Silva Carla A. D. M. Delgado Ana Luisa Duboc Dept. Ciência da Computação - UFRJ http://ladybugcodingschool.com/ Computação I - Python Aula

Leia mais

LAAB: Ludicidade Africana e Afrobrasileira.

LAAB: Ludicidade Africana e Afrobrasileira. UNIVERSIDADE FEDERAL DO PARÁ FACULDADE DE PEDAGOGIA CAMPUS DE CASTANHAL LAAB: Ludicidade Africana e Afrobrasileira. Coordenadora: Débora Alfaia Bolsista: Gabriela Paixão Castanhal- PA 2012 Oficina de Jogos

Leia mais

SEMINÁRIO DOS ARTIGOS:

SEMINÁRIO DOS ARTIGOS: SEMINÁRIO DOS ARTIGOS: Text Detection and Character Recognition in Scene Images with Unsupervised Feature Learning End-to-End Text Recognition with Convolutional Neural Networks Fernanda Maria Sirlene

Leia mais

Protótipo de um Simulador de um Aspirador de Pó, Utilizando Algoritmo de Busca e Agentes Inteligentes, em Ambientes com Barreiras

Protótipo de um Simulador de um Aspirador de Pó, Utilizando Algoritmo de Busca e Agentes Inteligentes, em Ambientes com Barreiras Protótipo de um Simulador de um Aspirador de Pó, Utilizando Algoritmo de Busca e Agentes Inteligentes, em Ambientes com Barreiras Jussara Vieira Ramos ROTEIRO Objetivo Introdução: I.A. X Robótica Agentes

Leia mais

Busca com informação e exploração. Inteligência Artificial. Revisão da aula passada: Heurística Admissível. Revisão da aula passada: Busca A *

Busca com informação e exploração. Inteligência Artificial. Revisão da aula passada: Heurística Admissível. Revisão da aula passada: Busca A * Inteligência Artificial Aula 6 Profª Bianca Zadrozny http://www.ic.uff.br/~bianca/ia Busca com informação e exploração Capítulo 4 Russell & Norvig Seção 4.2 e 4.3 Revisão da aula passada: Busca A * Idéia:

Leia mais

3. Resolução de problemas por meio de busca

3. Resolução de problemas por meio de busca Inteligência Artificial - IBM1024 3. Resolução de problemas por meio de busca Prof. Renato Tinós Local: Depto. de Computação e Matemática (FFCLRP/USP) 1 Principais Tópicos 3. Resolução de problemas por

Leia mais

Paradigma Simbólico. Sistemas de Informação UNISUL Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 2)

Paradigma Simbólico. Sistemas de Informação UNISUL Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 2) Paradigma Simbólico Sistemas de Informação UNISUL Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 2) Revisão da aula anterior: definição de IA Podemos associar o termo IA com: Parte da ciência da computação

Leia mais

Redes Neurais (Inteligência Artificial)

Redes Neurais (Inteligência Artificial) Redes Neurais (Inteligência Artificial) Aula 03 Resolução de Problemas por Meio de Busca Edirlei Soares de Lima Introdução Agentes Autônomos: Entidades capazes de observar o ambiente

Leia mais

Controle Ótimo - Aula 6 Exemplos e Exercícios

Controle Ótimo - Aula 6 Exemplos e Exercícios Controle Ótimo - Aula 6 Exemplos e Exercícios Adriano A. G. Siqueira e Marco H. Terra Departamento de Engenharia Elétrica Universidade de São Paulo - São Carlos Probabilidades Probabilidade: número entre

Leia mais

1/ 36. Computação 1 - Python Aula 1 - Teórica: Introdução

1/ 36. Computação 1 - Python Aula 1 - Teórica: Introdução 1/ 36 Computação 1 - Python Aula 1 - Teórica: Introdução Conhecendo a turma Experiência com programação e uso do computador Quantos já programaram antes? Quais linguagens? Quantos tem computador em casa

Leia mais

VERIFICAÇÃO DO DECAIMENTO DE INFORMAÇÃO EM REDES NEURAIS RECORRENTES APLICADAS AO PROBLEMA DO MUNDO DE WUMPUS 1

VERIFICAÇÃO DO DECAIMENTO DE INFORMAÇÃO EM REDES NEURAIS RECORRENTES APLICADAS AO PROBLEMA DO MUNDO DE WUMPUS 1 VERIFICAÇÃO DO DECAIMENTO DE INFORMAÇÃO EM REDES NEURAIS RECORRENTES APLICADAS AO PROBLEMA DO MUNDO DE WUMPUS 1 Henrique Augusto Richter 2, Eldair Fabrício Dornelles 3, Márcia Da Silva 4, Rogério Samuel

Leia mais

Aprendizado por Reforço usando Aproximação

Aprendizado por Reforço usando Aproximação Aprendizado por Reforço usando Aproximação de Funções Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Aproximação de Funções 2. Do the evolution 1 Aproximação de Funções Função Utilidade

Leia mais

Inteligência Artificial

Inteligência Artificial Universidade Federal de Campina Grande Departamento de Sistemas e Computação Pós-Graduação em Ciência da Computação Inteligência Artificial Aprendizagem (Redes Neurais - Complementar) Prof. a Joseana Macêdo

Leia mais

Tópicos Especiais em Informática

Tópicos Especiais em Informática Dilermando Piva Jr Fatec Indaiatuba Russell & Norvig (2003) atuadores Agentes Inteligentes 2 Incluem seres humanos, robôs, termostatos etc. A função do agente mapeia qualquer seqüência de percepções específica

Leia mais

Computação Evolutiva. Computação Evolutiva. Principais Tópicos. Evolução natural. Introdução. Evolução natural

Computação Evolutiva. Computação Evolutiva. Principais Tópicos. Evolução natural. Introdução. Evolução natural Computação Evolutiva Eduardo do Valle Simões Renato Tinós ICMC - USP Principais Tópicos Introdução Evolução Natural Algoritmos Genéticos Aplicações Conclusão 1 2 Introdução Evolução natural http://www.formula-um.com/

Leia mais

SIMULADOR DE UMA PARTIDA DE FUTEBOL COM ROBÔS VIRTUAIS

SIMULADOR DE UMA PARTIDA DE FUTEBOL COM ROBÔS VIRTUAIS SIMULADOR DE UMA PARTIDA DE FUTEBOL COM ROBÔS VIRTUAIS Fábio Schülter Orientador: Prof. José Roque Voltolini da Silva Roteiro da Apresentação Introdução - Objetivos do trabalho Revisão bibliográfica Desenvolvimento

Leia mais

Inteligência Artificial Agentes Inteligentes

Inteligência Artificial Agentes Inteligentes Inteligência Artificial Jarley P. Nóbrega, Dr. Faculdade Nova Roma Bacharelado em Ciência da Computação jpn@jarley.com Semestre 2018.2 Jarley P. Nóbrega, Dr. (Nova Roma) Inteligência Artificial Semestre

Leia mais

Redes Neurais (Inteligência Artificial)

Redes Neurais (Inteligência Artificial) Redes Neurais (Inteligência Artificial) Aula 02 Agentes Inteligentes Edirlei Soares de Lima Agentes Inteligentes Um agente é algo capaz de perceber seu ambiente por meio de sensores

Leia mais

REPOSICIONAMENTO DE ROBÔ INDUSTRIALCOM AUXÍLIO DE VISÃO COMPUTACIONAL

REPOSICIONAMENTO DE ROBÔ INDUSTRIALCOM AUXÍLIO DE VISÃO COMPUTACIONAL Anais do XVI Encontro de Iniciação Científica e Pós-Graduação do ITA XVI ENCITA / 2010 Instituto Tecnológico de Aeronáutica São José dos Campos SP Brasil 20 de outubro de 2010 REPOSICIONAMENTO DE ROBÔ

Leia mais

10. Conclusões e Perspectivas de Desenvolvimento

10. Conclusões e Perspectivas de Desenvolvimento Capítulo 10 10. Conclusões e Perspectivas de Desenvolvimento 10.1 Síntese do Trabalho Desenvolvido O objectivo geral deste trabalho foi o estudo e desenvolvimento de metodologias de coordenação em sistemas

Leia mais

COMPARAÇÃO ENTRE DIFERENTES ESTRUTURAS DE REDES NEURAIS NO PROBLEMA PRESA-PREDADOR 1

COMPARAÇÃO ENTRE DIFERENTES ESTRUTURAS DE REDES NEURAIS NO PROBLEMA PRESA-PREDADOR 1 COMPARAÇÃO ENTRE DIFERENTES ESTRUTURAS DE REDES NEURAIS NO PROBLEMA PRESA-PREDADOR 1 Márcia Da Silva 2, Eldair Fabricio Dornelles 3, Rogério S. M. Martins 4, Édson L. Padoin 5. 1 Pesquisa desenvolvida

Leia mais

MAC 115 Introdução à Ciência da Computação ROTHELO

MAC 115 Introdução à Ciência da Computação ROTHELO MAC 115 Introdução à Ciência da Computação INSTITUTO DE FÍSICA - BACHARELADO NOTURNO SEGUNDO SEMESTRE DE 2010 Terceiro Exercício-Programa (EP3) Data de entrega: até 06 de dezembro de 2010 (2a.feira) ROTHELO

Leia mais

Informática I. Aula 21. Aula 21-07/11/06 1

Informática I. Aula 21.  Aula 21-07/11/06 1 Informática I Aula 21 http://www.ic.uff.br/~bianca/informatica1/ Aula 21-07/11/06 1 Aula de hoje Explicação sobre o trabalho 3 Jogo de prospecção de petróleo por robôs. http://www.inf.puc-rio.br/~mascarenhas/robots/

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial INF 1771 Inteligência Artificial Aula 01 - Introdução Edirlei Soares de Lima O que é Inteligência Artificial? O que é Inteligência Artificial? Área de pesquisa que tem como objetivo

Leia mais

Resumo. Como um agente busca de seqüência de ações para alcançar seus objetivos.

Resumo. Como um agente busca de seqüência de ações para alcançar seus objetivos. Resumo Inteligência Artificial Russel e Norvig Capítulos 3,4 e 5 Prof. MsC Ly Freitas UEG Resolução de problemas por meio de busca Como um agente busca de seqüência de ações para alcançar seus objetivos.

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial INF 1771 Inteligência Artificial Aula 11 Aprendizado de Máquina Edirlei Soares de Lima Agentes Vistos Anteriormente Agentes baseados em busca: Busca cega Busca heurística Busca local

Leia mais

PROCESSO SELETIVO N 42/2019 PROVA 2 - CONHECIMENTOS ESPECÍFICOS

PROCESSO SELETIVO N 42/2019 PROVA 2 - CONHECIMENTOS ESPECÍFICOS PROCESSO SELETIVO N 42/2019 PROVA 2 - CONHECIMENTOS ESPECÍFICOS LEIA ATENTAMENTE AS INSTRUÇÕES ABAIXO 1. Você recebeu do fiscal o seguinte material: (a) Este caderno, com o enunciado das 20 (vinte) questões

Leia mais

Tópicos Especiais: Inteligência Artificial REDES NEURAIS

Tópicos Especiais: Inteligência Artificial REDES NEURAIS Tópicos Especiais: Inteligência Artificial REDES NEURAIS Material baseado e adaptado do Cap. 20 do Livro Inteligência Artificial de Russell & Norvig Bibliografia Inteligência Artificial Russell & Norvig

Leia mais

Enunciados dos Exercícios Cap. 2 Russell & Norvig

Enunciados dos Exercícios Cap. 2 Russell & Norvig Enunciados dos Exercícios Cap. 2 Russell & Norvig 1. (2.2) Tanto a medida de desempenho quanto a função de utilidade medem o quanto um agente está desempenhando bem suas atividades. Explique a diferença

Leia mais

Aprendizado por Árvores de Decisão

Aprendizado por Árvores de Decisão Universidade Federal de Santa Maria Departamento de Eletrônica e Computação Prof. Cesar Tadeu Pozzer Disciplina de Programação de Jogos 3D E-mail: pozzer@inf.ufsm.br Período: 2006/01 Aprendizado por Árvores

Leia mais

CENTRO UNIVERSITARIO DA FEI PROJETO DE INICIAÇÃO CIENTÍFICA SIMULADOR DE FÍSICA APLICADO AO FUTEBOL DE ROBÔS RELATÓRIO INICIAL

CENTRO UNIVERSITARIO DA FEI PROJETO DE INICIAÇÃO CIENTÍFICA SIMULADOR DE FÍSICA APLICADO AO FUTEBOL DE ROBÔS RELATÓRIO INICIAL SIMULADOR DE FÍSICA APLICADO AO FUTEBOL DE ROBÔS RELATÓRIO INICIAL Aluno: André de Oliveira Santos Número FEI: 12.109.144-1 Orientador: Flavio Tonidandel Departamento de Ciência da Computação Inicio: Agosto

Leia mais

Inteligência Artificial Aplicada a Robôs Reais

Inteligência Artificial Aplicada a Robôs Reais Inteligência Artificial Aplicada a Robôs Reais Prof. Dr. Eduardo Simões Instituto de Ciências Matemáticas e de Computação USP Cópias das Transparências: http://www.icmc.usp.br/~simoes/seminars/semi.html

Leia mais

5 ESTUDO DE CASOS 5.1 CATEGORIZAÇÃO

5 ESTUDO DE CASOS 5.1 CATEGORIZAÇÃO 102 5 ESTUDO DE CASOS 5.1 CATEGORIZAÇÃO Conforme detalhado na seção 4.3, foram criados três conjuntos de dados: clientes BT com 382 padrões, clientes comerciais MT com 866 padrões e clientes industriais

Leia mais

Jogos com Oponentes. Problemas de busca: não assumem a presença de um oponente

Jogos com Oponentes. Problemas de busca: não assumem a presença de um oponente Sistemas Inteligentes, 13-14 1 Jogos com ponentes Problemas de busca: não assumem a presença de um oponente Jogos: oponente INCERTEZA! Incerteza porque não se conhece as jogadas exatas do oponente e não

Leia mais

Simulações e Problemas para o Curso de Física Fundamental -Eletromagnetismo.

Simulações e Problemas para o Curso de Física Fundamental -Eletromagnetismo. Anais do 13 O Encontro de Iniciação Científica e Pós-Graduação do ITA XIII ENCITA / 2007 Instituto Tecnológico de Aeronáutica São José dos Campos SP Brasil Outubro 01 a 04 2007. Simulações e Problemas

Leia mais

CTC-17 Inteligência Artificial Busca Competitiva e Busca Iterativa. Prof. Paulo André Castro

CTC-17 Inteligência Artificial Busca Competitiva e Busca Iterativa. Prof. Paulo André Castro CTC-17 Inteligência Artificial Busca Competitiva e Busca Iterativa Prof. Paulo André Castro pauloac@ita.br www.comp.ita.br/~pauloac Sala 110, IEC-ITA Sumário Busca Competitiva Para Ambientes multiagentes...

Leia mais

Árvore de Jogos Minimax e Poda Alfa-Beta

Árvore de Jogos Minimax e Poda Alfa-Beta Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCA UFES Departamento de Computação Árvore de Jogos Minimax e Poda Alfa-Beta Inteligência Artificial Site: http://jeiks.net E-mail: jacsonrcsilva@gmail.com

Leia mais

4 Implementação Computacional

4 Implementação Computacional 4 Implementação Computacional 4.1. Introdução Neste capítulo é apresentada a formulação matemática do problema de otimização da disposição das linhas de ancoragem para minimizar os deslocamentos (offsets)

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial INF 1771 Inteligência Artificial Aula 01 - Introdução Edirlei Soares de Lima O que é Inteligência Artificial? Área de pesquisa que tem como objetivo buscar métodos ou dispositivos

Leia mais

COMPARAÇÃO DE DESEMPENHO ENTRE IMPLEMENTAÇÕES DO ALGORITMO JOGO DA VIDA COM PTHREAD E OPEMMP 1

COMPARAÇÃO DE DESEMPENHO ENTRE IMPLEMENTAÇÕES DO ALGORITMO JOGO DA VIDA COM PTHREAD E OPEMMP 1 COMPARAÇÃO DE DESEMPENHO ENTRE IMPLEMENTAÇÕES DO ALGORITMO JOGO DA VIDA COM PTHREAD E OPEMMP 1 Márcia Da Silva 2, Igor Gamste Haugg 3, Eliézer Silveira Prigol 4, Édson L. Padoin 5, Rogério S. M. Martins

Leia mais

lnteligência Artificial Introdução ao Aprendizado por Reforço (Reinforcement Learning)

lnteligência Artificial Introdução ao Aprendizado por Reforço (Reinforcement Learning) lnteligência Artificial Introdução ao Aprendizado por Reforço (Reinforcement Learning) Processo Decisório de Markov e Aprendizado por Reforço Quando falamos sobre Processo decisório de Markov e formalizamos

Leia mais

Inteligência Artificial

Inteligência Artificial Inteligência Artificial Professor Rafael Stubs Parpinelli E-mail: rafael.parpinelli@udesc.br udesc.academia.edu/rafaelstubsparpinelli www.researchgate.net/profile/rafael_parpinelli www.joinville.udesc.br/portal/professores/parpinelli/

Leia mais

CEFET/RJ Inteligência Artificial (2018.1) Prof. Eduardo Bezerra Lista de exercícios 04

CEFET/RJ Inteligência Artificial (2018.1) Prof. Eduardo Bezerra Lista de exercícios 04 . CEFET/RJ Inteligência Artificial (2018.1) Prof. Eduardo Bezerra (ebezerra@cefet-rj.br) Lista de exercícios 04 Créditos: essa lista de exercícios contém a tradução dos exercícios disponibilizados na disciplina

Leia mais

Linguagens de Programação

Linguagens de Programação Universidade Federal do Rio Grande do Norte Centro de Tecnologia Departamento de Computação e Automação Linguagens de Programação Professor Responsável: Luiz Affonso Henderson Guedes de Oliveira Prof.

Leia mais

SISTEMA DE VISÃO COMPUTACIONAL DO TIME DE FUTEBOL DE ROBÔS DO INSTITUTO FEDERAL DO SUL DE MINAS CÂMPUS MUZAMBINHO

SISTEMA DE VISÃO COMPUTACIONAL DO TIME DE FUTEBOL DE ROBÔS DO INSTITUTO FEDERAL DO SUL DE MINAS CÂMPUS MUZAMBINHO SISTEMA DE VISÃO COMPUTACIONAL DO TIME DE FUTEBOL DE ROBÔS DO INSTITUTO FEDERAL DO SUL DE MINAS CÂMPUS MUZAMBINHO 1 Leonardo de S. VIEIRA 2 ; Heber R. MOREIRA 3 ; João M. RIBEIRO RESUMO O desenvolvimento

Leia mais

Otimização Combinatória - Parte 4

Otimização Combinatória - Parte 4 Graduação em Matemática Industrial Otimização Combinatória - Parte 4 Prof. Thiago Alves de Queiroz Departamento de Matemática - CAC/UFG 2/2014 Thiago Queiroz (DM) Parte 4 2/2014 1 / 33 Complexidade Computacional

Leia mais

5 Estudo de Casos. 5.1 Modelo de Reservatório Sintético Homogêneo

5 Estudo de Casos. 5.1 Modelo de Reservatório Sintético Homogêneo 5 Estudo de Casos Para validar o modelo de otimização proposto neste trabalho, foram utilizados três modelos de reservatório distintos. O primeiro modelo consiste em um modelo de reservatório sintético

Leia mais

Experiência 5. Projeto e Simulação do Controle no Espaço de Estados de um Pêndulo Invertido sobre Carro

Experiência 5. Projeto e Simulação do Controle no Espaço de Estados de um Pêndulo Invertido sobre Carro Experiência 5 Projeto e Simulação do Controle no Espaço de Estados de um Pêndulo Invertido sobre Carro Professores: Adolfo Bauchspiess e Geovany A. Borges O objetivo deste experimento é projetar e simular

Leia mais

TÓPICOS EM INTELIGÊNCIA ARTIFICIAL Redes Neurais Artificiais

TÓPICOS EM INTELIGÊNCIA ARTIFICIAL Redes Neurais Artificiais TÓPICOS EM INTELIGÊNCIA ARTIFICIAL Redes Neurais Artificiais ricardo.kerschbaumer@ifc.edu.br http://professor.luzerna.ifc.edu.br/ricardo-kerschbaumer/ Introdução O Cérebro humano Mais fascinante processador

Leia mais

Sistemas: Distribuição ordenada dos componentes de uma equipe em quadra, visando facilitar a aplicação das diferentes manobras.

Sistemas: Distribuição ordenada dos componentes de uma equipe em quadra, visando facilitar a aplicação das diferentes manobras. CONCEITOS TÁTICOS E SISTEMAS Conceitos Sistemas: Distribuição ordenada dos componentes de uma equipe em quadra, visando facilitar a aplicação das diferentes manobras. Tipos de sistemas: Sistemas defensivos:

Leia mais

Computação Gráfica. Trabalho 1

Computação Gráfica. Trabalho 1 Computação Gráfica Trabalho 1 Futebol de Robô em PostScript Tobias Colombo Este trabalho está dividido em 5 módulos: bancodados.ps > Define as estruturas de dados que definem os times e seus jogadores,

Leia mais

SISTEMA DE CORREÇÃO AUTOMÁTICA DE TESTES DE MÚLTIPLA ESCOLHA USANDO TÉCNICAS DE PROCESSAMENTO DE IMAGENS

SISTEMA DE CORREÇÃO AUTOMÁTICA DE TESTES DE MÚLTIPLA ESCOLHA USANDO TÉCNICAS DE PROCESSAMENTO DE IMAGENS Patrocínio, MG, outubro de 2016 ENCONTRO DE PESQUISA & EXTENSÃO, 3., 2016, Patrocínio. Anais... Patrocínio: IFTM, 2016. SISTEMA DE CORREÇÃO AUTOMÁTICA DE TESTES DE MÚLTIPLA ESCOLHA USANDO TÉCNICAS DE PROCESSAMENTO

Leia mais

Robótica 2002/2003 Introdução à Robótica. Estrutura da Apresentação

Robótica 2002/2003 Introdução à Robótica. Estrutura da Apresentação Robótica 2002/2003 Introdução à Robótica Luís Paulo Reis lpreis@fe.up.pt http://www.fe.up.pt/~lpreis LIACC Lab.. Inteligência Artificial e Ciência de Computadores FEUP Faculdade de Engenharia da Universidade

Leia mais

CEFET/RJ Disciplina: Inteligência Artificial Professor: Eduardo Bezerra Lista de exercícios 02

CEFET/RJ Disciplina: Inteligência Artificial Professor: Eduardo Bezerra Lista de exercícios 02 . CEFET/RJ Disciplina: Inteligência Artificial Professor: Eduardo Bezerra Lista de exercícios 02 Créditos: alguns itens desta lista são adaptados do material da disciplina CS188 - Artificial Intelligence

Leia mais