Agentes Inteligentes Cont. 1
Caracterização de agente - M. A. A. S. (P.E.A.S) Medida desempenho Ambiente Atuadores Sensores Agente filtro de e-mail Minimizar carga de leitura usuário mensagens do usuário Aceitar ou rejeitar mensagem Leitor mensagem Agente tutorial para aprendizagem de língua Melhorar o desempenho do usuário Conjunto de estudantes Imprimir exercícios, dar sugestões uso, fazer correções, etc. Palavras digitadas Função de agente Programa de agente 2
O tipo de ambiente determina o programa de agente. Ex. agente robô para inspecionar a produção de peças em uma esteira de transportadora: Percepção: iluminação deve estar adequada, os itens da correia só podem ser peças, reconhecer a peças, etc. Ação: aceitar ou rejeitar as peças como corretas Agente de software softbots, para fornecer noticias da internet de interesse aos clientes Percepção: ter habilidade de processamento em linguagem natural para saber o que interessa, mudar seus planos dinamicamente quando a conexão para uma fonte de noticias cair ou quando uma nova forte entrar no ar, etc. Ação disponibilizar a noticia de interesse e descartar as demais 3
O tipo de ambiente determina o comportamento do agente. Exemplo: Agente de polícia Agente raciocínio Medida desempenho: - Conhecimento de leis, comportamento dos indivíduos,... Objetivo: - fazer com que as leis sejam respeitadas Ações: - multar - apitar - parar,... percepção execução Ambiente
Propriedades do ambiente de tarefas. Completamente observável x Parcialmente observável quando os sensores do agente conseguem perceber o estado completo do ambiente em cada instante; todos os aspectos relevantes do ambiente são acessíveis. Como definir todas? Relevância Desempenho Quando nem todas as informações do estado estão disponíveis o ambiente é parcialmente observável Sensores imprecisos; falta informação 5
Propriedades do ambiente de tarefas. Determinístico x estocástico o próximo estado do ambiente é completamente determinado pelo estado atual e pela ação executada pelo agente Determinismo + observabilidade total: previsível Se o ambiente é determinístico exceto pela ação de outro agente, ele é estratégico. quando há incerteza sobre o estado futuro do ambiente, mesmo tendo informações atuais, o ambiente é estocástico. Observabilidade parcial e não-determinismo 6
Propriedades do ambiente de tarefas. Episódico x sequencial a experiência do agente é dividida em episódios. Cada episódio consiste em o agente perceber e depois executar uma única ação. Cada episódio seguinte não depende das ações que ocorreram em episódios prévios. Desnecessário manter memória entre episódios Sem distinção curto x longo prazo em ambientes sequenciais a decisão atual poderá afetar todas as decisões futuras. Ações podem ter consequências de longo prazo 7
Propriedades do ambiente de tarefas. Estático x dinâmico o ambiente não muda enquanto o agente está escolhendo a ação a realizar. O agente não precisa observar o mundo enquanto esta decidindo sobre a realização de uma ação, nem com a passagem do tempo. Tempo é praticamente irrelevante Ambientes dinâmicos estão continuamente perguntando ao agente o que ele deseja fazer. Não decidir é o mesmo que fazer nada Se o ambiente não muda enquanto o agente delibera, mas o desempenho do agente muda esse é Semidinâmico. 8
Propriedades do ambiente de tarefas. Discreto x contínuo Está relacionado como o tempo é tratado e as percepções do agente. Quando existe um número distinto e claramente definido de percepções e ações em cada turno é discreto. Aplicada: Estado, Tempo, Ações, Percepções Quando as percepções e ações mudam em um espectro contínuo de valores é contínuo. Quantidades contínuas x discretas 9
Propriedades do ambiente de tarefas. Agente único x multiagente Um único agente operando sozinho no ambiente. Vários agentes interagindo ambiente. Podendo ser: multiagente cooperativo ou multiagente competitivo Quando considerar uma entidade como agente? Dependência de desempenho Ambientes competitivos x cooperativos 10
Exemplo de ambientes de tarefas e suas características ambiente observável determinístico episódico estático discreto Nº agente Palavras cruzadas Xadrez com relógio Completo Determinístico Sequencial Estático Discreto Único Completo Estratégico Sequencial Semi Discreto Multi Pôquer Parcial Estratégico Sequencial Estático Discreto Multi Direção taxi Parcial Estocástico Sequencial Dinâmico Contínuo Multi Diagnóstico médico Análise imagens Robô seleção peça Instrutor inglês Parcial Estocástico Sequencial Dinâmico Contínuo Único Completo Determinístico Episódico Semi Contínuo Único Parcial Estocástico Episódico Dinâmico Contínuo Único Parcial Estocástico Sequencial Dinâmico Discreto Multi 11
O tipo do ambiente determina em grande parte o projeto do agente. O mundo real é parcialmente observável, estocástico, sequencial, dinâmico, contínuo e multiagente. A classificação dos problemas Nem sempre simples ou precisa A maioria das situações reais é tão complexa que o fato de serem realmente determinísticas é um ponto discutível. Para finalidades práticas elas devem ser consideradas como estocásticas. Dirigir um taxi é difícil em todos os sentidos. 12
Estrutura de agente Comportamento de agente ação executada após qualquer sequencia de percepções. Programa de agente implementar a função do agente que mapeia percepções em ações em algum tipo de arquitetura. Agente = arquitetura + programa 13
Tipos de agentes Agente reativo simples Agente reativo baseado em modelos Agente baseado em objetivos Agente baseado em utilidades 14
Agente reativo simples O agente funcionará somente se a decisão correta puder ser tomada com base apenas na percepção atual, ou seja, se o ambiente for completamente observável. 15
Agente reativo baseado em modelos Ele controla o estado atual do mundo usando um modelo interno. A função AtualizaEstado é responsável pela criação da descrição do novo estado interno. Em seguida ele tem comportamento semelhante ao agente reativo simples. 16
Agente baseado em objetivos Esse agente controla o estado do mundo, bem como um conjunto de objetivos que está tentando atingir e escolhe uma ação que (no final) levará a realização de seus objetivos. 17
Agentes baseado em utilidades A função utilidade permite estabelecer preferências entre sequencias de estados que permitem atingir os mesmos objetivos. Não apenas perceber se vai ficar contente por realizar uma ação, mas medir esse contentamento e ordenar as opções com base nessa métrica. 18
Agentes com aprendizagem O aprendizado em agentes inteligentes pode ser assumido como um processo de modificação de cada componente do agente, afim de promover um acordo mais intimo com as informações e a realimentação disponível, melhorando assim o seu desempenho. 19
Exercícios. Ver pag. 55 a 57 livro texto Russel. 20
Referências Rich, Elaine; Knight, Kevin, Artificial Intelligence, Second Edition, McGraw. Hill, 1993. Russel, S.; Norvig, P. Artificial Intelligence: A Modern Approach, 2ª ed., Elsevier, Ed. Campus, 2004. 21