Resumo An Introduction To Multiagent Systems - Wooldridge Capítulo 6 Multiagent Interactions Disciplina de Sistemas Multi-agentes
|
|
- Ayrton Benevides Anjos
- 7 Há anos
- Visualizações:
Transcrição
1 Introdução Resumo An Introduction To Multiagent Systems - Wooldridge Capítulo 6 Multiagent Interactions Disciplina de Sistemas Multi-agentes Manoel Campos da Silva Filho Neste capítulo focaremos em como construir não mais um único agente, e sim uma sociedade de agentes. A figura 6.1 mostra a estrutura típica de um sistema multi agente. O sistema contém um número de agentes, que interagem um com o outro através de comunicação. Os agentes são capazes de agir no ambiente; diferentes agentes tem diferentes esferas de influência, no sentido de que eles tem controle sobre - ou pelo menos são capazes de influenciar diferentes partes do ambiente. Estas esferas de influência podem coincidir em alguns casos. Isto pode fazer surgir um relacionamento de dependência entre os agentes. Por exemplo, dois agentes robôs podem ser capazes de se mover através de uma porta, mas eles não podem fazer isso ao mesmo tempo. Agentes são também tipicamente ligados por outros relacionamentos como relacionamentos de poder, onde um agente é o chefe do outro. 1 de 9
2 Utilidades e Preferências Consideremos, para simplificação, um cenário com 2 agentes chamados i e j. É assumido que cada agente está auto-interessado, ou seja, cada agente tem suas próprias preferências e desejos sobre como o mundo deve ser. Iremos assumir que existe um conjunto Ω = {ω 1, ω 2, } de resultados ou estados que o agente tem preferência. Pense nisso como resultado de um jogo que dois agentes estão jogando. Nós formalmente capturamos as preferências que os dois agentes tem, por meio de funções de utilidade, uma para cada agente, que atribui a cada resultado, um número real, indicando quão bom o resultado é para o agente. Quanto maior o valor, melhor é o resultado. Assim, as preferências dos agentes i e j são capturadas por funções u i : Ω R u j : Ω R A função de utilidade guia para a ordenação de preferências dos resultados. Por exemplo, se ω e ω' são possíveis resultados em Ω, e u i (ω) >= u j (ω'), então, o resultado ω é preferido pelo agente i, ou pelo menos tanto quanto ω'. Isto pode ser representado resumidamente como ω >= i ω' A relação >= i é realmente uma ordenação sobre os elementos do conjunto Ω, tendo as seguintes propriedades: Reflexividade: para todo ω Ω, temos que ω >= i ω Transitividade: se ω >= i ω', e ω' >= i ω'', então ω >= i ω'' Comparatividade: para todo ω Ω e ω' Ω nós temos que tanto ω >= i ω' ou ω' >= i ω A estrita relação de preferência satisfará a 2a. e 3a. propriedades, mas claramente não será reflexiva. O que é utilidade Indubitavelmente, a forma mais simples de pensar sobre utilidade é como dinheiro; quanto mais dinheiro, melhor. Funções de utilidade são apenas uma forma de representar as preferências do agente, o que não é simplesmente igualado a dinheiro. Vamos supor que eu tenha R$ 500 milhões, enquanto você é absolutamente pobre. Se eu ganhar na loteria, qual será o incremento em minha utilidade? Bem, eu tenho mais dinheiro, então existirá claramente algum incremento na utilidade de minha situação. Mas não haverá muito: não há muito mais que eu possa fazer com R$ 501 milhões que eu não poderia com R$ 500 milhões. Em contraste, se você ganhar na loteria, o aumento em sua utilidade será enorme; você irá de completamente pobre a milionário. Encontros de Multi agentes Vamos introduzir agora um modelo de ambiente em que os agentes irão atuar. Os agentes podem simultaneamente escolher uma ação para realizar no ambiente, o que resulta em um estado do conjunto Ω. Este resultado dependerá da combinação de ações realizadas pelos agentes. Assumiremos que os agentes não tem escolha em se realizar uma ação, eles tem que realizar alguma. Além do mais, é assumido que um agente não pode ver a ação realizada por outro. Para simplificar, vamos assumir que cada agente tem apenas 2 ações que ele pode realizar, sendo C Cooperação e D Defesa, sendo Ac = {C, D} o conjunto destas ações. A forma que o ambiente se 2 de 9
3 comporta é determinada pela função τ: Ac x Ac Ω (ações do agente i) (ações do agente j) Isto é essencialmente uma função de transformação de estado, como discutido no capítulo 2. Isto significa que, de acordo com as ações executadas pelos dois agentes, um estado resultará. Aqui temos um exemplo de uma função de ambiente: τ(d, D) = ω 1, τ(d, C) = ω 2, τ(c, D) = ω 3, τ(c, C) = ω 4 (6.1) Este ambiente mapeia cada combinação de ações para um diferente estado resultante. Logo, ele é sensível às ações que cada agente executa. No outro extremo, podemos considerar um ambiente que mapeia cada combinação de ações para o mesmo estado resultante: τ(d, D) = ω 1, τ(d, C) = ω 1, τ(c, D) = ω 1, τ(c, C) = ω 1 (6.2) Neste ambiente, não importa o que os agentes façam: o resultado sempre será o mesmo. Nenhum agente tem qualquer influência em tal cenário. Podemos também considerar um ambiente que é sensível às ações realizadas por apenas um dos agentes: τ(d, D) = ω 1, τ(d, C) = ω 2, τ(c, D) = ω 1, τ(c, C) = ω 2 (6.3) Neste ambiente, não importa o que o agente i faça: o resultado depende somente das ações executadas pelo agente j. Se j escolhe defender, então o estado resultante será ω 1, se resolve cooperar, o estado será ω 2. O interessante é quando colocamos um ambiente junto com as preferências dos agentes. Suponha que temos um caso mais geral como descrito em (6.1), onde cada agente exerce alguma influência sobre o ambiente. Vamos supor que os agentes tem funções de utilidade definidas como segue: u i (ω 1 ) = 1, u i (ω 2 ) = 1, u i (ω 3 ) = 4, u i (ω 4 ) = 4 u j (ω 1 ) = 1, u j (ω 2 ) = 4, u j (ω 3 ) = 1, u j (ω 4 ) = 4 (6.4) Desde que conhecemos que cada diferente combinação de escolhas feitas pelos agentes são mapeadas para um diferente estado resultante, podemos fazer um novo mapeamento como: u i (D,D) = 1, u i (D,C) = 1, u i (C,D) = 4, u i (C,C) = 4 u j (D,D) = 1, u j (D,C) = 4, u j (C,D) = 1, u j (C,C) = 4 (6.5) Desta forma, consideramos que a ação de Cooperar tem melhor utilidade para ambos os agentes. Nós podemos então caracterizar as preferências do agente i sobre os possíveis resultados da seguinte forma: C,C >= i C,D > i D,C >= i D,D Agora vamos considerar a seguinte questão: Se você era o agente i neste cenário, o que você escolheria: cooperar ou defender? O agente i prefere todos os resultados em que ele coopera sobre todos em que ele defende. A escolha do agente i é portanto clara: ele deve cooperar, não importa o que o agente j faça. O mesmo ocorre para o agente j. Note que, neste caso, nenhum agente precisa se preocupar sobre o que o outro irá fazer: a ação que ele executará não depende, de nenhuma forma, do outro agente. Se ambos agentes neste cenário agem racionalmente, ou seja, ambos escolhem realizar a ação que 3 de 9
4 guiará para seus resultados preferidos, então ambos escolherão cooperar. Agora suponha que, para o mesmo ambiente, as funções de utilidade dos agentes fossem como segue: u i (D,D) = 4, u i (D,C) = 4, u i (C,D) = 1, u i (C,C) = 1 u j (D,D) = 4, u j (D,C) = 1, u j (C,D) = 4, u j (C,C) = 1 (6.6) As preferências do agente i sobre os possíveis resultados são: D,D >= i D,C > i C,D >= i C,C Neste cenário, o agente i não pode fazer nada melhor do que defender. O agente prefere todos os resultados em que ele defende, sobre todos os resultados em que ele coopera. O mesmo ocorre para o agente j. Da mesma forma como demonstrado no exemplo anterior, neste exemplo o melhor resultado para um agente não depende da ação executada pelo outro. Mas em cenários multi agentes, as escolhas que um agente deve fazer não são tão claras; realmente são muito mais difíceis. Nós podemos resumir o cenário de interação anterior usando a notação da teoria de jogos, conhecida como matriz de pagamento (payoff matrix): j defende j coopera i defende i coopera Cada uma das 4 células de valores representa um dos possíveis 4 1 resultados, de acordo com as ações de cada um dos agentes. 4 4 Os valores em cada célula, na linha superior à direta, representam a 4 1 utilidade para o agente i, e os na linha inferior à esquerda representam a 1 1 utilidade para o agente j. Estratégias Dominantes e Equilíbrio de Nash Dado um particular encontro envolvendo dois agentes i e j, existe uma questão criticamente importante que ambos os agentes querem respondida: O que eu devo fazer? Nessa seção iremos definir alguns dos conceitos usados em resposta a esta questão. O primeiro é o conceito de dominância. Suponha que temos dois subconjuntos de Ω, que nos referimos a eles como Ω 1 e Ω 2. Diremos que Ω 1 domina Ω 2 para o agente i se cada resultado em Ω 1 é preferido por i sobre cada resultado em Ω 2. Por exemplo, suponha que Ω = {ω 1, ω 2, ω 3, ω 4 } ω 1 > i ω 2 > i ω 3 > i ω 4 Ω 1 = {ω 1, ω 2 } e Ω 2 = {ω 3, ω 4 } Então Ω 1 fortemente domina Ω 2 desde que ω 1 > i ω 3, ω 1 > i ω 4, ω 2 > i ω 3, ω 2 > i ω 4. Formalmente, um conjunto de resultados Ω 1 fortemente domina um conjunto Ω 2 se ω 1 Ω 1, ω 2 Ω 2, temos ω 1 > i ω 2 Na linha de teoria de jogos, vamos nos referir à ações como estratégias. Dada qualquer particular estratégia (strategy) s para um agente i em um cenário de interação de um sistema multi agente, existirá um número de possíveis resultados. Vamos denotar por s* os resultados que podem surgir pelo agente i 4 de 9
5 jogando a estratégia s. Por exemplo, referindo para o ambiente de exemplo da equação (6.1), a partir do ponto de vista do agente i, nós temos C* = {ω 3, ω 4 }, enquanto temos D* = {ω 1, ω 2 }. Ou seja, para todas as estratégias onde o agente i coopera, temos os resultados {ω 3, ω 4 } e para todas onde ele defende temos {ω 1, ω 2 }. Agora, diremos que a estratégia s 1 domina a s 2 se o conjunto de resultados possíveis jogando s 1 domina o conjunto de resultados jogando s 2, isto é, se s 1 * domina s 2 *. Considerando o exemplo 6.5, para o agente i, cooperar fortemente domina defender. Como existem apenas duas estratégias disponíveis, a estratégia de cooperação é dominante: ela não é dominada por nenhuma outra estratégia. A presença de uma estratégia dominante torna a tomada de decisão extremamente fácil: o agente garante seu melhor resultado executando a estratégia dominante e ignorando as outras. Infelizmente, para muitos cenários de interação, não existirá uma estratégia fortemente dominante; depois de deletar as estratégias fortemente dominadas, podemos ter mais do que uma estratégia restante. O que fazer então? Nós podemos iniciar deletando as estratégias fracamente dominadas, onde uma estratégia s 1 é dita por fracamente dominar s 2 se, cada resultado s 1 * é preferido pelo menos tão quanto cada resultado s 2 *. O problema é que se uma estratégia é somente fracamente dominada, então não é necessariamente irracional usá-la; deletando ela, nós podemos portanto, 'jogar fora' uma estratégia que de fato poderia ter sido útil usar. Um dos conceitos mais importantes na teoria de jogos e de sistemas multi agentes é a noção de equilíbrio (equilibrium), mais especificamente, o Equilíbrio de Nash. Considere que a cada vez que você dirige um carro, você precisa decidir de que lado da rua dirigir. A escolha não é muito difícil: se você estiver no Reino Unido, por exemplo, você provavelmente escolherá dirigir pela esquerda; se você estiver nos EUA, você dirigirá pela direita. A razão da escolha não é difícil, é que ela é uma estratégia em equilíbrio de Nash. Assumindo que todos os outros estão dirigindo pela esquerda, você não pode fazer melhor que dirigir pela esquerda também. A partir do ponto de vista de todos os outros, assumindo que você está dirigindo pela esquerda, então todos os outros não podem fazer melhor do que dirigir pela esquerda também. Em geral, nós dizemos que duas estratégias s 1 e s 2 estão no Equilíbrio de Nash se: sobre a suposição de que o agente i joga a estratégia s 1, o agente j não pode fazer melhor do que jogar s 2 ; e sobre a suposição de que o agente j joga s 2, o agente i não pode fazer melhor do que jogar s 1. A forma mútua de equilíbrio é importante porque ela 'bloqueia os agentes' para um par de estratégias. Nenhum agente tem qualquer incentivo para desviar do equilíbrio de Nash. Para entender porquê, suponha que s 1 e s 2 são um par de estratégias no equilíbrio de Nash para os agentes i e j, respectivamente, e que o agente i escolhe jogar alguma outra estratégia, digamos s 3. Então, por definição, i não fará melhor, e pode possivelmente fazer pior do que ele poderia tendo jogado a estratégia s 1. A presença de um par de estratégias no equilíbrio de Nash pode ser a resposta para a questão do que fazer em um dado cenário. Infelizmente, existem 2 importantes resultados na teoria de jogos que dificultam a vida: nem todo cenário de interação tem um equilíbrio de Nash; e alguns cenários tem mais do que um. Interações competitivas e de Soma-Zero Suponha que temos algum cenário em que um resultado ω Ω é preferível por um agente i sobre um resultado ω' se, e somente se, ω' é preferido sobre ω pelo agente j. Formalmente, ω > i ω' se e somente se ω' > j ω As preferências dos jogadores são portanto, diametralmente opostas: um agente só pode melhorar seu resultado ao custo do outro. Um cenário de interação que satisfaz esta propriedade é dito estritamente competitivo. Encontros de soma-zero são aqueles em que, para qualquer resultado particular, a utilidade de dois 5 de 9
6 agentes tem soma igual a zero, formalmente: u i (ω) + u j (ω) = 0 para todo ω Ω Jogos como xadrez e damas são os mais óbvios exemplos de interação estritamente competitivas. Realmente, qualquer jogo em que os possíveis resultados são ganhar ou perder serão estritamente competitivos. É difícil pensar em exemplos de soma-zero. Uma guerra pode ser citada como uma interação de soma-zero entre nações, mas até nas mais extremas guerras, existe usualmente pelo menos alguns interesses comuns entre os participantes (por exemplo, garantir que o planeta sobreviva). O Dilema do Prisioneiro Considere o seguinte cenário. Dois homens são coletivamente acusados de um crime e são mantidos em celas separadas. Eles não tem nenhuma forma de se comunicar nem de fazer qualquer acordo. Aos dois homens é dito que: se um deles confessar o crime e o outro não, o confessor será libertado, e o outro ficará preso por 3 anos; e se ambos confessarem o crime, então, cada um ficará preso por 2 anos. Ambos os prisioneiros sabem que se nenhum confessar, então eles ficarão presos por 1 ano. Nós nos referimos a confessar como defesa e não confessar como cooperação. Existem 4 possíveis resultados e o ambiente é do tipo (6.1). Podemos escrever as funções de utilidade para cada agente na seguinte matriz de pagamento: j defende j coopera i defende i coopera Cooperar (C) = não confessar Defender (D) = confessar A utilidade é apresentada em negrito, e representa quão bom é o resultado para o agente. Quanto maior a utilidade, menor a pena Em resumo, as utilidades, em ordem de preferência para cada agente, são: Utilidade Pena (anos) e as preferências são u i (D,C) = 5, u i (C,C) = 3, u i (D,D) = 2, u i (C,D) = 0 u j (C,D) = 5, u j (C,C) = 3, u j (D,D) = 2, u j (D,C) = 0 D,C > i C,C > i D,D > i C,D C,D > j C,C > j D,D > j D,C O que um prisioneiro deve fazer? A resposta não é clara como nos exemplos anteriores. Não é o caso do prisioneiro preferir todos os resultados que ele coopera sobre todos que ele defende, nem o contrário. Em todos os casos, se um prisioneiro i cooperar, o pior pagamento que ele pode receber é zero, enquanto se ele defender, o pior será 2. Assim, ele pode preferir garantir um pagamento de 2 do que um de zero, então, ele deve defender. Desde que o cenário é simétrico (os agentes raciocinam da mesma forma), então, o resultado que emergirá se ambos os agentes pensarem racionalmente é que ambos defenderão, dando a cada agente 6 de 9
7 um pagamento de 2. Note que nenhuma estratégia fortemente domina neste cenário. Existe apenas um equilíbrio de Nash de D,D. Assim, sobre qualquer suposição que i jogará a estratégia D, j não pode fazer melhor do que escolher D. Isto é o melhor que eles podem fazer? Ingênua intuição diz que não. Claramente se os dois cooperarem, ambos podem fazer melhor, recebendo um pagamento de 3. Porém, se o agente i cooperar e o o j defender, i recebe zero, o pior pagamento. O dilema do prisioneiro pode ser aplicado a coisas reais como tratados de desarmamento nuclear. Dois países i e j assinaram um tratado para se livrar de suas armas nucleares. Cada país pode tanto cooperar (livrar-se de suas armas) ou defender (manter suas armas). Mas se você se livra de suas armas, você corre o risco de que o outro país as mantenha, fazendo com que você sofra do chamado pagamento do idiota. Muitas pessoas concluem que nesses casos, o melhor a fazer é defender. O que parece que cooperação surgiria apenas como resultado de comportamento irracional. Não somos todos Machiavéllicos A primeira proposta é arguir que não somos todos tão insensíveis como no dilema do prisioneiro. Não estamos constantemente tentando maximizar nosso próprio bem estar, possivelmente a custa de outros, sem considerar o bem estar alheio. Em muitos cenários, nós podemos ser felizes por confiar em nossos pares para reconhecer o valor do resultado cooperativo, até mesmo sem mencionar isso a eles, estando não mais do que levemente irritado se recebermos um 'pagamento de idiota'. Por exemplo, quando cedemos nosso assento no ônibus para um pessoa mais idosa, perderemos utilidade (conforto). Mas a sociedade pode ter punições para comportamentos não cooperativos, como sermos encarados pelos passageiros do ônibus. Pessoas não são racionais! Alguns podem dizer que, se podemos realmente ser felizes em arriscar cooperação quando encarados com situações onde o 'pagamento do idiota' realmente não importa muito. Por exemplo, pagar uma tarifa de ônibus que custa poucos centavos não nos custa muito, até mesmo se os outros estão defendendo e explorando o sistema (não pagando a taxa). Mas quando nós encaramos situações onde o 'pagamento do idiota' nos machuca situações de vida ou morte nós escolheremos o curso 'racional' de ação para maximizar nosso bem estar, e defender. A sombra do futuro Existem variações do dilema do prisioneiro em que cooperação é a coisa racional a se fazer. Uma ideia é jogar o jogo mais de uma vez, o dilema do prisioneiro iterado. Cada jogada é referida como um round. Criticamente, cada agente pode ver o que o oponente fez no round anterior. Agora imagine que o jogo será jogado eternamente. O incentivo para defender é consideravelmente reduzido por duas razões: se você defender agora, seu oponente pode puni-lo, também defendendo, o que não é possível no dilema do prisioneiro de apenas um round (one shot); se você iniciar cooperando, e recebe um 'pagamento de idiota' no primeiro round, então, devido estar jogando indefinidamente, esta perda de utilidade pode ser amortizada sobre os rounds futuros. Quando considerando um contexto de execução infinito (ou muito longo), então a perda 7 de 9
8 de uma única unidade de utilidade representará um pequeno percentual de toda a utilidade obtida. Então, se você joga o dilema do prisioneiro indefinidamente, a cooperação é um resultado racional. A 'sombra do futuro' nos encoraja a cooperar neste caso. Suponha que você decidiu jogar o dilema do prisioneiro um número pré-determinado de vezes. Você precisa decidir, antecipadamente, qual sua estratégia de jogo. Considerando o último round, agora você e seu oponente sabem que não haverá um próximo round. Em outras palavras, o último round é como o dilema do prisioneiro de apenas uma iteração (one shot). Assim, a ação racional que cada agente deve tomar é defender. Continuando esta dedução para os rounds anteriores, guia-nos para a conclusão de que defender é a estratégia dominante. Como vemos, somente num jogo de infinitos rounds a cooperação é possível. Porém, não é necessário jogar infinitamente. Com um número de rounds suficientemente longo, cooperação pode ser encorajada. Isto é possível se ambos os jogadores sabem, com suficiente probabilidade, que eles irão se encontrar e jogar novamente no futuro. A segunda razão é que, até mesmo pensando que um agente cooperativo pode sofrer jogando contra um defensivo, ele pode no geral se sair bem se tiver oportunidade de interagir com um agente cooperativo. Para entender isso, vamos ir para uma das mais conhecidas partes de pesquisa em sistemas multi agentes: O torneio do dilema do prisioneiro de Axelrod. O torneio de Axelrod (no dilema do prisioneiro iterado) Robert Axelrod foi um cientista político interessado em como cooperação pode surgir em sociedades de agentes auto interessados. Em 1980 ele organizou um torneio público em que cientistas políticos, psicólogos, economistas e teóricos de jogos foram convidados a submeter programas de computador para jogar o dilema do prisioneiro iterado. Cada programa tem disponível a escolha anterior feita pelo oponente. Cada programa foi jogado contra o outro por 5 jogos, onde cada jogo consistia de 200 rounds. O vencedor do torneio foi o programa que teve o melhor desempenho no geral. Os programas tinham desde 152 linas de código a apenas 5 linhas. A seguir são mostradas algumas estratégias utilizadas. ALL-D: sempre defender, não importa o que o oponente faça, baseado na análise do que é racional fazer num dilema do prisioneiro iterado. RANDOM: escolhe aleatoriamente uma ação, independente do que o oponente faça, tendo iguais probabilidades de resultados, considerando as ações C ou D. TIT-FOR-TAT: estratégia olho-por-olho onde 1. no primeiro round, coopera 2. nos rounds t > 1, faça o que o oponente fez no round t-1 Esta foi a estratégia mais simples, requerendo apenas 5 linhas de código TESTER: tem objetivo de explorar os programas que não punem defesa. Como seu nome sugere, no primeiro round ele testa o oponente, defendendo. Se o oponente retaliar com defesa, ele joga o TIT-FOR-TAT. Se o oponente não defende, então ele jogará repetidas sequências de cooperação por 2 rounds, então defenderá. JOSS: como TESTER, tem objetivo de explorar a 'fraqueza' dos oponentes. É essencialmente TIT- FOR-TAT, mas 10% do tempo, no lugar de cooperar, irá defender. 8 de 9
9 No final do torneio, a estratégia que teve melhor resultado foi TIT-FOR-TAT, a mais simples. Isto pode parecer uma prova empírica de que a análise da teoria de jogos do dilema do prisioneiro iterado está errada: cooperação é a coisa racional a ser feita depois de tudo. Mas TIT-FOR-TAT ganhou pois a pontuação total foi calculada considerando todas as estratégias com a qual ele jogou contra. O resultado quando TIT-FOR-TAT foi jogado contra ALL-D foi exatamente como esperado: ALL-D vem no topo. TIT-FOR-TAT se saiu melhor pois jogou com programas que também eram inclinados a cooperar. Ela não terá sucesso com estratégias que tendem a defender, como a ALL-D. Axelrod tentou caracterizar as razões do sucesso do TIT-FOR-TAT, e trouxe as seguintes 4 regras: 1. Não seja invejoso: não precisa bater no oponente para se sair melhor. 2. Não seja o primeiro a defender: seja legal inicialmente cooperando. Existe claramente um risco de iniciar cooperando, mas a perda de utilidade por receber um 'pagamento de idiota' no primeiro round será comparativamente pequena com os possíveis benefícios da cooperação mútua com outra estratégia legal. 3. Cooperação recíproca e defesa: TIT-FOR-TAT representa um balanço entre punição e piedade. A combinação de defesa como punição e recompensa como cooperação encoraja a cooperação. 4. Não seja esperto: não torne o raciocínio muito complexo pois, um dos motivos, é que, para o oponente, parece que você está agindo aleatoriamente, dificultando a cooperação, a realização de um acordo, pois o outro não entende exatamente como você está agindo. Relacionamento de dependência em sistemas multi agentes A dependência entre agentes existe se, um dos agentes requer o outro para alcançar seus objetivos. Abaixo são mostrados algumas possíveis relações de dependência. Independência: Não existe dependência entre os agentes. Unilateral: Somente um agente depende do outro, e não vice-versa. Mútua: Ambos os agentes dependem um do outro, com respeito ao mesmo objetivo. Dependência recíproca: O primeiro agente depende do outro para algum objetivo, enquanto o segundo também depende do primeiro para algum objetivo (os dois objetivos não são necessariamente o mesmo). Note que a dependência múltipla implica dependência recíproca. Estes relacionamentos podem ser qualificados como se ou não são localmente acreditados ou mutuamente acreditados. Existe uma dependência localmente acreditada se um agente acredita que a dependência existe, mas não acredita que o outro agente acredita que ela exista. Uma dependência mutuamente acreditada existe quando o agente acredita que a dependência existe, e também acredita que o outro agente é ciente disto. 9 de 9
Jogos. A teoria dos jogos lida com as interações estratégicas que ocorrem entre os agentes.
Jogos A teoria dos jogos lida com as interações estratégicas que ocorrem entre os agentes http://robguena.fearp.usp.br/anpec/tjogos.pdf a) Descrição de um jogo Teoria dos Jogos Jogadores: quem está envolvido
Leia mais3 Breve Introdução à Teoria dos Jogos
3 Breve Introdução à Teoria dos Jogos Teoria dos Jogos é uma ferramenta matemática criada para melhor entender ou interpretar a maneira com que agentes que tomam decisões interagem entre si. Pense num
Leia maisFundamentos de Teoria dos jogos
Fundamentos de Teoria dos jogos A Teoria dos Jogos é um ramo da matemática aplicada que estuda situações estratégicas em que jogadores escolhem diferentes ações na tentativa de melhorar seu retorno. Na
Leia maisTeoria dos Jogos. Jogos simultâneos. Roberto Guena de Oliveira USP. 31 de outubro de 2013
Teoria dos Jogos Jogos simultâneos Roberto Guena de Oliveira USP 31 de outubro de 2013 Roberto Guena (USP) Teoria dos Jogos 31 de outubro de 2013 1 / 58 Sumário 1 Representação de jogos com movimentos
Leia maisJogos em Teoria dos Jogos e em
3 Jogos em Teoria dos Jogos e em Computação A Teoria dos Jogos pode ser entendida como a análise matemática de qualquer situação que envolva um conflito de interesses com o intuito de indicar as melhores
Leia mais1. Qual é a diferença entre um jogo cooperativo e um jogo não-cooperativo? Dê um exemplo de cada um.
Instituto de Relações Internacionais - Universidade de São Paulo Disciplina de Fundamentos de Microeconomia BRI0060 Primeiro Semestre de 2016 Docente Responsável Marislei Nishijima Gabarito da Lista 10
Leia maisUNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL FACULDADE DE CIÊNCIAS ECONÔMICAS DISCIPLINA DE TEORIA DOS JOGOS - CURSO DE VERÃO PROF. SABINO PÔRTO JÚNIOR
UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL FACULDADE DE CIÊNCIAS ECONÔMICAS DISCIPLINA DE TEORIA DOS JOGOS - CURSO DE VERÃO PROF. SABINO PÔRTO JÚNIOR MONITOR: GUILHERME RISCO (guilhermerisco@gmail.com)
Leia maisAula 20 Teoria dos jogos
Aula 20 Teoria dos jogos Piracicaba, novembro de 2018 Professora Dra. Andréia Adami 12/11/2018 Equipe Microeconomia Aplicada 1 John Von Neumann e Oskar Morgenstein em Theory of Games and Economic Behavior,
Leia maisTeoria dos Jogos e Estratégia Competitiva
Teoria dos Jogos e Estratégia Competitiva 1. Jogos e Decisões Estratégicas 2. Estratégias Dominantes 3. O Equilíbrio de Nash Revisitado 4. Jogos Repetitivos 5. Jogos Sequenciais 6. Desencorajamento à entrada
Leia maisTeoria dos Jogos Jogos na Forma Normal Com Informação Completa. Maurício Bugarin Fernando Meneguin Adriana Portugal
1 Teoria dos Jogos Jogos na Forma Normal Com Informação Completa Maurício Bugarin Fernando Meneguin Adriana Portugal Brasília / UnB Lembrando: Ø Jogos estáticos: todos os jogadores jogam ao mesmo tempo
Leia maisJogos Estratégias Mistas
Jogos Estratégias Mistas Redes Sociais e Econômicas Prof. André Vignatti Aula Passada Equilíbrio de Nash ninguém tem incentivo de desviar da estratégia Vários equilíbrios qual será a saída? Jogos de Coordenação
Leia maisLista 7 de exercícios Jogos Conceitos Microeconomia II Professora: Joisa Dutra Monitor: Pedro Bretan
Lista 7 de exercícios Jogos Conceitos Microeconomia II Professora: Joisa Dutra Monitor: Pedro Bretan 1) Defina precisamente as noções que estão listadas abaixo: a) Jogo; b) Jogo estático de informação
Leia maisTeoria do consumidor. Propriedades do Conjunto Consumo,
Teoria do consumidor 1 Pedro Rafael Lopes Fernandes Qualquer modelo que vise explicar a escolha do consumidor é sustentado por quatro pilares. Estes são o conjunto consumo, o conjunto factível, a relação
Leia mais2. A respeito do equilíbrio de Nash, julgue as afirmativas abaixo:
Universidade Federal do Rio Grande do Sul Faculdade de Economia Teoria dos Jogos / 2006 Estágio Docência: Aline Trindade Figueiredo e Mariana Hauer Lista de Exercícios 1 1. Defina Equilíbrio de Nash. Todo
Leia maisCAPÍTULO 6 * JOGOS NA FORMA ESTRATÉGICA COM INFORMAÇÃO COMPLETA
CAPÍTULO 6 * JOGOS NA FORMA ESTRATÉGICA COM INFORMAÇÃO COMPLETA Objetivos: Definir a forma normal ou estratégica para representação de jogos estáticos com informação completa e desenvolver os conceitos
Leia maisJogos seqüenciais Teoria Microeconômica II Economia Matutino - Marcelo Ranieri Cardoso
Jogos seqüenciais Jogos seqüenciais são aqueles nos quais os jogadores não fazem os movimentos simultaneamente, mas seqüencialmente. Jogos repetitivos são um caso específico de jogos seqüenciais. Empresa
Leia maisLISTA DE EXERCÍCIOS IV TEORIA DOS JOGOS
UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL FACULDADE DE CIÊNCIAS ECONÔMICAS DEPARTAMENTO DE ECONOMIA Disciplina ECO0208 Teoria Microeconômica II Professor Sabino da Silva Porto Junior Estágio de docência
Leia maisMicroeconomia. 8. Teoria dos Jogos. Francisco Lima. 1º ano 2º semestre 2013/2014 Licenciatura em Engenharia e Gestão Industrial
Microeconomia 8. Teoria dos Jogos Francisco Lima 1º ano 2º semestre 2013/2014 Licenciatura em Engenharia e Gestão Industrial Teoria dos Jogos Teoria dos jogos é o estudo de como os agentes se comportam
Leia maisMicroeconomia. 8. Teoria dos Jogos. Francisco Lima. 1º ano 2º semestre 2015/2016 Licenciatura em Engenharia e Gestão Industrial
Microeconomia 8. Teoria dos Jogos Francisco Lima 1º ano 2º semestre 2015/2016 Licenciatura em Engenharia e Gestão Industrial Teoria dos Jogos Teoria dos jogos é o estudo de como os agentes se comportam
Leia maisInteracção estratégica e Teoria de Jogos
Interacção estratégica e Teoria de Jogos IST, LEGI - Teoria Económica II Margarida Catalão Lopes 1 Nos mercados concorrenciais as empresas não interagem: são demasiado pequenas para influenciar o equilíbrio
Leia maisMicroeconomia II. Cursos de Economia e de Matemática Aplicada à Economia e Gestão. AULA 2.4 Oligopólio e Cartel. Isabel Mendes
Microeconomia II Cursos de Economia e de Matemática Aplicada à Economia e Gestão AULA 2.4 Oligopólio e Cartel Isabel Mendes 2007-2008 18-03-2008 Isabel Mendes/MICRO II 1 Nos modelos de oligopólio dados
Leia maisMICROECONOMIA II. Teoria dos Jogos CAP. 10 Nicholson CAP. 13 Pindyck
MICROECONOMIA II Teoria dos Jogos CAP. 10 Nicholson CAP. 13 Pindyck 1. Introdução Teoria dos Jogos envolve o estudo de situações estratégicas Modelos de Teoria dos Jogos procuram abordar situações estratégicas
Leia maisTeoria dos Jogos Material Complementar Texto Selecionado 1 A Evolução da Cooperação, de Robert Axelrod. Prof. Murillo Dias
Teoria dos Jogos Material Complementar Texto Selecionado 1 A Evolução da Cooperação, de Robert Axelrod Prof. Murillo Dias A EVOLUCÃO DA COOPERAÇÃO - ROBERT AXELROD 1 TEXTO SELECIONADO 1 A EVOLUÇÃO DA COOPERAÇÃO
Leia maisGABARITO LISTA 1. GOLEIRO (q) (1-q) E D JOGADOR (p) E 1, 1 2, 1/2 (1-p) D 3, 0 1, 1
Fundação Getúlio Vargas (FGV-RJ) - Graduação Microeconomia II º Semestre de 007 Prof: Paulo C. Coimbra Monitor: Flavio Moraes GABARITO LISTA. (a) O jogador batedor do pênalti possui duas estratégias possíveis:
Leia mais1) Considere a matriz abaixo como forma de representar um jogo entre dois jogadores:
TEORIA MICROECONÔMICA III Primeira Lista de Exercícios 2º semestre de 2007 Professor: Antônio Marcos Hoelz Ambrózio Monitor: Christiam Gonzales TODOS OS EXERCÍCIOS DEVEM SER FEITOS. Entregar os Exercícios
Leia maisINTRODUÇÃO À PESQUISA OPERACIONAL
INTRODUÇÃO À PESQUISA OPERACIONAL ** Decisão com Incerteza Parte 1 ** Profa. Vitória Pureza 2º Semestre Roteiro Critérios de Decisão em Situações de Incerteza Teoria de Utilidade Axiomas de Von Neumann-Morgenstern
Leia maisMATRIZES - PARTE Mais exemplos Multiplicação de duas matrizes AULA 26
AULA 26 MATRIZES - PARTE 2 26. Mais exemplos Nesta aula, veremos mais dois algoritmos envolvendo matrizes. O primeiro deles calcula a matriz resultante da multiplicação de duas matrizes e utiliza três
Leia maisINF 1771 Inteligência Artificial
Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 24 Aprendizado Por Reforço Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor (KNN).
Leia maisProcessos Estocásticos
Processos Estocásticos Primeira Lista de Exercícios de junho de 0 Quantos códigos de quatro letras podem ser construídos usando-se as letras a, b, c, d, e, f se: a nenhuma letra puder ser repetida? b qualquer
Leia maisTeoria dos Jogos Repetidos
Teoria dos Jogos Repetidos Os processos de interação estratégica nos quais os jogadores decidem sem conhecer as decisões dos demais podem ser tratados como jogos simultâneos. Já os processos de interação
Leia maisMicroeconomia I. 3ª Ficha de Avaliação Ano lectivo 2009/2010 Nome: Nº Aluno: Turma:
Microeconomia I 3ª Ficha de Avaliação Ano lectivo 2009/2010 Nome: Nº Aluno: Turma: Num determinado jogo sequencial o Jogador 1 escolhe primeiro a estratégia que irá escolher (A ou B). Em resposta, o Jogador
Leia maisPRO Introdução à Economia
Introdução à Economia Aula 11 Oligopólio Quatro Tipos de Mercado Número de Empresas Muitas Empresas Tipos de Produtos Uma Empresa Poucas Empresas Produtos diferenciados Produtos Idênticos Monopólio Oligopólio
Leia maisHEITOR AUGUSTO S. FERREIRA MARIANA SILVA INÁCIO THAIS SEIDEL TEORIA DOS JOGOS
HEITOR AUGUSTO S. FERREIRA MARIANA SILVA INÁCIO THAIS SEIDEL TEORIA DOS JOGOS Trabalho apresentado à disciplina de Teoria das Relações Internacionais. Curso de Graduação em Relações Internacionais, turma
Leia maisUNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO MICROECONOMICS 2009/2010
UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO MICROECONOMICS 2009/2010 References: - Gibbons, R. (1992), A Primer in Game Theory, Harvester Wheatsheaf (G) - Mas-Collel, A., M.
Leia maisLista 4 Teoria dos Jogos Prof. Sergio Almeida
1 Lista 4 Teoria dos Jogos Prof. Sergio Almeida Questão 1 Considere o seguinte jogo: Jogador 2 Jogador 1 c1 c2 c3 c4 r1 3, 8 0, 4 1, 6-2, 9 r2 4, 2 1, -3 3, 5 1, 4 r3 0, -3 2, 2 4, -1-3, 2 r4 6, 5-1, 3
Leia maisBarganha e Poder em Redes
Barganha e Poder em Redes Redes Sociais e Econômicas Prof. André Vignatti Barganha e Poder em Redes Quando falamos de Teoria dos Jogos, vimos que é possível existir múltiplos equilíbrios de Nash Neste
Leia maisA prova é SEM CONSULTA. Não são permitidas calculadoras ou quaisquer equipamentos eletrônicos. Celulares devem ser desligados e guardados.
ELE2005: Análise Estratégica de Investimentos e de Decisões com Teoria dos Jogos e Jogos de Opções Reais. Primeira Prova Segunda Chamada 31/10/2007 A prova é SEM CONSULTA. Não são permitidas calculadoras
Leia maisCEFET/RJ Disciplina: Inteligência Artificial Professor: Eduardo Bezerra Lista de exercícios 02
. CEFET/RJ Disciplina: Inteligência Artificial Professor: Eduardo Bezerra Lista de exercícios 02 Créditos: alguns itens desta lista são adaptados do material da disciplina CS188 - Artificial Intelligence
Leia maisTópicos Especiais em Redes: Introdução a Teoria dos Jogos com Aplicações a Redes de Computadores
Tópicos Especiais em Redes: Introdução a Teoria dos Jogos com Aplicações a Redes de Computadores Aula passada: Jogos repetidos infinitamente Aula de hoje: Introdução a Teoria dos Jogos Evolucionária Dinâmica
Leia maisTeoria dos Jogos Algorítmica
Teoria dos Jogos Algorítmica Objetivos: Apresentar a área de teoria dos jogos algorítmica, introduzindo os conceitos necessários de teoria dos jogos, e discorrendo sobre problemas e resultados da área.
Leia maisCombinando jogos simultâneos e seguenciais
Combinando jogos simultâneos e seguenciais Roberto Guena de Oliveira USP 15 de setembro de 2011 Roberto Guena de Oliveira (USP) Combinando 15 de setembro de 2011 1 / 45 Sumário 1 Representações nas formas
Leia maisMODELOS DE TEORIAS. Apresentação. Adam Smith Cournot Bertrand Stackelberg John Nash Teoria dos Jogos Definição do EQUILÍBRIO de NASH
MODELOS DE TEORIAS Apresentação Adam Smith Cournot Bertrand Stackelberg John Nash Teoria dos Jogos Definição do EQUILÍBRIO de NASH 1 Adam Smith (1723 1790) Considerado o formulador da teoria econômica
Leia maise C 1 (q 1 ) = 2 q 2 Jogador 2
UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL - UFRGS FACULDADE DE CIÊNCIAS ECONÔMICAS DISCIPLINA: Teoria Microeconômica II Prof. Sabino da Silva Porto Júnior Lista de exercício n. 01 1.** Considere um duopólio
Leia maisBases Matemáticas. Como o Conhecimento Matemático é Construído. Aula 2 Métodos de Demonstração. Rodrigo Hausen. Definições Axiomas.
1 Bases Matemáticas Aula 2 Métodos de Demonstração Rodrigo Hausen v. 2012-9-21 1/15 Como o Conhecimento Matemático é Construído 2 Definições Axiomas Demonstrações Teoremas Demonstração: prova de que um
Leia maisTeoria dos Jogos. Prof. Maurício Bugarin Eco/UnB 2014-I. Aula 12A Teoria dos Jogos Maurício Bugarin
Teoria dos Jogos Prof. Maurício Bugarin Eco/UnB 2014-I Roteiro Jogos Jogos Repetidos Desenvolver o modelo de jogo repetido Provar o teorema popular Aplicar para conluio ao dilema dos prisioneiros e aos
Leia maisModelando Conhecimento
Modelando Conhecimento Prof. Leandro Chaves Rêgo Programa de Pós-Graduação em Estatística - UFPE Programa de Pós-Graduação em Engenharia de Produção - UFPE Recife, 17 de Outubro de 2014 Modelando Conhecimento
Leia maisINF 1771 Inteligência Artificial
INF 1771 Inteligência Artificial Aula 18 Aprendizado Por Reforço Edirlei Soares de Lima Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor (KNN).
Leia maisRefinamentos de Equilíbrios de Nash
Refinamentos de Equilíbrios de Nash Prof. Leandro Chaves Rêgo Programa de Pós-Graduação em Estatística - UFPE Programa de Pós-Graduação em Engenharia de Produção - UFPE Recife, 06 de Outubro de 2014 Equilíbrio
Leia maisMicroeconomia II. Cursos de Economia e de Matemática Aplicada à Economia e Gestão
Microeconomia II Cursos de Economia e de Matemática Aplicada à Economia e Gestão AULA 3.1 Introdução à Teoria das Probabilidades e da Preferência pelo Risco Isabel Mendes 2007-2008 18-03-2008 Isabel Mendes/MICRO
Leia maisLe rouge et le noir: probabilidades com cartas
Le rouge et le noir: probabilidades com cartas Prof. Luiz T. F. Eleno 22 de fevereiro de 207 O baralho comum Vamos considerar um baralho comum no Ocidente, dito francês, que é aquele usado nos jogos de
Leia maisEvolução da Cooperação
Evolução da Cooperação O problema da cooperação Em que condições pode a cooperação emergir num mundo de egoístas sem/com a intervenção de uma autoridade central? Evolução da cooperação Perceber porque
Leia maisProbabilidades. Wagner H. Bonat Elias T. Krainski Fernando P. Mayer
Probabilidades Wagner H. Bonat Elias T. Krainski Fernando P. Mayer Universidade Federal do Paraná Departamento de Estatística Laboratório de Estatística e Geoinformação 06/03/2018 WB, EK, FM ( LEG/DEST/UFPR
Leia maisUniversidade Federal de Ouro Preto (UFOP) Microeconomía II CSA-140 Prof. Martin H. Vargas Barrenechea Lista
Questão 1 (Preferências Altruísticas) A persona 1 se importa con sua renda e com a renda da persona 2. Precisamente, o valor que ela coloca sobre sua renda é o mesmo que dá para duas unidades de renda
Leia maisObservação: Responda no mínimo 70% das questões. (**) responda no mínimo duas questões com essa marcação
UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL - UFRGS FACULDADE DE CIÊNCIAS ECONÔMICAS PROGRAMA DE PÓS-GRADUAÇÃO EM ECONOMIA CURSO DE ESPECIALIZAÇÃO MBE- MASTER OF BUSINESS ECONOMICS DISCIPLINA: Comportamento
Leia maisMétodo Simplex. Marina Andretta ICMC-USP. 19 de outubro de 2016
Método Simplex Marina Andretta ICMC-USP 19 de outubro de 2016 Baseado no livro Introduction to Linear Optimization, de D. Bertsimas e J. N. Tsitsiklis. Marina Andretta (ICMC-USP) sme0211 - Otimização linear
Leia mais1) A empresa DD é monopolista no setor industrial de retentores de portas. Seu custo de produção é dado por C=100-5Q+Q 2 e sua demanda é P=55-2Q.
Mercados imperfeitos Monopólio 1) A empresa DD é monopolista no setor industrial de retentores de portas. Seu custo de produção é dado por C=100-5Q+Q 2 e sua demanda é P=55-2Q. a) Que preços a empresa
Leia maisBarganha e Poder em Redes
Barganha e Poder em Redes Redes Sociais e Econômicas Prof. André Vignatti Modelando a Interação entre Duas Pessoas Queremos desenvolver um modelo matemático para prever os resultados de uma rede de trocas
Leia maisCapítulo 32 BEM-ESTAR
Varian, H. Microeconomia. Princípios Básicos. Editora Campus (7ª edição), 2003. Capítulo 32 BEM-ESTAR Curso de Microeconomia I Profa. Valéria Pero 2 Análise de Bem-estar A eficiência de Pareto é um objetivo
Leia maisT e o r e m a d e N a s h
T e o r e m a d e N a s h Primeiro Seminário de Teoria dos Jogos Maio de 2007 Fabrício Murai S u m á r i o Objetivos Notação e definições Enunciado do Teorema Teoremas do Ponto Fixo Demostração do Teorema
Leia maisTeoria dos Jogos Parte 2
Teoria dos Jogos Parte 2 GST0190 - MÉTODOS QUANTITATIVOS PARA TOMADA DE DECISÃO 1 de junho de 2017 Slide 1 de 15 Estratégias estritamente dominantes e dominadas Uma empresa de sabão em pó Limpo tem que
Leia maisSISTEMAS COLABORATIVOS. Prof. Dr. Cícero Quarto PECS/UEMA
SISTEMAS COLABORATIVOS Prof. Dr. Cícero Quarto cicero@engcomp.uema.br PECS/UEMA 2018.1 1 PARTE 1 - Fundamentos Sistemas colaborativos para uma nova sociedade e um novo ser humano Teorias e modelos de colaboração
Leia maisGame design Processo criativo e balanceamento. Introdução ao Desenvolvimento de jogos Prof. André Campos DIMAp-UFRN
Game design Processo criativo e balanceamento Introdução ao Desenvolvimento de jogos Prof. André Campos DIMAp-UFRN Objetivo Apresentar os elementos principais no processo de criação de jogos de computador
Leia maisNoções sobre Probabilidade
Noções sobre Probabilidade Introdução Vimos anteriormente como apresentar dados em tabelas e gráficos, e também como calcular medidas que descrevem características específicas destes dados. Mas além de
Leia maisTodos conhecemos vários tipos de jogos, como xadrez, pôquer, jogo da velha, futebol, truco, jogos de computador a lista pode continuar a gosto.
Teoria dos Jogos 1 Estas notas são a tradução de parte do livro Game Theory de Thomas S. Ferguson, disponível na rede (www.gametheory.net). O objetivo será o de condensar num texto curto o que me parecer
Leia maisCAPÍTULO 5 CONCEITOS BÁSICOS DE TEORIA DOS JOGOS E MEDIDAS DE CONCENTRAÇÃO DE MERCADO
CAPÍTULO 5 CONCEITOS BÁSICOS DE TEORIA DOS JOGOS E MEDIDAS DE CONCENTRAÇÃO DE MERCADO 5.1 INTRODUÇÃO A Teoria dos Jogos é o instrumento natural para a avaliação de poder de mercado em ambientes competitivos.
Leia maisProbabilidade Condicional
18 Probabilidade Condicional Sumário 18.1 Introdução....................... 2 18.2 Probabilidade Condicional............... 2 1 Unidade 18 Introdução 18.1 Introdução Nessa unidade, é apresentada mais uma
Leia maisMA21: Resolução de Problemas - segunda prova - gabarito. Problema 1 (Olimpíada turca de 1996; 2 pontos) Considere o polinomio:
MA21: Resolução de Problemas - segunda prova - gabarito Problema 1 (Olimpíada turca de 1996; 2 pontos) Considere o polinomio: p(x) (1 + x 3 ) (1 + 2x 9 ) (1 + 3x 27 )... (1 + nx 3n )... (1 + 1996 x 31996
Leia maisAula 6 Revisão de análise combinatória
Aula 6 Revisão de análise combinatória Conforme você verá na próxima aula, a definição clássica de probabilidade exige que saibamos contar o número de elementos de um conjunto. Em algumas situações, é
Leia maisMétodo Simplex dual. Marina Andretta ICMC-USP. 24 de outubro de 2016
Método Simplex dual Marina Andretta ICMC-USP 24 de outubro de 2016 Baseado no livro Introduction to Linear Optimization, de D. Bertsimas e J. N. Tsitsiklis. Marina Andretta (ICMC-USP) sme0211 - Otimização
Leia maisComputação Evolucionária em Machine Learning
omputação Evolucionária em Machine Learning Programas capazes de construir novo conhecimento ou de aperfeiçoar conhecimento existente, usando informação de entrada. Novo onhecimento Ambiente do Problema
Leia maisJogos Repetidos Infinitas Vezes Nash Folk Folk Perfeito Jogos Repetidos Finitas Vezes. Jogos Repetidos. Prof. Leandro Chaves Rêgo
Jogos Repetidos Prof. Leandro Chaves Rêgo Programa de Pós-Graduação em Estatística - UFPE Programa de Pós-Graduação em Engenharia de Produção - UFPE Recife, 21 de Outubro de 2014 Jogos Repetidos Introdução
Leia mais1 O problema original
COMO GANHAR UM AUTOMOVEL Antonio Luiz Pereira - IME-USP O problema original Em seu artigo Como Perder Amigos e Enganar Pessoas Eureka! n 0 o Prof. Nicolau Saldanha discute quatro problemas envolvendo probabilidades,
Leia maisUnidade III ESTRATÉGIA APLICADA. Profª. Lérida Malagueta
Unidade III ESTRATÉGIA APLICADA TEORIA DOS JOGOS Profª. Lérida Malagueta Caos Ora, minha suspeita é que o universo não é só mais estranho do que supomos, mas é mais estranho do que somos capazes de supor.
Leia maisNotas esparsas Jogos Sequencias de Informação Completa I
Notas esparsas Jogos Sequencias de Informação Completa I 1. Lembram-se do jogo dos três deputados visto em sala? O exemplo é de Morrow (1994), p.125. Basicamente, três deputados votam o aumento de salário
Leia maisIntrodução à Probabilidade
A Teoria de Probabilidade é responsável pelo estudo de fenômenos que envolvem a incerteza (é impossível prever antecipadamente o resultado) e teve origem na teoria de jogos, servindo como ferramenta para
Leia maisEQUAÇÕES RELACIONAIS FUZZY E COMO RESOLVÊ-LAS
EQUAÇÕES RELACIONAIS FUZZY E COMO RESOLVÊ-LAS PEDRO ALADAR TONELLI 1. Introdução Nosso objetivo é apresentar de uma forma simples o procedimento para achar soluções de uma equação relacional fuzzy para
Leia maisUNIVERSIDADE CATÓLICA PORTUGUESA Faculdade de Ciências Económicas e Empresariais Licenciatura em Economia
UNIVERSIDADE CATÓLICA PORTUGUESA Faculdade de Ciências Económicas e Empresariais Licenciatura em Economia º Teste de Organização Industrial Professora Fátima Barros 3 de Março de 003 Ano Lectivo 00/003
Leia maisFunções e Limites - Aula 08
Funções e Limites - Aula 08 Alexandre Nolasco de Carvalho Universidade de São Paulo São Carlos SP, Brazil 22 de Março de 2013 Primeiro Semestre de 2013 Turma 2013104 - Engenharia de Computação Definição
Leia maisCapítulo 9. Conclusão 184
9 Conclusão Esperamos com este trabalho ter demonstrado que a lógica Game Analysis Logic GAL, que é uma lógica modal de primeira-ordem baseada na lógica Computation Tree Logic, pode ser usada para representar
Leia maisInteligência Artificial. Resolução de problemas por meio de algoritmos de busca. Aula VI Busca Competitiva
Universidade Estadual do Oeste do Paraná Curso de Bacharelado em Ciência da Computação http://www.inf.unioeste.br/~claudia/ia2017.html Inteligência Artificial Resolução de problemas por meio de algoritmos
Leia maisA prova é SEM CONSULTA. Não são permitidas calculadoras ou quaisquer equipamentos eletrônicos. Celulares devem ser desligados e guardados.
ELE2005: Análise Estratégica de Investimentos e de Decisões com Teoria dos Jogos e Jogos de Opções Reais. Primeira Prova 23/10/2007 A prova é SEM CONSULTA. Não são permitidas calculadoras ou quaisquer
Leia maisEAE 5706: Microeconomia II: Teoria dos Jogos
EAE 5706: Microeconomia II: Teoria dos Jogos Aula 3: Jogos Simultâneos: Marcos Y. Nakaguma 14/08/2017 1 Revisão Na aula passada, vimos como representar os jogos nas formas extensiva e normal: e Γ E =fi,x,a,p(),
Leia maisUNIVERSIDADE DE SÃO PAULO Faculdade de Economia, Administração e Contabilidade de Ribeirão Preto Departamento de Economia
REC0224 MICROECONOMIA II EXERCÍCIOS SOBRE TEORIA DOS JOGOS E OLIGOPÓLIO. ROBERTO GUENA DE OLIVEIRA 1) João e Maria participam de um jogo no qual estão em disputa R$10.000,00. Nesse jogo, cada um deles
Leia maisRoteiro da aula: Jogos dinâmicos com informação incompleta. Mas-Collel e Green capítulo 9 Refinamentos do conceito de Equilíbrio de Nash
Roteiro da aula: Jogos dinâmicos com informação incompleta Mas-Collel e Green capítulo 9 Refinamentos do conceito de quilíbrio de Nash Racionalidade seqüencial quilíbrio Bayesiano perfeito quilíbrio bayesiano
Leia maisTópicos Especiais em Redes: Introdução a Teoria dos Jogos com Aplicações a Redes de Computadores
Tópicos Especiais em Redes: Introdução a Teoria dos Jogos com Aplicações a Redes de Computadores Aula passada: iscussão das listas de exercícios Aula de hoje: iscussão dos tópicos para apresentação Jogos
Leia maisSINALIZAÇÃO. Rafael V. X. Ferreira 11 de Outubro de 2017
MICROECONOMIA II SINALIZAÇÃO Rafael V. X. Ferreira rafaelferreira@usp.br 11 de Outubro de 217 Universidade de São Paulo (USP) Faculdade de Economia, Administração e Contabilidade (FEA) Departamento de
Leia maisÁrvore de Jogos Minimax e Poda Alfa-Beta
Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCA UFES Departamento de Computação Árvore de Jogos Minimax e Poda Alfa-Beta Inteligência Artificial Site: http://jeiks.net E-mail: jacsonrcsilva@gmail.com
Leia maisProva Final. Programa de Pós-Graduação em Economia. Microeconomia IV Prof.: Rogério Mazali. 30 de abril de 2016
Programa de Pós-Graduação em Economia Microeconomia IV Prof.: Rogério Mazali Prova Final 30 de abril de 2016 Instruções: Você tem 120 minutos para completar a prova. Seja preciso em suas respostas. Pontos
Leia maisDecisões Sequenciais Árvores de Decisão
Teoria da Decisão Decisão Uni-Objectivo Decisões Sequenciais Árvores de Decisão Árvores de Decisão Uma Árvore de Decisão é uma forma gráfica que se utiliza para representar um conjunto de decisões sequenciais,
Leia maisCap. 8 - Intervalos Estatísticos para uma Única Amostra
Intervalos Estatísticos para ESQUEMA DO CAPÍTULO 8.1 INTRODUÇÃO 8.2 INTERVALO DE CONFIANÇA PARA A MÉDIA DE UMA DISTRIBUIÇÃO NORMAL, VARIÂNCIA CONHECIDA 8.3 INTERVALO DE CONFIANÇA PARA A MÉDIA DE UMA DISTRIBUIÇÃO
Leia maisIntrodução ao Curso. Área de Teoria DCC/UFMG 2019/01. Introdução à Lógica Computacional Introdução ao Curso Área de Teoria DCC/UFMG /01 1 / 22
Introdução ao Curso Área de Teoria DCC/UFMG Introdução à Lógica Computacional 2019/01 Introdução à Lógica Computacional Introdução ao Curso Área de Teoria DCC/UFMG - 2019/01 1 / 22 Introdução: O que é
Leia maisThe management of common property resources: collective action as an alternative to privatisation or state regulation
The management of common property resources: collective action as an alternative to privatisation or state regulation Robert Wade Apresentação: Alexandre Balduino Sollaci Universidade de Brasília Abril
Leia maisb) EN= {(D,D), (C,C)} Cooperar (C) Desertar (D) Jogador 1 Cooperar (C) (x,x) (z,y) Desertar (D) (y,z) (w,w) Apenas (C,C) é eficiente de Pareto.
TEORIA DOS JOGOS Primeira Lista de Exercícios 2º semestre de 2007 Professor: Antônio Marcos Hoelz Ambrózio Monitor: Christiam Gonzales 1ª Lista de Exercícios - Gabarito 1ª questão a) EN= {(D,D)} Cooperar
Leia maisUNIVERSIDADE CATÓLICA PORTUGUESA. Microeconomia
UNIVERSIDADE CATÓLICA PORTUGUESA Faculdade de Ciências Económicas e Empresariais Microeconomia Licenciaturas em Administração e Gestão de Empresas e em Economia Ano lectivo 2006-2007 Fernando Branco 2º
Leia maisJogo do Feche a caixa
Programa PIBID/CAPES Departamento de Matemática Universidade de Brasília Objetivos Introduzir o conceito de probabilidade. Conteúdos abordados Raciocínio combinatório; Probabilidade; Inequações. Metodologia
Leia maisDESENHO DE MECANISMOS (1)
MICROECONOMIA II DESENHO DE MECANISMOS (1) Rafael V. X. Ferreira rafaelferreira@usp.br Novembro de 2017 Universidade de São Paulo (USP) Faculdade de Economia, Administração e Contabilidade (FEA) Departamento
Leia maisFICHA DE REVISÕES Micro 1
FIH DE REVISÕES Micro 1 1) Monopólio Num determinado mercado, servido só por uma empresa, a procura de mercado desse bem é dada por Q D = 100 P +, em que P é o preço do bem e os gastos em publicidade efectuados
Leia maisTeoria dos Jogos. Roberto Guena de Oliveira 1 de junho de 2017 USP
Teoria dos Jogos Roberto Guena de Oliveira 1 de junho de 2017 USP 1 Introdução Os elementos de um jogo Jogadores Quais são os agentes envolvidos em um jogo? Em que número? Como serão denominados? 2 Os
Leia maisProg A B C A e B A e C B e C A,B e C Nenhum Pref
Polos Olímpicos de Treinamento Curso de Combinatória - Nível 2 Prof. Bruno Holanda Aula 2 Lógica II Quando lemos um problema de matemática imediatamente podemos ver que ele está dividido em duas partes:
Leia mais