Diego Silva Lemos da Costa. Introdução à Teoria dos Jogos
|
|
- Jonathan Aldeia Ribas
- 7 Há anos
- Visualizações:
Transcrição
1 Diego Silva Lemos da Costa Introdução à Teoria dos Jogos ITAJUBÁ - MG 14 de dezembro de 2015
2 Universidade Federal de Itajubá Instituto de Matemática e Computação Unifei Diego Silva Lemos da Costa Introdução à Teoria dos Jogos Orientador: Luis Fernando de Osório Mello Trabalho Final de Graduação apresentado ao curso de Matemática Bacharelado da Universidade Federal de Itajubá. ITAJUBÁ - MG 14 de dezembro de 2015
3 Sumário Sumário 3 1 Introdução 4 2 Um Jogo e suas Soluções O que é um jogo? Soluções de um jogo Dominância Solução estratégica ou equilíbrio de Nash Estratégias Mistas Soluções em Estratégias Mistas Teorema Minimax de Von Neumann Jogos de soma constante com dois jogadores Equilíbrio de Nash em estratégias puras Equilíbrio de Nash em estratégias mistas O Teorema Minimax de Von Neumann Teorema de Equilíbrio de Nash 37 5 A Forma Extensa de um Jogo Representação de um jogo via alfabetos e árvores Conversão entre as formas normal e extensa Um exemplo aplicado a Economia 56 7 Conclusões 61 Referências Bibliográficas 63
4 Capítulo 1 Introdução Este trabalho aborda uma introdução à Teoria dos Jogos, que é uma teoria matemática criada para modelar fenômenos observados quando dois ou mais agentes de decisão (jogadores) interagem entre si, ou melhor, uma teoria dos modelos matemáticos que estuda a escolha de decisões ótimas sob condições de conflito entre dois ou mais indivíduos. Tais modelos matemáticos podem ser usados em várias áreas, chegando, até mesmo, a ser usado em estudos de evolução genética. Trataremos em especial sobre a Teoria Econômica dos Jogos que, ao contrário da Teoria Combinatória dos Jogos (que busca aspectos combinatórios em jogos de mesa, como o jogo de nim [1]) [2, 4, 5, 6, 7, 11], possui motivações econômicas em seus fundamentos procurando estabelecer métodos para se maximizar o ganho (payoff ) de cada indivíduo nas situações que estiverem envolvidos em um conflito, onde precisam se sobresair ou não perder em relação ao oponente. Para ilustrar os primórdios da teoria dos jogos, vamos citar alguns colaboradores importantes em sua história e que ajudaram na sua evolução: James Waldegrave: Deu início aos primeiros registros no século XVIII analisando um jogo de cartas chamado Le Her, fornecendo uma solução que é um equilíbrio de estratégia mista (conceito que veremos mais adiante) [23, 24]. Augustin Cournot: No século XIX abordou o duopólio [3], usado na teoria econômica para maximizar o ganho em empresas. Ernst Zermelo: Em 1913 publicou o primeiro teorema matemático da teoria dos jogos [21]. Tal teorema afirma que o jogo de xadrez é estritamente determinado, isto é, em cada estágio do jogo pelo menos um dos jogadores tem uma estratégia que lhe dará a vitória ou conduzirá ao empate. 4
5 5 John Von Neumann: Em 1928 demonstrou que todo jogo finito de soma zero (também outro conceito que veremos mais adiante) com duas pessoas possui uma solução em estratégias mistas (Teorema Minimax de Von Neumann) [18]. A demonstração original usava Topologia e Análise Funcional, mas em 1937 foi fornecida uma demonstração baseada no teorema do ponto fixo de Brouwer. Von Neumann junto com o economista Oscar Morgenstern, publicou o clássico The Theory of Games and Economic Behaviour ( A Teoria dos Jogos e o Comportamento Econômico ) [19] em 1944, fazendo com que a teoria dos jogos invadisse a economia e a matemática aplicada. Enfim, especialmente, não poderia faltar o nome de John Forbes Nash Jr., que teve grandes contribuições na Teoria dos Jogos Não-Cooperativos [14, 16] e na Teoria de Barganha [15, 17] (que não abordaremos neste texto). Além disso, Nash em 1994 recebeu o Prêmio Nobel de Economia pelos seus feitos, tendo sua vida retratada no filme Uma Mente Brilhante, vencedor de quatro Oscars (indicado para oito), baseado em livro biográfico homônimo, que apresentou seu gênio para a matemática e sua luta contra a esquizofrenia. Figura 1.1: John Nash Neste trabalho estaremos em busca de uma situação em que, num jogo envolvendo dois ou mais jogadores, nenhum jogador tem a ganhar mudando sua estratégia (sua forma de jogar), ou seja, estaremos em busca de um equilíbrio no jogo, uma melhor jogada para todos os jogadores envolvidos. Para tal situação foi dado o nome na teoria de Equilíbrio de Nash que será visto com detalhe no decorrer do texto e será de grande utilidade nas situações de conflito.
6 6 Mas afinal, o que é um jogo? Uma resposta a esta pergunta é dada no Capítulo 2, onde daremos uma definição matemática de um jogo, buscando em exemplos esclarecer tal definição. Em seguida iremos definir uma solução de um jogo tanto em estratégias puras quanto em estratégias mistas (ais estratégias serão esclarecidas no decorrer do capítulo), sendo que a última é utilizada quando não conseguimos encontrar equilíbrio(s) de Nash do jogo em estratégias puras. Já o Capítulo 3 é voltado para o Teorema Minimax de Von Neumann, fornecendo sua demonstração completa. Para isso, definimos os conceitos de jogos de soma constante com dois jogadores e de um ponto de sela em tais jogos. O Teorema Minimax nos diz que para jogos de dois jogadores com soma zero (soma constante igual a zero) sempre existe pelo menos um equilíbrio de Nash em estratégias mistas. No Capítulo 4 iremos tratar do Teorema de Equilíbrio de Nash, que é muito mais abrangente na teoria dos jogos que o Teorema Minimax de Von Neumann, pois diz que todo jogo definido por matrizes de payoffs (conceito que será visto no Capítulo 1) possui um equilíbrio de Nash em estratégias mistas. Tal resultado é devido a John Forbes Nash Jr e faz o uso do Teorema do Ponto Fixo de Brouwer. Trataremos no Capítulo 5 da Forma Extensa de um Jogo, que diferente da forma normal vista principalmente no Capítulo 1 e no Capítulo 2, onde os jogadores escolhem suas estratégias simultaneamente ou fazem sem conhecer as estratégias dos outros, a forma extensa tem uma estrutura mais adequada para analisar jogos onde os jogadores tomam suas decisões gradualmente, depois de observar a ação que um outro jogador realizou (como em alguns jogos de cartas). Existem várias formas de se representar um jogo da forma extensa, porém veremos com detalhes a forma de representação via alfabetos [8] e palavras. Por fim, no Capítulo 6, daremos um exemplo, de forma resumida, relacionando a economia e a teoria de jogos vista, onde teremos uma noção de como tal teoria pode estar tão próxima do nosso cotidiano e de como pode ser vasta sua aplicação. A principal referência bibliográfica usada para a formulação do trabalho é dada em [24], detalhada na seção Bibliografia.
7 Capítulo 2 Um Jogo e suas Soluções 2.1 O que é um jogo? O elemento fundamental em um jogo é o conjunto de jogadores que dele participam, onde cada jogador tem um conjunto de estratégias específico. Quando cada jogador escolhe sua estratégia, temos uma situação ou perfil no espaço de todas as situações (ou perfis) possíveis, sendo que cada jogador tem interesse ou preferências para cada momento no jogo. Matematicamente, cada jogador tem sua função utilidade que atribui um número real, que chamamos de ganho ou payoff, a cada situação no jogo. Logo, visando os elementos básicos para se definir um jogo, temos que: Existe um conjunto finito de jogadores: G = { g 1, g 2,..., g n }; Cada jogador g i G possui um conjunto finito de opções, denominadas estratégias puras do jogador g i : S i = { s i1, s i2,..., s imi }, com m i 2; Um vetor s = (s 1j1, s 2j2,..., s njn ), onde s iji é uma estratégia pura para o jogador g i G, que é denominado um perfil de estratégia pura; 7
8 8 jogo é O conjunto de todos os perfis de estratégia pura ou espaço de estratégia pura do S = n S i = S 1 S 2... S n. i=1 Assim, podemos definir, para cada jogador g i G, uma função utilidade u i : S R s u i (s), (2.1) que associa o ganho u i (s) do jogador g i a cada perfil de estratégia pura s S. Para ilustrar a definição de um jogo, temos dois exemplos que estarão sempre presentes no decorrer do texto. Exemplo 2.1: Dilema dos Prisioneiros Considere a seguinte situação: Dois ladrões, Al e Bob, são capturados e acusados de um mesmo crime. Presos em selas separadas e sem poder se comunicar, o delegado faz as seguintes propostas: Cada um pode escolher entre confessar ou negar o crime. Se nenhum deles confessar, ambos serão submetidos a uma pena de 1 ano. Se os dois confessarem, então ambos terão pena de 5 anos. Mas, se um confessar e o outro negar, então o que confessar será libertado e o outro será condenado a 10 anos de prisão. Pela definição dada anteriormente temos: G = {Al, Bob} é o conjunto de jogadores; S Al = {confessar, negar} e S Bob = {confessar, negar} são os conjuntos de estratégias puras de Al e Bob, respectivamente.
9 9 Assim, o conjunto de todas as estratégias puras do jogo é 4 S i = S 1 S 2 S 3 S 4 = { (confessar, confessar), (confessar, negar), (negar, i=1 confessar), (negar, negar)}. Teremos as duas funções utilidades, u Al, u Bob : S R, onde os payoffs de cada jogador são: u Bob (confessar, confessar) = 5 u Bob (confessar, negar) = 10 u Bob (negar, confessar) = 0 u Bob (negar, negar) = 1 u Al (confessar, confessar) = 5 u Al (confessar, negar) = 0 u Al (negar, confessar) = 10 u Al (negar, negar) = 1 É uma prática representar, na teoria dos jogos, os payoffs dos jogadores através de uma matriz, denominada matriz de payoffs. No dilema dos prisioneiros temos: Al/Bob Confessar Negar Confessar (-5,-5) (0,-10) Negar (-10,0) (-1,-1) Nesta matriz, os números de cada célula representam, respectivamente, os payoffs de Al e Bob para as escolhas de Al e Bob correspondentes à célula. Exemplo 2.2: Batalha dos Sexos Considere a seguinte situação: Um homem e sua mulher decidem sair para passear. futebol enquanto sua mulher prefere ir ao cinema. O homem prefere assistir mulher. Se eles forem para o futebol, então o homem tem satisfação maior do que a
10 10 homem. Se eles forem juntos ao cinema, então a mulher tem satisfação maior do que o Se eles saírem sozinhos, então ambos ficam insatisfeitos. Considerando os mesmo moldes do Exemplo 2.1, temos que: G = {Homem, Mulher} é o conjunto de jogadores; S Homem = {futebol, cinema} e S Mulher = {futebol, cinema} são os conjuntos de estratégias puras do homem e da mulher, respectivamente. Teremos as duas funções utilidades, u Homem, u Mulher : S R, onde os payoffs de cada jogador são: u Homem (futebol, futebol) = 10 u Homem (futebol, cinema) = 0 u Mulher (futebol, futebol) = 5 u Mulher (futebol, cinema) = 0 u Homem (cinema, futebol) = 0 u Homem (cinema, cinema) = 5 u Mulher (cinema, futebol) = 0 u Mulher (cinema, cinema) = 10 Temos então, para a batalha dos sexos, a seguinte matriz de payoffs: Homem/Mulher Futebol Cinema Futebol (10,5) (0,0) Cinema (0,0) (5,10) Observe que o valor 5 representa a meia satisfação do homem ou da mulher, e o valor 10 representa a total satisfação do homem ou da mulher. Trataremos agora sobre as soluções de um jogo, em particular sobre dominância e equilíbrio de Nash.
11 Soluções de um jogo Considere um jogo conforme definido anteriormente. Uma solução de tal jogo é uma previsão feita com base em seus resultados, isto é, uma análise feita através dos ganhos dos jogadores (payoffs) em busca do melhor resultado para a situação de conflito em questão. Existem vários conceitos diferentes de solução, mas, em particular, investigaremos dois conceitos mais comuns: Dominância e Equilíbrio de Nash. Façamos, inicialmente, uma análise envolvendo o dilema dos prisioneiros. Como encontrar uma solução para o dilema de Al e Bob, isto é, que estratégias são plausíveis se os dois prisioneiros querem minimizar o tempo de cadeia? Do ponto de vista de Al, temos duas situações: Se Bob confessar, então é melhor Al confessar. Se Bob negar, então é melhor Al confessar. Logo, nos dois casos, Al irá confessar! Do ponto de vista de Bob, temos também duas situações: Se Al confessar, então é melhor Bob confessar. Se Al negar, então é melhor Bob confessar. Logo, nos dois casos, Bob irá confessar! Portanto, eles confessarão e ficarão presos por 5 anos. Em termos da teoria dos jogos, dizemos que os dois jogadores possuem uma estratégia dominante.
12 Dominância Geralmente, iremos discutir perfis de estratégia no qual apenas a estratégia de um único jogador g i G irá variar, enquanto as estratégias de seus oponentes ficarão fixas. Notação: s i = (s 1j1,..., s (i 1)j(i 1), s (i+1)j(i+1)..., s njn ) é uma escolha de estratégia do conjunto S i = S 1... S (i 1) S (i+1)... S n, para todos os jogadores menos o jogador g i. Desta maneira, um perfil de estratégia pode ser denotado por s = (s iji, s i ) = (s 1j1,..., s (i 1)j(i 1), s iji, s (i+1)j(i+1)..., s njn ). Definição 2.1: Estratégia Pura Estritamente Dominada Uma estratégia pura s ik estratégia s ik S i se S i do jogador g i G é estritamente dominada pela u i (s ik, s i ) > u i (s ik, s i ), s i S i ; s ik em S i é fracamente dominada pela estratégia s ik em S i se u i (s ik, s i ) u i (s ik, s i ), s i S i. Dominância estrita iterada nada mais é que um processo onde se eliminam as estratégias que são estritamente dominadas. Exemplo 2.3: Considere o jogo definido pela matriz de payoffs abaixo: g 1 /g 2 s 21 s 22 s 23 s 24 s 11 (5,2) (2,6) (1,4) (0,4) s 12 (0,0) (3,2) (2,1) (1,1) s 13 (7,0) (2,2) (1,1) (5,1) s 14 (9,5) (1,3) (0,2) (4,8)
13 13 Observe que a estratégia s 21 é estritamente dominada pela estratégia s 24. Assim, a primeira coluna pode ser ELIMINADA. Portanto, temos agora a matriz inicial reduzida, ou seja g 1 /g 2 s 22 s 23 s 24 s 11 (2,6) (1,4) (0,4) s 12 (3,2) (2,1) (1,1) s 13 (2,2) (1,1) (5,1) s 14 (1,3) (0,2) (4,8) Agora nesta matriz reduzida, para o jogador g 1, como u g1 (s 12, s 22 ) > u g1 (s 11, s 22 ), u g1 (s 12, s 23 ) > u g1 (s 11, s 23 ) e u g1 (s 12, s 24 ) > u g1 (s 11, s 24 ), a estratégia s 11 é estritamente dominada pela estratégia s 12. Analogamente, como u g1 (s 13, s 22 ) > u g1 (s 14, s 22 ), u g1 (s 13, s 23 ) > u g1 (s 14, s 23 ) e u g1 (s 13, s 24 ) > u g1 (s 14, s 24 ), a estratégia s 14 é estritamente dominada pela estratégia s 13. Portanto, as linhas 1 e 4 são eliminadas. Além disso, s 23 de g 2 é estritamente dominada pela estratégia s 22. Logo, a coluna 2 também pode ser eliminada. Após as eliminações acima, temos a matriz reduzida 2 2: g 1 /g 2 s 22 s 24 s 12 (3,2) (1,1) s 13 (2,2) (5,1) Finalmente, s 24 de g 2 é estritamente dominada pela estratégia s 22 e, na matriz 2 1 resultante, s 13 de g 1 é estritamente dominada por s 12. Temos que o resultado do jogo é (3, 2), isto é, g 1 escolhe s 12 e g 2 escolhe s 22. Observação 1: O exemplo deixa claro que a ordem das eliminações é independente, ou seja, iremos chegar no mesmo resultado independente da ordem das iterações feitas para a eliminação das estratégias dominadas. Veja que no dilema dos prisioneiros se aplicarmos a técnica de dominância estrita iterada o resultado do jogo é ( 5, 5), isto é, Al escolhe confessar e Bob escolhe confessar, o que condiz com a análise feita antes de darmos uma definição formal para dominância.
14 14 Observação 2: No exemplo, a técnica de dominância estrita iterada forneceu um único perfil de estratégia como solução do jogo, no caso o perfil (s 12, s 22 ). Porém, pode acontecer da técnica fornecer vários perfis, ou até mesmo todo espaço de estratégia se não existirem estratégias estritamente dominadas, como é o caso da batalha dos sexos, onde não existem estratégias estritamente dominadas Solução estratégica ou equilíbrio de Nash Uma solução estratégica ou um equilíbrio de Nash de um jogo é um ponto onde cada jogador não tem incentivo de mudar sua estratégia se os demais não o fizerem. Definição 2.2: Equilíbrio de Nash de Nash se Um perfil de estratégia s = (s 1,..., s (i 1), s i, s (i+1)..., s n ) S é um equilíbrio u i (s i, s i ) u i (s iji, s i ), i = 1,..., n e j i = 1,..., m i, com m i 2. Exemplo 2.4: a) No dilema dos prisioneiros, o perfil de estratégia (confessar, confessar) é um equilíbrio de Nash. De fato, se um prisioneiro confessar e o outro não, aquele que confessou fica preso na cadeia por 10 anos, ao invés de 5 anos, se tivesse confessado. b) Na batalha dos sexos, os perfis de estratégia (f utebol, f utebol) e (cinema, cinema) são os únicos equilíbrios de Nash do jogo. c) Existem jogos que não possuem equilíbrios de Nash em estratégias puras. Este é o caso do jogo de combinar moedas (matching pennies). Nesse jogo, dois jogadores exibem, ao mesmo tempo, a moeda que cada um esconde em sua mão. Se ambas as moedas apresentam cara ou coroa, o segundo jogador dá sua moeda para o primeiro. Se uma das moedas apresenta cara, enquanto a outra apresenta coroa, é a vez do primeiro
15 15 jogador dar sua moeda para o segundo. Esse jogo se encontra representado pela matriz de payoffs g 1 /g 2 s 21 s 22 s 11 (+1,-1) (-1,+1) s 12 (-1,+2) (+1,-1) 2.3 Estratégias Mistas Como vimos no jogo de combinar moedas no Exemplo 2.4, existem jogos que não possuem equilíbrios de Nash em estratégias puras. Uma alternativa para estes casos é a de considerar o jogo do ponto de vista probabilístico, isto é, ao invés de escolher um perfil de estratégia pura, o jogador deve escolher uma distribuição de probabilidade sobre suas estratégias puras. Uma estratégia mista p i para o jogador g i G é uma distribuição de probabilidades sobre o conjunto S i de estratégias puras do jogador, ou seja, p i é um elemento do conjunto { } m i mi = (x 1, x 2,..., x mi ) em R m i : x 1 0,..., x mi 0 e x k = 1. k=1 Assim, se p i = (p i1, p i2,..., p imi ), então p i1 0,..., p imi 0 e m i i=1 p ik = 1. Observe que cada mi é um conjunto compacto e convexo. Exemplo 2.5: Para representarmos a definição acima de mi, vamos tomar m i = 3. Daí, 3 = {(x 1, x 2, x 3 ) R 3 : x 1 0, x 2 0, x 3 0 e x 1 + x 2 + x 3 = 1}. Com auxílio do software Mathematica temos a região delimitada por 3 : Os vértices de mi, ou seja, os pontos e 1 = (1, 0,..., 0, 0),..., e mi = (0, 0,..., 0, 1), dão, respectivamente, probabilidade 1 às estratégias puras s i1, s i2,..., s imi. Desta maneira,
16 16 Figura 2.1: Região delimitada por 3. consideramos a distribuição de probabilidade e k como a estratégia mista que representa a estratégia pura s ik do jogador g i. O espaço de todos os perfis de estratégia mista é = m1 m2... mn, denominado espaço de estratégia mista. Como no caso de estratégias puras, usaremos a notação p i para representar as estratégias de todos os jogadores, com exceção do jogador g i. Cada perfil de estratégia mista p = (p 1, p 2,..., p n ) determina um payoff esperado. p = (p 1, p 2,..., p n ) = (p 11, p 12,..., p 1m1 ; p 21, p 22,..., p 2m2 ;...; p n1,..., p nmn ), então u i (p) = m 1 m 2 j 1 =1 j 2 =1... m n j n=1 ( n ) (p k )(j k )u i (s 1j1, s 2j2,..., s njn ) k=1 é o payoff esperado para o perfil de estratégia mista p. Mais precisamente, se
17 17 Exemplo 2.6: Voltemos ao jogo de combinar moedas (matching pennies). Dois jogadores exibem, ao mesmo tempo, a moeda que cada um esconde em sua mão. Se ambas as moedas apresentam cara ou coroa, o segundo jogador dá sua moeda para o primeiro. Se uma das moedas apresenta cara, enquanto a outra apresenta coroa, é a vez do primeiro jogador dar sua moeda para o segundo. A matriz de payoffs do jogo é g 1 /g 2 s 21 s 22 s 11 (+1,-1) (-1,+1) s 12 (-1,+2) (+1,-1) Suponha que g 1 escolha a distribuição de probabilidade p 1 = (1/4, 3/4) e g 2 escolhe p 2 = (1/3, 2/3), então os payoffs esperados associados ao perfil de estratégia mista p = (p 1, p 2 ) = (1/4, 3/4, 1/3, 2/3) são dados por u 1 (p) = ( (p k )(j k )u 1 (s 1j1, s 2j2 )) = p 11 (p 21 u 1 (s 11, s 21 ) + p 22 u 1 (s 11, s 22 )) + p 12 (p 21 u 1 (s 12, s 21 ) j 1 =1 j 2 =1 k=1 + p 22 u 1 (s 12, s 22 )) = 1/4(1/3(+1) + 2/3( 1)) + 3/4(1/3( 1) + 2/3(+1)) = 1/6 e, analogamente, u 2 (p) = ( (p k )(j k )u 2 (s 1j1, s 2j2 )) = p 11 (p 21 u 2 (s 11, s 21 ) + p 22 u 2 (s 11, s 22 )) + p 12 (p 21 u 2 (s 12, s 21 ) j 1 =1 j 2 =1 k=1 + p 22 u 2 (s 12, s 22 )) = 1/4(1/3( 1) + 2/3(+1)) + 3/4(1/3(+1) + 2/3( 1)) = 1/ Soluções em Estratégias Mistas Todos os critérios básicos para soluções de jogos em estratégias puras podem ser estendidos para estratégias mistas. Definição 2.3: Dominância Estrita Iterada em estratégias mistas Sejam S (0) i = S i e 0 m i = mi. Defina, de modo recursivo, S (n) i = {s S (n 1) i : p (n 1) mi tal que s i S (n 1) i, u i (p, s i ) > u i (s, s i )},
18 18 e n m i = {p = (p 1, p 2,..., p mi ) mi : k = 1,..., m i, p k > 0 se, e somente se, s ik S (n) i }, onde u i (p, s i ) representa o payoff esperado quando o jogador g i escolhe a estratégia mista p e os demais jogadores escolhem as estratégias mistas correspondentes as estratégias puras dadas por s i. A interseção S i = n=0 Sn i é o conjunto de estratégias puras e mi = {p mi : p mi tal que s i S i, u i (p, s i ) > u i (p, s i )} é o conjunto de todas as estratégias mistas do jogador g i que sobreviveram a técnica de dominância estrita iterada. Definição 2.4: Equilíbrio de Nash em estratégias mistas Um perfil de estratégia mista P* = (p* 1, p* 2,..., p* n ) = m1 m2... mn é um equilíbrio de Nash se, u i (p* i, P* i ) u i (p, P* i ), p mi, isto é, nenhum jogador sente motivação de trocar sua estratégia mista se os demais jogadores não o fizerem. Exemplo 2.7: No dilema dos prisioneiros, o perfil de estratégia mista P* = (p* 1, p* 2 ) = (1, 0; 1, 0) é um equilíbrio de Nash, pois dada a definição acima temos: u 1 (p, p* 2 ) = u 1 (p, 1 p; 1, 0) = 5p 10 5 = u 1 (1, 0; 1, 0) = u 1 (p* 1, p* 2 ), p = (p, 1 p) 2, e u 2 (p* 1, q) = u 2 (1, 0; q, 1 q) = 5q 10 5 = u 2 (1, 0; 1, 0) = u 2 (p* 1, p* 2 ), p = (q, 1 q) 2.
19 19 Observações: a) Observe que este equilíbrio corresponde ao equilíbrio em estratégias puras s*=(conf essar, conf essar), isto é, em estratégias mistas o perfil P* = (p* 1, p* 2 ) = (1, 0; 1, 0) é um equilíbrio de Nash para o dilema dos prisioneiros e em estratégias puras o perfil s*=(conf essar, conf essar) é um equilíbrio de Nash para o dilema dos prisioneiros. b) Na batalha dos sexos os equilíbrios de Nash em estratégias mistas são (1, 0; 1, 0) e (0, 1; 0, 1), correspondentes aos equilíbrios de Nash em estratégias puras (f utebol, f utebol) e (cinema, cinema), respectivamente. Mostraremos mais adiante que tanto em a) quanto em b), os equilíbrios de Nash citados são únicos. Como vimos no jogo de combinar moedas no item (d) do Exemplo 2.4, existem jogos que não possuem equilíbrios de Nash em estratégias puras e, até agora, todos os jogos apresentados nos exemplos possuem pelo menos um equilíbrio de Nash em estratégias mistas. Uma pergunta natural surge sobre a existência de soluções: A existência de equilíbrios de Nash em estratégias mistas é um resultado geral ou não? A resposta é SIM! Nos dois capítulos seguintes apresentaremos dois teoremas de existência: o Teorema Minimax de Von Neumann para jogos de soma zero com dois jogadores e o Teorema de Equilíbrios de Nash para jogos gerais.
20 Capítulo 3 Teorema Minimax de Von Neumann Antes de iniciarmos o capítulo, vamos dar um exemplo motivador para o conteúdo que será apresentado adiante. Exemplo 3.1: Jogos retangulares [20] Modelo do jogo: O jogador P 1 escolhe um número do conjunto M = {1, 2,..., m}. Seu adversário, P 2, escolhe um número do conjunto N = {1, 2,..., n}. Sejam i M e j N, respectivamente, as escolhas de P 1 e P 2. As regras do jogo definem então, um certo pagamento a ij de P 2 a P 1. Se a ij for positivo, representará realmente um pagamento (no sentido usual do vocábulo) de P 2 a P 1, e se a ij for negativo, equivalerá a um pagamento de P 1 a P 2. Os pagamentos relativos a todas as escolhas possíveis de P 1 e P 2 podem ser apresentados em uma matriz retangular. De posse desse modelo, podemos fazer algumas considerações: i) Veja que o modelo do jogo acima é idêntico a definição apresentada no início do nosso texto sobre o que seria um jogo, porém vista de uma forma mais informal. Para ilustrar o modelo de um jogo retangular temos o jogo chamado Morra (definido na Itália) que retrata a seguinte situação: Cada jogador (P 1 ou P 2 ) levanta 1 ou 2 dedos, e simultaneamente prevê a escolha de seu adversário. Se ambos acertam ou erram, o jogo é NULO. Se apenas um acerta, então este recebe um número de unidades monetárias igual ao total de dedos levantados. Representamos por (a, b) a escolha do jogador que levantar a dedos (a = 1 ou a = 2) e previu que seu adversário levantasse b dedos (b = 1 ou b = 2). 20
21 21 Daí, temos a seguinte matriz retangular (que é no nosso texto a matriz de payoffs): P 1 /P 2 (1,1) (1,2) (2,1) (2,2) (1,1) (1,2) (2,1) (2,2) ii) Veja também que pela matriz acima, as estratégias tanto de P 1 quanto de P 2 estão no conjunto S = {(1, 1), (1, 2), (2, 1), (2, 2)}, o que era esperado pelo modelo do jogo. Além disso, veja que a soma algébrica dos pagamentos é NULA, ou seja, o jogo Morra é um jogo de duas pessoas e de soma nula, o qual daremos a definição mais adiante. iii) Agora, imagine se quisermos buscar em um jogo retangular o melhor recurso para cada jogador, independente da ação de seu oponente. De que modo buscar esse melhor recurso? Podemos então tentar buscar uma estratégia segura, que garanta a cada jogador o melhor resultado. Considere a matriz retangular: P 1 /P Observe que para P 1 os resultados mais desfavoráveis são os mínimos pagamentos de cada linha (-1, -3 e 1), e para P 2 os máximos pagamentos de cada coluna (1, 4, 5 e 6). Logo, P 1 correrá menor risco jogando na linha correspondente ao máximo dos mínimos, o que assegura o ganho mínimo 1. P 2 terá, igualmente, menor risco jogando na coluna correspondente ao mínimo daqueles máximos, o que evita pagar mais do que 1. Ora, podemos ver que a entrada a 31 = 1 da matriz é um ponto especial, isto é, define o menor risco de perda para os dois jogadores. Veremos adiante que o ponto 1 é chamado de ponto de sela (daremos uma definição formal sobre tal ponto) e é fundamental em estratégias puras para obter um equilíbrio de Nash no jogo, pois teremos um teorema
22 22 que garante o fato de que dado um ponto de sela da matriz, então temos um equilíbrio de Nash no jogo. Nesse caso, (3,1) é um equilíbrio de Nash do jogo (P 1 jogar na linha 3 e P 2 jogar na coluna 1). Mesmo sem definirmos precisamente um ponto de sela, surge uma questão: E o caso onde as matrizes retangulares não possuem ponto de sela? exemplo: Neste caso recorremos à recursos aleatórios, ou seja, a probabilidade. Vejamos um Considere o jogo retangular definido pela matriz: P 1 /P Veja que a matriz acima não possui um ponto de sela como o ponto 1 do exemplo anterior, pois o mínimo valor de cada linha (-2 na primeira e -4 na segunda) não é o máximo valor de sua coluna. Desse modo, nenhuma estratégia pura é conveniente para cada jogador, por exemplo P 1 escolhe a estratégia pura 1 (joga na primeira linha). Então P 2 terá proveito dessa escolha empregando a estratégia pura 2 (jogando na segunda coluna). Então, temos um objetivo no jogo: Cada jogador deve fazer seu plano de modo que o adversário não descubra sua escolha! Suponha que P 1 e P 2 usem recursos aleatórios: As probabilidades de P 1 jogar nas linhas 1 e 2 são respectivamente x e 1 x, e as probabilidades de P 2 jogar nas colunas 1 e 2 são respectivamente y e 1 y. Considere então, a função esperança de P 1 (que é a mesma função utilidade que define o payoff de um jogador em estratégia mista) E(X, Y ) = n m a ij x i y j, onde X = (x, 1 x) e Y = (y, 1 y). j=1 i=1 Logo,
23 23 E(X, Y ) = 2xy 2x(1 y) 4y(1 x)+6(1 x)(1 y) = 14(x 5/7)(y 4/7)+2/7. Se P 1 usar a probabilidade x = 5/7 terá a certeza de seu ganho aleatório ser igual a 2/7, ou seja, não ser inferior a 2/7 qualquer que seja a escolha de P 2. Se P 2 utilizar a probabilidade y = 4/7, sua perda aleatória será 2/7, e por consequência, não superior a 2/7. Ou seja, P 1 usa a estratégia mista (5/7,2/7) e P 2 usa a estratégia mista (4/7,3/7) para termos o menor risco de perda para ambos os jogadores. Observação: Perceba que nesse exemplo fica clara a definição de estratégias mistas dada no Capítulo 2 e como ela funciona para os jogadores envolvidos. Além disso, considerando a definição de equilíbrio de Nash para estratégias mistas, o ponto p* = ((5/7,2/7);(4/7,3/7)) é um equilíbrio de Nash do jogo, visto que a função utilidade u i (p*) é equivalente a E(p*) para cada jogador na situação do acima. Com essas considerações, vamos agora falar sobre jogos de soma constante com dois jogadores. 3.1 Jogos de soma constante com dois jogadores Definição 3.1: Jogos de soma constante com dois jogadores Um jogo de soma constante com dois jogadores é um jogo com dois jogadores denominados jogador linha e jogador coluna, com estratégias S joglinha = {1, 2,..., m} e S jogcoluna = {1, 2,..., n}, e a matriz de payoff Jog. linha/jog. coluna n 1 (a 11, b 11 ) (a 12, b 12 )... (a 1n, b 1n ) 2 (a 21, b 21 ) (a 22, b 22 )... (a 2n, b 2n ) m (a m1, b m1 ) (a m2, b m2 )... (a mn, b mn ) Satisfazendo a ij + b ij = c (constante), i = 1,..., m, j = 1,..., m. No caso em que a constante c é zero, dizemos que o jogo tem soma zero.
24 24 Em termos de estratégias mistas, se p = (p 1,..., p m ) m é uma distribuição de probabilidades para as estratégias puras do jogador linha e q = (q 1,..., q n ) n é uma distribuição de probabilidades para as estratégias puras do jogador coluna, então o payoff esperado para o jogador linha é m n [ ] u l (p, q) = p i q j a ij = p 1 p 2... p m i=1 j=1 1 m = A q 1 q 2., q n n 1 isto é, u l (p, q) = p T Aq com A = a 11 a a 1n a 21 a a 2n a n1 a n2... a nn m n Analogamente, o payoff esperado para o jogador coluna é dado por: u c (p, q) = p T Bq, com B = b 11 b b 1n b 21 b b 2n b n1 b n2... b nn m n Como o jogo tem soma constante, c c... c c c... c A + B = C = c c... c m n = c 1 = , m n onde, 1 denota a matriz m n formada com 1 em todas as suas entradas. Sendo assim, podemos ver que u c (p, q) = p T Bq = p T (c 1 A)q = cp T 1 q p T Aq = c u l (p, q), onde na última igualdade usamos que p T 1 q = 1 pois m p i = 1 e i=1 m q j = 1. j=1
25 Equilíbrio de Nash em estratégias puras Definição 3.2: Ponto de sela Dizemos que um elemento a ij de uma matriz A é um ponto de sela de A se a ij a il, l = 1,..., n (Mínimo em sua linha), e Teorema 3.1: a ij a kj, k = 1,..., n (Máximo em sua coluna). O elemento a ij é um ponto de sela de uma matriz A, se, e somente se, o par (i, j) é um equilíbrio de Nash em estratégias puras para o jogo. Demonstração: i) Seja a ij um ponto de sela da matriz A. Como a ij é máximo em sua coluna, vale que u l (i, j) = a ij a kj = u l (k, j), k = 1,..., m. Isto é, o jogador linha não pode aumentar o seu payoff se o jogador coluna mantiver a escolha da coluna j. Por outro lado, como a ij é mínimo em sua linha, vale que u c (i, j) = b ij = c a ij c a il = b il = u c (i, l), l = 1,..., m. Isto é, o jogador coluna não pode aumentar o seu payoff se o jogador linha mantiver a escolha da linha i. Isto mostra que o perfil de estratégia pura (i, j) é um equilíbrio de Nash do jogo. ii) Agora, seja (i, j) um equilíbrio de Nash. A partir das considerações feitas em i) e sabendo da definição dada em estratégia pura para que um perfil seja equilíbrio de Nash, é fácil ver que a ij é máximo em sua coluna e mínimo em sua linha e que, portanto, a ij é um ponto de sela da matriz A. Teorema 3.2: Se a ij e a rs são dois pontos de sela da matriz A, então a is e a rj também são pontos de sela da matriz A, e a ij = a rs = a is = a rj.
26 26 Demonstração: Considere a matriz: a ij... a is..... a rj... a rs. Como a ij e a rs são pontos de sela, sabemos que eles são mínimos em suas respectivas linhas e máximos em suas respectivas colunas. Assim, a ij a is a rs e a ij a rj a rs, e portanto, a ij = a is = a rj = a rs. Observe que a is é mínimo em sua linha, pois a ij = a is é mínimo da mesma linha e que a is é máximo em sua coluna, pois a rs = a is é máximo da mesma coluna. Analogamente, a rj é mínimo em sua linha (pois a rs = a rj é mínimo da mesma linha) e a rj é máximo em sua coluna (pois a rj = a ij é máximo da mesma coluna). Portanto, a is e a rj são pontos de sela de A. Definição 3.3: payoff mínimo O payoff mínimo do jogador linha, se ele escolher a linha k, é dado por a k = min (1 l n) a kl. Analogamente, o payoff mínimo do jogador coluna, se ele escolher a coluna l, é dado por c a l, onde a l = max (1 k m) a kl. Assim, podemos definir V l (A) = max (1 k m) a k = max (1 k m) min (1 l n) a kl, e V c (A) = min (1 l n) a l = min (1 l n) max (1 k m) a kl.
27 27 Teorema 3.3: Para toda matriz A, tem-se V c (A) V l (A). Demonstração: Temos que k = 1,..., m e j = 1,..., n, a kj min (1 l n). Assim, max (1 k m) a kj max (1 k m) min (1 l n) a kl = V l (A), j = 1,..., n. Consequentemente, V c (A) = min (1 l n) max (1 k m) a kl V l (A) = max (1 k m) min (1 l n) a kl. O teorema abaixo caracteriza a existência de equilíbrio de Nash. Teorema 3.4: Uma matriz A tem um ponto de sela se, e somente se, V l (A) = V c (A). Demonstração: i) Seja a ij um ponto de sela da matriz A, ou seja, a ij = min (1 l n) a il = a i. Como V l (A) = max (1 k m) a k, fica claro que V l (A) a i = a ij. Por outro lado, a ij = max (1 k m) a kj = a j e como V c (A) = min (1 l n) a l, segue que V c(a) a j = a ij. Portanto, V c (A) a ij V l (A), mas pelo teorema anterior, V c (A) V l (A), ou seja, V c (A) = V l (A). ii) Como V l (A) = max (1 r m) a r, existe uma linha i tal que V l (A) = a i. Como, por sua vez, a i = min (1 s n) a is, existe uma coluna l tal que a i = a il. Analogamente, como V c (A) = min (1 s n) a s, existe uma coluna j tal que V c (A) = a j. Como a j = max (1 r m) a rj, existe uma linha k tal que a j = a kj. Assim, V c (A) = a j = a kj. Pela hipótese inicial (V l (A) = V c (A)) temos que a il = a i = V l (A) = V c (A) = a j = a kj. Afirmação: a ij é um ponto de sela de A. De fato, a ij a j = a i a is, s = 1,..., n, isto é, a ij é o mínimo de sua linha. Por outro lado, a ij a i = a j a rj, r = 1,..., m, isto é, a ij é o máximo de sua coluna.
28 28 Portanto, a ij é um ponto de sela de A. Decorre imediatamente do teorema acima a existência de equilíbrio de Nash: Um jogo de dois jogadores com soma constante definido pela matriz de payoffs A do jogador linha tem um equilíbrio de Nash em estratégias puras se, e somente se, V l (A) = V c (A). 3.3 Equilíbrio de Nash em estratégias mistas Defina, V l (A) = max (p m) min (q n) p T Aq e V c (A) = min (q n) max (p m) p T Aq. Com a definição acima, o teorema da seção anterior sobre a existência de equilíbrio de Nash para estratégias puras pode ser estendida para estratégias mistas. É o que veremos a seguir. Teorema 3.5: Para toda matriz A, tem-se V c (A) V l (A). Demonstração: Temos que, p m, p T Aq min (y n) p T Ay. Assim, max (p m) p T Aq max (p m) min (y n) p T Ay = V l (A) daí, temos que: V c (A) = min (q n) max (p m) p T Aq max (p m) min (y n) p T Ay = V l (A).
29 29 O teorema a seguir caracteriza a existência de equilíbrio de Nash em estratégias mistas em termos de V l e V c. Teorema 3.6: Um perfil de estratégia mista (p*, q*) é um equilíbrio de Nash de um jogo com dois jogadores com soma constante definido pela matriz de payoffs A do jogador linha, se, e somente se, V l (A) = V c (A) = p* T Aq*. Demonstração: i) Se (p*, q*) é um equilíbrio de Nash, então p* T Aq* = u l (p*, q*) u l (p, q*) = p T Aq*, p m. Em particular, p* T Aq* = max (p m) p T Aq* min (y n) max (p m) p T Ay = V c (A). Vale também que, p* T Aq* = c u c (p*, q*) c u c (p*, q) = p* T Aq, q n. Em particular, p* T Aq* = min (q n) p* T Aq max (x m) min (q n) x T Aq = V l (A). Desta maneira, V l (A) V c (A). V c (A) = V l (A). Como, pelo teorema anterior, V c (A) V l (A), concluímos que ii) Como V l (A) = max (p m) min (q n) p T Aq, existe p* m tal que Analogamente, V l (A) = min (q n) p* T Aq. Como V c (A) = min (q n) max (p m) p T Aq, existe q* m tal que V c (A) = max (p m) p T Aq*. Temos por hipótese que V l (A) = V c (A), ou seja,
30 30 V l (A) = min (q n) p* T Aq = V c (A) = max (p m) p T Aq*. Afirmamos então que (p*, p*) é um equilíbrio de Nash do jogo. De fato, u l (p, q*) = p* T Aq* min (q n) p* T Aq = max (p m) p T Aq* x T Aq* = u l (x, q*), x m. Por outro lado, u c (p*, q*) = c p* T Aq* c max (p m) p T Aq* = c min (q n)p* T Aq c p* T Ay = u c (p*, y), y n. Desta maneira, (p*, q*) é um equilíbrio de Nash do jogo.
31 O Teorema Minimax de Von Neumann Antes de enunciarmos o teorema Minimax, vale ressaltar que ele diz o seguinte: Para jogos de dois jogadores com soma zero, V l (A) = V c (A) sempre vale. Assim, pelo teorema anterior sobre a existência de equilíbrio de Nash em estratégias mistas, segue-se que para esta classe de jogos, sempre existe pelo menos um equilíbrio de Nash em estratégias mistas. Teorema Minimax de Von Neumann: Para todo jogo de soma zero com dois jogadores, representado pela matriz de payoffs A do jogador linha, sempre existe um perfil de estratégia mista (p*, q*) m n satisfazendo V l (A) = max (p m) min (q n) p T Aq = p* T Aq* = min (q n) max (p m) p T Aq = V c (A). Em particular, (p*, q*) é um equilíbrio de Nash do jogo. Para demonstrarmos o teorema, vamos usar o teorema de dualidade da teoria de programação linear. Vale ressaltar que um problema de programação linear é um um problema de otimização com função objetivo e restrições lineares, onde: i) Problema Primal: Maximizar b T y, sujeito a Ay c, y 0, onde as desigualdades devem ser interpretadas componente a componente. ii) Problema Dual: A cada problema de programação linear (Problema primal) podemos associar um outro problema de otimização (Problema dual): Minimizar c T x, sujeito a x T A b T, x 0.
32 32 Teorema da dualidade em programação linear: a) O problema primal possui uma solução, se, e somente se, o problema dual possui uma solução. b) Se y* é solução do problema primal e x* é solução do problema dual, então c T x* = b T y*. Obs: Uma demonstração do Teorema da dualidade pode ser encontrada em [12]. Com as considerações feitas acima, vamos a demonstração do Teorema Minimax. Demonstração: Sem perda de generalidade, todas as entradas da matriz de payoffs A do jogador linha são positivas. Caso contrário, basta substituir A por A = A + D e B = A por B = D+B, onde D = d 1, com d > max (1 i m) max (1 j n) a ij. Observe que A+B = 0 (isto é, o jogo definido pelas matrizes A e B tem soma zero) e que (p*, q*) é um equilíbrio de Nash para o jogo definido pela matriz A se, e somente se, (p*, q*) é um equilíbrio de Nash para o jogo definido pela matriz A. e b = (1, 1,..., 1) T. Considere os problemas de programação linear: Sejam c = (1, 1,..., 1) T i) Problema Primal: Maximizar b T y, sujeito a Ay c, y 0. ii) Problema Dual: Minimizar c T x, sujeito a x T A b T, x 0. Passo 1 da demonstração: O problema dual possui solução. Como as entradas da matriz A são positivas, o conjunto admissível X = {x R m : x T A b T, x 0} é não vazio. como: Por outro lado, como c = (1, 1,..., 1) T, a função objetivo do problema é escrita x = (x 1,..., x m ) c T x = x 1 + x x m.
33 33 Assim, o problema dual consiste em encontrar o ponto do conjunto X mais próximo da origem segundo a norma da soma. 1. O problema certamente possui solução, pois, se p X, então podemos compactificar o conjunto admissível incluindo a restrição x 1 p 1 e, com isso, podemos usar o Teorema de Weierstrass para garantir a existência de um mínimo. Passo 2 da demonstração: Construção do equilíbrio de Nash. Sabemos que o problema primal possui solução pelo teorema da dualidade, e mais ainda, se x* é solução do problema dual e y* é solução do problema primal, então c T x* = b T y*. Seja θ = c T x* = b T y* (que é > 0 pois (0,0,...,0) não é admissível) e defina p* = x* θ e q* = y* θ. Afirmação: (p*, q*) é um equilíbrio de Nash do jogo. De fato, p* m e q* n, pois p* 0 (já que x* θ > 0), q* 0 (já que y* θ > 0), e m p i = i=1 m i=1 x i θ = ct x θ = θ m θ = 1 e q j = j=1 n j=1 y i θ = bt y θ = θ θ = 1. Agora, como x* T A b T, temos que q n, x* T Aq b T q = x* = p*θ. Desta maneira, n q j = 1. Mas j=1 p* T Aq θ = p* T Aq*, q n. Consequentemente, u c (p*, q*) = p* T Aq* p* T Aq = u c (p*, q), q n. Portanto, o jogador coluna não pode aumentar o seu payoff esperado trocando q* por q, se o jogador linha mantiver a escolha de p*. Analogamente, Como Ay c, temos que p m, p T Ay p T c = Desta maneira, m p i = 1. Mas y* = q*θ. i=1
34 34 p*aq* θ = p* T Aq*, p m. Consequentemente, u l (p*, q*) = p* T Aq* p T Aq* = u l (p, q*), p m. Portanto, o jogador linha não pode aumentar o seu payoff esperado trocando p* por p, se o jogador linha mantiver a escolha de q*. Além de estabelecer a existência de equilíbrio de Nash, a demonstração sugere como calculá-los: Resolvendo dois problemas de programação linear. Exemplo 3.1: O governo deseja vacinar seus cidadãos contra um certo vírus da gripe. Este vírus possui dois sorotipos, sendo que é desconhecida a proporção na qual os dois sorotipos ocorrem na população do vírus. Foram desenvolvidas duas vacinas onde a eficácia da vacina 1 é de 85% contra o sorotipo 1 e de 70% contra o sorotipo 2. A eficácia da vacina 2 é de 60% contra o sorotipo 1 e de 90% contra o sorotipo 2. A questão é: Buscando a melhor eficácia no combate contra o vírus, é possível encontrar um equilíbrio de Nash para a situação acima? Esta situação pode ser modelada como um jogo de de soma zero com dois jogadores, onde o jogador linha L (o governo) deseja fazer a compensação (a fração dos cidadãos resistentes ao vírus) o maior possível e o jogador coluna C (o vírus) deseja fazer a compensação menor possível. Temos, então, a seguinte matriz de payoffs: Governo/Vírus Sorotipo 1 Sorotipo 2 Vacina 1 (85/100,-85/100) (70/100,70/100) Vacina 2 (60/100,-60/100) (90/100,-90/100) Para encontrar um equilíbrio de Nash, devemos resolver os seguinte problemas de programação linear: i) Problema Primal:
35 35 Maximizar y 1 + y 2, sujeito a [ 85/100 70/100 60/100 90/100 ] [ y 1 y 2 ] [ 1 1 ], [ y 1 y 2 ] [ 0 0 ]. ii) Problema Dual: Minimizar x 1 + x 2, sujeito a [x 1 x 2 ] [ 85/100 70/100 60/100 90/100 ] [1 1], [ x 1 x 2 ] [ 0 0 ]. Isto é, i) Problema Primal: Maximizar y 1 + y 2, sujeito a 17y y 2 = 20; 6y 1 + 9y 2 = 10; y 1 0; y 2 0;, e ii) Problema Dual: Maximizar y 1 + y 2, sujeito a 17x x 2 = 20; 7x 1 + 9x 2 = 10; x 1 0; x 2 0; Com o auxílio de um software Mathematica, calculamos as soluções: Solução do problema dual: x* = (20/23, 10/23) (conforme Figura 3.2); Solução do problema primal: y* = (40/69, 50/69) (conforme Figura 3.1). Temos que θ = x* 1 + x* 2 = y* 1 + y* 2 = 30/23, e desta maneira o único equilíbrio de Nash para o problema é dado pelo ponto (p*, q*), onde p* = x* θ = (2/3, 1/3) e q* = y* θ = (4/9, 5/9).
36 36 Temos as soluções dadas nas figuras abaixo: Figura 3.1: Solução do problema primal para o exemplo Figura 3.2: Solução do problema dual para o exemplo
37 Capítulo 4 Teorema de Equilíbrio de Nash O Teorema Minimax abrange apenas a classe dos jogos de soma zero com dois jogadores. Vamos mostrar neste capítulo que: Todo jogo definido por matrizes de payoffs possui um equilíbrio de Nash em estratégias mistas. Tal resultado é devido a John Nash e faz uso do teorema do ponto fixo de Brouwer que será visto adiante [10]. Teorema 4.1: Ponto fixo de Brouwer Se é um subconjunto compacto e convexo de um espaço euclidiano de dimensão finita e F : é uma função contínua, então F possui um ponto fixo em, isto é, existe p* tal que F (p*) = p*. Com as notações das Seções 2.1 e 2.2, estabeleceremos uma sequência de teoremas que fornecem caracterizações alternativas para um equilíbrio de Nash. Teorema 4.2: Para cada i = 1,..., n e j = 1,..., m i, defina a função z ij : R p z ij (p) = u i (s ij, p i ) u i (p i, p i ), (4.1) 37
38 que mede o ganho ou perda do jogador g i quando ele troca a distribuição de probabilidade p i pela estratégia pura s ij. 38 Temos que p* é um equilíbrio de Nash se, e somente se, z ij (p*) 0, para cada i = 1,..., n e j = 1,..., m i. Demonstração: i) Se p* = (p* i, p i ) é um equilíbrio de Nash, então u i (p*, p* i ) u i (s ij, p* i ), para cada i = 1,..., n e j = 1,..., m i. Consequentemente, z ij (p*) = u i (s ij, p* i ) u i (p* i, p* i ) 0. ii) Se z ij (p*) = u i (s ij, p* i ) u i (p* i, p* i ) 0, para cada i = 1,..., n e j = 1,..., m i, então u i (s ij, p* i ) = u i (e j, p* i ) u i (p* i, p* i ), para cada i = 1,..., n e j = 1,..., m i, onde e j é o vetor canônico. Temos que mostrar: p i = (p i1,..., p i m i ) mi, u i (p i, p* i ) u i (p* i, p* i ). Mas por x u i (x, p* i ) ser um funcional linear, temos m i m i m i u i (p i, p* i ) = u i ( p ik e k, p* i ) = p ik u i (e k, p* i ) p ik u i (p* i, p* i ) = k=1 k=1 k=1 = 1 u i (p* i, p* i ) = u i (p* i, p* i ), com p i m. Teorema 4.3 Para cada i = 1,..., n e j = 1,..., m i, defina a função g ij : R p g ij (p) = max{0, z ij (p)}, (4.2)
39 Temos que p é um equilíbrio de Nash se, e somente se, g ij (p) = 0, i = 1,..., n e j = 1,..., m i. 39 Demonstração: Segue imediatamente do teorema anterior. Teorema 4.4: Defina a aplicação F : = m1 m2... mn = m1 m2... mn p = (p 1, p 2,..., p n ) F (p) = (y 1 (p),..., y n (p))}, (4.3) onde y i (p) = (y i1 (p), y i2 (p),..., y imi (p)), p i = (p i1, p i2,..., p imi ) e y ij (p) = p ij + g ij (p) m i. 1 + g ik (p) k=1 Temos que p* é um equilíbrio de Nash se, e somente se, F (p*) = p*, isto é, se, e somente se, p* é ponto fixo de F. Demonstração: Observe que de fato, F ( ) está contido em pois claramente y ij 0 e m i m i y i k(p) = ( p ik + g ik (p) m i ) = 1 + g ik (p) k=1 k=1 m i k=1 m i p ik + g ik (p) k=1 m i 1 + g ik (p) = m i 1 + g ik (p) k=1 m i 1 + g ik (p) = 1, k=1 k=1 k=1 isto é, cada y i (p) mi.
40 40 i) Se p* é um equilíbrio de Nash, então g ij (p*) = 0 para cada i = 1,..., n e j = 1,..., m i. Desta maneira, y ij (p*) = p ij, para cada i = 1,..., n e j = 1,..., m i, isto é, y i (p*) = p* i para cada i = 1,..., n, ou ainda, F (p ) = p. ii) Suponha que p* = (p* 1, p* 2,..., p* n ) = m1 m2... mn ponto fixo da aplicação F :, isto é, suponha que seja um p ij = p ij +g ij (p*) m i, 1 + g ik (p*) k=1 para cada i = 1,..., n e j = 1,..., m i. Segue-se então que p ij m i k=1 g ik (p*) = g ij (p*), m i para cada i = 1,..., n e j = 1,..., m i. Afirmamos que α = g ik (p*) = 0, de modo que g ik (p*) = 0 para to k = 1,..., m i e i = 1,..., n. De fato: k=1 Se, por absurdo, α > 0, vemos pela relação acima que g ij (p*) > 0 se, e somente se, p ij > 0. Sem perda de generalidade suponha que p i1 > 0, p i2 > 0,..., p il > 0 e p i(l+1) = p i(l+2) =... = p imi = 0. Observe que m i p* i = p ik e k, k=1 onde e i é o i-ésimo vetor da base canônica de R m i. Dado que g ik (p*) > 0 para todo k = 1, 2,..., l, temos que u i (e i, p* i ) > u i (p* i, p* i ), para todo k = 1,..., l. Desta maneira, m i m i l u i (p* i, p* i ) = u i ( p ik e k, p* i ) = p ik u i (e k, p* i ) = p ik u i (e k, p* i ) > k=1 k=1 l p ik u i (p* i, p* i ) = u i (p* i, p* i ) k=1 k=1 k=1 l p ik = u i (p* i, p* i ),
41 41 um absurdo. Isto demonstra que g ij (p*) = 0 para todo j = 1,..., m i e i = 1,..., n, e, assim, p* é um equilíbrio de Nash em estratégias mistas. Teorema 4.5: Equilíbrio de Nash Todo jogo definido por matriz de payoff possui equilíbrio de Nash. Demonstração: A aplicação F : do teorema anterior é contínua e é um conjunto compacto e convexo. Pelo Teorema do ponto fixo, F possui ponto fixo p*. Logo, pelo teorema anterior, p* é um equilíbrio de Nash. Observação: O Teorema 4.4 sugere uma maneira de se calcular os equilíbrios de Nash de um jogo. São soluções do seguinte problema de otimização linear: Minimizar n m i (g ij (p)) 2, i=1 j=1 sujeito a p. Isto de fato faz sentido, pois a soma de quadrados é zero se, e somente se, cada parcela é igual a zero. Exemplo 4.1: Para o dilema dos prisioneiros, (p, q) = (p, 1 p; q, 1 q) 2 2 é um equilíbrio de Nash se (p,q) é solução do problema de otimização Minimizar G(p, q) = (max{0, (-1 + p)(4q + 1)}) 2 +(max{0, p(4q + 1)}) 2 +(max{0, (4p + 1)(-1 + q)}) 2 +(max{0, q(4p + 1)}) 2, sujeito a 0 p 1 e 0 q 1. Com o auxílio do software Mathematica, temos que o equilíbrio de Nash do jogo é (p*, q*) = (1, 0; 1, 0) e, além disso, vemos que é único pela solução na Figura 4.1 abaixo.
42 42 Figura 4.1: Solução para o problema de otimização - Dilema dos prisioneiros. Exemplo 4.2: Para a batalha dos sexos, (p, q) = (p, 1 p; q, 1 q) 2 2 é um equilíbrio de Nash se (p,q) é solução do problema de otimização: Minimizar G(p, q) = (max{0, 5( 1 + p)(3q 1)}) 2 + (max{0, 5p(3q 1)}) 2 + (max{0, 5(3p 2)( 1 + q)}) 2 + (max{0, 5q(3p 2)}) 2, sujeito a 0 p 1 e 0 q 1. Com o auxílio do software Mathematica, temos que os únicos equilíbrios de Nash do jogo são (p*, q*) = (1, 0; 1, 0), (p*, q*) = (0, 1; 0, 1) e (p*, q*) = (2/3, 1/3; 1/3, 2/3).
43 Capítulo 5 A Forma Extensa de um Jogo Como vimos, a forma normal é usada em situações onde os jogadores escolhem sua estratégia simultaneamente ou fazem sem conhecer a estratégia dos outros jogadores. Existem outras situações (por exemplo, no mundo dos negócios ou na política e em alguns jogos de cartas) em que os jogadores tomam suas decisões de forma sequencial, depois de observar a ação que um outro jogador realizou. A forma extensa tem uma estrutura mais adequada para analisar jogos deste tipo, especificando assim quem se move, quando, com qual informação e o payoff ou ganho de cada jogador, ou seja, ela contém toda informação sobre o conflito em questão. Tem-se várias formas de se representar um jogo da forma extensa, por exemplo a Teoria dos Grafos [9], todas elas tentando formalizar a idéia de árvore. No texto, usaremos a representação por alfabetos [8] e palavras. 5.1 Representação de um jogo via alfabetos e árvores Um jogo na forma extensa consiste de um conjunto de jogadores, N = {0, 1, 2,..., n}, um conjunto das ações possíveis de cada jogador e os ganhos de cada um. Definição 5.1: Chamaremos de alfabeto a um conjunto de letras = {a 1, a 2,..., a k }. Denotamos por ao conjunto de palavras que podem ser formadas pelos elementos do alfabeto. Uma árvore sobre é um conjunto T de nós (palavras) 43
Uma Introdução à Teoria dos Jogos
Uma Introdução à Teoria dos Jogos Humberto José Bortolossi 1 Gilmar Garbugio 2 Brígida Alexandre Sartini 3 1 Departamento de Matemática Aplicada Universidade Federal Fluminense 2 Departamento de Matemática
Leia maisUma Introdução a Teoria dos Jogos
Uma Introdução a Teoria dos Jogos Brígida Alexandre Sartini, Gilmar Garbugio, Humberto José Bortolossi Polyane Alves Santos e Larissa Santana Barreto II Bienal da SBM Universidade Federal da Bahia 25 a
Leia maisJogos em Teoria dos Jogos e em
3 Jogos em Teoria dos Jogos e em Computação A Teoria dos Jogos pode ser entendida como a análise matemática de qualquer situação que envolva um conflito de interesses com o intuito de indicar as melhores
Leia maisO TEOREMA DE EQUILÍBRIO DE NASH
O TEOREMA DE EQUILÍBRIO DE NASH Aluno: Pedro Henrique de Castro Simões Orientador: Flávio Abdenur Introdução Estudamos, ao longo do segundo semestre de 2006, tópicos em análise real na reta. Com as ferramentas
Leia maisAula 20 Teoria dos jogos
Aula 20 Teoria dos jogos Piracicaba, novembro de 2018 Professora Dra. Andréia Adami 12/11/2018 Equipe Microeconomia Aplicada 1 John Von Neumann e Oskar Morgenstein em Theory of Games and Economic Behavior,
Leia maisUNIVERSIDADE ESTADUAL DE SANTA CRUZ DEPARTAMENTO DE CIÊNCIAS EXATAS E TECNOLÓGICAS UMA INTRODUÇÃO A TEORIA DOS JOGOS. Polyane Alves Santos
UNIVERSIDADE ESTADUAL DE SANTA CRUZ DEPARTAMENTO DE CIÊNCIAS EXATAS E TECNOLÓGICAS UMA INTRODUÇÃO A TEORIA DOS JOGOS Polyane Alves Santos Ilhéus, Bahia 2003 Polyane Alves Santos UMA INTRODUÇÃO A TEORIA
Leia maisFundamentos de Teoria dos jogos
Fundamentos de Teoria dos jogos A Teoria dos Jogos é um ramo da matemática aplicada que estuda situações estratégicas em que jogadores escolhem diferentes ações na tentativa de melhorar seu retorno. Na
Leia mais3 Breve Introdução à Teoria dos Jogos
3 Breve Introdução à Teoria dos Jogos Teoria dos Jogos é uma ferramenta matemática criada para melhor entender ou interpretar a maneira com que agentes que tomam decisões interagem entre si. Pense num
Leia maisJogos de soma zero com dois jogadores
Jogos de soma zero com dois jogadores Problema: Dada uma matriz A m n, encontrar um equilíbrio de Nash (de estratégias mistas). Jogador 1 quer encontrar p que maximize v sujeito a i p i = 1 sujeito a (pa)
Leia maisTeoria dos Jogos Jogos na Forma Normal Com Informação Completa. Maurício Bugarin Fernando Meneguin Adriana Portugal
1 Teoria dos Jogos Jogos na Forma Normal Com Informação Completa Maurício Bugarin Fernando Meneguin Adriana Portugal Brasília / UnB Lembrando: Ø Jogos estáticos: todos os jogadores jogam ao mesmo tempo
Leia maisProgramação Linear. Dualidade
Programação Linear Dualidade Dualidade Já vimos em sala que para cada PPL existe um outro PL chamado dual, que consiste em modelar um problema que utiliza os mesmos dados que o original, mas alterando
Leia maisBig Points: Uma Análise Baseada na Teoria dos Jogos
Universidade de Brasília - UnB Faculdade UnB Gama - FGA Engenharia de Software Big Points: Uma Análise Baseada na Teoria dos Jogos Autor: Mateus Medeiros Furquim Mendonça Orientador: Prof. Dr. Edson Alves
Leia maisJogos. A teoria dos jogos lida com as interações estratégicas que ocorrem entre os agentes.
Jogos A teoria dos jogos lida com as interações estratégicas que ocorrem entre os agentes http://robguena.fearp.usp.br/anpec/tjogos.pdf a) Descrição de um jogo Teoria dos Jogos Jogadores: quem está envolvido
Leia maisJogos Estratégias Mistas
Jogos Estratégias Mistas Redes Sociais e Econômicas Prof. André Vignatti Aula Passada Equilíbrio de Nash ninguém tem incentivo de desviar da estratégia Vários equilíbrios qual será a saída? Jogos de Coordenação
Leia maisCAPÍTULO 6 * JOGOS NA FORMA ESTRATÉGICA COM INFORMAÇÃO COMPLETA
CAPÍTULO 6 * JOGOS NA FORMA ESTRATÉGICA COM INFORMAÇÃO COMPLETA Objetivos: Definir a forma normal ou estratégica para representação de jogos estáticos com informação completa e desenvolver os conceitos
Leia maisMétodo Simplex dual. Marina Andretta ICMC-USP. 24 de outubro de 2016
Método Simplex dual Marina Andretta ICMC-USP 24 de outubro de 2016 Baseado no livro Introduction to Linear Optimization, de D. Bertsimas e J. N. Tsitsiklis. Marina Andretta (ICMC-USP) sme0211 - Otimização
Leia maisLISTA DE EXERCÍCIOS IV TEORIA DOS JOGOS
UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL FACULDADE DE CIÊNCIAS ECONÔMICAS DEPARTAMENTO DE ECONOMIA Disciplina ECO0208 Teoria Microeconômica II Professor Sabino da Silva Porto Junior Estágio de docência
Leia maisProgramação Linear. Dual Simplex: Viabilidade Dual Método Dual Simplex
Programação Linear Dual Simplex: Viabilidade Dual Viabilidade Dual Considere o par de problemas primal (P) dual (D). Agora já sabemos como encontrar a solução de um desses PPL a partir da solução do outro.
Leia maisGABARITO LISTA 1. GOLEIRO (q) (1-q) E D JOGADOR (p) E 1, 1 2, 1/2 (1-p) D 3, 0 1, 1
Fundação Getúlio Vargas (FGV-RJ) - Graduação Microeconomia II º Semestre de 007 Prof: Paulo C. Coimbra Monitor: Flavio Moraes GABARITO LISTA. (a) O jogador batedor do pênalti possui duas estratégias possíveis:
Leia maisMétodo Simplex. Marina Andretta ICMC-USP. 19 de outubro de 2016
Método Simplex Marina Andretta ICMC-USP 19 de outubro de 2016 Baseado no livro Introduction to Linear Optimization, de D. Bertsimas e J. N. Tsitsiklis. Marina Andretta (ICMC-USP) sme0211 - Otimização linear
Leia maisUnidade 5 - Subespaços vetoriais. A. Hefez e C. S. Fernandez Resumo elaborado por Paulo Sousa. 10 de agosto de 2013
MA33 - Introdução à Álgebra Linear Unidade 5 - Subespaços vetoriais A. Hefez e C. S. Fernandez Resumo elaborado por Paulo Sousa PROFMAT - SBM 10 de agosto de 2013 Às vezes, é necessário detectar, dentro
Leia maisTeoria de dualidade. Marina Andretta ICMC-USP. 19 de outubro de 2016
Teoria de dualidade Marina Andretta ICMC-USP 19 de outubro de 2016 Baseado no livro Introduction to Linear Optimization, de D. Bertsimas e J. N. Tsitsiklis. Marina Andretta (ICMC-USP) sme0211 - Otimização
Leia maisTeoremas de dualidade
Teoremas de dualidade Marina Andretta ICMC-USP 19 de outubro de 2016 Baseado no livro Introduction to Linear Optimization, de D. Bertsimas e J. N. Tsitsiklis. Marina Andretta (ICMC-USP) sme0211 - Otimização
Leia maisUNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL FACULDADE DE CIÊNCIAS ECONÔMICAS DISCIPLINA DE TEORIA DOS JOGOS - CURSO DE VERÃO PROF. SABINO PÔRTO JÚNIOR
UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL FACULDADE DE CIÊNCIAS ECONÔMICAS DISCIPLINA DE TEORIA DOS JOGOS - CURSO DE VERÃO PROF. SABINO PÔRTO JÚNIOR MONITOR: GUILHERME RISCO (guilhermerisco@gmail.com)
Leia maisRepresentação de poliedros
Representação de poliedros Marina Andretta ICMC-USP 8 de novembro de 2016 Baseado no livro Introduction to Linear Optimization, de D. Bertsimas e J. N. Tsitsiklis. Marina Andretta (ICMC-USP) sme0211 -
Leia maisPontos extremos, vértices e soluções básicas viáveis
Pontos extremos, vértices e soluções básicas viáveis Marina Andretta ICMC-USP 19 de outubro de 2016 Baseado no livro Introduction to Linear Optimization, de D. Bertsimas e J. N. Tsitsiklis. Marina Andretta
Leia mais1) Considere a matriz abaixo como forma de representar um jogo entre dois jogadores:
TEORIA MICROECONÔMICA III Primeira Lista de Exercícios 2º semestre de 2007 Professor: Antônio Marcos Hoelz Ambrózio Monitor: Christiam Gonzales TODOS OS EXERCÍCIOS DEVEM SER FEITOS. Entregar os Exercícios
Leia maisTeoria dos Jogos e a Recuperação Judicial de Empresas
Felipe de Oliveira Coutinho Teoria dos Jogos e a Recuperação Judicial de Empresas Dissertação de Mestrado Dissertação apresentada ao Programa de Pósgraduação em Matemática da PUC-Rio como requisito parcial
Leia maisTeoria dos Jogos Algorítmica
Teoria dos Jogos Algorítmica Objetivos: Apresentar a área de teoria dos jogos algorítmica, introduzindo os conceitos necessários de teoria dos jogos, e discorrendo sobre problemas e resultados da área.
Leia maisTodos conhecemos vários tipos de jogos, como xadrez, pôquer, jogo da velha, futebol, truco, jogos de computador a lista pode continuar a gosto.
Teoria dos Jogos 1 Estas notas são a tradução de parte do livro Game Theory de Thomas S. Ferguson, disponível na rede (www.gametheory.net). O objetivo será o de condensar num texto curto o que me parecer
Leia maisBIOESTATISTICA. Unidade IV - Probabilidades
BIOESTATISTICA Unidade IV - Probabilidades 0 PROBABILIDADE E DISTRIBUIÇÃO DE FREQUÊNCIAS COMO ESTIMATIVA DA PROBABILIDADE Noções de Probabilidade Após realizar a descrição dos eventos utilizando gráficos,
Leia maisCones e raios extremos
Cones e raios extremos Marina Andretta ICMC-USP 7 de novembro de 2016 Baseado no livro Introduction to Linear Optimization, de D. Bertsimas e J. N. Tsitsiklis. Marina Andretta (ICMC-USP) sme0211 - Otimização
Leia maisMAT Resumo Teórico e Lista de
MAT 0132 - Resumo Teórico e Lista de Exercícios April 10, 2005 1 Vetores Geométricos Livres 1.1 Construção dos Vetores 1.2 Adição de Vetores 1.3 Multiplicação de um Vetor por um Número Real 2 Espaços Vetoriais
Leia maisLista 7 de exercícios Jogos Conceitos Microeconomia II Professora: Joisa Dutra Monitor: Pedro Bretan
Lista 7 de exercícios Jogos Conceitos Microeconomia II Professora: Joisa Dutra Monitor: Pedro Bretan 1) Defina precisamente as noções que estão listadas abaixo: a) Jogo; b) Jogo estático de informação
Leia maisPoliedros na forma padrão
Poliedros na forma padrão Marina Andretta ICMC-USP 19 de outubro de 2016 Baseado no livro Introduction to Linear Optimization, de D. Bertsimas e J. N. Tsitsiklis. Marina Andretta (ICMC-USP) sme0211 - Otimização
Leia maisINTRODUÇÃO À PESQUISA OPERACIONAL
INTRODUÇÃO À PESQUISA OPERACIONAL ** Decisão com Incerteza Parte 1 ** Profa. Vitória Pureza 2º Semestre Roteiro Critérios de Decisão em Situações de Incerteza Teoria de Utilidade Axiomas de Von Neumann-Morgenstern
Leia maisCombinando inequações lineares
Combinando inequações lineares A multiplicação por um número > 0 não altera uma inequação 2x x 5 4x 2x 10 1 2 1 2 A soma de duas inequações (com o mesmo sentido) produz uma inequação válida x 3x x 3 1
Leia maisTeoria dos Jogos. Prof. Maurício Bugarin ECO/UnB 2013-I. Aula 7 Teoria dos Jogos Maurício Bugarin. Cap. 2. Jogos Estáticos com Informação Completa
Teoria dos Jogos Prof Maurício Bugarin ECO/UnB 013-I Cap Jogos Estáticos com Informação Completa Roteiro Capítulo Jogos Estáticos com Informação Completa (Cap 1 do livro-texto) 1 A Forma Normal e o Conceito
Leia mais[Digite texto] Teoria dos Jogos/Mário
TEORIA DOS JOGOS 1. INTRODUÇÃO A teoria dos jogos é uma teoria matemática criada para se modelar fenômenos que podem ser observados quando dois ou mais agentes de decisão interagem entre si. Ela fornece
Leia maisProfessor João Soares 20 de Setembro de 2004
Teoria de Optimização (Mestrado em Matemática) Texto de Apoio 2A Universidade de Coimbra 57 páginas Professor João Soares 20 de Setembro de 2004 Optimização Linear Considere o problema (1) abaixo, que
Leia maisNotações e revisão de álgebra linear
Notações e revisão de álgebra linear Marina Andretta ICMC-USP 17 de agosto de 2016 Baseado no livro Introduction to Linear Optimization, de D. Bertsimas e J. N. Tsitsiklis. Marina Andretta (ICMC-USP) sme0211
Leia maisECONÔMICA DOS JOGOS. Humberto José Bortolossi Universidade Federal Fluminense. Gilmar Garbugio Universidade Federal Fluminense
UMA INTRODUÇÃO ÀTEORIA ECONÔMICA DOS JOGOS Humberto José Bortolossi Universidade Federal Fluminense Gilmar Garbugio Universidade Federal Fluminense Brígida Sartini Universidade Federal Rural do Rio de
Leia maisProgramação Linear - Parte 5
Matemática Industrial - RC/UFG Programação Linear - Parte 5 Prof. Thiago Alves de Queiroz 1/2016 Thiago Queiroz (IMTec) Parte 5 1/2016 1 / 29 Dualidade Os parâmetros de entrada são dados de acordo com
Leia maisOtimização. Otimização e Teoria dos Jogos. Paulo Henrique Ribeiro Gabriel Faculdade de Computação Universidade Federal de Uberlândia
Otimização Otimização e Teoria dos Jogos Paulo Henrique Ribeiro Gabriel phrg@ufu.br Faculdade de Computação Universidade Federal de Uberlândia 2016/2 Paulo H. R. Gabriel (FACOM/UFU) GSI027 2016/2 1 / 26
Leia maisMICROECONOMIA II. Teoria dos Jogos CAP. 10 Nicholson CAP. 13 Pindyck
MICROECONOMIA II Teoria dos Jogos CAP. 10 Nicholson CAP. 13 Pindyck 1. Introdução Teoria dos Jogos envolve o estudo de situações estratégicas Modelos de Teoria dos Jogos procuram abordar situações estratégicas
Leia maisLema de Farkas e desigualdades lineares
Lema de Farkas e desigualdades lineares Marina Andretta ICMC-USP 30 de outubro de 2016 Baseado no livro Introduction to Linear Optimization, de D. Bertsimas e J. N. Tsitsiklis. Marina Andretta (ICMC-USP)
Leia maisBig Points: Uma Análise Baseada na Teoria dos Jogos
Universidade de Brasília - UnB Faculdade UnB Gama - FGA Engenharia de Software Big Points: Uma Análise Baseada na Teoria dos Jogos Autor: Mateus Medeiros Furquim Mendonça Orientador: Prof. Dr. Edson Alves
Leia maisA Dualidade em Programação Linear
Investigação Operacional- 2009/10 - Programas Lineares 14 A Dualidade em Programação Linear Para melhor ilustrar este conceito vamos estudar dois problemas intimamente relacionadas: o problema da dona
Leia maisUNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO MICROECONOMICS 2009/2010
UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO MICROECONOMICS 2009/2010 References: - Gibbons, R. (1992), A Primer in Game Theory, Harvester Wheatsheaf (G) - Mas-Collel, A., M.
Leia maisProcessos Estocásticos
Processos Estocásticos Primeira Lista de Exercícios de junho de 0 Quantos códigos de quatro letras podem ser construídos usando-se as letras a, b, c, d, e, f se: a nenhuma letra puder ser repetida? b qualquer
Leia maisEQUAÇÕES RELACIONAIS FUZZY E COMO RESOLVÊ-LAS
EQUAÇÕES RELACIONAIS FUZZY E COMO RESOLVÊ-LAS PEDRO ALADAR TONELLI 1. Introdução Nosso objetivo é apresentar de uma forma simples o procedimento para achar soluções de uma equação relacional fuzzy para
Leia maisProbabilidade. Sumário Introdução Conceitos Básicos... 2
17 Sumário 17.1 Introdução....................... 2 17.2 Conceitos Básicos................... 2 1 Unidade 17 Introdução 17.1 Introdução Iniciamos, nesta unidade, o estudo de, cuja parte mais elementar
Leia maisMODELOS DE TEORIAS. Apresentação. Adam Smith Cournot Bertrand Stackelberg John Nash Teoria dos Jogos Definição do EQUILÍBRIO de NASH
MODELOS DE TEORIAS Apresentação Adam Smith Cournot Bertrand Stackelberg John Nash Teoria dos Jogos Definição do EQUILÍBRIO de NASH 1 Adam Smith (1723 1790) Considerado o formulador da teoria econômica
Leia maisTeoria dos Jogos. Jogos simultâneos. Roberto Guena de Oliveira USP. 31 de outubro de 2013
Teoria dos Jogos Jogos simultâneos Roberto Guena de Oliveira USP 31 de outubro de 2013 Roberto Guena (USP) Teoria dos Jogos 31 de outubro de 2013 1 / 58 Sumário 1 Representação de jogos com movimentos
Leia maisCAPÍTULO 5 CONCEITOS BÁSICOS DE TEORIA DOS JOGOS E MEDIDAS DE CONCENTRAÇÃO DE MERCADO
CAPÍTULO 5 CONCEITOS BÁSICOS DE TEORIA DOS JOGOS E MEDIDAS DE CONCENTRAÇÃO DE MERCADO 5.1 INTRODUÇÃO A Teoria dos Jogos é o instrumento natural para a avaliação de poder de mercado em ambientes competitivos.
Leia maisCadeias de Markov. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo
Cadeias de Markov Ricardo Ehlers ehlers@icmc.usp.br Departamento de Matemática Aplicada e Estatística Universidade de São Paulo Capitulos 3 e 4 Taylor & Karlin 1 / 71 Cadeias de Markov Seja X 0, X 1,...
Leia maisMicroeconomia II. Cursos de Economia e de Matemática Aplicada à Economia e Gestão. AULA 1.1 Descrição de Jogos não-cooperativos (forma normal)
Microeconomia II Cursos de Economia e de Matemática Aplicada à Economia e Gestão AULA 1.1 Descrição de Jogos não-cooperativos (forma normal) Isabel Mendes 2007-2008 1. Teoria dos Jogos: definição e contexto
Leia maisCapítulo 9. Conclusão 184
9 Conclusão Esperamos com este trabalho ter demonstrado que a lógica Game Analysis Logic GAL, que é uma lógica modal de primeira-ordem baseada na lógica Computation Tree Logic, pode ser usada para representar
Leia maisMATRIZES - PARTE Mais exemplos Multiplicação de duas matrizes AULA 26
AULA 26 MATRIZES - PARTE 2 26. Mais exemplos Nesta aula, veremos mais dois algoritmos envolvendo matrizes. O primeiro deles calcula a matriz resultante da multiplicação de duas matrizes e utiliza três
Leia maisProf a Dr a Ana Paula Marins Chiaradia
Projeto TEIA DO SABER 2007 UNESP Campus de Guaratinguetá Secretaria de Estado da Educação, SP. Departamento de Matemática Diretoria de Ensino da Região de Guaratinguetá Coordenador Prof. Dr. José Ricardo
Leia maisSumário. 2 Índice Remissivo 12
i Sumário 1 Definições Básicas 1 1.1 Fundamentos de Probabilidade............................. 1 1.2 Noções de Probabilidade................................ 3 1.3 Espaços Amostrais Finitos...............................
Leia maisIntroduzir os conceitos de base e dimensão de um espaço vetorial. distinguir entre espaços vetoriais de dimensão fnita e infinita;
META Introduzir os conceitos de base e dimensão de um espaço vetorial. OBJETIVOS Ao fim da aula os alunos deverão ser capazes de: distinguir entre espaços vetoriais de dimensão fnita e infinita; determinar
Leia maisRisco. Definição: Uma lotaria é qualquer evento com um resultado incerto. Exemplos: Investimento, Jogos de Casino, Jogo de Futebol.
Risco Definição: Uma lotaria é qualquer evento com um resultado incerto. Exemplos: Investimento, Jogos de Casino, Jogo de Futebol. Definição: A probabilidade de um resultado (de uma lotaria) é a possibilidade
Leia mais1 Matrizes e Determinantes
1 Matrizes e Determinantes 11 Introdução Definição (Matriz): Uma matriz A m n é um arranjo retangular de mn elementos distribuídos em m linhas horizontais e n colunas verticais: a 11 a 12 a 1j a 1n a 21
Leia maisRefinamentos de Equilíbrios de Nash
Refinamentos de Equilíbrios de Nash Prof. Leandro Chaves Rêgo Programa de Pós-Graduação em Estatística - UFPE Programa de Pós-Graduação em Engenharia de Produção - UFPE Recife, 06 de Outubro de 2014 Equilíbrio
Leia maisTEOREMA DE PITÁGORAS AULA ESCRITA
TEOREMA DE PITÁGORAS AULA ESCRITA 1. Introdução O Teorema de Pitágoras é uma ferramenta importante na matemática. Ele permite calcular a medida de alguma coisa que não conseguimos com o uso de trenas ou
Leia maisAula 16. Máximos e Mínimos Locais
Aula 16 Máximos e Mínimos Locais Seja f, y) uma função de 2 variáveis diferenciável em R 2 (ou num domínio aberto). Para estudar a função f, y), começamos por identificar os pontos de Máximo local e Mínimo
Leia maisOtimização Combinatória - Parte 4
Graduação em Matemática Industrial Otimização Combinatória - Parte 4 Prof. Thiago Alves de Queiroz Departamento de Matemática - CAC/UFG 2/2014 Thiago Queiroz (DM) Parte 4 2/2014 1 / 33 Complexidade Computacional
Leia maisControle Ótimo - Aula 6 Exemplos e Exercícios
Controle Ótimo - Aula 6 Exemplos e Exercícios Adriano A. G. Siqueira e Marco H. Terra Departamento de Engenharia Elétrica Universidade de São Paulo - São Carlos Probabilidades Probabilidade: número entre
Leia maisHEITOR AUGUSTO S. FERREIRA MARIANA SILVA INÁCIO THAIS SEIDEL TEORIA DOS JOGOS
HEITOR AUGUSTO S. FERREIRA MARIANA SILVA INÁCIO THAIS SEIDEL TEORIA DOS JOGOS Trabalho apresentado à disciplina de Teoria das Relações Internacionais. Curso de Graduação em Relações Internacionais, turma
Leia maisUNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ CURSO DE LICENCIATURA EM MATEMÁTICA ALEXANDRE ARIAS JUNIOR
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ CURSO DE LICENCIATURA EM MATEMÁTICA ALEXANDRE ARIAS JUNIOR ANÁLISE MATEMÁTICA APLICADA À TEORIA DE JOGOS TRABALHO DE CONCLUSÃO DE CURSO CURITIBA 2015 ALEXANDRE
Leia maisUnidade I ESTATÍSTICA APLICADA. Prof. Mauricio Fanno
Unidade I ESTATÍSTICA APLICADA Prof. Mauricio Fanno Estatística indutiva Estatística descritiva Dados no passado ou no presente e em pequena quantidade, portanto, reais e coletáveis. Campo de trabalho:
Leia maisEstatística (MAD231) Turma: IGA. Período: 2018/2
Estatística (MAD231) Turma: IGA Período: 2018/2 Aula #03 de Probabilidade: 19/10/2018 1 Variáveis Aleatórias Considere um experimento cujo espaço amostral é Ω. Ω contém todos os resultados possíveis: e
Leia maisInstituto Nacional de Matemática Pura e Aplicada Curso: Introdução à Economia Matemática
Instituto Nacional de Matemática Pura e Aplicada Curso: Introdução à Economia Matemática Prof. Rodrigo Novinski 8 de Fevereiro de 2010 Escolha sob Risco: Atitudes frente ao Risco (Castro e Faro, capítulo
Leia maisConstrução dos Números Reais
1 Universidade de Brasília Departamento de Matemática Construção dos Números Reais Célio W. Manzi Alvarenga Sumário 1 Seqüências de números racionais 1 2 Pares de Cauchy 2 3 Um problema 4 4 Comparação
Leia maisUNIVERSIDADE FEDERAL DO PARÁ BIBLIOTECA DE OBJETOS MATEMÁTICOS COORDENADOR: Dr. MARCIO LIMA
UNIVERSIDADE FEDERAL DO PARÁ BIBLIOTECA DE OBJETOS MATEMÁTICOS COORDENADOR: Dr. MARCIO LIMA TEXTO: DADOS NÃO TRANSITIVOS AUTOR: Mayara Brito (estagiária da BOM) ORIENTADOR: Dr. Professor Márcio Lima (coordenador
Leia maisa 11 a a 1n a 21 a a 2n A = a m1 a m2... a mn
Matrizes Definição Definição Uma matriz m n é uma tabela de mn números dispostos em m linhas e n colunas a 11 a 1 a 1n a 1 a a n a m1 a m a mn Embora a rigor matrizes possam ter quaisquer tipos de elementos,
Leia maisO PRINCÍPIO DAS GAVETAS Paulo Cezar Pinto Carvalho - IMPA
Nível Intermediário O PRINCÍPIO DAS GAVETAS Paulo Cezar Pinto Carvalho - IMPA Muitos problemas atraentes de matemática elementar exploram relações entre conjuntos finitos, expressas em linguagem coloquial.
Leia maisMaterial Teórico - Módulo Matrizes e Sistemas Lineares. Sistemas Lineares - Parte 2. Terceiro Ano do Ensino Médio
Material Teórico - Módulo Matrizes e Sistemas Lineares Sistemas Lineares - Parte 2 Terceiro Ano do Ensino Médio Autor: Prof Fabrício Siqueira Benevides Revisor: Prof Antonio Caminha M Neto 1 A representação
Leia maisTeoremas de uma, duas e três séries de Kolmogorov
Teoremas de uma, duas e três séries de Kolmogorov 13 de Maio de 013 1 Introdução Nestas notas Z 1, Z, Z 3,... é uma sequência de variáveis aleatórias independentes. Buscaremos determinar condições sob
Leia maisMarina Andretta. 10 de outubro de Baseado no livro Introduction to Linear Optimization, de D. Bertsimas e J. N. Tsitsiklis.
Solução básica viável inicial Marina Andretta ICMC-USP 10 de outubro de 2016 Baseado no livro Introduction to Linear Optimization, de D. Bertsimas e J. N. Tsitsiklis. Marina Andretta (ICMC-USP) sme0211
Leia maisAprendizado, minimização do arrependimento e equilíbrio (Learning, Regret Minimization, and Equilibria)
Aprendizado, minimização do arrependimento e equilíbrio (Learning, Regret Minimization, and Equilibria) Victor Alberto Romero Instituto de Matemática e Estatística Universidade de São Paulo Teoria dos
Leia maisAulas 12, 13 e 14 / 03, 05 e 10 de outubro
Aulas 12, 13 e 14 / 03, 05 e 10 de outubro 1 Teoria de jogos Nesta aula vamos dar um gostinho de teoria de jogos, e mostrar uma aplicação clássica do Teorema Forte da Dualidade. Aqui vamos tentar formalizar
Leia maisInteligência Artificial. Resolução de problemas por meio de algoritmos de busca. Aula VI Busca Competitiva
Universidade Estadual do Oeste do Paraná Curso de Bacharelado em Ciência da Computação http://www.inf.unioeste.br/~claudia/ia2017.html Inteligência Artificial Resolução de problemas por meio de algoritmos
Leia maisOs Quatro Subespaços Fundamentais
Álgebra Linear e Geometria Analítica Texto de apoio Professor João Soares 7 páginas Universidade de Coimbra 26 de Novembro de 29 Os Quatro Subespaços Fundamentais Seja A uma matriz m n de elementos reais.
Leia maisCombinando jogos simultâneos e seguenciais
Combinando jogos simultâneos e seguenciais Roberto Guena de Oliveira USP 15 de setembro de 2011 Roberto Guena de Oliveira (USP) Combinando 15 de setembro de 2011 1 / 45 Sumário 1 Representações nas formas
Leia maisObservação: Responda no mínimo 70% das questões. (**) responda no mínimo duas questões com essa marcação
UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL - UFRGS FACULDADE DE CIÊNCIAS ECONÔMICAS PROGRAMA DE PÓS-GRADUAÇÃO EM ECONOMIA CURSO DE ESPECIALIZAÇÃO MBE- MASTER OF BUSINESS ECONOMICS DISCIPLINA: Comportamento
Leia maisMestrado em Finanças e Economia Empresarial Competição Estratégica e Organização de Mercados Primeira prova: 30/08/2003
Mestrado em Finanças e Economia Empresarial Competição Estratégica e Organização de Mercados- 003 Primeira prova: 30/08/003 Questão 1: Considere o jogo do covarde(the Chicken Game), representado abaixo
Leia maisA prova é SEM CONSULTA. Não são permitidas calculadoras ou quaisquer equipamentos eletrônicos. Celulares devem ser desligados e guardados.
ELE2005: Análise Estratégica de Investimentos e de Decisões com Teoria dos Jogos e Jogos de Opções Reais. Primeira Prova 23/10/2007 A prova é SEM CONSULTA. Não são permitidas calculadoras ou quaisquer
Leia maisPrimeiro Exercício programa: Como o Google ordena páginas. MAP-2121 para EPUSP
Primeiro Exercício programa: Como o Google ordena páginas MAP-2121 para EPUSP 1 Instruções gerais Os exercícios computacionais pedidos na disciplina Cálculo Numérico têm por objetivo fundamental familiarizar
Leia maisCapítulo 2. Teoria dos Jogos 24
2 Teoria dos Jogos A Teoria dos Jogos tem como marco principal a publicação do livro de von Neumann e Morgenstern, Theory of Games and Economic Behavior (1944) (NM44), onde buscou-se utilizar do rigor
Leia maisGabriel Coutinho DCC035 - Pesquisa Operacional Lista 6
Lista 6 Exercício. O objetivo deste exercício é modelar o problema de emparelhamento em um grafo bipartido como um problema de fluxo, e verificar que o Teorema de Konig é essencialmente o Teorema de Fluxo
Leia maisEAE 5706: Microeconomia II: Teoria dos Jogos
EAE 5706: Microeconomia II: Teoria dos Jogos Aula 3: Jogos Simultâneos: Marcos Y. Nakaguma 14/08/2017 1 Revisão Na aula passada, vimos como representar os jogos nas formas extensiva e normal: e Γ E =fi,x,a,p(),
Leia maisJogos de Anti-Coordenação e Colorações Estáveis em Grafos. Renato Lui Geh NUSP:
Jogos de Anti-Coordenação e Colorações Estáveis em Grafos Renato Lui Geh NUSP:8536030 Introdução Jogos de coordenação: Classe de jogos em que jogadores jogam cooperativamente. Jogador i fazer a mesma ação
Leia maisProgramação Linear M É T O D O S : E S T A T Í S T I C A E M A T E M Á T I C A A P L I C A D A S D e 1 1 d e m a r ç o a 2 9 d e a b r i l d e
Programação Linear A otimização é o processo de encontrar a melhor solução (ou solução ótima) para um problema. Existe um conjunto particular de problemas nos quais é decisivo a aplicação de um procedimento
Leia maisDegenerescência. Marina Andretta ICMC-USP. 19 de outubro de 2016
Degenerescência Marina Andretta ICMC-USP 19 de outubro de 2016 Baseado no livro Introduction to Linear Optimization, de D. Bertsimas e J. N. Tsitsiklis. Marina Andretta (ICMC-USP) sme0211 - Otimização
Leia maisLaboratório de Simulação Matemática. Parte 7 2
Matemática - RC/UFG Laboratório de Simulação Matemática Parte 7 2 Prof. Thiago Alves de Queiroz 2/2017 2 [Cap. 7] BURDEN, R. L.; FAIRES, J. D. Numerical Analysis (9th ed). Cengage Learning, 2010. Thiago
Leia maisESPAÇOS VETORIAIS EUCLIDIANOS
ESPAÇOS VETORIAIS EUCLIDIANOS Produto interno em espaços vetoriais Estamos interessados em formalizar os conceitos de comprimento de um vetor e ângulos entre dois vetores. Esses conceitos permitirão uma
Leia maisÁlgebra Matricial - Nota 03 Eliminação Gaussiana e Método de Gauss-Jordan
Álgebra Matricial - Nota 03 Eliminação Gaussiana e Método de Gauss-Jordan Márcio Nascimento da Silva Universidade Estadual Vale do Acaraú Curso de Licenciatura em Matemática marcio@matematicauva.org 8
Leia mais