Diego Silva Lemos da Costa. Introdução à Teoria dos Jogos

Transcrição

1 Diego Silva Lemos da Costa Introdução à Teoria dos Jogos ITAJUBÁ - MG 14 de dezembro de 2015

2 Universidade Federal de Itajubá Instituto de Matemática e Computação Unifei Diego Silva Lemos da Costa Introdução à Teoria dos Jogos Orientador: Luis Fernando de Osório Mello Trabalho Final de Graduação apresentado ao curso de Matemática Bacharelado da Universidade Federal de Itajubá. ITAJUBÁ - MG 14 de dezembro de 2015

3 Sumário Sumário 3 1 Introdução 4 2 Um Jogo e suas Soluções O que é um jogo? Soluções de um jogo Dominância Solução estratégica ou equilíbrio de Nash Estratégias Mistas Soluções em Estratégias Mistas Teorema Minimax de Von Neumann Jogos de soma constante com dois jogadores Equilíbrio de Nash em estratégias puras Equilíbrio de Nash em estratégias mistas O Teorema Minimax de Von Neumann Teorema de Equilíbrio de Nash 37 5 A Forma Extensa de um Jogo Representação de um jogo via alfabetos e árvores Conversão entre as formas normal e extensa Um exemplo aplicado a Economia 56 7 Conclusões 61 Referências Bibliográficas 63

4 Capítulo 1 Introdução Este trabalho aborda uma introdução à Teoria dos Jogos, que é uma teoria matemática criada para modelar fenômenos observados quando dois ou mais agentes de decisão (jogadores) interagem entre si, ou melhor, uma teoria dos modelos matemáticos que estuda a escolha de decisões ótimas sob condições de conflito entre dois ou mais indivíduos. Tais modelos matemáticos podem ser usados em várias áreas, chegando, até mesmo, a ser usado em estudos de evolução genética. Trataremos em especial sobre a Teoria Econômica dos Jogos que, ao contrário da Teoria Combinatória dos Jogos (que busca aspectos combinatórios em jogos de mesa, como o jogo de nim [1]) [2, 4, 5, 6, 7, 11], possui motivações econômicas em seus fundamentos procurando estabelecer métodos para se maximizar o ganho (payoff ) de cada indivíduo nas situações que estiverem envolvidos em um conflito, onde precisam se sobresair ou não perder em relação ao oponente. Para ilustrar os primórdios da teoria dos jogos, vamos citar alguns colaboradores importantes em sua história e que ajudaram na sua evolução: James Waldegrave: Deu início aos primeiros registros no século XVIII analisando um jogo de cartas chamado Le Her, fornecendo uma solução que é um equilíbrio de estratégia mista (conceito que veremos mais adiante) [23, 24]. Augustin Cournot: No século XIX abordou o duopólio [3], usado na teoria econômica para maximizar o ganho em empresas. Ernst Zermelo: Em 1913 publicou o primeiro teorema matemático da teoria dos jogos [21]. Tal teorema afirma que o jogo de xadrez é estritamente determinado, isto é, em cada estágio do jogo pelo menos um dos jogadores tem uma estratégia que lhe dará a vitória ou conduzirá ao empate. 4

5 5 John Von Neumann: Em 1928 demonstrou que todo jogo finito de soma zero (também outro conceito que veremos mais adiante) com duas pessoas possui uma solução em estratégias mistas (Teorema Minimax de Von Neumann) [18]. A demonstração original usava Topologia e Análise Funcional, mas em 1937 foi fornecida uma demonstração baseada no teorema do ponto fixo de Brouwer. Von Neumann junto com o economista Oscar Morgenstern, publicou o clássico The Theory of Games and Economic Behaviour ( A Teoria dos Jogos e o Comportamento Econômico ) [19] em 1944, fazendo com que a teoria dos jogos invadisse a economia e a matemática aplicada. Enfim, especialmente, não poderia faltar o nome de John Forbes Nash Jr., que teve grandes contribuições na Teoria dos Jogos Não-Cooperativos [14, 16] e na Teoria de Barganha [15, 17] (que não abordaremos neste texto). Além disso, Nash em 1994 recebeu o Prêmio Nobel de Economia pelos seus feitos, tendo sua vida retratada no filme Uma Mente Brilhante, vencedor de quatro Oscars (indicado para oito), baseado em livro biográfico homônimo, que apresentou seu gênio para a matemática e sua luta contra a esquizofrenia. Figura 1.1: John Nash Neste trabalho estaremos em busca de uma situação em que, num jogo envolvendo dois ou mais jogadores, nenhum jogador tem a ganhar mudando sua estratégia (sua forma de jogar), ou seja, estaremos em busca de um equilíbrio no jogo, uma melhor jogada para todos os jogadores envolvidos. Para tal situação foi dado o nome na teoria de Equilíbrio de Nash que será visto com detalhe no decorrer do texto e será de grande utilidade nas situações de conflito.

6 6 Mas afinal, o que é um jogo? Uma resposta a esta pergunta é dada no Capítulo 2, onde daremos uma definição matemática de um jogo, buscando em exemplos esclarecer tal definição. Em seguida iremos definir uma solução de um jogo tanto em estratégias puras quanto em estratégias mistas (ais estratégias serão esclarecidas no decorrer do capítulo), sendo que a última é utilizada quando não conseguimos encontrar equilíbrio(s) de Nash do jogo em estratégias puras. Já o Capítulo 3 é voltado para o Teorema Minimax de Von Neumann, fornecendo sua demonstração completa. Para isso, definimos os conceitos de jogos de soma constante com dois jogadores e de um ponto de sela em tais jogos. O Teorema Minimax nos diz que para jogos de dois jogadores com soma zero (soma constante igual a zero) sempre existe pelo menos um equilíbrio de Nash em estratégias mistas. No Capítulo 4 iremos tratar do Teorema de Equilíbrio de Nash, que é muito mais abrangente na teoria dos jogos que o Teorema Minimax de Von Neumann, pois diz que todo jogo definido por matrizes de payoffs (conceito que será visto no Capítulo 1) possui um equilíbrio de Nash em estratégias mistas. Tal resultado é devido a John Forbes Nash Jr e faz o uso do Teorema do Ponto Fixo de Brouwer. Trataremos no Capítulo 5 da Forma Extensa de um Jogo, que diferente da forma normal vista principalmente no Capítulo 1 e no Capítulo 2, onde os jogadores escolhem suas estratégias simultaneamente ou fazem sem conhecer as estratégias dos outros, a forma extensa tem uma estrutura mais adequada para analisar jogos onde os jogadores tomam suas decisões gradualmente, depois de observar a ação que um outro jogador realizou (como em alguns jogos de cartas). Existem várias formas de se representar um jogo da forma extensa, porém veremos com detalhes a forma de representação via alfabetos [8] e palavras. Por fim, no Capítulo 6, daremos um exemplo, de forma resumida, relacionando a economia e a teoria de jogos vista, onde teremos uma noção de como tal teoria pode estar tão próxima do nosso cotidiano e de como pode ser vasta sua aplicação. A principal referência bibliográfica usada para a formulação do trabalho é dada em [24], detalhada na seção Bibliografia.

7 Capítulo 2 Um Jogo e suas Soluções 2.1 O que é um jogo? O elemento fundamental em um jogo é o conjunto de jogadores que dele participam, onde cada jogador tem um conjunto de estratégias específico. Quando cada jogador escolhe sua estratégia, temos uma situação ou perfil no espaço de todas as situações (ou perfis) possíveis, sendo que cada jogador tem interesse ou preferências para cada momento no jogo. Matematicamente, cada jogador tem sua função utilidade que atribui um número real, que chamamos de ganho ou payoff, a cada situação no jogo. Logo, visando os elementos básicos para se definir um jogo, temos que: Existe um conjunto finito de jogadores: G = { g 1, g 2,..., g n }; Cada jogador g i G possui um conjunto finito de opções, denominadas estratégias puras do jogador g i : S i = { s i1, s i2,..., s imi }, com m i 2; Um vetor s = (s 1j1, s 2j2,..., s njn ), onde s iji é uma estratégia pura para o jogador g i G, que é denominado um perfil de estratégia pura; 7

8 8 jogo é O conjunto de todos os perfis de estratégia pura ou espaço de estratégia pura do S = n S i = S 1 S 2... S n. i=1 Assim, podemos definir, para cada jogador g i G, uma função utilidade u i : S R s u i (s), (2.1) que associa o ganho u i (s) do jogador g i a cada perfil de estratégia pura s S. Para ilustrar a definição de um jogo, temos dois exemplos que estarão sempre presentes no decorrer do texto. Exemplo 2.1: Dilema dos Prisioneiros Considere a seguinte situação: Dois ladrões, Al e Bob, são capturados e acusados de um mesmo crime. Presos em selas separadas e sem poder se comunicar, o delegado faz as seguintes propostas: Cada um pode escolher entre confessar ou negar o crime. Se nenhum deles confessar, ambos serão submetidos a uma pena de 1 ano. Se os dois confessarem, então ambos terão pena de 5 anos. Mas, se um confessar e o outro negar, então o que confessar será libertado e o outro será condenado a 10 anos de prisão. Pela definição dada anteriormente temos: G = {Al, Bob} é o conjunto de jogadores; S Al = {confessar, negar} e S Bob = {confessar, negar} são os conjuntos de estratégias puras de Al e Bob, respectivamente.

9 9 Assim, o conjunto de todas as estratégias puras do jogo é 4 S i = S 1 S 2 S 3 S 4 = { (confessar, confessar), (confessar, negar), (negar, i=1 confessar), (negar, negar)}. Teremos as duas funções utilidades, u Al, u Bob : S R, onde os payoffs de cada jogador são: u Bob (confessar, confessar) = 5 u Bob (confessar, negar) = 10 u Bob (negar, confessar) = 0 u Bob (negar, negar) = 1 u Al (confessar, confessar) = 5 u Al (confessar, negar) = 0 u Al (negar, confessar) = 10 u Al (negar, negar) = 1 É uma prática representar, na teoria dos jogos, os payoffs dos jogadores através de uma matriz, denominada matriz de payoffs. No dilema dos prisioneiros temos: Al/Bob Confessar Negar Confessar (-5,-5) (0,-10) Negar (-10,0) (-1,-1) Nesta matriz, os números de cada célula representam, respectivamente, os payoffs de Al e Bob para as escolhas de Al e Bob correspondentes à célula. Exemplo 2.2: Batalha dos Sexos Considere a seguinte situação: Um homem e sua mulher decidem sair para passear. futebol enquanto sua mulher prefere ir ao cinema. O homem prefere assistir mulher. Se eles forem para o futebol, então o homem tem satisfação maior do que a

10 10 homem. Se eles forem juntos ao cinema, então a mulher tem satisfação maior do que o Se eles saírem sozinhos, então ambos ficam insatisfeitos. Considerando os mesmo moldes do Exemplo 2.1, temos que: G = {Homem, Mulher} é o conjunto de jogadores; S Homem = {futebol, cinema} e S Mulher = {futebol, cinema} são os conjuntos de estratégias puras do homem e da mulher, respectivamente. Teremos as duas funções utilidades, u Homem, u Mulher : S R, onde os payoffs de cada jogador são: u Homem (futebol, futebol) = 10 u Homem (futebol, cinema) = 0 u Mulher (futebol, futebol) = 5 u Mulher (futebol, cinema) = 0 u Homem (cinema, futebol) = 0 u Homem (cinema, cinema) = 5 u Mulher (cinema, futebol) = 0 u Mulher (cinema, cinema) = 10 Temos então, para a batalha dos sexos, a seguinte matriz de payoffs: Homem/Mulher Futebol Cinema Futebol (10,5) (0,0) Cinema (0,0) (5,10) Observe que o valor 5 representa a meia satisfação do homem ou da mulher, e o valor 10 representa a total satisfação do homem ou da mulher. Trataremos agora sobre as soluções de um jogo, em particular sobre dominância e equilíbrio de Nash.

11 Soluções de um jogo Considere um jogo conforme definido anteriormente. Uma solução de tal jogo é uma previsão feita com base em seus resultados, isto é, uma análise feita através dos ganhos dos jogadores (payoffs) em busca do melhor resultado para a situação de conflito em questão. Existem vários conceitos diferentes de solução, mas, em particular, investigaremos dois conceitos mais comuns: Dominância e Equilíbrio de Nash. Façamos, inicialmente, uma análise envolvendo o dilema dos prisioneiros. Como encontrar uma solução para o dilema de Al e Bob, isto é, que estratégias são plausíveis se os dois prisioneiros querem minimizar o tempo de cadeia? Do ponto de vista de Al, temos duas situações: Se Bob confessar, então é melhor Al confessar. Se Bob negar, então é melhor Al confessar. Logo, nos dois casos, Al irá confessar! Do ponto de vista de Bob, temos também duas situações: Se Al confessar, então é melhor Bob confessar. Se Al negar, então é melhor Bob confessar. Logo, nos dois casos, Bob irá confessar! Portanto, eles confessarão e ficarão presos por 5 anos. Em termos da teoria dos jogos, dizemos que os dois jogadores possuem uma estratégia dominante.

12 Dominância Geralmente, iremos discutir perfis de estratégia no qual apenas a estratégia de um único jogador g i G irá variar, enquanto as estratégias de seus oponentes ficarão fixas. Notação: s i = (s 1j1,..., s (i 1)j(i 1), s (i+1)j(i+1)..., s njn ) é uma escolha de estratégia do conjunto S i = S 1... S (i 1) S (i+1)... S n, para todos os jogadores menos o jogador g i. Desta maneira, um perfil de estratégia pode ser denotado por s = (s iji, s i ) = (s 1j1,..., s (i 1)j(i 1), s iji, s (i+1)j(i+1)..., s njn ). Definição 2.1: Estratégia Pura Estritamente Dominada Uma estratégia pura s ik estratégia s ik S i se S i do jogador g i G é estritamente dominada pela u i (s ik, s i ) > u i (s ik, s i ), s i S i ; s ik em S i é fracamente dominada pela estratégia s ik em S i se u i (s ik, s i ) u i (s ik, s i ), s i S i. Dominância estrita iterada nada mais é que um processo onde se eliminam as estratégias que são estritamente dominadas. Exemplo 2.3: Considere o jogo definido pela matriz de payoffs abaixo: g 1 /g 2 s 21 s 22 s 23 s 24 s 11 (5,2) (2,6) (1,4) (0,4) s 12 (0,0) (3,2) (2,1) (1,1) s 13 (7,0) (2,2) (1,1) (5,1) s 14 (9,5) (1,3) (0,2) (4,8)

13 13 Observe que a estratégia s 21 é estritamente dominada pela estratégia s 24. Assim, a primeira coluna pode ser ELIMINADA. Portanto, temos agora a matriz inicial reduzida, ou seja g 1 /g 2 s 22 s 23 s 24 s 11 (2,6) (1,4) (0,4) s 12 (3,2) (2,1) (1,1) s 13 (2,2) (1,1) (5,1) s 14 (1,3) (0,2) (4,8) Agora nesta matriz reduzida, para o jogador g 1, como u g1 (s 12, s 22 ) > u g1 (s 11, s 22 ), u g1 (s 12, s 23 ) > u g1 (s 11, s 23 ) e u g1 (s 12, s 24 ) > u g1 (s 11, s 24 ), a estratégia s 11 é estritamente dominada pela estratégia s 12. Analogamente, como u g1 (s 13, s 22 ) > u g1 (s 14, s 22 ), u g1 (s 13, s 23 ) > u g1 (s 14, s 23 ) e u g1 (s 13, s 24 ) > u g1 (s 14, s 24 ), a estratégia s 14 é estritamente dominada pela estratégia s 13. Portanto, as linhas 1 e 4 são eliminadas. Além disso, s 23 de g 2 é estritamente dominada pela estratégia s 22. Logo, a coluna 2 também pode ser eliminada. Após as eliminações acima, temos a matriz reduzida 2 2: g 1 /g 2 s 22 s 24 s 12 (3,2) (1,1) s 13 (2,2) (5,1) Finalmente, s 24 de g 2 é estritamente dominada pela estratégia s 22 e, na matriz 2 1 resultante, s 13 de g 1 é estritamente dominada por s 12. Temos que o resultado do jogo é (3, 2), isto é, g 1 escolhe s 12 e g 2 escolhe s 22. Observação 1: O exemplo deixa claro que a ordem das eliminações é independente, ou seja, iremos chegar no mesmo resultado independente da ordem das iterações feitas para a eliminação das estratégias dominadas. Veja que no dilema dos prisioneiros se aplicarmos a técnica de dominância estrita iterada o resultado do jogo é ( 5, 5), isto é, Al escolhe confessar e Bob escolhe confessar, o que condiz com a análise feita antes de darmos uma definição formal para dominância.

14 14 Observação 2: No exemplo, a técnica de dominância estrita iterada forneceu um único perfil de estratégia como solução do jogo, no caso o perfil (s 12, s 22 ). Porém, pode acontecer da técnica fornecer vários perfis, ou até mesmo todo espaço de estratégia se não existirem estratégias estritamente dominadas, como é o caso da batalha dos sexos, onde não existem estratégias estritamente dominadas Solução estratégica ou equilíbrio de Nash Uma solução estratégica ou um equilíbrio de Nash de um jogo é um ponto onde cada jogador não tem incentivo de mudar sua estratégia se os demais não o fizerem. Definição 2.2: Equilíbrio de Nash de Nash se Um perfil de estratégia s = (s 1,..., s (i 1), s i, s (i+1)..., s n ) S é um equilíbrio u i (s i, s i ) u i (s iji, s i ), i = 1,..., n e j i = 1,..., m i, com m i 2. Exemplo 2.4: a) No dilema dos prisioneiros, o perfil de estratégia (confessar, confessar) é um equilíbrio de Nash. De fato, se um prisioneiro confessar e o outro não, aquele que confessou fica preso na cadeia por 10 anos, ao invés de 5 anos, se tivesse confessado. b) Na batalha dos sexos, os perfis de estratégia (f utebol, f utebol) e (cinema, cinema) são os únicos equilíbrios de Nash do jogo. c) Existem jogos que não possuem equilíbrios de Nash em estratégias puras. Este é o caso do jogo de combinar moedas (matching pennies). Nesse jogo, dois jogadores exibem, ao mesmo tempo, a moeda que cada um esconde em sua mão. Se ambas as moedas apresentam cara ou coroa, o segundo jogador dá sua moeda para o primeiro. Se uma das moedas apresenta cara, enquanto a outra apresenta coroa, é a vez do primeiro

15 15 jogador dar sua moeda para o segundo. Esse jogo se encontra representado pela matriz de payoffs g 1 /g 2 s 21 s 22 s 11 (+1,-1) (-1,+1) s 12 (-1,+2) (+1,-1) 2.3 Estratégias Mistas Como vimos no jogo de combinar moedas no Exemplo 2.4, existem jogos que não possuem equilíbrios de Nash em estratégias puras. Uma alternativa para estes casos é a de considerar o jogo do ponto de vista probabilístico, isto é, ao invés de escolher um perfil de estratégia pura, o jogador deve escolher uma distribuição de probabilidade sobre suas estratégias puras. Uma estratégia mista p i para o jogador g i G é uma distribuição de probabilidades sobre o conjunto S i de estratégias puras do jogador, ou seja, p i é um elemento do conjunto { } m i mi = (x 1, x 2,..., x mi ) em R m i : x 1 0,..., x mi 0 e x k = 1. k=1 Assim, se p i = (p i1, p i2,..., p imi ), então p i1 0,..., p imi 0 e m i i=1 p ik = 1. Observe que cada mi é um conjunto compacto e convexo. Exemplo 2.5: Para representarmos a definição acima de mi, vamos tomar m i = 3. Daí, 3 = {(x 1, x 2, x 3 ) R 3 : x 1 0, x 2 0, x 3 0 e x 1 + x 2 + x 3 = 1}. Com auxílio do software Mathematica temos a região delimitada por 3 : Os vértices de mi, ou seja, os pontos e 1 = (1, 0,..., 0, 0),..., e mi = (0, 0,..., 0, 1), dão, respectivamente, probabilidade 1 às estratégias puras s i1, s i2,..., s imi. Desta maneira,

16 16 Figura 2.1: Região delimitada por 3. consideramos a distribuição de probabilidade e k como a estratégia mista que representa a estratégia pura s ik do jogador g i. O espaço de todos os perfis de estratégia mista é = m1 m2... mn, denominado espaço de estratégia mista. Como no caso de estratégias puras, usaremos a notação p i para representar as estratégias de todos os jogadores, com exceção do jogador g i. Cada perfil de estratégia mista p = (p 1, p 2,..., p n ) determina um payoff esperado. p = (p 1, p 2,..., p n ) = (p 11, p 12,..., p 1m1 ; p 21, p 22,..., p 2m2 ;...; p n1,..., p nmn ), então u i (p) = m 1 m 2 j 1 =1 j 2 =1... m n j n=1 ( n ) (p k )(j k )u i (s 1j1, s 2j2,..., s njn ) k=1 é o payoff esperado para o perfil de estratégia mista p. Mais precisamente, se

17 17 Exemplo 2.6: Voltemos ao jogo de combinar moedas (matching pennies). Dois jogadores exibem, ao mesmo tempo, a moeda que cada um esconde em sua mão. Se ambas as moedas apresentam cara ou coroa, o segundo jogador dá sua moeda para o primeiro. Se uma das moedas apresenta cara, enquanto a outra apresenta coroa, é a vez do primeiro jogador dar sua moeda para o segundo. A matriz de payoffs do jogo é g 1 /g 2 s 21 s 22 s 11 (+1,-1) (-1,+1) s 12 (-1,+2) (+1,-1) Suponha que g 1 escolha a distribuição de probabilidade p 1 = (1/4, 3/4) e g 2 escolhe p 2 = (1/3, 2/3), então os payoffs esperados associados ao perfil de estratégia mista p = (p 1, p 2 ) = (1/4, 3/4, 1/3, 2/3) são dados por u 1 (p) = ( (p k )(j k )u 1 (s 1j1, s 2j2 )) = p 11 (p 21 u 1 (s 11, s 21 ) + p 22 u 1 (s 11, s 22 )) + p 12 (p 21 u 1 (s 12, s 21 ) j 1 =1 j 2 =1 k=1 + p 22 u 1 (s 12, s 22 )) = 1/4(1/3(+1) + 2/3( 1)) + 3/4(1/3( 1) + 2/3(+1)) = 1/6 e, analogamente, u 2 (p) = ( (p k )(j k )u 2 (s 1j1, s 2j2 )) = p 11 (p 21 u 2 (s 11, s 21 ) + p 22 u 2 (s 11, s 22 )) + p 12 (p 21 u 2 (s 12, s 21 ) j 1 =1 j 2 =1 k=1 + p 22 u 2 (s 12, s 22 )) = 1/4(1/3( 1) + 2/3(+1)) + 3/4(1/3(+1) + 2/3( 1)) = 1/ Soluções em Estratégias Mistas Todos os critérios básicos para soluções de jogos em estratégias puras podem ser estendidos para estratégias mistas. Definição 2.3: Dominância Estrita Iterada em estratégias mistas Sejam S (0) i = S i e 0 m i = mi. Defina, de modo recursivo, S (n) i = {s S (n 1) i : p (n 1) mi tal que s i S (n 1) i, u i (p, s i ) > u i (s, s i )},

18 18 e n m i = {p = (p 1, p 2,..., p mi ) mi : k = 1,..., m i, p k > 0 se, e somente se, s ik S (n) i }, onde u i (p, s i ) representa o payoff esperado quando o jogador g i escolhe a estratégia mista p e os demais jogadores escolhem as estratégias mistas correspondentes as estratégias puras dadas por s i. A interseção S i = n=0 Sn i é o conjunto de estratégias puras e mi = {p mi : p mi tal que s i S i, u i (p, s i ) > u i (p, s i )} é o conjunto de todas as estratégias mistas do jogador g i que sobreviveram a técnica de dominância estrita iterada. Definição 2.4: Equilíbrio de Nash em estratégias mistas Um perfil de estratégia mista P* = (p* 1, p* 2,..., p* n ) = m1 m2... mn é um equilíbrio de Nash se, u i (p* i, P* i ) u i (p, P* i ), p mi, isto é, nenhum jogador sente motivação de trocar sua estratégia mista se os demais jogadores não o fizerem. Exemplo 2.7: No dilema dos prisioneiros, o perfil de estratégia mista P* = (p* 1, p* 2 ) = (1, 0; 1, 0) é um equilíbrio de Nash, pois dada a definição acima temos: u 1 (p, p* 2 ) = u 1 (p, 1 p; 1, 0) = 5p 10 5 = u 1 (1, 0; 1, 0) = u 1 (p* 1, p* 2 ), p = (p, 1 p) 2, e u 2 (p* 1, q) = u 2 (1, 0; q, 1 q) = 5q 10 5 = u 2 (1, 0; 1, 0) = u 2 (p* 1, p* 2 ), p = (q, 1 q) 2.

19 19 Observações: a) Observe que este equilíbrio corresponde ao equilíbrio em estratégias puras s*=(conf essar, conf essar), isto é, em estratégias mistas o perfil P* = (p* 1, p* 2 ) = (1, 0; 1, 0) é um equilíbrio de Nash para o dilema dos prisioneiros e em estratégias puras o perfil s*=(conf essar, conf essar) é um equilíbrio de Nash para o dilema dos prisioneiros. b) Na batalha dos sexos os equilíbrios de Nash em estratégias mistas são (1, 0; 1, 0) e (0, 1; 0, 1), correspondentes aos equilíbrios de Nash em estratégias puras (f utebol, f utebol) e (cinema, cinema), respectivamente. Mostraremos mais adiante que tanto em a) quanto em b), os equilíbrios de Nash citados são únicos. Como vimos no jogo de combinar moedas no item (d) do Exemplo 2.4, existem jogos que não possuem equilíbrios de Nash em estratégias puras e, até agora, todos os jogos apresentados nos exemplos possuem pelo menos um equilíbrio de Nash em estratégias mistas. Uma pergunta natural surge sobre a existência de soluções: A existência de equilíbrios de Nash em estratégias mistas é um resultado geral ou não? A resposta é SIM! Nos dois capítulos seguintes apresentaremos dois teoremas de existência: o Teorema Minimax de Von Neumann para jogos de soma zero com dois jogadores e o Teorema de Equilíbrios de Nash para jogos gerais.

20 Capítulo 3 Teorema Minimax de Von Neumann Antes de iniciarmos o capítulo, vamos dar um exemplo motivador para o conteúdo que será apresentado adiante. Exemplo 3.1: Jogos retangulares [20] Modelo do jogo: O jogador P 1 escolhe um número do conjunto M = {1, 2,..., m}. Seu adversário, P 2, escolhe um número do conjunto N = {1, 2,..., n}. Sejam i M e j N, respectivamente, as escolhas de P 1 e P 2. As regras do jogo definem então, um certo pagamento a ij de P 2 a P 1. Se a ij for positivo, representará realmente um pagamento (no sentido usual do vocábulo) de P 2 a P 1, e se a ij for negativo, equivalerá a um pagamento de P 1 a P 2. Os pagamentos relativos a todas as escolhas possíveis de P 1 e P 2 podem ser apresentados em uma matriz retangular. De posse desse modelo, podemos fazer algumas considerações: i) Veja que o modelo do jogo acima é idêntico a definição apresentada no início do nosso texto sobre o que seria um jogo, porém vista de uma forma mais informal. Para ilustrar o modelo de um jogo retangular temos o jogo chamado Morra (definido na Itália) que retrata a seguinte situação: Cada jogador (P 1 ou P 2 ) levanta 1 ou 2 dedos, e simultaneamente prevê a escolha de seu adversário. Se ambos acertam ou erram, o jogo é NULO. Se apenas um acerta, então este recebe um número de unidades monetárias igual ao total de dedos levantados. Representamos por (a, b) a escolha do jogador que levantar a dedos (a = 1 ou a = 2) e previu que seu adversário levantasse b dedos (b = 1 ou b = 2). 20

21 21 Daí, temos a seguinte matriz retangular (que é no nosso texto a matriz de payoffs): P 1 /P 2 (1,1) (1,2) (2,1) (2,2) (1,1) (1,2) (2,1) (2,2) ii) Veja também que pela matriz acima, as estratégias tanto de P 1 quanto de P 2 estão no conjunto S = {(1, 1), (1, 2), (2, 1), (2, 2)}, o que era esperado pelo modelo do jogo. Além disso, veja que a soma algébrica dos pagamentos é NULA, ou seja, o jogo Morra é um jogo de duas pessoas e de soma nula, o qual daremos a definição mais adiante. iii) Agora, imagine se quisermos buscar em um jogo retangular o melhor recurso para cada jogador, independente da ação de seu oponente. De que modo buscar esse melhor recurso? Podemos então tentar buscar uma estratégia segura, que garanta a cada jogador o melhor resultado. Considere a matriz retangular: P 1 /P Observe que para P 1 os resultados mais desfavoráveis são os mínimos pagamentos de cada linha (-1, -3 e 1), e para P 2 os máximos pagamentos de cada coluna (1, 4, 5 e 6). Logo, P 1 correrá menor risco jogando na linha correspondente ao máximo dos mínimos, o que assegura o ganho mínimo 1. P 2 terá, igualmente, menor risco jogando na coluna correspondente ao mínimo daqueles máximos, o que evita pagar mais do que 1. Ora, podemos ver que a entrada a 31 = 1 da matriz é um ponto especial, isto é, define o menor risco de perda para os dois jogadores. Veremos adiante que o ponto 1 é chamado de ponto de sela (daremos uma definição formal sobre tal ponto) e é fundamental em estratégias puras para obter um equilíbrio de Nash no jogo, pois teremos um teorema

22 22 que garante o fato de que dado um ponto de sela da matriz, então temos um equilíbrio de Nash no jogo. Nesse caso, (3,1) é um equilíbrio de Nash do jogo (P 1 jogar na linha 3 e P 2 jogar na coluna 1). Mesmo sem definirmos precisamente um ponto de sela, surge uma questão: E o caso onde as matrizes retangulares não possuem ponto de sela? exemplo: Neste caso recorremos à recursos aleatórios, ou seja, a probabilidade. Vejamos um Considere o jogo retangular definido pela matriz: P 1 /P Veja que a matriz acima não possui um ponto de sela como o ponto 1 do exemplo anterior, pois o mínimo valor de cada linha (-2 na primeira e -4 na segunda) não é o máximo valor de sua coluna. Desse modo, nenhuma estratégia pura é conveniente para cada jogador, por exemplo P 1 escolhe a estratégia pura 1 (joga na primeira linha). Então P 2 terá proveito dessa escolha empregando a estratégia pura 2 (jogando na segunda coluna). Então, temos um objetivo no jogo: Cada jogador deve fazer seu plano de modo que o adversário não descubra sua escolha! Suponha que P 1 e P 2 usem recursos aleatórios: As probabilidades de P 1 jogar nas linhas 1 e 2 são respectivamente x e 1 x, e as probabilidades de P 2 jogar nas colunas 1 e 2 são respectivamente y e 1 y. Considere então, a função esperança de P 1 (que é a mesma função utilidade que define o payoff de um jogador em estratégia mista) E(X, Y ) = n m a ij x i y j, onde X = (x, 1 x) e Y = (y, 1 y). j=1 i=1 Logo,

23 23 E(X, Y ) = 2xy 2x(1 y) 4y(1 x)+6(1 x)(1 y) = 14(x 5/7)(y 4/7)+2/7. Se P 1 usar a probabilidade x = 5/7 terá a certeza de seu ganho aleatório ser igual a 2/7, ou seja, não ser inferior a 2/7 qualquer que seja a escolha de P 2. Se P 2 utilizar a probabilidade y = 4/7, sua perda aleatória será 2/7, e por consequência, não superior a 2/7. Ou seja, P 1 usa a estratégia mista (5/7,2/7) e P 2 usa a estratégia mista (4/7,3/7) para termos o menor risco de perda para ambos os jogadores. Observação: Perceba que nesse exemplo fica clara a definição de estratégias mistas dada no Capítulo 2 e como ela funciona para os jogadores envolvidos. Além disso, considerando a definição de equilíbrio de Nash para estratégias mistas, o ponto p* = ((5/7,2/7);(4/7,3/7)) é um equilíbrio de Nash do jogo, visto que a função utilidade u i (p*) é equivalente a E(p*) para cada jogador na situação do acima. Com essas considerações, vamos agora falar sobre jogos de soma constante com dois jogadores. 3.1 Jogos de soma constante com dois jogadores Definição 3.1: Jogos de soma constante com dois jogadores Um jogo de soma constante com dois jogadores é um jogo com dois jogadores denominados jogador linha e jogador coluna, com estratégias S joglinha = {1, 2,..., m} e S jogcoluna = {1, 2,..., n}, e a matriz de payoff Jog. linha/jog. coluna n 1 (a 11, b 11 ) (a 12, b 12 )... (a 1n, b 1n ) 2 (a 21, b 21 ) (a 22, b 22 )... (a 2n, b 2n ) m (a m1, b m1 ) (a m2, b m2 )... (a mn, b mn ) Satisfazendo a ij + b ij = c (constante), i = 1,..., m, j = 1,..., m. No caso em que a constante c é zero, dizemos que o jogo tem soma zero.

24 24 Em termos de estratégias mistas, se p = (p 1,..., p m ) m é uma distribuição de probabilidades para as estratégias puras do jogador linha e q = (q 1,..., q n ) n é uma distribuição de probabilidades para as estratégias puras do jogador coluna, então o payoff esperado para o jogador linha é m n [ ] u l (p, q) = p i q j a ij = p 1 p 2... p m i=1 j=1 1 m = A q 1 q 2., q n n 1 isto é, u l (p, q) = p T Aq com A = a 11 a a 1n a 21 a a 2n a n1 a n2... a nn m n Analogamente, o payoff esperado para o jogador coluna é dado por: u c (p, q) = p T Bq, com B = b 11 b b 1n b 21 b b 2n b n1 b n2... b nn m n Como o jogo tem soma constante, c c... c c c... c A + B = C = c c... c m n = c 1 = , m n onde, 1 denota a matriz m n formada com 1 em todas as suas entradas. Sendo assim, podemos ver que u c (p, q) = p T Bq = p T (c 1 A)q = cp T 1 q p T Aq = c u l (p, q), onde na última igualdade usamos que p T 1 q = 1 pois m p i = 1 e i=1 m q j = 1. j=1

25 Equilíbrio de Nash em estratégias puras Definição 3.2: Ponto de sela Dizemos que um elemento a ij de uma matriz A é um ponto de sela de A se a ij a il, l = 1,..., n (Mínimo em sua linha), e Teorema 3.1: a ij a kj, k = 1,..., n (Máximo em sua coluna). O elemento a ij é um ponto de sela de uma matriz A, se, e somente se, o par (i, j) é um equilíbrio de Nash em estratégias puras para o jogo. Demonstração: i) Seja a ij um ponto de sela da matriz A. Como a ij é máximo em sua coluna, vale que u l (i, j) = a ij a kj = u l (k, j), k = 1,..., m. Isto é, o jogador linha não pode aumentar o seu payoff se o jogador coluna mantiver a escolha da coluna j. Por outro lado, como a ij é mínimo em sua linha, vale que u c (i, j) = b ij = c a ij c a il = b il = u c (i, l), l = 1,..., m. Isto é, o jogador coluna não pode aumentar o seu payoff se o jogador linha mantiver a escolha da linha i. Isto mostra que o perfil de estratégia pura (i, j) é um equilíbrio de Nash do jogo. ii) Agora, seja (i, j) um equilíbrio de Nash. A partir das considerações feitas em i) e sabendo da definição dada em estratégia pura para que um perfil seja equilíbrio de Nash, é fácil ver que a ij é máximo em sua coluna e mínimo em sua linha e que, portanto, a ij é um ponto de sela da matriz A. Teorema 3.2: Se a ij e a rs são dois pontos de sela da matriz A, então a is e a rj também são pontos de sela da matriz A, e a ij = a rs = a is = a rj.

26 26 Demonstração: Considere a matriz: a ij... a is..... a rj... a rs. Como a ij e a rs são pontos de sela, sabemos que eles são mínimos em suas respectivas linhas e máximos em suas respectivas colunas. Assim, a ij a is a rs e a ij a rj a rs, e portanto, a ij = a is = a rj = a rs. Observe que a is é mínimo em sua linha, pois a ij = a is é mínimo da mesma linha e que a is é máximo em sua coluna, pois a rs = a is é máximo da mesma coluna. Analogamente, a rj é mínimo em sua linha (pois a rs = a rj é mínimo da mesma linha) e a rj é máximo em sua coluna (pois a rj = a ij é máximo da mesma coluna). Portanto, a is e a rj são pontos de sela de A. Definição 3.3: payoff mínimo O payoff mínimo do jogador linha, se ele escolher a linha k, é dado por a k = min (1 l n) a kl. Analogamente, o payoff mínimo do jogador coluna, se ele escolher a coluna l, é dado por c a l, onde a l = max (1 k m) a kl. Assim, podemos definir V l (A) = max (1 k m) a k = max (1 k m) min (1 l n) a kl, e V c (A) = min (1 l n) a l = min (1 l n) max (1 k m) a kl.

27 27 Teorema 3.3: Para toda matriz A, tem-se V c (A) V l (A). Demonstração: Temos que k = 1,..., m e j = 1,..., n, a kj min (1 l n). Assim, max (1 k m) a kj max (1 k m) min (1 l n) a kl = V l (A), j = 1,..., n. Consequentemente, V c (A) = min (1 l n) max (1 k m) a kl V l (A) = max (1 k m) min (1 l n) a kl. O teorema abaixo caracteriza a existência de equilíbrio de Nash. Teorema 3.4: Uma matriz A tem um ponto de sela se, e somente se, V l (A) = V c (A). Demonstração: i) Seja a ij um ponto de sela da matriz A, ou seja, a ij = min (1 l n) a il = a i. Como V l (A) = max (1 k m) a k, fica claro que V l (A) a i = a ij. Por outro lado, a ij = max (1 k m) a kj = a j e como V c (A) = min (1 l n) a l, segue que V c(a) a j = a ij. Portanto, V c (A) a ij V l (A), mas pelo teorema anterior, V c (A) V l (A), ou seja, V c (A) = V l (A). ii) Como V l (A) = max (1 r m) a r, existe uma linha i tal que V l (A) = a i. Como, por sua vez, a i = min (1 s n) a is, existe uma coluna l tal que a i = a il. Analogamente, como V c (A) = min (1 s n) a s, existe uma coluna j tal que V c (A) = a j. Como a j = max (1 r m) a rj, existe uma linha k tal que a j = a kj. Assim, V c (A) = a j = a kj. Pela hipótese inicial (V l (A) = V c (A)) temos que a il = a i = V l (A) = V c (A) = a j = a kj. Afirmação: a ij é um ponto de sela de A. De fato, a ij a j = a i a is, s = 1,..., n, isto é, a ij é o mínimo de sua linha. Por outro lado, a ij a i = a j a rj, r = 1,..., m, isto é, a ij é o máximo de sua coluna.

28 28 Portanto, a ij é um ponto de sela de A. Decorre imediatamente do teorema acima a existência de equilíbrio de Nash: Um jogo de dois jogadores com soma constante definido pela matriz de payoffs A do jogador linha tem um equilíbrio de Nash em estratégias puras se, e somente se, V l (A) = V c (A). 3.3 Equilíbrio de Nash em estratégias mistas Defina, V l (A) = max (p m) min (q n) p T Aq e V c (A) = min (q n) max (p m) p T Aq. Com a definição acima, o teorema da seção anterior sobre a existência de equilíbrio de Nash para estratégias puras pode ser estendida para estratégias mistas. É o que veremos a seguir. Teorema 3.5: Para toda matriz A, tem-se V c (A) V l (A). Demonstração: Temos que, p m, p T Aq min (y n) p T Ay. Assim, max (p m) p T Aq max (p m) min (y n) p T Ay = V l (A) daí, temos que: V c (A) = min (q n) max (p m) p T Aq max (p m) min (y n) p T Ay = V l (A).

29 29 O teorema a seguir caracteriza a existência de equilíbrio de Nash em estratégias mistas em termos de V l e V c. Teorema 3.6: Um perfil de estratégia mista (p*, q*) é um equilíbrio de Nash de um jogo com dois jogadores com soma constante definido pela matriz de payoffs A do jogador linha, se, e somente se, V l (A) = V c (A) = p* T Aq*. Demonstração: i) Se (p*, q*) é um equilíbrio de Nash, então p* T Aq* = u l (p*, q*) u l (p, q*) = p T Aq*, p m. Em particular, p* T Aq* = max (p m) p T Aq* min (y n) max (p m) p T Ay = V c (A). Vale também que, p* T Aq* = c u c (p*, q*) c u c (p*, q) = p* T Aq, q n. Em particular, p* T Aq* = min (q n) p* T Aq max (x m) min (q n) x T Aq = V l (A). Desta maneira, V l (A) V c (A). V c (A) = V l (A). Como, pelo teorema anterior, V c (A) V l (A), concluímos que ii) Como V l (A) = max (p m) min (q n) p T Aq, existe p* m tal que Analogamente, V l (A) = min (q n) p* T Aq. Como V c (A) = min (q n) max (p m) p T Aq, existe q* m tal que V c (A) = max (p m) p T Aq*. Temos por hipótese que V l (A) = V c (A), ou seja,

30 30 V l (A) = min (q n) p* T Aq = V c (A) = max (p m) p T Aq*. Afirmamos então que (p*, p*) é um equilíbrio de Nash do jogo. De fato, u l (p, q*) = p* T Aq* min (q n) p* T Aq = max (p m) p T Aq* x T Aq* = u l (x, q*), x m. Por outro lado, u c (p*, q*) = c p* T Aq* c max (p m) p T Aq* = c min (q n)p* T Aq c p* T Ay = u c (p*, y), y n. Desta maneira, (p*, q*) é um equilíbrio de Nash do jogo.

31 O Teorema Minimax de Von Neumann Antes de enunciarmos o teorema Minimax, vale ressaltar que ele diz o seguinte: Para jogos de dois jogadores com soma zero, V l (A) = V c (A) sempre vale. Assim, pelo teorema anterior sobre a existência de equilíbrio de Nash em estratégias mistas, segue-se que para esta classe de jogos, sempre existe pelo menos um equilíbrio de Nash em estratégias mistas. Teorema Minimax de Von Neumann: Para todo jogo de soma zero com dois jogadores, representado pela matriz de payoffs A do jogador linha, sempre existe um perfil de estratégia mista (p*, q*) m n satisfazendo V l (A) = max (p m) min (q n) p T Aq = p* T Aq* = min (q n) max (p m) p T Aq = V c (A). Em particular, (p*, q*) é um equilíbrio de Nash do jogo. Para demonstrarmos o teorema, vamos usar o teorema de dualidade da teoria de programação linear. Vale ressaltar que um problema de programação linear é um um problema de otimização com função objetivo e restrições lineares, onde: i) Problema Primal: Maximizar b T y, sujeito a Ay c, y 0, onde as desigualdades devem ser interpretadas componente a componente. ii) Problema Dual: A cada problema de programação linear (Problema primal) podemos associar um outro problema de otimização (Problema dual): Minimizar c T x, sujeito a x T A b T, x 0.

32 32 Teorema da dualidade em programação linear: a) O problema primal possui uma solução, se, e somente se, o problema dual possui uma solução. b) Se y* é solução do problema primal e x* é solução do problema dual, então c T x* = b T y*. Obs: Uma demonstração do Teorema da dualidade pode ser encontrada em [12]. Com as considerações feitas acima, vamos a demonstração do Teorema Minimax. Demonstração: Sem perda de generalidade, todas as entradas da matriz de payoffs A do jogador linha são positivas. Caso contrário, basta substituir A por A = A + D e B = A por B = D+B, onde D = d 1, com d > max (1 i m) max (1 j n) a ij. Observe que A+B = 0 (isto é, o jogo definido pelas matrizes A e B tem soma zero) e que (p*, q*) é um equilíbrio de Nash para o jogo definido pela matriz A se, e somente se, (p*, q*) é um equilíbrio de Nash para o jogo definido pela matriz A. e b = (1, 1,..., 1) T. Considere os problemas de programação linear: Sejam c = (1, 1,..., 1) T i) Problema Primal: Maximizar b T y, sujeito a Ay c, y 0. ii) Problema Dual: Minimizar c T x, sujeito a x T A b T, x 0. Passo 1 da demonstração: O problema dual possui solução. Como as entradas da matriz A são positivas, o conjunto admissível X = {x R m : x T A b T, x 0} é não vazio. como: Por outro lado, como c = (1, 1,..., 1) T, a função objetivo do problema é escrita x = (x 1,..., x m ) c T x = x 1 + x x m.

33 33 Assim, o problema dual consiste em encontrar o ponto do conjunto X mais próximo da origem segundo a norma da soma. 1. O problema certamente possui solução, pois, se p X, então podemos compactificar o conjunto admissível incluindo a restrição x 1 p 1 e, com isso, podemos usar o Teorema de Weierstrass para garantir a existência de um mínimo. Passo 2 da demonstração: Construção do equilíbrio de Nash. Sabemos que o problema primal possui solução pelo teorema da dualidade, e mais ainda, se x* é solução do problema dual e y* é solução do problema primal, então c T x* = b T y*. Seja θ = c T x* = b T y* (que é > 0 pois (0,0,...,0) não é admissível) e defina p* = x* θ e q* = y* θ. Afirmação: (p*, q*) é um equilíbrio de Nash do jogo. De fato, p* m e q* n, pois p* 0 (já que x* θ > 0), q* 0 (já que y* θ > 0), e m p i = i=1 m i=1 x i θ = ct x θ = θ m θ = 1 e q j = j=1 n j=1 y i θ = bt y θ = θ θ = 1. Agora, como x* T A b T, temos que q n, x* T Aq b T q = x* = p*θ. Desta maneira, n q j = 1. Mas j=1 p* T Aq θ = p* T Aq*, q n. Consequentemente, u c (p*, q*) = p* T Aq* p* T Aq = u c (p*, q), q n. Portanto, o jogador coluna não pode aumentar o seu payoff esperado trocando q* por q, se o jogador linha mantiver a escolha de p*. Analogamente, Como Ay c, temos que p m, p T Ay p T c = Desta maneira, m p i = 1. Mas y* = q*θ. i=1

34 34 p*aq* θ = p* T Aq*, p m. Consequentemente, u l (p*, q*) = p* T Aq* p T Aq* = u l (p, q*), p m. Portanto, o jogador linha não pode aumentar o seu payoff esperado trocando p* por p, se o jogador linha mantiver a escolha de q*. Além de estabelecer a existência de equilíbrio de Nash, a demonstração sugere como calculá-los: Resolvendo dois problemas de programação linear. Exemplo 3.1: O governo deseja vacinar seus cidadãos contra um certo vírus da gripe. Este vírus possui dois sorotipos, sendo que é desconhecida a proporção na qual os dois sorotipos ocorrem na população do vírus. Foram desenvolvidas duas vacinas onde a eficácia da vacina 1 é de 85% contra o sorotipo 1 e de 70% contra o sorotipo 2. A eficácia da vacina 2 é de 60% contra o sorotipo 1 e de 90% contra o sorotipo 2. A questão é: Buscando a melhor eficácia no combate contra o vírus, é possível encontrar um equilíbrio de Nash para a situação acima? Esta situação pode ser modelada como um jogo de de soma zero com dois jogadores, onde o jogador linha L (o governo) deseja fazer a compensação (a fração dos cidadãos resistentes ao vírus) o maior possível e o jogador coluna C (o vírus) deseja fazer a compensação menor possível. Temos, então, a seguinte matriz de payoffs: Governo/Vírus Sorotipo 1 Sorotipo 2 Vacina 1 (85/100,-85/100) (70/100,70/100) Vacina 2 (60/100,-60/100) (90/100,-90/100) Para encontrar um equilíbrio de Nash, devemos resolver os seguinte problemas de programação linear: i) Problema Primal:

35 35 Maximizar y 1 + y 2, sujeito a [ 85/100 70/100 60/100 90/100 ] [ y 1 y 2 ] [ 1 1 ], [ y 1 y 2 ] [ 0 0 ]. ii) Problema Dual: Minimizar x 1 + x 2, sujeito a [x 1 x 2 ] [ 85/100 70/100 60/100 90/100 ] [1 1], [ x 1 x 2 ] [ 0 0 ]. Isto é, i) Problema Primal: Maximizar y 1 + y 2, sujeito a 17y y 2 = 20; 6y 1 + 9y 2 = 10; y 1 0; y 2 0;, e ii) Problema Dual: Maximizar y 1 + y 2, sujeito a 17x x 2 = 20; 7x 1 + 9x 2 = 10; x 1 0; x 2 0; Com o auxílio de um software Mathematica, calculamos as soluções: Solução do problema dual: x* = (20/23, 10/23) (conforme Figura 3.2); Solução do problema primal: y* = (40/69, 50/69) (conforme Figura 3.1). Temos que θ = x* 1 + x* 2 = y* 1 + y* 2 = 30/23, e desta maneira o único equilíbrio de Nash para o problema é dado pelo ponto (p*, q*), onde p* = x* θ = (2/3, 1/3) e q* = y* θ = (4/9, 5/9).

36 36 Temos as soluções dadas nas figuras abaixo: Figura 3.1: Solução do problema primal para o exemplo Figura 3.2: Solução do problema dual para o exemplo

37 Capítulo 4 Teorema de Equilíbrio de Nash O Teorema Minimax abrange apenas a classe dos jogos de soma zero com dois jogadores. Vamos mostrar neste capítulo que: Todo jogo definido por matrizes de payoffs possui um equilíbrio de Nash em estratégias mistas. Tal resultado é devido a John Nash e faz uso do teorema do ponto fixo de Brouwer que será visto adiante [10]. Teorema 4.1: Ponto fixo de Brouwer Se é um subconjunto compacto e convexo de um espaço euclidiano de dimensão finita e F : é uma função contínua, então F possui um ponto fixo em, isto é, existe p* tal que F (p*) = p*. Com as notações das Seções 2.1 e 2.2, estabeleceremos uma sequência de teoremas que fornecem caracterizações alternativas para um equilíbrio de Nash. Teorema 4.2: Para cada i = 1,..., n e j = 1,..., m i, defina a função z ij : R p z ij (p) = u i (s ij, p i ) u i (p i, p i ), (4.1) 37

38 que mede o ganho ou perda do jogador g i quando ele troca a distribuição de probabilidade p i pela estratégia pura s ij. 38 Temos que p* é um equilíbrio de Nash se, e somente se, z ij (p*) 0, para cada i = 1,..., n e j = 1,..., m i. Demonstração: i) Se p* = (p* i, p i ) é um equilíbrio de Nash, então u i (p*, p* i ) u i (s ij, p* i ), para cada i = 1,..., n e j = 1,..., m i. Consequentemente, z ij (p*) = u i (s ij, p* i ) u i (p* i, p* i ) 0. ii) Se z ij (p*) = u i (s ij, p* i ) u i (p* i, p* i ) 0, para cada i = 1,..., n e j = 1,..., m i, então u i (s ij, p* i ) = u i (e j, p* i ) u i (p* i, p* i ), para cada i = 1,..., n e j = 1,..., m i, onde e j é o vetor canônico. Temos que mostrar: p i = (p i1,..., p i m i ) mi, u i (p i, p* i ) u i (p* i, p* i ). Mas por x u i (x, p* i ) ser um funcional linear, temos m i m i m i u i (p i, p* i ) = u i ( p ik e k, p* i ) = p ik u i (e k, p* i ) p ik u i (p* i, p* i ) = k=1 k=1 k=1 = 1 u i (p* i, p* i ) = u i (p* i, p* i ), com p i m. Teorema 4.3 Para cada i = 1,..., n e j = 1,..., m i, defina a função g ij : R p g ij (p) = max{0, z ij (p)}, (4.2)

39 Temos que p é um equilíbrio de Nash se, e somente se, g ij (p) = 0, i = 1,..., n e j = 1,..., m i. 39 Demonstração: Segue imediatamente do teorema anterior. Teorema 4.4: Defina a aplicação F : = m1 m2... mn = m1 m2... mn p = (p 1, p 2,..., p n ) F (p) = (y 1 (p),..., y n (p))}, (4.3) onde y i (p) = (y i1 (p), y i2 (p),..., y imi (p)), p i = (p i1, p i2,..., p imi ) e y ij (p) = p ij + g ij (p) m i. 1 + g ik (p) k=1 Temos que p* é um equilíbrio de Nash se, e somente se, F (p*) = p*, isto é, se, e somente se, p* é ponto fixo de F. Demonstração: Observe que de fato, F ( ) está contido em pois claramente y ij 0 e m i m i y i k(p) = ( p ik + g ik (p) m i ) = 1 + g ik (p) k=1 k=1 m i k=1 m i p ik + g ik (p) k=1 m i 1 + g ik (p) = m i 1 + g ik (p) k=1 m i 1 + g ik (p) = 1, k=1 k=1 k=1 isto é, cada y i (p) mi.

40 40 i) Se p* é um equilíbrio de Nash, então g ij (p*) = 0 para cada i = 1,..., n e j = 1,..., m i. Desta maneira, y ij (p*) = p ij, para cada i = 1,..., n e j = 1,..., m i, isto é, y i (p*) = p* i para cada i = 1,..., n, ou ainda, F (p ) = p. ii) Suponha que p* = (p* 1, p* 2,..., p* n ) = m1 m2... mn ponto fixo da aplicação F :, isto é, suponha que seja um p ij = p ij +g ij (p*) m i, 1 + g ik (p*) k=1 para cada i = 1,..., n e j = 1,..., m i. Segue-se então que p ij m i k=1 g ik (p*) = g ij (p*), m i para cada i = 1,..., n e j = 1,..., m i. Afirmamos que α = g ik (p*) = 0, de modo que g ik (p*) = 0 para to k = 1,..., m i e i = 1,..., n. De fato: k=1 Se, por absurdo, α > 0, vemos pela relação acima que g ij (p*) > 0 se, e somente se, p ij > 0. Sem perda de generalidade suponha que p i1 > 0, p i2 > 0,..., p il > 0 e p i(l+1) = p i(l+2) =... = p imi = 0. Observe que m i p* i = p ik e k, k=1 onde e i é o i-ésimo vetor da base canônica de R m i. Dado que g ik (p*) > 0 para todo k = 1, 2,..., l, temos que u i (e i, p* i ) > u i (p* i, p* i ), para todo k = 1,..., l. Desta maneira, m i m i l u i (p* i, p* i ) = u i ( p ik e k, p* i ) = p ik u i (e k, p* i ) = p ik u i (e k, p* i ) > k=1 k=1 l p ik u i (p* i, p* i ) = u i (p* i, p* i ) k=1 k=1 k=1 l p ik = u i (p* i, p* i ),

41 41 um absurdo. Isto demonstra que g ij (p*) = 0 para todo j = 1,..., m i e i = 1,..., n, e, assim, p* é um equilíbrio de Nash em estratégias mistas. Teorema 4.5: Equilíbrio de Nash Todo jogo definido por matriz de payoff possui equilíbrio de Nash. Demonstração: A aplicação F : do teorema anterior é contínua e é um conjunto compacto e convexo. Pelo Teorema do ponto fixo, F possui ponto fixo p*. Logo, pelo teorema anterior, p* é um equilíbrio de Nash. Observação: O Teorema 4.4 sugere uma maneira de se calcular os equilíbrios de Nash de um jogo. São soluções do seguinte problema de otimização linear: Minimizar n m i (g ij (p)) 2, i=1 j=1 sujeito a p. Isto de fato faz sentido, pois a soma de quadrados é zero se, e somente se, cada parcela é igual a zero. Exemplo 4.1: Para o dilema dos prisioneiros, (p, q) = (p, 1 p; q, 1 q) 2 2 é um equilíbrio de Nash se (p,q) é solução do problema de otimização Minimizar G(p, q) = (max{0, (-1 + p)(4q + 1)}) 2 +(max{0, p(4q + 1)}) 2 +(max{0, (4p + 1)(-1 + q)}) 2 +(max{0, q(4p + 1)}) 2, sujeito a 0 p 1 e 0 q 1. Com o auxílio do software Mathematica, temos que o equilíbrio de Nash do jogo é (p*, q*) = (1, 0; 1, 0) e, além disso, vemos que é único pela solução na Figura 4.1 abaixo.

42 42 Figura 4.1: Solução para o problema de otimização - Dilema dos prisioneiros. Exemplo 4.2: Para a batalha dos sexos, (p, q) = (p, 1 p; q, 1 q) 2 2 é um equilíbrio de Nash se (p,q) é solução do problema de otimização: Minimizar G(p, q) = (max{0, 5( 1 + p)(3q 1)}) 2 + (max{0, 5p(3q 1)}) 2 + (max{0, 5(3p 2)( 1 + q)}) 2 + (max{0, 5q(3p 2)}) 2, sujeito a 0 p 1 e 0 q 1. Com o auxílio do software Mathematica, temos que os únicos equilíbrios de Nash do jogo são (p*, q*) = (1, 0; 1, 0), (p*, q*) = (0, 1; 0, 1) e (p*, q*) = (2/3, 1/3; 1/3, 2/3).

43 Capítulo 5 A Forma Extensa de um Jogo Como vimos, a forma normal é usada em situações onde os jogadores escolhem sua estratégia simultaneamente ou fazem sem conhecer a estratégia dos outros jogadores. Existem outras situações (por exemplo, no mundo dos negócios ou na política e em alguns jogos de cartas) em que os jogadores tomam suas decisões de forma sequencial, depois de observar a ação que um outro jogador realizou. A forma extensa tem uma estrutura mais adequada para analisar jogos deste tipo, especificando assim quem se move, quando, com qual informação e o payoff ou ganho de cada jogador, ou seja, ela contém toda informação sobre o conflito em questão. Tem-se várias formas de se representar um jogo da forma extensa, por exemplo a Teoria dos Grafos [9], todas elas tentando formalizar a idéia de árvore. No texto, usaremos a representação por alfabetos [8] e palavras. 5.1 Representação de um jogo via alfabetos e árvores Um jogo na forma extensa consiste de um conjunto de jogadores, N = {0, 1, 2,..., n}, um conjunto das ações possíveis de cada jogador e os ganhos de cada um. Definição 5.1: Chamaremos de alfabeto a um conjunto de letras = {a 1, a 2,..., a k }. Denotamos por ao conjunto de palavras que podem ser formadas pelos elementos do alfabeto. Uma árvore sobre é um conjunto T de nós (palavras) 43

Exibir mais