6 Teoria dos Jogos em GAL

6 Teoria dos Jogos em GAL Neste capítulo, relacionaremos os modelos da Teoria dos Jogos às estruturas de GAL, e os conceitos de soluções às fórmulas de GAL. Apesar da maioria dos conceitos da Teoria dos Jogos poder ser modelada utilizando apenas as características de primeira-ordem de GAL, optamos por representar as conseqüências das ações tomadas em cada tipo interação através de estados. Assim, por exemplo, em jogos estratégicos, temos que cada perfil de ações é representado por um estado. Para referenciarmos e denotarmos as ações tomadas, utilizaremos símbolos a i : A i, um para cada jogador i N, que têm suas interpretações variando de acordo com o perfil de ações que o estado representa. A partir daí, as fórmulas para os conceitos de soluções são definidas utilizando estes símbolos. A idéia de tal caracterização é encapsular as conseqüências das interações por estados, objetivando um melhor entendimento sobre os jogos. Este capítulo é dividido da seguinte forma: a seção 6.1 apresenta os jogos estratégicos como estruturas de GAL, bem como os conceitos de equilíbrio de Nash, de ótimo de Pareto, e de equilíbrio de Nash de estratégias mistas como fórmulas de GAL; a seção 6.2 provê duas versões de estruturas de GAL para os jogos extensivos, e ainda as fórmulas de GAL para cada versão dos conceitos de equilíbrio de Nash e de subjogo perfeito. Uma versão está relacionada à versão matricial de um jogo extensivo, enquanto que a outra está relacionada à versão extensiva; os jogos extensivos com informação quase perfeita e imperfeita são apresentados nas seções 6.3 e 6.4, respectivamente; os jogos de coalizões com utilidades transferíveis e o seu principal conceito de solução, core, são representados em GAL na seção 6.5. Alguns diferentes conceitos de soluções são também apresentados; nas duas seções posteriores dois novos modelos são desenvolvidos e representados em GAL com a finalidade de ilustrar como GAL se adapta a novos tipos de jogos e pode prover novos conceitos de soluções de forma intuitiva; e, por fim, na seção 6.8 modelamos jogos de coalizões sem utilidades transferíveis. As provas dos teoremas, que garantem as correspondências entre a Teoria dos Jogos e GAL, são apresentadas no apêndice B, objetivando uma leitura mais suave deste capítulo.

Capítulo 6. Teoria dos Jogos em GAL 111 6.1 Jogo Estratégico em GAL Um jogo estratégico Γ = N, A i, u i pode ser modelado em uma estrutura G Γ de GAL da seguinte forma. Cada perfil de ações a = a i A i do jogo estratégico Γ é mapeado em um estado a da estrutura de G Γ, onde, para cada jogador i N, o símbolo a i : A i designa neste estado a ação a i do jogador i do perfil a que originou o estado, em outras palavras, o símbolo a i é interpretado de forma não-rígida e sua interpretação depende do perfil que originou o estado. As funções de utilidades são definidas como no jogo estratégico e suas interpretações são rígidas 1. A relação é definida com o seu significado usual. Como jogo estratégico é um jogo de apenas um lance, o conjunto inicial dos estados é o conjunto dos estados do jogo, e nenhum jogador pode fazer uma escolha em cada estado, ou seja N e =. Desta forma, o conjunto de ações da estrutura de GAL é o conjunto vazio. A definição formal é apresentada abaixo. Definição 6.1 Um jogo estratégico Γ = N, A i, u i é mapeado em uma estrutura de GAL como segue. A linguagem não-lógica é definida por S, F, P, N, onde S = {A i, R}, temos um sort R para representar as utilidades e para cada jogador i N um sort A i. F = {a i, u i }, temos, para cada jogador i N, um símbolo a i : A i e um símbolo funcional u i : A i R. P = { }, um símbolo predicativo : R R. N = N, o conjunto de jogadores do jogo Γ. A estrutura de GAL G Γ = SE, SE o, CA, D Ai, D R, a i,e, u i,e SE,, N e e SE, onde SE = A, o conjunto de estados é o conjunto dos perfis de estratégias A = A i do jogo estratégico Γ. SE o = A. CA =, o jogo não possui evolução. Cada domínio D Ai é interpretado como o conjunto A i do jogo Γ; e o domínio D R é interpretado como o conjunto de todos os possíveis valores das utilidades de Γ. Note que este conjunto é finito se o jogo é finito. 1 Lembre-se que em uma interpretação rígida a interpretação é a mesma em todos os estados.

Capítulo 6. Teoria dos Jogos em GAL 112 Cada símbolo a i é interpretada no estado e SE como a ação do jogador i de acordo com o perfil de ações a = a 1,..., a i,..., a n do jogo Γ que originou o estado e, i.e. a i,e = a i. Cada símbolo funcional u i é interpretado como a função de utilidade u i do jogo Γ de forma rígida. O símbolo predicativo é interpretado de forma rígida como o predicado maior ou igual. N e =, pois o jogo não tem evolução. Iremos utilizar um abuso de notação e representar um jogo estratégico N, A i, u i como a seguinte estrutura de GAL A, A,, A i, R, a i,a, u i,, com linguagem não-lógica A i, R,a i : A i, u i : A R, : R R, N, onde A = A i é o conjunto dos perfis de estratégias, i é um jogador, e a i,a = a i para cada a = a 1,..., a i,..., a n A. Para exemplificar, considere o exemplo 2.2, Batalha dos Sexos, apresentado na seção 2.1. Representamos novamente este jogo nesta seção utilizando a sua forma matricial na figura 6.1.a. A linguagem não-lógica para este jogo estratégico é {A 1, A 2, R}, {a 1 : A 1, a 2 : A 2, u 1 : A 1 A 2 R, u 2 : A 1 A 2 R}, : R R, {1, 2}. A estrutura de GAL para esta linguagem não-lógica é G BoS = A, A,, A 1, A 2, R, a 1,a, a 2,a, u 1, u 2,,, onde A = { B, B, B, S, S, B, S, S } A 1 = A 2 = {B, S} e R = {0, 1, 2} u 1 B, B = 2, u 1 B, S = 0, u 1 S, B = 0, u 1 S, S = 1, u 2 B, B = 1, u 2 B, S = 0, u 2 S, B = 0, u 2 S, S = 2. a 1, B,B = B, a 2, B,B = B, a 1, B,S = B, a 2, B,S = S, a 1, S,B = S, a 2, S,B = B, a 1, S,S = S, a 2, S,S = S Na figura 6.1.b, apresentamos parte da estrutura de GAL para este exemplo. Os estados são representados pelos círculos que são rotulados com o perfil de ações da qual cada estado foi originado. As interpretações dos símbolos a i são apresentadas dentro dos círculos. Os domínios são apresentados pelos conjuntos logo abaixo dos círculos. Nesta figura, não apresentamos a definição das funções de utilidades. Por exemplo, o perfil de ações B, B é mapeada em um círculo rotulado com B, B no qual os símbolos a 1 e a 2 são interpretadas como B e B, respectivamente.

Capítulo 6. Teoria dos Jogos em GAL 113 B S B S 2,1 0,0 0,0 1,2 a - Representação Matricial a 1 = B a 1 = B a 2 = B a 2 = S B, B B, S a 1 = S a 1 = S a 2 = B a 2 = S S, B S, S R = {0, 1, 2} A 1 = A 2 = {B, S} b G BoS Estrutura de GAL Figura 6.1: Jogo estratégico Batalha dos Sexos. 6.1.1 Fórmula de Equilíbrio de Nash Expressamos equilíbrio de Nash através de uma fórmula de GAL, tal que esta fórmula é satisfeita em um estado se, e somente se, o perfil de ações, que o estado representa, é um equilíbrio de Nash. Sejam A, A,, A i, R, a i,a, u i,, uma estrutura de GAL com linguagem não-lógica A i, R, a i : A i, u i : A R, : R R, N, e v Ai variáveis de sorts A i, onde i N, a A e n é o número de jogadores em N. Uma fórmula de equilíbrio de Nash Equilibrium é definida como segue. v Ai u i a 1,..., a n u i a 1,..., v Ai,..., a n Para jogos com dois jogadores, como no exemplo 2.2, Batalha dos Sexos, temos a seguinte fórmula de equilíbrio de Nash. v A1 u 1 a 1, a 2 u 1 v A1, a 2 v A2 u 2 a 1, a 2 u 2 a 1, v A2 Abaixo iremos demonstrar que B, B é um equilíbrio de Nash. Desta forma, temos que a fórmula de GAL descrita acima é satisfeita no estado B, B. Sejam σ A1 e σ A2 funções de valorações para os sorts A 1 e A 2, respectivamente. G BoS, σ A1, σ A2 = B,B v A1 u 1 a 1, a 2 u 1 v A1, a 2 v A2 u 2 a 1, a 2 u 2 a 1, v A2 def G BoS, σ A1, σ A2 = B,B v A1 u 1 a 1, a 2 u 1 v A1, a 2 veja 6-1 E G BoS, σ A1, σ A2 = B,B v A2 u 2 a 1, a 2 u 2 a 1, v A2 veja 6-2.

Capítulo 6. Teoria dos Jogos em GAL 114 G BoS, σ A1, σ A2 = B,B v A1 u 1 a 1, a 2 u 1 v A1, a 2 6-1 def d 1 {B, S} temos que G BoS, σ A1 v A1 d 1, σ A2 = B,B u 1 a 1, a 2 u 1 v A1, a 2 def d 1 {B, S} temos que u 1 σ A1 v A1 d 1 B, B, a 1, σ A2 B, B, a 2 u 1 σ A1 v A1 d 1 B, B, v A1, σ A2 B, B, a 2 def d 1 {B, S} temos que u 1 B, B u 1 σ A1 v A1 d 1 B, B, v A1, B def u 1 B, B u 1 B, B e u 1 B, B u 1 S, B def 2 2 e 2 0 G BoS, σ A1, σ A2 = B,B v A2 u 2 a 1, a 2 u 2 a 1, v A2 6-2 def d 2 {B, S} temos que G BoS, σ A1, σ A2 v A2 d 2 = B,B u 2 a 1, a 2 u 2 a 1, v A2 def d 2 {B, S} temos que u 2 σ A1 B, B, a 1, σ A2 v A2 d 2 B, B, a 2 u 2 σ A1 B, B, a 1, σ A2 v A2 d 2 B, B, v A2 def d 2 {B, S} temos que u 2 B, B u 2 B, σ A2 v A2 d 2 B, B, v A2 def u 2 B, B u 2 B, B e u 2 B, B u 2 B, S def 1 1 e 1 0 Abaixo é apresentado o teorema que garante o mapeamento de equilíbrio de Nash, tal como descrito acima. A prova do mesmo é encontrada na seção B.1.1 página 204 do apêndice B. Teorema 6.2 Sejam Γ um jogo estratégico, a = a i um perfil de ações de Γ, G Γ uma estrutura de GAL para Γ como definido na seção 6.1, e α uma fórmula de Equilíbrio de Nash como definido acima. a é um equilíbrio de Nash em Γ G Γ = a α

Capítulo 6. Teoria dos Jogos em GAL 115 Podemos utilizar apenas as características de uma linguagem de primeiraordem para caracterizar o conceito de equilíbrio de Nash. Abaixo apresentamos uma fórmula que é verdadeira se, e somente se, existe um perfil de ações que é um equilíbrio de Nash. Note que a fórmula abaixo não é dependente de uma estrutura temporal. G Γ = v A 1... v A n v Ai u i va 1,..., va n u i va 1,..., v Ai,..., va n 6.1.2 Fórmula de Ótimo de Pareto A idéia da representação de ótimo de Pareto como uma fórmula de GAL é semelhante a definição da fórmula de equilíbrio de Nash apresentada na seção 6.1.1. Sejam v Ai variáveis de sorts A i. Define-se uma fórmula de ótimo de Pareto como segue. v A 1... v An u i v A1,..., v An u i a 1,..., a n u i v A1,..., v An > u i a 1,..., a n Para um jogo estratégico de dois jogadores, como no exemplo 2.3, Dilema do Prisioneiro, temos a seguinte fórmula de equilíbrio de Pareto. v A1 v A1 u1 v A1, v A2 u 1 a 1, a 2 u 2 v A1, v A2 u 2 a 1, a 2 u 1 v A1, v A2 > u 1 a 1, a 2 u 2 v A1, v A2 > u 2 a 1, a 2 Para o exemplo 2.3, Dilema do Prisioneiro, temos que a fórmula acima é satisfeita no estado NC, NC. Abaixo é apresentado o teorema que garante o mapeamento de ótimo de Pareto, tal como descrito acima. A prova do mesmo é encontrada na seção B.1.2 página 205 do apêndice B. Teorema 6.3 Sejam Γ um jogo estratégico, a = a i um perfil de estratégias de Γ, G Γ uma estrutura de GAL para Γ como definido na seção 6.1, e α uma fórmula de ótimo de Pareto como definido acima. a é um ótimo de Pareto em Γ G Γ = a α Assim como na seção 6.1.1, podemos utilizar apenas lógica de primeiraordem para caracterizar ótimo de Pareto.

Capítulo 6. Teoria dos Jogos em GAL 116 6.1.3 Fórmula de Equilíbrio de Nash de Estratégias Mistas Como o conceito de equilíbrio de Nash de estratégias mistas utiliza, para cada jogador i N, um conjunto de estratégias mistas Ai, um conjunto de estratégias degeneradas Ξ Ai, e uma função de utilidade U i calculada em função de um perfil de estratégias mistas τ i, adicionamos estes conjuntos e funções à estrutura de GAL de um jogo estratégico. Dito isto, definimos um jogo estratégico como A, A,, A i, Ai, Ξ Ai, R, a i,a, u i, U i,, com linguagem não-lógica A i, R, a i : A i, u i : A R, U i : R, : R R, N, onde A = A i é o conjunto dos perfis de ações, i é um jogador, e = Ai, e para cada a = a 1,..., a i,..., a n A, temos a i,a = a i. Como o conceito de equilíbrio de estratégias mistas é definido sobre as estratégias mistas e não utilizamos símbolos para representá-los a cada estado, utilizamos variáveis livres para caracterizar equilíbrio de Nash de estratégias mistas. Assim, a fórmula de equilíbrio de Nash de estratégia mistas, que tem variáveis livres v Ai, é um equilíbrio de Nash de estratégias mistas se, e somente se, existem funções de valorações σ Ai que tornam a fórmula verdadeira. Sejam v Ai variáveis de sorts Ai, e v ΞAi variáveis de sorts Ξ Ai, uma fórmula de equilíbrio de Nash de estratégias mistas é definido como segue. de GAL. v ΞAi U i v A1,..., v U A n iv A1,..., v ΞAi,..., v A n Note que aqui estamos utilizando apenas a linguagem de primeira-ordem Para jogos com dois jogadores como no exemplo 2.2, Batalha dos Sexos, temos a seguinte fórmula de equilíbrio de Nash. vξa1 U 1v A1, v A2 U 1v ΞA1, v A2 v ΞA2 U 2 v A1, v A2 U 2 v A1, v ΞA2 No exemplo 2.2, Batalha dos Sexos, a estrutura de GAL G BoS veja a figura 6.1.b com as funções de valoração σ A1 e σ A2, onde σ A1 v A1 = 2, 1 e σ 3 3 A2 v A2 = 1, 2 temos que 3 3 G BoS, σ A1, σ A2 = v Ξ A1 U 1 v A1, v A2 U 1 v ΞA1, v A2 v ΞA2 U 2 v A1, v A2 U 2 v A1, v ΞA2 def G BoS, σ A1, σ A2 = v ΞA1 U 1 v A1, v A2 U 1 v ΞA1, v A2 prova 6-3 E G BoS, σ A1, σ A2 = v ΞA2 U 2 v A1, v A2 U 2 v A1, v ΞA2 prova 6-4

Capítulo 6. Teoria dos Jogos em GAL 117 G BoS, σ A1, σ A2 = v ΞA1 U 1 v A1, v A2 U 1 v ΞA1, v A2 6-3 def d 1 { 1, 0, 0, 1 } temos que G BoS, σ A1 v ΞA1 d 1, σ A2 = U 1 v A1, v A2 U 1 d 1, v A2 def d 1 { 1, 0, 0, 1 } temos que U 2 1 3, 1 3, 1 3, 2 3 U1 d1, 1 3, 2 3 def U 2 1 3, 1 3, 1 3, 2 3 U1 1, 0, 1 3, 3 2 E 2 U1 3, 1 3, 1 3, 2 3 U 1 0, 1, 1 3, 2 3 G BoS, σ A1, σ A2 = v ΞA2 U 2 v A1, v A2 U 2 v A1, v ΞA2 6-4 def d 2 { 1, 0, 0, 1 } temos que G BoS, σ A1, σ A2 v ΞA2 d 2 = U 2 v A1, v A2 U 2 v A1, v ΞA2 def d 2 { 1, 0, 0, 1 } temos que U 2 2 3, 1 3, 1 3, 2 3 2 U2 3, 1 3, d2 def U 2 2 3, 1 3, 1 3, 2 3 2 U2 3, 1 3, 1, 0 E 2 U2 3, 1 3, 1 3, 2 3 U 2 2 3, 1 3, 0, 1 Abaixo é apresentado o teorema que garante o mapeamento de equilíbrio de Nash de estratégias mistas, tal como descrito acima. A prova do mesmo é encontrada na seção B.1.3 página 206 do apêndice B. Teorema 6.4 Sejam Γ um jogo estratégico, τ = τi um perfil de estratégias mistas, G Γ um estrutura de GAL para Γ como definido na seção 6.1.3, σ Ai funções de valorações de sorts Ai, e α uma fórmula de equilíbrio de Nash de estratégias mistas como definido acima. τi é um equilíbrio de estratégias mistas em Γ G Γ, σ Ai = α, onde cada σ Ai v Ai = τi

Capítulo 6. Teoria dos Jogos em GAL 118 6.2 Jogo Extensivo com Informação Perfeita em GAL Abaixo serão apresentados duas versões de jogo extensivo com informação perfeita em estruturas de GAL. Na primeira versão, seguimos a idéia de jogo estratégico como estrutura de GAL seção 6.1, e cada estado é representado por um perfil de estratégias para cada jogador. Na segunda versão, apresentamos uma versão mais natural de um jogo extensivo no qual cada estado é representado por um histórico. Em ambos os casos, os conceitos de soluções de equilíbrio de Nash e de subjogo perfeito são definidos através de fórmulas de GAL. 6.2.1 Versão Matricial em GAL de Jogo Extensivo Na primeira versão, a idéia de representar um jogo extensivo com informação perfeita 2 como estrutura de GAL segue o caso de jogo estratégico como estrutura de GAL apresentado na seção 6.1. Esta representação está relacionada a versão matricial de um jogo extensivo com informação perfeita. Assim, modelamos cada perfil de estratégias s como um estado s, no qual, para cada jogador i, um símbolo s i : S i é utilizado para representar a estratégia do jogador i, e sua interpretação depende da estratégia s i. Por exemplo, o perfil de estratégias A, L no exemplo 2.10 é mapeado no estado A, L, onde os símbolos s 1 e s 2 são as estratégias A e L, respectivamente. Representamos também cada conjunto das estratégias S i de cada jogador i N, o conjunto dos históricos H, o conjunto dos históricos terminais T, e o conjunto dos históricos não-terminais NT. As funções P, u i, O e O h são definidas como no jogo extensivo, e suas interpretações são rígidas. Definição 6.5 Um jogo extensivo com informação perfeita Γ = N, P, H, u i é mapeado em uma estrutura de GAL como segue. 33. A linguagem não-lógica é definida por S, F, P, N S = {S i, H, T, NT, R}, temos um sort H para os históricos, T para os terminais, N T para os não-terminais, R para as utilidades, e, para cada jogador i N, um sort S i. F = {P, u i, s i, O, O h }, os símbolos funcionais P : NT N, O : S i T, O h : H S i T, e para cada jogador i N um símbolo s i : S i e um símbolo funcional u i : S i R. P = { }, um símbolo predicativo : R R. 2 Para ver a definição de jogo extensivo com informação perfeita, veja a seção 2.2 página

Capítulo 6. Teoria dos Jogos em GAL 119 N = N, o conjunto de jogadores de Γ. A estrutura de GAL G Γ = SE, SE o, CA, D Si, D H, D T, D NT, D R, P, u i, s i,e, O, O h,e SE,, N e e SE, onde SE = S, o conjunto dos estados é o conjunto dos perfis de estratégias de Γ. SE o = S, pois nesta versão a evolução do jogo não ocorre na estrutura temporal de G Γ. CA =, pois nesta versão a evolução do jogo não ocorre na estrutura temporal de G Γ. Cada domínio D Si é o conjunto das estratégias S i do jogo Γ; o domínio D H é o conjunto dos históricos de Γ; o domínio D T é o conjunto dos históricos terminais de Γ; o domínio D NT é o conjunto dos históricos não-terminais de Γ; o domínio D R é o conjunto de todo os possíveis valores das utilidades do jogo Γ. Note que este conjunto é finito, se o jogo for finito. Cada símbolo s i é interpretado no estado e SE como a estratégia do jogador i de acordo com o perfil de estratégias s = s 1,..., s i,..., s n do jogo Γ que originou o estado e, i.e. s i,e = s i ; As funções P, u i, O, O h são interpretadas de forma rígida como as funções do jogo Γ. O predicado é interpretado de forma rígida como no jogo Γ. N e =, pois nesta versão a evolução do jogo não ocorre na estrutura temporal de G Γ. Iremos utilizar um abuso de notação, e representar um jogo extensivo com informação perfeita N, P, H, u i como a seguinte estrutura de GAL S, S,, S i, H, T, NT, R, P, u i, s i,s, O, O h,, com linguagem não-lógica S i, H, T, NT, R, P : NT N, u i : T R, s i : S i, O : S T, O h : H S T, : R R, N Abaixo apresentamos o jogo extensivo do exemplo 2.10 como uma estrutura de GAL para jogo extensivo na versão matricial. Como esta representação é mais parecida com a forma matricial do jogo extensivo, apresentamos na figura 6.2 a forma matricial deste jogo, bem como parte da estrutura de GAL definida abaixo. Exemplo 6.6 A estrutura de GAL para o exemplo 2.10 é definida por S, S,, S 1, S 2, H, T, NT, R, P, u 1, u 2, s 1,s, s 2,s, O, O h,, com linguagem não-lógica S 1, S 2, H, T, NT, R, P : NT {1, 2}, u 1 : S 1 S 2 R, u 2 : S 1 S 2 R, s 1 : S 1, s 2 : S 2, O : S 1 S 2 T, O h : H S 1 S 2 T, : R R, {1, 2} onde

Capítulo 6. Teoria dos Jogos em GAL 120 L R A B 0,0 1,2 2,1 1,2 a - Representação Matricial s 1 = A s 2 = L s 1 = A s 2 = R A, L A, R s 1 = B s 2 = L s 1 = B s 2 = R B, L B, R R = {0, 1, 2} S 1 = { A, B }, S 2 = { L, R } b- Estrutura de GAL G 6.6 Figura 6.2: Jogo extensivo do exemplo 2.10 S = { A, L, A, R, B, L, B, R }. S 1 = { A, B } e S 2 = { L, R }. H = {, A, B, A, L, A, R}. T = {B, A, L, A, R}. NT = {, A}. R = {0, 1, 2}. P = 1 e PA = 2. s 1, A, L = A, s 1, A, R = A, s 1, B, L = B, s 1, B, R = B s 2, A, L = L, s 2, A, R = R, s 2, B, L = L, s 2, B, R = R. O A, L = A, L, O A, R = A, R, O B, L = B, O B, R = B. O h, A, L = A, L, O h A, A, L = A, L, O h A, L, A, L = A, L, O h A, R, A, L = A, R, O h B, A, L = B, O h, A, R = A, R, O h A, A, R = A, R, O h A, L, A, R = A, L, O h A, R, A, R = A, R, O h B, A, R = B, O h, B, L = B, L, O h A, B, L = A, L, O h A, L, B, L = A, L, O h A, R, B, L = A, R, O h B, B, L = B, O h, B, R = B, R, O h A, B, R = A, R, O h A, L, B, R = A, L, O h A, R, B, R = A, R, O h B, B, R = B. u 1 B = 1, u 1 A, L = 0, u 1 A, R = 2 u 2 B = 2, u 2 A, L = 0, u 2 A, R = 1

Capítulo 6. Teoria dos Jogos em GAL 121 6.2.2 Fórmula de Equilíbrio de Nash para a Versão Matricial A representação de equilíbrio de Nash para jogo extensivo é similar ao caso de equilíbrio de Nash para jogo estratégico apresentada na seção 6.1.1. A fórmula de equilíbrio de Nash para jogo extensivo na versão matricial é definida da seguinte forma. Sejam v Si variáveis de sorts S i. v Si u i Os 1,..., s n u i Os 1,..., v Si,..., s n A fórmula de equilíbrio de Nash para um jogo com dois jogadores, como no exemplo 6.6, é definida da seguinte forma. v S1 u 1 Os 1, s 2 u 1 Ov S1, s 2 v S2 u 2 Os 1, s 2 u 2 Os 1, v S2 Assim, para o exemplo 6.6 a fórmula definida acima é satisfeita nos estados A, R e B, L. Desta forma, temos que G 6.6 = A, R v S1 u 1 Os 1, s 2 u 1 Ov S1, s 2 v S2 u 2 Os 1, s 2 u 2 Os 1, v S2 G 6.6 = B, L v S1 u 1 Os 1, s 2 u 1 Ov S1, s 2 v S2 u 2 Os 1, s 2 u 2 Os 1, v S2 Abaixo é apresentado o teorema que garante o mapeamento de equilíbrio de Nash, tal como descrito acima. A prova do mesmo é encontrada na seção B.2.1 página 207 do apêndice B. Teorema 6.7 Sejam Γ um jogo extensivo com informação perfeita, s = s i um perfil de estratégias para Γ, G Γ uma estrutura de GAL na versão matricial para Γ como definido na seção 6.2.1, e α uma fórmula de equilíbrio de Nash para G Γ como definido acima. Um perfil de estratégias s é um equilíbrio de Nash para Γ G Γ = s α 6.2.3 Fórmula de Equilíbrio de Subjogo Perfeito para a Versão Matricial A idéia de representar equilíbrio de subjogo perfeito para jogo extensivo na versão matricial é similar ao caso de representar equilíbrio de Nash para jogo estratégico apresentada na seção 6.1.1. A fórmula de equilíbrio de subjogo perfeito para jogo extensivo na versão matricial é definida da seguinte forma.

Capítulo 6. Teoria dos Jogos em GAL 122 v NT Sejam v NT uma variável de sort NT, e v Si variáveis de sorts S i. P v NT = i v Si u i O h v NT, s 1,..., s n u i O h v NT, s 1,..., v Si,..., s n A fórmula de equilíbrio de subjogo perfeito para um jogo com dois jogadores, como no exemplo 6.6, é definida da seguinte forma. v NT P vnt = 1 v S1 u 1 O h v NT, s 1, s 2 u 1 O h v NT, v S1, s 2 P v NT = 2 v S2 u 1 O h v NT, s 1, s 2 u 1 O h v NT, s 1, v S2 Assim, para o exemplo 6.6 a fórmula definida acima é satisfeita no estado A, R. Desta forma, temos que P vnt = 1 v S1 u 1 O h v NT, s 1, s 2 u 1 O h v NT, v S1, s 2 G 6.6 = A, R v NT P v NT = 2 v S2 u 1 O h v NT, s 1, s 2 u 1 O h v NT, s 1, v S2 Abaixo é apresentado o teorema que garante o mapeamento de equilíbrio de subjogo perfeito, tal como descrito acima. A prova do mesmo é encontrada na seção B.2.2 página 208 do apêndice B. Teorema 6.8 Sejam Γ um jogo extensivo com informação perfeita, s = s i um perfil de estratégias para Γ, G Γ uma estrutura de GAL na versão matricial para Γ como definido na seção 6.2.1, e α uma fórmula de equilíbrio de subjogo perfeito para G Γ como definido acima. Um perfil de estratégias s é um equilíbrio de subjogo perfeito para Γ G Γ = s α 6.2.4 Versão Extensiva em GAL de Jogo Extensivo Podemos modelar um jogo extensivo com informação perfeita Γ = N, H, P, u i em GAL de uma forma mais intuitiva, onde a estrutura de GAL é representada pela sua forma extensiva. Cada histórico h H do jogo extensivo é representado por um estado h, no qual o símbolo h : H denota o histórico h, que originou o estado, do jogo extensivo Γ. O conjunto de ações da estrutura de GAL é determinado pelas ações a partir de cada histórico nãoterminal. A função P determina o jogador que faz a escolha a cada estado, i.e. N h = {P h}. Os conjuntos das estratégias S i dos jogadores, e ainda as funções O e O h, são definidos na estrutura de GAL, e têm suas interpretações rígidas definidas como no jogo extensivo Γ. Formalmente, temos a definição abaixo.

Capítulo 6. Teoria dos Jogos em GAL 123 Definição 6.9 Um jogo extensivo Γ = N, H, P, u i é mapeado em uma estrutura de GAL na versão extensiva como segue. A linguagem não-lógica é definida por S, F, P, N, onde S = {H, T, S i, R}, temos o sort H para os históricos, T para os históricos terminais, o sort R para as utilidades e, para cada jogador i N, um sort S i. F = {h, u i, O, O h }, temos os símbolos funcionais O : S i T, O h : H S i T, o símbolo h : H, e, para cada jogador i N, um símbolo funcional u i : T R. P = { }, um símbolo predicativo : R R. N = N, o conjunto de jogadores de Γ. A estrutura de GAL G Γ = SE, SE o, CA, D Si, D H, D R, h e, u i, O, O h,e SE,, N e e SE, onde SE = H, o conjunto dos estados é o conjunto dos históricos de Γ. SE o = { }, o estado inicial é o estado representado pelo histórico. Para todo histórico h de Γ e toda ação a Ah tal que h, a H, temos que h, h, a CA. Cada domínio D Si é o conjunto das estratégias S i do jogador i de Γ; o domínio D H é o conjunto dos históricos de Γ; o domínio D T é o conjunto dos históricos terminais de Γ; e, finalmente, o domínio D R é o conjunto de todos os possíveis valores das utilidades de Γ. Perceba que este conjunto é finito, se o jogo é finito. O símbolo h é interpretado no estado e SE como o histórico h do jogo Γ que originou o estado e, i.e. h e = h; As funções u i, O, O h são interpretadas rigidamente como as funções do jogo Γ. O predicado é interpretado de forma rígida como no jogo Γ. N e = {P h}, a função P do jogo Γ determina qual jogador toma uma decisão no estado e SE, onde o estado e foi originado do histórico h. Iremos utilizar um abuso de notação e representar um jogo extensivo Γ = N, P, H, u i como a seguinte estrutura de GAL H, H o, CA, H, T, S i, R, h h, u i, O, O h,,n h com linguagem nãológica H, T, S i, R, h : H, u i : T R, O : S T, O h : H S T, : R R, N. Abaixo apresentamos o jogo extensivo do exemplo 2.10 como estrutura de GAL para jogo extensivo na versão extensiva. Na figura 6.3, apresentamos

Capítulo 6. Teoria dos Jogos em GAL 124 1 A B 2 1,2 L R 0,0 2,1 h = {1} h = A h = B {2} {} A B h = A, L {} h = A, R {} A, L A, R S 1 = { A, B }, S 2 = { L, R }, R = {0, 1, 2} H = {, A, B, A, L, A, R} T = {B, A, L, A, R} a - Representação Extensiva b - Estrutura de GAL G 6.10 Figura 6.3: Exemplo 2.10. a forma extensiva deste jogo, bem como parte da estrutura de GAL definida abaixo. Exemplo 6.10 A estrutura de GAL para o exemplo 2.10 é definido por H, H o, CA, H, T, S 1, S 2, R, h h, u 1, u 2, O, O h,, N h com linguagem não-lógica H, T, S 1, S 2, R, h : H, u 1 : T R, u 2 : T R, O : S 1 S 2 T, O h : H S 1 S 2 T, : R R, {1, 2} onde H = {, A, B, A, L, A, R}. H o = { }. CA = {, A,, B, A, A, L, A, A, R }. S 1 = { A, B } e S 2 = { L, R }. T = {B, A, L, A, R}. R = {0, 1, 2}. h =, h A = A, h B = B, h A,L = A, L, h A,R = A, R. O A, L = A, L, O A, R = A, R, O B, L = B, O B, R = B. O h, A, L = A, L, O h A, A, L = A, L, O h A, L, A, L = A, L, O h A, R, A, L = A, R, O h B, A, L = B, O h, A, R = A, R, O h A, A, R = A, R, O h A, L, A, R = A, L, O h A, R, A, R = A, R, O h B, A, R = B, O h, B, L = B, L, O h A, B, L = A, L, O h A, L, B, L = A, L, O h A, R, B, L = A, R, O h B, B, L = B, O h, B, R = B, R,

Capítulo 6. Teoria dos Jogos em GAL 125 O h A, B, R = A, R, O h A, L, B, R = A, L, O h A, R, B, R = A, R, O h B, B, R = B. u 1 B = 1, u 1 A, L = 0, u 1 A, R = 2 u 2 B = 2, u 2 A, L = 0, u 2 A, R = 1 N = {1}, N A = {2}, N B = N A,L = N A,R = {} 6.2.5 Fórmula de Equilíbrio de Nash para a Versão Extensiva Nesta versão a representação de equilíbrio de Nash difere da fórmula de equilíbrio de Nash apresentada na seção 6.2.2. Como em cada estado não fazemos referência as estratégias dos jogadores não existem símbolos em cada mundo para representá-los, utilizamos variáveis livres para caracterizar equilíbrio de Nash. Assim, a fórmula de equilíbrio de Nash, que tem variáveis livres v S i, uma para cada jogador i, é um equilíbrio de Nash se, e somente se, existem funções de valorações σ Si que tornam a fórmula verdadeira. Sejam Γ um jogo extensivo com informação perfeita, G Γ uma estrutura de GAL para Γ como definido em 6.2.4, v S i variáveis de sorts S i e v Si variáveis de sorts S i. Uma fórmula de equilíbrio de Nash para G Γ é definida como segue. v Si ui OvS 1,..., vs n u i OvS 1,..., v Si,..., vs n Para o exemplo 6.10, temos a seguinte fórmula de equilíbrio de Nash verdadeira para as funções de valorações σ S1 e σ S2, onde σ S1 vs 1 = A e σ S2 vs 2 = R. G 6.10, σ S1, σ S2 = vs1 u1 Ov S 1, v S 2 u 1 Ov S1, v S 2 v S2 u2 Ov S 1, v S 2 u 2 Ov S 1, v S2 O mesmo ocorre quando as funções de valoração σ S1 e σ S2 atribuem B e L, respectivamente, ou seja, σ S1 vs 1 = B e σ S2 vs 2 = L. Abaixo é apresentado o teorema que garante o mapeamento de equilíbrio de Nash, tal como descrito acima. A prova do mesmo é encontrada na seção B.3.1 página 210 do apêndice B. Teorema 6.11 Sejam Γ um jogo extensivo com informação perfeita, s = s i um perfil de estratégias para Γ, G Γ uma estrutura de GAL na versão extensiva para Γ como definido na seção 6.2.4, σ Si funções de valorações de sorts S i, e α uma fórmula de equilíbrio de Nash para G Γ como definido acima.

Capítulo 6. Teoria dos Jogos em GAL 126 Um perfil de estratégias s i é um equilíbrio Nash para Γ G Γ, σ Si = α, onde cada σ Si v S i = s i 6.2.6 Fórmula de Equilíbrio de Subjogo Perfeito para a Versão Extensiva A idéia para representar equilíbrio de subjogo perfeito segue a idéia da seção 6.2.5, onde utilizamos variáveis livres para caracterizar equilíbrio de Nash. O argumento utilizado é semelhante, pois não temos símbolos para representar as estratégias a cada estado. Assim, a fórmula de equilíbrio de subjogo perfeito, que tem variáveis livres v S i, uma para cada jogador i N, é um equilíbrio de subjogo perfeito se e somente se existem funções de valorações σ Si que satisfazem a fórmula a partir do estado inicial i.e. em todos os subjogos. Sejam Γ um jogo extensivo com informação perfeita, e G Γ uma estrutura de GAL como definido na seção 6.2.4, e v Si variáveis de sorts S i e v S i variáveis de sorts S i. Uma fórmula de equilíbrio de subjogo perfeito para G Γ é definida como segue. [AG] i v Si ui O h h, vs 1,..., vs n u i O h h, vs 1,..., v Si,..., vs n Note que a fórmula interna ao operador modal [AG] representa que se um jogador tem que tomar uma decisão, então está é ótima no subjogo do histórico h, levando em consideração as estratégias dos outros jogadores. O operador modal [AG] aplicado a esta fórmula representa que cada decisão de cada jogador em cada subjogo é ótima. Para o exemplo 6.10, temos a seguinte fórmula de equilíbrio de subjogo perfeito satisfeita no histórico inicial com as funções de valorações σ S1 e σ S2, onde σ S1 v S 1 = A e σ S2 v S 2 = R. G 6.10, σ S1, σ S2 = [AG] 1 vs1 u1 O h h, v S 1, v S 2 u 1 O h h, v S1, v S 2 2 v S2 u2 O h h, v S 1, v S 2 u 2 O h h, v S 1, v S2 Abaixo é apresentado o teorema que garante o mapeamento de equilíbrio de subjogo perfeito, tal como descrito acima. A prova do mesmo é encontrada na seção B.3.2 página 211 do apêndice B. Teorema 6.12 Sejam Γ um jogo extensivo com informação perfeita, s = s i um perfil de estratégias para Γ, G Γ uma estrutura de GAL na versão extensiva para Γ como definido na seção 6.2.4, σ Si funções de valorações de sorts S i, e α uma fórmula de equilíbrio de subjogo perfeito para G Γ como definido acima.

Capítulo 6. Teoria dos Jogos em GAL 127 Um perfil de estratégias s i é um equilíbrio de subjogo perfeito para Γ G Γ, σ Si = α, onde cada σ Si v S i = s i 6.2.7 Quantificando em Jogos Extensivos Nesta seção, iremos nos focar nas definições de equilíbrio de Nash EN e equilíbrio de subjogo perfeito ESP para jogos extensivos com informação perfeita, com o intuito de analisarmos as diferentes formas de quantificação. Para tal análise, iremos utilizar as definições de jogos extensivos em GAL na versão matricial e na versão extensiva. O conceito de solução de EN requer que a estratégia de cada jogador seja ótima, dadas as estratégias dos outros jogadores. O conceito de solução de ESP requer que a estratégia de cada jogador seja ótima em cada instante do jogo, dadas as estratégias dos outros jogadores. Na definição do conceito de ESP, temos uma descrição explícita da estrutura do jogo, enquanto que em EN a estrutura do jogo não é referenciada. As definições de EN para jogos extensivos desconsideram, assim, a estrutura do jogo. Podemos ver isto bem claramente na citação abaixo do livro A course in Game Theory, que é um dos livros mais citados de Teoria dos Jogos. The first solution concept [nash equilibrium] we define for an extensive game ignores the sequential structure of the games; it treats the strategies as choices that are made once and for all before play begins. OR94, pages 93 Iremos demonstrar que isto não é verdadeiro, ou seja, que o conceito de equilíbrio de Nash para jogos extensivos considera a estrutura seqüencial do jogo. Iremos nesta seção caracterizar EN através da estrutura do jogo. Dito de forma simples, o conceito de EN para um jogo extensivo requer que as estratégias sejam ótimas no caminho que ocorre quando cada jogador segue a sua estratégia, desconsiderando assim a racionalidade dos jogadores nos históricos que não ocorrem neste caminho. Na verdade, veremos em seções posteriores que tal caracterização é também válida para jogos com informação imperfeita e quase perfeita. Alguns autores FT91, Ros06 comentam, a exemplo da citação abaixo, sobre o conceito de caminho no conceito de equilíbrio de Nash, porém suas definições formais são apresentadas da forma usual. We also saw that some of these Nash Equilibria may rely on empty threats of suboptimal play at histories that are not expected to occur - that is, at histories off the path of the equilibrium. FT91, pages 72 Vejamos o exemplo apresentado na figura 6.4 abaixo. Em Teoria dos Jogos, costuma-se dizer que a solução B, R, que é um equilíbrio de Nash,

Capítulo 6. Teoria dos Jogos em GAL 128 não é razoável na medida em que se o jogador 2 tiver que tomar uma decisão no histórico não-terminal A, então ele obterá uma melhor utilidade caso mude sua estratégia para L, obtendo uma utilidade de 3 ao invés de 1, que é o equilíbrio. Assim, ele tem um incentivo para desviar do equilíbrio. Apesar disso ser usualmente aceito pelos teóricos de jogos, argumentamos que se os jogadores racionalizam suas estratégias somente ao longo do histórico terminal, que resultará das estratégias escolhidas, então o conceito de equilíbrio de Nash é razoável. A caracterização do conceito de EN, como acima exposto, parece mais relacionada a visão dos conceitos soluções como uma descrição do comportamento de agentes racionais ou humanos, enquanto que a interpretação do conceito de ESP a uma prescrição ou conselho para os jogadores em como agir. Voltemos ao exemplo da figura 6.4 para demonstrar que a solução B, R é razoável quando os jogadores racionalizam como acima exposto. Para vermos isto, considere que o jogador 1 tenha escolhido a ação B no histórico inicial, então o jogo alcançará o estado terminal B, e o jogo estará terminado. Notemos que se o jogador 2 não for racional nos históricos que não são alcançados ao longo do histórico terminal B, então ele pode tomar a estratégia R, que resultará em uma utilidade pior para o jogador 1, tornando assim a escolha da estratégia B melhor do que a estratégia A. Desta forma, os jogadores racionalizam ao longo dos históricos e B, que são os históricos que ocorrem a partir do perfil de estratégias B, R. 1 A B 2 2, 1 L R 3, 2 1, 1 a - Representação Extensiva L R A 3,2 1,1 B 2,1 2,1 b - Representação Matricial Figura 6.4: Exemplo de um jogo extensivo. Estamos argumentando o seguinte: o critério de racionalidade sobre os históricos, que nunca são alcançáveis, não é condição necessária para que uma solução seja considerada razoável. No exemplo da figura 6.5 abaixo, que é um jogo de soma zero 3, isto fica ainda mais aparente, pois neste caso temos duas soluções de EN: B, L e B, R. Ambos os perfis de estratégias 3 Jogo de soma zero é um jogo que um jogador ganha e o outro perde, a exemplo do xadrez e do jogo da velha.

Capítulo 6. Teoria dos Jogos em GAL 129 conduzem a mesma solução, que é o histórico terminal B. Assim, o jogador 2 é indiferente à estratégia adotada no histórico A, uma vez que este histórico nunca será alcançado. 1 A B 2 1, 1 L R 1, 1 1, 1 a - Representação Extensiva L R A 1,-1-1,1 B 1,-1 1,-1 b - Representação Matricial Figura 6.5: Exemplo de um jogo extensivo de soma zero. Agora voltemos as considerações sobre as definições de equilíbrio de Nash e de subjogo perfeito para jogo extensivo com informação perfeita. As definições 6.13 e 6.14 são relativas a equilíbrio de subjogo perfeito, enquanto que as definições 6.15 e 6.16 são relativas a equilíbrio de Nash. Note o enfoque em negrito dado a quantificação das estratégias. Iremos caracterizar estas definições através de fórmulas de GAL para a versão matricial e a versão extensiva. As definições abaixo quantificam sobre os caminhos de um jogo extensivo. Embora não possamos expressar de uma forma direta o conceito de caminho na versão matricial, uma vez que não temos operadores sobre caminhos, podemos tentar simulá-lo através de uma quantificação universal sobre os históricos. Definição 6.13 Versão De Dicto Um equilíbrio de subjogo perfeito para um jogo extensivo com informação perfeita N, H, P, u i é um perfil de estratégias s tal que para todo jogador i N e para todo histórico não-terminal h H para o qual P h = i, temos que u i O h h, s 1,..., s n u i O h h, s 1,..., s i,..., s n para toda estratégia s i S i. Definição 6.14 Versão De Re Um equilíbrio de subjogo perfeito para um jogo extensivo com informação perfeita N, H, P, u i é um perfil de estratégias s tal que para todo jogador i N, para toda estratégia s i S i e para todo histórico não-terminal h H para o qual P h = i, temos que u i O h h, s 1,..., s n u i O h h, s 1,..., s i,..., s n.

Capítulo 6. Teoria dos Jogos em GAL 130 Definição 6.15 Versão De Dicto Um equilíbrio de Nash para um jogo extensivo com informação perfeita Γ = N, H, P, u i é um perfil de estratégias s tal que para todo jogador i e para todo histórico não-terminal h H ao longo do histórico terminal que resulta do perfil de estratégias s i.e. h Os para o qual P h = i, temos que u i O h h, s 1,..., s n u i O h h, s 1,..., s i,..., s n, para toda estratégia s i S i. Definição 6.16 Versão De Re Um equilíbrio de Nash para um jogo extensivo com informação perfeita Γ = N, H, P, u i é um perfil de estratégias s tal que para todo jogador i, para toda estratégia s i S i e para todo histórico não-terminal h H ao longo do histórico terminal que resulta do perfil de estratégias s i.e. h Os para o qual P h = i, temos que u i O h h, s 1,..., s n u i O h h, s 1,..., s i,..., s n. A definição 6.13 foi caracterizada na versão matricial na seção 6.2.3 como a fórmula 6-5 abaixo; e na versão extensiva na seção 6.2.6 como a fórmula 6-6 abaixo. v NT P v NT =i v Si u i O h v NT, s 1,..., s n u i O h v NT, s 1,..., v Si,..., s n 6-5 [AG] i v Si ui O h h, vs 1,..., vs n u i O h h, vs 1,..., v Si,..., vs n 6-6 A fórmula 6-6 equivale a fórmula 6-8 abaixo devido a equivalência entre a quantificação universal De Re e De Dicto do operador [AG] veja a seção 5.1.1. As fórmulas 6-7 e 6-8 caracterizam a definição 6.14. Por outro lado, a fórmula 6-5 equivale a fórmula 6-7 abaixo, pois a quantificação universal sobre cada estratégia pode ser colocada anteriormente à quantificação universal sobre os históricos não-terminais, uma vez que eles quantificam sobre domínios diferentes. Assim, do ponto de vista da representação matricial e extensiva, as definições 6.13 e 6.14 são equivalentes.

Capítulo 6. Teoria dos Jogos em GAL 131 v S1... v Sn v NT P v NT =i u i O h v NT, s 1,..., s n u i O h v NT, s 1,..., v Si,..., s n 6-7 v S1... v Sn [AG] i u i O h h, vs 1,..., vs n u i O h h, vs 1,..., v Si,..., vs n 6-8 Para ilustrar, considere novamente o exemplo da figura 6.4 página 128. A fórmula abaixo caracteriza equilíbrio de subjogo perfeito para a versão matricial e é satisfeita apenas no estado A, L. P vnt = 1 v S1 u 1 O h v NT, s 1, s 2 u 1 O h v NT, v S1, s 2 G Γ = A, L v NT P v NT = 2 v S2 u 1 O h v NT, s 1, s 2 u 1 O h v NT, s 1, v S2 Na versão extensiva, a fórmula de equilíbrio de subjogo perfeito abaixo é satisfeita apenas para as funções de valorações σ S1 e σ S2 v S 2 = L. G Γ, σ S1, σ S2 = [AG] e σ S2, onde σ S1 v S 1 = A 1 vs1 u1 O h h, v S 1, v S 2 u 1 O h h, v S1, v S 2 2 v S2 u2 O h h, v S 1, v S 2 u 2 O h h, v S 1, v S2 Agora iremos caracterizar a definição 6.15 como fórmulas de GAL para a versão matricial e para a versão extensiva. Esta definição supõe que os jogadores têm suas racionalidades limitadas no sentido que eles só racionalizam suas estratégias ao longo dos históricos não-terminais resultantes das suas estratégias, desconsiderando assim a racionalidade nos outros pontos do jogo. Esta solução difere de equilíbrio de subjogo perfeito na medida em que ela considera apenas parte dos subjogos, e não todos como no caso de subjogo perfeito. Na versão matricial não temos como expressar o conceito de caminho, então a fórmula de equilíbrio de Nash é definida através de uma quantificação universal sobre os históricos não-terminais, no entanto, considerando as racionalidades dos jogadores somente nos históricos que resultam quando cada jogador segue sua estratégia. A caracterização é como segue abaixo.

Capítulo 6. Teoria dos Jogos em GAL 132 v NT v NT Os 1,..., s n P v NT = i v Si u i O h v NT, s 1,..., s n u i O h v NT, s 1,..., v Si,..., s n 6-9 Um perfil de estratégias s é um equilíbrio de Nash se, e somente se, a fórmula 6-9 é satisfeita no estado que representa este perfil de estratégias. Mais a frente iremos demonstrar que esta fórmula caracteriza equilíbrio de Nash. Por outro lado, na versão extensiva temos como expressar caminho através do operador [EG]. Dito isto, a caracterização é como segue. [EG] h Ov S 1,..., v S n i v Si ui O h h, vs 1,..., vs n u i O h h, vs 1,..., v Si,..., vs n 6-10 Um perfil de estratégias s = s i é um equilíbrio de Nash se, e somente se, a fórmula 6-10 é satisfeita no histórico inicial, onde cada σ Si v S i = s i. Mais a frente iremos demonstrar que esta fórmula caracteriza equilíbrio de Nash. Para ilustrar, considere novamente o exemplo da figura 6.4 página 128. A fórmula que caracteriza equilíbrio de Nash para a versão matricial é satisfeita no estado A, L e no estado B, R. Assim, temos que G Γ = A, L v NT G Γ = B, R v NT v NT Os 1, s 2 P vnt = 1 v S1 u 1 O h v NT, s 1, s 2 u 1 O h v NT, v S1, s 2 P v NT = 2 v S2 u 1 O h v NT, s 1, s 2 u 1 O h v NT, s 1, v S2 v NT Os 1, s 2 P vnt = 1 v S1 u 1 O h v NT, s 1, s 2 u 1 O h v NT, v S1, s 2 P v NT = 2 v S2 u 1 O h v NT, s 1, s 2 u 1 O h v NT, s 1, v S2 Na versão extensiva a fórmula de equilíbrio de Nash é satisfeita no histórico inicial quando: σ S1 v S 1 = A e σ S2 v S 2 = L ; σ S1 v S 1 = B e σ S2 v S 2 = R. Assim, temos que G Γ, σ S1,σ S2 = [EG] h Ov S 1, v S 2 1 vs1 u1 O h h, vs 1, vs 2 u 1 O h h, v S1, vs 2 2 v S2 u2 O h h, vs 1, vs 2 u 2 O h h, vs 1, v S2 A fórmula 6-9 equivale a fórmula 6-11 abaixo, pois a quantificação universal sobre cada estratégia pode ser colocada anteriormente à quantificação universal sobre os históricos não-terminais, uma vez que eles quantificam sobre domínios diferentes. Mostramos na seção 5.1.1 que, para a quantificação universal do operador

Capítulo 6. Teoria dos Jogos em GAL 133 [EG], temos que De Dicto implica em De Re. Assumindo que a fórmula 6-10 a prova será apresentada a seguir representa EN, temos que se uma solução é um EN, então ela satisfaz a fórmula 6-10 versão De Dicto. Daí, usando a implicação de De Dicto em De Re, temos que esta solução também satisfaz a fórmula 6-12 versão De Re. Por outro lado, não temos que De Re implica De Dicto, assim uma solução pode satisfazer a fórmula 6-12 versão De Re e não satisfazer a fórmula 6-10 versão De Dicto, ou seja, a solução pode não ser um EN. Como conseqüência, a fórmula 6-12 versão De Re parece não definir o conceito de EN. Contudo, isto não ocorre. A justificativa é que o operador [EG] não está escolhendo um caminho qualquer, e sim o caminho definido pelas estratégias. Resumidamente, temos que ambas as fórmulas 6-10 e 6-12 representam o conceito de EN. v NT Os 1,..., s n v S1... v Sn v NT P v NT = i u i O h v NT, s 1,..., s n u i O h v NT, s 1,..., v Si,..., s n 6-11 h OvS 1,..., vs n v S1... v Sn [EG] i u i O h h, vs 1,..., vs n u i O h h, vs 1,..., v Si,..., vs n 6-12 Uma última observação se faz necessária: as fórmulas a seguir são semelhantes as fórmulas que caracterizam EN, contudo, as mesmas não restringem a racionalidade a apenas os históricos no caminho das estratégias, e sim a qualquer caminho a partir do histórico inicial. Para os exemplos 6.5 e 6.4 as soluções de EN coincidem. Daí, surge a questão: essas fórmulas representam EN? No exemplo do dilema do prisioneiro apresentado na figura 6.6 abaixo, vemos que estas fórmulas não representam EN, uma vez que as soluções C, NC, C e NC, C, NC são satisfeitas na estrutura de GAL que representa este jogo. De fato, em EN, a racionalidade está limitada aos históricos que ocorrem no caminho das estratégias, e não a qualquer caminho. Para ver que a solução C, NC, C é um falso EN veja que no estado inicial, onde o jogador 1 toma uma decisão, a melhor coisa a fazer é escolher C, pois ele obterá 4 em vez de 0. Por outro lado, no estado que representa o histórico NC, a melhor escolha para o jogador 2 é C, pois ele obterá 4 ao invés de 3, caso ele escolhesse NC. Assim, temos que os caminhos, NC, NC, NC e, N C, N C, C validam a solução. Contudo, vale observar, como dito acima, que estes caminhos não são o caminho que, de fato, ocorre, que é

Capítulo 6. Teoria dos Jogos em GAL 134, C, C, NC. Em outras palavras, a racionalidade do jogador 2 é testada no estado NC e não no estado que, de fato, ocorre C. De forma semelhante, podemos demonstrar que a solução NC, C, NC não é um EN. [EG] i v si ui O h h, vs 1,..., vs n u i O h h, vs 1,..., v si,..., vs n 6-13 v s1... v sn [EG] i u i O h h, vs 1,..., vs n u i O h h, vs 1,..., v si,..., vs n 6-14 C NC C, C C, NC NC, C NC, NC 2,2 2,2 4,0 4,0 0,4 3,3 0,4 3,3 a - Jogo Estratégico 1 C NC 2 2 C NC C NC 2,2 4,0 0,4 3,3 b - Jogo Extensivo Figura 6.6: Dilema do Prisioneiro na versão extensiva com informação perfeita. Concluímos por dizer que as alternativas de quantificação De Re e De Dicto para os principais conceitos de soluções, equilíbrio de Nash e equilíbrio de subjogo perfeito, para jogos extensivos são equivalentes. Apresentamos abaixo os teoremas que garantem os mapeamentos de equilíbrio de Nash e equilíbrio de subjogo perfeito como descrito nesta seção. As provas dos mesmos são encontradas, respectivamente, nas seções B.4.2 e B.4.3 páginas 215 e 217 do apêndice B. Fundamental, para tais provas é o lema apresentado a seguir que garante a correção das definições de equilíbrio de Nash 6.15 e 6.16, cuja prova é encontrada na seção B.4.1 página 214 do apêndice B. Lema 6.2.7 As seguintes asserções são equivalentes. 1. Para todo jogador i N temos que u i Os 1,..., s n u i Os 1,..., s i,..., s n para todo s i S i. 2. Para todo h Os 1,..., s n para o qual P h = i vale que u i O h h, s 1,..., s n u i O h h, s 1,..., s i,..., s n para todo s i S i. 3. Para todo s i S i e para todo h Os 1,..., s n para o qual P h = i vale que u i O h h, s 1,..., s n u i O h h, s 1,..., s i,..., s n.

Capítulo 6. Teoria dos Jogos em GAL 135 Teorema 6.17 Sejam Γ um jogo extensivo, s = s i um perfil de estratégias para Γ, G Γ a estrutura de GAL na versão matricial para Γ como definido na seção 6.2.1, α 1 a fórmula 6-9 de equilíbrio de Nash na versão De Dicto, α 2 a fórmula 6-11 de equilíbrio de Nash na versão De Re, β 1 a fórmula 6-5 de equilíbrio de subjogo perfeito na versão De Dicto, e β 2 a fórmula 6-7 de equilíbrio de subjogo perfeito na versão De Re. 1. Um perfil de estratégias s é um EN para Γ G Γ = s α 1. 2. Um perfil de estratégias s é um EN para Γ G Γ = s α 2. 3. Um perfil de estratégias s é um ESP para Γ G Γ = s β 1. 4. Um perfil de estratégias s é um ESP para Γ G Γ = s β 2. Teorema 6.18 Sejam Γ um jogo extensivo, s = s i um perfil de estratégias para Γ, G Γ a estrutura de GAL na versão extensiva para Γ como definido na seção 6.2.4, α 1 a fórmula 6-10 de equilíbrio de Nash na versão De Dicto, α 2 a fórmula 6-12 de equilíbrio de Nash na versão De Re, β 1 a fórmula 6-6 de equilíbrio de subjogo perfeito na versão De Dicto, e β 2 a fórmula 6-8 de equilíbrio de subjogo perfeito na versão De Re. 1. Um perfil de estratégias s é um EN para Γ G Γ, σ Si = α 1, onde cada σ Si vs i = s i. 2. Um perfil de estratégias s é um EN para Γ G Γ, σ Si = α 1, onde cada σ Si vs i = s i. 3. Um perfil de estratégias s é um ESP para Γ G Γ, σ Si = β 1, onde cada σ Si vs i = s i. 4. Um perfil de estratégias s é um ESP para Γ G Γ, σ Si = β 2, onde cada σ Si vs i = s i.

Capítulo 6. Teoria dos Jogos em GAL 136 6.2.8 Outras soluções para Jogos Extensivos O que faremos nesta seção é propor soluções alternativas para jogos extensivos, e caracterizarmos através de exemplos quando estas soluções são razoáveis ou não. Novamente, uma solução é razoável se ela requer algum tipo de racionalidade dos jogadores, no sentido que os jogadores ao tomarem suas decisões utilizam algum processo de otimização, mesmo que este seja parcial. Iremos considerar dois tipos de soluções: soluções que utilizam o conceito de estratégias 4, como no caso de equilíbrio de subjogo perfeito; e ainda, soluções que se baseiam apenas nas seqüências de ações tomadas pelos jogadores históricos terminais. Estas últimas soluções têm a finalidade de caracterizar jogadores que possuem limitações quando racionalizam sobre as possíveis soluções. Assim, ao invés de racionalizar sobre todas as possíveis estratégias, eles consideram apenas suas ações e conseqüências durante seus planos de ações. Para exemplificarmos estes conceitos, considere o jogo extensivo como mostrado na figura 6.7 na sua versão extensiva e matricial. Para este jogo, o jogador 1 tem duas estratégias A e B, e o jogador 2 tem duas estratégias L e R. Utilizando os conceito de soluções para estratégias temos as seguintes possíveis soluções: A, L ; A, R ; B, L ; e B, R. Note que na solução B, L o jogador 2 especificou uma ação que nunca irá se realizar, uma vez que o jogador 1 escolheu B no histórico inicial, terminando assim, o jogo no histórico terminal B. O mesmo fato ocorre na solução B, R. Desta forma, algumas das soluções que iremos propor consideram apenas as seqüências das ações tomadas pelos jogadores, sem que eles tenham que definir ações que nunca são alcançáveis. No jogo da figura 6.7, temos apenas as soluções B, A, L e A, R, que são os históricos terminais, como soluções que se baseiam apenas nas seqüências das ações. Os exemplos utilizados nesta seção estão apresentados na forma extensiva e matricial de jogos extensivos com informação perfeita, contudo, quando apresentarmos as soluções, estaremos nos referindo a definição de jogos extensivo em GAL na versão extensiva, que foi apresentada na seção 6.2.4. Escolhemos apresentar os jogos desta forma para evitar uma notação mais densa. Abaixo apresentamos diversos conceitos de soluções, que serão representados como fórmulas de GAL, para jogos extensivos. A cada fórmula apresentaremos uma explicação do que cada fórmula significa, bem como exemplos que ajudam a caracterizar quando estes conceitos são razoáveis ou não. Os 4 Uma estratégia de um jogador i é uma função que atribui uma ação à cada histórico não-terminal h para o qual P h = i.