Jogos Cooperativos. Prof. Leandro Chaves Rêgo

Documentos relacionados
Refinamentos de Equilíbrios de Nash

Jogos de soma zero com dois jogadores

Construção dos Números Reais

T e o r e m a d e N a s h

Teoria do consumidor. Propriedades do Conjunto Consumo,

Pontos extremos, vértices e soluções básicas viáveis

Capítulo 9. Conclusão 184

MAP Métodos Numéricos e Aplicações Escola Politécnica 1 Semestre de 2017 EPREC - Entrega em 27 de julho de 2017

Ajuste de dados por mínimos quadrados

UNIVERSIDADE FEDERAL DE PERNAMBUCO DEPARTAMENTO DE ESTATÍSTICA. Medida e Probabilidade

EAE 5706: Microeconomia II: Teoria dos Jogos. Jogos de Informação Incompleta: Equilíbrio Bayesiano

Método Simplex. Marina Andretta ICMC-USP. 19 de outubro de 2016

Teoria dos Jogos. Prof. Maurício Bugarin ECO/UnB 2013-I. Aula 7 Teoria dos Jogos Maurício Bugarin. Cap. 2. Jogos Estáticos com Informação Completa

Números Reais. Víctor Arturo Martínez León b + c ad + bc. b c

SINALIZAÇÃO. Rafael V. X. Ferreira 11 de Outubro de 2017

Complexidade computacional

Poliedros na forma padrão

Espaços Euclidianos. Espaços R n. O conjunto R n é definido como o conjunto de todas as n-uplas ordenadas de números reais:

Falta de Consciência em Problemas de Barganha de dois Jogadores

SUMÁRIOS DE VARIÁVEIS ALEATÓRIAS CONTINUAS

DESENHO DE MECANISMOS (2)

Teoremas de uma, duas e três séries de Kolmogorov

Produtos de potências racionais. números primos.

Jogos Repetidos Infinitas Vezes Nash Folk Folk Perfeito Jogos Repetidos Finitas Vezes. Jogos Repetidos. Prof. Leandro Chaves Rêgo

Teoria do Consumidor: Preferências e Utilidade. Roberto Guena de Oliveira 7 de Março de 2017

Marina Andretta. 17 de setembro de Baseado no livro Numerical Optimization, de J. Nocedal e S. J. Wright.

Modelando Conhecimento

MATRIZES POSITIVAS DEFINIDAS

Axiomatizações equivalentes do conceito de topologia

Análise na Reta - Verão UFPA 1a lista - Números naturais; Corpos ordenados

1 Álgebra linear matricial

Roteiro da aula: Jogos dinâmicos com informação incompleta. Mas-Collel e Green capítulo 9 Refinamentos do conceito de Equilíbrio de Nash

Programação Linear M É T O D O S : E S T A T Í S T I C A E M A T E M Á T I C A A P L I C A D A S D e 1 1 d e m a r ç o a 2 9 d e a b r i l d e

Enumerabilidade. Capítulo 6

23 e 24. Forma Quadrática e Equação do Segundo Grau em R 3. Sumário

Lema de Farkas e desigualdades lineares

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Gabarito P2. Álgebra Linear I ) Decida se cada afirmação a seguir é verdadeira ou falsa.

TEORIA DA PRODUÇÃO. Rafael V. X. Ferreira Abril de 2017

Teoremas de dualidade

Matemática I. 1 Propriedades dos números reais

Métodos de Pesquisa Operacional

Fundamentos da Eletrostática Aula 02 Cálculo Vetorial: derivadas

MAT2457 ÁLGEBRA LINEAR PARA ENGENHARIA I Gabarito da 2 a Prova - 1 o semestre de 2015

Análise Convexa. 1. Conjuntos convexos 1.1. Casca convexa, ponto extremo, cone. 2. Hiperplanos: suporte, separador, teorema da separação

Aula 17. Máximo e Mínimo Absolutos

Otimização Aplicada à Engenharia de Processos

Módulo Tópicos Adicionais. Recorrências

Micro I: Aula 04. Preferências Reveladas. February 2, 2011

dosteoremasdepascaledepappus

O Teorema de Peano. f : D R n. uma função contínua. Vamos considerar o seguinte problema: Encontrar um intervalo I R e uma função ϕ : I R n tais que

Aula 2 A distância no espaço

Teoria da Medida e Integração (MAT505)

Existência e otimalidade de pontos extremos

Os números reais. Capítulo O conjunto I

Notas de Aula - Espaços Vetoriais I

7 O Método do Nucleolus

Teoria de dualidade. Marina Andretta ICMC-USP. 19 de outubro de 2016

Aula 09. Bibliograa: Kreps, Cap. 06. Cláudio R. Lucinda FEA-RP/USP. Equilíbrio Geral Eciência do Equilíbrio Geral Existência e Número de Equilíbrios

MAT Resumo Teórico e Lista de

Análise I Solução da 1ª Lista de Exercícios

Teoria dos Jogos. Ivan Sendin. 12 de novembro de FACOM - Universidade Federal de Uberlândia

Representação de poliedros

Controle Ótimo - Aula 10 Princípio do Mínimo de Pontryagin

A = B, isto é, todo elemento de A é também um elemento de B e todo elemento de B é também um elemento de A, ou usando o item anterior, A B e B A.

Otimização Combinatória - Parte 4

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

J. Delgado - K. Frensel - L. Crissaff Geometria Analítica e Cálculo Vetorial

15 AULA. Máximos e Mínimos LIVRO. META Encontrar os pontos de máximo e mínimo de uma função de duas variáveis a valores reais.

Capítulo Propriedades das operações com vetores

Probabilidade combinatória

6 Ajuste de mínimos quadrados

Probabilidade II. Departamento de Estatística. Universidade Federal da Paraíba. Prof. Tarciana Liberal (UFPB) Aula Desigualdades 02/14 1 / 31

Aula 12. Ângulo entre duas retas no espaço. Definição 1. O ângulo (r1, r2 ) entre duas retas r1 e r2 se define da seguinte maneira:

Cap. 5 Estabilidade de Lyapunov

Jogos. A teoria dos jogos lida com as interações estratégicas que ocorrem entre os agentes.

Minera c ao de Dados Aula 6: Finaliza c ao de Regress ao e Classifica c ao Rafael Izbicki 1 / 33

Aula 19 Elipse - continuação

Ralph S. Silva

2 Geometria e Programação Linear

Números Inteiros Axiomas e Resultados Simples

Ajuste de mínimos quadrados

Equação Geral do Segundo Grau em R 2

Tensores (Parte 1) 15 de abril de Primeira aula sobre tensores para a disciplina de CVT 2019Q1

DANIEL V. TAUSK. se A é um subconjunto de X, denotamos por A c o complementar de

Lema. G(K/F ) [K : F ]. Vamos demonstrar usando o Teorema do Elemento Primitivo, a ser provado mais adiante. Assim, K = F (α).

x B A x X B B A τ x B 3 B 1 B 2

Análise Matemática III - Turma especial

INE5403 FUNDAMENTOS DE MATEMÁTICA DISCRETA

DESENHO DE MECANISMOS (1)

ÁLGEBRA LINEAR I - MAT Em cada item diga se a afirmação é verdadeira ou falsa. Justifiquei sua resposta.

Máximos e mínimos em intervalos fechados

LISTA DE EXERCÍCIOS IV TEORIA DOS JOGOS

No. Try not. Do... or do not. There is no try. - Master Yoda, The Empire Strikes Back (1980)

INTRODUÇÃO À PESQUISA OPERACIONAL

A forma canônica de Jordan

Lema. G(K/F ) [K : F ]. Vamos demonstrar usando o Teorema do Elemento Primitivo, a ser provado mais adiante. Assim, K = F (α).

CAPÍTULO 13 (G F )(X) = X, X A (F G)(Y ) = Y, Y B. F G = I da e G F = I db,

Linguagens Não-Regulares

Caros Alunos, segue a resolução das questões de Estatística aplicadas na prova para o cargo de Auditor Fiscal da Receita Municipal de Teresina.

Transcrição:

Jogos Cooperativos Prof. Leandro Chaves Rêgo Programa de Pós-Graduação em Estatística - UFPE Programa de Pós-Graduação em Engenharia de Produção - UFPE Recife, 31 de Outubro de 2014

Jogos Cooperativos Introdução Cooperar significa agir conjuntamente, com um propósito comum. Neste capítulo nós iremos introduzir um modelo de cooperação entre dois jogadores que não abandona a hipótese que os jogadores são racionais e buscam maximizar suas utilidades esperadas. A princípio poderíamos tentar modelar esta situação utilizando, por exemplo, jogos em forma extensiva, onde incluiríamos todas as opções de comunicação e de assinatura de contratos entre os jogadores. Infelizmente, se formos cuidadosos em descrever todas as coisas que jogadores podem fazer em um processo de barganha, teremos um jogo muito grande com um conjunto de equilíbrios muito grande. Então, precisamos de alguma teoria de seleção cooperativa de equilíbrios.

Jogos Cooperativos Quando estudamos equilíbrio de Nash, vimos que se entre os equilíbrios, algum deles tiver alguma propriedade especial que leve os jogadores a focarem nele de maneira que isto seja conhecimento comum, então este equilíbrio que os jogadores esperam é o que realmente é implementado. Uma possível interpretação da suposição que jogadores em um jogo podem cooperar efetivamente é que eles podem utilizar comunicação para coordenar aquilo que eles esperam em um equilíbrio focal que tem boas propriedades para o bem-estar de alguns ou de todos deles. Então, os fundamentos da teoria dos jogos cooperativos reside, pelo menos em parte, no papel de arbitragem, negociação e propriedades de bem-estar para determinar um equilíbrio focal em um jogo com múltiplos equilíbrios.

Árbitro Um árbitro é um indivíduo que pode determinar o equilíbrio focal em um jogo sugerindo publicamente aos jogadores que eles devem implementar um equilíbrio particular. Para ser um árbitro efetivo, um indivíduo deve ser capaz de se comunicar com todos os jogadores, antes do jogo, em uma linguagem que eles entendam e que seja rica o suficiente para descrever qualquer equilíbrio. Também deve ser conhecimento comum entre os jogadores que devido ao prestígio ou autoridade do árbitro todos os jogadores irão atender ou focar em qualquer equilíbrio anunciado pelo árbitro. Um árbitro imparcial deve tentar basear sua seleção em algum tipo de princípio objetivo. Então, nosso objetivo poderia ser descobrir qual equilíbrio selecionaria um árbitro imparcial, em um jogo qualquer, se sua seleção se baseasse em princípios que tratassem os jogadores simetricamente e que selecionasse o mesmo equilíbrio em jogos equivalentes. Deste modo, estaríamos tentando desenvolver uma teoria normativa de arbitragem imparcial em jogos.

Hipótese de Equidade Em geral, sempre que os jogadores possam identificar um único equilíbrio que um árbitro imparcial selecionaria, este equilíbrio pode se tornar focal apenas pelo fato dele possuir essa propriedade especial, existindo ou não um árbitro. Uma outra possibilidade é que um equilíbrio focal pode ser determinado por algum processo de comunicação ente os jogadores anterior ao jogo. Uma maneira de fundamentar uma teoria para negociação de seleção de equilíbrios de um jogo, sem termos que modelar os detalhes do processo de negociação, é utilizar a seguinte hipótese de eqüidade: Os resultados de negociações efetivas as quais os jogadores tem oportunidades iguais de participarem devem ser os mesmos que as recomendações feitas por um árbitro imparcial que sabe a informação que é conhecimento comum entre os jogadores durante o processo de negociação. Esta hipótese de eqüidade afirma que as predições de uma teoria de negociação para seleção de um equilíbrio focal devem ser as mesmas que uma teoria de arbitragem imparcial faria. A seguir formalizaremos propriedades como eqüidade e eficiência para solucionar um problema de barganha entre dois jogadores.

Problema de entre 2 Jogadores Note que quando dois jogadores barganham ou um árbitro imparcial decide, a utilidade que os dois jogadores receberão deve depender apenas da utilidade que eles esperariam se negociação ou arbitragem falharem e no conjunto de possíveis utilidades que são possíveis aos jogadores no processo de negociação ou arbitragem. Portanto, define-se um problema de barganha entre dois jogadores como sendo um par (F,v), onde F é um subconjunto fechado e convexo do IR 2, v = (v 1,v 2) IR 2 e o conjunto F {(x 1,x 2) : x 1 v 1 e x 2 v 2} é não vazio e limitado. F é o conjunto de utilidades possíveis aos dois jogadores, ou conjunto viável, e v é o vetor de utilidades de discórdia. A suposição que F é convexo pode ser justificado se assumimos que jogadores podem concordar em randomizar conjuntamente estratégias, de modo que se o vetor x e o vetor y são possíveis e 0 θ 1, então a utilidade esperada θx +(1 θ)y pode ser atingida. Além disso, supomos ainda que existe algum vetor de utilidades possível que é pelo menos tão bom quanto o vetor de utilidades de discórdia e que ganhos ilimitados sobre o vetor de discórdia não é possível. Dizemos que um problema de barganha é essencial se existe pelo menos um vetor y F tal que y 1 > v 1 e y 2 > v 2.

Definindo a Partir de Um Jogo em Forma Normal Para interpretar estas estruturas precisamos especificar como elas seriam derivadas no contexto de um dado jogo em forma normal de duas pessoas Γ = ({1, 2},C 1,C 2,u 1,u 2). Uma possibilidade é definir F da seguinte maneira: F = {u 1(µ),u 2(µ)}, onde C = C 1 C 2 e u i(µ) = c C µ(c)ui(c). Uma outra maneira seria definir F como sendo o menor conjunto convexo que contém como pontos os vetores de utilidades de todos os equilíbrios de Nash do jogo Γ.

Definindo o Ponto de Discórdia Uma maneira de determinar o ponto de discórdia v é definir v i como sendo o valor minimax para o jogador i, então: v 1 = min max σ 2 (C 2 ) σ 1 (C 1 ) v 2 = min σ 1 (C 1 ) u 1(σ 1,σ 2), e max u2(σ1,σ2). σ 2 (C 2 ) Outra maneira seria escolher (σ 1,σ 2) como sendo algum equilíbrio focal de Γ e v i = u i(σ 1,σ 2) para cada jogador i. Adiante veremos uma outra maneira de definir v e discutiremos qual maneira é mais apropriada para cada situação dada.

Solução Axiomática O objetivo de qualquer teoria de negociação ou arbitragem é identificar para todo problema de barganha de duas pessoas (F,v) um vetor ϕ(f,v) do IR 2 que seria selecionado como resultado de um processo de negociação ou por um árbitro imparcial. Iremos abordar este problema através de axiomas, conhecidos como axiomas de Nash. Tais axiomas listam propriedades que uma solução razoável para um problema de barganha deve satisfazer. Para quaisquer dois vetores x e y em IR 2, escrevemos x y se, e somente se, x 1 y 1 e x 2 y 2; e x > y se, e somente se, x 1 > y 1 e x 2 > y 2. Os axiomas de Nash são: EF. Eficiência Forte (de Pareto). ϕ(f, v) é um vetor em F, e, para todo x F, se x ϕ(f,v), então x = ϕ(f,v). Axioma EF afirma que a solução deve ser viável e satisfazer o critério de eficiência forte de Pareto. Em geral, dado um conjunto F um ponto x F satisfaz a eficiência forte (de Pareto) se não existe nenhum outro ponto y F tal que y x e y i > x i para algum jogador i. E um ponto x F satisfaz a eficiência fraca (de Pareto) se não existe nenhum ponto y F tal que y > x.

Axiomas RI. Racionalidade Individual. ϕ(f, v) v. Axioma RI afirma que nenhum jogador deve estar em uma situação pior na solução que no ponto de discórdia. Dizemos que um vetor x é individualmente racional no problema (F,v) se x v.

Axiomas ITAP. Invariância a Transformações Afins Positivas. Para quaisquer números λ 1, λ 2, γ 1, e γ 2 tais que λ 1 > 0 e λ 2 > 0, se G = {(λ 1x 1 +γ 1,λ 2x 2 +γ 2) : (x 1,x 2) F}, e w = (λ 1v 1 +γ 1,λ 2v 2 +γ 2), então ϕ(g,w) = (λ 1ϕ 1(F,v)+γ 1,λ 2ϕ 2(F,v)+γ 2). Axioma ITAP afirma que se o problema (G,w) pode ser derivado do problema (F,v) por uma transformação afim positiva, então a solução de (G,w) pode ser obtida realizando a mesma transformação na solução de (F,v). Lembre que provamos que funções utilidades que diferem apenas por uma transformação linear afim positiva representam a mesma preferência do jogador, portanto (G, w) e (F, v) representam na verdade o mesmo problema de barganha em escalas diferentes e portanto devem ter a mesma solução.

Axiomas IAI. Independência das Alternativas Irrelevantes. Para qualquer conjunto fechado e convexo G, se G F e ϕ(f,v) G, então ϕ(g,v) = ϕ(f,v). Axioma IAI afirma que eliminar alternativas viáveis que não são soluções não deve alterar a solução. SM. Simetria. Se v 1 = v 2 e {(x 2,x 1) : (x 1,x 2) F} = F, então ϕ 1(F,v) = ϕ 2(F,v). Axioma SM afirma que se as posições dos jogadores são completamente simétricas, então a solução deve tratá-los simetricamente.

Solução de de Nash Um resultado importante obtido por Nash é que existe apenas uma única solução, chamada solução de barganha de Nash, que satisfaz todos estes axiomas. Teorema 2.1 Existe uma única solução ϕ(, ) que satisfaz os axiomas EF, RI, ITAP, IAI, e SM. Esta solução satisfaz que para qualquer problema de barganha de duas pessoas (F,v), ϕ(f,v) argmax x F,x v (x 1 v 1)(x 2 v 2).

Prova Primeiro, suponha que (F,v) é um problema de barganha essencial. Logo, existe algum y F tal que y 1 > v 1 e y 2 > v 2. Seja x o único ponto em F que que atinge o máximo da função (x 1 v 1)(x 2 v 2), chamada de produto de Nash, sobre todo x F tal que x v. Este ponto deve satisfazer x > v para que o produto de Nash calculado nele possa ser positivo, visto que o problema é essencial. (Exercício: Prove que este ponto de máximo é único.) Seja λ i = 1 x i v i e γ i = v i x i v i = v iλ i, para todo i. Defina uma função L : IR 2 IR 2 tal que L(y) = (λ 1y 1 +γ 1,λ 2y 2 +γ 2) = (λ 1(y 1 v 1),λ 2(y 2 v 2)), e seja G = {L(y) : y F}. Para qualquer y IR 2, se z = L(y), então z 1z 2 = λ 1λ 2(y 1 v 1)(y 2 v 2), e λ 1λ 2 é uma constante positiva. Portanto, como x maximiza o produto de Nash com respeito a F, L(x) maximiza o produto z 1z 2 com respeito a G. Mas L(x) = (1,1), e a hipérbole {z IR 2 : z 1z 2 = 1} tem inclinação -1 no ponto (1, 1). Portanto, a reta {z IR 2 : z 1 +z 2 = 2}, que tem inclinação -1 e passa pelo ponto (1,1), tem que estar acima e tangente ao conjunto convexo G em (1, 1). Seja E = {z IR 2 : z 1 +z 2 2}. Então, G E.

Prova Para satisfazer os axiomas EF e SM, nossa solução deve satisfazer ϕ(e,(0, 0)) = (1, 1). Portanto, pelo axioma IAI ϕ(g,(0,0)) = (1,1). Como L(v) = (0,0) e G = {L(y) : y F}, o axioma ITAP implica que L(ϕ(F,v)) = ϕ(g,(0,0)) = (1,1), ou seja, ϕ(f,v) = x. Portanto, para satisfazer os axiomas ϕ deve selecionar o vetor que maximiza o produto de Nash entre todos os vetores individualmente racionais em F. Agora suponha que (F,v) não é essencial, no sentido que não existe nenhum ponto y F tal que y > v. Como F é convexo, então existe pelo menos um jogador i tal que, para todo y F, se y v, então y i = v i. (Se pudéssemos encontra y e z em F tal que y v, z v, y 1 > v 1, e z 2 > v 2, então 0,5y+0,5z seria um ponto em F que seria estritamente melhor para ambos os jogadores, uma contradição.) Seja x o vetor em F que é melhor para o jogador diferente de i, sujeito a condição x i = v i. Então, este ponto é o único que satisfaz eficiência forte de Pareto e racionalidade individual com respeito a v. Portanto, para satisfazer EF e RI, temos que ϕ(f,v) = x onde x maximiza o produto de Nash que é igual a zero para todo vetor individualmente racional, neste problema de barganha não essencial.

Prova Mostramos que os 5 axiomas de Nash implicam que a solução do problema de barganha deve selecionar o único vetor que satisfaz a eficiência forte de Pareto e maximiza o produto de Nash. Resta-nos apenas provar que esta solução ϕ realmente satisfaz os 5 axiomas (Exercício).

Eficiência Fraca Uma versão mais fraca do axioma da eficiência forte é a seguinte. Ef. Eficiência Fraca. ϕ(f,v) F, e não existe nenhum y F tal que y > ϕ(f,v). Note que na prova do Teorema 2.1, no caso de um problema essencial, podemos substituir EF por Ef. Além disso, note que RI não foi necessário para a prova do caso de um problema essencial. Portanto, temos que vale o seguinte teorema: Teorema 2.2 Para um problema de barganha (F,v) de duas pessoas essencial, existe uma única solução ϕ(f,v) que satisfaz os axiomas Ef, ITAP, IAI, e SM. Esta solução satisfaz, ϕ(f,v) argmax x F,x v (x 1 v 1)(x 2 v 2).

Comparações Inter-pessoais de Utilidades Em problemas reais de barganha, é comum que jogadores façam comparações inter-pessoais de utilidade. Uma maneira é aplicar o princípio dos ganhos iguais. Para qualquer problema (F,v), definimos a solução igualitária como sendo o único vetor x F que é fracamente eficiente em F e satisfaz a condição de ganhos iguais: x 1 v 1 = x 2 v 2. Uma outra maneira de fazer comparações inter-pessoais é aplicar o princípio do bem maior. Para qualquer problema (F,v), definimos uma solução utilitária como sendo qualquer vetor x F que satisfaz: x 1 +x 2 = max(y1 +y2). y F

λ-igualitária e λ-utilitária Note que nem a solução igualitária nem a solução utilitária satisfazem o axioma ITAP. Dados quaisquer números λ 1,λ 2,γ 1, e γ 2 tais que λ 1 > 0 e λ 2 > 0, defina para todo y IR 2, L(y) = (λ 1y 1 +γ 1,λ 2y 2 +γ 2). Dados quaisquer problema (F,v), seja L(F) = {L(y) : y F}. Então, a solução igualitária de (L(F),L(v)) é L(x), onde x F é o único vetor que é fracamente eficiente em F tal que λ 1(x 1 v 1) = λ 2(x 2 v 2), que é conhecido como uma solução λ-igualitária de (F,v). Similarmente, a solução utilitária de (L(F),L(v)) é L(z), onde z F satisfaz: λ 1z 1 +λ 2z 2 = max(λ1y1 +λ2y2), y F que é conhecido como uma solução λ-utilitária de (F,v).

Comparações Inter-pessoais em barganhas Portanto, quando pessoas utilizam comparações inter-pessoais em barganhas, temos em geral que responder duas questões: Qual escala de utilidades das muitas que são equivalentes do ponto de vista de preferências dos jogadores devem ser consideradas comparáveis inter-pessoalmente? As comparações devem ser o usando o princípio de ganhos iguais ou do bem maior? Para um problema de barganha de dois jogadores essencial existe um vetor λ tal que a solução λ-igualitária é igual a solução λ-utilitária, este vetor é denominado de fator de escala natural para (F,v). O vetor em F que é λ-igualitário e λ-utilitário para este fator de escala natural é a solução de barganha de Nash.

Teorema Teorema 2.3 Seja (F,v) um problema de barganha de dois jogadores essencial, e seja x F tal que x v. Então, x é a solução de barganha de (F,v) se, e somente se, existirem números positivos λ 1 e λ 2 tais que λ 1(x 1 v 1) = λ 2(x 2 v 2), e λ 1x 1 +λ 2x 2 = max(λ1y1 +λ2y2). y F

Prova Defina H(x,v) = {y IR 2 : (y 1 v 1)(y 2 v 2) = (x 1 v 1)(x 2 v 2)}. O vetor x é a solução de barganha de Nash de (F,v) se, e somente se, a hipérbole H(x,v) é tangente a F em x. Mas, a inclinação da hipérbole H(x,v) em x é (x 2 v 2 ) (x 1 v 1, então H(x,v) é tangente em x a reta ) {y IR 2 : λ 1y 1 +λ 2y 2 = λ 1x 1 +λ 2x 2}, para quaisquer dois números positivos λ 1 e λ 2 tais que λ 1(x 1 v 1) = λ 2(x 2 v 2). Logo, x é a solução de barganha de Nash de (F,v) se, e somente se, F é tangente em x a uma reta da forma {y IR 2 : λ 1y 1 +λ 2y 2 = λ 1x 1 +λ 2x 2}, para algum vetor (λ 1,λ 2) tal que λ 1 > 0, λ 2 > 0, e λ 1(x 1 v 1) = λ 2(x 2 v 2).

Exemplo Seja v = (0,0), e seja F = {(y 1,y 2) : 0 y 1 30, 0 y 2 (30 y 1) 1/2 }. (F,v) pode ser interpretado como uma situação em que os jogadores têm que dividir R$30,00 de qualquer forma que eles concordem, ou recebem R$0,00 se eles não chegam em um acordo, onde o jogador 1 é neutro ao risco (tem utilidade linear para dinheiro), mas jogador 2 é averso ao risco, com uma escala de utilidades que é proporcional a raiz quadrada do valor monetário de seus ganhos. Para encontrar a solução de barganha de Nash, note que 0 = ( d )(y 1(30 y 1) 1/2 ) = (30 y 1) 1/2 y 1 dy 1 2(30 y 1) 1/2 implica que y 1 = 20. Então, a solução de barganha de Nash é o vetor de utilidades (20, 10), que corresponde a uma distribuição de R$20,00 para o jogador 1, e R$10,00 para o jogador 2.

Exemplo Fatores de escala naturais para problema são λ 1 = 1 e λ 2 = 40. Se modificarmos a utilidade do jogador 2, de modo que um ganho de R$x,00 proporcione um aumento de 40x ao invés de x em utilidade, enquanto a utilidade do jogador 1 permanece a mesma, então a representação deste problema se torna (G,(0,0)), onde G = {(y 1,y 2) : 0 y 1 30, 0 y 2 40(30 y 1) 1/2 }. Nesta representação, a solução de barganha de Nash é (20, 20), que ainda corresponde a uma distribuição de R$20,00 par o jogador 1, e R$10,00 para o jogador 2, e ainda é um solução igualitária e utilitária.

Utilidade Transferível Dado Γ = (N,(C i) i N,(u i) i N ) um jogo qualquer em forma normal, dizer que Γ é um jogo com utilidade transferível é dizer que além das estratégias listadas em C i, cada jogador i tem a opção de transferir qualquer quantidade de dinheiro a qualquer outro jogador, ou apenas de destruir dinheiro, e cada unidade perdida de dinheiro decresce a utilidade do jogador i em uma unidade. Isto é, um jogo Γ com utilidade transferível pode ser representado pelo jogo ˆΓ = (N,(Ĉ i) i N,(û i) i N ), onde para cada i, Ĉ i = C i IR N +, e û i((c j,x j) j N ) = u i((c j) j N ) x i(i)+ j i (x j(i) x i(j)), onde x j(k), para k j, representa a quantidade de dinheiro dada pelo jogador j ao jogador k; e x j(j) denota a quantidade de dinheiro destruída por j. A dependência linear de û i nas transferências x j expressa uma suposição implícita de neutralidade com respeito ao risco, que é sempre feita quando dizemos que um jogo tem utilidade transferível.

Utilidade Transferível Se (F,v) é um problema de barganha de dois jogadores derivado de um jogo com utilidade transferível, então o conjunto de possibilidades F deve ser da forma F = {y IR 2 : y 1 +y 2 v 12}, para algum número v 12 que representa a máxima utilidade transferível que os jogadores podem atingir conjuntamente. Por exemplo, podemos definir v 12 = max (u 1(µ)+u 2(µ)). µ (C) Então, para satisfazer as condições do Teorema 2.3 quando v 12 é definido da maneira acima, devemos ter λ 1 = λ 2, caso contrário max y F (λ 1y 1 +λ 2y 2) não existiria, pois {(λ 1y 1 +λ 2y 2) : y F} não seria limitado superiormente. Então as condições para ϕ(f,v) do Teorema 2.3 tornam-se ϕ 1(F,v) v 1 = ϕ 2(F,v) v 2 e ϕ 1(F,v)+ϕ 2(F,v) = v 12.

Solução de de Nash com Utilidade Transferível Resolvendo estas equações, temos as seguintes fórmulas gerais para a solução de barganha de Nash de um jogo com utilidades transferíveis: ϕ 1(F,v) = v12 +v1 v2 2 e ϕ 2(F,v) = v12 +v2 v1. (1) 2

Ameaças Racionais Note, na Equação 1 por exemplo, que a utilidade do jogador 1 na solução de barganha de Nash cresce quando a utilidade de discórdia do jogador 2 decresce. Portanto, a possibilidade de prejudicar jogador 2 em caso de discórdia pode na verdade ajudar o jogador 1 se um acordo cooperativo é atingido. Então, a expectativa de atingir um acordo cooperativo, que dependerá do ponto de discórdia, pode incentivar os jogadores a se comportarem mais agressivamente antes do acordo ser determinado, pois cada jogador tentará impor um ponto de discórdia mais favorável. Este fenômeno pode ser formalizado pela Teoria das ameças racionais de Nash.

Ameaças Racionais Seja Γ = (N,(C i),(u i)) um jogo finito em forma normal, e seja F um conjunto viável derivado de Γ. Suponha que antes de entrar no processo de negociação com o outro jogador, cada jogador i deva escolher uma ameaça τ i (C i). Suponha também que se os jogadores falharem em chegar a um acordo, então cada jogador deverá independentemente implementar a ameaça τ i que ele escolheu. Então, uma vez escolhidas as ameaças, o ponto de discórdia no problema de barganha de dois jogadores é (u 1(τ 1,τ 2),u 2(τ 1,τ 2)). Seja w i(τ 1,τ 2) a utilidade do jogador i na solução de barganha de Nash com este ponto de discórdia, isto é, w i(τ 1,τ 2) = ϕ i(f,(u 1(τ 1,τ 2),u 2(τ 1,τ 2))).

Ameaças Racionais Suponha agora que os jogadores esperam que eles irão no final chegar a um acordo que dependerá do ponto de discórdia segundo a solução de barganha de Nash. Então, os jogadores não devem se importar em implementar suas ameaças, mas devem ao invés avaliar suas ameaças apenas em termos no seu impacto no acordo cooperativo final. Dizemos que (τ 1,τ 2) é um par de ameaças racionais se w 1(τ 1,τ 2) w 1(σ 1,τ 2), σ 1 (C 1), e w 2(τ 1,τ 2) w 2(τ 1,σ 2), σ 2 (C 2).

Jogo de Ameaças Ou seja, ameaças racionais formam um equilíbrio de Nash do seguinte jogo de ameaças Γ {{1, 2}, (C 1), (C 2),w 1,w 2}. Existência de ameaças racionais pode ser provada utilizando o fato que um jogo finito possui pelo menos um equilíbrio em estratégias mistas.

Jogo de Ameaças Quando existe utilidade transferível, a análise do jogo de ameaças se torna mais simples. Da Equação 1, as utilidades no jogo de ameaças são: v12 +u1(τ1,τ2) u2(τ1,τ2) w 1(τ 1,τ 2) = e 2 v12 +u2(τ1,τ2) u1(τ1,τ2) w 2(τ 1,τ 2) =, 2 onde v 12 = max µ (C) (u 1(µ)+u 2(µ)). Note que como v 12 é uma constante, maximizar w 1(τ 1,τ 2) é equivalente a maximizar u 1(τ 1,τ 2) u 2(τ 1,τ 2), e maximizar w 2(τ 1,τ 2) é equivalente a maximizar u 2(τ 1,τ 2) u 1(τ 1,τ 2).

Jogo Diferença Então, quando Γ é um jogo com utilidades transferíveis, (τ 1,τ 2) é um par de ameaças racionais se for um equilíbrio de Nash do jogo de soma-zero Γ = ({1,2}, (C 1), (C 2),u 1 u 2,u 2 u 1), chamado de jogo diferença derivado de Γ.

Escolha do Ponto de Discórdia Consideramos 3 maneiras diferentes de escolher o ponto de discórdia de um problema de barganha de um jogo em forma normal Γ: (1) um equilíbrio de Γ, (2) valores minimax de Γ, (3) por ameaças racionais.

Exemplo Para comparar estes em um contexto de um exemplo considere o jogo Γ em forma normal descrito na seguinte tabela a 2 b 2 a 1 10,0-5,1 b 1 0,-5 0,10

Exemplo A maior soma de utilidades que pode ser obtida neste jogo é v 12 = 10. Este jogo tem um único equilíbrio de Nash em (b 1,b 2). Se escolhermos as utilidades neste equilíbrio para ser o ponto de discórdia temos v = (0, 10). Então, a solução de barganha de Nash é: ϕ 1(F,(0,10)) = 10+0 10 = 0 e 2 ϕ 2(F,(0,10)) = 10+10 0 = 10. 2

Exemplo Suponha agora que determinamos o ponto de discórdia utilizando o critério de minimax. O valor de minimax para o jogador 1 é v 1 = 0, e o valor de minimax para o jogador 2 é v 2 = 1. Para este ponto de discórdia temos que a solução de barganha de Nash é: ϕ 1(F,(0,1)) = 10+0 1 = 4,5 e 2 ϕ 2(F,(0,1)) = 10+1 0 = 5,5. 2

Exemplo O jogo de ameaças derivado de Γ é dado pela tabela seguinte a 2 b 2 a 1 10,0 2,8 b 1 7,5,2,5 0,10

Exemplo O único equilíbrio de Nash deste jogo de ameaças é (a 1,b 2), gerando o ponto de discórdia ( 5,1). E para este ponto de discórdia temos que a solução de barganha de Nash é: ϕ 1(F,( 5,1)) = 10 5 1 = 2 e 2 ϕ 2(F,( 5,1)) = 10+1+5 = 8. 2

Exemplo De acordo com as três teorias, a estratégias de discórdia do jogador 2 é b 2, pois a 2 é dominada por b 2 tanto se o objetivo de 2 for maximizar u 2 ou minimizar u 1. A diferença entre essas teorias surgem na especificação do comportamento de discórdia do jogador 1. No caso do equilíbrio de Nash, o comportamento de 1 é determinado somente pelo seu objetivo de maximizar u 1. No caso de ameaças racionais, o comportamento de 1 é determinado por uma única estratégia que têm o objetivo de maximizar (u 1 u 2). Finalmente, segundo a teoria de minimax, o jogador 1 pode escolher duas ameaças: uma defensiva a 1 que maximiza u 1 e é utilizada para determinar v 1, e outra b 1 que minimiza u 2 e é utilizada para determinar v 2.

Observações Portanto, a teoria do equilíbrio de Nash para selecionar o ponto de discórdia deve ser utilizada quando os jogadores não podem se comprometer antecipadamente a nenhuma estratégia pré-planejada para o evento de discórdia, apenas quando uma discórdia acontece que os jogadores cumprem suas estratégias de discórdia. A teoria das ameaças racionais é apropriada em situações, onde cada jogador, antes do processo de negociação, quando não é esperado que este processo não atinja um acordo, se comprometem com uma estratégia pré-planejada não importa quem tenha sido o último a rejeitar uma proposta de acordo. Finalmente, a teoria de minimax é apropriada quando os jogadores podem, antes do processo de negociação, se comprometerem a duas estratégias pré-planejadas, uma defensiva que ele utilizará se ele foi o último a rejeitar uma oferta de acordo, e outra ofensiva se o outro jogador foi o último a rejeitar uma oferta de acordo.

Um Jogo de com Ofertas Alternadas Vamos analisar agora um jogo de barganha no qual dois jogadores alternam fazendo ofertas até que uma delas seja aceita, e na qual existe uma probabilidade positiva do jogo terminar após cada período em discórdia se nenhuma oferta foi aceita até o momento. Nos restringiremos a uma classe menor de jogos de barganha de dois jogadores. Diz-se que um problema de barganha de dois jogadores (F,v) é regular se, e somente se, F é essencial ({y F : y > v} ) e, para todo vetor y F, (1) se y 1 > v 1, então z F tal que v 1 z 1 < y 1 e z 2 > y 2, e (2) se y 2 > v 2, então z F tal que v 2 z 2 < y 2 e z 1 > y 1. Portanto, em um problema regular, existe um vetor viável que é estritamente melhor que o ponto de discórdia para ambos jogadores; e sempre que um jogador recebe estritamente mais que sua utilidade de discórdia, existe algo que ele pode fazer que reduz sua utilidade e cresce estritamente a utilidade do outro jogador.

Algumas Definições e Propriedades Para qualquer problema de barganha de dois jogadores regular (F,v), seja m i(f,v) = max y F,y v y i, o máximo que i pode obter com uma estratégia em qualquer vetor individualmente racional em F. Para qualquer número z 1 tal que v 1 z 1 m 1(F,v), seja h 2(z 1,F) = max{y 2 : (z 1,y 2) F}, a maior utilidade que jogador 2 pode obter dado que o jogador 1 obtém utilidade z 1. Similarmente, define-se h 1(z 2,F) para qualquer v 2 z 2 m 2(F,v). Lema 2.4 Para qualquer problema de barganha de dois jogadores regular (F,v), temos que se m i(f,v) z i > y i v i, então h j(z i,f) < h j(y i,f), para j i.

Prova Suponha sem perda de generalidade que i = 1 e j = 2. Suponha por contradição que m 1(F,v) z 1 > y 1 v 1 e h 2(z 1,F) h 2(y 1,F). Como o problema é regular, temos que argmax x1 [v 1,z 1 ] h2(x1,f) = {v1}, pois caso contrário se existisse x 1 (v 1,z 1] tal que x 1 argmax x1 [v 1,z 1 ]h 2(x 1,F), a condição de regularidade implica que existe w 1 [v 1,x 1) tal que h 2(w 1,F) > h 2(x 1,F), uma contradição. Portanto, h 2(v 1,F) > h 2(z 1,F) e existe α (0,1) tal que y 1 = αz 1 +(1 α)v 1. Pela convexidade de F, temos que α(z 1,h 2(z 1,F))+(1 α)(v 1,h 2(v 1,F)) = (y 1,αh 2(z 1,F)+(1 α)h 2(v 1,F)) F. Como h 2(v 1,F) > h 2(z 1,F) h 2(y 1,F), temos que αh 2(z 1,F)+(1 α)h 2(v 1,F) > h 2(y 1,F), uma contradição.

Propriedade de um Problema de Regular Lema 2.5 Seja (F,v) um problema de barganha de dois jogadores regular, e sejam p 1 e p 2 números tais que 0 < p 1 < 1 e 0 < p 2 < 1. Então existe um único par de vetores x e y tais que x e y são individualmente racionais e fortemente eficientes em (F,v), e y 1 = (1 p 2)(x 1)+p 2v 1 e x 2 = (1 p 1)(y 2 )+p 1v 2.

Prova Note que a condição acima é equivalente a: x 1 y 1 = p 2(x 1 v 1), e (2) y 2 x 2 = p1(x2 v2) 1 p 1. (3)

Prova Quando fazemos x 1 crescer de v 1 até m 1(F,v), como x é fortemente eficiente, temos pelo Lema 2.4 que x 2 decresce de m 2(F,v) até v 2, e portanto o lado direito de (3) decresce para 0. Por outro lado, quando fazemos x 1 crescer de v 1 até m 1(F,v), o lado direito de (2) cresce monotonicamente de 0. Além disso, dado que x e y são vetores fortemente eficientes e F é convexo, quando fazemos x 1 e x 1 y 1 crescer, a diferença y 2 x 2 (Exercício: Verifique formalmente esta afirmação.) cresce monotonicamente e é igual a 0 se x 1 y 1 = 0. Então, quando requeremos que x e y sejam fortemente eficientes em F e satisfaçam (2), o lado esquerdo de (3) cresce monotonicamente de 0. Logo, pela continuidade das condições, existe um único valor para x 1 tal que (3) é satisfeita. Para este valor de x 1, podemos determinar y 1 a partir de (2), x 2 = h 2(x 1,F), e y 2 = h 2(y 1,F).

Jogo de com Ofertas Alternadas Seja (F,v) um problema de barganha de dois jogadores regular, e sejam p 1 e p 2 números tais que 0 < p 1 < 1 e 0 < p 2 < 1. Considere o seguinte jogo de barganha com ofertas alternadas: O jogador 1 faz uma oferta em F em cada período ímpar, e o jogador 2 faz uma oferta em F em cada período par, começando do primeiro período e continuando até que alguma oferta seja aceita, ou o jogo termine em discórdia; Após cada oferta, o outro jogador pode aceitar ou rejeitar a oferta. Se o jogador i fizer uma oferta e o jogador j rejeitar, para j i, existe uma probabilidade p i que o jogo terminará em discórdia na qual o jogador j receberá v j e o jogador i receberá v i. Quando uma oferta é aceita, os jogadores recebem a utilidade da oferta aceita. (Note que os jogadores recebem apenas em único período deste jogo, ou quando um acordo é feito, ou quando o jogo termina em discórdia.)

A Solução Teorema 2.6 O jogo de barganha de ofertas alternadas descrito acima possui um único equilíbrio de subjogo perfeito no qual o jogador 1 planeja sempre oferecer um vetor x, jogador 2 planeja sempre oferecer um vetor y, jogador 1 aceita qualquer oferta que lhe dê pelo menos y 1, e o jogador 2 aceita qualquer oferta que lhe dê pelo menos x 2. Logo, em equilíbrio, o jogo terminará em acordo em x no primeiro período. Este vetores x e y formam o único par de vetores que são individualmente racionais, satisfazem a eficiência forte, e as seguintes condições: y 1 = (1 p 2)(x 1)+p 2v 1 e x 2 = (1 p 1)(y 2 )+p 1v 2.

Prova Note que todos os subjogos que começam em um período ímpar devem ter o mesmo conjunto de equilíbrios de subjogo perfeito que o jogo completo. Similarmente, todos os subjogos que começam em um período par devem ter o mesmo conjunto de equilíbrios de subjogo perfeito. Além disso, a utilidade esperada em qualquer equilíbrio não pode estar acima da fronteira eficiente do conjunto convexo F. Seja x 1 o supremo e ˆx 1 o ínfimo do conjunto de todas as possíveis utilidades esperadas que o jogador 1 poderia receber em um equilíbrio de subjogo perfeito no qual o jogador 1 faz a primeira oferta. Similarmente, seja y 2 o supremo e ŷ 2 o ínfimo do conjunto de todas as possíveis utilidades esperadas que o jogador 2 poderia receber em um equilíbrio de subjogo perfeito no qual o jogador 2 faz a primeira oferta. Note que ŷ i v i, pois como o problema é essencial os jogadores podem garantir que receberão pelo menos o valor de discórdia em qualquer equilíbrio de subjogo perfeito.

Prova Em qualquer equilíbrio de subjogo perfeito deste jogo, o jogador 2 sempre aceitará uma proposta que lhe dê mais que (1 p 1)y 2 +p 1v 2 em um período ímpar, pois esta é a melhor utilidade que o jogador 2 pode esperar quando rejeita uma oferta do jogador 1. Portanto, a utilidade esperada do jogador 1 quando ele faz a primeira oferta não pode ser pior que h 1((1 p 1)y 2 +p 1v 2,F). Além disso, para qualquer ǫ > 0, existe um equilíbrio de subjogo perfeito no qual o jogador 2 esperar ter uma utilidade menor que y 2 que difira por menos de ǫ de y 2 (por definição de supremo) em qualquer subjogo que comece no período 2; logo o jogador 2 pode garantir pelo menos (1 p 1)(y 2 ǫ)+p 1v 2 no período 1. Como a utilidade esperada em qualquer equilíbrio não pode estar acima da fronteira eficiente do conjunto convexo F, o jogador 1 não pode ter uma utilidade esperada maior que h 1((1 p 1)(y 2 ǫ)+p 1v 2,F) neste equilíbrio.

Prova Portanto, ˆx 1 = h 1((1 p 1)y 2 +p 1v 2,F) (4) Um argumento simétrico pode ser usado para mostrar que ŷ 2 = h 2((1 p 2)x 1 +p 2v 1,F) (5)

Prova Por outro lado, o jogador 2 nunca aceitará uma oferta que lhe dê menos que (1 p 1)ŷ 2 +p 1v 2 em um período ímpar, pois esta é a pior utilidade que o jogador 2 pode esperar quando rejeita uma oferta do jogador 1 em um equilíbrio de subjogo perfeito. Portanto, a utilidade esperada do jogador 1 quando ele faz a primeira oferta não pode ser maior que h 1((1 p 1)ŷ 2 +p 1v 2,F). Além disso, para qualquer ǫ > 0, existe um equilíbrio de subjogo perfeito no qual o jogador 2 esperar ter uma utilidade maior que ŷ 2 que difira por menos de ǫ de ŷ 2 (por definição de ínfimo) em qualquer subjogo que comece no período 2; logo o jogador 2 aceitará qualquer oferta que lhe dê (1 p 1)(ŷ 2 +ǫ)+p 1v 2 no período 1. O jogador 1 pode garantir então uma utilidade esperada de pelo menos h 1((1 p 1)(ŷ 2+ǫ)+p 1v 2,F) neste equilíbrio.

Prova Portanto, x 1 = h 1((1 p 1)ŷ 2 +p 1v 2,F) (6) Um argumento simétrico pode ser usado para mostrar que y 2 = h 2((1 p 2)ˆx 1 +p 2v 1,F) (7)

Prova Vamos completar a definição dos vetores x,ˆx,y,ŷ definindo x 2 = h 2(x 1,F), ˆx 2 = h 2(ˆx 1,F), y 1 = h 1(y 2,F), e ŷ 1 = h 1(ŷ 2,F). Vamos provar que x 1 = h 1(x 2,F). Como (x 1,x 2) F, temos que h 1(x 2,F) x 1. Suponha por contradição que h 1(x 2,F) > x 1. Pelo Lema 2.4, temos que h 2(h 1(x 2,F),F) < h 2(x 1,F) = x 2. Porém, como (h 1(x 2,F),x 2) F, temos uma contradição. Logo, x 1 = h 1(x 2,F), o que pelo Lema 2.4 implica que x 2 = (1 p 1)ŷ 2 +p 1v 2 (8)

Prova Similarmente, utilizando um argumento similar temos que ŷ 1 = (1 p 2)x 1 +p 2v 1 (9) ˆx 2 = (1 p 1)y 2 +p 1v 2 (10) y 1 = (1 p 2)ˆx 1 +p 2v 1 (11)

Prova As condições anteriores implicam que os vetores os vetores x,ˆx,y,ŷ são fortemente eficientes e individualmente racionais. Logo, Lema 2.5, (8), (9), (10), e (11) implicam que ˆx = x e ŷ = y. Portanto, em qualquer equilíbrio de subjogo perfeito, o jogador 1 recebe uma utilidade esperada de x 1 em todos os subjogos que o jogador 1 faz uma oferta primeiro, e o jogador 2 recebe uma utilidade esperada de y 2 em todos os subjogos que o jogador 2 faz uma oferta primeiro. Resta-nos verificar que as estratégias descritas no enunciado do teorema formam o único equilíbrio de subjogo perfeito. Note que em qualquer equilíbrio em que o jogador 2 tem utilidade esperada y 2 no subjogo que começa no segundo período, se o jogador 1 oferecer 2 mais que x 2 = (1 p 1)y 2 +p 1v 2, então o jogador 2 aceitaria, mas nesse caso o jogador 1 receberia menos que x 1, e provamos que não existe um equilíbrio de subjogo perfeito com essas utilidades esperadas. Por outro lado, se o jogador 1 oferecer menos que x 2, então ela não aceitaria e ele teria uma utilidade esperada de no máximo (1 p 1)y 1 +p 1v 1 < x 1, e provamos que não existe um equilíbrio de subjogo perfeito com essas utilidades esperadas. Uma análise similar estabelece que em qualquer equilíbrio de subjogo perfeito o jogador 2 deve oferecer y.