Teoria dos Jogos Prof. Maurício Bugarin Eco/UnB 2014-I
Roteiro Jogos Jogos Repetidos Desenvolver o modelo de jogo repetido Provar o teorema popular Aplicar para conluio ao dilema dos prisioneiros e aos duopólios de Cournot
Exemplo-Dilema dos Prisioneiros c n C 6, 6 0, 9 N 9,0 1, 1 Exemplo-Duopólio de Cournot 2 6 8 1 6 72, 72 60, 80 8 80, 60 64, 64
Modelo híbrido 1 C,c N,n C,n N,c 22 24 21 23 Importante: Payoffs em cada período
Modelo híbrido mais geral Questão: Estratégia?
Definição- Uma estratégia para um jogador i no período t do jogo repetido, σ it, é uma escolha de uma ação em cada uma das cópias do jogo base que i possa vir a jogar no período t Uma estratégia para o jogador i, σ i =(σ i1, σ i2,, σ it ) é uma escolha de uma estratégia σ i t para cada um dos períodos t=1,,t. Chamaremos de S i o conjunto de todas as possíveis estratégias de i. Um perfil de estratégias do jogo repetido T é uma n-upla σ=(σ 1,,σ n ) onde σ i é uma estratégia para o jogador i, i=1,, n. Se o jogo for infinitamente repetido, o parâmetro T acima deve ser interpretado como +. Observação- Estratégias muito mais ricas que no caso de um único período: podem depender da história
c n C 6, 6 0, 9 N 9,0 1, 1 Exemplo-No jogo do dilema dos prisioneiros infinitamente repetido, algumas estratégias para os jogadores podem ser: σ 1 : o jogador 1 escolhe sempre N A estratégia σ 1 independe da história µ 2 : o jogador 2 escolhe n nos períodos ímpares e c nos períodos pares A estratégia µ 2 depende da história de forma muito simples ρ 1 : o jogador 1 escolhe N no período inicial e continua jogando N sempre que 2 tiver jogado n no passado; caso contrário, 1 joga C A estratégia ρ 1 depende da história de forma mais profunda
Cap 5. Jogos Repetidos Definição- Conseqüências: σ=(σ 1,,σ n ): perfil de estratégias do jogo repetido T Se u it for a conseqüência para i no período t quando o perfil de estratégias σ é jogado, então o payoff de i no jogo repetido é: U i =Σ t 1 δ t-1 u it δ: o fator de desconto intertemporal que reflete a impaciência dos jogadores
U i =Σ t 1 δ t-1 u it δ: o fator de desconto intertemporal que reflete a impaciência dos jogadores Interpretações- (i) Juros. Suponha que o agente queira desfrutar hoje do valor x que receberá amanhã. Então ele pode ir ao banco e pedir um empréstimo, pagando x unidades amanhã. O banco cobrará uma taxa de juros r, de forma que o agente receberá y tal que y+ry =x, ou ainda, y=[1/(1+r)]x. Isto quer dizer que, em termos de valores de hoje, x vale [1/(1+r)]x, ou ainda, o valor presente de x é [1/ (1+r)]x. Portanto, o fator de desconto é δ=1/(1+r).
U i =Σ t 1 δ t-1 u it Interpretações- (ii) Fim probabilístico de jogo. Suponha que o agente tem uma função de utilidade de von Neumann-Morgenstern u e que estima que o jogo repetido é um processo aleatório com probabilidade de continuar δ e de terminar 1-δ. Então a utilidade esperada do agente i dado o perfil de estratégias σ no jogo infinitamente repetido será: U i =u i1 (1-δ) + (u i1 +u i2 )δ(1-δ) + (u i1 +u i2 +u i3 )δ 2 (1-δ) + = u i1 [(1-δ)(1+δ+δ 2 +δ 3 + )] + u i2 [(1-δ)(δ+δ 2 +δ 3 + )] + = u i1 + u i2 δ +
Definição- Conseqüências: σ=(σ 1,,σ n ): perfil de estratégias do jogo repetido T u it U i =Σ t 1 δ t-1 u it δ: o fator de desconto intertemporal que reflete a impaciência dos jogadores Interpretações- (iii) δ=ρπ Observação: Em geral, δ próximo de 1: 0,98.
Definição- Equilíbrio de Nash: Um perfil de estratégias σ=(σ 1,, σ n ) é um equilíbrio de Nash (EN) do jogo repetido se nenhum jogador pode melhorar sua utilidade no jogo desviando unilateralmente da estratégia σ: i=1,, n, σ iʹ S i, U i (σ iʹ, σ -i ) U i Exemplo- No dilema dos prisioneiros repetido temos: σ 1 : o, jogador 1 escolhe sempre N µ 2 : o jogador 2 escolhe n nos períodos ímpares e c nos períodos pares U 1 (σ 1, µ 2 )= 1 9δ 1δ 2 9δ 3 = 1(1+δ 2 +δ 4 + ) 9δ(1+δ 2 +δ 4 + )= ( 1 9δ)/(1-δ 2 ) c n C 6, 6 0, 9 N 9,0 1, 1
Exemplo- No dilema dos prisioneiros repetido temos: σ 1 : o, jogador 1 escolhe sempre N c n C 6, 6 0, 9 N 9,0 1, 1 ρ 1 : o jogador 1 escolhe N no período inicial e continua jogando N sempre que 2 tiver jogado n no passado; caso contrário, 1 joga C µ 2 : o jogador 2 escolhe n nos períodos ímpares e c nos períodos pares U 1 (σ 1, µ 2 )= ( 1 9δ)/(1-δ 2 ) U 1 (ρ 1, µ 2 )= 1 9δ +0δ 2 6δ 3 +0δ 4 6δ 5 + = 1 9δ 6δ 3 (1 +δ 2 +δ 4 + )= 1 9δ-6δ 3 /(1-δ 2 )> U 1 (ρ 1, µ 2 ) Portanto, (σ 1, µ 2 ) não é um EN