Análise Estratégica de Investimentos com Teoria dos Jogos

Documentos relacionados

Jogos. Redes Sociais e Econômicas. Prof. André Vignatti

Análise Estratégica de Investimentos com Teoria dos Jogos

Tópicos Especiais em Redes: Introdução a Teoria dos Jogos com Aplicações a Redes de Computadores

Universidade Católica Portuguesa. Faculdade de Ciências Económicas e Empresariais. Tel.: Fax:

PERGUNTAS MAIS FREQÜENTES SOBRE VALOR PRESENTE LÍQUIDO (VPL)

Exercícios Teóricos Resolvidos

Modelos de Jogos: representando uma situação de interação estratégica

CAPÍTULO 10 CONCORRÊNCIA IMPERFEITA. Introdução

Podemos encontrar uma figura interessante no PMBOK (Capítulo 7) sobre a necessidade de organizarmos o fluxo de caixa em um projeto.

Perguntas e Respostas Alteração no rendimento da caderneta de poupança. 1) Por que o governo decidiu mudar as regras da caderneta de poupança?

3 Literatura teórica

SIMULAÇÃO DE GESTÃO EMPRESARIAL

Teoria Básica de Oferta e Demanda

Capítulo 15: Investimento, Tempo e Mercado de Capitais

Plano Aula 10 24/10/ Exercício de Desenvolvimento Pessoal - Vantagem Competitiva Liderança em Custos

Mercados de Publicidade

Pindyck & Rubinfeld, Capítulo 15, Mercado de Capitais::REVISÃO

O ESPAÇO NULO DE A: RESOLVENDO AX = 0 3.2

Exercício sobre Estratégias Mistas

Análise e Resolução da prova de Auditor Fiscal da Fazenda Estadual do Piauí Disciplina: Matemática Financeira Professor: Custódio Nascimento

Este material traz a teoria necessária à resolução das questões propostas.

Pelotas, novembro SIMULADO DE ADM APLICADA À GESTÃO AMBIENTAL Disciplina: Economia. Professor Alejandro Martins. SERÃO 5 QUESTÕES NA AVALIAÇÃO;

Exercícios Resolvidos sobre probabilidade total e Teorema de Bayes

Instrumentos Econômicos: Tributos Ambientais.

Legislação aplicada às comunicações

TAXA INTERNA DE RETORNO (TIR) PERGUNTAS MAIS FREQÜENTES

RESOLUÇÃO CFC Nº /09. O CONSELHO FEDERAL DE CONTABILIDADE, no exercício de suas atribuições legais e regimentais,

COMO INVESTIR PARA GANHAR DINHEIRO

REC 3600 Finanças 1 primeira prova

Levando em conta decisões de investimento não-triviais.

FUNDAMENTOS DA GESTÃO FINANCEIRA

MRP II. Planejamento e Controle da Produção 3 professor Muris Lage Junior

INVESTIMENTO A LONGO PRAZO 1. Princípios de Fluxo de Caixa para Orçamento de Capital

2. São grupos, respectivamente, de crédito na Conta 1 (PIB) e débito na Conta 2 (RNDB) das Contas Nacionais:

1. Uma situação na qual um comprador e um vendedor possuem informações diferentes sobre uma transação é chamada de...

Análise e Resolução da prova de Analista do Tesouro Estadual SEFAZ/PI Disciplinas: Matemática Financeira e Raciocínio Lógico Professor: Custódio

DEBATE: UPP x MERCADO RELEVANTE. Arthur Barrionuevo

Logística e a Gestão da Cadeia de Suprimentos. "Uma arma verdadeiramente competitiva"

Bases Matemáticas. Aula 2 Métodos de Demonstração. Rodrigo Hausen. v /15

Equilíbrio econômico de uma seguradora Francisco Galiza, Mestre em Economia (FGV)

Controle Financeiro. 7 dicas poderosas para um controle financeiro eficaz. Emerson Machado Salvalagio.

Jogos Equilíbrio de Nash

O papel do CRM no sucesso comercial

Utilização do SOLVER do EXCEL

O Princípio da Complementaridade e o papel do observador na Mecânica Quântica

CAP. 2 CONSIDERAÇÕES SOBRE OS CRITÉRIOS DE DECISÃO

Um estudo da correlação dos resultados patrimoniais e operacionais das seguradoras Francisco Galiza, Mestre em Economia (FGV)

Sérgio Carvalho Matemática Financeira Simulado 02 Questões FGV

GASTAR MAIS COM A LOGÍSTICA PODE SIGNIFICAR, TAMBÉM, AUMENTO DE LUCRO

Aula 11 Esperança e variância de variáveis aleatórias discretas

3. Mercados Incompletos

Microeconomia. Prof.: Antonio Carlos Assumpção

Prova de Microeconomia

Engenharia de Software III

A moeda possui três funções básicas: Reserva de Valor, Meio de troca e Meio de Pagamento.

ESTUDO DE VIABILIDADE. Santander, Victor - Unioeste Aula de Luiz Eduardo Guarino de Vasconcelos

1 Introdução. futuras, que são as relevantes para descontar os fluxos de caixa.

CAPÍTULO 2 MATEMÁTICA FINANCEIRA

BCC202 - Estrutura de Dados I

UNIVERSIDADE FEDERAL DO ESPÍRITO SANTO CENTRO UNIVERSITÁRIO NORTE DO ESPÍRITO SANTO DISCIPLINA: ECONOMIA DA ENGENHARIA

Orientação a Objetos

APLICAÇÕES DA DERIVADA

Unidade IV PLANEJAMENTO E CONTROLE. Profa. Marinalva Barboza

DESPESAS FIXAS. O que são Despesas Fixas?

Exercícios resolvidos sobre Definição de Probabilidade

Em meu entendimento, ela foi abaixo das expectativas. Prova fácil, cobrando conceitos básicos de Microeconomia, sem muita sofisticação.

What Are the Questions?

MÓDULO 6 INTRODUÇÃO À PROBABILIDADE

Gestão da Qualidade Políticas. Elementos chaves da Qualidade 19/04/2009

Hoje estou elétrico!

Prof. Cleber Oliveira Gestão Financeira

IFRS TESTE DE RECUPERABILIDADE CPC 01 / IAS 36

Melhores práticas no planejamento de recursos humanos

Mercado de Opções Opções de Compra Aquisição

inclinada, o inverso da elasticidade se aproxima de zero e o poder de monopólio da empresa diminui. Logo, desde que a curva de demanda da empresa não

APURAÇÃO DO RESULTADO (1)

Microeconomia 1 - Teoria da Firma - Parte 2

Microeconomia II. Cursos de Economia e de Matemática Aplicada à Economia e Gestão

Arquitetura de Rede de Computadores

Prof. Cleber Oliveira Gestão Financeira

Perfil de investimentos

4 passos para uma Gestão Financeira Eficiente

UM CONCEITO FUNDAMENTAL: PATRIMÔNIO LÍQUIDO FINANCEIRO. Prof. Alvaro Guimarães de Oliveira Rio, 07/09/2014.

Preparando sua empresa para o forecasting:

CURSO de CIÊNCIAS ECONÔMICAS - Gabarito

LISTA DE EXEMPLOS - PROBABILIDADE

NBC TSP 10 - Contabilidade e Evidenciação em Economia Altamente Inflacionária

PAYBACK - CALCULANDO O TEMPO NECESSÁRIO PARA RECUPERAR O INVESTIMENTO

Microeconomia. Prof.: Antonio Carlos Assumpção

CAPÍTULO 7 - ÁRVORES DE DECISÃO

CAIXA ECONOMICA FEDERAL

Risco e Retorno dos Investimentos. Paulo Pereira Ferreira Miba 507

Módulo 2 Custos de Oportunidade e Curva de Possibilidades de Produção

1.1.1 Instituições: o que são? Aula 2 Instituições: o que são e para que servem? Aula 2 Instituições: o que são e para que servem?

Mercados de Emparelhamento

Planejamento Estratégico

PLANO DE NEGÓCIOS. O QUE É?

ANEXO 1: Formato Recomendado de Planos de Negócios - Deve ter entre 30 e 50 páginas

MS 777 Projeto Supervisionado Professor: Laércio Luis Vendite Ieda Maria Antunes dos Santos RA:

O conceito de probabilidade

Transcrição:

Opções Reais: Teoria e Prática de Análise de Investimentos sob Incertezas Análise stratégica de Investimentos com Teoria dos Jogos Marco Antonio Guimarães Dias, Professor Adjunto, tempo parcial Rio de Janeiro, Outubro de 009. Bibliografia Livros-texto (cobrem apenas parte da matéria): Parte de teoria dos jogos: MWG Mas-Colell, A. & M.D. Whinston & J.R. Green (995): Microeconomic Theory (espec. caps. 7 a 9); OR e Jogos de OR: DP Dixit & Pindyck (994): Investment under Uncertainty (dinâmica da indústria e jogos de OR: caps. 8 e 9). Bibliografia complementar que mais uso em teoria dos jogos: Dutta, P.K. (999): Strategies and Games. MIT Press. Gibbons, R. (99): "Game Theory for Applied conomists". Osborne, M.J. (004): An Introduction to Game Theory. Fudenberg, D. & J. Tirole (99): Game Theory. MIT Press Shy, O. (995): Industrial Organization Theory and Applications. Menezes, F.M. & P. K. Monteiro (005): "An Introduction to Auction Theory". Bibliografia complementar que mais uso em jogos de OR: Huisman, K.J.M. (00): Technology Investment: A Game Theoretic Real Options Approach. Smit, H.T.J. & L. Trigeorgis (004): Strategic Investment Real Options and Games. O Que É a Teoria dos Jogos? A teoria dos jogos modela decisões interdependentes entre agentes que se interagem (conflito ou cooperação). Os agentes podem ser firmas, instituições, coalizões de firmas ou pessoas, países, pessoas, animais irracionais, etc. O escopo de teoria dos jogos é bem amplo, sendo usado em vários ramos das ciências sociais, como economia, mas também ciências biológicas (conflito de animais). Tem livros só com foco em biologia, em direito, finanças, etc. Sendo nosso foco em economia/finanças, vamos discutir a interação estratégica racional entre firmas ou pessoas. Não basta pensar qual a melhor decisão para você, é necessário considerar o que os outros agentes podem fazer e também que eles estão antecipando o que você pode fazer otimamente. É necessário calçar os sapatos do outro jogador, i. é, se colocar no lugar do outro, ver suas alternativas e ver o que ele sabe sobre você. Nossa ênfase será mais normativa, i. é, como o jogo deve ser jogado. Mercado em Competição Perfeita Num mercado em competição perfeita todas as firmas são (ou se comportam como) tomadoras de preço e produzem um mesmo bem homogêneo (commodity). As firmas não exergam uma curva de demanda para maximizar o lucro ajustando quantidades. Podem produzir qualquer quantidade que o preço será o mesmo. Para a firma a curva de demanda (q x P) é uma reta horizontal e a elasticidade da demanda (η) é infinito. O mercado tudo absorve. As firmas não podem ajustar preços para maximizar o lucro, pois a firma nada venderia com um preço maior e um preço menor seria sub-ótimo, já que reduziria seu lucro (ou geraria prejuízo). Já a indústria enxerga uma curva da demanda Q(P) ou gráfico Q x P. É + usada a função demanda inversa P(Q). O preço de equilíbrio num certo instante t é dado pela interseção das curvas de demanda x suprimento da indústria: P P quilíbrio S Q D Q

Mercado em Competição Perfeita Além disso, não é permitido as firmas entrar em colusão p/ maximizar o lucro ajustando o nível de produção Q. O conceito de indústria em competição perfeita independe do número de firmas, pode ocorrer até com só firma. O resultado do duopólio de Bertrand equivale a comp. perfeita. Mas dinamicamente uma indústria converge da competição imperfeita para a perfeita, na maioria dos casos, apenas quando o número de firmas cresce p/ uma grande quantidade de firmas. O resultado clássico (Marshall) mais importante p/ nós é: m competição perfeita, com livre entrada de firmas, o preço em equilíbrio é tal que o VPL da firma entrante é zero. O mercado em equilíbrio com preço P, é condicional ao estado da demanda e da oferta da indústria no tempo t. Depois, essa teoria microeconômica clássica será estendida p/ um modelo dinâmico de competição perfeita. As curvas de oferta e demanda oscilam e logo o preço será estocástico. struturas de Competição num Mercado VPL entrar 0 Perfeita Firma tomadora de preço; Decisão: quantidade a produzir. Oligopólio Idem duopólio. Seqüencial Adaptado de Industrial Organization, O. Shy (995) Tipo de Competição Duopólio Firma tem demanda residual; Decisão: quantidade ou preço. Não-Cooperativo Modelos de líder-seguidor; Decisão: quantidade ou preço. Simultâneo Bertrand Decisão: preço Cooperativo Monopólio Firma vê curva de demanda; Decisão: quantidade ou preço. stático Colusão: tácita ou coordenada. Jogos Repetidos Cournot Decisão: quantidade VPL entrar 0 Imperfeita Dinâmico T. Schelling e o Pensamento stratégico O raciocínio estratégico da T.J. é bem ilustrado a seguir: Prêmio Nobel de 005, T. Schelling se diz só um usuário da teoria dos jogos, mas ele deu várias contribuições: A obra clássica de Thomas Schelling, stratégia do Conflito (960) deu muita intuição sobre conflitos tais como a guerra fria, assim como em outras situações de conflito e cooperação. O conceito de commitment crível: atitudes aparentemente irracionais de eliminar opções para deixar claro o compromisso de que ele irá seguir um caminho, criando uma ameaça crível. x.: caso do conquistador espanhol Cortés, que queimava os próprios navios para deixar claro ao seu pessoal e ao inimigo que a opção de recuar seria impossível. Outro ex.: queimar pontes. Coordenação tácita com o conceito de ponto focal. x.: um casal marca encontro em New York ao meio-dia, mas não especifica o local. Pontos focais: mpire State e Penn Station. Deu contribuições à teoria de barganha (956), especialmente a discussão de ameaças críveis e não-críveis (citei na minha tese). OR e Jogos: Teorias Complementares m jogos de opções reais, o problema de maximização de valor da firma que analisa um investimento, deve considerar a presença de outras firmas como jogadores: Os players reagem otimamente aos processos estocásticos relevantes (exógeno) e às ações das outras firmas (endógeno). Onde endógeno significa que depende do nosso controle ótimo e exógeno não depende (entra como restrição na otimização). A teoria dos jogos é necessária e entra nas condições de contorno (principalmente), com considerações sobre o equilíbrio do jogo. As teorias dos jogos e de OR são teorias complementares: A teoria dos jogos tradicional sozinha ignora os avanços da teoria de finanças sobre risco-retorno e sobre o valor da flexibilidade gerencial sob incerteza (ignora as opções reais). A teoria das opções reais (OR) tradicional sozinha ignora o fato que o exercício de opções pelas outras firmas pode alterar o valor da sua opção real (ignora a interação estratégica). Conceitos de equilíbrio sob incerteza com opções são requeridos.

Conceitos Básicos de Teoria dos Jogos Um jogo pode ser cooperativo ou não-cooperativo: Num jogo cooperativo é permitido aos jogadores fazerem acordos entre si (um contrato, acordo de cavalheiros, etc.) Nos jogos não-cooperativos não são permitidos acordos. Jogos não-cooperativos são mais adequados para modelar a competição e a evolução do mercado (microeconomia). Jogos cooperativos são mais adequados p/ modelar barganha, contratos, a firma, acordos sociais, acordos internacionais... Jogos cooperativos são usados para modelar a firma, por ex. Jogos não-cooperativos usam conceitos de equilíbrio para prever o resultado de um jogo (em geral não são Pareto ótimo). Jogos cooperativos geralmente usam axiomas para estabelecer regras de como se deve jogar. Busca-se o Pareto ótimo. nfocaremos quase que só os jogos não-cooperativos por serem muito mais usados em economia e finanças (em especial a competição) do que os jogos cooperativos. Conceitos Básicos de Teoria dos Jogos Os jogos podem ser classificados como jogos de somafixa e jogos de soma variável (esses são mais relevantes). Regras do jogo (não-cooperativo, se não especificado): Os lances dos jogadores são simultâneos ou alternados? Quem joga e quando? O que cada jogador sabe (conjunto de informação) na sua vez de jogar? O que os outros jogadores sabem nesse instante? Quais as ações e planos (estratégias) possíveis? Resultados e payoffs: para cada conjunto de estratégias, qual é o resultado do jogo? Quanto vale esse resultado? Na teoria dos jogos tradicional, que em muitos casos analisa as decisões de indivíduos, usa-se a função utilidade esperada. Para firmas, a moderna teoria de finanças recomenda usar valores de mercado ou valores de opções reais (ativos reais). Nos jogos de opções reais os payoffs são valores de opções reais. Teoria dos Jogos: Origens e Conceitos A moderna teoria dos jogos começa com Nash em 950 s O chamado equilíbrio de Nash é o conceito mais importante e mais aceito da teoria dos jogos não-cooperativos. É a base de outros equilíbrios (perfeito, Bayesiano, etc.) Nash também formulou a mais importante solução em jogos cooperativos: a solução de Nash para jogos de barganha. Conceitos antigos como o minimax e maximin (ver anexo), vem perdendo o interesse na literatura econômica. Algumas definições básicas de teoria dos jogos. Defini-se estratégia s i do jogador i como uma regra de decisão ou plano contingente completo que descreve as ações a serem tomadas em cada possível evolução do jogo onde o jogador i é chamado a jogar. Se a estratégia for determinística, é chamada de estratégia pura, se probabilística é chamada estratégia mista. As estratégias dos outros jogadores são denotadas por s i. Um jogo é descrito especificando os jogadores, as regras, os possíveis resultados e os valores ( payoffs ) desses resultados. Representação Formal dos Jogos Os jogos não-cooperativos podem ser formalizados e apresentados em dois formatos (a serem detalhados): Na forma normal (ou estratégica), denotada por Γ N, com uma representação por matrizes para os payoffs dos jogadores; Na forma extensiva, denotada por Γ, com uma árvore de jogos. Árvore de jogos é uma árvore de decisão generalizada para múltiplos decisores (os jogadores). Os jogos cooperativos precisam de um terceiro formato: É preciso considerar a possibilidade de coalizões, isto é, subconjuntos dos N jogadores. xistem N coalizões possíveis. As coalizões S N jogam entre si diferentes tipos de jogos e internamente possuem uma regra de divisão do payoff ganho. A forma coalizão, denotada por Γ C, através da definição do par {N; C} no jogo de N jogadores e com função característica C(S). A função característica C(S) representa as possibilidades de cooperação para a coalizão S. É a utilidade total da coalização S (ou riqueza ou poder de S) a ser transferida aos seus membros.

xemplo na Forma Normal ou stratégica xemplo: jogo do par ou ímpar com disputa de R$ stratégias puras para o jog. par Jogador (par) ímpar Jogador (ímpar) par ímpar ; 0 0; 0; ; 0 stratégias puras para o jog. Payoff do jog. Payoff do jog. Veremos que o único equilíbrio do jogo do par ou ímpar é o equilíbrio probabilístico ou em estratégias mistas: cada jogador joga par com 50% de chance e ímpar com 50% chances. Dado um conjunto de estratégias puras S i, uma estratégia mista para um jogador i é uma função σ i : S i [0, ], que assinala a cada estratégia pura s i S i, uma probabilidade σ i (s i ) 0. A soma dos σ p/ todos s i é. Jogo do Par ou Ímpar na Forma xtensiva A forma extensiva é mais usada para jogos dinâmicos e com lances seqüenciais. Mas pode ser usada também p/ jogos com lances simultâneos, como no jogo do par ou ímpar: par Jogador ímpar Jogador par ímpar par ímpar lipse significa que o jog. não sabe em qual dos dois nós ele está. (usa-se tb. reta tracejada) Convenção payoff: jog. pediu par jog. pediu ímpar (; 0) (0; ) (0; ) (; 0) Nos jogos simultâneos ou de informação imperfeita, usa-se uma elipse circundando os nós do mesmo conjunto de informação. Se o jogo fosse de lances alternados, o jogador saberia em que nó ele estaria e poderia ganhar $ com a melhor resposta. Jogos Dinâmicos de Opção Jogos dinâmicos envolvem seqüências de ações. Constitui a maioria dos jogos de opções reais. x.: jogo de opção real com duas firmas. las decidem de forma seqüencial se exercem () ou não exercem (N) uma opção de entrar. Os payoffs são valores de opções. D i valor em duopólio da firma i e M i valor em monopólio de i. (D ; D ) (M ; 0) Firma Firma N N (0; M ) N Note que na forma normal não se poderia capturar a dinâmica do jogo. Por isso é necessária a forma extensiva. Aqui o jogo é de informação perfeita, pois a firma decide sabendo o lance jogado pela firma. (0; 0) Conceitos Básicos de Teoria dos Jogos Um jogo é dito de informação perfeita se cada conjunto de informação só contém um nó de decisão da árvore. Caso contrário é dito de informação imperfeita. x.: pôquer. Já o jogo de xadrêz é exemplo de jogo de informação perfeita. Algumas premissas usuais em teoria dos jogos: O jogo é assumido ser de memória perfeita ( perfect recall ), i. é, uma jogadora nunca esquece a informação que sabia antes de chegar até aquele estágio do jogo. Também se assume conhecimento comum ( common knowledge ), i. é, cada jogador conhece a estrutura do jogo (inclusive os valores) e sabem que os outros também conhecem, que sabem que os outros sabem que eles conhecem, etc. Um perfil de estratégias puras de um jogo com J jogadores é um vetor s (s, s, s J ) em que s i é escolhida pelo jogador i. Pode ser escrito como (s i, s i ) para ressaltar o ponto de vista de i em relação aos outros J jogadores.

stratégia Dominante e o Dilema dos Prisioneiros stratégia dominante é uma estratégia que é ótima para um jogador independentemente da(s) estratégia(s) escolhida(s) pelo(s) outro(s) jogador(es) (s i ). quilíbrio com estratégias dominantes é quando cada jogador possui e joga a sua estratégia dominante. x. clássico a seguir. O dilema dos prisioneiros é um jogo clássico que ilustra a não-cooperação como equilíbrio com estratégia dominante. Dois ladrões são presos e colocados em salas separadas. Para cada ladrão, o detetive propõe que ele confesse o crime e sirva de testemunha contra o outro. Se um dos ladrões confessar o crime e o outro não, aquele que confessou será posto em liberdade e o outro cumprirá pena de 0 anos. Se os dois confessarem, ambos ficarão presos por 3 anos. Se nenhum dos dois confessarem, a penalidade será de apenas um ano. Qual o resultado mais provável do jogo? Note que se eles pudessem se comunicar e fazer acordos críveis de serem cumpridos, a estratégia cooperativa (não-confessar) seria a melhor para ambos. Sem acordo, só há o incentivo de trair o outro. O Jogo Dilema dos Prisioneiros Os payoffs são anos de cadeia com sinal negativo. Assim, valores mais próximos de zero são os preferíveis. Prisioneiro confessa (não-coopera) não confessa (coopera) confessa (não-coopera) Prisioneiro não confessa (coopera) 3; 3 0; 0 0; 0 ; O equilíbrio é em estratégias dominantes (um caso particular de equilíbrio de Nash) e é muito comum em várias situações sociais (ex.: a tragédia dos comuns). Dilema dos Prisioneiros: O Jogo da Propaganda Um exemplo de dilema dos prisioneiros na área de decisão de investimentos é o jogo da propaganda. Cenário: Duas firmas concorrentes, Firma e Firma, têm de decidir quanto gastar em propaganda. stratégias: muita propaganda, pouca propaganda. Os resultados são mostradas abaixo: Jogador muita pouca Jogador muita pouca 4; 4 0; ; 0 6; 6 quilíbrio em estratégias dominantes: Nesse jogo, ambas as firmas têm a mesma estratégia dominante. Dessa forma, o resultado do jogo é (4; 4). Dilema dos prisioneiros: o equilíbrio não é Pareto ótimo, não é o resultado que os jogadores escolheriam se eles pudessem cooperar de forma crível. Dilema dos Prisioneiros: História e Relevância O dilema dos prisioneiros é talvez o jogo mais conhecido porque é uma situação que se repete muito em economia, política e em outros ramos de conhecimento. Apesar de existir ganhos de cooperação, cada jogador tem um incentivo de não-cooperar para qualquer estratégia do outro. Um ex. em política é a corrida nuclear: apesar de construir bombas ser caro, muitos países querem evitar a pior situação (menor payoff) que seria o outro país ter a bomba e ele não ter. Outro exemplo é a chamada Tragédia dos Comuns, um caso clássico de sociologia, em que apesar da cooperação gerar benefícios, frequentemente ela não ocorre. Ver slides do anexo. O esquema dilema dos prisioneiros surgiu em jan/950 quando os profs. M. Dresher e M. Flood usaram ele para criticar o então novo conceito de equilíbrio de Nash (N). Veremos que o resultado desse jogo é um caso particular de N A estória original é de A. Tucker (950), orientador de Nash.

O Jogo do Aquecimento Global Outra aplicação do dilema dos prisioneiros é o drama do aquecimento global. A cooperação (redução de emissões) é melhor para todos, mas os países não reduzem as emissões. No discurso, todos dizem que é urgente impedir o aquecimento global, mas poucos realmente se comprometem com isso. Na prática o que eles dizem é que é urgente que todos os países, exceto o deles, reduzam as emissões. Ou seja, querem ter o benefício da redução de emissões, sem ter o custo de reduzir o crescimento econômico do seu país. Com a maioria dos países se comportando segundo os seus próprios interesses, o resultado deve ser o desastre ambiental, embora seja Pareto ótimo a cooperação. É o dilema dos prisioneiros. VernomaterialoartigotraduzidodoTheconomist: Quem perde e quem ganha no jogo do clima? sse problema gerado pelo dilema dos prisioneiros pode ser solucionado com jogos repetidos (a ser visto) e com a introdução de estratégias de punição e recompensa. stratégia de Melhor Resposta Seja V i (σ i, σ i )ovalordaestratégiamistaσ i para o jogador i quando os demais jogam as estratégias mistas σ i.aestratégiaσ i éamelhor resposta deiparaoperfil σ i de J estratégias mistas dos outros jogadores se: V i (σ i, σ i ) V i (σ i, σ i ), para qualquer σ i (S i ) (S i )éoconjunto simplex do conjunto das estratégias puras S i. O simplex é uma extensão do conjunto de estratégias puras S i que assinala probabilidades a todas as M estratégias puras disponíveis para o jogador i. A definição de estratégia pura de melhor resposta é similar. A estratégia pura pode ser vista como uma estratégia mista degenerada (prob. p/ uma estratégia e zero para as demais) O conceito de melhor resposta é importante, pois será visto que o equilíbrio de Nash pode ser visto como um ponto fixo de estratégias de melhor resposta simultânea. quilíbrio de Nash (950) O perfil de estratégias s (s,s, s J )éumequilíbrio de Nash (N) em estratégias puras de um jogo se, para todo jogador i,,, J, vale a desigualdade: V i (s i, s i ) V i (s i, s i ), para qualquer s i S i O N implica que as estratégias que fazem parte desse equilíbrio são simultaneamente as melhores respostas para todos os jogadores. sse é um resultado fundamental. Dessa forma, não há incentivo para nenhum jogador desviar desse equilíbrio, unilateralmente. x.: dilema dos prisioneiros. Para saber se é equilíbrio de Nash, basta fazer a seguinte pergunta a cada jogador separadamente: mudando a sua estratégia você ficaria melhor (aumentaria V i )? Se as respostas de todos os jogadores forem negativas, então é um N. A definição de N para estratégias mistas é similar à apresentada. Para se testar se o perfil σ é N, basta testar desvios de σ para as estratégias puras s. Se não houver incentivo para desviar, σ é N. q. de Nash: Competição Internacional mbraer x Bombadier no mercado de jatos executivos Suponha que sem subsídios para a Bombadier, a matriz de payoffs para a fabricação de um novo modelo de jato é: mbraer Desenvolve Não Desenvolve Desenvolve Bombadier Não Desenvolve 0; 0 00; 0 0 ; 00 0; 0 Ou seja, dois N em estratégias puras (e um N em estratégias mistas). Na prática, existem os riscos de ambos desenvolverem o jato e terem prejuízo, ou não investirem.

Mercado de Jatos xecutivos com Subsídios Agora suponha que o governo do Canadá dá $ 0 de subsídio para a Bombadier para desenvolver jatos executivos (ex.: taxas de juros abaixo do mercado). A nova matriz de payoffs mostra a mudança do N: mbraer Desenvolve Não Desenvolve Desenvolve Bombadier Não Desenvolve 0; +0 00; 0 0; 0 0; 0 Ou seja, o subsídio fez com que a estratégia investir (desenvolver o projeto de jato executivo) se tornasse estratégia dominante para a Bombadier. O único N é a Bombadier sozinha no mercado. Jogos Repetidos: Cooperação é Possível No dilema dos prisioneiros vimos que não é equilíbrio {cooperar; cooperar}, mesmo sendo Pareto dominante. No entanto, foi assumido que o jogo é jogado apenas uma vez. xistem casos em que o jogo pode ser repetido pelas firmas e o resultado {cooperar; cooperar} pode ser N. Com a repetição, cada firma pode criar reputação sobre o seu comportamento e aprender sobre o comportamento dos rivais. Ocorre no caso de poucas firmas, com demanda e custos estáveis. studos experimentais tais como torneios de repetidos dilema de prisioneiros, mostra que a estratégia tit-fortat (retribuição/retaliação) pode sustentar a cooperação Tit-for tat: estratégia é cooperar no instante inicial e continuar cooperando enquanto o outro coopera. Retaliar (não cooperar) se o outro não-coopera. Voltar a cooperar se o outro o fizer. Teoremas populares ( folk theorems ) para jogos repetidos infinitamente, mostram que a cooperação pode ser N. quilíbrio de Nash (N): Notas O conceito de equilíbrio de Nash (N) pode ser intepretado e usado de várias maneiras: Normativo: aconselhar todos os jogadores. O conselho tem de ser equilíbrio no sentido de ter relativa estabilidade, não sendo ótimo para um jogador ganhar mais ao não seguir o conselho. N é melhor resposta simultânea e não há incentivo em desviar. Predição: Num processo dinâmico de ajustes, o N pode ser interpretado como um ponto estável. Muito usado em biologia. Sustentabilidade: é um acordo self-enforcing (de autocumprimento), pois não precisa de ajuda externa para manter ao ser do próprio interesse de cada jogador seguir o N. O conceito de N ajudou a deixar claro a distinção entre jogos não-cooperativos e jogos cooperativos: m jogos cooperativos há acordos que podem ser forçados (em tribunais, contratos, etc.) m jogos não-cooperativos não há tais mecanismos só resultados de equilíbrios são sustentáveis. q. de Nash: xercício & xperimento sse exercício é interessante como um experimento que pode ser feito em sala de aula, mas que você pode fazer numa roda de amigos(as) e/ou familiares. Ilustra a necessidade do pensamento estratégico para tomada de decisão. Ou seja, tem de pensar no que os outros farão, etc. Peça para cada participante escrever o seu nome e um número entre zero e 00 numa folha de papel. Informe antes que o ganhador do jogo será aquele que escrever o número mais próximo da metade da média dos números escritos. Após a primeira rodada, conhecido o vencedor e o valor médio, peça a todos que joguem novamente o jogo. O que ocorreu com a média e o lance vencedor, dado a lição obtida com o resultado da primeira vez que foi jogado? Determine o equilíbrio de Nash (N) desse jogo.

Jogo Assurance ou Stag-Hunt O jogo Stag-Hunt e suas variantes, também conhecidas como assurance game (jogo da garantia) ou jogo de coordenação ou dilema da confiança, tem sido usado para modelar conflitos sociais (ex.: livro de Brian, 004, Stag Hunt and volution of Social Structure ). Mostra o dilema entre a segurança x cooperação social. stória (Rousseau): dois caçadores podem caçar uma lebre (hare) ou um cervo adulto (stag). A lebre pode ser caçada por uma só pessoa, mas o cervo necessita dos dois (cooperação). Jogo tem dois N em estratégias puras (e um em est. mistas), sendo um risco dominante e outro payoff dominante. x.: Caçador Cervo Lebre Cervo 4 ; 4 0 ; 3 Caçador Lebre 3 ; 0 3 ; 3 Software Para Jogos na Forma Normal Um dos programas disponíveis na internet para resolver jogos na forma normal é um applet Java que fica em: http://www.gametheory.net/mike/applets/normalform/normalform.html xiste também uma versão em português (link na pág. acima). O applet acha os equilíbrios para jogos de jogadoras com até 4 estratégias puras (matrizes até 4 x 4) e estratégias mistas só para o caso de matriz x. Ver abaixo o ex. batalha dos sexos. le permite carregar alguns exemplos clássicos já prontos: Software Mais Geral de Teoria dos Jogos O software Gambit é um software mais geral que resolve jogos na forma normal e na forma extensiva. Mesmo na forma normal, permite mais de dois jogadores e é menos limitado que o anterior. scrito em C++, tem interface amigável para Windows. Última versão jan/007. Webpage do Gambit: http://gambit.sourceforge.net/ Inclui links para download e documentação (com arquivos de exemplos). xs. de janelas (formas normal e extensiva): Preços e Curva de Demanda Inversa A curva de demanda de um produto relaciona preços com a demanda. Preço mais baixo tem maior demanda e preço alto tem menor demanda. No duopólio, as firmas têm como dado uma função demanda inversa p f(q T ): o preço do produto é função da produção da indústria Q T q + q. As estratégias das firmas são q e q. Ver os gráficos das curvas de demanda exponencial e linear (planilha). Nas figuras aparecem duas curvas de demanda, uma delas elevada refletindo uma economia aquecida (vermelha) e a outra mais baixa, refletindo um desaquecimento do consumo (curva azul).

Competição por Quantidades em Duopólio Duas firmas dividem um mercado geográfico de um produto. quilíbrio de Cournot (838): simultaneamente e de forma independente os jogadores escolhem as quantidades, e o preço é tal que o total ofertado é igual a demanda. Veremos que o resultado de Cournot é um N único para esse jogo em que as estratégias são quantidades escolhidas simultaneamente. Curva de reação de Cournot: especifica a produção ótima de uma firma em função das possíveis produções da outra firma. quilíbrio de Stackelberg: sequencialmente, em dois estágios, uma firma (líder) estabelece sua produção e depois a outra firma (seguidor), observando o líder, estabelece a sua própria produção. A produção e o lucro no modelo de Stackelberg são maiores para o líder e menores para o seguidor (vantagem de jogar primeiro). O líder maximiza o lucro dado a curva de reação do seguidor. Iremos ver depois que esse resultado é um N perfeito em subjogos para o jogo seqüencial em que as estratégias são quantidades. Mas ele tem problemas de inconsistência temporal: não é N se o jogo continuar após a entrada do seguidor (há incentivo p/ desviar). Monopólio com Demanda Linear Dada a relação - entre preço e quantidade estabelecida na curva de demanda, um monopolista pode escolher ou preço ou quantidade a produzir, mas não ambas. O monopolista irá maximizar o lucro seja usando o preço ou usando a quantidade como variável de controle. Seja uma curva de demanda linear (a mais usada) dada por p a b Q. Assuma que o custo fixo do monopolista é zero e o custo variável é c. O lucro do monopolista é: π M p Q c Q π M (a b Q) Q c Q (a c) Q b Q. Para maximizar o lucro usa-se a condição de ª ordem (CPO): π M / Q 0 (checar a de ª ordem: π M / Q < 0). Os valores obtidos (quantidade, preço e lucro, respectiv.) são: q M a c b pm a+ c π M (a c) 4b Duopólio em Quantidades de Cournot No problema da escolha ótima de quantidade q i, a(s) firma(s) resolvem problemas de maximização de lucro π i. Para maximizar o lucro usa-se a condição de ª ordem (CPO): π i / q i 0 (checar a de ª ordem: π i / q i < 0). No caso do duopólio, o equilíbrio de Nash-Cournot é obtido com ambas as firmas escolhendo as quantidades que maximizam o lucro, considerando no problema de otimização que a firma rival estará fazendo o mesmo. Pois o N é a melhor resposta simultânea (não há incentivo para nenhum jogador desviar se estiver sendo jogado o N) e é assumido conhecimento comum (a firma sabe que a outra...). Melhor resposta simultânea: curvas de melhor resposta se cruzam. Se o custo operacional (fixo + variável) de cada firma é C i (q i ) e a função demanda é p(q T ), as funções lucros são: π q p(q T ) C (q ) e π q p(q T ) C (q ) Duopólio em quilíbrio de Nash-Cournot Seja uma curva inversa de demanda linear (por ser mais simples, é a mais usada), onde os preços são dados por: p(q T ) a b Q T p(q T ) a b (q + q ), com q 0 ; q 0 ; e a e b tal que p > 0 Se o custo fixo é zero, a função lucro da firma i ( ou ) é: π i q i a q i b (q + q ) c i q i q i (a c i ) q i b (q + q ) Onde c i é chamado de custo operacional variável da firma i. A curva de reação ou curva de melhor resposta da firma i (i ; ) em relação a produção da firma j (j i), q i *(q j ), é obtida com a condição de ª ordem (CPO). A interseção das duas curvas de reação, q *(q ) e q *(q ), é o ponto de melhor resposta simultânea é N! Para tal, basta substituir a curva de melhor resposta de uma na da outra, isto é, obter q *(q *) e q *(q *). O par {q *(q *); q *(q *)} é N (próx. slide):

Competição de Cournot em Duopólios Nesse caso com custo fixo igual a zero e demanda linear, as curvas de reação q i *(q j ), os lucros π i, o preço e as quantidades em N-Cournot {q *(q *); q *(q *)} são: Funções melhor resposta (reação): q(q) a c b q b a c b q b q(q) Curvas de Reação em Cournot A curva de reação da firma (jogador) dá a melhor resposta q a cada possível estratégia q da firma. q Solução de Monopólio (só firma produz) Funções Lucro em N-Cournot: Preço em N-Cournot: Quantidades em N (estratégias em N): p N-C a b Q q(q) N-C T a c + c 3b * * a+ c + c 3 q(q) a c + c 3b * * Assim, quanto menor o seu próprio custo e maior o custo do oponente, maior o seu lucro e a sua produção no N-Cournot (como esperado). Como a > c i, o preço em N é maior que o custo médio das firmas. Os gráficos a seguir ilustram o cruzamento das curvas de reação (N). a c b Curva de Reação q *(q ) Produção q equivale a Competição Perfeita (firma não produz) a c q b A curva de reação da firma é similar (troca os eixos dos X com os dos Y). Girando um dos gráficos (para que os eixos coincidam) poderemos ver o cruzamentos das curvas ( N), ver slides: Curvas de Reação em Cournot A curva de reação da firma (jogador) dá a melhor resposta q a cada possível estratégia q da firma. Curvas de Reação e N em Cournot O cruzamento das curvas de reação é o ponto em que temos melhor resposta simultânea N. q q q q a c b Girando Curva de Reação q *(q ) a c b Curva de Reação q *(q ) Curva de Reação q *(q ) a c b a c b a c b Curva de Reação q *(q ) N-Cournot Curva de Reação q *(q ) a c b q q a c b b q a c b a c b q

xemplo Numérico: Competição por Quantidades Considere uma curva de demanda inversa linear, dada pela equação: p 30 Q T (ver planilha duopolio_sob_certeza.xls) Por simplicidade, seja o custo variável igual a zero, ou, de forma alternativa, considere p a margem de lucro operacional. A função lucro π i da firma i é a margem vezes as vendas: π i p q i (30 Q T ) q i Na competição perfeita, as firmas irão produzir até a margem p cair a zero (logo, produzirão q q 5 Q T 30 p 0); No monopólio, a única firma escolhe Q T p/ maximizar o lucro (derivada do lucro π em relação à produção 0 Q T 5); e Colusão é quando as firmas se juntam e agem como monopólio Vimos que no duopólio onde as estratégias simultâneas são quantidades, o equilíbrio de Cournot é o N do jogo. A curva de reação da firma i é obtida pela maximização π i / q i 0, que dá as curvas de melhor resposta q i f(q j ) p/ cada jogador. O cruzamento dessas curvas é o N de Cournot (ponto fixo). Duopólio: Vários Possíveis Resultados Para entender os possíveis equilíbrios, serão plotadas as curvas de reação das duas firmas, i. é, as funções melhor resposta dos dois jogadores dada as estratégias das outras firmas. Uma solução de Colusão Curva de Contrato Curva de Reação da Firma (vale para Cournot e Stackelberg) quilíbrio de Stackelberg quilíbrio Competitivo quilíbrio de Cournot Curva de Reação em Cournot, Firma (*) Margem depois da entrada do seguidor. Antes da entrada do seguidor a margem do líder é p 30 5 5 margem da colusão. Lucro π i (30 Q T ) q i Margem p 30 Q T Cournot em Oligopólios: N Firmas Seja o caso de oligopólio com N firmas (N > ) com decisão simultânea competindo em quantidades (Cournot). Considere as N firmas homogêneas (mesmo custo unitário c) e demanda linear (custo fixo 0). A produção de cada firma e a produção total da indústria em N-Cournot é (basta resolver para firma homogênea): a c q i q (N + ) b Q q N q T i N (a c) (N + ) b O preço de equilíbrio no mercado ( market clearing price ) é: a + N c (a c) p Já o lucro de cada firma é: π i b q i N + (N + ) b Agora podemos ver o que ocorre no mercado quando N : a c lim Q T lim p c N N b Que são os resultados do caso de competição perfeita sem custo de entrada para produção e preço ( custo marginal; lucro 0). Comparação dos Modelos A produção da indústria é maior em competição perfeita (cp) do que em Cournot (C) que é maior que a do monopólio (m): (a c) N (a c) (a c) Q cp > Q C > Q m b (N+ ) b b Além disso, em Cournot a produção da indústria Q aumenta com a competição (n o de firmas N) e no limite tende a c.p.: Q C (a c) > 0 (a c) lim Q C Qcp N (N+ ) b N b Já o preço é o contrário: o maior é em monopólio, seguido de Cournot, e o menor preço é competição perfeita ( custo c): a + c a + N c p m > p C > p cp c N + A competição (N grande) reduz o preço: p C (a c) N (N + ) < 0 (pois a > c) xercício: mostre que o lucro da indústria tem a mesma ordenação acima para o preço e que diminui com N.

Oligopólio de Cournot em Fusões & Aquisições Para ilustrar o caso de N firmas em Cournot, imagine um mercado petroquímico com 4 firmas homogêneas. Uma onda de fusões e aquisições fez com que o mercado fosse reduzido de 4 para firmas, também homogêneas. Assuma que existam barreiras de entrada de produtos de firmas estrangeiras devido a custos de transporte e tarifas alfandegárias, de forma que só essas firmas competem. Isso é realista no Brasil apenas dentro de certos limites de preços. Assuma que a curva de demanda do mix de produtos é linear e dada por p 80 8 Q T, onde p preço do mix de produtos e o custo médio unitário é c 70 $/unidade. Determine os preços, quantidades e lucros em equil. de Nash- Cournot antes e depois das fusões. Quem ganha e quem perde? Agora considere que as fusões permitiram uma redução de custo unitário para c 60 $/unidade. Quais são os novos preços, quantidades e lucros? Use a planilha oligopolio.xls. Oligopólio de Cournot em Fusões & Aquisições Os resultados do caso de fusões sem reduzir custos são: Assim, as firmas ganharam com as fusões, mas em detrimento da renda dos consumidores (maiores preços). Os resultados do caso de fusões com redução de custos são: Ainda assim os preços subiram, embora menos que o caso anterior. Qual seria a redução de custo necessária para que os preços ao consumidor não aumentem? R: c 48 $/unid. Jogos Dinâmicos Até aqui vimos só jogos estáticos, onde os jogadores se encontravam uma só vez, o tempo não era uma variável. Agora serão vistos jogos dinâmicos onde o tempo é relevante e/ou os jogadores se encontram várias vezes. Os jogos dinâmicos podem ser jogos repetidos ou não-repetidos. Os jogos dinâmicos podem ser determinísticos ou estocásticos. Antes, os elementos ação e estratégia se confundiam, mas em jogos dinâmicos é necessário lembrar a diferença: Uma estratégia s i do jogador i é um plano completo de ações tal que especifica uma ação factível a i, c em cada contingência c na qual o jogador i possa ser chamado a jogar. Cada contingência c pode ser interpretada como cada instante t. A ação de um jogador pode ou não ser observável pelo(s) outro(s). Para analisar jogos dinâmicos precisamos do conceito de quilíbrio de Nash Perfeito em Subjogos (NPS). Refinamentos do N: quilíbrio Perfeito O grande problema prático do N é que geralmente se têm múltiplos Ns. Isso é freqüente em jogos dinâmicos. A pergunta natural é: qual o equilíbrio que deve prevalecer? m jogos dinâmicos, o conceito de N não consegue eliminar várias estratégias não-críveis. É necessário adicionar uma racionalidade seqüencial no caminho do equilíbrio. Princípio da racionalidade seqüencial: a estratégia de um jogador deve especificar ações ótimas em todos os pontos da árvore de jogos. Selten (965) introduziu o conceito de equilíbrio de Nash perfeito em subjogos (NPS) para jogos dinâmicos. NPS usa o princípio da racionalidade seqüencial e o conhecido processo de otimização backwards (retro-indução): stabelece primeiro as estratégias ótimas nos nós terminais e depois vai estabelecendo as estratégias ótimas nos nós anteriores. O precursor foi o teorema Zermelo (93) que pode ser enunciado assim todo jogo finito de informação perfeita tem um N em estratégias puras que pode ser obtido através de retro-indução.

Subjogos Antes de definir o NPS é necessário definir subjogo: Subjogo é um subconjunto do jogo Γ com as propriedades: (a) começa num conjunto de informação que contém apenas um nó de decisão e contém todos os nós sucessores; (b) não há conjuntos de informação quebrados, i. é, se o nó de decisão x está no subjogo, então cada nó x H(x) (i. é, o conjunto de informação onde está x) também estará no subjogo. Todo jogo tem pelo menos um subjogo que é o próprio jogo. Firma (D ; D ) (M ; 0) Firma N N (0; M ) N não é subjogo (não contém todos os nós sucessores) (0; 0) subjogo Quantos subjogos existem? R: 3 subjogos. Subjogos xemplo da segunda condição para ser subjogo: sse jogo só tem um único subjogo que é o próprio jogo. Pode ser interpretado como um jogo simultâneo ou como um jogo seqüencial onde a ação da firma não é observável. (D ; D ) (M ; 0) Firma Firma N N (0; M ) N (0; 0) Informação imperfeita x incompleta. Não é subjogo, pois não pode haver conjuntos de informação quebrados. Caso acima é informação imperfeita. Veremos depois o outro caso. quilíbrio de Nash Perfeito em Subjogos O perfil de estratégias σ (σ, σ, σ J ) no jogo na forma extensiva Γ é um quilíbrio de Nash Perfeito em Subjogos se ele induz um N em cada subjogo de Γ. No jogo finito com informação perfeita ele pode ser obtido backwards e o Teorema de Zermelo diz que existe o NPS. O NPS é único caso nenhum jogador tenha os mesmos payoffs em nós terminais quaisquer. Faremos um exemplo numérico. xiste uma ligação estreita óbvia entre o conceito de NPS e o de programação dinâmica: ambos usam otimização backwards. Para determinar o NPS inicia-se procurando o(s) N nos nós terminais, substitui-se esse subjogo pelos payoffs do N e analisa o sujogo predecessor, procurando o N, etc., até chegar ao início. Nos casos de jogos infinitos, a definição de NPS permanece no sentido de que induz N em todos os subjogos, apesar de não ter a última data para trabalhar backwards. Faremos um exemplo. Trabalhar com horizonte infinito é fácil, pois o tempo deixa de ser variável de estado (sempre terá um horizonte infinito pela frente). quilíbrio de Nash Perfeito em Subjogos Jogo abaixo: a forma normal mostra que existem dois N. Forma extensiva mostra que só um é NPS. 0 3 ½ U L u D R - - d - Dois N em estratégias puras (ver forma normal). Mas um deles não é crível (não é sequencialmente racional). Um NPS em estratégias puras: (DL ; u). É o N crível. UL UR DL DR 0 0 ½ - u 3 3-0 0 d 3 3 - -

Procedimento Backward Induction O procedimento de retro-indução (backward induction) é: ➊ Começe nos nós terminais do jogo e identifique quem joga. ➋ Ache a decisão ótima do jogador nos nós de decisão comparando os payoffs que os jogadores recebem em cada nó terminal. Registre essa escolha, ela é parte da estratégia ótima dos jogadores. ➌ Podar a árvore cortando todos os ramos que se originaram de #. Atribuir a cada um desses novos nós terminais os payoffs obtidos quando a ação ótima é realizada nesse nó. ➍ Uma nova árvore de jogo existe e é menor que a original. ➎ Se não existirem mais nós de decisão, o jogo termina. Se ainda existirem nós de decisão, aplicar os passos # a #4 até não haver mais nós de decisão. ➏ Para cada jogador, selecione as decisões ótimas em cada nó. sse conjunto de decisões constitem as estratégias ótimas desse jogo. O resultado é um equilíbrio de Nash perfeito em subjogos. O NPS pode ser único ou não (mesmo payoff em nós de decisão). x: Barreira de ntrada com xcesso de Capacidade O caso a seguir é uma variante do modelo de Stackelberg de líder e seguidor (caso mais geral é visto em seguida). A motivação desse exemplo é um famoso caso de 945: o processo antitrust contra o poder de monopólio da Alcoa, que dominava 90% do mercado de alumínio nos UA. A Alcoa foi condenada porque o juiz entendeu que o rápido acúmulo de capacidade de produção por parte da Alcoa, que excedia muito os níveis de demanda, tinha como objetivo criar uma barreira de entrada para inibir a entrada de competidores. Veremos que a teoria dos jogos e o NPS pode justificar a decisão do juiz americano, assim como o argumento usado. Suponha que duas firmas estão considerando entrar ou não no mercado, e também como (capacidade) entrar. Seja P o preço de equilíbrio e Q T a produção total da indústria que aqui é a soma das produções das duas firmas q + q. Barreira de ntrada com xcesso de Capacidade Seja uma curva de demanda inversa linear dada por: P 900 Q T ou P 900 q q Assuma que existem só duas alternativas de investimento em capacidades: pequena e grande. A unidade pequena demanda um investimento I p US$ 50.000 e permite produzir 00 unidades. A unidade grande teria de investir I g US$ 75.000 e permitiria produzir qualquer quantidade de unidades. Assim, só a unidade pequena é que tem restrição de capacidade. Suponha que em ambos os casos o custo operacional é zero. Assuma que a entrada das firmas é seqüencial: Primeiro a firma decide se entra e com que capacidade e depois a firma, observando a ação da firma, decide se entra ou não e com que capacidade. Determine o quilíbrio de Nash Perfeito em Subjogos (NPS). Barreira de ntrada com xcesso de Capacidade Para achar o NPS, vamos fazer alguns cálculos: Suponha que a firma i está sozinha no mercado. Assim, o preço duma unidade é P 900 q i e a receita R i q i (900 q i ). O lucro de i é maximizado escolhendo q i 450, que dá uma receita ( lucro oper., pois o custo oper. 0) de R* i 0.500. Mas a firma i só produz 450 se ela investir na unidade grande. Se ela investiu na unidade pequena, ela só produziria 00 e só obteria uma receita (lucro) de R 80.000. Suponha que esses valores estão todos em valor presente, de forma que os VPLs dos dois casos anteriores seriam: Unidade grande: VPL g R I g 0.500 75.000 $ 7.500. Unidade pequena: VPL p R I p 80.000 50.000 $ 30.000. Agora suponha que ambas as firmas estão no mercado. Assim, a receita da firma i é R i q i (900 q i q j ). A função melhor resposta de i é dada pela condição de primeira ordem: R i / q i 0 q* i 450 q j /. Resolvendo o sistema q* 450 q* / e q* 450 q* / obtemos q* q* 300.

Barreira de ntrada com xcesso de Capacidade sse cálculo considera que ambas as firmas não têm restrição de capacidades (investiram em unidades grandes). Nesse caso sem restrição e com as duas firmas no mercado, as firmas teriam receitas R i (900 300 300) 300 90.000. Nesse caso os VPLs seriam negativos: VPL VPL 90.000 75.000 VPL VPL 85.000. Se ambas as firmas estão no mercado, mas com capacidade restrita, a receita será R i (900 00 00) 00 70.000. Logo, VPL VPL 70.000 50.000 VPL VPL 0.000. Se ambas as firmas estão no mercado, uma (i) com capacidade sem restrição e a outra (j) com capacidade restrita, então a que não tem restrição produziria no ótimo q* i 450 00/ 400. Logo, o preço será P 900 400 00 400; as receitas das duas firmas serão: R i 400 x 400 60.000 e R i 400 x 00 40.000. Os VPLs serão: VPL i 60.000 75.000 VPL i 5.000 e VPL j 40.000 50.000 VPL j 0.000. Assim, uma análise não-estratégica recomendaria entrar com a planta pequena ou não entrar. Mas análise estratégica dará outro resultado! Barreira de ntrada com xcesso de Capacidade sse jogo seqüencial é mostrado na forma extensiva, onde N não-entrar; P entrar com capacidade pequena; e G entrar com capacidade grande. N (0; 0) Firma P (0; 30) Firma N P G Firma Firma G N P G N P G (0; 7,5) (30; 0) (0; 0) ( 0; 5) (7,5; 0) ( 5; 0) ( 85; 85) Backwards: Primeiro a escolha ótima da firma em cada subjogo terminal. Barreira de ntrada com xcesso de Capacidade Agora podemos substituir os subjogos terminais pelo payoff advindo da escolha ótima da firma. Com isso ficará claro a escolha ótima da firma. Firma N P G (0; 30) (0; 0) (7,5; 0) A firma escolhe a ação ótima nesse subjogo, considerando as respostas ótimas da firma. Assim, o único NPS é o par de estratégias (G; N), ou seja, a firma entra com capacidade grande e a firma não entra no mercado. Com isso, temos um monopólio! sse resultado é interessante, já que sem competição (sem a firma ameaçar entrar), o ótimo para a firma seria entrar com uma capacidade pequena (VPL 30 > 7,5). Logo, o excesso de capacidade inibiu a entrada do competidor! xemplo : quilíbrio de Stackelberg Stackelberg: entrada em um mercado com competição em quantidades e com ações seqüenciais, i. é, primeiro entra a firma (líder) com q e depois, observando a quantidade q, entra a firma (seguidor) com q *(q ). Firmas iguais com custo marginal c. As firmas já têm capacidades irrestritas. Demanda p(q) a b Q. Determine o único NPS. Firma Firma 0 q q 0 q q (π ; π ) Lembrando: em jogos dinâmicos finitos buscase o NPS por retro-indução ( backwards ). Assim, primeiro verifica-se o q ótimo para a firma, dado que a firma já entrou com q. A firma observou q e a melhor resposta da firma é a sua curva de reação q *(q ). A firma sabe que a firma irá observar o valor q e sabe que a rival irá jogar q *(q ). Assim, basta a firma jogar q * de forma a maximizar π, dado que a rival joga q *(q ).

xemplo: quilíbrio de Stackelberg Vimos que a função lucro π da firma e a curva de reação q *(q ) da firma p/ C i (q i ) c i q i, são dadas por: π q P(Q T ) C (q ) π q (a c ) q b (q + q ) * a c b q Firmas * a c b q q(q) b homogêneas q(q) b Assim, temos um problema de maximização de π, escolhendo q e substituindo q pela função q *(q ): a c b q Max P(q + q(q)) q C(q) q Max q (a c) b q (q + ) q b Aplicando a CPO (condição de primeira ordem) π / q 0: * (a c) * (a c) q q b 4 b xercício: Mostre que o lucro π > π e determine o preço P. A firma tem menor lucro por ter mais informação que a firma (sabe q ): aqui é desvantagem ser informado! No jogo do par-ou-ímpar, ao contrário, ter mais informação era melhor. Inconsistência Temporal O resultado de Stackelberg é não apenas N como também NPS, desde que o jogo termine no o estágio. A figura abaixo (do exemplo da parte, com P(Q) 30 - Q) mostra que a quantidade q não é melhor resposta para q. Assim, se houvesse um terceiro estágio seria ótimo para o líder reduzir a sua produção q para aumentar o seu lucro π. sse problema é chamado de problema de inconsistência temporal. Stackelberg: * (a c) q b * (a c) q 4 b Na prática a pergunta é: Será a estratégia q um compromisso crível? Inconsistência Temporal O resultado de Stackelberg é um exemplo do problema de inconsistência temporal ( time inconsistency ): Como a quantidade q de Stackelberg não é a melhor resposta para o q do seguidor, se o jogo continua essas quantidades deixam de ser equilíbrio, pois existe um incentivo para o líder mudar (reduzir) o valor de q num terceiro estágio do jogo. Ver, por ex., o livro do Fudenberg & Tirole (99, pgs. 74-77). Inconsistência temporal em geral descreve a situação onde as preferências do decisor mudam ao longo do tempo O que é preferido num certo instante é inconsistente com o que é preferido num outro instante do tempo. Os jogadores com freqüência re-otimizam no curto-prazo, abandonando o plano de longo-prazo que antes era ótimo por um que era pior. É comum que a série de decisões ótimas de curto-prazo tenha resultados piores do que o compromisso do plano de longo-prazo. sse tema é relacionado com credibilidade e compromisso. Inconsistência Temporal e Commitment sse tema ganhou popularidade após ser premiado com o Nobel de conomia de 004 para Kydland & Prescott. O paper clássico (que inaugurou um tema em macroeconomia) deles é Rules Rather than Discretion: The Inconsistency of Optimal Plans, Journal of Political conomy, 977. Política monetária: Banco Central em vez de perseguir meta de longo-prazo (commitment) de baixa inflação, ele pode afrouxar a política devido ao incentivo de aumentar o emprego com emissão de moeda ( curva Phillips ). No final há desemprego e inflação! ssa inconsistência está muito ligada ao conceito de compromisso ( commitment ) não-crível. x. na política: Um governo pode anunciar que não negocia com terroristas em caso de seqüestros. ntretanto, o terrorista sabe que isso é um compromisso não-crível, vazio ( bravata ), a menos que haja uma lei com punição prevista para quem negociar. Para um compromisso ser crível é necessário que não hajam incentivos para desviar no curto e longo-prazo.

Inconsistência Temporal e Macroeconomia Uma política macroeconômica tem inconsistência temporal quando o governo anuncia uma política de longo-prazo ótima (ex.: baixa inflação), mas de forma que há incentivos para desviar no curto-prazo. Os agentes econômicos são racionais consideram que o compromisso do governo é não-crível e reajustam os preços Uma maneira de conduzir uma política monetária com consistência temporal é dar autonomia ou independência ao Banco Central para que faça essa política de forma a cumprir uma meta de inflação. O BC tem de ser avaliado por cumprir essa meta e não por agradar empresários ou centrais sindicais. Assim o BC não terá incentivos de desviar no curto-prazo. É isso que tem sido feito no Brasil e em outros países com muito sucesso. Credibilidade do BC é a palavra-chave. Jogos Repetidos Jogo repetido é um jogo na forma extensiva que consiste de algum número de repetições de um jogo básico chamado estágio-jogo ( stage-game ). O estágio-jogo é geralmente um jogo bem conhecido de dois jogadores. O jogo todo é às vezes chamado de superjogo. Os jogos repetidos podem ser finitos ou infinitos. Geralmente os equilíbrios são totalmente diferentes em cada caso. Quando a ameaça de retaliação é crível, alguns resultados que não seriam N no stage-game muitas vezes são sustentáveis no superjogo. Isso ocorre principalmente em jogos infinitos. Mas pode ocorrer em jogos repetidos finitos, especialmente os que têm múltiplos N no estágio-jogo. Veremos um exemplo. Nos jogos repetidos finitos de informação perfeita, se o estágio-jogo tem um único N (como no dilema dos prisioneiros), então o único NPS é sempre jogar o N. A prova ( backwards ) é óbvia. Jogos Infinitamente Repetidos Nos jogos repetidos finitos existe uma última data de jogo. Mas em várias interações sociais não existe essa data-limite. Nesse caso, são mais adequado os jogos que potencialmente podem ser infinitamente repetidos. Nos jogos infinitamente repetidos é mais fácil sustentar como NPS uma ação que não é N no estágio-jogo. x.: cooperar no dilema dos prisioneiros pode ser NPS no Γ. Mas é necessário usar estratégias de punição e recompensa. Um dos critérios p/ comparar estratégias é o VPL (valor presente líquido) do fluxo de lucros descontado por δ <. O fator de desconto δ pode ser vista como /( + µ), onde µ é a taxa de desconto ajustada ao risco (dada pelo CAPM, por ex.). O lucro total (VPL) da firma i é dado por: VPL i π i, + (π i, δ) + (π i, 3 δ ) + + (π i, t δ t ) + Que é finito para π i, t finito, t. Note que a soma da PG infinita de razão menor que é finita: + δ + δ + /( δ). stratégias de Punição com Repetição Infinita m jogos repetidos os teoremas populares usam as chamadas estratégias de punição ( trigger strategies ) para obter certos payoffs. As três mais usadas são: stratégia Grim (rígida, intransigente): comece com a ação cooperar (C); continue com C a menos que algum jogador escolha não-cooperar (NC), nesse caso jogue NC p/ sempre. Na repetição infinita do dilema dos prisioneiros pode-se sustentar a cooperação (não-confessar) como NPS com essa estratégia, pois quem desvia tem um ganho imediato, mas uma perda eterna. stratégia tit-for-tat ( olho-por-olho ): comece com a ação cooperar (C); nos outros períodos, escolha em t a ação que o outro jogador escolheu em t. Desvio: ações cíclicas. Não é NPS no dilema dos prisioneiros, mas com ela Rapoport ganhou o torneio desse jogo repetido 00 vezes (Axelrod, 984)! stratégia minimax : Punir visando a máxima perda ao outro jogador, que então minimiza a máxima perda ele que pode ter. Como na grim, pode ser NPS a depender do fator de desconto.

xemplo stilo Dilema dos Prisioneiros Seja um jogo repetido infinitamente em que o estágiojogo é do estilo dilema dos prisioneiros com os payoffs: Jogador Coopera Não-Coopera Jogador Coopera Não-Coopera 3; 3 0; 5 5; 0 ; Com repetição infinita, note que cada subjogo é igual ao anterior com exceção talvez da sua história pregressa. Com a estratégia grim e o fator de desconto δ [0, ], não há incentivo para desviar da estratégia grim se: 3 ( + δ + δ + ) 3 / ( δ) 5 + (δ + δ + ) 5 + δ / ( δ) Algebrando se vê que isso ocorre se e somente se δ ½. sse valor limite (½) depende da estrutura de payoffs do jogo. Jogos stocásticos Repetidos (Shapley) A versão clássica de jogos estocásticos é devido a Shapley (953). Hoje existe uma nova literatura mais complexa de jogos de opções, que considera processos estocásticos e exercício ótimo de opções (reais ou financ.) A versão clássica é um jogo dinâmico repetido (finito ou infinito) em que existem probabilidades de transição de um estágio-jogo para outro estágio. Assim, a cada estágio do jogo o payoff é em geral diferente, existindo probabilidades p/ cada possível estado da natureza. A cada estágio os jogadores devem tomar ações que dependem não só do estado (e a matriz de payoffs) corrente, mas também dos possíveis estados nos próximos estágios do jogo. Jogos estocásticos clássicos são generalizações de jogos repetidos para um ambiente de payoffs estocásticos. Ver no anexo o caso do jogo de cotas da OPP em que a demanda é estocástica, mas com só dois estados da natureza. Jogos de Informação Incompleta m muitos jogos é mais realista considerar que existe informação incompleta sobre os payoffs dos rivais. Nesses jogos, cada firma só recebe informações parciais sobre os valores do jogo, representadas por distribuições de probabilidades a priori sobre os possíveis cenários dos payoffs. Um dos jogos dessa classe mais importantes é o jogo de informação assimétrica, em que existe uma parte informada e outra parte não (ou menos) informada. Assimetria de informação já deu 5 prêmios Nobel em economia Iremos ver alguns casos clássicos, como os jogos de sinalização. O método geral para resolver os jogos de informação incompleta é o método Bayesiano (Harsanyi, 967-68). O jogo original é transformado num jogo equivalente de Bayes com informação completa, embora imperfeita. Harsanyi desenvolveu o conceito de equilíbrio Bayesiano. Informação Incompleta e quilíbrio Bayesiano Nesse jogo de informação incompleta, a natureza faz o primeiro lance escolhendo a realização de θ i, a variável aleatória (v.a.) sobre o valor ou tipo de cada jogador i. Cada jogador i tem uma função valor V i (s i, s i, θ i ), onde θ i Θ i é uma v.a. escolhida pela natureza, só observada pelo jogador i. É assumido, como premissa, que a distribuição conjunta dos payoffs (valores) dos jogadores são de conhecimento comum. stratégia pura p/ o jogador i é a regra de decisão ou função s i (θ i ) que dá a escolha para cada realização do seu tipo θ i. O valor esperado condicional do jogador i é dado por: O equilíbrio Bayesiano de Nash (BN) é definido de forma similar ao N, mas para valores esperados condicionais. Um perfil de estratégias puras s (s, s, s J ) é BN se, para todos os J jogadores:

Informação Incompleta Vira Imperfeita Harsanyi transformou um jogo de informação incompleta em um jogo de informação completa mas imperfeita. Para isso, a natureza joga. x.: informação incompleta sobre a firma : Natureza joga: Com probabilidade p, a firma é do tipo alto custo Firma tipo AC N (D ; D ) (M ; 0) (0; M ) N informação imperfeita N (0; 0) Firma Com probabilidade - p, a firma é do tipo baixo custo N (D ; D ) (M ; 0) Firma tipo BC (0; M ) N N (0; 0) Crise 007/8 e Informação Assimétrica A crise financeira que começou em agosto de 007 (crédito imobiliário sub-prime) e se agravou a partir de setembro de 008 (crise sistêmica), é um exemplo radical da gravidade do problema de assimetria de informação. Assimetria de informação: como um banco não sabe se o outro tem ou não títulos podres, ele não empresta para o outro que fica com problemas para fechar o caixa do dia. Se um banco, mesmo sólido, não honrar um pagamento devido a essa paralisia no mercado interbancário, ele pode sofrer uma corrida bancária e quebrar. Se quebra, não honra os seus demais compromissos, criando mais dificuldades p/ os outros... Assim, rapidamente ocorre um grande problema de liquidez devido a essa falta de confiança entre os bancos. A crise de confiança é alavancada pela assimetria de informação. A crise financeira de 99 se tornou recessão e depois depressão nos anos 30: o Banco Central (FD) errou ao restringir ainda mais o crédito/reduzir liquidez. Crise 007/8 e Informação Assimétrica Os Bancos Centrais aprenderam com o erro de 99 e hoje em dia a atuação padrão dos BCs nesses momentos é prover liquidez no mercado interbancário para reduzir os efeitos da informação assimétrica entre os bancos. Isso é o que tem sido feito desde agosto/07 por BCs dos UA, uropa e Japão. No início, essa política foi bem sucedida. O problema é que o volume de créditos podres parece ser muito maior que se imaginava. Terão os BCs cacifes suficientes p/ conter a crise? Qual o tamanho do rombo? O pacote aprovado pelo congresso americano em 03/0/008 é uma maneira de tentar revelar o tamanho do problema, ao propor a compra desses títulos podres, assim como isolar o problema que causou a crise de confiança interbancária. Sem ele, poderia acontecer o mesmo problema do Japão nos anos 90 (crise imobiliária também) que teve prolongada recessão. Problemas: custo do pacote; dúvida se será ele suficiente já que persiste a assimetria de informação; e quanto pagar pelos títulos. Crise 007/8: pílogo? m julho de 009 aparentemente a crise de confiança no sistema financeiro terminou e a economia se recupera. Isso pode ser comemorado como um sucesso nas políticas dos governos (especialmente os Banco Centrais) p/ reduzir os efeitos da assimetria de informação (provendo liquidez ao mercado bancário e dando estímulos econômicos a economia real). Não foi repetido o erro de 99. Se fosse, a situação seria bem pior. Há indicadores surpreendentes de recuperação econômica. Bancos americanos estão mostrando lucros semestrais elevados. Já a redução da assimetria de informação em sí (quem detém os títulos podres) foi apenas parcialmente alcançada, já que a mudança nas regras contábeis de marcação a mercado está ocultando problemas com ativos podres (assimetria persiste). Marcação a mercado aqui significa lançar no balanço o valor de mercado dum ativo e não o valor nominal. Os bancos americanos estão podendo colocar o valor nominal de vários ativos no balanço. O problema é que não é claro se isso causará crises mais adiante. Também, o custo elevado de estímulo da economia, poderá causar problemas fiscais nos governos, com inflação, elevação dos juros, etc.

Caso da nron: Auditoria, Consultoria e Incentivos Um exemplo de falha de mercado foi a falência da nron e o papel(ão) das cias. independentes de auditoria. sse caso foi analisado por Stiglitz (Valor conômico, 7/0/0): Firmas de auditoria de balanços existem para evitar que a assimetria de informação cause prejuízos ao investidor por omissão ou falsidade. A firma de auditoria joga jogos repetidos com os investidores, logo teria o incentivo da reputação p/ bem informá-los sobre a nron. No entanto, quando a mesma empresa que audita também presta consultoria, aparece outro (e perverso) incentivo de curto-prazo: agradar os clientes que não gostam de relatórios desfavoráveis. A auditora da nron em 00 chegou ao cúmulo de ajudar a destruir diversos documentos (supostas provas de irregularidades). A. Levitt, ex-presidente da SC, tentou no passado proibir a mistura de atividades de auditoria e consultoria pela mesma empresa. Stiglitz argumenta que a questão central de nossa época é encontrar o equilíbrio certo entre governo e mercado. Mesmo com essas imperfeições no mercado, Stiglitz adverte: precisamos resistir a tentação de ir para o extremo oposto. Prêmio Nobel em 007 sse prêmio Nobel em 007 foi p/ a teoria de desenho de mecanismos, relacionada com jogos Bayesianos. Veremos exemplos: bônus p/ gerentes e desenho de leilões. Foram três ganhadores, sendo que dois deles (Maskin e Myerson) têm na teoria dos jogos seu principal foco de pesquisas (mas Hurwicz também usou conceitos de teoria dos jogos nessa teoria). Hurwicz (falecido em 008) foi o fundador da teoria e de conceitos tais como o de incentivo-compatível. Myerson foi quem fez o link entre mecanismos incetivocompatível e jogos Bayesianos, o princípio da revelação II. Maskin refinou essa teoria com a teoria da implementação e tem outras contribuições em jogos cooperativos e nãocooperativos, desigualdade de renda, patentes, etc. Myerson e Maskin estiveram no Rio em 008 (LACA). Tive a honra de ser o apresentador da palestra do Maskin. Desenho de Mecanismo e Princípio da Revelação A teoria do desenho de mecanismo combina o modelo de principal-agente com o conceito de equilíbrio Nash-Bayesiano. Mecanismo é um jogo: especifica as estratégias possíveis e os payoffs. Mecanismo direto é aquele que simplesmente pergunta ao agente para revelar a sua informação privada. stratégias disponíveis são simplesmente reportar sobre o seu tipo. Se for ótimo (NB) para um jogador revelar a verdade, tal mecanismo é chamado de incentivo-compatível. O teorema do princípio da revelação diz que se pode restringir a busca do mecanismo ótimo para aqueles que sejam diretos (pergunta o tipo) e incentivo-compatível (revelador da verdade). Prova-se que não há perda de payoff ao descartar os mecanismos que não atendam ao princípio da revelação. O link com jogos Bayesianos é devido a Myerson (979): Princípio da Revelação II: Qualquer equilíbrio Nash-Bayesiano (NB) de qualquer jogo Bayesiano, pode ser representado por um mecanismo direto incentivo-compatível. x.: Incentivos para Gerentes em Corporações xemplo simples de mecanismo incentivando tanto revelar a verdade sobre a meta factível de produção (Q f ), como maior empenho dada a meta. Um bônus baseado no nível de produção Q incentiva maior empenho, mas incentiva mais os gerentes de UNs maiores e desestimula gerentes de UNs menores. Também bônus baseado na diferença Q Q f estimula os gerentes a reportarem valores baixos para Q f. Weitzman (976) propõe o seguinte mecanismo para induzir os gerentes a reportarem a verdade sobre Q f e ao mesmo tempo induzir esforço para aumentar Q: Bônus B β Q f + α (Q Q f ) se Q > Q f e B β Q f γ(q f Q) se Q Q f Onde: γ > β > α > 0