TEORIA DOS JOGOS CONCEITUAÇÃO E CONTEXTUALIDADE

Documentos relacionados
/ :;7 1 6 < =>6? < 7 A 7 B 5 = CED? = DE:F= 6 < 5 G? DIHJ? KLD M 7FD? :>? A 6? D P

MESTRADO PROFISSIONAL EM ECONOMIA DO SETOR PÚBLICO

MESTRADO PROFISSIONAL EM ECONOMIA DO SETOR PÚBLICO

a) (0.2 v) Justifique que a sucessão é uma progressão aritmética e indique o valor da razão.

3. Geometria Analítica Plana

LEITURA 1: CAMPO ELÁSTICO PRÓXIMO À PONTA DA TRINCA

Externalidades 1 Introdução

FUNÇÕES DE UMA VARIÁVEL COMPLEXA

PROPOSTA DE RESOLUÇÃO DA PROVA DE MATEMÁTICA A DO ENSINO SECUNDÁRIO (CÓDIGO DA PROVA 635) 2ª FASE 21 DE JULHO Grupo I. Questões

Exame de Matemática Página 1 de 6. obtém-se: 2 C.

2 x. ydydx. dydx 1)INTEGRAIS DUPLAS: RESUMO. , sendo R a região que. Exemplo 5. Calcule integral dupla. xda, no retângulo

5.10 EXERCÍCIO pg. 215

Cálculo de Autovalores, Autovetores e Autoespaços Seja o operador linear tal que. Por definição,, com e. Considere o operador identidade tal que.

Razão e Proporção. Noção de Razão. 3 3 lê-se: três quartos lê-se: três para quatro ou três está para quatro

1.1 O Círculo Trigonométrico

P R O P O S T A D E R E S O L U Ç Ã O D O E X A M E T I P O 5

PROPOSTA DE RESOLUÇÃO DA PROVA DE MATEMÁTICA A DO ENSINO SECUNDÁRIO (CÓDIGO DA PROVA 635) 2ª FASE 21 DE JULHO 2014 Grupo I.

λ, para x 0. Outras Distribuições de Probabilidade Contínuas

Identifique todas as folhas Folhas não identificadas NÃO SERÃO COTADAS. Faculdade de Economia Universidade Nova de Lisboa EXAME DE CÁLCULO I

EXERCÍCIO: BRECHA ALEATÓRIA

SISTEMA DE PONTO FLUTUANTE

3 Modelagem de motores de passo

Representação de Números no Computador e Erros

Material Teórico - Módulo Equações e Sistemas de Equações Fracionárias. Sistemas de Equações Fracionárias. Oitavo Ano

AULA Subespaço, Base e Dimensão Subespaço.

estados. Os estados são influenciados por seus próprios valores passados x

v 4 v 6 v 5 b) Como são os corte de arestas de uma árvore?

TÓPICOS. ordem; grau; curvas integrais; condições iniciais e fronteira. 1. Equações Diferenciais. Conceitos Gerais.

Matemática A Extensivo V. 6

Ficha 2. 1 Polinómios de Taylor de um campo escalar. 1.1 O primeiro polinómio de Taylor.

Adriano Pedreira Cattai

Material Teórico - Módulo de Geometria Anaĺıtica 2. Círculos. Terceiro Ano - Médio

Algumas distribuições de variáveis aleatórias discretas importantes:

Seja f uma função r.v.r. de domínio D e seja a R um ponto de acumulação de

Análise Matemática IV

Aula Expressão do produto misto em coordenadas

Matemática IME-2007/ a QUESTÃO. 2 a QUESTÃO COMENTA

1. A soma de quaisquer dois números naturais é sempre maior do que zero. Qual é a quantificação correcta?

Campo elétrico. Antes de estudar o capítulo PARTE I

5.1 Operadores Evolutivos

Apêndice Matemático. Se este resultado for inserido na expansão inicial (A1.2), resulta

10. EXERCÍCIOS (ITA-1969 a ITA-2001)

E X A M E ª FASE, V E R S Ã O 1 P R O P O S T A D E R E S O L U Ç Ã O

ANÁLISE MATEMÁTICA IV A =

10 Encontro de Ensino, Pesquisa e Extensão, Presidente Prudente, 21 a 24 de outubro, 2013

Programa de Pós-Graduação Processo de Seleção 2 0 Semestre 2008 Exame de Conhecimento em Física

ANÁLISE CUSTO - VOLUME - RESULTADOS

Desse modo, podemos dizer que as forças que atuam sobre a partícula que forma o pêndulo simples são P 1, P 2 e T.

EXPRESSÕES LÓGICAS. 9.1 Lógica proposicional AULA 9

Equações não lineares processo iterativo

A trajetória sob a ação de uma força central inversamente proporcional ao quadrado da distância

CIRCUITOS EM REGIME SINUSOIDAL

Temática Circuitos Eléctricos Capítulo Sistemas Trifásicos LIGAÇÃO DE CARGAS INTRODUÇÃO

Problemas Numéricos: 1) Desde que a taxa natural de desemprego é 0.06, π = π e 2 (u 0.06), então u 0.06 = 0.5(π e π), ou u =

ANÁLISE MATEMÁTICA IV FICHA SUPLEMENTAR 2. < arg z < π}.

Equações não lineares processo iterativo

Justifique todas as passagens

ESCOLA SECUNDÁRIA COM 3º CICLO D. DINIS 12º ANO DE ESCOLARIDADE DE MATEMÁTICA A Tema II Introdução ao Cálculo Diferencial II

Derivada Escola Naval

Aula Teórica nº 8 LEM-2006/2007. Trabalho realizado pelo campo electrostático e energia electrostática

Questões para o concurso de professores Colégio Pedro II

ANÁLISE MATEMÁTICA IV FICHA SUPLEMENTAR A =

Enunciados equivalentes

Escola Politécnica da Universidade de São Paulo. Departamento de Engenharia de Estruturas e Fundações

FILTROS. Assim, para a frequência de corte ω c temos que quando g=1/2 ( )= 1 2 ( ) = 1 2 ( ) e quando = 1 2

Introdução ao Processamento Digital de Sinais Soluções dos Exercícios Propostos Capítulo 6

Material Teórico - Círculo Trigonométrico. Secante, cossecante e cotangente. Primeiro Ano do Ensino Médio

Teoria dos Jogos. Prof. Maurício Bugarin ECO/UnB 2013-I. Aula 09-Parte 2 Teoria dos Jogos Maurício Bugarin

Mecânica Quântica /7/2017 Teoria de Perturbações

- Função Exponencial - MATEMÁTICA

Divisão (cont.) Obter TODOS os nomes dos empregados que trabalham em TODOS os projectos nos quais Joao trabalha. projectos em que Joao trabalha.

Calor Específico. Q t

Prova Escrita de Matemática A 12. o Ano de Escolaridade Prova 635/Versões 1 e 2

E X A M E ª FASE, V E R S Ã O 1 P R O P O S T A D E R E S O L U Ç Ã O

Resolução do exame de Análise Matemática I (24/1/2003) Cursos: CA, GE, GEI, IG. 1ª Chamada

Universidade da Beira Interior Departamento de Matemática. Ficha de exercícios nº2: Algoritmo Simplex Primal.

Capítulo 4 Resposta em frequência

Hewlett-Packard CONJUNTOS NUMÉRICOS. Aulas 01 a 06. Elson Rodrigues, Gabriel Carvalho e Paulo Luiz Ramos

INTRODUÇÃO À ESTATÍSTICA

Cálculo Numérico. Integração Numérica. Prof: Reinaldo Haas

Estatística II. Aula 8. Prof. Patricia Maria Bortolon, D. Sc.

fase ω.τ

UNIVERSIDADE DE SÃO PAULO Faculdade de Economia, Administração e Contabilidade de Ribeirão Preto Departamento de Economia

UNIVERSIDADE DE SÃO PAULO Faculdade de Economia, Administração e Contabilidade de Ribeirão Preto Departamento de Economia

1 a Prova de F-128 Turmas do Noturno Segundo semestre de /10/2004

VI - ANÁLISE CUSTO - VOLUME - RESULTADOS

Segunda Prova de Física Aluno: Número USP:

PROFESSOR (A): ANDRÉ (MAL) DISCIPLINA: MATEMÁTICA DATA: 13 / 06 / matricial AX M em que: ) Sejam A =

Função do 2 o Grau. Uma aplicação f der emr

Sala: Rúbrica do Docente: Registo:

R é o conjunto dos reais; f : A B, significa que f é definida no conjunto A (domínio - domain) e assume valores em B (contradomínio range).

Hewlett-Packard MATRIZES. Aulas 01 a 05. Elson Rodrigues, Gabriel Carvalho e Paulo Luiz

Matemática C Extensivo V. 7

S = evento em que uma pessoa apresente o conjunto de sintomas;

Solução da equação de Poisson 1D com coordenada generalizada

Em cada ciclo, o sistema retorna ao estado inicial: U = 0. Então, quantidade de energia W, cedida, por trabalho, à vizinhança, pode ser escrita:

Modelagem Matemática em Membranas Biológicas

Instituto de Física USP. Física V - Aula 32. Professora: Mazé Bechara

Transcrição:

TEORI DOS JOGOS CONCEITUÇÃO E CONTEXTULIDDE Jogos dcisõs stratégicas têm sido rlatados ao longo da história, como na compilação anciã das lis babilônicas do Talmud do gnral chinês do século IV.C. Sun Tzu m o livro Th art of war. partir do século XVIII vários psquisadors lançaram as bass da toria dos ogos, como Jams Waldgrav, m 7 provu a primira solução conhcida para o problma do minima d stratégias mistas para o ogo d duas pssoas, ugustin Cournot, qu m 88 plicou intuitivamnt o qu mais tard sria conhcido como Equilíbrio d Nash, Francis Ysidro Edgworth, qu m 88, trou a noção d quilíbrios comptitivos, Emil orl, m 97, provu a primira prcpção m stratégias mistas, John von Numann fundou, como conhcmos ho, a Toria dos Jogos untamnt com Oskar Morgnstrn publicou m 947 o livro Th Thory of Gams and Economic havior, Jonh Nash qu m 95 provou a istência do quilíbrio não cooprativo John Charls C. McKinsy qu m 95 scrvu o livro sobr a toria dos ogos, Introduction to th Thory of Gams. toria dos ogos é uma abordagm distinta intrdisciplinar do studo do comportamnto humano, nos provê os fundamntos ncssários para o ntndimnto da intração ntr agnts conômicos. s disciplinas mais nvolvidas na toria dos ogos são a matmática, conomia outras ciências sociais do comportamnto. Eistm dois ramos principais na toria dos ogos: cooprativo não cooprativo, ou comptitivo. Para os ogos comptitivos, a toria dos ogos, studa como os agnts lidam uns com os outros, d modo a atingir sus obtivos pssoais. Já nos ogos cooprativos os agnts obtivam ganhos mútuos. partir d Nash m 95, a toria dos ogos tornou-s um campo popular d psquisas. O pnsamnto na época ra qu sta toria tornaria possívl uma séri d soluçõs d problmas até ntão insolúvis.

Cap - TEORI DOS JOGOS CONCEITUÇÃO E CONTEXTULIDDE 5 inda qu a toria dos ogos tnha sido aplicada a uma grand varidad d problmas, o intrss nla foi diminuindo a partir dos anos sssnta até o início dos anos stnta. Entr o fim dos anos stnta início dos anos oitnta acontcu um novo boom na toria dos ogos, spcialmnt dpois qu ril [Rf: 47] publicou m 98 um artigo no qual provou qu o modlo d barganha não cooprativo possui um único quilíbrio prfito. o final dos anos 8, ntrtanto, istia um sntimnto d dsconforto no uso do quilíbrio d Nash na prdição d rsultados. Na época os ogadors foram assumidos como hipr racionais stava sndo usado para cada problma um tipo difrnt muito spcífico d quilíbrio d Nash. O númro d rfinamntos para o quilíbrio d Nash crscu normmnt não ra claro d antmão m quais situaçõs um crto rfinamnto srviria mlhor. O qu stava claro é qu no mundo ral as pssoas não agiam da forma como foi postulada nos modlos. nts qu um novo dclínio no intrss pla toria dos ogos tivss lugar, os tóricos aprovitaram a idéia d volução vinda da biologia. Um artigo d 97, scrito plos biólogos Maynard Smith Pric [Rf: 7] no qual ls dfiniram o concito d stratégias volutivas stávis, tornou-s a mais important tradução do pnsamnto volutivo da biologia na toria dos ogos. O livro Evolution and th Thory of Gams scrito por Maynard Smith introduziu plicitamnt a slção volutiva no ogo. noção da volução das stratégias m ogos rptidos assmlha-s a crtos modlos nos quais, os ogadors aprndm através do comportamnto passado, o qu vio facilitar a acitação dsts modlos volutivos. Na década d 9, os modlos volutivos tornaram-s populars na toria dos ogos m outros campos da conomia. Est studo comçará rvisando a bas técnica da toria dos ogos, principalmnt do quilíbrio d Nash. sta toria srá unida a noção d Estratégias Evolutivas Estávis(EEE). Mais adiant, o conunto d quaçõs difrnciais qu rgm um procsso volutivo biológico, como a dinâmica do John Maynard Smith (9 4) Um dos gigants da biologia volutiva do século XX ra também ngnhiro, falcu no dia 9 d abril d 4, m sua casa, na Inglatrra, vítima d complicaçõs dcorrnts d um câncr no pulmão. Há um prêmio m su nom, o John Maynard Smith Priz, ofrcido a cada dois anos, dsd 997, pla Europan Socity for Evolutionary iology.

Cap. -TEORI DOS JOGOS CONCEITUÇÃO E CONTEXTULIDDE 6 rplicador, também srá abordada. Srá discutido o significado conômico d uma EEE da dinâmica d rplicador, mostrado qu uma EEE nada mais é do qu outro rfinamnto do quilíbrio d Nash qu, mbora a dinâmica do rplicador parça dscrvr muito bm um crto procsso volutivo biológico não racional, os quilíbrios volutivos stávis são um subconunto dos quilíbrios próprios d Nash considrados como hipr racionais. Por st motivo m crtos cnários conômicos qu não lvam m conta qualqur forma d comportamnto racional sta dinâmica podrá m todo caso favorcr uma comparação ntr um ambint racional um ambint d racionalidad limitada. toria dos ogos tornou-s uma frramnta padrão na modlagm d situaçõs conflitants ntr agnts racionais. Tal modlo dscrv um conunto d stratégias d cada agnt ou ogador o su payoff para cada prfil d stratégia, ond prfil d stratégias é a lista d stratégias concorrnts scolhidas plos ogadors. O concito do quilíbrio d Nash é a pdra fundamntal na prvisão do rsultado do ogo. No quilíbrio d Nash cada stratégia dos ogadors maimiza sua utilidad diant das stratégias ogadas plos outros ogadors. Em muitas situaçõs o quilíbrio d Nash não é único, isto é, ist mais d um prfil m quilíbrio. Dst modo, muitos artigos m toria dos ogos foram ddicados à slção do tipo d quilíbrio. Rfinando-s o concito do quilíbrio d Nash prmit-s dscartar crtos tipos d quilíbrios qu não satisfazm a crtos tipos d comportamntos racionais. Nsta sção srá rvisto um pouco da toria do quilíbrio d Nash sus rfinamntos. Isto capacita-nos mostrar, como os concitos básicos da toria dos ogos volutivos s ncaiam nst quadro. O modlo básico da toria dos ogos não cooprativos é conhcido como um ogo d n agnts m sua forma normal é caractrizado por uma n-tupla, Γ = ( S S, L ; π, π,, π ), S n L n Ond S =,, Lm ) é o conunto d todas as m i stratégias puras do ogador i, i ( i π i (s) é o payoff do ogador i diant do prfil d stratégias puras { s s L } s =,, s n.

Cap. -TEORI DOS JOGOS CONCEITUÇÃO E CONTEXTULIDDE 7 Cada stratégia pura s i ogada plo ogador i prtnc ao conunto d stratégias puras S i dst ogador i. O produto cartsiano qu todo prfil s S. O payoff combinado (s) S = Si é chamado d spaço d stratégias puras, m π é dfinido como [ π, π, L ] π n. Em trmos d stratégias puras, um ogo m sua forma normal pod sr scrito como: G = (I,S,π), ond I é o conunto d ogadors. Para o caso d ogos com dois ogadors, os payoffs podm sr postos na forma matricial dnota-s como a matriz d payoff do primiro ogador, ond cada lmnto d = a hk = π (h,k) é o payoff qu o ogador obtém ao ogar sua stratégia pura h contra a stratégia pura k do ogador. Do msmo modo, dnotas como a matriz d payoff do sgundo ogador, ond cada lmnto d = b hk = π (h,k) é o payoff qu o ogador obtém ao ogar sua stratégia pura k contra a stratégia pura h do ogador.. Estratégias mistas té agora vimos qu as açõs d um ogador são rprsntadas através das stratégias puras. Uma outra forma d rprsntar tais açõs são as stratégias mistas. Considr qu cada stratégia pura é ogada com uma crta probabilidad, ntão uma distribuição d probabilidads sobr o conunto d stratégias puras, é chamado d stratégia mista. Estas stratégias são rprsntadas plo vtor R m, ond cada lmnto dst vtor h é a probabilidad do ogador ogar a stratégia pura h. O conunto d todas as stratégias mistas do ogador é um simpl unitário d dimnsão m dfinido como: Δ = R m + m ; h = Equação - h= O simpl Δ tm dimnsão m -, pois podmos scrvr qualqur probabilidad como mnos a soma das outras probabilidads, dsd qu o somatório d todas stas probabilidads é igual a um. ssim, sm nnhuma prda

Cap. -TEORI DOS JOGOS CONCEITUÇÃO E CONTEXTULIDDE 8 d informação, pod-s studar o simpl m Δ R por sua proção no spaço com dimnsão m -. Para o caso d m igual a, isto é, para o caso m qu o ogador possui apnas duas stratégias d ogo, o spaço d stratégias mistas como dfinido na Equação - é rprsntado graficamnt na Figura - sua proção num spaço m pod sr vista na Figura -. Figura - Espaço d stratégias mistas para o caso d duas stratégias Figura - Proção do spaço d stratégias mistas R R Para o caso d um ogador com três stratégias, o spaço d stratégias mistas pod sr visto na Figura - sua proção no spaço bidimnsional na Figura -4 Figura - Espaço d stratégias mistas para o caso d três stratégias

Cap. -TEORI DOS JOGOS CONCEITUÇÃO E CONTEXTULIDDE 9 Figura -4 Proção do spaço d stratégias mistas R R Os vértics do simpl unitário Δ são vtors unitários no spaço m m dnotados por = {,L,}, = {,, L,},, = {,, L,} Cada vértic h rprsnta uma stratégia mista para o ogador qu associa a probabilidad um à sua h ésima stratégia pura consqüntmnt probabilidads nulas para as stratégias rstants. ssim o simpl d stratégias mistas Δ é a casca conva d todos os sus vértics, isto é, cada stratégia mista Δ é uma combinação conva d stratégias puras. Dst modo podmos scrvr. = m h= h h sguir srão introduzidas algumas dfiniçõs ncssárias ao ntndimnto da toria dos ogos... Suport d uma stratégia mista É o conunto d stratégias puras com probabilidad maior qu zro é dfinida como: { h ésima stratégia S : } C ( ) = h Ou sa, para cada stratégia h do conunto d stratégias puras S do ogador ist uma probabilidad maior qu zro h

Cap. -TEORI DOS JOGOS CONCEITUÇÃO E CONTEXTULIDDE Como mplo considr o ogador com duas stratégias apnas, assim suas stratégias mistas trão a forma { } =., S for {,5,5} o suport C ) srá {,} ( S for {,,} suport C ) srá {} (.. Fac d um spaço d stratégias mistas S um subconunto X Δ for a casca conva d algum subconunto d stratégias puras (vértics d X = Δ é uma fac. Δ ) ntão X é chamado fac d Δ. Em particular.. Intrior d um spaço d stratégias mistas Um subconunto scrito como INT( Δ ) é chamado intrior, s cada lmnto >, portanto cada stratégia pura dst subconunto é ogada com h probabilidad maior qu zro. Estratégias mistas com sta caractrística são chamadas d stratégias compltamnt mistas ou intriors têm suport complto, ou sa, C( ) = S...4 Frontira do spaço d stratégias mistas O conunto d stratégias não intriors d borda) é dnotado por: { Δ : INT ( Δ )} bd( Δ ) = Δ é chamado d frontira (ou No caso da frontira, o suport não é complto. frontira bd( Δ ) pod sr vista como a união d todas as facs frontiras d Δ como vimos uma fac é a combinação conva d um subconunto d vértics ou stratégias puras. Sndo assim, Δ é a única fac qu não é fac frontira.

Cap. -TEORI DOS JOGOS CONCEITUÇÃO E CONTEXTULIDDE..5 Prfil d stratégias mistas Sa = {,,, n } um prfil d stratégias mistas ond é a stratégia mista do ogador. Um prfil d stratégias mistas é um ponto do spaço d prfis d stratégias mistas dfinido como o produto cartsiano d n simpls dimnsão m -. = Δ Θ I Δ d O spaço Θ possui dimnsão m, ond m = n m = é o total d stratégias puras no ogo sua proção fita no spaço d dimnsão m-n = m -+m - + m n - é o produto cartsiano das proçõs d Δ. Para um ogo d duas pssoas com n = cada ogador possuindo apnas duas stratégias m =m =, o spaço Θ = {[, ],[, ],[, ],[, ]} 4 R é o produto cartsiano d Δ Δ. Nst caso o produto cartsiano das proçõs d Δ Δ é: = Figura -5 Espaço d prfis d stratégias mistas como o produto cartsiano d spaços d stratégias mistas d uma dimnsão Para um caso d dois ogadors, n =, o ogador um possuindo três stratégias o ogador dois possuindo duas stratégias, o spaço dos prfis d stratégias mistas srá o produto cartsiano d Δ Δ igual a; Θ = {[, ],[, ],[, ],[, ], [, ],[, ] } 5 R

Cap. -TEORI DOS JOGOS CONCEITUÇÃO E CONTEXTULIDDE = Figura -6 Espaço d prfis d stratégias mistas como o produto cartsiano d spaços d stratégias mistas d duas dimnsõs Um prfil d stratégias mistas é dito intrior s cada uma d suas stratégias mistas for intrior é dfinido por, INT ( ) = I INT ( Δ ) Θ O suport d um prfil d stratégias mistas é C( ) = C( ) S é I INT(Θ) s somnt s C() = S. frontira d Θ, bd(θ) é o conunto d prfis não intriors d Θ. Um subconunto X Θ é chamado fac d Θ s X é o produto cartsiano das facs dos simpls dos ogadors. Em particular s X = Θ é chamado d fac máima d Θ. Todas as outras facs d Θ são chamadas d facs d frontira. ssim cada prfil d stratégia pura, visto como um subconunto singlton d Θ, é uma fac d frontira. união das facs d frontiras d Θ é a própria bd(θ). Sa (,y - ) o prfil d stratégias no qual o ogador oga a stratégia Δ contra o prfil y Θ ogado plos outros ogadors. Mais prcisamnt o prfil d stratégias Z=(, y - ) Θ é dfinido por z = z i = y i para todo i. Função d payoff d uma stratégia mista probabilidad qu um prfil d stratégias puras s = (s,s,,s n ) S sr usado quando o prfil d stratégias mistas Θ é ogado é: ( s) = n S =

Cap. -TEORI DOS JOGOS CONCEITUÇÃO E CONTEXTULIDDE Ond s é a probabilidad do ogador ogar sua stratégia s. No caso d dois ogadors cada um com duas stratégias, sndo qu o ogador possui as stratégias a a o ogador possui as stratégias b b, um prfil d stratégias puras sria, por mplo, s = (a,b ) uma possívl stratégia mista do ogador sria = (, ) ond é a probabilidad do ogador ogar a stratégia a é a probabilidad do ogador ogar a stratégia a. Um prfil d stratégias mistas sria = (, ) ond é uma stratégia mista d. Então é quivalnt scrvr, = (, ) = Θ O valor sprado do payoff para o ogador associado com o prfil d stratégias mistas Θ é: ( ) = ( s) π ( s) s S Ond (s) é a probabilidad do prfil d stratégias puras π (s) é o payoff qu o ogador obtém caso o prfil d stratégias puras s for ogado. Jogar a stratégia pura s = k é probabilisticamnt quivalnt a ogar a stratégia mista k k Δ, assim podmos scrvr u, ) como o payoff ( sprado do ogador quando o prfil, ) for ogado, ou sa, o payoff qu o ( k ogador obtém quando l oga sua k-ésima stratégia pura. ssim para qualqur prfil Θ, m ( ) = ( k = k, ) k Ond k é a probabilidad do ogador ogar sua k-ésima stratégia pura. Em outras palavras o payoff () pod sr computado como a soma pondrada dos payoffs do ogador obtidos ogando-s cada uma d suas stratégias puras contra um dtrminado prfil d stratégias, dos outros

Cap. -TEORI DOS JOGOS CONCEITUÇÃO E CONTEXTULIDDE 4 ogadors, ond os psos são as probabilidads associadas pla stratégia mista ogada plo ogador, a cada uma d suas stratégias puras. função combinada () = ( (), (),, n ()) é chamada d função d payoff combinada d stratégias mistas do ogo. Uma altrnativa para isto é a rprsntação d stratégias puras G=(I,S,π) ou ainda, m algumas vzs mais convnint uma tnsão d G para as stratégias mistas (I,Θ,). Para o caso d dois ogadors podríamos rprsntar o ogo pla matriz d payoff. ssim, para qualqur par d stratégias mistas Δ Δ tmos: O valor sprado do payoff do ogador associado com a stratégia mista. m = m ) h h= k = T ( a =, ond é a matriz d payoff do ogador. hk k. O valor sprado do payoff do ogador associado com a stratégia mista ( ) m m = h= k = h b hk k = T T ond é a matriz d payoff do ogador Para o caso d dois ogadors tmos a sguint matriz d payoff para o ogador, a = a b π ( a, b ) π ( a, b ) b π ( a, b ) π (, ) a b Ond o π (a h, b k ) é o payoff do ogador ogando sua stratégia pura h contra a stratégia pura k do outro ogador i. O payoff sprado do ogador srá: s ( s) = Prob(a,b )*π (a,b ) + Prob(a,b )*π (a,b ) + ( ) = ( s) π s S Prob(a,b )*π (a,b ) + Prob(a,b )* π (a,b )

Cap. -TEORI DOS JOGOS CONCEITUÇÃO E CONTEXTULIDDE 5 Ond a Prob(a h, b k ) = Probabilidad(a h ) Probabilidad(b k ). Not qu para qu sta igualdad sa válida é ncssário qu a stratégia ogada plo primiro ogador sa indpndnt da stratégia ogada plo sgundo ogador. Probabilidad da stratégia pura a h sr ogada é tirada do h-ésimo lmnto da stratégia mista usada plo ogador, h. Fazndo π (a h, b k ) = a hk tmos, a * (a,b ) + a * (a,b ) + a * (a,b ) + a * (a,b ) = a * * + a * * + a * * + a * * = h= k= a hk h k Do msmo modo, ( ) T = b = = hk h= k= h k T T função d payoff combinado d stratégias mistas ()=( (), ()):IR 4 IR, ou sa IR m IR n ond m = m +m é o total d stratégias puras, nst caso igual a quatro, n o númro d ogadors, igual a. Para uma matriz d payoff do ogador igual a, 4 = 5 4 5 () = = [ ] = [ 4 + 5, ] = 4 + 5 +, 4 5 = + () = =[ ] [ 4,5 ] = 4 + 5 +

Cap. -TEORI DOS JOGOS CONCEITUÇÃO E CONTEXTULIDDE 6. Dominância Eistm três tipos d dominância, a dominância fraca, a dominância strita a dominância strita itrativa. É important tr m mnt qu tais concitos nos lvam a indicar qu stratégias podm sr rmovidas do ogo sm qu a solução final sa altrada. Tais stratégias são ditas stratégias dominadas... Dominância fraca Uma stratégia domina fracamnt outra quando o payoff do ogador obtido quando l oga tal stratégia contra todos os prfis d stratégias do ogo é smpr maior ou igual ao payoff quando l oga qualqur outra d suas stratégias contra os msmos prfis d stratégias maior para plo mnos um dos prfis. Ou sa, y Δ domina fracamnt Δ s (y,z - ) (,z - ) para todo z Θ com strita dsigualdad para algum z Θ. Uma stratégia é dita não dominada quando nnhuma outra a domina d modo fraco. Como mplo obsrvmos o ogo com a sguint matriz d payoff = O primiro ogador possui três stratégias puras o sgundo ogador possui duas stratégias puras. stratégia três, por mplo, não é dominada por nnhuma das outras duas stratégias do ogador um. Outro mplo é o conhcido dilma dos dois prisioniros ond as matrizs d payoff dos dois ogadors são rspctivamnt. 4 4 5 =, = 5 s duas stratégias são: Coopra Dlata

Cap. -TEORI DOS JOGOS CONCEITUÇÃO E CONTEXTULIDDE 7 Vmos qu a sgunda stratégia () do primiro ogador,dlatar, domina stritamnt a stratégia um, dsd qu π(,) > π(,) π(,) > π(,) Do msmo modo a stratégia dois dos sgundo ogador domina d modo strito a primira... Dominância strita Uma stratégia é dita stritamnt dominant s o payoff qu o ogador obtém quando a oga é smpr maior do qu o payoff qu l obtém quando oga qualqur outra d suas stratégias, ou sa, y Δ domina stritamnt Δ s (y,z - ) > (,z - ) para todo z Θ Como mplo, considrmos a matriz d payoff d um ogador com três stratégias comptindo com outro ogador qu possui duas stratégias. a = a a b b Obsrva-s plos payoffs obtidos na trcira linha, qu nnhuma stratégia do ogador domina fracamnt sua trcira stratégia pura,, pois: - O payoff d sua primira stratégia contra a sgunda stratégia do ogador é mnor qu o payoff da trcira stratégia contra a sgunda stratégia do ogador. O payoff d sua sgunda stratégia contra a primira stratégia do ogador é mnor qu o payoff da trcira stratégia contra a primira stratégia do ogador. Em trmos d stratégias puras, nnhuma stratégia do ogador é stritamnt ou fracamnt dominant. Entrtanto s o ogador usa uma stratégia mista y =,., ou sa oga a sua primira stratégia pura 5% das vzs oga a sua sgunda stratégia pura nas outras 5% das vzs não oga nnhuma vz a sua trcira stratégia pura, o payoff do ogador, (y,z ) é

Cap. -TEORI DOS JOGOS CONCEITUÇÃO E CONTEXTULIDDE 8 maior do qu qualqur outro payoff qu l possa obtr ogando uma outra stratégia mista. (y,z ) = Prob(a,b )*π (a,b ) + Prob(a,b )*π (a,b ) + Prob(a,b )*π (a,b ) + Prob(a,b )*π (a,b ) + Prob(a,b )*π (a,b ) + Prob(a,b )*π (a,b ) Considrando a probabilidad d ogar a = ½, a probabilidad d ogar a = ½, a probabilidad d ogar a = finalmnt considrando-s Prob(b ) = - Prob(b ), tmos, Prob(a,b ) = ½ Prob(b ) Prob(a,b ) = ½ (-Prob(b )) assim, (y,z ) = Pr ob( b ) Pr ob( b ) Pr ob( b ) Pr ob( b ) = + + + + * + * Pr ob( b ) = + Pr ob( b ) =,5 Já s o ogador ogar sua trcira stratégia pura oga sua trcira stratégia, su payoff srá: = (,,), ou sa, só (,z ) = ½* + ½* = <,5 (y,z ) srá maior do qu qualqur outro payoff qu possa obtr ogando uma outra stratégia mista Δ contra todo z Δ.

Cap. -TEORI DOS JOGOS CONCEITUÇÃO E CONTEXTULIDDE 9.. Dominância strita itrativa É natural pnsar qu qualqur suito racional dsprz suas stratégias stritamnt dominadas m ogos comptitivos, pois las podm sr rtiradas do ogo sm altrar o rsultado final. Porém, s isso for fito, algumas stratégias puras rstants podm tornar-s stritamnt dominadas no ogo rduzido. Rptidas rmoçõs d stratégias puras stritamnt dominadas d um ogo G nos lva à sguint dfinição. Uma stratégia pura não é itrativamnt stritamnt dominada s la não for stritamnt dominada no ogo original, nm m nnhum dos ogos rduzidos até qu não haam mais stratégias stritamnt dominadas. Sa G t um ogo rduzido na itração t. Para t igual a zro tmos o ogo original para t = T o último ogo rduzido ond não istm mais stratégias dominadas. G é o primiro ogo rduzido após trm sido rtiradas as stratégias stritamnt dominadas do ogo original G. G é o sgundo ogo rduzido após trm sido rmovidas as stratégias stritamnt dominadas do ogo G. S uma stratégia não é stritamnt dominada m nnhum dos ogos G t, ntão la não é itrativamnt stritamnt dominada. Para qualqur ogo finito m sua forma normal G = (I,S,π), di S D S (spaço dos possívis prfis d stratégias puras do ogo) sr um subconunto dos prfis d stratégias puras itrativamnt stritamnt não dominados. S st subconunto é um singlton, ou sa só possui um lmnto, ntão o ogo é chamado d domínio stritamnt solúvl. Como mplo tmos o ogo d dois ogadors com as rspctivas matrizs d payoff. a = a a b b b 6, 4 5 b = b b a a a 6 4 5 Pod-s obsrvar qu a sgunda stratégia pura do ogador é stritamnt dominada, á qu os payoffs da sgunda linha da matriz são mnors qu os payoffs das outras linhas.

Cap. -TEORI DOS JOGOS CONCEITUÇÃO E CONTEXTULIDDE 4 Então a é stritamnt dominada, pois, π(a,b ) < π(a,b ) π(a,b ) < π(a,b ) π(a,b ) < π(a,b ) π(a,b ) < π(a,b ) π(a,b )< π(a,b ) π(a,b )< π(a,b ). ssim, tanto a stratégia a como a a do ogador dominam stritamnt a stratégia a. O msmo acontc com a sgunda stratégia pura do ogador, b, la é stritamnt dominada plas stratégias b b. Como a b são stritamnt dominadas, las podm sr rtiradas do ogo o ogo rduzido G trá as sguints matrizs d payoff. = a a b b 6, 5 = b b a a 6 5 gora a stratégia a domina stritamnt a b também domina stritamnt b. Dst modo somnt o prfil d stratégias puras s = (a,b ) prmanc m G. Então S D = {[a,b ]}. Wibull comnta m su livro Evolutionary Gam Thory [Rf: ]. O postulado d qu nnhum ogador usa uma stratégia stritamnt dominada é uma suposição d racionalidad rlativamnt fraca. Para isto só s rqur qu a função d payoff d cada ogador rprsnt as suas prfrências. Em particular, nnhum conhcimnto por part do ogador sobr as prfrências ou comportamnto dos outros ogadors é rqurido. Em contrast, a aplicação da liminação itrativa das stratégias stritamnt dominadas rqur, qu os ogadors saibam sobr as funçõs d payoff dos outros ogadors, d forma a podrm liminar cada stratégia stritamnt dominada. lém disso, st conhcimnto das prfrências, tm qu sr conhcido por todos os ogadors, d forma qu ls possam liminar as stratégias qu são stritamnt dominadas no ogo rduzido após uma rodada d rmoçõs d stratégias stritamnt dominadas assim por diant, até um nívl d conhcimnto mútuo, ond itraçõs adicionais não liminam mais nnhuma stratégia..4 Mlhor réplica Uma mlhor réplica pura ou mlhor rsposta m stratégias puras para o ogador no prfil d stratégias y Θ é uma stratégia pura s i S tal qu nnhuma outra stratégia pura disponívl do ogador rsulta num payoff mlhor. Isto dfin a i-ésima stratégia d mlhor rsposta do ogador. É important

Cap. -TEORI DOS JOGOS CONCEITUÇÃO E CONTEXTULIDDE 4 rssaltar qu o trmo réplica, utilizado no concito d mlhor réplica, stá associado à idéia d contra rsposta, contstação. Mais adiant quando for introduzido o concito d dinâmica do rplicador, o trmo rplicador srá sinônimo d duplicador, aqul qu clona, qu copia..4. Corrspondência d Mlhor Réplica corrspondência d mlhor réplica d stratégia pura d um ogador, β : Θ S, mapia cada prfil d stratégia mista y Θ m um conunto d mlhors réplicas puras do ogador diant do prfil y. Est conunto, finito não vazio é dfinido por: h k { h S : (, y ) (, y ) ( k h S } β ( y) = ) Em rsumo, β (y) é o conunto d stratégias puras qu obtém os mlhors payoffs diant d um prfil concorrnt y. S a stratégia for uma mlhor réplica, pod havr outras stratégias tão boas quanto la, mas não mlhors. Dsd qu cada stratégia mista Δ é uma combinação conva d stratégias puras (,y - ) é linar m rlação a, nnhuma stratégia mista Δ pod dar ao ogador um payoff maior contra o prfil y Θ do qu qualqur uma d suas mlhors réplicas puras diant do msmo y. Sa = (, ) = (,) as duas stratégias puras d um ogador. Considrando qu (, y ) > (, y ), ntão qualqur stratégia mista qu sa uma combinação conva dssas duas stratégias puras trá um payoff, y ) >, y ) >, y ) o payoff ( ( ( Formalmnt podmos scrvr qu para qualqur y Θ, Δ h β (y) (, y m m k h ) = (, y ) k (, y ) k = k = k = obsrvando-s qu, ( h, y ) m k = ( k, y ) k m h h = (, y ) k = (, y k = )

Cap. -TEORI DOS JOGOS CONCEITUÇÃO E CONTEXTULIDDE 4 Rsta-nos vr qu = m (, y ) (, y k = k ) k dsd qu a stratégia mista pod sr scrita como combinação conva dos vértics d Δ, = m k = k k ssim, h { h S : (, y ) (, y Δ } β ( y) = ) Ou sa, o payoff d uma mlhor réplica pura é maior do qu o payoff d qualqur stratégia mista. Uma mlhor réplica mista para o ogador diant do prfil d stratégias y Θ é uma stratégia Δ, tal qu nnhuma outra stratégia mista consgu um payoff maior contra o prfil y. Cada mlhor réplica pura pod sr vista como uma stratégia mista h com % d probabilidad para a stratégia pura s h. Portanto cada mlhor réplica pura é também uma mlhor réplica mista. lém do mais, pla linaridad do payoff (,y - ) m rlação a, qualqur combinação conva d mlhors réplicas puras, também é uma mlhor réplica mista. Consqüntmnt a corrspondência ~ da mlhor réplica mista do ogador β : Θ Δ mapia cada prfil d stratégias mistas para a fac d Δ qu é grada plas mlhors réplicas puras diant d y. Por mplo, Figura -7 Conunto d mlhors réplicas mistas, situadas na fac do polidro, combinação conva d duas mlhors réplicas altrnativas.

Cap. -TEORI DOS JOGOS CONCEITUÇÃO E CONTEXTULIDDE 4 S são as mlhors réplicas puras X uma fac d Δ grada plas combinaçõs convas das duas mlhors réplicas puras diant d um prfil d stratégias y Θ, ntão tmos as mlhors réplicas mistas X. ~ O mapamnto β : Θ Δ dfinido por: ~ β ( y) = { Δ : u (, y ) u ( z, y ) z Δ } = é a corrspondência d mlhor réplica mista do ogador. Qualqur ~ stratégia mista β ( y ) é uma mlhor réplica para o ogador contra o prfil d stratégias y Θ. Sndo uma mlhor réplica mista uma combinação conva d mlhors réplicas puras, ntão a probabilidad h qu não stá associada a uma mlhor réplica pura h srá nula para qualqur stratégia pura β (y), { Δ : = h β ( y) } h Ou ainda, para o caso d sr uma mlhor réplica mista; { Δ : C( ) β ( y) }, pois o suport C( ) d é o conunto d stratégias puras associadas as probabilidads h >. corrspondência d mlhor réplica pura combinada, β:θ S, do ogo é dfinida como o produto cartsiano d todas as corrspondências d mlhors réplicas puras. β ( y) = β ( y) S I corrspondência combinada ~ β : Θ Θ é dfinida plo produto cartsiano das mlhors réplicas mistas d cada ogador. ~ ~ β ( y) = β ( y) Θ I

Cap. -TEORI DOS JOGOS CONCEITUÇÃO E CONTEXTULIDDE 44.5 Dominância Mlhor Réplica Uma stratégia pura h qu é uma mlhor réplica diant d um prfil y d stratégias mistas não pod sr stritamnt dominada, pois para isso sria ncssário qu (, y h k ) < (, y ) para a lgum ( k h) S o qu vai contra a dfinição d mlhor réplica pura. Para um ogo d dois ogadors as afirmaçõs sguints são vrdadiras.. Uma stratégia stritamnt dominada não pod sr uma mlhor réplica.. Uma stratégia qu não é stritamnt dominada é ncssariamnt uma mlhor réplica.. Uma stratégia qu é uma mlhor réplica diant d um prfil d stratégias compltamnt misto é não dominada. 4. Uma stratégia pura não dominada é a mlhor réplica para algum prfil d stratégias compltamnt mistas..6 Equilíbrio d Nash Um prfil y = (,y - ) Θ é um quilíbrio d Nash s cada uma d suas stratégias mistas é uma mlhor réplica contra o prfil rstant y -, ou sa quando y é uma mlhor réplica para si msmo como consqüência d qu toda stratégia mista y é uma mlhor réplica mista. ~ Então y Θ é um quilíbrio d Nash s y β ( y ). ~ Sgu da dfinição d β ( y ) qu s y é um quilíbrio d Nash, ntão toda stratégia pura no suport d cada componnt mista d y é uma mlhor réplica para y. S uma stratégia mista prtncnt ao prfil y for uma mlhor réplica ntão { Δ : C( ) β ( y) }. stratégia mista = { } stratégia pura,,, ond h é a probabilidad da h sr ogada, só srá uma mlhor réplica mista s for combinação conva d mlhors réplicas puras digamos qu somnt sam mlhors réplicas puras, ntão para qu sa uma mlhor réplica mista é ncssário qu a probabilidad sa zro. Dst modo podmos facilmnt

Cap. -TEORI DOS JOGOS CONCEITUÇÃO E CONTEXTULIDDE 45 concluir qu as mlhors réplicas puras β (y) possum uma probabilidad maior qu zro, portanto prtncm ao suport da stratégia mista. Portanto s s h C( ) s h β (y). stratégia pura s h do ogador com probabilidad h >, componnt do prfil m quilíbrio d Nash é uma mlhor réplica pura. Como mplo considr o sguint ogo d dois ogadors sm quilíbrio m stratégias puras. Cada ogador possui duas stratégias apnas as matrizs d payoff são: T = = Sa π (s) o payoff mostrado nas matrizs para um dtrminado prfil s d stratégias puras. O payoff do ogador para o prfil d stratégias mistas é,, = () = [ ] = - + - = [ - ]+ [ - ] Sabmos qu = - = - Então, () = + (4 -)- Para qu uma stratégia mista sa uma mlhor réplica é prciso qu as stratégias puras sam mlhors réplicas puras, ntão (,y - ) = (,y - ) portanto pandindo sta prssão tmos, + (4 = + = = = ) (4 ) 4,

Cap. -TEORI DOS JOGOS CONCEITUÇÃO E CONTEXTULIDDE 46 Diant do prfil - = ( ), diant do prfil y - = ( ), = ( ), é uma mlhor réplica pura para o ogador é uma mlhor réplica pura. Já diant do prfil - é a mlhor réplica pura do ogador, portanto o prfil = (, ) ~ β ( ) não é um quilíbrio d Nash. S continuarmos com st raciocínio para os dmais prfis d stratégias do ogo, vrmos qu nnhum prfil d stratégias ~ puras β ( ), portanto, não há quilíbrio d Nash m stratégias puras nst ogo. Uma qustão intrssant surg nst mplo. Como vimos, apsar da stratégia pura sr a única mlhor réplica pura contra o prfil (, ) não stá m quilíbrio dsd qu não é mlhor réplica pura contra, stndndo st raciocínio para as outras stratégias puras vmos qu não ist nnhum quilíbrio m stratégias puras nst ogo. Eist ainda a possibilidad d havr stratégias mistas m quilíbrio d Nash pla própria dfinição do quilíbrio las dvm sr mlhors réplicas mistas. Porém, sabmos qu uma mlhor réplica mista é combinação conva d duas mlhors réplicas puras. contc qu nst mplo ist uma stratégia mista qu dá o msmo payoff contra qualqur stratégia istnt no prfil d stratégias. Sndo assim qualqur stratégia é uma mlhor réplica mista contra la. Va a sguir. S um ogador opta por ogar uma stratégia mista com ambas as probabilidads iguais, isto é, = - = ½, qualqur stratégia do ogador é uma mlhor réplica mista diant d = (½,½), pois como s pod vrificar o payoff d qualqur stratégia contra (½,½) srá igual a zro. ssim todas h stratégias puras, são mlhors réplicas. Como a stratégia = (½,½) é uma mlhor réplica diant do prfil - = = (½,½) a stratégia = (½,½) é uma mlhor réplica diant do prfil - = ~ = (½,½) ntão = (, ) β ( ) é assim um quilíbrio d Nash. Obsrv qu = (½,½), apsar d sr uma mlhor réplica mista é combinação conva do prfil d réplicas puras, ou sa,, qu só são mlhors réplicas puras contra a stratégia mista (½,½). Va os payoffs d três stratégias d contra a stratégia [,] T d.

Cap. -TEORI DOS JOGOS CONCEITUÇÃO E CONTEXTULIDDE 47 [,] = = é mlhor réplica pura contra [,] T [, ] = = combinação conva d [,] T [,] T [,] = = não é mlhor réplica pura contra [ ] T > >, portanto contra qualqur outra stratégia não ist mais d uma mlhor réplica pura portanto não istiriam mlhors réplicas mistas. ssim no caso d só istir uma única mlhor réplica pura contra dtrminado prfil, a conclusão é não ist réplica mista qu sa mlhor qu a mlhor réplica pura. lém do mais s o prfil stá no quilíbrio não significa qu l possui o maior payoff, assim como s o prfil possuir o maior payoff não qur dizr qu l stá no quilíbrio. Um quilíbrio d Nash é chamado d quilíbrio strito s cada ~ componnt do prfil é a única mlhor réplica para. Cada β ( ) é um ~ singlton, portanto, β ( y ) é o próprio prfil. I Enquanto o critério do quilíbrio d Nash rqur qu nnhum dsvio fora do quilíbrio sa mais lucrativo o critério do quilíbrio strito d Nash rqur qu qualqur dsvio fora do quilíbrio sa custoso. Um quilíbrio strito não pod nvolvr uma probabilidad mnor qu um rlacionado com uma dtrminada stratégia pura, pois assim havria algum ogador para o qual istiriam plo mnos duas mlhors réplicas puras, dsd qu as stratégias mistas são combinaçõs convas d plo mnos duas stratégias puras o payoff é combinação linar das stratégias mistas para havr quilíbrio strito dv havr somnt uma mlhor réplica. ssim cada quilíbrio strito d Nash é um prfil d stratégias puras, vértic dos spaços d prfis Θ.

Cap. -TEORI DOS JOGOS CONCEITUÇÃO E CONTEXTULIDDE 48 Um prfil m quilíbrio d Nash não pod sr stritamnt dominado. Entrtanto não ist nada na dfinição qu o prvina s sr fracamnt dominado. Pod istir outra mlhor réplica para o prfil m quilíbrio qu não é pior qu a stratégia m quilíbrio m qustão qu é mlhor contra qualqur outro prfil. Um quilíbrio d Nash é dito não dominado s cada stratégia do prfil é não dominada. ~ Obsrv qu β ( ) não dpnd só d. Claramnt quilíbrio d Nash s somnt s ~ β ( ) I. n Θ é um lgância do concito do quilíbrio d Nash o comportamnto racional dos agnts inspiraram muitos conomistas na formulação d problmas conômicos como os ogos d n pssoas não cooprativos. Dsd os anos 7 o concito d Nash tm sido aplicado a uma grand class d problmas. Entrtanto, na aplicação do concito alguns tóricos s dram conta d uma séria dsvantagm do quilíbrio d Nash, ou sa, constataram qu um ogo não cooprativo d n pssoas pod tr muitos quilíbrios d Nash. ssim um quilíbrio scolhido arbitrariamnt pod não fazr muito sntido como prdição do rsultado do problma. lém do mais m muitos casos nm todos os rsultados são consistnts com a noção intuitiva d qual dvria sr o rsultado do ogo. Então, nos anos stnta vários tóricos abordaram o problma da slção d quilíbrio pondo mais rquisitos nos comportamntos racionais dos ogadors. ssumindo-s ogadors altamnt racionais pod-s liminar os rsultados mnos intuitivos. Nst studo só srão considrados os concitos dos quilíbrios prfito próprio d Nash m suas formas normais. noção d quilíbrio prfito d Nash, d um ogo d forma normal, foi introduzido por Rinhard Sltn é um dos rsultados mais fundamntais na toria dos rfinamntos do quilíbrio d Nash. Para algum númro ral > > ( (,)), um prfil d stratégias compltamnt mistas Θ, isto é, ih k k > I n k S, é um quilíbrio d Nash prfito s k ~, quando β ( ). probabilidad da stratégia pura k sr ogada dv sr mnor qu uma crta probabilidad s la não stivr no spaço d mlhors réplicas mistas. ssim para um quilíbrio d Nash prfito cada stratégia pura é ogada com uma probabilidad positiva (maior qu zro), mas

Cap. -TEORI DOS JOGOS CONCEITUÇÃO E CONTEXTULIDDE 49 somnt as stratégias puras contidas no conunto d mlhors réplicas podm tr uma probabilidad mais alta qu. Dst modo é prmitido aos ogadors comtrm rros, mas a probabilidad com qu uma stratégia não ótima srá ogada é limitada por. Um quilíbrio prfito é agora dfinido como o limit d uma sqüência d quilíbrios prfitos quando tnd a zro. Todo quilíbrio intrior é um quilíbrio prfito, pois s Θ(), sndo qu Θ() INT(Θ) Θ NE NE (subconunto d prfis m quilíbrio d Nash) ntão Θ (). lém disso, todo Θ PE (subconunto d prfis m quilíbrio prfito d Nash) é não dominado..7 Equilíbrio Prfito d Nash * Um prfil d stratégia Θ é um quilíbrio prfito d Nash para um ogo G = ( I n, Θ, u) s, para alguma sqüência r >, r IN convrgindo para zro, ist uma sqüência d quilíbrios prfitos d Nash convrgindo para *. Da dfinição, sgu-s imdiatamnt qu qualqur quilíbrio d Nash com stratégias compltamnt mistas é um quilíbrio prfito d Nash para algum suficint pquno. lém disso, Sltn provou qu qualqur ogo G = ( I n, Θ, u) tm um quilíbrio prfito d Nash, msmo s o ogo não possui quilíbrio nas stratégias compltamnt mistas..8 Torma d Sltn Qualqur ogo G = ( I n, Θ, u) tm plo mnos um quilíbrio prfito d Nash o conunto dos quilíbrios prfitos d Nash é um subconunto do conunto dos quilíbrios d Nash. Embora a noção d quilíbrio prfito limin os quilíbrios d Nash qu não são robustos com rspito às pqunas probabilidads d ngano por rro dos ogadors, a probabilidad com o qual um ogador racional oga uma stratégia por ngano dpndrá do fito prudicial da stratégia não ótima. Enganos mais custosos irão sr mnos provávis qu os nganos mnos custosos. Para um rfinamnto adicional do conunto d quilíbrio d Nash, Myrson (978) introduziu o concito d quilíbrio próprio. Para algum númro ral > > um prfil d stratégias compltamnt mistas Θ é um quilíbrio

Cap. -TEORI DOS JOGOS CONCEITUÇÃO E CONTEXTULIDDE 5 próprio d Nash s para qualqur ogador I k h n, k h s u (, ) < u (, ) k, h I. Novamnt, para um quilíbrio próprio d Nash cada stratégia pura é ogada com uma probabilidad positiva. lém do mais, s alguma stratégia pura k é uma pior réplica contra as stratégias dos outros ogadors qu uma crta stratégia h, ntão a probabilidad com qu a stratégia k é ogada é no máimo vzs a probabilidad com qu stratégia h é ogada. inda ist uma proposição qu diz qu s Θ NE é não dominado, ntão num ogo d dois ogadors Θ PE. m.9 Equilíbrio Próprio d Nash * Um prfil d stratégias Θ é um quilíbrio próprio d Nash para o ogo G = ( I n, Θ, u), s para alguma sqüência r >, r IN, convrgindo para zro, ist uma sqüência d quilíbrios r próprios d Nash convrgindo para *. Novamnt, sgu imdiatamnt qu qualqur quilíbrio intrior d Nash (compltamnt misto) é um quilíbrio próprio d Nash. lém do mais cada quilíbrio próprio d Nash satisfaz as condiçõs d um quilíbrio prfito, porqu a noção d propridad rstring o conunto d nganos prmissívis. Myrson provou qu qualqur ogo G = ( I n, Θ, u) tm plo mnos um quilíbrio próprio d Nash.. Torma d Myrson Qualqur ogo G = ( I n, Θ, u) possui plo mnos um quilíbrio próprio d Nash. lém disso, o conunto d quilíbrios próprios d Nash é um subconunto do conunto d quilíbrios prfitos d Nash. Os concitos d quilíbrio próprio prfito d Nash são bm ilustrados plo sguint mplo. Sa o ogo bimatricial, d duas pssoas, dado por. = T = 9 7 9 7 7

Cap. -TEORI DOS JOGOS CONCEITUÇÃO E CONTEXTULIDDE 5 Est ogo possui três quilíbrios d Nash m stratégias puras apontados plas stas, ou sa, cada prfil d stratégia no qual os dois ogadors ogam a msma stratégia pura. Entrtanto, o quilíbrio d Nash no qual ambos ogadors ogam a trcira stratégia é muito improvávl por sr irracional. Est quilíbrio é ritado pla noção d prfição, a qual só admit os dois quilíbrios nos quais ou ambos os ogadors ogam sua primira stratégia ou ambos os ogadors ogam sua sgunda stratégia. Podmos vr qu uma mlhor réplica para a trcira stratégia do ogador, é do ogador é, portanto ( nm (, ) nm (, a uma mlhor réplica para a trcira stratégia, ) é um quilíbrio d Nash. Porém, como ), são quilíbrios d Nash, ntão toda stratégia mista candidata a mlhor réplica dv tr suas componnts iguais a zro. ssim não sria robusto a prturbaçõs, portanto, não é um quilíbrio prfito. Sguindo com st msmo raciocínio para os outros quilíbrios tmos qu são mlhors réplicas para, portanto qualqur stratégia mista combinação conva d { é uma mlhor réplica mista contra o prfil, } é um quilíbrio d Nash. Para = (,, ), ond é combinação conva d (, ), (, ) (, ). é uma mlhor réplica? Calculmos os payoffs (, ), 9 (, ) = [,,] 7 [,, 9] = = 9 7 7 9, ) = [,,] 7 [,, 7] = = 9 7 7 ( 9 (, ). = [,,] 7 [ 9, 7, 7] = = 9 7 9 7 7

Cap. -TEORI DOS JOGOS CONCEITUÇÃO E CONTEXTULIDDE 5 Portanto só é uma mlhor réplica para s =, caso contrário não é uma mlhor réplica para (, ) não é um quilíbrio d Nash. Um modo mais claro d vrmos s é um quilíbrio prfito d Nash sria considrarmos a sguint dfinição: Um quilíbrio - prfito m um ogo d forma normal é um prfil Θ NE (), tal qu para cada ogador, maimiza o payoff (, - ε ) suito a h h para toda h S, ond < h < Dst modo s considrarmos a quilíbrio (, ), tmos qu: = [,,] =[,,] = [,,- - ] = [,,- - ] Então, 9 (, ) = [,,] 7 = 7 9 7 7 9 (, ) = [,,] 7 = 7 + 7 7 9 7 7 9 (, ) = [,,] 7 = + 9 9 9 7 7 ( *, S variarmos d a, isto é, simulando **, variamos os payoffs ) obsrvarmos qu não ist < < tal qu (, quilíbrio d Nash, portanto (, ) não é um quilíbrio prfito d Nash ) sa um

Cap. -TEORI DOS JOGOS CONCEITUÇÃO E CONTEXTULIDDE 5 Figura -8 O prfil (, ) não é um quilíbrio prfito d Nash, pois não é robusto à mnor prturbação. Já o prfil (, ) é robusto à qualqur prturbação <.4 Considrmos agora, um outro quilíbrio d Nash dst ogo (, ), assim, rptindo o msmo procdimnto antrior, tmos qu: = [,,] = [, - -, ] =[,,] = [,- -, ] Então, (, ) = 9 7 7 9 7 9,,] [ = (, ) = 7 7 7 9 7 9,,] [ = (, ) = 7 7 7 9 7 9,,] [ =

Cap. -TEORI DOS JOGOS CONCEITUÇÃO E CONTEXTULIDDE 54 S variarmos d m dirção a, isto é, simulando **, variamos os payoffs ( *, ) obsrvarmos qu para todo < <, (, quilíbrio d Nash, dsd qu (, ) é um quilíbrio prfito d Nash. ) > (, ) > (, ) é um ). Portanto (, Figura -9 O prfil (, ) é uma quilíbrio prfito d Nash para todo < < Finalmnt, considrando o quilíbrio d Nash rstant dst ogo ( rptindo os procdimntos antriors, tmos qu:, ) = [,,] =[,,] = [- -,, ] = [- -,, ] Então, 9 (, ) = [,,] 7 = 9 7 7 9 (, ) = [,,] 7 = 7 9 7 7

Cap. -TEORI DOS JOGOS CONCEITUÇÃO E CONTEXTULIDDE 55 9 (, ) = [,,] 7 = + 9 9 7 7 S variarmos d m dirção a, isto é, simulando **, variamos os payoffs ( *, ) assim podrmos obsrvar qu para todo < < ¼, (, ) é um quilíbrio d Nash, dsd qu para st intrvalo (, (, ). Portanto (, ) é um quilíbrio prfito d Nash. ) > (, ) > Figura - O prfil (, ) é uma quilíbrio prfito d Nash para todo < < /4 O sgundo quilíbrio é ritado pla noção d quilíbrio próprio. Obsrv qu pla dfinição d quilíbrio próprio, ( ) = ( ) = > ( ) =,, -7, portanto ( ) > ( ) > (, > >, assim o quilíbrio ( quilíbrio ( ).,,,,, ), portanto ) sria mnos provávl do qu o Então, pla dfinição d quilíbrio próprio slciona-s o quilíbrio na qual ambos os ogadors ogam a primira stratégia. Est quilíbrio dá a ambos os ogadors um payoff igual a um.