Jogos Repetidos Infinitas Vezes Nash Folk Folk Perfeito Jogos Repetidos Finitas Vezes. Jogos Repetidos. Prof. Leandro Chaves Rêgo

Tamanho: px
Começar a partir da página:

Download "Jogos Repetidos Infinitas Vezes Nash Folk Folk Perfeito Jogos Repetidos Finitas Vezes. Jogos Repetidos. Prof. Leandro Chaves Rêgo"

Transcrição

1 Jogos Repetidos Prof. Leandro Chaves Rêgo Programa de Pós-Graduação em Estatística - UFPE Programa de Pós-Graduação em Engenharia de Produção - UFPE Recife, 21 de Outubro de 2014

2 Jogos Repetidos Introdução Agentes podem se comportar de maneira diferente em relação a outros agentes com os quais eles esperam interagir novamente em comparação a outros agentes com os quais eles esperam nunca mais interagir. Para entender como o comportamento racional e inteligente pode ser afetado pela estrutura de futuras interações entre os agentes, estudam-se jogos repetidos. Em geral, temos duas classes de modelos para jogos repetidos: o horizonte pode ser finito ou infinito. Veremos que os resultados podem ser diferentes quando analisamos um ou outro tipo de modelo. Um modelo com um horizonte infinito é apropriado se após cada período de interação os agentes acreditam que o jogo continuará, enquanto um modelo com horizonte finito é apropriado se os agentes claramente percebem um período final de interação para o jogo.

3 Jogos Repetidos Infinitas Vezes O modelo para jogos repetidos infinitas vezes captura uma situação na qual agentes interagem repetidas vezes em um jogo em forma normal G. Assumiremos que G = (N,(A i ) i N,(u i ) i N ), onde A i é compacto e u i é uma função contínua e limitada em A = j N A j. A repetição infinita de um jogo G é um jogo em forma extensiva com informação perfeita e movimentos simultâneos (N,H,P,(u i ) i N ), onde H = { } ( t=1a t ) A, onde é a história inicial e A é o conjunto de todas as seqüências infinitas (a t ) t=1 de perfis de estratégias de G. P(h) = N para toda história não terminal, de forma que todos os jogadores se movem após cada repetição do jogo G.

4 Jogos Repetidos Infinitas Vezes u i é uma função utilidade em A que estende a função utilidade u i no sentido que ela satisfaz a seguinte condição de separabilidade fraca: se (a t ) A, a A, a A, e u i (a) u i (a ), então para todos os valores de t. u i (a 1,...,a t 1,a,a t+1,...) u i (a 1,...,a t 1,a, a t+1,...), Uma história é terminal se, e somente se, ela for infinita. Após qualquer história não terminal, cada jogador escolhe uma ação em A i. Portanto, uma estratégia para o jogador i é uma função que associa uma ação em A i para cada seqüência finita de perfis de estratégias de G.

5 Função Utilidade Podemos impor outras condições nas funções utilidades dos agentes além da separabilidade fraca. Primeiro, podemos assumir que a função utilidade u i do jogo repetido é baseada somente na função utilidade do jogo G, isto é, assumimos que u i ((a t ) t=1) u i ((b t ) t=1) depende apenas da relação entre as correspondentes seqüência de utilidades u i (a t ) e u i (b t ) de G. Consideraremos três possíveis condições na forma da função utilidade, a primeira é definida a seguir:

6 Critério do Desconto Existe algum número δ (0, 1), chamado de fator de desconto, tal que a seqüência de números reais vi t é pelo menos tão boa quanto a seqüência wi t se, e somente se, i=1 δt 1 (vi t wi t ) 0. Como assumimos que vi t é limitada, temos que a série i δ t 1 vi t é convergente e representa como o agente i avalia a seqüência (vi t ) de utilidades. Quando a função utilidade de todos os agentes tomam esta forma, nos referimos ao perfil ((1 δ) t=1 δt 1 vi t ) i N como o perfil de utilidades no jogo repetido associado com a seqüência (v t ) de perfil de utilidades do jogo G. Note que utilidades que satisfazem este critério do desconto tratam os períodos de forma diferente, pois o valor de um ganho diminui com o tempo. As outras condições tratam os períodos de forma simétrica.

7 Critério do Limite das Médias No segundo critério os jogadores avaliam uma seqüência (vi t ) essencialmente 1 pelo limite de sua média aritmética lim T T T t=1 vt i, contudo como este limite pode não existir o critério se torna o seguinte: De acordo com este critério, a seqüência de números reais (vi t ) é melhor que a seqüência (wi t ) se, e somente se, lim inf T 1 T T t=1 (vi t wi t ) > 0. Quando a função utilidade de todos os agentes tomam esta forma, nos 1 referimos ao perfil (lim T T T t=1 vt i ) i N, se ele existe, como o perfil de utilidades no jogo repetido associado com a seqüência (v t ) de perfil de utilidades do jogo G.

8 Observação Note que ao contrário do caso do desconto onde a mudança de utilidade em apenas um único período pode alterar a preferência entre seqüências, no caso do critério do limite de médias, qualquer mudança em um número finito de períodos não altera como a seqüência é avaliada. Portanto, este critério é útil para modelar situações onde os agentes põe toda importância no longo prazo mesmo que isso signifique prejuízos consideráveis no curto prazo.

9 Critério da Ultrapassagem O terceiro e último critério trata os períodos simetricamente, coloca ênfase no longo prazo, mas ao mesmo tempo é sensível a uma mudança de utilidade em um único período. De acordo com este critério, a seqüência de números reais (vi t ) é melhor que a seqüência (wi t ) se, e somente se, lim inf T T t=1 (vi t wi t ) > 0. Observação 1.1 Quando utilizamos este critério, não pode-se definir um perfil de utilidades do jogo repetido associado a uma seqüência de utilidades v t do jogo G, pois na grande maioria dos casos de interesse t vt i é uma série divergente.

10 Exemplos Os seguintes exemplos ilustram algumas diferenças entre esses três critérios. A seqüência (1, 1,0, 0,...) é melhor para qualquer δ (0,1) pelo critério do desconto que a seqüência (0,0,...), mas de acordo com os outros dois critérios as seqüências são indiferentes. A seqüência ( 1,2,0, 0,...) é melhor que a seqüência (0, 0,...) segundo o critério da ultrapassagem, mas as duas são indiferentes segundo o critério do limite das médias. A seqüência (0,...,0, 1,1,...) na qual M zeros são seguidos por uma seqüência constante de 1 s é melhor pelo critério do limite das médias que a seqüência (1,0, 0,...) para qualquer valor de M, mas para qualquer δ existe um M grande o suficiente tal que para todo M > M, esta última seqüência é melhor que a anterior pelo critério do desconto para este valor de δ.

11 Perfil de Utilidades Possível Denotaremos por u(a) o perfil (u i (a)) i N. Um vetor v IR N é um perfil de utilidades de (N,(A i ),(u i )) se existe um perfil de estratégias a A para o qual v = u(a). Nos referimos a um vetor v IR N como um perfil de utilidades possível de (N,(A i ),(u i )) se ele for uma combinação convexa de perfis de utilidades, isto é, se v = a A αau(a) para alguma coleção (αa) a A de números racionais não-negativos com a Aαa = 1.a Note que um perfil de utilidades possível de (N,(A i ),(u i )) não é necessariamente um perfil de utilidades de (N,(A i ),(u i )). a Seguimos a restrição de requerer que α a seja racional sugerida por Osborne e Rubistein (1994), esta restrição pode ser retirada complicando argumentos que veremos a seguir.

12 Estratégias como Máquinas Vamos agora apresentar uma linguagem para descrever convenientemente as estratégias utilizadas por jogadores em jogos repetidos. Começamos definindo o que é uma máquina, que é uma abstração do processo utilizado por um jogador para implementar uma estratégia. Uma máquina para o jogador i de um jogo G = (N,(A i ),(u i )) repetido infinitas vezes têm as seguintes componentes: Um conjunto de estados Q i. Um estado inicial q 0 i Q i. Uma função de saída f i : Q i A i que especifica uma estratégia do jogo G para cada estado. Uma função de transição τ i : Q i A Q i que associa um estado a cada par de estado e perfil de estratégias do jogo G.

13 Exemplos Para ilustrar este conceito de máquina considere os seguintes exemplos de máquinas para um jogador no Dilema do Prisioneiro representado na tabela a seguir repetido infinitas vezes. C D C 3,3 0,4 D 4,0 1,1

14 Máquina 1 A máquina (Q i,q 0 i,f i,τ i ) definida a seguir é a mais simples que implementa a estratégia que escolhe C enquanto ambos jogadores tenham sempre escolhido C no passado, e escolhe D no caso contrário. Q i = {C, D}. q 0 i = C. f i (C) = C e f i (D) = D. τ i (C,(C,C)) = C e τ i (X,(Y,Z)) = D se (X,(Y,Z)) (C,(C,C)).

15 Máquina 2 A seguinte máquina implementa a estratégia para o jogador 1 escolha C enquanto 2 escolhe C, se o jogador 2 escolhe D quando o jogador 1 escolhe C, o jogador 1 jogará D por três períodos seguidos e retornará a escolher C após esses três períodos independente das escolhas de 2 nestes três períodos, ou seja, 1 pune 2 por três períodos e depois perdoa 2. Q 1 = {P 0, P 1,P 2,P 3}. q 0 1 = P 0. f 1(P 0) = C e f 1(P) = D se P P 0. τ 1(P 0,(,C)) = P 0, τ 1(P 0,(, D)) = P 1, τ 1(P 1,(, )) = P 2, τ 1(P 2,(, )) = P 3, e τ 1(P 3,(, )) = P 0.

16 Máquina 3 A seguinte máquina implementa a estratégia para o jogador 2, comece jogando C e continue se o jogador 1 escolhe D. Se o jogador 1 escolher C, então escolha D, continue a jogar D até que o jogador 1 escolha D novamente, quando 2 deverá escolher C, e assim por diante. Q 2 = {R 0,R 1}. q 0 2 = R 0. f 2(R 0) = C e f 2(R 1) = D. τ 2(R 0,(D, )) = R 0, τ 2(R 0,(C, )) = R 1, τ 2(R 1,(C, )) = R 1, e τ 2(R 1,(D, )) = R 0.

17 Estratégias Gatilho: Teoremas de Nash Folk Estudamos agora o conjunto de equilíbrios de Nash de um jogo repetido infinitas vezes. Mostramos que este conjunto inclui perfis de estratégias que não são repetições de equilíbrios de Nash do jogo que se repete a cada período. Para justificar este perfil, cada jogador deve ser impedido de desviar através de uma punição. Esta punição pode tomar várias formas. Uma possibilidade é que cada jogador use uma estratégia gatilho: qualquer desvio dos outros jogadores leva o jogador a realizar uma estratégia punitiva que dura para sempre. Nesta seção estudaremos equilíbrios em que os jogadores utilizam tais tipos de estratégias.

18 Utilidade Minimax Dado um jogo G = (N,(A i ),(u i )), uma utilidade minimax para o jogador i, denotada por v i, é a menor utilidade que os demais jogadores podem forçar jogador i receber: v i = min max u i (a i, a i ). a i A i a i A i Um perfil de utilidades w para o qual temos w i v i para todo i N é chamado individualmente racional; se w i > v i para todo i N, então w é individualmente racional estrito. Se a A é um perfil de estratégias de G para o qual u(a) é individualmente racional (estrito), então nos referimos a a como um perfil de estratégias individualmente racional (estrito) de G. Seja p i A i uma das soluções do problema de minimização acima. A coleção de estratégias p i é a punição mais severa que os demais jogadores podem impor ao jogador i. Mostraremos que existe uma relação entre o conjunto de perfis de utilidade dos equilíbrios de Nash de um jogo repetido infinitas vezes e o conjunto de perfis de utilidade possíveis e individualmente racionais do jogo G, quando utilizamos ou o critério do desconto ou o critério do limite das médias.

19 Equilíbrio de Nash de Jogo Repetido Infinitas Vezes Teorema 2.1 Todo perfil de utilidades de um equilíbrio de Nash do jogo G = (N,(A i ),(u i )) repetido infinitas vezes quando se utiliza os critérios do limite das médias ou do desconto para qualquer fator de desconto δ (0,1) é um perfil de utilidades individualmente racional de G.

20 Prova Suponha que w é um perfil de utilidades do jogo que não é individualmente racional em G. Então, existe i N tal que w i < v i. w não pode ser um perfil de utilidades de um equilíbrio de Nash do jogo repetido infinitas vezes quando se utiliza os critérios do limite das médias ou do desconto para qualquer fator de desconto δ (0, 1), pois para qualquer perfil de estratégias do jogo repetido s, a estratégia s i do jogador i que é uma melhor resposta a s i (h) para cada história h garante ao jogador i utilidade de pelo menos v i em cada período. Portanto, utilizando qualquer um desses dois critérios, temos que é vantajoso para o jogador i mudar de estratégias quando estamos considerando qualquer perfil de estratégias que dá ao jogador i utilidade menor que v i. Logo, tais perfis não podem ser equilíbrios de Nash do jogo repetido.

21 Nash Folk para Limite das Médias O próximo teorema prova a recíproca para o caso do critério do limite das médias. Teorema 2.2 Teorema de Nash Folk para o Critério do Limite das Médias. Todo perfil de utilidades possível e individualmente racional de um jogo G = (N,(A i ),(u i )) é um perfil de utilidades de um equilíbrio de Nash do jogo G repetido infinitas vezes quando utilizamos o critério do limite das médias.

22 Prova Seja w = a A (βa )u(a) um perfil de utilidades possível e individualmente γ racional, onde β a é um número inteiro e γ = a Aβa. (Note que é sempre possível escrever um perfil de utilidades possível e individualmente racional desta forma pois assumimos que α a é um número racional na definição de um perfil de utilidades possível.) Seja (a t ) uma seqüência cíclica de perfis de estratégia do jogo G onde o ciclo de comprimento γ possui β a repetições do perfil de estratégias a para todo a A. Seja s i a estratégia para o jogo repetido do jogador i que escolhe ai t em cada período t exceto quando existir algum período anterior t onde um único jogador diferente de i desviou da estratégia especificada pelo perfil a t, neste caso, se j foi o primeiro jogador a desviar em um tal período t, temos que i jogará a estratégia (p j ) i em todos os períodos subseqüentes a t independente do que os demais jogadores façam no futuro.

23 Prova O perfil de estratégias s é um equilíbrio de Nash do jogo repetido visto que um jogador j que desvia da estratégia s j recebe no máximo sua utilidade minimax v j em todo período subseqüente ao primeiro desvio, portanto segundo o critério do limite das médias a utilidade desta outra estratégia é menor ou igual a v j. Mas de acordo com o perfil s, a utilidade de j é igual a w j v j segundo este critério, portanto nenhum jogador tem incentivo a desviar da estratégia determinada pelo perfil s.

24 Nash Folk para Desconto O próximo teorema é o resultado análogo para o critério do desconto. Teorema 2.3 Seja w um perfil de utilidades possível e individualmente racional estrito de um jogo G = (N,(A i ),(u i )). Para todo ǫ > 0, existe δ < 1 tal que se 1 > δ > δ, então o jogo G repetido infinitas vezes quando se utiliza o critério do desconto com fator de desconto δ possui um equilíbrio de Nash com perfil de utilidades w satisfaz w w < ǫ. Prova: Exercício.

25 Exemplo Para ilustrar equilíbrios de Nash nos quais jogadores utilizam estratégias gatilho, considere dois jogos repetidos infinitas vezes. O primeiro G 1 é o Dilema do Prisioneiro descrito na tabela a seguir: C D C 3,3 0,4 D 4,0 1,1

26 Exemplo O segundo G 2 é o jogo descrito na tabela a seguir: C D C 2,3 1,5 D 0,1 0,1

27 Exemplo Em G 1 e G 2 temos que a utilidade minimax para ambos os jogadores é 1 e jogando D cada jogador garante que o outro não pode conseguir uma utilidade maior que este valor (p 1 = p 2 = D). Em ambos os casos, a estratégia gatilho utilizada na prova do Teorema Nash Folk para o limite das médias envolve os jogadores mudarem para utilizar D em resposta a algum desvio das estratégias de equilíbrio. Em G 1 como D domina C, então esta ameaça é justificável. Por outro lado, em G 2 como a estratégia C domina a estratégia D para o jogador 1, o jogador 1 sofre com a punição que ele impõe ao jogador 2. Portanto, esta ameaça no jogo G 2 parece inacreditável. Observação 2.4 Este exemplo nos leva a necessidade de analisar equilíbrios de subjogo perfeito, pois neste caso todos os jogadores têm que agir otimamente após cada história.

28 Punindo por Tempo Limitado: Um Teorema de Folk Perfeito para o Critério do Limite das Médias As estratégias gatilho utilizadas na prova do Teorema de Nash Folk punem os jogadores que desviam da estratégia de equilíbrio indefinidamente. Esta punição pode ser desnecessariamente severa, só é necessário manter a utilidade do jogador que desvia da estratégia prescrita no nível minimax por uma quantidade de períodos suficientemente grande para que o desvio não seja lucrativo; deste modo, inibindo tal comportamento. Se as preferências dos jogadores obedecem o critério do limite das médias, então esta estratégia que retorna a trajetória de equilíbrio tem a vantagem que ela proporciona a mesma utilidade que a trajetória de equilíbrio, visto que elas diferem em apenas um número finito de períodos. Portanto, esta estratégia não causa nenhum prejuízo ao jogador que precisa impor uma punição a algum oponente. Veremos que tal estratégia constitui um equilíbrio de subjogo perfeito do jogo repetido infinitas vezes quando o critério do limite das médias é utilizado.

29 Folk Perfeito para Limite das Médias Teorema 3.1 Todo perfil de utilidades possível e individualmente racional estrito de um jogo G = (N,(A i ),(u i )) é um perfil de utilidades de um equilíbrio de subjogo perfeito do jogo G repetido infinitas vezes quando consideramos o critério do limite das médias.

30 Prova Seja w = a A (βa )u(a) um perfil de utilidades possível e individualmente γ racional estrito, onde β a é um número inteiro e γ = a Aβa. Seja ainda (a k ) γ k=1 uma seqüência de perfis de estratégia de G que consiste de βa repetições de a para cada a A. Vamos construir um perfil de estratégias para o jogo repetido que gera uma seqüência de perfis de estratégias de G que consiste de infinitas repetições do ciclo (a k ) γ k=1. Cada jogador pune um desvio dos demais por um período limitado de tempo, que por conveniência assumiremos que só inicia após o fim de um ciclo (a k ) γ k=1. Após o período de punição todos os jogadores retomam as repetições de (a k ) γ k=1. Se houverem desvios simultâneos de jogadores esses são ignorados e não são punidos. Como estamos considerando o critério do limite das médias, se todos os jogadores, seguem este tipo de estratégia temos que qualquer trajetória têm perfil de utilidade w. Formalmente, seja g = max i N,a i A i,a A u i (a i,a i) u i (a), isto é, g é o maior ganho que qualquer jogador pode ter desviando de qualquer perfil de estratégias. Como w i > v i, existe um inteiro m grande o suficiente tal que m (w i v i ) γg para todo i N. A estratégia de qualquer jogador i pune qualquer jogador que desvie por m períodos e é descrita pela seguinte máquina:

31 Prova Q i = {(Norm k, d): ou k = 1 e d = 0, ou 2 k γ e d {0} N} {P(j, t) : j N e 1 t m }. O estado (Norm k, 0) significa que estamos no k-ésimo período de um ciclo e nenhum jogador merece punição. O estado (Norm k, j) significa que estamos no k-ésimo período de um ciclo e o jogador j merece punição. O estado P(j, t) significa que o jogador j está sendo punido e ainda restam t períodos de punição. q 0 i = (Norm 1,0).

32 Prova f i ((Norm k,d)) = a k i, f i (P(j,t)) = (p j ) i se j i e f i (P(i, t)) = b i (p i ), onde b i (p i ) é uma melhor resposta para p i em G. De P(j, t) mude para P(j,t 1) se 2 t m, de P(j, 1) mude para (Norm 1, 0). De (Norm k,d) mude para (Norm k+1(modγ),d), exceto quando d = 0 e apenas o jogador j desviou de a k, neste caso, de (Norm k, 0) mude para (Norm k+1, j) se k γ e de (Norm γ, 0) mude para P(j, m ). d 0 e k = γ, neste caso de (Norm γ, d) mude para P(d, m ).

33 Prova Vamos agora verificar que este perfil de estratégias constitui um equilíbrio de subjogo perfeito do jogo repetido quando usamos o critério do limite das médias. Primeiro, após qualquer história na qual nenhum jogador tenha desviado ainda, nenhum jogador pode desviar da estratégia de equilíbrio e obter ganhos, pois o maior ganho possível por ciclo é γg e a perda que o jogador i sofrerá pela punição dos demais é m (w i v i ) por ciclo, que é maior ou igual a γg para todo i N. Suponha agora que estamos em qualquer história na qual o jogador j merece ser punido ou está sendo punido. Note que após o ciclo de punição para o jogador j, segundo as estratégias de equilíbrio, o jogo retornará ao estado inicial, e já provamos que deste ponto em diante não é vantajoso para nenhum jogador desviar da estratégia de equilíbrio. Portanto, como até o fim do ciclo da punição temos uma quantidade finita de no máximo (γ + m ) períodos, segundo o critério do limite das médias nenhum jogador pode desviar com vantagem.

34 Exemplo Considere novamente o jogo da tabela a seguir repetido infinitas vezes. C D C 2,3 1,5 D 0,1 0,1

35 Exemplo Neste jogo, temos v 1 = v 2 = 1. Considere o perfil de estratégias do jogo repetido definido na prova do Teorema 3.1 que suporta a seqüência de perfis de estratégia (a t ), onde a t = (C,C) que toma a seguinte forma: cada jogador escolhe C em todo período a não ser que os outros jogadores desviaram no período anterior, neste caso o jogador escolhe D por 2 períodos e depois retorna a escolher C.Observe que após qualquer história onde não houve desvio ou onde já terminou o período de punição, o jogador 1 não incentivo a desviar pois C é uma estratégia dominante para ele. O jogador 2, após qualquer história onde não houve desvio ou onde já terminou o período de punição, também não tem incentivo para desviar pois se desviar receberá (5,1,1) por cada ciclo de desvio e punição, enquanto se não desviar receberá (3,3, 3). Imediatamente após um desvio do jogador 2, o jogador 2 pode tomar qualquer ação nos dois períodos de punição que teremos um equilíbrio de subjogo perfeito, enquanto o jogador 1 se seguir a estratégia de equilíbrio receberá (0, 0,2, 2,2, 2,2,...) e se resolver não punir jogador 2 receberá (2, 2,2, 2,2,...). Como pelo critério do limite das médias essas sequências são indiferentes, então o jogador 1 irá punir o jogador 2.

36 Exemplo Apesar desta estratégia ser um equilíbrio de subjogo perfeito quando considera-se o critério do limite das médias, ela não é um equilíbrio de considerarmos ou a regra da ultrapassagem ou a regra do desconto. Note que após um desvio do jogador 2, o jogador 1 deve escolher D por 2 períodos antes de retornar a C. Contudo, jogador 1 estaria melhor escolhendo C que punindo o jogador 2, pois a seqüência de utilidades (2,2, 2,2, 2,...) é melhor segundo os critérios de ultrapassagem e do desconto que a seqüência (0, 0,2, 2,2,...). Para justificar uma trajetória de equilíbrio na qual o perfil de estratégias (C,C) é utilizado em todo período, jogador 2 precisa punir o jogador 1 se este não punir o jogador 2. Além disso, jogador 2 tem que ser punido se ele não punir jogador 1 por não punir o jogador 2, e assim por diante. A seguir usaremos estratégias que satisfazem este critério para provar Teoremas Perfeitos de Folk para os critérios de ultrapassagem e desconto.

37 Punindo quem não Pune: Um Teorema de Folk Perfeito para o Critério da Ultrapassagem O próximo teorema utiliza estratégias que punem quem não punir para provar um teorema de Folk Perfeito para o critério da ultrapassagem. Por simplicidade, construiremos uma estratégia apenas para o caso onde a trajetória de equilíbrio consiste de repetições de um único perfil de estratégia individualmente racional estrito. Teorema 3.2 Para todo perfil de estratégias individualmente racional estrito a de um jogo G = (N,(A i ),(u i )), existe um um equilíbrio de subjogo perfeito do jogo G repetido infinitas vezes quando consideramos o critério da ultrapassagem que gera a trajetória (a t ), onde a t = a, t.

38 Prova Seja M o máximo de u i (a) para todo i N e a A. Considere o perfil de estratégias onde o jogador i utiliza a estratégia descrita pela seguinte máquina: Q i = {Norm} {P(j, t) : j N e t IN}. No estado Norm ninguém necessita ser punido. No estado P(j, t) jogador j necessita ser punido por t períodos. q 0 i = Norm.

39 Prova f i (Norm) = a i, f i (P(j, t)) = (p j ) i se j i e f i (P(i, t)) = b i (p i ), onde b i (p i ) é uma melhor resposta para p i em G. Em resposta a um perfil de estratégia a: De Norm fique em Norm exceto quando a j a j para um e somente um j, neste caso mude para P(j, t), onde t é o menor inteiro tal que M + tv j < (t + 1)u j (a ). (Lembre que como a é individualmente racional estrito u j (a ) > v j j N.)

40 Prova De P(j, t): se a j = p j ou a l (p j ) l para pelo menos dois jogadores diferentes de j, ou seja, ou todos punem j ou pelo menos dois não punem, mude para P(j, t 1) se t 2, e para Norm se t = 1. se a l (p j ) l para um e somente um jogador l, então mude para P(l,T(j, t)), onde T(j, t) é um inteiro grande o suficiente tal que a soma da utilidade de l no estado P(j,t) e nos T(j, t) períodos seguintes se l não desviar é maior ou igual sua utilidade no estado P(j, t) quando ele desvia mais T(j,t)v l. (Este número T(j, t) existe pois após t períodos os jogadores retornariam ao perfil de equilíbrio a e u l (a ) > v l ). Com este perfil de estratégias, qualquer tentativa de algum jogador de aumentar sua utilidade desviando sozinho após qualquer história, incluindo histórias após a qual punição deve ocorrer, não é vantajosa devido a punição imposta pelos outros jogadores. Um argumento similar ao do Teorema 3.1 prova que este perfil é realmente um equilíbrio de subjogo perfeito. Verifique!

41 Recompensando quem Pune: Um Teorema de Folk Perfeito para o Critério do Desconto Como na estratégia utilizada na seção anterior um jogador, que não pune um outro jogador j que deveria ser punido no período t, deve ser penalizado durante T(j, t) períodos no futuro, temos que estes períodos de penalização podem ser cada vez maiores, portanto não importa quão próximo de 1 seja o fator de desconto pode ser que seja impossível que a pena futura seja maior que o ganho presente do jogador quando utilizamos o critério do desconto. Para estabelecer um resultado análogo para o caso do critério do desconto, para tanto usaremos estratégias segundo as quais jogadores que punem jogadores que desviam da estratégia de equilíbrio são recompensados no futuro tornando o ato de punir vantajoso para tais jogadores. Como anteriormente, por simplicidade, construiremos uma estratégia apenas para o caso onde a trajetória de equilíbrio consiste de repetições de um único perfil de estratégia individualmente racional estrito. Neste, teorema precisamos restringir a classe de jogos G. Dizemos que um jogo G = (N,(A i ),(u i )) tem dimensionalidade completa em relação a um perfil de estratégias a individualmente racional e estrito se existe uma coleção (a(i)) i N de perfis de estratégias individualmente racionais e estritos de G de forma que para todo i N, temos a i a(i) e a(j) i a(i) para todo j N {i}.

42 Folk Perfeito para Desconto Teorema 3.3 Seja a um perfil de estratégias individualmente racional e estrito de um jogo G = (N,(A i ),(u i )) com dimensionalidade completa em relação a a. Então, existe δ < 1 tal que para todo δ > δ existe um equilíbrio de subjogo perfeito do jogo G repetido infinitas vezes quando utilizamos o critério do desconto com fator de desconto δ que gera a trajetória (a t ) na qual a t = a para todo t.

43 Prova Iremos descrever as estratégias utilizadas pelos jogadores neste tipo de equilíbrio de subjogo perfeito utilizando uma máquina com três tipos de estados. No estado C(0) o perfil de estratégias de G escolhido pelos jogadores é a. Para cada j N o estado C(j) é um estado de reconciliação que ocorre após uma punição ao jogador j ser completada, neste estado o perfil de estratégias escolhido é a(j). Para cada jogador j e período t entre 1 e L, que especificaremos depois, o estado P(j, t) é um no qual ainda restam t períodos para o jogador j ser punido, neste estado todo jogador i exceto j escolhe a estratégia (p j ) i, e o jogador j escolhe uma melhor resposta para p j. Se um único jogador i se desviar da trajetória de equilíbrio ocorre uma transição para o estado P(i, L). Se em nenhum dos L períodos houver um desvio por um único jogador diferente de i o estado se torna C(i). Note que o conjunto de estados {C(i)} serve como um sistema que pune jogadores que desviam durante a fase de punição: se algum jogador i não pune jogador j como ele deveria fazer, então após a fase de punição ao invés do estado se tornar C(j) se tornará C(i), então o perfil de estratégias escolhido será pior para o jogador i, pois a(j) i a(i). Formalmente, assumindo que a(0) = a, temos

44 Prova Q i = {C(j) : j {0} N} {P(j, t) : j N e 1 t L}. q 0 i = C(0). f i (C(j)) = (a(j)) i, f i (P(j, t)) = (p j ) i se j i e f i (P(i,t)) = b i (p i ), onde b i (p i ) é uma melhor resposta para p i em G.

45 Prova Em resposta a um perfil de estratégia a: De C(j) fique em C(j) exceto quando a k (a(j)) k para um e somente um k, neste caso mude para P(k, L). De P(j, t): se a j = p j ou a k (p j ) k para pelo menos dois jogadores diferentes de j, ou seja, ou todos punem j ou pelo menos dois não punem, mude para P(j, t 1) se t 2, e para C(j) se t = 1. se a k (p j ) k para um e somente um jogador k j, então mude para P(k,L).

46 Prova Resta-nos agora especificar os valores de δ e L. Seja M o máximo de u i (a) para todo i N e a A. Devemos escolher δ e L grandes o suficiente para que qualquer desvio não seja vantajoso. Considere que estamos em um estado C(j), então a utilidade esperada para qualquer jogador i desviar da estratégia de equilíbrio é no máximo igual a: M + L δ k v i + k=1 k=l+1 δ k u i (a(i)). Por outro lado se i não desviar, sua utilidade esperada é: u i (a(j))+ L δ k u i (a(j))+ k=1 δ k u i (a(j)). k=l+1

47 Prova Note que or suposição temos que u i (a(j)) > u i (a(i)). Como u i (a(j)) > v i para todo i, podemos escolher L tal que M u i (a(j)) < L(u i (a(j)) v i ) para todo i N e j {0} N. Podemos ainda escolher δ próximo o suficiente de 1 tal que para todo δ > δ, i N e j {0} N, temos M + L δ k v i < u i (a(j))+ k=1 L δ k u i (a(j)). Portanto, para tais escolha de L e δ não é vantajoso para nenhum jogador i desviar em um estado C(j). Suponha agora que estamos em um estado P(j,t), então a utilidade esperada para qualquer jogador i j desviar da estratégia de equilíbrio é no máximo igual a: M + L δ k v i + k=1 k=1 δ k u i (a(i)). k=l+1

48 Prova Por outro lado se i não desviar, sua utilidade esperada é: t 1 δ k u i (p j,b j (p j ))+ δ k u i (a(j)). k=0 Como t < L+1 e u i (a(j)) > u i (a(i)), podemos escolher δ > δ próximo o suficiente de 1 tal que para todo δ > δ, i N e j {0} N, temos M + < k=t L t 1 δ k v i δ k u i (p j,b j (p j )) k=1 k=0 δ k u i (a(j)) k=t k=l+1 δ k u i (a(i)). Portanto, temos que não é vantajoso para um jogador i desviar em um estado P(j, t). Como j utiliza uma melhor resposta em um estado P(j, t) não é vantajoso para ele desviar desta estratégia.

49 Jogos Repetidos Finitas Vezes Vamos agora estudar jogos repetidos finitas vezes. Seja G = (N,(A i ) i N,(u i ) i N ), onde A i é compacto e u i é uma função contínua e limitada em A = j N A j. Definição 4.1 A repetição finita de um jogo G é um jogo em forma extensiva com informação perfeita e movimentos simultâneos (N,H, P,(u i ) i N ), onde H = { } ( T t=1a t ), onde é a história inicial. P(h) = N para toda história não terminal, de forma que todos os jogadores se movem após cada repetição do jogo G. u i é uma função utilidade em A T que estende a função utilidade u i. Vamos nos restringir ao caso do critério do limite das médias, ou seja, assumiremos que u i (a) = 1 T T t=1 u i(a t ), onde a = (a 1,a 2,...,a T ).

50 Jogos Repetidos Finitas Vezes Uma história a é terminal se, e somente se, a A T. Após qualquer história não terminal, cada jogador i escolhe uma ação em A i. Portanto, como no caso infinito uma estratégia para o jogador i é uma função que associa uma ação em A i para cada seqüência finita de perfis de estratégias de G. Este jogo é conhecido como a repetição do jogo G durante T períodos.

51 Equilíbrio de Nash O argumento intuitivo por trás dos Teoremas de Folk para jogos repetidos infinitas vezes é que qualquer perfil de utilidades que seja desejável por todos os jogadores pode ser um equilíbrio de Nash se todos acreditam que quando se desviarem da trajetória de equilíbrio serão punidos pelos demais jogadores. No caso de jogos finitos, este argumento não pode ser aplicado em todos os casos, pois sempre teremos que os jogadores devem jogar um equilíbrio de Nash no último período de repetição T. Portanto, quando analisamos o período anterior T 1 as ameaças de punição podem se tornar inacreditáveis. O próximo teorema mostra que no caso especial em que todos os equilíbrios de Nash o perfil de utilidades é igual ao perfil de utilidades minimax de G (como no caso do Dilema do Prisioneiro), então em qualquer período os jogadores deverão utilizar um equilíbrio de Nash de G.

52 Equilíbrio de Nash para Jogos Repetidos Finitas Vezes Teorema 4.2 Se o perfil de utilidades em qualquer equilíbrio de Nash de um jogo em forma normal G é o perfil (v i ) i N de utilidades minimax de G, então para qualquer valor de T, todo equilíbrio de Nash do jogo G repetido T vezes gera uma trajetória de perfis de estratégias (a 1,...,a T ) do jogo G com a propriedade que a t é um equilíbrio de Nash de G, para todo t = 1,2,...,T.

53 Prova Seja s o perfil de estratégias do jogo repetido que gera a trajetória de equilíbrio a = (a 1,...,a T ). Suponha que exista um período t tal que a t não seja um equilíbrio de Nash de G. Então, existe i N tal que u i (a t i,a i ) > u i (a t ). Considere a estratégia s i do jogador i que difere de s i apenas no fato que após a história (a 1,a 2,...,a t 1 ) ela escolhe a i, e após qualquer história h que se segue, ela escolhe uma ação melhor resposta para s i (h), obtendo portanto uma utilidade pelo menos igual a utilidade minimax v i. A trajetória gerada por (s i,s i) é uma história terminal b A T que é idêntica a a até o período t 1, u i (b t ) > u i (a t ), e u i (b r ) v i = u i (a r ) para todo r t + 1. Portanto, jogador i prefere b a a, contradizendo a suposição que s é um equilíbrio de Nash do jogo repetido.

54 Observação Este resultado se aplica a uma classe muito pequena de jogos. Por exemplo, se o jogo G possuir um equilíbrio de Nash a no qual a utilidade de algum jogador excede sua utilidade minimax, então este jogador pode ser punido no último período se ele tiver desviado no penúltimo período e a estratégia que seria utilizada no último período fosse igual a a. Se esta punição não for suficiente, então existe L grande o suficiente tal que se a for a estratégia a ser jogada nos últimos L períodos, então qualquer desvio antes destas últimas L jogadas pode ser punido impondo um pagamento minimax ao jogador que desviar até o fim do jogo. O valor de L é independente da duração do jogo T. Portanto, para T grande o suficiente, podemos obter como média das utilidades em um equilíbrio de Nash do jogo repetido T vezes qualquer perfil de utilidades possível e individualmente racional estrito. O próximo teorema ilustra este fato.

55 Folk Nash Finito Teorema 4.3 Se G = (N,(A i ),(u i )) tem um equilíbrio de Nash a no qual a utilidade de qualquer jogador i excede sua utilidade minimax v i, então para qualquer perfil de estratégia a de G individualmente racional estrito e qualquer ǫ > 0, existe um inteiro T tal que se T > T o jogo G repetido T vezes tem um equilíbrio de Nash no qual o pagamento de cada jogador i difere de u i (a ) por menos que ǫ.

56 Prova Considere a estratégia do jogador i descrita pela seguinte máquina. Q i = {Norm t : 1 t T L} {P(j) : j N} {Nash}. q 0 i = Norm 1. f i (Norm t ) = a i, f i (Nash) = a i, f i (P(j)) = (p j ) i se j i e f i (P(i)) = b i (p i ), onde b i (p i ) é uma melhor resposta para p i em G. De Norm t mude para Norm t+1 exceto quando t = T L, neste caso mude para Nash, ou quando apenas um jogador j desviou de a, neste caso mude para P(j). De P(j) permaneça em P(j) para todo j N, e de Nash permaneça em Nash.

57 Prova Resta-nos especificar L. Um desvio só pode ser vantajoso em um dos estados Norm t. Para impedir tal desvio requeremos que L seja grande o suficiente tal que max ai A i u i (a i,a i ) u i (a ) L(u i (a ) v i ) para todo i N. Finalmente, para obter um perfil de utilidades que difere de u i (a ) por menos de ǫ, escolhemos T de forma que (T L)u i (a )+Lu i (a ) T u i (a ) < ǫ, i N.

58 Equilíbrio de Subjogo Perfeito Em qualquer equilíbrio de subjogo perfeito de um jogo repetido finitas vezes, o perfil de estratégias utilizado no último período após qualquer história (não apenas após a história que ocorre se os jogadores seguem suas estratégias) deve ser um equilíbrio de Nash de G. Portanto, a estratégia utilizada no teorema anterior não constitui um equilíbrio de subjogo perfeito. Na verdade nenhuma punição é possível se G tem um único equilíbrio de Nash. Teorema 4.4 Se todos os equilíbrios de Nash de um jogo em forma normal G possuem um único perfil de utilidades, então para qualquer valor de T o perfil de estratégias escolhido após qualquer história em qualquer equilíbrio de subjogo perfeito do jogo G repetido T vezes é um equilíbrio de Nash de G.

59 Prova O perfil de estratégias utilizado em qualquer subjogo que começa no período T em qualquer equilíbrio de subjogo perfeito do jogo repetido T vezes deve ser um equilíbrio de Nash de G. Portanto, a utilidade de qualquer jogador no último período é independente da história. Conseqüentemente, em qualquer subjogo que comece no período T 1 temos que em qualquer equilíbrio de subjogo perfeito o perfil de estratégias utilizado em T 1 deve ser um equilíbrio de Nash de G. O restante da prova segue por indução.

60 Exemplo No caso em que o jogo G possua mais de um equilíbrio de Nash que produzam diferentes perfis de utilidades, então podemos realizar punição em um equilíbrio de subjogo perfeito. Considere o seguinte exemplo: Considere o jogo em forma normal a seguir: C D E C 3,3 0,4 0,0 D 4,0 1,1 0,0 E 0,0 0,0 0,0

61 Exemplo Existe um equilíbrio de subjogo perfeito deste jogo repetido T vezes no qual o perfil de estratégias (C,C) é utilizado em todos exceto nos últimos 3 períodos, nos quais o perfil utilizado é (D,D). No equilíbrio ambos jogadores utilizam a seguinte estratégia, escolha C em qualquer período até o período T 3 a não ser que D já tenha sido usada no passado, neste caso escolha E até o fim do jogo. Se C for utilizada por ambos até o período T 3, escolha D nos últimos 3 períodos. Um jogador que desviar para D até o período T 3 após uma história que consiste somente de perfis (C,C) nos períodos anteriores ganhará 1 em utilidade neste período e perderá pelo menos 3 em utilidade já que o outro jogador escolherá E nos períodos seguintes. Observe que esta punição é justificada pois, (E,E) também é um equilíbrio de Nash de G. É interessante ressaltar que este jogo difere de um Dilema do Prisioneiro apenas pela inclusão de uma ação fracamente dominada para cada jogador.

62 Folk Perfeito Finito O próximo teorema caracteriza o conjunto de perfis de utilidade que podem ser obtidos através de um equilíbrio de subjogo perfeito do jogo G repetido infinitas vezes para uma grande classe de jogos G. Teorema 4.5 Seja a um perfil de estratégias individualmente racionais estrito de G = (N,(A i ),(u i )). Assuma que (a) para cada i N existem dois equilíbrios de Nash de G que diferem na utilidade do jogador i e (b) existe uma coleção (a(i)) i N de perfis de estratégias individualmente racionais estritos de G tal que para todo jogador i N, temos a i a(i) e a(j) i a(i) para todo j N {i}. Então, para todo ǫ > 0, existe um inteiro T tal que se T > T o jogo G repetido T vezes tem um equilíbrio de subjogo perfeito no qual a utilidade do jogador i difere de u i (a ) por menos de ǫ para todo i N.

63 Prova A prova formal é omitida, mas intuitivamente, o perfil de estratégias do jogo repetido infinitas vezes tem o seguinte formato. Existem três etapas. Durante as duas primeiras etapas os jogadores escolhem a enquanto nenhum jogador desviar. Caso não haja desvios nas duas primeiras etapas, na terceira etapa os jogadores implementam uma seqüência de equilíbrios de Nash do jogo G para o qual a utilidade média de cada jogador é maior que a pior utilidade do jogador em algum equilíbrio de Nash do jogo G. Desvios são punidos da seguinte maneira. Um desvio na primeira etapa é punido com os demais jogadores forçando a utilidade minimax no jogador que desviou por um longo período e depois entrando em uma fase de reconciliação como no caso de teorema de Folk Perfeito para o critério do desconto. Um desvio na segunda etapa é punido com os jogadores implementando no início da terceira etapa o pior equilíbrio de Nash para o jogador que desviou. Como na terceira etapa, os jogadores só implementam equilíbrios de Nash não há incentivo a desvios.

Refinamentos de Equilíbrios de Nash

Refinamentos de Equilíbrios de Nash Refinamentos de Equilíbrios de Nash Prof. Leandro Chaves Rêgo Programa de Pós-Graduação em Estatística - UFPE Programa de Pós-Graduação em Engenharia de Produção - UFPE Recife, 06 de Outubro de 2014 Equilíbrio

Leia mais

Jogos Estratégias Mistas

Jogos Estratégias Mistas Jogos Estratégias Mistas Redes Sociais e Econômicas Prof. André Vignatti Aula Passada Equilíbrio de Nash ninguém tem incentivo de desviar da estratégia Vários equilíbrios qual será a saída? Jogos de Coordenação

Leia mais

Jogos com Consciência

Jogos com Consciência Jogos com Consciência Prof. Leandro Chaves Rêgo Programa de Pós-Graduação em Estatística - UFPE Programa de Pós-Graduação em Engenharia de Produção - UFPE Recife, 11 de Novembro de 2014 Motivação Modelos

Leia mais

Modelando Conhecimento

Modelando Conhecimento Modelando Conhecimento Prof. Leandro Chaves Rêgo Programa de Pós-Graduação em Estatística - UFPE Programa de Pós-Graduação em Engenharia de Produção - UFPE Recife, 17 de Outubro de 2014 Modelando Conhecimento

Leia mais

LISTA DE EXERCÍCIOS IV TEORIA DOS JOGOS

LISTA DE EXERCÍCIOS IV TEORIA DOS JOGOS UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL FACULDADE DE CIÊNCIAS ECONÔMICAS DEPARTAMENTO DE ECONOMIA Disciplina ECO0208 Teoria Microeconômica II Professor Sabino da Silva Porto Junior Estágio de docência

Leia mais

Microeconomia. 8. Teoria dos Jogos. Francisco Lima. 1º ano 2º semestre 2015/2016 Licenciatura em Engenharia e Gestão Industrial

Microeconomia. 8. Teoria dos Jogos. Francisco Lima. 1º ano 2º semestre 2015/2016 Licenciatura em Engenharia e Gestão Industrial Microeconomia 8. Teoria dos Jogos Francisco Lima 1º ano 2º semestre 2015/2016 Licenciatura em Engenharia e Gestão Industrial Teoria dos Jogos Teoria dos jogos é o estudo de como os agentes se comportam

Leia mais

Jogos. A teoria dos jogos lida com as interações estratégicas que ocorrem entre os agentes.

Jogos. A teoria dos jogos lida com as interações estratégicas que ocorrem entre os agentes. Jogos A teoria dos jogos lida com as interações estratégicas que ocorrem entre os agentes http://robguena.fearp.usp.br/anpec/tjogos.pdf a) Descrição de um jogo Teoria dos Jogos Jogadores: quem está envolvido

Leia mais

Interacção estratégica e Teoria de Jogos

Interacção estratégica e Teoria de Jogos Interacção estratégica e Teoria de Jogos IST, LEGI - Teoria Económica II Margarida Catalão Lopes 1 Nos mercados concorrenciais as empresas não interagem: são demasiado pequenas para influenciar o equilíbrio

Leia mais

3 Breve Introdução à Teoria dos Jogos

3 Breve Introdução à Teoria dos Jogos 3 Breve Introdução à Teoria dos Jogos Teoria dos Jogos é uma ferramenta matemática criada para melhor entender ou interpretar a maneira com que agentes que tomam decisões interagem entre si. Pense num

Leia mais

Microeconomia. 8. Teoria dos Jogos. Francisco Lima. 1º ano 2º semestre 2013/2014 Licenciatura em Engenharia e Gestão Industrial

Microeconomia. 8. Teoria dos Jogos. Francisco Lima. 1º ano 2º semestre 2013/2014 Licenciatura em Engenharia e Gestão Industrial Microeconomia 8. Teoria dos Jogos Francisco Lima 1º ano 2º semestre 2013/2014 Licenciatura em Engenharia e Gestão Industrial Teoria dos Jogos Teoria dos jogos é o estudo de como os agentes se comportam

Leia mais

EAE 5706: Microeconomia II: Teoria dos Jogos. Aula 13: Jogos Repetidos. Marcos Y. Nakaguma 27/09/2017. Jogos Repetidos

EAE 5706: Microeconomia II: Teoria dos Jogos. Aula 13: Jogos Repetidos. Marcos Y. Nakaguma 27/09/2017. Jogos Repetidos EAE 5706: Microeconomia II: Teoria dos Jogos Aula 13: Jogos Repetidos Marcos Y. Nakaguma 27/09/2017 1 Jogos Repetidos 2 Interação Repetida Uma importante classe de jogos dinâmicos é a dos chamados jogos

Leia mais

Capítulo 9. Conclusão 184

Capítulo 9. Conclusão 184 9 Conclusão Esperamos com este trabalho ter demonstrado que a lógica Game Analysis Logic GAL, que é uma lógica modal de primeira-ordem baseada na lógica Computation Tree Logic, pode ser usada para representar

Leia mais

Teoria dos Jogos Jogos na Forma Normal Com Informação Completa. Maurício Bugarin Fernando Meneguin Adriana Portugal

Teoria dos Jogos Jogos na Forma Normal Com Informação Completa. Maurício Bugarin Fernando Meneguin Adriana Portugal 1 Teoria dos Jogos Jogos na Forma Normal Com Informação Completa Maurício Bugarin Fernando Meneguin Adriana Portugal Brasília / UnB Lembrando: Ø Jogos estáticos: todos os jogadores jogam ao mesmo tempo

Leia mais

Teoria dos Jogos. Prof. Maurício Bugarin Eco/UnB 2015-II. Aula 6 Teoria dos Jogos Maurício Bugarin

Teoria dos Jogos. Prof. Maurício Bugarin Eco/UnB 2015-II. Aula 6 Teoria dos Jogos Maurício Bugarin Teoria dos Jogos Prof. Maurício Bugarin Eco/UnB -II Roteiro Capítulo : Jogos dinâmicos com informação completa. Jogos Dinâmicos com Informação Completa e Perfeita Forma extensiva Estratégias Equilíbrio

Leia mais

Marina Andretta. 17 de setembro de Baseado no livro Numerical Optimization, de J. Nocedal e S. J. Wright.

Marina Andretta. 17 de setembro de Baseado no livro Numerical Optimization, de J. Nocedal e S. J. Wright. Métodos de regiões de confiança Marina Andretta ICMC-USP 17 de setembro de 2014 Baseado no livro Numerical Optimization, de J. Nocedal e S. J. Wright. Marina Andretta (ICMC-USP) sme0212 - Otimização não-linear

Leia mais

Fundamentos de Teoria dos jogos

Fundamentos de Teoria dos jogos Fundamentos de Teoria dos jogos A Teoria dos Jogos é um ramo da matemática aplicada que estuda situações estratégicas em que jogadores escolhem diferentes ações na tentativa de melhorar seu retorno. Na

Leia mais

Roteiro da aula: Jogos dinâmicos com informação incompleta. Mas-Collel e Green capítulo 9 Refinamentos do conceito de Equilíbrio de Nash

Roteiro da aula: Jogos dinâmicos com informação incompleta. Mas-Collel e Green capítulo 9 Refinamentos do conceito de Equilíbrio de Nash Roteiro da aula: Jogos dinâmicos com informação incompleta Mas-Collel e Green capítulo 9 Refinamentos do conceito de quilíbrio de Nash Racionalidade seqüencial quilíbrio Bayesiano perfeito quilíbrio bayesiano

Leia mais

Teoria dos Jogos Repetidos

Teoria dos Jogos Repetidos Teoria dos Jogos Repetidos Os processos de interação estratégica nos quais os jogadores decidem sem conhecer as decisões dos demais podem ser tratados como jogos simultâneos. Já os processos de interação

Leia mais

2. A respeito do equilíbrio de Nash, julgue as afirmativas abaixo:

2. A respeito do equilíbrio de Nash, julgue as afirmativas abaixo: Universidade Federal do Rio Grande do Sul Faculdade de Economia Teoria dos Jogos / 2006 Estágio Docência: Aline Trindade Figueiredo e Mariana Hauer Lista de Exercícios 1 1. Defina Equilíbrio de Nash. Todo

Leia mais

Aprendizado, minimização do arrependimento e equilíbrio (Learning, Regret Minimization, and Equilibria)

Aprendizado, minimização do arrependimento e equilíbrio (Learning, Regret Minimization, and Equilibria) Aprendizado, minimização do arrependimento e equilíbrio (Learning, Regret Minimization, and Equilibria) Victor Alberto Romero Instituto de Matemática e Estatística Universidade de São Paulo Teoria dos

Leia mais

Combinando inequações lineares

Combinando inequações lineares Combinando inequações lineares A multiplicação por um número > 0 não altera uma inequação 2x x 5 4x 2x 10 1 2 1 2 A soma de duas inequações (com o mesmo sentido) produz uma inequação válida x 3x x 3 1

Leia mais

EAE 5706: Microeconomia II: Teoria dos Jogos. Jogos de Informação Incompleta: Equilíbrio Bayesiano

EAE 5706: Microeconomia II: Teoria dos Jogos. Jogos de Informação Incompleta: Equilíbrio Bayesiano EAE 5706: Microeconomia II: Teoria dos Jogos Aula 8: Equilíbrio de Nash Bayesiano e Jogos Dinâmicos Marcos Y. Nakaguma 28/08/2017 1 Exemplo 3: Leilão de Segundo Preço com Informação Incompleta I Nestecaso,vamosassumirqueovaluationv

Leia mais

Jogos seqüenciais Teoria Microeconômica II Economia Matutino - Marcelo Ranieri Cardoso

Jogos seqüenciais Teoria Microeconômica II Economia Matutino - Marcelo Ranieri Cardoso Jogos seqüenciais Jogos seqüenciais são aqueles nos quais os jogadores não fazem os movimentos simultaneamente, mas seqüencialmente. Jogos repetitivos são um caso específico de jogos seqüenciais. Empresa

Leia mais

Observação: Responda no mínimo 70% das questões. (**) responda no mínimo duas questões com essa marcação

Observação: Responda no mínimo 70% das questões. (**) responda no mínimo duas questões com essa marcação UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL - UFRGS FACULDADE DE CIÊNCIAS ECONÔMICAS PROGRAMA DE PÓS-GRADUAÇÃO EM ECONOMIA CURSO DE ESPECIALIZAÇÃO MBE- MASTER OF BUSINESS ECONOMICS DISCIPLINA: Comportamento

Leia mais

Produtos de potências racionais. números primos.

Produtos de potências racionais. números primos. MATEMÁTICA UNIVERSITÁRIA n o 4 Dezembro/2006 pp. 23 3 Produtos de potências racionais de números primos Mário B. Matos e Mário C. Matos INTRODUÇÃO Um dos conceitos mais simples é o de número natural e

Leia mais

Jogos de soma zero com dois jogadores

Jogos de soma zero com dois jogadores Jogos de soma zero com dois jogadores Problema: Dada uma matriz A m n, encontrar um equilíbrio de Nash (de estratégias mistas). Jogador 1 quer encontrar p que maximize v sujeito a i p i = 1 sujeito a (pa)

Leia mais

Capítulo 9: Linguagens sensíveis ao contexto e autômatos linearmente limitados.

Capítulo 9: Linguagens sensíveis ao contexto e autômatos linearmente limitados. Capítulo 9: Linguagens sensíveis ao contexto e autômatos linearmente limitados. José Lucas Rangel 9.1 - Introdução. Como já vimos anteriormente, a classe das linguagens sensíveis ao contexto (lsc) é uma

Leia mais

Teoria dos Jogos. Jogos simultâneos. Roberto Guena de Oliveira USP. 31 de outubro de 2013

Teoria dos Jogos. Jogos simultâneos. Roberto Guena de Oliveira USP. 31 de outubro de 2013 Teoria dos Jogos Jogos simultâneos Roberto Guena de Oliveira USP 31 de outubro de 2013 Roberto Guena (USP) Teoria dos Jogos 31 de outubro de 2013 1 / 58 Sumário 1 Representação de jogos com movimentos

Leia mais

Escolha sob Incerteza VNM. Aula 03. Bibliograa: MWG, cap. 06. Cláudio R. Lucinda FEA-RP/USP. Cláudio R. Lucinda Aula 03

Escolha sob Incerteza VNM. Aula 03. Bibliograa: MWG, cap. 06. Cláudio R. Lucinda FEA-RP/USP. Cláudio R. Lucinda Aula 03 Aula 03 Bibliograa: MWG, cap. 06 Cláudio R. Lucinda FEA-RP/USP Objetivos da Aula Escolha sob Incerteza 1 Escolha sob Incerteza Preferências sobre Objetivos da Aula Escolha sob Incerteza 1 Escolha sob Incerteza

Leia mais

Probabilidade IV. Ulisses U. dos Anjos. Departamento de Estatística Universidade Federal da Paraíba. Período

Probabilidade IV. Ulisses U. dos Anjos. Departamento de Estatística Universidade Federal da Paraíba. Período Probabilidade IV Ulisses U. dos Anjos Departamento de Estatística Universidade Federal da Paraíba Período 2014.2 Ulisses Umbelino (DE-UFPB) Probabilidade IV Período 2014.2 1 / 20 Sumário 1 Apresentação

Leia mais

Tópicos Especiais em Redes: Introdução a Teoria dos Jogos com Aplicações a Redes de Computadores

Tópicos Especiais em Redes: Introdução a Teoria dos Jogos com Aplicações a Redes de Computadores Tópicos Especiais em Redes: Introdução a Teoria dos Jogos com Aplicações a Redes de Computadores Aula passada: iscussão das listas de exercícios Aula de hoje: iscussão dos tópicos para apresentação Jogos

Leia mais

Continuidade de processos gaussianos

Continuidade de processos gaussianos Continuidade de processos gaussianos Roberto Imbuzeiro Oliveira April, 008 Abstract 1 Intrudução Suponha que T é um certo conjunto de índices e c : T T R é uma função dada. Pergunta 1. Existe uma coleção

Leia mais

7 Imunização utilizando o modelo de imunização estocástica

7 Imunização utilizando o modelo de imunização estocástica 139 7 Imunização utilizando o modelo de imunização estocástica No capítulo anterior apresentamos e definimos uma série de novos conceitos em duração e em imunização. odos estes conceitos teóricos servem

Leia mais

Notas esparsas Jogos Sequencias de Informação Completa I

Notas esparsas Jogos Sequencias de Informação Completa I Notas esparsas Jogos Sequencias de Informação Completa I 1. Lembram-se do jogo dos três deputados visto em sala? O exemplo é de Morrow (1994), p.125. Basicamente, três deputados votam o aumento de salário

Leia mais

CAPÍTULO 5 CONCEITOS BÁSICOS DE TEORIA DOS JOGOS E MEDIDAS DE CONCENTRAÇÃO DE MERCADO

CAPÍTULO 5 CONCEITOS BÁSICOS DE TEORIA DOS JOGOS E MEDIDAS DE CONCENTRAÇÃO DE MERCADO CAPÍTULO 5 CONCEITOS BÁSICOS DE TEORIA DOS JOGOS E MEDIDAS DE CONCENTRAÇÃO DE MERCADO 5.1 INTRODUÇÃO A Teoria dos Jogos é o instrumento natural para a avaliação de poder de mercado em ambientes competitivos.

Leia mais

e C 1 (q 1 ) = 2 q 2 Jogador 2

e C 1 (q 1 ) = 2 q 2 Jogador 2 UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL - UFRGS FACULDADE DE CIÊNCIAS ECONÔMICAS DISCIPLINA: Teoria Microeconômica II Prof. Sabino da Silva Porto Júnior Lista de exercício n. 01 1.** Considere um duopólio

Leia mais

Espaços Euclidianos. Espaços R n. O conjunto R n é definido como o conjunto de todas as n-uplas ordenadas de números reais:

Espaços Euclidianos. Espaços R n. O conjunto R n é definido como o conjunto de todas as n-uplas ordenadas de números reais: Espaços Euclidianos Espaços R n O conjunto R n é definido como o conjunto de todas as n-uplas ordenadas de números reais: R n = {(x 1,..., x n ) : x 1,..., x n R}. R 1 é simplesmente o conjunto R dos números

Leia mais

6 Teoria dos Jogos em GAL

6 Teoria dos Jogos em GAL 6 Teoria dos Jogos em GAL Neste capítulo, relacionaremos os modelos da Teoria dos Jogos às estruturas de GAL, e os conceitos de soluções às fórmulas de GAL. Apesar da maioria dos conceitos da Teoria dos

Leia mais

Cap. 5 Estabilidade de Lyapunov

Cap. 5 Estabilidade de Lyapunov Cap. 5 Estabilidade de Lyapunov 1 Motivação Considere as equações diferenciais que modelam o oscilador harmônico sem amortecimento e sem força aplicada, dada por: M z + Kz = 0 Escolhendo-se x 1 = z e x

Leia mais

Jogos. Geralmente o oponente tentará, na medida do possível, fazer o movimento menos benéfico para o adversário.

Jogos. Geralmente o oponente tentará, na medida do possível, fazer o movimento menos benéfico para o adversário. Jogos Os jogos tem atraído a atenção da humanidade, às vezes de modo alarmante, desde a antiguidade. O que o torna atraente para a IA é que é uma abstração da competição (guerra), onde se idealizam mundos

Leia mais

1 Séries de números reais

1 Séries de números reais Universidade do Estado do Rio de Janeiro - PROFMAT MA 22 - Fundamentos de Cálculo - Professora: Mariana Villapouca Resumo Aula 0 - Profmat - MA22 (07/06/9) Séries de números reais Seja (a n ) n uma sequência

Leia mais

Jogos Dinâmicos de Informação Completa

Jogos Dinâmicos de Informação Completa Jogos Dinâmicos de Informação Completa Dinâmico, em oposição a estático, signica que os jogadores não decidem suas estratégias simultaneamente. Os payos, porém, são recebidos apenas no nal do jogo, para

Leia mais

1 Limites e Conjuntos Abertos

1 Limites e Conjuntos Abertos 1 Limites e Conjuntos Abertos 1.1 Sequências de números reais Definição. Uma sequência de números reais é uma associação de um número real a cada número natural. Exemplos: 1. {1,2,3,4,...} 2. {1,1/2,1/3,1/4,...}

Leia mais

A prova é SEM CONSULTA. Não são permitidas calculadoras ou quaisquer equipamentos eletrônicos. Celulares devem ser desligados e guardados.

A prova é SEM CONSULTA. Não são permitidas calculadoras ou quaisquer equipamentos eletrônicos. Celulares devem ser desligados e guardados. ELE2005: Análise Estratégica de Investimentos e de Decisões com Teoria dos Jogos e Jogos de Opções Reais. Primeira Prova Segunda Chamada 31/10/2007 A prova é SEM CONSULTA. Não são permitidas calculadoras

Leia mais

Programação Linear M É T O D O S : E S T A T Í S T I C A E M A T E M Á T I C A A P L I C A D A S D e 1 1 d e m a r ç o a 2 9 d e a b r i l d e

Programação Linear M É T O D O S : E S T A T Í S T I C A E M A T E M Á T I C A A P L I C A D A S D e 1 1 d e m a r ç o a 2 9 d e a b r i l d e Programação Linear A otimização é o processo de encontrar a melhor solução (ou solução ótima) para um problema. Existe um conjunto particular de problemas nos quais é decisivo a aplicação de um procedimento

Leia mais

Resumo An Introduction To Multiagent Systems - Wooldridge Capítulo 6 Multiagent Interactions Disciplina de Sistemas Multi-agentes

Resumo An Introduction To Multiagent Systems - Wooldridge Capítulo 6 Multiagent Interactions Disciplina de Sistemas Multi-agentes Introdução Resumo An Introduction To Multiagent Systems - Wooldridge Capítulo 6 Multiagent Interactions Disciplina de Sistemas Multi-agentes Manoel Campos da Silva Filho Neste capítulo focaremos em como

Leia mais

Cadeias de Markov. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Cadeias de Markov. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo Cadeias de Markov Ricardo Ehlers ehlers@icmc.usp.br Departamento de Matemática Aplicada e Estatística Universidade de São Paulo Capitulos 3 e 4 Taylor & Karlin 1 / 71 Cadeias de Markov Seja X 0, X 1,...

Leia mais

UNIVERSIDADE FEDERAL DE PERNAMBUCO DEPARTAMENTO DE ESTATÍSTICA. Medida e Probabilidade

UNIVERSIDADE FEDERAL DE PERNAMBUCO DEPARTAMENTO DE ESTATÍSTICA. Medida e Probabilidade UNIVERSIDADE FEDERAL DE PERNAMBUCO DEPARTAMENTO DE ESTATÍSTICA Medida e Probabilidade Aluno: Daniel Cassimiro Carneiro da Cunha Professor: Andre Toom 1 Resumo Este trabalho contem um resumo dos principais

Leia mais

Jogos Cooperativos. Prof. Leandro Chaves Rêgo

Jogos Cooperativos. Prof. Leandro Chaves Rêgo Jogos Cooperativos Prof. Leandro Chaves Rêgo Programa de Pós-Graduação em Estatística - UFPE Programa de Pós-Graduação em Engenharia de Produção - UFPE Recife, 31 de Outubro de 2014 Jogos Cooperativos

Leia mais

4.1. ESPERANÇA x =, x=1

4.1. ESPERANÇA x =, x=1 4.1. ESPERANÇA 139 4.1 Esperança Certamente um dos conceitos mais conhecidos na teoria das probabilidade é a esperança de uma variável aleatória, mas não com esse nome e sim com os nomes de média ou valor

Leia mais

MATRIZES - PARTE Mais exemplos Multiplicação de duas matrizes AULA 26

MATRIZES - PARTE Mais exemplos Multiplicação de duas matrizes AULA 26 AULA 26 MATRIZES - PARTE 2 26. Mais exemplos Nesta aula, veremos mais dois algoritmos envolvendo matrizes. O primeiro deles calcula a matriz resultante da multiplicação de duas matrizes e utiliza três

Leia mais

Prova Final. Programa de Pós-Graduação em Economia. Microeconomia IV Prof.: Rogério Mazali. 30 de abril de 2016

Prova Final. Programa de Pós-Graduação em Economia. Microeconomia IV Prof.: Rogério Mazali. 30 de abril de 2016 Programa de Pós-Graduação em Economia Microeconomia IV Prof.: Rogério Mazali Prova Final 30 de abril de 2016 Instruções: Você tem 120 minutos para completar a prova. Seja preciso em suas respostas. Pontos

Leia mais

Jogos em Teoria dos Jogos e em

Jogos em Teoria dos Jogos e em 3 Jogos em Teoria dos Jogos e em Computação A Teoria dos Jogos pode ser entendida como a análise matemática de qualquer situação que envolva um conflito de interesses com o intuito de indicar as melhores

Leia mais

MICROECONOMIA II. Teoria dos Jogos CAP. 10 Nicholson CAP. 13 Pindyck

MICROECONOMIA II. Teoria dos Jogos CAP. 10 Nicholson CAP. 13 Pindyck MICROECONOMIA II Teoria dos Jogos CAP. 10 Nicholson CAP. 13 Pindyck 1. Introdução Teoria dos Jogos envolve o estudo de situações estratégicas Modelos de Teoria dos Jogos procuram abordar situações estratégicas

Leia mais

A prova é SEM CONSULTA. A nota da prova é = mínimo{10, pontuação} e o crédito para a próxima prova é = máximo{0, pontuação nota da 1ª prova}.

A prova é SEM CONSULTA. A nota da prova é = mínimo{10, pontuação} e o crédito para a próxima prova é = máximo{0, pontuação nota da 1ª prova}. ELE2005: Análise Estratégica de Investimentos e de Decisões com Teoria dos Jogos e Jogos de Opções Reais. Primeira Prova 17/10/2006 A prova é SEM CONSULTA. A nota da prova é = mínimo{10, pontuação} e o

Leia mais

Microeconomia I. 3ª Ficha de Avaliação Ano lectivo 2009/2010 Nome: Nº Aluno: Turma:

Microeconomia I. 3ª Ficha de Avaliação Ano lectivo 2009/2010 Nome: Nº Aluno: Turma: Microeconomia I 3ª Ficha de Avaliação Ano lectivo 2009/2010 Nome: Nº Aluno: Turma: Num determinado jogo sequencial o Jogador 1 escolhe primeiro a estratégia que irá escolher (A ou B). Em resposta, o Jogador

Leia mais

A prova é SEM CONSULTA. Não são permitidas calculadoras ou quaisquer equipamentos eletrônicos. Celulares devem ser desligados e guardados.

A prova é SEM CONSULTA. Não são permitidas calculadoras ou quaisquer equipamentos eletrônicos. Celulares devem ser desligados e guardados. ELE2005: Análise Estratégica de Investimentos e de Decisões com Teoria dos Jogos e Jogos de Opções Reais. Primeira Prova 23/10/2007 A prova é SEM CONSULTA. Não são permitidas calculadoras ou quaisquer

Leia mais

Lista 4. Esta lista, de entrega facultativa, tem três partes e seus exercícios versam sobre séries, funções contínuas e funções diferenciáveis em R.

Lista 4. Esta lista, de entrega facultativa, tem três partes e seus exercícios versam sobre séries, funções contínuas e funções diferenciáveis em R. UFPR - Universidade Federal do Paraná Departamento de Matemática CM095 - Análise I Prof José Carlos Eidam Lista 4 INSTRUÇÕES Esta lista, de entrega facultativa, tem três partes e seus exercícios versam

Leia mais

P1 de Análise Real ou Análise I Data: 16 de abril de 2008

P1 de Análise Real ou Análise I Data: 16 de abril de 2008 P1 de Análise Real ou Análise I 2008.1 Data: 16 de abril de 2008 Serão contadas as quatro melhores questões. 1. Seja (a n ) uma seqüência de números reais. Prove que se (a n ) 2 converge então a nn também

Leia mais

Teoremas de dualidade

Teoremas de dualidade Teoremas de dualidade Marina Andretta ICMC-USP 19 de outubro de 2016 Baseado no livro Introduction to Linear Optimization, de D. Bertsimas e J. N. Tsitsiklis. Marina Andretta (ICMC-USP) sme0211 - Otimização

Leia mais

UNIVERSIDADE DE SÃO PAULO Faculdade de Economia, Administração e Contabilidade de Ribeirão Preto Departamento de Economia

UNIVERSIDADE DE SÃO PAULO Faculdade de Economia, Administração e Contabilidade de Ribeirão Preto Departamento de Economia REC0224 MICROECONOMIA II EXERCÍCIOS SOBRE TEORIA DOS JOGOS E OLIGOPÓLIO. ROBERTO GUENA DE OLIVEIRA 1) João e Maria participam de um jogo no qual estão em disputa R$10.000,00. Nesse jogo, cada um deles

Leia mais

Método do Ponto Fixo

Método do Ponto Fixo Determinação de raízes de funções: Método do Ponto Fixo Marina Andretta ICMC-USP 07 de março de 2012 Baseado no livro Análise Numérica, de R. L. Burden e J. D. Faires. Marina Andretta (ICMC-USP) sme0500

Leia mais

Notações e revisão de álgebra linear

Notações e revisão de álgebra linear Notações e revisão de álgebra linear Marina Andretta ICMC-USP 17 de agosto de 2016 Baseado no livro Introduction to Linear Optimization, de D. Bertsimas e J. N. Tsitsiklis. Marina Andretta (ICMC-USP) sme0211

Leia mais

Lista 4 Teoria dos Jogos Prof. Sergio Almeida

Lista 4 Teoria dos Jogos Prof. Sergio Almeida 1 Lista 4 Teoria dos Jogos Prof. Sergio Almeida Questão 1 Considere o seguinte jogo: Jogador 2 Jogador 1 c1 c2 c3 c4 r1 3, 8 0, 4 1, 6-2, 9 r2 4, 2 1, -3 3, 5 1, 4 r3 0, -3 2, 2 4, -1-3, 2 r4 6, 5-1, 3

Leia mais

Busca Competitiva. Inteligência Artificial. Até aqui... Jogos vs. busca. Decisões ótimas em jogos 9/22/2010

Busca Competitiva. Inteligência Artificial. Até aqui... Jogos vs. busca. Decisões ótimas em jogos 9/22/2010 Inteligência Artificial Busca Competitiva Aula 5 Profª Bianca Zadrozny http://www.ic.uff.br/~bianca/ia-pos Capítulo 6 Russell & Norvig Seção 6.1 a 6.5 2 Até aqui... Problemas sem interação com outro agente.

Leia mais

Todos conhecemos vários tipos de jogos, como xadrez, pôquer, jogo da velha, futebol, truco, jogos de computador a lista pode continuar a gosto.

Todos conhecemos vários tipos de jogos, como xadrez, pôquer, jogo da velha, futebol, truco, jogos de computador a lista pode continuar a gosto. Teoria dos Jogos 1 Estas notas são a tradução de parte do livro Game Theory de Thomas S. Ferguson, disponível na rede (www.gametheory.net). O objetivo será o de condensar num texto curto o que me parecer

Leia mais

Teoria dos Jogos. Prof. Maurício Bugarin Eco/UnB 2014-I. Aula 12A Teoria dos Jogos Maurício Bugarin

Teoria dos Jogos. Prof. Maurício Bugarin Eco/UnB 2014-I. Aula 12A Teoria dos Jogos Maurício Bugarin Teoria dos Jogos Prof. Maurício Bugarin Eco/UnB 2014-I Roteiro Jogos Jogos Repetidos Desenvolver o modelo de jogo repetido Provar o teorema popular Aplicar para conluio ao dilema dos prisioneiros e aos

Leia mais

Inteligência Artificial. Resolução de problemas por meio de algoritmos de busca. Aula VI Busca Competitiva

Inteligência Artificial. Resolução de problemas por meio de algoritmos de busca. Aula VI Busca Competitiva Universidade Estadual do Oeste do Paraná Curso de Bacharelado em Ciência da Computação http://www.inf.unioeste.br/~claudia/ia2017.html Inteligência Artificial Resolução de problemas por meio de algoritmos

Leia mais

Lista de Exercícios 2

Lista de Exercícios 2 Programa de Pós-Graduação em Economia Microeconomia IV Prof.: Rogério Mazali Lista de Exercícios 2 18 de abril de 2016 NOTA: Para os problemas retirados do livro-texto, cheque par aver se você possui a

Leia mais

Construção dos Números Reais

Construção dos Números Reais 1 Universidade de Brasília Departamento de Matemática Construção dos Números Reais Célio W. Manzi Alvarenga Sumário 1 Seqüências de números racionais 1 2 Pares de Cauchy 2 3 Um problema 4 4 Comparação

Leia mais

CEFET/RJ Inteligência Artificial (2017.2) Professor: Eduardo Bezerra Lista de exercícios 03

CEFET/RJ Inteligência Artificial (2017.2) Professor: Eduardo Bezerra Lista de exercícios 03 . CEFET/RJ Inteligência Artificial (2017.2) Professor: Eduardo Bezerra (ebezerra@cefet-rj.br) Lista de exercícios 03 Créditos: essa lista de exercícios contém a tradução dos exercícios disponibilizados

Leia mais

Capítulo 2. Conjuntos Infinitos

Capítulo 2. Conjuntos Infinitos Capítulo 2 Conjuntos Infinitos Não é raro encontrarmos exemplos equivocados de conjuntos infinitos, como a quantidade de grãos de areia na praia ou a quantidade de estrelas no céu. Acontece que essas quantidades,

Leia mais

Noções de Probabilidade parte I

Noções de Probabilidade parte I Noções de Probabilidade parte I 5 de Março de 2012 Site: http://ericaestatistica.webnode.com.br/ e-mail: ericaa_casti@yahoo.com.br Referências: Probabilidae Aplicações à Estatística - Mayer (Capítulo 1)

Leia mais

Escola Brasileira de Economia e Finanças - EPGE/FGV Graduação em Ciências Econômicas - Ciclo Pro ssional

Escola Brasileira de Economia e Finanças - EPGE/FGV Graduação em Ciências Econômicas - Ciclo Pro ssional Escola Brasileira de Economia e Finanças - EPGE/FGV Graduação em Ciências Econômicas - Ciclo Pro ssional Finanças Públicas - 0 Lista de Exercícios 4 - Externalidade Carlos Eugênio Costa Professor Érica

Leia mais

Mestrado em Finanças e Economia Empresarial Competição Estratégica e Organização de Mercados Primeira prova: 30/08/2003

Mestrado em Finanças e Economia Empresarial Competição Estratégica e Organização de Mercados Primeira prova: 30/08/2003 Mestrado em Finanças e Economia Empresarial Competição Estratégica e Organização de Mercados- 003 Primeira prova: 30/08/003 Questão 1: Considere o jogo do covarde(the Chicken Game), representado abaixo

Leia mais

Curso de Pós-Graduação em Economia CAEN Universidade Federal do Ceará

Curso de Pós-Graduação em Economia CAEN Universidade Federal do Ceará Curso de Pós-Graduação em Economia CAEN Universidade Federal do Ceará Exame de Qualificação em Microeconomia Setembro de 008-09- Leia com a atenção as instruções abaixo:. A prova compõe-se de seis questões

Leia mais

Estratégias vencedoras para o jogo Slither

Estratégias vencedoras para o jogo Slither Estratégias vencedoras para o jogo Slither Marcelo da Silva Reis 1 1 Instituto de Matemática e Estatística, Universidade de São Paulo. marcelo.reis@gmail.com 11 de agosto de 009 Este artigo apresenta estratégias

Leia mais

O Teorema de Peano. f : D R n. uma função contínua. Vamos considerar o seguinte problema: Encontrar um intervalo I R e uma função ϕ : I R n tais que

O Teorema de Peano. f : D R n. uma função contínua. Vamos considerar o seguinte problema: Encontrar um intervalo I R e uma função ϕ : I R n tais que O Teorema de Peano Equações de primeira ordem Seja D um conjunto aberto de R R n, e seja f : D R n (t, x) f(t, x) uma função contínua. Vamos considerar o seguinte problema: Encontrar um intervalo I R e

Leia mais

Capítulo 2. Conjuntos Infinitos. 2.1 Existem diferentes tipos de infinito

Capítulo 2. Conjuntos Infinitos. 2.1 Existem diferentes tipos de infinito Capítulo 2 Conjuntos Infinitos Um exemplo de conjunto infinito é o conjunto dos números naturais: mesmo tomando-se um número natural n muito grande, sempre existe outro maior, por exemplo, seu sucessor

Leia mais

Professor João Soares 20 de Setembro de 2004

Professor João Soares 20 de Setembro de 2004 Teoria de Optimização (Mestrado em Matemática) Texto de Apoio 2A Universidade de Coimbra 57 páginas Professor João Soares 20 de Setembro de 2004 Optimização Linear Considere o problema (1) abaixo, que

Leia mais

DESENHO DE MECANISMOS (1)

DESENHO DE MECANISMOS (1) MICROECONOMIA II DESENHO DE MECANISMOS (1) Rafael V. X. Ferreira rafaelferreira@usp.br Novembro de 2017 Universidade de São Paulo (USP) Faculdade de Economia, Administração e Contabilidade (FEA) Departamento

Leia mais

EXPERIÊNCIA 08 CIRCUITOS COM AMPLIFICADORES OPERACIONAIS ELABORAÇÃO: PROFS ARIANA S. e VITOR N.

EXPERIÊNCIA 08 CIRCUITOS COM AMPLIFICADORES OPERACIONAIS ELABORAÇÃO: PROFS ARIANA S. e VITOR N. ESCOLA POLITÉCNICA DA UNIVERSIDADE DE SÃO PAULO Departamento de Engenharia de Sistemas Eletrônicos PSI - EPUSP PSI 3212 - LABORATÓRIO DE CIRCUITOS ELÉTRICOS EXPERIÊNCIA 08 CIRCUITOS COM AMPLIFICADORES

Leia mais

Instituto Nacional de Matemática Pura e Aplicada Curso: Introdução à Economia Matemática

Instituto Nacional de Matemática Pura e Aplicada Curso: Introdução à Economia Matemática Instituto Nacional de Matemática Pura e Aplicada Curso: Introdução à Economia Matemática Prof. Rodrigo Novinski 8 de Fevereiro de 2010 Escolha sob Risco: Atitudes frente ao Risco (Castro e Faro, capítulo

Leia mais

ELE2005: Análise Estratégica de Investimentos e de Decisões com Teoria dos Jogos e Jogos de Opções Reais.

ELE2005: Análise Estratégica de Investimentos e de Decisões com Teoria dos Jogos e Jogos de Opções Reais. ELE2005: Análise Estratégica de Investimentos e de Decisões com Teoria dos Jogos e Jogos de Opções Reais. Segunda Prova Extra (P2 de segunda chamada) 18/12/2006 OBS: 1) A prova é SEM CONSULTA. A nota da

Leia mais

CEFET/RJ Disciplina: Inteligência Artificial Professor: Eduardo Bezerra Lista de exercícios 02

CEFET/RJ Disciplina: Inteligência Artificial Professor: Eduardo Bezerra Lista de exercícios 02 . CEFET/RJ Disciplina: Inteligência Artificial Professor: Eduardo Bezerra Lista de exercícios 02 Créditos: alguns itens desta lista são adaptados do material da disciplina CS188 - Artificial Intelligence

Leia mais

Aprendizado por Reforço

Aprendizado por Reforço Aprendizado por Reforço Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Aprendizado por Reforço 2. Q-Learning 3. SARSA 4. Outras ideias 1 Aprendizado por Reforço Problemas de decisão

Leia mais

LINGUAGENS FORMAIS E AUTÔMATOS

LINGUAGENS FORMAIS E AUTÔMATOS LINGUAGENS FORMAIS E AUTÔMATOS O objetivo deste curso é formalizar a idéia de linguagem e definir os tipos de sintaxe e semântica. Para cada sintaxe, analisamos autômatos, ue são abstrações de algoritmos.

Leia mais

Capítulo 3. Séries Numéricas

Capítulo 3. Séries Numéricas Capítulo 3 Séries Numéricas Neste capítulo faremos uma abordagem sucinta sobre séries numéricas Apresentaremos a definição de uma série, condições para que elas sejam ou não convergentes, alguns exemplos

Leia mais

Linguagens Não-Regulares

Linguagens Não-Regulares Linguagens Não-Regulares Mário S. Alvim (msalvim@dcc.ufmg.br) Fundamentos de Teoria da Computação (FTC) DCC-UFMG (2018/02) Mário S. Alvim (msalvim@dcc.ufmg.br) Linguagens Não-Regulares DCC-UFMG (2018/02)

Leia mais

Unidade 1 Conceitos Preliminares e Importância do Estudo da Teoria dos Jogos

Unidade 1 Conceitos Preliminares e Importância do Estudo da Teoria dos Jogos MINISTÉRIO DA EDUCAÇÃO UNIVERSIDADE FEDERAL DE GOIÁS FACULDADE DE ADMINISTRAÇÃO, CIÊNCIAS CONTÁBEIS E CIÊNCIAS ECONÔMICAS CURSO DE CIÊNCIAS ECONÔMICAS PLANO DE ENSINO Disciplina: Teoria dos Jogos CHS:

Leia mais

Teoria do consumidor. Propriedades do Conjunto Consumo,

Teoria do consumidor. Propriedades do Conjunto Consumo, Teoria do consumidor 1 Pedro Rafael Lopes Fernandes Qualquer modelo que vise explicar a escolha do consumidor é sustentado por quatro pilares. Estes são o conjunto consumo, o conjunto factível, a relação

Leia mais

3 3. Variáveis Aleatórias

3 3. Variáveis Aleatórias ÍNDICE 3. VARIÁVEIS ALEATÓRIAS...49 3.. VARIÁVEIS ALEATÓRIAS UNIDIMENSIONAIS...49 3.2. VARIÁVEIS DISCRETAS FUNÇÃO DE PROBABILIDADE E FUNÇÃO DISTRIBUIÇÃO DE PROBABILIDADE...50 3.2.. Função de probabilidade...50

Leia mais

CAPÍTULO 6 * JOGOS NA FORMA ESTRATÉGICA COM INFORMAÇÃO COMPLETA

CAPÍTULO 6 * JOGOS NA FORMA ESTRATÉGICA COM INFORMAÇÃO COMPLETA CAPÍTULO 6 * JOGOS NA FORMA ESTRATÉGICA COM INFORMAÇÃO COMPLETA Objetivos: Definir a forma normal ou estratégica para representação de jogos estáticos com informação completa e desenvolver os conceitos

Leia mais

Algoritmos de retrocesso

Algoritmos de retrocesso Algoritmos de retrocesso Algoritmos em que se geram escolhas que vão sendo testadas e eventualmente refeitas Problemas para os quais não existem algoritmos eficientes: retrocesso é melhor que pesquisa

Leia mais

Combinando inequações lineares

Combinando inequações lineares Combinando inequações lineares A multiplicação por um número > 0 não altera uma inequação 2x x 5 4x 2x 0 2 2 A soma de duas inequações (com o mesmo sentido) produz uma inequação válida x 3x + x 3 2 + 5x

Leia mais

SobreoProblema3daOBM2009:

SobreoProblema3daOBM2009: SobreoProblema3daOBM2009: Possíveis Generalizações e Conexões 1. O problema original Problema 3, OBM 2009, Nível 3. São colocadas 2009 pedras em alguns pontos (x, y) de coordenadas inteiras do plano cartesiano.

Leia mais

EAE 5706: Microeconomia II: Teoria dos Jogos

EAE 5706: Microeconomia II: Teoria dos Jogos EAE 5706: Microeconomia II: Teoria dos Jogos Aula 3: Jogos Simultâneos: Marcos Y. Nakaguma 14/08/2017 1 Revisão Na aula passada, vimos como representar os jogos nas formas extensiva e normal: e Γ E =fi,x,a,p(),

Leia mais

σ-álgebras, geradores e independência

σ-álgebras, geradores e independência σ-álgebras, geradores e independência Roberto Imbuzeiro M. F. de Oliveira 15 de Março de 2009 Resumo Notas sobre a σ-álgebra gerada por uma variável aleatória X e sobre as condições de independência de

Leia mais

Teoremas de uma, duas e três séries de Kolmogorov

Teoremas de uma, duas e três séries de Kolmogorov Teoremas de uma, duas e três séries de Kolmogorov 13 de Maio de 013 1 Introdução Nestas notas Z 1, Z, Z 3,... é uma sequência de variáveis aleatórias independentes. Buscaremos determinar condições sob

Leia mais