Teoria de Jogos Evolucionária

Documentos relacionados
Tópicos Especiais em Redes: Introdução a Teoria dos Jogos com Aplicações a Redes de Computadores

2. A respeito do equilíbrio de Nash, julgue as afirmativas abaixo:

Uma breve introdução à Teoria dos Jogos com aplicações a Redes de Computadores

MICROECONOMIA II. Teoria dos Jogos CAP. 10 Nicholson CAP. 13 Pindyck

A prova é SEM CONSULTA. Não são permitidas calculadoras ou quaisquer equipamentos eletrônicos. Celulares devem ser desligados e guardados.

ELE2005: Análise Estratégica de Investimentos e de Decisões com Teoria dos Jogos e Jogos de Opções Reais.

Jogos. A teoria dos jogos lida com as interações estratégicas que ocorrem entre os agentes.

Microeconomia. 8. Teoria dos Jogos. Francisco Lima. 1º ano 2º semestre 2015/2016 Licenciatura em Engenharia e Gestão Industrial

Interacção estratégica e Teoria de Jogos

Microeconomia. 8. Teoria dos Jogos. Francisco Lima. 1º ano 2º semestre 2013/2014 Licenciatura em Engenharia e Gestão Industrial

Teoria dos Jogos e Estratégia Competitiva

A prova é SEM CONSULTA. A nota da prova é = mínimo{10, pontuação} e o crédito para a próxima prova é = máximo{0, pontuação nota da 1ª prova}.

FICHA DE REVISÕES Micro 1

CAPÍTULO 5 CONCEITOS BÁSICOS DE TEORIA DOS JOGOS E MEDIDAS DE CONCENTRAÇÃO DE MERCADO

Jogos seqüenciais Teoria Microeconômica II Economia Matutino - Marcelo Ranieri Cardoso

Curso de Pós-Graduação em Economia CAEN Universidade Federal do Ceará

Trabalho do Curso de Redes de Computadores COS765/MAB /1

ELE2005: Análise Estratégica de Investimentos e de Decisões com Teoria dos Jogos e Jogos de Opções Reais.

A prova é SEM CONSULTA. Não são permitidas calculadoras ou quaisquer equipamentos eletrônicos. Celulares devem ser desligados e guardados.

Aulas 13 & 14. Acesso Múltiplo a Pacote: Protocolo Aloha. Eytan Modiano MIT

INTRODUÇÃO À TEORIA DAS FILAS

A subcamada de controle de acesso ao meio

ELE2005: Análise Estratégica de Investimentos e de Decisões com Teoria dos Jogos e Jogos de Opções Reais.

LISTA DE EXERCÍCIOS IV TEORIA DOS JOGOS

Esse material foi extraído de Barbetta (2007 cap 13)

Aprendizado por Reforço

Métodos Quantitativos para Ciência da Computação Experimental

Refinamentos de Equilíbrios de Nash

Estatística e Modelos Probabilísticos - COE241

Estatística e Modelos Probabilísticos - COE241

Modelagem e Análise Aula 9

Jogos Estratégias Mistas

1) A empresa DD é monopolista no setor industrial de retentores de portas. Seu custo de produção é dado por C=100-5Q+Q 2 e sua demanda é P=55-2Q.

3 a Lista de PE Solução

Teoria dos Jogos Algorítmica

Curso de Teoria Monetária

UNIVERSIDADE CATÓLICA PORTUGUESA. Microeconomia

Teoria dos Jogos. Prof. Maurício Bugarin Eco/UnB 2014-I. Aula 12A Teoria dos Jogos Maurício Bugarin

Avaliação de Desempenho de Sistemas Discretos

Avaliação e Desempenho Aula 18

Microeconomia I 2008/09 17 de Janeiro de 2009 Duração: 2h00m + 30 min

Roteiro da aula: Jogos dinâmicos com informação incompleta. Mas-Collel e Green capítulo 9 Refinamentos do conceito de Equilíbrio de Nash

INF 1771 Inteligência Artificial

Lista Considere um jogo dinâmico de informação completa(e perfeita) jogado por três jogadores,1,2e3,nessaordem.

Microeconomia I. 3ª Ficha de Avaliação Ano lectivo 2009/2010 Nome: Nº Aluno: Turma:

ALOHA Simples. Departamento de Informática. Modelagem Analítica do Desempenho de Sistemas de Computação. Disciplina: Aloha. Aloha

MAE0229 Introdução à Probabilidade e Estatística II

Fundamentos de Teoria dos jogos

Escola Politécnica da Universidade de São Paulo

Estatística e Modelos Probabilísticos - COE241

e C 1 (q 1 ) = 2 q 2 Jogador 2

Teoria das Filas aplicadas a Sistemas Computacionais. Aula 20

1. Qual é a diferença entre um jogo cooperativo e um jogo não-cooperativo? Dê um exemplo de cada um.

Conteúdo Programático

Noções de Simulação. Ciências Contábeis - FEA - Noturno. 2 o Semestre MAE0219 (IME-USP) Noções de Simulação 2 o Semestre / 23

Teoria dos Jogos Jogos na Forma Normal Com Informação Completa. Maurício Bugarin Fernando Meneguin Adriana Portugal

Teoria Microeconômica I Prof. Salomão Neves 05/02/17

Observação: Responda no mínimo 70% das questões. (**) responda no mínimo duas questões com essa marcação

Modelagem e Análise de Sistemas - COS767

Tópicos Especiais em Redes: Introdução a Teoria dos Jogos com Aplicações a Redes de Computadores

3 Aprendizado por reforço

Barganha e Poder em Redes

Método de Euler. Marina Andretta/Franklina Toledo ICMC-USP. 29 de outubro de 2013

Caros Alunos, segue a resolução das questões de Estatística aplicadas na prova para o cargo de Auditor Fiscal da Receita Municipal de Teresina.

Controle de acesso ao meio

5 TORIA ELEMENTAR DA AMOSTRAGEM

CORRELAÇÃO E REGRESSÃO. Modelos Probabilísticos para a Computação Professora: Andréa Rocha. UNIVERSIDADE FEDERAL DA PARAÍBA Dezembro, 2011

Modelos Probabilísticos de Desempenho. Profa. Jussara M. Almeida 1º Semestre de 2014

TP308 Introdução às Redes de Telecomunicações

Teoria dos Jogos. Prof. Maurício Bugarin Eco/UnB 2015-II. Aula 6 Teoria dos Jogos Maurício Bugarin

O Que Veremos. Introdução. Introdução. Definindo Desempenho. Definindo Desempenho. Avaliando e Compreendendo o Desempenho

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Capítulo 9: Linguagens sensíveis ao contexto e autômatos linearmente limitados.

Redes de Computadores

Aprendizado por Reforço

GABARITO. Prova 3 (points: 128/100; bonus: 8 ; time: 100 ) FMC1, (Turmas do Thanos) Regras: Esclarecimentos: Boas contas! Gabarito 09/12/2016

Microeconomia II. Cursos de Economia e de Matemática Aplicada à Economia e Gestão. AULA 2.4 Oligopólio e Cartel. Isabel Mendes

TE802 Processos Estocásticos em Engenharia

Protocolos de Acesso ao Meio

1/7 1/ se hoje não chove, amanhã não vai chover com probabilidade p 00 = 6/7;

Universidade Federal de Ouro Preto (UFOP) Microeconomía II CSA-140 Prof. Martin H. Vargas Barrenechea Lista

Processos Estocásticos

Controle de Acesso ao Meio

Cadeias de Markov de Tempo Contínuo (CTMC)

Probabilidade Condicional

Prova Final. Programa de Pós-Graduação em Economia. Microeconomia IV Prof.: Rogério Mazali. 30 de abril de 2016

Processos Estocásticos aplicados à Sistemas Computacionais

Controle Ótimo - Aula 6 Exemplos e Exercícios

Tópicos Especiais em Redes: Introdução a Teoria dos Jogos com Aplicações a Redes de Computadores

Jogos em Teoria dos Jogos e em

Microeconomia II. Competição Imperfeita Oligopólio. Pindyck Cap: 12

Estatística II Aula 2. Prof.: Patricia Maria Bortolon, D. Sc.

INE5403 FUNDAMENTOS DE MATEMÁTICA DISCRETA

FILAS. Mestrado em Engenharia Elétrica Carlos Marcelo Pedroso 2013

Redes de Computadores

Avaliação de Desempenho de Sistemas Discretos

Avaliação de Desempenho de Sistemas Discretos

Lista de Exercícios 2

Transmissão de impulsos em banda-base

Transcrição:

Teoria de Jogos Evolucionária Edmundo de Souza e Silva - Daniel Ratton Figueiredo Universidade Federal do Rio de Janeiro Programa de Engenharia de Sistemas e Computação - COPPE Departamento de Ciência da Computação do IM E. de Souza e Silva, D. Figueiredo - JAI 2007 1

Teoria dos Jogos Evolucionária Assume jogadores são racionais Maximizam suas recompensas e sabem que os outros jogadores fazem o mesmo Nada é dito sobre como os jogadores atingem o equilíbrio de Nash é atingido Caso mais de um equilíbrio exista, como ele é atingido? E. de Souza e Silva, D. Figueiredo - JAI 2007 2

Teoria dos Jogos Evolucionária Tenta explicar o comportamento dos sistemas que, em geral, evoluem com o tempo Jogo repetido infinitas vezes Jogadores possuem uma dinâmica de adaptação de estratégia jogadores podem mudar de estratégia ao longo do jogo, de acordo com o ganho que eles recebem Lembra do jogo do acesso a canal sem-fio de ontem? Adaptação visa melhorar o desempenho do jogador Jogadores não necessariamente são racionais Tenta estudar a convergência do processo adaptativo E. de Souza e Silva, D. Figueiredo - JAI 2007 3

Exemplo Dois irmãos compartilham seu canal de acesso a Internet em casa. Ambos decidem escutar música via internet, ao mesmo tempo Ambos estão usando a versão do VivaVoz que permite escolher a taxa de recebemento do áudio Podem escolher 3 taxas diferentes de recepção: 24Kbps, 64Kbps, 128Kbps Quanto maior a taxa, melhor a qualidade do som Mas... o canal compartilhado não tem capacidade suficiente para suportar as 2 conexões a taxa mais elevada E. de Souza e Silva, D. Figueiredo - JAI 2007 4

Exemplo Ambos estão usando a versão do VivaVoz que permite escolher a taxa de recebemento do áudio Podem escolher 3 taxas diferentes de recepção: 24Kbps, 64Kbps, 128Kbps E. de Souza e Silva, D. Figueiredo - JAI 2007 5

Exemplo E. de Souza e Silva, D. Figueiredo - JAI 2007 6

Exemplo E. de Souza e Silva, D. Figueiredo - JAI 2007 7

Exemplo E. de Souza e Silva, D. Figueiredo - JAI 2007 8

Diagrama de Transição Como representar o processo dinâmico? Melhor resposta por ser difícil (como saber?) Idéia Mudar para estratégia que oferece algum ganho mudança proporcional ao ganho E. de Souza e Silva, D. Figueiredo - JAI 2007 9

Diagrama de Transição Processo dinâmico: taxa de transição (indivíduous/tempo) proporcional: differença de ganho 2 0 0 2x(2,3-2,0)= 0.6 2x(2,1-2,0)= 0,1 (2,3-2,1)= 0,2 1 0 1 (3,8-3,5)=0,3 (3,1-3,0)=0,1 1 1 0 0 1 1 0 0 2 (3,8-3,3)=0,5 (4,0-3,0)=1,0 0 2 0 (4,0-3,1)=0,9 Construir diagrama de transição E. de Souza e Silva, D. Figueiredo - JAI 2007 10

Diagrama de Transição Processo dinâmico: taxa de transição (indivíduous/tempo) proporcional: differença de ganho 2 0 0 2x(2,3-2,0)= 0.6 2x(2,1-2,0)= 0,1 (2,3-2,1)= 0,2 1 0 1 (3,8-3,5)=0,3 (3,1-3,0)=0,1 1 1 0 0 1 1 0 0 2 (3,8-3,3)=0,5 (4,0-3,0)=1,0 0 2 0 (4,0-3,1)=0,9 E. de Souza e Silva, D. Figueiredo - JAI 2007 11

Diagrama de Transição Processo dinâmico: taxa de transição (indivíduous/tempo) proporcional: differença de ganho 2 0 0 2x(2,3-2,0)= 0.6 2x(2,1-2,0)= 0,1 (2,3-2,1)= 0,2 1 0 1 (3,8-3,5)=0,3 (3,1-3,0)=0,1 1 1 0 0 1 1 0 0 2 (3,8-3,3)=0,5 (4,0-3,0)=1,0 0 2 0 (4,0-3,1)=0,9 E. de Souza e Silva, D. Figueiredo - JAI 2007 12

Diagrama de Transição Processo dinâmico: taxa de transição (indivíduous/tempo) proporcional: differença de ganho 2 0 0 2x(2,3-2,0)= 0.6 2x(2,1-2,0)= 0,1 (2,3-2,1)= 0,2 1 0 1 (3,8-3,5)=0,3 (3,1-3,0)=0,1 1 1 0 0 1 1 0 0 2 (3,8-3,3)=0,5 (4,0-3,0)=1,0 0 2 0 (4,0-3,1)=0,9 E. de Souza e Silva, D. Figueiredo - JAI 2007 13

Dinâmica do Replicador Assumir milhares de jogadores (infinito) Estado: fração de jogadores que adotam cada uma das estratégias no instante t: <σ ι, σ 2,..., σ Μ > Tempo contínuo (jogo está sendo jogado continuamente) Qual é a recompensa de um jogador que adote a estratégia s? recompensa de um indivíduo que adota a estratégia i: u i (σ) Supor: em t indivíduo um indivíduo aprende sobre a recompensa de outro indivíduo com probabilidade λ t E. de Souza e Silva, D. Figueiredo - JAI 2007 14

Dinâmica do Replicador Escolher um jogador para jogar aleatoriamente: Aumento (ou diminuição) da populção proporcioanal a diferença de recompensa E. de Souza e Silva, D. Figueiredo - JAI 2007 15

Dinâmica do Replicador Dividindo por N(t) DINÂMICA DO REPLICADOR E. de Souza e Silva, D. Figueiredo - JAI 2007 16

Dinâmica do Replicador Estratégias com recompensas menor ou maior que média diminuem ou aumentam fração da população Indivíduos adotam estratégias que possuem recompensas mais altas Sistema dinâmico é determinístico (equações diferenciais) Estratégia não possui variação se recompensa é igual a média Estudos na área médica Equilíbrio: σ ἰ = 0 para todo i E. de Souza e Silva, D. Figueiredo - JAI 2007 17

Exemplo Jogo da águia-pombo-burguês Qual é o equilíbrio? E. de Souza e Silva, D. Figueiredo - JAI 2007 18

Exemplo burguês ponto inicial σ Α σ p águia σ Β pombo E. de Souza e Silva, D. Figueiredo - JAI 2007 19

Estratégias Evolucionariamente Estáveis (ESS) Estratégia evolucionariamente estável: Informalmente, uma população adotando estratégias segundo uma distribuição σ é ESS se ela não é vulnerável a invasões por indivíduos (perturbações) que conseqüentemente irão alterar a distribuição da população pelas estratégia. classe C classe C ponto inicial ponto inicial ponto inicial classe A classe B classe A classe B Se σ é um equil evolucionário então é um equil de Nash E. de Souza e Silva, D. Figueiredo - JAI 2007 20

Exemplo: Rede sem Fio Já vimos esse problema... Vamos simplificar... Slotted Aloha p(1-q) A Estação A fica transmitindo até que B transmita Colisão 0 q p q(1-p) B Estação B fica transmitindo até que A transmita q E. de Souza e Silva, D. Figueiredo - JAI 2007 21

Exemplo: Rede sem Fio Vazão: pode-se facilmente calcular (se você usar o Tangram-II!!!!) p(1-q) A 1 vazão de A q 0.8 0 p 0.6 0.4 q(1-p) B 0.2 0 q 1 0.8 0.6 0.8 0.4 0 0.2 0.4 0.6 0.2 1 0 q p E. de Souza e Silva, D. Figueiredo - JAI 2007 22

q Exemplo: Rede sem Fio Se p=q --> vazão máxima = 1/3 (para que valor???) O que acontece??? sistema MUITO injusto... Por que??? E. de Souza e Silva, D. Figueiredo - JAI 2007 23

q Exemplo: Rede sem Fio Se p=q --> vazão máxima = 1/3 (para que valor --> p=q-->0 sistema MUITO injusto... A estação que ganha o canal permanece com ele... VAMOS COLOCAR UM LIMITE NA VAZÃO DE CADA ESTAÇÃO Como modelar a competição??? E. de Souza e Silva, D. Figueiredo - JAI 2007 24

Exemplo: Rede sem Fio JOGO DE STACKELBERG Um jogo de Stackelberg é um jogo extensivo de dois rivais e com informação perfeita onde o líder escolhe uma estratégia do seu conjunto e o seguidor, informado sobre a escolha do líder, escolhe em seguida a sua, do seu conjunto de opções. Exemplo: limitar vazão a 0,2, líder: E A E A escolhe p=0,1 -> E B escolhe valor que maximiza a sua vazão, dada a restrição -> q=0,0666; E A escolhe... Ambas alcançam a vazão máxima permitida q E se a vazão máxima for 0,5? --> neste caso é preferível ser o líder... mas mesmo assim não ocupa 100% da banda PREÇO DA ANARQUIA!!! E. de Souza e Silva, D. Figueiredo - JAI 2007 25

Exemplo: Rede sem Fio Como E A sabe que E B irá maximizar a sua vazão depois da sua escolha... Problema do seguidir E A : o seguidor conhece a estratégia do líder, isto é, o parâmetro p escolhido por ele. Então apenas tenta otimizar a sua vazão dado p: Problema do líder E A : o líder sabe que o seguidor tentará maximizar a sua escolha, e portanto ele deve de antemão escolher o valor do seu parâmetro da forma: q E. de Souza e Silva, D. Figueiredo - JAI 2007 26

q Exemplo: Dilema do Retransmissor Transmitir gasta energia... D B E A E B D A E. de Souza e Silva, D. Figueiredo - JAI 2007 27

Problemas de Congestionamento Usuário ajusta taxa de transmissão -> otimizar desempoenho MÉTRICA: POWER (vazão/delay) E. de Souza e Silva, D. Figueiredo - JAI 2007 28

Problemas de Congestionamento Suponha estratégias: taxas 0,1 e 0,499 restrição: 0,1 usuário 1 0,499 usuário 2 0,1 0,499 0,08; 0,08 0,2; 0,04 0,04; 0,2 10-4 ;10-4 Como modelar??? E. de Souza e Silva, D. Figueiredo - JAI 2007 29

Problemas de Congestionamento Jogador 1 escolhe estratégia, então jog 2,... restrição: 0,1 usuário 1 0,499 usuário 2 0,1 0,499 0,08; 0,08 0,2; 0,04 0,04; 0,2 10-4 ;10-4 Convergência: recompença total: 1/9*2 = 0,22 --- mas cooperação --- recompença 0,25 (taxas = 0,25) E. de Souza e Silva, D. Figueiredo - JAI 2007 30

Problemas do VivaVoz E. de Souza e Silva, D. Figueiredo - JAI 2007 31

Teoria dos Jogos Evolucionária layer 1 σ NS or active measurements NS or active measurements NS or active measurements NS or active measurements layer 2 E. de Souza e Silva, D. Figueiredo - JAI 2007 32

Teoria dos Jogos Evolucionária layer 1 σ Network State codec FEC MOS Network State codec FEC MOS Network State codec FEC MOS Network State codec FEC MOS NS or active measurements NS or active measurements NS or active measurements NS or active measurements layer 2 E. de Souza e Silva, D. Figueiredo - JAI 2007 33

Teoria dos Jogos Evolucionária 350 300 Aggregate traffic Saturation Throughput 250 Kbps 200 150 100 50 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Minutes E. de Souza e Silva, D. Figueiredo - JAI 2007 34