Introdução à Modelagem do Sistema Terrestree (CST-317) Prof. Dr. Gilberto Câmara Modelo de Simulação Social: Teoria de Jogos Alunos(as): Lucía Chipponelli (lucia.chipponelli@inpe.br) Michelle Furtado (michelle.furtado@inpe.br) São Jose dos Campos SP Outubro de 2012
Modelo de Simulação Social: Dilema do Prisioneiro O dilema do prisioneiro é um problema da teoria dos jogos e um exemplo claro, mas atípico, de um problema de soma não nula. Neste problema, como em outros muitos, supõe-se que cada jogador, de modo independente, quer aumentar ao máximo a sua própria vantagem sem lhe importar o resultado do outro jogador. As técnicas de análise da teoria de jogos padrão - por exemplo determinar o equilíbrio de Nash - podem levar cada jogador a escolher trair o outro, mas curiosamente ambos os jogadores obteriam um resultado melhor se colaborassem. Infelizmente (para os prisioneiros), cada jogador é incentivado individualmente para defraudar o outro, mesmo após lhe ter prometido colaborar. Este é o ponto-chave do dilema. No dilema do prisioneiro iterado, a cooperação pode obter-se como um resultado de equilíbrio. Aqui joga-se repetidamente, pelo que, quando se repete o jogo, oferece-se a cada jogador a oportunidade de castigar ao outro jogador pela não cooperação em jogos anteriores. Assim, o incentivo para defraudar pode ser superado pela ameaça do castigo, o que conduz a um resultado melhor, cooperativo. Exercício 1: Implementar o modelo de Nowak e May para várias configurações iniciais de colaboradores e desertores, e vários valores de ganho R (reward = ganho pela colaboração mutua), S (sucker s payoff = prejuízo por colaborar quando o outro deserta), T (temptation = tentação para desertar), e P (punishment = punição por deserção mútua), R=1, S=0, P > S, e 1< T < 2, numa vizinhança 3 x 3 com a célula jogando contra ela mesma. 1
Resposta: Com os parâmetros T= 1.85, R = 1, S = 0, P = 0.01 rodamos o modelo por 300 interações e percebe-se que a porcentagem de defectores aumenta gradativamente até 60 interações, após esse time a porcentagem de defectores varia entre 60% e 80%. Com esses valores adotados de T e P está sendo favorecido o aumento dos defectores, pois o valor da punição é muito baixo e tentação é alta. Mesmo tendo o inicio com um número elevado de colaboradores rapidamente eles se tornam defectores devido as configurações de T e P, como pode ser visto nas figuras abaixo. Fig: 30 interações Fig: 60 interações Exercício 2: Implementar o dilema do prisioneiro espacial para várias configurações iniciais de colaboradores e desertores, com ganhos R = 3 (fixo), S = 0 (fixo), 3 < T < 6 e 0 < P < 3. Descubram quantas e quais são os espaços de fase do modelo. Use vizinhança de Von Neumann (2 2). A célula joga com seus quatro vizinhos, mas não joga consigo. Resposta: A simulação começa com 50% de delatores e é alterada com os passos de tempo conforme as condições iniciais colocadas no modelo referentes à T (tentação de desertar) e P (punição por deserção mútua). Rodando o modelo com várias condições iniciais diferentes percebemos que existem 5 grupos principais de cenários encontrados quando as condições iniciais do modelo são: R = 3 (fixo), S = 0 (fixo), 3 < T < 6 e 0 < P < 3. 2
Na Figura 1 observamos a condição T = 5.8 e P = 2.5 onde 100% das células se tornam defectores. Figura 1: T = 5.8 e P = 2.5, onde 100% das células são defectores Na Figura 2 observamos a condição T = 3 e P = 1, onde 83% das células se tornam defectores, e também podemos observar pequenos grupos de colaboradores. Figura 2: T = 3 e P = 1, onde das células 83% são de defectores Na Figura 3 observamos uma condição onde as células defectores caem para apenas 23% das células. Observamos também que são formados grupos de colaboradores. 3
Figura 3: T = 3.5 e P = 1, onde 23% das células são defectores Na Figura 4 observamos a condição T = 4 e P = 0.2, onde as células não se estabilizam e ficam variando entorno de 55% e 60% de defectores. Figura 4: T = 4 e P = 0.2, onde as células não se estabilizam e ficam variando entre 55% e 60% de defectores. Com essas variações nas condições iniciais do modelo podemos observar que existe 4 configurações finais principais, porém para determinar qual o intervalo de T e P para essas configurações seria necessário testes com quase todas as combinações de valores entre T e P possíveis, ou alguma formulação matemática, assim poderíamos gerar um gráfico para representar esses limites como é mostrado no estudo de Schweitzer et al., 2002. 4
Referência: Schweitzer, F.; Behera, L.; M uhlenbein, H. Evolution of Cooperation in a Spatial Prisoner s Dilemma. Advances in Complex Systems, v. 5, n. 2-3, pp. 269-299, 2002 5