LIÇÕES DE TEORIA DOS JOGOS Marilda Antônia de Oliveira Sotomayor e Maurício Soares Bugarin São Paulo, maio de 2007 Livro encaminhado ao CNPq como parte do relatório técnico do Projeto Edital Universal número 4797771/2004-9. Direitos autorais reservados. Qualquer forma de reprodução é expressamente proibida. Marilda Sotomayor e Maurício Bugarin, 2007
CAPÍTULO 2 ESQUEMAS DE VOTAÇÃO Objetivos: Introduzir o conceito de regra de escolha social ou esquema de votação. Discutir a noção de manipulabilidade. Apresentar o Teorema da impossibilidade de Gibbard e Satterthwaite e esquematizar uma demonstração. 2.1-INTRODUÇÃO O capítulo anterior mostrou que é impossível construir uma relação de preferências sociais, a partir de preferências individuais, que satisfaça condições mínimas desejáveis. Quando se procura uma tal relação, no entanto, tem-se por objetivo final a tomada de decisão social. De fato, uma vez construída uma relação de preferências sociais num conjunto de alternativas X, pode-se usá-la para determinar uma alternativa que seja preferida às demais opções em X, tornando possível a escolha dessa alternativa socialmente ótima. Considerando o Teorema da Impossibilidade de Arrow, surge naturalmente a seguinte questão: Será possível obter diretamente uma regra de escolha social adequada, ou seja, será possível construir uma função f que, a cada perfil de preferências individuais definidas sobre um conjunto de alternativas X, (R 1,..., R n ), associa uma alternativa x=f(r 1,..., R n ) X? Que propriedades mínimas uma tal função deve satisfazer? Essas questões serão analisadas no presente capítulo. 1
2.2-ESQUEMAS DE VOTAÇÃO Exemplo 2.1-Voltemos ao exemplo do restaurante, discutido no capítulo anterior. Um grupo de indivíduos (uma sociedade) deseja ir a um restaurante para comer uma pizza, que será repartida entre eles. Os tipos de pizza aceitáveis para qualquer um do grupo são: x, y e z. O problema de decisão do grupo de indivíduos pode ser apresentado a seguir. Que pizza escolher dadas as preferências dos indivíduos da sociedade? A resposta a esta pergunta envolve a escolha de uma regra de escolha social, definida abaixo. Definição 2.1-Regra de escolha social (ou esquema de votação). Sejam N={1,, n} um conjunto de indivíduos representando uma sociedade e X um conjunto de alternativas ou escolhas possíveis para a sociedade. Seja ainda ρ o conjunto de todas as relações de preferências completas e transitivas que podem ser definidas sobre X. Para cada j em N seja ρ j ρ o conjunto das possíveis preferências completas e transitivas do indivíduo j e seja ρ n = ρ 1 ρ 2 ρ n. Uma regra de escolha social (RES) ou um esquema de votação f é qualquer função de ρ n em X: F: ρ 1 ρ 2 ρ n ρ R=(R 1, R 2,, R n )! x=f(r)=f(r 1, R 2,, R n ) Assim, uma regra de escolha social associa uma escolha social para cada perfil de preferências dos agentes. No que se segue será comum ressaltar o papel de um dos agentes j N. Para tanto serão usadas as notações: ρ j=ρ 1 ρ 2 ρ j 1 ρ j+1 ρ n, ρ=ρ j ρ j, R j=(r 1, R 2,, R j 1, R j+1,, R n ) e R=(R j, R j). Assim como no capítulo anterior usa-se a notação P j para a relação de preferências estritas associada a R j. Observação 2.1-Para usar uma regra de escolha social, é necessário dispor da informação sobre as preferências individuais. Como se trata tipicamente de informação privada de cada indivíduo, supõe-se, neste capítulo, que essa informação é solicitada aos 2
agentes. No exemplo a seguir, mostra-se uma importante dificuldade de pode surgir quando os agentes têm que informar suas preferências. Exemplo 2.2-Pluralidade de votos. Um exemplo de regra de escolha social é o esquema de votação usual (ou regra da pluralidade). Considere um conjunto de três candidatos, {x, y, z}, a um cargo político. Os eleitores se dividem em 3 grupos: A, B e C, com A =3, B = C =2. As preferências dos indivíduos, supostas estritas, são dadas pelas colunas a seguir, nas quais uma alternativa que se encontra mais ao alto é estritamente preferida à alternativa que se encontra mais abaixo. A B C x y z y z x z x y Pede-se a cada indivíduo que vote por seu candidato favorito. O candidato que tiver mais votos é eleito. Este esquema pode ser visto claramente como uma regra de escolha social, na qual a única informação que é considerada sobre as preferências de cada indivíduo é seu candidato favorito. Se os indivíduos declararem suas preferências, o candidato escolhido será x, já que esse é o mais votado. Entretanto suponha que os indivíduos de B declaram PʹB: B (PʹB) z x y Então z será o mais votado e os indivíduos de B, que preferem z a x, se beneficiarão com a escolha social. Isto quer dizer que f é coletivamente manipulável pela coalizão B. Definição 2.2-Manipulabilidade. Uma regra de escolha social é individualmente manipulável ou não é à prova de estratégias se existirem um indivíduo j, um perfil de preferências R=(R 1,, R j,, R n ) ρ n e uma relação de preferências para j, Rʹj ρ j, tais que: 3
f((r 1,, Rʹj,, R n ) P j f(r 1,, R j,, R n ). Uma regra de escolha social é coletivamente manipulável se existirem uma coalizão S, um perfil de preferências R=(R 1,, R j,, R n ) ρ n e uma relação de preferências Rʹj ρ j, para cada j S, tais que, se RʹS=( Rʹj, j S) e R S=( Rʹj, j S), f( R S, RʹS) P j f(r), para todo j S. Exemplo 2.3-Regra de Borda. O seguinte método de votação foi proposto por Jean-Charles de Borda (1733-1799) e é chamado de método de Borda. Cada votante ordena todos os candidatos em ordem de preferência. Para cada votante, o pior candidato obtém 0 ponto, o segundo pior candidato obtém 1 ponto, etc. O número de pontos ganhos por cada candidato é igual à soma de seus pontos entre os votantes. O candidato com o maior número de pontos é eleito. Cada jogador pode declarar qualquer ordenação entre os candidatos. Cada ordenação é uma estratégia. A função de resultados aplica a conta e determina quem é o escolhido. Considere, por exemplo, N={1, 2}, X={x, y, z, w}, ρ j é o conjunto de todas as ordenações possíveis de preferências sobre o conjunto X, f(.) é o candidato que possui a maior soma dos pontos. As verdadeiras preferências (estritas) são dadas por: R 1 R 2 3- x y 2- y w 1- z x 0- w z O candidato y detém o maior número de pontos segundo as preferências verdadeiras. No entanto, suponha que o jogador 1 declare Rʹ1 dada a seguir. Rʹ1 3- x 2- z 1- w 0- y 4
Então, f(rʹ1, R 2 )=x, que é o candidato favorito do jogador 1. Assim, a regra de Borda é manipulável pelo agente 1: se P 1 representar a relação de preferências estritas associada a R 1, então f(rʹ1, R 2 )P 1 f(r 1, R 2 ). Observação 2.2-Se um esquema de votação é manipulável então a honestidade não é a melhor política para pelo menos um indivíduo. Se alguns indivíduos não declaram suas verdadeiras preferências, o resultado obtido com a regra de escolha social não tem porque expressar os gostos dos indivíduos da sociedade. Para ilustrar, no exemplo 2.2 os agentes do tipo B conseguem eleger um candidato que não tem a preferência da maioria dos eleitores, caso os outros agentes decidam votar de acordo com suas convicções. Analogamente, mentindo, o agente 1 pode induzir uma escolha social que lhe favorece no exemplo 2.3. A possibilidade de manipulação gera uma grande instabilidade na escolha dos agentes. Deve-se declarar a verdade, ou existe uma melhor alternativa, se os outros declararem a verdade? Mas e se os outros também manipularem suas declarações? Uma maneira de se livrar dessas questões é garantir que a regra social não seja manipulável. O problema é então saber se existe algum esquema de votação não-manipulável. Esquemas de votação constituem o núcleo da teoria de escolha social, iniciada com o livro de Arrow (1963). O interesse pelas propriedades estratégicas das regras de votação cresceu nos anos 60. Em 1969, o trabalho pioneiro de Farqharson, embora não usasse a linguagem de teoria dos jogos, estava recheado de argumentos estratégicos. A partir de então a questão da existência ou não de um esquema de votação à prova de estratégias foi colocada. Foi negativamente respondida por Gibbard (1973) e Satterthwaite (1975). Esse resultado teve profunda influência na literatura emergente sobre compatibilidade de incentivos e desenho de mecanismos. No que se segue indica-se como esse resultado foi obtido. 5
2.3-FORMAS DE JOGO Definição 2.3-Forma de jogo. Uma regra de escolha social f: ρ n = ρ 1 ρ 2 ρ n X induz uma forma de jogo definida por Γ(f) = (N, (ρ 1,,ρ n ), X, f), em que N={1,..., n} é um conjunto de indivíduos chamados jogadores, ρ j é o conjunto de possíveis declarações de preferências, chamadas de estratégias, do indivíduo j, j=1,..., n e f é a função resultado, que indica a alternativa escolhida em X para cada perfil de estratégias. Observação 2.3-Uma forma de jogo não gera nenhuma previsão de comportamento. Para tanto, é necessário especificar os desejos de cada jogador, suas verdadeiras preferências, descritas por R=(R 1,, R j,, R n ). As preferências declaradas pelos jogadores são escolhas estratégicas, enquanto as verdadeiras preferências indicam como cada indivíduo de fato ordena as alternativas. Observe que está implícito na construção acima que o conjunto das estratégias de um agente j é o conjunto de todas as suas possíveis relações de preferências: ρ j. Dada a regra de escolha social f, é possível que cada indivíduo ache ótimo declarar suas verdadeiras preferências, independentemente do que declarem os outros, ou seja, f(r j, Rʹ j) R j f(rʹj, Rʹ j), para todos R j, Rʹj ρ j, Rʹ j ρ j. Nesse caso, dizemos que declarar a verdade é uma estratégia dominante. Mais geralmente, tem-se a definição abaixo. Definição 2.4-Estratégia dominante. Uma estratégia para um jogador é dita dominante se ela é a declaração ótima que este jogador pode fazer, dadas suas preferências verdadeiras sobre os resultados, para qualquer conjunto de estratégias dos outros jogadores. Equivalentemente, dadas as preferências R j para j, a estratégia r ρ j é dominante se: f(r, Rʹ j) R j f(s, Rʹ j), s ρ j, Rʹ j ρ j. 6
Observação 2.4-A definição acima proporciona uma nova caracterização do conceito de manipulabilidade. De fato, um esquema de votação f é não-manipulável se, para todo perfil de preferências verdadeiras R na forma de jogo Γ(f), r=r j é uma estratégia dominante para cada jogador j=1,...,n. Exemplo 2.4-Regra ditatorial. Uma regra de escolha social não-manipulável é a regra ditatorial. Uma regra de escolha social f é ditatorial se existe um indivíduo j (chamado ditador) tal que, para todo perfil de preferências R=(R j, R j) ρ n, verifica-se: (i) f(r j, R j) R j y, y Im(f) (ii) f(r j, R j) = f(r j, Rʹ j), Rʹ j ρ j. A condição (i) garante que o jogador j receberá uma melhor alocação possível se declarar suas próprias preferências. Portanto, para j é uma estratégia dominante declarar a verdade. Por outro lado, a condição (ii) garante que a declaração de qualquer jogador k j não influencia a escolha social. Assim, declarar suas verdadeiras preferências também é uma estratégia (trivialmente) dominante para k. Portanto, uma regra de escolha social ditatorial é não-manipulável. Observação 2.5-Sejam f uma regra ditatorial e Γ(f) a forma de jogo associada, com verdadeiras preferências R. Sejam ainda j um ditador associado a f e P j a relação de preferência estrita obtida a partir de R j. Suponha que x Im(f) é tal que x P j y, para todo y Im(f). Então f(r j, R j)=x, R j ρ j. Assim, numa regra social ditatorial, o ditador sempre consegue impor aos outros agentes sua escolha favorita, anunciando suas verdadeiras preferências na forma de jogo correspondente. Esta observação sugere definir o conceito geral de forma de jogo ditatorial. Definição 2.5-Forma de jogo ditatorial. Uma forma de jogo Γ(f)=(N, (ρ 1,,ρ n ), X, f), é ditatorial se existe um indivíduo j tal que, para todo resultado x X, existe uma estratégia s j (x) ρ j tal que se j escolher 7
s j (x) então o resultado será x, não importando o que os outros escolham. O jogador j é chamado de ditador com relação à forma de jogo Γ(f). Observação 2.6-Toda forma de jogo associada a uma regra de escolha social ditatorial é ela mesma uma forma de jogo ditatorial. De fato, para induzir uma alternativa x Im(f), basta para o ditador j anunciar uma relação R j tal que xp j y, para todo y Im(f). A volta, no entanto, não é imediata. De fato, por definição, numa forma de jogo o ditador consegue impor à sociedade qualquer alternativa factível; no entanto, para atingir esse objetivo pode ser necessário anunciar uma preferência não-verdadeira. Assim, a questão da manipulabilidade assume um papel central nessa comparação. Para poder demonstrar um resultado recíproco considera-se, no que se segue, apenas relações de preferências estritas nos conjuntos ρ j ; assim, se x, y X, para cada agente j, xp j y ou yp j x. Nesse caso, a condição (ii) da definição de regra de escolha social ditatorial torna-se uma conseqüência imediata da condição (i). Lema 2.1-Seja f uma regra de escolha social não-manipulável e seja Γ(f) a forma de jogo associada. Se a forma de jogo Γ(f) for ditatorial, então a regra de escolha social f também será ditatorial. Demonstração. Suponha, por contradição, que f não é ditatorial. Então, para cada jogador j N, existem R j =(R j 1,..., R j n) ρ n e y Im(f), tais que y P j f(r j ) em que P j é a relação de preferência estrita associada a R j j. Fixe um desses jogadores j assim como R j e y. Como a forma de jogo é ditatorial, existe Rʹj tal que f(rʹj, R j j) = y P j f(r j ). Mas então Rʹj R j j e a regra é manipulável, uma contradição. 2.4-O TEOREMA DE GIBBARD, SATTERTHWAITE Na seção anterior vimos que uma propriedade desejável para uma regra de decisão social é a não-manipulabilidade. No entanto, a única regra de escolha social 8
não-manipulável que conseguimos construir foi uma regra ditatorial. O teorema de Gibbard e Satterthwaite enunciado a seguir mostra que, infelizmente, trata-se de um resultado geral. Teorema 2.1-(Gibbard, Satterthwaite). Toda regra de escolha social não-ditatorial definida num conjunto de pelo menos três alternativas é manipulável. Gibbard (1973) prova esse teorema como um corolário do lema a seguir. Lema 2.2-(Teorema da não-dominância de Gibbard). Em toda forma de jogo não-ditatorial com três ou mais resultados possíveis, existem no mínimo um indivíduo j e um perfil de preferências R definidas sobre o conjunto dos possíveis resultados, tais que o indivíduo não tem uma estratégia dominante dadas as verdadeiras preferências R. Demonstração do Teorema de Gibbard, Satterthwaite. Sejam f uma regra de escolha social não-ditatorial e g=γ(f) a forma de jogo induzida por f. Suponha, em primeiro lugar, que a forma de jogo g é ditatorial. Então, pelo Lema 2.1, f tem que ser manipulável. Suponha agora que g é não-ditatorial. Então, pelo Lema 2.2, existem um indivíduo j e um perfil de preferências R definidas sobre os resultados, tais que j não tem uma estratégia dominante dadas as verdadeiras preferências R. Em particular, declarar a verdade não é uma estratégia dominante para j, dadas as verdadeiras preferências R. Mas então f é manipulável. Observação 2.7-O Teorema da não-dominância de Gibbard (Gibbard 1973), em sua forma original, demonstra a impossibilidade da existência de uma regra de escolha social não-manipulável e não-ditatorial no caso específico em que as preferências dos 9
jogadores são estritas, conforme assumido neste capítulo. No entanto, esse resultado foi estendido para o caso geral por Satterthwaite (Satterthwaite 1975). 2.5-CONCLUSÃO O teorema de Gibbard, Satterthwaite mostra que qualquer regra de escolha social com a propriedade mínima de não ser ditatorial está sujeita a manipulações dos agentes, que têm incentivo a agir estrategicamente, cada um fazendo declarações que possam induzir uma escolha social que mais lhe interesse. Este resultado negativo está intimamente relacionado com o resultado semelhante obtido para funções de bem estar social. Ambos constituem uma clara sugestão para o estudo de situações nas quais os agentes têm interesse em buscar a melhor forma de agir, considerando as ações dos outros jogadores e os efeitos das ações de todos no resultado final. Esse é justamente o objetivo primeiro da teoria dos jogos, que estudaremos em detalhe neste livro. 2.6-EXERCÍCIOS Exercício 2.1-Suponha que existem apenas duas alternativas possíveis: X =2. Construa uma regra de escolha social que é ao mesmo tempo não-manipulável e não-ditatorial. REFERÊNCIAS Abdou e Keiding (1991), Effectivity functions in social choice. Dordrecht: Kluwer Academic Publishers. Arrow, K. (1951, 1963) Social choice and individual values, New Haven, Yale University Press. 10
Barbera, S. (1983) Strategy-proofness and pivotal voters: a direct proof of the Gibbard- Satterthwaite theorem, International Economic Review, 24: 413-417. Barbera, S., F. Gül e E. Stachetti (1993) Generalized median voter schemes and committees, Journal of Economic Theory, 61: 262-289. Barbera, S., H. Sonnenschein e L. Zhou (1991) Voting by committees, Econometrica, 59: 595-609. Farqharson, R. (1969) Theory of voting, Yale University press, New Haven. Gibbard, A. (1973) Manipulation of voting schemes: a general result, Econometrica, 41: 587-601. Moulin, H. (1983) The strategy of social choice, advanced textbook in Economics. Amsterdam: North-Holland. Peleg (1984) Game theoretical analysis of voting in committees, Cambridge University Press, Cambridge. Satterthwaite, M. A. (1975) Strategyproofness and Arrow s conditions: existence and correspondence theorems for voting procedures and social welfare functions, Journal of Economic Theory, 10: 198-217. Sen, Amartya K., (1970) Collective Choice and Social Welfare, San Francisco, Holden- Day. Sen, A. K., (1986) Social choice theory (survey) em: Handbook of Mathematical Economics, editado por K. Arrow e M. Intriligator. Amsterdan: North-Holland. 11