1 O que é Teoria da Decisão?

Universidade Federal do Paraná Departamento de Estatística Graduação em Estatística Introdução a Teoria da Decisão Prof. Thaís Fonseca 1 O que é Teoria da Decisão? 1.1 Introdução Teoria da decisão, como o nome diz, trata do problema de tomada de decisões. Teoria da decisão estatística se preocupa em tomada de decisões na presença de conhecimento estatístico que tenta controlar algumas das incertezas involvidas no problema de decisão. As incertezas estarão relacionadas com quantidades numéricas desconhecidas e será representada por θ. A vida é cheia de situações onde decisões devem ser tomadas mesmo que a informação disponível para tomar decisões seja incompleta ou incerta. Questões como: Se estou seriamente doente, qual tratamento devo fazer se os tratamentos tem efeitos colaterais? Qual a probabilidade de cura? Devo investir no mercado de ações? No que devo investir? Como devo investir? Se investir, quanto vou ganhar ou perder? Estando num tribunal devo votar que o acusado é culpado ou não culpado? Para um cientista, quão conclusivos devem ser seus resultados para que sejam reportados em uma revista? Probabilidade e Teoria da Decisão são as ferramentas principais para nos ajudar a analisar questões como essas. Neste curso, vamos investigar como essas ferramentas podem ser úteis na tomada de decisões importantes na área de negócios, medicina, justiça etc. Além disso, iremos considerar algumas das controversias que podem ocorrer durante o processo de tomada de decisão. A teoria da decisão é dividida em normativa (ou prescritiva) e em descritiva. A teoria normativa é a teoria sobre como as decisões devem ser tomadas. Assume-se racionalidade, acurácia e optimalidade. A teoria descritiva, por outro lado, é a teoria sobre como decisões são tomadas de fato, isto é, tenta descrever como as pessoas vão agir ao tomar uma decisão. Abordaremos aqui apenas a teoria normativa. Exemplo 1: João vai ao médico reclamando de um desconforto. O médico acredita que João tem a doença A. O médico examina João cuidadosamente e observa os sintomas. Ele então diz que a probabilidade de João ter a doença A é 0.7. Neste exemplo exitem dois estados da natureza θ 1 : João possui a doença A e θ 2 : João não possui a doença A. O médico explica a João que as possiveis alternativas são: a 1 : fazer um tratamento doloroso e caro mas que cura a doença ou a 2 : voltar para casa e não fazer nenhum tratamento. Sabe-se que para cada par (ação,estado da natureza) existe uma consequência associada. 1

Estados Tratar Melhora da doença/ Novos clientes/ Dor/ Custos Menos clientes/ Dor/ Custos Não tratar Piora da doença/ Menos clientes Novos clientes Qual decisão o médico deve tomar? Primeiro devemos considerar as incertezas envolvidas no processo de tomada de decisão, isto é, ao escolher um curso de ação devemos considerar que as consequências dependem de eventos incertos. Um modelo de decisão consiste de dois aspectos básicos: 1. Especificação estrutural: identificação dos elementos do problema de decisão, isto é, os eventos incertos, as alternativas possíveis, os parâmetros desconhecidos e as relações estruturais relacionando estes elementos. 2. Definição de critérios para comparação de alternativas: os critérios de comparação das consequências associadas as várias alternativas devem possibilitar ao decisor uma certa racionalidade ou coerência no processo decisório. Uma condição necessária para o comportamento racional dos decisores será denominada de coerência. 2 Conceitos básicos Alguns dos Elementos básicos da tomada de decisão na presença de incerteza a serem considerados são: 1. Probabilidade Utilizada para quantificar incerteza. 2. Possíveis ações Considera-se um conjunto A = {a i, i I} de possíveis ações (decisões), onde uma delas deve ser selecionada. 3. Possíveis estados da natureza Indentificar os possíveis estados da natureza que são relevantes para a tomada de decisão. Para cada ação a i existe um conjunto Θ = {θ j, j J} de eventos incertos. 4. Consequências Identificar as consequências das ações e quantificar o valor dessas consequências, o que chamaremos utilizades. Correspondendo a cada conjunto Θ existe um conjunto de consequências {c j, j J}. 5. Dados Identificar informações que podem ajudar a determinar os estados da natureza. Quando é feita uma investigação estatística para obter informação sobre θ, o resultado dessa investigação é denotado por X e é uma variável aleatória. 6. Decisão ótima Combinar todos esses elementos para achar a decisão ótima (Teoria Bayesiana, também chamada Teoria da Utilidade Esperada). Observação importante: Em problemas de estimação de parâmetros temos que A = Θ. Em alguns problemas de tomada de decisão não há informações vindas de um experimento estatístico. Esses casos são chamados problemas sem dados (no-data problems). 2

2.1 Probabilidade É a maneira de quantificar incerteza. Convencionalmente é definida numa escala entre 0 e 1, com 0 denotando nenhuma chance de ocorrer e 1 denotando certo de ocorrer. O exemplo a seguir ilustra como o uso de probabilidade condicional pode levar a uma solução coerente numa situação que pode parecer paradoxal. Leitura recomendada: Probabilidade condicional e marginal (Bar-Hillel e Falk, 1982) Três cartas estão em um chapéu. Uma carta é vermelha em ambos os lados, denotada V V. Outra é branca de ambos os lados denotada BB. A última é vermelha de um lado e branca do outro lado, denotada V B. Seleciona-se uma carta aleatoriamente e coloca-se na mesa. A face para cima é vermelha, o que denotaremos V. Qual a probabilidade que a face virada para baixo também seja vermelha. Resposta: 2/3 (Use probabilidade condicional). Resposta comum: 1/2. P (V V V ) = P (V V V )P (V V ) P (V V V )P (V V )+P (V V B)P (V B)+P (V BB)P (BB) = 1 1/3 (1 1/3)+(1/2 1/3)+(0 1/3) = 1/3 1/2 = 2/3. 2.2 Utilidades e perdas Definição: A função perda da ação a para o estado da natureza θ é dada por L(θ, a) e representa a perda sofrida pela escolha da ação a A quando o estado da natureza é θ Θ, isto é, L : Θ A R Equivalentemente podemos definir a função de utilidade por U(θ, a) = L(θ, a) Exemplo 1: (continuação) De acordo com suas preferencias, o médico é capaz de associar a cada uma das consequências uma utilidade que é mostrada na tabela abaixo: Estados Tratar 50-30 Não tratar -200 100 Tabela 1: U(θ, a): Utilidades Estados Tratar -50 30 Não tratar 200-100 Tabela 2: L(θ, a): Perdas Definição: A ação a m A é denominada minimax se a m = arg min a max θ L(θ, a) Este critério é de natureza conservadora pois escolhe dentre as ações de maior perda, aquela de menor valor. Em outras palavras, escolhe-se a menos pior dentre as piores. Pode-se dizer que um tomador de decisão que adota um algoritmo minimax para tomada de decisão é averso ao risco. 3

Exemplo 1: (continuação) Neste exemplo qual seria a ação minimax? max θ L(θ, a 1 ) = max{ 50, 30} = 30 max θ L(θ, a 2 ) = max{200, 100} = 200 min{30, 200} = 30, então a ação minimax é a 1, tratar o paciente. Podemos dizer que o médico estaria tomando uma ação conservadora. Note, neste exemplo, que não estamos incorporando a informação que o médico tem sobre a probabilidade da doença, que ele obteve de sua experiência e após saber os sintomas do paciente. Devemos, de alguma forma, incorporar as incertezas associadas a θ 1 e θ 2 no processo decisório, de sorte que o médico (decisor) não tenha que ser totalmente averso ao risco. 3 Probabilidade subjetiva e perda esperada 3.1 Distribuição a priori e ação de Bayes Como no exemplo supracitado, seja π(θ), θ Θ a distribuição de probabilidade que mede a informação fornecida ao tomador de decisão (através de estudo prévio ou introspecção). Essa distribuição é também conhecida como distribuição a priori. Essa distribuição reflete a crenças a priori em termos de probabilidades dos possíveis valores de θ. Definição: O risco ou perda esperada de uma ação a A é dado por r(π, a) = L(θ, a)π(θ)dθ ou ainda como Θ r(π, a) = θ Θ L(θ, a)π(θ) onde π(θ) é a função de densidade ou distribuição de probabilidade de θ. Dessa forma, temos que r(π, a) é a perda esperada a priori da ação a A. Exemplo 1: (continuação) θ 1 : Paciente tem a doença A e π(θ 1 ) = 0.7 θ 2 : Paciente não tem a doença A e π(θ 2 ) = 0.3 a 1 : tratar e r(π, a 1 ) = ( 50 0.7) + (30 0.3) = 26 a 2 : não tratar e r(π, a 2 ) = (200 0.7) + ( 100 0.3) = 110 Definição: A ação a b A é denominada ação de Bayes com respeito a π(θ) se a b = arg min a r(π, a) O valor mínimo de risco de Bayes r(π, a b ) é o risco de Bayes associado a ação a b. Exemplo 1: (continuação) 4

A ação de Bayes é aquela que minimiza a perda esperada. 26 < 110 então a b = a 1. O médico deve tratar o paciente segundo esse critério. 5