Lógica e Raciocínio Universidade da Madeira http://dme.uma.pt/edu/ler/ Introdução a Teoria da Decisão 1
Conteúdos Os tópicos que vamos abordar: Decisão sob ignorância Decisão sob Risco Teoria da Probabilidade Função de Utilidade O que são Teoria da Decisão e Análise da Decisão? Teoria da Decisão é o resultado de um esforço conjunto de economistas, matemáticos, filósofos, sociólogos e estatísticos para explicar como os indivíduos ou grupos fazem ou devem tomar decisões. (Resnik, 1987) Os principais objectivos da Teoria da Decisão são, primeiramente, fornecer modelos para como nos guiamos os nossos desejos e as nossas crenças e, no segundo lugar para esclarecer como combinamse em decisões racionais (Gärdenfors & Sahlin, 1988) 2
O que são Teoria da Decisão e Análise da Decisão? Uma filosofia, articulada por um conjunto de axiomas lógicos e uma metodologia e colecção de procedimentos sistemáticos baseados nestes axiomas, com o fim de analisar as complexidades inerentes em problemas da decisão. (Keeney, 1982) Análise da Decisão é o termo utilizado para referir a cuidadosa deliberação que precede uma decisão Mas especificamente refere-se aos aspectos quantitativos desta (French, 1988) Onde aplica-se teoria da decisão? Ferramentas de análise de risco e decisão Inteligência Artificial Analise Operacional Modelos Económicos Grupos de Decisão 3
Componentes O problema é analizado desde as alternativas (actos) As alternativas conduzem aos resultados (prémios, consequências) Estes são analisados com base num valor v ou na utilidade u, e a probabilidade p Podem também ser considerados outros critérios diferentes (aspectos, perspectivas) Modelo Base Uma decisão implica uma escolha entre dois ou mais possíveis alternativas Cada alternativa leva a um o mais futuros estados Um estado conjuntamente com a alternativa formam uma consequência 4
Exemplo Decisão: Devo levar o guarda-chuva ao passeio? Alternativas: levo o guarda-chuva, não levo o guarda-chuva Estados: Começa a chover, não começa a chover Consequências: Chove e não tenho guarda-chuvas, não chove e tenho guarda-chuva, etc Árvore de Decisão Consiste de quatro componentes Nós de decisão (quadrados) Nós de Probabilidade (círculos) Nós de consequência triângulos Eixos Probability node decisão node Consequence node 5
Avaliação das consequências Analisar os valores ser frequentemente difícil. Necessita encontrar uma escala para medir as consequências. Comparar Celsius, Fahrenheit, etc. para a temperatura Mais como é possível, por exemplo medir os aspectos do ambiente (nublado, instável, etc.). Na literatura e no software convencional são necessários valores precisos para achar estimações correctas. Análise de planos de acção (Análise de cenários ) Investiga que tão provável é cada um dos possíveis resultados Exaustivo: pelo menos uma das consequências vá acontecer. Disjuntivo de a pares: no máximo uma das consequências vá acontecer. : exactamente uma das consequências vá acontecer. Utilizamos probabilidades p com a finalidade de quantificar as nossas crenças (Σp i = 100%). 6
Avaliação Mesmo que possuamos conhecimento acerca de todos os dados de fundo, precisamos saber como escolher. Aqui é que a teoria da decisão entra em jogo. Algumas regras de decisão Preferência (Dominance) Regra Maximin/Maximax Regra de Optimismo Pessimismo Regra Minimax Regret Principio da ração insuficiente Etc. 7
Maximizando a utilidade esperada A utilidade esperada e o valor da a media ponderada Σp xi u xi = p x1 u x2 +p x2 u x2 +...+p x(n-1) u x(n-1) +p xn u xn Alt. 1 u 11 p 11 u 12. p 12.. p 1n u1n Alt. 2 u 21 p 21 u 22. p 22.. p 2m u2m Escolher a alternativa com a utilidade esperada mais elevada.. Problema de Decisão : gangrene Formulação da decisão : Um paciente de 68 anos tem que escolher entre: A amputação da perna esquerda por baixo do joelho. Tratamento com medicamentos Com a amputação o risco de vida é de 1% Com o tratamento com medicamentos, a probabilidade é, num passo posterior, de 30% de precisar amputar a perna por cima do joelho, com risco de morrer de 10% 8
Alternativas As alternativas consistem em escolher o que fazer, se amputar ou usar medicamentos Identificando as consequências As consequencias é o que acontece de acordo com cada alternativa: C11: Perna amputada por baixo do joelho, saudável C12: Morte C21: saudável C22: Perna amputada por cima do joelho, saudável C23: Morte 9
Estruturando o Problema Distribuição de Probabilidades C11: Perna amputada por baixo do joelho, saudável 0,99 C12: Morte 0,01 C21: saudável 0,70 C22: Perna amputada por cima do joelho, saudável 0,27 C23: Morte 0,03 10
Actualizamos a Estrutura Agregamos as Probabilidades Avaliação. Passo 1 Se o paciente considera a probabilidade de morrer como um factor determinante, então deve escolher a amputação. Se o paciente considera a diferencia insignificante (0,03 vs. 0,01) e a possibilidade de ficar completamente curado é um factor determinante, então deve escolher a medicação. 11
Avaliação. Passo 2 Escala de valores Aqui podemos considerar A utilidade da morte é a mais baixa A utilidade de ficar saudável é a mais alta Escolhemos uma escala de valores u(morte) = 0 u(saudável) = 1 Estimar as consequências É difícil de quantificar, mas usualmente se utiliza um intervalo ou um ranking Valores Precisos: Perna amputada por baixo do joelho = 0.8 Perna amputada por cima do joelho = 0.6 Exemplo de Intervalos : Perna amputada por baixo do joelho = [0.7, 0.9]. Perna amputada por cima do joelho = [0.5, 0.7]. Ordem de preferência: Perna amputada por baixo do joelho é melhor que Perna amputada por cima do joelho 12
Estruturando - valores Inserimos os valores Utilidade Esperada A utilidade esperada de cada alternativa: A1(amp.): p(amp. bj)*u(amp. bj) + p(morte)*u(morte) = 0,99*0,8 + 0,01*0 = 0,792 (probabilidade * utilidade de Perna amputada por baixo do joelho + probabilidade * utilidade de morte) A2 (medic.): p(saudável)*u(saudável) + p(amp. cj)*u(amp. cj) + p(morte)*u(morte) = 0,7*1 + 0,27*0,6 + 0,03*0 = 0,862 (probabilidade * utilidade de saudável + probabilidade * utilidade de Perna amputada por cima do joelho + probabilidade * utilidade de morte) 13
Consequências Posteriores Suponhamos que alguns anos depois da medicação a doença possa voltar: C211: Saudável nos próximos 5 anos (75%) C212: Perna amputada por baixo do joelho (7%) C213: Perna amputada por cima do joelho (15%) C214: Morte (3%) Consequências Posteriores 14
Utilidade Esperada A utilidade esperada de cada alternativa: A1(amp.): 0,792 (não muda) A2 (medic.): 0,7*0,75*1+ p(saudável)* p(saudavél 5 nos)*u(saudável) + 0,7*0,07*0.8+p(saudavél)*p(amp. bj)*u(amp. bj) + 0,7*0,15*0.6+p(saudavél)*p(amp. cj)*u(amp. cj) + 0,7*0,03*0+ p(saudavél)*p(morte)*u(morte) + 0,27*0.6+ p(amp. cj)*u(amp. cj) + 0,03*0 p(morte)*u(morte) = = 0,789 15