Fatores de Certeza e Teoria da Evidência

Incerteza Pode ser considerada como a falta de informação para tomar uma decisão. Há uma dúvida que não permite ter uma resposta binária: sim ou não. Havendo dúvida, dizemos que encontramos um ponto não decidido, mas, que temos de resolver.

Incerteza Os humanos se deparam constantemente com situações de incerteza, no entanto devem tomar decisões. O tratamento das incerteza é uma das capacidades importantes do especialista humano. Como inserir esta qualidade em um sistema artificial?

Fatores de Certeza Uma abordagem do tratamento da incerteza no raciocínio usa Fatores de Certeza, teve como pioneiro o sistema MYCIN. O MYCIN tenta recomendar terapias apropriadas para pacientes com infecções bacteriológicas. Nesse sistema, o grau de confirmação foi originalmente definido como um fator de certeza.

Fatores de Certeza Define-se Fator de certeza (FC) como: Onde: FC H, E = MC H, E MD(H, E) FC H, E é o fator de certeza na hipótese H dada a evidência E. MC H, E é a medida de crença na hipótese H dada a evidência E. MD(H, E) é a medida de descrença na hipótese H dada a evidência E.

Fatores de Certeza Medidas de crença e descrença definidas em termos de probabilidade ( entendendo-se probabilidade como crença): 1 se P H = 1 MC H, E = máx P H, E, P(H) P(H) emoutros casos máx 1,0 P(H) 1 se P H = 0 MD H, E = mín P H, E, P(H) P(H) emoutros casos mín 1,0 P(H)

Fatores de Certeza O FC pode ser utilizada em dois caminhos: 1. Para um conjunto de hipóteses em ordem de importância: Seja um problema que tem certos sinais ou indicativos que sugerem diversos diagnósticos, o diagnóstico (hipótese) com um alto FC pode ser o primeiro a ser pesquisado, e, através de ensaios ou testes poderá se confirmar ou não a hipótese (diagnóstico).

Fatores de Certeza Exemplo: Problema: o pedal do freio não funciona Evidência: O pedal esta baixo ou vá todo ao fundo Hipóteses (diagnósticos): H 1 : As pastilhas do freio estão gastas (FC H 1, E = 0,6) H 2 : O nível do liquido de freio está baixo (FC H 2, E = 0,8) H 3 : O cilindro esta defeituoso (FC H 3, E = 0,5) Primeira hipótese a ser verificada: H 2

Fatores de Certeza 2. O FC indica a rede de crença em uma hipótese sob alguma evidência, assim: a. Um FC positivo significa que a evidência suporta a hipótese desde que MC > MD. b. Um FC = 1 significa que a evidência definitivamente prova a hipótese. c. Um FC = 0 significa uma de duas possibilidades: MC = MD = 0 as duas são zero, isto é, na realidade não existe evidência ou ela é irrelevante. MC = MD 0 as duas não são zero. A crença e descrença são igualmente fortes ou fracas. Assim a crença é cancelada pela descrença.

Fatores de Certeza d. Um FC negativo significa que a evidência favorece a negação da hipótese desde que MC < MD, ou existem mais razões para a descrença em uma hipótese do que para a crença nela: Exemplo: FC = 70% significa que a descrença é 70% maior que a crença. Deve-se observar que valores individuais diferentes levam ao mesmo FC: FC = 0,80 = 0,80 0,00 FC = 0,80 = 0,95 0,15

Fatores de Certeza Algumas características dos FC, MC e MD

Fatores de Certeza O FC permite ao especialista expressar uma crença sem comprometer um valor para a descrença: FC(H, E) + FC( ഥH, E) = 0 FC(H, E) + FC( ഥH, E) 1 A soma zero significa que se a evidencia suporta uma hipótese reduz o suporte para a negação da hipótese por uma quantidade igual. Se a evidencia confirma uma hipótese por algum valor FC(H, E), a confirmação da negação da hipótese não é 1 FC H, E.

Fatores de Certeza Exemplo: O aluno graduar-se-á se um A é obtido no curso: FC H, E = 0,65 e FC ഥH, E = 0,65 Há 65% de certeza que o aluno se graduará se obtiver um A no curso, e, Há 65% de certeza que o aluno não se graduará se obtiver um A no curso Dito em outros termos não acredito que o aluno não se graduará se obtiver um A no curso

Fatores de Certeza Suponha que x é A com FC = x 1 e a Base de conhecimento tem a regra R 1 Se x é A então y é B com FC = r 1 Quando o antecedente é composto por múltiplas premissas, como agregar o grau de certeza ao antecedente como um todo? Como definir a função para obter o grau de certeza da conclusão? Se múltiplas regras determinam a mesma conclusão com diferentes FC, qual a função que determina o grau de certeza final da conclusão?

Fatores de Certeza Regras para combinação dos antecedentes de expressões elementares

Fatores de Certeza Exemplo: Seja a Regra (E 1 e E 2 e E 3 ) ou (E 4 e E 5 ) então C O FC do antecedente será: máx(mín(e 1, E 2, E 3 ), mín(e 4, E 5 ))

Fatores de Certeza A fórmula fundamental para o FC de uma regra Se E então H esta dada por: Onde: FC H, e = FC H, E FC(E, e) FC E, e é o FC da evidencia E constituindo o antecedente da regra baseada na evidência incerta e. FC H, E é o FC da hipótese supondo que a evidência é conhecida com certeza, quando FC(E, e) = 1. FC H, e é o FC da hipótese baseada na incerteza da evidência e.

Fatores de Certeza Exemplo: Seja a regra A e B e C então D com FC = 0,7 FC H, E = FC D, A B C = 0,7 considerando todas as premissas com a mesma força FC E, e = 1, isto é, FC A, e = FC B, e = FC C, e = 1 Suponha que: FC A, e = 0,5; FC B, e = 0,6; FC C, e = 0,3 O FC E, e será: FC E, e = mín FC A, e, FC B, e, FC C, e = 0,3 E o FC da conclusão: FC H, e = FC H, E FC E, e = 0,7 0,3 = 0,21

Fatores de Certeza Função de combinação: Quando há outra regra que também conclui a mesma hipótese, mas com um diferente FC: FC combinação FC 1, FC 2 = FC 1 + FC 2 1 FC 1, se as duas são > 0 FC 1 + FC 2 1 mín FC 1, FC 2, se uma é < 0 FC 1 + FC 2 1 + FC 1, se as duas são < 0

Fatores de Certeza Exemplo: Sejam quatro regras que sugerem a conclusão C. R1 FC = 0,8, R2 FC = 0,3 R3 FC = 0,2, R4 FC = 0,7 FC combinação 0,8, (0,3) = 0,8 + 0,3 1 0,8 = 0,86 FC combinação 0,86, ( 0,2) = 0,86 0,2 1 mín 0,86, 0,2 = 0,825 FC combinação 0,825, (0,3) = 0,825 + 0,7 1 0,825 = 0,74 O FC da conclusão será: 0,74

Dificuldades com os Fatores de Certeza Um problema dos FC é que os valores poderiam ser opostos à probabilidade condicional. Suponha que: P(H 1 ) = 0,8 e P(H 1, E) = 0,9 P(H 2 ) = 0,2 e P H 2, E = 0,8 Calculando o FC para as duas hipóteses: MC H 1, E = MC H 2, E = máx 0,9, 0,8 0,8 1 0,8 máx 0,8, 0,2 0,2 1 0,2 = 0,5, então FC H 1, E = 0,50 = 0,75, então FC H 2, E = 0,75 Considerando que o propósito dos FC é posicionar hipóteses em termos de diagnósticos verossímeis, o baixo FC H 1, E seria uma contradição para a hipótese H 1 que tem uma alta probabilidade condicional P(H 1, E).

Dificuldades com os Fatores de Certeza Um outro problema dos FC é que, em geral: P H, e P H, h i P h i, e Onde h i é alguma hipótese intermediária baseada na evidência e. Mas, o FC de duas regras em uma cadeia de inferência é obtida como probabilidades independentes: FC H, e = FC H, h i FC h i, e * * A fórmula é verdadeira somente no caso especial que a população com propriedades H é contida na população com propriedades h i e que está contida na população com propriedades e.

Dificuldades com os Fatores de Certeza O sucesso do MYCIN, mesmo os problemas descritos, deve-se, talvez, às pequenas cadeias de inferências e a hipóteses simples. Se a solução do problema envolve cadeias de inferência longas ou hipóteses complexas (p.e. dependências), o uso de FC deve ser cuidadoso.

Teoria da Evidência ou Teoria de Dempster-Shafer

Teoria de Dempster-Shafer Dempster modelou a incerteza por uma faixa de probabilidade ao invés de um número probabilístico. Shafer estendeu o trabalho de Dempster e publicou em 1976 o livro: A Mathematical Theory of Evidence.

Teoria de Dempster-Shafer A teoria define um conjunto fixo de elementos mutuamente exclusivos e exaustivos, denominado meio e simbolizado por θ: θ = {θ 1, θ 2, θ 3,., θ n } Meio é um conjunto de objetos que são de interesse. Meio é um termo usado para se referir ao universo de discurso em teoria de conjuntos.

Teoria de Dempster-Shafer Se perguntas são feitas ao meio, as respostas serão subconjuntos de θ. Cada subconjunto de θ pode ser interpretado como uma possível resposta. Desde que os elementos de θ são exaustivos e exclusivos, somente pode existir um subconjunto com a resposta correta. Exemplo: Meios de transporte: θ = avião, helicóptero, barco, submarino, trem, ônibus Pergunta: Quais meios são de transporte terrestre? Resposta: θ 5, θ 6 = {trem, ônibus}

A função Mass Definida para os elementos de θ e todos seus subconjuntos (incluindo subconjuntos unitários). Representada por m é um valor que mede a quantidade de crença corretamente atribuída a um subconjunto de θ. Se θ contém 'n' elementos, então há 2 n subconjuntos de θ.

A função Mass A teoria da evidência não força crenças pelo desconhecimento de uma hipótese. A quantidade de crença é designada somente aos subconjuntos do meio aos quais deseja-se designar crença. Qualquer crença que não é designada a um subconjunto específico é considerada não crença ou semicrença e somente associada com o meio θ.

A função Mass: Exemplo Seja θ = A, B, C É feita uma pergunta ao meio e a resposta encontrase sobre os elementos A e B com crença de 0,7: m 1 {A, B} = 0,7 m 1 θ = 1 0,7 = 0,3 O restante da crença é designada ao meio e não como poderia se supor pela Teoria da Probabilidade: P {A, B} = 0,7 P {A, B} = 0,3

A função Mass: Exemplo É importante perceber que m 1 θ = 0,3 não designa nenhum valor aos demais subconjuntos de θ. Os subconjuntos de θ incluem: {A, B, C}, {A, C}, B, C, {A}, {B}, {C}.

A função Mass Tabela de Comparação entre a Teoria da Probabilidade e a Teoria de Demspter-Shafer Teoria de Dempster-Shafer m(θ) não tem que ser 1 Se X Y não necessariamente m(x) m(y) Não precisa de relações entre m(x) e m( X) Teoria da Probabilidade P i = 1 i P(X) P(Y) P X + P X = 1

Combinação de Evidências As evidências podem ser combinadas usando a Combinação de Regras de Dempster: m 1 m 2 = X Y=Z m 1 (X)m 2 (X) A soma estende-se sobre todos os elementos no quais a interseção X Y = Z. O operador denota soma ortogonal ou soma direta e é calculada pelo produto das interseções.

Combinação de Evidências: Exemplo Seja θ = {A, L, P, G}, o conjunto exaustivo e exclusivo de diagnósticos possíveis. Inicialmente não se tem nenhuma informação e define-se m θ = 1 Suponha que surgem evidências que {A, L} são os diagnósticos com crença de 0,6: m 1 {A, L} = 0,6 e m 1 {θ} = 0,4 Uma nova evidência sugere que a resposta encontra-se em {L} com 0,8 de crença m 2 {L} = 0,8 e m 2 {θ} = 0,2

Combinação de Evidências: Exemplo Tabela 1: Valores de m e os produtos das interseções Valores de m m 2 L = 0,8 m 2 θ = 0,2 m 1 A, L = 0,6 L = 0,48 A, L = 0,12 m 1 θ = 0,4 L = 0,32 θ = 0,08 m 1 m 2 L = 0,48 + 0,32 = 0,80 de crença para L. m 1 m 2 A, L = 0,12 de crença para A ou L. m 1 m 2 θ = 0,08 de não crença ou sem crença.

Normalização de Crenças Suponha-se que há uma nova evidência conflitante m 3 P = 0,95 e m 3 θ = 0,05 Tabela 2: Valores de m e os produtos das interseções Valores de m m 1 m 2 L = 0,8 m 1 m 2 A, L = 0,12 m 1 m 2 θ = 0,2 m 3 P = 0,95 ϕ = 0,76 ϕ = 0,114 P = 0,076 m 3 θ = 0,05 L = 0,04 A, L = 0,006 θ = 0,004 O conjunto nulo ϕ ocorre devido a que não há interseções entre P e L, nem entre P e A, L.

Normalização de Crenças Obtendo as crenças: m 1 m 2 m 3 P = 0,076 m 1 m 2 m 3 L = 0,04 m 1 m 2 m 3 A, L = 0,006 m 1 m 2 m 3 θ = 0,04 m 1 m 2 m 3 ϕ = 0 (Definição de conjunto nulo) A soma de todos os m 1 m 2 m 3 é << 1. A soma sobre todos os elementos foco deve ser 1, a solução é normalizar todos os elementos focais.

Normalização de Crenças Para normalizar divide-se por 1 k, e: k = X Y=φ m 1 (X)m 2 (X) A soma estende-se sobre todos os elementos no quais a interseção X Y = φ Para a Tabela 2: k = 0,76 + 0,114 1 k = 0,126

Normalização de Crenças Normalizando: m 1 m 2 m 3 P = 0,603 m 1 m 2 m 3 L = 0,317 m 1 m 2 m 3 A, L = 0,047 m 1 m 2 m 3 θ = 0,031 A evidência de P prejudicou a crença em L como era esperado.

Dificuldades com a Teoria da Evidência A normalização na Teoria de DempsterShafer pode levar a resultados opostos às expectativas. Um exemplo citado por Zadeh é sobre a crença de dois médicos A e B no diagnóstico da doença de um paciente: m A Doença 1 = 0,99 m A Doença 2 = 0,01 m B Doença 3 = 0,99 m B Doença 2 = 0,01

Dificuldades com a Teoria da Evidência Ambos médicos concordam que há pouca chance para a Doença 2: m = 0,01 e diferem grandemente no diagnóstico A acredita que é a Doença 1 e B acredita que é a Doença 3. Calculando com a Combinação de Regras de Dempster obtémse: m( Doença 2 ) = 1. Esse resultado é inesperado e contra a intuição, visto que ambos médicos estiveram de acordo que a Doença 2 era pouco provável.