INTELIGÊNCIA ARTIFICIAL Raciocínio Incerto!"#$ $ % & $ '()* +, -.. /0*1!"#2 -.. $!%!"#"
Raciocínio Incerto!&"'!(#"!")#"*#"#'")+!),*- 3-4- '5516 7-1' 48, - '1 9() - 1. '9': ' ;- '*1'1) Raciocínio Incerto 0* 8< 3- & (18/= >2?= >:(?'* : 8'8''* 4-!. (.. (( 8!@((.""/ $"!0"" ' '*:(9(8'
Aproximação Frequencista RACIOCÍNIO INCERTO -../0*1!"# - Teorema de Bayes É uma teoria estatística condicionais da evidência baseada na noção de probabilidades Teorema de Bayes: P(Hi E) = P(E Hi) * P(Hi) Σ k P(E H n )*P(H n ) n=1 Simplificável Aproximação Frequencista O Teorema(ou Regra ou Lei) de Bayes relaciona a probabilidade condicional de um evento com a ocorrência conjunta de vários eventos p(h E) = p(h E) * p(e) p(e H) = p(e H) * p(h) de onde se deriva a fórmula de Bayes relacionando probabilidades condicionais e que na sua forma mais simples se pode escrevêr: p(h E) =( p(e H) * p(h) ) / p(e) O teorema de Bayes é uma teoria estatística da evidência baseada na noção das probabilidades condicionais
Aproximação Frequencista? (...:? 0,? A ( BB; BBC A( BB3 BDE /2FB3 /= 2FB33 /2FBBG/ 2FBB; 8HI, /J2F/ 2K/2FBB;KBBGFBD & ((/2*1-(4 1..: Aproximação Frequencista!'HI )/..L2 M.N p(h E) =( p(e H) * p(h) ) / p(e) M.595....'8 0, 9' *'/GBO 2 /J2FB5G./'2 /2F3KGBBBB./*'2 /2F3K4B &)!1!2&"341!' /J2F/J2P/2K/2 FB5BBB4/3GBBB2 /J2/J21(L.L )&)2&2<)91<. ) & 1N % ('59.L 1./J2 & 9'HI./2
Aproximação Frequencista O Problema da dependência das proposições leva à necessidade das Probabilidades condicionais Seja o problema seguinte de diagnóstico: P: Paciente tem pintas S: Paciente tem sarampo F: Paciente tem febre Pintas sarampo febre Teriamos de usar prob. Condicionais Não há independência Precisamos da probabilidade condicional: P(H E 1,E 2 ) = P(H E 2 ) * P(E2 E1,H) P(E1) * P(E2) O número de probabilidades a calcular aumenta muito com o número das preposições (O(2 n )) o que torna o uso de teorema intratável. Aproximação Frequencista Independência dois acontecimentos H e E são independentes se: p(h E) = p(h) se C = A B Dependência implica: Aplicação da fórmula de Bayes p(c) = p(a B) = p(a) *p(b) H: paciente tem cancro no pulmão E: paciente fuma queremos p(h E) = p(cancro fuma)
Aproximação Frequencista dado p(h) p(e) p(e H) probabilidade de cancro do pulmão na população probabilidade de se ser fumador p(fumador cancro) isto é, conhece-se de todas as pessoas diagnosticadas com cancro quantas eram fumadoras, então se for dada evidência que um paciente fuma, a probabilidade de ter cancro modifica-se de p(h) para Aproximação Frequencista Limitações da aproximação probabilistica: As probabilidades tem um duplo efeito, isto é: se E suporta parcialmente H então também deve suportar negativamente a negação da hipótese ~ H pois p(h E) + p(~ H E) = 1 Mas os humanos, em contraste, tendem a classificar evidência para suportar ou outras para refutar hipóteses. Problema da assumpção da independência dos factos (leva a incorrecções) C = A B p(c) = p(a) * p(b) D = C A p(d) = p 2 (A) * p(b) o que é incorrecto pois C e A já não são independentes p(d) = p(c A) = p(a) * p(c A) p(c A) = p(a) * p(b) p(d) = p(c) - Assumindo Independência resulta probabilidade inferior
Outros Métodos Três Mecanismos modificam esta teoria para a tornar tratável: a) Modelo dos Factores de Certeza b) Rede de Bayes c) Teoria de Dempster-Shaffer a) Modelo dos Factores de Certeza As regras (na Representação do Conhecimento) tem Factores de Certeza associados FC [h e] = MB [h,e] - MD [h,e] Os Factores de Certeza podem ser combinados uma vez que: i) várias regras suportam separadamente uma mesma hipótese ii) várias evidências conjuntas suportam uma hipótese iii) o resultado de uma regra é a entrada em outra Modelo dos Factores de Certeza & $ +Q$ +$ >! $ + R!? (1# ' 3# 5"6. *:%!'7!#"? S ()9 >9(90( 1:() -3FT FT3 >9*1"$!%# 0,'8*:
Modelo dos Factores de Certeza 0,U!'8*: # $ :' 01 :V$ V W. % ()'89: ( & *& HX% 5Y(*1.*() B<& HT3 & *& +X% 5Y (), & HZB --Z& +FB & +ZB --Z& HFB & HFB& +FB ; <=> *; <= ; <=? %#!#@@ Modelo dos Factores de Certeza $ & > H5 & [ $ & 6,? 'H1 +'8?!()18'?!'1' W& > 9( L)HI & >
Modelo dos Factores de Certeza!8(1(', -!*6. *1((( /()2 -!*1 ()( & H - (( '(* Modelo dos Factores de Certeza TRÊS FORMAS DE COMBINAÇÃO DE FACTORES DE CERTEZA: A C 1) Mais que uma regra levam à mesma conclusão B A B 2) Crença numa colecção de fórmulas em conjunto A B C 3) Encadeamento de Regras
Modelo dos Factores de Certeza 1) Combinação de Evidências SE MD[h,e1&e2] >0 MB[h,e1&e2] =0 SENÃO MB[h,e1&e2] = MB[h,e1] + MB[h,e2] * (1-MB(h,e1)) Similar para MD 2) Combinação de Hipóteses MB[h1 h2, e] = min (MB[h1,e], MB[h2,e]) MB[h1 h2, e] = max (MB[h1,e], MB[h2,e]) 3) Incerteza na evidência suportando a hipótese MB[h,s] = MB [h,s] * max(0, FC[s,e]) onde MB [h,s] é a crença em h no caso de s ser certo Modelo dos Factores de Certeza #"@ 0. (*1B7 1, & HX53YFB7 & +X53YFB>X53YFB7 (() 4B4 1, & HX54YFB4 & +X54YFB & HX53Λ 4YFB7\B4P/3-B72FB;; & +X53Λ 4YFB Q',>X53Λ 4YFB;;
Modelo dos Factores de Certeza :'A $ :() /9'2 /3 4 12 & HX3Λ 45YF/& HX35Y5& HX45Y2 & HX3= 45YF0/& HX35Y5& HX45Y2 & +9' Modelo dos Factores de Certeza B $ '1 ) ' (/(. (*66 '2 & H]*. (*1 = 51, & HX5YF& H]X5YP0/B5& HX5Y2 ()" =)0'
Modelo dos Factores de Certeza Exemplo: (do Sistema Mycin. Os factores de certeza estão instanciados para um caso) SE tipo_organismo GRAM POSITIVO (0.9) E morfologia ROD (0.8) E aerobicidade AEROBICO (0.7) OU aerobicidade DESCONHECIDA (0.3) ENTÃO há evidência sugestiva (0.6) de ENTEROBACTERACEAE FC[h, e1 e2 ( e3 e4) ] = 0.6 * max(0, FC [e1 e2 ( e3 e4) ] ) = 0.6 * max((0, MB [e1 e2 ( e3 e4) ] -MD[...])) MB [e1 e2 ( e3 e4) ] = min( MB[e1], MB[e2], max( MB[e3], MB[e4] ) ) FC[Enterobacteraceae, [e1 e2 ( e3 e4)] ] = 0.6 * max(0, min(0.9, 0.8, max(0.7, 0.3) ) ) = 0.6 * 0.7 = 0.42 Modelo dos Factores de Certeza +, Ex: Suponhamos considerar 3 ' R1:SE organismo gram positivo ENTÃO stafilococus (0.6) R2:SE morfologia do organismo é cocus ENTÃO stafilococus (0.6) R3:SE conformação de crescimento do organismo é "borrão" ENTÃO stafilococus (0.6) Na realidade, esta situação seria compatível com um FC combinado de 0.6 por haver bastante sobreposição das condições aplicando as fórmulas de 1) MB [h,s S 1 2 ] = 0.6 + (0.6 * 0.4) = 0.84 MB [h, (S 1 S 2 ) S3] = 0.84 + (0.6 * 0.16) = 0.936 -./BC2 Q'M'7
Modelo dos Factores de Certeza EXEMPLO DE INFERÊNCIA E PROPAGAÇÃO DOS FACTORES DE CERTEZA: R1: P1 -->C1 (0.7) 3575;5G (/()2 R2: C1 P2 P3 -->C2 (0.9) R3: P4 --> P2 (0.4) R4: P1 P5 --> C1 (0.6) De R1 e R4, e porque P1, P5 são factos, conclui-se C1 MB[C1] = 0.7 + (1-0.7) * 0.6 = 0.88 De R3 e porque P4 é verdadeiro concluímos P2 com 0.4 R2 pode concluir C2 com FC=? MB[C2, C1 P2 P3] = MB [C2, C1 P2 P3] * max(0, FC[(C1 P2 P3), Ea] MB = 0.9 * max(0, min(0.88, 0.4, 1.0) = 0.36 --> FC =0.36 Modelo dos Factores de Certeza = *1!'&'7!#.(*672 Exemplo : Proposições: I: o irrigador funcionou na noite passada H: a relva está húmida C: choveu a noite passada Possíveis regras: R1: SE o irrigador funcionou a noite passada ENTÃO a relva está húmida esta manhã (0.9) outra R2: SE a relva está húmida esta manhã ENTÃO choveu a noite passada (0.8) pode concluir-se primeiro "relva húmida" com FC=0,9 MB [H I] = 0.9 e depois, conclui-se que "choveu a noite passada" MB [C H] = 0.9 * 0.8 = 0.72 Incorrecto!
Modelo dos Factores de Certeza )&##' 0*6 '5'"#"'(#.. / )).'*, Se considerarmos C=A B (acontecimentos conjuntos): FC Prob considerando independência conf (C) = conf (A) conf (B) conf(c) = min conf (A) * conf (B) 0 0 0 0 0.1 0.9 0.1 0.09 0.25 1 0.25 0.25 0.25 0.25 0.25 0.06 0.5 1 0.5 0.5 0.5 0.5 0.5 0.25 0.75 1 0.75 0.75 0.75 0.75 0.75 0.56 FC assemelha-se à aproximação probabilística considerando não a independência : mas dependencia p(c)=p( A B) = p(a B)*p(B) p(b) = p(b A) * p(a) p(a) Q'5(-, p( A B) min{p(b), p(a)} (FC é = min) mas superior ou igual à probabilidade considerando a independência Método das Redes Bayesianas *C ( 'de acontecimentos que interagem. Uma /1HI2consideramos no exemplo anterior é: irrigador chuva R1 húmida R2
Método das Redes Bayesianas?!HI "&##) ),?S U '/U!+28*6?:, ^._ - '_- (_% - (% M, P(N)=0.5 N P(I) N T 0.10 I F 0.50 C N P(C) T 0.80 F 0.20 I C P(H) T T 0.99 T F 0.90 F T 0.90 F F 0.00 H U & - Estamos a considerar que I e C são causas independentes para H Método das Redes Bayesianas? U )5!#'" 1* ((/825? S '(595! D% (9:*1, 51!)' 1&#) /@'`2 ((/2!09$ /2 P(N)=0.5 N P(I+C) TT TF FT FF N Mega-Nodo T 0.08 0.02 0.72 0.18 F 0.10 0.40 0.10 0.40 I + C H I+C TT TF FT FF P(H) 0.99 0.90 0.90 0.00
Método das Redes Bayesianas ) 1*1:19M 0+% "#36E "#36!!1#' +%# +F)!'# 50/J 2FB V''V0WV(V % 1 81' & *% S 0G)5#"'*#." Teoria de Dempster-Schaffer!#' )&" +#00 (;3#<5#"!!5!'#'=;* 5<5=. :*6, 3#H (B/()23/2 5#"!!5!'#' F3-H/ A 2B3 *5!'!#1#'0!#3# )")#&&"!36 # 5#"!!5!'#'@* 5H!'!#%#5)DI!)# &'+1# # 5#0!#3#9
Teoria de Dempster-Schaffer!#' )&" +#00 '-, (# 1J!# (..*1 -..()0 *1 :'%)"6"&#&)#!"%!'7!#" Teoria de Dempster-Schaffer I)&5'D55'"!1!0!#''5#"!!5!'#'-, *1:)7 G < *K a /27G! 34 1 H 3 1 ;G + G C ( C 1 H/2F3KG /2 F3-7KG F4KG 9.. 0(*
Teoria de Dempster-Schaffer Vamos supor 8 mutuamente exclusivas para ( '!#1G"!$Θ Θ = {A, G, C, P} A: alergia G: gripe C: constipação P: pneumonia %!'7!# 1 :Θ.:Θ. Por exemplo Febre suporta {G, C, P}.(**XB53Y 1*6 6 (.LB77{G, C, P} Teoria de Dempster-Schaffer Consideremos a função densidade de probabilidade m para Θ e todos os seus sub-conjuntos. m(p) mede a "quantidade" de crença atribuída ao sub-conjunto p. A soma de todos os ms não deve exceder 1. No nosso exemplo suponhamos que não temos inicialmente informação então: {Θ} tem m =1 isto é, não se distinguem os elementos do conjunto. Conhecemos agora a evidência Febre que aponta para o sub-conjunto {G, C, P} com 0.6 então {Θ} fica com m=0.4 (notar que 0.4 não está atribuído ao complementar do 1º sub-conjuntp)
Teoria de Dempster-Schaffer Sejam dadas duas funções de crença m1 e m2 Seja X o conjunto de todos os sub-conjuntos de Θ tais que a crença m1, é não zero Seja Y o conjunto correspondente para m2 m3 combina as crenças m1 e m2 como segue: Usando o exemplo: Vamos supor primeiro que todas as intersecções de elementos de Xe Y são não vazias. m1 crença depois de observar febre. {G, C, P} 0.6 Θ 0.4 m2 crença depois de observar "pingo no nariz" {A, G, C} 0.8 Θ 0.2 Teoria de Dempster-Schaffer *1 7.*19:., m1 m2 {A, G, C} 0.8 Θ 0.2 {G, C, P} 0.6 {G, C} 0.48 {G, C, P} 0.12 Θ 0.4 {A, G, C} 0.32 Θ 0.08 m3
Teoria de Dempster-Schaffer ) B.* (: m 4 {A} 0.9 Θ 0.1 8(, m4 {A} 0.9 Θ m3 0.1 {G, C} 0.48 ø 0.432 {G, C} 0.048 {A, G, C} 0.32 {G, C, P} 0.12 Θ 0.08 {A} 0.288 ø 0.108 {A} 0.072 {A, G, C} 0.032 {G, C, P} 0.012 Θ 0.008 ø tem uma crença de 0.54. 8B;C8( 1-(3-BG;FB;C Então)5, {G, C} = 0.048 / 0.46 {A, G, C} = (0.032) / 0.46 {G, C, P} = 0.12 / 0.46 {A} = (0.072+0.288) / 0.46=0.78 Θ = 0.072 / 0.46 Teoria de Dempster-Schaffer (, :47(()(L8% 3 ', m 1 (E2) {H1} = 0.8 m 1 (E2) {θ} = 0.2 m 2 (E3) {H1} = 0.4 m 2 (E3) {θ} = 0.6 combinando: (m 1 (E2) + m 2 (E3)) {H1} m 2 (E3) {H1}=0.4 {θ}=0.6 {H1}=0.8 {H1}=0.32 {H1}=0.48 m 1 (E2) {θ}=0.2 {H1}=0.08 {θ}=0.12 (m 1 (E2) + m 2 (E3)) {H1} = 0.32+0.08+0.48 =0.88 (m 1 (E2) + m 2 (E3) ) {θ} =0.12 S >, >/% 32F& H-& +F& H/% 32FBD\B;P/3-BD2FBD\B;PB4F89:: '5'"L)#""&!#5'#!#' )&" +#00
Teoria de Dempster-Schaffer :'4% 3 7 /9A% 32 ': m 1 (E2) {H1} = 0.8 m 1 (E2) {θ} = 0.2 m 3 (E3) {~H1} = 0.5 m 3 (E3) {θ} = 0.5 m 1 (E2) + m 3 (E3) m 3 (E3) {~H1}=0.5 {θ}=0.5 {H1}=0.8 {φ}=0.40 {H1}=0.40 m 1 (E2) {θ}=0.2 {~H1}=0.10 {θ}=0.10 m 1 (E2) + m 3 (E3) ({H1}) = 0.4/(1-0.4)= 0.66 m 1 (E2) + m 3 (E3) ({~H1}) = 0.1/(1-0.4)= 0.17 m 1 (E2) + m 3 (E3) (θ}) =0.1/0.6=0.17 3 /42 *b% 3c((XBD53Y + 7 /72 *b% 3c-,X5YFXBCC5BD7Y Teoria de Dempster-Schaffer!# ' )&" +#0,.. 1 9. 1 0 () :N 1 ( (# 1J!# 5 1
Lógica dos Conjuntos Difusos *M KN O??CK O QR /3ECG- >I2!0*1Q8'H :5.90 *1Q8'+ :/('2 :.::9 : bb53c5 -PQ8<@R Lógica dos Conjuntos Difusos *M KN O??CK O :59: d 5[ d 9[ 9 :bb53c!*1e#e (( (9 d 5[ (, /[ F3*19(2 [ FB*19
Lógica dos Conjuntos Difusos PRINCÍPIOS BÁSICOS DA LÓGICA DIFUSA (FUZZY LOGIC) Lógica de Boole Lógica dos Conjºs Difusos.-:/2.-:+ C S C F {0,1} [0,1] S : C {0,1} O mapeamento é representado por Sub-conjunto F de Cé definido um conjunto de pares ordenados X,Y como o conjunto de pares ordenados em que X C e Y {0,1} únicos X,Y em que X C e Y [0,1] Lógica dos Conjuntos Difusos +'.:('>: :Md 5[ d 9 [ (XB53Y$ ( B 1*d >3*d >$ (9U!S + "!d >$ :9(:('>$ 9 >S "# $ + "!:>!*1e# >e ( ([ d 5[ d F[ (XB53Y R L((' K ( =.: +>F!Q $ (9'*1*,
Lógica dos Conjuntos Difusos alto (X) = 0, altura(x)-1,65m/0,2 1, se altura(x) < 1,65m se 1,65m <= altura(x) <= 1,85m se altura(x) > 1,85m O gráfico desta função é: 1.0 0.5 0.0 1,65 1,75 1,85 altura (cm) Lógica dos Conjuntos Difusos *1'0, ""# #5# 1#'#5 35GB BBB 35fB B4G 35DB BfG >* 35EB 3BB!01e9 e 9 '(BfG +*6* 1 g!q $ ]&!J15" & (5.95*1*1 8 905!Q $ (.959 1V*1V/>I2
Lógica dos Conjuntos Difusos S"KG1!#"!'. Q8'+*1 d 9!Q $ 5(*1, d9h! d$ [9!Q $ $ S/ #$ R9& + $ 2!*6Q8'+ 1, =/ #$ d2 F3B- =/d2 = /d [ 2 F/= /d 25= /[ 22 = /d $ S [ 2 F0/= /d 25= /[ 22 (3B 8. (Q8'H 1.:+Q8'+ 1(1#5!(#36 : Q8'H.:/21.:+1 9 Lógica dos Conjuntos Difusos I)&5- *1!Q $ *1 +$ $ 9,!'"T F B //d 2-3D2K;4 /d 2T3D 3DTF/d 2TFCB 3 /d 2ZCB :, Fd9!Q $ d9 +$ $.Fd9!Q $ d9 +$ $ F d9!q $ 1'(, #5!'TLK TL # 35GB CG BBB 3BB BBB3BB3BB 35fB 7B B4G B4D B4GB4DBfG 35DB ;G BfG BC; BC;BfGB4G 35EB ;G 3BB BC; BC;3BBBBB 35GB 3G BBB BBB BBBBBB3BB
Lógica dos Conjuntos Difusos Febre Valor Característico FC Normal 36.5 1 Alta 39 0.9 Muito Alta 40.2 1 1.0 0.9 0.8 0.7 1 2 3 1 Febre Normal 2 Febre Alta 3 Febre Muito Alta R1 SE febre = muito alta E ENTÃO C1 36.5 39 40 40.2 R2 SE febre=alta E ENTÃO C2 Facto: febre=40º Lógica dos Conjuntos Difusos #!4!!0" U "0"!0!#36/- :'34 H.h& 8( 34 @, 3F4F' # $ A, 3F4F # $, 3FG 4F7B >S "i + "!(+W, 0.9 afastado ' 0.6 0.2 5 cm 30 cm
Lógica dos Conjuntos Difusos Raciocínio Difuso: desfuzificação $, '3 BC /BC5BE2 '4 B4 /BE5B42 esquerda muito esquerda 0.6 X X centróide 0.2 Rodar esquerda 45 o 63 o 90 o Método do Centróide: Divide-se a área limitada pelos factores de pertença em áreas elementares (triângulos e rectângulos). Calculam-se (Xi,Yi) dos respectivos centróides. (Xc,Yc) do centróide será calculado por: Xc=(Σxi*Ai / Atotal) e Yc=(Σyi*Ai/Atotal) em que Atotal = Σ Ai Outro método simplificado de Desfusificação : 0.2*45º + 0.6*90º = 9º + 54º = 63º