Environment. Agent. Cap. 18, Russell: Aprendendo através de observações Performance standard. Critic. feedback. changes.

istemas de Api à Decisã Clínica, 09-10 1 Cap. 18, Russell: Aprendend através de bservações Perfrmance standard Critic Sensrs feedback learning gals Learning element changes knwledge Perfrmance element Envirnment Prblem generatr Agent Effectrs

istemas de Api à Decisã Clínica, 09-10 2 Aprendend através de bservações Prjet de um element de desempenh (perfrmance element) é influenciad pr 4 fatres: que cmpnentes devem ser melhrads. que representaçã é usada para s cmpnentes. que tip de retr-alimentaçã está dispnível. que infrmaçã anterir é cnhecida.

istemas de Api à Decisã Clínica, 09-10 3 Aprendend através de bservações Cmpnentes de um element de desempenh: mapeament diret de cndições d estad crrente para as ações. meis de inferir prpriedades relevantes d ambiente através das percepções. inf sbre mdificações n ambiente inf sbre s resultads de pssíveis ações. inf de utilidade inf sbre valres de ações (priridades) que indiquem interesse naquela determinada açã em determinad estad. Objetivs que descrevem classes de estads que maximizem a utilidade.

istemas de Api à Decisã Clínica, 09-10 4 Aprendend através de bservações Representaçã ds cmpnentes: pde ser feita utilizand qq esquema estudad. Retr-alimentaçã: aprendizagem supervisinada: entradas e saídas ds cmpnentes sã cnhecidas. Agente pde prever qual será a saída. reinfrcement: agente recebe algum avaliaçã de sua açã, mas nã cnhece a açã crreta. aprendizagem nã supervisinada: qd nã há nenhuma dica sbre as saídas. Cnheciment anterir (prëvi): necessári para melhrar aprendizagem.

istemas de Api à Decisã Clínica, 09-10 5 Aprendizagem Indutiva (Inductive Learning) Em aprendizagem supervisinada element de aprendizagem tem valr crret u aprximad da funçã das entradas. Mdifica a representaçã da funçã para que esta se trne análga à inf frnecida pr retr-alimentaçã. Exempl: par (x, f(x)), nde x é entrada é f(x) é saída. Inferência puramente indutiva (u simplesmente induçã): dad um cnj de exempls de f, retrna uma funçã h (hipótese) que aprxima f. Bias: preferência pr uma u utra hipótese.

istemas de Api à Decisã Clínica, 09-10 6 Aprendizagem Indutiva (Inductive Learning) (a) (b) (c) (d)

istemas de Api à Decisã Clínica, 09-10 7 glbal examples fg functin REFLEX-PERFORMANCE-ELEMENT( percept) returns an actin if ( percept, a) in examples then return a else h INDUCE(examples) return h( percept) prcedure REFLEX-LEARNING-ELEMENT(percept, actin) inputs: percept, feedback percept actin, feedback actin examples examples [ f( percept,actin)g

istemas de Api à Decisã Clínica, 09-10 8 Aprendizagem Indutiva (Inductive Learning) Algritm atualiza var glbal examples, lista de pares percepçã, açã. Percepçã pde ser uma situaçã n jg de xadrez. Açã: melhr jgada de acrd cm um grande mestre enxadrista. Se agente percebe uma situaçã q já tenha vist antes, executa a açã crrespndente. Cas cntrári, utiliza algritm de aprendizagem INDUCE sbre exempls que viu até entã. INDUCE retrna uma hipótese h q é usada para esclher uma açã.

istemas de Api à Decisã Clínica, 09-10 9 Aprendizagem Indutiva (Inductive Learning) Alternativa: aprendizagem incremental. Agente tenta atualizar a hipótese anterir sempre q um nv exempl aparece, sem precisar induzir sbre *tds* s exempls a cada nva previsã. Pde tb receber retr-alimentaçã sbre a qualidade das ações esclhidas. Frma em que hipóteses sã representadas: livre. Algritms de aprendizagem: mais uma vez, baseads em lógica! Duas abrdagens para aprender sentenças lógicas: árvres de decisã e versin-space (mais geral, mens eficiente). Prblema: representaçã da funçã utilizada para a aprendizagem. É representável na linguagem? É eficiente?

istemas de Api à Decisã Clínica, 09-10 10 Aprendizagem Indutiva (Inductive Learning) Lógica de primeira rdem: temp de cmputaçã e númer de exempls necessáris para aprender um bm cnjunt de sentenças. Bm cnj de sentenças: prevê crretamente experências futuras e reflete crretamente experiências passadas. Prblema filsófic: cm é que pdems saber se um algritm de aprendizagem está prduzind uma teria q prevê crretamente futur?

istemas de Api à Decisã Clínica, 09-10 11 Árvres de Decisã Simples e fácil de implementar. Recebe cm entrada um bjet u situaçã descrita pr um cnj de prpriedades e prduz uma respsta sim u nã. Representam funções bleanas. Exempl: esperar pr uma mesa num restaurante. Objetiv: aprender a definiçã d predicad VuEsperar.

istemas de Api à Decisã Clínica, 09-10 12 Árvres de Decisã Decidims (p eqt, pis ist pderia ser decidid pel algritm de aprendizagem) as prpriedades u atributs: Alternativ: algum restaurante alternativ pert? Bar: restaurante tem uma área de espera? Sex/Sab: V se fr sexta u sábad. CmFme: estams cm fme? Clientes: númer de pessas n restaurante (Nenhuma, Algumas, Chei). Preç: $, $$, $$$. Chvend: chvend? Reserva: tems reserva? Tip: Francês, Italian etc. EsperaEstimada: 0 10min, 10 30, 30 60, > 60.

istemas de Api à Decisã Clínica, 09-10 13 Patrns? Nne Sme Full N Yes WaitEstimate? >60 30 60 10 30 0 10 N Alternate? Hungry? Yes N Yes N Yes Reservatin? Fri/Sat? Yes Alternate? N Yes N Yes N Yes Bar? Yes N Yes Yes Raining? N Yes N Yes N Yes N Yes

istemas de Api à Decisã Clínica, 09-10 14 Árvres de Decisã Representaçã de uma árvre de decisã em lógica: s V uesperar(s) P 1 (s) P 2 (s)... P n (s) Em lógica pdems representar: r 2 Pert(r 2, r) Prec(r, p) Prec(r 2, p 2 ) menr(p 2, p) Árvres de decisã nã cnseguem representar testes sbre 2 u mais bjets diferentes. Limitações em representaçã. Qq funçã bleana pde ser representada cm uma árvre de decisã. N entant, representaçã em árvres de decisã deve ser + cmpacta, pq tabelas verdade têm cresciment expnencial.

istemas de Api à Decisã Clínica, 09-10 15 Árvres de Decisã Exempls: valres ds atributs + valr d predicad desejad. Classificaçã d exempl: valr d predicad. qd valr é verdadeir, exempl psitiv. Cas cntrári, é um exempl negativ. cnj cmplet de exempls: cnjunt de treinament.

istemas de Api à Decisã Clínica, 09-10 16 Example Attributes Gal Alt Bar Fri Hun Pat Price Rain Res Type Est WillWait X 1 Yes N N Yes Sme $$$ N Yes French 0 10 Yes X 2 Yes N N Yes Full $ N N Thai 30 60 N X 3 N Yes N N Sme $ N N Burger 0 10 Yes X 4 Yes N Yes Yes Full $ N N Thai 10 30 Yes X 5 Yes N Yes N Full $$$ N Yes French >60 N X 6 N Yes N Yes Sme $$ Yes Yes Italian 0 10 Yes X 7 N Yes N N Nne $ Yes N Burger 0 10 N X 8 N N N Yes Sme $$ Yes Yes Thai 0 10 Yes X 9 N Yes Yes N Full $ Yes N Burger >60 N X 10 Yes Yes Yes Yes Full $$$ N Yes Italian 10 30 N X 11 N N N N Nne $ N N Thai 0 10 N X 12 Yes Yes Yes Yes Full $ N N Burger 30 60 Yes

istemas de Api à Decisã Clínica, 09-10 17 Árvres de Decisã Cm induzir uma árvre de decisã através de exempls? Cada exempl pde ser um caminh diferente na árvre. limitaçã de representaçã, nã deixa extrair nenhum utr padrã de infrmaçã além daquele descrit pels exempls já cnhecids. Extrair um padrã significa descrever um grande númer de cass de frma cncisa. Princípi geral de aprendizagem indutiva: Ockham s razr. A hipótese mais prvável é a mais simples e cnsistente cm tdas as bservações. encntrar a menr árvre de decisã é um prblema intratável. heurísticas pdem ajudar.

istemas de Api à Decisã Clínica, 09-10 18 Árvres de Decisã idéia básica d algritm: testar s atributs mais imprtantes primeir. O que é um atribut mais imprtante? É aquele que influencia mais a classificaçã d exempl. Exempl: 12 cnjunts de treinament, separads em exempls psitivs e negativs. Clientes é um atribut imprtante: se valr igual a Nenhuma u Algumas, predicad sempre tem valr definid (Nã e Sim). Tip: atribut pbre. algritm esclhe atribut + frte e clca cm raiz da árvre.

istemas de Api à Decisã Clínica, 09-10 19 Árvres de Decisã Restam subcnjunts de exempls, algritm é aplicad recursivamente. 4 cass pssíveis: Se há alguns exempls psitivs e negativs, esclher melhr atribut. Se tds s exempls restantes sã psitivs (u tds negativs), pdems respnder diretamente Sim u Nã. Se nã há mais exempls, significa que nenhum exempl fi bservad para aquele caminh. Retrna valr default Sim u Nã dependend da mairia das classificações d pai. Se nã há mais atributs, mas tems exempls psitivs e negativs, significa que estes exempls têm exatamente a mesma descriçã, mas diferentes classificações. Sluçã simples: vt majritári.

istemas de Api à Decisã Clínica, 09-10 20

istemas de Api à Decisã Clínica, 09-10 21 (a) +: X1,X3,X4,X6,X8,X12 : X2,X5,X7,X9,X10,X11 Patrns? Nne Sme Full +: : X7,X11 +: X1,X3,X6,X8 : +: X4,X12 : X2,X5,X9,X10 (b) +: X1,X3,X4,X6,X8,X12 : X2,X5,X7,X9,X10,X11 Type? French Italian Thai Burger +: X1 : X5 +: X6 : X10 +: X4,X8 : X2,X11 +: X3,X12 : X7,X9 (c) +: X1,X3,X4,X6,X8,X12 : X2,X5,X7,X9,X10,X11 Patrns? Nne Sme Full +: : X7,X11 +: X1,X3,X6,X8 : +: X4,X12 : X2,X5,X9,X10 Yes N Hungry? Y N +: X4,X12 : X2,X10 +: : X5,X9

istemas de Api à Decisã Clínica, 09-10 22

istemas de Api à Decisã Clínica, 09-10 23 Patrns? Nne Sme Full N Yes Hungry? N Yes Type? N French Italian Thai Burger Yes N Fri/Sat? Yes N Yes N Yes

istemas de Api à Decisã Clínica, 09-10 24 Árvres de Decisã Observações: árvre induzida é diferente da árvre riginal, apesar d agente ter utilizad exempls gerads pr aquela árvre. algritm pde cncluir fats que nã estã muit evidentes ds exempls: sempre esperar pr um restaurante Tailandes, se fr um fim de semana. Pr causa destes fats: muit temp gast em depuraçã prcurand pr errs nã existentes! qt mais exempls, mas detalhada será a árvre de decisã. Figura 18.8 pde induzir errs já que nunca viu um cas nde temp de espera é 0-10mins, mas restaurante está chei. Questã: se algritm induz uma árvre cnsistente, mas incrreta, através ds exempls, quã incrreta é a árvre?

istemas de Api à Decisã Clínica, 09-10 25 Desempenh de um Algritm de Aprendizagem Um algritm de aprendizagem é bm se prduzir hipóteses que classificam bem exempls ainda nã vists. duas frmas de avaliar desempenh: após s fats, em avanç. Métd após s fats: verificaçã das previsões de acrd cm as classificações crretas num cnjunt de teste. 1. Esclher um cnjunt grande de exempls. 2. Dividir este cnj em cnj de treinament e cnj de teste. 3. Usar algritm cm cnj de treinament cm exempl para gerar a hipótese H. 4. Calcular a percentagem de exempls n cnj de teste que estejam crretamente classificads pr H. 5. Repetir passs 1 a 4 para tamanhs diferentes de cnjs de treinament e cnjs de treinament selecinads aleatriamente para cada tamanh.

istemas de Api à Decisã Clínica, 09-10 26 Resultad d métd: cnj de dads q pdem ser prcessads para prduzir a curva de aprendizagem.

istemas de Api à Decisã Clínica, 09-10 27 Desempenh de um Algritm de Aprendizagem 1 0.9 % crrect n test set 0.8 0.7 0.6 0.5 0.4 0 20 40 60 80 100 Training set size

istemas de Api à Decisã Clínica, 09-10 28 Utilizaçã Prática de Aprendizagem em Árvres de Decisã GASOIL, BP, sistema escrit a mã levaria 10 ans para ser cmpletad. Usand algritm basead de induçã de árvres de decisã, fi desenvlvid em 100 dias! Cnsiderad melhr d que um expert. Aprendend a var: C4.5 utilizad para extrair a árvre de decisã através de 90.000 exempls btids pr pilts experientes num simuladr. Árvre resultante cnvertida em C aprende e va melhr d que s instrutres.

istemas de Api à Decisã Clínica, 09-10 29 Teria da Infrmaçã Encntrar medidas frmais para classificar atributs cm bm u razável u pbre etc. Infrmaçã representada em númer de bits. Se I(p) = 1, precisams de 1 bit de inf. Se I(p) = 0, nã precisams de inf adicinal. Assuma q atribut tenha cm respstas pssíveis v i cm prbabilidade P(v i ). Infrmaçã ttal: I(P(v 1 ),...,P(v n )) = n i=1 P(v i)lg 2 P(v i ) Cdificaçã da inf cm tamanh ótim vai ter lg 2 p bits para atribut que tenha prb p. Cnsiderand exempls psitivs e negativs: I( p p+n, n p+n ) = p p+n lg 2 p p+n cntida em uma respsta crreta. p lg p+n 2 n, estimativa da inf p+n

istemas de Api à Decisã Clínica, 09-10 30 Ganh de infrmaçã: diferença entre a inf riginal e nv requisit. Ganh(A) = I( p p+n, n p+n ) Restante(A) Heurística usada pr CHOOSE-ATTRIBUTE esclhe atribut cm mair ganh. Ex: Ganh(Clientes) = 1 [ 2 12 I(0, 1)+ 4 12 I(1, 0)+ 6 12 I(2 6, 4 6 )] 0.541 bits.