Environment. Agent. Cap. 18, Russell: Aprendendo através de observações Performance standard. Critic. feedback. changes.

Documentos relacionados
Environment. Agent. Cap. 18: Aprendendo através de observações Performance standard. Critic. feedback. changes. Learning element. Performance element

Aprendizagem de Máquina. May 29, 2014

Aprendizagem de Máquina. April 28, 2016

Indução de Regras. Indução de Regras. Regra. Regra de Classificação. Complexo. Uma regra de classificação assume a forma restrita de uma regra

Aprendizagem a partir de observações

Aprendizado Simbólico: Regras

Cálculo do Valor Acrescentado (VA) no Aves

decisão em comparação com a curva para árvores de decisão.

Bias de AM. Bias e Variância Estatísticos

Organização de Computadores Digitais. Cap.10: Conjunto de Instruções: Modos de Endereçamento e Formatos

MATEMÁTICA APLICADA RESOLUÇÃO

COMPARAÇÃO DE CURVAS DE SOBREVIVÊNCIA

Métodos de reamostragem

Indução de Árvores de Decisão

Aprendizagem a partir de observações. Inteligência Artificial. Aprendizagem Indutiva Clássica. Aprendizagem Indutiva. Aprendizagem indutiva

LÓGICA FORMAL parte 2 QUANTIFICADORES, PREDICADOS E VALIDADE

TÉCNICAS NÃO-PARAMÉTRICAS

Aprendizagem a partir de observações. Capítulo 18 (Secções 1-3)

Os critérios de correcção são os seguintes:

2 Modelagem da previsão de atenuação por chuvas em enlaces GEO

Sugestões para Escrita de Artigos Científicos

Alinhamento de Seqüências Biológicas

Auditoria às Reclamações e Pedidos de Informação dos CTT Correios de Portugal, S.A. 2017

Árvore de Decisão. Capítulo 18 Russell & Norvig Seções 18.1 a 18.3

Sistemas de Tempo Real

Exame: Matemática Nº Questões: 58 Duração: 120 minutos Alternativas por questão: 4 Ano: 2009

Factsheet GS Momentum Builder Multi-Asset 5S ER Index

Caixas Ativas e Passivas. SKY 3000, SKY 2200, SKY 700, SKY 600 e NASH Áreas de Cobertura e Quantidade de Público

Pesquisa de Satisfação de Clientes HB SAÚDE Relatório de Auditoria e Parecer Técnico

Classificações ECTS. - Resultados da aplicação experimental às disciplinas do IST - Carla Patrocínio

5 Flutuação intrínseca chuveiro a chuveiro

CLASSIFICAÇÃO DE IMAGENS

AVALIAR O IMPACTO Transformar Promessas em Evidências Bénédicte de la Brière, Banco mundial

AL 1.1 Movimento num plano inclinado: variação da energia cinética e distância percorrida. Nome dos membros do grupo: Data de realização do trabalho:

A) O volume de cada bloco é igual à área da base multiplicada pela altura, isto é, 4 1

SIC Gerenciando Através s da Confiabilidade. Fabiana Pereira da Silva Vale

Como Z constitui-se claramente a hipotenusa de um triângulo retângulo, tem-se

Granalha De Aço Sablacier

Profs.: Eduardo Vargas Ferreira Walmes Marques Zeviani

TESTES DE SOFTWARE.

Aprendizado de Máquina Conceitos e Definições

a) No total são 10 meninas e cada uma delas tem 10 opções de garotos para formar um par. Logo, o número total de casais possíveis é = 100.

Relembrando: Simpsons

Eduardo Vargas Ferreira

Tópicos sobre JavaCC. Compiladores Cristina C. Vieira. Compiladores 2012/2013

Matemática E Extensivo V. 2

Nome dos membros do grupo: Data de realização do trabalho:

Novo processo de devolução de peças para garantia Mudanças na aplicação web ewarranty e no processo de devolução de peças

Variáveis e Tipo de Dados

Programa de Serviços Polycom Premier

Observadores de Estado

ALGORITMOS. Expressões e Instruções PrimiKvas. Alessandro J. de Souza DIATINF - IFRN. twi;er.

ANÁLISE SWOT PESSOAL Aproveitar ao Máximo os Seus Talentos e Oportunidades

DISSERTAÇÃO ou PROJECTO FINAL NORMAS PARA O SEU FUNCIONAMENTO

CIRCUITO SÉRIE/PARALELO Prof. Antonio Sergio-D.E.E-CEAR-UFPB.

Resultados 4º Trimestre de de Fevereiro de 2017

Processamento de imagem a cores

Conheça o Programa de Afiliados Ganhos Automáticos passo a passo.

III Olimpíada de Matemática do Grande ABC Primeira Fase Nível 3 (1ª ou 2ª Séries EM)

Estilos de Interação

A Arte de Escrever Artigos Científicos

MODELAGEM RELACIONAL

Redes Neurais (Conceitos Fundamentais)

XXXIII OLIMPÍADA BRASILEIRA DE MATEMÁTICA PRIMEIRA FASE NÍVEL 3 (Ensino Médio) GABARITO

APRENDER, GANHAR PONTOS E MEDALHAS

Cursinho Triu. Aula 2 - Cinemática. 1 o semestre de Pedro Simoni Pasquini

Descrição do serviço. Visão geral do serviço. Escopo dos serviços Copilot Optimize. Copilot Optimize CAA Escopo

Serviço Social

4 MÉTODO DE CONTROLE DE CUSTOS

CATÁLOGO DE APLICAÇÕES PEFIN SERASA

Execução detalhada de instruções

FACULDADE AGES CURSO DE ENFERMAGEM REGULAMENTAÇÃO DAS PRÁTICAS EDUCATIVAS ADMINISTRAÇÃO APLICADA A ENFERMAGEM

Conteúdo A parte principal de um relatório de auditoria, mas não a única, é a parte dos desvios encontrados. O que é que constitui um desvio?

ENFERMAGEM SAÚDE DA MULHER. Planejamento Familiar Parte 1. Profª. Lívia Bahia

Descoberta de Conhecimento em Bases de Dados e Mineração de Dados

Estudo do efeito de sistemas de forças concorrentes.

CÁLCULO I. Aula n o 02: Funções. Denir função e conhecer os seus elementos; Listar as principais funções e seus grácos.

Diagramas líquido-vapor

UML. Diagrama de Classes de Projeto e Diagrama de Objetos Análise e Projeto de Software. Profª. Cibele da Rosa Christ

Aprendizagem. Profa. Josiane M. Pinheiro Ferreira. Nov/2005

Inteligência Artificial

CÓDIGO DE CONDUTA E DE ÉTICA POLÍTICA SOBRE PRESENTES E ENTRETENIMENTO

SISTEMA GALGO FATURAMENTO CONSULTA AO DEMONSTRATIVO DE TRANSAÇÕES TARIFADAS PRODUTO PROCESSO GUIA DO USUÁRIO

Blackjack. Projeto de Programaça o Entrega Interme dia

CATÁLOGO DE APLICAÇÕES Geração de Guias para ST, DIFAL e FCP

Comunicado Cetip n 091/ de setembro de 2013

Rescisão Complementar

Inovações em Gestão de Dados de Imunização, Uso e Melhoria da Eficiência de Processo

CAPÍTULO - 6 CICLOCONVERSORES

ESPECIFICAÇÃO DO TEMPO DE SOBREVIVÊNCIA

CONTRATO PARTICULAR DE PRESTAÇÃO DE SERVIÇOS.

1 - Introdução. 2 - Desenvolvimento

SISTEMAS DIGITAIS LETI, LEE Ano lectivo de 20615/201 Trabalho 5 Circuitos Sequenciais Síncronos

Redes Neurais Artificiais ( Neural(

Gerenciamento de Valor Agregado

O Percurso de 5 anos do Subsistema para a Garantia da Qualidade das Unidades Curriculares (SubGQ_UC)

Aula 3 Expressões. 1. Introdução. 2. Operadores. Operador Tipo Operação Prioridade

PPGEP Comentários Iniciais CAPÍTULO 7 TESTE DE HIPÓTESE UFRGS. Testes de Hipótese

Transcrição:

istemas de Api à Decisã Clínica, 09-10 1 Cap. 18, Russell: Aprendend através de bservações Perfrmance standard Critic Sensrs feedback learning gals Learning element changes knwledge Perfrmance element Envirnment Prblem generatr Agent Effectrs

istemas de Api à Decisã Clínica, 09-10 2 Aprendend através de bservações Prjet de um element de desempenh (perfrmance element) é influenciad pr 4 fatres: que cmpnentes devem ser melhrads. que representaçã é usada para s cmpnentes. que tip de retr-alimentaçã está dispnível. que infrmaçã anterir é cnhecida.

istemas de Api à Decisã Clínica, 09-10 3 Aprendend através de bservações Cmpnentes de um element de desempenh: mapeament diret de cndições d estad crrente para as ações. meis de inferir prpriedades relevantes d ambiente através das percepções. inf sbre mdificações n ambiente inf sbre s resultads de pssíveis ações. inf de utilidade inf sbre valres de ações (priridades) que indiquem interesse naquela determinada açã em determinad estad. Objetivs que descrevem classes de estads que maximizem a utilidade.

istemas de Api à Decisã Clínica, 09-10 4 Aprendend através de bservações Representaçã ds cmpnentes: pde ser feita utilizand qq esquema estudad. Retr-alimentaçã: aprendizagem supervisinada: entradas e saídas ds cmpnentes sã cnhecidas. Agente pde prever qual será a saída. reinfrcement: agente recebe algum avaliaçã de sua açã, mas nã cnhece a açã crreta. aprendizagem nã supervisinada: qd nã há nenhuma dica sbre as saídas. Cnheciment anterir (prëvi): necessári para melhrar aprendizagem.

istemas de Api à Decisã Clínica, 09-10 5 Aprendizagem Indutiva (Inductive Learning) Em aprendizagem supervisinada element de aprendizagem tem valr crret u aprximad da funçã das entradas. Mdifica a representaçã da funçã para que esta se trne análga à inf frnecida pr retr-alimentaçã. Exempl: par (x, f(x)), nde x é entrada é f(x) é saída. Inferência puramente indutiva (u simplesmente induçã): dad um cnj de exempls de f, retrna uma funçã h (hipótese) que aprxima f. Bias: preferência pr uma u utra hipótese.

istemas de Api à Decisã Clínica, 09-10 6 Aprendizagem Indutiva (Inductive Learning) (a) (b) (c) (d)

istemas de Api à Decisã Clínica, 09-10 7 glbal examples fg functin REFLEX-PERFORMANCE-ELEMENT( percept) returns an actin if ( percept, a) in examples then return a else h INDUCE(examples) return h( percept) prcedure REFLEX-LEARNING-ELEMENT(percept, actin) inputs: percept, feedback percept actin, feedback actin examples examples [ f( percept,actin)g

istemas de Api à Decisã Clínica, 09-10 8 Aprendizagem Indutiva (Inductive Learning) Algritm atualiza var glbal examples, lista de pares percepçã, açã. Percepçã pde ser uma situaçã n jg de xadrez. Açã: melhr jgada de acrd cm um grande mestre enxadrista. Se agente percebe uma situaçã q já tenha vist antes, executa a açã crrespndente. Cas cntrári, utiliza algritm de aprendizagem INDUCE sbre exempls que viu até entã. INDUCE retrna uma hipótese h q é usada para esclher uma açã.

istemas de Api à Decisã Clínica, 09-10 9 Aprendizagem Indutiva (Inductive Learning) Alternativa: aprendizagem incremental. Agente tenta atualizar a hipótese anterir sempre q um nv exempl aparece, sem precisar induzir sbre *tds* s exempls a cada nva previsã. Pde tb receber retr-alimentaçã sbre a qualidade das ações esclhidas. Frma em que hipóteses sã representadas: livre. Algritms de aprendizagem: mais uma vez, baseads em lógica! Duas abrdagens para aprender sentenças lógicas: árvres de decisã e versin-space (mais geral, mens eficiente). Prblema: representaçã da funçã utilizada para a aprendizagem. É representável na linguagem? É eficiente?

istemas de Api à Decisã Clínica, 09-10 10 Aprendizagem Indutiva (Inductive Learning) Lógica de primeira rdem: temp de cmputaçã e númer de exempls necessáris para aprender um bm cnjunt de sentenças. Bm cnj de sentenças: prevê crretamente experências futuras e reflete crretamente experiências passadas. Prblema filsófic: cm é que pdems saber se um algritm de aprendizagem está prduzind uma teria q prevê crretamente futur?

istemas de Api à Decisã Clínica, 09-10 11 Árvres de Decisã Simples e fácil de implementar. Recebe cm entrada um bjet u situaçã descrita pr um cnj de prpriedades e prduz uma respsta sim u nã. Representam funções bleanas. Exempl: esperar pr uma mesa num restaurante. Objetiv: aprender a definiçã d predicad VuEsperar.

istemas de Api à Decisã Clínica, 09-10 12 Árvres de Decisã Decidims (p eqt, pis ist pderia ser decidid pel algritm de aprendizagem) as prpriedades u atributs: Alternativ: algum restaurante alternativ pert? Bar: restaurante tem uma área de espera? Sex/Sab: V se fr sexta u sábad. CmFme: estams cm fme? Clientes: númer de pessas n restaurante (Nenhuma, Algumas, Chei). Preç: $, $$, $$$. Chvend: chvend? Reserva: tems reserva? Tip: Francês, Italian etc. EsperaEstimada: 0 10min, 10 30, 30 60, > 60.

istemas de Api à Decisã Clínica, 09-10 13 Patrns? Nne Sme Full N Yes WaitEstimate? >60 30 60 10 30 0 10 N Alternate? Hungry? Yes N Yes N Yes Reservatin? Fri/Sat? Yes Alternate? N Yes N Yes N Yes Bar? Yes N Yes Yes Raining? N Yes N Yes N Yes N Yes

istemas de Api à Decisã Clínica, 09-10 14 Árvres de Decisã Representaçã de uma árvre de decisã em lógica: s V uesperar(s) P 1 (s) P 2 (s)... P n (s) Em lógica pdems representar: r 2 Pert(r 2, r) Prec(r, p) Prec(r 2, p 2 ) menr(p 2, p) Árvres de decisã nã cnseguem representar testes sbre 2 u mais bjets diferentes. Limitações em representaçã. Qq funçã bleana pde ser representada cm uma árvre de decisã. N entant, representaçã em árvres de decisã deve ser + cmpacta, pq tabelas verdade têm cresciment expnencial.

istemas de Api à Decisã Clínica, 09-10 15 Árvres de Decisã Exempls: valres ds atributs + valr d predicad desejad. Classificaçã d exempl: valr d predicad. qd valr é verdadeir, exempl psitiv. Cas cntrári, é um exempl negativ. cnj cmplet de exempls: cnjunt de treinament.

istemas de Api à Decisã Clínica, 09-10 16 Example Attributes Gal Alt Bar Fri Hun Pat Price Rain Res Type Est WillWait X 1 Yes N N Yes Sme $$$ N Yes French 0 10 Yes X 2 Yes N N Yes Full $ N N Thai 30 60 N X 3 N Yes N N Sme $ N N Burger 0 10 Yes X 4 Yes N Yes Yes Full $ N N Thai 10 30 Yes X 5 Yes N Yes N Full $$$ N Yes French >60 N X 6 N Yes N Yes Sme $$ Yes Yes Italian 0 10 Yes X 7 N Yes N N Nne $ Yes N Burger 0 10 N X 8 N N N Yes Sme $$ Yes Yes Thai 0 10 Yes X 9 N Yes Yes N Full $ Yes N Burger >60 N X 10 Yes Yes Yes Yes Full $$$ N Yes Italian 10 30 N X 11 N N N N Nne $ N N Thai 0 10 N X 12 Yes Yes Yes Yes Full $ N N Burger 30 60 Yes

istemas de Api à Decisã Clínica, 09-10 17 Árvres de Decisã Cm induzir uma árvre de decisã através de exempls? Cada exempl pde ser um caminh diferente na árvre. limitaçã de representaçã, nã deixa extrair nenhum utr padrã de infrmaçã além daquele descrit pels exempls já cnhecids. Extrair um padrã significa descrever um grande númer de cass de frma cncisa. Princípi geral de aprendizagem indutiva: Ockham s razr. A hipótese mais prvável é a mais simples e cnsistente cm tdas as bservações. encntrar a menr árvre de decisã é um prblema intratável. heurísticas pdem ajudar.

istemas de Api à Decisã Clínica, 09-10 18 Árvres de Decisã idéia básica d algritm: testar s atributs mais imprtantes primeir. O que é um atribut mais imprtante? É aquele que influencia mais a classificaçã d exempl. Exempl: 12 cnjunts de treinament, separads em exempls psitivs e negativs. Clientes é um atribut imprtante: se valr igual a Nenhuma u Algumas, predicad sempre tem valr definid (Nã e Sim). Tip: atribut pbre. algritm esclhe atribut + frte e clca cm raiz da árvre.

istemas de Api à Decisã Clínica, 09-10 19 Árvres de Decisã Restam subcnjunts de exempls, algritm é aplicad recursivamente. 4 cass pssíveis: Se há alguns exempls psitivs e negativs, esclher melhr atribut. Se tds s exempls restantes sã psitivs (u tds negativs), pdems respnder diretamente Sim u Nã. Se nã há mais exempls, significa que nenhum exempl fi bservad para aquele caminh. Retrna valr default Sim u Nã dependend da mairia das classificações d pai. Se nã há mais atributs, mas tems exempls psitivs e negativs, significa que estes exempls têm exatamente a mesma descriçã, mas diferentes classificações. Sluçã simples: vt majritári.

istemas de Api à Decisã Clínica, 09-10 20

istemas de Api à Decisã Clínica, 09-10 21 (a) +: X1,X3,X4,X6,X8,X12 : X2,X5,X7,X9,X10,X11 Patrns? Nne Sme Full +: : X7,X11 +: X1,X3,X6,X8 : +: X4,X12 : X2,X5,X9,X10 (b) +: X1,X3,X4,X6,X8,X12 : X2,X5,X7,X9,X10,X11 Type? French Italian Thai Burger +: X1 : X5 +: X6 : X10 +: X4,X8 : X2,X11 +: X3,X12 : X7,X9 (c) +: X1,X3,X4,X6,X8,X12 : X2,X5,X7,X9,X10,X11 Patrns? Nne Sme Full +: : X7,X11 +: X1,X3,X6,X8 : +: X4,X12 : X2,X5,X9,X10 Yes N Hungry? Y N +: X4,X12 : X2,X10 +: : X5,X9

istemas de Api à Decisã Clínica, 09-10 22

istemas de Api à Decisã Clínica, 09-10 23 Patrns? Nne Sme Full N Yes Hungry? N Yes Type? N French Italian Thai Burger Yes N Fri/Sat? Yes N Yes N Yes

istemas de Api à Decisã Clínica, 09-10 24 Árvres de Decisã Observações: árvre induzida é diferente da árvre riginal, apesar d agente ter utilizad exempls gerads pr aquela árvre. algritm pde cncluir fats que nã estã muit evidentes ds exempls: sempre esperar pr um restaurante Tailandes, se fr um fim de semana. Pr causa destes fats: muit temp gast em depuraçã prcurand pr errs nã existentes! qt mais exempls, mas detalhada será a árvre de decisã. Figura 18.8 pde induzir errs já que nunca viu um cas nde temp de espera é 0-10mins, mas restaurante está chei. Questã: se algritm induz uma árvre cnsistente, mas incrreta, através ds exempls, quã incrreta é a árvre?

istemas de Api à Decisã Clínica, 09-10 25 Desempenh de um Algritm de Aprendizagem Um algritm de aprendizagem é bm se prduzir hipóteses que classificam bem exempls ainda nã vists. duas frmas de avaliar desempenh: após s fats, em avanç. Métd após s fats: verificaçã das previsões de acrd cm as classificações crretas num cnjunt de teste. 1. Esclher um cnjunt grande de exempls. 2. Dividir este cnj em cnj de treinament e cnj de teste. 3. Usar algritm cm cnj de treinament cm exempl para gerar a hipótese H. 4. Calcular a percentagem de exempls n cnj de teste que estejam crretamente classificads pr H. 5. Repetir passs 1 a 4 para tamanhs diferentes de cnjs de treinament e cnjs de treinament selecinads aleatriamente para cada tamanh.

istemas de Api à Decisã Clínica, 09-10 26 Resultad d métd: cnj de dads q pdem ser prcessads para prduzir a curva de aprendizagem.

istemas de Api à Decisã Clínica, 09-10 27 Desempenh de um Algritm de Aprendizagem 1 0.9 % crrect n test set 0.8 0.7 0.6 0.5 0.4 0 20 40 60 80 100 Training set size

istemas de Api à Decisã Clínica, 09-10 28 Utilizaçã Prática de Aprendizagem em Árvres de Decisã GASOIL, BP, sistema escrit a mã levaria 10 ans para ser cmpletad. Usand algritm basead de induçã de árvres de decisã, fi desenvlvid em 100 dias! Cnsiderad melhr d que um expert. Aprendend a var: C4.5 utilizad para extrair a árvre de decisã através de 90.000 exempls btids pr pilts experientes num simuladr. Árvre resultante cnvertida em C aprende e va melhr d que s instrutres.

istemas de Api à Decisã Clínica, 09-10 29 Teria da Infrmaçã Encntrar medidas frmais para classificar atributs cm bm u razável u pbre etc. Infrmaçã representada em númer de bits. Se I(p) = 1, precisams de 1 bit de inf. Se I(p) = 0, nã precisams de inf adicinal. Assuma q atribut tenha cm respstas pssíveis v i cm prbabilidade P(v i ). Infrmaçã ttal: I(P(v 1 ),...,P(v n )) = n i=1 P(v i)lg 2 P(v i ) Cdificaçã da inf cm tamanh ótim vai ter lg 2 p bits para atribut que tenha prb p. Cnsiderand exempls psitivs e negativs: I( p p+n, n p+n ) = p p+n lg 2 p p+n cntida em uma respsta crreta. p lg p+n 2 n, estimativa da inf p+n

istemas de Api à Decisã Clínica, 09-10 30 Ganh de infrmaçã: diferença entre a inf riginal e nv requisit. Ganh(A) = I( p p+n, n p+n ) Restante(A) Heurística usada pr CHOOSE-ATTRIBUTE esclhe atribut cm mair ganh. Ex: Ganh(Clientes) = 1 [ 2 12 I(0, 1)+ 4 12 I(1, 0)+ 6 12 I(2 6, 4 6 )] 0.541 bits.