Algoritmos Indutores de Árvores de



Documentos relacionados
Algoritmos Indutores de Árvores de. Fabrício J. Barth

O Processo de KDD. Data Mining SUMÁRIO - AULA1. O processo de KDD. Interpretação e Avaliação. Seleção e Pré-processamento. Consolidação de dados

Data, Text and Web Mining

Fabrício J. Barth. Apontador

SISTEMAS INTELIGENTES

Web Data mining com R: aprendizagem de máquina

Universidade Estadual do Ceará Laboratório de Redes de Computadores e Segurança - LARCES

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas

Aprendizagem de Máquina

Lista de Exercícios Tratamento de Incerteza baseado em Probabilidade

Informações na era do Big Data

Prof. Msc. Paulo Muniz de Ávila

Sistemas de Apoio à Decisão Árvores de decisão V 1.2, V.Lobo, EN/ISEGI, 2010

Web Data Mining com R: design de projetos para criação de modelos preditivos

I.3 Indução de Árvores de Decisão

Avaliando o que foi Aprendido

MLP (Multi Layer Perceptron)

Hierarquia de modelos e Aprendizagem de Máquina

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Árvores de Decisão. David Menotti.

Aprendizado de Máquina

Classificação - avaliação de resultados - 1. Mineração de Dados 2013

Web Data Mining com R

Aprendizagem de Máquina

Aprendizagem de Máquina

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka

Aprendizagem de Máquina

Aprendizagem de Máquina

Algoritmos Construtivos. Prof. Júlio Cesar Nievola PPGIA PUCPR Especialização em Inteligência Computacional

Classificação: Definição. Classificação: conceitos básicos e árvores de decisão. Exemplos de Tarefas de Classificação

CAPÍTULO 3 - TIPOS DE DADOS E IDENTIFICADORES

INF 1771 Inteligência Artificial

Aprendizagem de Máquina

Inteligência Artificial

Aprendizagem de Máquina. Ivan Medeiros Monteiro

O que é a estatística?

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

3 Aprendizado de Máquina em Jogos Eletrônicos

Indução de Árvores de Decisão para a Inferência de Redes Gênicas

4 Estratégias para Implementação de Agentes

3 Estratégia para o enriquecimento de informações

Aprendizagem de Máquina

Inteligência Empresarial. BI Business Intelligence. Business Intelligence 22/2/2011. Prof. Luiz A. Nascimento

INF 1771 Inteligência Artificial

lnteligência Artificial Aprendizagem em IA

O que é a ciência de dados (data science). Discussão do conceito. Luís Borges Gouveia Universidade Fernando Pessoa Versão 1.

Introdução a Datamining (previsão e agrupamento)

Curso: Redes II (Heterogênea e Convergente) Tema da Aula: Características Roteamento

Data Mining Software Weka. Software Weka. Software Weka 30/10/2012

Árvore de Decisão. George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE

Esta aula foi compilada por alunos. Caso encontre erros, favor procurar no ou.

Introdução. Capítulo 1

Aprendizado em IA. Prof. Carlos H. C. Ribeiro ITA Divisão de Ciência da Computação

Projeto de Redes Neurais e MATLAB

Aula 05 Raciocínio Lógico p/ INSS - Técnico do Seguro Social - Com Videoaulas

3. REDES DE CAMADA ÚNICA

BANCO DE DADOS PROFESSOR MAURÍCIO - MAURICIO.MELLO@PUCPR.BR AULA 02. O Modelo Entidade-Relacionamento ( MER )

Árvores de Decisão. Índice

JAN FEV MAR ABR MAIO JUN JUL AGO SEP OCT NOV DEZ

Manual Do Usuário Processo Licitação

Gerência de Projetos. Aula 07. Prof. Gladimir Ceroni Catarino

Complemento II Noções Introdutória em Redes Neurais

Aula 2 RNA Arquiteturas e Treinamento

DESENVOLVIMENTO DE UM SOFTWARE NA LINGUAGEM R PARA CÁLCULO DE TAMANHOS DE AMOSTRAS NA ÁREA DE SAÚDE

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO

Desafios do setor de saúde suplementar no Brasil Maílson da Nóbrega

Inteligência Artificial

Aprendizagem indutiva

Iluminação com flashes portáteis para fotografia

Introdução a Datamining (previsão e agrupamento)

Árvores de Decisão. Sistemas Inteligentes

Inteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo]

Manual de utilização do sistema OTRS (Atendimento) Cliente Externo

Características do conhecimento científico

Banco de Dados. MER Estendido. Profa. Flávia Cristina Bernardini

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse

Aprendizado de classificadores das ementas da Jurisprudência do Tribunal Regional do Trabalho da 2ª. Região - SP

97% dos indivíduos com idade entre os 10 e os 15 anos utilizam computador, 93% acedem à Internet e 85% utilizam telemóvel

Universidade Federal do Vale do São Francisco - UNIVASF Colegiado de Engenharia de Computação CECOMP

Revisão de Estatística Básica:

Complemento III Noções Introdutórias em Lógica Nebulosa

3 Metodologia de Previsão de Padrões de Falha

Algoritmos Genéticos em Mineração de Dados. Descoberta de Conhecimento. Descoberta do Conhecimento em Bancos de Dados

Pesquisa de mercado Pesquisa de mercado

SCC Capítulo 9 Indução de Árvores de Decisão

Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados

Estrutura da Apresentação

Extração de Conhecimento & Mineração de Dados

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

COMO AS CRIANÇAS APRENDEM O QUE OS TEÓRICOS DIZEM ESTILOS DE APRENDIZAGEM

Diagrama de Classes. Um diagrama de classes descreve a visão estática do sistema em termos de classes e relacionamentos entre as classes.

PERGUNTAS MAIS FREQÜENTES SOBRE VALOR PRESENTE LÍQUIDO (VPL)

Aprendizagem de Máquina - 2. Prof. Júlio Cesar Nievola PPGIa - PUCPR

Aula 4 Pseudocódigo Tipos de Dados, Expressões e Variáveis

Paralelização do algoritmo SPRINT usando MyGrid

26/08/2013. Árvore. Árvore. Árvore. Floresta :: Exemplo. Floresta ÁRVORES

A Preparação dos Dados

Transcrição:

Algoritmos Indutores de Árvores de Decisão Fabrício J. Barth Sistemas Inteligentes Análise e Desenvolvimento de Sistemas Faculdades de Tecnologia Bandeirantes Abril de 2013

Problema: Diagnóstico para uso de lentes de contato 2

Diagnóstico para o uso de lentes de contato O setor de oftalmologia de um hospital da cidade de São Paulo possui, no seu banco de dados, um histórico de pacientes que procuraram o hospital queixando-se de problemas na visão. A conduta, em alguns casos, realizada pelo corpo cĺınico de oftalmologistas do hospital é indicar o uso de lentes ao paciente. Problema: Extrair do banco de dados do hospital uma hipótese que explica que paciente deve usar ou não lente de contatos. Problema: Diagnóstico para uso de lentes de contato Diagnóstico para o uso de lentes de contato 3

Atributos idade (jovem, adulto, idoso) miopia (míope, hipermétrope) astigmatismo (não, sim) taxa de lacrimejamento (reduzido, normal) lentes de contato (forte, fraca, nenhuma) Problema: Diagnóstico para uso de lentes de contato Atributos 4

Dados Idade Miopia Astigmat. Lacrimej. Lentes jovem míope não reduzido nenhuma jovem míope não normal fraca jovem míope sim reduzido nenhuma jovem míope sim normal forte jovem hiper não reduzido nenhuma jovem hiper não normal fraca jovem hiper sim reduzido nenhuma jovem hiper sim normal forte adulto míope não reduzido nenhuma Problema: Diagnóstico para uso de lentes de contato Dados 5

Idade Miopia Astigmat. Lacrimej. Lentes adulto míope não normal fraca adulto míope sim reduzido nenhuma adulto míope sim normal forte adulto hiper sim reduzido nenhuma adulto hiper não normal fraca adulto hiper sim reduzido nenhuma adulto hiper sim normal nenhuma Problema: Diagnóstico para uso de lentes de contato Dados 6

Idade Miopia Astigmat. Lacrimej. Lentes idoso míope não reduzido nenhuma idoso míope não normal nenhuma idoso míope sim reduzido nenhuma idoso míope sim normal forte idoso hiper não reduzido nenhuma idoso hiper não normal fraca idoso hiper sim reduzido nenhuma idoso hiper sim normal nenhuma Problema: Diagnóstico para uso de lentes de contato Dados 7

Exemplo de árvore de decisão Problema: Diagnóstico para uso de lentes de contato Exemplo de árvore de decisão 8

Aprendizado de Árvores de Decisão 9

Sumário e Objetivos Representação de Árvores de Decisão Algoritmo de Aprendizagem ID3 Entropia e Ganho de informação Bias Resumo Exercícios Aprendizado de Árvores de Decisão Sumário e Objetivos 10

Uma árvore de decisão para o problema de JogarTenis Aparencia sol nublado chuva Umidade quente suave Nao Sim Sim Ventando falso verdadeiro Sim Nao Aprendizado de Árvores de Decisão Uma árvore de decisão para o problema de JogarTenis 11

Características Representação de árvore de decisão: cada nodo interno testa um atributo; cada aresta correponde a um valor de atributo; cada nodo folha retorna uma classificação. Pode-se representar: conjunções e disjunções. Aprendizado de Árvores de Decisão Características 12

Características Em geral, árvores de decisão representam uma disjunção de conjunções de restrições sobre os valores dos atributos dos exemplos. Cada caminho entre a raiz da árvore e um folha correspondente a uma conjunção de testes de atributos e a própria árvore corresponde a uma disjunção destas conjunções. Aprendizado de Árvores de Decisão Características 13

Quando considerar Árvores de Decisão? Exemplos descritos por pares atributo/valor. Exemplos são descritos por um conjunto fixo de atributos(aparência) e seus valores(sol). A função alvo tem valores discretos de saída. Classificação booleana (sim ou não) ou mais de duas possibilidades para cada exemplo. Aprendizado de Árvores de Decisão Quando considerar Árvores de Decisão? 14

Hipóteses disjuntivas podem ser necessárias. Árvores de decisão representam naturalmente expressões disjuntivas. Dados de treinamento podem conter erros e valores de atributos faltantes. Aprendizado de Árvores de Decisão Quando considerar Árvores de Decisão? 15

Algoritmo ID3 O algoritmo ID3 cria uma árvore de uma maneira top-down começando com a seguinte pergunta: Qual atributo deve ser testado na raiz da árvore? Para responder esta questão, cada atributo do conjunto de treinamento é avaliado usando um teste estatístico para determinar quão bem o atributo (sozinho) classifica os exemplos de treinamento. Aprendizado de Árvores de Decisão Algoritmo ID3 16

Algoritmo ID3 Aprendizado de Árvores de Decisão Algoritmo ID3 17

Entrada: Conjunto de Exemplos E. Saída: Árvore de Decisão (Hipótese h). 1 Se todos os exemplos tem o mesmo resultado para a função sendo aprendida, retorna um nodo folha com este valor; 2 Cria um nodo de decisão N e escolhe o melhor atributo A para este nodo; 3 Para cada valor V possível para A: 3.1 cria uma aresta em N para o valor V ; 3.2 cria um subconjunto E V de exemplos onde A = V ; 3.3 liga a aresta com o nodo que retorna da aplicação do algoritmo considerando os exemplos E V. 4 Os passos 1, 2 e 3 são aplicados recursivamente para cada novo subconjunto de exemplos de treinamento. Aprendizado de Árvores de Decisão Algoritmo ID3 18

Qual o melhor atributo? Aprendizado de Árvores de Decisão Qual o melhor atributo? 19

Entropia - Teoria da Informação Caracteriza a impureza de uma coleção arbitrária de exemplos. Dado uma coleção S contendo exemplos e de algum conceito alvo, a entropia de S relativa a esta classificação booleana é Entropia(S) = p log 2 p p log 2 p (1) p é a proporção de exemplos positivos em S. p é a proporção de exemplos negativos em S. Aprendizado de Árvores de Decisão Entropia - Teoria da Informação 20

Exemplo Sendo S uma coleção de 14 exemplos de algum conceito booleano, incluindo 9 exemplos positivos e 5 negativos [9+,5-]. A entropia de S relativa a classificação booleana é Entropia(S) = 9 14 log 2 ( 9 14) 5 14 log 2 ( 5 14) = 0.940 (2) Aprendizado de Árvores de Decisão Exemplo 21

Entropia 1.0 Entropy(S) 0.5 0.0 0.5 1.0 p + Aprendizado de Árvores de Decisão Entropia 22

Entropia Generalizando para o caso de um atributo alvo aceitar c diferentes valores, a entropia de S relativa a esta classificação c classes é definida como: v Entropia(S) = p i log 2 p i (3) i=1 onde p i é a proporção de S pertencendo a classe i. Aprendizado de Árvores de Decisão Entropia 23

Ganho de Informação Ganho(S, A) = redução esperada na entropia devido a ordenação sobre A, ou seja, a redução esperada na entropia causada pela partição dos exemplos de acordo com estre atributo A. Ganho(S, A) = Entropia(S) Ganho(A) (4) S v Ganho(A) = S Entropia(S v) (5) v V alores(a) Aprendizado de Árvores de Decisão Ganho de Informação 24

Ganho de Informação - Exemplo Qual atributo tem o maior ganho de informação? Aprendizado de Árvores de Decisão Ganho de Informação - Exemplo 25

Atributo alvo: Jogar Tênis Aparência Temperatura Umidade Ventando Jogar sol quente elevada falso não sol quente elevada verdadeiro não nublado quente elevada falso sim chuva suave elevada falso sim chuva frio normal falso sim chuva frio normal verdadeiro não Aprendizado de Árvores de Decisão Atributo alvo: Jogar Tênis 26

Aparência Temperatura Umidade Ventando Jogar nublado frio normal verdadeiro sim sol suave elevada falso não sol frio normal falso sim chuva suave normal falso sim sol suave normal verdadeiro sim nublado suave elevada verdadeiro sim nublado quente normal falso sim chuva suave elevada verdadeiro não Aprendizado de Árvores de Decisão Atributo alvo: Jogar Tênis 27

Exemplo ilustrativo Ganho(S, Aparência) = 0.246 Ganho(S, Humidade) = 0.151 Ganho(S, Vento) = 0.048 Ganho(S, Temperatura) = 0.029 Aprendizado de Árvores de Decisão Exemplo ilustrativo 28

Graficamente: atributo aparência Aprendizado de Árvores de Decisão Graficamente: atributo aparência 29

Graficamente: atributo humidade Aprendizado de Árvores de Decisão Graficamente: atributo humidade 30

Graficamente: atributo ventando Aprendizado de Árvores de Decisão Graficamente: atributo ventando 31

Graficamente: atributo temperatura Aprendizado de Árvores de Decisão Graficamente: atributo temperatura 32

Árvore de decisão final Aparencia sol nublado chuva Umidade quente suave Nao Sim Sim Ventando falso verdadeiro Sim Nao Aprendizado de Árvores de Decisão Árvore de decisão final 33

Busca no espaço de hipóteses O método de aprendizagem ID3 pode ser caracterizado como um método de busca em um espaço de hipóteses, por uma hipótese que se ajusta aos exemplos de treinamento. O espaço de hipóteses do ID3 é o conjunto de árvores de decisão possíveis. O ID3 realiza uma busca (subida da montanha) através do espaço de hipóteses começando com uma árvore vazia e considerando progressivamente hipóteses mais elaboradas. Aprendizado de Árvores de Decisão Busca no espaço de hipóteses 34

Busca no espaço de hipóteses + + A1 + + + A2 + +...... + + A2 A3 + A2 + + A4...... Aprendizado de Árvores de Decisão Busca no espaço de hipóteses 35

Busca no espaço de hipóteses Espaço de hipóteses é completo (a função alvo está presente e é encontrada pelo algoritmo ID3). Fornece uma única hipótese (qual?) - não pode representar 20 hipóteses. Sem backtracking (recuo/volta atrás) - mínimo local. Escolhas de busca com base estatística - robustez a ruído nos dados. Aprendizado de Árvores de Decisão Busca no espaço de hipóteses 36

Bias Indutivo no ID3 Dada uma coleção de exemplos de treinamento, existem geralmente várias árvores de decisão consistentes com os exemplos. Qual árvore deve ser escolhida? Aprendizado de Árvores de Decisão Bias Indutivo no ID3 37

Bias Indutivo no ID3 A preferência é por árvore mais curtas e por aquelas com atributos de alto ganho de informação próximos da raiz. Bias: é uma preferência por algumas hipóteses ao invés de uma restrição do espaço de hipóteses H. Occam s razor prefere hipóteses mais curtas (mais simples) que se ajustam aos dados. Aprendizado de Árvores de Decisão Bias Indutivo no ID3 38

Resumo O bias indutivo impĺıcito do ID3 inclui uma preferência por árvores menores. A busca através do espaço de hipóteses expande a árvore somente o necessário para classificar os exemplos de treinamento disponíveis. Várias extensões do algoritmo básico ID3 (C4.5, J4.8,...). Aprendizagem de árvores de decisão fornece um método prático para a aprendizagem de conceito e para a aprendizagem de outras funções de valor discreto. Aprendizado de Árvores de Decisão Resumo 39

A família de algoritmos ID3 infere árvores de decisão expandindo-as a partir da raiz e descendo, selecionando o próximo melhor atributo para cada novo ramo de decisão. Aprendizado de Árvores de Decisão Resumo 40

Exercícios Forneça árvores de decisão para representar as seguintes funções booleanas: A B A (B C) A XOR B (A B) (C D) Aprendizado de Árvores de Decisão Exercícios 41

Considere o seguinte conjunto de treinamento: Exemplo Classificação a 1 a 2 1 + T T 2 + T T 3 - T F 4 + F F 5 - F T 6 - F T Aprendizado de Árvores de Decisão Exercícios 42

Qual é a entropia de todo o conjunto de treinamento com relação ao atributo objetivo: Classificação? Qual é o ganho de informação do atributo a 2 relativo ao conjunto de exemplos? Aprendizado de Árvores de Decisão Exercícios 43

Árvores de decisão e R http://rpubs.com/fbarth/5533 Aprendizado de Árvores de Decisão Árvores de decisão e R 44

Material de consulta Tom Mitchell. Machine Learning, 1997. (Capítulo 3) Russel e Norvig. Inteligência Artificial, 2a. edição, capítulo 18. Ferramentas: RapidMiner e Weka. Weka no R: http://cran.rproject.org/web/packages/rweka/rweka.pdf. Yanchang Zhao. R and Data Mining: Examples and Case Studies. (Capítulo 4): http://cran.rproject.org/doc/contrib/zhao R and data mining.pdf Aprendizado de Árvores de Decisão Material de consulta 45