Aprendizado de Máquina
|
|
|
- Octavio Dinis Fontes
- 8 Há anos
- Visualizações:
Transcrição
1 Aprendizado de Máquina Sistemas de Informação Inteligente Prof. Leandro C. Fernandes Adaptação dos materiais de: Thiago A. S. Pardo, Daniel Honorato e Bianca Zadrozny
2 APRENDIZADO SIMBÓLICO: ÁRVORES DE DECISÃO
3 Árvores de Decisão (ADs) Um dos métodos mais usados e práticos para inferência indutiva Conhecimento estrutural do domínio Indução a partir de um conjunto de dados rotulados (classificados) Aprendizado supervisionado Algumas áreas de aplicação: medicina (diagnóstico médico) e análise de risco de crédito para novos clientes de banco
4 Exemplo Dia Aparência Temperatura Umidade Vento Jogar tênis D1 ensolarado quente alta fraco não D2 ensolarado quente alta forte não D3 nublado quente alta fraco sim D4 chuva moderada alta fraco sim D5 chuva fria normal fraco sim D6 chuva fria normal forte não D7 nublado fria normal forte sim D8 ensolarado moderada alta fraco não D9 ensolarado fria normal fraco sim D10 chuva moderada normal fraco sim D11 ensolarado moderada normal forte sim D12 nublado moderada alta forte sim D13 nublado quente normal fraco sim D14 chuva moderada alta forte não
5 Exemplo Dia Aparência Temperatur a Umidade Vento Jogar tênis D1 ensolarado quente alta fraco não D2 ensolarado quente alta forte não D3 nublado quente alta fraco sim D4 chuva moderada alta fraco sim D5 chuva fria normal fraco sim D6 chuva fria normal forte não D7 nublado fria normal forte sim D8 ensolarado moderada alta fraco não D9 ensolarado fria normal fraco sim D10 chuva moderada normal fraco sim D11 ensolarado moderada normal forte sim D12 nublado moderada alta forte sim D13 nublado quente normal fraco sim D14 chuva moderada alta forte não ensolarado aparência nublado chuva umidade sim vento alta normal forte fraco não sim não sim
6 Propriedades das ADs Instâncias (exemplos) são representados por pares atributo-valor. A hipótese/função objetivo (classe) tem, preferencialmente, valores discretos. Atributos contínuos podem ser usados fazendo o nó dividir o domínio do atributo entre dois intervalos baseados em um limite (ex. tamanho < 3 e tamanho 3) Árvores de classificação têm valores discretos nas folhas, árvores de regressão têm valores reais nas folhas. Algoritmos para encontrar árvores consistentes são eficientes e podem processar grandes quantidades de dados de treinamento
7 Propriedades das ADs Descrições disjuntivas podem ser necessárias. Os métodos de aprendizado de árvore de decisão lidam bem com ruído. O conjunto de treinamento pode conter dados problemáticos: valores errados, incompletos ou inconsistentes. Existem métodos de árvore de decisão que permitem valores desconhecidos para algumas características.
8 Estrutura Uma árvore de decisão contém: Nós-folha que correspondem às classes. Nós de decisão que contêm testes sobre atributos. Para cada resultado de um teste, existe uma aresta para uma sub-árvore; cada sub-árvore tem a mesma estrutura que a árvore.
9 Exemplo valor do atributo aparência teste no atributo aparência aparência ensolarado nublado chuva umidade sim vento alta normal forte fraco não sim não sim classe
10 Exemplo Para classificar (dizer se vai chover), basta começar pela raiz, seguindo cada teste até que a folha seja alcançada. aparência ensolarado nublado chuva umidade sim vento alta normal forte fraco não sim não sim
11 Transformação em Regras Toda AD pode ser reescrita como um conjunto de regras, por exemplo, em forma normal disjuntiva (DNF). Cada regra é obtida percorrendo a AD da raiz até as folhas. não umid ade aparê ncia ensolarado nublado sim sim chuva não vento alta normal forte fraco sim SE aparência=sol E umidade=alta ENTAO classe=não FIM SE SE aparência=sol E umidade=normal ENTAO classe=sim FIM SE SE aparência=nublado ENTAO classe=sim FIM SE...
12 Algoritmos de Aprendizado de AD Muitos algoritmos foram desenvolvidos para aprendizado de AD. CART (1977) ID3 (1979) ASSISTANT (1984) C4.5 (1993), aprimoramento do ID3 A maioria utiliza abordagem top-down e busca gulosa no espaço de possíveis árvores de decisão.
13 Construindo uma AD 1. O conjunto de treinamento T contém um ou mais exemplos, todos da mesma classe Cj: AD para T é um nó-folha identificando a classe Cj. 2. T não contém exemplos: AD é um nó-folha, mas a classe associada à folha é determinada por outras informações sobre T. 3. T contém exemplos de diversas classes: refinar T em subconjuntos de exemplos que são (ou possam vir a ser) conjunto de exemplos de uma única classe; a divisão em subconjuntos é feita em função de valores de atributos. 4. Aplicar os passos 1, 2 e 3 recursivamente para cada subconjunto de exemplos de treinamento até que o i-ésimo ramo conduza a uma AD construída sobre o subconjunto Ti do conjunto de treinamento. 5. Depois de construída a AD, utilizar técnicas de poda.
14 Atributo de Particionamento A chave para o sucesso de um algoritmo de aprendizado de AD depende do critério utilizado para escolher o atributo que particiona (atributo de teste) o conjunto de exemplos em cada iteração Questão: Como escolher o atributo de particionamento?
15 Atributo de Particionamento Existem várias possibilidades para a escolha do atributo: Aleatória: seleciona um atributo aleatoriamente Menos valores: escolhe o atributo com o menor número de valores possíveis Mais valores: escolhe o atributo com o maior número de valores possíveis Ganho Máximo: seleciona o atributo que possui o maior ganho de informação esperado, isto é, escolhe o atributo que resultará no menor tamanho para as sub-árvores enraizadas em seus filhos Índice Gini (Breiman et al, 1984) Razão de ganho (Quinlan, 1993)
16 Algoritmo ID3 O algoritmo ID3 (Inductive Decision Tree) é um dos mais utilizados para a construção de ADs. Um dos mais famosos, proposto por Quinlan. Características: Top-down Busca gulosa no espaço de possíveis AD Medida para selecionar atributos: ganho de informação. A medida de ganho de informação é usada para selecionar o atributo de teste, entre os atributos candidatos, em cada passo do crescimento da árvore.
17 Algoritmo ID3 O ID3 começa a construção da árvore com a pergunta: Qual atributo deveria ser testado como raiz da árvore? Para saber a resposta, usa a medida estatística ganho de informação, a qual mede quão bem um dado atributo separa o conjunto de treinamento de acordo com a classe. Árvore é construída recursivamente de cima para baixo, usando divisão e conquista.
18 Algoritmo ID3 1. Começar com todos os exemplos de treino; 2. Escolher o teste (atributo) que melhor divide os exemplos, ou seja, que agrupa exemplos da mesma classe ou exemplos semelhantes; 3. Para o atributo escolhido, criar um nó filho para cada valor possível do atributo; 4. Transportar os exemplos para cada filho tendo em conta o valor do filho; 5. Repetir o procedimento para cada filho não "puro". Um filho é puro quando cada atributo X tem o mesmo valor em todos os exemplos.
19 Pseudocódigo DTree(exemplos, atributos) retorna uma árvore Se todos exemplos pertencem a uma única classe, retorna um nó folha com essa classe. Senão Se o conjunto de atributos estiver vazio, retorna um nó folha com a classe mais comum entre os exemplos. Senão escolha um atributo F e crie um nó R para ele Para cada possível valor v i de F: Seja exemplos i o subconjunto de exemplos que tenha valor v i para F Coloque uma aresta E a partir do nó R com o valor v i. Se exemplos i estiver vazio coloque um nó folha ligado a aresta E com a classe mais comum entre os exemplos. Senão chame DTree(exemplos i, atributos {F}) e ligue a árvore resultante como uma sub-árvore sob E. Retorne a sub-árvore com raiz R.
20 Ganho de Informação A medida de ganho de informação pode ser definida como a redução esperada na entropia causada pelo particionamento de exemplos de acordo com um determinado atributo. Entropia: grau de desordem/surpresa de um conjunto de dados Quanto menor a entropia, mais previsível e organizado é o conjunto de dados. Original da Teoria da Informação, para calcular o número de bits necessários para a codificação de uma mensagem. Quanto menor a entropia, menos bits são necessários para codificar a mensagem.
21 Entropia Entropia (desordem, impureza) de um conjunto de exemplos, S, relativa a classificação binária é: Entropy S = p (:) log 2 p (:) p (;) log 2 p (;) onde p (:) é a fração de exemplos positivos em S e p (;) é a fração de negativos. Genericamente, para qualquer número c de classes de um conjunto de dados, a entropia de S é dada pela fórmula: Entropy S = p i log 2 (p i ) i<1 em que p i é a proporção de instâncias (exemplos) de S pertencendo a classe i e c é o número total de classes. c
22 Entropia para Classificação Binária Se todos os exemplos forem da mesma classe, a entropia é zero (definimos 0. log 0 = 0) Se os exemplos estiverem igualmente misturados (p 1 = p 0 = 0.5), entropia é 1. Se a coleção contém número diferente de exemplos positivos e negativos, a entropia varia entre 0 e 1.
23 Exemplo Dada uma coleção S com 14 exemplos, sendo que a classe é constituída por 9 positivos e 5 negativos, 9+, 5, a entropia de S é: Entropy S = p : log 2 (p : ) p ; log 2 (p ; ) Entropy S = 9 14 log 2 Entropy S = log
24 Ganho de Informação A medida de ganho de informação pode ser definida como a redução esperada na entropia causada pelo particionamento de exemplos de acordo com um determinado atributo. O ganho de informação deve ser calculado para cada atributo do conjunto de atributos da coleção S. O atributo que resultar no maior ganho de informação é selecionado como atributo de teste.
25 Ganho de Informação O ganho de informação de um atributo A relativo à coleção S é definido como: Gain S, A = Entropy S v Valores(A) S v S Entropy(S v) em que Valores(A) é o conjunto de todos os possíveis valores de A, S v é o subconjunto de S para o qual o atributo A tem valor v, o primeiro termo é a entropia da coleção S e o segundo termo é a soma das entropias de cada valor presente no atributo A.
26 Ganho de Informação Exemplo Atributo vento, com valores forte e fraco. Coleção S com 14 exemplos, sendo que 9 são positivos e 5 são negativos, i.e., [9+, 5-]. Desses exemplos, suponha que 6 dos exemplos positivos e dois exemplos negativos tem vento=fraco [6+, 2-] e o resto tem vento=forte ([3+, 3-]) Portanto: Valores(Vento) = fraco, forte Distribuição de S = [9+, 5-] Distribuição de S fraco = [6+, 2-] Distribuição de S forte = [3+, 3-]
27 Ganho de Informação Exemplo Dados: Valores(Vento) = fraco, forte Distribuição de S fraco = [6+, 2-] Distribuição de S = [9+, 5-] Distribuição de S forte = [3+, 3-] Gain S, Vento = Entropy S v Fraco,Forte S v S Entropy(S v) 6 8 log log log 2 Gain S, Vento = log 2 v Fraco,Forte 3 6 S v S Entropy(S v) Gain S, Vento = Entropy S fraco 6 14 Entropy(S forte) Gain S, Vento = Gain S, Vento = 0.048
28 Construindo uma AD Dia Aparência Temperatura Umidade Vento Jogar tênis D1 ensolarado quente alta fraco não D2 ensolarado quente alta forte não D3 nublado quente alta fraco sim D4 chuva moderada alta fraco sim D5 chuva fria normal fraco sim D6 chuva fria normal forte não D7 nublado fria normal forte sim D8 ensolarado moderada alta fraco não D9 ensolarado fria normal fraco sim D10 chuva moderada normal fraco sim D11 ensolarado moderada normal forte sim D12 nublado moderada alta forte sim D13 nublado quente normal fraco sim D14 chuva moderada alta forte não
29 Construindo uma AD Qual deverá ser o nó raiz da árvore? O nó raiz é identificado calculando o ganho de informação para cada atributo do conjunto de treinamento (menos o atributo classe). Calculando o Ganho para cada atributo, teremos: Ganho(S, aparência) = Ganho(S, umidade) = Ganho(S, vento) = Ganho(S, temperatura) = De acordo com a medida de ganho de informação, o atributo aparência é o que melhor prediz do atributo classe (jogar_tênis) sobre o conjunto de treinamento.
30 Construindo uma AD aparência ensolarado nublado chuva [D1, D2, D8, D9, D11] [2+, 3-] [D3, D7, D12, D13] [4+, 0-] [D4, D5, D6, D10, D14] [3+, 2-]
31 Construindo uma AD aparência ensolarado nublado chuva [D1, D2, D8, D9, D11] [2+, 3-] [D3, D7, D12, D13] [4+, 0-] sim [D4, D5, D6, D10, D14] [3+, 2-] Entropia igual a zero!
32 Construindo uma AD Qual atributo deverá ser testado aqui? ensolarado aparência nublado chuva [D1, D2, D8, D9, D11] [2+, 3-] sim [D3, D7, D12, D13] [4+, 0-] [D4, D5, D6, D10, D14] [3+, 2-]
33 Construindo uma AD Dia Aparência Temperatura Umidade Vento Jogar tênis D1 ensolarado quente alta fraco não D2 ensolarado quente alta forte não D3 nublado quente alta fraco sim D4 chuva moderada alta fraco sim D5 chuva fria normal fraco sim D6 chuva fria normal forte não D7 nublado fria normal forte sim D8 ensolarado moderada alta fraco não D9 ensolarado fria normal fraco sim D10 chuva moderada normal fraco sim D11 ensolarado moderada normal forte sim D12 nublado moderada alta forte sim D13 nublado quente normal fraco sim D14 chuva moderada alta forte não
34 Construindo uma AD S ensolarado = {D1, D2, D8, D9, D11} Dia Aparência Temperatura Umidade Vento Jogar tênis D1 ensolarado quente alta fraco não D2 ensolarado quente alta forte não D8 ensolarado moderada alta fraco não D9 ensolarado fria normal fraco sim D11 ensolarado moderada normal forte sim Calculando os ganhos: Ganho(S ensolarado, umidade) = (3/5)0.0 - (2/5)0.0 = Ganho(S ensolarado, temperatura) = (2/5)1.0 - (2/5)0.0 - (1/5)0.0 = Ganho(S ensolarado, vento) = (2/5)1.0 - (3/5)0.918 = Nesse caso, o maior ganho de informação está no atributo umidade.
35 Construindo uma AD aparência ensolarado nublado chuva Entropia igual a zero! alta [0+, 3-] umidade normal [2+, 0-] sim Entropia igual a zero! [D4, D5, D6, D10, D14] [3+, 2-] não sim
36 Construindo uma AD aparência umidade ensolarado nublado sim chuva [D4, D5, D6, D10, D14] [3+, 2-] alta não normal sim
37 Construindo uma AD ensolarado aparência nublado chuva Qual atributo deverá ser testado aqui? umidade sim [D4, D5, D6, D10, D14] [3+, 2-] alta não normal sim Terminar em casa ;)
38 Exercício Instância A1 A2 Classe 1 T T + 2 T T + 3 T F - 4 F F + 5 F F - 6 F T - De acordo com a tabela: Qual é a entropia desse conjunto de treinamento? Qual o ganho de informação do atributo A2 em relação a esse conjunto de treinamento? Lembre-se que: c i<1 Entropia S = p i log 2 (p i ) Ganho S, A = Entropia S v Valores(A) S v S Entropia(S v)
39 Missing values Como lidar com atributos sem valores (ausentes ou perdidos por alguma razão)? As instâncias com valores ausentes são ignoradas; O valor ausente é usado como um valor comum, podendo ser um valor testado, inclusive; Diante de um valor ausente, segue-se por um outro ramo, por exemplo, o que for mais popular (ou seja, que tenha mais instâncias associadas a ele). Permitir que a instância siga por vários ramos, sendo que é dado um peso para cada ramo em função do número de instâncias associados a ele; os resultados são recombinados (com os pesos) para se decidir pela classe.
40 Poda (Pruning) Maneira de tratar o ruído e o overfitting em árvores de decisão. Pré-poda: durante a fase de geração da hipótese alguns exemplos de treinamento são deliberadamente ignorados. Pós-poda: após a geração da hipótese, esta é generalizada, e algumas partes suas são eliminadas (poda de nós-folha) Mais usada, pois se tem mais informação; no caso anterior, não se sabe onde parar a poda. A folha resultante da poda deve ser marcada com a classe majoritária ou uma distribuição de probabilidade de cada classe.
41 Métodos de Pruning Métodos para determinar quais sub-árvores podar: Validação cruzada: Reservar alguns dados de treinamento (conjunto de validação) para avaliar utilidade das sub-árvores. Teste estatístico: Usa o teste para determinar se a regularidade observada foi devida ao acaso. Comprimento da descrição mínima (MDL): Determina se a complexidade adicional da hipótese é mais ou menos complexa que lembrar explicitamente as exceções resultantes da poda.
42 Pseudocódigo de Pruning PruningTree(árvore, exemplos) retorna uma árvore Divida os dados de treinamento em dois conjuntos, criação e validação. Construa a árvore completa a partir do conjunto de criação. Até que a precisão no conjunto de validação diminua, faça: Para cada nó não-folha n na árvore faça: Pode temporariamente a sub-árvore abaixo de n e a substitua por uma folha rotulada com a classe mais frequente naque- -le nó. Avalie e grave a precisão da árvore podada no conjunto de validação. Pode permanentemente os nós que resultaram no maior ganho de precisão no conjunto de validação.
43 Links interessantes: Softwares: C4.5 (free) See5.0 (limitado, para MS. Windows) Weka 3 ( Applet: cisiontrees/applet/decisiontreeapplet.html
Árvore de Decisão. George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE
Árvore de Decisão George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE Tópicos Introdução Representando Árvores de Decisão O algoritmo ID3 Definições Entropia Ganho de Informação Overfitting Objetivo
Inteligência Artificial
https://www.pinterest.com/carlymundo/decision-tree-infographics/ Universidade Federal de Campina Grande Departamento de Sistemas e Computação Pós-Graduação em Ciência da Computação Inteligência Artificial
Aurora Trinidad Ramirez Pozo Universidade Federal do Paraná
Aurora Trinidad Ramirez Pozo Universidade Federal do Paraná 1 Um dos métodos práticos mais usados Induz funções discretas robustas a ruído Capaz de aprender expressões disjuntivas Se pais = Inglaterra
Aprendizado em IA. Prof. Carlos H. C. Ribeiro ITA Divisão de Ciência da Computação
Aprendizado em IA Prof. Carlos H. C. Ribeiro ITA Divisão de Ciência da Computação Tópicos Agentes baseados em aprendizado Aprendizado indutivo Árvores de decisão Método ID3 Aprendizado em redes neurais
Árvores de Decisão. Sistemas Inteligentes
Árvores de Decisão Sistemas Inteligentes Uma Abordagem típica em aprendizagem simbólica Árvores de decisão: inductive decision trees (ID3) Instâncias (exemplos) são representadas por pares atributo-valor
Árvores de Decisão. Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Departamento de Ciências de Computação
Árvores de Decisão Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Departamento de Ciências de Computação Rodrigo Fernandes de Mello [email protected] Árvores de Decisão Método
Fundamentos de Inteligência Artificial [5COP099]
Fundamentos de Inteligência Artificial [5COP099] Dr. Sylvio Barbon Junior Departamento de Computação - UEL 1 o Semestre Assunto Aula 10 Modelos Preditivos - Árvore de Decisão 2 de 20 Aula 10 - Árvore de
Aprendizagem indutiva
Aprendizagem indutiva Inferência indutiva de fatos providos por um professor ou ambiente. O estudo e modelagem desta forma de aprendizagem é um dos tópicos centrais de aprendizagem de máquina. Em aprendizagem
Inteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo]
Inteligência Artificial Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo] Aprendizagem de Máquina Área da Inteligência Artificial cujo objetivo é o desenvolvimento de técnicas computacionais sobre
Aprendizagem de Máquina
Plano de Aula Aprendizagem de Máquina Aprendizagem de Árvores de Decisão Aula 3 Alessandro L. Koerich Introdução Representação de Árvores de Decisão Algoritmo de Aprendizagem ID3 Entropia e Ganho de Informação
Créditos. SCC0173 Mineração de Dados Biológicos. Aula de Hoje. Introdução. Classificação III: Árvores de Decisão
SCC073 Mineração de Dados Biológicos Classificação III: Árvores de Decisão Créditos O material a seguir consiste de adaptações e extensões dos originais: gentilmente cedidos pelo Prof. André C. P. L. F.
Aprendizagem de Máquina
Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) ÁRVORES DE DECISÃO Plano de Aula Introdução Representação de Árvores
Árvores de Decisão. Sistemas Inteligentes
Árvores de Decisão Sistemas Inteligentes Exemplos de situações do dia a dia em que a aprendizagem de máquina é importante A partir de informações sobre pacientes relativas a gravidez aprender a prever
Aprendizado de Máquina (Machine Learning)
Ciência da Computação Aprendizado de Máquina (Machine Learning) Aula 09 Árvores de Decisão Max Pereira Classificação É a tarefa de organizar objetos em uma entre diversas categorias pré-definidas. Exemplos
Aprendizagem de Máquina
Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Engenharia Elétrica Universidade Federal do Paraná (UFPR) ÁRVORES DE DECISÃO Plano de Aula Introdução Representação de Árvores
Inteligência nos Negócios (Business Inteligente)
Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 6) Fundamentação da disciplina Analise de dados Decisões
Aprendizagem de Máquina. Prof. Júlio Cesar Nievola PPGIA - PUCPR
Aprendizagem de Máquina Prof. Júlio Cesar Nievola PPGIA - PUCPR Introdução Justificativa Recente progresso em algoritmos e teoria Disponibilidade crescente de dados online Poder computacional disponível
Aprendizagem de Máquina - 2. Prof. Júlio Cesar Nievola PPGIa - PUCPR
Aprendizagem de Máquina - 2 Prof. Júlio Cesar Nievola PPGIa - PUCPR Inteligência versus Aprendizado Aprendizado é a chave da superioridade da Inteligência Humana Para que uma máquina tenha Comportamento
Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas
Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas Wrapper Filtros Muitos algoritmos de AM são projetados de modo a selecionar os
Arvores de decisão. O que é uma árvore de decisão? Cap.6 Árvores de Decisão V 3.0, V.Lobo, EN/ISEGI, Victor Lobo
V., V.Lobo, EN/ISEGI, 5 Arvores de decisão Victor Lobo O que é uma árvore de decisão? Algorítmo para tomar decisões (ou classificar) Modo de representar conhecimento Tem penas? Arcos (resultados ou pertença)
Entropia, Ganho de informação e Decision trees
Entropia, Ganho de informação e Decision trees O exemplo de hoje foi baseado no livro Machine learning de Tom M. Mitchell. Para esse exemplo vamos usar um conjunto de dados simples: A tabela acima consiste
Aprendizado Bayesiano Anteriormente...
Aprendizado Bayesiano Anteriormente... Conceito de Probabilidade Condicional É a probabilidade de um evento A dada a ocorrência de um evento B Universidade de São Paulo Instituto de Ciências Matemáticas
Árvore de Decisão. Capítulo 18 Russell & Norvig Seções 18.1 a 18.3
Árvore de Decisão Capítulo 18 Russell & Norvig Seções 18.1 a 18.3 Aprendizagem Indutiva Clássica Recebe como entrada o valor correto de uma função desconhecida para entradas específicas e tenta recuperar
Classificação: Árvores de Decisão e k-nn. Eduardo Raul Hruschka
Classificação: Árvores de Decisão e k-nn Eduardo Raul Hruschka Árvores de Decisão Métodos para aproximar funções discretas, representadas por meio de uma árvore de decisão; Árvores de decisão podem ser
INF 1771 Inteligência Artificial
INF 1771 Inteligência Artificial Aula 12 Árvores de Decisão Prof. Augusto Baffa Árvores de Decisão Uma das formas de algoritmo de aprendizado mais simples e de maior sucesso. Uma
Árvores de Decisão. Sumario. João Gama Árvores de decisão. Motivação Construção de uma árvore de decisão. Podar a árvore.
Árvores de Decisão João Gama [email protected] Sumario Árvores de decisão Motivação Construção de uma árvore de decisão Critérios para seleccionar atributos Entropia Podar a árvore Estimativas de erro Extensões
Modelagem da Rede Neural. Modelagem da Rede Neural. Back Propagation. Modelagem da Rede Neural. Modelagem da Rede Neural. Seleção de Variáveis:
Back Propagation Fatores importantes para a modelagem da Rede Neural: Seleção de variáveis; veis; Limpeza dos dados; Representação das variáveis veis de entrada e saída; Normalização; Buscando melhor Generalização
Thiago Marzagão 1. 1 Thiago Marzagão (Universidade de Brasília) MINERAÇÃO DE DADOS 1 / 21
MINERAÇÃO DE DADOS Thiago Marzagão 1 1 [email protected] ÁRVORE DE DECISÃO & VALIDAÇÃO Thiago Marzagão (Universidade de Brasília) MINERAÇÃO DE DADOS 1 / 21 árvore de decisão Aulas passadas: queríamos
Arvores de decisão. O que é uma árvore de decisão? Victor Lobo
Arvores de decisão Victor Lobo O que é uma árvore de decisão? Algorítmo para tomar decisões (ou classificar) Modo de representar conhecimento Tem penas? Arcos (resultados ou pertença) Nós (testes, ou conceitos)
BANCO DE DADOS DISTRIBUÍDOS e DATAWAREHOUSING Asterio K. Tanaka
BANCO DE DADOS DISTRIBUÍDOS e DATAWAREHOUSING Asterio K. Tanaka http://www.uniriotec.br/~tanaka/tin0036 [email protected] Introdução a Data Mining Árvores de Decisão Categorização de Dados Parte II Rogério
Arvores de decisão. Outras árvores. Outra maneira de ver árvores. Extracção de regras (a partir de árvores) Vantagens das árvores (1)
O que é a árvore de decisão? Arvores de decisão Algorítmo para tomar decisões (ou classificar) Modo de representar conhecimento Tem penas? Arcos (resultados ou pertença) Victor Lobo Nós (testes, ou conceitos)
CEFET/RJ Disciplina: Inteligência Artificial Professor: Eduardo Bezerra Lista de exercícios 02
. CEFET/RJ Disciplina: Inteligência Artificial Professor: Eduardo Bezerra Lista de exercícios 02 Créditos: alguns itens desta lista são adaptados do material da disciplina CS188 - Artificial Intelligence
Aprendizagem a partir de observações. Capítulo 18
Aprendizagem a partir de observações Capítulo 18 Descrição de agentes que podem melhorar o seu comportamento a partir do estudo diligente das próprias experiências Índice Formas de aprendizagem Aprendizagem
Lista de Exercícios - Capítulo 8 [1] SCC Inteligência Artificial 1o. Semestre de Prof. João Luís
ICMC-USP Lista de Exercícios - Capítulo 8 [1] SCC-630 - Inteligência Artificial 1o. Semestre de 2011 - Prof. João Luís 1. Seja breve na resposta às seguintes questões: (a) o que você entende por Aprendizado
Árvores de Decisão. Sumario. João Gama Árvores de decisão. Motivação Construção de uma árvore de decisão. Podar a árvore.
Árvores de Decisão João Gama [email protected] Sumario Árvores de decisão Motivação Construção de uma árvore de decisão Critérios para seleccionar atributos Entropia Podar a árvore Estimativas de erro
Aula 8: Árvores. Rafael Izbicki 1 / 33
Mineração de Dados Aula 8: Árvores Rafael Izbicki 1 / 33 Revisão Vimos que a função de risco é dada por R(g) := E[I(Y g(x))] = P (Y g(x)), Nem sempre tal função nos traz toda informação sobre g. É comum
Aula 10: Tratabilidade
Teoria da Computação DAINF-UTFPR Aula 10: Tratabilidade Prof. Ricardo Dutra da Silva Na aula anterior discutimos problemas que podem e que não podem ser computados. Nesta aula vamos considerar apenas problemas
Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação
Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Francisco A. Rodrigues Departamento de Matemática Aplicada e Estatística - SME Conceitos básicos Classificação não-supervisionada:
Aprendizado de Máquina
Aprendizado de Máquina André C. P. L. F. de Carvalho Posdoutorando: Isvani Frias-Blanco ICMC-USP Agrupamento de dados Tópicos Agrupamento de dados Dificuldades em agrupamento Algoritmos de agrupamento
Introdução à Aprendizagem Simbólica Automática. Aprendizagem Indutiva
Introdução à Aprendizagem Simbólica Automática (parte 2) Disciplina: Metodologias de Inteligência Artificial FEUP Aprendizagem Indutiva Aprendizagem indutiva Algoritmos que criam Árvores de Decisão (Algoritmos
Metodologia Aplicada a Computação.
Metodologia Aplicada a Computação [email protected] Pré-processamento de dados Técnicas utilizadas para melhorar a qualidade dos dados; Eliminam ou minimizam os problemas como ruídos, valores incorretos,
Compressão Sem Perdas: Codificações Huffman e Aritmética. Adelar da Silva Queiróz Marcelo Teixeira Thiago da Silva Sodré
Compressão Sem Perdas: Codificações Huffman e Aritmética Adelar da Silva Queiróz Marcelo Teixeira Thiago da Silva Sodré Compressão Sem Perdas (Lossless Data Compression) Refere-se a métodos de compressão
Métodos de Amostragem. Métodos de Amostragem e Avaliação de Algoritmos. Métodos de Amostragem. Métodos de Amostragem. Métodos de Amostragem
e Avaliação de s José Augusto Baranauskas Departamento de Física e Matemática FFCLRP-USP AM é uma ferramenta poderosa, mas não existe um único algoritmo que apresente o melhor desempenho para todos os
Algoritmos para Classificação
Mineração de Dados Algoritmos para Classificação 1 Sumário Algoritmo 1R Naïve Bayes Árvore de Decisão Regras Modelos Lineares (Regressão) Baseados em Instância (Vizinhos mais Próximos) 2 1 Atividades 3
2 Teoria da Informação
2 Teoria da Informação Neste capítulo apresentamos alguns conceitos básicos sobre Teoria da Informação que utilizaremos durante este trabalho. 2.1 Alfabeto, texto, letras e caracteres Um alfabeto Σ = (σ
DCBD. Avaliação de modelos. Métricas para avaliação de desempenho. Avaliação de modelos. Métricas para avaliação de desempenho...
DCBD Métricas para avaliação de desempenho Como avaliar o desempenho de um modelo? Métodos para avaliação de desempenho Como obter estimativas confiáveis? Métodos para comparação de modelos Como comparar
Redes Neurais Artificial. Prática. Inteligência Artificial
Redes Neurais Artificial Prática Inteligência Artificial Professor: Rosalvo Ferreira de Oliveira Neto Estrutura 1. Introdução a MLP 2. Base de dados e Pré-Processamento 3. Prática MLP - Introdução Redes
PROJETO E ANÁLISE DE ALGORITMOS (INF 2926)
PUC-Rio Departamento de Informática Prof. Marcus Vinicius S. Poggi de Aragão Horário: 4as-feiras de 13 às 16 horas - Sala 511 RDC 29 de abril de 2015 Data da Entrega: 10 de junho de 2015 Período: 2015.1
Métodos de Classificação por Árvores de Decisão Disciplina de Projeto e Análise de Algoritmos
Métodos de Classificação por Árvores de Decisão Disciplina de Projeto e Análise de Algoritmos Juliana Moreira Barbosa, Tiago Garcia de Senna Carneiro, Andrea Iabrudi Tavares PPGCC - Programa de Pós-Graduação
Unidade I ESTATÍSTICA APLICADA. Prof. Mauricio Fanno
Unidade I ESTATÍSTICA APLICADA Prof. Mauricio Fanno Estatística indutiva Estatística descritiva Dados no passado ou no presente e em pequena quantidade, portanto, reais e coletáveis. Campo de trabalho:
Busca Competitiva. Inteligência Artificial. Até aqui... Jogos vs. busca. Decisões ótimas em jogos 9/22/2010
Inteligência Artificial Busca Competitiva Aula 5 Profª Bianca Zadrozny http://www.ic.uff.br/~bianca/ia-pos Capítulo 6 Russell & Norvig Seção 6.1 a 6.5 2 Até aqui... Problemas sem interação com outro agente.
Estruturas de Dados 2
Estruturas de Dados 2 Técnicas de Projeto de Algoritmos Dividir e Conquistar IF64C Estruturas de Dados 2 Engenharia da Computação Prof. João Alberto Fabro - Slide 1/83 Projeto de Algoritmos por Divisão
Aprendizado por Árvores de Decisão
Universidade Federal de Santa Maria Departamento de Eletrônica e Computação Prof. Cesar Tadeu Pozzer Disciplina de Programação de Jogos 3D E-mail: [email protected] Período: 2006/01 Aprendizado por Árvores
