Introdução ao Data Mining Instituto Nacional de Estatística de Fevereiro de 2009

Tamanho: px
Começar a partir da página:

Download "Introdução ao Data Mining Instituto Nacional de Estatística de Fevereiro de 2009"

Transcrição

1 Introdução ao Data Mining Instituto Nacional de Estatística de Fevereiro de 2009 Módulo 2 -Métodos de Data Mining- -Árvores de decisão- -Regressão Linear e Árvores de regressão André Falcão (afalcao@di.fc.ul.pt) Graça Gaspar (gg@di.fc.ul.pt) Sumário Data Mining Componentes do processo Métodos e algoritmos Características Métodos supervisionados e não supervisionados Árvores de decisão para classificação Construção Medidas de impureza Poda Regressão linear Árvores de regressão 2

2 Data Mining Data mining descoberta de informação e padrões em dados (Knowledge Discovery from Data KDD) Métodos Analíticos Métodos Inferênciais (preditivos) Processo de Descoberta de Conhecimento Selecção obtenção de dados de várias fontes Pré-processamento e limpeza Transformação para um formato comum Data mining Ajustamento de Modelos Interpretação e avaliação Sistemas OLTP Data warehouse Data Mining ETL Selecção 3 KDD e DM Knowledge Discovery from Databases (KDD) e Data Mining (DM) Historicamente, eram termos utilizados por comunidades de investigadores distintas, embora com significados próximos DM Estatística, Análise de Dados, Sistemas de Informação KDD Inteligência Artificial, Aprendizagem Simbólica Automática Actualmente, tende-se a adoptar abordagens mais multi-disciplinares e considerar estes termos como sinónimos. Quando é feita alguma diferenciação no seu significado é no sentido de considerar KDD como um processo global mais abrangente, que inclui o processo de DM KDD parte dos dados tal como fornecidos pelo utilizador (inclui o pré-processamento) KDD tem por objectivo a descoberta de conhecimento compreensível e útil (inclui a interpretação de resultados) 4

3 Processo de descoberta de conhecimento Processo normalmente interactivo e iterativo, envolvendo vários passos: preparação dos dados procura de novos padrões/ descoberta de conhecimento avaliação do conhecimento extraído ou descoberto refinamento Avaliação do conhecimento descoberto: validade medida de desempenho da aprendizagem ou de certeza nos resultados utilidade potencial medida de utilidade compreensibilidade 5 Componentes de um sistema de KDD Controlo SGBD/ Datawarehouse S e l e c ç ã o P r é - p r o c e s a m e n t o Data Mining / Aprendizagem Automática Aprendizagem Simbólica Redes Neuronais Análise de Dados Estatística Algoritmos Genéticos A v a l i a ç ã o V i s u a l i z a ç ã o Utilizador Base de conhecimento 6

4 Passos do processo de descoberta de conhecimento extraído de Advances in Knowledge Discovery and Data Mining, U. Fayyad, G Piatetsky-Shapiro e P. Smyth 7 Métodos/Algoritmos de DM Um algoritmo de Data Mining é um procedimento bem definido que recebe dados e produz como resultado um modelo ou padrão Um método (computacional) de Data Mining descreve um procedimento de modo mais abstracto, omitindo detalhes de implementação Para caracterizar um método/algoritmo deve-se definir: O tipo de tarefa de Data Mining a que se destina Classificação, regressão, agrupamento (Clustering), A estrutura do modelo que produz Árvore, modelo linear, hierarquia de grupos, A função de avaliação do modelo com base nas observações Erro de classificação, erro quadrático, O método de procura dos parâmetros ou estruturas Procura heurística local, descida de gradiente, 8

5 Alguns métodos menos comuns Métodos baseados em árvores Usados para tarefas de classificação ou regressão (predição numérica) Procuram bifurcar os dados, recursivamente, em pontos críticos das variáveis determinantes, construindo árvores de decisão Métodos baseados em redes neuronais Usados para tarefas de regressão não linear ou classificação Um vector de p nós de entrada é multiplicado por pesos e os valores resultantes são transformados por uma função não linear para produzir valores para o 1º nível de nós escondidos. E assim sucessivamente até atingir os nós finais de saída. 9 Aprendizagem supervisionada? Aprendizagem supervisionada: Implicitamente há um supervisor/professor que fornece ao algoritmo informação correctamente processada (classificada ou avaliada) Métodos de classificação ou regressão são formas de aprendizagem supervisionada Aprendizagem não supervisionada: A experiência de treino consiste apenas em exemplos, não previamente classificados ou avaliados Métodos de agrupamento (clustering) são formas de aprendizagem não supervisionada. 10

6 Treino e Teste Na aprendizagem supervisionada, para avaliar o desempenho da aprendizagem, testa-se o seu resultado quando aplicado a alguns exemplos para os quais se conhece a classe/valor correcto Exemplos pré-classificados Algoritmo de Aprendizagem Exemplos de treino <x, classe> Exemplos de teste <x, classe> =? Resultado da Aprendizagem (Modelo) <x, classe estimada> 11 INDUÇÃO DE ÁRVORES DE DECISÃO Métodos de classificação que representam o resultado como uma árvore de decisão Função alvo da aprendizagem: função de classificação f: X V = {v 1,..., v n } X conjunto de exemplos V conjunto de classes Entre todas as árvores que classificam bem os exemplos, qual produzir? Viés/Inclinação da aprendizagem (Inductive bias): Pretende-se obter a descrição da função que melhor discrimine entre as classes descrição discriminante Melhor? Preferem-se árvores de menor dimensão 12

7 Exemplo Conjunto de pares <exemplo de treino, classe>: altura nacionalidade estadocivil classe Baixo Alemão Solteiro A Alto Francês Solteiro A Baixo Italiano Solteiro B Alto Alemão Solteiro A Alto Alemão Casado B Alto Italiano Solteiro B Alto Italiano Casado B Baixo Alemão Casado B Árvore de decisão: nacionalidad e italiano francês alemão estadocivil B A solteiro casado A B 13 Estrutura de uma árvore de decisão Uma árvore de decisão é uma árvore que permite determinar a classe a que pertence uma instância a partir de condições/testes sobre os valores de alguns dos seus atributos Nas árvores de decisão simples (univariadas, i.e. nas quais cada teste é relativo a um só atributo): Um nó interno da árvore representa um teste sobre o valor de um atributo A Cada arco a partir de um nó A representa um valor possível do atributo A Um nó folha da árvore de decisão indica uma classe A árvore como procedimento de classificação: A classificação de uma nova instância obtêm-se por travessia da árvore a partir do nó raiz, sendo essa travessia guiada pelos valores da instância a classificar 14

8 Selecção dos atributos - motivação Seleccionar um atributo que minimize a incerteza quanto à classe a indicar Exemplo: atributos: altura, cabelo, olhos V= {+, -} C = <(baixo, louro, azuis), + > <(baixo, preto, azuis), - > <(alto, preto, castanhos), - > <(alto, louro, castanhos), - > <(alto, preto, azuis), - > <(baixo, louro, castanhos), - > <(alto, ruivo, azuis), + > <(alto, louro, azuis), + > C contem 8 exemplos assim distribuídos pelas 2 classes : [3+, 5-] Estrutura de 2 das 3 possíveis árvores alternativas: cabelo altura preto ruivo louro alto baixo baixo, preto, azuis: - alto, preto, castanhos: - alto, preto, azuis: - { alto, ruivo, azuis: + } baixo, louro, azuis: + alto, louro, castanhos: - baixo, louro, castanhos: - alto, louro, azuis: + alto, preto, castanhos: - alto, louro, castanhos: - alto, preto, azuis: - alto, ruivo, azuis: + baixo, louro, azuis: + baixo, preto, azuis: - baixo, louro, castanhos: - alto, louro, azuis: + [0+, 3-] [1+, 0-] [2+, 2-] [2+, 3-] [1+, 2-] 15 Entropia de um conjunto C: conjunto de exemplos de treino Duas classes: + e p + : proporção de exemplos + em C p - : proporção de exemplos em C Entropia(C) = - p + log 2 p + -p - log 2 p - 1 0,9 0,8 0,7 0,6 IE (C ) 0,5 0,4 0,3 0,2 0, ,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 p+ 16

9 Cálculo da Entropia, associada a um conjunto de treino cabelo preto ruivo C louro baixo, preto, azuis: - alto, preto, castanhos: - alto, preto, azuis: - { alto, ruivo, azuis: + } baixo, louro, azuis: + alto, louro, castanhos: - baixo, louro, castanhos: - alto, louro, azuis: + [2+, 2-] Entropia([2+, 2-]) = - 2/4* log 2 (2/4) - 2/4* log2 (2/4) = 1/2 + 1/2 = 1 Entropia máxima! 17 Algoritmo ID3 - Critério do maior ganho de informação Ganho de informação resultante de seleccionar um atributo A, face a um conjunto de instâncias de treino C: Considerando: A com valores possíveis a 1,..., a m A partição de C, resultante da escolha de A = { C a1,..., C am } Ganho de informação(c, A) = Entropia (C) Entropia média (partição de C por A) m ganho(c,a) = Entropia(C) prob(a = a j )Entropia(C aj) j= 1 O ganho de informação é a heurística usada pelo ID3 para escolher o atributo a testar num nó de árvore, para o conjunto corrente de exemplos C Critério do maior ganho de informação no ID3: Face a um conjunto de exemplos corrente C, associado a um nó da árvore, selecciona-se para testar nesse nó o atributo A tal que ganho(c,a) é máximo Isto é, o atributo A cuja entropia média da partição de C por A é mínima 18

10 ID3 procura no espaço de hipóteses Espaço de hipóteses considerado: Conjunto de árvores de decisão univariadas Tipo de procura efectuada: De árvores simples para árvores mais complexas Procura sobe-montanhas ( hill-climbing ) com a heurística ganho de informação: Em profundidade (uma única hipótese corrente árvore corrente) Sem retrocesso (extensão possível: post-prunning ) Não garante atingir a melhor solução, i.e. a menor árvore 19 Outras medidas da impureza de um conjunto A Entropia é uma medida da impureza de um conjunto. Um conjunto puro é um conjunto cujos elementos pertencem todos à mesma classe. Outras medidas de impureza têm sido aplicadas, por exemplo: Gini Index (usada na função rpart() do R): n Gini C = prob classe i i= 1 j i Com 2 classes + e apenas: Gini( C) = 2p+ ( 1 p+ ) ( ) ( ) prob ( classe ) Erro de classificação ( C) = 1 max ( prob( classe) ) ErroClass = i 1,..., n i j 20

11 Algoritmos de indução de árvores de decisão Família de algoritmos de aprendizagem TDIDT Top-down Induction of Decision Trees Alguns algoritmos: ID3 (Quinlan 79) CART Classification and Regression Trees (Brieman et al. 84) C4.5 (Quinlan 93) See5 (Quinlan 97)... C4.5 uma extensão do ID3, eliminando algumas das suas restrições: Capacidade de lidar com atributos numéricos Capacidade para lidar com valores em falta Geração de regras a partir da árvore Avaliação do desempenho / poda da árvore 21 C4.5 testes sobre atributos numéricos A construção da árvore, tal como é efectuada pelo ID3, obriga a criar tantos descendentes de um nó A quantos os valores possíveis de A Só permite lidar com atributos de domínio finito Sendo A um atributo com domínio real, o C4.5 considera a hipótese de efectuar testes binários sobre A, com base em diferentes valores limiar z Teste: A > z corresponde a considerar um novo atributo virtual binário Determinação automática do limiar mais adequado: Ordenação dos valores de A que ocorrem no conjunto de exemplos de treino { a 1,..., a k } conjunto finito k-1 limiares possíveis correspondentes aos pontos médios dos intervalos ] a i, a i+1 ] Para cada um dos limiares possíveis z i, cálculo do ganho de informação considerando o teste A > z i e selecção do limiar com maior ganho. 22

12 O espaço de exemplos e as superfícies de decisão Com uma árvore de decisão univariada, as fronteiras entre as superfícies de decisão são paralelas aos eixos A >10 B sim não B >7 B >11 11 A >5 7 5 A C4.5 valores em falta Como construir a árvore partindo de exemplos com valores em falta para um atributo A? Omitir exemplos nestas circunstâncias; Considerar conceptualmente o exemplo subdividido em vários exemplos idênticos, um para cada valor possível de A, com um peso fraccionário associado: Soma das fracções igual a 1; Valor da fracção relativa a a i dado pela frequência relativa do valor a i no conjunto de exemplos corrente Ao avaliar a escolha desse atributo na construção da árvore, cada fracção do exemplo irá descer o ramo correspondente da árvore Dada uma árvore, como classificar uma nova instância com valores em falta? Fracções do exemplo poderão também descer diferentes ramos da árvore. Se forem atingidos nós folha com diferentes classificações, terá que se determinar uma classificação combinada, em função dos pesos fraccionários associados. 24

13 C4.5 -Simplificação das árvores Este método continua a subdividir o conjunto de exemplos corrente até que cada subconjunto na partição seja puro ou nenhum dos testes produza ganho positivo. O resultado pode ser uma árvore muito complexa que está sobre-ajustada (overfitting) aos dados de treino: Classifica idealmente esses dados de treino (com erro 0 ou mínimo), Mas Quando usada para classificar outros dados, produz um erro superior àquele que seria produzido por uma árvore menos complexa É desejável ter formas de: Caracterizar a noção de sobre-ajustamento aos dados de treino Reduzir a sobre-ajustamento aos dados de treino produzida por um certo algoritmo 25 overfitting A noção de sobre-ajustamento aos dados de treino é uma noção geral que se pode definir relativamente a qualquer tipo de modelo induzido a partir de dados (não é específica para modelos representados sob a forma de árvore de decisão). Uma hipótese (de modelo) está sobre-ajustada aos dados de treino se outra hipótese pior adaptada a esses dados (com pior desempenho sobre esses dados de treino) tem melhor desempenho na distribuição global de instâncias. Uma possível medida de desempenho, num modelo de classificação: Taxa de erro na classificação, calculada a partir de um conjunto de exemplos pré-classificados Sobre-adaptação pode ser provocada por: Ruído/incorrecções nos dados de treino Pequeno número ou selecção inadequada dos exemplos de treino 26

14 C4.5 Poda de árvores Possíveis abordagens para reduzir a sobre-adaptação de árvores de decisão: Stopping ou pre-pruning: parar a construção da árvore antes de conseguir a classificação perfeita dos exemplos de treino Determinar a melhor partição a efectuar para o conjunto corrente de exemplos Avaliar essa partição do ponto de vista da significância estatística (teste do χ 2 ), ganho de informação, redução do erro ou Se o valor determinado é inferior a um limiar pré-determinado, a subdivisão da árvore é rejeitada e é considerado um nó folha com a classe maioritária. Post-pruning: podar partes da árvore após a sua construção. Substituição de uma ou mais subárvores por uma folha Reduced-error pruning (Quinlan, 1987) 27 Rpart poda das árvores O algoritmo rpart do R considera uma medida de custocomplexidade (cost-complexity) para efectuar a poda: R α = R + α * dimensão Onde R é uma medida avaliada nas folhas (por exemplo nº de erros de classificação) e R(T), sendo T uma árvore, é a soma dos valores para as folhas em T O parâmetro cp (complexity parameter) é α / R(T0) da árvore raiz T0 28

15 Validação cruzada Técnica geral para avaliar o desempenho de um modelo de classificação Procedimento: Dividir o conjunto de dados em N subconjuntos de igual dimensão (N-fold cross-validation) Construir N modelos (árvores, no caso de algoritmos TDIDT) da forma seguinte: Reservar 1 dos N subconjuntos para dados de teste, construindo a árvore a partir da união dos restantes (N-1) subconjuntos; Assume-se que um modelo assim obtido não difere muito do obtido a partir de todo o conjunto de treino Estimar a taxa de erro pela média das taxas de erro dos N modelos produzidos 29 De árvores a regras É possível traduzir uma árvore de decisão num conjunto de regras de classificação da forma E D Parte esquerda ou antecedente: conjunção de condições atómicas Exemplos: Parte direita ou consequente: inclusão numa classe Nacionalidade(x)=italiano x B Nacionalidade(x)=alemão estadocivil(x)=casado x B Cada regra corresponde a um caminho na árvore da raiz para um nó folha Regras com o mesmo consequente podem ser fundidas desde que se admita a utilização de disjunções no antecedente rule post-pruning: A redução do sobre-ajustamento pode ser realizada por poda de condições no antecedente de uma regra A poda de uma subárvore corresponde a podar várias regras 30

16 Modelos para Regressão Pretende-se aprender a predizer o valor de uma variável (atributo) numérica. Os atributos (ou variáveis) usados como entrada para o algoritmo de aprendizagem dizem-se preditores podendo ser numéricos ou nominais. Questões relevantes: Precisão da predição Importância relativa / interdependência das variáveis preditoras Complexidade dos modelos obtidos 31 Modelos lineares Seja y a variável alvo, ŷ o seu valor aproximado (predito), e x j as variáveis preditoras ŷ é uma combinação linear das variáveis preditoras: p y ) = a 0 + a j x j j = 1 Normalmente tem-se por objectivo que ŷ prediga o valor médio de y para cada vector (x 1,, x p ) Os (p+1) coeficientes a j são chamados coeficientes de regressão. Por conveniência da notação, considera-se uma variável extra x0, cujo valor é sempre 1, permitindo reescrever a equação linear de modo mais simples p y ) = a jx j j= 0 Com uma única variável preditora temos um modelo de regressão simples, representando uma recta de regressão. Com várias variáveis preditoras temos um modelo de regressão múltipla, representando um plano de regressão.

17 Exemplo cycle time main memory cache chanels performance (ns) (Kb) (Kb) MYCT MMIN MMAX CACH CHMIN CHMAX class Modelo linear produzido a partir de conjunto de 209 exemplos de treino: class = MYCT MMIN MMAX CACH CHMIN CHMAX 33 Método de regressão linear Os valores actuais de y no conjunto de treino tipicamente diferem de ŷ Estas diferenças e(i) são chamadas resíduos ou erros: p ) y(i) = y(i) + e(i) = a j x j(i) + e(i) j= 0 Queremos obter valores para os parâmetros a j que minimizem os resíduos: Método dos quadrados mínimos ( least squares ) minimizar 2 n n p 2 e(i) = y(i) a j x j(i) i = 1 i = 1 j = 0 34

18 Árvores para predição numérica Uma estrutura análoga a uma árvore de decisão pode ser usada para problemas de regressão, indicando nos nós folha um valor numérico que é a média dos valores do atributo alvo para todas as instâncias de treino que alcançam esse nó folha. Estas árvores são chamadas árvores de regressão. É possível combinar árvores de regressão com equações de regressão as folhas contêm expressões de regressão lineares em lugar de um único valor numérico. Estas árvores são chamadas árvores de modelos. 35 Árvore de regressão: MMAX <= : CACH <= 8.5 : MMAX <= 6100 : class = 24.3 MMAX > 6100 : class = 43.1 CACH > 8.5 : CHMIN <= 7 : class = 52.1 CHMIN > 7 : class = 104 MMAX > : MMAX <= : CACH <= 27 : class = 80.4 CACH > 27 : class = 128 MMAX > : CHMIN <= 10 : class = 235 CHMIN > 10 : MMAX <= : class = 355 MMAX > : class = 971 Exemplos Árvore de modelos: MMAX <= : CACH <= 8.5 : LM1 CACH > 8.5 : LM2 MMAX > : MMAX <= : LM3 MMAX > : LM4 Modelos nas folhas: LM1: class = MYCT MMAX LM2: class = MMAX CACH CHMIN LM3: class = MYCT MMIN MMAX CACH CHMIN CHMAX LM4: class = MYCT MMAX CACH 36

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Árvores de Decisão Poda e extensões Prof. Paulo Martins Engel UFRGS 2 Questões sobre Árvores de Decisão Questões práticas do aprendizado de AD incluem: Determinar até quando se

Leia mais

Árvore de Decisão. George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE

Árvore de Decisão. George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE Árvore de Decisão George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE Tópicos Introdução Representando Árvores de Decisão O algoritmo ID3 Definições Entropia Ganho de Informação Overfitting Objetivo

Leia mais

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Árvores de Decisão. David Menotti.

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Árvores de Decisão. David Menotti. Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica Árvores de Decisão David Menotti www.inf.ufpr.br/menotti/ci171-182 Árvores de Decisão Agenda Introdução Representação Quando Usar

Leia mais

Descoberta de Conhecimento em Bancos de Dados - KDD

Descoberta de Conhecimento em Bancos de Dados - KDD Descoberta de Conhecimento em Bancos de Dados - KDD Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Fases do processo 3. Exemplo do DMC 4. Avaliação

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina Árvores de Decisão Luiz Eduardo S. Oliveira Universidade Federal do Paraná Departamento de Informática http://lesoliveira.net Luiz S. Oliveira (UFPR) Aprendizado de Máquina 1 / 28

Leia mais

Arvores de decisão. O que é uma árvore de decisão? Victor Lobo

Arvores de decisão. O que é uma árvore de decisão? Victor Lobo Arvores de decisão Victor Lobo O que é uma árvore de decisão? Algorítmo para tomar decisões (ou classificar) Modo de representar conhecimento Tem penas? Arcos (resultados ou pertença) Nós (testes, ou conceitos)

Leia mais

Arvores de decisão. Outras árvores. Outra maneira de ver árvores. Extracção de regras (a partir de árvores) Vantagens das árvores (1)

Arvores de decisão. Outras árvores. Outra maneira de ver árvores. Extracção de regras (a partir de árvores) Vantagens das árvores (1) O que é a árvore de decisão? Arvores de decisão Algorítmo para tomar decisões (ou classificar) Modo de representar conhecimento Tem penas? Arcos (resultados ou pertença) Victor Lobo Nós (testes, ou conceitos)

Leia mais

Árvores de Decisão. Sistemas Inteligentes

Árvores de Decisão. Sistemas Inteligentes Árvores de Decisão Sistemas Inteligentes Uma Abordagem típica em aprendizagem simbólica Árvores de decisão: inductive decision trees (ID3) Instâncias (exemplos) são representadas por pares atributo-valor

Leia mais

Data Mining. Felipe E. Barletta Mendes. 21 de maio de 2008

Data Mining. Felipe E. Barletta Mendes. 21 de maio de 2008 21 de maio de 2008 O foco principal deste material não é apresentar em minúcia todo o contexto de, muito menos o sobre o processo KDD em que a mineração de dados usualmente está inserida. O objetivo é

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina Sistemas de Informação Inteligente Prof. Leandro C. Fernandes Adaptação dos materiais de: Thiago A. S. Pardo, Daniel Honorato e Bianca Zadrozny APRENDIZADO SIMBÓLICO: ÁRVORES DE

Leia mais

2284-ELE/5, 3316-IE/3

2284-ELE/5, 3316-IE/3 INTELIGÊNCIA ARTIFICIAL 2284-ELE/5, 3316-IE/3 Universidade da Beira Interior, Departamento de Informática Hugo Pedro Proença, 2007/2008 Aprendizagem Supervisionada 2 Os vários algoritmos de Aprendizagem

Leia mais

Inteligência Computacional [2COP229]

Inteligência Computacional [2COP229] Inteligência Computacional [2COP229] Mestrado em Ciência da Computação Sylvio Barbon Jr barbon@uel.br (2/41) Tema Aula Árvores de Decisão Aula- Árvore de Decisão (3/41) Sumário Introdução Indução de Árvores

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Engenharia Elétrica Universidade Federal do Paraná (UFPR) ÁRVORES DE DECISÃO Plano de Aula Introdução Representação de Árvores

Leia mais

Redes Neuronais e Aprendizagem Automática 1

Redes Neuronais e Aprendizagem Automática 1 Redes Neuronais e Aprendizagem Automática 2005/2006 18 a aula Fernando.Silva@ist.utl.pt Instituto Superior Técnico Redes Neuronais e Aprendizagem Automática 1 Sumário Árvores de decisão (continuação) Redes

Leia mais

Arvores de decisão. O que é uma árvore de decisão? Cap.6 Árvores de Decisão V 3.0, V.Lobo, EN/ISEGI, Victor Lobo

Arvores de decisão. O que é uma árvore de decisão? Cap.6 Árvores de Decisão V 3.0, V.Lobo, EN/ISEGI, Victor Lobo V., V.Lobo, EN/ISEGI, 5 Arvores de decisão Victor Lobo O que é uma árvore de decisão? Algorítmo para tomar decisões (ou classificar) Modo de representar conhecimento Tem penas? Arcos (resultados ou pertença)

Leia mais

Árvores de Decisão. Sumario. João Gama Árvores de decisão. Motivação Construção de uma árvore de decisão. Podar a árvore.

Árvores de Decisão. Sumario. João Gama Árvores de decisão. Motivação Construção de uma árvore de decisão. Podar a árvore. Árvores de Decisão João Gama Jgama@ncc.up.pt Sumario Árvores de decisão Motivação Construção de uma árvore de decisão Critérios para seleccionar atributos Entropia Podar a árvore Estimativas de erro Extensões

Leia mais

Tópicos Especiais em Informática Fatec Indaiatuba 13/07/2017

Tópicos Especiais em Informática Fatec Indaiatuba 13/07/2017 Inteligência de Negócios Fatec Indaiatuba Prof. Piva Compreender as definições e conceitos básicos da Mineração de Dados (MD) Entender o processo KDD (Knowledge Discovery Data) e MD Descrever as etapas

Leia mais

Estudo de Caso. Índice. Descrição da Área. Daniel Gomes Dosualdo Solange Oliveira Rezende

Estudo de Caso. Índice. Descrição da Área. Daniel Gomes Dosualdo Solange Oliveira Rezende Estudo de Caso Daniel Gomes Dosualdo Solange Oliveira Rezende Índice Descrição da Área Identificação do Problema Descrição do Conjunto de Dados Pré-Processamento Extração de Padrões Pós-Processamento Disponibilização

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação Aprendizado de Máquina (Machine Learning) Aula 09 Árvores de Decisão Max Pereira Classificação É a tarefa de organizar objetos em uma entre diversas categorias pré-definidas. Exemplos

Leia mais

Créditos. SCC0173 Mineração de Dados Biológicos. Aula de Hoje. Introdução. Classificação III: Árvores de Decisão

Créditos. SCC0173 Mineração de Dados Biológicos. Aula de Hoje. Introdução. Classificação III: Árvores de Decisão SCC073 Mineração de Dados Biológicos Classificação III: Árvores de Decisão Créditos O material a seguir consiste de adaptações e extensões dos originais: gentilmente cedidos pelo Prof. André C. P. L. F.

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Alessandro L. Koerich/Alceu S. Britto Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) ÁRVORES DE DECISÃO Plano de Aula Introdução Representação

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) ÁRVORES DE DECISÃO Plano de Aula Introdução Representação de Árvores

Leia mais

Aula 8: Árvores. Rafael Izbicki 1 / 33

Aula 8: Árvores. Rafael Izbicki 1 / 33 Mineração de Dados Aula 8: Árvores Rafael Izbicki 1 / 33 Revisão Vimos que a função de risco é dada por R(g) := E[I(Y g(x))] = P (Y g(x)), Nem sempre tal função nos traz toda informação sobre g. É comum

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina écnicas de Classificação Árvores de Decisão Prof. Paulo Martins Engel UFRGS Árvores de Decisão As árvores de decisão (AD) são ferramentas poderosas para classificação cuja maior

Leia mais

SCC Capítulo 9 Indução de Árvores de Decisão

SCC Capítulo 9 Indução de Árvores de Decisão Indução de Árvores de Decisão SCC-630 - Capítulo 9 Indução de Árvores de Decisão João Luís Garcia Rosa 1 1 Departamento de Ciências de Computação Instituto de Ciências Matemáticas e de Computação Universidade

Leia mais

Classificação: Árvores de Decisão e k-nn. Eduardo Raul Hruschka

Classificação: Árvores de Decisão e k-nn. Eduardo Raul Hruschka Classificação: Árvores de Decisão e k-nn Eduardo Raul Hruschka Agenda: Conceitos de Classificação Técnicas de Classificação One Rule (1R) Naive Bayes (com seleção de atributos) Árvores de Decisão K-Vizinhos

Leia mais

Análise de Regressão Linear Simples e

Análise de Regressão Linear Simples e Análise de Regressão Linear Simples e Múltipla Carla Henriques Departamento de Matemática Escola Superior de Tecnologia de Viseu Introdução A análise de regressão estuda o relacionamento entre uma variável

Leia mais

Árvores de Decisão. Sumario. João Gama Árvores de decisão. Motivação Construção de uma árvore de decisão. Podar a árvore.

Árvores de Decisão. Sumario. João Gama Árvores de decisão. Motivação Construção de uma árvore de decisão. Podar a árvore. Árvores de Decisão João Gama Jgama@liacc.up.pt Sumario Árvores de decisão Motivação Construção de uma árvore de decisão Critérios para seleccionar atributos Entropia Podar a árvore Estimativas de erro

Leia mais

Exame de Aprendizagem Automática

Exame de Aprendizagem Automática Exame de Aprendizagem Automática 2 páginas com 11 perguntas e 3 folhas de resposta. Duração: 2 horas e 30 minutos DI, FCT/UNL, 5 de Janeiro de 2016 Nota: O exame está cotado para 40 valores. Os 20 valores

Leia mais

Classificação: Árvores de Decisão e k-nn. Eduardo Raul Hruschka

Classificação: Árvores de Decisão e k-nn. Eduardo Raul Hruschka Classificação: Árvores de Decisão e k-nn Eduardo Raul Hruschka Árvores de Decisão Métodos para aproximar funções discretas, representadas por meio de uma árvore de decisão; Árvores de decisão podem ser

Leia mais

Assim, no algoritmo BIOCLIM, qualquer ponto do espaço pode ser classificado como:

Assim, no algoritmo BIOCLIM, qualquer ponto do espaço pode ser classificado como: ANEXO A ALGORITMOS BIOCLIM E GARP A.1 Algoritmo BIOCLIM O algoritmo BIOCLIM implementa o conceito de envelope bioclimático (Nix, 1986). O algoritmo calcula a média e o desvio-padrão para cada variável

Leia mais

Saída: Representação de conhecimento

Saída: Representação de conhecimento Saída: Representação de conhecimento Kate Revoredo katerevoredo@uniriotec.br 1 Saída: Representando padrões estruturais Existem muitas maneiras diferentes de representar padrões: Árvores de decisão, regras,

Leia mais

Árvores de decisão. Marcelo K. Albertini. 17 de Agosto de 2015

Árvores de decisão. Marcelo K. Albertini. 17 de Agosto de 2015 Árvores de decisão Marcelo K. Albertini 17 de Agosto de 2015 2/31 Árvores de Decisão Nós internos testam o valor de um atributo individual ramificam de acordo com os resultados do teste Nós folhas especificam

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação (Machine Learning) Aula 01 Motivação, áreas de aplicação e fundamentos Max Pereira Nem todo conhecimento tem o mesmo valor. O que torna determinado conhecimento mais importante que

Leia mais

Inteligência Artificial

Inteligência Artificial Inteligência Artificial Descoberta de Conhecimento em Bases de Dados Mineração de Dados Descobertas de regras de associação Descoberta de Conhecimento em Bases de Dados DCBD (Descoberta de Conhecimento

Leia mais

Inteligência nos Negócios (Business Inteligente)

Inteligência nos Negócios (Business Inteligente) Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 6) Fundamentação da disciplina Analise de dados Decisões

Leia mais

Inteligência Artificial

Inteligência Artificial UFRGS 2 Inteligência Artificial Técnicas de Mineração de Dados Árvores de Decisão Regras de Associação Árvores de Decisão As árvores de decisão (AD) são ferramentas poderosas para classificação cuja maior

Leia mais

ÁRVORES DE DECISÃO PROFA. MARIANA KLEINA

ÁRVORES DE DECISÃO PROFA. MARIANA KLEINA ÁRVORES DE DECISÃO PROFA. MARIANA KLEINA DEFINIÇÃO Uma árvore de decisão é uma ferramenta de suporte à tomada de decisão que usa um gráfico no formato de árvore e demonstra visualmente as condições e as

Leia mais

Aula 3 Representação do Conhecimento

Aula 3 Representação do Conhecimento Aula 3 Representação do Conhecimento Sumário (Representação do Conhecimento) - Introdução - Tabelas - Modelos Lineares - Árvores - Regras - Baseada em Instância - Clusters (Aglomerado) - Prática: Árvore

Leia mais

Árvores de Decisão. Sistemas Inteligentes

Árvores de Decisão. Sistemas Inteligentes Árvores de Decisão Sistemas Inteligentes Exemplos de situações do dia a dia em que a aprendizagem de máquina é importante A partir de informações sobre pacientes relativas a gravidez aprender a prever

Leia mais

Árvores de Decisão. Fabrício Olivetti de França. Universidade Federal do ABC

Árvores de Decisão. Fabrício Olivetti de França. Universidade Federal do ABC Árvores de Decisão Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Árvores de Decisão 1 Árvores de Decisão Base de Dados Relembrando nossa base de dados utilizada na aula passada: Pele

Leia mais

Extracção de Conhecimento

Extracção de Conhecimento Programa Doutoral em Engenharia Informática Mestrado Integrado em Engenharia Informática LIACC/FEUP Universidade do Porto www.fe.up.pt/ ec rcamacho@fe.up.pt Outubro 2007 conceitos básicos Conteúdo Definições

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Plano de Aula Aprendizagem de Máquina Aprendizagem de Árvores de Decisão Aula 3 Alessandro L. Koerich Introdução Representação de Árvores de Decisão Algoritmo de Aprendizagem ID3 Entropia e Ganho de Informação

Leia mais

Mineração de Dados para Detecção de Padrões de Mudança de Cobertura da Terra. Padrões e processos em Dinâmica de uso e Cobertura da Terra

Mineração de Dados para Detecção de Padrões de Mudança de Cobertura da Terra. Padrões e processos em Dinâmica de uso e Cobertura da Terra Mineração de Dados para Detecção de Padrões de Mudança de Cobertura da Terra Padrões e processos em Dinâmica de uso e Cobertura da Terra Introdução 1 2 3 4 Capacidade de Armazenamento X Análise e Interpretação

Leia mais

Seleção de Variáveis e Construindo o Modelo

Seleção de Variáveis e Construindo o Modelo Seleção de Variáveis e Construindo o Modelo Seleção de modelos candidatos A idéia é selecionar um conjunto menor de variáveis explanatórias de acordo com algum(s) critério(s), e assim selecionar o modelo

Leia mais

Algoritmos Indutores de Árvores de. Fabrício J. Barth

Algoritmos Indutores de Árvores de. Fabrício J. Barth Algoritmos Indutores de Árvores de Decisão Fabrício J. Barth Maio de 2018 Problema: Diagnóstico para uso de lentes de contato 2 Diagnóstico para o uso de lentes de contato O setor de oftalmologia de um

Leia mais

Fundamentos de Inteligência Artificial [5COP099]

Fundamentos de Inteligência Artificial [5COP099] Fundamentos de Inteligência Artificial [5COP099] Dr. Sylvio Barbon Junior Departamento de Computação - UEL 1 o Semestre Assunto Aula 10 Modelos Preditivos - Árvore de Decisão 2 de 20 Aula 10 - Árvore de

Leia mais

Árvores de decisão e seus refinamentos na predição genômica da resistência à ferrugem alaranjada em café arábica

Árvores de decisão e seus refinamentos na predição genômica da resistência à ferrugem alaranjada em café arábica Árvores de decisão e seus refinamentos na predição genômica da resistência à ferrugem alaranjada em café arábica Ithalo Coelho de Sousa ithalo.coelho@gmail.com Programa de Pós-Graduação em Estatística

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCA UFES Departamento de Computação Aprendizado de Máquina Inteligência Artificial Site: http://jeiks.net E-mail: jacsonrcsilva@gmail.com

Leia mais

Aula 3: Random Forests

Aula 3: Random Forests Aula 3: Random Forests Paulo C. Marques F. Aula ministrada no Insper 26 de Fevereiro de 2016 Insper Random Forests 26 de Fevereiro de 2016 1 / 18 Árvores de classificação Estamos no mesmo contexto de aprendizagem

Leia mais

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE Engenharia de Computação Professor: Rosalvo Ferreira de Oliveira Neto O processo de descoberta do conhecimento - KDD Roteiro Introdução Definição Etapas Desafios

Leia mais

Aprendizagem de Máquina. Prof. Júlio Cesar Nievola PPGIA - PUCPR

Aprendizagem de Máquina. Prof. Júlio Cesar Nievola PPGIA - PUCPR Aprendizagem de Máquina Prof. Júlio Cesar Nievola PPGIA - PUCPR Introdução Justificativa Recente progresso em algoritmos e teoria Disponibilidade crescente de dados online Poder computacional disponível

Leia mais

Fundamentos de Inteligência Artificial [5COP099]

Fundamentos de Inteligência Artificial [5COP099] Fundamentos de Inteligência Artificial [5COP099] Dr. Sylvio Barbon Junior Saulo Martiello Mastelini Departamento de Computação - UEL 1 o Semestre Assunto Aula 11 Modelos Preditivos - Árvore de Decisão

Leia mais

2284-ELE/5, 3316-IE/3. Universidade da Beira Interior, Departamento de Informática

2284-ELE/5, 3316-IE/3. Universidade da Beira Interior, Departamento de Informática INTELIGÊNCIA ARTIFICIAL 2284-ELE/5, 3316-IE/3 Universidade da Beira Interior, Departamento de Informática Hugo Pedro Proença, 2007/2008 Aprendizagem A aprendizagem é um aspecto crucial da Inteligência

Leia mais

Inteligência Artificial

Inteligência Artificial Aprendizagem por que? lnteligência Artificial Aprendizagem em IA Capacidade de aprender é parte fundamental do conceito de inteligência. Um agente aprendiz é mais flexível aprendizado permite lidar com

Leia mais

Inteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo]

Inteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo] Inteligência Artificial Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo] Aprendizagem de Máquina Área da Inteligência Artificial cujo objetivo é o desenvolvimento de técnicas computacionais sobre

Leia mais

lnteligência Artificial Aprendizagem em IA

lnteligência Artificial Aprendizagem em IA lnteligência Artificial Aprendizagem em IA 1 Aprendizagem por que? Capacidade de aprender é parte fundamental do conceito de inteligência. Um agente aprendiz é mais flexível aprendizado permite lidar com

Leia mais

Prof.: Eduardo Vargas Ferreira

Prof.: Eduardo Vargas Ferreira Universidade Federal do Paraná Laboratório de Estatística e Geoinformação - LEG Introdução Prof.: Eduardo Vargas Ferreira O que é Machine Learning? Estatística Data Mining 2 O que é Machine Learning? Estatística

Leia mais

Análise de regressão linear simples. Diagrama de dispersão

Análise de regressão linear simples. Diagrama de dispersão Introdução Análise de regressão linear simples Departamento de Matemática Escola Superior de Tecnologia de Viseu A análise de regressão estuda o relacionamento entre uma variável chamada a variável dependente

Leia mais

Roteiro. PCC142 / BCC444 - Mineração de Dados. Cenário

Roteiro. PCC142 / BCC444 - Mineração de Dados. Cenário Roteiro PCC142 / BCC444 - Mineração de Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br www.decom.ufop.br/luiz Introdução Tarefas

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Tópicos Aprendizado de Máquina Aula 3 http://www.ic.uff.br/~bianca/aa/. Introdução Cap. (6/03). Classificação Indutiva Cap. (3/03) 3. Cap. 3 (30/03) 4. Ensembles - Artigo (06/04) 5. Avaliação Experimental

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCA UFES Departamento de Computação Aprendizado de Máquina Inteligência Artificial Site: http://jeiks.net E-mail: jacsonrcsilva@gmail.com

Leia mais

2 Modelos Não Lineares

2 Modelos Não Lineares Modelos Não Lineares 17 2 Modelos Não Lineares 2.1. Introdução Nos últimos anos, muitos modelos não-lineares para a análise de séries temporais têm sido propostos. Na econometria clássica, os modelos de

Leia mais

Prof. Daniela Barreiro Claro

Prof. Daniela Barreiro Claro O volume de dados está crescendo sem parar Gigabytes, Petabytes, etc. Dificuldade na descoberta do conhecimento Dados disponíveis x Análise dos Dados Dados disponíveis Analisar e compreender os dados 2

Leia mais

Aprendizado de Máquinas

Aprendizado de Máquinas Aprendizado de Máquinas Objetivo A área de aprendizado de máquina preocupa-se em construir programas que automaticamente melhorem seu desempenho com a experiência. Conceito AM estuda métodos computacionais

Leia mais

Análise Discriminante

Análise Discriminante Universidade Técnica de Lisboa INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO Informática e Sistemas de Informação Aplicados em Economia Análise Discriminante Análise Discriminante 1 Análise discriminante - A

Leia mais

Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si

Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si Classificação de Dados Os modelos de classificação de dados são preditivos, pois desempenham inferências

Leia mais

Introdução ao Data Mining. Sumário

Introdução ao Data Mining. Sumário Introdução ao Data Mining Instituto Nacional de Estatística 20-24 de Abril de 2009 Módulo 1 - Data Warehousing e Data Mining - André Falcão (afalcao@di.fc.ul.pt) Graça Gaspar (gg@di.fc.ul.pt) Sumário Data-mining

Leia mais

Inteligência Artificial

Inteligência Artificial https://www.pinterest.com/carlymundo/decision-tree-infographics/ Universidade Federal de Campina Grande Departamento de Sistemas e Computação Pós-Graduação em Ciência da Computação Inteligência Artificial

Leia mais

Considerações de Desempenho

Considerações de Desempenho Back Propagation Considerações de Desempenho Dicas para o BP O uso da função de ativação simétrica geralmente acelera o treinamento TANH +1 logistic linear 0 tanh -1-4 +4 1 Dicas para o BP Os pesos devem

Leia mais

Aurora Trinidad Ramirez Pozo Universidade Federal do Paraná

Aurora Trinidad Ramirez Pozo Universidade Federal do Paraná Aurora Trinidad Ramirez Pozo Universidade Federal do Paraná 1 Um dos métodos práticos mais usados Induz funções discretas robustas a ruído Capaz de aprender expressões disjuntivas Se pais = Inglaterra

Leia mais

Aprendizagem a partir de Observações

Aprendizagem a partir de Observações Aprendizagem a partir de Observações Descrição de agentes que podem melhorar o seu comportamento a partir do estudo diligente das próprias experiências Índice Formas de aprendizagem Aprendizagem indutiva

Leia mais

KDD E MINERAÇÃO DE DADOS

KDD E MINERAÇÃO DE DADOS KDD E MINERAÇÃO DE DADOS O Processo de KDD: Visão Geral Prof. Ronaldo R. Goldschmidt ronaldo@de9.ime.eb.br rribeiro@univercidade.br geocities.yahoo.com.br/ronaldo_goldschmidt CARACTERIZAÇÃO ÁREAS DE ORIGEM

Leia mais

Aprendizado em IA. Prof. Carlos H. C. Ribeiro ITA Divisão de Ciência da Computação

Aprendizado em IA. Prof. Carlos H. C. Ribeiro ITA Divisão de Ciência da Computação Aprendizado em IA Prof. Carlos H. C. Ribeiro ITA Divisão de Ciência da Computação Tópicos Agentes baseados em aprendizado Aprendizado indutivo Árvores de decisão Método ID3 Aprendizado em redes neurais

Leia mais

KDD E MINERAÇÃO DE DADOS

KDD E MINERAÇÃO DE DADOS KDD E MINERAÇÃO DE DADOS O Processo de KDD: Visão Geral Prof. Ronaldo R. Goldschmidt Instituto Militar de Engenharia Seção de Engenharia de Computação (SE/8) ronaldo.rgold@ime.eb.br / ronaldo.rgold@gmail.com

Leia mais

Conceitos de Aprendizagem de Máquina e Experimentos. Visão Computacional

Conceitos de Aprendizagem de Máquina e Experimentos. Visão Computacional Conceitos de Aprendizagem de Máquina e Experimentos Visão Computacional O que você vê? 2 Pergunta: Essa imagem tem um prédio? Classificação 3 Pergunta: Essa imagem possui carro(s)? Detecção de Objetos

Leia mais

Back Propagation. Dicas para o BP

Back Propagation. Dicas para o BP Back Propagation Considerações de Desempenho Dicas para o BP O uso da função de ativação simétrica geralmente acelera o treinamento TANH +1 logistic linear 0 tanh -1-4 +4 11 Dicas para o BP Os pesos devem

Leia mais

Introdução à Mineração de Dados com Aplicações em Ciências Espaciais

Introdução à Mineração de Dados com Aplicações em Ciências Espaciais Introdução à Mineração de Dados com Aplicações em Ciências Espaciais Escola de Verão do Laboratório Associado de Computação e Matemática Aplicada Rafael Santos Dia 2: 1 /59 Programa Dia 1: Apresentação

Leia mais

2 Mineração de Dados Processo de Busca de Conhecimento (KDD) 2 Mineração de Dados

2 Mineração de Dados Processo de Busca de Conhecimento (KDD) 2 Mineração de Dados 2 Mineração de Dados 2 Mineração de Dados A mineração de dados, ou data mining, é uma das principais etapas do processo de busca de conhecimento. Este conceito é utilizado para identificar técnicas avançadas

Leia mais

Seleção de Atributos 1

Seleção de Atributos 1 Seleção de Atributos 1 Tópicos Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Seleção de atributos antes do aprendizado Benefícios Abordagens automáticas

Leia mais

APRENDIZAGEM DE MÁQUINA

APRENDIZAGEM DE MÁQUINA APRENDIZAGEM DE MÁQUINA (usando Python) Thiago Marzagão ÁRVORE DE DECISÃO & VALIDAÇÃO Thiago Marzagão APRENDIZAGEM DE MÁQUINA 1 / 20 árvore de decisão Aulas passadas: queríamos prever variáveis quantitativas.

Leia mais

Exame de Aprendizagem Automática

Exame de Aprendizagem Automática Exame de Aprendizagem Automática 2 páginas com 12 perguntas e 3 folhas de resposta. Duração: 2 horas e 30 minutos DI, FCT/UNL, 12 de Janeiro de 2017 Nota: O exame está cotado para 40 valores. Os 20 valores

Leia mais

Árvores de Decisão. Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Departamento de Ciências de Computação

Árvores de Decisão. Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Departamento de Ciências de Computação Árvores de Decisão Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Departamento de Ciências de Computação Rodrigo Fernandes de Mello mello@icmc.usp.br Árvores de Decisão Método

Leia mais

TCE Informática Pré-Processamento de Dados Prof. Marcelo Ribeiro

TCE Informática Pré-Processamento de Dados Prof. Marcelo Ribeiro TCE Informática Pré-Processamento de Dados Prof. Marcelo Ribeiro www.acasadoconcurseiro.com.br Informática PRÉ-PROCESSAMENTO DE DADOS EM DATA MINING Técnicas de pré-processamento e transformação de dados

Leia mais

Aprendizagem a partir de observações. Capítulo 18

Aprendizagem a partir de observações. Capítulo 18 Aprendizagem a partir de observações Capítulo 18 Descrição de agentes que podem melhorar o seu comportamento a partir do estudo diligente das próprias experiências Índice Formas de aprendizagem Aprendizagem

Leia mais

BANCO DE DADOS DISTRIBUÍDOS e DATAWAREHOUSING Asterio K. Tanaka

BANCO DE DADOS DISTRIBUÍDOS e DATAWAREHOUSING Asterio K. Tanaka BANCO DE DADOS DISTRIBUÍDOS e DATAWAREHOUSING Asterio K. Tanaka http://www.uniriotec.br/~tanaka/tin0036 tanaka@uniriotec.br Introdução a Data Mining Árvores de Decisão Categorização de Dados Parte II Rogério

Leia mais

Seleção de Atributos FSS. Relevância de Atributos. Relevância de Atributos. Seleção de Atributos - FSS. FSS como Busca no Espaço de Estados

Seleção de Atributos FSS. Relevância de Atributos. Relevância de Atributos. Seleção de Atributos - FSS. FSS como Busca no Espaço de Estados Seleção FSS Alguns indutores geralmente degradam seu desempenho quando são fornecidos muitos atributos irrelevantes para o conceito a ser aprendido Feature Subset Selection (FSS) é o processo de selecionar

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCENS UFES Departamento de Computação Aprendizado de Máquina Inteligência Artificial Site: http://jeiks.net E-mail: jacsonrcsilva@gmail.com

Leia mais

Métodos baseados em árvores

Métodos baseados em árvores Universidade Federal do Paraná Laboratório de Estatística e Geoinformação - LEG Métodos baseados em árvores Profs.: Eduardo Vargas Ferreira Walmes Marques Zeviani Introdução Nesta seção vamos descrever

Leia mais

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Regressão. David Menotti.

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Regressão. David Menotti. Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica Regressão David Menotti www.inf.ufpr.br/menotti/ci171-182 Hoje Regressão Linear ( e Múltipla ) Não-Linear ( Exponencial / Logística

Leia mais

Data Mining. O Processo de KDD. Mauricio Reis

Data Mining. O Processo de KDD. Mauricio Reis 1 Data Mining O Processo de KDD Mauricio Reis prof_uva@mreis.info http://mreis.info/uva-2016-9-datamining 2 ROTEIRO 1. Definição 2. Aplicação KDD problema recursos resultados 3. Área de origem 4. Histórico

Leia mais

MÉTODOS NÃO MÉTRICOS. PTC-5001 Reconhecimento de Padrões (aula11) PTC-5001 Reconhecimento de Padrões (aula11)

MÉTODOS NÃO MÉTRICOS. PTC-5001 Reconhecimento de Padrões (aula11) PTC-5001 Reconhecimento de Padrões (aula11) MÉTODOS NÃO MÉTRICOS Introdução Métodos métricos (já estudados): utilizam vetores de características com valores reais e discretos e com métricas estabelecidas Métodos não métricos: estudam os dados nominais

Leia mais

Modelos para Regressão. Modelos lineares. Exemplo. Método de regressão linear

Modelos para Regressão. Modelos lineares. Exemplo. Método de regressão linear Modelos ara Regressão Pretende-se arender a redizer o valor de uma variável (atributo) numérica. Os atributos (ou variáveis) usados como entrada ara o algoritmo de arendizagem dizem-se reditores odendo

Leia mais

Aprendizagem a partir de observações

Aprendizagem a partir de observações Aprendizagem a partir de observações Aprendizagem é essencial para ambientes desconhecidos, i.e., quando o projetista não prevê tudo Útil como um método de construção de sistemas i.e., expor o agente à

Leia mais