Mineração de Dados - Introdução. Elaine Ribeiro de Faria UFU 2018
|
|
- Eric Garrido
- 5 Há anos
- Visualizações:
Transcrição
1 Mineração de Dados - Introdução Elaine Ribeiro de Faria UFU
2 Mineração de Dados Processo de automaticamente descobrir informação útil em grandes repositórios de dados Tan P., SteinBack M. e Kumar V. Introduction to Data Mining, Pearson, 2006
3 Mineração de Dados Motivação Grandes quantidades de dados geradas Dados de alta dimensionalidade Dados heterogêneos e complexos Dados distribuídos Análise não tradicional
4 Mineração de Dados Exemplos de aplicação Negócios Padrões de compra/ligações Marketing Logs da Web Melhor design de sites Detecção de fraude Agrupamento de clientes Bioinformática Genes importantes Sintomas associados a doenças
5 Mineração de Dados e Aprendizado de Máquina Figura retirada dos slides do Prof. Ricardo Campello ICMC-USP
6 Descoberta do conhecimento em bases de dados - KDD Fayyad U. et al. Knowledge Discovery and Data Mining: Towards a Unfiying Framework, KDD 96, 1996
7 Mineração de Dados Tarefas de mineração Tarefas Preditivas Classificação Regressão Detecção de Anomalias Tarefas Descritivas Agrupamento Descoberta de Regras de Associação Descoberta de Padrões Sequenciais
8 Qual a diferença entre agrupamento e classificação Agrupamento Aprendizado não-supervisionado sem rótulo Classificação Aprendizado supervisionado usa os rótulos
9 Classificação Atribuir objetos a uma dentre várias categorias prédefinidas Ex.: Classificação de letras e números Reconhecimento de faces Análise de crédito Diagnóstico médico 9
10 Classificação Dado um conjunto de registros (conjunto de treinamento ) Cada registro contém um conjunto de atributos, sendo que um dos atributos é a classe. Encontrar um modelo para o atributo classe como uma função dos valores dos outros atributos. Objetivo: a partir de registros não vistos previamente associar uma classe com base nomodelo. Um conjunto de teste é usado para determinar a acurácia do modelo. Usualmente, o conjunto de dados é divido em treino e teste, sendo que o treino é usado para construir o modelo e o teste para validálo. Retirado de: Tan, Steinbach, Kumar - Introduction to Data Mining 10
11 Exemplo de Classificação Nome Idade Renda Pagador João <30 Média Bom Ana Alta Bom Pedro Alta Bom Maria Baixa Ruim Paulo <30 Baixa Ruim Aldo >60 Alta Ruim Base de Dados Treinamento Construção de um Modelo de Decisão Algoritmo Se idade = e Renda = Alta então Pagador = Bom Se renda = baixa então Pagador = Ruim Modelo
12 Exemplo de Classificação Nome Idade Renda Pagador Ivo Baixa???? Se idade = e Renda = Alta então Pagador = Bom Se renda = baixa então Pagador = Ruim Ruim Novo Dado Classificador Classificação
13 10 10 Exemplo de Classificação Tid Refund Marital Status Taxable Income Cheat class Refund Marital Status Taxable Income Cheat 1 Yes Single 125K No No Single 75K? 2 No Married 100K No Yes Married 50K? 3 No Single 70K No No Married 150K? 4 Yes Married 120K No Yes Divorced 90K? 5 No Divorced 95K Yes 6 No Married 60K No 7 Yes Divorced 220K No No Single 40K? No Married 80K? Conjunto de Teste 8 No Single 85K Yes 9 No Married 75K No 10 No Single 90K Yes Conjunto de Treino Construir Classificador Modelo Retirado de: Tan, Steinbach, Kumar - Introduction to Data Mining 13
14 Agrupamento Dado um conjunto de registros, cada um deles contendo um conjunto de atributos, e uma medida de similaridade entre eles, encontrar grupos tais que Registros em um cluster são mais similares uns aos outros. Registros em clusters distintos são menos similares uns aos outros. Medidas de similaridade: Distância Euclidiana se os atributos são contínuos. Medidas específicas para outros problemas. Retirado de: Tan, Steinbach, Kumar - Introduction to Data Mining 14
15 Agrupamento xdistância Euclidiana baseada em um agrupamento no espaço 3D. Distâncias intraclusters são minimizadas Distâncias interclusters são maximizadas Retirado de: Tan, Steinbach, Kumar - Introduction to Data Mining 15
16 Exemplo de Agrupamento Nome Idade Peso João Ana Pedro Maria Aplicação de uma técnica agrupamento João Maria Paulo Paulo Aldo Ana Pedro Aldo
17 Regressão Predizer um valor de uma dada variável de valor contínuo baseado no valor dos outros atributos Muito estudado em estatística e redes neurais. Exemplos: Predizer a quantidade de vendas de um novo produto baseado nas despesas com publicidade Predizer a velocidade do vento como uma função da temperatura, umidade e pressão do ar, etc. Predição de séries temporais dos índices do mercado de ações 17
18 Entendo melhor a tarefa de classificação 18
19 Classificação Binária Mais comum Dados podem pertencer a uma dentre 2 classes Classe positiva Classe negativa 19
20 Classificação Avançada Classificação com uma única classe Detecção de Novidades Data Streams Classificação Multiclasses Classificação Hierárquica Classificação Multi-rótulo Classificação com Ranking Classificação com múltiplas instâncias 20
21 Técnicas de classificação Exemplos de técnicas de classificação K-vizinhos mais próximos Árvores de Decisão Métodos basedos em regras Redes Neurais Naive Bayes Support Vector Machines (SVM) 21
22 K-vizinhos mais próximos Aprendizado baseado em instância Classifica de acordo com distância aos vizinhos Simples Armazenamento de dados (não há modelo explícito) 22
23 K-vizinhos mais próximos Para cada novo exemplo Definir a classe dos k exemplos mais próximos Classificar exemplo na classe majoritária de seus vizinhos 23
24 K-vizinhos mais próximos Quantos vizinhos K muito grande Vizinhos podem ser muito diferentes Predição tendenciosa para classe majoritária Custo computacional mais elevado K muito pequeno Não usa informação suficiente Previsão pode ser instável Distâncias podem ser ponderadas 24
25 10 Árvore de Decisão - Exemplo categorical Tid Refund Marital Status categorical Taxable Income continuous Cheat class Splitting Attributes 1 Yes Single 125K No 2 No Married 100K No 3 No Single 70K No 4 Yes Married 120K No 5 No Divorced 95K Yes 6 No Married 60K No 7 Yes Divorced 220K No 8 No Single 85K Yes Refund Yes No NO MarSt Single, Divorced TaxInc < 80K > 80K NO 9 No Married 75K No 10 No Single 90K Yes NO YES Model: Decision Tree Retirado de: Tan, Steinbach, Kumar - Introduction to Data Mining 25
26 10 Árvore de Decisão - Exemplo Tid Refund Marital Status Taxable Income 1 Yes Single 125K No 2 No Married 100K No Cheat class Married NO MarSt Yes Single, Divorced Refund No 3 No Single 70K No NO TaxInc 4 Yes Married 120K No < 80K > 80K 5 No Divorced 95K Yes 6 No Married 60K No NO YES 7 Yes Divorced 220K No 8 No Single 85K Yes 9 No Married 75K No 10 No Single 90K Yes There could be more than one tree that fits the same data! Retirado de: Tan, Steinbach, Kumar - Introduction to Data Mining 26
27 Tarefa de classificação usando árvores de decisão Retirado de: Tan, Steinbach, Kumar - Introduction to Data Mining 27
28 10 Apply Model to Test Data Start from the root of tree. Test Data Refund Marital Status Taxable Income Cheat Yes Refund No No Married 80K? NO Single, Divorced MarSt Married TaxInc < 80K > 80K NO NO YES Retirado de: Tan, Steinbach, Kumar - Introduction to Data Mining
29 10 Apply Model to Test Data Test Data Refund Marital Status Taxable Income Cheat Yes Refund No No Married 80K? NO MarSt Single, Divorced Married TaxInc NO < 80K > 80K NO YES Retirado de: Tan, Steinbach, Kumar - Introduction to Data Mining
30 10 Apply Model to Test Data Test Data Refund Marital Status Taxable Income Cheat Yes Refund No No Married 80K? NO MarSt Single, Divorced Married TaxInc NO < 80K > 80K NO YES Retirado de: Tan, Steinbach, Kumar - Introduction to Data Mining
31 10 Apply Model to Test Data Test Data Refund Marital Status Taxable Income Cheat Yes Refund No No Married 80K? NO MarSt Single, Divorced Married TaxInc NO < 80K > 80K NO YES Retirado de: Tan, Steinbach, Kumar - Introduction to Data Mining
32 10 Apply Model to Test Data Test Data Refund Marital Status Taxable Income Cheat Yes Refund No No Married 80K? NO Single, Divorced MarSt Married TaxInc < 80K > 80K NO NO YES Retirado de: Tan, Steinbach, Kumar - Introduction to Data Mining
33 10 Apply Model to Test Data Test Data Refund Marital Status Taxable Income Cheat Refund No Married 80K? Yes No NO Single, Divorced MarSt Married Assign Cheat to No TaxInc NO < 80K > 80K NO YES Retirado de: Tan, Steinbach, Kumar - Introduction to Data Mining
34 General Structure of Hunt s Algorithm Let D t be the set of training records that reach a node t General Procedure: If D t contains records that belong the same class y t, then t is a leaf node labeled as y t If D t is an empty set, then t is a leaf node labeled by the default class, y d If D t contains records that belong to more than one class, use an attribute test to split the data into smaller subsets. Recursively apply the procedure to each subset.? D t Retirado de: Tan, Steinbach, Kumar - Introduction to Data Mining
35 10 Hunt s Algorithm Tid Refund Marital Status Taxable Income 1 Yes Single 125K No Cheat Don t Cheat Yes Don t Cheat Refund No Don t Cheat 2 No Married 100K No 3 No Single 70K No 4 Yes Married 120K No 5 No Divorced 95K Yes 6 No Married 60K No 7 Yes Divorced 220K No Yes Refund No Yes Refund No 8 No Single 85K Yes 9 No Married 75K No 10 No Single 90K Yes Don t Cheat Single, Divorced Cheat Marital Status Married Don t Cheat Don t Cheat Single, Divorced Taxable Income Marital Status Married Don t Cheat < 80K >= 80K Don t Cheat Cheat Retirado de: Tan, Steinbach, Kumar - Introduction to Data Mining
36 Indução da árvore Estratégia Gulos Dividir os registros basead em um atributo teste que otimiza um certo critério. Questões Determinar como dividir os registros Como escolher o atributo de teste Como determinar a melhor divisão? Determinar quando parar a divisão Retirado de: Tan, Steinbach, Kumar - Introduction to Data Mining
37 Como especificar uma condição de teste Depende do tipo do atributo Nominal Ordinal Contínuo Depende do número de modos de dividir 2 divisões Mais que 2 divisões Retirado de: Tan, Steinbach, Kumar - Introduction to Data Mining
38 Como determinar a melhor divisão Proposta gulosa: Nós com distribuição de classe homogênea são prefereidos Medida de impureza de um nó: Não-homogêneo, Alto nível de impureza Homogêneo, Baixo nível de impureza Retirado de: Tan, Steinbach, Kumar - Introduction to Data Mining
39 Medidas de Impureza de um nó Índice de Gini Entropia Erro de classificação Retirado de: Tan, Steinbach, Kumar - Introduction to Data Mining
40 Entendo melhor a tarefa de agrupamento 40
41 Agrupamento - definições Análise de grupos ou clusters é o estudo de algoritmos e métodos para agrupar objetos de acordo com suas características. Cluster (grupo) é uma aglomeração de pontos no espaço tal que a distância entre quaisquer dois pontos no cluster é menor que a distância entre qualquer ponto no cluster e qualquer ponto que não está nele. Jain, A. K.; Dubes, R. C. Algorithms for Clustering Data, Prentice Hall, 1988.
42 Agrupamento Figura retirada dos slides do prof. André C. P. L. F. Carvalho disciplina Aprendizado de Máquina ICMC-USP
43 Agrupamento - questões O que é um grupo ideal? Quantos grupos devem ser formados? Há um agrupamento natural dos dados? Como podemos definir o que é semelhante?
44 Agrupamento Quantos grupos? Tan P., SteinBack M. e Kumar V. Introduction to Data Mining, Pearson, 2006
45 Agrupamento Quantos grupos? Tan P., SteinBack M. e Kumar V. Introduction to Data Mining, Pearson, 2006
46 Agrupamento Quantos grupos? Tan P., SteinBack M. e Kumar V. Introduction to Data Mining, Pearson, 2006
47 Agrupamento Quantos grupos? Tan P., SteinBack M. e Kumar V. Introduction to Data Mining, Pearson, 2006
48 Agrupamento Como agrupar os objetos?? Alguns dos possíveis agrupamento Keogh, E. A g. Introduction to Machine Learning and Data Mining for the Database Community, SBBD 2003, Manaus.
49 Agrupamento - questões Dados de entrada Agrupamento desejado JAIN, A. K Data Clustering: 50 Years Beyond K-Means, Pattern Recognition Letters, vol. 31, n 8, 2010.
50 Agrupamento Semelhança entre objetos Keogh, E. A g. Introduction to Machine Learning and Data Mining for the Database Community, SBBD 2003, Manaus.
51 Tipos de Agrupamento Seja X = {x 1, x 2,..., x n } o conjunto de todos os dados Tarefa: colocar cada Xi em um dos m clusters C 1, C 2,..., C m Clusters podem ser de dois tipos: Tipo 1: duro (crisp) Tipo 2: fuzzy
52 Tipos de Agrupamento Cluster Crisp Cada exemplo X i pertence ou não a cada cluster C j Exemplo em C i é mais semelhante a outros em C i que àqueles em C j, i j
53 Tipos de Agrupamento Cluster Fuzzy Usa uma função de pertinência para definir o quanto um elemento pertence a um grupo
54 Diferentes Tipos de Agrupamento Agrupamento Particional Divisão do conjunto de dados em grupos (não sobrepostos) tal que cada objeto está em exatamente um grupo X Agrupamento Hierárquico Conjunto de grupos aninhados que estão organizados como uma árvore Cada nó (grupo) na árvore (exceto as folhas) é a união de dos seus filhos (subgrupos) A raiz contém todos os objetos da base
55 Diferentes Tipos de Agrupamento Keogh, E. A g. Introduction to Machine Learning and Data Mining for the Database Community, SBBD 2003, Manaus.
56 Diferentes Tipos de Agrupamento Exclusivo Associa cada objeto a um único cluster X Sobreposição (não exclusivo) Um objeto pode pertencer simultaneamente a mais que um grupo X Fuzzy Cada objeto pertence a cada grupo com um grau de pertinência entre 0 e 1
57 Diferentes Tipos de Agrupamento Completo Associa cada objeto a um cluster Parcial X Não associa cada objeto a um cluster Motivação: alguns objetos no conjunto de dados podem não pertencer a grupos bem definidos Ex: ruídos ou outliers
58 Algoritmos Particionais Características São baseados na minimização de uma função de custo Objetos agrupados em um número K de grupos Cada objeto é agrupado no grupo que minimiza a função de custo Uma única partição é obtida Vantagem Um objeto pode mudar de grupo ao longo do agrupamento
59 k-means Selecione K objetos como centróides Repita Forme K grupos associando cada objeto ao seu centróide mais próximo Recalcule os centróides de cada grupo Até que Convergência seja obtida
60 k-means Videos no youtube sobre K-Means KX4 e3e
61 k-means Centróides iniciais Ex de Técnica: Escolher aleatoriamente objetos do conjunto de dados Associar um objeto ao seu grupo mais próximo Usar uma medida de proximidade que quantifica a noção de mais próximo Ex: usar distância Euclidiana
62 k-means Critérios de Convergência Número máximo de iterações é obtido Limiar mínimo de mudanças nos centróides
63 k-means Função Objetivo Objetivo do agrupamento Minimizar a distância quadrada de cada objeto ao seu centróide mais próximo J k c 1 x j C d( x c j, x c 2 ) d: distância Euclidiana
64 k-means Limitações Escolha do valor de K Problemas quando os grupos têm Diferentes densidades Formatos não hiper-esféricos Problemas quando os dados possuem outliers
65 Agrupamento Após realizar o agrupamento o problema acabou? Não, agora é preciso interpretar os resultados obtidos!!!! Analisar e avaliar o agrupamento!
66 Tarefa Sugestão de leitura Tan P., SteinBack M. e Kumar V. Introduction to Data Mining, Pearson Leitura dos Capítulo 1, 3, 4, 7 e 8
67 FIM Dúvidas?? 67
Mineração em Data Streams - Clustering. Profa. Elaine Faria UFU
Mineração em Data Streams - Clustering Profa. Elaine Faria UFU - 2018 Mineração de Dados Tarefas de mineração Tarefas Preditivas Classificação Regressão Detecção de Anomalias Tarefas Descritivas Agrupamento
Leia maisSCC0173 Mineração de Dados Biológicos
SCC0173 Mineração de Dados Biológicos Classificação I: Algoritmos 1Rule e KNN Prof. Ricardo J. G. B. Campello SCC / ICMC / USP 1 Créditos O material a seguir consiste de adaptações e extensões dos originais:
Leia maisAprendizado de Máquina (Machine Learning)
Ciência da Computação (Machine Learning) Aula 01 Motivação, áreas de aplicação e fundamentos Max Pereira Nem todo conhecimento tem o mesmo valor. O que torna determinado conhecimento mais importante que
Leia maisAprendizado de Máquina
Aprendizado de Máquina André C. P. L. F. de Carvalho Posdoutorando: Isvani Frias-Blanco ICMC-USP Agrupamento de dados Tópicos Agrupamento de dados Dificuldades em agrupamento Algoritmos de agrupamento
Leia maisMineração de Dados em Biologia Molecular
Mineração de Dados em Biologia Molecular André C. P. L. F. de Carvalho Monitor: Valéria Carvalho Agrupamento de Dados Tópicos Agrupamento de dados Análise de cluster Dificuldades em agrupamento Algoritmos
Leia maisUniversidade de São Paulo Instituto de Ciências Matemáticas e de Computação
Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Francisco A. Rodrigues Departamento de Matemática Aplicada e Estatística - SME Conceitos básicos Classificação não-supervisionada:
Leia maisClustering: k-means e Agglomerative
Tópicos Avançados em Avaliação de Desempenho de Sistemas Jackson Nunes Marco Eugênio Araújo Outubro de 2014 1 Sumário Contextualização Classificação Agrupamento (Clustering) Cenários de Aplicação Clustering
Leia maisAula 7 Medidas de Distância. Profa. Elaine Faria UFU
Aula 7 Medidas de Distância Profa. Elaine Faria UFU - 2017 Agradecimentos Este material é baseado No livro Tan et al, 2006 Nos slides do prof Andre C. P. L. F. Carvalho Agradecimentos Ao professor André
Leia maisIntegração de Mineração de Dados com SGBD Detecção de Agrupamentos
Integração de Mineração de Dados com SGBD Detecção de Agrupamentos Centro de Matemática Computação e Cognição-UFABC Jéssica Andressa de Souza Pós-Graduação em Ciência da Computação Sistemas de Banco de
Leia maisSCC5895 Análise de Agrupamento de Dados
SCC5895 Análise de Agrupamento de Dados Conceituação Prof. Ricardo J. G. B. Campello PPG-CCMC / ICMC / USP Créditos O material a seguir consiste de adaptações e extensões dos originais: gentilmente cedidos
Leia maisOrganização. 1. Introdução 2. Medidas de Similaridade. hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters
Organização. Introdução 2. Medidas de Similaridade 3. Métodos de Agrupamento (métodos hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters Métodos de Partição Cada exemplo
Leia maisTópicos Avançados em IA. Prof. Eduardo R. Hruschka
Tópicos Avançados em IA Prof. Eduardo R. Hruschka Créditos Este material consiste de adaptações dos originais: Elaborados por Eduardo Hruschka e Ricardo Campello de (Tan et al., 2006) de E. Keogh (SBBD
Leia maisINF 1771 Inteligência Artificial
Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 18 Aprendizado Não-Supervisionado Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor
Leia maisRedes Neurais (Inteligência Artificial)
Redes Neurais (Inteligência Artificial) Aula 16 Aprendizado Não-Supervisionado Edirlei Soares de Lima Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest
Leia maisClassificação: Árvores de Decisão e k-nn. Eduardo Raul Hruschka
Classificação: Árvores de Decisão e k-nn Eduardo Raul Hruschka Agenda: Conceitos de Classificação Técnicas de Classificação One Rule (1R) Naive Bayes (com seleção de atributos) Árvores de Decisão K-Vizinhos
Leia maisANÁLISE DE AGRUPAMENTOS
ANÁLISE DE AGRUPAMENTOS Análise de Agrupamentos 2 Definição Consistem em encontrar grupos de objetos entre os objetos Categorizá-los ou agrupá-los Tipo de aprendizado não supervisionado Encontrar grupos
Leia maisCréditos. SCC0173 Mineração de Dados Biológicos. Aula de Hoje. Introdução. Classificação III: Árvores de Decisão
SCC073 Mineração de Dados Biológicos Classificação III: Árvores de Decisão Créditos O material a seguir consiste de adaptações e extensões dos originais: gentilmente cedidos pelo Prof. André C. P. L. F.
Leia maisAula 6 Mineração Streams Representação dos Dados. Profa. Elaine Faria UFU
Aula 6 Mineração Streams Representação dos Dados Profa. Elaine Faria UFU - 2017 Agradecimentos Este material é baseado No livro Tan et al, 2006 Nos slides do prof. Andre C. P. L. F. Carvalho Agradecimentos
Leia maisSCC5895 Análise de Agrupamento de Dados
SCC5895 Análise de Agrupamento de Dados Introdução Prof. Eduardo Raul Hruschka PPG-CCMC / ICMC / USP Créditos O material a seguir consiste de adaptações e extensões dos originais: Elaborados por Eduardo
Leia maisClassificação: Árvores de Decisão e k-nn. Eduardo Raul Hruschka
Classificação: Árvores de Decisão e k-nn Eduardo Raul Hruschka Árvores de Decisão Métodos para aproximar funções discretas, representadas por meio de uma árvore de decisão; Árvores de decisão podem ser
Leia maisClassificação: Definição. Classificação: conceitos básicos e árvores de decisão. Exemplos de Tarefas de Classificação
Classificação: Definição Mineração de dados Classificação: conceitos básicos e árvores de decisão Apresentação adaptada do material de apoio do livro: Introduction to Data Mining Tan, Steinbach, Kumar
Leia maisInteligência Artificial Agrupamento de Dados. prof. Dr. Rogério R. de Vargas. Universidade Estadual de Santa Cruz - UESC. Ilhéus-Ba, Outubro de 2013
Inteligência Artificial de prof. Dr. Rogério R. de Vargas Universidade Estadual de Santa Cruz - UESC Ilhéus-Ba, Outubro de 2013 http://rogerio.in slide 1 Introdução http://rogerio.in slide 2 Como agrupar?
Leia maisTrilha Learning Machine Cluster Analysis em 4 passos Marco Siqueira Campos
Trilha Learning Machine Cluster Analysis em 4 passos Marco Siqueira Campos Marco Siqueira Campos Sócio fundador Siqueira Campos Associados e sos-stat Estatístico UFRGS Certificado Data Science Specialization
Leia maisInteligência nos Negócios (Business Inteligente)
Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 7) Fundamentação da disciplina Analise de dados Decisões
Leia maisDescoberta de Conhecimento em Bancos de Dados - KDD
Descoberta de Conhecimento em Bancos de Dados - KDD Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Fases do processo 3. Exemplo do DMC 4. Avaliação
Leia maisAPRENDIZAGEM DE MÁQUINA
APRENDIZAGEM DE MÁQUINA (usando Python) Thiago Marzagão ÁRVORE DE DECISÃO & VALIDAÇÃO Thiago Marzagão APRENDIZAGEM DE MÁQUINA 1 / 20 árvore de decisão Aulas passadas: queríamos prever variáveis quantitativas.
Leia mais3 Técnicas de agrupamento
3 Técnicas de agrupamento Com o advento da internet a quantidade de informação disponível aumentou consideravelmente e com isso, tornou-se necessário uma forma automática de organizar e classificar esta
Leia maisSEL-0339 Introdução à Visão Computacional. Aula 7 Reconhecimento de Objetos
Departamento de Engenharia Elétrica - EESC-USP SEL-0339 Introdução à Visão Computacional Aula 7 Reconhecimento de Objetos Prof. Dr. Marcelo Andrade da Costa Vieira Prof. Dr. Adilson Gonzaga mvieira@sc.usp.br
Leia maisInformática Parte 19 Prof. Márcio Hunecke
Escriturário Informática Parte 19 Prof. Márcio Hunecke Informática NOÇÕES DE ALGORITMOS DE APRENDIZADO O aprendizado automático, aprendizado de máquina (em inglês: "machine learning") ou aprendizagem
Leia maisInteligência Artificial
Universidade Federal de Campina Grande Departamento de Sistemas e Computação Pós-Graduação em Ciência da Computação Inteligência Artificial Aprendizagem Outras Técnicas Prof. a Joseana Macêdo Fechine Régis
Leia maisIntrodução a Sistemas Inteligentes
Introdução a Sistemas Inteligentes Conceituação Prof. Ricardo J. G. B. Campello ICMC / USP Créditos Parte do material a seguir consiste de adaptações e extensões dos originais gentilmente cedidos pelo
Leia maisMineração de Dados. Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri
Mineração de Dados Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri 1 Motivação Aumento da capacidade de processamento e de armazenamento de dados; Baixo custo; Grande quantidade de dados
Leia maisThiago Marzagão 1. 1 Thiago Marzagão (Universidade de Brasília) MINERAÇÃO DE DADOS 1 / 21
MINERAÇÃO DE DADOS Thiago Marzagão 1 1 marzagao.1@osu.edu ÁRVORE DE DECISÃO & VALIDAÇÃO Thiago Marzagão (Universidade de Brasília) MINERAÇÃO DE DADOS 1 / 21 árvore de decisão Aulas passadas: queríamos
Leia mais2COP229 Inteligência Computacional. Aula 3. Clusterização.
Aula 3 Clusterização Sumário (Clusterização) - Introdução - Aprendizado Não Supervisionado - Aprendizado Supervisionado - Introdução: Clusterização - Etapas para o processo de Clusterização - Distância
Leia maisAprendizado de Máquina (Machine Learning)
Ciência da Computação Aprendizado de Máquina (Machine Learning) Aula 09 Árvores de Decisão Max Pereira Classificação É a tarefa de organizar objetos em uma entre diversas categorias pré-definidas. Exemplos
Leia maisUNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica
REDES NEURAIS ARTIFICIAIS MÁQUINA DE VETOR DE SUPORTE (SUPPORT VECTOR MACHINES) Prof. Dr. André A. P. Biscaro 1º Semestre de 2017 Introdução Poderosa metodologia para resolver problemas de aprendizagem
Leia maisIA: Aprendizado IV. Professor Paulo Gurgel Pinheiro. 30 de Setembro de 2010
IA: Aprendizado IV Professor Paulo Gurgel Pinheiro MC906A - Inteligência Articial Instituto de Computação Universidade Estadual de Campinas - UNICAMP 30 de Setembro de 2010 1 / 75 http://www.ic.unicamp.br/
Leia maisMineração de Dados em Biologia Molecular
Mineração de Dados em Biologia Molecular Principais tópicos André C. P. L. F. de Carvalho Monitor: Valéria Carvalho Métodos baseados em distância Aprendizado baseado em instâncias Conceitos básicos KNN
Leia maisSCC5895 Análise de Agrupamento de Dados
SCC89 Análise de Agrupamento de Dados Algoritmos Hierárquicos (Parte I) Prof. Eduardo Raul Hruschka PPG-CCMC / ICMC / USP Créditos O material a seguir consiste de adaptações e etensões dos originais: Elaborados
Leia maisAprendizado de Máquina
Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCA UFES Departamento de Computação Aprendizado de Máquina Inteligência Artificial Site: http://jeiks.net E-mail: jacsonrcsilva@gmail.com
Leia maisAprendizagem de Máquinas
Universidade Federal do Rio Grande do Norte Departamento de Engenharia de Computação e Automação Aprendizagem de Máquinas DCA0121 Inteligência Artificial Aplicada Heitor Medeiros 1 Aprendizagem de Máquinas
Leia maisClassificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si
Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si Classificação de Dados Os modelos de classificação de dados são preditivos, pois desempenham inferências
Leia maisCréditos. SCC0173 Mineração de Dados Biológicos. Conteúdo. Motivação. Agrupamento de Dados Partes I & II: Conceituação e Métodos Hierárquicos
SCC7 Mineração de Dados Biológicos Agrupamento de Dados Partes I & II: Conceituação e Métodos Hierárquicos Prof. Ricardo J. G. B. Campello Créditos O material a seguir consiste de adaptações e etensões
Leia maisInformática. Aprendizado de Máquina. Professor Márcio Hunecke.
Informática Aprendizado de Máquina Professor Márcio Hunecke www.acasadoconcurseiro.com.br Informática Aula XX NOÇÕES DE ALGORITMOS DE APRENDIZADO O aprendizado automático, aprendizado de máquina (em inglês:
Leia maisFundamentos de Inteligência Artificial [5COP099]
Fundamentos de Inteligência Artificial [5COP099] Dr. Sylvio Barbon Junior Departamento de Computação - UEL 1 o Semestre Assunto Aula 10 Modelos Preditivos - Árvore de Decisão 2 de 20 Aula 10 - Árvore de
Leia maisInteligência nos Negócios (Business Inteligente)
Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 6) Fundamentação da disciplina Analise de dados Decisões
Leia maisAprendizado de Máquina
Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCA UFES Departamento de Computação Aprendizado de Máquina Inteligência Artificial Site: http://jeiks.net E-mail: jacsonrcsilva@gmail.com
Leia maisAprendizado de Máquina
Aprendizado de Máquina O que é Aprendizado? Memorizar alguma coisa Aprender fatos por meio de observação e exploração Melhorar habilidades motoras/cognitivas por meio de prática Organizar novo conhecimento
Leia maisUniversidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Tipos de Aprendizagem. Luiz Eduardo S. Oliveira, Ph.D.
Universidade Federal do Paraná Departamento de Informática Reconhecimento de Padrões Tipos de Aprendizagem Luiz Eduardo S. Oliveira, Ph.D. http://lesoliveira.net Objetivos Introduzir diferentes tipos de
Leia maisAprendizagem de Máquina - 2. Prof. Júlio Cesar Nievola PPGIa - PUCPR
Aprendizagem de Máquina - 2 Prof. Júlio Cesar Nievola PPGIa - PUCPR Inteligência versus Aprendizado Aprendizado é a chave da superioridade da Inteligência Humana Para que uma máquina tenha Comportamento
Leia maisAula 8 - Reconhecimento e Interpretação. Prof. Adilson Gonzaga
Aula 8 - Reconhecimento e Interpretação Prof. Adilson Gonzaga Elementos de Visão Computacional: Visão Computacional Processamento de Baio Nível Processamento de Nível Intermediário Processamento de Alto
Leia mais2 Mineração de Dados Processo de Busca de Conhecimento (KDD) 2 Mineração de Dados
2 Mineração de Dados 2 Mineração de Dados A mineração de dados, ou data mining, é uma das principais etapas do processo de busca de conhecimento. Este conceito é utilizado para identificar técnicas avançadas
Leia maisAprendizado de Máquina
Aprendizado de Máquina Aula #8.1 EBS 564 IA Prof. Luiz Fernando S. Coletta luizfsc@tupa.unesp.br Campus de Tupã Conhecimento: abstração (modelo) das relações existentes entre as informações contidas nos
Leia maisAprendizado de Máquinas. Introdução à Aprendizado Não- Supervisionado
Universidade Federal do Paraná (UFPR) Departamento de Informática (DInf) Aprendizado de Máquinas Introdução à Aprendizado Não- Supervisionado David Menotti, Ph.D. http://web.inf.ufpr.br/menotti Objetivos
Leia maisCréditos. SCC5895 Análise de Agrupamento de Dados. Relembrando... Aula de Hoje. Algoritmos Hierárquicos: Parte I. [ x ] T. Algoritmos Hierárquicos
SCC Análise de Agrupamento de Dados Algoritmos Hierárquicos: Parte I Prof Ricardo J G B Campello Créditos O material a seguir consiste de adaptações e etensões dos originais: gentilmente cedidos pelo Prof
Leia maisRedes Neurais não Supervisionadas: SOM
Universidade Federal do Rio Grande do Norte Departamento de Engenharia de Computação e Automação Redes Neurais não Supervisionadas: SOM DCA0121 Inteligência Artificial Aplicada Heitor Medeiros 1 Tópicos
Leia maisAprendizagem de Máquina. Prof. Júlio Cesar Nievola PPGIA - PUCPR
Aprendizagem de Máquina Prof. Júlio Cesar Nievola PPGIA - PUCPR Introdução Justificativa Recente progresso em algoritmos e teoria Disponibilidade crescente de dados online Poder computacional disponível
Leia maisInteligência nos Negócios (Business Inteligente)
Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 7) Fundamentação da disciplina Analise de dados Decisões
Leia maisINF 1771 Inteligência Artificial
INF 1771 Inteligência Artificial Aula 13 K-Nearest Neighbor (KNN) 2016.1 Prof. Augusto Baffa Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor
Leia maisAgregação de Algoritmos de Aprendizado de Máquina (AM) Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta
Agregação de Algoritmos de Aprendizado de Máquina (AM) Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta (luizfsc@icmc.usp.br) Sumário 1. Motivação 2. Bagging 3. Random Forest 4. Boosting
Leia maisBANCO DE DADOS DISTRIBUÍDOS e DATAWAREHOUSING Asterio K. Tanaka
BANCO DE DADOS DISTRIBUÍDOS e DATAWAREHOUSING Asterio K. Tanaka http://www.uniriotec.br/~tanaka/tin0036 tanaka@uniriotec.br Introdução a Data Mining Árvores de Decisão Categorização de Dados Parte II Rogério
Leia maisIntrodução à Mineração de Dados com Aplicações em Ciências Espaciais
Introdução à Mineração de Dados com Aplicações em Ciências Espaciais Escola de Verão do Laboratório Associado de Computação e Matemática Aplicada Rafael Santos Dia 3: 1 /54 Programa Dia 1: Apresentação
Leia maisClustering (k-means, SOM e hierárquicos)
Clustering (k-means, SOM e hierárquicos) André Tavares da Silva andre.silva@udesc.br (Capítulo 10 de Duda e Hart) Clustering Introdução e tipos Roteiro Agrupamentos hierárquicos AGNES, DIANA e Dendogram
Leia maisAula 03: Dados Profa. Ms. Rosângela da Silva Nunes
Aula 03: Dados Profa. Ms. Rosângela da Silva Nunes 1 de 29 Tipos de Conjuntos de dados Registro Tabela do BD Matriz de dados Document 1 Document 2 team coach pla y ball score game wi n lost timeout 3 0
Leia maisWeka. Universidade de Waikato - Nova Zelândia. Coleção de algoritmos de aprendizado de máquina para resolução de problemas de Data Mining
Weka Universidade de Waikato - Nova Zelândia Coleção de algoritmos de aprendizado de máquina para resolução de problemas de Data Mining implementado em Java open source software http://www.cs.waikato.ac.nz/ml/weka/
Leia maisClassificação. Eduardo Raul Hruschka
Classificação Eduardo Raul Hruschka Agenda: Conceitos de Classificação Técnicas de Classificação One Rule (1R) Naive Bayes (com seleção de atributos) Super-ajuste e validação cruzada Combinação de Modelos
Leia maisIntrodução à Mineração de Dados com Aplicações em Ciências Espaciais
Introdução à Mineração de Dados com Aplicações em Ciências Espaciais Escola de Verão do Laboratório Associado de Computação e Matemática Aplicada Rafael Santos Dia 2: 1 /59 Programa Dia 1: Apresentação
Leia maisAgrupamento. Algoritmos e aplicações
Agrupamento Algoritmos e aplicações Equipe Bertha Andaluz (bmca) Deborah Mesquita (dhsm) Lucas Lima (lapl) Lucas Tenório (lvt) Roteiro Motivação Métodos de clustering Modelos de clustering Fuzzy clustering
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Horários Aulas Sala 3 CCET [quinta-feira, 8:20 12:00] Atendimento
Leia maisData Mining. O Processo de KDD. Mauricio Reis
1 Data Mining O Processo de KDD Mauricio Reis prof_uva@mreis.info http://mreis.info/uva-2016-9-datamining 2 ROTEIRO 1. Definição 2. Aplicação KDD problema recursos resultados 3. Área de origem 4. Histórico
Leia maisMineração de Dados e Aprendizado de Máquinas. Rodrigo Leite Durães.
Mineração de Dados e Aprendizado de Máquinas. Rodrigo Leite Durães. O que é mineração de dados Mineração de Dados é um passo no processo de KDD que consiste na aplicação de análise de dados e algoritmos
Leia maisscikit-learn: Aprendizado de máquina 101 com Python
scikit-learn: Aprendizado de máquina 101 com Python Luciana Fujii Campus Party BH 2016 1 / 30 Introdução Aprendizado de máquina Aprendizado de máquina é o campo da ciência da computação que dá aos computadores
Leia maisMineração de Dados para Detecção de Padrões de Mudança de Cobertura da Terra. Padrões e processos em Dinâmica de uso e Cobertura da Terra
Mineração de Dados para Detecção de Padrões de Mudança de Cobertura da Terra Padrões e processos em Dinâmica de uso e Cobertura da Terra Introdução 1 2 3 4 Capacidade de Armazenamento X Análise e Interpretação
Leia maisInteligência Computacional [2COP229]
Inteligência Computacional [2COP229] Mestrado em Ciência da Computação Sylvio Barbon Jr barbon@uel.br (2/41) Tema Aula Árvores de Decisão Aula- Árvore de Decisão (3/41) Sumário Introdução Indução de Árvores
Leia maisINF 1771 Inteligência Artificial
INF 1771 Inteligência Artificial Aula 14 Support Vector Machines (SVM) 2016.1 Prof. Augusto Baffa Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest
Leia maisKDD E MINERAÇÃO DE DADOS
KDD E MINERAÇÃO DE DADOS O Processo de KDD: Visão Geral Prof. Ronaldo R. Goldschmidt ronaldo@de9.ime.eb.br rribeiro@univercidade.br geocities.yahoo.com.br/ronaldo_goldschmidt CARACTERIZAÇÃO ÁREAS DE ORIGEM
Leia maisMB 756 PESQUISA OPERACIONAL APLICADA À PRODUÇÃO. Professor: Rodrigo A. Scarpel
MB 756 PESQUISA OPERACIONAL APLICADA À PRODUÇÃO Professor: Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo Programa do curso: Semana 1 2 Conteúdo Princípios de POAP : 1. O processo decisório
Leia maisMétodos para Classificação: - Naïve Bayes.
Métodos para Classificação: - 1R; - Naïve Bayes. Visão Geral: Simplicidade em primeiro lugar: 1R; Naïve Bayes. 2 Classificação: Tarefa: Dado um conjunto de exemplos préclassificados, construir um modelo
Leia maislnteligência Artificial Introdução a Aprendizado de Máquina
lnteligência Artificial Introdução a Aprendizado de Máquina 1 Aprendizado por que? Capacidade de aprender é parte fundamental do conceito de inteligência. Um agente aprendiz é mais flexível aprendizado
Leia maisProcesso de Descoberta de Conhecimento aplicado ao SIGAA UFPI
Processo de Descoberta de Conhecimento aplicado ao SIGAA UFPI Francisco N. C. de Araújo 1, Vinicius P. Machado 1 1 Departamento de Ciência da Computação Universidade Federal do Piauí (UFPI) Teresina, PI
Leia maisMetodologia de Desenvolvimento de Sistemas Informação
Instituto Superior Politécnico de Ciências e Tecnologia Metodologia de Desenvolvimento de Sistemas Informação Prof Pedro Vunge http://pedrovunge.com I Semestre de 2019 Capítulo 2 TECNOLOGIAS PARA DATA
Leia maisPor que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas
Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas Wrapper Filtros Muitos algoritmos de AM são projetados de modo a selecionar os
Leia maisCluster. Larissa Sayuri Futino Castro dos Santos
Cluster Larissa Sayuri Futino Castro dos Santos Agenda O que faremos Modelos de Mistura LDA Reconhecimento Overview Mét. Particionais E Hierárquicos Melhorias K-Medians K-Medoids K-Modes Mét. Probabilís
Leia maisMétodos de Análise de Dados (AO-802)
Métodos de Análise de Dados (AO-802) DADOS INFORMAÇÃO CONHECIMENTO Rodrigo A. Scarpel rodrigo@ita.br www.ief.ita.br/~rodrigo INTELIGÊNCIA Introdução: Revolução dos Serviços (final anos 80) Dilúvio de dados
Leia maisIntrodução ao Data Mining (Mineração de Dados)
Introdução ao Data Mining (Mineração de Dados) Quem é da área de TI, provavelmente já ouviu sobre Data Mining, mesmo que não saiba o que é. É uma das últimas modas relacionados à BD. Para se ter uma noção
Leia maisData Mining. Felipe E. Barletta Mendes. 21 de maio de 2008
21 de maio de 2008 O foco principal deste material não é apresentar em minúcia todo o contexto de, muito menos o sobre o processo KDD em que a mineração de dados usualmente está inserida. O objetivo é
Leia maisAprendizado de Máquina
Aprendizado de Máquina A necessidade de inserir aprendizado nas máquinas surgiu após a construção dos Sistemas Especialistas (SEs). Os primeiros SEs não possuíam mecanismo de aprendizado e tornavam-se
Leia maisOs Dados. Mineração de Dados 2011
Os Dados Mineração de Dados 2011 Luís Rato (Capítulo 2 do livro Introduction to Data Mining ) Universidade de Évora, 2011 Mineração de dados / Data Mining 1 Os Dados Bibliografia Capítulo 2 do livro Introduction
Leia maisÍndice. Classificação Supervisionada e Árvores de Decisão. Problema de Classificação. Problema de Classificação 14/06/2017
Índice Classificação Supervisionada e Árvores de Decisão Eduardo Laber 1. Problema de Classificação 2. Árvore de Decisão 1. Preliminares 2. Construindo uma árvore de decisão 3. Definindo atributos de teste
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Árvores de Decisão Poda e extensões Prof. Paulo Martins Engel UFRGS 2 Questões sobre Árvores de Decisão Questões práticas do aprendizado de AD incluem: Determinar até quando se
Leia maisAgenda. Conceitos Iniciais. Modelos de aprendizado. Oportunidades e casos de uso. Ferramentas. Desafios
Machine Learning Agenda Conceitos Iniciais Modelos de aprendizado Oportunidades e casos de uso Ferramentas Desafios Ronald Bertele Bacharelado em Ciências da Computação - UCS MBA em Gestão de Negócios
Leia maislnteligência Artificial Aprendizagem em IA
lnteligência Artificial Aprendizagem em IA 1 Aprendizagem por que? Capacidade de aprender é parte fundamental do conceito de inteligência. Um agente aprendiz é mais flexível aprendizado permite lidar com
Leia maisSUPPORT VECTOR MACHINE - SVM
SUPPORT VECTOR MACHINE - SVM Definição 2 Máquinas de Vetores Suporte (Support Vector Machines - SVMs) Proposto em 79 por Vladimir Vapnik Um dos mais importantes acontecimentos na área de reconhecimento
Leia maisRede complexa probabilística baseada em similaridade na classificação de dados com ruídos
Rede complexa probabilística baseada em similaridade na classificação de dados com ruídos Robson C. da Motta, e Alneu de A. Lopes Instituto de Ciências Matemáticas e de Computação - ICMC Universidade de
Leia maisMineração de Dados - II
Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II Mineração de Dados - II Sylvio Barbon Junior barbon@uel.br 10 de julho de 2015 DC-UEL Sylvio Barbon Jr 1 Sumário Etapa II Algoritmos Básicos Weka: Framework
Leia maisMineração em Data Streams - Avaliação. Profa. Elaine Faria UFU
Mineração em Data Streams - Avaliação Profa. Elaine Faria UFU - 2018 Avaliação em Agrupamento Validação de Agrupamento Em tarefas de classificação A avaliação dos resultados do modelo de classificação
Leia maisAprendizado em IA. Prof. Carlos H. C. Ribeiro ITA Divisão de Ciência da Computação
Aprendizado em IA Prof. Carlos H. C. Ribeiro ITA Divisão de Ciência da Computação Tópicos Agentes baseados em aprendizado Aprendizado indutivo Árvores de decisão Método ID3 Aprendizado em redes neurais
Leia maisIntrodução às Redes Neurais Artificiais
Introdução às Redes Neurais Artificiais Clusterização: Conceitos Básicos Prof. João Marcos Meirelles da Silva www.professores.uff.br/jmarcos Departamento de Engenharia de Telecomunicações Escola de Engenharia
Leia mais