Clustering Using REpresentatives: An Efficient Clustering Algorithm for Large Databases
|
|
- Aparecida Gusmão Palmeira
- 4 Há anos
- Visualizações:
Transcrição
1 Clustering Using REpresentatives: An Efficient Clustering Algorithm for Large Databases Bilzã Marques de Araújo SCC Análise de Agrupamento de Dados Seminário 09 de Dezembro de 2010 Bilzã Araújo (SCC AAD) Clustering Using REpresentatives: CURE 1 / 31
2 Conteúdo 1 Introdução 2 CURE 3 Melhorias - Large Scale Databases 4 Resultados Bilzã Araújo (SCC AAD) Clustering Using REpresentatives: CURE 2 / 31
3 Principais Referências Guha, S., Rastogi, R., & Shim, K. (1998). Cure: an efficient clustering algorithm for large databases. In Proceedings of the 1998 ACM SIGMOD international conference on Management of data, SIGMOD 98 (pp ). New York, NY, USA: ACM. Guha, S., Rastogi, R., & Shim, K. (2001). Cure: an efficient clustering algorithm for large databases. Information Systems, 26, Theodoridis, S. & Koutroumbas, K. (2009). Pattern Recognition, (pp ). Academic Press, 4th edition. Bilzã Araújo (SCC AAD) Clustering Using REpresentatives: CURE 3 / 31
4 1 Introdução 2 CURE 3 Melhorias - Large Scale Databases 4 Resultados Bilzã Araújo (SCC AAD) Clustering Using REpresentatives: CURE 4 / 31
5 Introdução Problema de clustering: Dado um conjunto de objetos, agrupar os objetos em clusters tal que cada objetos em um cluster seja mais similares aos demais objetos no mesmo cluster que a objetos em outros clusters. Bilzã Araújo (SCC AAD) Clustering Using REpresentatives: CURE 5 / 31
6 Representantes Quando unem grupos, algoritmos aglomerativos utilizam representantes : centroides, medoides: d mean todos os objetos do grupo: d min, d max, d ave Bilzã Araújo (SCC AAD) Clustering Using REpresentatives: CURE 6 / 31
7 Deficiências abordagens clássicas Abordagens clássicas favorecem clusters esféricos e tamanhos similares ou são frágeis na presença de outliers Bilzã Araújo (SCC AAD) Clustering Using REpresentatives: CURE 7 / 31
8 1 Introdução 2 CURE 3 Melhorias - Large Scale Databases 4 Resultados Bilzã Araújo (SCC AAD) Clustering Using REpresentatives: CURE 8 / 31
9 Clustering Using REpresentatives Técnica de Agrupamento de Dados Hierárquica Cada grupo é representado por min(c, C i ) pontos que descrevem a forma* do grupo Dois grupos, C 1 e C 2, são unidos se C i, C j d cure (C 1, C 2 ) == min(d cure (C i, C j )) d cure (C i, C j ) é a menor distancia entre representantes de C i e C j Os grupos são unidos até que sejam obtidos k grupos Bilzã Araújo (SCC AAD) Clustering Using REpresentatives: CURE 9 / 31
10 c objetos bem distribuídos + + Bilzã Araújo (SCC AAD) Clustering Using REpresentatives: CURE 10 / 31
11 c objetos bem distribuídos Bilzã Araújo (SCC AAD) Clustering Using REpresentatives: CURE 10 / 31
12 c objetos bem distribuídos Bilzã Araújo (SCC AAD) Clustering Using REpresentatives: CURE 11 / 31
13 c objetos bem distribuídos Bilzã Araújo (SCC AAD) Clustering Using REpresentatives: CURE 11 / 31
14 c representantes Cada representante é encolhidos sentido ao centroide em α p = p + α(x p) + + Bilzã Araújo (SCC AAD) Clustering Using REpresentatives: CURE 12 / 31
15 c representantes Cada representante é encolhidos sentido ao centroide em α p = p + α(x p) + + Dois grupos são unidos de acordo com os representantes Bilzã Araújo (SCC AAD) Clustering Using REpresentatives: CURE 12 / 31
16 Algoritmo Bilzã Araújo (SCC AAD) Clustering Using REpresentatives: CURE 13 / 31
17 Algoritmo Bilzã Araújo (SCC AAD) Clustering Using REpresentatives: CURE 13 / 31
18 1 Introdução 2 CURE 3 Melhorias - Large Scale Databases 4 Resultados Bilzã Araújo (SCC AAD) Clustering Using REpresentatives: CURE 14 / 31
19 Melhorias - Large Scale Databases Bases de dados com centenas de milhares de objetos Limitações de memória Inviabilidade Computacional O(n 2 log n) Base de dados Amostragem sobre os dados Particionamento das amostras Agrupamento parcial cada partição Elimina outliers Agrupa grupos parciais Rotulação dados no disco Bilzã Araújo (SCC AAD) Clustering Using REpresentatives: CURE 15 / 31
20 Amostragem Amostra suficientemente grande preserva características dos grupos e elimina outliers De acordo com Chernoff bounds, para clusters bem definidos (densos intra e esparso inter): s min = ξkρ + kρ log( 1 δ ) + kρ (log( 1 δ ))2 + 2ξ log( 1 δ ) Não depende do número de objetos n, mas sim do número de clusters bem definidos, k Com grupos de densidades variadas é necessário assumir k de acordo com regiões densas Bilzã Araújo (SCC AAD) Clustering Using REpresentatives: CURE 16 / 31
21 Particionamento Particionamento da amostra Agrupamento hierárquico até n pq Permite melhor tratamento de outliers* Reduz ainda mais custo computacional a 2 + b 2 < (a + b) 2 Bilzã Araújo (SCC AAD) Clustering Using REpresentatives: CURE 17 / 31
22 Remoção de outliers Modelo ainda susceptível a outliers Amostragem e parâmetro α podem não eliminar todo efeito de Uma vez que outliers tendem a ser agrupados no final da hierarquia Grupos com poucos objetos são removidos da amostra ao final de cada partição quando atinge o número de grupos k Bilzã Araújo (SCC AAD) Clustering Using REpresentatives: CURE 18 / 31
23 Rotulação em disco Objetos em disco são rotulados de acordo com os representantes de grupos Cada objeto é atribuído ao grupo do representante mais próximo Bilzã Araújo (SCC AAD) Clustering Using REpresentatives: CURE 19 / 31
24 1 Introdução 2 CURE 3 Melhorias - Large Scale Databases 4 Resultados Bilzã Araújo (SCC AAD) Clustering Using REpresentatives: CURE 20 / 31
25 Comparação com BIRCH e MST n = , s = 2500, c = 10, α = 0.3, p = 1 Bilzã Araújo (SCC AAD) Clustering Using REpresentatives: CURE 21 / 31
26 Comparação com BIRCH e MST n = , s = 2500, c = 10, α = 0.3, p = 1 Bilzã Araújo (SCC AAD) Clustering Using REpresentatives: CURE 22 / 31
27 Comparação com BIRCH e MST n = , s = 3000, c = 100, α = 0.15, p = 1 Bilzã Araújo (SCC AAD) Clustering Using REpresentatives: CURE 23 / 31
28 Fator de encolhimento α n = , s = 2500, c = 10, p = 1, α = [0.1, 0.9] Bilzã Araújo (SCC AAD) Clustering Using REpresentatives: CURE 24 / 31
29 Fator de encolhimento α n = , s = 2500, c = 10, p = 1, α = [0.1, 0.9] Quando α = 0 similar ao MST, quando α = 1, similar ao BIRCH Bilzã Araújo (SCC AAD) Clustering Using REpresentatives: CURE 24 / 31
30 Número de representantes, c n = , s = 2500, α = 0.3, p = 1, c = [1, 100] Bilzã Araújo (SCC AAD) Clustering Using REpresentatives: CURE 25 / 31
31 Número de representantes, c n = , s = 2500, α = 0.3, p = 1, c = [1, 100] Bilzã Araújo (SCC AAD) Clustering Using REpresentatives: CURE 25 / 31
32 Tamanho da amostra de representantes, s n = , α = 0.3, c = 10, p = 1, s = [500, 5000] Bilzã Araújo (SCC AAD) Clustering Using REpresentatives: CURE 26 / 31
33 Número de partições, p n = , α = 0.3, c = 10, s = 2500, p = [1, 100], Bilzã Araújo (SCC AAD) Clustering Using REpresentatives: CURE 27 / 31
34 Performance comparado ao BIRCH Bilzã Araújo (SCC AAD) Clustering Using REpresentatives: CURE 28 / 31
35 Performance Bilzã Araújo (SCC AAD) Clustering Using REpresentatives: CURE 29 / 31
36 Obrigado pela atenção! Bilzã Araújo (SCC AAD) Clustering Using REpresentatives: CURE 30 / 31
37 Bibliografia I Guha, S., Rastogi, R., & Shim, K. (1998). Cure: an efficient clustering algorithm for large databases. In Proceedings of the 1998 ACM SIGMOD international conference on Management of data, SIGMOD 98 (pp ). New York, NY, USA: ACM. Guha, S., Rastogi, R., & Shim, K. (2001). Cure: an efficient clustering algorithm for large databases. Information Systems, 26, Theodoridis, S. & Koutroumbas, K. (2009). Pattern Recognition, (pp ). Academic Press, 4th edition. Bilzã Araújo (SCC AAD) Clustering Using REpresentatives: CURE 31 / 31
Sumário. RObust Clustering using links ROCK. Thiago F. Covões. Motivação. Motivação. Links. Market basket analys. Motivação
Sumário RObust Clustering using links ROCK Thiago F. Covões Motivação Links Função de qualidade Algoritmo Vantagens/Desvantagens SCC5895Análise de Agrupamento de Dados 1 2 Motivação Atributos categóricos/nominais/discretos
Leia maisCLARA. Resumo. Introdução. Artigo de Referência [1] Introdução PAM. Modelagem como grafo CLARANS. Comparação de eficiência Conclusão
Resumo CLARANS Diego Raphael Amancio Introdução PAM CLARA CLARANS Comparação de eficiência Conclusão 2 Artigo de Referência [1] Introdução Imagem do artigo original entitulado Efficient and Effective Clustering
Leia maisMétodos de Acesso Métrico
Métodos de Acesso Métrico http://www.icmc.usp.br/img/novafaixa.png Arthur Emanuel de O. Carosia Profa. Dra. Cristina Dutra de Aguiar Ciferri Índice Conceitos Básicos Métodos de Acesso Onion-tree 2 Índice
Leia maisMétodos de Agrupamento (Clustering) Aula 18
Métodos de Agrupamento (Clustering) Aula 18 Prof. Dr. Paulo A. V. de Miranda Instituto de Matemática e Estatística (IME), Universidade de São Paulo (USP) pmiranda@vision.ime.usp.br Existem duas classes
Leia maisSumário. Referências utilizadas. Introdução. MAFIA: Merging of Adaptive Finite Intervals. Introdução Visão Geral e Objetivos do MAFIA
Sumário : Merging of Adaptive Finite Intervals Elaine Ribeiro de Faria Análise de Agrupamento de Dados ICMC-USP Dezembro 2010 Introdução Visão Geral e Objetivos do Algoritmo Grid Adaptativo Algoritmo Algoritmo
Leia maisImpacto da amostragem aleatória uniforme para o aumento da escalabilidade na geração de agrupamentos hierárquicos de séries espaço-temporais
Impacto da amostragem aleatória uniforme para o aumento da escalabilidade na geração de agrupamentos hierárquicos de séries espaço-temporais Rodolfo M. S. Mendes 1, Humberto Razente 1, Maria Camila N.
Leia maisIntrodução às Redes Neurais Artificiais
Introdução às Redes Neurais Artificiais Clusterização: Conceitos Básicos Prof. João Marcos Meirelles da Silva www.professores.uff.br/jmarcos Departamento de Engenharia de Telecomunicações Escola de Engenharia
Leia maisUniversidade de São Paulo Instituto de Ciências Matemáticas e de Computação
Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Francisco A. Rodrigues Departamento de Matemática Aplicada e Estatística - SME Conceitos básicos Classificação não-supervisionada:
Leia maisMineração em Data Streams - Clustering. Profa. Elaine Faria UFU
Mineração em Data Streams - Clustering Profa. Elaine Faria UFU - 2018 Mineração de Dados Tarefas de mineração Tarefas Preditivas Classificação Regressão Detecção de Anomalias Tarefas Descritivas Agrupamento
Leia maisAlgoritmo CLIQUE (Clustering In QUEst)
Algoritmo CLIQUE (Clustering In QUEst) Marcelo Camacho de Souza Nº USP: 3199616 Roteiro Algoritmo CLIQUE Exemplo Prático Complexidade Computacional Vantagens e Desvantagens Autores (IBM Almaden Research
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Aprendizagem Não Supervisionada Alessandro L. Koerich Mestrado/Doutorado em Informática (PPGIa) Pontifícia Universidade Católica do Paraná (PUCPR) Mestrado/Doutorado em Informática
Leia maisTópicos Avançados em IA. Prof. Eduardo R. Hruschka
Tópicos Avançados em IA Prof. Eduardo R. Hruschka Créditos Este material consiste de adaptações dos originais: Elaborados por Eduardo Hruschka e Ricardo Campello de (Tan et al., 2006) de E. Keogh (SBBD
Leia maisClustering: k-means e Agglomerative
Tópicos Avançados em Avaliação de Desempenho de Sistemas Jackson Nunes Marco Eugênio Araújo Outubro de 2014 1 Sumário Contextualização Classificação Agrupamento (Clustering) Cenários de Aplicação Clustering
Leia maisProjected Clustering Algorithm
Projected Clustering Algorithm Emanuel Matos 5560105 Disciplina : Análise de Agrupamentos Prof. Dr. Ricardo Campello Dez/2010 View Problema Objetivo Definições/Premissas Algoritmo Acurácia Escalabilidade
Leia maisOrganização. 1. Introdução 2. Medidas de Similaridade. hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters
Organização. Introdução 2. Medidas de Similaridade 3. Métodos de Agrupamento (métodos hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters Métodos de Partição Cada exemplo
Leia maisClustering (k-means, SOM e hierárquicos)
Clustering (k-means, SOM e hierárquicos) André Tavares da Silva andre.silva@udesc.br (Capítulo 10 de Duda e Hart) Clustering Introdução e tipos Roteiro Agrupamentos hierárquicos AGNES, DIANA e Dendogram
Leia maisAprendizado de Máquina
Aprendizado de Máquina André C. P. L. F. de Carvalho Posdoutorando: Isvani Frias-Blanco ICMC-USP Agrupamento de dados Tópicos Agrupamento de dados Dificuldades em agrupamento Algoritmos de agrupamento
Leia maisLancet: Um sistema para clustering hierárquico aplicado à biodeterioração do concreto
Lancet: Um sistema para clustering hierárquico aplicado à biodeterioração do concreto Jean Metz 1, Huei D. Lee 1, Leonilda C. dos Santos 2, Renato B. Machado 1,2, Feng C. Wu 1,3,4 1 Laboratório de Bioinformática
Leia maisIntrodução às Redes Neurais Artificiais
Introdução às Redes Neurais Artificiais Mapas Auto-Organizáveis Prof. João Marcos Meirelles da Silva http://www.professores.uff.br/jmarcos Departamento de Engenharia de Telecomunicações Escola de Engenharia
Leia maisIA: Aprendizado IV. Professor Paulo Gurgel Pinheiro. 30 de Setembro de 2010
IA: Aprendizado IV Professor Paulo Gurgel Pinheiro MC906A - Inteligência Articial Instituto de Computação Universidade Estadual de Campinas - UNICAMP 30 de Setembro de 2010 1 / 75 http://www.ic.unicamp.br/
Leia maisMineração de Textos na Web
Mineração de Textos na Web Luciano Antonio Digiampietri Escola de Artes Ciências e Humanidades da Universidade de São Paulo digiampietri@usp.br Resumo: Com o crescimento das informações disponíveis na
Leia maisAgrupamento. Algoritmos e aplicações
Agrupamento Algoritmos e aplicações Equipe Bertha Andaluz (bmca) Deborah Mesquita (dhsm) Lucas Lima (lapl) Lucas Tenório (lvt) Roteiro Motivação Métodos de clustering Modelos de clustering Fuzzy clustering
Leia maisAnálise de Clusters. Aplicações da formação de Grupos (Clustering)
Análise de Clusters Aplicações da formação de Grupos (Clustering) Ver e analisar vastas quantidades de dados biológicos como um todo pode ser difícil É mais fácil interpretar os dados se forem divididos
Leia maisRedes Neurais (Inteligência Artificial)
Redes Neurais (Inteligência Artificial) Aula 16 Aprendizado Não-Supervisionado Edirlei Soares de Lima Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest
Leia maisMineração de Dados em Biologia Molecular
Mineração de Dados em Biologia Molecular André C. P. L. F. de Carvalho Monitor: Valéria Carvalho Agrupamento de Dados Tópicos Agrupamento de dados Análise de cluster Dificuldades em agrupamento Algoritmos
Leia maisEstatística: Aplicação ao Sensoriamento Remoto SER ANO Análise de Agrupamento
statística: plicação ao Sensoriamento Remoto SR 204 - NO 2017 nálise de grupamento amilo aleles Rennó camilo@dpi.inpe.br http://www.dpi.inpe.br/~camilo/estatistica/ nálise de grupamento (luster nalysis)
Leia maisINF 1771 Inteligência Artificial
Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 18 Aprendizado Não-Supervisionado Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor
Leia maisEstudo e Análise das Diversas Representações e Estruturas de Dados Utilizadas nos Algoritmos de Clustering Hierárquico. N o 269
Instituto de Ciências Matemáticas e de Computação ISSN - 0103-2569 Estudo e Análise das Diversas Representações e Estruturas de Dados Utilizadas nos Algoritmos de Clustering Hierárquico Jean Metz Maria
Leia maisReconhecimento Facial 3D utilizando o Simulated Annealing com as Medidas Surface Interpenetration Measure e M-Estimator Sample Consensus
Reconhecimento Facial 3D utilizando o Simulated Annealing com as Medidas Surface Interpenetration Measure e M-Estimator Sample Consensus Dissertação de Mestrado em Informática Sídnei Augusto Drovetto Jr.
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Aprendizado não-supervisionado Formação de agrupamentos Aprendizado Não-Supervisionado Classificação supervisionada: discriminar padrões com base num modelo pré-definido de classes.
Leia maisVisualização Computacional
Visualização Computacional Séries Temporais Rafael Umino Nakanishi Universidade de São Paulo Instituto de Ciências Matemáticas e Computação Novembro de 2013 Rafael Umino Nakanishi (USP-ICMC) Visualização
Leia maisAnálise de Difusão de Influência em redes sociais com foco na Hipótese dos Influentes
UNIVERSIDADE FEDERAL DE PERNAMBUCO - UFPE Análise de Difusão de Influência em redes sociais com foco na Hipótese dos Influentes Proposta de Trabalho de Graduação Centro de Informática - CIn Recife, Março
Leia maisCluster. Larissa Sayuri Futino Castro dos Santos
Cluster Larissa Sayuri Futino Castro dos Santos Agenda O que faremos Modelos de Mistura LDA Reconhecimento Overview Mét. Particionais E Hierárquicos Melhorias K-Medians K-Medoids K-Modes Mét. Probabilís
Leia maisCombinando semi-supervisão e hubness para aprimorar o agrupamento de dados em alta dimensão
Combinando semi-supervisão e hubness para aprimorar o agrupamento de dados em alta dimensão Mateus Curcino de Lima, Maria Camila Nardini Barioni, Humberto Luiz Razente mateuscurcino@mestrado.ufu.br, {camila.barioni,humberto.razente}@ufu.br
Leia maisInteligência nos Negócios (Business Inteligente)
Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 7) Fundamentação da disciplina Analise de dados Decisões
Leia maisAprendizagem de Máquina
Problema do Agrupamento Aprendizagem de Máquina Alessandro L. Koerich Seja x = (x 1, x 2,, x d ) um vetor d dimensional de características Seja D um conjunto de x vetores, D = { x(1), x(2),, x(n) } Problema
Leia maisANÁLISE DE AGRUPAMENTOS
ANÁLISE DE AGRUPAMENTOS Análise de Agrupamentos 2 Definição Consistem em encontrar grupos de objetos entre os objetos Categorizá-los ou agrupá-los Tipo de aprendizado não supervisionado Encontrar grupos
Leia maisUma Abordagem para Seleção de Grupos Significativos em Agrupamento Hierárquico de Documentos
Uma Abordagem para Seleção de Grupos Significativos em Agrupamento Hierárquico de Documentos Ricardo M. Marcacini 1, Maria F. Moura 2, Solange O. Rezende 1 1 Instituto de Ciências Matemáticas e de Computação
Leia maisMineração de Dados. Modelos Descritivos. Descoberta de agrupamentos
Mineração de Dados Descoberta de agrupamentos Modelos Descritivos tarefa de geração de um modelo descritivo consiste (em grande parte) em analisar os dados do domínio (entradas) e sugerir uma partição
Leia maisAvaliação de atividades de programação submetidas em MOOC com emprego de técnicas de visualização
III Workshop de Ensino em Pensamento Computacional, Algoritmos e Programação VI Congresso Brasileiro de Informática na Educação Avaliação de atividades de programação submetidas em MOOC com emprego de
Leia maisA procura da melhor partição em Classificação Hierárquica: A abordagem SEP/COP
A procura da melhor partição em Classificação Hierárquica: A abordagem SEP/COP Lúcia Sousa Escola Superior de Tecnologia e Gestão, Instituto Politécnico de Viseu Fernanda Sousa Faculdade de Engenharia
Leia maisSCC5895 Análise de Agrupamento de Dados
SCC5895 Análise de Agrupamento de Dados Algoritmos Hierárquicos: Parte II Prof. Ricardo J. G. B. Campello PPG-CCMC / ICMC / USP Créditos Parte do material a seguir consiste de adaptações e extensões dos
Leia maisTipos de Índices. Profa. Dra. Cristina Dutra de Aguiar Ciferri
Tipos de Índices Cristina Dutra de Aguiar Ciferri Tipos de Índice Ordenados em um único nível primário agrupamento (cluster) secundário Estruturas de dados de árvores índices multiníveis árvores-b, árvores-b+
Leia maisAutor 1 Orientador: 1. dia de mês de ano
Título Autor 1 Orientador: 1 1 Laboratório de Sistemas de Computação Universidade Federal de Santa Maria dia de mês de ano Roteiro Introdução Fundamentação Desenvolvimento Resultados Conclusão e Trabalhos
Leia maisAnálise de Desempenho de Estratégias de Particionamento de Grafos
Análise de Desempenho de Estratégias de Particionamento de Grafos Diogo T. Murata, Rodrigo M. Martins, Vanderson M. do Rosario, Anderson F. da Silva 1 Departamento de Informática - Universidade Estadual
Leia maisSCC5895 Análise de Agrupamento de Dados
SCC5895 Análise de Agrupamento de Dados Conceituação Prof. Ricardo J. G. B. Campello PPG-CCMC / ICMC / USP Créditos O material a seguir consiste de adaptações e extensões dos originais: gentilmente cedidos
Leia maisDescritores de Imagens
Descritores de Imagens André Tavares da Silva PPGCA/UDESC Outubro de 2017 André Tavares da Silva (PPGCA/UDESC) Descritores de Imagens Outubro de 2017 1 / 17 Introdução Excelentes pesquisas sobre descritores
Leia maisDescoberta de Conhecimento em Bases de Dados. Pesquisa de Clusters
Universidade Técnica de Lisboa INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO Informática e Sistemas de Informação Aplicados em Economia Descoberta de Conhecimento em Bases de Dados. Pesquisa de Clusters Descoberta
Leia maisEleição de Clusters Heads em Roteamento Hierárquico para Redes de Sensores sem Fio
Eleição de Clusters Heads em Roteamento Hierárquico para Redes de Sensores sem Fio INF2056 - Algoritmos Distribuídos Juliana França Santos Aquino juliana@lac.inf.puc-rio.br 18 de junho de 2007 1 Roteiro
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Horários Aulas Sala 3 CCET [quinta-feira, 8:20 12:00] Atendimento
Leia maisMineração de Dados - Introdução. Elaine Ribeiro de Faria UFU 2018
Mineração de Dados - Introdução Elaine Ribeiro de Faria UFU 2018 1 Mineração de Dados Processo de automaticamente descobrir informação útil em grandes repositórios de dados Tan P., SteinBack M. e Kumar
Leia maisK-MEANS COM ÁRVORES KD
2 Roteiro K-MEANS COM ÁRVORES KD Rodrigo Coelho Barros Árvores KD O que são? Algoritmo de Bentley (1975) Métodos de divisão K-Means com árvores KD Algoritmo de filtragem (Kanungo et al., 2002) Exemplo
Leia maisOutliers Detecção de Anomalias AULA DATA MINING
Outliers Detecção de Anomalias AULA DATA MINING Motivação/Caso unidimensional Bill Gates ganha $500 milhões por ano. Ele está numa sala com 9 professores, 4 que recebem $40k/ano, 3 ganham $45k/ano, e 2
Leia maisUniversidade Federal de Pernambuco
Universidade Federal de Pernambuco Graduação em Engenharia da Computação Centro de Informática Análise de Comportamento de Sistemas DASH com Teoria de Controle em Redes 3G Aluno: Daniel Bezerra { db@cin.ufpe.br
Leia maisDetecção: quais os caminhos?
Detecção: quais os caminhos? Visão Computacional Programa de Pós- Graduação em Ciência da Computação UFMA Prof. Geraldo Braz Junior Baseado nas notas de aula do CS131, CS229 CS231B Porque? Aplicações necessitam
Leia maisAlgoritmos de Junção Estrela em MapReduce
Algoritmos de Junção Estrela em MapReduce Jaqueline Joice Brito 09 de junho de 2015 1 Modelo Relacional Dados armazenados em um conjunto de tabelas Amplamente utilizado Junção Recuperação de dados de duas
Leia maisUNIVERSIDADE FEDERAL DA BAHIA
UNIVERSIDADE FEDERAL DA BAHIA INSTITUTO DE MATEMÁTICA E ESTATÍSTICA DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO RECUPERAÇÃO DE ARQUITETURA DE SOFTWARE UTILIZANDO ALGORITMOS DE AGRUPAMENTO ALUNO: DENNIS LESSA
Leia maisA análise de aglomerados
Mais importante do que saber fazer é saber o por quê (Norbert Wiener (1894 1964). Prof. Lorí Viali, Dr. viali@pucrs.br; viali@mat.ufrgs.br; http://www.pucrs.br/famat/viali; http://www.mat.ufrgs.br/~viali/
Leia maisAnálise Multivariada Aplicada à Contabilidade
Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes www.marcelobotelho.com mbotelho@usp.br Turma: 2º / 2016 1 Agenda
Leia maisAprendizado de Máquina. Combinando Classificadores
Universidade Federal do Paraná (UFPR) Departamento de Informática (DInf) Aprendizado de Máquina Combinando Classificadores David Menotti, Ph.D. web.inf.ufpr.br/menotti Introdução O uso de vários classificadores
Leia maisAlgoritmos de Agrupamento - Aprendizado Não Supervisionado
Algoritmos de Agrupamento - Aprendizado Não Supervisionado Fabrício Jailson Barth fabricio.barth@gmail.com Agosto de 2016 Sumário Introdução e Definições Aplicações Algoritmos de Agrupamento Agrupamento
Leia maisClassificação Hierárquica Multirrótulo Utilizando Redes Neurais Artificiais
Classificação Hierárquica Multirrótulo Utilizando Redes Neurais Artificiais Ricardo Cerri Instituto de Ciências Matemáticas e de Computação Universidade de São Paulo cerri@icmc.usp.br Roteiro Introdução
Leia maisIntegração de Dados. Processamento Analítico de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri Prof. Dr. Ricardo Rodrigues Ciferri
Integração de Dados Processamento Analítico de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri Prof. Dr. Ricardo Rodrigues Ciferri Integração de Dados Problema: dados armazenados nos provedores são
Leia maisAgrupamento de Dados. (Clustering)
Agrupamento de Dados (Clustering) Organização 1. Introdução 2. Medidas de (Dis)similaridade 3. Métodos de Agrupamento (métodos hierárquicos, de partição) 4. Critérios numéricos para definir o número de
Leia maisSEL-0339 Introdução à Visão Computacional. Aula 7 Reconhecimento de Objetos
Departamento de Engenharia Elétrica - EESC-USP SEL-0339 Introdução à Visão Computacional Aula 7 Reconhecimento de Objetos Prof. Dr. Marcelo Andrade da Costa Vieira Prof. Dr. Adilson Gonzaga mvieira@sc.usp.br
Leia maisClustering - c-means e Self Organizing Maps
- c-means e Self Organizing Maps Sarajane M. Peres e Clodoaldo A. M. Lima 13 de abril de 2015 Material baseado em: HAN, J. & KAMBER, M. Data Mining: Concepts and Techniques. 2nd. 2006 FAUSETT, L. Fundamentals
Leia maisMODELAGEM E OTIMIZAÇÃO DE SOFTWARE AUTOMOTIVOS PROPOSTA DE TRABALHO DE GRADUAÇÃO
Universidade Federal de Pernambuco Graduação em Engenharia da Computação Centro de Informática MODELAGEM E OTIMIZAÇÃO DE SOFTWARE AUTOMOTIVOS PROPOSTA DE TRABALHO DE GRADUAÇÃO Aluno : Newton Leal Barbosa(
Leia maisDEFINING METRIC THRESHOLDS FOR SOFTWARE PRODUCT LINES: A COMPARATIVE STUDY
DEFINING METRIC THRESHOLDS FOR SOFTWARE PRODUCT LINES: A COMPARATIVE STUDY APRESENTADO POR: BRUNO LUAN DE SOUSA QUA L I DA DE E MEDIÇÃO DE SOFTWA R E U N I V E R S I DA D E F E D E R A L D E MINAS G E
Leia maisIntegração de Mineração de Dados com SGBD Detecção de Agrupamentos
Integração de Mineração de Dados com SGBD Detecção de Agrupamentos Centro de Matemática Computação e Cognição-UFABC Jéssica Andressa de Souza Pós-Graduação em Ciência da Computação Sistemas de Banco de
Leia maisAplicação de Sistemas de Partículas e Smoothed Particle Hydrodynamics na Simulação de Regiões Espaço-Tempo Afetadas por Singularidades
Aplicação de Sistemas de Partículas e Smoothed Particle Hydrodynamics na Simulação de Regiões Espaço-Tempo Afetadas por Singularidades Autor: Douglas Farias Cordeiro, Orientadora: Celia A. Zorzo Barcelos
Leia maisCréditos. SCC0173 Mineração de Dados Biológicos. Aula de Hoje. Introdução. Classificação III: Árvores de Decisão
SCC073 Mineração de Dados Biológicos Classificação III: Árvores de Decisão Créditos O material a seguir consiste de adaptações e extensões dos originais: gentilmente cedidos pelo Prof. André C. P. L. F.
Leia maisDados Espaciais e Indexação
Dados Espaciais e Indexação Cristina Dutra de Aguiar Ciferri Arthur Emanuel de O. Carosia 1 Tipos de Dados Espaciais Ponto: menor unidade possível para representar um objeto espacial. Linha: seqüência
Leia maisSCC5895 Análise de Agrupamento de Dados
SCC89 Análise de Agrupamento de Dados Algoritmos Hierárquicos (Parte I) Prof. Eduardo Raul Hruschka PPG-CCMC / ICMC / USP Créditos O material a seguir consiste de adaptações e etensões dos originais: Elaborados
Leia maisComunicação Científica I
Faculdade de Engenharia da Universidade do Porto Programa Doutoral em Engenharia Biomédica 2008/2009 Disciplina: Comunicação Científica I Relatório sobre as actividades de investigação, trabalhos e comunicações
Leia maisSobre a execução de workflows científicos sobre diferentes estrategias de dados de entrada - Uma Avaliação Experimental
Sobre a execução de workflows científicos sobre diferentes estrategias de dados de entrada - Uma Avaliação Experimental Douglas Oliveira Cristina Boeres Fábio Laboratório Nacional de Computação Científica
Leia maisDAGER: UMA FERRAMENTA PARA MINERAÇÃO DE DADOS GEORREFERENCIADOS DAGER: A TOOL FOR GEOREFERENCED DATA MINING
DAGER: UMA FERRAMENTA PARA MINERAÇÃO DE DADOS GEORREFERENCIADOS Ronan Assumpção Silva (UEPG) E-mail: ronan.ras@gmail.com Prof Dr Petraq J. Papajorgji (UEPG) E-mail: petraq@gmail.com Profa Dra Alaine M.
Leia maisTrilha Learning Machine Cluster Analysis em 4 passos Marco Siqueira Campos
Trilha Learning Machine Cluster Analysis em 4 passos Marco Siqueira Campos Marco Siqueira Campos Sócio fundador Siqueira Campos Associados e sos-stat Estatístico UFRGS Certificado Data Science Specialization
Leia maisEXECUTIVE MASTER EM APPLIED BUSINESS ANALYTICS
EXECUTIVE MASTER EM APPLIED BUSINESS ANALYTICS UNIDADE CURRICULAR: MÉTODOS DE SEGMENTAÇÃO Relatório da Aplicação do Algoritmo SOM Mapa Auto-organizado Elisabeth Fernandes Nuno Pinho da Silva Ano letivo
Leia maisCréditos. SCC5895 Análise de Agrupamento de Dados. Relembrando... Aula de Hoje. Algoritmos Hierárquicos: Parte I. [ x ] T. Algoritmos Hierárquicos
SCC Análise de Agrupamento de Dados Algoritmos Hierárquicos: Parte I Prof Ricardo J G B Campello Créditos O material a seguir consiste de adaptações e etensões dos originais: gentilmente cedidos pelo Prof
Leia maisAlgoritmos de bulk-loading para o método de acesso métrico Onion-tree
Algoritmos de bulk-loading para o método de acesso métrico Onion-tree http://www.icmc.usp.br/img/novafaixa.png Arthur Emanuel de O. Carosia Profa. Dra. Cristina Dutra de Aguiar Ciferri Visão Geral Onion-tree
Leia maisMÉTODO ROCK APLICADO NA DETECÇÃO AUTOMÁTICA DE RESPOSTAS EM UM SISTEMA EDUCACIONAL
MÉTODO ROCK APLICADO NA DETECÇÃO AUTOMÁTICA DE RESPOSTAS EM UM SISTEMA EDUCACIONAL PEDROTTI, Tales 1 CHICON, Patricia Mariotto Mozzaquatro 2 Resumo: Atualmente, a expansão e utilização de plataformas Web
Leia maisUNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE INFORMÁTICA GRADUAÇÃO EM ENGENHARIA DA COMPUTAÇÃO
UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE INFORMÁTICA GRADUAÇÃO EM ENGENHARIA DA COMPUTAÇÃO Aluno: Larissa Lages de Oliveira (llo@cin.ufpe.br) Orientador: Daniel Carvalho da Cunha (dcunha@cin.ufpe.br)
Leia maisIntrodução ao Reconhecimento de Padrões e aplicações em problemas de Bioinformática
ao Reconhecimento de Padrões e aplicações em problemas de Bioinformática fabricio@utfpr.edu.br UTFPR-CP Grupo de Pesquisa em Bioinformática e Reconhecimento de Padrões bioinfo-cp@utfpr.edu.br Curso de
Leia maisInteligência nos Negócios (Business Inteligente)
Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 7) Fundamentação da disciplina Analise de dados Decisões
Leia maisAula 8 - Reconhecimento e Interpretação. Prof. Adilson Gonzaga
Aula 8 - Reconhecimento e Interpretação Prof. Adilson Gonzaga Elementos de Visão Computacional: Visão Computacional Processamento de Baio Nível Processamento de Nível Intermediário Processamento de Alto
Leia maisMedidas de avaliação de agrupamentos (Clustering)
Medidas de avaliação de agrupamentos (Clustering) Sarajane M. Peres e Clodoaldo A. M. Lima 12 de novembro de 2015 Sarajane M. Peres e Clodoaldo A. M. Lima Medidas de avaliação de agrupamentos (Clustering)
Leia maisUma Análise da Distorção na Coleta de Dados em Agrupamentos Baseados em Similaridade Espacial
Uma Análise da Distorção na Coleta de Dados em Agrupamentos Baseados em Similaridade Espacial 1. Introdução Sérgio Samuel Furlaneto 1, Michel Albonico 2 1 Universidade Federal do Paraná (UFPR) Caixa Postal
Leia maisUma Nova Forma de Calcular o Centro dos Clusters no Algoritmo Fuzzy C-Means
Uma Nova Forma de Calcular o Centro dos Clusters no Algoritmo Fuzzy C-Means Rogério R. de Vargas, Benjamín R. C. Bedregal, Departamento de Matemática Aplicada e Informática, DIMAp, UFRN 59072-970, Natal,
Leia maisUma Estratégia Eficiente de Treinamento para Programação Genética Aplicada a Deduplicação de Registros.
Uma Estratégia Eficiente de Treinamento para Programação Genética Aplicada a Deduplicação de Registros. Davi Guimarães da Silva 1, Moisés Gomes de Carvalho 2, Duivilly Brito 2 1 Instituto Federal de Educação
Leia maisTabelas de Dispersão - Introdução (1)
Algoritmos e Estruturas de Dados LEE 2013/14 Tabelas de Dispersão Tabelas de Dispersão - Introdução (1) As tabelas de dispersão (hash tables) são estruturas de dados adequadas para: Tabelas de símbolos
Leia maisAUTENTICAÇÃO DE IMPRESSÕES DIGITAIS
AUTENTICAÇÃO DE IMPRESSÕES DIGITAIS Felipe Negreiros Pedrosa- IC Aluno de graduação do curso de Eng. de Computação do Instituto Tecnológico de Aeronáutica Bolsista PIBIC-CNPQ; Brasil; e-mail: felipe.pedrosa@gmail.com
Leia maisRoteiro. PCC142 / BCC444 - Mineração de Dados Agrupamento (Segmentação) Agrupamento (Segmentação) Introdução. Denição. Aplicações
Roteiro PCC142 / BCC444 - Mineração de Dados (Segmentação) Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@icebufopbr wwwdecomufopbr/luiz Introdução
Leia maisB A N C O D E D A D O S G E O G R Á F I C O S M A R C O N I D E A R R U D A P E R E I R A
Mineração de Dados Espaciais B A N C O D E D A D O S G E O G R Á F I C O S M A R C O N I D E A R R U D A P E R E I R A Roteiro 2 Introdução Mineração de Dados Estado da Arte Artigo apresentado Conclusão
Leia maisFUZZY KOHONEN CLUSTERING NETWORK PARA DADOS INTERVALARES COM DISTÂNCIA CITY-BLOCK PONDERADA
XIV CONGRESSO DE INICIAÇÃO CIENTÍFICA DA UNIVERSIDADE FEDERAL CAMPINA GRANDE FUZZY KOHONEN CLUSTERING NETWORK PARA DADOS INTERVALARES COM DISTÂNCIA CITY-BLOCK PONDERADA Danilo de Menezes Freitas 1 Carlos
Leia maisCC-226 Introdução à Análise de Padrões
CC-226 Introdução à Análise de Padrões Apresentação do Curso Carlos Henrique Q. Forster 1 1 Divisão de Ciência da Computação Instituto Tecnológico de Aeronáutica 25 de fevereiro de 2008 C. H. Q. Forster
Leia maisDiego Martin Mancini Orientador: Prof. Paulo A. V. de Miranda Instituto de Matemática e Estatística Universidade de São Paulo
Estudo de comparação do descritor de imagens coloridas BIC empregando diferentes abordagens de classificação de detecção de bordas: Canny e Operador Laplaciano Diego Martin Mancini Orientador: Prof. Paulo
Leia maisProf. Daniela Barreiro Claro
O volume de dados está crescendo sem parar Gigabytes, Petabytes, etc. Dificuldade na descoberta do conhecimento Dados disponíveis x Análise dos Dados Dados disponíveis Analisar e compreender os dados 2
Leia maisSENSOMETRIA. Adilson dos Anjos. Curitiba, PR 21 de maio de Departamento de Estatística Universidade Federal do Paraná
SENSOMETRIA Adilson dos Anjos Departamento de Estatística Universidade Federal do Paraná aanjos@ufpr.br Curitiba, PR 21 de maio de 2015 1 / 7 SENSOMETRIA SEGMENTAÇÃO 2 / 7 Introdução Análise de agrupamentos->
Leia maisMÉTODOS MULTIVARIADOS. Rodrigo A. Scarpel
MÉTODOS MULTIVARIADOS Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo INTRODUÇÃO Semana Conteúdo Introdução aos métodos multivariados 1 Análise de componentes principais 2 Aplicações de análise
Leia maisÍndice. Classificação de textos para o ensino de português como segunda língua. Índice. technology from seed
Classificação de textos para o ensino de português como segunda língua Pedro Santos Curto Conclusões, Contribuições e Trabalho futuro 1 2 Motivação Aplicações e escala da classificação de textos Motivação
Leia mais