Sumário. RObust Clustering using links ROCK. Thiago F. Covões. Motivação. Motivação. Links. Market basket analys. Motivação

Tamanho: px
Começar a partir da página:

Download "Sumário. RObust Clustering using links ROCK. Thiago F. Covões. Motivação. Motivação. Links. Market basket analys. Motivação"

Transcrição

1 Sumário RObust Clustering using links ROCK Thiago F. Covões Motivação Links Função de qualidade Algoritmo Vantagens/Desvantagens SCC5895Análise de Agrupamento de Dados 1 2 Motivação Atributos categóricos/nominais/discretos Caso específico: booleanos Market basket analys sis <Leite, Manteiga, Pão> <Leite, Bolacha, Suco> Motivação Porque um novo algoritmo? Algoritmos baseados em distância euclidiana não são interessantess Medida de similaridad de: Coeficiente de Jaccard Grupos com sobreposição de items 3 4

2 Motivação Motivação Exemplo: T 1 = {Pão, Refrigerante, Sal Grosso}; T 2 = {Pão, Refrigerante, Fralda}; T 3 = {Pão, Cerveja, Pican nha}; T 4 = {Sal Grosso, Picanha, Farofa}; T 5 = {Sal Grosso, Picanha, Maminha}; T 6 = {Refrigerante, Fralda, Hipoglós}; T 7 = {Fralda, Hipóglos, Lenço Umedecido}; T 8 = {Hipoglós, Lenço Umedecido, Papinha}; Single Complete 5 6 Vizinhos Como distinguir entree grupos quando há forte sobreposição? Considerar os vizinho os em comum entre dois objetos Definindo θ O coeficiente de Jaccard pode assumir um número finito de valores: Min( T 1, T 2 ) +1 Vizinhos No exemplo: Todas as transações têm 3 items Valores possíveis: 0/6 1/5 2/4 3/3 7 8

3 Exemplo: Vizinhos de T 1 θ=0,2 (1/5) T 1 = {Pão, Refrigerante, Sal Grosso}; T 2 = {Pão, Refrigerante, Fralda}; T 3 = {Pão, Cerveja, Pican nha}; T 4 = {Sal Grosso, Picanha, Farofa}; T 5 = {Sal Grosso, Picanha, Maminha}; T 6 = {Refrigerante, Fralda, Hipoglós}; T 7 = {Fralda, Hipóglos, Lenço Umedecido}; T 8 = {Hipoglós, Lenço Umedecido, Papinha}; Exemplo: Vizinhos de T 1 θ=0,2 (1/5) T 1 = {Pão, Refrigerante, Sal Grosso}; T 2 = {Pão, Refrigerante, Fralda}; T 3 = {Pão Pão, Cerveja, Pican nha}; T 4 = {Sal Grosso, Picanha, Farofa}; T 5 = {Sal Grosso, Picanha, Maminha}; T 6 = {Refrigerante Refrigerante, Fralda, Hipoglós}; T 7 = {Fralda, Hipóglos, Lenço Umedecido}; T 8 = {Hipoglós, Lenço Umedecido, Papinha}; 9 10 Exemplo: Vizinhos de T 1 θ=0,5 (2/4) T 1 = {Pão, Refrigerante, Sal Grosso}; T 2 = {Pão, Refrigerante, Fralda}; T 3 = {Pão, Cerveja, Pican nha}; T 4 = {Sal Grosso, Picanha, Farofa}; T 5 = {Sal Grosso, Picanha, Maminha}; T 6 = {Refrigerante, Fralda, Hipoglós}; T 7 = {Fralda, Hipóglos, Lenço Umedecido}; T 8 = {Hipoglós, Lenço Umedecido, Papinha}; Links link(t i,t ) j é o número de vizinhos comuns a T i e T j Grafo de vizinhos: Número de caminhos de tamanho 2 distintos 11 12

4 Exemplo: link(t 1,T 2 ) ; θ=0,2 T 1 = {Pão, Refrigerante, Sal Grosso}; T 2 = {Pão, Refrigerante, Fralda}; T 3 = {Pão, Cerveja, Pican nha}; T 4 = {Sal Grosso, Picanha, Farofa}; T 5 = {Sal Grosso, Picanha, Maminha}; T 6 = {Refrigerante, Fralda, Hipoglós}; T 7 = {Fralda, Hipóglos, Lenço Umedecido}; T 8 = {Hipoglós, Lenço Umedecido, Papinha}; ROCK Algoritmo hierárquico Aglomerativo Utiliza links no lugar das proximidades Como definir qual par de grupos deve ser unido? Links Cruzados Função de qualidade Número de links cruzados entre dois grupos Grupos maiores dominam Necessário normalizar 15 16

5 Função de qualidade Função de qualidade Número esperado de links em um grupo Assumindo que existe uma função f(θ) tal que o número de vizinhos de cada objeto do grupo C i é aproximadamente n f(θ) i n i 1+2f(θ) (n i + n j ) ) 1+2f(θ) n j 1+2f(θ) n i é o número de objetos no grupo C i Cada objeto contribui n i Portanto, o esperado são n 1+2f(θ) i links i 2f(θ) links Função de qualidade Função de qualidade Qualidade da união dos grupos C i e C j Como definir f(θ)? Para este tipo de base de dados, uma possível função é: θ=1 f(θ)=0 n 0 i = 1 θ=0 f(θ)=1 n i1 = n i 19 20

6 Algoritmo Três etapas principais Cálculo dos links Cálculo dos Links Seja A NxN uma matriz de adjacências onde a ij =1 se T i e T j são vizinhos e 0 caso contrário Inicialização de estruturas auxiliares Basta calcular L NxN =A AA Inicialização de estrutura auxiliar Inicialização de estrutura auxiliar Cada objeto inicia em um grupo Para cada grupo é gerada uma lista local Uma entrada para cada grupo que possue pelo menos um link cruzad do O valor da qualidade da união para cada grupo 23 No exemplo (com θ=0,2): link(t 1,T 2 )=2 C 1 Lista local do grupo C C

7 Inicialização de estrutura auxiliar Inicialização de estrutura auxiliar Após a inicialização das N listas locais Inicializase uma lista global, com o valor da melhor união possível para cada grupo No exemplo (com θ=0,2): Lista global C C Lista local de C 1 C Seja: C u = Grupo com maior valor na lista global C v = Grupo com maior valor na lista local de C u Une C u e C v formando C w Substituir entradas referentes a C u e C v em listas locais por C w Número de links entree um grupo e C w é a soma do número de links de C i a C u e C v Uma nova lista local paraa C w é criada Lista global é atualizada No exemplo (com θ=0,2): C u = C 1 = { T 1 }; C v = C 3 = { T 3 } C w = C 1 C 3 = { T 1, T 3 } Grupos que tem C u ou C v em sua lista local: {,,,,, } Vamos considerar a atualização em relação ao grupo 27 28

8 Lista local de Lista global C 1 C {1,3} 0.43 C C Lista global 0.57 Lista local de Próxima iteração C u = = { T 2 }; C v = = { T 8 } C w = = { T 2, T 8 } Grupos que tem C u ou C v em sua lista local: {,,,, } Vamos considerar a atualização em relação ao grupo 31 32

9 Lista local de Lista global C 0.32 {1,3} } 0.57 C 0.32 {1,3} 0.57 C {2,8} {2,8} C {2,8} Resultado Continuando o algoritmo, é obtida a seguinte hierarquia Custo computacional Cálculo dos links O(N 2,37 ) Criação das listas locais usando heaps O(N 2 ) Criação da lista global usando heap O(N) Laço de união dos grupos O(N 2 logn) 35 36

10 (Des)Vantagens Considera informação de vizinhança no agrupamento de objetos Robusto em relação a outliers, já que eles vão ter poucos links, pouco afetam o agrupamento Se o número de grupos for subestimado, o algoritmo para antes Quando não há links entre grupos Pode não obter uma hierarquia completa Referências Guha, S.; Rastogi, R.; Shim, K.; ROCK: a robust clustering algorithm for categorical attributes, In 15th International Conference on Data Engineering, Como definir θ e f(θ)? 37 38

SENSOMETRIA. Adilson dos Anjos. Curitiba, PR 21 de maio de Departamento de Estatística Universidade Federal do Paraná

SENSOMETRIA. Adilson dos Anjos. Curitiba, PR 21 de maio de Departamento de Estatística Universidade Federal do Paraná SENSOMETRIA Adilson dos Anjos Departamento de Estatística Universidade Federal do Paraná aanjos@ufpr.br Curitiba, PR 21 de maio de 2015 1 / 7 SENSOMETRIA SEGMENTAÇÃO 2 / 7 Introdução Análise de agrupamentos->

Leia mais

Organização. 1. Introdução 2. Medidas de Similaridade. hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters

Organização. 1. Introdução 2. Medidas de Similaridade. hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters Organização. Introdução 2. Medidas de Similaridade 3. Métodos de Agrupamento (métodos hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters Métodos de Partição Cada exemplo

Leia mais

Agrupamento Espectral e Hierárquico

Agrupamento Espectral e Hierárquico Agrupamento Espectral e Hierárquico Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Agrupamento Espectral 2. Agrupamento Hierárquico 1 Agrupamento Espectral Agrupamento Espectral Nem

Leia mais

ANÁLISE DE AGRUPAMENTOS

ANÁLISE DE AGRUPAMENTOS ANÁLISE DE AGRUPAMENTOS Análise de Agrupamentos 2 Definição Consistem em encontrar grupos de objetos entre os objetos Categorizá-los ou agrupá-los Tipo de aprendizado não supervisionado Encontrar grupos

Leia mais

Aula 13: Regras de Associação. Rafael Izbicki

Aula 13: Regras de Associação. Rafael Izbicki Mineração de Dados Aula 13: Regras de Associação Rafael Izbicki 1 / 6 O Problema Imagine que temos um banco de dados em que cada linha representa a ida de uma pessoa a um supermercado, e cada coluna representa

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina André C. P. L. F. de Carvalho Posdoutorando: Isvani Frias-Blanco ICMC-USP Agrupamento de dados Tópicos Agrupamento de dados Dificuldades em agrupamento Algoritmos de agrupamento

Leia mais

Análise Multivariada Aplicada à Contabilidade

Análise Multivariada Aplicada à Contabilidade Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes www.marcelobotelho.com mbotelho@usp.br Turma: 2º / 2016 1 Agenda

Leia mais

2 Processo de Agrupamentos

2 Processo de Agrupamentos 20 2 Processo de Agrupamentos A análise de agrupamentos pode ser definida como o processo de determinação de k grupos em um conjunto de dados. Para entender o que isso significa, observe-se a Figura. Y

Leia mais

Clustering - c-means e Self Organizing Maps

Clustering - c-means e Self Organizing Maps - c-means e Self Organizing Maps Sarajane M. Peres e Clodoaldo A. M. Lima 13 de abril de 2015 Material baseado em: HAN, J. & KAMBER, M. Data Mining: Concepts and Techniques. 2nd. 2006 FAUSETT, L. Fundamentals

Leia mais

Tópicos Avançados em IA. Prof. Eduardo R. Hruschka

Tópicos Avançados em IA. Prof. Eduardo R. Hruschka Tópicos Avançados em IA Prof. Eduardo R. Hruschka Créditos Este material consiste de adaptações dos originais: Elaborados por Eduardo Hruschka e Ricardo Campello de (Tan et al., 2006) de E. Keogh (SBBD

Leia mais

Agrupamento de dados. Critério 1: grupos são concentrações de dados k-means Critério 2: grupos são conjuntos de elementos próximos entre si espectral

Agrupamento de dados. Critério 1: grupos são concentrações de dados k-means Critério 2: grupos são conjuntos de elementos próximos entre si espectral Agrupamento de dados Critério 1: grupos são concentrações de dados k-means Critério 2: grupos são conjuntos de elementos próximos entre si espectral Dados e grafos Se temos dados x i, i 0... n, criamos

Leia mais

Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação

Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Francisco A. Rodrigues Departamento de Matemática Aplicada e Estatística - SME Conceitos básicos Classificação não-supervisionada:

Leia mais

= comprimento (distância, valor) da aresta orientada do vértice i ao vértice j,, e:

= comprimento (distância, valor) da aresta orientada do vértice i ao vértice j,, e: 8 - Problema do Caminho Mínimo Considere a rede: Dado dois vértices nesta rede, queremos determinar o menor caminho ente eles. Uma primeira questão é como representar os valores associados às arestas neste

Leia mais

Descoberta de Conhecimento em Bases de Dados. Pesquisa de Clusters

Descoberta de Conhecimento em Bases de Dados. Pesquisa de Clusters Universidade Técnica de Lisboa INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO Informática e Sistemas de Informação Aplicados em Economia Descoberta de Conhecimento em Bases de Dados. Pesquisa de Clusters Descoberta

Leia mais

Clustering (k-means, SOM e hierárquicos)

Clustering (k-means, SOM e hierárquicos) Clustering (k-means, SOM e hierárquicos) André Tavares da Silva andre.silva@udesc.br (Capítulo 10 de Duda e Hart) Clustering Introdução e tipos Roteiro Agrupamentos hierárquicos AGNES, DIANA e Dendogram

Leia mais

Mineração de Dados em Biologia Molecular

Mineração de Dados em Biologia Molecular Mineração de Dados em Biologia Molecular André C. P. L. F. de Carvalho Monitor: Valéria Carvalho Agrupamento de Dados Tópicos Agrupamento de dados Análise de cluster Dificuldades em agrupamento Algoritmos

Leia mais

Projected Clustering Algorithm

Projected Clustering Algorithm Projected Clustering Algorithm Emanuel Matos 5560105 Disciplina : Análise de Agrupamentos Prof. Dr. Ricardo Campello Dez/2010 View Problema Objetivo Definições/Premissas Algoritmo Acurácia Escalabilidade

Leia mais

Inteligência nos Negócios (Business Inteligente)

Inteligência nos Negócios (Business Inteligente) Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 7) Fundamentação da disciplina Analise de dados Decisões

Leia mais

Mineração de padrões frequentes

Mineração de padrões frequentes Mineração de padrões frequentes Fabrício J. Barth fabricio.barth@gmail.com Setembro de 2016 Objetivos Os objetivos desta aula são: Apresentar e discutir métodos para identificar associações úteis em grandes

Leia mais

Introdução à Mineração de Dados com Aplicações em Ciências Espaciais

Introdução à Mineração de Dados com Aplicações em Ciências Espaciais Introdução à Mineração de Dados com Aplicações em Ciências Espaciais Escola de Verão do Laboratório Associado de Computação e Matemática Aplicada Rafael Santos Dia 3: 1 /54 Programa Dia 1: Apresentação

Leia mais

O estudo utilizando apenas este material não é suficiente para o entendimento do conteúdo. Recomendamos a leitura das referências no final deste

O estudo utilizando apenas este material não é suficiente para o entendimento do conteúdo. Recomendamos a leitura das referências no final deste O estudo utilizando apenas este material não é suficiente para o entendimento do conteúdo. Recomendamos a leitura das referências no final deste material e a resolução (por parte do aluno) de todos os

Leia mais

Acessibilidade e Fecho Transitivo de Grafos Dirigidos

Acessibilidade e Fecho Transitivo de Grafos Dirigidos 1 Acessibilidade e Fecho Transitivo de Grafos Dirigidos 1. Fecho transitivo 2. Multiplicação de matrizes booleanas 3. Algoritmo de Warshall 4. Equivalência em termos de complexidade computacional com o

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação Aprendizado de Máquina (Machine Learning) Aula 07 Classificação com o algoritmo knn Max Pereira Classificação com o algoritmo (knn) Um algoritmo supervisionado usado para classificar

Leia mais

Regras Rudimentarias

Regras Rudimentarias Regras Regras Rudimentarias 1R: aprende uma regra por atributo atribuí a classe mais freqüente taxa de erro: proporção de instâncias que não pertence a classe majoritária escolhe o atributo com menor taxa

Leia mais

Clustering: K-means and Aglomerative

Clustering: K-means and Aglomerative Universidade Federal de Pernambuco UFPE Centro de Informática Cin Pós-graduação em Ciência da Computação U F P E Clustering: K-means and Aglomerative Equipe: Hugo, Jeandro, Rhudney e Tiago Professores:

Leia mais

Clustering: k-means e Agglomerative

Clustering: k-means e Agglomerative Tópicos Avançados em Avaliação de Desempenho de Sistemas Jackson Nunes Marco Eugênio Araújo Outubro de 2014 1 Sumário Contextualização Classificação Agrupamento (Clustering) Cenários de Aplicação Clustering

Leia mais

Prova Didática Grafos: Árvores Geradoras e Caminhos Mínimos, Análise de Complexidade

Prova Didática Grafos: Árvores Geradoras e Caminhos Mínimos, Análise de Complexidade Prova Didática Grafos: Árvores Geradoras e Caminhos Mínimos, Análise de Complexidade Gustavo E.A.P.A. Batista 25 de janeiro de 2005 1 Contextualização 2 Caminhos Mínimos Caminhos Mínimos de uma Origem

Leia mais

Roteiro. PCC142 / BCC444 - Mineração de Dados. Cenário

Roteiro. PCC142 / BCC444 - Mineração de Dados. Cenário Roteiro PCC142 / BCC444 - Mineração de Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br www.decom.ufop.br/luiz Introdução Tarefas

Leia mais

Minerando Padrões Sequenciais para Bases de Dados de Lojas Virtuais

Minerando Padrões Sequenciais para Bases de Dados de Lojas Virtuais Universidade Federal de Ouro Preto Instituto de Ciências Exatas e Biológicas Departamento de Computação Minerando Padrões Sequenciais para Bases de Dados de Lojas Virtuais Cecília Henriques Devêza ceciliadeveza@gmail.com

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 18 Aprendizado Não-Supervisionado Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor

Leia mais

Detecção: quais os caminhos?

Detecção: quais os caminhos? Detecção: quais os caminhos? Visão Computacional Programa de Pós- Graduação em Ciência da Computação UFMA Prof. Geraldo Braz Junior Baseado nas notas de aula do CS131, CS229 CS231B Porque? Aplicações necessitam

Leia mais

Laços Fortes e Fracos

Laços Fortes e Fracos Laços Fortes e Fracos Redes Sociais e Econômicas Prof. André Vignatti Motivação Estudo nos anos 60: pessoas que mudaram recentemente de emprego Como elas encontraram o novo emprego? Resposta: através de

Leia mais

Grafos: caminhos (matriz adjacência)

Grafos: caminhos (matriz adjacência) Grafos: caminhos (matriz adjacência) Algoritmos e Estruturas de Dados 2 Graça Nunes 1 O problema do menor caminho Um motorista deseja encontrar o caminho mais curto possível entre duas cidades do Brasil

Leia mais

IA: Aprendizado IV. Professor Paulo Gurgel Pinheiro. 30 de Setembro de 2010

IA: Aprendizado IV. Professor Paulo Gurgel Pinheiro. 30 de Setembro de 2010 IA: Aprendizado IV Professor Paulo Gurgel Pinheiro MC906A - Inteligência Articial Instituto de Computação Universidade Estadual de Campinas - UNICAMP 30 de Setembro de 2010 1 / 75 http://www.ic.unicamp.br/

Leia mais

Sensometria, Segmentação. Adilson dos Anjos

Sensometria, Segmentação. Adilson dos Anjos Segmentação Adilson dos Anjos Segmentação Objetivo O objetivo dessa aula é apresentar alguns métodos de Segmentação. As análises serão realizadas com uso do R; Pacotes utilizados nessa aula FactoMineR

Leia mais

Distâncias Mínimas. Pedro Ribeiro 2014/2015 DCC/FCUP. Pedro Ribeiro (DCC/FCUP) Distâncias Mínimas 2014/ / 27

Distâncias Mínimas. Pedro Ribeiro 2014/2015 DCC/FCUP. Pedro Ribeiro (DCC/FCUP) Distâncias Mínimas 2014/ / 27 Distâncias Mínimas Pedro Ribeiro DCC/FCUP 2014/2015 Pedro Ribeiro (DCC/FCUP) Distâncias Mínimas 2014/2015 1 / 27 Distâncias Mínimas Uma das aplicações mais típicas em grafos é o cálculo de distâncias.

Leia mais

6 Clustering: Definindo Grupos Estratégicos

6 Clustering: Definindo Grupos Estratégicos 6 Clustering: Definindo Grupos Estratégicos 6.1 Introdução Não é difícil deduzir que as 60 empresas distribuidoras de energia elétrica, operantes no SEB, apresentam características heterogêneas. Entretanto,

Leia mais

Método Simplex. Marina Andretta ICMC-USP. 19 de outubro de 2016

Método Simplex. Marina Andretta ICMC-USP. 19 de outubro de 2016 Método Simplex Marina Andretta ICMC-USP 19 de outubro de 2016 Baseado no livro Introduction to Linear Optimization, de D. Bertsimas e J. N. Tsitsiklis. Marina Andretta (ICMC-USP) sme0211 - Otimização linear

Leia mais

Inteligência Artificial Agrupamento de Dados. prof. Dr. Rogério R. de Vargas. Universidade Estadual de Santa Cruz - UESC. Ilhéus-Ba, Outubro de 2013

Inteligência Artificial Agrupamento de Dados. prof. Dr. Rogério R. de Vargas. Universidade Estadual de Santa Cruz - UESC. Ilhéus-Ba, Outubro de 2013 Inteligência Artificial de prof. Dr. Rogério R. de Vargas Universidade Estadual de Santa Cruz - UESC Ilhéus-Ba, Outubro de 2013 http://rogerio.in slide 1 Introdução http://rogerio.in slide 2 Como agrupar?

Leia mais

Análise de Clusters. Aplicações da formação de Grupos (Clustering)

Análise de Clusters. Aplicações da formação de Grupos (Clustering) Análise de Clusters Aplicações da formação de Grupos (Clustering) Ver e analisar vastas quantidades de dados biológicos como um todo pode ser difícil É mais fácil interpretar os dados se forem divididos

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Problema do Agrupamento Aprendizagem de Máquina Alessandro L. Koerich Seja x = (x 1, x 2,, x d ) um vetor d dimensional de características Seja D um conjunto de x vetores, D = { x(1), x(2),, x(n) } Problema

Leia mais

Redes Neurais (Inteligência Artificial)

Redes Neurais (Inteligência Artificial) Redes Neurais (Inteligência Artificial) Aula 16 Aprendizado Não-Supervisionado Edirlei Soares de Lima Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest

Leia mais

Métodos de Agrupamento (Clustering) Aula 18

Métodos de Agrupamento (Clustering) Aula 18 Métodos de Agrupamento (Clustering) Aula 18 Prof. Dr. Paulo A. V. de Miranda Instituto de Matemática e Estatística (IME), Universidade de São Paulo (USP) pmiranda@vision.ime.usp.br Existem duas classes

Leia mais

Redes Neurais não Supervisionadas: SOM

Redes Neurais não Supervisionadas: SOM Universidade Federal do Rio Grande do Norte Departamento de Engenharia de Computação e Automação Redes Neurais não Supervisionadas: SOM DCA0121 Inteligência Artificial Aplicada Heitor Medeiros 1 Tópicos

Leia mais

Análise de Agrupamento (Cluster analysis)

Análise de Agrupamento (Cluster analysis) Análise de Agrupamento (Cluster analysis) Anderson Rodrigo da Silva 1 Exemplos de aplicações de análise de agrupamento Pesquisas de mercado Agrupamento de cidades-teste Bancos de germoplasma Caracterização

Leia mais

Aula 8 - Reconhecimento e Interpretação. Prof. Adilson Gonzaga

Aula 8 - Reconhecimento e Interpretação. Prof. Adilson Gonzaga Aula 8 - Reconhecimento e Interpretação Prof. Adilson Gonzaga Elementos de Visão Computacional: Visão Computacional Processamento de Baio Nível Processamento de Nível Intermediário Processamento de Alto

Leia mais

Aula 7 Medidas de Distância. Profa. Elaine Faria UFU

Aula 7 Medidas de Distância. Profa. Elaine Faria UFU Aula 7 Medidas de Distância Profa. Elaine Faria UFU - 2017 Agradecimentos Este material é baseado No livro Tan et al, 2006 Nos slides do prof Andre C. P. L. F. Carvalho Agradecimentos Ao professor André

Leia mais

Mineração de Dados e Aprendizado de Máquinas. Rodrigo Leite Durães.

Mineração de Dados e Aprendizado de Máquinas. Rodrigo Leite Durães. Mineração de Dados e Aprendizado de Máquinas. Rodrigo Leite Durães. O que é mineração de dados Mineração de Dados é um passo no processo de KDD que consiste na aplicação de análise de dados e algoritmos

Leia mais

Combinando semi-supervisão e hubness para aprimorar o agrupamento de dados em alta dimensão

Combinando semi-supervisão e hubness para aprimorar o agrupamento de dados em alta dimensão Combinando semi-supervisão e hubness para aprimorar o agrupamento de dados em alta dimensão Mateus Curcino de Lima, Maria Camila Nardini Barioni, Humberto Luiz Razente mateuscurcino@mestrado.ufu.br, {camila.barioni,humberto.razente}@ufu.br

Leia mais

MÉTODOS MULTIVARIADOS. Rodrigo A. Scarpel

MÉTODOS MULTIVARIADOS. Rodrigo A. Scarpel MÉTODOS MULTIVARIADOS Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo INTRODUÇÃO Semana Conteúdo Introdução aos métodos multivariados 1 Análise de componentes principais 2 Aplicações de análise

Leia mais

Grafos. Fabio Gagliardi Cozman. PMR2300 Escola Politécnica da Universidade de São Paulo

Grafos. Fabio Gagliardi Cozman. PMR2300 Escola Politécnica da Universidade de São Paulo PMR2300 Escola Politécnica da Universidade de São Paulo Um grafo é uma estrutura que generaliza árvores, sendo formado por nós e arestas. Cada nó em um grafo pode ser conectado a vários outros nós por

Leia mais

Curso de Introdução ao OpenProj

Curso de Introdução ao OpenProj Curso de Introdução ao OpenProj Prof. Dr. Eliandro R. Cirilo Universidade Estadual de Londrina - UEL Centro de Ciências Exatas - CCE Departamento de Matemática 22 de fevereiro de 2017 1 / 16 Sumário 1

Leia mais

Estudo e Análise das Diversas Representações e Estruturas de Dados Utilizadas nos Algoritmos de Clustering Hierárquico. N o 269

Estudo e Análise das Diversas Representações e Estruturas de Dados Utilizadas nos Algoritmos de Clustering Hierárquico. N o 269 Instituto de Ciências Matemáticas e de Computação ISSN - 0103-2569 Estudo e Análise das Diversas Representações e Estruturas de Dados Utilizadas nos Algoritmos de Clustering Hierárquico Jean Metz Maria

Leia mais

Inteligência nos Negócios (Business Inteligente)

Inteligência nos Negócios (Business Inteligente) Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 7) Fundamentação da disciplina Analise de dados Decisões

Leia mais

Agrupamento. Algoritmos e aplicações

Agrupamento. Algoritmos e aplicações Agrupamento Algoritmos e aplicações Equipe Bertha Andaluz (bmca) Deborah Mesquita (dhsm) Lucas Lima (lapl) Lucas Tenório (lvt) Roteiro Motivação Métodos de clustering Modelos de clustering Fuzzy clustering

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação (Machine Learning) Aula 07 Classificação com o algoritmo knn Max Pereira Classificação com o algoritmo k-nearest Neighbors (knn) Como os filmes são categorizados em gêneros? O que

Leia mais

AGRUPAMENTO DE ESCOLAS D. JOSÉ I - VRSA MATEMÁTICA 5.º ANO 2015/16

AGRUPAMENTO DE ESCOLAS D. JOSÉ I - VRSA MATEMÁTICA 5.º ANO 2015/16 AGRUPAMENTO DE ESCOLAS D. JOSÉ I - VRSA MATEMÁTICA 5.º ANO 2015/16 Ficha 4 Números naturais (revisão) NOME Turma Data 1. Considere os números 15, 25 e 30. a) Determine os divisores de 15, 25 e 30. b) A

Leia mais

Método de Newton modificado

Método de Newton modificado Método de Newton modificado Marina Andretta ICMC-USP 14 de setembro de 2010 Marina Andretta (ICMC-USP) sme0212 - Otimização não-linear 14 de setembro de 2010 1 / 36 Método de Newton Como já vimos, o método

Leia mais

Otimização em Grafos

Otimização em Grafos Otimização em Grafos Luidi G. Simonetti PESC/COPPE 2017 Luidi Simonetti (PESC) EEL857 2017 1 / 33 Definição do Problema Dado: um grafo ponderado G = (V, E), orientado ou não, onde d : E R + define as distâncias

Leia mais

ESTRUTURAS DISCRETAS (INF 1631) GRAFOS. 1. O que é um grafo? Defina um grafo orientado. Defina um grafo não-orientado.

ESTRUTURAS DISCRETAS (INF 1631) GRAFOS. 1. O que é um grafo? Defina um grafo orientado. Defina um grafo não-orientado. PUC-Rio Departamento de Informática Profs. Marcus Vinicius S. Poggi de Aragão Período: 0. Horário: as-feiras e as-feiras de - horas de maio de 0 ESTRUTURAS DISCRETAS (INF 6) a Lista de Exercícios Procure

Leia mais

PMR2560 Visão Computacional Detecção de cores e blobs. Prof. Eduardo L. L. Cabral

PMR2560 Visão Computacional Detecção de cores e blobs. Prof. Eduardo L. L. Cabral PMR2560 Visão Computacional Detecção de cores e blobs Prof. Eduardo L. L. Cabral Objetivos Detecção de cores; Detecção de blobs. Detecção de cores Cores são facilmente identificadas nas imagens. Cor a

Leia mais

GRAFOS Aula 07 Algoritmos de Caminho Mínimo: Bellman-Ford / Floyd-Warshall Max Pereira

GRAFOS Aula 07 Algoritmos de Caminho Mínimo: Bellman-Ford / Floyd-Warshall Max Pereira Ciência da Computação GRAFOS Aula 07 Algoritmos de Caminho Mínimo: Bellman-Ford / Floyd-Warshall Max Pereira Algoritmo de Bellman-Ford Arestas com valores negativos podem parecer inúteis, mas elas podem

Leia mais

Mineração de Dados - Introdução. Elaine Ribeiro de Faria UFU 2018

Mineração de Dados - Introdução. Elaine Ribeiro de Faria UFU 2018 Mineração de Dados - Introdução Elaine Ribeiro de Faria UFU 2018 1 Mineração de Dados Processo de automaticamente descobrir informação útil em grandes repositórios de dados Tan P., SteinBack M. e Kumar

Leia mais

Teoria dos Grafos Aula 3

Teoria dos Grafos Aula 3 Teoria dos Grafos Aula 3 Aula passada Exemplo (mapas) Definições Algumas propriedades Aula de hoje Representando grafos Matriz e lista Comparando tempos de acesso Grafo G=(V, E) Grafo V = conjunto de vértices

Leia mais

Data t Mi M ning : : Conceitos e Técnicas

Data t Mi M ning : : Conceitos e Técnicas Data Mining: Conceitos e Técnicas Algumas técnicas para Data Mining Geração de regras de associação; Classificação e predição; Agrupamento (clustering). Data Mining: Regras de Associação Regras de associação

Leia mais

AULA 11 PROJETO E ANÁLISE DE ALGORITMOS. Conceitos básicos e representação de grafos Karina Valdivia Delgado

AULA 11 PROJETO E ANÁLISE DE ALGORITMOS. Conceitos básicos e representação de grafos Karina Valdivia Delgado AULA 11 PROJETO E ANÁLISE DE ALGORITMOS Conceitos básicos e representação de grafos Karina Valdivia Delgado Roteiro Motivação Conceitos básicos Representação Motivação Um grafo é uma abstração que permite

Leia mais

4 Agrupamento de documentos

4 Agrupamento de documentos 4 Agrupamento de documentos É a teoria que decide o que podemos observar. Albert Einstein Um dos métodos mais utilizados de mineração de dados descritiva é conhecido como análise de grupos 23. Com ele,

Leia mais

Análise de dados multivariados I

Análise de dados multivariados I Análise de dados multivariados I Tópico: Análise de Conglomerados ou Agrupamentos (ou ainda, Cluster Analysis) Bibliografia: R.A. Johnson, Applied Multivariate Statistical Analysis, Prentice Hall, 199

Leia mais

Uso da Rede Neural Artificial Self Organizing Maps (SOM) na clusterização de dados meteorológicos

Uso da Rede Neural Artificial Self Organizing Maps (SOM) na clusterização de dados meteorológicos Trabalho apresentado no CMAC-Sul, Curitiba-PR, 2014. Uso da Rede Neural Artificial Self Organizing Maps (SOM) na clusterização de dados meteorológicos Jorge V. R. Bonato, Paulo H. Siqueira Programa de

Leia mais

Integração de Mineração de Dados com SGBD Detecção de Agrupamentos

Integração de Mineração de Dados com SGBD Detecção de Agrupamentos Integração de Mineração de Dados com SGBD Detecção de Agrupamentos Centro de Matemática Computação e Cognição-UFABC Jéssica Andressa de Souza Pós-Graduação em Ciência da Computação Sistemas de Banco de

Leia mais

Marina Andretta. 10 de outubro de Baseado no livro Introduction to Linear Optimization, de D. Bertsimas e J. N. Tsitsiklis.

Marina Andretta. 10 de outubro de Baseado no livro Introduction to Linear Optimization, de D. Bertsimas e J. N. Tsitsiklis. Solução básica viável inicial Marina Andretta ICMC-USP 10 de outubro de 2016 Baseado no livro Introduction to Linear Optimization, de D. Bertsimas e J. N. Tsitsiklis. Marina Andretta (ICMC-USP) sme0211

Leia mais

06 Grafos: Caminhos Mínimos SCC0503 Algoritmos e Estruturas de Dados II

06 Grafos: Caminhos Mínimos SCC0503 Algoritmos e Estruturas de Dados II 06 Grafos: Caminhos Mínimos SCC050 Algoritmos e Estruturas de Dados II Paulo H. R. Gabriel Moacir Ponti Jr. www.icmc.usp.br/~moacir Instituto de Ciências Matemáticas e de Computação USP 011/1 Paulo H.

Leia mais

Tópicos em Mineração de Dados

Tópicos em Mineração de Dados Tópicos em Mineração de Dados Descoberta de agrupamentos Método k-médias 1. Introdução A descoberta de agrupamentos é uma tarefa descritiva que procura agrupar dados utilizando a similaridade dos valores

Leia mais

Reconhecimento de palma de mão. Peterson Wagner Kava de Carvalho

Reconhecimento de palma de mão. Peterson Wagner Kava de Carvalho Reconhecimento de palma de mão Peterson Wagner Kava de Carvalho 1 Sumário 1. Introdução 2. Artigo 1: Palmprint Recognition a. Pré-Processamento b. Extração de Features c. Classificação d. Resultados 3.

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação (Machine Learning) Aula 14 Regras de Associação Max Pereira Regras de Associação Motivação O que é geralmente comprado junto com o produto x? Que pares de produtos são comprados juntos?

Leia mais

Teoria dos Grafos. Valeriano A. de Oliveira, Socorro Rangel, Silvio A. de Araujo. Departamento de Matemática Aplicada

Teoria dos Grafos. Valeriano A. de Oliveira, Socorro Rangel, Silvio A. de Araujo. Departamento de Matemática Aplicada Teoria dos Grafos Valeriano A. de Oliveira, Socorro Rangel, Silvio A. de Araujo Departamento de Matemática Aplicada Capítulo 10: Caminho mínimo - Algoritmo de Dijskstra Preparado a partir do texto: Rangel,

Leia mais

Projeções Multi-dimensionais

Projeções Multi-dimensionais Prof. Fernando V. Paulovich http://www.icmc.usp.br/~paulovic paulovic@icmc.usp.br Instituto de Ciências Matemáticas e de Computação (ICMC) Universidade de São Paulo (USP) 23 de setembro de 2010 Introdução

Leia mais

Estudo e Comparação de Métodos para Estimação de Números de Grupos em Problemas de Agrupamento de Dados. N o 340 RELATÓRIOS TÉCNICOS DO ICMC

Estudo e Comparação de Métodos para Estimação de Números de Grupos em Problemas de Agrupamento de Dados. N o 340 RELATÓRIOS TÉCNICOS DO ICMC Instituto de Ciências Matemáticas e de Computação ISSN - 0103-2569 Estudo e Comparação de Métodos para Estimação de Números de Grupos em Problemas de Agrupamento de Dados André Fontana Murilo Coelho Naldi

Leia mais

AED2 - Aula 22 Busca em largura, cálculo de distâncias

AED2 - Aula 22 Busca em largura, cálculo de distâncias AED2 - Aula 22 Busca em largura, cálculo de distâncias Relembrando a busca genérica, usando um versão alternativa: marque todos os vértices como não encontrados. marque s como encontrado. coloque s no

Leia mais

Sistemas de Equações Lineares

Sistemas de Equações Lineares Capítulo 3 Sistemas de Equações Lineares Um sistema com n equações lineares pode ser escrito na forma : ou na forma matricial onde com a 1,1 x 1 + a 1,2 x 2 + + a x n = b 1 a 2,1 x 1 + a 2,2 x 2 + + a

Leia mais

Processamento de Imagens usando Grafos (MAC6903)

Processamento de Imagens usando Grafos (MAC6903) Processamento de Imagens usando Grafos (MAC6903) Prof. Dr. Paulo A. V. de Miranda pmiranda@vision.ime.usp.br Instituto de Matemática e Estatística (IME), Universidade de São Paulo (USP) P.A.V. Miranda,

Leia mais

Teoria dos Grafos AULA

Teoria dos Grafos AULA Teoria dos Grafos Valeriano A. de Oliveira Socorro Rangel Departamento de Matemática Aplicada antunes@ibilce.unesp.br, socorro@ibilce.unesp.br AULA Caminho mínimo - Algoritmo de Djskstra Preparado a partir

Leia mais

Estrutura (IV) - Modularidade

Estrutura (IV) - Modularidade Modularidade Estrutura (IV) - Modularidade Paulo R. Guimarães Jr (Miúdo) & Flávia M. D. Marquitti Ecologia - USP Modularidade Modularidade Modularidade Como caracterizar o agrupamento de pontos e interações?

Leia mais

TGR BCC Representação Computacional de Grafos. Prof. Ricardo José Pfitscher

TGR BCC Representação Computacional de Grafos. Prof. Ricardo José Pfitscher TGR BCC Representação Computacional de Grafos Prof. Ricardo José Pfitscher Cronograma Representação Matriz de djacências Lista de djacências Matriz de Incidências Representação Como podemos representar

Leia mais

Processamento de Imagens usando Grafos (MAC6903)

Processamento de Imagens usando Grafos (MAC6903) Processamento de Imagens usando Grafos (MAC6903) Prof. Dr. Paulo A. V. de Miranda Instituto de Matemática e Estatística (IME), Universidade de São Paulo (USP) pmiranda@vision.ime.usp.br 1 / 20 Uma imagem

Leia mais

Prof. Daniela Barreiro Claro

Prof. Daniela Barreiro Claro O volume de dados está crescendo sem parar Gigabytes, Petabytes, etc. Dificuldade na descoberta do conhecimento Dados disponíveis x Análise dos Dados Dados disponíveis Analisar e compreender os dados 2

Leia mais

Teoria dos Grafos Aula 22

Teoria dos Grafos Aula 22 Teoria dos Grafos Aula 22 Aula passada Caminho mais curto entre todos os pares Algoritmo de Floyd Warshall Programação dinâmica Aula de hoje Caminho mais curto Algoritmo de Bellman Ford Melhorias Caminho

Leia mais

A análise de aglomerados

A análise de aglomerados Mais importante do que saber fazer é saber o por quê (Norbert Wiener (1894 1964). Prof. Lorí Viali, Dr. viali@pucrs.br; viali@mat.ufrgs.br; http://www.pucrs.br/famat/viali; http://www.mat.ufrgs.br/~viali/

Leia mais

SEL-0339 Introdução à Visão Computacional. Aula 7 Reconhecimento de Objetos

SEL-0339 Introdução à Visão Computacional. Aula 7 Reconhecimento de Objetos Departamento de Engenharia Elétrica - EESC-USP SEL-0339 Introdução à Visão Computacional Aula 7 Reconhecimento de Objetos Prof. Dr. Marcelo Andrade da Costa Vieira Prof. Dr. Adilson Gonzaga mvieira@sc.usp.br

Leia mais

Resposta da pergunta 2: Θ(n 3 ). Resposta da pergunta 8: 1. 7 O(n). Sim. 22. n log n O(1). Não. 3. n + 7 O(n). Sim. 4. n + 7 O(1). Não.

Resposta da pergunta 2: Θ(n 3 ). Resposta da pergunta 8: 1. 7 O(n). Sim. 22. n log n O(1). Não. 3. n + 7 O(n). Sim. 4. n + 7 O(1). Não. SSC0503 - Introdução à Ciência de Computação II Respostas da 1 a Lista Professor: Claudio Fabiano Motta Toledo (claudio@icmc.usp.br) Estagiário PAE: Jesimar da Silva Arantes (jesimar.arantes@usp.br) Resposta

Leia mais

Projeto e Implementação do Módulo de Clustering Hierárquico do DISCOVER. N o 278 RELATÓRIOS TÉCNICOS DO ICMC. São Carlos Agosto de 2006.

Projeto e Implementação do Módulo de Clustering Hierárquico do DISCOVER. N o 278 RELATÓRIOS TÉCNICOS DO ICMC. São Carlos Agosto de 2006. Instituto de Ciências Matemáticas e de Computação ISSN - 0103-2569 Projeto e Implementação do Módulo de Clustering Hierárquico do DISCOVER Jean Metz Maria Carolina Monard N o 278 RELATÓRIOS TÉCNICOS DO

Leia mais

SCC0173 Mineração de Dados Biológicos

SCC0173 Mineração de Dados Biológicos SCC0173 Mineração de Dados Biológicos Preparação de Dados: Parte B Prof. Ricardo J. G. B. Campello SCC / ICMC / USP 1 Créditos O material a seguir consiste de adaptações e extensões: dos originais gentilmente

Leia mais

Inteligência de Enxame

Inteligência de Enxame Inteligência de Enxame! Inteligência de enxames é a denominação aplicada a tentativa de desenvolvimento de algoritmos para a solução distribuída de problemas inspirando-se no comportamento coletivo de

Leia mais

Eduardo Camponogara. DAS-9003: Introdução a Algoritmos

Eduardo Camponogara. DAS-9003: Introdução a Algoritmos Caminhos Mínimos Com Uma Fonte 1/74 Caminhos Mínimos Com Uma Fonte Eduardo Camponogara Departamento de Automação e Sistemas Universidade Federal de Santa Catarina DAS-9003: a Algoritmos Caminhos Mínimos

Leia mais

UNIVERSIDADE FEDERAL DA BAHIA

UNIVERSIDADE FEDERAL DA BAHIA UNIVERSIDADE FEDERAL DA BAHIA INSTITUTO DE MATEMÁTICA E ESTATÍSTICA DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO RECUPERAÇÃO DE ARQUITETURA DE SOFTWARE UTILIZANDO ALGORITMOS DE AGRUPAMENTO ALUNO: DENNIS LESSA

Leia mais

Análise de Agrupamento. Cluster Analysis

Análise de Agrupamento. Cluster Analysis Análise de Agrupamento Cluster Analysis Objetivo Classificar objetos, itens ou indivíduos de acordo com as suas semelhanças. Os objetos semelhantes são alocados em um mesmo grupo e, portanto, aqueles que

Leia mais

Mineração de Dados em Biologia Molecular

Mineração de Dados em Biologia Molecular Mineração de Dados em Biologia Molecular Principais tópicos André C. P. L. F. de Carvalho Monitor: Valéria Carvalho Métodos baseados em distância Aprendizado baseado em instâncias Conceitos básicos KNN

Leia mais

Sumário. Referências utilizadas. Introdução. MAFIA: Merging of Adaptive Finite Intervals. Introdução Visão Geral e Objetivos do MAFIA

Sumário. Referências utilizadas. Introdução. MAFIA: Merging of Adaptive Finite Intervals. Introdução Visão Geral e Objetivos do MAFIA Sumário : Merging of Adaptive Finite Intervals Elaine Ribeiro de Faria Análise de Agrupamento de Dados ICMC-USP Dezembro 2010 Introdução Visão Geral e Objetivos do Algoritmo Grid Adaptativo Algoritmo Algoritmo

Leia mais

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica REDES NEURAIS ARTIFICIAIS AULA 03 Prof. Dr. André A. P. Biscaro 1º Semestre de 2017 INTRODUÇÃO Aprendizagem é um processo pelo qual os parâmetros livres de uma rede neural são adaptados através de um processo

Leia mais