A análise de aglomerados

Tamanho: px
Começar a partir da página:

Download "A análise de aglomerados"

Transcrição

1 Mais importante do que saber fazer é saber o por quê (Norbert Wiener ( ). Prof. Lorí Viali, Dr. viali@pucrs.br; viali@mat.ufrgs.br; Matemático americano que ficou conhecido como o fundador da cibernética. A análise de aglomerados O termo Análise de Aglomerados (Cluster analysis) foi utilizado pela primeira vez por Tryon em 1939 e a técnica é de fato um conjunto de técnicas (algoritmos) de classificação. Uma questão básica que muitos pesquisadores de várias áreas enfrentam é como organizar dados observados em estruturas que agrupem subconjuntos semelhantes, isto é, como criar ou desenvolver taxionomias. O que é Análise de Conglomerados? É uma técnica multivariada que tem como objetivo agrupar dados de acordo com as similaridades entre eles. É uma ferramenta estatística com a qual é possível formar grupos com homogeneidade dentro do agrupamento e heterogeneidade entre eles. 1

2 Como são determinados os grupos? Existem diferentes métodos para isto, que deverão ser selecionados em função da quantidade de dados disponíveis e do número de agrupamentos a serem formados. As Hipóteses A amostra deve ser representativa da população; A colinearidade múltipla entre as variáveis deve ser mínima; A amostra deve estar livre de outliers e a razão n/k deve ser razoável. Outras nomenclaturas Técnicas similares tem sido independentemente desenvolvidas em vários campos, dando origem a nomes diferentes para esta técnica estatística (p. e. Biologia, Arqueologia, etc.). Análise de Conglomerados Taxionomia Numérica Análise Q Análise de Tipologia Análise de Classificação Variações Existem várias técnicas diferentes de aglomeração dependendo do: Procedimento utilizado para medir a similaridade ou distância entre os objetos e do algoritmo de agrupamento empregado. Metodologia No estágio inicial, quando cada item representa seu próprio grupo, as distâncias entre os itens são definidas pela distância escolhida. No entanto, uma vez que vários itens tenham sido agrupados, como determinar a distância entre os grupos formados? Em outras palavras, é necessário uma regra de agrupamento para determinar quando dois grupos são semelhantes o suficiente para serem transformados em um novo grupo. 2

3 Existem várias possibilidades. Por exemplo, se poderia juntar dois grupos quando dois itens quaisquer nos dois grupos estão mais próximos do que a distância de agrupamento. Colocando de outra forma: será utilizado o vizinho mais próximo (nearest neighbors) entre grupos para determinar as distâncias entre os aglomerados. Este método é denominado de encadeamento simples (single linkage). Esta regra produz grupos ligados por itens que estão próximos por acaso. De forma alternativa pode-se utilizar vizinhos que estão o mais distante possível um do outro dando origem ao método de encadeamento completo (complete linkage). Existem muitos métodos de encadeamento semelhantes aos dois propostos. Matriz de dissimilaridades Passo 1 - A análise inicia com o estabelecimento de uma base de dados nxk; Passo 2 - Utilizando um dos vários métodos, uma matriz nxn é criada para indicar as similaridades (ou dissimilaridades) de cada objeto para os demais basedo nas k variáveis. Objetos n 1 0,87 1,54 32,23 2 0,87 23,77 13,45 3 1,54 23,77 7,39 n 32,23 13,45 7,39 Medidas de similaridades ou diferenças Passo 3 - Utilizando um dos vários algoritmos, os objetos são colocados nos diferentes grupos, onde: os objetos dentro dos grupos são os mais homogêneos possíveis e os grupos são os mais diferentes possíveis entre si. A análise de aglomerados inicia criando uma matriz que indica a similaridade (ou distância) entre cada par de objetos relativos às k variáveis contidas na base de dados. Existem várias formas de se fazer isto. 3

4 Técnica Distância Euclidiana ao quadrado (*) Distância Euclidiana (*) Distância de Chebychev (*) Distância Manhattan (*) Métrica do Poder Absoluto Cosseno do vetor de variáveis (*) Técnica Coeficiente de Correlação de Pearson (*) D 2 de Mahalanobis (*) Métrica de Minkowski (*) Coeficiente de Jaccard Coeficiente de Gower Coef. Simples de Concordância Um exemplo de Distância Euclidiana ao Quadrado Objetos Variáveis Objeto 1 Objeto 2 (S 1 -S 2 ) (S 1 -S 2 ) 2 X X X X X Total Tipos de Algoritmos Os algoritmos de agrupamento são geralmente classificados em dois grandes grupos: Métodos hierárquicos e Métodos não-hierárquicos (a) Agrupamento hierárquico O agrupamento hierárquico avança sucessivamente tanto juntando pequenos grupos em maiores quanto dividindo grandes grupos em menores. O método de agrupamento difere na regra pela qual dois pequenos grupos são unidos ou na forma como um grande é dividido. O resultado do algoritmo é uma árvore de grupos denominada de dendograma, que mostra como os grupos estão relacionados. Pelo corte do dendograma a um nível desejado pode-se obter um aglomerado de itens de dados classificados em grupos disjuntos. Métodos Hierárquicos Métodos Aglomerativos Métodos Divisivos Encadeamento Simples (Vizinho mais Próximo) (*) Método da fragmentação média Encadeamento Médio (*) Métodos de Traço Encadeamento Completo Método de Detecção de (Vizinho mais Distante) (*) Interação Automática Método de Ward (*) Aglomeração por k médias (*) Agrupamento pela Mediana 4

5 Encadeamento simples (vizinho mais próximo) Este método utiliza a distância entre os dois itens mais próximos (vizinhos) como a distância entre dois grupos. Esta regra aglomera itens para formar grupos e os aglomerados resultantes tendem a representar longas cadeias. Encadeamento completo (vizinho distante) Neste procedimento a distância entre dois grupos é determinada pela maior distância entre dois itens em grupos diferentes. Este método nem sempre funciona bem em todas as situações, principalmente quando os grupos tendem a ser alongados. Médias não ponderadas de grupos pareados (Unweighted pair-group average) Neste método a distância entre dois grupos é calculada pela pela média entre todos os pares de itens pertencentes aos grupos. Este método é mais eficiente quando os objetos formam aglomerados naturais distintos. Sneath and Sokal (1973) introduziram a abreviação UPGMA (Unweighted Pair-Group Method using Arithmetic averages). Médias ponderadas de grupos pareados (Weighted pair-group average). Este método é idêntico ao anterior exceto que a média agora é ponderada pelos tamanhos dos grupos. Assim, este método, deve preferido quando os tamanhos dos grupos forem bastante diferentes. Sneath and Sokal (1973) introduziram a abreviação WPGMA (weighted pair-group method using arithmetic averages). Centróide não ponderada do par de grupos (Unweighted pair-group centroid) A centróide de um grupo (cluster) é o ponto médio no espaço definido pelas dimensões. Em um certo sentido, ela é o centro de gravidade do grupo. Neste método a distância entre dois grupos é determinada pela diferença entre as respectivas centróides. Sneath and Sokal (1973) utilizam a abreviação UPGMC (unweighted pair-group method using the centroid average). Centróide ponderada do par de grupos (Weighted pair-group centroid - median) Este método é idêntico ao anterior, exceto que é ponderado pelo tamanho dos grupos. Sneath and Sokal (1973) utilizam a abreviação WPGMC (weighted pair-group method using the centroid average) para designar este método. 5

6 Método de Ward. Utiliza uma abordagem diferente dos demais, a análise de variância para avaliar as distâncias entre os grupos (clusters). O método tenta minimizar a soma dos quadrados (SQ) de dois hipotéticos grupos que podem ser formados a cada passo. O método é eficiente mas tende a criar grupos de tamanhos pequenos. (b) Agrupamento particional O agrupamento partitional tenta decompor os dados em um conjunto de grupos disjuntos. A função critério que o algoritmo de agrupamento tenta minimizar pode enfatizar a estruturar local dos dados pela atribuição de grupos aos picos da função densidade de probabilidade ou ou então pela estrutura global. Métodos Não Hierárquicos Tipicamente o critério global envolve minimizar de alguma medida de não similaridade nas amostras dentro de cada cluster enquanto maximiza a não similaridade (dissimilarity) dos diferentes grupos. A método comum de agrupamento particional é o denominado agrupamento por k-médias (k-means). Métodos Interativos Limiar Seqüencial Limiar Paralelo Método de Otimização Outros Análise de Fatores Q Métodos de Clump Métodos de Densidade NOMIX NORMAX Observações: A análise de aglomerados pode ser caracterizada como uma análise descritiva, não teórica e não inferencial. É utilizada principalmente com uma técnica exploratória. De fato, a análise de aglomerados não é uma técnica estatística típica, mas uma coleção de algoritmos que agrupa objetos ou casos. Diferente de outros procedimentos estatísticos esta técnica é utilizada principalmente quando não se tem uma hipótese a priori e ainda se está na fase inicial de uma pesquisa ou levantamento de dados. Sendo assim é necessário fazer uma avaliação do impacto de cada decisão tomada na performance da análise de conglomerado. 6

7 Problemas Um dos problemas da técnica é que a interpretação dos grupos pode ser difícil. Muitos algoritmos de agrupamento preferem determinadas formas de grupos e os algoritmos sempre irão colocar dados em grupos daquele formato mesmo se não existirem grupos nos dados. Desta forma se o objetivo não for apenas comprimir os dados mas também fazer inferências sobre a estrutura dos grupos é essencial examinar se o conjunto de dados apresenta, de fato, subgrupos. O resultado da análise de agrupamento precisa, também, ser validado. Outro problema potencial é a escolha do número de grupos. Diferentes números de grupos podem surgir quando o valor de k é alterado. Uma boa inicialização das centróides dos grupos é também importante, alguns grupos podem mesmo ficar vazios se a sua centróide ficar distante da massa dos dados. As soluções não são únicas, como os integrantes de cada grupo são dependentes de todo o conjunto, muitas soluções diferentes podem ser obtidas variando um ou mais elementos. Áreas de Aplicação A técnica de agrupamento tem sido aplicada a uma grande variedade de problemas de pesquisa. Hartigan (1975) fornece um sumário de muitos estudos que utilizaram esta técnica. Por exemplo na medicina o agrupamento de doenças, tratamentos ou sintomas podem resultar em classificações bastante úteis. Na psiquiatria o diagnóstico correto de grupos de sintomas tais como paranóia, esquizofrenia, etc. é essencial para uma terapia bem sucedida. Na arqueologia os pesquisadores tem tentado estabelecer taxionomias de ferramentas de pedra, objetos fúnebres, etc. através da análise de agrupamentos. 7

8 Referências: DURAN, B. S. ODELL, P. L. Cluster Analysis. New York: Springer-Verlag, EVERITT, B. S. Cluster Analysis. London: Heineman Educational Books, HARTIGAN, J. A. Clustering Algorithms, New York: John Wiley & Sons, LORR, M. Cluster Analysis for Social Scientists. San Francisco: Jossey-Bass, MASSART, D. L. KAUFMAN, L. The Interpretation of Analytical Chemical Data by the Use of Cluster Analysis. New York: John Wiley & Sons, McQUITTY, L. L. Pattern Analytic Clustering Lanham: University Press of America, SOKAL, R. R., SNEATH, P. H. A. Principles of numerical taxonomy. San Francisco: W. H. Freeman SPATH, H. Cluster Dissection and Analysis. Chichester (England): Ellis Horwood, TRYON, R. C. Cluster analysis. Ann Arbor: Edwards Brothers, TRYON, R. C., BAYLEY, D. E. Cluster Analysis. New York: McGraw-Hill, TUKEY, J. W. Exploratory Data Analysis. Addison- Reading (MA): Wesley, FISHER, R. A. The Use of Multiple Measurements in Taxonomic Problems. Annals of Eugenics. n. 7, p , HARTIGAN, J. A. Statistical Theory in Clustering. Journal of Classification. n. 2, p , JAIN, A. K., MURTY, M. N., FLIN. P. J. Data Clustering: a review. ACM Computing survey. v. 31, n. 3, sept SNEATH, P. H. A. Thirty years of numerical taxonomy. Syst Biol. n. 44, p WARD, J. H. Hierarchical Grouping to Optimize an Objective Function. Journal of the American Statistical Association. n. 58, p ,

Análise Multivariada Aplicada à Contabilidade

Análise Multivariada Aplicada à Contabilidade Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes www.marcelobotelho.com mbotelho@usp.br Turma: 2º / 2016 1 Agenda

Leia mais

Análise de Agrupamento. Cluster Analysis

Análise de Agrupamento. Cluster Analysis Análise de Agrupamento Cluster Analysis Objetivo Classificar objetos, itens ou indivíduos de acordo com as suas semelhanças. Os objetos semelhantes são alocados em um mesmo grupo e, portanto, aqueles que

Leia mais

Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação

Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Francisco A. Rodrigues Departamento de Matemática Aplicada e Estatística - SME Conceitos básicos Classificação não-supervisionada:

Leia mais

MÉTODOS MULTIVARIADOS. Rodrigo A. Scarpel

MÉTODOS MULTIVARIADOS. Rodrigo A. Scarpel MÉTODOS MULTIVARIADOS Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo INTRODUÇÃO Semana Conteúdo Introdução aos métodos multivariados 1 Análise de componentes principais 2 Aplicações de análise

Leia mais

Clustering: k-means e Agglomerative

Clustering: k-means e Agglomerative Tópicos Avançados em Avaliação de Desempenho de Sistemas Jackson Nunes Marco Eugênio Araújo Outubro de 2014 1 Sumário Contextualização Classificação Agrupamento (Clustering) Cenários de Aplicação Clustering

Leia mais

Redes Neurais (Inteligência Artificial)

Redes Neurais (Inteligência Artificial) Redes Neurais (Inteligência Artificial) Aula 16 Aprendizado Não-Supervisionado Edirlei Soares de Lima Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest

Leia mais

SENSOMETRIA. Adilson dos Anjos. Curitiba, PR 21 de maio de Departamento de Estatística Universidade Federal do Paraná

SENSOMETRIA. Adilson dos Anjos. Curitiba, PR 21 de maio de Departamento de Estatística Universidade Federal do Paraná SENSOMETRIA Adilson dos Anjos Departamento de Estatística Universidade Federal do Paraná aanjos@ufpr.br Curitiba, PR 21 de maio de 2015 1 / 7 SENSOMETRIA SEGMENTAÇÃO 2 / 7 Introdução Análise de agrupamentos->

Leia mais

Mineração de Dados em Biologia Molecular

Mineração de Dados em Biologia Molecular Mineração de Dados em Biologia Molecular André C. P. L. F. de Carvalho Monitor: Valéria Carvalho Agrupamento de Dados Tópicos Agrupamento de dados Análise de cluster Dificuldades em agrupamento Algoritmos

Leia mais

Trilha Learning Machine Cluster Analysis em 4 passos Marco Siqueira Campos

Trilha Learning Machine Cluster Analysis em 4 passos Marco Siqueira Campos Trilha Learning Machine Cluster Analysis em 4 passos Marco Siqueira Campos Marco Siqueira Campos Sócio fundador Siqueira Campos Associados e sos-stat Estatístico UFRGS Certificado Data Science Specialization

Leia mais

MANUAL DE REFERÊNCIA DE ANÁLISE DE CONGLOMERADOS

MANUAL DE REFERÊNCIA DE ANÁLISE DE CONGLOMERADOS MANUAL DE REFERÊNCIA DE ANÁLISE DE CONGLOMERADOS INTRODUÇÃO... 2 MEDIDAS DE SIMILARIDADE [2,3]... 3 2. MEDIDAS DE CORRELAÇÃO... 4 2.2 MEDIDAS DE DISTÂNCIA... 6 2.2. TIPOS DE MEDIDAS DE DISTÂNCIA... 7 2.3

Leia mais

Les-0773: ESTATÍSTICA APLICADA III ANÁLISE DE AGRUPAMENTO. Junho de 2017

Les-0773: ESTATÍSTICA APLICADA III ANÁLISE DE AGRUPAMENTO. Junho de 2017 Les-0773: ESTATÍSTICA APLICADA III ANÁLISE DE AGRUPAMENTO AULA 4 02/06/17 Prof a Lilian M. Lima Cunha Junho de 2017 DEFINIÇÃO Análise de conglomerados (Cluster Analysis) é uma das técnicas de análise multivariada

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina André C. P. L. F. de Carvalho Posdoutorando: Isvani Frias-Blanco ICMC-USP Agrupamento de dados Tópicos Agrupamento de dados Dificuldades em agrupamento Algoritmos de agrupamento

Leia mais

Organização. 1. Introdução 2. Medidas de Similaridade. hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters

Organização. 1. Introdução 2. Medidas de Similaridade. hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters Organização. Introdução 2. Medidas de Similaridade 3. Métodos de Agrupamento (métodos hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters Métodos de Partição Cada exemplo

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 18 Aprendizado Não-Supervisionado Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Aprendizagem Não Supervisionada Alessandro L. Koerich Mestrado/Doutorado em Informática (PPGIa) Pontifícia Universidade Católica do Paraná (PUCPR) Mestrado/Doutorado em Informática

Leia mais

Análise de dados multivariados I

Análise de dados multivariados I Análise de dados multivariados I Tópico: Análise de Conglomerados ou Agrupamentos (ou ainda, Cluster Analysis) Bibliografia: R.A. Johnson, Applied Multivariate Statistical Analysis, Prentice Hall, 199

Leia mais

Aprendizado de Máquinas. Introdução à Aprendizado Não- Supervisionado

Aprendizado de Máquinas. Introdução à Aprendizado Não- Supervisionado Universidade Federal do Paraná (UFPR) Departamento de Informática (DInf) Aprendizado de Máquinas Introdução à Aprendizado Não- Supervisionado David Menotti, Ph.D. http://web.inf.ufpr.br/menotti Objetivos

Leia mais

Níveis descritivos de testes estatísticos de variabilidade como medidas de similaridade entre objetos em análises de agrupamento

Níveis descritivos de testes estatísticos de variabilidade como medidas de similaridade entre objetos em análises de agrupamento Níveis descritivos de testes estatísticos de variabilidade como medidas de similaridade entre objetos em análises de agrupamento Luiz Roberto Martins Pinto 1 Leonardo Evangelista Moraes 2 Priscila Ramos

Leia mais

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Tipos de Aprendizagem. Luiz Eduardo S. Oliveira, Ph.D.

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Tipos de Aprendizagem. Luiz Eduardo S. Oliveira, Ph.D. Universidade Federal do Paraná Departamento de Informática Reconhecimento de Padrões Tipos de Aprendizagem Luiz Eduardo S. Oliveira, Ph.D. http://lesoliveira.net Objetivos Introduzir diferentes tipos de

Leia mais

ANÁLISE DE AGRUPAMENTOS

ANÁLISE DE AGRUPAMENTOS ANÁLISE DE AGRUPAMENTOS Análise de Agrupamentos 2 Definição Consistem em encontrar grupos de objetos entre os objetos Categorizá-los ou agrupá-los Tipo de aprendizado não supervisionado Encontrar grupos

Leia mais

ANÁLISE DE AGRUPAMENTOS (Cluster Analysis) Flávia F. Feitosa

ANÁLISE DE AGRUPAMENTOS (Cluster Analysis) Flávia F. Feitosa ANÁLISE DE AGRUPAMENTOS (Cluster Analysis) Flávia F. Feitosa BH1350 Métodos e Técnicas de Análise da Informação para o Planejamento Julho de 2015 ANÁLISE DE AGRUPAMENTOS É uma técnica analítica pra identificar

Leia mais

PRÁTICA 8. A Distância Euclidiana entre dois vetores n-dimensionais x e y é definida como o escalar: d = norm(x y)

PRÁTICA 8. A Distância Euclidiana entre dois vetores n-dimensionais x e y é definida como o escalar: d = norm(x y) PRÁTICA 8 1) Medidas de Distância. A Distância Euclidiana entre dois vetores n-dimensionais e y é definida como o escalar: d 1 2 2 [( y ) + + ( y ) ] 2 e (, y) = y = y = 1 1 L n n esta epressão é a Norma

Leia mais

PÓS-GRADUAÇÃO ANÁLISE DE DATA MINING

PÓS-GRADUAÇÃO ANÁLISE DE DATA MINING PÓS-GRADUAÇÃO ANÁLISE DE DATA MINING OBJETIVOS Na era da informação, as empresas capturam e armazenam muitos dados, e existe a real necessidade da aplicação de técnicas adequadas para a rápida tomada de

Leia mais

Descoberta de Conhecimento em Bases de Dados. Pesquisa de Clusters

Descoberta de Conhecimento em Bases de Dados. Pesquisa de Clusters Universidade Técnica de Lisboa INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO Informática e Sistemas de Informação Aplicados em Economia Descoberta de Conhecimento em Bases de Dados. Pesquisa de Clusters Descoberta

Leia mais

ANÁLISE DE BIG DATA E INTELIGÊNCIA ARTIFICIAL PARA A ÁREA MÉDICA

ANÁLISE DE BIG DATA E INTELIGÊNCIA ARTIFICIAL PARA A ÁREA MÉDICA CURTA DURAÇÃO ANÁLISE DE BIG DATA E INTELIGÊNCIA ARTIFICIAL PARA A ÁREA MÉDICA CARGA HORÁRIA: 80 horas COORDENAÇÃO: Prof.ª Dr.ª Alessandra de Ávila Montini OBJETIVOS Introduzir o conceito de Big Data,

Leia mais

MELHORIA DA CORRELAÇÃO COFENÉTICA PELA EXCLUSÃO DE UNIDADES EXPERIMENTAIS NA CONSTRUÇÃO DE DENDROGRAMAS

MELHORIA DA CORRELAÇÃO COFENÉTICA PELA EXCLUSÃO DE UNIDADES EXPERIMENTAIS NA CONSTRUÇÃO DE DENDROGRAMAS MELHORIA DA CORRELAÇÃO COFENÉTICA PELA EXCLUSÃO DE UNIDADES EXPERIMENTAIS NA CONSTRUÇÃO DE DENDROGRAMAS IMPROVEMENT OF COPHENETIC CORRELATION FOR THE EXPERIMENTAL UNITS EXCLUSION IN THE DENDROGRAMS CONSTRUCTION

Leia mais

Comparação entre o método Ward e o método K-médias no agrupamento de produtores de leite

Comparação entre o método Ward e o método K-médias no agrupamento de produtores de leite Comparação entre o método Ward e o método K-médias no agrupamento de produtores de leite Enio Júnior Seidel,Fernando de Jesus Moreira Júnior, Angela Pelegrin Ansuj, Maria Rosane Coradini Noal Departamento

Leia mais

Sensometria, Segmentação. Adilson dos Anjos

Sensometria, Segmentação. Adilson dos Anjos Segmentação Adilson dos Anjos Segmentação Objetivo O objetivo dessa aula é apresentar alguns métodos de Segmentação. As análises serão realizadas com uso do R; Pacotes utilizados nessa aula FactoMineR

Leia mais

Análise de Agrupamento (Cluster analysis)

Análise de Agrupamento (Cluster analysis) Análise de Agrupamento (Cluster analysis) Anderson Rodrigo da Silva 1 Exemplos de aplicações de análise de agrupamento Pesquisas de mercado Agrupamento de cidades-teste Bancos de germoplasma Caracterização

Leia mais

Descrição do Método de Análise de Clusters

Descrição do Método de Análise de Clusters ANÁLISE DE CLUSTERS A análise de Clusters designa uma série de procedimentos estatísticos sofisticados que podem ser usados para classificar objectos e pessoas por observação das semelhanças e dissemelhanças

Leia mais

Profissinais que desejam adquirir ou aprimorar seus conhecimentos em modelagem de dados, analytics e estatística aplicada

Profissinais que desejam adquirir ou aprimorar seus conhecimentos em modelagem de dados, analytics e estatística aplicada MBA ANALYTICS OBJETIVOS Na era da informação, as empresas capturam e armazenam muitos dados, e existe a real necessidade da aplicação de técnicas adequadas para a rápida tomada de decisão com base nas

Leia mais

Análise de agrupamento dos dados sedimentológicos da plataforma e talude continentais da Bahia

Análise de agrupamento dos dados sedimentológicos da plataforma e talude continentais da Bahia Análise de agrupamento dos dados sedimentológicos da plataforma e talude continentais da Bahia ÂNGELA CRISTINA DA FONSECA MIRANTE 1 2 4 JOÃO DOMINGOS SCALON 2 4 TÂNIA MARIA FONSECA ARAÚJO 3 TÂNIA JUSSARA

Leia mais

Inteligência nos Negócios (Business Inteligente)

Inteligência nos Negócios (Business Inteligente) Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 7) Fundamentação da disciplina Analise de dados Decisões

Leia mais

Redimensionamento de variáveis utilizadas para avaliar a qualidade em serviços por meio da Análise Hierárquica

Redimensionamento de variáveis utilizadas para avaliar a qualidade em serviços por meio da Análise Hierárquica Redimensionamento de variáveis utilizadas para avaliar a qualidade em serviços por meio da Análise Hierárquica Gilvete Silvania Wolff Lírio (UFSM) ajlirio@terra.com.br Adriano Mendoça Souza (UFSM) amsouza@smail.ufsm.br

Leia mais

Clustering (k-means, SOM e hierárquicos)

Clustering (k-means, SOM e hierárquicos) Clustering (k-means, SOM e hierárquicos) André Tavares da Silva andre.silva@udesc.br (Capítulo 10 de Duda e Hart) Clustering Introdução e tipos Roteiro Agrupamentos hierárquicos AGNES, DIANA e Dendogram

Leia mais

2 Processo de Agrupamentos

2 Processo de Agrupamentos 20 2 Processo de Agrupamentos A análise de agrupamentos pode ser definida como o processo de determinação de k grupos em um conjunto de dados. Para entender o que isso significa, observe-se a Figura. Y

Leia mais

APLICAÇÃO DE ANÁLISE DE CLUSTER EM VALORES NUTRICIONAIS REFERENTES Á TIPOS DE CARNES

APLICAÇÃO DE ANÁLISE DE CLUSTER EM VALORES NUTRICIONAIS REFERENTES Á TIPOS DE CARNES APLICAÇÃO DE ANÁLISE DE CLUSTER EM VALORES NUTRICIONAIS REFERENTES Á TIPOS DE CARNES Samara Rilda de S.BEZERRA 1, Edwirde Luiz SILVA 1,Aldreany P.Araújo SILVA 1 1 Departamento de Estatística, Universidade

Leia mais

Consistência do padrão de agrupamento de cultivares de milho

Consistência do padrão de agrupamento de cultivares de milho Ciência Rural, Santa Maria, v.41, Consistência n.9, p.1503-1508, do padrão set, de 2011 agrupamento de cultivares de milho. ISSN 0103-8478 1503 Consistência do padrão de agrupamento de cultivares de milho

Leia mais

MEDIDAS DE SIMILARIDADE UTILIZANDO CARACTERÍSTICAS DA ÁGUA DO MUNICÍPIO DE BOTUCATU

MEDIDAS DE SIMILARIDADE UTILIZANDO CARACTERÍSTICAS DA ÁGUA DO MUNICÍPIO DE BOTUCATU MEDIDAS DE SIMILARIDADE UTILIZANDO CARACTERÍSTICAS DA ÁGUA DO MUNICÍPIO DE BOTUCATU Lívia Paschoalino de Campos 1,Farid Sallum Neto 2, Lilian Cristina Trevizan Felipe 3 Carlos Roberto Padovani 4 1 Mestra

Leia mais

3 Técnicas de agrupamento

3 Técnicas de agrupamento 3 Técnicas de agrupamento Com o advento da internet a quantidade de informação disponível aumentou consideravelmente e com isso, tornou-se necessário uma forma automática de organizar e classificar esta

Leia mais

2COP229 Inteligência Computacional. Aula 3. Clusterização.

2COP229 Inteligência Computacional. Aula 3. Clusterização. Aula 3 Clusterização Sumário (Clusterização) - Introdução - Aprendizado Não Supervisionado - Aprendizado Supervisionado - Introdução: Clusterização - Etapas para o processo de Clusterização - Distância

Leia mais

Inteligência nos Negócios (Business Inteligente)

Inteligência nos Negócios (Business Inteligente) Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 7) Fundamentação da disciplina Analise de dados Decisões

Leia mais

ANÁLISE DE AGRUPAMENTO UTILIZANDO VARIÁVEIS QUANTITATIVAS E QUALITATIVAS PARA O ESTUDO DA DIVERSIDADE GENÉTICA EM GENÓTIPOS DE MANDIOCA SILVESTRE

ANÁLISE DE AGRUPAMENTO UTILIZANDO VARIÁVEIS QUANTITATIVAS E QUALITATIVAS PARA O ESTUDO DA DIVERSIDADE GENÉTICA EM GENÓTIPOS DE MANDIOCA SILVESTRE ANÁLISE DE AGRUPAMENTO UTILIZANDO VARIÁVEIS QUANTITATIVAS E QUALITATIVAS PARA O ESTUDO DA DIVERSIDADE GENÉTICA EM GENÓTIPOS DE MANDIOCA SILVESTRE Carlos Alberto da Silva LEDO 1, Leônidas Francisco de Queiroz

Leia mais

Uma nova abordagem para a análise de agrupamento com uma aplicação em agronomia

Uma nova abordagem para a análise de agrupamento com uma aplicação em agronomia Uma nova abordagem para a análise de agrupamento com uma aplicação em agronomia Bruno de Athayde Prata ; Sílvia Maria de Freitas. Resumo A Estatística Multivariada, por avaliar múltiplas variáveis em uma

Leia mais

Aula 8 - Reconhecimento e Interpretação. Prof. Adilson Gonzaga

Aula 8 - Reconhecimento e Interpretação. Prof. Adilson Gonzaga Aula 8 - Reconhecimento e Interpretação Prof. Adilson Gonzaga Elementos de Visão Computacional: Visão Computacional Processamento de Baio Nível Processamento de Nível Intermediário Processamento de Alto

Leia mais

VARIEDADES DE SOBREMESAS DO MCDONALDS SEGUNDO SUAS CARACTERÍSTICAS NUTRICIONAIS: UMA APLICAÇÃO DE ANÁLISE DE AGRUPAMENTO

VARIEDADES DE SOBREMESAS DO MCDONALDS SEGUNDO SUAS CARACTERÍSTICAS NUTRICIONAIS: UMA APLICAÇÃO DE ANÁLISE DE AGRUPAMENTO VARIEDADES DE SOBREMESAS DO MCDONALDS SEGUNDO SUAS CARACTERÍSTICAS NUTRICIONAIS: UMA APLICAÇÃO DE ANÁLISE DE AGRUPAMENTO Luana Kelly de Souza Nóbrega 1 Dalila Camêlo Aguiar 2 Jaylanne Medeiros de Mendonça

Leia mais

SCC5895 Análise de Agrupamento de Dados

SCC5895 Análise de Agrupamento de Dados SCC5895 Análise de Agrupamento de Dados Algoritmos Hierárquicos: Parte II Prof. Ricardo J. G. B. Campello PPG-CCMC / ICMC / USP Créditos Parte do material a seguir consiste de adaptações e extensões dos

Leia mais

Classificação quimiométrica de vinagres usando espectros UV-Vis

Classificação quimiométrica de vinagres usando espectros UV-Vis Classificação quimiométrica de vinagres usando espectros UV-Vis Hebertty Vieira Dantas 1 ; Marcelo Batista de Lima 1 Universidade Federal da Paraíba Departamento de Química CCEN heberttyvd@gmail.com Resumo

Leia mais

Inteligência Artificial Agrupamento de Dados. prof. Dr. Rogério R. de Vargas. Universidade Estadual de Santa Cruz - UESC. Ilhéus-Ba, Outubro de 2013

Inteligência Artificial Agrupamento de Dados. prof. Dr. Rogério R. de Vargas. Universidade Estadual de Santa Cruz - UESC. Ilhéus-Ba, Outubro de 2013 Inteligência Artificial de prof. Dr. Rogério R. de Vargas Universidade Estadual de Santa Cruz - UESC Ilhéus-Ba, Outubro de 2013 http://rogerio.in slide 1 Introdução http://rogerio.in slide 2 Como agrupar?

Leia mais

ANÁLISE DE AGRUPAMENTO APLICADA AO CRESCIMENTO POPULACIONAL DE ALGUNS PAÍSES EUROPEUS

ANÁLISE DE AGRUPAMENTO APLICADA AO CRESCIMENTO POPULACIONAL DE ALGUNS PAÍSES EUROPEUS ANÁLISE DE AGRUPAMENTO APLICADA AO CRESCIMENTO POPULACIONAL DE ALGUNS PAÍSES EUROPEUS Edwirde Luiz SILVA 1, Dalila Camêlo AGUIAR 2 1 Departamento de Estatística, Universidade Estadual da Paraíba - UEPB,

Leia mais

Estatística: Aplicação ao Sensoriamento Remoto SER ANO Análise de Agrupamento

Estatística: Aplicação ao Sensoriamento Remoto SER ANO Análise de Agrupamento statística: plicação ao Sensoriamento Remoto SR 204 - NO 2017 nálise de grupamento amilo aleles Rennó camilo@dpi.inpe.br http://www.dpi.inpe.br/~camilo/estatistica/ nálise de grupamento (luster nalysis)

Leia mais

Cluster. Larissa Sayuri Futino Castro dos Santos

Cluster. Larissa Sayuri Futino Castro dos Santos Cluster Larissa Sayuri Futino Castro dos Santos Agenda O que faremos Modelos de Mistura LDA Reconhecimento Overview Mét. Particionais E Hierárquicos Melhorias K-Medians K-Medoids K-Modes Mét. Probabilís

Leia mais

Universidade de Aveiro

Universidade de Aveiro Universidade de Aveiro 17 Departamento de Matemática António da Costa Fernandes Análise de conglomerados: comparação de técnicas e uma aplicação a dados de fluxo migratório em Portugal Universidade de

Leia mais

3 Método Pesquisa de Orçamentos Familiares (POF)

3 Método Pesquisa de Orçamentos Familiares (POF) 26 3 Método Este estudo se caracteriza como sendo de natureza descritiva, baseado em dados secundários, provenientes das duas últimas edições da Pesquisa de Orçamentos Familiares do IBGE, realizadas nos

Leia mais

Seminário de Análise Multivariada

Seminário de Análise Multivariada Seminário de Análise Multivariada Capítulo 1 - Introdução Conteúdo 1 Introdução 1 11 Aplicações de Técnicas Multivariadas 2 12 Organização de Dados 3 121 Arranjos 3 122 Exemplo 11 - Seleção de recibos

Leia mais

EXECUTIVE MASTER EM APPLIED BUSINESS ANALYTICS

EXECUTIVE MASTER EM APPLIED BUSINESS ANALYTICS EXECUTIVE MASTER EM APPLIED BUSINESS ANALYTICS UNIDADE CURRICULAR: MÉTODOS DE SEGMENTAÇÃO Relatório da Aplicação do Algoritmo SOM Mapa Auto-organizado Elisabeth Fernandes Nuno Pinho da Silva Ano letivo

Leia mais

SEL-0339 Introdução à Visão Computacional. Aula 7 Reconhecimento de Objetos

SEL-0339 Introdução à Visão Computacional. Aula 7 Reconhecimento de Objetos Departamento de Engenharia Elétrica - EESC-USP SEL-0339 Introdução à Visão Computacional Aula 7 Reconhecimento de Objetos Prof. Dr. Marcelo Andrade da Costa Vieira Prof. Dr. Adilson Gonzaga mvieira@sc.usp.br

Leia mais

Tópicos Avançados em IA. Prof. Eduardo R. Hruschka

Tópicos Avançados em IA. Prof. Eduardo R. Hruschka Tópicos Avançados em IA Prof. Eduardo R. Hruschka Créditos Este material consiste de adaptações dos originais: Elaborados por Eduardo Hruschka e Ricardo Campello de (Tan et al., 2006) de E. Keogh (SBBD

Leia mais

Consultas por Similaridade em Domínios de Dados Complexos

Consultas por Similaridade em Domínios de Dados Complexos Consultas por Similaridade em Domínios de Dados Complexos Guilherme Felipe Zabot Orientador: Profº Dr Caetano Traina Jr Roteiro Objetivo Introdução Dados Complexos Representação de Dados Complexos Extração

Leia mais

Introdução às Redes Neurais Artificiais

Introdução às Redes Neurais Artificiais Introdução às Redes Neurais Artificiais Clusterização: Conceitos Básicos Prof. João Marcos Meirelles da Silva www.professores.uff.br/jmarcos Departamento de Engenharia de Telecomunicações Escola de Engenharia

Leia mais

A Figura 28 mostra a representação gráfica dos dados presentes na base de dados fcmdata do Matlab de dimensão 140x2 dividida em 2 grupos.

A Figura 28 mostra a representação gráfica dos dados presentes na base de dados fcmdata do Matlab de dimensão 140x2 dividida em 2 grupos. 84 5 Estudos de Caso A seguir serão apresentados três estudos de caso. Os dois primeiros estudos de caso têm por objetivo demonstrar a facilidade de uso do aplicativo, e o último estudo de caso é focado

Leia mais

Análise de Conglomerados Espaciais Via Árvore Geradora Mínim

Análise de Conglomerados Espaciais Via Árvore Geradora Mínim Revista Brasileira de Estatística(2002) Análise de Conglomerados Espaciais Via Árvore Geradora Mínima ABRIL/2010 SUMÁRIO Introdução Conglomerados Espaciais O Método da Árvore Geradora Mínima Algorítimo

Leia mais

UNIVERSIDADE FEDERAL DE UBERLÂNDIA FACULDADE DE MATEMÁTICA CURSO DE ESTATÍSTICA BRUNA QUEIROZ DE MELO PRADO

UNIVERSIDADE FEDERAL DE UBERLÂNDIA FACULDADE DE MATEMÁTICA CURSO DE ESTATÍSTICA BRUNA QUEIROZ DE MELO PRADO UNIVERSIDADE FEDERAL DE UBERLÂNDIA FACULDADE DE MATEMÁTICA CURSO DE ESTATÍSTICA BRUNA QUEIROZ DE MELO PRADO ANÁLISE DE AGRUPAMENTOS DAS TAXAS DE INCIDÊNCIA DE DENGUE NOS ESTADOS BRASILEIROS Uberlândia

Leia mais

Algoritmo Genético Híbrido aplicado ao problema de agrupamento de dados

Algoritmo Genético Híbrido aplicado ao problema de agrupamento de dados UNIVERSIDADE FEDERAL DO ESPÍRITO SANTO CENTRO TECNOLÓGICO PROGRAMA DE PÓS-GRADUAÇÃO EM INFORMÁTICA DANUZA PRADO DE FARIA ALCKMIN Algoritmo Genético Híbrido aplicado ao problema de agrupamento de dados

Leia mais

REVISITANDO CONJUNTOS E DISTÂNCIAS PARA ENCONTRAR PONTOS VIZINHOS

REVISITANDO CONJUNTOS E DISTÂNCIAS PARA ENCONTRAR PONTOS VIZINHOS REVISITANDO CONJUNTOS E DISTÂNCIAS PARA ENCONTRAR PONTOS VIZINHOS Eduardo Braun - eduardotbraun@gmail.com Universidade Federal de Santa Maria, Campus Camobi, 97105-900 - Santa Maria, RS, Brasil Alice de

Leia mais

Medidas de Semelhança

Medidas de Semelhança Medidas de Semelhança Índices de Semelhança Grandezas numéricas que quantificam o grau de associação entre um par de objetos ou de descritores. Como escolher um Índice? O objetivo da análise é associar

Leia mais

Mineração em Data Streams - Clustering. Profa. Elaine Faria UFU

Mineração em Data Streams - Clustering. Profa. Elaine Faria UFU Mineração em Data Streams - Clustering Profa. Elaine Faria UFU - 2018 Mineração de Dados Tarefas de mineração Tarefas Preditivas Classificação Regressão Detecção de Anomalias Tarefas Descritivas Agrupamento

Leia mais

Consistência de agrupamentos de acessos de alho via análise discriminante

Consistência de agrupamentos de acessos de alho via análise discriminante Consistência de agrupamentos de acessos de alho via análise discriminante 1 Introdução 1 Anderson Rodrigo da Silva 1 Paulo Roberto Cecon 1 Mário Puiatti 2 Moysés Nascimento 1 Fabyano Fonseca e Silva 1

Leia mais

Métodos de Agrupamento (Clustering) Aula 18

Métodos de Agrupamento (Clustering) Aula 18 Métodos de Agrupamento (Clustering) Aula 18 Prof. Dr. Paulo A. V. de Miranda Instituto de Matemática e Estatística (IME), Universidade de São Paulo (USP) pmiranda@vision.ime.usp.br Existem duas classes

Leia mais

Bernardo Pereira Nunes. Classificação automática de dados semi-estruturados. Dissertação de Mestrado

Bernardo Pereira Nunes. Classificação automática de dados semi-estruturados. Dissertação de Mestrado Bernardo Pereira Nunes Classificação automática de dados semi-estruturados Dissertação de Mestrado Dissertação apresentada como requisito parcial para obtenção do título de Mestre pelo Programa de Pós-

Leia mais

Agrupamento. Algoritmos e aplicações

Agrupamento. Algoritmos e aplicações Agrupamento Algoritmos e aplicações Equipe Bertha Andaluz (bmca) Deborah Mesquita (dhsm) Lucas Lima (lapl) Lucas Tenório (lvt) Roteiro Motivação Métodos de clustering Modelos de clustering Fuzzy clustering

Leia mais

CONHECIMENTOS ESPECÍFICOS

CONHECIMENTOS ESPECÍFICOS ECT11_17_52N43767 Uma cadeia de Markov é denominada irredutível (ou ergódica) caso qualquer estado possa ser transformado em qualquer outro estado, não necessariamente em um único passo. Uma cadeia de

Leia mais

SCC5895 Análise de Agrupamento de Dados

SCC5895 Análise de Agrupamento de Dados SCC89 Análise de Agrupamento de Dados Algoritmos Hierárquicos (Parte I) Prof. Eduardo Raul Hruschka PPG-CCMC / ICMC / USP Créditos O material a seguir consiste de adaptações e etensões dos originais: Elaborados

Leia mais

Análise de Clusters. Aplicações da formação de Grupos (Clustering)

Análise de Clusters. Aplicações da formação de Grupos (Clustering) Análise de Clusters Aplicações da formação de Grupos (Clustering) Ver e analisar vastas quantidades de dados biológicos como um todo pode ser difícil É mais fácil interpretar os dados se forem divididos

Leia mais

CARMEM TEREZINHA BECKER CrLIA CAMPOS BRAGA- JUAN CARLOS CEBALLOS--

CARMEM TEREZINHA BECKER CrLIA CAMPOS BRAGA- JUAN CARLOS CEBALLOS-- 225 "REGIONALIZAÇ~O OA PRECIPITAÇ~O E TEMPERATURA NO ESTAOO DO RIO GRANDE DO SUL A PARTIR DA AN~LISE DE AGRUPAMENTO" CARMEM TEREZINHA BECKER CrLIA CAMPOS BRAGA- JUAN CARLOS CEBALLOS-- DepartaMento de Ciências

Leia mais

Gilberto Müller Beuren

Gilberto Müller Beuren Gilberto Müller Beuren Coleta dos dados: Processo de obtenção dos dados Validação Interna: O quão bem o instrumento mede o que está proposto a medir Validação Externa: Refere-se às hipóteses do estudo

Leia mais

4 Agrupamento de documentos

4 Agrupamento de documentos 4 Agrupamento de documentos É a teoria que decide o que podemos observar. Albert Einstein Um dos métodos mais utilizados de mineração de dados descritiva é conhecido como análise de grupos 23. Com ele,

Leia mais

Técnicas de Classificação para Caracterização da Curva de Carga de Empresas de Distribuição de Energia - Um Estudo Comparativo

Técnicas de Classificação para Caracterização da Curva de Carga de Empresas de Distribuição de Energia - Um Estudo Comparativo Proceedings of the V Brazilian Conference on Neural Networks - V Congresso Brasileiro de Redes Neurais pp. 133 138, April 2 5, 21 - Rio de Janeiro - RJ - Brazil Técnicas de Classificação para Caracterização

Leia mais

UNIVERSIDADE FEDERAL DE UBERLÂNDIA FACULDADE DE MATEMÁTICA

UNIVERSIDADE FEDERAL DE UBERLÂNDIA FACULDADE DE MATEMÁTICA UNIVERSIDADE FEDERAL DE UBERLÂNDIA FACULDADE DE MATEMÁTICA ANÁLISE DA MORTALIDADE POR CAUSAS EXTERNAS NO BRASIL NO PERÍODO DE 2009 A 2012 POR MEIO DE TÉCNICAS MULTIVARIADAS HEVERTON RODRIGUES FERNANDES

Leia mais

Análise de dados: clustering e redução de dimensionalidade

Análise de dados: clustering e redução de dimensionalidade Análise de dados: clustering e redução de dimensionalidade Métodos e sua implementação em R Clustering - definições Objectivo genérico: agrupar objetos / entidades / exemplos (linhas da tabela) com base

Leia mais

Clusterização. Grupo: Eduardo Gade Gusmão (egg) Felipe Kuhner dos Santos (fkcs) Nelson Gutemberg Rocha (ngrs) Paulo Ricardo da Silva Soares (prss)

Clusterização. Grupo: Eduardo Gade Gusmão (egg) Felipe Kuhner dos Santos (fkcs) Nelson Gutemberg Rocha (ngrs) Paulo Ricardo da Silva Soares (prss) Clusterização Grupo: Eduardo Gade Gusmão (egg) Felipe Kuhner dos Santos (fkcs) Nelson Gutemberg Rocha (ngrs) Paulo Ricardo da Silva Soares (prss) UFPE Centro de Informática IF796 Mineração da Web Professora:

Leia mais

Foram avaliadas as produções quinzenais de leite nas primeiras e segundas lactações de vacas da raça Holandesa, entre 5 a 305 dias de lactação,

Foram avaliadas as produções quinzenais de leite nas primeiras e segundas lactações de vacas da raça Holandesa, entre 5 a 305 dias de lactação, Análise de agrupamento hierárquico e não hierárquico dos valores fenotípicos e genéticos da produção de leite de vacas Holandesas em primeira e segunda lactação Rodrigo Pelicioni Savegnago 1 Lenira El

Leia mais

Créditos. SCC5895 Análise de Agrupamento de Dados. Relembrando... Aula de Hoje. Algoritmos Hierárquicos: Parte I. [ x ] T. Algoritmos Hierárquicos

Créditos. SCC5895 Análise de Agrupamento de Dados. Relembrando... Aula de Hoje. Algoritmos Hierárquicos: Parte I. [ x ] T. Algoritmos Hierárquicos SCC Análise de Agrupamento de Dados Algoritmos Hierárquicos: Parte I Prof Ricardo J G B Campello Créditos O material a seguir consiste de adaptações e etensões dos originais: gentilmente cedidos pelo Prof

Leia mais

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr. Prof. Lorí Viali, Dr. viali@mat.ufrgs.br http://www.ufrgs.br/~viali/ Distribuição Conjunta Suponha que se queira analisar o comportamento conjunto das variáveis X = Grau de Instrução e Y = Região de

Leia mais

Segmentação local. geralmente baseados em análise de descontinuidade ou similaridade de valores digitais.

Segmentação local. geralmente baseados em análise de descontinuidade ou similaridade de valores digitais. Segmentação Segmentação local 2 Segmentação local geralmente baseados em análise de descontinuidade ou similaridade de valores digitais. descontinuidade : a abordagem é dividir a imagem baseando-se em

Leia mais

Integração de Mineração de Dados com SGBD Detecção de Agrupamentos

Integração de Mineração de Dados com SGBD Detecção de Agrupamentos Integração de Mineração de Dados com SGBD Detecção de Agrupamentos Centro de Matemática Computação e Cognição-UFABC Jéssica Andressa de Souza Pós-Graduação em Ciência da Computação Sistemas de Banco de

Leia mais

Análise do Desempenho do Algoritmo de Agrupamento Baseado em Colônia de Formigas Modificado

Análise do Desempenho do Algoritmo de Agrupamento Baseado em Colônia de Formigas Modificado Anais do CNMAC v. ISSN 1984-80X Análise do Desempenho do Algoritmo de Agrupamento Baseado em Colônia de Formigas Modificado Rosangela Villwock UFPR - Programa de Pós-Graduação em Métodos Numéricos em Engenharia

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Problema do Agrupamento Aprendizagem de Máquina Alessandro L. Koerich Seja x = (x 1, x 2,, x d ) um vetor d dimensional de características Seja D um conjunto de x vetores, D = { x(1), x(2),, x(n) } Problema

Leia mais

Clustering - c-means e Self Organizing Maps

Clustering - c-means e Self Organizing Maps - c-means e Self Organizing Maps Sarajane M. Peres e Clodoaldo A. M. Lima 13 de abril de 2015 Material baseado em: HAN, J. & KAMBER, M. Data Mining: Concepts and Techniques. 2nd. 2006 FAUSETT, L. Fundamentals

Leia mais

ANÁLISE DE CLUSTER APLICADA À LOGÍSTICA: DEFINIÇÃO DE ZONAS DE TRANSPORTE PARA UMA EMPRESA DO SETOR SIDERÚRGICO

ANÁLISE DE CLUSTER APLICADA À LOGÍSTICA: DEFINIÇÃO DE ZONAS DE TRANSPORTE PARA UMA EMPRESA DO SETOR SIDERÚRGICO ANÁLISE DE CLUSTER APLICADA À LOGÍSTICA: DEFINIÇÃO DE ZONAS DE TRANSPORTE PARA UMA EMPRESA DO SETOR SIDERÚRGICO Alvaro Simões da Conceição Neto (UFMG) alvaro.neto@terra.com.br Juliana Jacob Ferreira (UFMG)

Leia mais

Aprendizagem de Dados Simbólicos e/ou Numéricos

Aprendizagem de Dados Simbólicos e/ou Numéricos Aprendizagem de Dados Simbólicos e/ou Numéricos Francisco de A.T. de Carvalo Francisco de A.T. de Carvalo, Agrupamento (Clustering Métodos usados para a construção de grupos de objetos com base nas semelanças

Leia mais

Análise Discriminante

Análise Discriminante Universidade Técnica de Lisboa INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO Informática e Sistemas de Informação Aplicados em Economia Análise Discriminante Análise Discriminante 1 Análise discriminante - A

Leia mais

Mineração de Dados em Biologia Molecular

Mineração de Dados em Biologia Molecular Mineração de Dados em Biologia Molecular Principais tópicos André C. P. L. F. de Carvalho Monitor: Valéria Carvalho Métodos baseados em distância Aprendizado baseado em instâncias Conceitos básicos KNN

Leia mais

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Segmentação. Luiz Eduardo S. Oliveira, Ph.D.

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Segmentação. Luiz Eduardo S. Oliveira, Ph.D. Universidade Federal do Paraná Departamento de Informática Reconhecimento de Padrões Segmentação Luiz Eduardo S. Oliveira, Ph.D. http://lesoliveira.net Objetivos Introduzir os conceitos básicos de segmentação

Leia mais

SME0822 Análise Multivariada 2 o semestre de 2014

SME0822 Análise Multivariada 2 o semestre de 2014 SME0822 Análise Multivariada 2 o semestre de 2014 Prof. Cibele Russo cibele@icmc.usp.br http://www.icmc.usp.br/ cibele Sala 3-139 Coteia Wiki: http://wiki.icmc.usp.br/index.php/sme0822 6 de agosto de 2014

Leia mais

Estudo e Análise das Diversas Representações e Estruturas de Dados Utilizadas nos Algoritmos de Clustering Hierárquico. N o 269

Estudo e Análise das Diversas Representações e Estruturas de Dados Utilizadas nos Algoritmos de Clustering Hierárquico. N o 269 Instituto de Ciências Matemáticas e de Computação ISSN - 0103-2569 Estudo e Análise das Diversas Representações e Estruturas de Dados Utilizadas nos Algoritmos de Clustering Hierárquico Jean Metz Maria

Leia mais

5 Definição da Árvore de Cenários

5 Definição da Árvore de Cenários 5 Definição da Árvore de Cenários 5.1. Considerações Iniciais Com o intuito de propor um método para definir a sub-árvore a ser visitada durante o processo do cálculo da estratégia ótima de operação, de

Leia mais

Agrupamento Espectral e Hierárquico

Agrupamento Espectral e Hierárquico Agrupamento Espectral e Hierárquico Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Agrupamento Espectral 2. Agrupamento Hierárquico 1 Agrupamento Espectral Agrupamento Espectral Nem

Leia mais

SME0822 Análise Multivariada 2 o semestre de 2014

SME0822 Análise Multivariada 2 o semestre de 2014 SME0822 Análise Multivariada 2 o semestre de 2014 Prof. Cibele Russo cibele@icmc.usp.br http://www.icmc.usp.br/ cibele Sala 3-139 Coteia Wiki: http://wiki.icmc.usp.br/index.php/sme0822 7 de agosto de 2014

Leia mais

Análise de Clusters na Montagem de Modelos para Avaliação de Imóveis. Prof. Dr. Norberto Hochheim Universidade Federal de Santa Catarina - UFSC

Análise de Clusters na Montagem de Modelos para Avaliação de Imóveis. Prof. Dr. Norberto Hochheim Universidade Federal de Santa Catarina - UFSC Análise de Clusters na Montagem de Modelos para Avaliação de Imóveis Prof. Dr. Norberto Hochheim Universidade Federal de Santa Catarina - UFSC ANÁLISE DE CLUSTERS Agrupa os indivíduos de uma amostra num

Leia mais