SCC5895 Análise de Agrupamento de Dados

Tamanho: px
Começar a partir da página:

Download "SCC5895 Análise de Agrupamento de Dados"

Transcrição

1 SCC5895 Análise de Agrupamento de Dados Algoritmos Particionais: Parte I Prof. Eduardo R. Hruschka PPG-CCMC / ICMC / USP

2 Créditos Este material consiste de adaptações e etensões dos originais: Elaborados por Eduardo R. Hruschka e Ricardo J.G.B. Campello de (Tan et al., 6) de E. Keogh (SBBD 3) de G. Piatetsky-Shapiro (KDNuggets)

3 Aula de Hoje Definições Algoritmos Particionais sem Sobreposição k-means Raizes Históricas e Algoritmo Básico Inicialização e Implementações Eficientes Fundamentação Teórica (perspectiva de otimização) K-Means Paralelo e Distribuído Variantes do k-means K-Medianas, k-medóides,... Estimativa do Número de Grupos k 3

4 Definição de Partição de Dados (Revisão) Consideremos um conjunto de N objetos a serem agrupados: X = {,,..., N } Partição (rígida): coleção de k grupos não sobrepostos P = {C, C,..., C k } tal que: C C... C k = X C i C i C j = para i j Eemplo: P = { ( ), ( 3, 4, 6 ), (, 5 ) } 4

5 Matriz de Partição Matriz de Partição é uma matriz com k linhas (no. de grupos) e N colunas (no. de objetos) na qual cada elemento ij indica o grau de pertinência do j-ésimo objeto ( j ) ao i-ésimo grupo (C i ) U X k k N N kn Se essa matriz for binária, ou seja, ij {,}, e ainda, se a restrição i ( ij ) = j for respeitada, então denomina-se: matriz de partição rígida, eclusiva ou sem sobreposição 5

6 Matriz de Partição Eemplo: P = { ( ), ( 3, 4, 6 ), (, 5 ) } U X 6

7 Métodos Particionais (Sem Sobreposição) Métodos particionais sem sobreposição referem-se a algoritmos de agrupamento que buscam (eplícita ou implicitamente) por uma matriz de partição rígida de um conjunto de objetos X Encontrar uma Matriz de Partição U(X): Equivale a particionar o conjunto X = {,,..., N } de N objetos em uma coleção C = {C, C,..., C k } de k grupos disjuntos C i tal que C C... C k = X, C i, e C i C j = para i j 7

8 Particionamento como Problema Combinatório Problema: Assumindo que k seja conhecido, o no. de possíveis formas de agrupar N objetos em k clusters é dado por (Liu, 968): NM ( N, k) k! k i ( ) i k i k i N Por eemplo, NM(, 5) Em um computador com capacidade de avaliar 9 partições/s, precisaríamos.8 5 séculos para processar todas as avaliações Como k em geral é desconhecido, problema é ainda maior... NP-Hard: Avaliação computacional eaustiva é impraticável... Solução: formulações alternativas... 8

9 Algoritmo k-means Começaremos nosso estudo com um dos algoritmos mais clássicos da área de mineração de dados em geral algoritmo das k-médias ou k-means listado entre os Top Most Influential Algorithms in DM Wu, X. and Kumar, V. (Editors), The Top Ten Algorithms in Data Mining, CRC Press, 9 X. Wu et al., Top Algorithms in Data Mining, Knowledge and Info. Systems, vol. 4, pp. -37, 8 9

10 Referência Mais Aceita como Original: J. B. MacQueen, Some methods of classification and analysis of multivariate observations, In Proceedings 5th Berkeley Symposium on Mathematical Statistics and Probability, Berkeley, California, USA, 967, 8 97 Porém... Algoritmo k-means K-means has a rich and diverse history as it was independently discovered in different scientific fields by Steinhaus (956), Lloyd (proposed in 957, published in 98), Ball & Hall (965) and MacQueen (967) [Jain, Data Clustering: 5 Years Beyond K-Means, Patt. Rec. Lett., ]... e tem sido assunto por mais de meio século! Douglas Steinley, K-Means Clustering: A Half-Century Synthesis, British Journal of Mathematical and Statistical Psychology, Vol. 59, 6

11 k-means ) Escolher aleatoriamente um número k de protótipos (centros) para os clusters ) Atribuir cada objeto para o cluster de centro mais próimo (segundo alguma distância, e.g. Euclidiana) 3) Mover cada centro para a média (centróide) dos objetos do cluster correspondente 4) Repetir os passos e 3 até que algum critério de convergência seja obtido: - número máimo de iterações - limiar mínimo de mudanças nos centróides

12 k-means - passo : a k Escolher 3 centros iniciais k k 3 Slide baseado no curso de Gregory Piatetsky-Shapiro, disponível em a

13 k-means - passo : a k Atribuir cada objeto ao cluster de centro + próimo k k 3 Slide baseado no curso de Gregory Piatetsky-Shapiro, disponível em 3 a

14 k-means - passo 3: a k k Mover cada centro para o vetor médio do cluster (centróide) k k k 3 k 3 Slide baseado no curso de Gregory Piatetsky-Shapiro, disponível em 4 a

15 k-means: Re-atribuir objetos aos clusters de centróides mais próimos Quais objetos mudarão de cluster? a k k k 3 a Slide baseado no curso de Gregory Piatetsky-Shapiro, disponível em 5

16 k-means: a k Resp: objetos k k 3 a Slide baseado no curso de Gregory Piatetsky-Shapiro, disponível em 6

17 k-means: k re-calcular vetores médios a k k 3 Slide baseado no curso de Gregory Piatetsky-Shapiro, disponível em 7 a

18 k-means: k a mover centros dos clusters k k 3 Slide baseado no curso de Gregory Piatetsky-Shapiro, disponível em 8 a

19 Eercício Objeto i i i i Eecutar k-means com k=3 nos dados acima a partir dos protótipos [6 6], [4 6] e [5 ] e outros a sua escolha 9 i

20 K-Means sob Perspectiva de Otimização Algoritmo minimiza a seguinte função objetivo: SSE = Sum of Squared Erros (variâncias intra-cluster) onde d = Euclidiana e é o centróide do c-ésimo grupo: k c c j c j d J, C c j j c c C C c

21 K-Means sob a Perspectiva de Otimização: - Assumamos: - conjunto de objetos X = {,,..., N } - conjunto de k centróides quaisquer {,,..., k } - Podemos reescrever o critério SSE de forma equivalente como: J N k j c cj j c ; c j ; - Desejamos minimizar J com respeito a { c } e { cj } - Pode-se fazer isso via um procedimento iterativo ( passos): a) Fiar { c } e minimizar J com respeito a { cj } (E) b) Minimizar J com respeito a { c }, fiando-se { cj } (M) k cj cj,

22 a) Fiar { c } e minimizar J com respeito a { cj } (Passo E) - Termos envolvendo diferentes j são independentes - Logo, pode-se otimizá-los separadamente - cj = para c que fornece o menor valor do erro quadrático * Atribuir cj = para o grupo mais próimo. b) Minimizar J com respeito a { c }, fiando-se { cj } (Passo M) - Derivar J com respeito a cada c e igualar a zero: N j cj N j j cj c N j j c cj N j c j T c j cj c c J K-Means sob a Perspectiva de Otimização:, ; ; cj k c cj N j k c c j cj j J

23 Discussão Resultado pode variar significativamente dependendo da escolha das sementes (protótipos) iniciais k-means pode ficar preso em ótimos locais Eemplo: Centros iniciais objetos Como evitar...? Slide baseado no curso de Gregory Piatetsky-Shapiro, disponível em 3

24 y y y Two different K-means Clusterings Original Points Optimal Clustering Sub-optimal Clustering Tan,Steinbach, Kumar Introduction to Data Mining 4/8/4 nº

25 y Importance of Choosing Initial Centroids 3 Iteration Tan,Steinbach, Kumar Introduction to Data Mining 4/8/4 nº

26 y y y y y y Importance of Choosing Initial Centroids 3 Iteration 3 Iteration 3 Iteration Iteration 4 3 Iteration 5 3 Iteration Tan,Steinbach, Kumar Introduction to Data Mining 4/8/4 nº

27 y Importance of Choosing Initial Centroids 3 Iteration Tan,Steinbach, Kumar Introduction to Data Mining 4/8/4 nº

28 y y y y y Importance of Choosing Initial Centroids 3 Iteration 3 Iteration Iteration 3 3 Iteration 4 3 Iteration Tan,Steinbach, Kumar Introduction to Data Mining 4/8/4 nº

29 Análise da Seleção dos Protótipos Iniciais Premissa: Uma boa seleção de k protótipos iniciais em uma base de dados com k grupos naturais é tal que cada protótipo é um objeto de um grupo diferente No entanto, a chance de se selecionar um protótipo de cada grupo é pequena, especialmente para k grande... Assumamos grupos balanceados, com uma mesma quantidade g = N / k de objetos cada: Podemos calcular a probabilidade de selecionar protótipo de cada grupo diferente como: P no. de maneiras de selecionar objeto de cada grupo (com N / k objetos) no. de maneiras de selecionar k dentre N objetos 9

30 Análise da Seleção dos Protótipos Iniciais N o de formas de selecionar k protótipos (denominador) cada um dos N = kg objetos pode ser selecionado em cada um dos k sorteios, com reposição, logo tem-se (kg) k formas N o de formas de escolher protótipo por grupo (numerador) No º sorteio, qualquer um dos N = kg objetos pode ser selecionado. No º sorteio, qualquer objeto eceto aqueles g do mesmo grupo do º sorteio podem ser selecionados, ou seja, kg g = (k )g podem ser selecionados, e assim por diante. Logo, tem-se kg (k )g... g = k!g k Portanto, tem-se P = k!g k /k k g k P = k! /k k Eemplo: se k =, P =.36 3

31 y Eemplo: Iniciando com centróides iniciais em um grupo de cada par 8 Iteration Tan, Steinbach & Kumar, Introduction to Data Mining, 6. 3

32 y y y y Ilustrando Todas as Iterações: 8 Iteration 8 Iteration Iteration Iteration Tan, Steinbach & Kumar, Introduction to Data Mining, 6. 3

33 y Agora Vejamos Outra Inicialização: 8 Iteration Tan, Steinbach & Kumar, Introduction to Data Mining, 6. 33

34 y y y y Ilustrando Todas as Iterações: 8 Iteration 8 Iteration Iteration Iteration Tan, Steinbach & Kumar, Introduction to Data Mining, 6. 34

35 Alternativas para Inicialização Múltiplas Eecuções (inicializações aleatórias): funciona bem em muitos problemas. mas em bases de dados compleas, pode demandar um no. enorme de eecuções. em particular para no. de grupos grande. especialmente dado que k é, em geral, desconhecido Agrupamento Hierárquico: agrupa-se uma amostra dos dados tomam-se os centros da partição com k grupos

36 Alternativas para Inicialização Seleção Informada : toma-se o º protótipo como um objeto aleatório ou como o centro dos dados (grand mean) sucessivamente escolhe-se o próimo protótipo como o objeto mais distante dos protótipos correntes Nota: para reduzir o esforço computacional e minimizar a probabilidade de seleção de outliers processa-se apenas uma amostra dos dados Busca Guiada: X-means, k-means evolutivo,... 36

37 Discussão k-means é mais susceptível a problemas quando clusters são de diferentes Tamanhos Densidades Formas não-globulares Tan,Steinbach, Kumar Introduction to Data Mining 4/8/4 nº

38 Differing Sizes Original Points K-means (3 Clusters) Tan,Steinbach, Kumar Introduction to Data Mining 4/8/4 nº

39 Differing Density Original Points K-means (3 Clusters) Tan,Steinbach, Kumar Introduction to Data Mining 4/8/4 nº

40 Formas Não-Globulares Tan, Steinbach, Kumar Nota: na prática, esse problema em geral não é crítico, i.e., há pouco interesse na maioria das aplicações de mundo real Grandes BDs (muitos objetos & atributos) e necessidade de interpretação dos resultados (e.g. segmentação de mercado...)

41 Manipulando Grupos Vazios k-means pode gerar grupos vazios Por inicialização em pontos dominados do espaço protótipos não representativos: nenhum objeto mais próimo inicialização como objetos ao invés de pontos aleatórios resolve Pela inicialização de grupos cujos protótipos são não representativos; por eemplo: 3 4 Grupos iniciais k =3 Ao longo das iterações 4

42 Manipulando Grupos Vazios Estratégias para contornar o problema: Eliminar os protótipos não representativos (reduz k) viável se o número inicial de grupos, k, puder ser reduzido pode ser útil para ajustar valores superestimados de k Substituir cada protótipo não representativo (mantém k) pelo objeto que mais contribui para o SSE da partição por um dos objetos do grupo com maior MSE visa dividir o grupo com maior erro quadrático médio Nota: a eecução do algoritmo prossegue após a substituição

43 Implementações Eficientes Desempenho computacional pode ser melhorado... Estruturas de Dados, e.g. kd-trees (seminários...) Algoritmos, e.g. Atualização recursiva dos centróides Cálculo dos centróides só depende dos valores anteriores, dos nos. de objetos dos grupos e dos objetos que mudaram de grupo Não demanda recalcular tudo novamente Eercício: a partir da equação do cálculo do centróide, escrever a equação de atualização recursiva descrita acima. Uso da desigualdade triangular (vide discussão a seguir) Paralelização (vide discussão a seguir) 43

44 Uso da Desigualdade Triangular Lema: Se d(,a) d(a,b)/ então d(,b) d(,a). Prova: d(a,b) d(a,)+d(,b);... Interpretação Geométrica: C A B ½d(A,B) 44

45 K-Means Paralelo / Distribuído Dados distribuídos em múltiplos data sites ou processadores Algoritmo: Mesmos protótipos iniciais são distribuídos a cada sítio de dados Cada sítio eecuta (em paralelo) uma iteração de k-means Protótipos locais e nos. de objetos dos grupos são comunicados Protótipos globais são calculados e retransmitidos aos sítios Repete-se o processo 45

46 Eercício Objeto i i i Processador A B 3 A 4 B A B B A 9 5 B 5 A 4 B 4 A Eecutar k-means paralelo nos dados ao lado, com k=3, a partir dos protótipos iniciais [6 6], [4 6] e [5 ] 46

47 Resumo do k-means Vantagens Simples e intuitivo Compleidade computacional linear em todas as variáveis críticas: O(N n k) quadrático apenas se n N... Eficaz em muitos cenários de aplicação e produz resultados de interpretação relativamente simples Considerado um dos mais influentes algoritmos em Data Mining (Wu & Kumar, 9). Desvantagens k =? Sensível à inicialização dos protótipos (mínimos locais de J) Limita-se a encontrar clusters volumétricos / globulares Cada item deve pertencer a um único cluster (partição rígida, ou seja, sem sobreposição) Limitado a atributos numéricos Sensível a outliers 47

48 Generalização: - Banerjee et al. (Clustering with Bregman Divergences, JMLR, 5) apresentam uma visão unificada para a classe de algoritmos de agrupamento baseados em centróides (ao estilo k-means); - Estudo teórico minucioso baseado em Divergentes de Bregman: d (, y) ( ) ( y) y, ( y) - Distância Euclidiana ao quadrado, Mahalanobis, KL, perda quadrática, perda logística, etc.; - Eemplo: () = T é estritamente convea e diferenciável em n... - Algoritmos derivados mantém simplicidade, garantias teóricas e escalabilidade do k-médias; - Aplicável a diferentes tipos de atributos --- diferentes funcões conveas escolhidas para diferentes subconjuntos de atributos. 48

49 Algumas Variantes do k-means K-medianas: Substituir as médias pelas medianas Média de, 3, 5, 7, 9 é Média de, 3, 5, 7, 9 é 5 5 Mediana de, 3, 5, 7, 9 é 5 Vantagem: menos sensível a outliers * Desvantagem: implementação mais complea cálculo da mediana em cada atributo... Pode-se mostrar que minimiza a soma das distâncias de Manhattan dos objetos aos centros (medianas) dos grupos 49

50 Algumas Variantes do k-means K-medóides: Substituir cada centróide por um objeto representativo do cluster, denominado medóide Medóide = objeto mais próimo aos demais objetos do cluster mais próimo em média (empates resolvidos aleatoriamente) Vantagens: menos sensível a outliers permite cálculo relacional (apenas matriz de distâncias) logo, pode ser aplicado a bases com atributos categóricos convergência assegurada com qualquer medida de (dis)similaridade Desvantagem: Compleidade quadrática com n o. de objetos (N) 5

51 Eercício Objeto i i i i Eecutar k-medóides com k=3 nos dados acima, com medóides iniciais dados pelos objetos 5, 6 e 8 i 5

52 Algumas Variantes do k-means K-means para Fluos de Dados (Data Streams): Em geral, usa conceito de vizinhos mais próimos (K-NN) Objetos dinamicamente incorporados ao cluster mais próimo Atualização do centróide do cluster pode ser incremental centróide atualizado a cada novo objeto incorporado mas isso introduz dependência de ordem dos dados... Heurísticas podem ser usadas para criar e/ou remover clusters Ver Silva, Faria, Barros, Hruschka, de Carvalho, Gama, Data Stream Clustering: A Survey, ACM Computing Surveys, to appear. 5

53 Algumas Variantes do k-means Métodos de Múltiplas Eecuções de k-means: Eecutam k-means repetidas vezes a partir de diferentes valores de k e de posições iniciais dos protótipos Ordenado: n p inicializações de protótipos para cada k [k min, k ma ] Aleatório: n T inicializações de protótipos com k sorteado em [k min, k ma ] Tomam a melhor partição resultante de acordo com algum critério de qualidade (critério de validade de agrupamento) Vantagens: Estimam k e são menos sensíveis a mínimos locais Desvantagem: Custo computacional pode ser elevado 53

54 Questão... J poderia ser utilizada como medida de qualidade para escolher a melhor partição dentre um conjunto de candidatas? Resposta é sim se todas têm o mesmo no. k de clusters (fio) Mas e se k for desconhecido e, portanto, variável? Para responder, considere, por eemplo, que as partições são geradas a partir de múltiplas eecuções do algoritmo: com protótipos iniciais aleatórios com no. variável de grupos k [k min, k ma ] 54

55 Questão... - Para tentar responder a questão anterior, vamos considerar o método de múltiplas eecuções ordenadas de k-means, com uso da função objetivo J J Erro Quadrático: k i j C d i Função Objetivo j, i Keogh, E. A Gentle Introduction to Machine Learning and Data Mining for the Database Community, SBBD 3, Manaus.

56 Questão... - Considere o seguinte eemplo: Keogh, E. A Gentle Introduction to Machine Learning and Data Mining for the Database Community, SBBD 3, Manaus. 56

57 Para k =, o valor da função objetivo é 873, Keogh, E. A Gentle Introduction to Machine Learning and Data Mining for the Database Community, SBBD 3, Manaus. 57

58 Para k =, o valor da função objetivo é 73, Keogh, E. A Gentle Introduction to Machine Learning and Data Mining for the Database Community, SBBD 3, Manaus. 58

59 Para k = 3, o valor da função objetivo é 33, Keogh, E. A Gentle Introduction to Machine Learning and Data Mining for the Database Community, SBBD 3, Manaus. 59

60 Função Objetivo Podemos então repetir este procedimento e plotar os valores da função objetivo J para k =,,6,... e tentar identificar um joelho :.E+3 9.E+ 8.E+ 7.E+ 6.E+ 5.E+ 4.E+ 3.E+.E+.E+.E+ k Keogh, E. A Gentle Introduction to Machine Learning and Data Mining for the Database Community, SBBD 3, Manaus. 6

61 Eercício Objeto i i i i Eecutar k-means com k= até k=5 nos dados acima e representar graficamente a f. objetivo J em função de k 6 i

62 Questão... Infelizmente os resultados não são sempre tão claros quanto no eemplo anterior Vide eemplo abaio... Além disso, como utilizar essa metodologia em variantes baseadas em busca guiada, que otimizam k? X-means, k-means evolutivo,... Solução: vide aulas de validação de agrupamento! 6

63 Referências Jain, A. K. and Dubes, R. C., Algorithms for Clustering Data, Prentice Hall, 988 Kaufman, L., Rousseeuw, P. J., Finding Groups in Data An Introduction to Cluster Analysis, Wiley, 5. Tan, P.-N., Steinbach, M., and Kumar, V., Introduction to Data Mining, Addison-Wesley, 6 Wu, X. and Kumar, V., The Top Ten Algorithms in Data Mining, Chapman & Hall/CRC, 9 D. Steinley, K-Means Clustering: A Half-Century Synthesis, British J. of Mathematical and Stat. Psychology, V. 59, 6 63

Tópicos Avançados em IA. Prof. Eduardo R. Hruschka

Tópicos Avançados em IA. Prof. Eduardo R. Hruschka Tópicos Avançados em IA Prof. Eduardo R. Hruschka Créditos Este material consiste de adaptações dos originais: Elaborados por Eduardo Hruschka e Ricardo Campello de (Tan et al., 2006) de E. Keogh (SBBD

Leia mais

Organização. 1. Introdução 2. Medidas de Similaridade. hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters

Organização. 1. Introdução 2. Medidas de Similaridade. hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters Organização. Introdução 2. Medidas de Similaridade 3. Métodos de Agrupamento (métodos hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters Métodos de Partição Cada exemplo

Leia mais

ANÁLISE DE AGRUPAMENTOS

ANÁLISE DE AGRUPAMENTOS ANÁLISE DE AGRUPAMENTOS Análise de Agrupamentos 2 Definição Consistem em encontrar grupos de objetos entre os objetos Categorizá-los ou agrupá-los Tipo de aprendizado não supervisionado Encontrar grupos

Leia mais

SCC5895 Análise de Agrupamento de Dados

SCC5895 Análise de Agrupamento de Dados SCC89 Análise de Agrupamento de Dados Algoritmos Hierárquicos (Parte I) Prof. Eduardo Raul Hruschka PPG-CCMC / ICMC / USP Créditos O material a seguir consiste de adaptações e etensões dos originais: Elaborados

Leia mais

Créditos. SCC0173 Mineração de Dados Biológicos. Conteúdo. Motivação. Agrupamento de Dados Partes I & II: Conceituação e Métodos Hierárquicos

Créditos. SCC0173 Mineração de Dados Biológicos. Conteúdo. Motivação. Agrupamento de Dados Partes I & II: Conceituação e Métodos Hierárquicos SCC7 Mineração de Dados Biológicos Agrupamento de Dados Partes I & II: Conceituação e Métodos Hierárquicos Prof. Ricardo J. G. B. Campello Créditos O material a seguir consiste de adaptações e etensões

Leia mais

Créditos. SCC5895 Análise de Agrupamento de Dados. Relembrando... Aula de Hoje. Algoritmos Hierárquicos: Parte I. [ x ] T. Algoritmos Hierárquicos

Créditos. SCC5895 Análise de Agrupamento de Dados. Relembrando... Aula de Hoje. Algoritmos Hierárquicos: Parte I. [ x ] T. Algoritmos Hierárquicos SCC Análise de Agrupamento de Dados Algoritmos Hierárquicos: Parte I Prof Ricardo J G B Campello Créditos O material a seguir consiste de adaptações e etensões dos originais: gentilmente cedidos pelo Prof

Leia mais

SCC5895 Análise de Agrupamento de Dados

SCC5895 Análise de Agrupamento de Dados SCC5895 Análise de Agrupamento de Dados Conceituação Prof. Ricardo J. G. B. Campello PPG-CCMC / ICMC / USP Créditos O material a seguir consiste de adaptações e extensões dos originais: gentilmente cedidos

Leia mais

SCC5895 Análise de Agrupamento de Dados

SCC5895 Análise de Agrupamento de Dados SCC5895 Análise de Agrupamento de Dados Introdução Prof. Eduardo Raul Hruschka PPG-CCMC / ICMC / USP Créditos O material a seguir consiste de adaptações e extensões dos originais: Elaborados por Eduardo

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Problema do Agrupamento Aprendizagem de Máquina Alessandro L. Koerich Seja x = (x 1, x 2,, x d ) um vetor d dimensional de características Seja D um conjunto de x vetores, D = { x(1), x(2),, x(n) } Problema

Leia mais

Mineração em Data Streams - Clustering. Profa. Elaine Faria UFU

Mineração em Data Streams - Clustering. Profa. Elaine Faria UFU Mineração em Data Streams - Clustering Profa. Elaine Faria UFU - 2018 Mineração de Dados Tarefas de mineração Tarefas Preditivas Classificação Regressão Detecção de Anomalias Tarefas Descritivas Agrupamento

Leia mais

SCC5895 Análise de Agrupamento de Dados

SCC5895 Análise de Agrupamento de Dados SCC5895 Análise de Agrupamento de Dados Algoritmos Hierárquicos: Parte II Prof. Ricardo J. G. B. Campello PPG-CCMC / ICMC / USP Créditos Parte do material a seguir consiste de adaptações e extensões dos

Leia mais

Aula 8 - Reconhecimento e Interpretação. Prof. Adilson Gonzaga

Aula 8 - Reconhecimento e Interpretação. Prof. Adilson Gonzaga Aula 8 - Reconhecimento e Interpretação Prof. Adilson Gonzaga Elementos de Visão Computacional: Visão Computacional Processamento de Baio Nível Processamento de Nível Intermediário Processamento de Alto

Leia mais

Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação

Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Francisco A. Rodrigues Departamento de Matemática Aplicada e Estatística - SME Conceitos básicos Classificação não-supervisionada:

Leia mais

SEL-0339 Introdução à Visão Computacional. Aula 7 Reconhecimento de Objetos

SEL-0339 Introdução à Visão Computacional. Aula 7 Reconhecimento de Objetos Departamento de Engenharia Elétrica - EESC-USP SEL-0339 Introdução à Visão Computacional Aula 7 Reconhecimento de Objetos Prof. Dr. Marcelo Andrade da Costa Vieira Prof. Dr. Adilson Gonzaga mvieira@sc.usp.br

Leia mais

REVISITANDO CONJUNTOS E DISTÂNCIAS PARA ENCONTRAR PONTOS VIZINHOS

REVISITANDO CONJUNTOS E DISTÂNCIAS PARA ENCONTRAR PONTOS VIZINHOS REVISITANDO CONJUNTOS E DISTÂNCIAS PARA ENCONTRAR PONTOS VIZINHOS Eduardo Braun - eduardotbraun@gmail.com Universidade Federal de Santa Maria, Campus Camobi, 97105-900 - Santa Maria, RS, Brasil Alice de

Leia mais

Mineração de Dados - Introdução. Elaine Ribeiro de Faria UFU 2018

Mineração de Dados - Introdução. Elaine Ribeiro de Faria UFU 2018 Mineração de Dados - Introdução Elaine Ribeiro de Faria UFU 2018 1 Mineração de Dados Processo de automaticamente descobrir informação útil em grandes repositórios de dados Tan P., SteinBack M. e Kumar

Leia mais

IA: Aprendizado IV. Professor Paulo Gurgel Pinheiro. 30 de Setembro de 2010

IA: Aprendizado IV. Professor Paulo Gurgel Pinheiro. 30 de Setembro de 2010 IA: Aprendizado IV Professor Paulo Gurgel Pinheiro MC906A - Inteligência Articial Instituto de Computação Universidade Estadual de Campinas - UNICAMP 30 de Setembro de 2010 1 / 75 http://www.ic.unicamp.br/

Leia mais

Agrupamento de Dados. (Clustering)

Agrupamento de Dados. (Clustering) Agrupamento de Dados (Clustering) Organização 1. Introdução 2. Medidas de (Dis)similaridade 3. Métodos de Agrupamento (métodos hierárquicos, de partição) 4. Critérios numéricos para definir o número de

Leia mais

Classificação: Árvores de Decisão e k-nn. Eduardo Raul Hruschka

Classificação: Árvores de Decisão e k-nn. Eduardo Raul Hruschka Classificação: Árvores de Decisão e k-nn Eduardo Raul Hruschka Árvores de Decisão Métodos para aproximar funções discretas, representadas por meio de uma árvore de decisão; Árvores de decisão podem ser

Leia mais

SCC5895 Análise de Agrupamento de Dados

SCC5895 Análise de Agrupamento de Dados SCC5895 Análise de Agrupamento de Dados Representação de Dados e Medidas de Proimidade Prof. Eduardo R. Hruschka PPG-CCMC / ICMC / USP Créditos O material a seguir consiste de adaptações e etensões dos

Leia mais

2 Processo de Agrupamentos

2 Processo de Agrupamentos 20 2 Processo de Agrupamentos A análise de agrupamentos pode ser definida como o processo de determinação de k grupos em um conjunto de dados. Para entender o que isso significa, observe-se a Figura. Y

Leia mais

CLARA. Resumo. Introdução. Artigo de Referência [1] Introdução PAM. Modelagem como grafo CLARANS. Comparação de eficiência Conclusão

CLARA. Resumo. Introdução. Artigo de Referência [1] Introdução PAM. Modelagem como grafo CLARANS. Comparação de eficiência Conclusão Resumo CLARANS Diego Raphael Amancio Introdução PAM CLARA CLARANS Comparação de eficiência Conclusão 2 Artigo de Referência [1] Introdução Imagem do artigo original entitulado Efficient and Effective Clustering

Leia mais

Aula 6 Mineração Streams Representação dos Dados. Profa. Elaine Faria UFU

Aula 6 Mineração Streams Representação dos Dados. Profa. Elaine Faria UFU Aula 6 Mineração Streams Representação dos Dados Profa. Elaine Faria UFU - 2017 Agradecimentos Este material é baseado No livro Tan et al, 2006 Nos slides do prof. Andre C. P. L. F. Carvalho Agradecimentos

Leia mais

SCC0173 Mineração de Dados Biológicos

SCC0173 Mineração de Dados Biológicos SCC0173 Mineração de Dados Biológicos Classificação I: Algoritmos 1Rule e KNN Prof. Ricardo J. G. B. Campello SCC / ICMC / USP 1 Créditos O material a seguir consiste de adaptações e extensões dos originais:

Leia mais

Projected Clustering Algorithm

Projected Clustering Algorithm Projected Clustering Algorithm Emanuel Matos 5560105 Disciplina : Análise de Agrupamentos Prof. Dr. Ricardo Campello Dez/2010 View Problema Objetivo Definições/Premissas Algoritmo Acurácia Escalabilidade

Leia mais

Classificação: Árvores de Decisão e k-nn. Eduardo Raul Hruschka

Classificação: Árvores de Decisão e k-nn. Eduardo Raul Hruschka Classificação: Árvores de Decisão e k-nn Eduardo Raul Hruschka Agenda: Conceitos de Classificação Técnicas de Classificação One Rule (1R) Naive Bayes (com seleção de atributos) Árvores de Decisão K-Vizinhos

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Aprendizado não-supervisionado Formação de agrupamentos Aprendizado Não-Supervisionado Classificação supervisionada: discriminar padrões com base num modelo pré-definido de classes.

Leia mais

Trilha Learning Machine Cluster Analysis em 4 passos Marco Siqueira Campos

Trilha Learning Machine Cluster Analysis em 4 passos Marco Siqueira Campos Trilha Learning Machine Cluster Analysis em 4 passos Marco Siqueira Campos Marco Siqueira Campos Sócio fundador Siqueira Campos Associados e sos-stat Estatístico UFRGS Certificado Data Science Specialization

Leia mais

SCC5895 Análise de Agrupamento de Dados

SCC5895 Análise de Agrupamento de Dados SCC5895 Análise de Agrupamento de Dados Representação de Dados Prof. Ricardo J. G. B. Campello PPG-CCMC / ICMC / USP Créditos O material a seguir consiste de adaptações e etensões dos originais: gentilmente

Leia mais

Integração de Mineração de Dados com SGBD Detecção de Agrupamentos

Integração de Mineração de Dados com SGBD Detecção de Agrupamentos Integração de Mineração de Dados com SGBD Detecção de Agrupamentos Centro de Matemática Computação e Cognição-UFABC Jéssica Andressa de Souza Pós-Graduação em Ciência da Computação Sistemas de Banco de

Leia mais

Clustering (k-means, SOM e hierárquicos)

Clustering (k-means, SOM e hierárquicos) Clustering (k-means, SOM e hierárquicos) André Tavares da Silva andre.silva@udesc.br (Capítulo 10 de Duda e Hart) Clustering Introdução e tipos Roteiro Agrupamentos hierárquicos AGNES, DIANA e Dendogram

Leia mais

Otimização de horários Seminário. Clarisse Resende 25/01/2013

Otimização de horários Seminário. Clarisse Resende 25/01/2013 Otimização de horários Seminário Clarisse Resende 25/01/2013 O problema dos horários consiste numa sequência de atividades de programação, satisfazendo um conjunto de restrições de recursos. Pretende-se

Leia mais

( ) Aula de Hoje. Introdução a Sistemas Inteligentes. Modelo RBF (revisão) Modelo RBF (revisão)

( ) Aula de Hoje. Introdução a Sistemas Inteligentes. Modelo RBF (revisão) Modelo RBF (revisão) Introdução a Sistemas Inteligentes ópicos em Redes Neurais III: Redes Neurais RBF ª Parte Prof. Ricardo J. G. B. Campello ICMC / USP Aula de Hoje Revisão de Modelos RBF reinamento de Modelos RBF Estimação

Leia mais

Introdução às Redes Neurais Artificiais

Introdução às Redes Neurais Artificiais Introdução às Redes Neurais Artificiais Clusterização: Conceitos Básicos Prof. João Marcos Meirelles da Silva www.professores.uff.br/jmarcos Departamento de Engenharia de Telecomunicações Escola de Engenharia

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina André C. P. L. F. de Carvalho Posdoutorando: Isvani Frias-Blanco ICMC-USP Agrupamento de dados Tópicos Agrupamento de dados Dificuldades em agrupamento Algoritmos de agrupamento

Leia mais

Aprendizagem de Máquina - 2. Prof. Júlio Cesar Nievola PPGIa - PUCPR

Aprendizagem de Máquina - 2. Prof. Júlio Cesar Nievola PPGIa - PUCPR Aprendizagem de Máquina - 2 Prof. Júlio Cesar Nievola PPGIa - PUCPR Inteligência versus Aprendizado Aprendizado é a chave da superioridade da Inteligência Humana Para que uma máquina tenha Comportamento

Leia mais

Uma Nova Forma de Calcular o Centro dos Clusters no Algoritmo Fuzzy C-Means

Uma Nova Forma de Calcular o Centro dos Clusters no Algoritmo Fuzzy C-Means Uma Nova Forma de Calcular o Centro dos Clusters no Algoritmo Fuzzy C-Means Rogério R. de Vargas, Benjamín R. C. Bedregal, Departamento de Matemática Aplicada e Informática, DIMAp, UFRN 59072-970, Natal,

Leia mais

Cluster. Larissa Sayuri Futino Castro dos Santos

Cluster. Larissa Sayuri Futino Castro dos Santos Cluster Larissa Sayuri Futino Castro dos Santos Agenda O que faremos Modelos de Mistura LDA Reconhecimento Overview Mét. Particionais E Hierárquicos Melhorias K-Medians K-Medoids K-Modes Mét. Probabilís

Leia mais

Introdução à Mineração de Dados com Aplicações em Ciências Espaciais

Introdução à Mineração de Dados com Aplicações em Ciências Espaciais Introdução à Mineração de Dados com Aplicações em Ciências Espaciais Escola de Verão do Laboratório Associado de Computação e Matemática Aplicada Rafael Santos Dia 3: 1 /54 Programa Dia 1: Apresentação

Leia mais

Estatística: Aplicação ao Sensoriamento Remoto SER ANO Análise de Agrupamento

Estatística: Aplicação ao Sensoriamento Remoto SER ANO Análise de Agrupamento statística: plicação ao Sensoriamento Remoto SR 204 - NO 2017 nálise de grupamento amilo aleles Rennó camilo@dpi.inpe.br http://www.dpi.inpe.br/~camilo/estatistica/ nálise de grupamento (luster nalysis)

Leia mais

CLASSIFICADORES ELEMENTARES

CLASSIFICADORES ELEMENTARES CLASSIFICADORES ELEMENTARES Classificação 2 Consiste em tentar discriminar em diferentes classes um conjunto de objetos com características mensuráveis Exemplo: classificação de frutas Forma, cor, sabor,

Leia mais

Redes Neurais (Inteligência Artificial)

Redes Neurais (Inteligência Artificial) Redes Neurais (Inteligência Artificial) Aula 16 Aprendizado Não-Supervisionado Edirlei Soares de Lima Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest

Leia mais

Descoberta de Conhecimento em Bancos de Dados - KDD

Descoberta de Conhecimento em Bancos de Dados - KDD Descoberta de Conhecimento em Bancos de Dados - KDD Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Fases do processo 3. Exemplo do DMC 4. Avaliação

Leia mais

Classificação: 1R e Naïve Bayes. Eduardo Raul Hruschka

Classificação: 1R e Naïve Bayes. Eduardo Raul Hruschka Classificação: 1R e Naïve Bayes Eduardo Raul Hruschka Agenda: Conceitos de Classificação Técnicas de Classificação One Rule (1R) Naive Bayes (com seleção de atributos) Super-ajuste e validação cruzada

Leia mais

Análise Multivariada Aplicada à Contabilidade

Análise Multivariada Aplicada à Contabilidade Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes www.marcelobotelho.com mbotelho@usp.br Turma: 2º / 2016 1 Agenda

Leia mais

Otimização da Paleta de Cores

Otimização da Paleta de Cores Otimização da Paleta de Cores Resumo O objetivo deste artigo é apresentar a técnica de otimização da paleta de cores utilizada no MSX Viewer 5 para encontrar a melhor paleta de cores do MSX 2 e do v9990,

Leia mais

Aula 7 Medidas de Distância. Profa. Elaine Faria UFU

Aula 7 Medidas de Distância. Profa. Elaine Faria UFU Aula 7 Medidas de Distância Profa. Elaine Faria UFU - 2017 Agradecimentos Este material é baseado No livro Tan et al, 2006 Nos slides do prof Andre C. P. L. F. Carvalho Agradecimentos Ao professor André

Leia mais

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Tipos de Aprendizagem. Luiz Eduardo S. Oliveira, Ph.D.

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Tipos de Aprendizagem. Luiz Eduardo S. Oliveira, Ph.D. Universidade Federal do Paraná Departamento de Informática Reconhecimento de Padrões Tipos de Aprendizagem Luiz Eduardo S. Oliveira, Ph.D. http://lesoliveira.net Objetivos Introduzir diferentes tipos de

Leia mais

Clustering - c-means e Self Organizing Maps

Clustering - c-means e Self Organizing Maps - c-means e Self Organizing Maps Sarajane M. Peres e Clodoaldo A. M. Lima 13 de abril de 2015 Material baseado em: HAN, J. & KAMBER, M. Data Mining: Concepts and Techniques. 2nd. 2006 FAUSETT, L. Fundamentals

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 18 Aprendizado Não-Supervisionado Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor

Leia mais

Análise de dados multivariados I

Análise de dados multivariados I Análise de dados multivariados I Tópico: Análise de Conglomerados ou Agrupamentos (ou ainda, Cluster Analysis) Bibliografia: R.A. Johnson, Applied Multivariate Statistical Analysis, Prentice Hall, 199

Leia mais

Aprendizado de Máquinas. Introdução à Aprendizado Não- Supervisionado

Aprendizado de Máquinas. Introdução à Aprendizado Não- Supervisionado Universidade Federal do Paraná (UFPR) Departamento de Informática (DInf) Aprendizado de Máquinas Introdução à Aprendizado Não- Supervisionado David Menotti, Ph.D. http://web.inf.ufpr.br/menotti Objetivos

Leia mais

Método Simplex dual. Marina Andretta ICMC-USP. 24 de outubro de 2016

Método Simplex dual. Marina Andretta ICMC-USP. 24 de outubro de 2016 Método Simplex dual Marina Andretta ICMC-USP 24 de outubro de 2016 Baseado no livro Introduction to Linear Optimization, de D. Bertsimas e J. N. Tsitsiklis. Marina Andretta (ICMC-USP) sme0211 - Otimização

Leia mais

Agrupamento. Algoritmos e aplicações

Agrupamento. Algoritmos e aplicações Agrupamento Algoritmos e aplicações Equipe Bertha Andaluz (bmca) Deborah Mesquita (dhsm) Lucas Lima (lapl) Lucas Tenório (lvt) Roteiro Motivação Métodos de clustering Modelos de clustering Fuzzy clustering

Leia mais

Créditos. SCC0173 Mineração de Dados Biológicos. Aula de Hoje. Introdução. Classificação III: Árvores de Decisão

Créditos. SCC0173 Mineração de Dados Biológicos. Aula de Hoje. Introdução. Classificação III: Árvores de Decisão SCC073 Mineração de Dados Biológicos Classificação III: Árvores de Decisão Créditos O material a seguir consiste de adaptações e extensões dos originais: gentilmente cedidos pelo Prof. André C. P. L. F.

Leia mais

SCC0173 Mineração de Dados Biológicos

SCC0173 Mineração de Dados Biológicos SCC0173 Mineração de Dados Biológicos Preparação de Dados: Parte B Prof. Ricardo J. G. B. Campello SCC / ICMC / USP 1 Créditos O material a seguir consiste de adaptações e extensões: dos originais gentilmente

Leia mais

Mineração de Dados em Biologia Molecular

Mineração de Dados em Biologia Molecular Mineração de Dados em Biologia Molecular André C. P. L. F. de Carvalho Monitor: Valéria Carvalho Agrupamento de Dados Tópicos Agrupamento de dados Análise de cluster Dificuldades em agrupamento Algoritmos

Leia mais

CÁLCULO NUMÉRICO. Profa. Dra. Yara de Souza Tadano.

CÁLCULO NUMÉRICO. Profa. Dra. Yara de Souza Tadano. CÁLCULO NUMÉRICO Profa. Dra. Yara de Souza Tadano yaratadano@utfpr.edu.br Aula 4 09/2014 Zeros reais de funções Parte 1 Objetivo Determinar valores aproimados para as soluções (raízes) de equações da forma:

Leia mais

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Segmentação. Luiz Eduardo S. Oliveira, Ph.D.

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Segmentação. Luiz Eduardo S. Oliveira, Ph.D. Universidade Federal do Paraná Departamento de Informática Reconhecimento de Padrões Segmentação Luiz Eduardo S. Oliveira, Ph.D. http://lesoliveira.net Objetivos Introduzir os conceitos básicos de segmentação

Leia mais

Algoritmo CLIQUE (Clustering In QUEst)

Algoritmo CLIQUE (Clustering In QUEst) Algoritmo CLIQUE (Clustering In QUEst) Marcelo Camacho de Souza Nº USP: 3199616 Roteiro Algoritmo CLIQUE Exemplo Prático Complexidade Computacional Vantagens e Desvantagens Autores (IBM Almaden Research

Leia mais

Uso da Rede Neural Artificial Self Organizing Maps (SOM) na clusterização de dados meteorológicos

Uso da Rede Neural Artificial Self Organizing Maps (SOM) na clusterização de dados meteorológicos Trabalho apresentado no CMAC-Sul, Curitiba-PR, 2014. Uso da Rede Neural Artificial Self Organizing Maps (SOM) na clusterização de dados meteorológicos Jorge V. R. Bonato, Paulo H. Siqueira Programa de

Leia mais

3 Técnicas de agrupamento

3 Técnicas de agrupamento 3 Técnicas de agrupamento Com o advento da internet a quantidade de informação disponível aumentou consideravelmente e com isso, tornou-se necessário uma forma automática de organizar e classificar esta

Leia mais

SENSOMETRIA. Adilson dos Anjos. Curitiba, PR 21 de maio de Departamento de Estatística Universidade Federal do Paraná

SENSOMETRIA. Adilson dos Anjos. Curitiba, PR 21 de maio de Departamento de Estatística Universidade Federal do Paraná SENSOMETRIA Adilson dos Anjos Departamento de Estatística Universidade Federal do Paraná aanjos@ufpr.br Curitiba, PR 21 de maio de 2015 1 / 7 SENSOMETRIA SEGMENTAÇÃO 2 / 7 Introdução Análise de agrupamentos->

Leia mais

PRÁTICA 8. A Distância Euclidiana entre dois vetores n-dimensionais x e y é definida como o escalar: d = norm(x y)

PRÁTICA 8. A Distância Euclidiana entre dois vetores n-dimensionais x e y é definida como o escalar: d = norm(x y) PRÁTICA 8 1) Medidas de Distância. A Distância Euclidiana entre dois vetores n-dimensionais e y é definida como o escalar: d 1 2 2 [( y ) + + ( y ) ] 2 e (, y) = y = y = 1 1 L n n esta epressão é a Norma

Leia mais

Inteligência nos Negócios (Business Inteligente)

Inteligência nos Negócios (Business Inteligente) Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 7) Fundamentação da disciplina Analise de dados Decisões

Leia mais

Otimização da Paleta de Cores

Otimização da Paleta de Cores Otimização da Paleta de Cores Resumo O objetivo deste artigo é apresentar a técnica de otimização da paleta de cores utilizada no MSX Viewer 5 para encontrar a melhor paleta de cores do MSX 2 e do v9990,

Leia mais

SUPPORT VECTOR MACHINE - SVM

SUPPORT VECTOR MACHINE - SVM SUPPORT VECTOR MACHINE - SVM Definição 2 Máquinas de Vetores Suporte (Support Vector Machines - SVMs) Proposto em 79 por Vladimir Vapnik Um dos mais importantes acontecimentos na área de reconhecimento

Leia mais

Clustering: k-means e Agglomerative

Clustering: k-means e Agglomerative Tópicos Avançados em Avaliação de Desempenho de Sistemas Jackson Nunes Marco Eugênio Araújo Outubro de 2014 1 Sumário Contextualização Classificação Agrupamento (Clustering) Cenários de Aplicação Clustering

Leia mais

Aula 6. Zeros reais de funções Parte 3

Aula 6. Zeros reais de funções Parte 3 CÁLCULO NUMÉRICO Aula 6 Zeros reais de funções Parte 3 MÉTODO DE NEWTON RAPHSON Cálculo Numérico 3/47 CONSIDERAÇÕES INICIAIS MÉTODO DO PONTO FIXO: Uma das condições de convergência é que onde I é um intervalo

Leia mais

MÉTODOS MULTIVARIADOS. Rodrigo A. Scarpel

MÉTODOS MULTIVARIADOS. Rodrigo A. Scarpel MÉTODOS MULTIVARIADOS Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo INTRODUÇÃO Semana Conteúdo Introdução aos métodos multivariados 1 Análise de componentes principais 2 Aplicações de análise

Leia mais

Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas

Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas Wrapper Filtros Muitos algoritmos de AM são projetados de modo a selecionar os

Leia mais

3 Aprendizado por reforço

3 Aprendizado por reforço 3 Aprendizado por reforço Aprendizado por reforço é um ramo estudado em estatística, psicologia, neurociência e ciência da computação. Atraiu o interesse de pesquisadores ligados a aprendizado de máquina

Leia mais

Inteligência nos Negócios (Business Inteligente)

Inteligência nos Negócios (Business Inteligente) Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 7) Fundamentação da disciplina Analise de dados Decisões

Leia mais

Método Simplex. Marina Andretta ICMC-USP. 19 de outubro de 2016

Método Simplex. Marina Andretta ICMC-USP. 19 de outubro de 2016 Método Simplex Marina Andretta ICMC-USP 19 de outubro de 2016 Baseado no livro Introduction to Linear Optimization, de D. Bertsimas e J. N. Tsitsiklis. Marina Andretta (ICMC-USP) sme0211 - Otimização linear

Leia mais

PESQUISA OPERACIONAL Definições e Teoremas Básicos. Professor Volmir Wilhelm Professora Mariana Kleina

PESQUISA OPERACIONAL Definições e Teoremas Básicos. Professor Volmir Wilhelm Professora Mariana Kleina PESQUISA OPERACIONAL Definições e Teoremas ásicos Professor Volmir Wilhelm Professora Mariana Kleina Conceitos Solução Viável Solução Não Viável Região Viável Solução ásica Solução ásica Viável Solução

Leia mais

Thiago Christiano Silva

Thiago Christiano Silva Thiago Christiano Silva Conteúdo Conceitos Relevantes Problemas de Otimização Conceitos de Estabilidade e Convergência Teoremas de Lyapunov Rede Neural de Hopfield Aplicações do modelo de Hopfield Clusterização

Leia mais

MÉTODOS DE OTIMIZAÇÃO ENE081

MÉTODOS DE OTIMIZAÇÃO ENE081 UNIVERSIDADE FEDERAL DE JUIZ DE FORA Graduação em Engenharia Elétrica MÉTODOS DE OTIMIZAÇÃO ENE8 PROF. IVO CHAVES DA SILVA JUNIOR E-mail: ivo.junior@uj.edu.br Aula Número: 9 Disciplina Métodos de Otimização

Leia mais

Análise do Desempenho do Algoritmo de Agrupamento Baseado em Colônia de Formigas Modificado

Análise do Desempenho do Algoritmo de Agrupamento Baseado em Colônia de Formigas Modificado Anais do CNMAC v. ISSN 1984-80X Análise do Desempenho do Algoritmo de Agrupamento Baseado em Colônia de Formigas Modificado Rosangela Villwock UFPR - Programa de Pós-Graduação em Métodos Numéricos em Engenharia

Leia mais

étodos uméricos SISTEMAS DE EQUAÇÕES LINEARES (Continuação) Prof. Erivelton Geraldo Nepomuceno PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA

étodos uméricos SISTEMAS DE EQUAÇÕES LINEARES (Continuação) Prof. Erivelton Geraldo Nepomuceno PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA étodos uméricos SISTEMAS DE EQUAÇÕES LINEARES (Continuação) Prof. Erivelton Geraldo Nepomuceno PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA UNIVERSIDADE DE JOÃO DEL-REI PRÓ-REITORIA DE PESQUISA CENTRO

Leia mais

6 Aplicação do Modelo de Geração de Cenários

6 Aplicação do Modelo de Geração de Cenários 6 Aplicação do Modelo de Geração de Cenários 6.. Considerações Iniciais Os cenários de energia natural afluente, que são utilizados durante as simulações forward e backward do processo de definição da

Leia mais

Processamento de Imagens CPS755

Processamento de Imagens CPS755 Processamento de Imagens CPS755 aula 06 - sistemas não lineares Antonio Oliveira Ricardo Marroquim 1 / 38 laboratório de processamento de imagens tópicos RANSAC métodos iterativos (não-lineares) gradientes

Leia mais

Aprendizado de Máquina. Combinando Classificadores

Aprendizado de Máquina. Combinando Classificadores Universidade Federal do Paraná (UFPR) Departamento de Informática (DInf) Aprendizado de Máquina Combinando Classificadores David Menotti, Ph.D. web.inf.ufpr.br/menotti Introdução O uso de vários classificadores

Leia mais

Redes de Computadores sem Fio

Redes de Computadores sem Fio Redes de Computadores sem Fio Prof. Marcelo Gonçalves Rubinstein Programa de Pós-Graduação em Engenharia Eletrônica Faculdade de Engenharia Universidade do Estado do Rio de Janeiro Programa Introdução

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Aprendizagem Não Supervisionada Alessandro L. Koerich Mestrado/Doutorado em Informática (PPGIa) Pontifícia Universidade Católica do Paraná (PUCPR) Mestrado/Doutorado em Informática

Leia mais

CÁLCULO NUMÉRICO. Profa. Dra. Yara de Souza Tadano.

CÁLCULO NUMÉRICO. Profa. Dra. Yara de Souza Tadano. CÁLCULO NUMÉRICO Profa. Dra. Yara de Souza Tadano yaratadano@utfpr.edu.br Aula 5 Zeros reais de funções Parte 2 Voltando ao eemplo da aula anterior, vemos que o ponto médio da primeira iteração 1 = 2,5

Leia mais

Mineração de Dados. Modelos Descritivos. Descoberta de agrupamentos

Mineração de Dados. Modelos Descritivos. Descoberta de agrupamentos Mineração de Dados Descoberta de agrupamentos Modelos Descritivos tarefa de geração de um modelo descritivo consiste (em grande parte) em analisar os dados do domínio (entradas) e sugerir uma partição

Leia mais

SCC5895 Análise de Agrupamento de Dados

SCC5895 Análise de Agrupamento de Dados SCC5895 Análise de Agrupamento de Dados Validação de Agrupamento: Parte II Prof. Ricardo J. G. B. Campello PPG-CCMC / ICMC / USP Aula de Hoje Introdução à Validação Estatística Revisão de Testes de Significância

Leia mais

K-MEANS COM ÁRVORES KD

K-MEANS COM ÁRVORES KD 2 Roteiro K-MEANS COM ÁRVORES KD Rodrigo Coelho Barros Árvores KD O que são? Algoritmo de Bentley (1975) Métodos de divisão K-Means com árvores KD Algoritmo de filtragem (Kanungo et al., 2002) Exemplo

Leia mais

Programa do Curso. Transformação de Dados. Sistemas Inteligentes Aplicados. Carlos Hall. Discretização de Variáveis Contínuas

Programa do Curso. Transformação de Dados. Sistemas Inteligentes Aplicados. Carlos Hall. Discretização de Variáveis Contínuas Sistemas Inteligentes Aplicados Carlos Hall Programa do Curso Limpeza/Integração de Dados Transformação de Dados Discretização de Variáveis Contínuas Transformação de Variáveis Discretas em Contínuas Transformação

Leia mais

SCC0173 Mineração de Dados Biológicos

SCC0173 Mineração de Dados Biológicos SCC073 Mineração de Dados Biológicos Análise Exploratória de Dados Parte A: Revisão de Estatística Descritiva Elementar Prof. Ricardo J. G. B. Campello SCC / ICMC / USP Tópicos Análise Exploratória de

Leia mais

Análise de Clusters. Aplicações da formação de Grupos (Clustering)

Análise de Clusters. Aplicações da formação de Grupos (Clustering) Análise de Clusters Aplicações da formação de Grupos (Clustering) Ver e analisar vastas quantidades de dados biológicos como um todo pode ser difícil É mais fácil interpretar os dados se forem divididos

Leia mais

A análise de aglomerados

A análise de aglomerados Mais importante do que saber fazer é saber o por quê (Norbert Wiener (1894 1964). Prof. Lorí Viali, Dr. viali@pucrs.br; viali@mat.ufrgs.br; http://www.pucrs.br/famat/viali; http://www.mat.ufrgs.br/~viali/

Leia mais

Inteligência Artificial Agrupamento de Dados. prof. Dr. Rogério R. de Vargas. Universidade Estadual de Santa Cruz - UESC. Ilhéus-Ba, Outubro de 2013

Inteligência Artificial Agrupamento de Dados. prof. Dr. Rogério R. de Vargas. Universidade Estadual de Santa Cruz - UESC. Ilhéus-Ba, Outubro de 2013 Inteligência Artificial de prof. Dr. Rogério R. de Vargas Universidade Estadual de Santa Cruz - UESC Ilhéus-Ba, Outubro de 2013 http://rogerio.in slide 1 Introdução http://rogerio.in slide 2 Como agrupar?

Leia mais

Métodos de reamostragem

Métodos de reamostragem Universidade Federal do Paraná Laboratório de Estatística e Geoinformação - LEG Métodos de reamostragem Eduardo Vargas Ferreira Função custo 2 Função custo Matriz de confusão: é um layout de tabela que

Leia mais

2. Redes Neurais Artificiais

2. Redes Neurais Artificiais Computação Bioinspirada - 5955010-1 2. Redes Neurais Artificiais Prof. Renato Tinós Depto. de Computação e Matemática (FFCLRP/USP) 1 2.4. Outras Redes Neurais Artificiais 2.4.1. Redes RBF 2.4.2. Mapas

Leia mais

MINERAÇÃO DE DADOS. Thiago Marzagão CLUSTERIZAÇÃO. Thiago Marzagão (UnB) MINERAÇÃO DE DADOS 1 / 9

MINERAÇÃO DE DADOS. Thiago Marzagão CLUSTERIZAÇÃO. Thiago Marzagão (UnB) MINERAÇÃO DE DADOS 1 / 9 MINERAÇÃO DE DADOS Thiago Marzagão marzagao.1@osu.edu CLUSTERIZAÇÃO Thiago Marzagão (UnB) MINERAÇÃO DE DADOS 1 / 9 regressão/classificação vs clusterização Regressão/classificação: temos x 1, x 2,...,

Leia mais

Distribuições Amostrais

Distribuições Amostrais Estatística II Antonio Roque Aula Distribuições Amostrais O problema central da inferência estatística é como fazer afirmações sobre os parâmetros de uma população a partir de estatísticas obtidas de amostras

Leia mais

Problema de designação

Problema de designação Departamento de Engenharia de Produção UFPR 48 Problema de designação Imagine, que em uma gráfica eiste uma única máquina e um único operador apto a operá-la. Como você empregaria o trabalhador? Sua resposta

Leia mais