Aprendizagem de Máquina

Tamanho: px
Começar a partir da página:

Download "Aprendizagem de Máquina"

Transcrição

1 Aprendizagem de Máquina Aprendizagem Não Supervisionada Alessandro L. Koerich Mestrado/Doutorado em Informática (PPGIa) Pontifícia Universidade Católica do Paraná (PUCPR)

2 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 2 Plano de Aula Aprendizagem não supervisionada Algoritmos de agrupamento (Clustering) Seqüenciais Hierárquicos Baseados na otimização de funções Outros

3 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 3 Introdução Previamente, todas as amostras de treinamento estavam rotuladas, ou seja, com o valor do conceito alvo associado vetor de atributos 0,43 0,03 0,40 0,19 0,12 0,16 0,04 0,01 0,00 0,01 0,40 0,02 Bart valor do conceito alvo associado ao vetor de atributos Estes exemplos são ditos supervisionados, pois, contém tanto a entrada (atributos), quanto a saída (valor do conceito alvo).

4 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 4 Introdução Porém, muitas vezes temos que lidar com exemplos não supervisionados, isto é, exemplos não rotulados, ou seja: sem um conceito alvo associado ou sem um valor de conceito alvo associado Por que? Coletar e rotular um grande conjunto de exemplos pode custar muito (tempo, esforço, dinheiro).

5 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 5 Introdução Porém, podemos utilizar grandes quantidades de dados não rotulados para treinamento e somente então usar supervisão para rotular os agrupamentos encontrados. Isto é apropriado para aplicações de mineração de dados (datamining), onde o conteúdo de grandes bases de dados não é conhecido antecipadamente.

6 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 6 Introdução Podemos usar métodos não supervisionados para identificar características que serão então úteis para categorização. Podemos ganhar alguma percepção da natureza (ou estrutura) dos dados.

7 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 7 Introdução O interesse principal é desvendar a organização dos padrões em clusters (agrupamentos) consistentes, os quais permitirão descobrir similaridades e diferenças entre padrões bem como derivar conclusões úteis a respeito deles. Clustering = Aprendizagem Não Supervisionada = Aprendizado Sem Professor = Taxonomia Numérica = Tipologia = Partição.

8 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 8 Introdução Exemplo de agrupamentos (clusters) De acordo com a progenitura Existência de pulmões Ambiente onde vivem progenitura e existência de pulmões

9 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 9 Introdução Assumimos que: Todos os padrões são representados em termos de atributos (características ou features) que formam vetores de d dimensões d

10 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 10 Introdução Os passos básicos da tarefa de aprendizagem não supervisionada são: 1. Seleção de atributos 2. Medida de proximidade 3. Critério de agrupamento 4. Algoritmo de agrupamento 5. Verificação dos resultados 6. Interpretação dos resultados

11 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina Seleção de Atributos Atributos devem ser propriamente selecionados para codificar a maior quantidade possível de informações relacionada a tarefa de interesse. Os atributos devem ter também uma redundância mínima entre eles.

12 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina Medida de Proximidade Medida para quantificar quão similar ou dissimilar são dois vetores de atributos. É ideal que todos os atributos contribuam de maneira igual no cálculo da medida de proximidade. Ou seja, que um atributo não seja dominante sobre o outro.

13 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina Critério de Agrupamento Depende da interpretação que o especialista dá ao termo sensível com base no tipo de cluster que são esperados. Por exemplo, um cluster compacto de vetores de atributos pode ser sensível de acordo com um critério enquanto outro cluster alongado, pode ser sensível de acordo com outro critério.

14 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina Algoritmo de Agrupamento Tendo adotado uma medida de proximidade e um critério de agrupamento devemos escolher um algoritmo de clustering que revele a estrutura agrupada do conjunto de dados.

15 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina Validação dos Resultados Uma vez obtidos os resultados do algoritmo de agrupamento, devemos verificar sua correção. Isto geralmente é feito através de testes apropriados.

16 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina Interpretação dos Resultados Em geral os resultados de clustering devem ser integrados com outras evidências experimentais e análise para chegar as conclusões corretas.

17 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 17 Introdução Atenção: Diferentes escolhas de atributos (features), medidas de proximidade, critérios de agrupamento e algoritmos de clustering levam a... resultados totalmente diferentes!!! Qual resultado é correto?

18 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 18 Aplicações de Clustering Quatro direções básicas onde clustering é utilizado: Redução de dados Geração de hipóteses Teste de hipóteses Predição baseada em grupos

19 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 19 Definição de Clustering Dado um conjunto de dados X: X = {x 1, x 2,..., x n } definimos como um m agrupamento de X a partição de X em m conjuntos (clusters ou grupos) C 1, C 2,..., C m tal que as três condições seguintes sejam satisfeitas: C i, i =1,2,..., m Υ m i=1 C i = X Ci C j = i j i, j = 1,2,..., m

20 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 20 Definição de Clustering C i, i =1,2,..., Nenhum cluster pode ser vazio. Υ m i=1 C i = X A união de todos os cluster deve ser igual ao conjunto de dados que gerou os clusters, ou seja, X. Ci C j = i j i, j =1,2,..., m m A união de dois clusters deve ser vazio, i.e., dois cluster não podem conter vetores em comum.

21 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 21 Definição de Clustering Além disso, os vetores contidos em um cluster C i são mais similares uns aos outros e menos similares aos vetores presentes nos outros clusters. Quantificar os termos similar e dissimilar depende dos tipos de clusters. Definição alternativa: Um vetor pode pertencer a mais de um cluster fuzzy clustering

22 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 22 Definição de Clustering

23 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 23 Medidas de Proximidade Medidas de Dissimilaridade (DM) Métrica l p ponderada Métrica Norma l ponderada Métrica l 2 ponderada (Mahalanobis) Métrica l p especial (Manhattan) Distância de Hamming Medidas de Similaridade (SM) Produto interno (inner) Medida de Tanimoto

24 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 24 Medidas de Proximidade Métrica l p ponderada (reais): d 1/ p l p p( x, y) = wi xi yi i= 1 onde x i e y i são as i ésimas coordenadas de x e y, i=1,2,...,l e w i 0 é o i ésimo coeficiente de ponderação. Caso particular: p = 2 Distância Euclidiana.

25 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 25 Alessandro L. Koerich Medidas de Proximidade Métrica Norma l ponderada: Métrica l 2 ponderada: onde B é uma matriz simétrica positiva (Mahalanobis) max ), ( 1 i i i l i y x w y x d = ) ( ) ( ), ( y x B y x y x d T =

26 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 26 Medidas de Proximidade Métrica l p especial: d l 1 ( x, y) = wi xi yi i= 1 é também chamada de norma Manhattan.

27 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 27 Medidas de Proximidade Exemplo:

28 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 28 Alessandro L. Koerich Medidas de Proximidade Produto interno (inner): Medida de Tanimoto: = = = l i i i T inner y x y x y x s 1 ), ( y x y x y x y x s T T T ) ( ) ( 1 1 ), ( + =

29 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 29 Medidas de Proximidade Consideramos agora, vetores x cujas coordenadas pertencem ao conjunto finito F = {0,1,2,..., k 1}, onde k é um inteiro positivo. Existem exatamente k l vetores x F l Estes vetores podem ser considerados como vértices em um grid l dimensional.

30 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 30 Medidas de Proximidade Grid l dimensional.

31 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 31 Medidas de Proximidade Distância de Hamming: d ( x, y) = k 1 k 1 H a ij i= 0 j= 0, j i isto corresponde a soma de todos os elementos fora da diagonal de A, os quais indicam as posições onde x e y diferem.

32 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 32 Medidas de Proximidade Medida de Tanimoto: s T ii i= 1 ( x, y) = k 1 k 1 k 1 k 1 k 1 i= 1 j= 0 a ij + i= 0 k 1 j= 1 a a ij 1 i= 1 k 1 j= 1 a ij Existem ainda diversas outras medidas...

33 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 33 Medidas de Proximidade Vetores com valores discretos e reais

34 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 34 Número de Agrupamentos A melhor maneira de designar quais vetores de atributos x i, i=1, 2,..., N de um conjunto X vetores pertencem a quais clusters seria: identificar todas as partições possíveis e selecionar a mais sensível de acordo com um critério pré estabelecido. Entretanto... fazer isto é muito difícil (trabalhoso!!!)

35 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 35 Número de Agrupamentos Fazendo S (N, m) representar número de todos os clusters possíveis de N vetores em m grupos. As seguintes condições se mantêm... S (N,1) = 1 S (N,N) = 1 S (N,m) = 0, para m > N L 1 k N : lista contendo todos os agrupamentos possíveis de N 1 vetores em k clusters, para k = m, m 1. O N ésimo vetor: ou será adicionado a um cluster de qualquer membro ou formará um novo cluster para cada membro m 1 L N 1 m LN 1

36 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 36 Número de Agrupamentos Solução Números de Stirling: S( N, m) = 1! m m i= 0 ( 1) m i m i i N Exemplo: Para X={x 1, x 2, x 3 }, quais os agrupamentos possíveis dos elementos em 2 clusters? Exemplos numéricos: S (15,3) = S (25,8) = S (100,5) 10 68

37 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 37 Número de Agrupamentos Os resultados anteriores são para um número fixo de clusters, m fixo Para enumerar todos os clusters possíveis para todos os valores possíveis de m computacionalmente intratável Exemplo: 100 objetos, 5 clusters, seg/cluster anos Entretanto, o objetivo é sempre tentar identificar o agrupamento mais sensível ( ou representativo).

38 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 38 Algoritmos de Clustering Objetivo: Encontrar agrupamentos representativos considerando somente uma pequena fração do conjunto contendo todas as partições possíveis de X. Solução: Algoritmos de Clustering Problema: Os resultados dependem: de um algoritmo específico; dos critérios utilizados.

39 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 39 Algoritmos de Clustering O que é um algoritmo de Clustering? É um procedimento de aprendizagem que tenta identificar características específicas dos agrupamentos intrínsecos (ou existentes) em um conjunto de dados. Os algoritmos de clustering podem ser divididos em categorias: Seqüenciais Hierárquicos Baseados na otimização de funções custo Outros: Fuzzy, LVQ, SOM

40 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 40 Algoritmos Seqüenciais Principais características dos algoritmos seqüenciais: Algoritmos desta categoria produzem um único agrupamento. São algoritmo diretos e rápidos. Geralmente, todos os vetores de características são apresentados ao algoritmo uma ou várias vezes (até 5 ou 6 vezes). O resultado final geralmente depende da ordem de apresentação.

41 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 41 Algoritmo BSAS Basic Sequential Algorithmic Scheme (BSAS) Todos os vetores são apresentados uma única vez ao algoritmo. Número de clusters não é conhecido a priori. Novos clusters são criados enquanto o algoritmo evolui.

42 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 42 Algoritmo BSAS Parâmetros do BSAS d (x, C): distância (ou dissimilaridade) entre um vetor de características x e um cluster C. Θ: limiar de dissimilaridade q: número máximo de clusters. m: número de clusters que o algoritmo criou até o momento. Idéia Básica do BSAS: para um dado vetor, designá lo para um cluster existente ou criar um novo cluster (depende da distância entre o vetor e os clusters já formados).

43 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 43 Algoritmo BSAS 2 Esta instrução é ativada nos casos onde cada cluster é representado por um único vetor. Por exemplo, se cada cluster for representado por um vetor médio, ele deve ser atualizado cada vez que um novo vetor se tornar membro do cluster.

44 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 44 Algoritmo BSAS Para estimar o número de clusters, um procedimento auxiliar é utilizado:

45 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 45 Algoritmo BSAS

46 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 46 Melhoramento do Algoritmo BSAS Modified Basic Sequential Algorithmic Scheme (MBSAS) Two Threshold Sequential Algorithmic Scheme (TTSAS) Estes algoritmos possuem estágios de refinamento, isto é: um procedimento de unir clusters um procedimento de re atribuição de vetores aos clusters.

47 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 47 Melhoramento do Algoritmo BSAS Estágio de refinamento: procedimento para unir clusters

48 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 48 Melhoramento do Algoritmo BSAS Estágio de refinamento: procedimento para re atribuição, ou seja, retirar um vetor de um cluster e colocá lo em outro mais próximo.

49 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 49 Algoritmos Hierárquicos Podem ser divididos em 2 subcategorias: Aglomerativos produzem uma seqüência de agrupamentos com um número decrescente de clusters, m a cada passo. Os agrupamentos produzidos em cada passo resultam do anterior pela fusão de dois clusters em um. Divisivos Atuam na direção oposta, isto é, eles produzem uma seqüência de agrupamentos com um número crescente de clusters, m a cada passo. Os agrupamentos produzidos em cada passo resultam da partição de um único cluster em dois.

50 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 50 Algoritmos Hierárquicos Os algoritmos hierárquicos tem uma filosofia diferente dos algoritmos seqüenciais. ao invés de produzir um único agrupamento, eles produzem uma hierarquia de agrupamentos. Considerando um conjunto de vetores d dimensionais a serem agrupados: X = {x i, i=1,2,..., m} Definição de agrupamento: R = {C j, j=1,2,...,m} onde C j X.

51 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 51 Algoritmos Hierárquicos Um agrupamento R 1 contendo k clusters édito aninhado (nested) no agrupamento R 2, o qual contém r (<k) clusters, se: cada cluster em R 1 for um subconjunto de um conjunto em R 2 e pelo menos um cluster de R 1 for um subconjunto próprio de R 2. Neste caso, escrevemos R 1 R 2 Exemplo

52 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 52 Algoritmos Hierárquicos Algoritmos hierárquicos de agrupamento produzem uma hierarquia de agrupamentos aninhados. Estes algoritmos envolvem N passos, ou seja, tantos passos quanto o número de vetores. Em cada passo t, um novo agrupamento é obtido baseando se nos agrupamentos produzidos no passo anterior (t 1).

53 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 53 Hierárquicos Aglomerativos O agrupamento inicial R 0 para o algoritmo aglomerativo consiste de N clusters cada um contendo um único elemento de X. No primeiro passo, o agrupamento R 1 éproduzido. Ele contém N 1 conjuntos, tal que R 0 R 1. Este procedimento continua até o agrupamento final, R N 1 ser obtido, o qual contém um único conjunto, isto é, o conjunto de dados X. A hierarquia dos agrupamentos resultantes é: R 0 R 1 R 2... R N 1

54 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 54 Hierárquicos Aglomerativos

55 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 55 Hierárquicos Aglomerativos

56 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 56 Hierárquicos Aglomerativos

57 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 57 Hierárquicos Aglomerativos Algoritmos aglomerativos baseados na teoria das matrizes MUAS: Matrix Updating Algorithmic Scheme WPGMA: Weighted Pair Group Method Average UPGMA: Unweighted Pair Group Method Average UPGMC: Unweighted Pair Group Method Centroid WPGMC: Weighted Pair Group Method Centroid Ward s Algorithm Referência: S. Theodoridis & K. Koutroumbas, Pattern Recognition, Academic Press, 1999.

58 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 58 Hierárquicos Aglomerativos Algoritmos aglomerativos baseados na teoria dos grafos GTAS: Graph Theory Based Algorithmic Scheme Algoritmos aglomerativos baseados na árvore mínima MST: Minimum Spanning Tree Referência: S. Theodoridis & K. Koutroumbas, Pattern Recognition, Academic Press, 1999.

59 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 59 Hierárquicos Divisivos Os algoritmos divisivos trabalham de maneira inversa. O agrupamento inicial R 0 para o algoritmo divisivo consiste de um único conjunto X. No primeiro passo, o agrupamento R 1 éproduzido. Ele consiste de dois conjuntos tal que R 1 R 2. Este procedimento continua até que o agrupamento final R N 1 seja obtido, o qual contém N conjuntos, cada um consistindo de um único elemento de X. A hierarquia dos agrupamentos resultantes é: R N 1 R N 2... R 0

60 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 60 Hierárquicos Divisivos O método direto considera todas as 2 N 1 1 possíveis partições de X em dois conjuntos e seleciona o ótimo de acordo com um critério pré especificado. Este procedimento é aplicado iterativamente a cada um dos dois conjuntos produzidos no estágio precedente. O agrupamento final consiste de N clusters cada um contendo um único vetor de X.

61 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 61 Hierárquicos Divisivos

62 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 62 Algoritmos Hierárquicos Escolha do melhor número de clusters O problema é identificar o melhor agrupamento dentro de uma dada hierarquia. Isto corresponde a identificação do número de clusters que melhor se ajusta aos dados. Solução: buscar por clusters que tenham um grande tempo de vida em um dendograma de proximidades. Tempo de vida de um cluster: é valor absoluto da diferença entre o nível de proximidade no qual ele é criado e o nível de proximidade no qual ele é absorvido por um cluster maior.

63 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 63 Algoritmos Hierárquicos

64 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 64 Algoritmos Hierárquicos Método Extrínseco requer a determinação do valor de um parâmetro específico, i.e. a definição de uma função h(c) que mede a dissimilaridade entre vetores do mesmo cluster C. Θ :limiar (threshold) apropriado para a h(c) Então o algoritmo termina em R t se C R + : h( C ) j t 1 j > Θ ou seja, R t é o agrupamento final se existir um cluster C em R t+1, com dissimilaridade entre seus vetores h(c) maior do que Θ.

65 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 65 Alessandro L. Koerich Algoritmos Hierárquicos }, ),, ( { ) ( }, ),, ( max{ ) ( 2 1 C y x y x med d C h C y x y x d C h = =

66 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 66 Algoritmos Hierárquicos Método Intrínseco O agrupamento final R t deve satisfazer a seguinte relação: d ss ( min C i, C j ) > max{ h( C ), h( C )}, C, C i j i j R t ou seja, no agrupamento final, a dissimilaridade entre cada par de clusters é maior do que a auto similaridade entre cada um deles.

67 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 67 Algoritmos Baseados em Otimização Baseiam se na otimização de uma função custo J usando diferente técnicas de cálculo. O custo J é uma função dos vetores do conjunto de dados X e ele é parametrizado em termos de um vetor de parâmetros desconhecidos Θ. O número de clusters m assume se como sendo conhecido. Meta: estimação do Θ que melhor caracterize os clusters intrínsecos em X.

68 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 68 Algoritmos Baseados em Otimização Três categorias principais de algoritmos baseados na otimização de uma função custo: Decomposição de misturas Método Fuzzy Métodos Possibilísticos Métodos Hard

69 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 69 Algoritmos Baseados em Otimização Decomposição de Misturas: a função custo é construída com base em vetores aleatórios e a atribuição aos clusters segue argumentos probabilísticos. Método Fuzzy: é definida uma função de proximidade entre um vetor e um cluster e o grau de afiliação (adesão) de um vetor a um cluster é fornecido por um conjunto de funções afiliação.

70 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 70 Algoritmos Baseados em Otimização Métodos Hard Cada vetor pertence exclusivamente a um único cluster. Por isso estes métodos são chamados de hard. A maioria dos algoritmos de clustering mais conhecidos recaem nesta categoria. k Means ou c Means se encaixa nesta categoria!!!

71 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 71 Outros Algoritmos Algoritmos que não podem ser incluídos nas categorias prévias. Algoritmos baseados na teoria dos grafos Algoritmos de aprendizagem competitiva Algoritmos branch and bound Algoritmos baseados em transformações morfológicas Algoritmos baseados em limites entre os clusters Algoritmos de regiões compactas Algoritmos baseados na otimização de funções (annealing) Algoritmos baseados em GA

72 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 72 Validade dos Clusters Existem métodos para avaliar quantitativamente os resultados dos algoritmos de agrupamento. Referência: S. Theodoridis & K. Koutroumbas, Pattern Recognition, Academic Press, 1999.

73 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 73 Resumo Aprendizagem não supervisionada ou clustering (agrupamento) busca extrair informação relevante de dados não rotulados. Uma solução mais geral consiste em definir medidas de similaridade entre dois clusters assim como um critério global como a soma do erro quadrático. Existem vários algoritmos que fazem agrupamento. Os algoritmos de agrupamento são classificados como hierárquicos ou seqüenciais (ou iterativos).

74 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 74 Introdução: Aprendizagem D (exemplos de treinamento) H (conjunto de hipóteses) treinamento Árvore h 1 h 2 h 4 Hipóteses P(h 1 ), P(D h 1 ) P(h 2 ), P(D h 2 ) P(h 3 ), P(D h 3 ) Bayes

75 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 75 Introdução: Classificação x (exemplo de teste) Árvore de Decisão h 1 h 2 h 4 Hipóteses P(h 1 ), P(D h 1 ) P(h 2 ), P(D h 2 ) P(h 3 ), P(D h 3 ) Bayes Valor do Conceito Alvo

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 18 Aprendizado Não-Supervisionado Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor

Leia mais

Redes Neurais (Inteligência Artificial)

Redes Neurais (Inteligência Artificial) Redes Neurais (Inteligência Artificial) Aula 16 Aprendizado Não-Supervisionado Edirlei Soares de Lima Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest

Leia mais

Introdução às Redes Neurais Artificiais

Introdução às Redes Neurais Artificiais Introdução às Redes Neurais Artificiais Clusterização: Conceitos Básicos Prof. João Marcos Meirelles da Silva www.professores.uff.br/jmarcos Departamento de Engenharia de Telecomunicações Escola de Engenharia

Leia mais

Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação

Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Francisco A. Rodrigues Departamento de Matemática Aplicada e Estatística - SME Conceitos básicos Classificação não-supervisionada:

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina André C. P. L. F. de Carvalho Posdoutorando: Isvani Frias-Blanco ICMC-USP Agrupamento de dados Tópicos Agrupamento de dados Dificuldades em agrupamento Algoritmos de agrupamento

Leia mais

Mineração de Dados em Biologia Molecular

Mineração de Dados em Biologia Molecular Mineração de Dados em Biologia Molecular André C. P. L. F. de Carvalho Monitor: Valéria Carvalho Agrupamento de Dados Tópicos Agrupamento de dados Análise de cluster Dificuldades em agrupamento Algoritmos

Leia mais

Análise de Agrupamento. Cluster Analysis

Análise de Agrupamento. Cluster Analysis Análise de Agrupamento Cluster Analysis Objetivo Classificar objetos, itens ou indivíduos de acordo com as suas semelhanças. Os objetos semelhantes são alocados em um mesmo grupo e, portanto, aqueles que

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Aprendizagem Baseada em Instâncias Alessandro L. Koerich Mestrado/Doutorado em Informática (PPGIa) Pontifícia Universidade Católica do Paraná (PUCPR) Mestrado/Doutorado em Informática

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Aprendizagem Baseada em Instâncias Plano de Aula Introdução Espaço

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Problema do Agrupamento Aprendizagem de Máquina Alessandro L. Koerich Seja x = (x 1, x 2,, x d ) um vetor d dimensional de características Seja D um conjunto de x vetores, D = { x(1), x(2),, x(n) } Problema

Leia mais

Clustering (k-means, SOM e hierárquicos)

Clustering (k-means, SOM e hierárquicos) Clustering (k-means, SOM e hierárquicos) André Tavares da Silva andre.silva@udesc.br (Capítulo 10 de Duda e Hart) Clustering Introdução e tipos Roteiro Agrupamentos hierárquicos AGNES, DIANA e Dendogram

Leia mais

Análise Multivariada Aplicada à Contabilidade

Análise Multivariada Aplicada à Contabilidade Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes www.marcelobotelho.com mbotelho@usp.br Turma: 2º / 2016 1 Agenda

Leia mais

Organização. 1. Introdução 2. Medidas de Similaridade. hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters

Organização. 1. Introdução 2. Medidas de Similaridade. hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters Organização. Introdução 2. Medidas de Similaridade 3. Métodos de Agrupamento (métodos hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters Métodos de Partição Cada exemplo

Leia mais

Clustering: k-means e Agglomerative

Clustering: k-means e Agglomerative Tópicos Avançados em Avaliação de Desempenho de Sistemas Jackson Nunes Marco Eugênio Araújo Outubro de 2014 1 Sumário Contextualização Classificação Agrupamento (Clustering) Cenários de Aplicação Clustering

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Alessandro L. Koerich/Alceu S. Britto Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Combinação de Classificadores Filosofia O objetivo

Leia mais

Aprendizado de Máquinas. Introdução à Aprendizado Não- Supervisionado

Aprendizado de Máquinas. Introdução à Aprendizado Não- Supervisionado Universidade Federal do Paraná (UFPR) Departamento de Informática (DInf) Aprendizado de Máquinas Introdução à Aprendizado Não- Supervisionado David Menotti, Ph.D. http://web.inf.ufpr.br/menotti Objetivos

Leia mais

Aula 8 - Reconhecimento e Interpretação. Prof. Adilson Gonzaga

Aula 8 - Reconhecimento e Interpretação. Prof. Adilson Gonzaga Aula 8 - Reconhecimento e Interpretação Prof. Adilson Gonzaga Elementos de Visão Computacional: Visão Computacional Processamento de Baio Nível Processamento de Nível Intermediário Processamento de Alto

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Alessandro L. Koerich Redes Bayesianas Mestrado/Doutorado em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Mestrado/Doutorado em Informática Aprendizagem de Máquina

Leia mais

2 Processo de Agrupamentos

2 Processo de Agrupamentos 20 2 Processo de Agrupamentos A análise de agrupamentos pode ser definida como o processo de determinação de k grupos em um conjunto de dados. Para entender o que isso significa, observe-se a Figura. Y

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Engenharia Elétrica Universidade Federal do Paraná (UFPR) Combinação de Classificadores Filosofia O objetivo da combinação de

Leia mais

Aprendizado de Máquina. Combinando Classificadores

Aprendizado de Máquina. Combinando Classificadores Universidade Federal do Paraná (UFPR) Departamento de Informática (DInf) Aprendizado de Máquina Combinando Classificadores David Menotti, Ph.D. web.inf.ufpr.br/menotti Introdução O uso de vários classificadores

Leia mais

ANÁLISE DE AGRUPAMENTOS

ANÁLISE DE AGRUPAMENTOS ANÁLISE DE AGRUPAMENTOS Análise de Agrupamentos 2 Definição Consistem em encontrar grupos de objetos entre os objetos Categorizá-los ou agrupá-los Tipo de aprendizado não supervisionado Encontrar grupos

Leia mais

Análise de Clusters. Aplicações da formação de Grupos (Clustering)

Análise de Clusters. Aplicações da formação de Grupos (Clustering) Análise de Clusters Aplicações da formação de Grupos (Clustering) Ver e analisar vastas quantidades de dados biológicos como um todo pode ser difícil É mais fácil interpretar os dados se forem divididos

Leia mais

Redes Neurais não Supervisionadas: SOM

Redes Neurais não Supervisionadas: SOM Universidade Federal do Rio Grande do Norte Departamento de Engenharia de Computação e Automação Redes Neurais não Supervisionadas: SOM DCA0121 Inteligência Artificial Aplicada Heitor Medeiros 1 Tópicos

Leia mais

SENSOMETRIA. Adilson dos Anjos. Curitiba, PR 21 de maio de Departamento de Estatística Universidade Federal do Paraná

SENSOMETRIA. Adilson dos Anjos. Curitiba, PR 21 de maio de Departamento de Estatística Universidade Federal do Paraná SENSOMETRIA Adilson dos Anjos Departamento de Estatística Universidade Federal do Paraná aanjos@ufpr.br Curitiba, PR 21 de maio de 2015 1 / 7 SENSOMETRIA SEGMENTAÇÃO 2 / 7 Introdução Análise de agrupamentos->

Leia mais

Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação

Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Francisco A. Rodrigues Departamento de Matemática Aplicada e Estatística - SME Objetivo Dada M classes ω 1, ω 2,..., ω M e um

Leia mais

SEL-0339 Introdução à Visão Computacional. Aula 7 Reconhecimento de Objetos

SEL-0339 Introdução à Visão Computacional. Aula 7 Reconhecimento de Objetos Departamento de Engenharia Elétrica - EESC-USP SEL-0339 Introdução à Visão Computacional Aula 7 Reconhecimento de Objetos Prof. Dr. Marcelo Andrade da Costa Vieira Prof. Dr. Adilson Gonzaga mvieira@sc.usp.br

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Avaliação de Paradigmas Alessandro L. Koerich Mestrado/Doutorado em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Mestrado/Doutorado em Informática Aprendizagem

Leia mais

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Tipos de Aprendizagem. Luiz Eduardo S. Oliveira, Ph.D.

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Tipos de Aprendizagem. Luiz Eduardo S. Oliveira, Ph.D. Universidade Federal do Paraná Departamento de Informática Reconhecimento de Padrões Tipos de Aprendizagem Luiz Eduardo S. Oliveira, Ph.D. http://lesoliveira.net Objetivos Introduzir diferentes tipos de

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Horários Aulas Sala 3 CCET [quinta-feira, 8:20 12:00] Atendimento

Leia mais

SCC5895 Análise de Agrupamento de Dados

SCC5895 Análise de Agrupamento de Dados SCC5895 Análise de Agrupamento de Dados Algoritmos Hierárquicos: Parte II Prof. Ricardo J. G. B. Campello PPG-CCMC / ICMC / USP Créditos Parte do material a seguir consiste de adaptações e extensões dos

Leia mais

Aprendizagem de Dados Simbólicos e/ou Numéricos

Aprendizagem de Dados Simbólicos e/ou Numéricos Aprendizagem de Dados Simbólicos e/ou Numéricos Francisco de A.T. de Carvalo Francisco de A.T. de Carvalo, Agrupamento (Clustering Métodos usados para a construção de grupos de objetos com base nas semelanças

Leia mais

4 Agrupamento de documentos

4 Agrupamento de documentos 4 Agrupamento de documentos É a teoria que decide o que podemos observar. Albert Einstein Um dos métodos mais utilizados de mineração de dados descritiva é conhecido como análise de grupos 23. Com ele,

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Aprendizado não-supervisionado Formação de agrupamentos Aprendizado Não-Supervisionado Classificação supervisionada: discriminar padrões com base num modelo pré-definido de classes.

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCA UFES Departamento de Computação Aprendizado de Máquina Inteligência Artificial Site: http://jeiks.net E-mail: jacsonrcsilva@gmail.com

Leia mais

Paradigmas de Aprendizagem

Paradigmas de Aprendizagem Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCA UFES Departamento de Computação Paradigmas de Aprendizagem Redes Neurais Artificiais Site: http://jeiks.net E-mail: jacsonrcsilva@gmail.com

Leia mais

Clustering - c-means e Self Organizing Maps

Clustering - c-means e Self Organizing Maps - c-means e Self Organizing Maps Sarajane M. Peres e Clodoaldo A. M. Lima 13 de abril de 2015 Material baseado em: HAN, J. & KAMBER, M. Data Mining: Concepts and Techniques. 2nd. 2006 FAUSETT, L. Fundamentals

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCA UFES Departamento de Computação Aprendizado de Máquina Inteligência Artificial Site: http://jeiks.net E-mail: jacsonrcsilva@gmail.com

Leia mais

Reconhecimento de Padrões/Objetos

Reconhecimento de Padrões/Objetos Reconhecimento de Padrões/Objetos André Tavares da Silva andre.silva@udesc.br Capítulo 12 de Gonzales Reconhecimento de Padrões (imagem) Objetivo: Interpretar o conteúdo da imagem através de um mapeamento

Leia mais

Tópicos Avançados em IA. Prof. Eduardo R. Hruschka

Tópicos Avançados em IA. Prof. Eduardo R. Hruschka Tópicos Avançados em IA Prof. Eduardo R. Hruschka Créditos Este material consiste de adaptações dos originais: Elaborados por Eduardo Hruschka e Ricardo Campello de (Tan et al., 2006) de E. Keogh (SBBD

Leia mais

Reconhecimento de Padrões

Reconhecimento de Padrões Reconhecimento de Padrões André Tavares da Silva andre.silva@udesc.br Duda e Hart Capítulo 1 Reconhecimento de Padrões (imagem) Objetivo: Interpretar um conjunto de dados através de um mapeamento (classificação)

Leia mais

3 Técnicas de agrupamento

3 Técnicas de agrupamento 3 Técnicas de agrupamento Com o advento da internet a quantidade de informação disponível aumentou consideravelmente e com isso, tornou-se necessário uma forma automática de organizar e classificar esta

Leia mais

Tópicos em Mineração de Dados

Tópicos em Mineração de Dados Tópicos em Mineração de Dados Descoberta de agrupamentos Método k-médias 1. Introdução A descoberta de agrupamentos é uma tarefa descritiva que procura agrupar dados utilizando a similaridade dos valores

Leia mais

2COP229 Inteligência Computacional. Aula 3. Clusterização.

2COP229 Inteligência Computacional. Aula 3. Clusterização. Aula 3 Clusterização Sumário (Clusterização) - Introdução - Aprendizado Não Supervisionado - Aprendizado Supervisionado - Introdução: Clusterização - Etapas para o processo de Clusterização - Distância

Leia mais

Mineração de Dados. Modelos Descritivos. Descoberta de agrupamentos

Mineração de Dados. Modelos Descritivos. Descoberta de agrupamentos Mineração de Dados Descoberta de agrupamentos Modelos Descritivos tarefa de geração de um modelo descritivo consiste (em grande parte) em analisar os dados do domínio (entradas) e sugerir uma partição

Leia mais

Mapas Auto-Organizáveis de Kohonen (SOM) SOM é uma rede neural artificial (Kohonen (1995))

Mapas Auto-Organizáveis de Kohonen (SOM) SOM é uma rede neural artificial (Kohonen (1995)) Mapas Auto-Organizáveis de Kohonen (SOM) SOM é uma rede neural artificial (Kohonen (1995)) que realiza simultaneamente agrupamento e visualização SOM usa aprendizagem não supervisionada para mapear dados

Leia mais

Aprendizagem de Máquina - 2. Prof. Júlio Cesar Nievola PPGIa - PUCPR

Aprendizagem de Máquina - 2. Prof. Júlio Cesar Nievola PPGIa - PUCPR Aprendizagem de Máquina - 2 Prof. Júlio Cesar Nievola PPGIa - PUCPR Inteligência versus Aprendizado Aprendizado é a chave da superioridade da Inteligência Humana Para que uma máquina tenha Comportamento

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Introdução Aprendizagem de Máquina Para ilustrar a construção de um sistema inteligente, vamos considerar um problema simples, porém interessante. Alessandro L. Koerich Estudo de Caso Suponha que desejamos

Leia mais

A análise de aglomerados

A análise de aglomerados Mais importante do que saber fazer é saber o por quê (Norbert Wiener (1894 1964). Prof. Lorí Viali, Dr. viali@pucrs.br; viali@mat.ufrgs.br; http://www.pucrs.br/famat/viali; http://www.mat.ufrgs.br/~viali/

Leia mais

Descoberta de Conhecimento em Bases de Dados. Pesquisa de Clusters

Descoberta de Conhecimento em Bases de Dados. Pesquisa de Clusters Universidade Técnica de Lisboa INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO Informática e Sistemas de Informação Aplicados em Economia Descoberta de Conhecimento em Bases de Dados. Pesquisa de Clusters Descoberta

Leia mais

PRÁTICA 8. A Distância Euclidiana entre dois vetores n-dimensionais x e y é definida como o escalar: d = norm(x y)

PRÁTICA 8. A Distância Euclidiana entre dois vetores n-dimensionais x e y é definida como o escalar: d = norm(x y) PRÁTICA 8 1) Medidas de Distância. A Distância Euclidiana entre dois vetores n-dimensionais e y é definida como o escalar: d 1 2 2 [( y ) + + ( y ) ] 2 e (, y) = y = y = 1 1 L n n esta epressão é a Norma

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Estudo de Caso Alessandro L. Koerich Mestrado/Doutorado em Informática (PPGIa) Pontifícia Universidade Católica do Paraná (PUCPR) Mestrado/Doutorado em Informática PPGIa 2 Introdução

Leia mais

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica REDES NEURAIS ARTIFICIAIS AULA 03 Prof. Dr. André A. P. Biscaro 1º Semestre de 2017 INTRODUÇÃO Aprendizagem é um processo pelo qual os parâmetros livres de uma rede neural são adaptados através de um processo

Leia mais

Rastreamento de Objetos Baseado em Grafos. Casamento Inexato entre Grafos Relacionais com Atributos

Rastreamento de Objetos Baseado em Grafos. Casamento Inexato entre Grafos Relacionais com Atributos Rastreamento de Objetos Baseado em Casamento Inexato entre Grafos Relacionais com Atributos Exame de Qualificação de Mestrado Ana Beatriz Vicentim Graciano Orientador: Roberto M. Cesar Jr. Colaboradora:

Leia mais

F- Classificação. Banda A

F- Classificação. Banda A F- Classificação Classificação Digital é associar determinado pixel a determinada categoria por meio de critérios estatísticos Banda B? da d b dc Espaço dos Atributos Classes Banda A Classificação: ordenar,

Leia mais

Reconhecimento de Padrões

Reconhecimento de Padrões Reconhecimento de Padrões André Tavares da Silva andre.silva@udesc.br Roteiro da aula Conceitos básicos sobre reconhecimento de padrões Visão geral sobre aprendizado no projeto de classificadores Seleção

Leia mais

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Segmentação. Luiz Eduardo S. Oliveira, Ph.D.

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Segmentação. Luiz Eduardo S. Oliveira, Ph.D. Universidade Federal do Paraná Departamento de Informática Reconhecimento de Padrões Segmentação Luiz Eduardo S. Oliveira, Ph.D. http://lesoliveira.net Objetivos Introduzir os conceitos básicos de segmentação

Leia mais

Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas

Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas Wrapper Filtros Muitos algoritmos de AM são projetados de modo a selecionar os

Leia mais

Aprendizagem de Máquinas

Aprendizagem de Máquinas Universidade Federal do Rio Grande do Norte Departamento de Engenharia de Computação e Automação Aprendizagem de Máquinas DCA0121 Inteligência Artificial Aplicada Heitor Medeiros 1 Aprendizagem de Máquinas

Leia mais

PROCEDIMENTOS NÃO SUPERVISIONADOS E TÉCNICAS DE AGRUPAMENTO (parte 1)

PROCEDIMENTOS NÃO SUPERVISIONADOS E TÉCNICAS DE AGRUPAMENTO (parte 1) PROCEDIMENTOS NÃO SUPERVISIONADOS E TÉCNICAS DE AGRUPAMENTO (parte 1) 1 Procedimentos não supervisionados Não se conhece a classificação das amostras de treinamento Qual é o interesse? 1) Coletar e rotular

Leia mais

Cluster. Larissa Sayuri Futino Castro dos Santos

Cluster. Larissa Sayuri Futino Castro dos Santos Cluster Larissa Sayuri Futino Castro dos Santos Agenda O que faremos Modelos de Mistura LDA Reconhecimento Overview Mét. Particionais E Hierárquicos Melhorias K-Medians K-Medoids K-Modes Mét. Probabilís

Leia mais

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Árvores de Decisão. David Menotti.

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Árvores de Decisão. David Menotti. Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica Árvores de Decisão David Menotti www.inf.ufpr.br/menotti/ci171-182 Árvores de Decisão Agenda Introdução Representação Quando Usar

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina Árvores de Decisão Luiz Eduardo S. Oliveira Universidade Federal do Paraná Departamento de Informática http://lesoliveira.net Luiz S. Oliveira (UFPR) Aprendizado de Máquina 1 / 28

Leia mais

Inteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo]

Inteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo] Inteligência Artificial Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo] Aprendizagem de Máquina Área da Inteligência Artificial cujo objetivo é o desenvolvimento de técnicas computacionais sobre

Leia mais

Profa. Lidia Rodella UFPE-CAA

Profa. Lidia Rodella UFPE-CAA Profa. Lidia Rodella UFPE-CAA O que é estatística? É conjunto de técnicas que permite, de forma sistemática, coletar, organizar, descrever, analisar e interpretar dados oriundos de estudos ou experimentos,

Leia mais

Agrupamento de dados. Critério 1: grupos são concentrações de dados k-means Critério 2: grupos são conjuntos de elementos próximos entre si espectral

Agrupamento de dados. Critério 1: grupos são concentrações de dados k-means Critério 2: grupos são conjuntos de elementos próximos entre si espectral Agrupamento de dados Critério 1: grupos são concentrações de dados k-means Critério 2: grupos são conjuntos de elementos próximos entre si espectral Dados e grafos Se temos dados x i, i 0... n, criamos

Leia mais

Projeções Multi-dimensionais

Projeções Multi-dimensionais Prof. Fernando V. Paulovich http://www.icmc.usp.br/~paulovic paulovic@icmc.usp.br Instituto de Ciências Matemáticas e de Computação (ICMC) Universidade de São Paulo (USP) 23 de setembro de 2010 Introdução

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Apresentação da Disciplina Alessandro L. Koerich 2008 Mestrado e Doutorado em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Mestrado/Doutorado em Informática Aprendizagem

Leia mais

Les-0773: ESTATÍSTICA APLICADA III ANÁLISE DE AGRUPAMENTO. Junho de 2017

Les-0773: ESTATÍSTICA APLICADA III ANÁLISE DE AGRUPAMENTO. Junho de 2017 Les-0773: ESTATÍSTICA APLICADA III ANÁLISE DE AGRUPAMENTO AULA 4 02/06/17 Prof a Lilian M. Lima Cunha Junho de 2017 DEFINIÇÃO Análise de conglomerados (Cluster Analysis) é uma das técnicas de análise multivariada

Leia mais

Reconhecimento de Padrões aplicado à Bioinformática

Reconhecimento de Padrões aplicado à Bioinformática Reconhecimento de Padrões aplicado à Bioinformática Dr. Leandro Carrijo Cintra CNPTIA Embrapa Informática Agropecuária Curso de Verão 2010 Bioinformática USP CNPTIA - Centro Nacional de Pesquisas Tecnológicas

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Plano de Aula Aprendizagem de Máquina Aula 1 Alessandro L. Koerich Introdução Mestrado em Informática Aplicada Pontifícia Universidade Católica do Paraná (PUCPR) Introdução à Aprendizagem de Máquina Por

Leia mais

Trilha Learning Machine Cluster Analysis em 4 passos Marco Siqueira Campos

Trilha Learning Machine Cluster Analysis em 4 passos Marco Siqueira Campos Trilha Learning Machine Cluster Analysis em 4 passos Marco Siqueira Campos Marco Siqueira Campos Sócio fundador Siqueira Campos Associados e sos-stat Estatístico UFRGS Certificado Data Science Specialization

Leia mais

Inteligência nos Negócios (Business Inteligente)

Inteligência nos Negócios (Business Inteligente) Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 7) Fundamentação da disciplina Analise de dados Decisões

Leia mais

Aula 5: k-means. Paulo C. Marques F. 1 de Abril de Aula ministrada no Insper. Insper Aula 5: k-means 1 de Abril de / 19

Aula 5: k-means. Paulo C. Marques F. 1 de Abril de Aula ministrada no Insper. Insper Aula 5: k-means 1 de Abril de / 19 Aula 5: k-means Paulo C. Marques F. Aula ministrada no Insper 1 de Abril de 2016 Insper Aula 5: k-means 1 de Abril de 2016 1 / 19 Aprendizagem não supervisionada Encerramos, por hora, o capítulo sobre

Leia mais

Aula 7 Medidas de Distância. Profa. Elaine Faria UFU

Aula 7 Medidas de Distância. Profa. Elaine Faria UFU Aula 7 Medidas de Distância Profa. Elaine Faria UFU - 2017 Agradecimentos Este material é baseado No livro Tan et al, 2006 Nos slides do prof Andre C. P. L. F. Carvalho Agradecimentos Ao professor André

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Plano da Apresentação Aprendizagem de Máquina Alessandro L. Koerich 2007 Mestrado e Doutorado em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Professor & Experiência Acadêmica Horários

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCENS UFES Departamento de Computação Aprendizado de Máquina Inteligência Artificial Site: http://jeiks.net E-mail: jacsonrcsilva@gmail.com

Leia mais

Análise de dados multivariados I

Análise de dados multivariados I Análise de dados multivariados I Tópico: Análise de Conglomerados ou Agrupamentos (ou ainda, Cluster Analysis) Bibliografia: R.A. Johnson, Applied Multivariate Statistical Analysis, Prentice Hall, 199

Leia mais

Teoria dos Grafos. Árvores Geradoras

Teoria dos Grafos. Árvores Geradoras Teoria dos Grafos Valeriano A. de Oliveira Socorro Rangel Silvio A. de Araujo Departamento de Matemática Aplicada antunes@ibilce.unesp.br, socorro@ibilce.unesp.br, saraujo@ibilce.unesp.br Preparado a partir

Leia mais

Análise de Agrupamento (Cluster analysis)

Análise de Agrupamento (Cluster analysis) Análise de Agrupamento (Cluster analysis) Anderson Rodrigo da Silva 1 Exemplos de aplicações de análise de agrupamento Pesquisas de mercado Agrupamento de cidades-teste Bancos de germoplasma Caracterização

Leia mais

Otimização de horários Seminário. Clarisse Resende 25/01/2013

Otimização de horários Seminário. Clarisse Resende 25/01/2013 Otimização de horários Seminário Clarisse Resende 25/01/2013 O problema dos horários consiste numa sequência de atividades de programação, satisfazendo um conjunto de restrições de recursos. Pretende-se

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Rejeição Introdução Em aplicações reais, sistemas de reconhecimento

Leia mais

Problemas de otimização

Problemas de otimização Problemas de otimização Problemas de decisão: Existe uma solução satisfazendo certa propriedade? Resultado: sim ou não Problemas de otimização: Entre todas as soluções satisfazendo determinada propriedade,

Leia mais

Descoberta de Conhecimento em Bancos de Dados - KDD

Descoberta de Conhecimento em Bancos de Dados - KDD Descoberta de Conhecimento em Bancos de Dados - KDD Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Fases do processo 3. Exemplo do DMC 4. Avaliação

Leia mais

Integração de Mineração de Dados com SGBD Detecção de Agrupamentos

Integração de Mineração de Dados com SGBD Detecção de Agrupamentos Integração de Mineração de Dados com SGBD Detecção de Agrupamentos Centro de Matemática Computação e Cognição-UFABC Jéssica Andressa de Souza Pós-Graduação em Ciência da Computação Sistemas de Banco de

Leia mais

Agrupamento. Algoritmos e aplicações

Agrupamento. Algoritmos e aplicações Agrupamento Algoritmos e aplicações Equipe Bertha Andaluz (bmca) Deborah Mesquita (dhsm) Lucas Lima (lapl) Lucas Tenório (lvt) Roteiro Motivação Métodos de clustering Modelos de clustering Fuzzy clustering

Leia mais

Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação

Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Francisco A. Rodrigues Departamento de Matemática Aplicada e Estatística - SME Tópicos 1. Seleção de atributos 2. Redução de

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina O que é Aprendizado? Memorizar alguma coisa Aprender fatos por meio de observação e exploração Melhorar habilidades motoras/cognitivas por meio de prática Organizar novo conhecimento

Leia mais

Algoritmos de Agrupamento - Aprendizado Não Supervisionado

Algoritmos de Agrupamento - Aprendizado Não Supervisionado Algoritmos de Agrupamento - Aprendizado Não Supervisionado Fabrício Jailson Barth fabricio.barth@gmail.com Agosto de 2016 Sumário Introdução e Definições Aplicações Algoritmos de Agrupamento Agrupamento

Leia mais

Aprendizagem de Máquina. Prof. Júlio Cesar Nievola PPGIA - PUCPR

Aprendizagem de Máquina. Prof. Júlio Cesar Nievola PPGIA - PUCPR Aprendizagem de Máquina Prof. Júlio Cesar Nievola PPGIA - PUCPR Introdução Justificativa Recente progresso em algoritmos e teoria Disponibilidade crescente de dados online Poder computacional disponível

Leia mais

Inteligência Artificial Agrupamento de Dados. prof. Dr. Rogério R. de Vargas. Universidade Estadual de Santa Cruz - UESC. Ilhéus-Ba, Outubro de 2013

Inteligência Artificial Agrupamento de Dados. prof. Dr. Rogério R. de Vargas. Universidade Estadual de Santa Cruz - UESC. Ilhéus-Ba, Outubro de 2013 Inteligência Artificial de prof. Dr. Rogério R. de Vargas Universidade Estadual de Santa Cruz - UESC Ilhéus-Ba, Outubro de 2013 http://rogerio.in slide 1 Introdução http://rogerio.in slide 2 Como agrupar?

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Introdução + Estudo de Caso Introdução Percepção de máquina Um

Leia mais

Agrupamento Espectral e Hierárquico

Agrupamento Espectral e Hierárquico Agrupamento Espectral e Hierárquico Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Agrupamento Espectral 2. Agrupamento Hierárquico 1 Agrupamento Espectral Agrupamento Espectral Nem

Leia mais

Inteligência nos Negócios (Business Inteligente)

Inteligência nos Negócios (Business Inteligente) Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 7) Fundamentação da disciplina Analise de dados Decisões

Leia mais

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica REDES DE FUNÇÃO DE BASE RADIAL - RBF Prof. Dr. André A. P. Biscaro 1º Semestre de 2017 Funções de Base Global Funções de Base Global são usadas pelas redes BP. Estas funções são definidas como funções

Leia mais

CC-226 Aula 05 - Teoria da Decisão Bayesiana

CC-226 Aula 05 - Teoria da Decisão Bayesiana CC-226 Aula 05 - Teoria da Decisão Bayesiana Carlos Henrique Q. Forster - Instituto Tecnológico de Aeronáutica 2008 Classificador Bayesiano Considerando M classes C 1... C M. N observações x j. L atributos

Leia mais

Sumário. RObust Clustering using links ROCK. Thiago F. Covões. Motivação. Motivação. Links. Market basket analys. Motivação

Sumário. RObust Clustering using links ROCK. Thiago F. Covões. Motivação. Motivação. Links. Market basket analys. Motivação Sumário RObust Clustering using links ROCK Thiago F. Covões Motivação Links Função de qualidade Algoritmo Vantagens/Desvantagens SCC5895Análise de Agrupamento de Dados 1 2 Motivação Atributos categóricos/nominais/discretos

Leia mais

MÉTODOS MULTIVARIADOS. Rodrigo A. Scarpel

MÉTODOS MULTIVARIADOS. Rodrigo A. Scarpel MÉTODOS MULTIVARIADOS Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo INTRODUÇÃO Semana Conteúdo Introdução aos métodos multivariados 1 Análise de componentes principais 2 Aplicações de análise

Leia mais