Aprendizagem de Máquina
|
|
- Sarah Alves Gabeira
- 7 Há anos
- Visualizações:
Transcrição
1 Aprendizagem de Máquina Aprendizagem Não Supervisionada Alessandro L. Koerich Mestrado/Doutorado em Informática (PPGIa) Pontifícia Universidade Católica do Paraná (PUCPR)
2 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 2 Plano de Aula Aprendizagem não supervisionada Algoritmos de agrupamento (Clustering) Seqüenciais Hierárquicos Baseados na otimização de funções Outros
3 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 3 Introdução Previamente, todas as amostras de treinamento estavam rotuladas, ou seja, com o valor do conceito alvo associado vetor de atributos 0,43 0,03 0,40 0,19 0,12 0,16 0,04 0,01 0,00 0,01 0,40 0,02 Bart valor do conceito alvo associado ao vetor de atributos Estes exemplos são ditos supervisionados, pois, contém tanto a entrada (atributos), quanto a saída (valor do conceito alvo).
4 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 4 Introdução Porém, muitas vezes temos que lidar com exemplos não supervisionados, isto é, exemplos não rotulados, ou seja: sem um conceito alvo associado ou sem um valor de conceito alvo associado Por que? Coletar e rotular um grande conjunto de exemplos pode custar muito (tempo, esforço, dinheiro).
5 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 5 Introdução Porém, podemos utilizar grandes quantidades de dados não rotulados para treinamento e somente então usar supervisão para rotular os agrupamentos encontrados. Isto é apropriado para aplicações de mineração de dados (datamining), onde o conteúdo de grandes bases de dados não é conhecido antecipadamente.
6 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 6 Introdução Podemos usar métodos não supervisionados para identificar características que serão então úteis para categorização. Podemos ganhar alguma percepção da natureza (ou estrutura) dos dados.
7 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 7 Introdução O interesse principal é desvendar a organização dos padrões em clusters (agrupamentos) consistentes, os quais permitirão descobrir similaridades e diferenças entre padrões bem como derivar conclusões úteis a respeito deles. Clustering = Aprendizagem Não Supervisionada = Aprendizado Sem Professor = Taxonomia Numérica = Tipologia = Partição.
8 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 8 Introdução Exemplo de agrupamentos (clusters) De acordo com a progenitura Existência de pulmões Ambiente onde vivem progenitura e existência de pulmões
9 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 9 Introdução Assumimos que: Todos os padrões são representados em termos de atributos (características ou features) que formam vetores de d dimensões d
10 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 10 Introdução Os passos básicos da tarefa de aprendizagem não supervisionada são: 1. Seleção de atributos 2. Medida de proximidade 3. Critério de agrupamento 4. Algoritmo de agrupamento 5. Verificação dos resultados 6. Interpretação dos resultados
11 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina Seleção de Atributos Atributos devem ser propriamente selecionados para codificar a maior quantidade possível de informações relacionada a tarefa de interesse. Os atributos devem ter também uma redundância mínima entre eles.
12 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina Medida de Proximidade Medida para quantificar quão similar ou dissimilar são dois vetores de atributos. É ideal que todos os atributos contribuam de maneira igual no cálculo da medida de proximidade. Ou seja, que um atributo não seja dominante sobre o outro.
13 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina Critério de Agrupamento Depende da interpretação que o especialista dá ao termo sensível com base no tipo de cluster que são esperados. Por exemplo, um cluster compacto de vetores de atributos pode ser sensível de acordo com um critério enquanto outro cluster alongado, pode ser sensível de acordo com outro critério.
14 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina Algoritmo de Agrupamento Tendo adotado uma medida de proximidade e um critério de agrupamento devemos escolher um algoritmo de clustering que revele a estrutura agrupada do conjunto de dados.
15 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina Validação dos Resultados Uma vez obtidos os resultados do algoritmo de agrupamento, devemos verificar sua correção. Isto geralmente é feito através de testes apropriados.
16 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina Interpretação dos Resultados Em geral os resultados de clustering devem ser integrados com outras evidências experimentais e análise para chegar as conclusões corretas.
17 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 17 Introdução Atenção: Diferentes escolhas de atributos (features), medidas de proximidade, critérios de agrupamento e algoritmos de clustering levam a... resultados totalmente diferentes!!! Qual resultado é correto?
18 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 18 Aplicações de Clustering Quatro direções básicas onde clustering é utilizado: Redução de dados Geração de hipóteses Teste de hipóteses Predição baseada em grupos
19 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 19 Definição de Clustering Dado um conjunto de dados X: X = {x 1, x 2,..., x n } definimos como um m agrupamento de X a partição de X em m conjuntos (clusters ou grupos) C 1, C 2,..., C m tal que as três condições seguintes sejam satisfeitas: C i, i =1,2,..., m Υ m i=1 C i = X Ci C j = i j i, j = 1,2,..., m
20 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 20 Definição de Clustering C i, i =1,2,..., Nenhum cluster pode ser vazio. Υ m i=1 C i = X A união de todos os cluster deve ser igual ao conjunto de dados que gerou os clusters, ou seja, X. Ci C j = i j i, j =1,2,..., m m A união de dois clusters deve ser vazio, i.e., dois cluster não podem conter vetores em comum.
21 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 21 Definição de Clustering Além disso, os vetores contidos em um cluster C i são mais similares uns aos outros e menos similares aos vetores presentes nos outros clusters. Quantificar os termos similar e dissimilar depende dos tipos de clusters. Definição alternativa: Um vetor pode pertencer a mais de um cluster fuzzy clustering
22 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 22 Definição de Clustering
23 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 23 Medidas de Proximidade Medidas de Dissimilaridade (DM) Métrica l p ponderada Métrica Norma l ponderada Métrica l 2 ponderada (Mahalanobis) Métrica l p especial (Manhattan) Distância de Hamming Medidas de Similaridade (SM) Produto interno (inner) Medida de Tanimoto
24 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 24 Medidas de Proximidade Métrica l p ponderada (reais): d 1/ p l p p( x, y) = wi xi yi i= 1 onde x i e y i são as i ésimas coordenadas de x e y, i=1,2,...,l e w i 0 é o i ésimo coeficiente de ponderação. Caso particular: p = 2 Distância Euclidiana.
25 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 25 Alessandro L. Koerich Medidas de Proximidade Métrica Norma l ponderada: Métrica l 2 ponderada: onde B é uma matriz simétrica positiva (Mahalanobis) max ), ( 1 i i i l i y x w y x d = ) ( ) ( ), ( y x B y x y x d T =
26 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 26 Medidas de Proximidade Métrica l p especial: d l 1 ( x, y) = wi xi yi i= 1 é também chamada de norma Manhattan.
27 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 27 Medidas de Proximidade Exemplo:
28 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 28 Alessandro L. Koerich Medidas de Proximidade Produto interno (inner): Medida de Tanimoto: = = = l i i i T inner y x y x y x s 1 ), ( y x y x y x y x s T T T ) ( ) ( 1 1 ), ( + =
29 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 29 Medidas de Proximidade Consideramos agora, vetores x cujas coordenadas pertencem ao conjunto finito F = {0,1,2,..., k 1}, onde k é um inteiro positivo. Existem exatamente k l vetores x F l Estes vetores podem ser considerados como vértices em um grid l dimensional.
30 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 30 Medidas de Proximidade Grid l dimensional.
31 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 31 Medidas de Proximidade Distância de Hamming: d ( x, y) = k 1 k 1 H a ij i= 0 j= 0, j i isto corresponde a soma de todos os elementos fora da diagonal de A, os quais indicam as posições onde x e y diferem.
32 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 32 Medidas de Proximidade Medida de Tanimoto: s T ii i= 1 ( x, y) = k 1 k 1 k 1 k 1 k 1 i= 1 j= 0 a ij + i= 0 k 1 j= 1 a a ij 1 i= 1 k 1 j= 1 a ij Existem ainda diversas outras medidas...
33 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 33 Medidas de Proximidade Vetores com valores discretos e reais
34 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 34 Número de Agrupamentos A melhor maneira de designar quais vetores de atributos x i, i=1, 2,..., N de um conjunto X vetores pertencem a quais clusters seria: identificar todas as partições possíveis e selecionar a mais sensível de acordo com um critério pré estabelecido. Entretanto... fazer isto é muito difícil (trabalhoso!!!)
35 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 35 Número de Agrupamentos Fazendo S (N, m) representar número de todos os clusters possíveis de N vetores em m grupos. As seguintes condições se mantêm... S (N,1) = 1 S (N,N) = 1 S (N,m) = 0, para m > N L 1 k N : lista contendo todos os agrupamentos possíveis de N 1 vetores em k clusters, para k = m, m 1. O N ésimo vetor: ou será adicionado a um cluster de qualquer membro ou formará um novo cluster para cada membro m 1 L N 1 m LN 1
36 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 36 Número de Agrupamentos Solução Números de Stirling: S( N, m) = 1! m m i= 0 ( 1) m i m i i N Exemplo: Para X={x 1, x 2, x 3 }, quais os agrupamentos possíveis dos elementos em 2 clusters? Exemplos numéricos: S (15,3) = S (25,8) = S (100,5) 10 68
37 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 37 Número de Agrupamentos Os resultados anteriores são para um número fixo de clusters, m fixo Para enumerar todos os clusters possíveis para todos os valores possíveis de m computacionalmente intratável Exemplo: 100 objetos, 5 clusters, seg/cluster anos Entretanto, o objetivo é sempre tentar identificar o agrupamento mais sensível ( ou representativo).
38 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 38 Algoritmos de Clustering Objetivo: Encontrar agrupamentos representativos considerando somente uma pequena fração do conjunto contendo todas as partições possíveis de X. Solução: Algoritmos de Clustering Problema: Os resultados dependem: de um algoritmo específico; dos critérios utilizados.
39 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 39 Algoritmos de Clustering O que é um algoritmo de Clustering? É um procedimento de aprendizagem que tenta identificar características específicas dos agrupamentos intrínsecos (ou existentes) em um conjunto de dados. Os algoritmos de clustering podem ser divididos em categorias: Seqüenciais Hierárquicos Baseados na otimização de funções custo Outros: Fuzzy, LVQ, SOM
40 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 40 Algoritmos Seqüenciais Principais características dos algoritmos seqüenciais: Algoritmos desta categoria produzem um único agrupamento. São algoritmo diretos e rápidos. Geralmente, todos os vetores de características são apresentados ao algoritmo uma ou várias vezes (até 5 ou 6 vezes). O resultado final geralmente depende da ordem de apresentação.
41 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 41 Algoritmo BSAS Basic Sequential Algorithmic Scheme (BSAS) Todos os vetores são apresentados uma única vez ao algoritmo. Número de clusters não é conhecido a priori. Novos clusters são criados enquanto o algoritmo evolui.
42 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 42 Algoritmo BSAS Parâmetros do BSAS d (x, C): distância (ou dissimilaridade) entre um vetor de características x e um cluster C. Θ: limiar de dissimilaridade q: número máximo de clusters. m: número de clusters que o algoritmo criou até o momento. Idéia Básica do BSAS: para um dado vetor, designá lo para um cluster existente ou criar um novo cluster (depende da distância entre o vetor e os clusters já formados).
43 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 43 Algoritmo BSAS 2 Esta instrução é ativada nos casos onde cada cluster é representado por um único vetor. Por exemplo, se cada cluster for representado por um vetor médio, ele deve ser atualizado cada vez que um novo vetor se tornar membro do cluster.
44 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 44 Algoritmo BSAS Para estimar o número de clusters, um procedimento auxiliar é utilizado:
45 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 45 Algoritmo BSAS
46 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 46 Melhoramento do Algoritmo BSAS Modified Basic Sequential Algorithmic Scheme (MBSAS) Two Threshold Sequential Algorithmic Scheme (TTSAS) Estes algoritmos possuem estágios de refinamento, isto é: um procedimento de unir clusters um procedimento de re atribuição de vetores aos clusters.
47 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 47 Melhoramento do Algoritmo BSAS Estágio de refinamento: procedimento para unir clusters
48 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 48 Melhoramento do Algoritmo BSAS Estágio de refinamento: procedimento para re atribuição, ou seja, retirar um vetor de um cluster e colocá lo em outro mais próximo.
49 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 49 Algoritmos Hierárquicos Podem ser divididos em 2 subcategorias: Aglomerativos produzem uma seqüência de agrupamentos com um número decrescente de clusters, m a cada passo. Os agrupamentos produzidos em cada passo resultam do anterior pela fusão de dois clusters em um. Divisivos Atuam na direção oposta, isto é, eles produzem uma seqüência de agrupamentos com um número crescente de clusters, m a cada passo. Os agrupamentos produzidos em cada passo resultam da partição de um único cluster em dois.
50 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 50 Algoritmos Hierárquicos Os algoritmos hierárquicos tem uma filosofia diferente dos algoritmos seqüenciais. ao invés de produzir um único agrupamento, eles produzem uma hierarquia de agrupamentos. Considerando um conjunto de vetores d dimensionais a serem agrupados: X = {x i, i=1,2,..., m} Definição de agrupamento: R = {C j, j=1,2,...,m} onde C j X.
51 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 51 Algoritmos Hierárquicos Um agrupamento R 1 contendo k clusters édito aninhado (nested) no agrupamento R 2, o qual contém r (<k) clusters, se: cada cluster em R 1 for um subconjunto de um conjunto em R 2 e pelo menos um cluster de R 1 for um subconjunto próprio de R 2. Neste caso, escrevemos R 1 R 2 Exemplo
52 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 52 Algoritmos Hierárquicos Algoritmos hierárquicos de agrupamento produzem uma hierarquia de agrupamentos aninhados. Estes algoritmos envolvem N passos, ou seja, tantos passos quanto o número de vetores. Em cada passo t, um novo agrupamento é obtido baseando se nos agrupamentos produzidos no passo anterior (t 1).
53 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 53 Hierárquicos Aglomerativos O agrupamento inicial R 0 para o algoritmo aglomerativo consiste de N clusters cada um contendo um único elemento de X. No primeiro passo, o agrupamento R 1 éproduzido. Ele contém N 1 conjuntos, tal que R 0 R 1. Este procedimento continua até o agrupamento final, R N 1 ser obtido, o qual contém um único conjunto, isto é, o conjunto de dados X. A hierarquia dos agrupamentos resultantes é: R 0 R 1 R 2... R N 1
54 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 54 Hierárquicos Aglomerativos
55 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 55 Hierárquicos Aglomerativos
56 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 56 Hierárquicos Aglomerativos
57 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 57 Hierárquicos Aglomerativos Algoritmos aglomerativos baseados na teoria das matrizes MUAS: Matrix Updating Algorithmic Scheme WPGMA: Weighted Pair Group Method Average UPGMA: Unweighted Pair Group Method Average UPGMC: Unweighted Pair Group Method Centroid WPGMC: Weighted Pair Group Method Centroid Ward s Algorithm Referência: S. Theodoridis & K. Koutroumbas, Pattern Recognition, Academic Press, 1999.
58 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 58 Hierárquicos Aglomerativos Algoritmos aglomerativos baseados na teoria dos grafos GTAS: Graph Theory Based Algorithmic Scheme Algoritmos aglomerativos baseados na árvore mínima MST: Minimum Spanning Tree Referência: S. Theodoridis & K. Koutroumbas, Pattern Recognition, Academic Press, 1999.
59 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 59 Hierárquicos Divisivos Os algoritmos divisivos trabalham de maneira inversa. O agrupamento inicial R 0 para o algoritmo divisivo consiste de um único conjunto X. No primeiro passo, o agrupamento R 1 éproduzido. Ele consiste de dois conjuntos tal que R 1 R 2. Este procedimento continua até que o agrupamento final R N 1 seja obtido, o qual contém N conjuntos, cada um consistindo de um único elemento de X. A hierarquia dos agrupamentos resultantes é: R N 1 R N 2... R 0
60 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 60 Hierárquicos Divisivos O método direto considera todas as 2 N 1 1 possíveis partições de X em dois conjuntos e seleciona o ótimo de acordo com um critério pré especificado. Este procedimento é aplicado iterativamente a cada um dos dois conjuntos produzidos no estágio precedente. O agrupamento final consiste de N clusters cada um contendo um único vetor de X.
61 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 61 Hierárquicos Divisivos
62 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 62 Algoritmos Hierárquicos Escolha do melhor número de clusters O problema é identificar o melhor agrupamento dentro de uma dada hierarquia. Isto corresponde a identificação do número de clusters que melhor se ajusta aos dados. Solução: buscar por clusters que tenham um grande tempo de vida em um dendograma de proximidades. Tempo de vida de um cluster: é valor absoluto da diferença entre o nível de proximidade no qual ele é criado e o nível de proximidade no qual ele é absorvido por um cluster maior.
63 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 63 Algoritmos Hierárquicos
64 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 64 Algoritmos Hierárquicos Método Extrínseco requer a determinação do valor de um parâmetro específico, i.e. a definição de uma função h(c) que mede a dissimilaridade entre vetores do mesmo cluster C. Θ :limiar (threshold) apropriado para a h(c) Então o algoritmo termina em R t se C R + : h( C ) j t 1 j > Θ ou seja, R t é o agrupamento final se existir um cluster C em R t+1, com dissimilaridade entre seus vetores h(c) maior do que Θ.
65 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 65 Alessandro L. Koerich Algoritmos Hierárquicos }, ),, ( { ) ( }, ),, ( max{ ) ( 2 1 C y x y x med d C h C y x y x d C h = =
66 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 66 Algoritmos Hierárquicos Método Intrínseco O agrupamento final R t deve satisfazer a seguinte relação: d ss ( min C i, C j ) > max{ h( C ), h( C )}, C, C i j i j R t ou seja, no agrupamento final, a dissimilaridade entre cada par de clusters é maior do que a auto similaridade entre cada um deles.
67 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 67 Algoritmos Baseados em Otimização Baseiam se na otimização de uma função custo J usando diferente técnicas de cálculo. O custo J é uma função dos vetores do conjunto de dados X e ele é parametrizado em termos de um vetor de parâmetros desconhecidos Θ. O número de clusters m assume se como sendo conhecido. Meta: estimação do Θ que melhor caracterize os clusters intrínsecos em X.
68 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 68 Algoritmos Baseados em Otimização Três categorias principais de algoritmos baseados na otimização de uma função custo: Decomposição de misturas Método Fuzzy Métodos Possibilísticos Métodos Hard
69 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 69 Algoritmos Baseados em Otimização Decomposição de Misturas: a função custo é construída com base em vetores aleatórios e a atribuição aos clusters segue argumentos probabilísticos. Método Fuzzy: é definida uma função de proximidade entre um vetor e um cluster e o grau de afiliação (adesão) de um vetor a um cluster é fornecido por um conjunto de funções afiliação.
70 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 70 Algoritmos Baseados em Otimização Métodos Hard Cada vetor pertence exclusivamente a um único cluster. Por isso estes métodos são chamados de hard. A maioria dos algoritmos de clustering mais conhecidos recaem nesta categoria. k Means ou c Means se encaixa nesta categoria!!!
71 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 71 Outros Algoritmos Algoritmos que não podem ser incluídos nas categorias prévias. Algoritmos baseados na teoria dos grafos Algoritmos de aprendizagem competitiva Algoritmos branch and bound Algoritmos baseados em transformações morfológicas Algoritmos baseados em limites entre os clusters Algoritmos de regiões compactas Algoritmos baseados na otimização de funções (annealing) Algoritmos baseados em GA
72 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 72 Validade dos Clusters Existem métodos para avaliar quantitativamente os resultados dos algoritmos de agrupamento. Referência: S. Theodoridis & K. Koutroumbas, Pattern Recognition, Academic Press, 1999.
73 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 73 Resumo Aprendizagem não supervisionada ou clustering (agrupamento) busca extrair informação relevante de dados não rotulados. Uma solução mais geral consiste em definir medidas de similaridade entre dois clusters assim como um critério global como a soma do erro quadrático. Existem vários algoritmos que fazem agrupamento. Os algoritmos de agrupamento são classificados como hierárquicos ou seqüenciais (ou iterativos).
74 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 74 Introdução: Aprendizagem D (exemplos de treinamento) H (conjunto de hipóteses) treinamento Árvore h 1 h 2 h 4 Hipóteses P(h 1 ), P(D h 1 ) P(h 2 ), P(D h 2 ) P(h 3 ), P(D h 3 ) Bayes
75 Mestrado/Doutorado em Informática (PPGIa) Aprendizagem de Máquina 75 Introdução: Classificação x (exemplo de teste) Árvore de Decisão h 1 h 2 h 4 Hipóteses P(h 1 ), P(D h 1 ) P(h 2 ), P(D h 2 ) P(h 3 ), P(D h 3 ) Bayes Valor do Conceito Alvo
INF 1771 Inteligência Artificial
Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 18 Aprendizado Não-Supervisionado Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor
Leia maisRedes Neurais (Inteligência Artificial)
Redes Neurais (Inteligência Artificial) Aula 16 Aprendizado Não-Supervisionado Edirlei Soares de Lima Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest
Leia maisIntrodução às Redes Neurais Artificiais
Introdução às Redes Neurais Artificiais Clusterização: Conceitos Básicos Prof. João Marcos Meirelles da Silva www.professores.uff.br/jmarcos Departamento de Engenharia de Telecomunicações Escola de Engenharia
Leia maisUniversidade de São Paulo Instituto de Ciências Matemáticas e de Computação
Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Francisco A. Rodrigues Departamento de Matemática Aplicada e Estatística - SME Conceitos básicos Classificação não-supervisionada:
Leia maisAprendizado de Máquina
Aprendizado de Máquina André C. P. L. F. de Carvalho Posdoutorando: Isvani Frias-Blanco ICMC-USP Agrupamento de dados Tópicos Agrupamento de dados Dificuldades em agrupamento Algoritmos de agrupamento
Leia maisMineração de Dados em Biologia Molecular
Mineração de Dados em Biologia Molecular André C. P. L. F. de Carvalho Monitor: Valéria Carvalho Agrupamento de Dados Tópicos Agrupamento de dados Análise de cluster Dificuldades em agrupamento Algoritmos
Leia maisAnálise de Agrupamento. Cluster Analysis
Análise de Agrupamento Cluster Analysis Objetivo Classificar objetos, itens ou indivíduos de acordo com as suas semelhanças. Os objetos semelhantes são alocados em um mesmo grupo e, portanto, aqueles que
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Aprendizagem Baseada em Instâncias Alessandro L. Koerich Mestrado/Doutorado em Informática (PPGIa) Pontifícia Universidade Católica do Paraná (PUCPR) Mestrado/Doutorado em Informática
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Aprendizagem Baseada em Instâncias Plano de Aula Introdução Espaço
Leia maisAprendizagem de Máquina
Problema do Agrupamento Aprendizagem de Máquina Alessandro L. Koerich Seja x = (x 1, x 2,, x d ) um vetor d dimensional de características Seja D um conjunto de x vetores, D = { x(1), x(2),, x(n) } Problema
Leia maisClustering (k-means, SOM e hierárquicos)
Clustering (k-means, SOM e hierárquicos) André Tavares da Silva andre.silva@udesc.br (Capítulo 10 de Duda e Hart) Clustering Introdução e tipos Roteiro Agrupamentos hierárquicos AGNES, DIANA e Dendogram
Leia maisAnálise Multivariada Aplicada à Contabilidade
Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes www.marcelobotelho.com mbotelho@usp.br Turma: 2º / 2016 1 Agenda
Leia maisOrganização. 1. Introdução 2. Medidas de Similaridade. hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters
Organização. Introdução 2. Medidas de Similaridade 3. Métodos de Agrupamento (métodos hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters Métodos de Partição Cada exemplo
Leia maisClustering: k-means e Agglomerative
Tópicos Avançados em Avaliação de Desempenho de Sistemas Jackson Nunes Marco Eugênio Araújo Outubro de 2014 1 Sumário Contextualização Classificação Agrupamento (Clustering) Cenários de Aplicação Clustering
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Alessandro L. Koerich/Alceu S. Britto Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Combinação de Classificadores Filosofia O objetivo
Leia maisAprendizado de Máquinas. Introdução à Aprendizado Não- Supervisionado
Universidade Federal do Paraná (UFPR) Departamento de Informática (DInf) Aprendizado de Máquinas Introdução à Aprendizado Não- Supervisionado David Menotti, Ph.D. http://web.inf.ufpr.br/menotti Objetivos
Leia maisAula 8 - Reconhecimento e Interpretação. Prof. Adilson Gonzaga
Aula 8 - Reconhecimento e Interpretação Prof. Adilson Gonzaga Elementos de Visão Computacional: Visão Computacional Processamento de Baio Nível Processamento de Nível Intermediário Processamento de Alto
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Alessandro L. Koerich Redes Bayesianas Mestrado/Doutorado em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Mestrado/Doutorado em Informática Aprendizagem de Máquina
Leia mais2 Processo de Agrupamentos
20 2 Processo de Agrupamentos A análise de agrupamentos pode ser definida como o processo de determinação de k grupos em um conjunto de dados. Para entender o que isso significa, observe-se a Figura. Y
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Engenharia Elétrica Universidade Federal do Paraná (UFPR) Combinação de Classificadores Filosofia O objetivo da combinação de
Leia maisAprendizado de Máquina. Combinando Classificadores
Universidade Federal do Paraná (UFPR) Departamento de Informática (DInf) Aprendizado de Máquina Combinando Classificadores David Menotti, Ph.D. web.inf.ufpr.br/menotti Introdução O uso de vários classificadores
Leia maisANÁLISE DE AGRUPAMENTOS
ANÁLISE DE AGRUPAMENTOS Análise de Agrupamentos 2 Definição Consistem em encontrar grupos de objetos entre os objetos Categorizá-los ou agrupá-los Tipo de aprendizado não supervisionado Encontrar grupos
Leia maisAnálise de Clusters. Aplicações da formação de Grupos (Clustering)
Análise de Clusters Aplicações da formação de Grupos (Clustering) Ver e analisar vastas quantidades de dados biológicos como um todo pode ser difícil É mais fácil interpretar os dados se forem divididos
Leia maisRedes Neurais não Supervisionadas: SOM
Universidade Federal do Rio Grande do Norte Departamento de Engenharia de Computação e Automação Redes Neurais não Supervisionadas: SOM DCA0121 Inteligência Artificial Aplicada Heitor Medeiros 1 Tópicos
Leia maisSENSOMETRIA. Adilson dos Anjos. Curitiba, PR 21 de maio de Departamento de Estatística Universidade Federal do Paraná
SENSOMETRIA Adilson dos Anjos Departamento de Estatística Universidade Federal do Paraná aanjos@ufpr.br Curitiba, PR 21 de maio de 2015 1 / 7 SENSOMETRIA SEGMENTAÇÃO 2 / 7 Introdução Análise de agrupamentos->
Leia maisUniversidade de São Paulo Instituto de Ciências Matemáticas e de Computação
Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Francisco A. Rodrigues Departamento de Matemática Aplicada e Estatística - SME Objetivo Dada M classes ω 1, ω 2,..., ω M e um
Leia maisSEL-0339 Introdução à Visão Computacional. Aula 7 Reconhecimento de Objetos
Departamento de Engenharia Elétrica - EESC-USP SEL-0339 Introdução à Visão Computacional Aula 7 Reconhecimento de Objetos Prof. Dr. Marcelo Andrade da Costa Vieira Prof. Dr. Adilson Gonzaga mvieira@sc.usp.br
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Avaliação de Paradigmas Alessandro L. Koerich Mestrado/Doutorado em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Mestrado/Doutorado em Informática Aprendizagem
Leia maisUniversidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Tipos de Aprendizagem. Luiz Eduardo S. Oliveira, Ph.D.
Universidade Federal do Paraná Departamento de Informática Reconhecimento de Padrões Tipos de Aprendizagem Luiz Eduardo S. Oliveira, Ph.D. http://lesoliveira.net Objetivos Introduzir diferentes tipos de
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Horários Aulas Sala 3 CCET [quinta-feira, 8:20 12:00] Atendimento
Leia maisSCC5895 Análise de Agrupamento de Dados
SCC5895 Análise de Agrupamento de Dados Algoritmos Hierárquicos: Parte II Prof. Ricardo J. G. B. Campello PPG-CCMC / ICMC / USP Créditos Parte do material a seguir consiste de adaptações e extensões dos
Leia maisAprendizagem de Dados Simbólicos e/ou Numéricos
Aprendizagem de Dados Simbólicos e/ou Numéricos Francisco de A.T. de Carvalo Francisco de A.T. de Carvalo, Agrupamento (Clustering Métodos usados para a construção de grupos de objetos com base nas semelanças
Leia mais4 Agrupamento de documentos
4 Agrupamento de documentos É a teoria que decide o que podemos observar. Albert Einstein Um dos métodos mais utilizados de mineração de dados descritiva é conhecido como análise de grupos 23. Com ele,
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Aprendizado não-supervisionado Formação de agrupamentos Aprendizado Não-Supervisionado Classificação supervisionada: discriminar padrões com base num modelo pré-definido de classes.
Leia maisAprendizado de Máquina
Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCA UFES Departamento de Computação Aprendizado de Máquina Inteligência Artificial Site: http://jeiks.net E-mail: jacsonrcsilva@gmail.com
Leia maisParadigmas de Aprendizagem
Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCA UFES Departamento de Computação Paradigmas de Aprendizagem Redes Neurais Artificiais Site: http://jeiks.net E-mail: jacsonrcsilva@gmail.com
Leia maisClustering - c-means e Self Organizing Maps
- c-means e Self Organizing Maps Sarajane M. Peres e Clodoaldo A. M. Lima 13 de abril de 2015 Material baseado em: HAN, J. & KAMBER, M. Data Mining: Concepts and Techniques. 2nd. 2006 FAUSETT, L. Fundamentals
Leia maisAprendizado de Máquina
Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCA UFES Departamento de Computação Aprendizado de Máquina Inteligência Artificial Site: http://jeiks.net E-mail: jacsonrcsilva@gmail.com
Leia maisReconhecimento de Padrões/Objetos
Reconhecimento de Padrões/Objetos André Tavares da Silva andre.silva@udesc.br Capítulo 12 de Gonzales Reconhecimento de Padrões (imagem) Objetivo: Interpretar o conteúdo da imagem através de um mapeamento
Leia maisTópicos Avançados em IA. Prof. Eduardo R. Hruschka
Tópicos Avançados em IA Prof. Eduardo R. Hruschka Créditos Este material consiste de adaptações dos originais: Elaborados por Eduardo Hruschka e Ricardo Campello de (Tan et al., 2006) de E. Keogh (SBBD
Leia maisReconhecimento de Padrões
Reconhecimento de Padrões André Tavares da Silva andre.silva@udesc.br Duda e Hart Capítulo 1 Reconhecimento de Padrões (imagem) Objetivo: Interpretar um conjunto de dados através de um mapeamento (classificação)
Leia mais3 Técnicas de agrupamento
3 Técnicas de agrupamento Com o advento da internet a quantidade de informação disponível aumentou consideravelmente e com isso, tornou-se necessário uma forma automática de organizar e classificar esta
Leia maisTópicos em Mineração de Dados
Tópicos em Mineração de Dados Descoberta de agrupamentos Método k-médias 1. Introdução A descoberta de agrupamentos é uma tarefa descritiva que procura agrupar dados utilizando a similaridade dos valores
Leia mais2COP229 Inteligência Computacional. Aula 3. Clusterização.
Aula 3 Clusterização Sumário (Clusterização) - Introdução - Aprendizado Não Supervisionado - Aprendizado Supervisionado - Introdução: Clusterização - Etapas para o processo de Clusterização - Distância
Leia maisMineração de Dados. Modelos Descritivos. Descoberta de agrupamentos
Mineração de Dados Descoberta de agrupamentos Modelos Descritivos tarefa de geração de um modelo descritivo consiste (em grande parte) em analisar os dados do domínio (entradas) e sugerir uma partição
Leia maisMapas Auto-Organizáveis de Kohonen (SOM) SOM é uma rede neural artificial (Kohonen (1995))
Mapas Auto-Organizáveis de Kohonen (SOM) SOM é uma rede neural artificial (Kohonen (1995)) que realiza simultaneamente agrupamento e visualização SOM usa aprendizagem não supervisionada para mapear dados
Leia maisAprendizagem de Máquina - 2. Prof. Júlio Cesar Nievola PPGIa - PUCPR
Aprendizagem de Máquina - 2 Prof. Júlio Cesar Nievola PPGIa - PUCPR Inteligência versus Aprendizado Aprendizado é a chave da superioridade da Inteligência Humana Para que uma máquina tenha Comportamento
Leia maisAprendizagem de Máquina
Introdução Aprendizagem de Máquina Para ilustrar a construção de um sistema inteligente, vamos considerar um problema simples, porém interessante. Alessandro L. Koerich Estudo de Caso Suponha que desejamos
Leia maisA análise de aglomerados
Mais importante do que saber fazer é saber o por quê (Norbert Wiener (1894 1964). Prof. Lorí Viali, Dr. viali@pucrs.br; viali@mat.ufrgs.br; http://www.pucrs.br/famat/viali; http://www.mat.ufrgs.br/~viali/
Leia maisDescoberta de Conhecimento em Bases de Dados. Pesquisa de Clusters
Universidade Técnica de Lisboa INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO Informática e Sistemas de Informação Aplicados em Economia Descoberta de Conhecimento em Bases de Dados. Pesquisa de Clusters Descoberta
Leia maisPRÁTICA 8. A Distância Euclidiana entre dois vetores n-dimensionais x e y é definida como o escalar: d = norm(x y)
PRÁTICA 8 1) Medidas de Distância. A Distância Euclidiana entre dois vetores n-dimensionais e y é definida como o escalar: d 1 2 2 [( y ) + + ( y ) ] 2 e (, y) = y = y = 1 1 L n n esta epressão é a Norma
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Estudo de Caso Alessandro L. Koerich Mestrado/Doutorado em Informática (PPGIa) Pontifícia Universidade Católica do Paraná (PUCPR) Mestrado/Doutorado em Informática PPGIa 2 Introdução
Leia maisUNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica
REDES NEURAIS ARTIFICIAIS AULA 03 Prof. Dr. André A. P. Biscaro 1º Semestre de 2017 INTRODUÇÃO Aprendizagem é um processo pelo qual os parâmetros livres de uma rede neural são adaptados através de um processo
Leia maisRastreamento de Objetos Baseado em Grafos. Casamento Inexato entre Grafos Relacionais com Atributos
Rastreamento de Objetos Baseado em Casamento Inexato entre Grafos Relacionais com Atributos Exame de Qualificação de Mestrado Ana Beatriz Vicentim Graciano Orientador: Roberto M. Cesar Jr. Colaboradora:
Leia maisF- Classificação. Banda A
F- Classificação Classificação Digital é associar determinado pixel a determinada categoria por meio de critérios estatísticos Banda B? da d b dc Espaço dos Atributos Classes Banda A Classificação: ordenar,
Leia maisReconhecimento de Padrões
Reconhecimento de Padrões André Tavares da Silva andre.silva@udesc.br Roteiro da aula Conceitos básicos sobre reconhecimento de padrões Visão geral sobre aprendizado no projeto de classificadores Seleção
Leia maisUniversidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Segmentação. Luiz Eduardo S. Oliveira, Ph.D.
Universidade Federal do Paraná Departamento de Informática Reconhecimento de Padrões Segmentação Luiz Eduardo S. Oliveira, Ph.D. http://lesoliveira.net Objetivos Introduzir os conceitos básicos de segmentação
Leia maisPor que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas
Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas Wrapper Filtros Muitos algoritmos de AM são projetados de modo a selecionar os
Leia maisAprendizagem de Máquinas
Universidade Federal do Rio Grande do Norte Departamento de Engenharia de Computação e Automação Aprendizagem de Máquinas DCA0121 Inteligência Artificial Aplicada Heitor Medeiros 1 Aprendizagem de Máquinas
Leia maisPROCEDIMENTOS NÃO SUPERVISIONADOS E TÉCNICAS DE AGRUPAMENTO (parte 1)
PROCEDIMENTOS NÃO SUPERVISIONADOS E TÉCNICAS DE AGRUPAMENTO (parte 1) 1 Procedimentos não supervisionados Não se conhece a classificação das amostras de treinamento Qual é o interesse? 1) Coletar e rotular
Leia maisCluster. Larissa Sayuri Futino Castro dos Santos
Cluster Larissa Sayuri Futino Castro dos Santos Agenda O que faremos Modelos de Mistura LDA Reconhecimento Overview Mét. Particionais E Hierárquicos Melhorias K-Medians K-Medoids K-Modes Mét. Probabilís
Leia maisUniversidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Árvores de Decisão. David Menotti.
Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica Árvores de Decisão David Menotti www.inf.ufpr.br/menotti/ci171-182 Árvores de Decisão Agenda Introdução Representação Quando Usar
Leia maisAprendizado de Máquina
Aprendizado de Máquina Árvores de Decisão Luiz Eduardo S. Oliveira Universidade Federal do Paraná Departamento de Informática http://lesoliveira.net Luiz S. Oliveira (UFPR) Aprendizado de Máquina 1 / 28
Leia maisInteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo]
Inteligência Artificial Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo] Aprendizagem de Máquina Área da Inteligência Artificial cujo objetivo é o desenvolvimento de técnicas computacionais sobre
Leia maisProfa. Lidia Rodella UFPE-CAA
Profa. Lidia Rodella UFPE-CAA O que é estatística? É conjunto de técnicas que permite, de forma sistemática, coletar, organizar, descrever, analisar e interpretar dados oriundos de estudos ou experimentos,
Leia maisAgrupamento de dados. Critério 1: grupos são concentrações de dados k-means Critério 2: grupos são conjuntos de elementos próximos entre si espectral
Agrupamento de dados Critério 1: grupos são concentrações de dados k-means Critério 2: grupos são conjuntos de elementos próximos entre si espectral Dados e grafos Se temos dados x i, i 0... n, criamos
Leia maisProjeções Multi-dimensionais
Prof. Fernando V. Paulovich http://www.icmc.usp.br/~paulovic paulovic@icmc.usp.br Instituto de Ciências Matemáticas e de Computação (ICMC) Universidade de São Paulo (USP) 23 de setembro de 2010 Introdução
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Apresentação da Disciplina Alessandro L. Koerich 2008 Mestrado e Doutorado em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Mestrado/Doutorado em Informática Aprendizagem
Leia maisLes-0773: ESTATÍSTICA APLICADA III ANÁLISE DE AGRUPAMENTO. Junho de 2017
Les-0773: ESTATÍSTICA APLICADA III ANÁLISE DE AGRUPAMENTO AULA 4 02/06/17 Prof a Lilian M. Lima Cunha Junho de 2017 DEFINIÇÃO Análise de conglomerados (Cluster Analysis) é uma das técnicas de análise multivariada
Leia maisReconhecimento de Padrões aplicado à Bioinformática
Reconhecimento de Padrões aplicado à Bioinformática Dr. Leandro Carrijo Cintra CNPTIA Embrapa Informática Agropecuária Curso de Verão 2010 Bioinformática USP CNPTIA - Centro Nacional de Pesquisas Tecnológicas
Leia maisAprendizagem de Máquina
Plano de Aula Aprendizagem de Máquina Aula 1 Alessandro L. Koerich Introdução Mestrado em Informática Aplicada Pontifícia Universidade Católica do Paraná (PUCPR) Introdução à Aprendizagem de Máquina Por
Leia maisTrilha Learning Machine Cluster Analysis em 4 passos Marco Siqueira Campos
Trilha Learning Machine Cluster Analysis em 4 passos Marco Siqueira Campos Marco Siqueira Campos Sócio fundador Siqueira Campos Associados e sos-stat Estatístico UFRGS Certificado Data Science Specialization
Leia maisInteligência nos Negócios (Business Inteligente)
Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 7) Fundamentação da disciplina Analise de dados Decisões
Leia maisAula 5: k-means. Paulo C. Marques F. 1 de Abril de Aula ministrada no Insper. Insper Aula 5: k-means 1 de Abril de / 19
Aula 5: k-means Paulo C. Marques F. Aula ministrada no Insper 1 de Abril de 2016 Insper Aula 5: k-means 1 de Abril de 2016 1 / 19 Aprendizagem não supervisionada Encerramos, por hora, o capítulo sobre
Leia maisAula 7 Medidas de Distância. Profa. Elaine Faria UFU
Aula 7 Medidas de Distância Profa. Elaine Faria UFU - 2017 Agradecimentos Este material é baseado No livro Tan et al, 2006 Nos slides do prof Andre C. P. L. F. Carvalho Agradecimentos Ao professor André
Leia maisAprendizagem de Máquina
Plano da Apresentação Aprendizagem de Máquina Alessandro L. Koerich 2007 Mestrado e Doutorado em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Professor & Experiência Acadêmica Horários
Leia maisAprendizado de Máquina
Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCENS UFES Departamento de Computação Aprendizado de Máquina Inteligência Artificial Site: http://jeiks.net E-mail: jacsonrcsilva@gmail.com
Leia maisAnálise de dados multivariados I
Análise de dados multivariados I Tópico: Análise de Conglomerados ou Agrupamentos (ou ainda, Cluster Analysis) Bibliografia: R.A. Johnson, Applied Multivariate Statistical Analysis, Prentice Hall, 199
Leia maisTeoria dos Grafos. Árvores Geradoras
Teoria dos Grafos Valeriano A. de Oliveira Socorro Rangel Silvio A. de Araujo Departamento de Matemática Aplicada antunes@ibilce.unesp.br, socorro@ibilce.unesp.br, saraujo@ibilce.unesp.br Preparado a partir
Leia maisAnálise de Agrupamento (Cluster analysis)
Análise de Agrupamento (Cluster analysis) Anderson Rodrigo da Silva 1 Exemplos de aplicações de análise de agrupamento Pesquisas de mercado Agrupamento de cidades-teste Bancos de germoplasma Caracterização
Leia maisOtimização de horários Seminário. Clarisse Resende 25/01/2013
Otimização de horários Seminário Clarisse Resende 25/01/2013 O problema dos horários consiste numa sequência de atividades de programação, satisfazendo um conjunto de restrições de recursos. Pretende-se
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Rejeição Introdução Em aplicações reais, sistemas de reconhecimento
Leia maisProblemas de otimização
Problemas de otimização Problemas de decisão: Existe uma solução satisfazendo certa propriedade? Resultado: sim ou não Problemas de otimização: Entre todas as soluções satisfazendo determinada propriedade,
Leia maisDescoberta de Conhecimento em Bancos de Dados - KDD
Descoberta de Conhecimento em Bancos de Dados - KDD Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Fases do processo 3. Exemplo do DMC 4. Avaliação
Leia maisIntegração de Mineração de Dados com SGBD Detecção de Agrupamentos
Integração de Mineração de Dados com SGBD Detecção de Agrupamentos Centro de Matemática Computação e Cognição-UFABC Jéssica Andressa de Souza Pós-Graduação em Ciência da Computação Sistemas de Banco de
Leia maisAgrupamento. Algoritmos e aplicações
Agrupamento Algoritmos e aplicações Equipe Bertha Andaluz (bmca) Deborah Mesquita (dhsm) Lucas Lima (lapl) Lucas Tenório (lvt) Roteiro Motivação Métodos de clustering Modelos de clustering Fuzzy clustering
Leia maisUniversidade de São Paulo Instituto de Ciências Matemáticas e de Computação
Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Francisco A. Rodrigues Departamento de Matemática Aplicada e Estatística - SME Tópicos 1. Seleção de atributos 2. Redução de
Leia maisAprendizado de Máquina
Aprendizado de Máquina O que é Aprendizado? Memorizar alguma coisa Aprender fatos por meio de observação e exploração Melhorar habilidades motoras/cognitivas por meio de prática Organizar novo conhecimento
Leia maisAlgoritmos de Agrupamento - Aprendizado Não Supervisionado
Algoritmos de Agrupamento - Aprendizado Não Supervisionado Fabrício Jailson Barth fabricio.barth@gmail.com Agosto de 2016 Sumário Introdução e Definições Aplicações Algoritmos de Agrupamento Agrupamento
Leia maisAprendizagem de Máquina. Prof. Júlio Cesar Nievola PPGIA - PUCPR
Aprendizagem de Máquina Prof. Júlio Cesar Nievola PPGIA - PUCPR Introdução Justificativa Recente progresso em algoritmos e teoria Disponibilidade crescente de dados online Poder computacional disponível
Leia maisInteligência Artificial Agrupamento de Dados. prof. Dr. Rogério R. de Vargas. Universidade Estadual de Santa Cruz - UESC. Ilhéus-Ba, Outubro de 2013
Inteligência Artificial de prof. Dr. Rogério R. de Vargas Universidade Estadual de Santa Cruz - UESC Ilhéus-Ba, Outubro de 2013 http://rogerio.in slide 1 Introdução http://rogerio.in slide 2 Como agrupar?
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Introdução + Estudo de Caso Introdução Percepção de máquina Um
Leia maisAgrupamento Espectral e Hierárquico
Agrupamento Espectral e Hierárquico Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Agrupamento Espectral 2. Agrupamento Hierárquico 1 Agrupamento Espectral Agrupamento Espectral Nem
Leia maisInteligência nos Negócios (Business Inteligente)
Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 7) Fundamentação da disciplina Analise de dados Decisões
Leia maisUNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica
REDES DE FUNÇÃO DE BASE RADIAL - RBF Prof. Dr. André A. P. Biscaro 1º Semestre de 2017 Funções de Base Global Funções de Base Global são usadas pelas redes BP. Estas funções são definidas como funções
Leia maisCC-226 Aula 05 - Teoria da Decisão Bayesiana
CC-226 Aula 05 - Teoria da Decisão Bayesiana Carlos Henrique Q. Forster - Instituto Tecnológico de Aeronáutica 2008 Classificador Bayesiano Considerando M classes C 1... C M. N observações x j. L atributos
Leia maisSumário. RObust Clustering using links ROCK. Thiago F. Covões. Motivação. Motivação. Links. Market basket analys. Motivação
Sumário RObust Clustering using links ROCK Thiago F. Covões Motivação Links Função de qualidade Algoritmo Vantagens/Desvantagens SCC5895Análise de Agrupamento de Dados 1 2 Motivação Atributos categóricos/nominais/discretos
Leia maisMÉTODOS MULTIVARIADOS. Rodrigo A. Scarpel
MÉTODOS MULTIVARIADOS Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo INTRODUÇÃO Semana Conteúdo Introdução aos métodos multivariados 1 Análise de componentes principais 2 Aplicações de análise
Leia mais