Aprendizado Não-Supervisionado
|
|
|
- Maria das Neves Marques
- 7 Há anos
- Visualizações:
Transcrição
1 Aprendizado Não-Supervisionado Fabrício Olivetti de França Universidade Federal do ABC
2 Tópicos 1. Aprendizado Não-Supervisionado 2. Agrupamento de Dados 1
3 Aprendizado Não-Supervisionado
4 Aprendizado Não-Supervisionado Muitas vezes não temos um rótulo pré-definido que queremos extrair de nossos dados. Contagem? 1 e 2 Tipo? 2
5 Aprendizado Não-Supervisionado O aprendizado não-supervisionado especifica as técnicas para extrair conhecimento de um conjunto de dados sem que tenhamos: Informação do que queremos encontrar. Qualquer retorno indicando corretude do que encontramos. 3
6 Aprendizado Não-Supervisionado Essas técnicas se baseiam em: Formação de grupos de dados similares. Modelo de criação de um dado. Busca de objetos representativos. Redução de Dimensionalidade e Extração de Atributos. 4
7 Formação de grupos de dados Define-se uma medida de similaridade entre nossos dados. Forme grupos baseados na similaridade entre objetos do mesmo grupo. 5
8 Formação de grupos de dados Nas imagens abaixo: 6
9 Formação de grupos de dados Podemos formar os grupos bonzinhos e malvados : 7
10 Formação de grupos de dados Podemos formar os grupos masculino, feminino e indefinido : 8
11 Formação de grupos de dados Podemos formar os grupos heróis, vítimas e vilões : 9
12 Modelo de Criação Procura encontrar um modelo que explica a geração dos dados: P(θ x) =? 10
13 Modelo de Criação Vamos tomar como exemplo agora as seguintes imagens: 11
14 Modelo de Criação Com elas podemos encontrar os seguintes modelos de criação: 12
15 Dados Representativos Vamos considerar que uma imagem é um conjunto de pixels, e as cores desses pixels são nossos dados. Se encontrarmos as k cores mais representativa dessa imagem, podemos redesenhá-la utilizando essas cores, economizando bits! 13
16 Dados Representativos 14
17 Redução de Dimensionalidade e Extração de Atributos Já vimos que em alguns casos (textos, imagens, vídeos) temos a necessidade de extrair atributos estruturados para que seja possível utilizar algoritmos de Aprendizado de Máquina. Além disso, em algumas situações também pode ser desejável extrair atributos do conjunto de atributos estruturados. 15
18 Redução de Dimensionalidade e Extração de Atributos A extração de novos atributos é motivado por: encontrar um espaço de atributos com separação linear entre as classes; reduzir a dimensão do problema reduzindo o custo computacional do modelo de aprendizado; descobrir relações entre os atributos que podem ser de interesse prático; projetar para um espaço bi ou tri-dimensional com o intuito de visualizar os dados. 16
19 Redução de Dimensionalidade e Extração de Atributos Já a redução de atributos é aplicada com o objetivo de minimizar o impacto da maldição da dimensionalidade. Quando o espaço de atributos tem uma dimensão muito grande, observamos alguns fenômenos: A diferença entre as distâncias de objetos similares e dissimilares se torna pequena. Muitos atributos não contribuem com o objetivo do aprendizado. Alguns atributos inserem ruídos que atrapalham o ajuste dos parâmetros livres dos algoritmos. 17
20 Agrupamento de Dados
21 k-means Digamos que temos diversas cores que são tons de vermelho, verde e azul y x 18
22 k-means Queremos escolher as 3 cores mais representativas desse conjunto! y x 19
23 k-means E não necessariamente essas 3 cores devem fazer parte do conjunto de dados, podemos criar cores novas! y x 20
24 k-means O que caracteriza uma cor representativa de um conjunto? y x 21
25 k-means Bom, para saber isso primeiro precisamos conhecer os conjuntos! y x 22
26 k-means Para nosso exemplo é fácil: y x 23
27 k-means A cor representativa de cada grupo é aquela que mais se aproxima de todas do grupo y x 24
28 k-means Ou seja, é a que tem maior similaridade média com os elementos do grupo y x 25
29 k-means Ou seja, é a que tem maior similaridade média com os elementos do grupo y x 26
30 k-means Matematicamente, quem são esses elementos? y x 27
31 k-means Dado um conjunto de pontos X n-dimensionais, queremos determinar o ponto c, representando o centro, que minimiza: J(X, c) = 1 m m dist(x i, c) i=1 definimos que a distância é o inverso da similaridade. 28
32 k-means O mínimo pode ser encontrado com: J(X, c) = 1 m m dist(x i, c) = 0 i=1 29
33 k-means Temos os centros...como definir os grupos? y x 33
34 k-means Para cada amostra x, verificamos o centro mais próximo...essa amostra fará parte desse grupo y x 34
35 k-means Sabemos como calcular o centro, dado os grupos...e como definir os grupos dado os centros y x 35
36 k-means Começamos chutando pontos iniciais para os centros y x 36
37 k-means Definimos os grupos de acordo com esses centros: y x 37
38 k-means Para cada grupo, calculamos o novo centro: y x 38
39 k-means E remontamos os grupos: y x 39
40 k-means Repetimos esse procedimento y x 40
41 k-means...até os centros ou os grupos não se alterarem mais y x 41
42 k-means - Algoritmo def kmeans(x, k, it=100): centers = [X[i,:] for i in np.random.choice(x.shape[0])] while it>0: centers = emstep(x, centers) return eststep(x, centers) def emstep(x, centers): return maxstep( X, eststep(x, centers) ) 42
43 k-means - Algoritmo def eststep(x, centers): return np.array([np.argmin(distances(x_i, centers)) for x_i in X]) def maxstep(x, labels): return [X[labels == k].mean(axis = 0) for k in np.unique(labels)] 43
44 k-means - Algoritmo def distances(x, centers): return [dist(x, center_j) for center_j in centers] 44
45 k-means - Scikit-Learn from sklearn.cluster import KMeans model = KMeans(n_clusters=k) model.fit(x) clusters = model.labels_ 45
46 Próxima Aula Na próxima aula aprenderemos sobre os algoritmos de agrupamento Espectral e Hierárquico. 46
Agrupamento Espectral e Hierárquico
Agrupamento Espectral e Hierárquico Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Agrupamento Espectral 2. Agrupamento Hierárquico 1 Agrupamento Espectral Agrupamento Espectral Nem
Regressão Linear. Fabrício Olivetti de França. Universidade Federal do ABC
Regressão Linear Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Ordinary Least Square 2. Gradiente Descendente 1 Aprendendo com exemplos Uma das formas de aprendizado de máquina é definido
Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação
Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Francisco A. Rodrigues Departamento de Matemática Aplicada e Estatística - SME Conceitos básicos Classificação não-supervisionada:
Clustering: k-means e Agglomerative
Tópicos Avançados em Avaliação de Desempenho de Sistemas Jackson Nunes Marco Eugênio Araújo Outubro de 2014 1 Sumário Contextualização Classificação Agrupamento (Clustering) Cenários de Aplicação Clustering
Introdução ao Reconhecimento. Prof. Dr. Geraldo Braz Junior
Introdução ao Reconhecimento Prof. Dr. Geraldo Braz Junior O que você vê? 2 Pergunta: Essa imagem tem um prédio? Classificação 3 Pergunta: Essa imagem possui carro(s)? Detecção de Objetos Vários 4 Pergunta:
Aprendizado de Máquina (Machine Learning)
Ciência da Computação (Machine Learning) Aula 01 Motivação, áreas de aplicação e fundamentos Max Pereira Nem todo conhecimento tem o mesmo valor. O que torna determinado conhecimento mais importante que
Regressão Linear. Fabrício Olivetti de França. Universidade Federal do ABC
Regressão Linear Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Overfitting 2. Treino e Validação 3. Baseline dos modelos 1 Overfitting Overfit Em muitos casos, a amostra de dados coletada
Aprendizado de Máquina (Machine Learning)
Ciência da Computação Aprendizado de Máquina (Machine Learning) Aula 07 Classificação com o algoritmo knn Max Pereira Classificação com o algoritmo (knn) Um algoritmo supervisionado usado para classificar
Redes Neurais Artificiais
Redes Neurais Artificiais Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Redes Neurais Biológicas 2. Neurônio Artificial 3. Rede Neural Artificial 4. Keras 1 Redes Neurais Biológicas
Aprendizagem de Máquinas
Universidade Federal do Rio Grande do Norte Departamento de Engenharia de Computação e Automação Aprendizagem de Máquinas DCA0121 Inteligência Artificial Aplicada Heitor Medeiros 1 Aprendizagem de Máquinas
Aula 5: k-means. Paulo C. Marques F. 1 de Abril de Aula ministrada no Insper. Insper Aula 5: k-means 1 de Abril de / 19
Aula 5: k-means Paulo C. Marques F. Aula ministrada no Insper 1 de Abril de 2016 Insper Aula 5: k-means 1 de Abril de 2016 1 / 19 Aprendizagem não supervisionada Encerramos, por hora, o capítulo sobre
Regressão Polinomial e Simbólica
Regressão Polinomial e Simbólica Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Variáveis Não-Lineares 2. Regressão Simbólica 1 Variáveis Não-Lineares Variáveis Não-Lineares Considere
Redes Neurais (Inteligência Artificial)
Redes Neurais (Inteligência Artificial) Aula 16 Aprendizado Não-Supervisionado Edirlei Soares de Lima Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest
Redes Neurais não Supervisionadas: SOM
Universidade Federal do Rio Grande do Norte Departamento de Engenharia de Computação e Automação Redes Neurais não Supervisionadas: SOM DCA0121 Inteligência Artificial Aplicada Heitor Medeiros 1 Tópicos
Inteligência Artificial
Universidade Federal de Campina Grande Departamento de Sistemas e Computação Pós-Graduação em Ciência da Computação Inteligência Artificial Aprendizagem Outras Técnicas Prof. a Joseana Macêdo Fechine Régis
UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica
REDES NEURAIS ARTIFICIAIS AULA 03 Prof. Dr. André A. P. Biscaro 1º Semestre de 2017 INTRODUÇÃO Aprendizagem é um processo pelo qual os parâmetros livres de uma rede neural são adaptados através de um processo
MINERAÇÃO DE DADOS. Thiago Marzagão CLUSTERIZAÇÃO. Thiago Marzagão (UnB) MINERAÇÃO DE DADOS 1 / 9
MINERAÇÃO DE DADOS Thiago Marzagão [email protected] CLUSTERIZAÇÃO Thiago Marzagão (UnB) MINERAÇÃO DE DADOS 1 / 9 regressão/classificação vs clusterização Regressão/classificação: temos x 1, x 2,...,
Aprendizado por Reforço
Aprendizado por Reforço Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Aprendizado por Reforço 2. Q-Learning 3. SARSA 4. Outras ideias 1 Aprendizado por Reforço Problemas de decisão
Álgebra Linear Semana 04
Álgebra Linear Semana 04 Diego Marcon 17 de Abril de 2017 Conteúdo 1 Produto de matrizes 1 11 Exemplos 2 12 Uma interpretação para resolução de sistemas lineares 3 2 Matriz transposta 4 3 Matriz inversa
Aprendizado por Instâncias Janelas de Parzen & Knn
Universidade Federal do Paraná (UFPR) Especialização em Engenharia Industrial 4.0 Aprendizado por Instâncias Janelas de Parzen & Knn David Menotti www.inf.ufpr.br/menotti/ci171-182 Hoje Aprendizado por
Aprendizado de Máquina
Aprendizado de Máquina Introdução Luiz Eduardo S. Oliveira Universidade Federal do Paraná Departamento de Informática http://lesoliveira.net Luiz S. Oliveira (UFPR) Aprendizado de Máquina 1 / 19 Introdução
Reconhecimento de cores do MSX por lógica fuzzy
Reconhecimento de cores do MSX por lógica fuzzy Resumo O objetivo deste artigo é demonstrar como é possível reconhecer, em uma imagem de 24 bits, a cor mais parecida com uma das 15 cores do MSX 1. 1- Introdução
SCC0173 Mineração de Dados Biológicos
SCC0173 Mineração de Dados Biológicos Classificação I: Algoritmos 1Rule e KNN Prof. Ricardo J. G. B. Campello SCC / ICMC / USP 1 Créditos O material a seguir consiste de adaptações e extensões dos originais:
Método Simplex. Marina Andretta ICMC-USP. 19 de outubro de 2016
Método Simplex Marina Andretta ICMC-USP 19 de outubro de 2016 Baseado no livro Introduction to Linear Optimization, de D. Bertsimas e J. N. Tsitsiklis. Marina Andretta (ICMC-USP) sme0211 - Otimização linear
Aula 7 Medidas de Distância. Profa. Elaine Faria UFU
Aula 7 Medidas de Distância Profa. Elaine Faria UFU - 2017 Agradecimentos Este material é baseado No livro Tan et al, 2006 Nos slides do prof Andre C. P. L. F. Carvalho Agradecimentos Ao professor André
Consultas por Similaridade em Domínios de Dados Complexos
Consultas por Similaridade em Domínios de Dados Complexos Guilherme Felipe Zabot Orientador: Profº Dr Caetano Traina Jr Roteiro Objetivo Introdução Dados Complexos Representação de Dados Complexos Extração
Reconhecimento de Padrões
Reconhecimento de Padrões André Tavares da Silva [email protected] Roteiro da aula Conceitos básicos sobre reconhecimento de padrões Visão geral sobre aprendizado no projeto de classificadores Seleção
UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica
REDES NEURAIS ARTIFICIAIS MÁQUINA DE VETOR DE SUPORTE (SUPPORT VECTOR MACHINES) Prof. Dr. André A. P. Biscaro 1º Semestre de 2017 Introdução Poderosa metodologia para resolver problemas de aprendizagem
Reconhecimento facial. uma aplicação prática do reconhecimento de padrões
Reconhecimento facial uma aplicação prática do reconhecimento de padrões Márcio Koch, junho 2014 Pauta Apresentação Visão computacional Reconhecimento de padrões Analise de Componentes Principais Reconhecimento
Integração de Mineração de Dados com SGBD Detecção de Agrupamentos
Integração de Mineração de Dados com SGBD Detecção de Agrupamentos Centro de Matemática Computação e Cognição-UFABC Jéssica Andressa de Souza Pós-Graduação em Ciência da Computação Sistemas de Banco de
PMR2560 Visão Computacional Quantização de cores. Prof. Eduardo L. L. Cabral
PMR2560 Visão Computacional Quantização de cores Prof. Eduardo L. L. Cabral Objetivos Quantização de cores redução do números de cores presentes na imagem: Métodos: Quantização uniforme; Quantização adaptativa;
Teoria dos Grafos Aula 18
Teoria dos Grafos Aula 18 Aula passada Coloração Algoritmo guloso Número cromático Teorema das 4 cores Aula de hoje Clusterização (ou agrupamento) Algoritmo Variação Clusterização Coleção de objetos Agrupar
Aula 6 Mineração Streams Representação dos Dados. Profa. Elaine Faria UFU
Aula 6 Mineração Streams Representação dos Dados Profa. Elaine Faria UFU - 2017 Agradecimentos Este material é baseado No livro Tan et al, 2006 Nos slides do prof. Andre C. P. L. F. Carvalho Agradecimentos
Métodos Não Paramétricos
Universidade Federal do Paraná Departamento de Informática Reconhecimento de Padrões Métodos não Paramétricos Luiz Eduardo S. Oliveira, Ph.D. http://lesoliveira.net Métodos Não Paramétricos Introduzir
Visocor - Sistema de acessibilidade visual
- Sistema de acessibilidade visual Trabalho de Conclusão de Curso. André Asato Rafael Lopes Professor Supervisor: Roberto Hirata Jr. Novembro de 2009 Antes de qualquer coisa Pergunta Que número você vê
Combinando inequações lineares
Combinando inequações lineares A multiplicação por um número > 0 não altera uma inequação 2x x 5 4x 2x 10 1 2 1 2 A soma de duas inequações (com o mesmo sentido) produz uma inequação válida x 3x x 3 1
SUPPORT VECTOR MACHINE - SVM
SUPPORT VECTOR MACHINE - SVM Definição 2 Máquinas de Vetores Suporte (Support Vector Machines - SVMs) Proposto em 79 por Vladimir Vapnik Um dos mais importantes acontecimentos na área de reconhecimento
Rumo Curso Pré Vestibular Assistencial - RCPVA Disciplina: Matemática Professor: Vinícius Nicolau 12 de Setembro de 2014
Sumário 1 Análise Combinatória 1 1.1 Princípio Multiplicativo.............................. 1 1.1.1 Exercícios................................. 4 1.2 Permutação Simples................................
Aprendizado de Máquinas. Classificadores Lineares
Universidade Federal do Paraná (UFPR) Departamento de Informática Aprendizado de Máquinas Classificadores Lineares David Menotti, Ph.D. web.inf.ufpr.br/menotti Objetivos Introduzir o conceito de classificação
Algoritmos de Agrupamento - Aprendizado Não Supervisionado
Algoritmos de Agrupamento - Aprendizado Não Supervisionado Fabrício Jailson Barth [email protected] Agosto de 2016 Sumário Introdução e Definições Aplicações Algoritmos de Agrupamento Agrupamento
Aprendizado por Reforço usando Aproximação
Aprendizado por Reforço usando Aproximação de Funções Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Aproximação de Funções 2. Do the evolution 1 Aproximação de Funções Função Utilidade
Organização. 1. Introdução 2. Medidas de Similaridade. hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters
Organização. Introdução 2. Medidas de Similaridade 3. Métodos de Agrupamento (métodos hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters Métodos de Partição Cada exemplo
Pode-se mostrar que da matriz A, pode-se tomar pelo menos uma submatriz quadrada de ordem dois cujo determinante é diferente de zero. Então P(A) = P(A
MATEMÁTICA PARA ADMINISTRADORES AULA 03: ÁLGEBRA LINEAR E SISTEMAS DE EQUAÇÕES LINEARES TÓPICO 02: SISTEMA DE EQUAÇÕES LINEARES Considere o sistema linear de m equações e n incógnitas: O sistema S pode
Questões concursos
Questões concursos Grandezas radiométricas Índices de vegetação Classificação Concurso Público para Pesquisador do IMB Instituto Mauro Borges de Estatísticas e Estudos Socioeconômicos 25. A
Gestão de Processos. Tópico 7. Ferramentas de Qualidade: Diagrama de Pareto
Gestão de Processos Tópico 7 Ferramentas de Qualidade: Diagrama de Pareto Sumário 1. Introdução... 3 2. Construindo um Gráfico de Pareto... 3 3. Exemplo Prático Livraria Virtual... 3 3.1 Primeiro Passo:
DCC008 - Cálculo Numérico
DCC008 - Cálculo Numérico Polinômios de Taylor Bernardo Martins Rocha Departamento de Ciência da Computação Universidade Federal de Juiz de Fora [email protected] Conteúdo Introdução Definição
Aula 3- Codificação de Canal. October 18, 2017
ELE-32 Introdução a Comunicações Aula 3- Codificação de Canal October 18, 2017 1 Introdução Em muitas situações, a mensagem a ser transmitida por um sistema de comunicações é uma sequência de bits. Entretanto,
3. Limites e Continuidade
3. Limites e Continuidade 1 Conceitos No cálculo de limites, estamos interessados em saber como uma função se comporta quando a variável independente se aproxima de um determinado valor. Em outras palavras,
Implementação de Kernel Customizado Aplicado à Análise de Sentimentos em Resenhas de Filmes
Implementação de Kernel Customizado Aplicado à Análise de Sentimentos em Resenhas de Filmes Luciana Kayo e Paulo Mei Prof. Dr. Marco Dimas Gubitoso Introdução Inspiração na competição When Bag of Words
SME0300 Cálculo Numérico Aula 4
SME0300 Cálculo Numérico Aula 4 Maria Luísa Bambozzi de Oliveira marialuisa @ icmc. usp. br Sala: 3-241 Página: tidia-ae.usp.br 13 de agosto de 2015 Aula Passada Operações Aritméticas: Arredondamento a
scikit-learn: Aprendizado de máquina 101 com Python
scikit-learn: Aprendizado de máquina 101 com Python Luciana Fujii Campus Party BH 2016 1 / 30 Introdução Aprendizado de máquina Aprendizado de máquina é o campo da ciência da computação que dá aos computadores
Mapeamento do uso do solo para manejo de propriedades rurais
1/28 Mapeamento do uso do solo para manejo de propriedades rurais Teoria Eng. Allan Saddi Arnesen Eng. Frederico Genofre Eng. Marcelo Pedroso Curtarelli 2/28 Conteúdo programático: Capitulo 1: Conceitos
Aprendizado de Máquina
Aprendizado de Máquina A necessidade de inserir aprendizado nas máquinas surgiu após a construção dos Sistemas Especialistas (SEs). Os primeiros SEs não possuíam mecanismo de aprendizado e tornavam-se
Aprendizado de Máquina
Aprendizado de Máquina André C. P. L. F. de Carvalho Posdoutorando: Isvani Frias-Blanco ICMC-USP Agrupamento de dados Tópicos Agrupamento de dados Dificuldades em agrupamento Algoritmos de agrupamento
Aprendizado de Máquina (Machine Learning)
Ciência da Computação (Machine Learning) Aula 07 Classificação com o algoritmo knn Max Pereira Classificação com o algoritmo k-nearest Neighbors (knn) Como os filmes são categorizados em gêneros? O que
Pra início de conversa... O que é um algoritmo? Exemplos de algoritmos. Como podemos descrever algoritmos? Como podemos descrever algoritmos?
Pra início de conversa... O que é um algoritmo? Como podemos descrever algoritmos? avaliar algoritmos? Introdução à Análise de Algoritmos Prof. Cláudio E. C. Campelo http://claudiocampelo.com Derivado
Mineração de Dados. Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri
Mineração de Dados Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri 1 Motivação Aumento da capacidade de processamento e de armazenamento de dados; Baixo custo; Grande quantidade de dados
