K-Nearest Neighbours & RSTUDIO
|
|
|
- Eduardo Vilaverde da Fonseca
- 8 Há anos
- Visualizações:
Transcrição
1 K-Nearest Neighbours & RSTUDIO Rodrigo Augusto Igawa Universidade Estadual de Londrina 17 de novembro de 2015 Rodrigo Augusto Igawa (UEL) KNN PARTE 2 17 de novembro de / 16
2 Sumário 1 Revisão 2 KNN no Software R 3 Atividades 4 Considerações Finais Rodrigo Augusto Igawa (UEL) KNN PARTE 2 17 de novembro de / 16
3 Relembrando a última aula KNN Amplamente usado Aprendizado de máquina supervisionado Modelo simples Buscar os vizinhos mais próximos pode ser custoso Rodrigo Augusto Igawa (UEL) KNN PARTE 2 17 de novembro de / 16
4 Na aula de hoje Na aula de hoje Como usar o KNN no R KNN e sua performance em alguns datasets Rodrigo Augusto Igawa (UEL) KNN PARTE 2 17 de novembro de / 16
5 KNN no R Package class O pacote class disponibiliza alguns algorítimos para classificação. Um deles é o KNN train conjunto de teste (sem a classe) test conjunto de treino (sem a classe) cl a coluna das classes do conjunto de treino k número de vizinho a serem considerados prob distribuição probabiĺıstica dos resultados Rodrigo Augusto Igawa (UEL) KNN PARTE 2 17 de novembro de / 16
6 Detalhes de implementação do KNN no R Limitações A distância a ser usada é exclusivamente a euclidiana Não existe possibilidade de ponderar atributos Rodrigo Augusto Igawa (UEL) KNN PARTE 2 17 de novembro de / 16
7 Atividades Exercícios Efetuar testes nos datasets descritos nos próximos slides. Para cada conjunto de dados computar a matriz de confusão usando KNN e Random Forest. Rodrigo Augusto Igawa (UEL) KNN PARTE 2 17 de novembro de / 16
8 O Dataset de iris Descrição Conjunto de dados com 150 instâncias (75 para teste, 75 para treino). Objetivo: Separar o conjunto de dados em três classes distintas. Atributos: 4 atributos numéricos Exemplos: Petal.length{1, 6.9}, Petal.width{0.1, 2.5} Rodrigo Augusto Igawa (UEL) KNN PARTE 2 17 de novembro de / 16
9 Atividade - Dataset de iris Objetivo Dividir o conjunto de dados em duas partes de mesmo tamanho e, em seguida, construir a matriz de confusão usando o 5NN e Random Forest como classificadores. Rodrigo Augusto Igawa (UEL) KNN PARTE 2 17 de novembro de / 16
10 O Dataset de sites de phishing Descrição Conjunto de dados com instâncias (11054 para treino, 524 para teste). Objetivo: Deseja-se classificar se um site é usado para a prática de phishing. Cada exemplar do conjunto de dados possui seu rótulo na última coluna. Atributos: Todos numéricos, variando entre -1, 0 e 1. Exemplos: Shortining Service{1, -1}, Having Sub Domain{-1, 0, 1}, Domain registeration length{-1, 1} Rodrigo Augusto Igawa (UEL) KNN PARTE 2 17 de novembro de / 16
11 Atividade - Dataset de sites de phishing Objetivo Dividir o conjunto de dados em duas partes de mesmo tamanho e, em seguida, construir a matriz de confusão usando o 5NN como classificador. Rodrigo Augusto Igawa (UEL) KNN PARTE 2 17 de novembro de / 16
12 O Dataset de mãos de poker Descrição Conjunto de dados com instâncias (25009 para treino, todo o resto para teste). Objetivo: Deseja-se classificar se a mão do jogador possui: nada, um par, dois pares,.... Atributos: Todos numéricos. Alguns variando de 1 a 13 representando o número da carta e de 1 a 4 para os símbolos. Rodrigo Augusto Igawa (UEL) KNN PARTE 2 17 de novembro de / 16
13 Atividade - Dataset de mão de poker Objetivo Dividir o conjunto de dados em duas partes do mesmo tamanho e, em seguida, construir a matriz de confusão usando 5NN e Random Forest como classificadores. Rodrigo Augusto Igawa (UEL) KNN PARTE 2 17 de novembro de / 16
14 Considerações finais Resumo da aula KNN possui dificuldades para trabalhar com grandes quantidades de dados KNN assim como outros classificadores não apresenta boa performance para problemas com mais de duas classes. Ambos os itens anteriores são justificados na acurácia obtida em experimentos Rodrigo Augusto Igawa (UEL) KNN PARTE 2 17 de novembro de / 16
15 Dúvidas Rodrigo Augusto Igawa (UEL) KNN PARTE 2 17 de novembro de / 16
16 Muito Obrigado Rodrigo A. Igawa Rodrigo Augusto Igawa (UEL) KNN PARTE 2 17 de novembro de / 16
Aprendizado de Máquina (Machine Learning)
Ciência da Computação Aprendizado de Máquina (Machine Learning) Aula 07 Classificação com o algoritmo knn Max Pereira Classificação com o algoritmo (knn) Um algoritmo supervisionado usado para classificar
INF 1771 Inteligência Artificial
INF 1771 Inteligência Artificial Aula 13 K-Nearest Neighbor (KNN) 2016.1 Prof. Augusto Baffa Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor
MLaaS com Azure: Que tipo de flor de íris é essa?
MLaaS com Azure: Que tipo de flor de íris é essa? Douglas Lima Dantas Bacharel em Engenharia de Computação pela UEA (2013-2017) Trainee Samsung Ocean (2015-2017) Mestrando em Engenharia Elétrica pela Poli-USP
Aprendizado de Máquina (Machine Learning)
Ciência da Computação (Machine Learning) Aula 07 Classificação com o algoritmo knn Max Pereira Classificação com o algoritmo k-nearest Neighbors (knn) Como os filmes são categorizados em gêneros? O que
SCC0173 Mineração de Dados Biológicos
SCC0173 Mineração de Dados Biológicos Classificação I: Algoritmos 1Rule e KNN Prof. Ricardo J. G. B. Campello SCC / ICMC / USP 1 Créditos O material a seguir consiste de adaptações e extensões dos originais:
Inteligência nos Negócios (Business Inteligente)
Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 6) Fundamentação da disciplina Analise de dados Decisões
Mineração de Dados - II
Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II Mineração de Dados - II Sylvio Barbon Junior [email protected] 10 de julho de 2015 DC-UEL Sylvio Barbon Jr 1 Sumário Etapa II Algoritmos Básicos Weka: Framework
DCBD. Avaliação de modelos. Métricas para avaliação de desempenho. Avaliação de modelos. Métricas para avaliação de desempenho...
DCBD Métricas para avaliação de desempenho Como avaliar o desempenho de um modelo? Métodos para avaliação de desempenho Como obter estimativas confiáveis? Métodos para comparação de modelos Como comparar
Mapeamento do uso do solo para manejo de propriedades rurais
1/28 Mapeamento do uso do solo para manejo de propriedades rurais Teoria Eng. Allan Saddi Arnesen Eng. Frederico Genofre Eng. Marcelo Pedroso Curtarelli 2/28 Conteúdo programático: Capitulo 1: Conceitos
UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica
REDES NEURAIS ARTIFICIAIS MÁQUINA DE VETOR DE SUPORTE (SUPPORT VECTOR MACHINES) Prof. Dr. André A. P. Biscaro 1º Semestre de 2017 Introdução Poderosa metodologia para resolver problemas de aprendizagem
Silva (2014) faz a classificação dos elementos no trabalho Data Mining sobre um dataset de Câncer de Mama:
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ (UTFPR) Mineração de Dados 2016/3 Professores Celso e Heitor Jean Avila Rangel 1801317 - PPGCA PPGCA/UTFPR câmpus Curitiba -- CAIA003 - Mineração de Dados --
Introdução ao Reconhecimento. Prof. Dr. Geraldo Braz Junior
Introdução ao Reconhecimento Prof. Dr. Geraldo Braz Junior O que você vê? 2 Pergunta: Essa imagem tem um prédio? Classificação 3 Pergunta: Essa imagem possui carro(s)? Detecção de Objetos Vários 4 Pergunta:
Aprendizado de Máquina (Machine Learning)
Ciência da Computação Aprendizado de Máquina (Machine Learning) Aula 09 Árvores de Decisão Max Pereira Classificação É a tarefa de organizar objetos em uma entre diversas categorias pré-definidas. Exemplos
Inteligência Artificial
Universidade Federal de Campina Grande Departamento de Sistemas e Computação Pós-Graduação em Ciência da Computação Inteligência Artificial Aprendizagem Outras Técnicas Prof. a Joseana Macêdo Fechine Régis
Aprendizado por Instâncias Janelas de Parzen & Knn
Universidade Federal do Paraná (UFPR) Especialização em Engenharia Industrial 4.0 Aprendizado por Instâncias Janelas de Parzen & Knn David Menotti www.inf.ufpr.br/menotti/ci171-182 Hoje Aprendizado por
Thiago Marzagão 1. 1 Thiago Marzagão (Universidade de Brasília) MINERAÇÃO DE DADOS 1 / 21
MINERAÇÃO DE DADOS Thiago Marzagão 1 1 [email protected] ÁRVORE DE DECISÃO & VALIDAÇÃO Thiago Marzagão (Universidade de Brasília) MINERAÇÃO DE DADOS 1 / 21 árvore de decisão Aulas passadas: queríamos
Aula 7 Medidas de Distância. Profa. Elaine Faria UFU
Aula 7 Medidas de Distância Profa. Elaine Faria UFU - 2017 Agradecimentos Este material é baseado No livro Tan et al, 2006 Nos slides do prof Andre C. P. L. F. Carvalho Agradecimentos Ao professor André
MAC 0425/ Inteligência Artificial
MAC 0425/5739 - Inteligência Artificial Exercício-Programa 4 - Clasificação Prazo limite de entrega: 23:59 07/12/2016 1 Introdução Neste exercício-programa estudaremos o problema de aprendizagem supervisionado
INF 1771 Inteligência Artificial
INF 1771 Inteligência Artificial Aula 14 Support Vector Machines (SVM) 2016.1 Prof. Augusto Baffa Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest
Exame de Aprendizagem Automática
Exame de Aprendizagem Automática 2 páginas com 12 perguntas e 3 folhas de resposta. Duração: 2 horas e 30 minutos DI, FCT/UNL, 12 de Janeiro de 2017 Nota: O exame está cotado para 40 valores. Os 20 valores
Classificação: Árvores de Decisão e k-nn. Eduardo Raul Hruschka
Classificação: Árvores de Decisão e k-nn Eduardo Raul Hruschka Árvores de Decisão Métodos para aproximar funções discretas, representadas por meio de uma árvore de decisão; Árvores de decisão podem ser
Laboratório Classificação com o WEKA Explorer
Laboratório Classificação com o WEKA Explorer Para esse laboratório considere os seguintes classificadores: C4.5 (J4.8) KNN Naïve Bayes Considere as bases de treinamento e teste de dígitos manuscrítos
INF 1771 Inteligência Artificial
Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 17 Support Vector Machines (SVM) Formas de Aprendizado Aprendizado Supervisionado Árvores de decisão. K-Nearest Neighbor
Metodologia KNN-Fuzzy: Uma Abordagem da Classificação de Dados por Similaridade
Metodologia KNN-Fuzzy: Uma Abordagem da Classificação de Dados por Similaridade Alfredo N. P. Boente Carlos Alberto A. Lemos José Luiz dos Anjos Rosa Instituto Superior de Tecnologia em Ciência da Computação
Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação
Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Francisco A. Rodrigues Departamento de Matemática Aplicada e Estatística - SME 1 Conceitos básicos Naive Bayes K-vizinhos mais
1 o Teste de Aprendizagem Automática
o Teste de Aprendizagem Automática 3 páginas com 6 perguntas e 2 folhas de resposta. Duração: 2 horas DI, FCT/UNL, 22 de Outubro de 205 Pergunta [4 valores] As figuras abaixo mostram o erro de treino e
MCZA Processamento de Linguagem Natural Classificação de textos
MCZA017-13 Processamento de Linguagem Natural Classificação de textos Prof. Jesús P. Mena-Chalco [email protected] 1Q-2018 1 Bibliografia Daniel Jurafsky & James H. Martin. Speech and language processing:
Agregação de Algoritmos de Aprendizado de Máquina (AM) Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta
Agregação de Algoritmos de Aprendizado de Máquina (AM) Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta ([email protected]) Sumário 1. Motivação 2. Bagging 3. Random Forest 4. Boosting
Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas
Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas Wrapper Filtros Muitos algoritmos de AM são projetados de modo a selecionar os
Aprendizado de Máquina (Machine Learning)
Ciência da Computação (Machine Learning) Aula 01 Motivação, áreas de aplicação e fundamentos Max Pereira Nem todo conhecimento tem o mesmo valor. O que torna determinado conhecimento mais importante que
Teoria do aprendizado
Teoria do aprendizado Marcelo K. Albertini 7 de Agosto de 2014 2/37 Teoria do aprendizado Teoremas não existe almoço grátis Viés e variância Aprendizado PAC Dimensão VC Máquinas de vetores suporte 3/37
Tutorial: Árvore de Decisão com Weka para a classificação de carne suína
Universidade Estadual de Londrina - UEL 2 CTA 121 - Processamento de Imagens em Alimentos Prática de Aprendizado de Máquina com Weka 28/07/2016 Prof. Dr. Sylvio Barbon Jr Tutorial: Árvore de Decisão com
Algoritmos de Agrupamento - Aprendizado Não Supervisionado
Algoritmos de Agrupamento - Aprendizado Não Supervisionado Fabrício Jailson Barth [email protected] Agosto de 2016 Sumário Introdução e Definições Aplicações Algoritmos de Agrupamento Agrupamento
scikit-learn: Aprendizado de máquina 101 com Python
scikit-learn: Aprendizado de máquina 101 com Python Luciana Fujii Campus Party BH 2016 1 / 30 Introdução Aprendizado de máquina Aprendizado de máquina é o campo da ciência da computação que dá aos computadores
Reconhecimento de texturas utilizando padrão binário local e classificador knn.
Reconhecimento de texturas utilizando padrão binário local e classificador knn. Vinicius Santos Andrade 1 Resumo. Através de uma imagem é possível obter inúmeras informações. Portanto, é cada vez mais
Rede complexa probabilística baseada em similaridade na classificação de dados com ruídos
Rede complexa probabilística baseada em similaridade na classificação de dados com ruídos Robson C. da Motta, e Alneu de A. Lopes Instituto de Ciências Matemáticas e de Computação - ICMC Universidade de
CLASSIFICADORES ELEMENTARES
CLASSIFICADORES ELEMENTARES Classificação 2 Consiste em tentar discriminar em diferentes classes um conjunto de objetos com características mensuráveis Exemplo: classificação de frutas Forma, cor, sabor,
Redes Neurais Artificiais. Everton Gago
Redes Neurais Artificiais Everton Gago Como vai ser? O que é RNA? Conglomerado de neurônios!?!? Neurônio: Neurônio: Entradas: X0 = 0 X1 = 1 X2 = 1 Neurônio: Entradas: X0 = 0 X1 = 1 X2 = 1 Pesos: W0 = 0.3
SUPPORT VECTOR MACHINE - SVM
SUPPORT VECTOR MACHINE - SVM Definição 2 Máquinas de Vetores Suporte (Support Vector Machines - SVMs) Proposto em 79 por Vladimir Vapnik Um dos mais importantes acontecimentos na área de reconhecimento
CLASSIFICADORES ELEMENTARES -II
CLASSIFICADORES ELEMENTARES -II Estimando a densidade 2 A função densidade de probabilidade é um conceito fundamental em estatística Permite associar probabilidades a uma variável aleatória x Especificar
Regressão Linear. Fabrício Olivetti de França. Universidade Federal do ABC
Regressão Linear Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Overfitting 2. Treino e Validação 3. Baseline dos modelos 1 Overfitting Overfit Em muitos casos, a amostra de dados coletada
Aprendizado de Máquina
Aprendizado de Máquina Aula #8.1 EBS 564 IA Prof. Luiz Fernando S. Coletta [email protected] Campus de Tupã Conhecimento: abstração (modelo) das relações existentes entre as informações contidas nos
Inteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo]
Inteligência Artificial Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo] Aprendizagem de Máquina Área da Inteligência Artificial cujo objetivo é o desenvolvimento de técnicas computacionais sobre
Função discriminante linear de Fisher
Função discriminante linear de Fisher ## Biblioteca com a função discriminante linear de Fisher library(mass) ## Dados (?iris apresenta informações sobre o conjunto de dados) dados
Reconhecimento de Padrões aplicado à Bioinformática
Reconhecimento de Padrões aplicado à Bioinformática Dr. Leandro Carrijo Cintra CNPTIA Embrapa Informática Agropecuária Curso de Verão 2010 Bioinformática USP CNPTIA - Centro Nacional de Pesquisas Tecnológicas
Métodos Não Paramétricos
Universidade Federal do Paraná Departamento de Informática Reconhecimento de Padrões Métodos não Paramétricos Luiz Eduardo S. Oliveira, Ph.D. http://lesoliveira.net Métodos Não Paramétricos Introduzir
Redes Neurais (Inteligência Artificial)
Redes Neurais (Inteligência Artificial) Aula 13 Support Vector Machines (SVM) Edirlei Soares de Lima Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest
Tutorial básico de classificação em RapidMiner
Tutorial básico de classificação em RapidMiner Mineração de dados biológicos Ciências físicas e biomoleculares Neste tutorial, aprenderemos a utilizar as funcionalidades básicas para classificação em Rapidminer.
Aprendizado de Máquinas
Aprendizado de Máquinas Objetivo A área de aprendizado de máquina preocupa-se em construir programas que automaticamente melhorem seu desempenho com a experiência. Conceito AM estuda métodos computacionais
Análise de dados: clustering e redução de dimensionalidade
Análise de dados: clustering e redução de dimensionalidade Métodos e sua implementação em R Clustering - definições Objectivo genérico: agrupar objetos / entidades / exemplos (linhas da tabela) com base
Aprendizado de Máquina
Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCA UFES Departamento de Computação Aprendizado de Máquina Inteligência Artificial Site: http://jeiks.net E-mail: [email protected]
Implementação de Kernel Customizado Aplicado à Análise de Sentimentos em Resenhas de Filmes
Implementação de Kernel Customizado Aplicado à Análise de Sentimentos em Resenhas de Filmes Luciana Kayo e Paulo Mei Prof. Dr. Marco Dimas Gubitoso Introdução Inspiração na competição When Bag of Words
Descoberta de Conhecimento em Bancos de Dados - KDD
Descoberta de Conhecimento em Bancos de Dados - KDD Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Fases do processo 3. Exemplo do DMC 4. Avaliação
Aprendizagem de Máquina - 2. Prof. Júlio Cesar Nievola PPGIa - PUCPR
Aprendizagem de Máquina - 2 Prof. Júlio Cesar Nievola PPGIa - PUCPR Inteligência versus Aprendizado Aprendizado é a chave da superioridade da Inteligência Humana Para que uma máquina tenha Comportamento
Aprendizado de Máquina
Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCA UFES Departamento de Computação Aprendizado de Máquina Inteligência Artificial Site: http://jeiks.net E-mail: [email protected]
ESTATÍSTICA Aula de 07/08/2017. Introdução ao R Variáveis Qualitativas: gráficos
ESTATÍSTICA Aula de 07/08/2017 Introdução ao R Variáveis Qualitativas: gráficos O Programa R É um software de análise estatística de dados, de domínio público. Como baixar o programa? Vá no site: https://cran.r-project.org/
Aprendizado de Máquina
Aprendizado de Máquina O que é Aprendizado? Memorizar alguma coisa Aprender fatos por meio de observação e exploração Melhorar habilidades motoras/cognitivas por meio de prática Organizar novo conhecimento
4 Construção dos Classificadores
4 Construção dos Classificadores 4.1. Modelagem O aprendizado supervisionado contém a etapa de modelagem, nessa etapa definimos quais serão as características encaminhadas ao classificador para o treinamento.
Visão computacional. Juliana Patrícia Detroz Orientador: André Tavares Silva
Visão computacional Juliana Patrícia Detroz Orientador: André Tavares Silva Visão computacional Tentativa de replicar a habilidade humana da visão através da percepção e entendimento de uma imagem; Fazer
- lnteligência Artificial. Seminário sobre o artigo: Beans quality inspection using correlationbased granulometry
PCS - 5689 - lnteligência Artificial Seminário sobre o artigo: Beans quality inspection using correlationbased granulometry Autores: Sidnei Alves de Araújo, Jorge Henrique Pessota, Hae Yong Kim Aluno:
Organização. 1. Introdução 2. Medidas de Similaridade. hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters
Organização. Introdução 2. Medidas de Similaridade 3. Métodos de Agrupamento (métodos hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters Métodos de Partição Cada exemplo
