Prof. Heitor Silvério Lopes
|
|
|
- Fátima Arantes Ribeiro
- 8 Há anos
- Visualizações:
Transcrição
1 Prof. Heitor Silvério Lopes
2 WEKA WEKA: Waikato Environment for Knowledge Analysis Iniciado em 1992, versão estável atual: É um software para mineração de dados desenvolvido em Java com código aberto Desenvolvido na Universidade de Waikato (Nova Zelândia), por Ian Witten, Eibe Frank e colaboradores. Todo o código e o ambiente Java estão disponíveis. Livro: Witten, I.H., Frank, E. & Hall, M.A., Data Mining Practical machine learning tools and techniques, 4th Edition, Morgan Kaufmann, 2016.
3 Funcionalidades básicas Pré-processamento de dados: Formato nativo ARFF Outros: CSV, ASCII, JDBC Filtros diversos para remoção de atributos e operações Classificação: +100 métodos, divididos em grupos (Bayesianos, vizinhança, regras, árvores, funções, miscelânea), além de meta-métodos (bagging, boosting e outros). Agrupamento: Aprendizado não-supervisionado, incluindo EM, k-means e agrupamento hierárquico. Visualização de dados: Gráficos de valores dos atributos por classe ou por outros atributos, visualizadores de árvores, redes Bayesianas e dendograma. Muitas outras funcionalidades: Seleção de atributos, Regras de associação, Comparação de classificadores, Geração de conjuntos de dados, etc.
4 WEKA GUI Chooser Painel de controle de seleção das Graphical User Interfaces - GUIs
5 GUI Explorer Permite uma exploração rápida dos dados e suporta a maioria das funcionalidades
6 GUI Experimenter GUI que simplifica o projeto de experimentos com múltiplos datasets e múltiplos métodos de classificação ou regressão
7 GUI Experimenter Analisa comparativamente os resultados obtidos por diferentes métodos
8 GUI Knowledge Flow Tem as mesmas funcionalidades do Explorer, sob a forma de um workflow de operações.
9 GUI Workbench É similar ao Explorer, um pouco mais simples
10 GUI Simple CLI Permite utilizar as funções disponíveis via linha de comando (painel Java).
11 Menus do GUI Chooser Aba Visualization: Há interfaces gráficas especializadas Plot: gráfico 2D de um conjunto de dados, ROC: mostra a curva Receive Operating Characteristics, TreeVisualizer: mostra gráficos nos formatos XML, BIF e DOT para redes Bayesianas. GraphVisualizer: BoundaryVisualizer: Aba Tools: Há interfaces gráficas especializadas para: Package Manager: instala/desinstala pacotes 3rd party Bayes net editor: edição de redes Bayesianas, SqlViewer : interação com SQL server, ARFFViewer : editor de arquivos ARFF. Aba Help:
12 Menus do Explorer Aba Tools: Há interfaces gráficas especializadas para: Edição de redes Bayesianas (Bayes net editor), Interação com SQL server (SqlViewer), Editor de arquivos ARFF (ARFFViewer). Aba Visualization: permite a visualização de dados: Plot: gráfico 2D de um conjunto de dados, ROC: mostra a curva Receive Operating Characteristics, TreeVisualizer: mostra gráficos nos formatos XML, BIF e DOT para redes Bayesianas. Boundary Visualizer: permite a visualização em duas dimensões dos limites de decisão de um classificador. Aba Help: provê recursos on-line para ajuda
13 WEKA: Explorer GUI Aba Preprocess: leitura de arquivos e manipulação de dados É possível ler, editar e salvar arquivos, bem como aplicar filtros aos dados. Do lado direito são mostrados dados estatísticos simples dos dados, bem como sua distribuição. A leitura de arquivos pode ser no formato nativo ARFF ou CSV, ASCII, JDBC, etc
14 Formato de entrada de dados O formato nativo do WEKA é ARFF (Attribute- Relation File Format) que é texto em ASCII e tem: Header e Data A seção Header tem os campos: Relation: que define o nome do problema, Attribute: define cada atributo e seu tipo de dado, que pode ser: numérico (real ou inteiro), string, nominal (lista entre { } ) ou dado genérico (especifica formato). Nome do dataset Declaração dos atributos (nome, tipo, Intervalo/valores)
15 Formato de entrada de dados A seção Data contém uma instância por linha Cada linha tem os valores de todos os atributos na ordem listada na seção Header Instâncias dos dados (?=missing) Para a conversão de formatos: CSV ARFF, pode-se utilizar a ferramenta on-line:
16 Manipulação de dados A partir da versão o Weka é capaz de ler e salvar arquivos de dados em formatos variados: Excel (xls, xlsx), CSV, JSON, Matlab, TXT e outros formatos Pode ler dados diretamente de bases de dados com queries SQL Tem visualizador e editor simples dos dados carregados Tem um gerador de datasets através de vários métodos
17 Edição de arquivos lidos Após lido um arquivo de entrada (no formato ARFF ou CSV), pode-se editá-lo através do botão Edit da aba Preprocess:
18 Aplicação de filtros No botão Edit da aba Preprocess é possível aplicar diversos filtros às instâncias e atributos do dataset sendo tratado.
19 Outras funcionalidades do Weka Aba Classify: : +100 métodos de classificação, divididos em grupos (Bayesianos, vizinhança, regras, árvores, funções, miscelânea), além de meta-métodos (bagging, boosting e outros). Aba Cluster: : Algoritmos de agrupamento (aprendizado nãosupervisionado) incluindo EM, k-means e agrupamento hierárquico. Aba Associate: Algoritmos para regras de associação, incluindo o Apriori Aba Select attributes: Métodos para seleção de atributos (redução de dimensionalidade) Aba Visualize: Gráficos 2D de valores dos atributos por classe ou por outros atributos, visualizadores de árvores e redes Bayesianas
Mineração de Dados em Biologia Molecular
Mineração de Dados em Biologia Molecular WEKA Tópicos Introdução Simuladores de MD Principais módulos André C. P. L. F. de Carvalho Monitor: Váléria Carvalho André Ponce de Leon de Carvalho 2 Usando MD
Aprendizado de Máquina
Aprendizado de Máquina Introdução ao WEKA Luiz Eduardo S. Oliveira Universidade Federal do Paraná Departamento de Informática http://web.inf.ufpr.br/luizoliveira Luiz S. Oliveira (UFPR) Aprendizado de
Passos para o Aprendizado de Máquina com Pentaho. Prof. Marcos Vinicius Fidelis UTFPR/UEPG
Passos para o Aprendizado de Máquina com Pentaho Prof. Marcos Vinicius Fidelis UTFPR/UEPG Apresentação Professor da UTFPR, leciona Sistemas de Apoio a Decisão e Tópicos Avançados em BD (WEKA, Pentaho e
Redes Neurais no WEKA
Redes Neurais WEKA http://www.cs.waikato.ac.nz/ml/weka/ Redes Neurais no WEKA Introdução ao WEKA Base Benchmark Estudo de Casos Análise de Crédito Bancário 1 Redes Neurais no Weka WEKA (Waikaito Environment
WEKA: Prática Carregando a base de dados no Weka
WEKA: Prática 2 1. Introdução O objetivo desta prática é utilizar a ferramenta Weka para comparar dois algoritmos de aprendizagem de máquina em um problema de detecção de SPAM. Os algoritmos a serem comparados
Implementação de um Modelo para Previsão de Evasão Escolar no IFSULDEMINAS
6ª Jornada Científica e Tecnológica e 3º Simpósio de Pós-Graduação do IFSULDEMINAS 04 e 05 de novembro de 2014, Pouso Alegre/MG Implementação de um Modelo para Previsão de Evasão Escolar no IFSULDEMINAS
Laboratório Classificação com o WEKA Explorer
Laboratório Classificação com o WEKA Explorer Para esse laboratório considere os seguintes classificadores: C4.5 (J4.8) KNN Naïve Bayes Considere as bases de treinamento e teste de dígitos manuscrítos
Mineração de Dados. Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri
Mineração de Dados Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri 1 Motivação Aumento da capacidade de processamento e de armazenamento de dados; Baixo custo; Grande quantidade de dados
Mineração de Dados Aplicada no Contexto Educacional
Giana da Silva Bernardino ¹ e Alexandre Leopoldo Gonçalves Universidade Federal de Santa Catarina ¹[email protected] RESUMO Este trabalho faz uso da mineração de dados com o objetivo de encontrar informações
Laboratório Preprocessamento com WEKA Explorer
Laboratório Preprocessamento com WEKA Explorer Faça o download do dataset test_credit.csv*, e execute as seguintes tarefas: 1. Use o Weka Viewer para ter uma visão geral do dataset original. 2. Substitua
WEKA: The bird. Ferramenta Weka Waikato Environment for Knowledge Analysis. Ambiente WEKA. Explorer. Explorer. Explorer
II Semana de Tecnologia da Informação IFBA Campus Vitória da Conquista 27 a 30 de maio de 2014 WEKA: The bird Ferramenta Weka Waikato Environment for Knowledge Analysis Prof. MSc Pablo Freire Matos Informática
Mineração de Dados - II
Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II Mineração de Dados - II Sylvio Barbon Junior [email protected] 10 de julho de 2015 DC-UEL Sylvio Barbon Jr 1 Sumário Etapa II Algoritmos Básicos Weka: Framework
GUI Ant-Miner: Uma versão atualizada do minerador de dados baseado em colônias de formigas
GUI Ant-Miner: Uma versão atualizada do minerador de dados baseado em colônias de formigas Fernando Meyer 1, Rafael Stubs Parpinelli 1 1 Departamento de Ciência da Computação Universidade do Estado de
Mineração em Data Streams - Weka e MOA. Profa. Elaine Faria UFU
Mineração em Data Streams - Weka e MOA Profa. Elaine Faria UFU - 2018 O que é o Weka? Ferramenta para Aprendizado de Máquina desenvolvida em Java Criado por pesquisadores da Universidade de Waikato Nova
PPGCA/UTFPR câmpus Curitiba -- CAIA003 - Mineração de Dados -- Profs. Celso Kaestner e Heitor Lopes Trabalho #2 Regras de Associação
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ (UTFPR) Mineração de Dados 2016/3 Professores Celso e Heitor Jean Avila Rangel 1801317 - PPGCA PPGCA/UTFPR câmpus Curitiba -- CAIA003 - Mineração de Dados --
Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka
Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka 1 Introdução A mineração de dados (data mining) pode ser definida como o processo automático de descoberta de conhecimento em bases de
Ambiente Weka Waikato Environment for Knowledge Analysis
Universidade Federal de São Carlos - UFSCar Departamento de Computação - DC Programa de Pós-Graduação em Ciência da Computação - PPGCC Ambiente Weka Waikato Environment for Knowledge Analysis Classificação
Técnicas de Mineração de Dados aplicado na Universidade Federal Rural do Semi Árido (UFERSA) Campus Angicos 1*
Técnicas de Mineração de Dados aplicado na Universidade Federal Rural do Semi Árido (UFERSA) Campus Angicos 1* Julio Cartier Maia Gomes 1, Paulo Henrique de Morais 1, Cynthia Moreira Maia¹, Walter Martins
Estrutura de Dados e Algoritmos
Mestrado Integrado em Engenharia Biomédica http://www.fe.up.pt/ rcamacho/cadeiras/eda FEUP Universidade do Porto [email protected] 14 de Setembro de 2009 Objectivos da disciplina A disciplina tem por
Tutorial: Árvore de Decisão com Weka para a classificação de carne suína
Universidade Estadual de Londrina - UEL 2 CTA 121 - Processamento de Imagens em Alimentos Prática de Aprendizado de Máquina com Weka 28/07/2016 Prof. Dr. Sylvio Barbon Jr Tutorial: Árvore de Decisão com
6. QUADRIMESTRE IDEAL 7. NÍVEL Graduação 8. Nº. MÁXIMO DE ALUNOS POR TURMA
Universidade Federal do ABC Rua Santa Adélia, 166 - Bairro Bangu - Santo André - SP - Brasil CEP 09.210-170 - Telefone/Fax: +55 11 4996-3166 1. CÓDIGO E NOME DA DISCIPLINA MC5004 - APRENDIZADO DE MÁQUINA
APLICAÇÃO DE ALGORITMO DE APRENDIZAGEM DE MÁQUINA NÃO-SUPERVISIONADO PARA CLASSIFICAÇÃO DE USUÁRIOS NA REDE SOCIAL ACADÊMICA SCIENTIA.
APLICAÇÃO DE ALGORITMO DE APRENDIZAGEM DE MÁQUINA NÃO-SUPERVISIONADO PARA CLASSIFICAÇÃO DE USUÁRIOS NA REDE SOCIAL ACADÊMICA SCIENTIA.NET Heloína Alves Arnaldo (bolsista do PIBIC/UFPI), Vinicius Ponte
Aplicação de Regras de Associação para Mineração de Dados em uma Empresa do Setor Varejista Visando Auxiliar na Gestão de Vendas
Aplicação de Regras de Associação para Mineração de Dados em uma Empresa do Setor Varejista Visando Auxiliar na Gestão de Vendas Mateus Luiz Gamba 1, Giana da Silva Bernardino 2 1 Universidade Federal
Aprendizado de Máquina (Machine Learning)
Ciência da Computação (Machine Learning) Aula 01 Motivação, áreas de aplicação e fundamentos Max Pereira Nem todo conhecimento tem o mesmo valor. O que torna determinado conhecimento mais importante que
PÓS-GRADUAÇÃO LATO SENSU. Curso: Banco de Dados. Disciplina: Laboratório de Data Warehouse e Business Intelligence Professor: Fernando Zaidan
PÓS-GRADUAÇÃO LATO SENSU Curso: Banco de Dados Disciplina: Laboratório de Data Warehouse e Business Intelligence Professor: Fernando Zaidan Unidade 31 2016 Crédito dos Slides: Clever Junior 2 História
Estatística Aplicada à Administração com o software KNIME. Prof. Dr. Evandro Marcos Saidel Ribeiro
UNIVERSIDADE DE SÃO PAULO FACULDADE DE ECONOMIA, ADMINISTRAÇÃO E CONTABILIDADE DE RIBEIRÃO PRETO DEPARTAMENTO DE ADMINISTRAÇÃO Estatística Aplicada à Administração com o software KNIME Prof. Dr. Evandro
Weka. Universidade de Waikato - Nova Zelândia. Coleção de algoritmos de aprendizado de máquina para resolução de problemas de Data Mining
Weka Universidade de Waikato - Nova Zelândia Coleção de algoritmos de aprendizado de máquina para resolução de problemas de Data Mining implementado em Java open source software http://www.cs.waikato.ac.nz/ml/weka/
Avaliação de Classificadores Anti-spam Aplicada no Campo de Cabeçalho de From:
Avaliação de Classificadores Anti-spam Aplicada no Campo de Cabeçalho de E-mail From: Wallace A.B.S. de Macedo, Júlio Cesar Nievola Centro de Ciências Exatas e de Tecnologia Pontifícia Universidade Católica
IMPLEMENTAÇÃO DE CLASSIFICAÇÃO BAYESIANA
IMPLEMENTAÇÃO DE CLASSIFICAÇÃO BAYESIANA Gabriela Silva de Oliveira¹, Silvio do Lago Pereira² ¹Aluna do Curso de Análise e Desenvolvimento de Sistemas DTI/FATEC-SP ²Prof. Dr. do Departamento de Tecnologia
BIBLIOMETRIA ANEXO I COMO EXPORTAR DADOS NAS BASES SCOPUS E EBSCOHOST
BIBLIOMETRIA ANEXO I COMO EXPORTAR DADOS NAS BASES SCOPUS E EBSCOHOST Os repositórios digitais também podem servir de ferramentas para análise bibliométrica (produtividade de autores, de periódicos, palavras-chave,
SCC0173 Mineração de Dados Biológicos
SCC0173 Mineração de Dados Biológicos Classificação I: Algoritmos 1Rule e KNN Prof. Ricardo J. G. B. Campello SCC / ICMC / USP 1 Créditos O material a seguir consiste de adaptações e extensões dos originais:
Microsoft Office Bruno Giancristoforo Jorge Bittencourt
Microsoft Office 2007 Bruno Giancristoforo Jorge Bittencourt Padrão de Armazenamento de Arquivos Padrão de armazenamento de arquivos aberto e padronizado por comunidade internacional Formato XML permite
MSP430 Lab 02 Criar e Compilar um projeto
MSP430 Lab 02 Criar e Compilar um projeto Software CCS Neste post iremos criar um novo projeto utilizando a IDE CCS da Texas Instruments, compilar o código feito em linguagem C e fazer o Debug da aplicação
ANÁLISE ESPACIAL DOS ÍNDICES EDUCACIONAIS DO RIO GRANDE DO NORTE COM O USO DE TÉCNICAS DE MINERAÇÃO DE DADOS
ANÁLISE ESPACIAL DOS ÍNDICES EDUCACIONAIS DO RIO GRANDE DO NORTE COM O USO DE TÉCNICAS DE MINERAÇÃO DE DADOS Fábio Abrantes Diniz 1, Fabiano Rosemberg de Moura Silva 2, Roberto Douglas da Costa 3, Thiago
Fundamentos de Mineração de Dados
Fundamentos de Mineração de Dados Prof. Ricardo Fernandes [email protected] O que é Mineração de Dados? Uso de ferramentas matemáticas, clássicas ou inteligentes, no processo de descoberta de conhecimento
Métodos para Classificação: - Naïve Bayes.
Métodos para Classificação: - 1R; - Naïve Bayes. Visão Geral: Simplicidade em primeiro lugar: 1R; Naïve Bayes. 2 Classificação: Tarefa: Dado um conjunto de exemplos préclassificados, construir um modelo
INSTALAÇÃO DO PROCESSOR BI 6.0
INSTALAÇÃO DO PROCESSOR BI 6.0 1 Sumário Pré-requisitos... 3 Servidor:... 3 Cliente:... 4 Instalação... 5 Banco de Dados:... 5 Aplicação:... 7 Configurando o IIS:... 8 Configurações recomendadas do Internet
Figura 1. Tela de inicialização do WEKA. 2. Será apresentada a seguinte janela, que iremos utilizar para testar as respostas do WEKA.
WEKA: Prática 1 Nesta primeira prática vamos usar o Explorer, para treinar o WEKA e depois testarmos a eficiência das respostas de acordo com a base de conhecimento informada. 1. Iniciando o WEKA Explorer
Instalação pré-configurada da plataforma Pentaho Demonstração do uso de relatórios, cubos e dashboards
Pentaho BI Suite Pentaho BI Platform demo Instalação pré-configurada da plataforma Pentaho Demonstração do uso de relatórios, cubos e dashboards Base de dados Steel Wheels Download http://sourceforge.net/projects/pentaho/files/
Novidades do ENVI 5.4 Harris Proprietary Information
Place image here (13.33 x 3.5 ) Novidades do ENVI 5.4 SISTEMAS, SENSORES E FORMATO DE DADOS O ENVI 5.4 segue com a tradição de oferecer o mais amplo suporte de importação de sensores, formatos de dados
Solisc 2010 Uma Introdução ao Pentaho BI Open Source
Solisc 2010 Uma Introdução ao Pentaho BI Open Source Marcio Junior Vieira marcio @ ambientelivre.com.br Sobre o Palestrante A 10 anos trabalha nas áreas de análise, consultoria e desenvolvimento de sistemas.
APRESENTAÇÃO DO SPSS
APRESENTAÇÃO DO SPSS O Statistical Package for Social Science for Windows (SPSS) - O SPSS e um software estatístico que permite a utilização de dados em diversos formatos para gerar relatórios, calcular
Classificação. Eduardo Raul Hruschka
Classificação Eduardo Raul Hruschka Agenda: Conceitos de Classificação Técnicas de Classificação One Rule (1R) Naive Bayes (com seleção de atributos) Super-ajuste e validação cruzada Combinação de Modelos
Tutorial sobre o uso da ferramenta de autoria A Ferramenta de Autoria - Célula
Tutorial sobre o uso da ferramenta de autoria A Ferramenta de Autoria - Célula Célula é uma Ferramenta de Autoria para o padrão Ginga. Auxilia no processo de criação da interatividade na TV Digital e é
KDD E MINERAÇÃO DE DADOS
KDD E MINERAÇÃO DE DADOS O Processo de KDD: Visão Geral Prof. Ronaldo R. Goldschmidt [email protected] [email protected] geocities.yahoo.com.br/ronaldo_goldschmidt CARACTERIZAÇÃO ÁREAS DE ORIGEM
Sistema de mineração de dados para descobertas de regras e padrões em dados médicos
Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Pollyanna Carolina BARBOSA¹; Thiago MAGELA² 1Aluna do Curso Superior Tecnólogo em Análise e Desenvolvimento de Sistemas
Introdução Capítulo 1: Um Olhar sobre as Funcionalidades e Interface do Microsoft Excel
Introdução... 25 1. Que Usos para o Microsoft Excel?...25 2. Funcionalidades Disponibilizadas pelo Microsoft Excel...25 3. Tabelas e Gráficos Dinâmicos: As Ferramentas de Análise de Dados Desconhecidas...26
UMA INTERFACE DE GERENCIAMENTO DE REDES DEFINIDAS POR SOFTWARE
UMA INTERFACE DE GERENCIAMENTO DE REDES DEFINIDAS POR SOFTWARE Fagner Jefferson de Araújo Silva; Whasley Sousa Cardoso; Marcelo Portela Sousa. Instituto Federal de Educação, Ciência e Tecnologia da Paraíba
Classificação Automática de Gêneros Musicais
Introdução Método Experimentos Conclusões Utilizando Métodos de Bagging e Boosting Carlos N. Silla Jr. Celso Kaestner Alessandro Koerich Pontifícia Universidade Católica do Paraná Programa de Pós-Graduação
Inteligência Artificial
Universidade Federal de Campina Grande Departamento de Sistemas e Computação Pós-Graduação em Ciência da Computação Inteligência Artificial Aprendizagem Outras Técnicas Prof. a Joseana Macêdo Fechine Régis
MINERAÇÃO DE DADOS NO MOODLE: ANÁLISE DE PRAZOS DE ENTREGA DE ATIVIDADES
UNIVERSIDADE FEDERAL DE SANTA MARIA CENTRO DE TECNOLOGIA PROGRAMA DE PÓS-GRADUAÇÃO EM INFORMÁTICA MINERAÇÃO DE DADOS NO MOODLE: ANÁLISE DE PRAZOS DE ENTREGA DE ATIVIDADES DISSERTAÇÃO DE MESTRADO Fabieli
