Aprendizado de Máquina

Documentos relacionados
Laboratório Classificação com o WEKA Explorer

Mineração de Dados em Biologia Molecular

Prof. Heitor Silvério Lopes

Laboratório Preprocessamento com WEKA Explorer

WEKA: Prática Carregando a base de dados no Weka

Redes Neurais no WEKA

Figura 1. Tela de inicialização do WEKA. 2. Será apresentada a seguinte janela, que iremos utilizar para testar as respostas do WEKA.

Tutorial: Árvore de Decisão com Weka para a classificação de carne suína

Weka. Universidade de Waikato - Nova Zelândia. Coleção de algoritmos de aprendizado de máquina para resolução de problemas de Data Mining

Aprendizagem de Máquina

Manual de Compilação/Execução da Aplicação SmartHome

MTA Monitor. Manual de Usuário. Transferência de Arquivos. Versão: Última modificação: 11/11/2014

SQL Server Management Studio - Backup e Restauração de dados

Inteligência nos Negócios (Business Inteligente)

Tutorial básico de classificação em RapidMiner

Conteúdo Como gerar os arquivos pelo WinMFD da Bematech?... 3 Como saber a data do arquivo?... 9 Como copiar os arquivos gerados para o PENDRIVE:...

INFORMÁTICA. 04. Pode-se dizer que tanto o Windows, quanto o Linux possuem o kernel aberto, podendo ser facilmente customizados pelos usuários.

Aula Prática de Redes Industriais Wireshark

Objetivo: Teste de Ponto e Teste de Busca da característica (zonas).

WEKA: The bird. Ferramenta Weka Waikato Environment for Knowledge Analysis. Ambiente WEKA. Explorer. Explorer. Explorer

MSP430 Lab 02 Criar e Compilar um projeto

Instalação do TextPad

Aprendizado de Máquina

Manual Básico - VeraCrypt

EBRcart2 digital cart machine

Configurador do JBOSS. TOTVS Datasul 11. Alerta

Inclusão dos pacotes de serviços Toyota

Manual Coleta de Dados Hyperterminal

STD SERVIÇO DE BACKUP EM NUVEM

Procedimentos para Atualização Sisloc

Tutorial sobre o uso da ferramenta de autoria A Ferramenta de Autoria - Célula

Redes Neurais Artificiais. Sistemas de Informação/Ciências da Computação UNISUL Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 9)

Sankhya Web Connection. Versão: 02 Criado em: 28/03/2017

Portal nddcargo Manual de Utilização Central de Relacionamento Visão Gerente

Aplicativo RockSim Tutorial 1

MANUAL DE INSTALAÇÃO SISTEMA DE GERÊNCIA CONSCIUS

Aplicativo RockSim Tutorial 2c

Código PD0017. Este documento ter por objetivo auxiliar o usuário no entendimento e utilização do Nexus.

IDES E PROGRAMAÇÃO. Prof. Dr. Cláudio Fabiano Motta Toledo PAE: Maurício A Dias

Administrador Documentos. Gestão de Documentos. Título do documento

Mineração de Dados. Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri

Aplicativo RockSim Tutorial 3

Estruturas de Sistemas Operacionais

Aprendizado de Máquina (Machine Learning)

PROGRAMACAO E INTEGRACAO DE JOGOS I

Manual do Usuário. Uma plataforma:

Instalação Serviço de Acompanhamento de Projeto (PCSIS007) Sistema de Gestão da Qualidade

Manifestação de Destinatário

MyMLE MOODLE Ferramenta para desenvolvimento de Objetos de Aprendizagem para Celulares

Como utilizar o Tux Paint

Open Day Bibliotecas ElipseX

Manual de Instalação C3SL

Mineração de Dados - II

Secure Client. Manual do Usuário. IPNv2. Secure Client IPNv2

MLaaS com Azure: Que tipo de flor de íris é essa?

O Camguard permite detectar e gravar vídeos facilmente com uma webcam.

Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas

Reconhecimento de Padrões

Como Fazer o Fechamento de Caixa no PDV-PAF? - FPF05

Manual do Usuário Linux Educacional 6.0 C3SL

MANUAL DE PROCEDIMENTOS

Aprendizagem de Máquina. Prof. Júlio Cesar Nievola PPGIA - PUCPR

Configurações para acessar o Sadig pela Rede

Tutorial de Navegação

MANUAL DE UTILIZAÇÃO COLETOR OPTIMUS METROLOGIC SP5500

PROCEDIMENTO OPERACIONAL PADRÃO Fazendo Escalas e Medidas no Sistema de Captura de Imagens Q Capture Pró

Manual SIGOSMS Aplicação de Gerenciamento e Envio SMS

Fa u amen o E e ôn co CASSEMS

Título: Como configurar o gerenciador Busca NF-e no meu Cliente do Escritório?

Fixo (41) Vivo (41) Tim (41) Claro (41) OI (41) Sistema Descomplicado CNPJ

Capítulo 11. GRÁFICOS COM WGNUPLOT

PROJETO INFORMÁTICA NA ESCOLA

EXERCÍCIOS COMPLEMENTARES AULA 3

MAC 0425/ Inteligência Artificial

APLICAÇÃO DE ALGORITMO DE APRENDIZAGEM DE MÁQUINA NÃO-SUPERVISIONADO PARA CLASSIFICAÇÃO DE USUÁRIOS NA REDE SOCIAL ACADÊMICA SCIENTIA.

PROCEDIMENTOS OPERACIONAIS DE TROCA DE MFD PELA REDE CREDENCIADA BEMATECH

Salvar Relatórios em Arquivo

Aplicativo RockSim Tutorial 2b

Passos para o Aprendizado de Máquina com Pentaho. Prof. Marcos Vinicius Fidelis UTFPR/UEPG

TOTVS Utilização dos Aplicativos. Arquitetura e Instalação

Transcrição:

Aprendizado de Máquina Introdução ao WEKA Luiz Eduardo S. Oliveira Universidade Federal do Paraná Departamento de Informática http://web.inf.ufpr.br/luizoliveira Luiz S. Oliveira (UFPR) Aprendizado de Máquina 1 / 16

Conteúdo 1 Introdução 2 Conceitos Básicos 3 Ambiente Gráfico Luiz S. Oliveira (UFPR) Aprendizado de Máquina 2 / 16

Weka Waikato Environment for Knowledge Analysis. Conjunto de algoritmos de aprendizagem de máquina Desenvolvido em Java na Universidade de Waikato, Nova Zelândia Software livre (GNU General Public License) Disponibiliza quatro ambientes Explorer Experimenter KnowledgeFlow SimpleCLI (linha de comando) Luiz S. Oliveira (UFPR) Aprendizado de Máquina 3 / 16

Linha de Comando Para realizar qualquer experimento, em geral o ambiente gráfico é suficiente Entretanto, para experimentos mais elaborados, executar os experimentos em linha de comando pode ser mais prático. Integração com outros aplicativos Busca por parâmetros Múltiplas execuções Execução remota sem ambiente gráfico Memória A memória default é de 16 a 64M, o que pode ser pouco para grandes bases de dados Para aumentar a memória use a opção -Xmx1024M, por exemplo (1GB). Luiz S. Oliveira (UFPR) Aprendizado de Máquina 4 / 16

Ambiente Não esqueça de incluir o caminho do arquivo weka.jar na variável CLASSPATH Isso pode ser feito incluindo a seguinte linha no arquivo.profile do seu diretório. export CLASSPATH=/.../tools/weka/weka-3-6-2/weka.jar:$CLASSPATH Luiz S. Oliveira (UFPR) Aprendizado de Máquina 5 / 16

Arquivos.arff O arquivo de características (dataset) é o conceito mais básico na aprendizagem de máquina. Atributos que descrevem o padrão Um dataset é uma coleção de exemplos, cada um deles da classe weka.core.instance Cada instância tem um certo número de atributos, podendo ser Nominal (um de uma lista predefinida de valores) Numeric (um valor inteiro ou real) String Exemplo de um arquivo.arff Luiz S. Oliveira (UFPR) Aprendizado de Máquina 6 / 16

Estatísticas Algumas estatísticas básicas podem ser geradas atravésda rotina weka.core.instances Outras rotinas úteis como weka.core.converters.cvsloader também estão disponíveis. Para mais detalhes consulte o manual. Luiz S. Oliveira (UFPR) Aprendizado de Máquina 7 / 16

Classificadores Qualquer algoritmo de aprendizagem no WEKA é derivado da classe abstrata weka.classifiers.classifier Um classificador mapeia os atributos de cada instância do dataset para uma única classe. A maneira como isso é feito difere de classificador para classificador. Exemplo: java weka.classifiers.bayes.naivebayes -t iris.arff Para opções (exemplo -i para saída detalhada), consulte o manual Luiz S. Oliveira (UFPR) Aprendizado de Máquina 8 / 16

Executando WEKA O ambiente gráfico do WEKA possui quatro aplicações: Explorer: Ambiente para explorar dados, classificadores, etc Experimenter: Ambiente para realizar experimentos e realizar testes estatísticos KnowledgeFlow: Tem a mesma funcionalidade do Explorer com uma interface drag-and-drop SimpleCLI: Interface em linha de comando para sistemas operacionais que não disponibilizam sua propria interface em linha de comando. Luiz S. Oliveira (UFPR) Aprendizado de Máquina 9 / 16

Explorer As seguintes opções estão disponíveis no ambiente explorer (após abrir um arquivo de dados) Preprocess: Escolher e modificar os dados Classify: Treinar e testar diferentes esquemas de classificação Cluster: Aprender agrupamentos (clustering) de dados Select Attributes: Selecionar os atributos mais relevantes Visualize: Vizualização 2D dos dados Status Box Uma caixa de status aparece na parte inferior da janela. Botão direito habilita algumas outras opções como por exemplo o uso de memória. Log Mostra uma janela com um log de tudo que foi realizado durante a sessão. Salvando Gráficos Todo e qualquer janela gráfica pode ser gravada com a seguinte sequência de comandos: alt+shift+left click. Luiz S. Oliveira (UFPR) Aprendizado de Máquina 10 / 16

Carregando Dados Open file: Carrega os dados de um arquivo.arff. Open URL: Carrega os dados de um determinado endereço Open DB: Lê os dados de um banco de dados Generate: Gera dados sintéticos para validar experimentos. Luiz S. Oliveira (UFPR) Aprendizado de Máquina 11 / 16

Filtros Permite transformar os dados de diferentes maneiras. No WEKA eles estão divididos em supervisionados e não supervisionados Os filtros supervisionados levam em consideração as classes, o que não acontece nos não supervisionados. Os filtros podem ser aplicados nas instâncias ou nos atributos. Entre os filtros mais utilizados estão Discretize (supervised): Discretiza valores numéricos em nominais NominalToBinary (supervised): Transforma valores nominais em binários Standardize (non-supervised): Normaliza os atributos para ficarem com média 0 e desvio 1. Após escolher o filtro basta clicar no botão Apply. Note que vários classificadores aplicam filtros de maneira automática. Luiz S. Oliveira (UFPR) Aprendizado de Máquina 12 / 16

Filtros Luiz S. Oliveira (UFPR) Aprendizado de Máquina 13 / 16

Classificação Na lista superior de opções escolha Classify e então clique no botão Choose. As seguintes opções de teste estão disponíveis Use training set: Utiliza o mesmo dataset para treinar e testar o modelo Supplied test set: O usuário fornece um outro arquivo para testes Cross-validation: Realiza validação cruzada utilizando o número de folds indicado pelo usuário. Percentage split: Separa uma partição para treinamento e outra para teste. Clicando com o botão direito sobre um classificador, você pode gravar o modelo aprendido. Mais tarde esse modelo pode ser carregado e testado com uma outra base de dados qualquer. Mais opções estão disponíveis no botão More options (ver manual) Luiz S. Oliveira (UFPR) Aprendizado de Máquina 14 / 16

Clustering Funciona de maneira bastante similar ao processo de classificação Luiz S. Oliveira (UFPR) Aprendizado de Máquina 15 / 16

Clustering Exemplo utilizando KMeans com três clusters Luiz S. Oliveira (UFPR) Aprendizado de Máquina 16 / 16