Mineração de Dados em Biologia Molecular

Documentos relacionados
Prof. Heitor Silvério Lopes

Aprendizado de Máquina

Passos para o Aprendizado de Máquina com Pentaho. Prof. Marcos Vinicius Fidelis UTFPR/UEPG

Implementação de um Modelo para Previsão de Evasão Escolar no IFSULDEMINAS

Ferramentas de Suporte

Redes Neurais no WEKA

Software Para Geração de Consultas e Relatórios

19 Congresso de Iniciação Científica INCLUSÃO DE UM NOVO ALGORITMO DE CLASSIFICAÇÃO NA FERRAMENTA KIRA

Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta

APLICAÇÃO DE ALGORITMO DE APRENDIZAGEM DE MÁQUINA NÃO-SUPERVISIONADO PARA CLASSIFICAÇÃO DE USUÁRIOS NA REDE SOCIAL ACADÊMICA SCIENTIA.

Sistemas de Informação e Decisão. Douglas Farias Cordeiro

Laboratório Classificação com o WEKA Explorer

UnoTech Soluções em Histórico da Revisão Data Versão Descrição Autor 27/05/ 1.0 Construção do Documento Carlos GG Flor Página 2

UMA INTERFACE DE GERENCIAMENTO DE REDES DEFINIDAS POR SOFTWARE

VISEDU-CG: Aplicação Didática para Visualizar Material Educacional, Módulo de Computação Gráfica

Curso online de Fundamentos em Android. Plano de Estudo

UTILIZANDO O CODE BLOCKS

Antes de falarmos do novo modelo, vamos entender como o SophiA trabalhou até hoje.

Pesquisa de Produtos - Estoque

Introdução Capítulo 1: Um Olhar sobre as Funcionalidades e Interface do Microsoft Excel

WEKA: Prática Carregando a base de dados no Weka

MANUAL DE INSTALAÇÃO SISTEMA DE GERÊNCIA CONSCIUS

PORTAL DE COMPRAS PÚBLICAS GUIA DO ADMINISTRADOR PREGÃO ELETRÔNICO 07/JUNH0/2016

Estudo do Ambiente de Programação Arduino Software (IDE) com Intel Galileo Gen2. Apostila de acompanhamento para o aluno.

BI ApexBrasil. Mudanças da Versão 11g. BI 11g Fevereiro/2012

5 Implementação 5.1 Plataforma 5.2 Arquitetura

Gestão Unificada de Recursos Institucionais GURI

Implementação de uma biblioteca gráfica multiplataforma utilizando OpenGL e GLFW.

Estatística Aplicada à Administração com o software KNIME. Prof. Dr. Evandro Marcos Saidel Ribeiro

Biblioteca de auxílio ao uso de elementos gráficos

Infor LN Service Guia do usuário para o nivelamento da carga de trabalho

Tutorial sobre o uso da ferramenta de autoria A Ferramenta de Autoria - Célula

Mineração de Dados. Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri

Tutorial da ferramenta de modelagem ASTAH (Versão resumida) Prof. Moacyr Franco Neto

Infor LN Service Guia do usuário para o Console de planejamento de território

Manual. Portal de Seminovos

6 IMPLEMENTAÇÃO DO MODELO DE REFERÊNCIA

Programação de Computadores

PORTAL DE COMPRAS PÚBLICAS

SISTEMA ATENA INSTITUIÇÕES DE ENSINO

Novidades da Plataforma de suporte remoto 3.0

Guia prático do. Passo a passo

Inclusão tecnológica aos discentes do Ensino Fundamental II através do Software R

Copyright 2004/ VLC

Simulação de Caixa Automático

Inteligência Computacional Aula 2 - Introdução ao MatLab Graduação /2

Victor Hugo Andrade Soares monitor João Vitor dos Santos Tristão Primeiro Trabalho Prático

Manual de Utilização do Convert Video. Passo Fundo, abril de Av. Presidente Vargas, 1305 / Sala 201 Passo Fundo RS

DESENVOLVIMENTO DE SOFWARE PARA PROJETO DE ELEMENTOS SENSORES PIEZORESISTIVOS 1

CP Introdução à Informática Prof. Msc. Carlos de Salles

GUI Ant-Miner: Uma versão atualizada do minerador de dados baseado em colônias de formigas

Manual de Compilação/Execução da Aplicação SmartHome

Campus Capivari Análise e Desenvolvimento de Sistemas (ADS) Prof. André Luís Belini /

Laboratório Preprocessamento com WEKA Explorer

Avaliação Institucional. Manual do Usuário Coordenador de Curso STI-UFC

Laboratório 1-05/07/2018

Estatísticas e Relatórios. Treinamento OTRS Help Desk

Sistema de Atendimento Telefônico Automático. Manual do Usuário

Finanças do Infor LN Guia do usuário para controladoria

Ubiratam Carvalho de Paula Junior Rafaelli de Carvalho Coutinho

18º Congresso de Iniciação Científica INCORPORAÇÃO DA TAREFA DE CLASSIFICAÇÃO NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA

Simulador didático de testes de algoritmos de ordenação

Data Mining Software Weka. Software Weka. Software Weka 30/10/2012

Fa u amen o E e ôn co CASSEMS

Introdução a Tecnologia da Informação

Neste capítulo será descrito detalhadamente o desenvolvimento do software do sistema FEROS, justificando a escolha das tecnologias envolvidas.

Introdução ao Desenvolvimento de

2 Conceitos importantes

Manual. Portal de Seminovos

Segundo Trabalho Prático

Instalação e Operação do Leitor de Tracer do SAO WEB

SISNOR WEB SISTEMA INTEGRADO DE APOIO À FISCALIZAÇÃO DOS SERVIÇOS NOTARIAIS E DE REGISTRO INFORMAÇÕES GERAIS

Introdução. descrever os tipos de interfaces e linguagens oferecidas por um SGBD. mostrar o ambiente de programas dos SGBD s

PACOTE DE ATUALIZAÇÕES 2014

Criação da Base de Conhecimento

PORTAL DE COMPRAS PÚBLICAS

O que há de novo no Autodesk Navisworks 2011?

Gerando um programa executável a partir de um módulo Python

Actiwatch. Guia do clínico

Manual do Tutor PIRELLI TYRE CAMPUS

Processo de Controle

IHC Interação Homem- Computador. Profa.Denise Neves

Versão do documento agosto Usando recursos avançados de geração de relatórios Soluções Ariba On-Demand

SÍNDICO e SUBSÍNDICO CONFIGURAÇÕES

SISTEMA INTEGRADO DE APOIO À FISCALIZAÇÃO DOS SERVIÇOS NOTARIAIS E DE REGISTRO SISNOR INFORMAÇÕES GERAIS

Personalizando o seu PC

Roteiro. PCC142 / BCC444 - Mineração de Dados. Cenário

Interatividade. Limitado Reativa Coativa. Alargado Coativa Proativa

Faculdades Santa Cruz

Consulta Estoque de Veículos

Nota de Aplicação: Cliente ios com BluePlant. Sumário

Prof. Ms. Ronaldo Martins da Costa

Figura 1. Tela de inicialização do WEKA. 2. Será apresentada a seguinte janela, que iremos utilizar para testar as respostas do WEKA.

Sistema Mobi-Lar Engenharia de Software

IO Instrução Operacional Código: IO-SMA/SRH/CEDRE/ACE Título: Criar Permissões no Sistema Ronda

Transcrição:

Mineração de Dados em Biologia Molecular WEKA Tópicos Introdução Simuladores de MD Principais módulos André C. P. L. F. de Carvalho Monitor: Váléria Carvalho André Ponce de Leon de Carvalho 2 Usando MD Implementação e simulação Escrever código do zero Reaproveitar código Utilizar um ambiente dedicado Fornece ferramentas apropriadas para auxiliar o usuário ao longo de toda a simulação Minimiza esforço do usuário Agiliza implementação e realização de experimentos Ambientes para MD Principais tipos Baseados em telas e interfaces gráficas Baseados em biblioteca de funções (lego) Baseados em uma linguagem de programação específica Funcionalidades Suporte a pré-processamento e análise de resultados Grande número de algoritmos de AM, técnicas estatísticas e ferramentas de visualização André Ponce de Leon de Carvalho 3 André Ponce de Leon de Carvalho 4 Ambientes de MD Comerciais SAS SPSS Matlab Públicos Rapid miner Knime WEKA WEKA o Pássaro Pássaro típico da Nova Zelândia Encontrado apenas lá Não voa Tamanho de uma galinha Alimentam-se de invertebrados e frutas Dócil em extremo Quase foram a extinção André Ponce de Leon de Carvalho 5 André Ponce de Leon de Carvalho 6 1

WEKA o Pássaro Weka o Ambiente Desenvolvido na Universidade de Waikato, NZ Mineração de Dados e Aprendizado de Máquina Escrito em JAVA Distribuído por meio da licença de software livre da GNU Utilizada com diferentes propósitos Ensino, pesquisa, aplicações Copyright: Martin Kramer (mkramer@wxs.nl) André Ponce de Leon de Carvalho 7 André Ponce de Leon de Carvalho 8 Onde fica Waikato? 1992: Submissão do projeto para financiamento pelo governo da NZ por Ian Witten 1993: Financiado aprovado pelo governo Sigla WEKA criada por Geoff Holmes Waikato Environment for Knowledge Analysis Criação do formato ARFF por Andrew Donkin Attribute-Relation File Format Segundo rumores, Andrew s Ridiculous File Format André Ponce de Leon de Carvalho 9 André Ponce de Leon de Carvalho 10 1994: Primeira versão é disponibilizada Interface TCL/TK e algoritmos de aprendizado escritos principalmente em C Versão beta 1996: Primeira versão pública: WEKA 2.1 1997: Decisão de reescrever o código em Java Tese de doutorado de Eibe Frank 1998 Disponibilizado WEKA 2.3, última versão baseada em TCL/TK 1998: Disponibilizado WEKA 3 Primeira versão completamente em Java Inclusão do módulo de desenvolvimento, com GUI Compatível com livro do Wittel e Frank André Ponce de Leon de Carvalho 11 André Ponce de Leon de Carvalho 12 2

Últimas Versões do WEKA Várias versões foram desenvolvidas depois: WEKA 3.2: versão GUI, adiciona GUI (versão do livro usava linha de comando) WEKA 3.3: versão de desenvolvimento com várias melhorias WEKA 3.4: versão do livro compatível com segunda edição do livro Data Mining WEKA 3.6: última versão estável (3.6.7) WEKA 3.7: finalizada, mas ainda instável Possui vários módulos, que podem ser utilizados para: Pré-processamento de dados Uso de algoritmos de Aprendizado de Máquina Análise de resultados Visualização gráfica de dados e modelos Comparação de modelos (e algoritmos) André Ponce de Leon de Carvalho 13 André Ponce de Leon de Carvalho 14 Com WEKA, é possível Abrir um conjunto de dados em diferentes formatos Pré-processar os dados por meio de filtros Aplicar um algoritmo de AM aos dados Ajustar parâmetros dos algoritmos Analisar os resultados obtidos Utilizar diversas medidas de desempenho 3 formas de usar Aplicar um algoritmo de aprendizado a um conjunto de dados e analisar a saída para saber mais sobre os dados Usar modelos induzidos para gerar previsões para novos dados Comparar desempenho de diferentes algoritmos para selecionar um deles André Ponce de Leon de Carvalho 15 André Ponce de Leon de Carvalho 16 Como usar WEKA? Linhas de comando A partir de programas em Java Chamar métodos do WEKA utilizando suas bibliotecas Permite escrever e testar novos algoritmos Usando GUI do Mais fácil Uma das opções do WEKA GUI Chooser Graphical User Interface Ponto inicial para chamar as principais aplicações e ferramentas de suporte Possui quatro opções: KnowledgeFlow SimpleCLI André Ponce de Leon de Carvalho 17 André Ponce de Leon de Carvalho 18 3

Funcionalidades são acessadas por Escolha de uma opção de um menu Permite apenas as opções exibidas no momento da simulação Preenchimento de valores em telas Pré-preenchidos com valores defaultpara obtenção de resultados com o mínimo de esforço Entender os algoritmos e seu uso é importante para entender os resultados André Ponce de Leon de Carvalho 19 André Ponce de Leon de Carvalho 20 Principais Opções Ambiente para exploração de dados Ambiente para realização de experimentos e testes estatísticos Permite comparar modelos Principais Aplicações KnwoledgeFlow Suporta mesmas funções que, além de aprendizado incremental Permite trabalhar com fluxos de dados Inclui interface drag-and-drop(arrastar e por) SimpleCLI Interface para linha de comando Permite que comandos do WEKA sejam executados por sistemas operacionais que não possuem interface GUI André Ponce de Leon de Carvalho 21 André Ponce de Leon de Carvalho 22 Ferramenta gráfica de fácil uso que mostra as funcionalidades do software Cada um dos principais pacotes disponíveis é representado na interface Filtros Algoritmos de classificação Algoritmos de agrupamento Algoritmos de associação Algoritmos de seleção de atributos Ferramenta de visualização Ferramentas de visualização permitem a análise em duas dimensões de: Dados de um conjunto Predições geradas por: Modelos de classificação Modelos de agrupamento de dados Possui vários painéis André Ponce de Leon de Carvalho 23 André Ponce de Leon de Carvalho 24 4

KnowlegdeFlow Permite colocar ícones representando algoritmos e fontes de dados na tela E uni-los na configuração desejada Permite definir um fluxo de dados Conectando componentes representando Fontes de dados Ferramentas de pré-processamento Algoritmos de aprendizado Métodos de avaliação Módulos de visualização Ajuda a definir quando aplicar técnicas de classificação (e de regressão) Que métodos e valores de parâmetros funcionam melhor para um dado problema? Resposta não fácil Permite comparar vários algoritmos de aprendizado Pode ser feito interativamente com explorer Módulo automatiza esse processo André Ponce de Leon de Carvalho 25 André Ponce de Leon de Carvalho 26 Como automatiza? Torna mais fácil: Executar algoritmos com: Diferentes valores para seus parâmetros e Vários conjuntos de dados Avaliar desempenho estatístico Realizar testes de significância Pode ser usado para distribuir carga em várias máquinas Usando Java Remote Method Invocation(RMI) Documentação Documentação onlinegerada automaticamente do código fonte Única fonte completa dos algoritmos disponíveis WEKA esta continuamente em crescimento Por ser gerada automaticamente a partir do código fonte, documentação online esta sempre atualizada André Ponce de Leon de Carvalho 27 André Ponce de Leon de Carvalho 28 Prática Entrar na ferramenta WEKA Selecionar opção explorer Carregar base de dados iris.arrf Opção Open file Carregar classificador J48 Opção Classifier Em Classifier, opção Choose J48 Realizar experimento usando training set Olhar resultados Perguntas André Ponce de Leon de Carvalho 29 André Ponce de Leon de Carvalho 30 5