PPGCA/UTFPR câmpus Curitiba -- CAIA003 - Mineração de Dados -- Profs. Celso Kaestner e Heitor Lopes Trabalho #2 Regras de Associação

Tamanho: px
Começar a partir da página:

Download "PPGCA/UTFPR câmpus Curitiba -- CAIA003 - Mineração de Dados -- Profs. Celso Kaestner e Heitor Lopes Trabalho #2 Regras de Associação"

Transcrição

1 UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ (UTFPR) Mineração de Dados 2016/3 Professores Celso e Heitor Jean Avila Rangel PPGCA PPGCA/UTFPR câmpus Curitiba -- CAIA003 - Mineração de Dados -- Profs. Celso Kaestner e Heitor Lopes Trabalho #2 Regras de Associação 1) Um total de 10 pacientes estiveram em um Posto de Saúde com sintomas que sugerem gripe, mostrados na tabela abaixo. Considere o atendimento de cada paciente como uma transação de uma cesta de compras, onde cada sintoma é um item comprado. Paciente Sintomas (a=febre, b=tosse, c=coriza, d=fadiga, e=dor de cabeça) 1 {a,d,e} 2 {a,b,c,e} 3 {a,b,d,e} 4 {a,c,d,e} 5 {b,c,e} 6 {b,d,e} 7 {c,d} 8 {a,b,c} 9 {a,d,e} 10 {a,b,e} a) Calcule o Suporte para os conjuntos de sintomas {dor de cabeça}, {tosse, fadiga, dor de cabeça} e {tosse, fadiga}. Suporte: os pacientes com DOR DE CABEÇA: 1, 2, 3, 4, 5, 6, 9 e 10 = 8 8/10 = 0,8 os pacientes com TOSSE, FADIGA e DOR DE CABEÇA: 3 e 6 = 2 2/10 = 0,2 os pacientes com TOSSE e FADIGA: 3 e 6 = 2 2/10 = 0,2 Confiança: FADIGA -> DOR DE CABEÇA Fadiga: 1, 3, 4, 6, 9 = 5 Dor de cabeça: 1, 3, 4, 6, 9, 10 = 6 5 / 6 = 0,833 DOR DE CABEÇA -> FADIGA Dor de cabeça: 1, 2, 3, 4, 5, 6, 9 e 10 = 8 5/8 = 0,625 A confiança NÃO é assimétrica. Se inverter os atributos, o resultado sai diferente.

2 c) Quantas regras têm Suporte mínimo de 0,5? Os elementos sozinhos acontecem na seguinte quantidade de vezes: A = 7 B = 6 C = 5 D = 6 E = 8 Existem 8 regras com suporte mínimo de 0,5 d) Descubra a regra de maior Confiança possível que tenha Suporte mínimo de 50%. Informe também o valor da Confiança. A maior confiança possível no suporte mínimo de 0.5 é de 100%. Todos os pacientes que NÃO apresentaram CORIZA possuíam DOR DE CABEÇA. Em segundo lugar, ocorre a regra que diz que quando o paciente tem FEBRE (7 casos), ele possui DOR DE CABEÇA. A confiança nessa regra é de 0.86, pois acontecem em 6 casos (de 7). 2) Faça download do dataset Fertility disponível no Machine Learning Repository. Este dataset tem a finalidade de determinar a normalidade ou não da concentração de espermatozoides em 100 voluntários, de acordo com critérios da OMS, com base em 9 atributos sócio-demográficos, ambientais, hábitos de vida e saúde. a) O dataset tem todos os atributos numéricos que precisam ser transformados em nominais para o uso no software Weka. Isto pode ser feito diretamente com o Weka, na aba pre-processamento utilizando os filtros não-supervisionados de atributos. Num primeiro momento, ignore os atributos previsores Idade e Horas-sentado. O dataset deve ter o seguinte aspecto: b) Utilizando o algoritmo Apriori e tendo o atributo-meta (classe) como Result obtenha regras de associação para Result=normal com Suporte/Confiança mínimos de 0,25/0,9. Analise qualitativamente as regras obtidas se são interessantes ou não. Quais as conclusões sobre os resultados? Apriori =======

3 Minimum support: 0.25 (25 instances) Minimum metric <confidence>: 0.9 Number of cycles performed: 15 Generated sets of large itemsets: Size of set of large itemsets L(1): 14 Size of set of large itemsets L(2): 39 Size of set of large itemsets L(3): 29 Size of set of large itemsets L(4): 3 Best rules found: 1. Fever=0 Alcohol=1 27 ==> Result=Normal 27 <conf:(1)> lift:(1.14) lev:(0.03) [3] conv:(3.24) 2. Season=-1 Ch_Diseas=1 26 ==> Result=Normal 26 <conf:(1)> lift:(1.14) lev:(0.03) [3] conv:(3.12) 3. Trauma=1 Surgery=1 25 ==> Result=Normal 25 <conf:(1)> lift:(1.14) lev:(0.03) [3] conv:(3) 4. Alcohol=1 Smoking=-1 30 ==> Result=Normal 29 <conf:(0.97)> lift:(1.1) lev:(0.03) [2] conv:(1.8) 5. Season=-1 28 ==> Result=Normal 27 <conf:(0.96)> lift:(1.1) lev:(0.02) [2] conv:(1.68) 6. Trauma=1 Fever=0 28 ==> Result=Normal 27 <conf:(0.96)> lift:(1.1) lev:(0.02) [2] conv:(1.68) 7. Season=-1 Result=Normal 27 ==> Ch_Diseas=1 26 <conf:(0.96)> lift:(1.11) lev:(0.03) [2] conv:(1.75) 8. Ch_Diseas=1 Alcohol=1 Smoking=-1 26 ==> Result=Normal 25 <conf:(0.96)> lift:(1.09) lev:(0.02) [2] conv:(1.56) 9. Alcohol=1 40 ==> Result=Normal 38 <conf:(0.95)> lift:(1.08) lev:(0.03) [2] conv:(1.6) 10. Ch_Diseas=1 Alcohol=1 36 ==> Result=Normal 34 <conf:(0.94)> lift:(1.07) lev:(0.02) [2] conv:(1.44)

4 Interpretação: Possuíram casos NORMAIS: Na primeira linha, vimos quem não bebe e possuiu febre a mais de 3 meses. Na segunda, vimos quem não teve doenças na infância e fez o exame no inverno. Na terceira, quem nunca teve trauma ou fez cirurgia. Na quarta, quem nunca fumou e quem não bebe. Em resumo, quem não bebe, não fuma, não fez cirurgia e nunca teve uma doença séria, possui boa fertilidade. Vimos que durante o INVERNO os pacientes obtiveram um melhor resultado. c) Utilize o Package Manager do Weka, acessível pela aba Tools do GUI Chooser e através dele instale o pacote HotSpot utilizado para gerar Regras e Árvores de Associação. Uma vez instalado, utilize este algoritmo para descobrir regras interessantes para a classe-alvo Altered com suporte mínimo 0,25. Quais conclusões gerais se pode tirar destas regras (quando contrastadas com as do item anterior)? Hot Spot ======== Total population: 100 instances Target attribute: Result Target value: Altered [value count in total population: 12 instances (12%)] Minimum value count for segments: 3 instances (25% of target value total population) Maximum branching factor: 2 Maximum rule length: unbounded Minimum improvement in target: 1% Result=Altered (12% [12/100]) Alcohol = 0.6 (21.05% [4/19]) Age <= 0.67 (50% [3/6]) Age > 0.61 (100% [3/3]) Surgery = 1 (75% [3/4]) Age > 0.61 (100% [3/3]) Trauma = 0 (100% [3/3]) Season = 1 (42.86% [3/7])

5 Age > 0.58 (60% [3/5]) Hours_sitted > 0.25 (100% [3/3]) Hours_sitted > 0.25 (60% [3/5]) Age > 0.64 (20.37% [11/54]) Hours_sitted > 0.38 (38.46% [5/13]) Hours_sitted <= 0.5 (55.56% [5/9]) Surgery = 1 (80% [4/5]) Age <= 0.75 (62.5% [5/8]) Surgery = 1 (80% [4/5]) Fever = 0 (66.67% [4/6]) Surgery = 1 (75% [3/4]) Surgery = 1 (50% [4/8]) Trauma = 0 (66.67% [4/6]) Hours_sitted <= 0.5 (80% [4/5]) Age <= 0.69 (75% [3/4]) Fever = 0 (60% [3/5]) Trauma = 0 (75% [3/4]) Hours_sitted <= 0.5 (75% [3/4]) Trauma = 0 (36% [9/25]) Smoking = 1 (60% [3/5]) Season = 1 (55.56% [5/9]) Surgery = 1 (80% [4/5]) Ch_Diseas = 1 (100% [3/3]) Hours_sitted > 0.25 (100% [3/3]) Hours_sitted > 0.25 (80% [4/5]) Age <= 0.69 (100% [4/4]) Nesta etapa, confirmamos a etapa anterior (pessoas que bebem ou fumam mais, tendem a ter os piores resultados). Também percebemos que as pessoas mais velhas possuem mais incidência nos casos de fertilidade ALTERADA. Houve uma grande incidência de fertilidade ALTERADA também quando o exame foi realizado no período do OUTONO.

Trabalho #2. a) Calcule o Suporte para os conjuntos de sintomas {dor de cabeça}, {tosse, fadiga, dor de cabeça}

Trabalho #2. a) Calcule o Suporte para os conjuntos de sintomas {dor de cabeça}, {tosse, fadiga, dor de cabeça} Disciplina de Mineração de Dados Aluna: Priscila Louise Leyser Santin CPGEI Trabalho #2 1) Um total de 10 pacientes estiveram em um Posto de Saúde com sintomas que sugerem gripe, mostrados na tabela abaixo.

Leia mais

Regras de Associação

Regras de Associação Regras de Associação Engenharia Biomédica Programa de Aprendizagem: Professor: Heitor Silvério Lopes Aluno: Luciano Daniel Amarante Matricula: 1895753 (externo) Período: Fase III - 2016 CURITIBA - PR OUTUBRO

Leia mais

Mineração de Dados (Regras de associação)

Mineração de Dados (Regras de associação) Aplicações Mineração de Dados (Regras de associação) Perfis de clientes ( Market basket analysis ) Merchandizing Detecção de fraudes em seguros de saúde Organização de produtos em vitrines de lojas M.

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação (Machine Learning) Aula 14 Regras de Associação Max Pereira Regras de Associação Motivação O que é geralmente comprado junto com o produto x? Que pares de produtos são comprados juntos?

Leia mais

Silva (2014) faz a classificação dos elementos no trabalho Data Mining sobre um dataset de Câncer de Mama:

Silva (2014) faz a classificação dos elementos no trabalho Data Mining sobre um dataset de Câncer de Mama: UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ (UTFPR) Mineração de Dados 2016/3 Professores Celso e Heitor Jean Avila Rangel 1801317 - PPGCA PPGCA/UTFPR câmpus Curitiba -- CAIA003 - Mineração de Dados --

Leia mais

Prof. Heitor Silvério Lopes

Prof. Heitor Silvério Lopes Prof. Heitor Silvério Lopes WEKA WEKA: Waikato Environment for Knowledge Analysis Iniciado em 1992, versão estável atual: 3.8.1 É um software para mineração de dados desenvolvido em Java com código aberto

Leia mais

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ (UTFPR) 2016/ PPGCA PPGCA/UTFPR -- CAIA003

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ (UTFPR) 2016/ PPGCA PPGCA/UTFPR -- CAIA003 UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ (UTFPR) Mineração de Dados 2016/3 Professores Celso e Heitor Jean Avila Rangel 1801317 - PPGCA PPGCA/UTFPR câmpus Curitiba -- CAIA003 - Mineração de Dados --

Leia mais

MINERAÇÃO DE DADOS EM ARQUIVOS DE LOG GERADOS POR SERVIDORES DE PÁGINAS WEB

MINERAÇÃO DE DADOS EM ARQUIVOS DE LOG GERADOS POR SERVIDORES DE PÁGINAS WEB MINERAÇÃO DE DADOS EM ARQUIVOS DE LOG GERADOS POR SERVIDORES DE PÁGINAS WEB Acadêmico: Leonardo José Correia Orientador: Prof. Ricardo Alencar Azambuja Blumenau, Julho/2004 1 Roteiro Introdução Objetivo

Leia mais

Sempre aplicando os algoritmos de classificação com a validação cruzada de 10 folds, os resultados foram os seguintes:

Sempre aplicando os algoritmos de classificação com a validação cruzada de 10 folds, os resultados foram os seguintes: UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ (UTFPR) Mineração de Dados 2016/3 Professores Celso e Heitor Jean Avila Rangel 1801317 - PPGCA PPGCA/UTFPR câmpus Curitiba -- CAIA003 - Mineração de Dados --

Leia mais

Regras de Associação. José Augusto Baranauskas Departamento de Física e Matemática FFCLRP-USP

Regras de Associação. José Augusto Baranauskas Departamento de Física e Matemática FFCLRP-USP Regras de Associação A compra de um produto quando um outro produto é comprado representa uma Regra de Associação Regras de Associação são frequentemente utilizadas para apoiar campanhas de marketing e

Leia mais

Exemplo: vendas casadas Sei que quem compra A também compra B. Mineração de Dados. Técnicas de Associação. prof. Luis Otavio Alvares

Exemplo: vendas casadas Sei que quem compra A também compra B. Mineração de Dados. Técnicas de Associação. prof. Luis Otavio Alvares Mineração de Dados Técnicas de Associação Exemplo: vendas casadas Sei que quem compra A também compra B. Apresentação adaptada do material do livro: Introduction to Data Mining Tan, Steinbach e Kumar PRODUTO

Leia mais

Sistema de mineração de dados para descoberta de padrões em dados médicos

Sistema de mineração de dados para descoberta de padrões em dados médicos Sistema de mineração de dados para descoberta de padrões em dados médicos Matheus Felipe MIRANDA¹; Marcos Roberto RIBEIRO² ¹ Estudante do curso de Tecnologia em Análise e Desenvolvimento de Sistemas e

Leia mais

Trabalho 1 - Relatório Técnico

Trabalho 1 - Relatório Técnico Trabalho 1 - Relatório Técnico Aluno: Adenir Pedro da Silva Junior Orientador: Heitor Silvério Lopes Co-orientador: Celso Antonio Alves Kaestner Disciplina: Mineração de Dados - PPGCA fase 3 / 2016 1.

Leia mais

Mineração de Dados. Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri

Mineração de Dados. Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri Mineração de Dados Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri 1 Motivação Aumento da capacidade de processamento e de armazenamento de dados; Baixo custo; Grande quantidade de dados

Leia mais

Weka. Universidade de Waikato - Nova Zelândia. Coleção de algoritmos de aprendizado de máquina para resolução de problemas de Data Mining

Weka. Universidade de Waikato - Nova Zelândia. Coleção de algoritmos de aprendizado de máquina para resolução de problemas de Data Mining Weka Universidade de Waikato - Nova Zelândia Coleção de algoritmos de aprendizado de máquina para resolução de problemas de Data Mining implementado em Java open source software http://www.cs.waikato.ac.nz/ml/weka/

Leia mais

Créditos. SCC0173 Mineração de Dados Biológicos. Aula de Hoje. Análise de Associação. Mineração de Regras de Associação

Créditos. SCC0173 Mineração de Dados Biológicos. Aula de Hoje. Análise de Associação. Mineração de Regras de Associação SCC0173 Mineração de Dados Biológicos Mineração de Regras de Associação Prof. Ricardo J. G. B. Campello Créditos Parte deste material consiste de adaptações e extensões dos originais: gentilmente cedidos

Leia mais

Mineração de Dados em Biologia Molecular

Mineração de Dados em Biologia Molecular Mineração de Dados em Biologia Molecular Análise de associação Principais tópicos Análise de associação Itens frequentes Conjunto de itens frequentes de associação Avaliação de regras de associação Docente:

Leia mais

RELATÓRIO TÉCNICO DISCIPLINA: MINERAÇÃO DE DADOS PPGCA fase 3 / 2016 Prof. Celso Antônio Alves Kaestner

RELATÓRIO TÉCNICO DISCIPLINA: MINERAÇÃO DE DADOS PPGCA fase 3 / 2016 Prof. Celso Antônio Alves Kaestner RELATÓRIO TÉCNICO DISCIPLINA: MINERAÇÃO DE DADOS PPGCA fase 3 / 2016 Prof. Celso Antônio Alves Kaestner Aluno: Luciano Daniel Amarante (externo, nº: 195753, PPBEG) 1. Objetivo: Está em realizar as análises

Leia mais

Mineração de itemsets e regras de associação

Mineração de itemsets e regras de associação Mineração de itemsets e regras de associação Marcelo K. Albertini 3 de Novembro de 2015 2/46 Conteúdo Regras de associação A-priori FP-Tree 3/46 Análise de cestas de compras Uma cadeia de supermercados

Leia mais

Introdução a Sistemas Inteligentes

Introdução a Sistemas Inteligentes Introdução a Sistemas Inteligentes Noções de Preparação de Dados e Mineração de Regras de Associação Prof. Ricardo J. G. B. Campello ICMC / USP Créditos Parte deste material consiste de adaptações e extensões

Leia mais

Mineração de Dados Aplicada no Contexto Educacional

Mineração de Dados Aplicada no Contexto Educacional Giana da Silva Bernardino ¹ e Alexandre Leopoldo Gonçalves Universidade Federal de Santa Catarina ¹gianagsb@gmail.com RESUMO Este trabalho faz uso da mineração de dados com o objetivo de encontrar informações

Leia mais

partir da navegação de usuários em sites Web

partir da navegação de usuários em sites Web Criação de regras de associação a partir da navegação de usuários em sites Web Fabrício J. Barth Faculdades BandTec e VAGAS Tecnologia Junho de 2013 Processo de mineração de padrões na Web Pré processamento

Leia mais

Métodos para Classificação: - Naïve Bayes.

Métodos para Classificação: - Naïve Bayes. Métodos para Classificação: - 1R; - Naïve Bayes. Visão Geral: Simplicidade em primeiro lugar: 1R; Naïve Bayes. 2 Classificação: Tarefa: Dado um conjunto de exemplos préclassificados, construir um modelo

Leia mais

Número: Nome:

Número: Nome: Número: Nome: 1 -------------------------------------------------------------------------------------------------------------- INSTITUTO SUPERIOR TÉCNICO Sistemas de Apoio à Decisão Exame 1 20 junho 2006

Leia mais

Minerando regras de associação

Minerando regras de associação Minerando regras de associação Proposto por Rakesh Agrawal em 1993. É o modelo de mineração de dados mais estudado pela comunidade de banco de dados. Utiliza dados categóricos. Não há bons algoritmos para

Leia mais

SCC0173 Mineração de Dados Biológicos

SCC0173 Mineração de Dados Biológicos SCC0173 Mineração de Dados Biológicos Classificação I: Algoritmos 1Rule e KNN Prof. Ricardo J. G. B. Campello SCC / ICMC / USP 1 Créditos O material a seguir consiste de adaptações e extensões dos originais:

Leia mais

Data Mining: Ferramenta JAVA

Data Mining: Ferramenta JAVA Data Mining: Ferramenta JAVA JAVA para Data Mining Weka 3: Data Mining Software em Java http://www.cs.waikato.ac.nz/ml/weka/ Coleção de algoritmos para as tarefas de data mining; Free software. WEKA: JAVA

Leia mais

Sarajane M. Peres e Clodoaldo A. M. Lima. 19 de novembro de 2015

Sarajane M. Peres e Clodoaldo A. M. Lima. 19 de novembro de 2015 Sarajane M. Peres e Clodoaldo A. M. Lima 19 de novembro de 2015 Material baseado em: HAN, J. & KAMBER, M. Data Mining: Concepts and Techniques. 2nd. 2006 Sarajane M. Peres e Clodoaldo A. M. Lima Regras

Leia mais

Classificação: 1R e Naïve Bayes. Eduardo Raul Hruschka

Classificação: 1R e Naïve Bayes. Eduardo Raul Hruschka Classificação: 1R e Naïve Bayes Eduardo Raul Hruschka Agenda: Conceitos de Classificação Técnicas de Classificação One Rule (1R) Naive Bayes (com seleção de atributos) Super-ajuste e validação cruzada

Leia mais

Mineração de padrões frequentes

Mineração de padrões frequentes Mineração de padrões frequentes Fabrício J. Barth fabricio.barth@gmail.com Setembro de 2016 Objetivos Os objetivos desta aula são: Apresentar e discutir métodos para identificar associações úteis em grandes

Leia mais

Inteligência Artificial

Inteligência Artificial Inteligência Artificial Descoberta de Conhecimento em Bases de Dados Mineração de Dados Descobertas de regras de associação Descoberta de Conhecimento em Bases de Dados DCBD (Descoberta de Conhecimento

Leia mais

Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta

Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta Professor: Eduardo R Hruschka Estagiário PAE: Luiz F S Coletta (luizfsc@icmcuspbr) Sumário Definição do projeto 1 Desenvolvimento de algoritmo de Aprendizado de Máquina (AM); 2 Pré-processamento dos dados;

Leia mais

Associações & Freqüentes

Associações & Freqüentes Associações & Análises de Itens Freqüentes Eduardo R. Hruschka Baseado no curso de Gregory Piatetsky-Shapiro, disponível no sítio http://www.kdnuggets.com Visão Geral: Transações Itens freqüentes Regras

Leia mais

UNIVERSIDADE DE SÃO PAULO

UNIVERSIDADE DE SÃO PAULO UNIVERSIDADE DE SÃO PAULO Instituto de Ciências Matemáticas e de Computação ISSN 0103-2569 Sintaxe Padrão para Representar Regras de Associação Edson Augusto Melanda Solange Oliveira Rezende N ō 206 RELATÓRIOS

Leia mais

Mineração de Dados e Aprendizado de Máquinas. Rodrigo Leite Durães.

Mineração de Dados e Aprendizado de Máquinas. Rodrigo Leite Durães. Mineração de Dados e Aprendizado de Máquinas. Rodrigo Leite Durães. O que é mineração de dados Mineração de Dados é um passo no processo de KDD que consiste na aplicação de análise de dados e algoritmos

Leia mais

Mineração de Dados - II

Mineração de Dados - II Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II Mineração de Dados - II Sylvio Barbon Junior barbon@uel.br 10 de julho de 2015 DC-UEL Sylvio Barbon Jr 1 Sumário Etapa II Algoritmos Básicos Weka: Framework

Leia mais

MINERAÇÃO DE DADOS APLICADO AO JOGO LIGA QUATRO

MINERAÇÃO DE DADOS APLICADO AO JOGO LIGA QUATRO INPE-16640-RPQ/845 MINERAÇÃO DE DADOS APLICADO AO JOGO LIGA QUATRO Wesley Gomes de Almeida Relatório final da disciplina Princípios e Aplicações de Mineração de Dados (CAP-359) do Programa de Pós-Graduação

Leia mais

Uma visão diferente do Teorema de Laplace

Uma visão diferente do Teorema de Laplace Uma visão diferente do Teorema de Laplace Teorema de Laplace: O determinante de uma matriz quadrada A de ordem n 2 é igual à soma dos produtos dos elementos de uma fila qualquer (linha ou coluna) por seus

Leia mais

Introdução à Mineração de Dados com Aplicações em Ciências Espaciais

Introdução à Mineração de Dados com Aplicações em Ciências Espaciais Introdução à Mineração de Dados com Aplicações em Ciências Espaciais Escola de Verão do Laboratório Associado de Computação e Matemática Aplicada Rafael Santos Dia 3: 1 /54 Programa Dia 1: Apresentação

Leia mais

Prof: Renato Rocha Souza. Aluno: Walter Dominguez

Prof: Renato Rocha Souza. Aluno: Walter Dominguez Prof: Renato Rocha Souza Aluno: Walter Dominguez Trabalho sôbre uso de ferramenta estatística (WEKA v 3-9-0) para identificar padrões ou relacionamentos comercialmente úteis em bancos de dados ou em outros

Leia mais

Passos para o Aprendizado de Máquina com Pentaho. Prof. Marcos Vinicius Fidelis UTFPR/UEPG

Passos para o Aprendizado de Máquina com Pentaho. Prof. Marcos Vinicius Fidelis UTFPR/UEPG Passos para o Aprendizado de Máquina com Pentaho Prof. Marcos Vinicius Fidelis UTFPR/UEPG Apresentação Professor da UTFPR, leciona Sistemas de Apoio a Decisão e Tópicos Avançados em BD (WEKA, Pentaho e

Leia mais

Aula 13: Regras de Associação. Rafael Izbicki

Aula 13: Regras de Associação. Rafael Izbicki Mineração de Dados Aula 13: Regras de Associação Rafael Izbicki 1 / 6 O Problema Imagine que temos um banco de dados em que cada linha representa a ida de uma pessoa a um supermercado, e cada coluna representa

Leia mais

Sistema SGPA-IFSP. Manual de Instalação

Sistema SGPA-IFSP. Manual de Instalação Sistema SGPA-IFSP Manual de Instalação Sumário 1. Introdução... 3 2. Softwares Necessários... 4 2.1 Ambiente Java... 4 2.2 Servidor MySQL... 8 2.3 Spring Tool Suit... 17 3. Configuração e Implantação do

Leia mais

Relatório Técnico - SVM na base Breast Cancer Wisconsin

Relatório Técnico - SVM na base Breast Cancer Wisconsin Relatório Técnico - SVM na base Breast Cancer Wisconsin Matheus Gutoski Universidade Tecnológica Federal do Paraná - CPGEI/PPGCA Mineração de Dados 4 de novembro de 2016 1 Objetivo O objetivo deste trabalho

Leia mais

Laboratório Classificação com o WEKA Explorer

Laboratório Classificação com o WEKA Explorer Laboratório Classificação com o WEKA Explorer Para esse laboratório considere os seguintes classificadores: C4.5 (J4.8) KNN Naïve Bayes Considere as bases de treinamento e teste de dígitos manuscrítos

Leia mais

Regras de Associação. Roteiro da Aula. Exemplos de perguntas a responder. Motivação e Relevância. Motivação e relevância. Regras de associação:

Regras de Associação. Roteiro da Aula. Exemplos de perguntas a responder. Motivação e Relevância. Motivação e relevância. Regras de associação: Roteiro da Aula Regras de Associação Stanley Robson de M. Oliveira Motivação e relevância. Regras de associação: Definição e exemplos; Conceitos básicos. Geração de regras de associação: Complexidade Problemas

Leia mais

Laboratório Preprocessamento com WEKA Explorer

Laboratório Preprocessamento com WEKA Explorer Laboratório Preprocessamento com WEKA Explorer Faça o download do dataset test_credit.csv*, e execute as seguintes tarefas: 1. Use o Weka Viewer para ter uma visão geral do dataset original. 2. Substitua

Leia mais

Descoberta de conhecimento aplicando regras de associação na ferramenta WEKA

Descoberta de conhecimento aplicando regras de associação na ferramenta WEKA Descoberta de conhecimento aplicando regras de associação na ferramenta WEKA RESUMO Elio Ribeiro Faria Junior 58 Marcos Jesus de Oliveira Nielsen 59 Nos últimos anos vem aumentando o uso das técnicas de

Leia mais

Patterns Identification in the Consumption of Oracle Database Resources Using Weka Tool in Data Mining

Patterns Identification in the Consumption of Oracle Database Resources Using Weka Tool in Data Mining Journal of Engineering and Technology for Industrial Applications, 2019. Edition. 17.Vol: 05 https://www.itegam-jetia.org ISSN ONLINE: 2447-0228 DOI: https://dx.doi.org/10.5935/2447-0228.20190005 Patterns

Leia mais

Inteligência Artificial

Inteligência Artificial UFRGS 2 Inteligência Artificial Técnicas de Mineração de Dados Árvores de Decisão Regras de Associação Árvores de Decisão As árvores de decisão (AD) são ferramentas poderosas para classificação cuja maior

Leia mais

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS Professor: Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo Programa do curso: Semana Conteúdo 1 Apresentação da disciplina. Princípios de modelos lineares

Leia mais

Aplicação de Regras de Associação para Mineração de Dados em uma Empresa do Setor Varejista Visando Auxiliar na Gestão de Vendas

Aplicação de Regras de Associação para Mineração de Dados em uma Empresa do Setor Varejista Visando Auxiliar na Gestão de Vendas Aplicação de Regras de Associação para Mineração de Dados em uma Empresa do Setor Varejista Visando Auxiliar na Gestão de Vendas Mateus Luiz Gamba 1, Giana da Silva Bernardino 2 1 Universidade Federal

Leia mais

Gripe H1N1, o que os Pais precisam saber!

Gripe H1N1, o que os Pais precisam saber! 1 Gripe H1N1, o que os Pais precisam saber! O que é a gripe H1N1? A gripe H1N1, também conhecida como gripe A, é uma doença respiratória infecciosa de origem viral, que pode levar ao agravamento e ao óbito,

Leia mais

Data Science. Data Stream Mining: trabalhando com dados massivos. André Luís Nunes Porto Alegre, Globalcode Open4education

Data Science. Data Stream Mining: trabalhando com dados massivos. André Luís Nunes Porto Alegre, Globalcode Open4education Data Science Data Stream Mining: trabalhando com dados massivos André Luís Nunes Porto Alegre, 2018 Globalcode Open4education Data Stream Mining trabalhando com dados massivos 2018 agenda andré luís nunes

Leia mais

Inteligência nos Negócios (Business Inteligente)

Inteligência nos Negócios (Business Inteligente) Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 5) Fundamentação da disciplina Analise de dados Decisões

Leia mais

Perfil epidemiológico do consumo de álcool entre os estudantes da Universidade Federal do Sul e Sudeste do Pará

Perfil epidemiológico do consumo de álcool entre os estudantes da Universidade Federal do Sul e Sudeste do Pará Perfil epidemiológico do consumo de álcool entre os estudantes da Universidade Federal do Sul e Sudeste do Pará Daniela Morais Silva Elaine Ferreira Chaves Ana Cristina Viana Campos Palavras chave: Epidemiologia,

Leia mais

Regras Rudimentarias

Regras Rudimentarias Regras Regras Rudimentarias 1R: aprende uma regra por atributo atribuí a classe mais freqüente taxa de erro: proporção de instâncias que não pertence a classe majoritária escolhe o atributo com menor taxa

Leia mais

Utilizando Regras de Associação para Delinear o Perfil Feminino em Ciência da Computação

Utilizando Regras de Associação para Delinear o Perfil Feminino em Ciência da Computação Utilizando Regras de Associação para Delinear o Perfil Feminino em Ciência da Computação Joyce Quintino 1, Carina T. Oliveira 1, Mauro Oliveira 1 1 Laboratório de Redes de Computadores e Sistemas (LAR)

Leia mais

Universidade Federal do Paraná

Universidade Federal do Paraná Universidade Federal do Paraná Mineração de Dados e Aprendizado de Máquinas. Aurora Trinidad Ramírez Pozo Roteiro Overview a Descoberta de Conhecimento em Bases de Dados Descoberta de Conhecimento em Bancos

Leia mais

Sobre o curso. Fabrício Olivetti de França. Universidade Federal do ABC

Sobre o curso. Fabrício Olivetti de França. Universidade Federal do ABC Sobre o curso Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Sobre mim 2. Sobre a Disciplina 1 Sobre mim Sobre mim Formado em Engenharia Elétrica com ênfase em Computação pela Universidade

Leia mais

Mineração de Dados em Biologia Molecular

Mineração de Dados em Biologia Molecular Mineração de Dados em Biologia Molecular WEKA Tópicos Introdução Simuladores de MD Principais módulos André C. P. L. F. de Carvalho Monitor: Váléria Carvalho André Ponce de Leon de Carvalho 2 Usando MD

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação (Machine Learning) Aula 02 Representação dos dados Pré-processamento Max Pereira Tipo de Dados Os atributos usados para descrever objetos de dados podem ser de diferentes tipos: Quantitativos

Leia mais

Coleta e Análise de Características de Fluxo para Classificação de Tráfego em Redes Definidas por Software

Coleta e Análise de Características de Fluxo para Classificação de Tráfego em Redes Definidas por Software Coleta e Análise de Características de Fluxo para Classificação de Tráfego em Redes Definidas por Software Rodolfo Vebber Bisol, Anderson Santos da Silva, Cristian Cleder Machado, Lisandro Zambenedetti

Leia mais

Uso do Algoritmo APriori para Descoberta de Padrões de Evasão de Usuários em Cursos Online. Francisco Neto Orientador: Alberto

Uso do Algoritmo APriori para Descoberta de Padrões de Evasão de Usuários em Cursos Online. Francisco Neto Orientador: Alberto Uso do Algoritmo APriori para Descoberta de Padrões de Evasão de Usuários em Cursos Online Francisco Neto Orientador: Alberto Definição do Problema Evasão de Usuários em Cursos Online Possível prever?

Leia mais

Mineração de Dados voltada para Recomendação no Âmbito de Marketing de Relacionamento

Mineração de Dados voltada para Recomendação no Âmbito de Marketing de Relacionamento Livia Fonseca Fracalanza Mineração de Dados voltada para Recomendação no Âmbito de Marketing de Relacionamento Dissertação de Mestrado Dissertação apresentada como requisito parcial para obtenção do título

Leia mais

QUALIDADE DE VIDA DOS PROFESSORES DE CIÊNCIAS E BIOLOGIA DA REDE PÚBLICA DO MUNICÍPIO DE ARAPONGAS- PR

QUALIDADE DE VIDA DOS PROFESSORES DE CIÊNCIAS E BIOLOGIA DA REDE PÚBLICA DO MUNICÍPIO DE ARAPONGAS- PR QUALIDADE DE VIDA DOS PROFESSORES DE CIÊNCIAS E BIOLOGIA DA REDE PÚBLICA DO MUNICÍPIO DE ARAPONGAS- PR SANCHES, D. F. 1 ; MÔNACO, A. P. do A. 2 ; QUINTILHANO. D. L. 1 1 Discentes do curso de Ciências Biológicas

Leia mais

Estudo de Caso. Índice. Descrição da Área. Daniel Gomes Dosualdo Solange Oliveira Rezende

Estudo de Caso. Índice. Descrição da Área. Daniel Gomes Dosualdo Solange Oliveira Rezende Estudo de Caso Daniel Gomes Dosualdo Solange Oliveira Rezende Índice Descrição da Área Identificação do Problema Descrição do Conjunto de Dados Pré-Processamento Extração de Padrões Pós-Processamento Disponibilização

Leia mais

Roteiro. PCC142 / BCC444 - Mineração de Dados. Cenário

Roteiro. PCC142 / BCC444 - Mineração de Dados. Cenário Roteiro PCC142 / BCC444 - Mineração de Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br www.decom.ufop.br/luiz Introdução Tarefas

Leia mais

Renato Martins Assunção

Renato Martins Assunção Análise Numérica Renato Martins Assunção DCC - UFMG 2012 Renato Martins Assunção (DCC - UFMG) Análise Numérica 2012 1 / 32 Introdução Sistemas lineares - introdução Nosso primeiro problema neste curso

Leia mais

Figura 1: Metodologia de Reconhecimentos de Padrões desenvolvida na UFC

Figura 1: Metodologia de Reconhecimentos de Padrões desenvolvida na UFC Uma Solução para o GISSA: Análise Comparativa entre Algoritmos de Aprendizagem de Máquina Aplicados em um Dataset Relacionado ao Óbito Infantil Joyce Quintino Alves (1) ; Cristiano Lima da Silva (2); Antônio

Leia mais

Data Science e Big Data

Data Science e Big Data InforAbERTA IV Jornadas de Informática Data Science e Big Data Luís Cavique, Porto, março 2014 Agenda 1. Definições: padrões micro e Macro 2. Novos padrões para velhos problemas: Similis, Ramex, Process

Leia mais

Prof. Júlio Cesar Nievola Data Mining PPGIa PUCPR

Prof. Júlio Cesar Nievola Data Mining PPGIa PUCPR Dado um conjunto de transações, achar regras que prevejam a ocorrência de um item baseado nas ocorrências de outros itens na transação Market-Basket transactions TID Items 1 Bread, Milk 2 Bread, Diaper,

Leia mais

Aprendizado de Supervisionado

Aprendizado de Supervisionado Aprendizado de Supervisionado Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Aprendendo com Exemplos 2. Classificação 3. Conceitos Gerais 4. Vizinho Mais Próximo 1 Aprendendo com Exemplos

Leia mais

Vacinação do Adulto/Idoso

Vacinação do Adulto/Idoso Vacinação do Adulto/Idoso Introdução 3 Por que eu devo me vacinar? 4 SUMÁRIO Vacinas e doenças respiratórias Gripe Pneumonia Coqueluche 6 6 7 8 Conheça o LPC 15 Imunizar adultos é um desafio mundial, já

Leia mais

ANÁLISE DE BIG DATA E INTELIGÊNCIA ARTIFICIAL PARA A ÁREA MÉDICA

ANÁLISE DE BIG DATA E INTELIGÊNCIA ARTIFICIAL PARA A ÁREA MÉDICA CURTA DURAÇÃO ANÁLISE DE BIG DATA E INTELIGÊNCIA ARTIFICIAL PARA A ÁREA MÉDICA CARGA HORÁRIA: 80 horas COORDENAÇÃO: Prof.ª Dr.ª Alessandra de Ávila Montini OBJETIVOS Introduzir o conceito de Big Data,

Leia mais

Computação Evolucionária

Computação Evolucionária UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ UTFPR Programa de Pós-Graduação em Engenharia e Informática CPGEI Laboratório de Bioinformática e Inteligência Computacional Câmpus Curitiba (PR) Computação Evolucionária

Leia mais

Influenza (gripe) 05/07/2013

Influenza (gripe) 05/07/2013 Influenza (gripe) 05/07/2013 O que é? Doença infecciosa aguda Vírus Influenza A e B Sazonal (outono e inverno) Incubação: 1 a 4 dias Transmissibilidade: Adultos: 24h antes dos sintomas e 24h após febre

Leia mais

Universidade Federal de Uberlândia - Mestrado em Ciência da Computação. Profa. Sandra A. de Amo

Universidade Federal de Uberlândia - Mestrado em Ciência da Computação. Profa. Sandra A. de Amo Universidade Federal de Uberlândia - Mestrado em Ciência da Computação Lista de Exercícios n 0 1 - Data Mining : REGRAS DE ASSOCIAÇÃO 1 0 Semestre de 2003 Profa. Sandra A. de Amo Nesta lista, alguns exercícios

Leia mais

Pós-Graduação em Ciência da Computação CCM Sistemas de Banco de Dados

Pós-Graduação em Ciência da Computação CCM Sistemas de Banco de Dados Pós-Graduação em Ciência da Computação CCM 202 - Sistemas de Banco de Dados Mineração Visual de Dados (Visual Data Mining) Cledson Diego de Marchi 26/07/11 1 Considerações Iniciais Pontos Relevantes; Motivação

Leia mais

Aprendizado de Supervisionado

Aprendizado de Supervisionado Aprendizado de Supervisionado Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Padronizando e Normalizando os Atributos 2. Tipos de Atributos 3. Representação Textual 1 Padronizando e

Leia mais

www.cpsol.com.br TEMA 003 CONHEÇA E PREVINA AS DOENÇAS DO INVERNO

www.cpsol.com.br TEMA 003 CONHEÇA E PREVINA AS DOENÇAS DO INVERNO TEMA 003 CONHEÇA E PREVINA AS DOENÇAS DO INVERNO 1/8 O inverno chegou e junto com ele maiores problemas com as doenças respiratórias entre outras Isso não ocorre por acaso já que pé nesta estação onde

Leia mais

Avaliação das leis de proibição ao fumo

Avaliação das leis de proibição ao fumo 1 Avaliação das leis de proibição ao fumo São Paulo Capital Maio de 2013 Complemento: questão sobre a adição de sabores e aromas ao cigarro Objetivo 2 Essa pesquisa teve o objetivo de investigar as opiniões

Leia mais

Roteiro. Introdução. Introdução. Introdução. Abordagens. Aprendizado de máquina. (machine learning) Introdução. Arquitetura

Roteiro. Introdução. Introdução. Introdução. Abordagens. Aprendizado de máquina. (machine learning) Introdução. Arquitetura Aprendizado de Máquina (machine learning) Introdução abordagens técnicas Arquitetura Roteiro Introdução Dificuldade classificação síntese aprendizado de máquina (simbólico) Definição: Learning denotes

Leia mais

Relatório de Atividades

Relatório de Atividades Relatório de Atividades BCC390 - Monografia I MINERAÇÃO DE DADOS PARA PADRÕES DE SEQUENCIA Cecília Henriques Devêza OURO PRETO, 27 DE NOVEMBRO DE 2010 Introdução O que são Padrões de Sequência O projeto

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina Aula #8.1 EBS 564 IA Prof. Luiz Fernando S. Coletta luizfsc@tupa.unesp.br Campus de Tupã Conhecimento: abstração (modelo) das relações existentes entre as informações contidas nos

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina Introdução ao WEKA Luiz Eduardo S. Oliveira Universidade Federal do Paraná Departamento de Informática http://web.inf.ufpr.br/luizoliveira Luiz S. Oliveira (UFPR) Aprendizado de

Leia mais

UNIVERSIDADE DE MOGI DAS CRUZES - UMC COMISSÃO PRÓPRIA DE AVALIAÇÃO CPA

UNIVERSIDADE DE MOGI DAS CRUZES - UMC COMISSÃO PRÓPRIA DE AVALIAÇÃO CPA UNIVERSIDADE DE MOGI DAS CRUZES - UMC COMISSÃO PRÓPRIA DE AVALIAÇÃO CPA PROJETO: PERFIL DOS ALUNOS DOS CURSOS DE GRADUAÇÃO DA UNIVERSIDADE DE MOGI DAS CRUZES UMC RELATÓRIO 2011 I. Apresentação O projeto

Leia mais

2COP355 INTELIGÊNCIA COMPETITIVA. Algoritmos. Sylvio Barbon Junior 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 1

2COP355 INTELIGÊNCIA COMPETITIVA. Algoritmos. Sylvio Barbon Junior 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 1 2COP355 INTELIGÊNCIA COMPETITIVA Algoritmos Sylvio Barbon Junior barbon@uel.br 27 de novembro de 2015 DC-UEL Sylvio Barbon Jr 1 Sumário Etapa I Etapa II Inteligência de Negócios Visão Geral sobre Mineração

Leia mais

Estudo das Condições Climáticas em uma Planta Geradora de Energia Eólica Utilizando Mineração de Dados

Estudo das Condições Climáticas em uma Planta Geradora de Energia Eólica Utilizando Mineração de Dados Estudo das Condições Climáticas em uma Planta Geradora de Energia Eólica Utilizando Mineração de Dados Elias Rocha Gonçalves Júnior Virgínia Siqueira Gonçalves Cláudio Luiz Melo de Souza Geórgia Regina

Leia mais

SCC0173 Mineração de Dados Biológicos

SCC0173 Mineração de Dados Biológicos SCC0173 Mineração de Dados Biológicos Preparação de Dados: Parte A Prof. Ricardo J. G. B. Campello SCC / ICMC / USP 1 Créditos O material a seguir consiste de adaptações e extensões: dos originais gentilmente

Leia mais

Data Mining Software Weka. Software Weka. Software Weka 30/10/2012

Data Mining Software Weka. Software Weka. Software Weka 30/10/2012 Data Mining Software Weka Prof. Luiz Antonio do Nascimento Software Weka Ferramenta para mineração de dados. Weka é um Software livre desenvolvido em Java. Weka é um É um pássaro típico da Nova Zelândia.

Leia mais

KDD, Mineração de Dados e Algoritmo Apriori

KDD, Mineração de Dados e Algoritmo Apriori Universidade Federal de São Carlos - UFSCar Departamento de Computação - DC Programa de Pós-Graduação em Ciência da Computação - PPGCC KDD, Mineração de Dados e Algoritmo Apriori Aluno: Rodrigo Moura J.

Leia mais

Revista Gestão Pública em Curitiba MOMENTOS I ENCONTRO INTERNACIONAL DE CURITIBA EM GESTÃO PÚBLICA Pública Gestão Curitiba 2011 em I Encontro Internacional de Curitiba Gestão Pública para Resultados 44

Leia mais

Attribute Information:

Attribute Information: Universidade Tecnológica Federal do Paraná (UTFPR) 2010/03 Mineração de Dados Jean Avila Rangel PPGCA 1801317 Trabalho para o dia 18 do professor Heitor. Análise na ferramenta Rstudio de arquivos da base

Leia mais

EXTRAÇÃO DE ASSOCIAÇÕES EM BASES DE DADOS DE VAREJO

EXTRAÇÃO DE ASSOCIAÇÕES EM BASES DE DADOS DE VAREJO EXTRAÇÃO DE ASSOCIAÇÕES EM BASES DE DADOS DE VAREJO Gustavo Silva Semaan, Andrei de Alencastro Graça, Carlos Rodrigo Dias Faculdade Metodista Granbery Rua Batista de Oliveira, 1145, Centro, Juiz de Fora

Leia mais

Fundamentos de Mineração de Dados

Fundamentos de Mineração de Dados Fundamentos de Mineração de Dados Prof. Ricardo Fernandes ricardo.asf@ufscar.br O que é Mineração de Dados? Uso de ferramentas matemáticas, clássicas ou inteligentes, no processo de descoberta de conhecimento

Leia mais

Créditos. SCC0173 Mineração de Dados Biológicos. Aula de Hoje. Introdução. Classificação III: Árvores de Decisão

Créditos. SCC0173 Mineração de Dados Biológicos. Aula de Hoje. Introdução. Classificação III: Árvores de Decisão SCC073 Mineração de Dados Biológicos Classificação III: Árvores de Decisão Créditos O material a seguir consiste de adaptações e extensões dos originais: gentilmente cedidos pelo Prof. André C. P. L. F.

Leia mais

Curso de Data Mining. Sandra de Amo. Aula 18 - Mineração de padrões em caminhos percorridos por usuários da Internet

Curso de Data Mining. Sandra de Amo. Aula 18 - Mineração de padrões em caminhos percorridos por usuários da Internet Curso de Data Mining Sandra de Amo Aula 18 - Mineração de padrões em caminhos percorridos por usuários da Internet Nesta aula vamos tratar do problema de mineração de caminhos percorridos por usuários

Leia mais