Mineração de Dados (Regras de associação)

Documentos relacionados
Aprendizado de Máquina (Machine Learning)

Mineração de padrões frequentes

Data Mining: Ferramenta JAVA

MINERAÇÃO DE DADOS EM ARQUIVOS DE LOG GERADOS POR SERVIDORES DE PÁGINAS WEB

Associações & Freqüentes

Regras de Associação

Aula 13: Regras de Associação. Rafael Izbicki

Inteligência Artificial

PPGCA/UTFPR câmpus Curitiba -- CAIA003 - Mineração de Dados -- Profs. Celso Kaestner e Heitor Lopes Trabalho #2 Regras de Associação

Mineração de Dados em Biologia Molecular

Roteiro. PCC142 / BCC444 - Mineração de Dados. Cenário

Mineração de Dados e Aprendizado de Máquinas. Rodrigo Leite Durães.

Inteligência Artificial

Otimização de Resultados com Big Data em Televendas. Georthon Giroldo dos Santos Big Data

Regras Rudimentarias

Regras de Associação e suas Medidas de Interesse Objetivas e Subjetivas

Créditos. SCC0173 Mineração de Dados Biológicos. Aula de Hoje. Análise de Associação. Mineração de Regras de Associação

Minerando regras de associação

Introdução à Mineração de Dados com Aplicações em Ciências Espaciais

Minerando Padrões Sequenciais para Bases de Dados de Lojas Virtuais

Universidade Federal Fluminense (UFF) Rua Passo da Pátria, 156, bloco E, sala Niterói, RJ

Sarajane M. Peres e Clodoaldo A. M. Lima. 19 de novembro de 2015

Mineração de Dados. Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri

REGRAS NEGATIVAS DE ASSOCIAÇÃO EM MINERAÇÃO DE DADOS

Introdução a Sistemas Inteligentes

Descoberta de conhecimento aplicando regras de associação na ferramenta WEKA

Exemplo: vendas casadas Sei que quem compra A também compra B. Mineração de Dados. Técnicas de Associação. prof. Luis Otavio Alvares

KDD, Mineração de Dados e Algoritmo Apriori

EXTRAÇÃO DE ASSOCIAÇÕES EM BASES DE DADOS DE VAREJO

Regras de Associação. José Augusto Baranauskas Departamento de Física e Matemática FFCLRP-USP

Inteligência nos Negócios (Business Inteligente)

Weka. Universidade de Waikato - Nova Zelândia. Coleção de algoritmos de aprendizado de máquina para resolução de problemas de Data Mining

Mineração de itemsets e regras de associação

Curso de Data Mining

partir da navegação de usuários em sites Web

Formulário I - Cardápio N.º do Cardápio: Frequência: CARDÁPIO: BISCOITO DOCE MAISENA E VITAMINA DE ACEROLA

Extração de Conhecimento por meio de Regras de Associação. Alex Werneck Ferreira

Universidade Federal do Paraná

Aula 20: Regras de Associação

Associação. de -0,18% Higiene pessoal 3390,00). o Núcleo. que apresentou 11,22 5,70 5,59 4,08 3,34 2,20 2,01 1,97 1,83 1,48 1,44 1,10 0,12 0,22

Universidade Federal de Uberlândia - Mestrado em Ciência da Computação. Profa. Sandra A. de Amo

Tecnologia RFID aplicada a agrocomputação: Um estudo de caso utilizando descoberta de conhecimento em base de dados

Consumo de açúcar e padrões alimentares no Brasil

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ (UTFPR) 2016/ PPGCA PPGCA/UTFPR -- CAIA003

Revista Multidisciplinar do Nordeste Mineiro Unipac ISSN Faculdade Presidente Antônio Carlos de Teófilo Otoni - Dezembro de 2018

CARDÁPIO DE LANCHES - JULHO

UNIVERSAL KIDS. Quarta 05/08

CURSO DE DATA MINING. Sandra A. de Amo

Salada da Casa alface, tomate, cebola, azeitona e cenoura (vinagre e azeite) R$15,00

Alimentos e combustíveis pressionam o custo de vida em São Paulo

Custo de vida praticamente não tem alteração

02 Quarta-feira. 03 Quinta-feira. 04 Sexta-feira. Fruta* Suco de Fruta*

CARDÁPIO NOVEMBRO Berçário I

Sumário. RObust Clustering using links ROCK. Thiago F. Covões. Motivação. Motivação. Links. Market basket analys. Motivação

Escola de Educação Infantil Castelo do Saber Cardápio referente ao mês de Novembro de 2013* Refeição Segunda Terça Quarta Quinta Sexta 01/11

Data Mining Software Weka. Software Weka. Software Weka 30/10/2012

Nutricionista Carolina Cestari De Paoli Bortoletto_ CRN

1. O CUSTO DA CESTA BÁSICA APRESENTOU UMA VARIAÇÃO POSITIVA DE 1,13% NO MÊS DE MARÇO EM CASCA

CARDÁPIO EDUCAÇÃO INFANTIL (maiores de 2 anos) OUTUBRO/2016

Famílias de renda mais baixa continuam a ser mais afetadas pela inflação na cidade de São Paulo

Autor(es) HARLEI MIGUEL DE ARRUDA LEITE. Orientador(es) MARINA TERESA PIRES VIEIRA. Apoio Financeiro PIBIC/CNPQ. 1. Introdução

MATERNAL FEVEREIRO 2012 Dias Desjejum Almoço Lanche Jantar

Medicamentos e alimentação pressionam o Custo de Vida em São Paulo

CARDÁPIO MATERNAL 1. MÊS: AGOSTO 2016 Nutricionista responsável: Gabriele Klitzke Valtrich - CRN 10/SC 2944 DATA 01/ago 02/ago 03/ago 04/ago 05/ago

Crianças até o Segundo Ano de Vida Serviço de Nutrição e Dietética

UNIDADE: 01. Observe as imagens que representam os quatro grupos de alimentos.

Cuidados preventivos As próximas perguntas são sobre cuidados preventivos, como vacinas e testes do pezinho, orelhinha, e olhinho.

Sucos naturais e sobremesas são servidos diariamente, durante o almoço.

Questionário de Frequência Alimentar

Lista de ingredientes

UNIVERSIDADE DE CAXIAS DO SUL CENTRO DE CIÊNCIAS CONTÁBEIS, ECONÔMICAS E ADMINISTRATIVAS INSTITUTO DE PESQUISAS ECONÔMICAS E SOCIAIS CESTA BÁSICA

Sistema de mineração de dados para descoberta de padrões em dados médicos

Indicadores do Autosserviço

UNIVERSIDADE DE CAXIAS DO SUL CENTRO DE CIÊNCIAS CONTÁBEIS, ECONÔMICAS E ADMINISTRATIVAS INSTITUTO DE PESQUISAS ECONÔMICAS E SOCIAIS CESTA BÁSICA

AGOSTO/2017. CARDÁPIO COLÉGIO OBJETIVO 1ª SEMANA (31/07 a 04/08)

AGOSTO/ MATERNAL. CARDÁPIO COLÉGIO OBJETIVO 1ª SEMANA (31/07 a 04/08)

SECTOR PRODUTO OBSERVAÇÃO

Mineração de Dados - II

INFORMAÇÕES BÁSICAS PARA PROFISSIONAIS DE SAÚDE FENILCETONÚRIA SAÚDE

EDITAL DE LICITAÇÃO PREGÃO PRESENCIAL Nº 2/2017

UNIVERSIDADE DE CAXIAS DO SUL CENTRO DE CIÊNCIAS CONTÁBEIS, ECONÔMICAS E ADMINISTRATIVAS INSTITUTO DE PESQUISAS ECONÔMICAS E SOCIAIS CESTA BÁSICA

CARDÁPIO MARÇO - CANTINA ESTAÇÃO

CARDÁPIO EDUCAÇÃO INFANTIL

Data Dia da semana. Bolo de maçã com canela integral Suco de goiaba. Macarrão brasileirinho (milho e ervilha) Franguinho ensopado

Escola de Educação Infantil Kids Arte Cardápio referente ao mês de Setembro de 2016* Refeição Segunda Terça Quarta Quinta 01/09 Sexta 02/09

Mineração de Dados CONCEITOS E PRINCIPAIS TÉCNICAS

PREFEITURA MUNICIPAL DE TIMBAÚBA Cardápio Merenda Escolar - Regular Secretaria de Educação Fevereiro / 2015.

UNIVERSAL KIDS JULHO 2016 INFANTIL ***CARDÁPIO SUJEITO À ALTERAÇÕES***

A formação de bons hábitos alimentares na infância devem convergir para um único fim: o bem-estar emocional, social e físico da criança

Biscoito integral com requeijão Suco de melão. Arroz parbolizado Feijão branco. Kibe assado. Salada de beterraba com cenoura ralada

APÓS TRÊS MESES DE AUMENTO, CUSTO DO CESTO BÁSICO CAI EM CHAPECÓ

Reino do Ensino Cardápio sujeito a alterações mediante a disponibilidade de alimentos

CARDÁPIO OUTUBRO - CANTINA ESTAÇÃO

Alimentos seguem pressionando a inflação

Cardápio (30/06 ATE 04/07)

UNIVERSIDADE DE CAXIAS DO SUL CENTRO DE CIÊNCIAS CONTÁBEIS, ECONÔMICAS E ADMINISTRATIVAS INSTITUTO DE PESQUISAS ECONÔMICAS E SOCIAIS CESTA BÁSICA

Índice: 1ª agosto 2007 = 100

Cardápio Ensino Infantil

Índice: 1ª agosto 2007 = 100

UNIVERSIDADE DE CAXIAS DO SUL CENTRO DE CIÊNCIAS CONTÁBEIS, ECONÔMICAS E ADMINISTRATIVAS INSTITUTO DE PESQUISAS ECONÔMICAS E SOCIAIS CESTA BÁSICA

Transcrição:

Aplicações Mineração de Dados (Regras de associação) Perfis de clientes ( Market basket analysis ) Merchandizing Detecção de fraudes em seguros de saúde Organização de produtos em vitrines de lojas M. Sc. Luiz Alberto lasf.bel@gmail.com Aula Mineração de Dados 1 Uma regra de associação representa um padrão de relacionamento entre itens de dados do domínio da aplicação que ocorre com uma determinada freqüência na base de dados. parte significativa das compras de homens, às sextas-feiras à noite, que inclui fraldas, inclui também cerveja. {fralda} {cerveja} o cliente que compra pão e manteiga, 80% das vezes compra leite. {pão, manteiga} {leite} muitos pacientes aidético que contraem a doença candidíase também têm pneumonia. {candidíase} {pneumonia} Considere a regra A B. Aé chamado de antecedenteda regra e Bé chamado de conseqüente. a sua medida de suporte(sup) representa a porcentagem de transações da base de dados que contêm os itens de Ae B, indicando a relevância da mesma. Já a sua medida de confiança(conf) representa, dentre as transações que possuem os itens de A, a porcentagem de transações que possuem também os itens de B, indicando a validade da regra. Aula Mineração de Dados 2 Aula Mineração de Dados 3

Definições úteis Regra A ==> B Confidência = P (A e B ocorrerem juntos) / P(A) = P (B A) O problema da mineração de regras de associação, conforme definido originalmente em1993, consiste em encontrar todas as regras de associação que possuam suporte e confiança maiores ou iguais, respectivamente, a um suporte mínimo (SupMin) e uma confiança mínima (ConfMin), especificados pelo usuário. Suporte = P (A e B ocorrerem juntos) Prof. 4 Luiz Alberto Aula Mineração de Dados 5 TID Produtos Comprados ------------------------------------------------------ 1 biscoito, cerveja, chá, salaminho 2 cerveja, couve, lingüiça, pão, queijo 3 café, brócolis, couve, pão 4 brócolis, café, cerveja, couve, pão, salaminho 5 brócolis, café, couve, pão, refrigerante 6 couve, lingüiça Observe que cada registro da base de dados armazena a relação de produtos adquiridos por um cliente específico. Um exemplo de regra de associação que poderia ser minerada nesta base de dados, através da utilização de uma ferramenta de data mining, é dado por: {cerveja} => {salaminho}. Note que duas das seis transações que compõem a base contêm os produtos {cerveja} e {salaminho}. Desta maneira, o suporte da regra {cerveja} =>{salaminho} pode ser calculado da seguinte forma: 2/6 = 33,33%. Aula Mineração de Dados 6 Aula Mineração de Dados 7

Observe agora que na base de dados, existem duas transações que contêm os produtos {cerveja} e {salaminho} juntos e três transações que contêm o produto {cerveja}. A confiança da regra {cerveja}=>{salaminho} pode então ser calculada da seguinte maneira: 2/3 = 66,67%. Este valor indica que 66,67% dos consumidores que compraram {cerveja} também compraram {salaminho}. Regras de associação são extraídas a partir de bases de dados que contêm transações - formadas por conjuntos de itens do domínio da aplicação. Id-Transação (TID) Itens Comprados 1 leite, pão, refrigerante 2 cerveja, carne 3 cerveja, fralda, leite, refrigerante 4 cerveja, fralda, leite, pão 5 fralda, leite, refrigerante {fralda} {cerveja} confiança de 66% (suporte médio) {fralda} {leite} confiança de 100% (suporte alto) {leite} {fralda} confiança de 75% (suporte alto) {carne} {cerveja} confiança de 100% (suporte baixo) Aula Mineração de Dados 8 Aula Mineração de Dados 9 Regras de associação possuem índices que indicam sua relevância e a validade. O fator de suporte de uma regra X Y é definido pela porcentagem de transações que incluem todos os itens do conjunto X U Y. Representa a fração das transações que satisfazem tanto o antecedente quanto o conseqüente da regra. O suporte de uma regra indica sua relevância. Seja R a regra X Y. Seja T o número de transações consideradas. Seja T XUY o número de transações que incluem os elementos de X U Y. Suporte(R) = T XUY / T O fator de confiança de uma regra X Y é definido pela porcentagem de transações que incluem os itens X e Y em relação a todas que incluem os itens de X. Representa o grau de satisfatibilidade do conseqüente, em relação às transações que incluem o antecedente. A confiança indica a validade da regra. Seja R a regra X Y. Seja T X o número de transações que incluem os elementos de X. Seja T XUY o número de transações que incluem os elementos de X U Y. Confiança(R) = T XUY / T X TID Itens Comprados Suporte({leite} {suco}) = 2 / 4 = 50% 101 leite, pão, suco Suporte({suco} {leite}) = 50% 792 leite, suco Suporte({pão} {suco}) = 1130 leite, ovos Suporte({pão} {ovos}) = 1735 pão, biscoito, café Suporte({pão,café} {biscoito}) = Id-T. Itens Comprados Confiança({leite} {suco}) = 2 / 3 = 67% 101 leite, pão, suco Confiança({suco} {leite}) = 2 / 2 = 100% 792 leite, suco Confiança({pão} {suco}) = 1130 leite, ovos Confiança({pão} {ovos}) = 1735 pão, biscoito, café Confiança({pão,café} {biscoito}) = Aula Mineração de Dados 10 Aula Mineração de Dados 11

Mineração de Entrada: Base de dados de transações; Suporte mínimo; Confiança mínima. Algoritmos de Mineração (de ) Apriori Partition Saída: Todas as regras de associação que possuem suporte e confiança maiores ou iguais ao suporte e à confiança mínimos. Aula Mineração de Dados 12 Aula Mineração de Dados 13

L2 L2 L2 L3

Conjunto de itens frequentes L2 L3 Exemplos de regras: Se {Pão} => {Manteiga} = 43% Se {Pão,Leite} => {Cerveja} = 60% Se {Leite} => {Pão,Cerveja} = 38% WEKA: JAVA para Data Mining WEKA: JAVA para Data Mining @relation produtos @attribute leite {yes, no} @attribute cafe {yes, no} @attribute biscoito {yes, no} @attribute farinha {yes, no} @attribute açucar {yes, no} @attribute pao {yes, no} @attribute feijao {yes, no} @data no, yes, no, yes, yes, no, no yes, no, yes, yes, yes, no, no no, yes, no, yes, yes, no, no yes, yes, no, yes, yes, no, no no, no, no, no, yes, no, no no, no, no, no, yes, no, no yea, no, no, no, yes, no, no yes, no, yes, yes, yes, no, no yes, no, yes, no, yes, no, no yes, no, yes, yes, yes, no, yes Carga do arquivo; Análise dos atributos e seus valores; Indicação de pré-processamento; Escolha da tarefa de data mining; Escolha do algoritmo a aplicar; Acerto dos parâmetros; Execução; Análise dos resultados de saída.

WEKA: JAVA para Data Mining WEKA: JAVA para Data Mining === Run information === Scheme: weka.associations.apriori -N 10 -T 0 -C 0.9 -D 0.05 -U 1.0 -M 0.1 -S -1.0 Relation: paoeleite Instances: 10 Attributes: 7 leite cafe biscoito farinha açucar pao feijao === Associator model (full training set) === Apriori ======= Minimum support: 0.5 Minimum metric <confidence>: 0.9 Number of cycles performed: 8 Generated sets of large itemsets: Size of set of large itemsets L(1): 7 Size of set of large itemsets L(2): 12 Size of set of large itemsets L(3): 6 WEKA: JAVA para Data Mining Produtos.arff Best rules found: 1. pao=no 10 ==> açucar=yes 10 conf:(1) 2. açucar=yes 10 ==> pao=no 10 conf:(1) 3. feijao=no 9 ==> açucar=yes 9 conf:(1) 4. feijao=no 9 ==> pao=no 9 conf:(1) 5. pao=no feijao=no 9 ==> açucar=yes 9 conf:(1) 6. açucar=yes feijao=no 9 ==> pao=no 9 conf:(1) 7. feijao=no 9 ==> açucar=yes pao=no 9 conf:(1) 8. açucar=yes 10 ==> feijao=no 9 conf:(0.9) 9. pao=no 10 ==> feijao=no 9 conf:(0.9) 10. açucar=yes pao=no 10 ==> feijao=no 9 conf:(0.9) @relation produtos @attribute leite {yes,no} @attribute cafe {yes,no} @attribute biscoito {yes,no} @attribute farinha {yes,no} @attribute açucar {yes,no} @attribute pao {yes,no} @attribute feijao {yes,no} @data no, yes, no, yes, yes, no, no yes, no, yes, yes, yes, no, no no, yes, no, yes, yes, no, no yes, yes, no, yes, yes, no, no no, no, no, no, yes, no, no no, no, no, no, yes, no, no yes, no, no, no, yes, no, no yes, no, yes, yes, yes, no, no yes, no, yes, no, yes, no, no yes, no, yes, yes, yes, no, yes @relation produtos @attribute leite {yes} @attribute cafe {yes} @attribute biscoito {yes} @attribute farinha {yes} @attribute açucar {yes} @attribute pao {yes} @attribute feijao {yes} @data?, yes,?, yes, yes,?,? yes,?, yes, yes, yes,?,??, yes,?, yes, yes,?,? yes, yes,?, yes, yes,?,??,?,?,?, yes,?,??,?,?,?, yes,?,? yes,?,?,?, yes,?,? yes,?, yes, yes, yes,?,? yes,?, yes,?, yes,?,? yes,?, yes, yes, yes,?, yes 27

Dúvidas? 28