Minerando Padrões Sequenciais para Bases de Dados de Lojas Virtuais
|
|
- Vergílio Alencastre da Cunha
- 6 Há anos
- Visualizações:
Transcrição
1 Universidade Federal de Ouro Preto Instituto de Ciências Exatas e Biológicas Departamento de Computação Minerando Padrões Sequenciais para Bases de Dados de Lojas Virtuais Cecília Henriques Devêza ceciliadeveza@gmail.com Orientador: Luiz Henrique de Campos Merschmann Ouro Preto, 13 de Junho de 2011
2 Roteiro Processo KDD Tarefas de Mineração de Dados Definição e exemplo Objetivos Ferramenta Computacional Dados Amostrais Correção de caracteres Pré-processamento Mineração de Dados Pós-Processamento Aplicação Conclusão
3 Processo KDD Processo de descoberta de conhecimento em bases de dados.
4 Tarefas de Mineração de Dados Extração de regras de associação / padrões de sequência Classificação Agrupamento (Clustering) Regressão
5 Tarefas de Mineração de Dados Extração de regras de associação / padrões de sequência Classificação Agrupamento (Clustering) Regressão
6 Definição e exemplo Regras de Associação: representam um padrão de relacionamento entre itens de dados. Ex: leite, pão => refrigerante. ID Transação Itens comprados 1 leite, pão, refrigerante 2 cerveja, carne 3 cerveja, fralda,pão, leite, refrigerante 4 cerveja, fralda, leite, pão 5 fralda, leite, refrigerante,pão Padrões de Sequência: conjunto de itens que ocorrem seguindo uma ordem temporal. Ex: <{pão, leite},{cerveja}> Consumidor Data / Hora Produtos João 20/03/2010 leite, pão João 21/03/2010 carne, cerveja João 15/07/2010 queijo, manteiga, sal Marcos 28/09/2010 leite, ovos, pão Marcos 02/12/2010 queijo, manteiga, cerveja
7 Objetivos Propor uma ferramenta computacional capaz de processar dados de lojas virtuais. Extrair padrões sequenciais de visualização de produtos por clientes de lojas virtuais. Obter conhecimento para adaptação automática do ambiente virtual (site) das lojas.
8 Dados das lojas virtuais Base de dados disponibilizada Trans. IdCliente Produto Loja Data afbfc Mitiflex C af9a49394f aeb Pequenas Fontes... B f7c191a0cd6a75c5cbe2 Surdez Processos... C aw23ew3983y4thi4438 CDI Digital DAFRA... D t52kdi7486db5g1mnk6t8 Agulha Auricular C... A dsb8dbdf8bfdb6wd65 Zumbido Avaliação... C d2f1dsg23sd1gs35ytj5ui O Pastor Alemão B
9 Correção de Erros Trans. IdCliente Produto Loja Data c48 Mà todo das Boquinhas 1 Alfabetizaà o... C c48 Ponta De LÃngua Com 10 Unidades B B408d92d61a284 J.Aplicados à Fonoaudiologia Prýtica C aw23ew399thi44 PaquÃmetro 18 cm D Substituição de caracteres inválidos para um caractere único:?. Seleção das tuplas que contém? e geração de um script SQL Correção das manual dos caracteres no script Execução do script para substituição completa
10 Tela Inicial
11 Tela Inicial
12 Pré-processamento Validação do arquivo
13 Pré-processamento Seleção de dados: definição de loja virtual.
14 Pré-processamento Seleção de dados: remoção de tuplas únicas.
15 Pré-processamento Transformação de dados: mapeamento de identificadores de clientes e produtos. Clientes 5e182b89fb42e9cd6d a7f6e14b5094d e182b89fb42e9cd6d9585 Produtos Ponto Cristal com 100 Unid Óleo Hung Far Oir 30 ml Ventosa 19 Copos Clientes Produtos
16 Pré-processamento Geração do arquivo.arff
17 Mineração de Dados Execução
18 Mineração de Dados Algoritmo GSP Geração de candidatos Definição de frequentes Poda de candidatos Propriedade: Para uma sequencia ser frequente, todas suas subsequencias também devem ser frequentes.
19 Pós-processamento Mapeamento dos dados Sequencias <{261}{246}> <{92}{140}{170}> <{0}{3}{4}> Sequencias Mapeadas <{...com Fecho De Velcro} {...com Fecho De Metal}> <{Acuspointer...}{Sikuro Ds100jr}{Wq 10}> <{Ponto Cristal...}{Mapa De Auriculoterapia...}{Orelhas com Ponto...}>
20 Apresentação dos resultados Exibição das sequencias na tela
21 Apresentação dos resultados Salvar arquivo de soluções
22 Aplicação Exemplo de utilização para arquivo XML
23 Conclusão Foi apresentado um software capaz de extrair padrões sequenciais de uma base de dados de loja virtual. Resultados obtidos: Induzem o consumidor à compra de outros itens. Oferecem ao cliente produtos condizentes com sua expectativa.
24 Perguntas?
25 Fim
26 Anexo - GSP
27 Algoritmo GSP Iteração 1 GERAÇÃO DE PRÉ-CANDIDATOS E CÁLCULO DE SUPORTE TID Produtos 1 <{2, 1, 4, 6}, {3, 7, 8}, {5}, {9}> 2 <{2, 4, 5}, {1, 6, 7}, {3}> 3 <{2, 4}, {1, 5}> 4 <{1, 3}, {2, 4, 5}> Prods. Suporte <{1}> 4 <{2}> 4 <{3}> 3 <{4}> 4 <{5}> 4 <{6}> 2 <{7}> 2 <{8}> 1 <{9}> 1 Supondo suporte mínimo igual a 50%, todos os itens são considerados frequentes nesta iteração exceto o {8} e {9}.
28 Algoritmo GSP Iteração 2 (k=1) <{1}> <{2}> <{3}> <{4}> <{5}> <{6}> <{7}> GERAÇÃO DE PRÉ-CANDIDATOS L1 X L1 <{1}> <{1}> <{2}> <{2}> <{3}> <{3}> <{4}> <{4}> <{5}> <{5}> <{6}> <{6}> <{7}> <{7}> TID Produtos 1 <{1, 1}>, <{1}, {1}> 2 <{1, 2}>, <{1}, {2}> 3 <{1, 3}>, <{1}, {3}> 4 <{1, 4}>, <{1}, {4}> 5 <{1, 5}>, <{1}, {5}> 6 <{1, 6}>, <{1}, {6}> 7 <{1, 7}>, <{1}, {7}> 8 <{2, 1}>, <{2}, {1}> 9 <{2, 2}>, <{2}, {2}> Na segunda iteração, são criados todos os conjuntos possíveis de 2 itens. Os conjuntos que possuem o mesmo elemento, na mesma transação, sempre possuem frequência 0. (Ex.: <{1, 1}>).
29 Algoritmo GSP Iteração 2 DEFINIÇÃO DOS FREQUENTES Tendo todos os candidatos possíveis de 2 itens, é necessário verificar quais atendem ao suporte mínimo especificado. Esta verificação será mostrada posteriormente.
30 Algoritmo GSP Iteração 3 A partir desta iteração, é preciso ficar atento para a seguinte regra: Os candidatos só podem ser gerados a partir de duas sequências ligáveis. Duas sequências s = < s1, s2, s3, s4,..., sn > e t = < t1, t2, t3, t4,..., tm > são ditas ligáveis se, retirando-se o primeiro item de s1 e o último item de tm, as sequências resultantes são iguais. Neste caso, s e t podem ser ligadas e produzir a sequência V, onde: Se tm não é unitário: v = <s1, s2, s3,..., sn U t >, onde t é o último item de tm. Se tm é unitário: v = <s1, s2, s3,..., sn, tm>
31 Algoritmo GSP Iteração 3 GERAÇÃO DE PRÉ-CANDIDATOS Suponha que as 2-sequências mostradas abaixo atingiram o suporte mínimo. (k=2) <{1}, {2}> <{1}, {3}> <{1}, {4}> <{1, 5}> <{2}, {6}> <{2, 6}> <{6}, {7}> <{4},{6}> <{3, 7}> <{5, 6}> <{4, 7}> TID Produtos 1 <{1}, {2}, {6}> 2 <{1}, {2,6}> 3 <{1}, {3, 7}> 4 <{1}, {4}, {6}> 5 <{1}, {4, 7}> 6 <{1, 5, 6}> 7 <{2}, {6}, {7}> 8 <{2, 6}, {7}> 9 <{4}, {6}, {7}> 10 <{5, 6}, {7}>
32 Algoritmo GSP Iteração 3 FASE DE PODA DOS PRÉ-CANDIDATOS Para uma sequencia S ser frequente, então toda subsequência de S deve se frequente. (k=2) <{1}, {2}> <{1}, {3}> <{1}, {4}> <{1, 5}> <{2}, {6}> <{1, 6}> <{6}, {7}> <{4},{6}> <{3, 7}> <{5, 6}> <{4},{7}> TID Produtos 1 <{1}, {2}, {6}> 2 <{1}, {2,6}> 3 <{1}, {3, 7}> 4 <{1}, {4}, {6}> 5 <{1}, {4, 7}> 6 <{1, 5, 6}> 7 <{2}, {6}, {7}> 8 <{2, 6}, {7}> 9 <{4}, {6}, {7}> 10 <{5, 6}, {7}> (K=3) <{1, 5, 6}> <{4}, {6}, {7}> A subsequência <{1}, {6}> não pertence à Lk=2
33 Algoritmo GSP Iteração 3 DEFINIÇÃO DOS FREQUENTES Novamente, é feito o cálculo do suporte para os candidatos que permaneceram após a poda. Este cálculo é mostrado a seguir.
34 Definição das sequencias frequentes GERAÇÃO DA ÁRVORE-HASH Suponha as seguintes 2-sequências candidatas: (k=2) <{1, 3}> <{1}, {3}> <{2}, {3}> <{3}, {3}> <{2, 3}> <{1}, {4}> Para construir a árvore hash, é preciso definir duas variáveis M e N, sendo: M : Número de sequências que cabem em um mesmo nó. N : Número de nós-filhos que um nó pode possuir. Neste exemplo, usaremos M=3, N=2.
35 GSP - Cálculo do Suporte Primeiramente, definimos as funções de hash para cada item que aparece na base: h(1) = 1; h(2) = 2; h(3) = 1; h(4) = 2; h(5) = 1. (Variam de acordo com N). Inserindo as 3 primeiras sequências na árvore: <{1, 3}> <{1}, {3}> <{2}, {3}> Na hora de inserir a quarta sequência <{3}, {3}>, o nó-raiz está cheio! <{1, 3}> <{1}, {3}> <{3}, {3}> <{2}, {3}>
36 GSP - Cálculo do Suporte Inserindo a sequência <{2, 3}> na árvore: <{1, 3}> <{1}, {3}> <{3}, {3}> <{2}, {3}> <{2, 3}> Na hora de inserir <{1}, {4}> seu nó de destino encontra-se cheio!
37 GSP - Cálculo do Suporte Inserindo a sequência <{1}, {4}> na árvore: <{2}, {3}> <{2, 3}> <{1, 3}> <{1}, {3}> <{3}, {3}> <{1}, {4}>
38 GSP - Cálculo do Suporte CONTANDO AS FREQUÊNCIAS A PARTIR DA ÁRVORE HASH Supondo a seguinte sequência de cliente: c = <{1, 5}, {1}, {3}> <{2}, {3}> <{2, 3}> INCLUDE <{1}, {4}> h(1) = 1; h(2) = 2; h(3) = 1; h(4) = 2; h(5) = 1
39 GSP - Cálculo do Suporte CONTANDO AS FREQUÊNCIAS A PARTIR DA ÁRVORE HASH Supondo a seguinte sequência de cliente: c = <{1, 5}, {1}, {3}> <{2}, {3}> <{2, 3}> INCLUDE <{1}, {4}> h(1) = 1; h(2) = 2; h(3) = 1; h(4) = 2; h(5) = 1
40 GSP - Cálculo do Suporte CONTANDO AS FREQUÊNCIAS A PARTIR DA ÁRVORE HASH Supondo a seguinte sequência de cliente: c = <{1, 5}, {1}, {3}> <{2}, {3}> <{2, 3}> INCLUDE <{1}, {4}> h(1) = 1; h(2) = 2; h(3) = 1; h(4) = 2; h(5) = 1
41 GSP - Cálculo do Suporte CONTANDO AS FREQUÊNCIAS A PARTIR DA ÁRVORE HASH Supondo a seguinte sequência de cliente: c = <{1, 5}, {1}, {3}> <{2}, {3}> <{2, 3}> INCLUDE <{1}, {4}> h(1) = 1; h(2) = 2; h(3) = 1; h(4) = 2; h(5) = 1
42 GSP - Cálculo do Suporte CONTANDO AS FREQUÊNCIAS A PARTIR DA ÁRVORE HASH Supondo a seguinte sequência de cliente: c = <{1, 5}, {1}, {3}> <{2}, {3}> <{2, 3}> INCLUDE <{1}, {4}> h(1) = 1; h(2) = 2; h(3) = 1; h(4) = 2; h(5) = 1
43 GSP - Função INCLUDE INCREMENTANDO O CONTADOR DOS NÓS FREQUENTES Temos como entrada uma sequencia S (presente no Nó) e C (cliente) S = <{2, 4}, {6, 7}> C = <{1, 2}, {4, 6}, {3}, {1, 2}, {3}, {2, 4}, {6, 7}> Em seguida, construímos a tabela de tempos: Itens Tempo 1 [1, 4] 2 [1, 4, 6] 3 [3, 5] 4 [2, 6] 5 [ ] 6 [2, 7] 7 [7]
44 GSP - Função INCLUDE Sendo C uma sequencia de cliente, e S uma sequencia contida no nó, faça: Gera lista de tempos para os itemsets de C. Se C contém S, incrementa contador de frequencia para S. Retira da árvore as sequencias S que atendem ao suporte mínimo.
CECÍLIA HENRIQUES DEVÊZA Orientador: Luiz Henrique de Campos Merschmann. Minerando Padrões Sequenciais para Bases de Dados de Lojas Virtuais
CECÍLIA HENRIQUES DEVÊZA Orientador: Luiz Henrique de Campos Merschmann Minerando Padrões Sequenciais para Bases de Dados de Lojas Virtuais Ouro Preto Junho de 2011 Universidade Federal de Ouro Preto -
Leia maisMINERAÇÃO DE DADOS PARA PADRÕES DE SEQUENCIA
Universidade Federal de Ouro Preto - UFOP Instituto de Ciências Exatas e Biológicas - ICEB Departamento de Computação - DECOM MINERAÇÃO DE DADOS PARA PADRÕES DE SEQUENCIA Aluna: Cecília Henriques Devêza
Leia maisIMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES ENTRE PRODUTOS DE UMA BASE DE DADOS REAL
Universidade Federal de Ouro Preto - UFOP Instituto de Ciências Exatas e Biológicas - ICEB Departamento de Computação - DECOM IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES
Leia maisCECÍLIA HENRIQUES DEVÊZA Orientador: Luiz Henrique de Campos Merschmann. Minerando Padrões Sequenciais para Bases de Dados de Lojas Virtuais
CECÍLIA HENRIQUES DEVÊZA Orientador: Luiz Henrique de Campos Merschmann Minerando Padrões Sequenciais para Bases de Dados de Lojas Virtuais Ouro Preto Junho de 2011 Universidade Federal de Ouro Preto -
Leia maisMineração de Dados: Introdução e Aplicações
Mineração de Dados: Introdução e Aplicações Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br Apresentação Luiz Merschmann Engenheiro
Leia maisCurso de Data Mining
Curso de Data Mining Sandra de Amo Aula 2 - Mineração de Regras de Associação - O algoritmo APRIORI Suponha que você seja gerente de um supermercado e esteja interessado em conhecer os hábitos de compra
Leia maisMINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br
MINERAÇÃO DE DADOS APLICADA Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br Processo Weka uma Ferramenta Livre para Data Mining O que é Weka? Weka é um Software livre do tipo open source para
Leia maisTécnicas de Mineração de Dados
Técnicas de Mineração de Dados Sandra de Amo Universidade Federal de Uberlândia Faculdade de Computação deamo@ufu.br Abstract Data Mining is a multidisciplinary research area, including database tecnology,
Leia maisManual XML. Versão: 1.1
Manual XML Versão: 1.1 Data da última atualização: 19/09/2011 Arquivo revendas.xml Para portais de revendas, este arquivo é o responsável por listar todas as suas revendas. Para própria revenda, o arquivo
Leia maisESTRUTURAS DE DADOS I. Notas de Aula. Prof. Dr. Gilberto Nakamiti
ESTRUTURAS DE DADOS I Notas de Aula 1 SUMÁRIO 1. INTRODUÇÃO... 2 1.1 Array (vetores)... 2 2. BUSCA DE ELEMENTOS... 3 2.1 Busca Seqüencial... 3 2.2 Busca Binária... 3 2.3 Busca Indexada... 3 2.4 Busca Hash...
Leia maisCurso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan
Faculdade INED Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan 1 Unidade 4.5 2 1 BI BUSINESS INTELLIGENCE BI CARLOS BARBIERI
Leia maisModelo de Dados. Modelos Conceituais
Modelo de Dados Modelo para organização dos dados de um BD define um conjunto de conceitos para a representação de dados exemplos: entidade, tabela, atributo,... existem modelos para diferentes níveis
Leia maisData Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento
Data Mining Prof Luiz Antonio do Nascimento Data Mining Ferramenta utilizada para análise de dados para gerar, automaticamente, uma hipótese sobre padrões e anomalias identificadas para poder prever um
Leia maisPossui como idéia central a divisão de um universo de dados a ser organizado em subconjuntos mais gerenciáveis.
3. Tabelas de Hash As tabelas de hash são um tipo de estruturação para o armazenamento de informação, de uma forma extremamente simples, fácil de se implementar e intuitiva de se organizar grandes quantidades
Leia maisAplicação de Regras de Associação para Auxílio na Gestão de Vendas de uma Empresa Varejista Utilizando a ferramenta WEKA
POLITÉCNICA DE Aplicação de Regras de Associação para Auxílio na Gestão de Vendas de uma Empresa Varejista Utilizando a ferramenta WEKA Trabalho de Conclusão de Curso Engenharia da Computação André Luiz
Leia maisESTRUTURA INTERNA DO SISTEMA ESTRUTURA GERAL DO SGBD. Desempenho do BD ÙSatisfação do usuário. A performance do sistema depende:
ESTRUTURA INTERNA DO SISTEMA ESTRUTURA GERAL DO SGBD Desempenho do BD ÙSatisfação do usuário USUÁRIO A performance do sistema depende: da eficiência das estruturas de dados utilizadas; como o sistema opera
Leia maisKDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é?
KDD Conceitos o que é? Fases limpeza etc Datamining OBJETIVOS PRIMÁRIOS TAREFAS PRIMÁRIAS Classificação Regressão Clusterização OBJETIVOS PRIMÁRIOS NA PRÁTICA SÃO DESCRIÇÃO E PREDIÇÃO Descrição Wizrule
Leia maisProf. Msc. Paulo Muniz de Ávila
Prof. Msc. Paulo Muniz de Ávila O que é Data Mining? Mineração de dados (descoberta de conhecimento em bases de dados): Extração de informação interessante (não-trivial, implícita, previamente desconhecida
Leia maisRoteiro. Modelo de Dados Relacional. Processo de Projeto de Banco de Dados. BCC321 - Banco de Dados I. Ementa. Posicionamento.
Roteiro Modelo de Dados Relacional Posicionamento Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br www.decom.ufop.br/luiz Introdução
Leia maisAlgoritmos e Estruturas de Dados 2
Algoritmos e Estruturas de Dados 2 Unidade 1: Árvores binárias Rafael Beserra Gomes Universidade Federal do Rio Grande do Norte Material compilado em 21 de fevereiro de 201. Licença desta apresentação:
Leia maisÁrvores Trie e Patricia. Márcio Bueno ed2tarde@marciobueno.com / ed2noite@marciobueno.com
Árvores Trie e Patricia Márcio Bueno ed2tarde@marciobueno.com / ed2noite@marciobueno.com Árvores Trie Definida em 1960 por Edward Fredkin Vêm de Retrieval (Relacionado à Recuperação de Informações) Para
Leia maisData Warehouse Mineração de Dados
Data Warehouse Mineração de Dados Profa. Roberta Macêdo M. Gouveia robertammg@gmail.com 1 18/12/2014 Data Warehouse Data Mining Big Data A mina de ouro debaixo dos bits 2 Data Warehouse: A Memória da Empresa
Leia maisUnidade 5 Armazenamento e Indexação
Unidade 5 Armazenamento e Indexação Engenharia de Computação / Engenharia de Produção Banco de Dados Prof. Maria das Graças da Silva Teixeira Material base: Banco de Dados, 2009.2, prof. Otacílio José
Leia maisHASHING. Katia Guimarães. katia@cin.ufpe.br 1
HASHING Katia Guimarães katia@cin.ufpe.br 1 HASHING Suponha que você pudesse criar um array onde qualquer item pudesse ser localizado através de acesso direto. Isso seria ideal em aplicações do tipo Dicionário,
Leia maisModelo de Dados. Modelo para organização dos dados de um BD
Modelo de Dados Modelo para organização dos dados de um BD define um conjunto de conceitos para a representação de dados exemplos: entidade, tabela, atributo,... existem modelos para diferentes níveis
Leia maisPlanejar, administrar, desenvolver e implementar banco de dados e sistemas integrados de informacao.
PLANO DE ESTAGIO INTEGRADO A PROPOSTA PEDAGOGICA DO CURSO Curso: 000654 - TECNOLOGIA EM REDES DE COMPUTADORES Nivel: Superior Area Profissional: 0018 - INFORMATICA Area de Atuacao: 0018 - BANCO DE DADOS/INFORMATICA
Leia maisDEPARTAMENTO DE EXPRESSÕES
DEPARTAMENTO DE EXPRESSÕES Critéris de Avaliaçã Direçã Reginal de Educaçã d Nrte Agrupament de Esclas AMADEO DE SOUZA-CARDOSO Telões - Amarante EDUCAÇÃO MUSICAL 2ºCICLO An Letiv 2014/2015 Dmíni Cgnitiv
Leia maisPlanejar, administrar, desenvolver e implementar banco de dados e sistemas integrados de informacao.
PLANO DE ESTAGIO INTEGRADO A PROPOSTA PEDAGOGICA DO CURSO Curso: 000407 - REDES DE COMPUTADORES Nivel: Superior Area Profissional: 0018 - INFORMATICA Area de Atuacao: 0018 - BANCO DE DADOS/INFORMATICA
Leia maisPlanejar, administrar, desenvolver e implementar banco de dados e sistemas integrados de informacao.
PLANO DE ESTAGIO INTEGRADO A PROPOSTA PEDAGOGICA DO CURSO Curso: 000184 - SISTEMAS DE INFORMACAO Nivel: Superior Area Profissional: 0018 - INFORMATICA Area de Atuacao: 0018 - BANCO DE DADOS/INFORMATICA
Leia maisAdministração e Optimização de BDs
Departamento de Engenharia Informática 2010/2011 Administração e Optimização de BDs Mini-Projecto 1 2º semestre A resolução deve ser claramente identificada com o número de grupo e entregue sob a forma
Leia maisData Warehouse Mineração de Dados
Data Warehouse Mineração de Dados Profa. Roberta Macêdo M. Gouveia robertammg@gmail.com 1 05/11/2015 DATA WAREHOUSE DATA MINING BIG DATA A mina de ouro debaixo dos bits. 2 Data Warehouse: A Memória da
Leia maisA Preparação dos Dados
A Preparação dos Dados Escolhas Básicas Objetos, casos, instâncias Objetos do mundo real: carros, arvores, etc Ponto de vista da mineração: um objeto é descrito por uma coleção de características sobre
Leia maisTabelas Hash. Jeane Melo
Tabelas Hash Jeane Melo Roteiro Introdução Motivação Definição Tabelas Hash Exemplos Funções hash Colisões Introdução Estudamos a utilização de estruturas como listas e árvores para armazenar informações
Leia maisAula 02: Conceitos Fundamentais
Aula 02: Conceitos Fundamentais Profa. Ms. Rosângela da Silva Nunes 1 de 26 Roteiro 1. Por que mineração de dados 2. O que é Mineração de dados 3. Processo 4. Que tipo de dados podem ser minerados 5. Que
Leia maisData mining na descoberta de padrões de sintomas com foco no auxílio ao diagnóstico médico
Data mining na descoberta de padrões de sintomas com foco no auxílio ao diagnóstico médico Alexander Rivas de Melo Junior 1, Márcio Palheta Piedade 1 1 Ciência da Computação Centro de Ensino Superior FUCAPI
Leia mais3 Market Basket Analysis - MBA
2 Mineração de Dados 3 Market Basket Analysis - MBA Market basket analysis (MBA) ou, em português, análise da cesta de compras, é uma técnica de data mining que faz uso de regras de associação para identificar
Leia maisBanco de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri. Banco de Dados Processamento e Otimização de Consultas
Processamento e Otimização de Consultas Banco de Dados Motivação Consulta pode ter sua resposta computada por uma variedade de métodos (geralmente) Usuário (programador) sugere uma estratégia para achar
Leia maisMANUAL DE INTEGRAÇÃO. Padrão de envio e recebimento de dados. Contato suporte@gtplan.com.br
MANUAL DE INTEGRAÇÃO Padrão de envio e recebimento de dados Contato suporte@gtplan.com.br Índice Introdução... 2 Garantia de Funcionamento... 2 Envio de dados pelo cliente... 2 Layouts de integração...
Leia maisSISTEMAS LINEARES CONCEITOS
SISTEMAS LINEARES CONCEITOS Observemos a equação. Podemos perceber que ela possui duas incógnitas que são representadas pelas letras x e y. Podemos também notar que se e, a igualdade se torna verdadeira,
Leia maisBases de Dados. Parte IX: Organização Física dos Dados
Bases de Dados Parte IX Organização Física dos Dados Unidades de Medida da Informação A unidade fundamental é o byte. byte corresponde a 8 bits e cada bit permite representar ou um 0 ou um. Kilobyte (Kbyte
Leia mais20-mai-05 ruiz INT: Versão 3.1.15 BUG: Erro ao abrir o wireport sem o builder, nao validava a licença corretamente
20-mai-05 ruiz INT: Versão 3.1.15 23-mai-05 ruiz BUG: Erro ao abrir o wireport sem o builder, nao validava a licença corretamente 25-mai-05 ruiz 30-mai-05 geraldo INT: Versão 3.1.16 7-jun-05 ruiz 7-jun-05
Leia maise commerces DOCUMENTO DE INTEGRAÇÃO Sumário Dúvidas: 55 51 3023.2332 suporte@hookit.cc www.hookit.cc Atualizado em: 10/09/2014
DOCUMENTO DE INTEGRAÇÃO e commerces Atualizado em: 10/09/2014 Sumário 1. Cadastro e atualização de produtos 2. Exibição do botão Hookar 3. Conversão de acesso em venda 4. Status das vendas 1. Cadastro
Leia maisCurso de Aprendizado Industrial Desenvolvedor WEB. Disciplina: Banco de Dados Professora: Cheli Mendes Costa Modelo de Dados
Curso de Aprendizado Industrial Desenvolvedor WEB Disciplina: Banco de Dados Professora: Cheli Mendes Costa Modelo de Dados Modelo para organização dos dados de um BD. define um conjunto de conceitos para
Leia maisCOMPRESSÃO DE DADOS MULTIMÍDIA
COMPRESSÃO DE DADOS MULTIMÍDIA Por que Compressão? Apesar da expansão das capacidade de comunicação e computação, a demanda das novas aplicações multimídia cresce rapidamente Custo de transmissão e armazenagem
Leia maisDISSERTAÇÃO DE MESTRADO
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE CENTRO DE CIÊNCIAS E TECNOLOGIA COORDENAÇÃO DE PÓS-GRADUAÇÃO EM INFORMÁTICA DISSERTAÇÃO DE MESTRADO INTEGRAÇÃO MINERAÇÃO DE DADOS SGBD NÃO É UMA PANACÉIA: ESTUDO
Leia maisO Crivo de Eratóstenes. Jones Albuquerque DFM-UFRPE. 2004, Recife - PE.
O Crivo de Eratóstenes Jones Albuquerque DFM-UFRPE 2004, Recife - PE. O Algoritmo O Crivo de Eratóstenes encontra o número de primos menor ou igual a algum inteiro positivo número primo é um número que
Leia maisOrientações Básicas Repom.
Orientações Básicas Repom. Considerações importantes: 1 A viagem deverá estar autorizada para depois solicitar o pagamento. 2 É obrigatório informar o campo NCM da mercadoria, que está em tabela>auxiliares>mercadoria.
Leia mais4. Que tipos de padrões podem ser minerados. 5. Critérios de classificação de sistemas de Data Mining. 6. Tópicos importantes de estudo em Data Mining
Curso de Data Mining - Aula 1 1. Como surgiu 2. O que é 3. Em que tipo de dados pode ser aplicado 4. Que tipos de padrões podem ser minerados 5. Critérios de classificação de sistemas de Data Mining 6.
Leia maisPLANO DE ESTAGIO INTEGRADO A PROPOSTA PEDAGOGICA DO CURSO. Curso: 001844 - TECNOLOGIA EM ANALISE E DESENVOLV.DE SISTEMAS Nivel: Superior
PLANO DE ESTAGIO INTEGRADO A PROPOSTA PEDAGOGICA DO CURSO Curso: 001844 - TECNOLOGIA EM ANALISE E DESENVOLV.DE SISTEMAS Nivel: Superior Area Profissional: 0018 - INFORMATICA Area de Atuacao: 0021 - OPERACAO
Leia maisDisciplina de Banco de Dados Parte V
Disciplina de Banco de Dados Parte V Prof. Elisa Maria Pivetta CAFW - UFSM Modelo de Dado Relacional O Modelo Relacional O Modelo ER é independente do SGDB portanto, deve ser o primeiro modelo gerado após
Leia maisESTRUTURAS DE DADOS AVANÇADAS (INF 1010) (a) Seja um TAD definido por uma lista circular implementada em um vetor.
PUC-Rio Departamento de Informática Período: 2015.1 Horário: 2as-feiras e 4as-feiras de 17-19 30 de março de 2015 ESTRUTURAS DE DADOS AVANÇADAS (INF 1010) 1 a Lista de Exercícios 1. Lista (a) Seja um TAD
Leia maisManual de Integração
Manual de Integração Versão 3.10 Conteúdo 1 Obtendo e Instalando o Emissor... 4 1.1 Obtendo o instalador... 4 1.2 Instalando o JAVA e o Framework.NET 2.0... 4 1.3 Instalando o Emissor... 5 2 Padrões de
Leia maisHashing. Rafael Nunes LABSCI-UFMG
Hashing Rafael Nunes LABSCI-UFMG Sumário Mapeamento Hashing Porque utilizar? Colisões Encadeamento Separado Endereçamento Aberto Linear Probing Double Hashing Remoção Expansão Quando não usar! Mapeamento
Leia maisDATA MINING Fabiany Lamboia Luciano Machado Pereira
Unioeste - Universidade Estadual do Oeste do Paraná CENTRO DE CIÊNCIAS EXATAS E TECNOLÓGICAS Colegiado de Informática Curso de Bacharelado em Informática DATA MINING Fabiany Lamboia Luciano Machado Pereira
Leia maisMicrosoft Innovation Center
Microsoft Innovation Center Mineração de Dados (Data Mining) André Montevecchi andre@montevecchi.com.br Introdução Objetivo BI e Mineração de Dados Aplicações Exemplos e Cases Algoritmos para Mineração
Leia maisScanners. série i900. Guia de configuração de digitalização para aplicativos ISIS. A-61734_pt-br
Scanners série i900 Guia de configuração de digitalização para aplicativos ISIS A-61734_pt-br Guia de configuração de digitalização para o driver ISIS Sumário Caixa de diálogo Ferramenta de validação de
Leia maisENGENHARIA DE SOFTWARE PLANO DE ESTAGIO INTEGRADO A PROPOSTA PEDAGOGICA DO CURSO
(s15h PLANO DE ESTAGIO INTEGRADO A PROPOSTA PEDAGOGICA DO CURSO Curso: 002312 - ENGENHARIA DE SOFTWARE Nivel: Superior Area Profissional: 0018 - INFORMATICA Area Atuacao: 0018 - BANCO DE DADOS/INFORMATICA
Leia maisData Warehouse Mineração de Dados
Data Warehouse Mineração de Dados Profa. Roberta Macêdo M. Gouveia robertammg@gmail.com 1 11/06/2015 DATA WAREHOUSE DATA MINING BIG DATA A mina de ouro debaixo dos bits. 2 Data Warehouse: A Memória da
Leia maisKDD UMA VISAL GERAL DO PROCESSO
KDD UMA VISAL GERAL DO PROCESSO por Fernando Sarturi Prass 1 1.Introdução O aumento das transações comerciais por meio eletrônico, em especial as feitas via Internet, possibilitou as empresas armazenar
Leia maisUNIVERSIDADE FEDERAL RURAL DE PERNAMBUCO UFRPE
Seção 1: Algoritmos Seqüências 1. Qual o valor das variáveis x, y, z e k após a execução do seguinte trecho de código? int x, y; int a = 14, b = 3; float z, k; Solução: x=14/3=4 y=14mod(3)=2 z=14/3=4 k=3/2.0=1.5
Leia maisProf. Daniela Barreiro Claro
Arquivos de registros Abstração do SGBD Pode ser criado, destruido e ter registros incluidos e excluidos nele Tb suporta a varredura Uma relacao geralmente é armazenada como um arquivo de registros Camada
Leia maisFigura C13.1. Diagrama de Casos de Uso para UC004 Registrar Proventos e Descontos!.
A6Implementando o Padrão "Manter Coleção" Capítulo 13 Implementação o Caso de Uso UC004 Registrar Proventos e Descontos! - Analisando a Especificação Analisando o estereótipo do Caso de Uso da especificação
Leia maisTarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS
Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS Sumário Conceitos / Autores chave... 3 1. Introdução... 3 2. Tarefas desempenhadas por Técnicas de 4 Mineração de Dados...
Leia maisAlgoritmos e Programação (Prática) Profa. Andreza Leite andreza.leite@univasf.edu.br
(Prática) Profa. Andreza Leite andreza.leite@univasf.edu.br Introdução O computador como ferramenta indispensável: Faz parte das nossas vidas; Por si só não faz nada de útil; Grande capacidade de resolução
Leia maisGEOPROCESSAMENTO. Conjunto de ferramentas usadas para coleta e tratamento de informaçõ. ções espaciais, geraçã
GEOPROCESSAMENTO Conjunto de ferramentas usadas para coleta e tratamento de informaçõ ções espaciais, geraçã ção o de saídas na forma de mapas, relatórios, rios, arquivos digitais, etc; Deve prover recursos
Leia maisStrings (Compressão) Estrutura de Dados II Jairo Francisco de Souza
Strings (Compressão) Estrutura de Dados II Jairo Francisco de Souza Compressão de Dados Objetivos Reduzir espaço de armazenagem Reduzir tempo de transmissão Muito importante Informação (e dados) tende
Leia maisManual do Usuário. Sistema Financeiro e Caixa
Manual do Usuário Sistema Financeiro e Caixa - Lançamento de receitas, despesas, gastos, depósitos. - Contas a pagar e receber. - Emissão de cheque e Autorização de pagamentos/recibos. - Controla um ou
Leia maisComputação e Processamento de Dados CPD INF400
Computação e Processamento de Dados CPD INF400 Professor: André Ferreira andre.ferreira@ifba.edu.br Algoritmos com Repetição São algoritmos onde um conjunto de passos é repetido por um certo número de
Leia maisRoteiro. BCC321 - Banco de Dados I. Conceitos Básicos. Conceitos Básicos. O que é um banco de dados (BD)?
Roteiro BCC321 - Banco de Dados I Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br www.decom.ufop.br/luiz Conceitos Básicos Banco
Leia maisINE 5432 Banco de Dados II
UFSC-CTC-INE Curso de Ciências da Computação INE 5432 Banco de Dados II Ronaldo S. Mello 2010/1 http://www.inf.ufsc.br/~ronaldo/ine5432 Programa da Disciplina Objetivo Conteúdo Avaliação Bibliografia Cronograma
Leia maisInformática I. Aula 6. http://www.ic.uff.br/~bianca/informatica1/ Aula 6-12/09/2007 1
Informática I Aula 6 http://www.ic.uff.br/~bianca/informatica1/ Aula 6-12/09/2007 1 Ementa Noções Básicas de Computação (Hardware, Software e Internet) HTML e Páginas Web Internet e a Web Javascript e
Leia maisO Valor do Licenciamento do SQL Server 2012 Versus Oracle Database
White Paper Publicado em: Janeiro de 2012 Aplica-se ao: SQL Server 2012 O Valor do Licenciamento do SQL Server 2012 Versus Oracle Database Resumo: As mudanças no produto e no licenciamento da Microsoft
Leia maisCONHECIMENTOS ESPECÍFICOS
De acordo com o comando a que cada um dos itens de 51 a 120 se refira, marque, na folha de respostas, para cada item: o campo designado com o código C, caso julgue o item CERTO; ou o campo designado com
Leia maisFACULDADE DE CIÊNCIAS SOCIAIS E TECNOLÓGICAS FACITEC CURSO:
FACULDADE DE CIÊNCIAS SOCIAIS E TECNOLÓGICAS FACITEC CURSO: Bacharelado em Sistemas de Informação DISCIPLINA: Fundamentos de Sistemas de Informação PROFESSOR: Paulo de Tarso Costa de Sousa TURMA: BSI 2B
Leia maisExemplos de aplicação. Mineração de Dados 2013
Exemplos de aplicação Mineração de Dados 2013 Luís Rato Universidade de Évora, 2013 Mineração de dados / Data Mining 1 Classificação: Definição Dado uma conjunto de registos (conjunto de treino training
Leia maisMotivação: inundação de informação. Data warehouse. Inteligência computacional aplicada em finanças, comércio e indústria
Programa de Especialização em Inteligência Computacional Motivação: inundação de informação Morrendo de sede por conhecimento em um oceano de dados Inteligência computacional aplicada em finanças, comércio
Leia maisCURSO BÁSICO DE PROGRAMAÇÃO AULA 7
CURSO BÁSICO DE PROGRAMAÇÃO AULA 7 Revisão para prova: Comandos de Entrada e Saída Estruturas de Decisão (Se, caso (escolha)) Laços de Repetição (Enquanto, Repita, Para) Relembrando Trabalho 1 Prazo de
Leia maisPlanejar, administrar, desenvolver e implementar banco de dados e sistemas integrados de informacao.
PLANO DE ESTAGIO INTEGRADO A PROPOSTA PEDAGOGICA DO CURSO Curso: 000053 - ENGENHARIA DA COMPUTACAO Nivel: Superior Area Profissional: INFORMATICA Area de Atuacao: BANCO DE DADOS/INFORMATICA Planejar, administrar,
Leia maisPOSCOMP 2004. Caderno de Questões. Nome do Candidato: Identidade:
POSCOMP 2004 Exame de Seleção para Pós-Graduação em Ciência da Computação Caderno de Questões Nome do Candidato: Identidade: Instruções Gerais aos Candidatos O tempo total de duração do exame será de 4
Leia maisÁlgebra Relacional. Conjunto de operações que usa uma ou duas relações como entrada e gera uma relação de saída. Operações básicas:
Álgebra Relacional Conjunto de operações que usa uma ou duas relações como entrada e gera uma relação de saída operação (REL 1 ) REL 2 operação (REL 1,REL 2 ) REL 3 Operações básicas: seleção projeção
Leia maisAlgoritmos de pesquisa. Tabelas de dispersão/hash
Algoritmos de pesquisa Tabelas de dispersão/hash Introdução Motivação: Considerar o problema de pesquisar um determinado valor num vetor (array). Se o vetor não está ordenado, a pesquisa requer O(n) de
Leia maisO Processo de KDD. Data Mining SUMÁRIO - AULA1. O processo de KDD. Interpretação e Avaliação. Seleção e Pré-processamento. Consolidação de dados
SUMÁRIO - AULA1 O Processo de KDD O processo de KDD Interpretação e Avaliação Consolidação de dados Seleção e Pré-processamento Warehouse Data Mining Dados Preparados p(x)=0.02 Padrões & Modelos Conhecimento
Leia maisWEBSERVICES. Versão Schema XML 1
WEBSERVICES Versão Schema XML 1 1.Introdução 2. Interfaces Disponíveis 3.Arquitetura de Comunicação 4.Serviços e Métodos 5.Anexos 1 Introdução Nota Fiscal de Serviços Eletrônica (NFS-e) é o documento emitido
Leia maisRegisto Alimentar de 3 dias. Nota: Leia com atenção, e tente cumprir, os parâmetros de utilização.
Registo Alimentar de 3 dias Nota: Leia com atenção, e tente cumprir, os parâmetros de utilização. Parâmetros de Utilização: É necessário anotar tudo o que foi ingerido durante 3 dias representativos do
Leia maisEntendendo Injeção de SQL
Entendendo Injeção de SQL Autor K4m1k451 < k4m1k451@gmail.com bere_bad@hotmail.com > 18/05/2009 Sumário: ---[ 0x00 Introdução... 4 ---[ 0x01 Desmistificando as single quotes... 4 ---[ 0x02 Injetando...
Leia maisManual de Integração WebCheckout
Manual de Integração WebCheckout Conteúdo 1. Introdução... 3 2. Integração WebCheckout... 3 2.1. Campos Obrigatórios... 3 2.2. Integração Ideal... 4 2.2.1. Código exemplo com os campos necessários para
Leia maisMANUAL INTEGRAÇÃO DE SISTEMAS
MANUAL INTEGRAÇÃO DE SISTEMAS ÍNDICE 1. Objetivo... 3 2. Características... 4 3. Configuração do FTP... 5 4. Exportação de Pedidos e Clientes... 7 4.1 Exemplo... 9 5. Exportar estoque de produtos... 10
Leia maisEstruturas de Repetição Parte II PARA-ATÉ
Estruturas de Repetição Parte II PARA-ATÉ Prof. Dr. Edson Pimentel Centro de Matemática, Computação e Cognição Objetivos Aprender a sintaxe da Estrutura de Repetição PARA-ATÉ na linguagem PORTUGOL Aprender
Leia maisExercícios Gerência de Memória
Exercícios Gerência de Memória 1) Considerando o uso de particionamento Buddy em um sistema com 4 GB de memória principal, responda as seguintes perguntas: a) Esboce o gráfico que representa o uso da memória
Leia maisUFG - Instituto de Informática
UFG - Instituto de Informática Curso: Engenharia de Software Arquitetura de Software Prof.: Fabrízzio A A M N Soares professor.fabrizzio@gmail.com Aula 12 Consultas JPQL Consultas JPQL Consultas em JPQL
Leia maisFACULDADE CAMPO LIMPO PAULISTA MESTRADO EM CIÊNCIA DA COMPUTAÇÃO. Projeto e Análise de Algoritmos II Lista de Exercícios 2
FACULDADE CAMPO LIMPO PAULISTA MESTRADO EM CIÊNCIA DA COMPUTAÇÃO Projeto e Análise de Algoritmos II Lista de Exercícios 2 Prof. Osvaldo. 1. Desenvolva algoritmos para as operações abaixo e calcule a complexidade
Leia maisTutorial de Metastorage
Tutorial de Metastorage Desenvolvimento de aplicações com banco de dados em PHP usando a ferramenta Metastorage http://www.manuellemos.net/ Manuel Lemos mlemos@acm.org Novembro de 2005 Resumo Introdução
Leia maisRoteiro. Conceitos e Arquitetura de Sistemas de Banco de Dados. Conceitos e Arquiteturas de Sistemas de Banco de Dados. BCC321 - Banco de Dados I
Roteiro Conceitos e Arquitetura de Sistemas de Banco de Dados Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br www.decom.ufop.br/luiz
Leia maisAplicações Informáticas de Gestão
1. Denominação do curso de especialização tecnológica: Aplicações Informáticas de Gestão 2. Perfil profissional que visa preparar: Técnico (a) Especialista em Aplicações Informáticas de Gestão É o profissional
Leia maisNúmero: Nome: 1 --------------------------------------------------------------------------------------------------------------
Número: Nome: 1 -------------------------------------------------------------------------------------------------------------- INSTITUTO SUPERIOR TÉCNICO Gestão e Tratamento de Informação Exame: tipo Dezembro
Leia maisSistemas de Arquivos. Sistemas de arquivos: Mecanismos para armazenamento on-line e acesso de dados e programas.
Sistemas de Arquivos Sistemas de arquivos: Mecanismos para armazenamento on-line e acesso de dados e programas. Sistemas de Arquivos Um sistema de arquivos implica: Conceituação de arquivos e diretórios
Leia maisUMA VISÃO GERAL DAS PRINCIPAIS TAREFAS DE MINERAÇÃO DE DADOS. Tauller Augusto de Araújo Matos 1
UMA VISÃO GERAL DAS PRINCIPAIS TAREFAS DE MINERAÇÃO DE DADOS Tauller Augusto de Araújo Matos 1 Resumo: Este trabalho tem como objetivo conceituar e diferenciar as principais tarefas de mineração de dados,
Leia maisHipótese Estatística:
1 PUCRS FAMAT DEPTº DE ESTATÍSTICA TESTE DE HIPÓTESE SÉRGIO KATO Trata-se de uma técnica para se fazer inferência estatística. Ou seja, a partir de um teste de hipóteses, realizado com os dados amostrais,
Leia mais(s15h PLANO DE ESTAGIO INTEGRADO A PROPOSTA PEDAGOGICA DO CURSO. Curso: 000065 - LETRAS Nivel: Superior
(s15h PLANO DE ESTAGIO INTEGRADO A PROPOSTA PEDAGOGICA DO CURSO Curso: 000065 - LETRAS Nivel: Superior Area Profissional: 0004 - BIBLIOTECA Area de Atuacao: 0042 - ACERVO/BIBLIOTECA Analisar e processar
Leia mais