Mineração e Armazenamento de Dados



Documentos relacionados
TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

Data Warehousing e OLAP

Modelação Multidimensional

Arquitetura física de um Data Warehouse

Data Warehousing. Leonardo da Silva Leandro. CIn.ufpe.br

Módulo 4. Construindo uma solução OLAP

Modelando um Data Warehouse GRIMALDO OLIVEIRA

Diagrama de transição de Estados (DTE)

Instituto Superior Politécnico de Viseu Escola Superior de Tecnologia

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan

Computadores e Sistemas de Informação. Bases de Dados Relacionais (linguagem SQL)

DATA WAREHOUSE. Introdução

Gestão de Tecnologia da Informação

Modelo Relacional. 2. Modelo Relacional (Lógico)

INF Fundamentos de Banco de Dados Exercícios sobre normalização

Chapter 3. Análise de Negócios e Visualização de Dados

OLAP. Introdução. Cristina C. Vieira Departamento de Engenharia Eletrónica e Informática

Banco de Dados I. 1. Conceitos de Banco de Dados

Especificação Operacional.

Diagrama de contexto

Fundamentos da Análise Multidimensional

Tópicos Avançados de Banco de Dados (Business Intelligence)

Conteúdo. Disciplina: INF Engenharia de Software. Monalessa Perini Barcellos. Centro Tecnológico. Universidade Federal do Espírito Santo

Tarefa Orientada 14 Subconsultas

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse

Gerenciamento de Dados e Gestão do Conhecimento

ADMINISTRAÇÃO DE ATIVOS DE TI GERENCIAMENTO DE CONFIGURAÇÃO

Capítulo Laudon, Cap. 5

CIn/UFPE Projeto Conceitual de BD - Prof. Robson Fidalgo 1

MSc. Daniele Carvalho Oliveira

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan

ADMINISTRAÇÃO DOS RECURSOS DE DADOS

Curso de Engenharia de Sistemas e Informática - 5º Ano. Ficha T. Prática n.º 1

Desenho e Modelação de Esquemas de Bases de Dados

TOTVS BA Guia de Customização Linha Logix

Profa. Daniela Barreiro Claro

Tecnologia da Informação. Prof Odilon Zappe Jr

KDD E MINERAÇÃO DE DADOS:

SAD orientado a DADOS

Ferramentas de Engª de Requisitos

Gerenciamento de Dados. Objetivos do Capítulo

1. Dados Gerais. Morada da Sede : Código Postal : Concelho : WebPage : geral : Nome da pessoa responsável pelo projecto:

Uma peça estratégica para o seu negócio

Implementação de BD. Banco de dados relacional. Elementos que compõem o banco de dados CAMPO REGISTRO TABELA. Paulo Damico MDK Informática Ltda.

Modelação Dimensional 4

Complementos de Base de Dados Enunciados de Exercícios

Prof. Ronaldo R. Goldschmidt.

Modelagem Multidimensional: Esquema Estrela

Campus Capivari Análise e Desenvolvimento de Sistemas (ADS) Prof. André Luís Belini prof.andre.luis.belini@gmail.com /

PARTE L - CONTRATOS PÚBLICOS

Soluções de Inteligência de Negócio e Mercado

Software PHC preparado para SAF-T PT

Banco de Dados Modelo Conceitual, Lógico, Físico, Entidade- Relacionamento (ER) Hélder Nunes

Departamento de Engenharia de Electrónica e Telecomunicações e de Computadores Licenciatura em Engenharia Informática e de Computadores


Data Warehouse. Diogo Matos da Silva 1. Universidade Federal de Ouro Preto, Ouro Preto, MG, Brasil. Banco de Dados II

Master File CARTILHA MASTER FILE

Sistemas de Apoio à Decisão (SAD) - Senado

Instituto Politécnico de Beja Escola Superior de Tecnologia e Gestão. GesStock. Engenharia Informática. Base de Dados II

Data Warehouse. Compras. Caroline B. Perlin

Tarefa Orientada 2 Criar uma base de dados

Sistemas de Informação

Modelode Domínio: Identificando. Prof. Anderson Cavalcanti UFRN-CT-DCA

Thiago Locatelli de OLIVEIRA, Thaynara de Assis Machado de JESUS; Fernando José BRAZ Bolsistas CNPq; Orientador IFC Campus Araquari

SISTEMAS DE INFORMAÇÃO PARA GESTÃO

Banco de Dados - Senado

Capítulo 5 Complemento. 5.1 Laudon, Cap. 5

ANEXO 5 - Guia para o preenchimento do Questionário sobre património cultural imaterial

Banco de Dados. Arquitetura e Terminologia. Prof. Walteno Martins Parreira Jr waltenomartins@yahoo.

Licenciatura em Gestão

Banco de Dados I. Apresentação (mini-currículo) Conceitos. Disciplina Banco de Dados. Cont... Cont... Edson Thizon

CADERNO DE EXERCÍCIOS. Módulo 5 Folha de Cálculo

Tecnologia da Informação. Prof Odilon Zappe Jr

Banco de Dados. Modelo Relacional. Prof. Enzo Seraphim

Conjunto de objetos da realidade modelada sobre os quais deseja-se. dados.

Data Warehouse Granularidade. rogerioaraujo.wordpress.com - rgildoaraujo@gmail.com 1

Modelagem de Dados Usando o Modelo Entidade-Relacionamento

1/5 *UNIVERSIDADE DA BEIRA INTERIOR* (A classificação desta prova será publicada neste site)

Curso:... Prova de Sistemas de Informação para Bibliotecas (21105) Nome:... Nº de Estudante:... B. I. nº... Assinatura do Vigilante:...

Engenharia de Software I

- A crescente necessidade de sistemas inteligentes e de aquisição de conhecimento levaram à necessidade de implementação de Data Warehouses.

CENTRO DE INFORMÁTICA

Licenciatura em Engenharia Informática Sistemas Distribuídos I 2ª chamada, 6 de Julho de º Semestre, 2004/2005

Construir um modelo de dados é: - Identificar, Analisar e Registar a política da organização acerca dos dados

Bairro. Normas Orientadoras BAIRRO. Co-financiamento

FUNDAMENTOS DA ORIENTAÇÃO A OBJETOS- REVISÃO

Profº Aldo Rocha. Banco de Dados

Projecto Final de Licenciatura Engenharia Informática - Computadores e Sistemas. elaborado por: Filipe Manuel Marques Pinto Pinheiro

UNIVERSIDADE LUSÍADA DE LISBOA. Programa da Unidade Curricular MARKETING INDUSTRIAL E DOS SERVIÇOS Ano Lectivo 2014/2015

DATA WAREHOUSE. Rafael Ervin Hass Raphael Laércio Zago

Faturação simplificada: Principais alterações

No mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o

Transcrição:

Mineração e Armazenamento de Dados Carlos P. Caldeira Departamento de Informática Universidade de Évora ccaldeira@di.uevora.pt http://www.di.uevora.pt/~ccaldeira

Modelo dimensional

Modelo dimensional Modelo Entidade-Relação Limitações dos SGBDR Modelo dimensional: com fácil acesso e utilização

Modelo relacional Objectivos: Redundância Integridade Consequência: Transações Divisão dos dados Teia intrincada Todas as tabelas são semelhantes

Modelo relacional Problemas: Queries simples complexas Diagramas demasiado complexos Número de possibilidades num join

Modelo relacional Análise complexa? Calcular a percentagem do total das vendas para cada produto, por categoria e cidade, comparado com o mesmo período do ano anterior. pergunta complicada? como faz o utilizador?

Análise dos dados OLTP: Qual foi o lucro gerado pelo novo produto? DSS: Qual foi o lucro gerado pelo novo produto por mês, na Beira Litoral, por nível demográfico, em cada ponto de venda, em relação à anterior versão do produto?

Modelo multi-dimensional Estrutura adequada aos utilizadores Olhar para os dados usando uma vista multi-dimensional Modelo de dados Diagrama

Modelo dimensional Dois grupos: factos e dimensões dados a analisar atributos sobre os factos

Tabela de factos Tabela principal facto - é uma medida da actividade Vendas Diárias Factos Data Chave (CE) Produto Chave (CE) Loja Chave (CE) Cliente Chave (CE) Número Talão (DD) Venda Euros Unidades Vendidas

Tabelas de dimensões Contêm a descrição textual do negócio Muitos atributos Cada dimensão é definida pela PK Principal fonte de informação Manter o DW utilizável Não-normalizadas

Modelo dimensional Data Dimensão Data Chave (CP) (outros atributos) Produto Dimensão Produto Chave (CP) (outros atributos) Vendas Diárias Factos Loja Dimensão Loja Chave (CP) (outros atributos) Data Chave (CE) Produto Chave (CE) Loja Chave (CE) Cliente Chave (CE) Número Talão (DD) Venda Euros Simplicidade e simetria Unidades Vendidas Compreensão e navegabilidade Melhor performance Dados atómicos Star Join Schema

Complementaridade entre... Data Dimensão Data Chave (CP) Data Dia da Semana Mês Ano (outros atributos) Loja Dimensão Loja Chave (CP) Código da Loja Nome da Loja Endereço da Loja Código Postal da Loja Concelho da Loja Freguesia da Loja (outros atributos) Vendas Diárias Factos Data Chave (CE) Produto Chave (CE) Loja Chave (CE) Cliente Chave (CE) Número Talão (DD) Venda em Euros Unidades Vendidas Produto Dimensão Produto Chave (CP) Descrição do Produto Número SKU (Chave Natural) Gama Descrição Categoria Descrição Subcategoria Descrição (mais atributos)

Complementaridade entre... Data Dimensão Data Chave (CP) Data Dia da Semana Mês Ano (outros atributos) Loja Dimensão Loja Chave (CP) Código da Loja Nome da Loja Endereço da Loja Código Postal da Loja Concelho da Loja Freguesia da Loja (outros atributos) Vendas Diárias Factos Data Chave (CE) Produto Chave (CE) Loja Chave (CE) Cliente Chave (CE) Número Talão (DD) Venda Euros Unidades Vendidas Produto Dimensão Produto Chave (CP) Descrição do Produto Número SKU (Chave Natural) Gama Descrição Categoria Descrição Subcategoria Descrição (mais atributos) Concelho da Loja Gama Descrição Venda Euros Unidades Vendidas Lisboa Detergente 125 6 Lisboa Loiça 27,5 1 Lisboa Ferramenta 13,8 1 Évora Roupa 7,9 1 Évora Bolacha 36,3 7

Asneiras... Utilização de nomes crípticos: T_Colegio T_Grau T_Especialidade Num_Al Doc_Id Cd_cr_key etc..

Asneiras... Tabela tradução de códigos

Modelo dimensional Casos de Estudo

As quatro fases do desenho 1. Escolha do processo a modelar Um processo não é... Publicar os dados apenas uma vez

As quatro fases do desenho 2. Declaração do grão do processo Nível de detalhe, o que significa... Exemplos: Cada um dos medicamentos... A classificação a cada disciplina... O balanço mensal de uma conta... O bilhete de embarque...

As quatro fases do desenho 3. Escolha das dimensões Quais são as propriedades dos dados? Se a granularidade for bem escolhida...

As quatro fases do desenho 4. Identificação dos factos numéricos O que se está a medir? Os factos têm que estar de acordo com o nível de detalhe definido no ponto 2.

Empresa distribuição (retail case) Cada loja: mercearia, drogaria, lácteos, padaria,... Cada loja tem 60 000 produtos: código de inventário 5 000 não têm UPC 1. Processo 2. Grão 3. Dimensões 4. Factos

Empresa distribuição 1. Estudar as vendas nos POS Analisar o comportamento dos clientes Tipo de vendas por loja Promoções

Empresa distribuição 2. Cada linha numa venda no POS Dados atómicos são naturalmente dimensionais alto valor analítico agregado de múltiplas formas Qualquer estudo-resumo pode ter base nos dados atómicos mas...

Empresa distribuição 3. Derivação das dimensões Loja, produto e data dimensões primárias Promoção dimensão adicional

Empresa distribuição 4. Escolha dos factos Os factos têm que alinhar com o grão escolhido Que factos são recolhidos num POS? a quantidade vendida o valor da venda

Data Dimensão Data - dimensão Data Key (PK) Data Descrição Dia da Semana Dia Juliano Semana Juliana Mês Juliano Número do Dia no Mês Número do Dia no Ano Número do Dia no Mês Fiscal Número do Dia no Ano Fiscal Nome do Mês Número do Mês no Ano Mês-Ano (MM-YYYY) Trimestre Semestre Ano Semana Fiscal Mês Fiscal Número do Mês Fiscal no Ano Número da Semana Fiscal no Ano Mês-Ano Fiscal (MM-YYYY) Indicação de Feriado Tipo de Dia da Semana Estação de Vendas Acontecimento Importante (outros atributos)