Data Warehouse Toolkit: Telecomunicações e Utilitários (Cap. 10)

Documentos relacionados
Data Warehouse Toolkit Guia completo para modelagem dimensional Capítulo 7 - Contabilidade

Data Warehouse. Debora Marrach Renata Miwa Tsuruda

Processo de Criação de um Esquema Estrela

Sérgio Luisir Díscola Junior

EAD-0750 INTELIGÊNCIA DE NEGÓCIOS. Prof. Sérgio Luiz de Oliveira Assis

Conceitos Básicos. Processamento Analítico de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri Prof. Dr. Ricardo Rodrigues Ciferri

The Data Warehouse Toolkit

Sistemas de Informação Geográficos. Informação na Organização. O Valor da Informação. Sistemas de Informação Tradicionais. O Valor da Informação

Modelação Dimensional 2

Arquitetura de um Ambiente de Data Warehousing

Modelagem Multidimensional

1ª Forma Normal. Uma relação está na 1ª Forma normal se todos os seus atributos são valores escalares.

Roteiro da apresentação

Informática II Cap. 5-1 Modelo Relacional, Normalização e Diagramas E-R

Modelo Relacional. Relacionamento. Processo de Projeto de. Programa. Modelo Entidade Relacionamento

Normalização. Anomalias Dependência e determinantes Normalização

Antecipar o Problema

MODELO DE BANCO DE DADOS RELACIONAL

2. Revisão e Dicas de Modelagem Conceitual

Sistemas de Apoio a Decisão

Data Warehousing: Conceitos Básicos e Arquitetura

Modelagem Multidimensional - Nível Lógico -

Banco de Dados Geográficos

Data Warehousing: Conceitos Básicos e Arquitetura

Conceitos Básicos. Profa. Dra. Cristina Dutra de Aguiar Ciferri. Algoritmos e Estruturas de Dados II: Projeto

Sistemas de Apoio a Decisão


Backup e Restauração Banco de Dados. Evandro Deliberal

Arquitetura de um Ambiente de Data Warehousing

ÍNDICE EPI. Por departamento / Seção. Botas e Calçados Luvas Óculos Segurança e Proteção e e 197.

Análise e Projeto de Sistemas

Modelação Dimensional 4

A apuração do resultado leva em consideração as origens de recursos representadas pelas RECEITAS, e as aplicações de recursos em DESPESAS e CUSTOS.

Mineração de itemsets e regras de associação

Banco de Dados I. Aula 17 - Prof. Bruno Moreno 08/11/2011

Banco de Dados. Banco de Dados

Conceitos Básicos. Fundação Centro de Análise, Pesquisa e Inovação Tecnológica Instituto de Ensino Superior - FUCAPI. Disciplina: Banco de Dados

EAD-0750 INTELIGÊNCIA DE NEGÓCIOS. Prof. Sérgio Luiz de Oliveira Assis

PORTFÓLIO TEROS : PRICING AGILIDADE, CONSISTÊNCIA E ASSERTIVIDADE NA DEFINIÇÃO DE PREÇOS

Modelagem Multidimensional

CONTABILIDADE GERAL. Demonstrações Contábeis. Demonstração do Valor Adicionado Parte 1. Prof. Cláudio Alves

8ª Semana. 12 semana para o topo

Layout de Extração Relatório de Produtos DI NeoGrid v5.1

Transformação ER para modelo relacional

Contabilidade Avançada Prof. João Domiraci Paccez Exercício Nº 13

O ECR no Varejo Brasileiro: estrutura e oportunidades. Nelson Barrizzelli Universidade de SãoPaulo

Business Intelligence Inteligência Corporativa

Estudo de Validade feito por Spectrum Assessments Avaliação de Índice Comportamental

ESTUDO DE IMPACTO AMBIENTAL (EIA)

Introdução aos sistemas de informação

Engenharia reversa de arquivos e documentos. Capítulo 6

DIAGRAMAS DE FLUXO DE DADOS. Rosana C. M. Grillo Gonçalves

Divulgação dos Resultados. 3 Trimestre de 2018

Livro: Sistemas e Ciências da Informação Geográfica. SUMÁRIO 1 Introdução

Revisando habilidades. Prof. Msc. Hamilton Vinícius Gomes

Material Complementar - BI. Grinaldo Lopes de Oliveira Curso Superior de Tecnologia em Análise e Desenvolvimento de Sistemas

OLAP. Rodrigo Leite Durães.

SQL. Processamento Analítico de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri Prof. Dr. Ricardo Rodrigues Ciferri

Sales & Marketing. Inspiring consumer goods sector by everis

O que é modelo lógico. Tipos de modelo

Banco de Dados I. Prof. Diego Buchinger. Profa. Rebeca Schroeder Freitas Prof. Fabiano Baldo.

Recursividade, Tentativa e Erro

Motivação. Análise de Dados. BD x DW OLTP. Data Warehouse. Revisão Quais as diferenças entre as tecnologias de BD e DW? OLAP Modelos Multidimensionais

Transcrição:

Data Warehouse Toolkit: Telecomunicações e Utilitários (Cap. 10) Vinícius Ramos Toledo Ferraz Prof. Dr. Ricardo Rodrigues Ciferri

Agenda n Dicas para revisão de projetos n O que está errado neste estudo de caso? n Correções! n Dimensão Posição Geográfica 2

Dicas para revisão de projetos n Granularidade q Qual o grão da tabela de fatos? Declarar uma definição clara e concisa do grão da tabela de fatos é fundamental para um esforço de modelagem produtivo Devem ser identificados os fatos que são consistentes com a declaração do grão 3

Dicas para revisão de projetos n Granularidade q Qual o grão da tabela de fatos? Fato da transação de vendas a varejo no POS Chave da data (FK) Chave do produto (FK) Chave da loja (FK) Chave da promoção (FK) Número da transação POS (DD) Quantidade de vendas Total de vendas em dólar Valor de custo em dólar Valor de lucro bruto em dólar Fato da cesta de mercado no POS Chave da data (FK) Chave do produto A (FK) Chave do produto B (FK) Chave da loja (FK) Chave da promoção (FK) Contagem da cesta Quantidade de vendas do produto A Quantidade de vendas do produto B Total de vendas em dólar do produto A Total de vendas em dólar do produto B Grão = 1 linha por linha de transação POS Grão = 1 linha para cada par de produtos vendidos em um dia por loja e promoção 4

Dicas para revisão de projetos n Granularidade q Qual o grão da tabela de fatos? Fatos agregados como totais anuais são perigosos, pois não são totalmente aditivos Ir para o nível mais baixo de granularidade possível não implica utilizar a maior quantidade de dados detalhados disponíveis na empresa 5

Dicas para revisão de projetos n Granularidade q Qual o grão da tabela das tabelas de dimensão? Cada dimensão deve utilizar um único valor com cada linha de medições da tabela de fatos Devemos recolher as hierarquias de atributos das dimensões, sempre que possível 6

Dicas para revisão de projetos n Granularidade q Qual o grão da tabela das tabelas de dimensão? A economia de disco com o snowflaking raramente compensa suas desvantagens em complexidade e desempenho da consulta Usar outriggers em um cluster de cardinalidade baixa ou atributos reaproveitados com freqüência deve ser a exceção, e não a regra 7

Dicas para revisão de projetos n Dimensão Data A que se refere a Dimensão Data? 8

Dicas para revisão de projetos n Dimensões de degeneração q O grão da tabela de fatos representa uma transação ou item de linha da transação? q Se tivéssemos uma dimensão separada para as informações de cabeçalho de uma transação, seríamos redundantes? Os números de controle operacional normalmente dão origem a dimensões vazias e são representados como dimensões de degeneração 9

Dicas para revisão de projetos 10

Dicas para revisão de projetos n Chaves substitutas q Há identificadores operacionais sendo utilizados como chave? Em vez de contar com chaves ou identificadores operacionais, recomendamos o uso de chaves substitutas no seu projeto dimensional Nenhuma chave do DW deve ser inteligente 11

Dicas para revisão de projetos n Dimensões em excesso (ou em falta) q O projeto contém entre 5 e 15 dimensões? Um número muito grande de dimensões normalmente é um sinal de que várias delas não são completamente independentes e devem ser combinadas. 12

Dicas para revisão de projetos 13

Agenda n Dicas para revisão de projetos n O que está errado neste estudo de caso? n Correções! n Dimensão Posição Geográfica 14

O que está errado neste projeto? n Data Warehouse de uma grande empresa de telecomunicações wireless Da ta Cli ent e Pr od ut o Pla no de Tar ifa Ca nal de ve nd as Bilhetagem do cliente X X X X X X Lin ha de ser viç o Tráfego de detalhes da chamada X X X X X X Compras X X X X X Estoque do distribuidor X X X X X Vendas por canal X X X X X X X Chamadas de serviço X X X X X X X Itens de reparo X X X X X X X Sw itc h Fo rn ec ed or Co nta do LR E mp res a Fu nci on ári o Tip o da ch am ad a St atu s da ch am ad a 15

O que está errado neste projeto? n Foco no processo de bilhetagem do cliente, pois deseja-se poder analisar... n n n n Uso mensal Receita gerada pelo cliente (bilhetagem) Organização de vendas Plano de tarifas q...para medir o desempenho do canal de vendas e seu representante, além de analisar a eficácia dos planos de tarifas. 16

O que está errado neste projeto? n Dinâmica dos serviços da empresa: n n n n n n Todo mês, é gerada uma conta para cada linha de serviço (número telefônico) Cada linha de serviço é associada a um único cliente Um cliente pode ser várias linhas de serviço, que aparecem como itens de linha separados na mesma conta Cada linha de serviço possui seu próprio conjunto de métricas de bilhetagem, como o número de minutos usados e a tarifa de serviço mensal Há um único plano de tarifa associado a cada linha de serviço em uma dada conta. Mas tal plano pode mudar Um rep. de vendas (e sua empresa/canal de vendas respectivos) é associado a cada linha de serviço para avaliar a receita gerada por cada rep. de vendas. 17

O que está errado neste projeto? n A equipe de DW expõe orgulhosamente sua obra-prima da modelagem dimensional e aguarda o SEU pronunciamento... Dimensão Cliente ID do cliente (PK) Nome do cliente Cidade do cliente CEP do cliente Data do primeiro serviço Crédito original Dimensão Rep. Vendas Chave do rep. de vendas (PK natural) Nome do rep. de vendas ID da empresa de vendas Dimensão Empresa de Vendas ID da empresa de vendas (PK) ID do canal de vendas Fato da conta Conta nº (FK) ID do cliente (FK) Nº do rep. de vendas (FK) ID da empresa de vendas (FK) Cod. do plano de tarifas (FK) Cod. do tipo de plano de tarifas Nº de chamadas Nº total de minutos Nº de minutos de Roam Nº de minutos de longa dist. Tarifa de serviço mensal Tarifa de serviço mês anterior Tarifa de serviço anual Tarifa de roaming Tarifa de longa dist. Impostos Tarifas regulatórias Dimensão Conta Conta nº (PK) Data da conta Nº linha de serviço (FK) Dimensão Linha de Serviço Nº linha de serviço (PK) Cód. da área Cód. e prefixo da área Cód. ativação da linha de serviço Dimensão Plano de Tarifas Cód. plano de tarifas (PK natural) Abreviação do plano de tarifas Grão = 1 linha por conta a cada mês 18

Revisando o projeto... Dimensão Cliente ID do cliente (PK) Nome do cliente Cidade do cliente CEP do cliente Data do primeiro serviço Crédito original Dimensão Rep. Vendas Chave do rep. de vendas (PK natural) Nome do rep. de vendas ID da empresa de vendas Dimensão Empresa de Vendas ID da empresa de vendas (PK) ID do canal de vendas Fato da conta Conta nº (FK) ID do cliente (FK) Nº do rep. de vendas (FK) ID da empresa de vendas (FK) Cod. do plano de tarifas (FK) Cod. do tipo de plano de tarifas Nº de chamadas Nº total de minutos Nº de minutos de Roam Nº de minutos de longa dist. Tarifa de serviço mensal Tarifa de serviço mês anterior Tarifa de serviço anual Tarifa de roaming Tarifa de longa dist. Impostos Tarifas regulatórias Grão = 1 linha por conta a cada mês Dimensão Conta Conta nº (PK) Data da conta Nº linha de serviço (FK) Dimensão Linha de Serviço Nº linha de serviço (PK) Cód. da área Cód. e prefixo da área Cód. ativação da linha de serviço Dimensão Plano de Tarifas Cód. plano de tarifas (PK natural) Abreviação do plano de tarifas X O grão mais baixo seria: 1 linha por linha de serviço em uma conta 19

Revisando o projeto... Vamos criar uma dimensão data! Dimensão Cliente ID do cliente (PK) Nome do cliente Cidade do cliente CEP do cliente Data do primeiro serviço Crédito original Dimensão Rep. Vendas Chave do rep. de vendas (PK natural) Nome do rep. de vendas ID da empresa de vendas Dimensão Empresa de Vendas ID da empresa de vendas (PK) ID do canal de vendas Esta dimensão provavelmente terá o mesmo nº de tuplas que a tabela de fatos! Fato da conta Conta nº (FK) ID do cliente (FK) Nº do rep. de vendas (FK) ID da empresa de vendas (FK) Cod. do plano de tarifas (FK) Cod. do tipo de plano de tarifas Nº da linha de serviço (FK) Nº de chamadas Nº total de minutos Nº de minutos de Roam Nº de minutos de longa dist. Tarifa de serviço mensal Tarifa de serviço mês anterior Tarifa de serviço anual Tarifa de roaming Tarifa de longa dist. Impostos Tarifas regulatórias Dimensão Conta Conta nº (PK) Data da conta DD Dimensão Linha de Serviço Nº linha de serviço (PK) Cód. da área Cód. e prefixo da área Cód. ativação da linha de serviço Dimensão Plano de Tarifas Cód. plano de tarifas (PK natural) Abreviação do plano de tarifas Grão = 1 linha por linha de serviço em uma conta 20

Revisando o projeto... Dimensão Cliente ID do cliente (PK) Nome do cliente Cidade do cliente CEP do cliente Data do primeiro serviço Crédito original Dimensão Rep. Vendas Chave do rep. de vendas (PK natural) Nome do rep. de vendas ID da empresa de vendas Dimensão Empresa de Vendas ID da empresa de vendas (PK) ID do canal de vendas Este snowflaking é desnecessário! Fato da conta Chave da data da conta (FK) Conta nº (DD) ID do cliente (FK) Nº do rep. de vendas (FK) ID da empresa de vendas (FK) Cod. do plano de tarifas (FK) Cod. do tipo de plano de tarifas Nº da linha de serviço (FK) Nº de chamadas Nº total de minutos Nº de minutos de Roam Nº de minutos de longa dist. Tarifa de serviço mensal Tarifa de serviço mês anterior Tarifa de serviço anual Tarifa de roaming Tarifa de longa dist. Impostos Tarifas regulatórias Dimensão Data da conta Chave da data da conta (PK) Data da conta Ano da data da conta...mais atributos Dimensão Linha de Serviço Nº linha de serviço (PK) Cód. da área Cód. e prefixo da área Cód. ativação da linha de serviço Dimensão Plano de Tarifas Cód. plano de tarifas (PK natural) Abreviação do plano de tarifas Grão = 1 linha por linha de serviço em uma conta 21

Revisando o projeto... Vamos agupar este fato textual e seus atributos descritivos na Dimensão Plano de Tarifas! Dimensão Cliente ID do cliente (PK) Nome do cliente Cidade do cliente CEP do cliente Data do primeiro serviço Crédito original Dimensão Rep. Vendas Chave do rep. de vendas (PK natural) Nome do rep. de vendas ID da empresa de vendas Nome empresa de vendas ID do canal de vendas Nome canal de vendas Fato da conta Chave da data da conta (FK) Conta nº (DD) ID do cliente (FK) Nº do rep. de vendas (FK) Cod. do plano de tarifas (FK) Cod. do tipo de plano de tarifas Nº da linha de serviço (FK) Nº de chamadas Nº total de minutos Nº de minutos de Roam Nº de minutos de longa dist. Tarifa de serviço mensal Tarifa de serviço mês anterior Tarifa de serviço anual Tarifa de roaming Tarifa de longa dist. Impostos Tarifas regulatórias Dimensão Data da conta Chave da data da conta (PK) Data da conta Ano da data da conta...mais atributos Fatos textuais raramente são uma boa escolha de projeto! Dimensão Linha de Serviço Nº linha de serviço (PK) Cód. da área Cód. e prefixo da área Cód. ativação da linha de serviço Dimensão Plano de Tarifas Cód. plano de tarifas (PK natural) Abreviação do plano de tarifas Grão = 1 linha por linha de serviço em uma conta 22

Revisando o projeto... Incentiva-se a implementação de chaves substitutas! Dimensão Cliente ID do cliente (PK) Nome do cliente Cidade do cliente CEP do cliente Data do primeiro serviço Crédito original Dimensão Rep. Vendas Chave do rep. de vendas (PK natural) Nome do rep. de vendas ID da empresa de vendas Nome empresa de vendas ID do canal de vendas Nome canal de vendas Fato da conta Chave da data da conta (FK) Conta nº (DD) ID do cliente (FK) Nº do rep. de vendas (FK) Cod. do plano de tarifas (FK) Nº da linha de serviço (FK) Nº de chamadas Nº total de minutos Nº de minutos de Roam Nº de minutos de longa dist. Tarifa de serviço mensal Tarifa de serviço mês anterior Tarifa de serviço anual Tarifa de roaming Tarifa de longa dist. Impostos Tarifas regulatórias Dimensão Data da conta Chave da data da conta (PK) Data da conta Ano da data da conta...mais atributos Dimensão Linha de Serviço Nº linha de serviço (PK) Cód. da área Cód. e prefixo da área Cód. ativação da linha de serviço Dimensão Plano de Tarifas Cód. plano de tarifas (PK natural) Abreviação do plano de tarifas Descrição do plano de tarifas Código do tipo de plano de tarifas Descrição do tipo de plano de tarifas Grão = 1 linha por linha de serviço em uma conta 23

Revisando o projeto... Dimensão Cliente Chave do cliente (PK) ID do cliente (chave natural) Nome do cliente Cidade do cliente CEP do cliente Data do primeiro serviço Crédito original...mais atributos Dimensão Rep. Vendas Chave do rep. de vendas (PK) ID do rep. de vendas (chave natural) Nome do rep. de vendas ID da empresa de vendas Nome empresa de vendas ID do canal de vendas Nome canal de vendas Fato da conta Chave da data da conta (FK) Conta nº (DD) Chave do cliente (FK) Chave do rep. de vendas (FK) Chave do plano de tarifas (FK) Chave da linha de serviço (FK) Nº de chamadas Nº total de minutos Nº de minutos de Roam Nº de minutos de longa dist. Fato atualizado anualmente em meio a fatos atualizados Tarifa de serviço mensalmente! Tarifa de serviço mês anterior Tarifa de serviço anual Tarifa de roaming Tarifa de longa dist. Impostos Tarifas regulatórias Grão = 1 linha por linha de serviço em uma conta Dimensão Data da conta Chave da data da conta (PK) Data da conta Ano da data da conta...mais atributos Dimensão Linha de Serviço Chave da linha de serviço (PK) Nº linha de serviço (chave natural) Cód. da área Cód. e prefixo da área Prefixo da linha de serviço Data de ativação da linha de serviço Dimensão Plano de Tarifas Chave do plano de tarifas (PK) Cód. plano de tarifas (chave natural) Abreviação do plano de tarifas Descrição do plano de tarifas Código do tipo de plano de tarifas Descrição do tipo de plano de tarifas 24

Revisando o projeto... Dimensão Cliente Chave do cliente (PK) ID do cliente (chave natural) Nome do cliente Cidade do cliente CEP do cliente Data do primeiro serviço Crédito original...mais atributos Dimensão Rep. Vendas Chave do rep. de vendas (PK) ID do rep. de vendas (chave natural) Nome do rep. de vendas ID da empresa de vendas Nome empresa de vendas ID do canal de vendas Nome canal de vendas Versão final! Fato da conta Chave da data da conta (FK) Conta nº (DD) Chave do cliente (FK) Chave do rep. de vendas (FK) Chave do plano de tarifas (FK) Chave da linha de serviço (FK) Nº de chamadas Nº total de minutos Nº de minutos de Roam Nº de minutos de longa dist. Tarifa de serviço mensal Tarifa de serviço mês anterior Tarifa de roaming Tarifa de longa dist. Impostos Tarifas regulatórias Grão = 1 linha por linha de serviço em uma conta Dimensão Data da conta Chave da data da conta (PK) Data da conta Ano da data da conta...mais atributos Dimensão Linha de Serviço Chave da linha de serviço (PK) Nº linha de serviço (chave natural) Cód. da área Cód. e prefixo da área Prefixo da linha de serviço Data de ativação da linha de serviço Dimensão Plano de Tarifas Chave do plano de tarifas (PK) Cód. plano de tarifas (chave natural) Abreviação do plano de tarifas Descrição do plano de tarifas Código do tipo de plano de tarifas Descrição do tipo de plano de tarifas 25

Dimensão Posição Geográfica n Utilizada quando a localização geográfica faz parte do conjunto de atributos q Pode ser uma rua, cidade, estado CEP ou mesmo um conjunto de latitudes e longitudes q Cria-se uma tabela geográfica mestra, onde os dados são padronizados e depois reutilizados q Cada linha desta tabela é um uma localização geográfica. 26

Dimensão Posição Geográfica n Outrigger de localização Notem que a hierarquia de localização não foi normalizada! Outrigger de localização: Normalização aceitável de uma dimensão com atributos de localização que, de outra forma, seriam demasiadamente replicados. Notem também que este exemplo não aplica algumas das dicas apresentadas neste capítulo ;-) 27

Dimensão Posição Geográfica n Integração com GIS q Possibilita visualização espacial das consultas, permitindo evidenciar informações antes escondidas em planilhas e relatórios tradicionais q Permite que o GIS tire proveito dos recursos espaciais dos SGBD s 28

Perguntas Vinícius R. T. Ferraz vinicius_ferraz@dc.ufscar.br 29