Modelagem Multidimensional: Esquema Estrela



Documentos relacionados
Tópicos Avançados de Banco de Dados (Business Intelligence)

SISTEMAS DE APOIO À INTELIGÊNCIA DE NEGÓCIOS

Introdução à Modelagem Dimensional para Datawarehouses

Fundamentos da Análise Multidimensional

Modelo de dados do Data Warehouse

Data Warehousing. Leonardo da Silva Leandro. CIn.ufpe.br

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan

Banco de Dados - Senado

Modelo de Entidade e Relacionamento (MER) - Parte 07


Kimball University: As 10 Regras Essenciais para a Modelagem de Dados Dimensional

Disciplina: Unidade III: Prof.: Período:

Data Warehousing e OLAP

Sistemas de Apoio à Decisão (SAD) - Senado

MSc. Daniele Carvalho Oliveira

DATA WAREHOUSE. Introdução

Banco de Dados Modelo Conceitual, Lógico, Físico, Entidade- Relacionamento (ER) Hélder Nunes

UNIVERSIDADE FEDERAL FLUMINENSE PÓLO UNIVERSITÁRIO DE RIO DAS OSTRAS FACULDADE FEDERAL DE RIO DAS OSTRAS CURSO DE CIÊNCIA DA COMPUTAÇÃO

Diagrama de Entidade e Relacionamento

Modelo de Dados. Modelos Conceituais

Banco de Dados I. 1. Conceitos de Banco de Dados

INTRODUÇÃO. Enfoque abstrato. Enfoque Intermediário

BANCO DE DADOS. Eliminar redundâncias e inconsistências de um banco de dados, com reorganização mínima dos dados.

Projeto e Implementação

Aplicação A. Aplicação B. Aplicação C. Aplicação D. Aplicação E. Aplicação F. Aplicação A REL 1 REL 2. Aplicação B REL 3.

Banco de Dados. Aula 1 - Prof. Bruno Moreno 16/08/2011

Modelo de Dados. Modelo para organização dos dados de um BD

DATA WAREHOUSE. Rafael Ervin Hass Raphael Laércio Zago

Arquiteturas de DW e Abordagens de Implementação. Arquiteturas e Abordagens de Implementação

Roteiro 3 Modelagem relacional

SISTEMAS DE APOIO À INTELIGÊNCIA DE NEGÓCIOS

Prof. Alexandre Unterstell Banco de Dados I

BANCO DE DADOS. Fixação dos conteúdos Integridade Referencial Normalização Exercícios

Arquitetura física de um Data Warehouse

Módulo 4. Construindo uma solução OLAP

BANCO DE DADOS DISTRIBUÍDOS e DATAWAREHOUSING

MC536 Bancos de Dados: Teoria e Prática

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

SISTEMA GERENCIADOR DE BANCO DE DADOS

Lista de exercícios 01

BANCO DE DADOS. info 3º ano. Prof. Diemesleno Souza Carvalho

Data Warehouses. Alunos: Diego Antônio Cotta Silveira Filipe Augusto Rodrigues Nepomuceno Marcos Bastos Silva Roger Rezende Ribeiro Santos

Modelo Entidade-Relacionamento

Banco de Dados Lista de Exercícios 01

Tecnologias e Linguagens para Banco de Dados I. Expressão do Relacionamento. Expressão do Relacionamento

Junções e Índices em Tabelas

Para construção dos modelos físicos, será estudado o modelo Relacional como originalmente proposto por Codd.

Curso de Aprendizado Industrial Desenvolvedor WEB. Disciplina: Banco de Dados Professora: Cheli Mendes Costa Modelo de Dados

Prof. Ronaldo R. Goldschmidt. geocities.yahoo.com.br/ronaldo_goldschmidt

Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados

Tarefa Orientada 16 Vistas

Data Warehouse. Debora Marrach Renata Miwa Tsuruda

Mineração e Armazenamento de Dados

Sistemas Gerenciadores de Bancos de Dados

MODELAGEM DE DADOS MODELAGEM DE DADOS. rafaeldiasribeiro.com.br. Aula 3. Prof. Rafael Dias Ribeiro.

OBJETIVOS. Orientações para Projetos de BD; Dependências Funcionais (DFs): Definição de DF; Regras de inferência para DFs.

Dados. Qualquer elemento (aspecto, fato, medida etc.) representativo, disponível e coletável na realidade. fatos no estado bruto, conforme Platão;

A MODELAGEM DE DADOS NO AMBIENTE DATA WAREHOUSE

Bases de Dados aplicadas a Inteligência de Negócios

Modelando um Data Warehouse GRIMALDO OLIVEIRA

Fernando Albuquerque - fernando@cic.unb.br. Bancos de Dados. Fernando Albuquerque fernando@cic.unb.br

CIn/UFPE Projeto Conceitual de BD - Prof. Robson Fidalgo 1

Modelagem de Dados Usando o Modelo Entidade-Relacionamento

Diferença Entre Banco de Dados Relacional e Banco de Dados Dimensional. Difference Between Relational Database and Dimensional Database

Banco de Dados - Senado

Universidade Federal de Goiás Ciências da Computação Sistemas Operacionais 2

AULA Entidade-Relacionamento

Curso de Engenharia de Sistemas e Informática - 5º Ano. Ficha T. Prática n.º 1

Conversão de Base de Dados Relacional para Dimensional para Business Intelligence Utilizando Banco de Dados Mysql

Tópicos Avançados Business Intelligence. Banco de Dados Prof. Otacílio José Pereira. Unidade 10 Tópicos Avançados Business Inteligence.

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan

Banco de Dados I Introdução

Revisão de Banco de Dados

BANCO DE DADOS I AULA 6. Wlllamys Araújo willamysaraujo7@gmail.com

BANCO DE DADOS I AULA 3. Willamys Araújo

Modelagem Conceitual Exercício resolvido 02 Modelagem Conceitual

NOME SEXO CPF NASCIMENTO SALARIO

Banco de Dados I. Introdução. Fabricio Breve

Hoje é inegável que a sobrevivência das organizações depende de dados precisos e atualizados.

Profa. Daniela Barreiro Claro

04/08/2012 MODELAGEM DE DADOS. PROF. RAFAEL DIAS RIBEIRO, MODELAGEM DE DADOS. Aula 1. Prof. Rafael Dias Ribeiro. M.Sc.

Tarefa Orientada 15 Manipulação de dados

Exercícios de Lógica Exercícios de Fixação 08

Dado: Fatos conhecidos que podem ser registrados e têm um significado implícito. Banco de Dados:

ALESSANDRO RODRIGO FRANCO FERNANDO MARTINS RAFAEL ALMEIDA DE OLIVEIRA

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5

ADMINISTRAÇÃO DOS RECURSOS DE DADOS

Faculdade Lourenço Filho - ENADE

Unidade II ADMINISTRAÇÃO DE. Prof. Luiz Fernando de Lima Santos

ANÁLISE E PROJETO ORIENTADO A OBJETOS. Isac Aguiar isacaguiar.com.br isacaguiar@gmail.com

PLANEJAMENTO OPERACIONAL - MARKETING E PRODUÇÃO MÓDULO 3 O QUE É PLANEJAMENTO DE VENDAS E OPERAÇÕES?

Conceitos de Banco de Dados

TRABALHO DE BANCO DE DADOS POSTGRES MINI-MUNDO: BD PARA GERENCIAMENTO DE UNIDADES DE CONSERVAÇÃO

MC536 Bancos de Dados: Teoria e Prática

Introdução Banco de Dados

1- Identifique para cada questão abaixo, se o enunciado se refere a View, Stored Procedures, Trigger ou Function. Apenas um por questão.

Sistema de Informação Gerencial baseado em Data Warehouse aplicado a uma software house

Transcrição:

BANCO DE DADOS DISTRIBUÍDOS e DATAWAREHOUSING http://www.uniriotec.br/~tanaka/tin0036 tanaka@uniriotec.br Modelagem Dimensional Conceitos Básicos Modelagem Multidimensional: Esquema Estrela Proposto por Ralph Kimball Dominante no projeto de DW Características: Distingue melhor as dimensões dos fatos medidos Simplifica a visualização dimensional Na verdade é uma mistura de modelagem conceitual com modelagem lógica, pois já é bastante voltada para a abordagem relacional (a literatura fala sempre em tabelas) Page 1

Esquema Estrela Uma tabela de de fatos cercada de de tabelas de de dimensões Dimensão Fato Dimensão Dimensão Dimensão Esquema Estrela - Exemplo Dimensão Tempo pk_tempo data mes quadrimestre ano Flag_feriado Fato Vendas pk_tempo pk_produto pk_loja preco_venda unidades_venda preco_custo Dimensão Produto pk_produto descricao categoria marca Dimensão Loja pk_loja nome_loja endereço cidade estado Page 2

Exemplo Consultas Vendas por categoria de produto sobre os últimos seis meses Vendas por marca entre 1990 e 1995 Dimensão Loja Colunas da chave composta ligando a tabela de fatos às tabelas de dimensão Medidas Numéricas Dimensão Produto pk_tempo pk_produto pk_loja preco_venda unidades_venda preco_custo Tabelas de Dimensão Dimensão Tempo... Tabela de Fatos Consulta SQL sobre um esquema estrela select [Loja].[NomeLoja], [Tempo].[DataCompleta], [Produto].[Descricao], Sum( [Vendas].[Unidades_Venda]) as Total from [Vendas], [Tempo], [Produto], [Loja] where [Vendas].[CodTempo] = [Tempo].[CodTempo] and [Vendas].[CodProduto] = [Produto].[CodProduto] and Qtd Vendida de cada Produto por Loja e por Data [Vendas].[CodLoja] = [Loja].[CodLoja] group by [Loja].[NomeLoja], [Tempo].[DataCompleta], [Produto].[Descricao] order by [Tempo].[DataCompleta], [Loja].[NomeLoja], [Produto].[Descricao] Page 3

Resultados NomeLoja DataCompleta Descricao Total ================================================ East Loja Oct 1, 1994 Athletic Drink 57 East Loja Oct 1, 1994 Beef Stew 128 East Loja Oct 1, 1994 Buffalo Jerky 202 East Loja Oct 1, 1994 Chicken Dinner 161 East Loja Oct 1, 1994 Clear Refresher73 East Loja Oct 1, 1994 Dried Grits 102 East Loja Oct 1, 1994 Dry Tissues 16 East Loja Oct 1, 1994 Extra Nougat 442 East Loja Oct 1, 1994 Fizzy Classic 46 East Loja Oct 1, 1994 Fizzy Light 65 East Loja Oct 1, 1994 Lasagna 162 East Loja Oct 1, 1994 Lots of Nuts 248 East Loja Oct 1, 1994 Onion Slices 120 Tipos de Dimensões mais comuns onde quando Fato quem o quê Page 4

Modelagem Dimensional Esquema Estrela é assimétrico Em relação aos esquemas ERs Tabela de Fatos Tabela dominante» usualmente com grande volume de dados Tabelas de Dimensões Tabelas que qualificam os fatos Uma junção liga cada tabela de dimensão à tabela de fatos volume bem menor que as tabelas de fatos Comparação entre a Modelagem ER e a Multidimensional ER 1 diagrama (vários processos de negócio) Multidimensional Vários diagramas dimensionais (1 para cada processo de negócio) Usuários acham difícil entender e navegar pelo modelo Muitas junções para responder a consultas Dados atômicos Planos de consultas extremanente distintos e específicos para as consultas previstas Usuários reconhecem o seu negócio Poucas junções Dados atômicos e agregados Planos de consultas genéricos (assimetria do modelo) Page 5

Tabela de Fatos Chave composta pelas chaves das dimensões Dimensão tempo é sempre parte da chave (DW é histórico) Medida do fato usualmente numérica Fatos tipicamente aditivos Mas podem ser Semi-aditivos Não aditivos Fato Vendas pk_tempo pk_produto pk_loja preco_venda unidades_venda preco_custo Fatos Aditivos São númericos e podem ser somados em relação às dimensões existentes Sempre que, em uma modelagem, um dado númerico for apresentado, então este será um bom indício de um atributo em fatos. Em geral, fatos aditivos representam medidas de atividade do negócio. Valor Venda, Quantidade de produtos vendidos,.. Page 6

Fatos Semi-Aditivos Também são númericos Não podem ser somados em relação a todas as dimensões existentes semântica não permite. Em geral, fatos semi-aditivos representam leituras medidas de intensidade do negócio. São snapshots destas leituras que entram no DW. O valor atual já leva em consideração valores passados. Nível de Estoque, Fechamento diário/mensal de conta,.. Fatos Não-Aditivos Algumas observações não númericas podem eventualmente ser fatos. Em um DW para registrar acidentes de transito: Atributos:» carro1, carro2, mot.1, mot2., descrição do acidente, descrição do tempo (chuva,...) e descrição da pista. Todas as informações da situação acima são fatos! Page 7

Tabelas de Dimensões Objetivo: Servir como cabeçalho das linhas e colunas das análises e filtro nas consultas/relatórios Características: Chaves simples (em geral, artificiais: surrogate keys ) Descrição única para cada registro Usualmente não dependente do tempo Desnormalizada Hierarquias implícitas Dimensão Loja pk_loja nome_loja endereço cidade estado Hierarquias de Dimensões Uma dimensão pode ter múltiplas hierarquias além de outros atributos descritivos Exemplo para uma empresa atacadista: Geografia física:» cep, cidade, estado, região, país Geografia de vendas:» território, região, zona Geografia de Distribuição:» AD primária, região Page 8

Passos da Modelagem Dimensional Definição da área do negócio Definir processos dentro da área de negócio Definição a granularidade desejada para os dados de cada processo Considerar volumes e dificuldades de se obter o nível desejado Definição dos atributos e hierarquia das dimensões Considerar hierarquias múltiplas Definição das métricas das tabelas de Fatos Observar valores aditivos, semi-aditivos e não aditivos Dicas importantes na Modelagem Dimensional Faça ou use um modelo de dados convencional E-R como ponto de partida para o trabalho de modelagem dimensional. Observe os relacionamentos 1:N existentes. Eles podem sugerir dimensões Observe as entidades fortes. Elas também podem sugerir dimensões. Observe as entidades que expressam documentos como Nota Fiscal, Pedido, Ordem de Compra, etc. Elas podem sugerir fatos. Observe os relacionamentos M:N. Na sua interseção, pode haver valores numéricos. Isto sugere fatos. Observe os atributos que estarão nas tabelas de dimensões. Analise a relação de hierarquias entre esses atributos de dimensão. Atente para os relacionamentos M:N entre eles. Isto pode definir granularidade. Page 9

Dicas importantes na Modelagem Dimensional As tabelas FATOS, tipicamente, armazenam dados, valores atômicos ou agregados obtidos a partir destes. As métricas das tabelas FATOS são normalmente aditivas em certas dimensões. As tabelas FATOS possuem chaves que as conectam às diferentes DIMENSÕES que as circundam. Essa conexão se dá num nível de granularidade compatível entre elas (FATO e DIMENSÃO). As tabelas DIMENSÃO armazenam os valores de filtro, check, acesso e textos que caracterizam os dados trabalhados. As tabelas FATOS são normalmente normalizadas. As tabelas DIMENSÕES são normalmente desnormalizadas (Esquema Estrela). A granularidade combinada da tabela FATO com a de suas tabelas DIMENSÕES determina o número de linhas das tabelas do projeto. Exemplo Processos de uma empresa revendedora de produtos: planos de estoque, ordens de compra, inventário, pedidos de clientes, expedição de pedidos, créditos, etc. Processos identificados cria-se uma ou mais tabelas de fatos a partir de cada um deles. Neste ponto é necessário decidir o fato individual naquela tabela granularidade da tabela» uma linha sobre um produto, um perfil de venda diário do produto, ou um perfil de venda mensal do produto Por exemplo: tabela de fatos vendas acumuladas do produto. Page 10

Exemplo Definir dimensões e suas respectivas granularidades. dimensões tempo, produto e vendedor são criadas. outras dimensões descritivas como:» local-de-expedição, local-de-recebimento, modo-deenvio. Cada dimensão pode ser vista como um ponto de entrada para a tabela de fatos.» A escolha das dimensões é o ponto chave no projeto. O passo seguinte consiste em detalhar: todas as medidas que constarão da tabela de fatos; e completar as tabelas de dimensões. Exemplo Page 11

Variações do Esquema Estrela Esquema floco de neve O esquema floco de neve é uma variação do esquema estrela no qual todas as tabelas dimensão são normalizadas na terceira forma normal (3FN) Reduzem a redundância mas aumentam a complexidade do esquema e consequentemente a compreensão por parte dos usuários Dificultam as implementações de ferramentas de visualização dos dados Esquema Floco de Neve Dimensões normalizadas Fatos como no Esquema estrela Page 12

Esquema Flocos de Neve - Exemplo Ano Ano Mês Mês Ano Tempo pk_tempo data mês Tabela de Fatos De Vendas pk_tempo pk_produto Produto pk_produto descprod Categoria Loja pk_loja País País Região Estado Estado País Cidade Cidade Estado Medidas Pk_loja Cidade Unidades_vendidas Preco_venda Preco_custo Esquema Constelação de Fatos Múltiplas tabela de fatos com dimensões compartilhadas Maior complexidade Integra diferentes processos Page 13

Esquema Constelação de Fatos Time Dimension Shipping Fact time_key day_of_week month quarter year holiday_flag Sales Fact time_key product_key location_key dollar_sold unit_sold dollar_cost Product Dimension product_key description brand category Location Dimension loc_key loc_name address city state time_key product_key from_location_key to_location_key shipper_key dollar_cost units_shipped Shipper Dimension shipper_key shipper_name location_key Modelo Entidades-Relacionamentos (adequado para BDs operacionais) Page 14

Modelo Dimensional (Estrela ou Constelação de Fatos) Dimensões Fatos Dimensões desnormalizadas Tabelas de Dimensão Segundo KIMBALL, as tabelas de dimensão não devem ser normalizadas pois: 1) não há atualização freqüente nas bases; 2) o espaço em disco economizado é relativamente pequeno e; 3) esse ganho de espaço não justifica a perda de performance na realização de consultas por conta dos joins necessários em caso de normalização. Page 15

Esquema Estrela - Conceitual Esquema Estrela - Lógico Page 16

Implementação do Modelo Dimensional SGBDs multidimensionais implementam fisicamente o modelo dimensional problemas de desempenho, segurança e confiabilidade Esparsidade: células onde não há dados SGBDs relacionais Maior aceitação Exige mapeamento (vide artigo de Colonese et al.) Escolha do SGBD Page 17

Esquema Estrela - Físico (Dimensional) Page 18