Modelagem Multidimensional - Nível Físico -

Documentos relacionados
Modelagem Multidimensional - Nível Físico -

Modelagem Multidimensional - Nível Físico -

Modelagem Multidimensional - Nível Físico -

Modelagem Multidimensional - Nível Lógico -

SQL. Processamento Analítico de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri Prof. Dr. Ricardo Rodrigues Ciferri

SQL. Processamento Analítico de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri Prof. Dr. Ricardo Rodrigues Ciferri

Modelagem Multidimensional

Modelagem Multidimensional

Conceitos Básicos. Processamento Analítico de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri Prof. Dr. Ricardo Rodrigues Ciferri

Processo de Criação de um Esquema Estrela

Conceitos Básicos. Profa. Dra. Cristina Dutra de Aguiar Ciferri. Algoritmos e Estruturas de Dados II: Projeto

Arquitetura de um Ambiente de Data Warehousing

Arquitetura de um Ambiente de Data Warehousing

Arquitetura de um Ambiente de Data Warehousing

30/10/2012. Prof. Luiz A. Nascimento

Data Warehousing: Conceitos Básicos e Arquitetura

Data Warehouse. Debora Marrach Renata Miwa Tsuruda

Motivação e Conceitos Básicos

Aula 02. Evandro Deliberal

Metodologia de Desenvolvimento de Sistemas Informação

SQL CREATE MATERIALIZED VIEW. Processamento Analítico de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri. OLAP: Modelagem Multidimensional

Índice Bitmap. Aluno: Carlos Henrique Villa Pinto Orientador: Ricardo Rodrigues Ciferri Colaboradora: Renata Miwa Tsuruda

Sistemas de Suporte à Decisão. Suporte à Decisão X Operacional. Banco de Dados Avançado. Data Warehouse. Data Warehouse & Data Mart

Roteiro da apresentação

Motivação. Análise de Dados. BD x DW OLTP. Data Warehouse. Revisão Quais as diferenças entre as tecnologias de BD e DW? OLAP Modelos Multidimensionais

Data Warehousing: Conceitos Básicos e Arquitetura

Sumário. 1 Introdução 2 BD Orientado a Objetos 3 BD Objeto-Relacional 4 Noções Básicas de Data Warehouse 5 XML e BD XML. Motivação

Ambiente de Data Warehouse Para Imagens Médicas Baseado Em Similaridade

OLAP. Rodrigo Leite Durães.

Anderson Chaves Carniel Profa. Dra. Cristina Dutra de Aguiar Ciferri

Introdução. Introdução. Álgebra Relacional. Linguagens formais de Consulta Modelo Relacional. O que foi visto até agora...

SEFAZ INFORMÁTICA Olap Prof. Márcio Hunecke

PLANO DE ENSINO. PRÉ-REQUISITO: Modelagem e Programação Orientada a Objetos. PROFESSORA RESPONSÁVEL: Roberta Macêdo Marques Gouveia

Uso de Índices na Otimização e Processamento de Consultas. Otimização e Processamento de Consultas. Otimização e Processamento de Consultas

Lista de Exercícios. Av. Trabalhador São-carlense, 400. centro. São Carlos - SP cep Brasil.

Inteligência nos Negócios (Business Inteligente)

Álgebra Relacional e SQL operações de interesse

SISTEMAS DE APOIO À INTELIGÊNCIA DE NEGÓCIOS

23/05/12. Consulta distribuída. Consulta distribuída. Objetivos do processamento de consultas distribuídas

INF1383 -Bancos de Dados

Procedência de Dados. Disciplina de Procedência de Dados e Data Warehousing. Profa. Dra. Cristina Dutra de Aguiar Ciferri

Interpretação de Imagens com CSP

Bancos de Dados IV. OLAP e Cubos de Dados. Rogério Costa

PROJETO: CONFERÊNCIA ACADÊMICA. 2. Informações Básicas sobre o Sistema a ser Desenvolvido

Introdução a Ciência da Computação Estrutura e Organização das Informações PROFESSORA CINTIA CAETANO

Bruno Tomazela Orientadora: Profª Drª Cristina Dutra de Aguiar Ciferri. 04 de Abril de 2008

Índice Bitmap e Indexação de Ambientes de Data Warehousing

Universidade Federal do Maranhão

Segunda Parte do Trabalho Prático (Parte II) Valor: 60% Descrição do índice

Apresentação. Rodrigo Leite Durães

Ferramenta de Suporte a Decisão caracterizada por Consultas OLAP

Banco de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri. Banco de Dados Processamento e Otimização de Consultas

Tecnologias Oracle para DW Visões Materializadas no Oracle

EAD-0750 INTELIGÊNCIA DE NEGÓCIOS. Prof. Sérgio Luiz de Oliveira Assis

Integração de Dados. Processamento Analítico de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri Prof. Dr. Ricardo Rodrigues Ciferri

Bancos de Dados IV. Arquiteturas. Rogério Costa

Projeto de Banco de Dados. Componentes de um Sistema de Informação. Arquitetura de SI. Sistema de Informação (SI) SI nas Organizações

Segunda Parte do Trabalho Prático (Parte II) Valor: 70%

Inteligência nos Negócios (Business Inteligente)

Álgebra Relacional. Introdução. Introdução. Álgebra Relacional

Quinto Trabalho Prático. Este trabalho tem como objetivo indexar arquivos de dados usando um índice árvore-b.

Arquiteturas para SGBD. Laboratório de Bases de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri

UTFPR - Universidade Tecnológica Federal do Paraná. Processamento e otimização de consultas

Bancos de Dados Distribuídos. Bancos de Dados Distribuídos. Conteúdo. Motivação. Motivação. Introdução aos BDs Distribuídos.

P R O J E T O: C A R N A V A L. 2. Informações Básicas sobre o Sistema a ser Desenvolvido

Mapa Mental de Data Warehouse Definições e Características

Informática. Business Intelligence (BI), Data Warehouse, OLAP e Data Mining. Prof. Márcio Hunecke

SB-index: Um Índice Espacial baseado em Bitmap para Data Warehouse Geográfico

Roteiro. Noções de Controle de Concorrência. BCC321 - Banco de Dados I. Ementa. Finalidade do Controle de Concorrência.

Compiladores. Introdução à Compiladores

Modelagem de Dados MODELAGEM DE DADOS. Sistemas de Banco de Dados. Profa. Rosemary Melo

Sistemas de Apoio a Decisão

Modelagem Multidimensional: Conceitos Avançados

Tecnologias Oracle para DW Visões Materializadas no Oracle

Modelagem de BDG. Modelagem de BDG

ATIVIDADES PRÁTICAS SUPERVISIONADAS

Victor Hugo Andrade Soares monitor João Vitor dos Santos Tristão Primeiro Trabalho Prático

Sistemas de Banco de Dados

Imagem e Gráficos. vetorial ou raster?

SISTEMA DE INFORMAÇÕES EXECUTIVAS BASEADO EM DATA WAREHOUSE APLICADO A GERENCIAMENTO DE CLIENTES

Bancos de Dados NoSQL

Modelagem de Dados MODELAGEM DE DADOS. Sistemas de Banco de Dados. Profa. Rosemary Melo

Sistemas de Gerência de Bancos de Dados. Módulo 1 - Armazenamento

Korth Silberschatz Sundarshan. Sistema de Banco de Dados, 5/E

Arquiteturas de Sistemas de Informação Geográfica

Faculdade Ieducare 4º Semestre Sistemas de Informação Professor: Rhyan Ximenes

FRAGMENTAÇÃO VERTICAL DE DADOS EM DATA WAREHOUSES NO SISTEMA WEBD 2 W

Trabalho Prático. Descrição do arquivo de dados

Metodologia Aplicada a Computação.

Avaliação do Star Schema Benchmark aplicado a bancos de dados NoSQL distribuídos e orientados a colunas. Lucas de Carvalho Scabora

UNINGÁ UNIDADE DE ENSINO SUPERIOR INGÁ FACULDADE INGÁ CIÊNCIA DA COMPUTAÇÃO PROJETO DE BANCO DE DADOS RELACIONAL. Profº Erinaldo Sanches Nascimento

AULA: Introdução à Informática I

Motivação. Pouco conhecimento. Muitos dados e informações. Problemas para tomada de decisão

Departamento de Ciências de Computação SCC Instituto de Ciências Matemáticas e de Computação ICMC Universidade de São Paulo USP

Conceitos Básicos de Banco de Dados

Modelo Entidade Relacionamento

Ana Carolina Salgado Fábio Ávila PROJETO DE DATA WAREHOUSE

Trabalho Prático. Primeira Parte do Trabalho (Parte I): peso 40%

Transcrição:

Modelagem Multidimensional - Nível Físico - Processamento Analítico de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri Prof. Dr. Ricardo Rodrigues Ciferri

Arquitetura de 3 Camadas esquema operações conceitual metáfora do cubo de dados Cube Álgebra lógico esquemas estrela e floco de neve ROLAP estruturas matriciais MOLAP SQL MDX... físico índices: árvores ROLAP índices bitmap estruturas e algoritmos proprietários MOLAP processamento e otimização de consultas

Índices Bitmap Índice bitmap sobre um atributo A de uma relação R sequência ordenada de valores de chave, sendo que cada chave representa um valor distinto do domínio ativo de A Cada valor de chave associado a um vetor de bits especifica o conjunto de tuplas de R em que A assume aquele valor

Cada vetor de bits Índices Bitmap possui tantos bits quanto as tuplas de R i-ésimo bit se o valor de A na i-ésima tupla de R é igual ao valor de chave do vetor associado caso contrário

filial Exemplo chavefilial nomefilial cidade estado regiao pais Filial Sao Carlos SP SE Brasil 2 Filial 2 Araraquara SP SE Brasil 3 Filial 3 Recife PE NE Brasil 4 Filial 4 Ribeirao Preto SP SE Brasil 5 Filial 5 Jaboatao PE NE Brasil Araraquara Recife Ribeirao Preto Sao Carlos Jaboatao índice bitmap para o atributo cidade NE SE índice bitmap para o atributo região

Vantagens e Desvantagens Vantagem tempo de resposta reduzido, baseando no processamento de operações lógicas bit-a-bit OR, AND, XOR Desvantagem requer grande espaço de armazenamento, especialmente para atributos com domínio ativo muito grande atualização não é eficiente indicado para DWs porque DWs são não voláteis

Exemplo: Consulta Quais as filiais localizadas em Sao Carlos ou em Recife? Araraquara Recife Ribeirao Preto Sao Carlos Jaboatao filiais das tuplas e 3 OR

Exemplo: Consulta 2 Quais as filiais localizadas em Sao Carlos ou em Recife, e que sejam da região NE? Araraquara Recife Ribeirao Preto Sao Carlos Jaboatao NE SE OR AND filial da tupla 3

Índice Bitmap de Junção Característica adapta índices bitmap para DW usado para evitar a computação das junções requeridas pela junção-estrela Funcionamento para cada atributo A i de cada tabela de dimensão T j de interesse criar um índice bitmap que relaciona os valores de chave de A i às tuplas da tabela de fatos

tabela de dimensão: filial Exemplo (/2) chavefilial nomefilial cidade estado regiao pais Filial Sao Carlos SP SE Brasil 2 Filial 2 Araraquara SP SE Brasil 3 Filial 3 Recife PE NE Brasil 4 Filial 4 Ribeirao Preto SP SE Brasil 5 Filial 5 Jaboatao PE NE Brasil tabela de dimensão: tempo chavetempo dia mes trimestre semestre ano janeiro 24 2 2 janeiro 24 3 janeiro 25 4 2 janeiro 25 tabela de dimensão: produto chaveproduto nomeproduto marca categoria departamento coca cola 6 ml Coca Cola refrigerante

Exemplo (2/2) tabela de fatos: vendas chave Filial chave Produto chave Tempo lucro Dolar unidades Vendidas 2 2 2 4 3 3 6 2 3.5 7 3 2 2 4 2 2 4 2 3.5 3 3 3 4 8 5 3 4.5 9 4 5 4 4 2 5 4 7.5 5 NE SE índice bitmap para o atributo região 24 25 índice bitmap para o atributo ano

Exemplo: Consulta 3 Qual a quantidade de unidades vendidas para as filiais localizadas no NE? NE somar as unidades vendidas das tuplas 3, 5, 8, 9, 2 da tabela de fatos vendas

Exemplo: Consulta 4 Qual a quantidade de unidades vendidas para as filiais localizadas no NE em 24? NE 24 AND somar as unidades vendidas das tuplas 3, 5 da tabela de fatos vendas

Definição Visão Materializada especificação: intenção dados: extensão Utilidade em ambientes de DWing aumento no desempenho de processamento de consultas diminuição dos custos relacionados à atualização de outras visões materializadas

Visões Materializadas & Níveis de Agregação Nível inferior conjunto de visões materializadas no qual as relações base residem nos provedores de informação Demais níveis conjunto de visões materializadas no qual as relações base são as do nível imediatamente subjacente

Problemas Relacionados Três grandes linhas de pesquisa. Identificação de quais visões devem ser materializadas 2. Manutenção incremental das visões 3. Reformulação transparente de consultas dos usuários de SSD usando visões materializadas

Problema Identificando Visões requisito processamento de consultas eficiente é conflitante tanto com o tamanho do DW quanto com o tempo gasto para manter a consistência dos dados Trabalhos existentes entradas: restrição de espaço, consultas frequentes dos usuários, uso de índices, custo de manutenção saída: quais visões devem ser materializadas

Problema Mantendo Visões visões materializadas tornam-se inconsistentes sempre que as relações base são alteradas Passos detecção e propagação de alterações relevantes nos provedores atualização incremental das visões materializadas tanto de nível inferior quanto dos demais níveis de agregação

Problema Reformulando Visões a existência de diversas visões correlacionadas permite que uma mesma consulta seja respondida usando-se diferentes visões materializadas Trabalhos existentes dado uma consulta Q e um conjunto de visões materializadas, encontrar uma reescrita de Q, chamada de Q, de forma que Q seja equivalente a Q