Universidade Técnica de Lisboa INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO Informática e Sistemas de Informação Aplicados em Economia Fundamentos da Análise Multidimensional Fundamentos da Análise Multidimensional 1
Fundamentos da Análise Multidimensional - Bases de Dados Analíticas - Processamento Analítico - Modelação Multidimensional - Operações Multidimensionais Fundamentos da Análise Multidimensional 2
Bases de Dados Analíticas - Gestão de grandes volumes de dados - Suporte do processamento analítico o Múltiplas dimensões de análise o Múltiplos níveis de consolidação - Sumarização Data Warehouse colecção de dados orientada aos factos, integrada, variando no tempo, não volátil que é utilizado primordialmente no processo de tomada de decisão Fundamentos da Análise Multidimensional 3
Elementos de um Data Warehouse - um Conjunto de Programas que o extrai dados do ambiente operacional e o transforma-os de acordo com critérios de coerência e integração - um Repositório que armazena os dados do warehouse e - Sistemas que fornecem informação para os utilizadores. Fundamentos da Análise Multidimensional 4
Processamento Analítico e Processamento Transaccional OLTP OLAP Utilizadores Empregados Administrativos Decisores, analistas das organizações Dados Unidade de operação Número de registos Correntes, correctos e muito detalhados Transacção: um programa inicia-se, executa uma função muito simples e extingue-se O acesso é a conjunto de registos relativamente pequeno e analistas da economia Históricos, multidimensionais e muitas vezes sumarizados Conjunto de queries interligados e complexo o que se traduz na necessidade da sua optimização Conjunto de registos de magnitude muito superior Fundamentos da Análise Multidimensional 5
Separação Física - Características do Processamento Analítico - Fontes Heterogéneas de dados - Modelos eficazes ao processo de tomada de decisão o Modelação Entidade Associação mais orientada para as aplicações o Diagramas estrela, floco de neve, constelações de factos: candidatos para modelar eficazmente o OLAP Fundamentos da Análise Multidimensional 6
Operações Multidimensionais - Roll-up diminuir o nível de detalhe e - Drill-down aumentar o nível de detalhe (Nestas dimensões podemos encontrar hierarquias de acesso ascendente e descendente, sendo admissível um nível global (any) equivalente a não considerar a dimensão). - Slice and dice aplicação de operações de selecção e projecção juntamente com uma operação de drill-down. Fundamentos da Análise Multidimensional 7
Implementação de um Data Warehouse - Olap Relacional (ROLAP) - Olap Multidimensional (MDOLAP) - Olap Híbrido Fundamentos da Análise Multidimensional 8
OLAP Relacional Os servidores que permitem o ROLAP assumem que os dados estão armazenados em bases de dados relacionais e possuem extensões ao SQL que facilitam a implementação do modelo e das operações multidimensionais. A modelação pode utilizar diagramas estrela, floco de neve e constelações de factos. Fundamentos da Análise Multidimensional 9
Diagrama Estrela - Tabela de Factos central - Tabelas de Dimensão organizadas à sua volta - Apontadores na forma de chave estrangeira para cada uma das tabelas de dimensão - Atributos de dimensão que podem ou não corresponder à hierarquia associada à dimensão - Métricas de análise ou medidas na tabela de factos Fundamentos da Análise Multidimensional 10
Diagrama Estrela Dimensão Origem Investidor País Origem Comunidade Dimensão Tempo Ano Tabela de Factos Investidor Empresa Operação Ano Crédito Débito Dimensão Destino Empresa Capital Social CAE Cidade País Comunidade Dimensão Operação Operação Grupo de Operação Fundamentos da Análise Multidimensional 11
Desnormalização - Tabela de Factos altamente normalizada - Tabelas associadas às dimensões surgem desnormalizadas. na dimensão Origem dada a dependência funcional País Origem Comunidade e na dimensão Destino que contêm as dependências funcionais Cidade País e País Comunidade. A primeira daquelas dimensões pode ser normalizada eliminando a coluna Comunidade e criando outra tabela com as colunas País Origem e Comunidade. Fundamentos da Análise Multidimensional 12
Problemas dos Diagramas Estrela A Estrutura Desnormalizada - oferece um acesso mais fácil aos dados associados às dimensões, mas - os diagrama estrela não fornecem um suporte explícito a hierarquias conceptuais Fundamentos da Análise Multidimensional 13
Diagrama Floco de Neve Muitos data warehouses são desenhados utilizando um Diagrama em Floco de Neve onde algumas ou todas as dimensões são totalmente normalizadas Vantagens em - manutenção do esquema e - trabalho com hierarquias conceptuais. Kimball, um perito em tecnologia data warehouse desencoraja fortemente a utilização de diagramas floco de neve Fundamentos da Análise Multidimensional 14
Diagrama Floco de Neve Dimensão País Origem País Origem Comunidade Dimensão Tempo Dimensão Origem Investidor País Origem Ano Tabela de Factos Investidor Empresa Operação Ano Crédito Débito Dimensão Destino Empresa Capital Social CAE Cidade Dimensão Operação Operação Dimensão Cidade Cidade Destino País Destino Dimensão País Destino País Destino Comunidade Grupo de Operação Fundamentos da Análise Multidimensional 15
Constelações de Factos Finalmente alguns data warehouses são construídos utilizando Constelações de Factos, uma estrutura complexa em que múltiplas tabelas de factos partilham tabelas de dimensões. Fundamentos da Análise Multidimensional 16