Roteiro da apresentação

Documentos relacionados
Aula 02. Evandro Deliberal

Sumário. 1 Introdução 2 BD Orientado a Objetos 3 BD Objeto-Relacional 4 Noções Básicas de Data Warehouse 5 XML e BD XML. Motivação

Conceitos Básicos. Processamento Analítico de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri Prof. Dr. Ricardo Rodrigues Ciferri

Metodologia de Desenvolvimento de Sistemas Informação

Informática. Business Intelligence (BI), Data Warehouse, OLAP e Data Mining. Prof. Márcio Hunecke

Inteligência nos Negócios (Business Inteligente)

Sistemas de Suporte à Decisão. Suporte à Decisão X Operacional. Banco de Dados Avançado. Data Warehouse. Data Warehouse & Data Mart

Modelagem Multidimensional

Business Intelligence :

SEFAZ INFORMÁTICA Olap Prof. Márcio Hunecke

Motivação. Análise de Dados. BD x DW OLTP. Data Warehouse. Revisão Quais as diferenças entre as tecnologias de BD e DW? OLAP Modelos Multidimensionais

OLAP. Rodrigo Leite Durães.

Modelagem Multidimensional - Nível Lógico -

Inteligência nos Negócios (Business Inteligente)

Ferramenta de Suporte a Decisão caracterizada por Consultas OLAP

Material Complementar - BI. Grinaldo Lopes de Oliveira Curso Superior de Tecnologia em Análise e Desenvolvimento de Sistemas

SISTEMAS DE APOIO À INTELIGÊNCIA DE NEGÓCIOS

Data Warehousing: Conceitos Básicos e Arquitetura

30/10/2012. Prof. Luiz A. Nascimento

Arquitetura de um Ambiente de Data Warehousing

Motivação. Pouco conhecimento. Muitos dados e informações. Problemas para tomada de decisão

Formação Analista de BI Microsoft Aula 1

Bancos de Dados IV. Arquiteturas. Rogério Costa

Arquitetura de um Ambiente de Data Warehousing

Fundamentos de sistemas de informação

Apresentação. Rodrigo Leite Durães

PÓS-GRADUAÇÃO LATO SENSU. Curso: Banco de Dados. Disciplina: Data Warehouse e Business Intelligence; Laboratório Professor: Fernando Zaidan

Motivação e Conceitos Básicos

Data Warehousing: Conceitos Básicos e Arquitetura

Tópicos Especiais em Informática Fatec Indaiatuba

GESTÃO DE DADOS NAS ORGANIZAÇÕES. Prof. Robson Almeida

DATA WAREHOUSE. Prof. Fulvio Cristofoli. Armazenagem De Dados.

Sistemas de Apoio à Decisão

PÓS-GRADUAÇÃO LATO SENSU. Curso: Banco de Dados. Disciplina: Data Warehouse e Business Intelligence Professor: Fernando Zaidan

Arquitetura de um Ambiente de Data Warehousing

Inteligência de Negócios Profa.Denise

Mapa Mental de Data Warehouse Definições e Características

Aula 01. Evandro Deliberal

UNIVERSIDADE FEDERAL DA PARAÍBA

dimensionais fundamentos de DW

Informática Parte 6 Prof. Márcio Hunecke

UNIVERSIDADE REGIONAL DE BLUMENAU. Acadêmica: Cristina Alves de Sousa Morais Orientador: Oscar Dalfovo

Introdução à teoria de Data Warehouse. Prof. Rodrigo Leite Durães

Bancos de Dados IV. OLAP e Cubos de Dados. Rogério Costa

Joana Simon Orientador: Prof. Oscar Dalfovo, Doutor

Modelagem Multidimensional

Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence

Utilização de Business Intelligence no Apoio a Gestão de Saúde Pública

Business Intelligence (BI)

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

CENTRO UNIVERSITÁRIO FEEVALE EDMILSON J. W. FELBER

Qualificando decisões de negócio. Entendendo Business Intelligence

Aula Data Warehouse. Evandro Deliberal

20/3/2012. Gerenciamento Estratégico de Dados. Gerenciamento Estratégico de Dados. Gerenciamento Estratégico de Dados. Prof. Luiz A.

IMPLEMENTAÇÃO DE UM DATA WAREHOUSE PARA UM SISTEMA DE AVALIAÇÃO INSTITUCIONAL ESTUDO DE CASO DA UNIVERSIDADE DO VALE DO ITAJAÍ

Bancos de Dados IV. Data Warehouse Conceitos. Rogério Costa

Banco de Dados Gerenciais

Fundamentos da Inteligência de Negócios: Gerenciamento da Informação e de Bancos de Dados by Prentice Hall

Introdução. Conceitos Básicos. Conceitos Básicos. Conceitos Básicos

Informática. Data Warehouse. Professor Julio Alves.

SQL. Processamento Analítico de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri Prof. Dr. Ricardo Rodrigues Ciferri

Introdução. Conceitos Básicos. Conceitos Básicos. Conceitos Básicos

EAD-0750 INTELIGÊNCIA DE NEGÓCIOS. Prof. Sérgio Luiz de Oliveira Assis

Generated by Foxit PDF Creator Foxit Software For evaluation only. EDSON VIEIRA TECNOLOGIA OLAP

SQL. Processamento Analítico de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri Prof. Dr. Ricardo Rodrigues Ciferri

Núcleo de Pós Graduação Pitágoras

Sistemas de Informação Geográficos. Informação na Organização. O Valor da Informação. Sistemas de Informação Tradicionais. O Valor da Informação

UNIVERSIDADE PRESBITERIANA MACKENZIE

UNIVERSIDADE DE CAXIAS DO SUL Centro de Computação e Tecnologia da Informação Curso de Bacharelado em Sistemas de Informação

Mineração de Dados em Biologia Molecular

UNIVERSIDADE FEDERAL DE PELOTAS Instituto de Informática Ciência da Computação. Trabalho acadêmico

Sistemas de Apoio a Decisão

Instrumentos de informação para extração de indicadores e de informação textual

Sistemas de Apoio a Decisão

SISTEMA DE INFORMAÇÃO EXECUTIVA PARA A ÁREA DE VENDAS APLICADO À INDÚSTRIA METALÚRGICA

Modelagem Multidimensional - Nível Físico -

Banco de Dados - Senado

UNIVERSIDADE DO VALE DO ITAJAÍ CENTRO DE CIÊNCIAS TECNOLÓGICAS DA TERRA E DO MAR CURSO DE CIÊNCIA DA COMPUTAÇÃO

Arquivo. Banco de Dados. Organização dos Arquivos. Banco de Dados. Banco de Dados. Introdução a Computação

Roberto Ângelo F. Santos. Universidade Federal de Pernambuco

RESUMO UMA ARQUITETURA PARA DISTRIBUIÇÃO DE COMPONENTES ECNOLÓGICOS DE SISTEMAS DE INFORMAÇÕES BASEADOS EM DATA WAREHOUSE. Denilson Sell 2001

Modelagem Multidimensional - Nível Físico -

Asterio K. Tanaka. Programa de Pós-Graduação em Informática. Interesses de Pesquisa

Data Warehouse. Introdução Negócio. Introdução O Ambiente de Dados. Introdução Como obter a informação certa? Data Warehouse Definição

X-META UMA METODOLOGIA DE DESENVOLVIMENTO DE DATA WAREHOUSE COM GERENCIAMENTO DE METADADOS. Liane Carneiro Barbosa Lima

Inteligência do Negócio

SISTEMAS DE INFORMAÇÕES DIAGRAMA DE FLUXO DE DADOS

Rafael Mueller. Construção de um Cubo OLAP para Análise de Metas em Sistemas Baseados em Balanced Scorecard

MODELAGEM DE DADOS NORMALIZAÇÃO E INTRODUÇÃO AO DATA W. Inteligência de Negócios

PROTÓTIPO DE UM SISTEMA DE INFORMAÇÃO EXECUTIVA APLICADO A PREFEITURA MUNICIPAL DE JARAGUÁ DO SUL UTILIZANDO DATA WAREHOUSE

Modelo de Gerenciamento de Versões para Evolução de Data Warehouses

Introdução ao Data Mining. Sumário

Ferramenta para Geração de Modelo Dimensional para Data Warehouses

Roger Pereira dos Santos DATA WAREHOUSE COM INTEGRAÇÃO DE BUSINESS INTELLIGENCE

UNIVERSIDADE REGIONAL DE BLUMENAU. Acadêmica: Anilésia P. Boni Orientador: Oscar Dalfovo 1999/2-02

UTILIZANDO DATA MART PARA O DESENVOLVIMENTO DE BUSINESS INTELLIGENCE APLICADA A CARTEIRA DE PEDIDOS DE UMA EMPRESA DO SETOR TÊXTIL

KDD E MINERAÇÃO DE DADOS:

ESTUDO DA IMPLEMENTAÇÃO DE OLAP PARA ANÁLISE

Transcrição:

Alexandre Schlöttgen Data Warehouse Curso de Pós Graduação em Ciência da Computação Tópicos Avançados em Modelos de Banco de Dados Profs: Clésio Santos e Nina Edelweiss Junho de 2003 Roteiro da apresentação 1 - O que é um Data Warehouse? 2 - Arquiteturas de DWs 2.1 Arquitetura de integração 2.2 Arquitetura de acesso aos dados 2.3 Arquitetura funcional 3 - Modelagem de Dados para DW 4 - Ferramentas Comerciais 1. O que é um Data Warehouse? DW é uma coleção de informações corporativas extraídas de sistemas transacionais, organizada por assunto, com o objetivo de dar suporte à tomada de decisões estratégicas, através do processamento analítico destas informações. 1 2 3 Informações corporativas: O DW armazena e trata e informações de vários departamentos e processos de negócio. Um DW é composto por vários Data Marts (DM). Cada DM atende a uma unidade estratégica do negócio ou departamento. Extraída de Sistemas transacionais: Sistemas OLTP (on-line transaction processing) Aplicações do dia-a-dia grande volume de pequenas transações (de 1 à 4 registros) Inserção, atualização, consulta e deleção Organizada por assunto : O DW armazena as informações agrupadas por assuntos de interesse da empresa, enquanto que os sistemas operacionais (OLTP) são orientados aos processos desenvolvidos. Exemplo: OLTP ( Pedido, Nota Fiscal, Pagamento) DW ( Vendas ) 4 5 6 1.2 Características de um DW Decisões Estratégicas Decisões para 6 meses à 5 anos Histórico de informações de 1 à 10 anos Exemplo: Análise de segmentação de Clientes Análise de Vendas Lucratividade x Campanha de Marketing Análise de Atendimento ao Cliente 7 processamento analítico OLAP ( On-Line Analytic Processing ) atividades de consulta e apresentação de dados númericos e textos associados. Suporte a operações matemáticas (somatórios, porcentagem, variações, funções) Grande quantidade de registros analisados 8 Extração de dados de fontes heterogênias (60% do tempo de projeto) Integração dos dados (transformações) Não volátil (dados somente são inseridos e consultados) Instantâneos do tempo Existência obrigatória do elemento tempo. Uso constante de Metadados em todo DW 9

1.2 Características de um DW Consultas intensivas, complexas e Ad-hoc. Modelos de dados multidimensional (mais intuitivo para executivos e usuários comuns) Estruturas simples de armazenamento dos dados para aumentar a velocidade de consulta (Matrizes esparsas, Modelo Multidimensional) Nenhuma preocupação com Redundância. Alta preocupação com a forma de visualização dos dados. 10 2. Arquiteturas de DW Arquiteturas de Integração Como é a divisão e integração dos dados Arquiteturas de acesso aos dados Quais as tecnologias utilizadas para armazenar e recuperar os dados Arquiteturas funcionais Divisão dos módulos funcionais 11 2.1 Arquiteturas de integração de um DW De modo geral: Arquitetura Global Centralizada ou Distribuída Arquitetura de Data Mart Independente Arquitetura de Data Marts Integrados 12 2.1.1 Arquitetura Global Ideal Trata a empresa como um todo Menor redundância de dados Manutenção mais fácil Altíssimo tempo de desenvolvimento 2.1.2 Arquitetura de Data Mart Independente Realidade atual Muitas ferramentas de apoio Não há comunicação entre departamentos Muitos dados redundantes Menor tempo de desenvolvimento Consultas mais limitadas 2.1.3 Arquitetura de Data Marts Integrados Médio tempo de desenvolvimento Solução intermediária da Arquitetura Global e à de Data Marts Independentes 13 14 15 2.2 Arquitetura de acesso aos dados ROLAP (Relacional - OLAP) MOLAP (Multidimencional - OLAP) HOLAP (Híbrido - OLAP) DOLAP (Desktop - OLAP) 16 2.2.1 ROLAP Os dados do DW são armazenados nos próprios SGBDs relacionais dos bancos de dados fontes, com as tabelas sendo implementadas com estruturas relacionais clássicas. Oferecem todas as vantagens de um SGBD convencional, A palavra ROLAP vem de R (relacional) + OLAP, e significa fazer consultas OLAP em SGBDs relacionais. 17 2.2.2 MOLAP A arquitetura MOLAP utiliza SGBDs multidimensionais, otimizados ao máximo para as consultas OLAP e com tratamento dimensional nativo. Exigem a migração dos dados do SGBD relacional para o armazenamento multidimensional e a sua constante atualização. 18

2.2.3 HOLAP 2.2.4 DOLAP Arquitetura funcional É um misto de arquitetura ROLAP com MOLAP. A idéia é armazenar os dados de maior granularidade do DW em estruturas relacionais normalizadas e os agregados de menor granularidade em estruturas dimensionais nativas como cubos OLAP. A palavra HOLAP vem de H (híbrido) + OLAP e significa fazer consultas OLAP tanto em bancos de dados relacionais, quanto em banco de dados multidimensionais. 19 A palavra DOLAP vem de D (Desktop) + OLAP e significa processar consultas OLAP em máquinas desktop e não nos SGBDs. A idéia é diminuir a carga de trabalho do SGBD do DW, de modo que o processamento massivo dos dados seja feito na máquina cliente e não no servidor de banco de dados, que fica somente com a tarefa de garantir a integridade dos dados e de atualizar os cubos OLAP das máquinas cliente. 20 21 3 - Modelagem de Dados para DW 3.1 Modelo Multidimensional 3.1 Elementos básicos (cont.) Modelos ER (Entidade-Relacionamento) Mais conhecido por desenvolvedores Facilita o projeto de extração dos dados de BDs Relacionais Modelos Multidimensionais Mais simples para usuários comuns Facilidade na elaboração de consultas Maior clareza no objeto de análise Elementos básicos Fatos coleção de ítens de dados de medida e contexto cada fato representa um item, transação ou evento do negócio. Dimensões elementos que participam de um fato contexto do fato são descritivas e classificatórias Medidas (variáveis) Atributos numéricos que representam um fato representam uma performance de um indicador de negócio relativo as dimensões de um fato 22 23 24 3.1 Exemplos dos elementos básicos: 3.2 Visualização do Modelo 3.2 Exemplo de Cubo Assunto do Negócio : Vendas Fato : Vendas Dimensões : Localização,, Tempo Medidas : Número de s vendidos, Valor das vendas O caminho mais popular é desenhar um Cubo. Mas um Cubo possui apenas 3 dimensões e usualmente os modelos possuem mais de 3 dimensões. (Hipercubo). Transmitir a idéia de dimensão, perspectiva de visão, fatiamento do cubo, visão dimensional. Localização Tempo 25 26 27

3.3 Operações básicas no Cubo Drill Down (alto nível => baixo nível) Roll UP (baixo nível => alto nível) 3.3 Exemplo das Operações Roll UP (mais detalhado => menos detalhado) 3.3 Exemplo das Operações Slice Corte do Cubo e análise somente da fatia Slice ( fatiar o cubo ) Dice (Mudança de perspectiva) 28 29 30 3.4 Modelo Estrela (Star Schema) Cliente Tempo Fato de Vendas Região Vendedor 31 3.4 Representação Relacional Tempo Fornecedor Chave_tempo Chave_fornecedor Código do Fornecedor Compra Nome do Fornecedor Área do Fornecedor Chave_tempo Comprador Chave_comprador Chave_fornecedor Chave_Comprador Chave_produto ---------- Chave_ Código do Comprador Valor da Compra Nome do Comprador Número de Itens Código do Endereço Grupo do 32 3.5 Modelo Floco de Neve (SnowFlake) Aplicação da Terceira Forma Normal sobre as entidades dimensão. Os desenvolvedores freqüentemente elegem o modelo SnowFlake pelo fato de preservar a utilização de meios de armazenamento. Evita redundâncias de valores textuais 33 Cliente 3.5 Modelo SnowFlake Vendedor Tempo Fato de Vendas Região Tipo Estado Cidade 3.6 Comparação de modelos Estrela SnowFlake Espaço de armazenamento Velocidade de Consulta Entendimento Do Usuário Semântica Hierárquica Alto Alto Ótimo Baixa Médio Baixo Médio Alta 4. Ferramentas Comerciais Atualmente, o mercado de BI (Business Intelligence) aponta para valores de 4 à 5 bilhões de dólares [PAL 2001]. As primeiras empresas de BI e DW foram compradas pelas gigantes: IBM, Computer Associates, Oracle, Informix, Microsoft e Sybase. 34 35 36

4. Ferramentas Comerciais Computer Associates: adquiriu a Platininum e a Sterling, que por sua vez, já havia comprado outras empresas menores. IBM: parceria com a Hyperion Informix: adquiriu Metacube, Red Bricks e Ardent Oracle: Oracle Express, Darwin da Thinking Machines Referências Inmon, W.H. Como Construir o Data Warehouse.- 2 ed. Campus. Rio de Janeiro, 1997. Kimball, R. Data Warehouse Toolkit Makron Books. São Paulo, 1998. PALESTINO, C. B. BI-Business Intelligence (modelagem & tecnologia). Axcel Books. Rio de Janeiro,2001 POE V., KLAUER P., BROBST S. Building a data warehouse for decision support, Prentice Hall PTR, New Jersey 1998 TANLER R., The Intranet data warehouse: tool and techniques for building an intranet-enabled data warehouse. USA, 1997. Referências KIMBALL R, A Dimensional Modeling Manifesto, 1997. Disponível por WWW em http://www.dbmsmag.com (10/10/2001) MACHADO, F. N. R. Projeto de Data Warehouse: Uma visão multidimensional. Érica. São Paulo, 2000 Golfarelli, M., Maio D., Rizzi,, The Dimensional Fact Model: A Conceptual Model for Data Warehouses. Cooperative Information Systems (IJCIS), vol. 7, no. 2-3, pag. 215-247, 1998. 37 38 39