Data Warehousing. Leonardo da Silva Leandro. CIn.ufpe.br



Documentos relacionados
DATA WAREHOUSE. Introdução

Data Warehouse. Debora Marrach Renata Miwa Tsuruda

Banco de Dados - Senado

Checklist de Projeto de Data Warehouse

Capítulo 2 Data Warehousing

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan

Data Warehouse. Diogo Matos da Silva 1. Universidade Federal de Ouro Preto, Ouro Preto, MG, Brasil. Banco de Dados II

Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence

Hoje é inegável que a sobrevivência das organizações depende de dados precisos e atualizados.

DATA WAREHOUSE. Rafael Ervin Hass Raphael Laércio Zago

Modelo de dados do Data Warehouse

Complemento I - Noções Introdutórias em Data Warehouses

SAD orientado a DADOS

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

SISTEMA GERENCIADOR DE BANCO DE DADOS

Sistemas de Apoio à Decisão (SAD) - Senado

Arquitetura física de um Data Warehouse

Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados

Módulo 4. Construindo uma solução OLAP

Data Warehouse Processos e Arquitetura

Tópicos Avançados Business Intelligence. Banco de Dados Prof. Otacílio José Pereira. Unidade 10 Tópicos Avançados Business Inteligence.

ADMINISTRAÇÃO DOS RECURSOS DE DADOS

Fundamentos da Análise Multidimensional

UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado)

Chapter 3. Análise de Negócios e Visualização de Dados

Programação com acesso a BD. Prof.: Clayton Maciel Costa clayton.maciel@ifrn.edu.br

Gerenciamento de Dados e Gestão do Conhecimento

Roteiro. BCC321 - Banco de Dados I. Conceitos Básicos. Conceitos Básicos. O que é um banco de dados (BD)?

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Adriano Maranhão BUSINESS INTELLIGENCE (BI),

Data Warehousing e OLAP

Aplicação A. Aplicação B. Aplicação C. Aplicação D. Aplicação E. Aplicação F. Aplicação A REL 1 REL 2. Aplicação B REL 3.

Para construção dos modelos físicos, será estudado o modelo Relacional como originalmente proposto por Codd.

Curso Data warehouse e Business Intelligence

04/08/2012 MODELAGEM DE DADOS. PROF. RAFAEL DIAS RIBEIRO, MODELAGEM DE DADOS. Aula 1. Prof. Rafael Dias Ribeiro. M.Sc.

Data Warehouses. Alunos: Diego Antônio Cotta Silveira Filipe Augusto Rodrigues Nepomuceno Marcos Bastos Silva Roger Rezende Ribeiro Santos

ADMINISTRAÇÃO DOS RECURSOS DE DADOS

BANCO DE DADOS DISTRIBUÍDOS e DATAWAREHOUSING

Prova INSS RJ cargo: Fiscal de Rendas

Sistema de Informação Gerencial baseado em Data Warehouse aplicado a uma software house

Interatividade aliada a Análise de Negócios

Disciplina de Banco de Dados Introdução

Detecção e investigação de ameaças avançadas. INFRAESTRUTURA

Curso Data warehouse e Business Intelligence Fundamentos, Metodologia e Arquitetura

MSc. Daniele Carvalho Oliveira

Data Warehouses Uma Introdução

Módulo 4: Gerenciamento de Dados

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5

Definition of a Measurement Guide for Data Warehouse Projects

Introdução à Banco de Dados. Definição

Persistência e Banco de Dados em Jogos Digitais

Banco de Dados I. Apresentação (mini-currículo) Conceitos. Disciplina Banco de Dados. Cont... Cont... Edson Thizon

Banco de Dados. Uma coleção de dados relacionados [ELMASRI/NAVATHE]

Banco de Dados. Introdução. João Eduardo Ferreira Osvaldo Kotaro Takai. DCC-IME-USP

5 Estudo de Caso Material selecionado para o estudo de caso

Bancos de dados distribuídos Prof. Tiago Eugenio de Melo

Planejamento e Orçamento

Faculdade Pitágoras PROJETO DE DW FASES FCS-EM PROJETOS DE DW 08/02/2012. Unidade 2.1. Curso Superior de Tecnologia: Banco de Dados

Sistema. Atividades. Sistema de informações. Tipos de sistemas de informação. Everson Santos Araujo

GBC043 Sistemas de Banco de Dados. Introdução. Ilmério Reis da Silva UFU/FACOM

Arquiteturas de DW e Abordagens de Implementação. Arquiteturas e Abordagens de Implementação

Banco de Dados. Aula 1 - Prof. Bruno Moreno 16/08/2011

05/06/2012. Banco de Dados. Gerenciamento de Arquivos. Gerenciamento de Arquivos Sistema Gerenciador de Banco de Dados Modelos de Dados

Uma análise de ferramentas de modelagem e gerência de metadados aplicadas ao projeto de BI/DW-UFBA

Prof. Ronaldo R. Goldschmidt. geocities.yahoo.com.br/ronaldo_goldschmidt

As principais características da abordagem de um banco de dados versus a abordagem de processamento de arquivos são as seguintes:


INTRODUÇÃO. Diferente de Bando de Dados

O Modelo de Entidades e Relacionamentos (MER) é um modelo conceitual usado para projeto de aplicações de banco de dados.

Universidade Federal de Santa Maria Curso de Arquivologia. Disciplina de Banco de Dados Aplicados à Arquivística. Versao 1.

Dado: Fatos conhecidos que podem ser registrados e têm um significado implícito. Banco de Dados:

O Que é Data Warehouse

Modelo de Dados. Modelos Conceituais

Projeto de Data Warehousing sobre Informações em Saúde para dar Suporte a Análise de Faturamento Hospitalar

Revisão de Banco de Dados

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse

Data Warehouse. Djenane Cristina Silveira dos Santos¹, Felipe Gomes do Prado¹, José Justino Neto¹, Márcia Taliene Alves de Paiva¹

Thalita Moraes PPGI Novembro 2007

Data Mining: Conceitos e Técnicas

Professor: Disciplina:

Curso de Aprendizado Industrial Desenvolvedor WEB. Disciplina: Banco de Dados Professora: Cheli Mendes Costa Modelo de Dados

1

Kimball University: As 10 Regras Essenciais para a Modelagem de Dados Dimensional

Identificar as mudanças que acontecem na forma e no uso de apoio à decisão em empreendimentos de e-business. Identificar o papel e alternativas de

MBA Inteligência Competitiva Com ênfase em BI/CPM. Metadados

Medição de tamanho para Sistemas de Data Mart

SUMÁRIO 1. INTRODUÇÃO O QUE É DATA WAREHOUSE? O QUE DATA WAREHOUSE NÃO É IMPORTANTE SABER SOBRE DATA WAREHOUSE

Uma Arquitetura de Gestão de Dados em Ambiente Data Warehouse

Conceitos de Banco de Dados

ATIVIDADES PRÁTICAS SUPERVISIONADAS

PLANO DE ENSINO PRÉ-REQUISITOS: ENS

ADMINISTRAÇÃO DE ATIVOS DE TI GERENCIAMENTO DE CONFIGURAÇÃO

ASSUNTO DA APOSTILA: SISTEMAS DE INFORMAÇÃO E AS DECISÕES GERENCIAIS NA ERA DA INTERNET

INTRODUÇÃO E CONCEITOS BÁSICOS. Prof. Ronaldo R. Goldschmidt

Modelo de Dados. Modelo para organização dos dados de um BD

GBD PROF. ANDREZA S. AREÃO

CONSIDERAÇÕES SOBRE ATIVIDADES DE IDENTIFICAÇÃO, LOCALIZAÇÃO E TRATAMENTO DE DADOS NA CONSTRUÇÃO DE UM DATA WAREHOUSE

COMPATIBILIZANDO CADASTROS

Sistemas de Informação I

LISTA DE EXERCÍCIOS. 1. Binário: Bit: Menor unidade de dados; dígito binário (0,1) Byte: Grupo de bits que representa um único caractere

Transcrição:

Data Warehousing Leonardo da Silva Leandro

Agenda Conceito Elementos básicos de um DW Arquitetura do DW Top-Down Bottom-Up Distribuído Modelo de Dados Estrela Snowflake Aplicação

Conceito Em português: Armazém de Dados Base de dados orientada por assunto Integrado Não volátil Variável com o tempo Apoiar as decisões gerenciais

Conceito: Orientado por Assunto Na visão de uma empresa, toda modelagem do DW é orientada a partir dos principais assuntos da organização Empresa do ramo dos supermercados Cadastro de funcionários e produtos Ao se iniciar a construção de um DW, deve-se discutir com os usuários finais quais os seus objetivos Definir quais são as informações importantes

Conceito: Integrado Uma das características mais importantes de um Data Warehouse A integração é realizada do ambiente operacional para as aplicações do DW Padronização dos dados dos diversos sistemas em uma única representação Transferência para a base de dados única do DW Maximização do processamento Agilidade na busca dos dados

Conceito: Integrado Dois elementos básicos do DW estão relacionados com a integração Área de estagiamento dos dados Armazenamento dos dados operacionais (ODS) Quando há incompatibilidade de sistemas e necessidade de integração por assuntos, deve-se considerar a construção do ODS Os processos de limpeza, transformação e agregação ocorrem no estagiamento Compatibilização e integração nos próprios sistemas legados ocorrem no ODS

Conceito: Integrado Tabela 1: Integração de dados representados de formas diferentes

Conceito: Não Volátil Ambiente Operacional: Dados atualizados registro por registro Múltiplas transações Necessita de grande esforço para assegurar integridade e consistência Rollback Recuperação de falhas Commits Bloqueios DataWarehouse: Dados filtrados e limpos ( gerando informações ) Não existem alterações de dados Sofrem somente operações de consulta e exclusão (sem alterações)

Conceito: Variável com o Tempo Manutenção de um histórico de dados em relação ao período de tempo maior que dos sistemas comuns Técnicas de mineração de dados não são aplicadas em tempo real Os dados de um DW sempre estarão associados a um período determinado de tempo Chave indicando o dia no qual os dados foram extraídos

Conceito: Localização Em um DW, pode-se encontrar os dados armazenados fisicamente de três formas: Armazenados em um único local: BD centralizado em um DW integrado Maior processamento Busca de dados rápida Distribuídos por áreas de interesse (arquitetura federativa): Dados financeiros em um servidor Dados de marketing em um segundo servidor Dados de manufatura em um terceiro lugar Armazenados por níveis de detalhes

Conceito: Localização Armazenados por níveis de detalhes: Dados altamente resumidos armazenados em um servidor Grande número de acessos Baixo volume de dados Dados resumidos em um nível de detalhe intermediário armazenados em um segundo servidor Dados com maior número de detalhes (atômicos) em um terceiro servidor

Elementos básicos de um Data Warehouse Figura 1: Esquema com elementos básicos de um DW

Elementos básicos de um Data Warehouse Sistemas de Origem: Sistema Operacional de registros cuja função é capturar as transações do negócio Sistemas transacionais da empresa, pode ser composto por diversas formas de dados Área de Estagiamento de dados: Área de armazenamento Conjunto de processos que limpam, transformam, combinam, retiram duplicações, retêm, arquivam e preparam os dados fonte para uso no DW

Elementos básicos de um Data Warehouse Servidor de Apresentações: Máquina física de destino Armazenados e organizados os dados do DW para consulta diretas Modelo Dimensional: Disciplina específica para modelagem dos dados Uma alternativa ao modelo ER Modelo apropriado para produção de informação gerencial Processos do Negócio: Conjunto coerente das atividades do negócio da organização

Elementos básicos de um Data Warehouse Data Mart: Subconjunto lógico do DW completo Contém dados altamente resumidos e levemente resumidos Tem por objetivo equilibrar os gastos e oferecer resultados em prazos mais curtos Normalmente são divididos por departamentos

Elementos básicos de um Data Warehouse Data Mart: Figura 2: Arquitetura de Data Marts Departamentais

Elementos básicos de um Data Warehouse Armazenamento de Dados Operacionais (ODS): Ponto de integração com os SOs da organização Criados para integrar em nível operacional os diferentes sistemas da organização sem incluir consultas gerenciais (ficam no nível do DW) OLAP: Atividade genérica de consultar e apresentar dados textuais ou numéricos Tecnologia não-relacional Geralmente baseada em cubos dimensionais de dados

Elementos básicos de um Data Warehouse OLAP (cont.) Figura 3: Cubo OLAP

Elementos básicos de um Data Warehouse ROLAP (OLAP Relacional): Conjunto de interfaces ao usuário e de aplicações que dão características multidimensional a banco de dados relacionais MOLAP (OLAP Multidimensional): Conjunto de interfaces ao usuário, aplicações com base de dados proprietária que são fortemente multidimensionais Fazer uma pesquisa ou uma análise do tipo: verificar as vendas realizadas pela empresa por produto, por mês e por loja Consultas rápidas Necessita de um espaço muito maior para o armazenamento dos dados Aplicação para Usuário Final: Coleção de ferramentas que consultam, analisam e apresentam informações desejadas

Elementos básicos de um Data Warehouse Figura 4: Esquema dos processos de manipulação de dados MOLAP, ROLAP e um híbrido destes, o HOLAP.

Elementos básicos de um Data Warehouse Ferramenta de Controle de Acesso aos Dados para Usuário Final: Uma ferramenta de controle de acesso aos dados Pode ser simples como sistemas de consultas ad-hoc Pode ser complexa e sofisticada como mineração de dados ou aplicações de modelagem Ferramentas de Consultas Ad-Hoc: Tipo específico de ferramenta de acesso dos dados Induz o usuário final a formar suas próprias consultas Manipulando diretamente tabelas relacionais e suas funções

Elementos básicos de um Data Warehouse Aplicações de Modelagem: Tipo sofisticado de ferramenta cliente do DW Capacidades analíticas de transformar ou compreender as saídas do DW Ex: Data Mining Modelos de Previsão Modelos de Comportamento Metadados: Toda informação no ambiente do Data Warehouse que não é dado real em si mesmo

Arquitetura do DW Data Warehouses são capazes de responder a consultas avançadas de maneira rápida, sem deixar de apresentar detalhes importantes à resposta Para tanto, é preciso que o mesmo tenha uma arquitetura que lhe permita coletar, manipular e apresentar os dados de forma eficiente e rápida A constituição de um DW pode ser feita basicamente com dois modelos arquiteturais: Aquitetura top-down Arquitetura bottom-up Data Warehouses Distribuídos

Arquitetura do DW: Top-Down Figura 5: Arquitetura Top-Down de um DW

Arquitetura do DW: Top-Down Extração, Transformação, Migração e Carregamento de dados Dados oriundos dos sistemas legados e/ou de fontes externas Os dados são retirados de suas origens e armazenados na área de estagiamento de dados Carregamento dos dados para dentro do Data Warehouse Data Marts são oriundos a partir de resumos do DW e dos metadados O DW é constituído por dados atômicos e também dados históricos detalhados O modelo top-down pode fazer uso do modelo de dados E-R normalizado A integração entre o DW e os Data Marts é automática Mantendo-se um disciplina na construção (data marts como subconjuntos do DW

Arquitetura do DW: Top-Down Críticas ao modelo: Custo de implantação Demora na obtenção de resultados parciais Alto grau de dificuldade no planejamento e implementação de um modelo único, não diferençável e mestre à toda organização

Arquitetura do DW: Bottom-Up Oferece uma alternativa de construção incremental Tem início com a construção de um ou mais Data Marts Geralmente não usam modelo de dados E-R de forma normalizada Os Data Marts usam dados atômicos detalhados, incluindo dados históricos (enquanto que o modelo top-down que usa dados levemente resumidos e altamente resumidos Difere no top-down em não provê nenhum componente de metadado comum para os data marts

Arquitetura do DW: Bottom-Up Figura 6: Arquitetura Bottom-Up de um DW

Arquitetura do DW: Data Warehouses Distribuídos Possibilidade de integração de diferentes DW Centenas de servidores separados (SOs e BDs diferentes) Usado quando o os processamentos operacionais de informações ocorrem tanto no nível local como no global Comum em empresas com sede matriz e sedes filiadas

Modelo de Dados A modelagem dimensional tem-se firmado como meio mais efetivo para o projeto do DW Chamam-se dimensões as diferentes perspectivas envolvidas (ex: produto, marca, filial e mês) Considera-se também um conjunto de medidas (ex: vendas ou despesas com promoção) As medias podem ser agregadas segundo diversas dimensões Ficam armazenadas para acesso futuro Ex: Calcula-se a média de todas as vendas por todos os meses por filial A forma como as agregações são armazenadas pode ser vista em termos de dimensões e coordenadas (Multidimensional)

Modelo de Dados: Modelo Estrela Criado como forma de acomodar as necessidades de todos os usuários e facilitar a atualização do DW (melhor entendimento em termos de negócio) Possui uma tabela dominante no centro (tabela de fatos) Múltiplas junções que a conectam às outras tabelas (tabelas de dimensão) A tabela de fatos pode conter milhares (até milhões) de valores e medidas de negócio da empresa, como transações de vendas ou compras Cada medida é tomada segundo a interseção de todas as dimensões A tabela de fatos é esparsa Se não existe um cruzamento para alguns valores das dimensões, a tabela não armazena zeros

Modelo de Dados: Modelo Estrela Figura 7: Modelo dimensional do tipo Estrela

Modelo de Dados: Modelo Estrela As tabelas secundárias (tabelas de dimensão) armazenam as descrições textuais das dimensões do negócio Tabelas de dimensão tendem a usar tipo de caracteres ao invés de numéricos Linhas mais longas, mas em pouca quantidade Ocupa pequena percentagem de espaço em disco A tabela de fatos tem como chave primária uma composição de todas as chaves estrangeiras de todas as tabelas de dimensão

Modelo de Dados: Modelo Snowflake Extensão do modelo Estrela Cada uma das pontas da estrela passa a ser o centro de outras estrelas Surge da des-normalização e redução da cardinalidade do modelo estrela Quebrando-se a tabela original ao longo de hierarquias existentes em seus atributos Ex: Classificação de um automóvel Dimensão do produto possui uma hierarquia definida Categoria se divide em marca Marca se divide em produtos

Modelo de Dados: Modelo Snowflake Existe uma resistência à transformar o modelo estrela em um modelo snowflake Impacto da complexidade deste tipo de estrutura sobre o usuário final Ganho em termos de espaço de armazenamento pouco relevante

Aplicações

Aplicações

Aplicações