Apresentação Assunto DATA WAREHOUSE Professor Rodrigo Leite Durães
Data Warehouse Surgimento SADs Definição Propriedades e Conceitos Aplicações Arquitetura Modelagem Projeto Acesso a dados Considerações Finais
Surgimento Necessidade de análise de dados históricos Necessidade de análise de dados corporativos oriundos de banco de dados diferentes ou distribuídos. Sistemas de Apoio à Decisão
Sistema de Apoio à Decisão Informação Obtidas analisando dados históricos de vendas, produção, etc Análise dos Dados Aumenta a competitividade da empresa Era feita intuitivamente
Sistema de Apoio à Decisão Dificuldade para obter informação Quantidade de dados cresce com expansão e tempo Dados conflitantes Impossivel para alguém gurdar tantos dados Moobilidade do mercado de trabalho
Sistema de Apoio à Decisão Benefícios Determinar mercado-alvo de um produto Criar promoções Responder rapidamente a mudanças de mercado Problema Dados históricos não guardados Solução Banco de Dados especializados para SADs
Histórico Criado pela IBM, década de 60, intitulado Information Ware House Relançado várias vezes sem sucesso. Seu nome definitivo foi dado por William Inmon Tornou-se viável por novas tecnologias (armazenamento e processamento)
Definição Sistema que armazena dados históricos Um ambiente não um produto Integra dados corporativos num único repositório de dados, se necessário sumarizando-os Utilizado por SADs
Propriedades BD Operacional Data Warehouse Usuários Funcionários Gerência Utilização Tarefas Cotidianas Decisões Estratégicas Padrão de uso Previsível Imprevisível Funcionamento Base em transições Base na análise Valores de dados Atuais e voláteis Históricos e não-voláteis Detalhamneto Alto Sumarizado Organização do dados Orientado a aplicações Orientado a assunto
Principais Características Orientado a assunto Integrado Não volátil Variável com o tempo
Processamento OLAP Pesquisa Inteligente ( Data Mining ) Ênfase na performance da recuperação de consultas Visualização de dados ao longo de varias dimensões analíticas.
OLTP x OLAP Características Operacional-OLTP Decisão-OLAP Objetivo Op. diárias do negócio Análisar o negócio Visão dos dados Relacional Multidimensional Op. com os dados Incl., Alt, Excl e Cons. Carga e Consulta Atualização Contínua (tempo real) Periódica (Bach) N o de usuários Milhares Dezenas Tipo de usuário Operacional Gerencial Interação c/ usuário Pré-definida Pré-definida e ad-hoc Granularidade Detalhados Detalhados e Resumos Redundância Não ocorre Ocorre Volume Megabytes-Gigabytes Gigabytes-Terabytes Histórico Até uma atualização 5 a 10 anos Acesso a registro Dezenas Milhares
Granularidade Processo de Sumarização (alta) Processo de envelhecimento(baixa) Nível de detalhe dos dados Quanto maior o nível de detalhamento menor a granularidade.
Metadados Metadados de mapeamento Metadados de Sumarização Metadados históricos Metadados de padrões de acesso
Modelagem Multidimensional NORDESTE Tempo Jan./99 PERNAMBUCO CEARÁ FORTALEZA... SOBRAL SUDESTE RIO DE JANEIRO SÃO PAULO Fev./99 5 1 8 6 P1 P2 P3 P4 Produto
Modelagem Pivoteamento (rotação) Disposição roll-up (ascende) Disposição drill-down (refina na hierarquia) Esquema estrela Esquema floco de neve.
Projeto de DW