Capítulo 2 Data Warehousing
Objetivos de Aprendizado Compreender as definições e os conceitos básicos dos data warehouses Compreender as arquiteturas de data warehousing Descrever os processos usados no desenvolvimento e gerenciamento dos data warehouses Explicar as operações de data warehousing Explicar o papel dos data warehouses no suporte à decisão
Objetivos de Aprendizado Explicar a integração de dados e os processos de extração ão, transofrmação e carga (ETL) Descrever o data warehousing em tempo real (ativo( ativo) Compreender as questões de administração e segurança do data warehouse
Data warehouse É um conjunto de dados produzido para oferecer suporte à tomada de decisões. Conceito introduzido inicialmente no final dos anos 1980
Data warehouse Poderia-se dizer também que é uma coleção de dados orientada por assunto, integrada, variável vel no tempo e não-vol volátil, que proportiona suporte ao processamento de tomada de decisões da gerência.
Caracteristicas do data warehousing Orientado por assunto Dados organizados por assunto; Permite que os usuários determinem não só como está o desempenho de sua empresa, mas também determinar o porquê deste desempenho. Pormenorizados vendas, produtos ou clientes; Contêm apenas informações relevantes ao suporte à decisão. Proporciona uma visão mais abrangente da organização ão.
Caracteristicas do data warehousing (cont) Integrado Dados de diferentes fontes em formato consistente; Uniformidade de nomenclatura, formatação e significado (unidades de medida, por exemplo);
Caracteristicas do data warehousing (cont) Variável no tempo (séries( temporais) Manutenção de dados históricos ricos; Dados não mostram necessariamente o status atual; Detectam tendências, variações ões, relações de longo prazo para previsão e comparações ões;
Caracteristicas do data warehousing (cont) Não-vol volátil Dados não podem ser alterados ou atualizados após sua inserção ão; Dados obsoletos são descartados; Atualizações são encaradas como dados novos;
Caracteristicas do data warehousing (cont) Baseado na Web São normalmente criados para apresentar um ambiente informatizado eficiente às aplicações na Web. Relacional/multidimensional Usa estrutura relacional ou multidimensional Cliente/servidor Arquitetura usada para facilitar o acesso aos dados; Em tempo real Acesso aos dados e recursos de análise em tempo real; Inclui metadados Inclui dados sobre dados sobre como os dados estão organizados e como usá-los de forma eficiente.
Data mart Um data warehouse departamental que guarda somente dados relevantes de um assunto ou departamento Data mart dependente Um subconjunto criado diretamente a partir do data warehouse Data mart independente É um pequeno data warehouse projetado para um unidade estretégica de negócios ou departamento, mas cuja fonte não é um EDW
Operational data stores (ODS) Um tipo de banco de dados frequentemente usado como uma área temporária ria para um data warehouse, especialmente para informações recentes para consumo (customer information files CIF) Oper marts Um data mart operacional.. Um oper mart é criado quando os dados operacionais necessitam de análise multidimensional. É criado a partir de um ODS.
Data warehouse Empresarial (EDW) É um DW em grande escala usado por toda a empresa no suporte à decisão. Oferece indetração com dados oriundos de muitas fontes em um formato padronizado, para eficiência das aplicações de BI e suporte à decisão. Metadados Dados sobre dados. Em um data warehouse, os metadados descrevem a estrutura e alguns significados a respeito dos dados, e, assim, contribuem para que seu uso seja eficiente ou ineficiente.
Questões de revisão: 1. O que é um data warehouse? 2. Como um DW se diferencia de um banco de dados? 3. O que é um ODS? 4. Expliquem a diferença entre um data mart,, um ODS e um EDW. 5. Expliquem a importância dos metadados.