Data Warehouse Processos e Arquitetura



Documentos relacionados
Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence

DATA WAREHOUSE. Introdução

Data Warehouse. Debora Marrach Renata Miwa Tsuruda

DATA WAREHOUSE. Rafael Ervin Hass Raphael Laércio Zago

Data Warehouse. Diogo Matos da Silva 1. Universidade Federal de Ouro Preto, Ouro Preto, MG, Brasil. Banco de Dados II

Data Warehousing. Leonardo da Silva Leandro. CIn.ufpe.br

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

Capítulo 2 Data Warehousing

5 Estudo de Caso Material selecionado para o estudo de caso

Adriano Maranhão BUSINESS INTELLIGENCE (BI),

Bancos de dados distribuídos Prof. Tiago Eugenio de Melo

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Thalita Moraes PPGI Novembro 2007

SAD orientado a DADOS

BANCO DE DADOS DISTRIBUÍDOS e DATAWAREHOUSING

CRM - Customer Relationship Management

Módulo 4: Gerenciamento de Dados

Interatividade aliada a Análise de Negócios

SUMÁRIO 1. INTRODUÇÃO O QUE É DATA WAREHOUSE? O QUE DATA WAREHOUSE NÃO É IMPORTANTE SABER SOBRE DATA WAREHOUSE

ADMINISTRAÇÃO DOS RECURSOS DE DADOS

Arquitetura dos Sistemas de Informação Distribuídos

Gerenciamento de Projetos

DATA WAREHOUSE NO APOIO À TOMADA DE DECISÕES

Programação com acesso a BD. Prof.: Clayton Maciel Costa clayton.maciel@ifrn.edu.br

Planejamento Estratégico de TI. Prof.: Fernando Ascani

ADMINISTRAÇÃO DOS RECURSOS DE DADOS

Detecção e investigação de ameaças avançadas. INFRAESTRUTURA

Gerenciamento de Níveis de Serviço

Hoje é inegável que a sobrevivência das organizações depende de dados precisos e atualizados.

Conceitos de Banco de Dados

Uma Arquitetura de Gestão de Dados em Ambiente Data Warehouse

PLANO DE ENSINO PRÉ-REQUISITOS: ENS

Roteiro. BCC321 - Banco de Dados I. Conceitos Básicos. Conceitos Básicos. O que é um banco de dados (BD)?

Projeto de Arquitetura

04/08/2012 MODELAGEM DE DADOS. PROF. RAFAEL DIAS RIBEIRO, MODELAGEM DE DADOS. Aula 1. Prof. Rafael Dias Ribeiro. M.Sc.

Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados

Fundamentos de Banco de Dados

IMPLANTAÇÃO DO DW NA ANVISA

Tópicos Avançados Business Intelligence. Banco de Dados Prof. Otacílio José Pereira. Unidade 10 Tópicos Avançados Business Inteligence.

INSTRUÇÃO DE TRABALHO PARA INFORMAÇÕES GERENCIAIS

ADMINISTRAÇÃO DE ATIVOS DE TI GERENCIAMENTO DE CONFIGURAÇÃO

Para construção dos modelos físicos, será estudado o modelo Relacional como originalmente proposto por Codd.

Introdução ao Modelos de Duas Camadas Cliente Servidor

Gerenciamento de Dados. Objetivos do Capítulo

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5

Dado: Fatos conhecidos que podem ser registrados e têm um significado implícito. Banco de Dados:

Análise de custo projetado da plataforma SAP HANA

SISTEMA GERENCIADOR DE BANCO DE DADOS

15/09/2015. Gestão e Governança de TI. Modelo de Governança em TI. A entrega de valor. A entrega de valor. A entrega de valor. A entrega de valor

Planejamento e Orçamento

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO

Professor: Disciplina:

Gestão da Qualidade por Processos

04/08/2012 MODELAGEM DE DADOS. PROF. RAFAEL DIAS RIBEIRO, MODELAGEM DE DADOS. Aula 2. Prof. Rafael Dias Ribeiro. M.Sc.

Palavras-chave: On-line Analytical Processing, Data Warehouse, Web mining.

MBA Inteligência Competitiva Com ênfase em BI/CPM. Metadados

Trilhas Técnicas SBSI

Banco de Dados - Senado

REVISÃO ENGENHARIA DO SOFTWARE. Isac Aguiar isacaguiar.com.br

Prova INSS RJ cargo: Fiscal de Rendas

SISTEMA DE GESTÃO DE PESSOAS SEBRAE/TO UNIDADE: GESTÃO ESTRATÉGICA PROCESSO: TECNOLOGIA DA INFORMAÇÃO

Universidade Paulista

Projeto de Arquitetura

MÓDULO 8 ARQUITETURA DOS SISTEMAS DE BANCO DE DADOS

AGENDA. O Portal Corporativo. Arquitetura da Informação. Metodologia de Levantamento. Instrumentos Utilizados. Ferramentas

BRAlarmExpert. Software para Gerenciamento de Alarmes. BENEFÍCIOS obtidos com a utilização do BRAlarmExpert:

PROCESSO DE DESENVOLVIMENTO DE SOFTWARE. Modelos de Processo de Desenvolvimento de Software

Universidade Federal de Santa Maria Curso de Arquivologia. Disciplina de Banco de Dados Aplicados à Arquivística. Versao 1.

Conhecendo os usuários de um Sistema de Banco de Dados

Data Warehouse. Djenane Cristina Silveira dos Santos¹, Felipe Gomes do Prado¹, José Justino Neto¹, Márcia Taliene Alves de Paiva¹

05/06/2012. Banco de Dados. Gerenciamento de Arquivos. Gerenciamento de Arquivos Sistema Gerenciador de Banco de Dados Modelos de Dados

IBM WebSphere DataStage

Mídias sociais como apoio aos negócios B2C

F.1 Gerenciamento da integração do projeto

Comunicando através da rede

Forneça a próxima onda de inovações empresariais com o Open Network Environment

Complemento I - Noções Introdutórias em Data Warehouses

Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence

ATIVIDADES PRÁTICAS SUPERVISIONADAS

Disciplina de Banco de Dados Introdução

Prof. JUBRAN. Aula 1 - Conceitos Básicos de Sistemas de Informação

Introdução. Conceitos Básicos. Conceitos Básicos. Conceitos Básicos

UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado)

Sistemas Distribuídos

ARCO - Associação Recreativa dos Correios. Sistema para Gerenciamento de Associações Recreativas Plano de Desenvolvimento de Software Versão <1.

Prof. Marcelo Machado Cunha

RESUMO DA SOLUÇÃO CA ERwin Modeling. Como eu posso gerenciar a complexidade dos dados e aumentar a agilidade dos negócios?

UNIP Ciência da Computação / Sistemas de Informação TED I - Orientações Gerais para Elaboração dos Documentos

Prof. Daniel Gondim. Sistemas de Informações

Profº Aldo Rocha. Banco de Dados

GERÊNCIA DE INTEGRAÇÃO DO PROJETO

Arquitetura de Disseminação de Informações baseada em Datawarehouse 05/04/2006

Especial Online RESUMO DOS TRABALHOS DE CONCLUSÃO DE CURSO. Sistemas de Informação ISSN

Sistemas Distribuídos. Professora: Ana Paula Couto DCC 064

Transcrição:

Data Warehouse - definições: Coleção de dados orientada a assunto, integrada, não volátil e variável em relação ao tempo, que tem por objetivo dar apoio aos processos de tomada de decisão (Inmon, 1997) Uma base de dados analítica que dá apoio a processos decisórios provida de recursos de acesso intuitivos (Poe et al, 1998) Um processo para a montagem e administração de dados provenientes de várias fontes com o propósito de obter uma visão simples e detalhada de todo o negócio (Gardner, 1998) Um armazém de dados históricos, cuja finalidade é apresentar informações que permitam identificar indicadores, evolução de valores ao longo de uma grande janela de tempo (Machado, 2007) Proibida a reprodução 1

Data Warehouse frases importantes: é uma arquitetura, não um produto ele é construído, não se compra é um processo complexo, não um simples projeto Arquitetura Metodologia Ferramentas Proibida a reprodução 2

Data Mart: Representa um subconjunto de dados do DW Direcionado a uma área específica ou processo de negócio Normalmente modelado em um esquema estrela Produção Vendas Marketing E Commerce Projeto Data Warehouse Proibida a reprodução 3

Características do Data Mart: Projeto piloto Atender necessidades imediatas Restrições (custo, tempo, conhecimento tecnológico) Desempenho Aprendizagem, aceitação. Proibida a reprodução 4

Cubo de dados: Permitem armazenar, em caráter temporário, apenas dados de interesse momentâneo Reduz o escopo da informação e acelera seu processamento Um subconjunto do Data Mart Proibida a reprodução 5

Processo de construção do DW: Consiste na extração, organização e integração de dados operacionais da empresa de forma consistente. Deve ser realizado com o objetivo de garantir a consistência e integridade das informações de forma a retratar a realidade dos negócios da empresa. Para isso são usadas ferramentas de software. As ferramentas devem permitir acesso intuitivo aos dados para dar mais flexibilidade e permitir rápidas análises dos dados. Proibida a reprodução 6

Processo de construção do DW: O DW deve ser construído de forma interativa Não é possível definir antecipadamente todos os requisitos necessários à sua construção até que ele esteja parcialmente povoado Necessária a definição de alguns requisitos iniciais Não pode ser plenamente baseado em requisitos Abordagem Evolucionária e incremental Inicia-se por áreas específicas e carentes de informação. Proibida a reprodução 7

Processo de construção do DW: Um dos itens mais importantes é o repositório dos metadados, responsável pela documentação de cada registro realizado na base de dados, pois são eles que vão proporcionar a segurança sobre a qualidade das informações obtidas. Proibida a reprodução 8

Tipos de ferramentas em Data Warehouse: Ferramentas para pesquisa e relatório (exemplo Crystal Reports). Ferramentas OLAP (On-Line Analytical Processing): permite analisar o porquê dos resultados obtidos. Sistemas de informações executivas: apresentam uma visualização mais simplificada dos dados (forma consolidada), sem requer do usuário a análise dos dados. Data Mining: categoria de ferramentas denominada open-end. Permite avaliar tendências e padrões não conhecidos entre os dados. Proibida a reprodução 9

Processo de construção do DW - grandezas: Escopo: todo o conjunto de informação da empresa informações de um único usuário da empresa Abordagem de implementação: a) Virtual b) Central c) Distribuída Proibida a reprodução 10

Staging Area ou Operational Data Store (ODS): Representa um armazenamento intermediário dos dados, facilitando a integração do ambiente operacional antes de sua atualização no DW. Extrair os dados no momento adequado, possivelmente em processos batch em horários fora do pico de operações podem estar disponíveis somente entre às 3:00h e 4:00h Proibida a reprodução 11

Staging Area ou Operational Data Store (ODS): Pode ser usada para filtrar dados do processo de extração. Não é um componente obrigatório Permite análise e apoio a tomada de decisão em tempo real Paulo Id = 0001 Cliente Paulo + Conta + Poupança + Investimentos Paulo ID = 2342 Paulo ID = 5463 Servidor ETL (arq. seqüenciais - mainframe) Proibida a reprodução 12

Fluxo do Data Warehouse: www.deakin.edu.au/ddw/images/dw-schematic.gif Proibida a reprodução 13

Arquitetura - Definição: Uma arquitetura de Data Warehouse pode ser definida como a forma de representar toda a estrutura do ambiente de dados, comunicação, processamento e apresentação disponível para o usuário na empresa (SINGH, 2001). SINGH, H. S. Data Warehouse. Conceitos, Tecnologias, Implementação e Gerenciamento. São Paulo: Makron Books, 2001. Proibida a reprodução 14

Arquitetura multicamadas Application Message Diretório de (Metadados) Operac. Data Staging Data Warehouse informação Gerenciamento do Processo Proibida a reprodução 15

Arquitetura multicamadas Application Message Diretório de (Metadados) Operac. Data Staging Data Warehouse informação Operacionais: Correspondem as dados internos da empresa juntamente com dados provenientes de outras fontes externas que irão compor o Data Warehouse. Proibida a reprodução 16

Arquitetura multicamadas Application Message Diretório de (Metadados) Operac. Data Staging Data Warehouse informação : Realiza a conexão entre várias outras camadas Uso extensivo da linguagem SQL Pode ser composta por diversos SGBDs, sistemas operacionais, protocolos, de maneira a fornecer acesso transparente, não importando a plataforma em uso. Proibida a reprodução 17

Arquitetura multicamadas Application Message Diretório de (Metadados) Operac. Data Staging Data Warehouse informação Data Staging: Inclui os processos de ETL, trata-se de uma camada que mantém os dados limpos e padronizados antes do processo de carga no Data Warehouse. Proibida a reprodução 18

Arquitetura multicamadas Application Message Diretório de (Metadados) Operac. Data Staging Data Warehouse informação Data Warehouse: Corresponde aos dados informacionais, uma cópia dos dados em formato apropriado para acesso rápido Proibida a reprodução 19

Arquitetura multicamadas Application Message Diretório de (Metadados) Operac. Data Staging Data Warehouse informação Informação: Camada que os usuários finais interagem Hardware e Software utilizados para geração de gráficos, relatórios, planilhas Data Mining e análises dimensionais Proibida a reprodução 20

Arquitetura multicamadas Application Message Diretório de (Metadados) Operac. Diretório de : Fornecem Acesso informações a Data sobre certos Data dados do ambiente, tais como fontes de dados, transformações Staging Warehouse dos dados, visões do usuário, Autorização do acesso, estrutura dos dados etc. informação Proibida a reprodução 21

Arquitetura multicamadas Application Message Gerenciamento do Processo: Organiza os diversos processos do DW a fim de mantê-lo atualizado. Envolve as tarefas necessárias à construção e manutenção do DW de maneira a manter sua consistência Gerenciamento do Processo Proibida a reprodução 22

Arquitetura multicamadas Application Message Application Messaging: Conhecida como camada de Middleware ou transporte Fornece suporte a troca de mensagens entre aplicações Através dela o DW troca dados pela rede Proibida a reprodução 23

Arquiteturas de Implementação: 1. Global (escopo de acesso) Os dados estão disponíveis em toda a empresa Pode ser fisicamente centralizada ou fisicamente distribuída (filiais) Filial 1 2. Independente (stand alone) Focalizado em uma área específica, sem foco corporativo Data Marts sem conectividade 3. Integrada Apesar de implementados separadamente, os DM estão interconectados Cada departamento é proprietário de seus dados Operacionais e externos Operacionais e externos Filial 1 Filial 2 Filial 3 Filial 2 Filial 3 Proibida a reprodução 24

Arquitetura de Implementação - Topologia DW DW Centralizada DM DM DM DM Dependente Independente

Abordagem de Implementação: A abordagem de implementação se refere basicamente ao caminho trilhado na construção do Data Warehouse, isto é, por onde deve-se começar o processo de elaboração do DW. Três tipos de abrodagem: Top Down Bottom up Combinado Proibida a reprodução 26

Tipos de Implementação: 1. Top Down Inicialmente o processo de ETL transfere os dados para o ODS Operacionais e externos ETL Definição de padrões e estruturas de dados ODS Seqüência de desenvolvimento DW Data Marts 2. Bottom Up Inicialmente o processo de ETL transfere os dados para Data Marts independentes Dificuldade na padronização Operacionais e externos ETL Data Marts Seqüência de desenvolvimento DW Proibida a reprodução 27

Top Down: vantagens e desvantagens Vantagens Herança da arquitetura: todos os DMs seguem o DW Visão do empreendimento: como abrange todos os departamentos ajuda a compreender os processo de negócio como um todo Repositório central de metadados Desvantagens Implementação muito longa e demorada (planejamento) Alta taxa de risco: não existe muita garantia de que haverá retorno do investimento Gera muita ansiedade e expectativa por parte dos usuários do sistema Controle e Centralização de regras para extração, limpeza e integração. Proibida a reprodução 28

Bottom Up: vantagens e desvantagens Vantagens Implementação rápida Rápido retorno do investimento (faster pay back) Herança incremental, facilita o crescimento e o aprendizado da equipe Desvantagens Possibilita a criação de Data Marts independentes, dificultando ou inviabilizando futuras integrações Desafio em manter a visão do empreendimento como um todo no caso de DMs sendo desenvolvidos em paralelo Administrar e coordenar múltiplas equipes de desenvolvimento Egoísmo dos usuários Proibida a reprodução 29

Implementação Combinada: Planejamento Top Down Desenvolvimento Bottom Up Cada DM torna-se um processo evolutivo do DW Gestão dos Metadados e coerência entre os DMs Operacionais e externos ETL Seqüência de desenvolvimento Proibida a reprodução 30