BANCO DE DADOS DISTRIBUÍDOS e DATAWAREHOUSING



Documentos relacionados
Sistemas de Apoio à Inteligência do Negócio

Data Warehousing. Leonardo da Silva Leandro. CIn.ufpe.br

Sistemas de Apoio à Inteligência do Negócio

SISTEMAS DE APOIO À INTELIGÊNCIA DE NEGÓCIOS

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence

Banco de Dados - Senado

Sistemas de Apoio à Decisão (SAD) - Senado

Aplicação A. Aplicação B. Aplicação C. Aplicação D. Aplicação E. Aplicação F. Aplicação A REL 1 REL 2. Aplicação B REL 3.

DATA WAREHOUSE. Rafael Ervin Hass Raphael Laércio Zago

SISTEMAS DE APOIO À INTELIGÊNCIA DE NEGÓCIOS

Chapter 3. Análise de Negócios e Visualização de Dados

Tópicos Avançados Business Intelligence. Banco de Dados Prof. Otacílio José Pereira. Unidade 10 Tópicos Avançados Business Inteligence.

Data Warehouse Processos e Arquitetura

Processo Decisório, OLAP e Relatórios Corporativos OLAP E RELATÓRIOS CORPORATIVOS

Data Warehouse. Debora Marrach Renata Miwa Tsuruda

Adriano Maranhão BUSINESS INTELLIGENCE (BI),

Interatividade aliada a Análise de Negócios

Faculdade Pitágoras PROJETO DE DW FASES FCS-EM PROJETOS DE DW 08/02/2012. Unidade 2.1. Curso Superior de Tecnologia: Banco de Dados

Data Warehouse. Diogo Matos da Silva 1. Universidade Federal de Ouro Preto, Ouro Preto, MG, Brasil. Banco de Dados II

DATA WAREHOUSE. Introdução

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan

Identificar as mudanças que acontecem na forma e no uso de apoio à decisão em empreendimentos de e-business. Identificar o papel e alternativas de

Data Warehouses. Alunos: Diego Antônio Cotta Silveira Filipe Augusto Rodrigues Nepomuceno Marcos Bastos Silva Roger Rezende Ribeiro Santos

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan

Complemento I - Noções Introdutórias em Data Warehouses

Uma estrutura (framework) para o Business Intelligence (BI)

Curso Data warehouse e Business Intelligence

Curso Data warehouse e Business Intelligence Fundamentos, Metodologia e Arquitetura

Introdução à Modelagem Dimensional para Datawarehouses

Planejamento Estratégico de TI. Prof.: Fernando Ascani

KDD E MINERAÇÃO DE DADOS:

Professor: Disciplina:

Faculdade Pitágoras Curso Superior de Tecnologia: Banco de Dados

ACOMPANHAMENTO TESTE 6. Fonte: Carlos Barbieri. Fonte: Carlos Barbieri

Data Warehousing Visão Geral do Processo

SISTEMA GERENCIADOR DE BANCO DE DADOS

Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence

Fundamentos da Análise Multidimensional

Prof. Ronaldo R. Goldschmidt.


Sistema. Atividades. Sistema de informações. Tipos de sistemas de informação. Everson Santos Araujo

Capítulo 1 - A revolução dos dados, da informação e do conhecimento 1 B12 4

PLANO DE ENSINO PRÉ-REQUISITOS: ENS

Hoje é inegável que a sobrevivência das organizações depende de dados precisos e atualizados.

Curso de Engenharia de Sistemas e Informática - 5º Ano. Ficha T. Prática n.º 1

IMPLANTAÇÃO DO DW NA ANVISA

APLICATIVOS CORPORATIVOS

Modelo de dados do Data Warehouse

Data Warehouses Uma Introdução

Uma Ferramenta WEB para apoio à Decisão em Ambiente Hospitalar

Visão Geral de Business Intelligence & Analytics, etc.

BUSINESS INTELLIGENCE Prof. Fabio Purcino

Thalita Moraes PPGI Novembro 2007

Business Intelligence e ferramentas de suporte

OLAP: Características, Arquitetura e Ferramentas

Profº Aldo Rocha. Banco de Dados

Planejamento Estratégico de TI. Prof.: Fernando Ascani

INTELIGÊNCIA COMPETITIVA. Transformando dados em decisões estratégicas

Business Intelligence. BI CEOsoftware Partner YellowFin

Arquiteturas de DW e Abordagens de Implementação. Arquiteturas e Abordagens de Implementação

Data Mining: Conceitos e Técnicas

Uma Arquitetura de Gestão de Dados em Ambiente Data Warehouse

Administração de Sistemas de Informação I

Sistemas de Informação

Data Warehouse Granularidade. rogerioaraujo.wordpress.com - rgildoaraujo@gmail.com 1

Data Warehouse. Djenane Cristina Silveira dos Santos¹, Felipe Gomes do Prado¹, José Justino Neto¹, Márcia Taliene Alves de Paiva¹

04/08/2012 MODELAGEM DE DADOS. PROF. RAFAEL DIAS RIBEIRO, MODELAGEM DE DADOS. Aula 1. Prof. Rafael Dias Ribeiro. M.Sc.

Material de Apoio. Sistema de Informação Gerencial (SIG)

Percio Alexandre de Oliveira Prof. Maurício Capobianco Lopes - Orientador

AGILE ROLAP - UMA METODOLOGIA ÁGIL PARA IMPLEMENTAÇÃO DE AMBIENTES DE NEGÓCIOS BASEADO EM SERVIDORES OLAP.

Bancos de dados distribuídos Prof. Tiago Eugenio de Melo

Uma peça estratégica para o seu negócio

BUSINESS INTELLIGENCE -Inteligência nos Negócios-

MAPA DE PROBLEMAS Administração de Sistemas de Informações Profa.MS.c. Cláudia Brazil Marques

Sistemas de Informação Gerenciais (SIG)

MBA Inteligência Competitiva Com ênfase em BI/CPM. Metadados

5 Estudo de Caso Material selecionado para o estudo de caso

INTRODUÇÃO E CONCEITOS BÁSICOS. Prof. Ronaldo R. Goldschmidt

MANUAL BI- Business Intelligence

Gerenciamento de Dados e Gestão do Conhecimento

AULA 07. Tecnologia hoje nas empresas. Prof. André Luiz Silva de Moraes

BANCO DE DADOS DISTRIBUÍDOS e DATAWAREHOUSING

Definition of a Measurement Guide for Data Warehouse Projects

ATIVIDADES PRÁTICAS SUPERVISIONADAS

Banco de Dados I. Apresentação (mini-currículo) Conceitos. Disciplina Banco de Dados. Cont... Cont... Edson Thizon

Business Intelligence: Desafios e Melhores Práticas

Sistemas de Informação

Checklist de Projeto de Data Warehouse

Business Intelligence para Computação TítuloForense. Tiago Schettini Batista

Dado: Fatos conhecidos que podem ser registrados e têm um significado implícito. Banco de Dados:

TÉCNICAS DE INFORMÁTICA WILLIAN FERREIRA DOS SANTOS

Capítulo 2 Data Warehousing

Decisão Suporte: Warehousing, OLAP e Data Mining

Decisão Suporte: Warehousing, OLAP e Data Mining

Programação com acesso a BD. Prof.: Clayton Maciel Costa clayton.maciel@ifrn.edu.br

Banco de Dados, Integração e Qualidade de Dados. Ceça Moraes cecafac@gmail.com

Módulo 4: Gerenciamento de Dados

SAD orientado a DADOS

Transcrição:

BANCO DE DADOS DISTRIBUÍDOS e DATAWAREHOUSING http://www.uniriotec.br/~tanaka/tin0036 tanaka@uniriotec.br Introdução a Data Warehousing e OLAP

Introdução a Data Warehouse e Modelagem Dimensional Visão Geral de BI ERM, EAI, CRM, PRM, ERP,... OLTP x OLAP Definições e Arquitetura de DW Projeto de DW Modelagem dimensional Esquema Estrela» Fatos» Dimensões» Hierarquias e Agregados Esquema Snowflake

Sistemas na Pirâmide Organizacional (Sprague & Watson, 1991)

Visão Geral da Arquitetura ERM Enterprise Relationship Management (BI-Business Intelligence, C. Barbieri, Axcel Books, 2001) Alta Gerência BSC CI Business Intelligence KMS CRM EAI Enteprise Application Integration PRM B2C B2B Clientes ERP Outros sistemas transacionais Parceiros/Fornecedores

Suporte à Decisão Produção e distribuição de INFORMAÇÃO ÚTIL para gerentes, executivos e analistas do conhecimento. INFORMAÇÃO ÚTIL! Mas de que forma? Com: Agilidade Flexibilidade Precisão

Ambiente de Sistemas de Aplicação Operacionais Dão suporte às funções associadas à execução do negócio da empresa: ERP, SCM B2C, B2B Sistemas transacionais legados etc. Informacionais Dão suporte às funções associadas à concepção do negócio da empresa DSS, EIS DW, CRM, PRM Ferramentas OLAP Ferramentas de Data Mining etc.

Business Inteligence Inteligência Aplicada aos Negócios BI é um conjunto de tecnologias que permitem o cruzamento de informações e suportam a análise dos indicadores de desempenho de um negócio. Data Warehouse é um componente essencial de BI (é o banco de dados da BI) Ferramentas OLAP e de Data Mining são usadas como ferramentas de apoio à decisão, para análise e extração de dados de Data Warehouses.

OLTP x OLAP Características Dados operacionais Dados informacionais Conteúdo Valores correntes, detalhados Valores históricos, sumariados Organização dos dados Natureza dos dados Estrutura de dados Por aplicação, sistema de informação Dinâmica, sujeita a atualizações freqüentes Relacional, própria para processamento transacional Por assunto, negócio Estática, atualização apenas com refreshment Dimensional, própria para processamento analítico Uso Estruturado, repetitivo Desestruturado, consultas sob diferentes perspectivas Desempenho Otimizado para tempo de resposta (máximo 2 a 3 segundos) Análises complexas, com tempos de respostas maiores

Suporte à Decisão Tradicional Ambiente Operacional Analista do negócio Dados não estão adequados para suporte à decisão Sistemas de suporte à decisão desenvolvidos ad-hoc Analista do Negócio vira Programador Longo tempo de espera

Porque um ambiente de Data Warehouse? Aplicação SD Ferramenta OLAP Aplicação EIS DW BDs Operacionais Integrar dados de múltiplas fontes Facilitar o processo de análise sem impacto para o ambiente de dados operacionais Obter informação de qualidade Atender diferentes tipos de usuários finais Flexibilidade e agilidade para atender novas análises

Data Warehouse - Definições Processos, ferramentas e recursos para gerenciar e disponibilizar informações de negócios precisas e inteligíveis para que indivíduos possam tomar decisões efetivas. Um ambiente para adequadamente organizar, gerenciar e disponibilizar informações oriundas de fontes diversas, fornecendo um visão única de parte ou de todo o negócio com o objetivo de dar suporte a operações analíticas.

Definição de Data Warehouse A Data Warehouse is a subject-oriented, integrated, time-variant, non-volatile collection of data in support of management s decision-making process. (W. Imnon) Um banco de dados destinado a sistemas de suporte à decisão, cujos dados são armazenados em estruturas lógicas dimensionais, possibilitando o seu processamento analítico por ferramentas OLAP e de mineração de dados.

Arquitetura Genérica de um Data Warehouse Meta Dados FONTES DE DADOS FERRAMENTAS DE CONSULTA OLAP BDs Operacionais Extração Transformação Carga Atualização Data Warehouse Análise Data Mining Relatórios Fontes Externas Data Marts OLAP Chaudhri&Dayal, SIGMOD RECORD 1997

Estratégias de projeto de DW O Data Warehouse Corporativo Data Warehouses Departamentais Data Warehouses Funcionais Marketing, Financeiro, Admnistrativo, etc. Data Warehouses para projetos especiais...

O Mito Para serem úteis, os Data Warehouses devem possuir grande abrangência, com dados de variadas fontes abrangendo os diversos aspectos da Empresa. Pré-requisito : empresa totalmente informatizada e integrada. Implicação : projetos extremamente complexos e com alta probabilidade de insucesso.

A Realidade Projetos evolutivos Enfoque inicial nos aspectos mais críticos Aproveitamento da estrutura operacional disponível Retorno mais rápido Acúmulo de experiência : menor risco e menor custo

Abordagem corrente : Estratégia Desenvolver incrementalmente Visão Integrada Dividir para conquistar Errar pequeno Implementação Planejamento Top-Down Desenvolvimento Bottom-Up, um Data Mart de cada vez, resultados devem ser atingidos em pequenos ciclos (ex.: a cada 3 meses) Cada Data Mart deve ser encarado de forma evolutiva Desafio Garantir a coerência entre os vários Data Marts

Data Mart - Conceito Um subconjunto lógico do Data Warehouse, geralmente visto como um data warehouse setorial. (Kimball) Uma perspectiva top-down considera que um DW completo, centralizado deva ser desenvolvido antes que partes dele, sumariadas, possam ser derivadas na forma de Data Marts. Uma perspectiva bottom-up, considera que um DW possa ser composto a partir de Data Marts previamente desenvolvidos.

Fatores Críticos de Sucesso em Projetos de DW/DM Foco bem definido Patrocinador forte Existência dos dados necessários Envolvimento dos usuários Qualificação da equipe de projeto Arquitetura tecnológica bem definida Marketing interno e acompanhamento Gerência e manutenção de metadados

Modelagem para Data Warehouse Requisitos distintos das aplicações do ambiente transacional: flexibilidade quanto às análises a suportar medidas a analisar precisam ser vistas sob diferentes perspectivas Enfoque diferente da modelagem no ambiente operacional Abordagem utilizada: MODELAGEM DIMENSIONAL

Visão multidimensional Facilita o entendimento e visualização de problemas típicos de suporte à decisão Mais intuitiva para o processamento analítico Utilizada pelas ferramentas OLAP A visão lógica é multidimensional, embora a estrutura física tenha a mesma visão tabular do modelo relacional.

Estrutura Relacional Volume de vendas (do revendedor GLEASON) MODEL COLOR SALES VOLUME MINI VAN BLUE 6 MINI VAN RED 5 MINI VAN WHITE 4 SPORTS COUPE BLUE 3 SPORTS COUPE RED 5 SPORTS COUPE WHITE 5 SEDAN BLUE 4 SEDAN RED 3 SEDAN WHITE 2

Visão matricial ou multidimensional Volume de Vendas (do revendedor Gleason) M O D E L Mini Van Coupe Sedan 6 5 4 3 5 5 4 3 2 Blue Red COLOR White Um array multidimensional tem um número fixo de dimensões e os valores são armazenados nas células Cada dimensão consiste de um número de elementos

Acrescentando mais uma coluna... Volume de Vendas de todos os revendedores MODEL COLOR DEALERSHIP VOLUME MINI VAN BLUE CLYDE 6 MINI VAN BLUE GLEASON 6 MINI VAN BLUE CARR 2 MINI VAN RED CLYDE 3 MINI VAN RED GLEASON 5 MINI VAN RED CARR 5 MINI VAN WHITE CLYDE 2 MINI VAN WHITE GLEASON 4 MINI VAN WHITE CARR 3 SPORTS COUPE BLUE CLYDE 2 SPORTS COUPE BLUE GLEASON 3 SPORTS COUPE BLUE CARR 2 SPORTS COUPE RED CLYDE 7 SPORTS COUPE RED GLEASON 5 SPORTS COUPE RED CARR 2 SPORTS COUPE WHITE CLYDE 4 SPORTS COUPE WHITE GLEASON 5 SPORTS COUPE WHITE CARR 1 SEDAN BLUE CLYDE 6 SEDAN BLUE GLEASON 4 SEDAN BLUE CARR 2 SEDAN RED CLYDE 1 SEDAN RED GLEASON 3 SEDAN RED CARR 4 SEDAN WHITE CLYDE 2 SEDAN WHITE GLEASON 2 SEDAN WHITE CARR 3

Visão multidimensional Volume de Vendas M O D E L Mini Van Coupe Sedan Carr Gleason Clyde DEALERSHIP Blue Red White COLOR O cubo é, de fato, apenas uma metáfora visual. É uma representação intuitiva do fato porque todas as dimensões coexistem para todo ponto no cubo e são independentes umas das outras.

Adicionando Dimensões - Hipercubos Volume de Vendas M O D E L Mini Van Coupe Sedan Blue Red White Carr Gleason Clyde Mini Van Coupe Sedan Blue Red White Carr Gleason Clyde Mini Van Coupe Sedan Blue Red White Carr Gleason Clyde DEALERSHIP COLOR COLOR COLOR JANUARY FEBRUARY MARCH

Níveis nas dimensões ou Hierarquias Total de vendas Produto Alfa1 Dimensão: área NE Brasil SUL NO PE SE RS SC AC AM Dimensão: 7 tempo abril 14 21 1996 29 maio 15 30 34 23 45 62 56 23 92 73 23 234 13 87 21 14 34.. 18 46.. 150 Hierarquias são a base das agregações

Agregados Vendas Categoria Região Produto XPTO XPTA XPTN Março Abril Maio Mês... ES SP RJ... Estado Trimestre

Problemas Calcular os os agregados no no momento da da recuperação ou ou armazená-los? Armazenamento X Tempo de Resposta BD4 BD3 BD2 BD1 BD1 BD2 BD3 BD4

A Síndrome da Explosão no Volume de Dados Número de Agregações 70000 60000 50000 40000 30000 20000 10000 0 16 64 256 1024 4096 16384 65536 2 3 4 5 6 7 8 Número de Dimensões (4 níveis em cada dimensão)

Agregados As hierarquias permitem que o usuário possa ter acesso a dados com maior ou menor detalhe Os valores apresentados quando o analista consulta dados em níveis hierárquicos mais altos são valores agregados

Exemplo Qual a margem de contribuição de cada área de vendas?

Hierarquias e Agregados Produto Tempo Geografia Consultas Marca Categoria Ano Trimestre País Região Vendas por Produto, Marca, Trimestre Ano e e Região Produto Mês Estado

Visão dos fatos e dimensões em uma ferramenta OLAP

Ferramentas OLAP OLAP: On Line Analytical Processing Conjunto de técnicas para tratar informações contidas em DW. Visão Multidimensional dos Dados Termo proposto por E.F. Codd, em 1993 Providing OLAP to User-Analysts: An IT Mandate. Doze Regras de Codd para ferramentas OLAP: Visão conceitual multidimensional Transparência Acessibilidade Desempenho de Informações consistentes Arquitetura Cliente Servidor Dimensionalidade genérica Manipulação de dados dinâmicos Suporte a multiusuários Operações ilimitadas em dimensões cruzadas Manipulação intuitiva de dados Flexibilidade nas consultas Níveis de dimensão e agregação ilimitados

Doze Regras de Codd para ferramentas OLAP Visão conceitual multidimensional Os dados são modelados em diversas dimensões podendo haver cruzamento de todos os tipos de informações Transparência OLAP deve atender a todas as solicitações do analista, não importando de onde os dados virão. Todas as implicações devem ser transparentes para os usuários finais. Acessibilidade As ferramentas OLAP devem permitir conexão com todas as bases de dados legadas. A distribuição de informações deve ser mapeada para permitir o acesso a qualquer base. Desempenho de Informações consistentes As ferramentas OLAP devem possuir conhecimento sobre todas as informações armazenadas que possa disponibilizar, sem complexidade para o usuário final, qualquer tipo de consulta.

Doze Regras de Codd para ferramentas OLAP Arquitetura Cliente Servidor OLAP deve ser construída em arquitetura C/S para que possa atender a qualquer usuário em qualquer ambiente operacional Dimensionalidade genérica Deve ser capaz de tratar informações em qualquer quantidade de dimensões Manipulação de dados dinâmicos Devido ao grande volume de informações armazenadas nas diversas dimensões de um modelo multidimensional, é comum a esparsidade dos dados, e então essas células nulas devem ser tratadas para evitar custos com memória. Suporte a multiusuários Nas grandes organizações, é comum vários analistas trabalharem com a mesma massa de dados.

Doze Regras de Codd para ferramentas OLAP Operações ilimitadas em dimensões cruzadas As ferramentas OLAP devem ser capazes de navegar nas diversas dimensões existentes. Manipulação intuitiva de dados O usuários devem ser capazes de manipular os dados livremente, sem necessitar de qualquer tipo de ajuda. Flexibilidade nas consultas O usuário deve ter a flexibilidade para efetuar qualquer tipo de consulta. Níveis de dimensão e agregação ilimitados Devido às várias dimensões existentes, deve haver vários níveis de agregação dos dados.

Operações OLAP Ferramentas OLAP fornecem suporte para funções de análise de dados, típicas de aplicações avançadas de planilhas eletrônicas. Operações dimensionais de ferramentas OLAP: Slice and Dice (Ponto, Plano, Cubo) Rotation (Rotação ou Pivotamento) Drilling» Drill Down» Drill Across e Drill Through» Drill Up (Roll Up) Ranking (Classificação por uma coluna)

Operadores Dimensionais Ponto - Valor pontual Interseção de valores (Fato) com relação aos eixos (Dimensões) Plano Slicing Duas dimensões variando com outras fixas. Cubo Dicing Todas as dimensões variando Rotação Pivotamento Mudança dos eixos das dimensões, para fins de visualização Vide tabelas dinâmicas no MS Excel

Operadores Drilling Drill-down Drill-up ou Roll-up

Operadores Drilling Drill Across Drill Through

Tipos de ferramentas OLAP OLAP Multidimensional (MOLAP) Utilizam estrutura de dados multidimensional e permitem a navegação pelos níveis de detalhamento em tempo real. O BD e o SGBD são multidimensionais Estrutura de dados é um array com um número fixo de dimensões. O (hiper)cubo é uma metáfora visual, onde as dimensões coexistem para todo ponto e são independentes entre si. OLAP RELACIONAL (ROLAP) Decorrência do uso consagrado de SGBDs relacionais nos BDs operacionais (transacionais), com as vantagens da tecnologia aberta e padronizada (SQL). Utiliza os metadados no apoio à descrição do modelo de dados e na construção de consultas. Através de uma camada semântica acima do esquema relacional, os dados são apresentados ao usuário com visão multidimensional. OLAP HÍBRIDO (HOLAP) Tendência dos modernos SGBDs relacionais de adicionar uma arquitetura multidimensional para prover facilidades a ambientes de suporte a decisão. Proporciona o desempenho e flexibilidade de um BD multidimensional e mantém a gerenciabilidade, escalabilidade, confiabilidade e acessibilidade conquistadas pelos BDs relacionais.