Aplicação A. Aplicação B. Aplicação C. Aplicação D. Aplicação E. Aplicação F. Aplicação A REL 1 REL 2. Aplicação B REL 3.



Documentos relacionados
Sistemas de Apoio à Decisão (SAD) - Senado

Banco de Dados - Senado

DATA WAREHOUSE. Rafael Ervin Hass Raphael Laércio Zago

DATA WAREHOUSE. Introdução

Data Warehousing. Leonardo da Silva Leandro. CIn.ufpe.br

Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

Modelo de dados do Data Warehouse

Data Warehouse. Debora Marrach Renata Miwa Tsuruda

Adriano Maranhão BUSINESS INTELLIGENCE (BI),

Tópicos Avançados Business Intelligence. Banco de Dados Prof. Otacílio José Pereira. Unidade 10 Tópicos Avançados Business Inteligence.

Interatividade aliada a Análise de Negócios

Curso Data warehouse e Business Intelligence

BANCO DE DADOS DISTRIBUÍDOS e DATAWAREHOUSING

Curso Data warehouse e Business Intelligence Fundamentos, Metodologia e Arquitetura

Fundamentos da Análise Multidimensional

Chapter 3. Análise de Negócios e Visualização de Dados

Data Warehouses Uma Introdução

PLANO DE ENSINO PRÉ-REQUISITOS: ENS

Identificar as mudanças que acontecem na forma e no uso de apoio à decisão em empreendimentos de e-business. Identificar o papel e alternativas de

Data Warehouse Granularidade. rogerioaraujo.wordpress.com - rgildoaraujo@gmail.com 1

UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado)


SAD orientado a DADOS

Complemento I - Noções Introdutórias em Data Warehouses

Data Warehouse. Diogo Matos da Silva 1. Universidade Federal de Ouro Preto, Ouro Preto, MG, Brasil. Banco de Dados II

Data Warehouses. Alunos: Diego Antônio Cotta Silveira Filipe Augusto Rodrigues Nepomuceno Marcos Bastos Silva Roger Rezende Ribeiro Santos

Professor: Disciplina:

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Kimball University: As 10 Regras Essenciais para a Modelagem de Dados Dimensional

Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence

Módulo 4: Gerenciamento de Dados

Sistema. Atividades. Sistema de informações. Tipos de sistemas de informação. Everson Santos Araujo

ADM041 / EPR806 Sistemas de Informação

Sistema de Informação Gerencial baseado em Data Warehouse aplicado a uma software house

5 Estudo de Caso Material selecionado para o estudo de caso

Uma análise de ferramentas de modelagem e gerência de metadados aplicadas ao projeto de BI/DW-UFBA

Gerenciamento de Dados e Gestão do Conhecimento

04/08/2012 MODELAGEM DE DADOS. PROF. RAFAEL DIAS RIBEIRO, MODELAGEM DE DADOS. Aula 1. Prof. Rafael Dias Ribeiro. M.Sc.

Business Intelligence e ferramentas de suporte

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse

05/06/2012. Banco de Dados. Gerenciamento de Arquivos. Gerenciamento de Arquivos Sistema Gerenciador de Banco de Dados Modelos de Dados

Business Intelligence. BI CEOsoftware Partner YellowFin

FLUXO DE CAIXA: Módulo BI (Business Intelligence)

SISTEMA GERENCIADOR DE BANCO DE DADOS

1- Identifique para cada questão abaixo, se o enunciado se refere a View, Stored Procedures, Trigger ou Function. Apenas um por questão.

Módulo 4. Construindo uma solução OLAP

Hoje é inegável que a sobrevivência das organizações depende de dados precisos e atualizados.

Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados

Banco de Dados. Arquitetura e Terminologia. Prof. Walteno Martins Parreira Jr waltenomartins@yahoo.

Arquitetura física de um Data Warehouse

Banco de Dados. Introdução. João Eduardo Ferreira Osvaldo Kotaro Takai. DCC-IME-USP

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5

No mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o

08/03/2009. Como mostra a pirâmide da gestão no slide seguinte... Profª. Kelly Hannel. Fonte: adaptado de Laudon, 2002

Data Mining: Conceitos e Técnicas

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan

A importância da. nas Organizações de Saúde

Uma estrutura (framework) para o Business Intelligence (BI)

SAD. Paulo Silva, Rodolfo Ribeiro, Vinicius Tavares

Banco de Dados I. Apresentação (mini-currículo) Conceitos. Disciplina Banco de Dados. Cont... Cont... Edson Thizon

Modelos. Comunicação com clientes

Como melhorar a tomada de decisão. slide 1

Fundamentos de Sistemas de Informação Sistemas de Informação

ADMINISTRAÇÃO DOS RECURSOS DE DADOS

Prof. JUBRAN. Aula 1 - Conceitos Básicos de Sistemas de Informação

SUMÁRIO 1. INTRODUÇÃO O QUE É DATA WAREHOUSE? O QUE DATA WAREHOUSE NÃO É IMPORTANTE SABER SOBRE DATA WAREHOUSE

Criação e uso da Inteligência e Governança do BI

Universidade Federal de Santa Maria Curso de Arquivologia. Disciplina de Banco de Dados Aplicados à Arquivística. Versao 1.

Prof.: Clayton Maciel Costa

22/02/2009. Supply Chain Management. É a integração dos processos do negócio desde o usuário final até os fornecedores originais que

O Que é Data Warehouse

Laudon & Laudon Essentials of MIS, 5th Edition. Pg. 1.1

Processo Decisório, OLAP e Relatórios Corporativos OLAP E RELATÓRIOS CORPORATIVOS

Fornecendo Inteligência, para todo o mundo, a mais de 20 anos.

Definition of a Measurement Guide for Data Warehouse Projects

F.1 Gerenciamento da integração do projeto

ADMINISTRAÇÃO DOS RECURSOS DE DADOS

Sistemas de Informação Gerenciais (SIG)

Pós-Graduação em Gerenciamento de Projetos práticas do PMI

ADMINISTRAÇÃO DE ATIVOS DE TI GERENCIAMENTO DE CONFIGURAÇÃO

Sistemas de Informação CEA460 - Gestão da Informação

Faculdade Pitágoras PROJETO DE DW FASES FCS-EM PROJETOS DE DW 08/02/2012. Unidade 2.1. Curso Superior de Tecnologia: Banco de Dados

Módulo 15 Resumo. Módulo I Cultura da Informação

Curso de Engenharia de Sistemas e Informática - 5º Ano. Ficha T. Prática n.º 1

Capítulo 2 Data Warehousing

MSc. Daniele Carvalho Oliveira

Banco de Dados. Modelagem de Dados com MER. Prof. Walteno Martins Parreira Jr

Palavras-chave: On-line Analytical Processing, Data Warehouse, Web mining.

Versão º. Semestre de 2006 Marcelo Nogueira São José dos Campos SP

Revisão de Banco de Dados

Data Warehouse. Djenane Cristina Silveira dos Santos¹, Felipe Gomes do Prado¹, José Justino Neto¹, Márcia Taliene Alves de Paiva¹

Service Level Management SLM. Gerenciamento de Níveis de Serviço

Banco do Brasil S.A. Consulta ao Mercado - RFP - Request for Proposa Aquisição de Ferramenta de Gestão de Limites Dúvida de Fornecedor

Seção 2/E Monitoramento, Avaliação e Aprendizagem

Planejamento Estratégico de TI. Prof.: Fernando Ascani

DATA WAREHOUSE NO APOIO À TOMADA DE DECISÕES

Transcrição:

Sumário Data Warehouse Modelagem Multidimensional. Data Mining BI - Business Inteligence. 1 2 Introdução Aplicações do negócio: constituem as aplicações que dão suporte ao dia a dia do negócio da empresa, que garantem a operação da empresa, também chamadas de sistemas de produção; Aplicações sobre o negócio: são as aplicações que analisam o negócio, ajudando a interpretar o que ocorreu e a decidir sobre estratégias futuras para a empresa - compreendem os Sistemas de Apoio à Decisão. Consultas típicas de um SAD são: Listar a evolução das vendas nos últimos 10 anos; Listar o fornecedor que não teve mais do que 20% de atrasos nas últimas 100 entregas. Evolução do Ambiente de Data Warehouse 3 4 REL 1 REL 1 REL 2 REL 2 REL 3 REL 3 REL 4 REL 4 REL 5 REL 5 REL 5 6 REL 6 6 1

SAD 1 SAD 1 SAD 2 SAD 2 SAD 3 SAD 3 SAD 4 SAD 4 SAD 5 SAD 5 SAD 6 7 8 SAD 6 SAD 1 SAD 2 Tecnologia de Data Warehousing SAD 1 SAD 2 SAD 3 SAD 3 SAD 4 SAD 4 SAD 5 SAD 5 SAD 6 9 10 SAD 6 Conjunto de de Dados Dados Não Não Volátil, Aplicação Organizado D por por Assuntos, Integrado, Varia Varia com com Passar do do Tempo, Suporte para para Processo de de Tomada de Decisão da Empresa 11 Organizados por Assuntos: Refere-se ao fato do armazenar informações sobre temas específicos importantes para o negócio da empresa. Exemplos típicos de temas são: produtos, atividades, contas, clientes, etc. Em contrapartida, o ambiente operacional é organizado por aplicações funcionais. Integração: Esta característica irá definir a representação única para os dados provenientes dos diversos sistemas que formarão a base de dados do. A maior parte do trabalho na construção de um está na análise dos sistemas operacionais e dos dados que eles contêm. Como não existem padrões de codificação, cada analista pode definir a mesma estrutura de dados de várias formas, fazendo com que dados que representam a mesma informação sejam representados de diversas maneiras dentro dos sistemas utilizados pela empresa ao longo dos anos. Variação no Tempo: Segundo W.H.Inmon todos os dados no são precisos em algum instante no tempo, como eles podem estar corretos somente em um determinado momento, é dito que esses dados "variam com o tempo". Não Volátil: Em um não existem alterações de dados, somente a carga inicial e as consultas posteriores. Ele é definido assim pois as operações a nível de registro em modo on-line como são os sistemas transacionais, exigem um controle e um processamento muito grande, fugindo do objetivo principal do. 12 2

DM DM Coleção de de Assuntos de de uma uma Área, Área, Organizado para para Apoio Apoio à à Decisão, de DM Necessidades de Departamento/ Setor Setor DM Conceito de Data Warehouse Data Warehouse, pode ser definido como um banco de dados especializado, o qual integra e gerencia o fluxo de informações a partir dos bancos de dados corporativos e fontes de dados externas à Organização. Um oferece os fundamentos e os recursos necessários para um Sistema de Apoio a Decisão (SAD) eficiente, fornecendo dados integrados e históricos que servem desde à alta direção, que necessita de informações mais resumidas, até as gerências de baixo nível, onde os dados detalhados ajudam a observar aspectos mais táticos da Organização. 13 14 OLTP x A característica simples mais distintiva dos aplicativos OLTP (On-line Transaction Processing) é que o banco de dados está sendo constantemente atualizado. Como os dados estão mudando constantemente, o sistema não pode ajudar no apoio a decisões. De um ponto de vista prático, (On-line Analytic Processing) sempre envolve consultas interativas aos dados, seguindo um caminho de análise através de múltiplos passos, como, por exemplo, aprofundar-se sucessivamente por níveis mais baixos de detalhe de um quesito de informação específico. envolve capacidades analíticas, incluindo a derivação de taxas, variâncias, etc., e envolvendo medidas ou dados numéricos através de muitas dimensões, devendo suportar modelos para previsões, análises estatísticas e de tendências. 15 16 Modelo Estrela. Modelagem Dimensional () Modelagem Relacional Modelagem Dimensional GEOGRAFIA Cod_geografiainteger Nome varchar(10) População integer Estado char(2) Região char(2) TEMPO Cod_tempo integer Dia integer Mês integer Ano integer Dia_semana char(3) VENDAS Cod_produto integer Cod_tempo integer Cod_geografiainteger Cod_canal integer Quantidade decimal(16,0) Faturamento decimal(16,2) PRODUTO Cod_produto integer Nome varchar(10) Categoria char(4) Familia char(4) CANAL Cod_canal integer Tipo varchar(10) 17 18 3

Modelagem Dimensional () Modelo Flocos de Neve (Snowflake): Incorpora tabelas dimensionais principais, que têm uma conexão lógica direta em fact tables através de suas chaves primárias, e tabelas menores como 'extensões', que são usadas para armazenar descrições e decodificação para chaves e códigos nas tabelas maiores. As tabelas dimensionais principais parecem tabelas dimensionais em estrela, exceto pelo fato das colunas atributo conterem chaves para as tabelas extensões em lugar de descrições de texto. As tabelas 'extensões' são conectadas com a tabela dimensional principal (ou com outras tabelas 'extensões') através de suas chaves primárias, e contêm texto decodificado e descrições de valores chave ou codificados, armazenados na tabela dimensional principal. 19 Embora aceitável, a normalização de dimensões não é recomendável por razões de desempenho e facilidade de uso: A quantidade de tabelas torna a apresentação do modelo mais complexa. Otimizadores do SGBD têm mais dificuldade com esquema complexo. A economia de espaço em disco é insignificante em relação ao completo. Diminui a habilidade de usuários de navegar na dimensão. 20 Sistema 1 Conjunto de Dados Não Volátil, Extração Organizado por Assuntos, Integrado, Fontes Externas Transformação Varia com Passar do Tempo, Carga Suporte para Processo de Tomada de Decisão da Empresa Sistema 1 Fontes Externas Ferramentas de Consulta Sistema 2 Área de Organização de Dados Sistema 2 Área de Organização de Dados Sistema n Dados Não Estruturados 21 Sistema n Dados Não Estruturados Extração, Transformação e Carga 22 Fontes Externas Análise Data Mining Projeto de um Sistema 1 Sistema 2 Área de Organização de Dados Ferramentas de Data Mining Kimball aponta um conjunto pontos fundamentais no projeto da estrutura de (tipo estrela). São os seguintes os chamados pontos de decisão, que constituem definições a serem feitas e correspondem, de fato, a etapas do projeto: Os processos, e por conseqüência, a identidade das tabelas de fatos; A granularidade de cada tabela de fatos; As dimensões de cada tabela de fatos; Aos fatos, incluindo fatos pré-calculados; Os atributos das dimensões; Como acompanhar mudanças graduais em dimensões; As agregações, minidimensões e outras decisões de projeto físico; Duração histórica do banco de dados; Urgência com que se dá a extração e carga para o. Sistema n Dados Não Estruturados Extração, Transformação e Carga 23 Esta metodologia segue a linha top-down, pois começa identificando os grandes processos da empresa. 24 4

Estratégias de Implementação Estratégia Evolucionária Estratégias de Implementação Inmon: Histórico de sucesso das aplicações; Usuário final não terá condições de expressar suas necessidades com clareza antes da primeira interação; A gerência não se comprometerá antes da primeira interação; Há necessidade de, rapidamente, obter resultados visíveis. INMON Avalia o que o Ambiente Operativo tem a Oferecer Fácil Mapeamento Limitação de Visão KIMBALL Orientada às Necessidades do Usuário Final Mapeamento Lento (Identificar Fontes) Visão mais Ampla 25 26 Povoando um Filtragen,Transformação e Integração dos Dados Extraídos Conflitos Semânticos e Estruturais: Diferenças de unidades; Diferenças de precisão; Diferenças em código ou expressões; Diferenças de granularidade; Diferenças de abstração. 27 Modelagem Multidimensional Tabela de Fatos Tabela central do projeto dimensional. Armazena medições numéricas do negócio. Possui chaves de múltiplas partes. Cada chave é uma chave externa para uma tabela de dimensão. Cada uma das medições é obtida na interseção de todas as dimensões. Em consultas a tabela de fatos são usados centenas, milhares ou até milhões de registros para a construção da resposta. 28 Modelagem Multidimensional Dimensão: Representação dos contextos relevantes para a análise de um fato. Exemplo: Fato: Vendas. Dimensões: Clientes, Produtos, Tempo, Locais,... Uma dimensão pode conter membros; ser organizada em hierarquias. Modelagem Multidimensional Membros: Exemplos: dimensão Tempo: dia, semana, horário. dimensão Locais: bairro, cidade, estado. Hierarquias: I) TEMPO II) GEOGRAFIA ANO REGIAO TRIMESTRE ESTADO 29 MES DIA 30 5

Normalmente, a modelagem dimensional utilizando o esquema estrela apenas representa os fatos no nível de granularidade mais baixa (a partir do qual é possível gerar as combinações ou diferentes perspectivas de análise). No entanto, torna-se evidente a vantagem (por razões de desempenho) de pré-calcular e armazenar fatos sumário, contendo agregações segundo diferentes combinações de dimensões. Produto Marca Categoria Produto Tempo Ano Trimestre Mês Geografia País Região Estado Consultas Vendas por Produto, Marca, Trimestre Ano e e Região 31 32 Vendas Categoria Tempo de Resposta XPTO Trimestre Região XPTA XPTN Março Abril Maio Sul Norte Sudeste Marca Ano Região 33 BD2 BD4 BD3 BD1 BD1 BD2 BD3 BD4 34 Fatores: Custo de Criação; Custo de Manutenção; Frequência de Manutenção; Frequência de Utilização; Tempo de Geração. Nem sempre é viável armazenar todos os agregados. Modelo Dimensional Visualização: Uma visão multidimensional é usualmente representada por um cubo. Adequado à visualização de até 3 dimensões. Análise tridimensional é bastante utilizada. Hipercubo: cubo com mais de 3 dimensões. 35 36 6

Modelo Dimensional 37 Modelo Dimensional Funcionalidades: Roll-up(agregação): os dados são resumidos com generalização crescente (dia, mês, ano). Drill-down(desmembramento): níveis crescentes de detalhes são revelados (ano, mês, dia). Drill Across: ocorre quando o usuário pula um nível intermediário dentro de uma mesma dimensão. Por exemplo: a dimensão tempo é composta por ano, semestre, trimestre, mês e dia. O usuário estará executando um Drill Across quando ele passar de ano direto para trimestre ou mês. Drill Throught: ocorre quando o usuário passa de uma informação contida em uma dimensão para uma outra. Por exemplo: Estou na dimensão de tempo e no próximo passo começo a analisar a informação por região. Pivot(pivoteamento): rotação do cubo (hipercubo). Slice-and-Dice(fatiar e cortar em cubos): realizar a operação de projeção nas dimensões. 38 Roll-up Drill-down 39 40 Pivot Slice-and-Dice 41 42 7

Banco de Dados Multidimensional Originalmente, o conceito de banco de dados multidimensional surgiu no MIT ligado a pesquisas em econometria. Um banco de dados multidimensional ao invés de armazenar os dados como registros em tabelas, armazena os dados em arrays multidimensionais. M Banco de Dados Multidimensional R 43 44 Data Mining As ferramentas de Mineração de Dados, são especializadas em procurar padrões nos dados. Essa busca pode ser efetuada automaticamente pelo sistema ou interativamente com um analista, responsável pela geração de hipóteses. Diversas ferramentas distintas, como redes neurais, indução de árvores de decisão, sistemas baseados em regras e programas estatísticos, tanto isoladamente quanto em combinação, podem ser então aplicadas ao problema. Em geral, o processo de busca é interativo, de forma que os analistas revêem o resultado, formulam um novo conjunto de questões para refinar a busca em um dado aspecto das descobertas, e realimentam o sistema com novos parâmetros. Ao final do processo, o sistema de Mineração de Dados gera um relatório das descobertas, que passa então a ser interpretado pelos analistas de mineração. Somente após a interpretação das informações obtidas encontramos conclusões ou regras, este processo é conhecido por Knowledge Discovery 45 in Database (KDD) ou descoberta de conhecimento em banco de dados. Data Mining Objetivos: Explanatório: explicar algum evento ou medida observada, tal como porque a venda de sorvetes caiu no Rio de Janeiro; Confirmatório: confirmar uma hipótese. Uma companhia de seguros, por exemplo, pode querer examinar os registros de seus clientes para determinar se famílias de duas rendas tem mais probalidade de adquirir um plano de saúde do que famílias de uma renda; Exploratório: analisar os dados buscando relacionamento novos e não previstos. Uma companhia de cartão de crédito pode analisar seus registros históricos para determinar que fatores estão associados a pessoas que representam risco para créditos. 46 Business Intelligence (BI) O termo BI surgiu na década de 80, cunhado pelo Gartner Group, e tem como principais características: Extrair e integrar dados de múltiplas fontes ; Fazer uso da experiência ; Analisar dados contextualizados ; Trabalhar com hipóteses; Procurar relações de causa e efeito; Transformar os registros obtidos em informação útil para o conhecimento empresarial. 47 Business Intelligence (BI) Business Intelligence é o processo de analisar informações brutas acumuladas da empresa e a partir delas obter insights valiosos. Business Intelligence permite que os responsáveis pelas decisões tenham as informações certas, na hora certa e no lugar certo, capacitando-os a tomar melhores decisões corporativas. As aplicações de BI incluem: Sistemas de suporte à decisão; Consultas e relatórios (padronizadas e ad-hoc); Análises (On-Line Analytical Processing); Análises estatísticas; Previsões; Data Mining. 48 8

Business Intelligence (BI) Conclusão Inmon: É um engano pensar que os enfoques de projeto que funcionaram no passado serão úteis na construção do. Os requisitos para a criação de um não podem ser conhecidos até que ele seja parcialmente povoado e sendo usado pelo analista de SAD. Portanto, ele não pode ser projetado do mesmo modo pelo qual são construídos os sistemas clássicos baseados em requisitos. Por outro lado, também constitui um engano pensar que não prever requisitos seja uma boa idéia. A realidade se encontra em algum ponto intermediário. (estratégia evolucionária) 49 50 FIM 9