Banco de Dados - Senado

Documentos relacionados

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

DATA WAREHOUSE. Rafael Ervin Hass Raphael Laércio Zago

Data Warehouse Granularidade. rogerioaraujo.wordpress.com - rgildoaraujo@gmail.com 1

DATA WAREHOUSE. Introdução

Adriano Maranhão BUSINESS INTELLIGENCE (BI),

Data Warehousing. Leonardo da Silva Leandro. CIn.ufpe.br

Fundamentos da Análise Multidimensional

Data Warehouse. Debora Marrach Renata Miwa Tsuruda

Prova INSS RJ cargo: Fiscal de Rendas

Data Warehouses. Alunos: Diego Antônio Cotta Silveira Filipe Augusto Rodrigues Nepomuceno Marcos Bastos Silva Roger Rezende Ribeiro Santos

04/08/2012 MODELAGEM DE DADOS. PROF. RAFAEL DIAS RIBEIRO, MODELAGEM DE DADOS. Aula 1. Prof. Rafael Dias Ribeiro. M.Sc.

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Tópicos Avançados Business Intelligence. Banco de Dados Prof. Otacílio José Pereira. Unidade 10 Tópicos Avançados Business Inteligence.

Glossário Apresenta a definição dos termos, siglas e abreviações utilizadas no contexto do projeto Citsmart.

Business Intelligence e ferramentas de suporte

15/09/2015. Gestão e Governança de TI. Modelo de Governança em TI. A entrega de valor. A entrega de valor. A entrega de valor. A entrega de valor

SAD orientado a DADOS

Complemento I - Noções Introdutórias em Data Warehouses

PLANO DE ENSINO PRÉ-REQUISITOS: ENS

Curso Data warehouse e Business Intelligence

Data Warehouse. Diogo Matos da Silva 1. Universidade Federal de Ouro Preto, Ouro Preto, MG, Brasil. Banco de Dados II

Universidade Paulista

Aplicação A. Aplicação B. Aplicação C. Aplicação D. Aplicação E. Aplicação F. Aplicação A REL 1 REL 2. Aplicação B REL 3.

Modelo de dados do Data Warehouse

Sistemas de Apoio à Decisão (SAD) - Senado

Curso Data warehouse e Business Intelligence Fundamentos, Metodologia e Arquitetura

Chapter 3. Análise de Negócios e Visualização de Dados

Uma análise de ferramentas de modelagem e gerência de metadados aplicadas ao projeto de BI/DW-UFBA

Disciplina de Banco de Dados Introdução

MECANISMOS PARA GOVERNANÇA DE T.I. IMPLEMENTAÇÃO DA. Prof. Angelo Augusto Frozza, M.Sc.

Governança de TI. ITIL v.2&3. parte 1

Lista de Exercícios 01: ITIL Prof. Fernando Pedrosa

ADMINISTRAÇÃO DOS RECURSOS DE DADOS

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Módulo 4. Construindo uma solução OLAP

Professor: Disciplina:

ANEXO X DIAGNÓSTICO GERAL

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan

Sistemas de Informações Gerenciais (SIG) Juliana Grigol Fonsechi Chang Ming Vanessa Herculano de Oliveira

A Grande Importância da Mineração de Dados nas Organizações

Inteligência Empresarial. BI Business Intelligence. Business Intelligence 22/2/2011. Prof. Luiz A. Nascimento

ATIVIDADES PRÁTICAS SUPERVISIONADAS

GESTÃO DE PROJETOS PARA A INOVAÇÃO

SISTEMA DE GESTÃO DE PESSOAS SEBRAE/TO UNIDADE: GESTÃO ESTRATÉGICA PROCESSO: TECNOLOGIA DA INFORMAÇÃO

Módulo 4: Gerenciamento de Dados

e-business A IBM definiu e-business como: GLOSSÁRIO

Governança AMIGA. Para baixar o modelo de como fazer PDTI:

Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence

CobiT 4.1 Domínios de Processos. rogerioaraujo.wordpress.com - rgildoaraujo@gmail.com 1

Oracle Hyperion Essbase

Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados

Como melhorar a tomada de decisão. slide 1

ADMINISTRAÇÃO DE ATIVOS DE TI GERENCIAMENTO DE CONFIGURAÇÃO

SISTEMAS DE INFORMAÇÃO. Prof. José Carlos Vaz Baseado em LAUDON, K. & LAUDON, J. Sistemas de Informação Gerenciais. Pearson, 2004 (5a. ed.).

Thiago Locatelli de OLIVEIRA, Thaynara de Assis Machado de JESUS; Fernando José BRAZ Bolsistas CNPq; Orientador IFC Campus Araquari

BUSINESS INTELLIGENCE Prof. Fabio Purcino

Data Warehouses Uma Introdução

PROPOSTA DE UMA ARQUITETURA PARA CONSTRUÇÃO DE UM DATA WAREHOUSE PARA GESTÃO DA SAÚDE PÚBLICA DE UM MUNICÍPIO DO VALE DO ITAJAÍ

ADM041 / EPR806 Sistemas de Informação

Universidade de Brasília. Faculdade de Ciência da Informação. Prof a Lillian Alvares

SAD. Paulo Silva, Rodolfo Ribeiro, Vinicius Tavares

SAM GERENCIAMENTO DE ATIVOS DE SOFTWARE

Apresentação, xix Prefácio à 8a edição, xxi Prefácio à 1a edição, xxiii. Parte I - Empresa e Sistemas, 1

AGILE ROLAP - UMA METODOLOGIA ÁGIL PARA IMPLEMENTAÇÃO DE AMBIENTES DE NEGÓCIOS BASEADO EM SERVIDORES OLAP.

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO

Laudon K., Laudon J., Sistemas de Informações gerencias, editora Pearson, Laudon K., Laudon J., Sistemas de Informação, editora LTC, 1999

Sistemas de Informação CEA460 - Gestão da Informação

SUMÁRIO 1. INTRODUÇÃO O QUE É DATA WAREHOUSE? O QUE DATA WAREHOUSE NÃO É IMPORTANTE SABER SOBRE DATA WAREHOUSE

MSc. Daniele Carvalho Oliveira

TI em Números Como identificar e mostrar o real valor da TI

Data Warehouse. Djenane Cristina Silveira dos Santos¹, Felipe Gomes do Prado¹, José Justino Neto¹, Márcia Taliene Alves de Paiva¹

ADMINISTRAÇÃO DOS RECURSOS DE DADOS

Governança de TI B Aula 02

Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence

Coletividade; Diferenciais; Informação; Dado; Informação; Conhecimento. Coletar informação; e Identificar as direções.

TECNOLOGIA DA INFORMAÇÃO - TI Elaborado e adaptado por: Prof.Mestra Rosimeire Ayres

Criação e uso da Inteligência e Governança do BI

Identificar as mudanças que acontecem na forma e no uso de apoio à decisão em empreendimentos de e-business. Identificar o papel e alternativas de

Dado: Fatos conhecidos que podem ser registrados e têm um significado implícito. Banco de Dados:

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO

Interatividade aliada a Análise de Negócios

Governança de TI Evolução e Conceitos de Gestão da TI. Raimir Holanda raimir@tce.ce.gov.br

Palavras-chave: On-line Analytical Processing, Data Warehouse, Web mining.

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5

UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado)

Gerenciamento de Serviços de TI ITIL v2 Módulo 1 Conceitos básicos

INTELIGÊNCIA COMPETITIVA. Transformando dados em decisões estratégicas

Conhecendo os usuários de um Sistema de Banco de Dados

Curso Plano de Continuidade de Negócios

Sistemas de Informação I

Transcrição:

Banco de Dados - Senado Exercícios OLAP - CESPE Material preparado: Prof. Marcio Vitorino

OLAP Material preparado: Prof. Marcio Vitorino

Soluções MOLAP promovem maior independência de fornecedores de SGBDs que soluções ROLAP. Em um esquema de dados multidimensional, a tabela de fatos, usualmente, contém uma chave primária composta por várias chaves estrangeiras e algumas colunas cujos tipos de dados são, usualmente, nominais, ao passo que as tabelas de dimensões, usualmente, contêm uma chave primária simples e algumas colunas cujos tipos de dados são, usualmente, escalares. O uso de tecnologias e de sistemas OLAP e datawarehouse é mais justificável no nível estratégico que no nível operacional. O uso de tecnologias e de sistemas OLTP é mais justificado no nível do conhecimento que no nível operacional.

a) Assim como no ciclo de vida de desenvolvimento de sistemas clássicos, o ciclo de vida de desenvolvimento do data warehouse é também baseado em requisitos. b) Quanto ao nível de granularidade dos dados do data warehouse, é correto afirmar que quanto maior for o nível de detalhe, mais alto será o nível de granularidade dos dados e maior será a possibilidade de o sistema responder a qualquer consulta. c) No datamining, o agrupamento e a classificação funcionam de maneira similar: o agrupamento reconhece os padrões que descrevem o grupo ao qual um item pertence, examinando os itens existentes; a classificação é aplicada quando nenhum grupo foi ainda definido. d) O processamento OLAP é mais flexível do que aquele que ocorre no nível estruturado organizacional do data warehouse.

A construção de um data warehouse envolve primordialmente um processo de extração, transformação e carga de dados, que normalmente tem origem nas bases de dados dos sistemas que estão ou estiveram em operação. O sucesso desse processo é fortemente influenciado pela escolha da ferramenta OLAP (on-line analytical processing) a ser utilizada. O esquema multidimensional em estrela consiste de um conjunto de tabelas, classificadas como tabelas fato e tabelas dimensão, no qual cada tabela dimensão guarda referências às tabelas fato. Essas referências são implementadas como colunas nas tabelas dimensão.

O data warehouse é uma coleção de dados orientada por assunto, integrado, volátil e variante no tempo, voltado para a análise de séries temporais e de tendências, a partir do processamento de dados históricos. Ferramentas do tipo OLAP são utilizadas para extrair dados e realizar análise ad hoc, na área de business intelligence. Elas permitem, entre outras operações, executar o drill down, que é o aumento da granularidade dos dados, o slice and dice, que permite executar operações de projeção nas dimensões, e o pivoteamento, que permite realizar rotação (tabulação transversal) do cubo. MOLAP é uma arquitetura OLAP na qual os dados ficam armazenados em um banco de dados multidimensional. Nas arquiteturas ROLAP e HOLAP, são utilizados bancos de dados relacionais para armazenamento dos dados. O snowflake, uma variação do esquema estrela, é um esquema multidimensional no qual as tabelas dimensionais, por meio da sua normalização, são organizadas em uma hierarquia, de modo que nem todas as dimensões sejam ligadas diretamente à tabela fato que armazena as medidas, usualmente numéricas.

A data mining apóia a descoberta de regras e padrões em grandes quantidades de dados. Em data mining, um possível foco é a descoberta de regras de associação. Para que uma associação seja de interesse, é necessário avaliar o seu suporte, que se refere à freqüência com a qual a regra ocorre no banco de dados. Os data warehouses são depósitos de dados tipicamente direcionados para aplicações de apoio às decisões administrativas. As informações em data warehouses mudam mais freqüentemente do que em bancos de dados convencionais. Além disso, os data warehouse, em vez de otimizar a recuperação de dados, otimizam o processamento de transações.

A figura apresenta os elementos básicos da arquitetura de um sistema de suporte a decisão que foi, de forma fictícia, implantado em uma organização de monitoramento, usando-se a tecnologia de SGBDs relacionais. Esse sistema atende ao objetivo de se aprimorarem a gestão e o uso de recursos de TI em mais de 3.000 órgãos públicos federais, não tendo sido consideradas as subunidades que compõem esses órgãos. O principal negócio dessa organização é o monitoramento e controle da governança de TI desses órgãos, por meio de: aplicação e análise de questionários com questões fechadas (objetivas) e abertas (subjetivas) que, disponíveis via web, abordem aspectos relacionados à governança de TI conforme o modelo COBIT; análise de informações oriundas de coletores de dados online sobre os níveis de serviços e o emprego de recursos de TI nas organizações; prestação de serviço online visando à orientação e à normatização de compras de bens e serviços de TI; auditorias regulares. Algumas das informações produzidas a cada dia pelos coletores de dados online de cada organização monitorada são: quantidade de computadores desktop em funcionamento dentro da rede; horas de disponibilidade de cada um dos serviços online prestados pela organização (sítio web, servidor de webmail, FTP, sistemas aplicativos, atendimento a usuários por meio de birô de serviços etc.); despesas e investimentos planejados (empenhados) e executados na aquisição de bens e serviços de TI registrados no sistema de administração financeira. Para bem planejar e desempenhar sua missão, a organização de monitoramento implementou um sistema de apoio à decisão, conforme a arquitetura esboçada na figura.

No cenário apresentado, a produção dos dados online de cada organização monitorada deverá ser efetuada por meio das ferramentas apresentadas nas camadas #B, #C e #D. A mineração de dados no sistema com a arquitetura acima, se aplicável a todo o conjunto de informações produzidas em decorrência das atividades da organização de monitoramento, contribuirá diretamente para o aprimoramento dos indicadores de desempenho das organizações monitoradas. Os dados de controle de processamento da camada #B serão acessíveis a poucos funcionários servidores da organização de monitoramento e controle. A fim de agilizar o processo de extração, transformação e carga dos dados operacionais, estes devem ser armazenados de forma denormalizada na camada #B. Se, visando à criação de uma datamart cujo objetivo é analisar o processo de disponibilidade de serviços online prestados pelas organizações monitoradas, criar-se uma tabela de fatos que representa a quantidade de horas de disponibilidade diária de cada serviço provido por cada órgão, nesse caso, será correto afirmar que, nessa datamart, em vez do uso de um esquema do tipo floco de neve ( snow flake ), será viável o uso de um esquema do tipo estrela, e as dimensões poderão ser: tipo de serviço; órgão prestador do serviço; data em que o serviço foi disponibilizado. Na tabela fatos dessa datamart, uma das colunas deverá conter o quantitativo de horas de disponibilidade. Tendo em vista a criação, na arquitetura proposta, de um conjunto de datamarts integradas, deve-se sugerir o compartilhamento das tabelas de dimensões entre as tabelas de fatos, de modo que cada tabela de fatos possua a mesma quantidade de dimensões comuns.

Material preparado: Prof. Marcio Vitorino Gabarito

E E C E Soluções MOLAP promovem maior independência de fornecedores de SGBDs que soluções ROLAP. Em um esquema de dados multidimensional, a tabela de fatos, usualmente, contém uma chave primária composta por várias chaves estrangeiras e algumas colunas cujos tipos de dados são, usualmente, nominais, ao passo que as tabelas de dimensões, usualmente, contêm uma chave primária simples e algumas colunas cujos tipos de dados são, usualmente, escalares. O uso de tecnologias e de sistemas OLAP e datawarehouse é mais justificável no nível estratégico que no nível operacional. O uso de tecnologias e de sistemas OLTP é mais justificado no nível do conhecimento que no nível operacional.

a) E Assim como no ciclo de vida de desenvolvimento de sistemas clássicos, o ciclo de vida de desenvolvimento do data warehouse é também baseado em requisitos. b) E Quanto ao nível de granularidade dos dados do data warehouse, é correto afirmar que quanto maior for o nível de detalhe, mais alto será o nível de granularidade dos dados e maior será a possibilidade de o sistema responder a qualquer consulta. c) E No datamining, o agrupamento e a classificação funcionam de maneira similar: o agrupamento reconhece os padrões que descrevem o grupo ao qual um item pertence, examinando os itens existentes; a classificação é aplicada quando nenhum grupo foi ainda definido. d) C O processamento OLAP é mais flexível do que aquele que ocorre no nível estruturado organizacional do data warehouse.

E E A construção de um data warehouse envolve primordialmente um processo de extração, transformação e carga de dados, que normalmente tem origem nas bases de dados dos sistemas que estão ou estiveram em operação. O sucesso desse processo é fortemente influenciado pela escolha da ferramenta OLAP (on-line analytical processing) a ser utilizada. O esquema multidimensional em estrela consiste de um conjunto de tabelas, classificadas como tabelas fato e tabelas dimensão, no qual cada tabela dimensão guarda referências às tabelas fato. Essas referências são implementadas como colunas nas tabelas dimensão.

E E C C O data warehouse é uma coleção de dados orientada por assunto, integrado, volátil e variante no tempo, voltado para a análise de séries temporais e de tendências, a partir do processamento de dados históricos. Ferramentas do tipo OLAP são utilizadas para extrair dados e realizar análise ad hoc, na área de business intelligence. Elas permitem, entre outras operações, executar o drill down, que é o aumento da granularidade dos dados, o slice and dice, que permite executar operações de projeção nas dimensões, e o pivoteamento, que permite realizar rotação (tabulação transversal) do cubo. MOLAP é uma arquitetura OLAP na qual os dados ficam armazenados em um banco de dados multidimensional. Nas arquiteturas ROLAP e HOLAP, são utilizados bancos de dados relacionais para armazenamento dos dados. O snowflake, uma variação do esquema estrela, é um esquema multidimensional no qual as tabelas dimensionais, por meio da sua normalização, são organizadas em uma hierarquia, de modo que nem todas as dimensões sejam ligadas diretamente à tabela fato que armazena as medidas, usualmente numéricas.

C E A data mining apóia a descoberta de regras e padrões em grandes quantidades de dados. Em data mining, um possível foco é a descoberta de regras de associação. Para que uma associação seja de interesse, é necessário avaliar o seu suporte, que se refere à freqüência com a qual a regra ocorre no banco de dados. Os data warehouses são depósitos de dados tipicamente direcionados para aplicações de apoio às decisões administrativas. As informações em data warehouses mudam mais freqüentemente do que em bancos de dados convencionais. Além disso, os data warehouse, em vez de otimizar a recuperação de dados, otimizam o processamento de transações.

A figura apresenta os elementos básicos da arquitetura de um sistema de suporte a decisão que foi, de forma fictícia, implantado em uma organização de monitoramento, usando-se a tecnologia de SGBDs relacionais. Esse sistema atende ao objetivo de se aprimorarem a gestão e o uso de recursos de TI em mais de 3.000 órgãos públicos federais, não tendo sido consideradas as subunidades que compõem esses órgãos. O principal negócio dessa organização é o monitoramento e controle da governança de TI desses órgãos, por meio de: aplicação e análise de questionários com questões fechadas (objetivas) e abertas (subjetivas) que, disponíveis via web, abordem aspectos relacionados à governança de TI conforme o modelo COBIT; análise de informações oriundas de coletores de dados online sobre os níveis de serviços e o emprego de recursos de TI nas organizações; prestação de serviço online visando à orientação e à normatização de compras de bens e serviços de TI; auditorias regulares. Algumas das informações produzidas a cada dia pelos coletores de dados online de cada organização monitorada são: quantidade de computadores desktop em funcionamento dentro da rede; horas de disponibilidade de cada um dos serviços online prestados pela organização (sítio web, servidor de webmail, FTP, sistemas aplicativos, atendimento a usuários por meio de birô de serviços etc.); despesas e investimentos planejados (empenhados) e executados na aquisição de bens e serviços de TI registrados no sistema de administração financeira. Para bem planejar e desempenhar sua missão, a organização de monitoramento implementou um sistema de apoio à decisão, conforme a arquitetura esboçada na figura.

E E C C E No cenário apresentado, a produção dos dados online de cada organização monitorada deverá ser efetuada por meio das ferramentas apresentadas nas camadas #B, #C e #D. A mineração de dados no sistema com a arquitetura acima, se aplicável a todo o conjunto de informações produzidas em decorrência das atividades da organização de monitoramento, contribuirá diretamente para o aprimoramento dos indicadores de desempenho das organizações monitoradas. Os dados de controle de processamento da camada #B serão acessíveis a poucos funcionários servidores da organização de monitoramento e controle. A fim de agilizar o processo de extração, transformação e carga dos dados operacionais, estes devem ser armazenados de forma denormalizada na camada #B. Se, visando à criação de uma datamart cujo objetivo é analisar o processo de disponibilidade de serviços online prestados pelas organizações monitoradas, criar-se uma tabela de fatos que representa a quantidade de horas de disponibilidade diária de cada serviço provido por cada órgão, nesse caso, será correto afirmar que, nessa datamart, em vez do uso de um esquema do tipo floco de neve ( snow flake ), será viável o uso de um esquema do tipo estrela, e as dimensões poderão ser: tipo de serviço; órgão prestador do serviço; data em que o serviço foi disponibilizado. Na tabela fatos dessa datamart, uma das colunas deverá conter o quantitativo de horas de disponibilidade. Tendo em vista a criação, na arquitetura proposta, de um conjunto de datamarts integradas, deve-se sugerir o compartilhamento das tabelas de dimensões entre as tabelas de fatos, de modo que cada tabela de fatos possua a mesma quantidade de dimensões comuns.