Uma Arquitetura de Gestão de Dados em Ambiente Data Warehouse



Documentos relacionados
DATA WAREHOUSE. Introdução

DATA WAREHOUSE NO APOIO À TOMADA DE DECISÕES

Data Warehousing. Leonardo da Silva Leandro. CIn.ufpe.br

CONSIDERAÇÕES SOBRE ATIVIDADES DE IDENTIFICAÇÃO, LOCALIZAÇÃO E TRATAMENTO DE DADOS NA CONSTRUÇÃO DE UM DATA WAREHOUSE

O Que é Data Warehouse

Data Warehouse. Debora Marrach Renata Miwa Tsuruda

Hoje é inegável que a sobrevivência das organizações depende de dados precisos e atualizados.

Disciplina de Banco de Dados Introdução

Módulo 4: Gerenciamento de Dados

Conceitos de Banco de Dados

TOTVS BA Guia de Customização Linha Logix

Interatividade aliada a Análise de Negócios

Data Warehouse Processos e Arquitetura

Uma análise de ferramentas de modelagem e gerência de metadados aplicadas ao projeto de BI/DW-UFBA

Planejamento Estratégico de TI. Prof.: Fernando Ascani

MBA Inteligência Competitiva Com ênfase em BI/CPM. Metadados

RESUMO DA SOLUÇÃO CA ERwin Modeling. Como eu posso gerenciar a complexidade dos dados e aumentar a agilidade dos negócios?

SISTEMA GERENCIADOR DE BANCO DE DADOS

DATA WAREHOUSE. Rafael Ervin Hass Raphael Laércio Zago

Banco de Dados. Introdução. João Eduardo Ferreira Osvaldo Kotaro Takai. DCC-IME-USP

Universidade Federal de Santa Maria Curso de Arquivologia. Disciplina de Banco de Dados Aplicados à Arquivística. Versao 1.

Palavras-chave: On-line Analytical Processing, Data Warehouse, Web mining.

SAD orientado a DADOS

Checklist de Projeto de Data Warehouse

Data Warehouse. Diogo Matos da Silva 1. Universidade Federal de Ouro Preto, Ouro Preto, MG, Brasil. Banco de Dados II

Desenvolvimento de aplicação web com framework JavaServer Faces e Hibernate

Banco de Dados - Senado

Automação de Locais Distantes

UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado)

Módulo 4. Construindo uma solução OLAP

ATIVIDADES PRÁTICAS SUPERVISIONADAS

Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence

Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados

Projeto Disciplinar de Infra-Estrutura de Software SISPA FACULDADE SENAC

PLANO DE ENSINO PRÉ-REQUISITOS: ENS

IMPLANTAÇÃO DO DW NA ANVISA

Dado: Fatos conhecidos que podem ser registrados e têm um significado implícito. Banco de Dados:

5 Estudo de Caso Material selecionado para o estudo de caso

Roteiro. BCC321 - Banco de Dados I. Conceitos Básicos. Conceitos Básicos. O que é um banco de dados (BD)?

Banco de Dados. Uma coleção de dados relacionados [ELMASRI/NAVATHE]

ADMINISTRAÇÃO DOS RECURSOS DE DADOS

Banco de Dados I. Apresentação (mini-currículo) Conceitos. Disciplina Banco de Dados. Cont... Cont... Edson Thizon


UNIVERSIDADE FEDERAL DO PARANÁ UFPR Bacharelado em Ciência da Computação

Sistema de Informação Gerencial baseado em Data Warehouse aplicado a uma software house

Gerenciamento de Dados e Gestão do Conhecimento

Modelagemde Software Orientadaa Objetos com UML

Gestão da Qualidade por Processos

Curso Data warehouse e Business Intelligence

Glossário Apresenta a definição dos termos, siglas e abreviações utilizadas no contexto do projeto Citsmart.

FACULDADE INTEGRADAS DE PARANAÍBA ADMINISTRAÇÃO DE EMPRESAS. Bancos de Dados Conceitos Fundamentais

DESENVOLVENDO APLICAÇÃO UTILIZANDO JAVA SERVER FACES

Curso Data warehouse e Business Intelligence Fundamentos, Metodologia e Arquitetura

04/08/2012 MODELAGEM DE DADOS. PROF. RAFAEL DIAS RIBEIRO, MODELAGEM DE DADOS. Aula 1. Prof. Rafael Dias Ribeiro. M.Sc.

Capítulo 2 Data Warehousing

Uma Ferramenta Web para BI focada no Gestor de Informação

Para construção dos modelos físicos, será estudado o modelo Relacional como originalmente proposto por Codd.

No mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o

Programação com acesso a BD. Prof.: Clayton Maciel Costa clayton.maciel@ifrn.edu.br

Inteligência Empresarial. BI Business Intelligence. Business Intelligence 22/2/2011. Prof. Luiz A. Nascimento

XDOC. Solução otimizada para armazenamento e recuperação de documentos

Introdução à Banco de Dados. Definição

TECNOLOGIA DA INFORMAÇÃO - TI Elaborado e adaptado por: Prof.Mestra Rosimeire Ayres

Introdução ao GED Simone de Abreu

Prof. Marcelo Machado Cunha

As principais características da abordagem de um banco de dados versus a abordagem de processamento de arquivos são as seguintes:

ADMINISTRAÇÃO DOS RECURSOS DE DADOS

ACADEMIA DE BW (BUSINESS WAREHOUSE)

Sistemas Integrados de Gestão Empresarial

É importante que nos atenhamos a alguns aspectos importantes sobre banco de dados:

Virtualização de Sistemas Operacionais

FACULDADE DE ENGENHARIA DE COMPUTAÇÃO. PROJETO FINAL I e II PLANO DE TRABALHO <NOME DO TRABALHO> <Nome do Aluno> <Nome do Orientador>

UNIVERSIDADE FEDERAL DO PARANÁ UFPR Bacharelado em Ciência da Computação

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan

AUTOR(ES): IANKSAN SILVA PEREIRA, ALINE GRAZIELE CARDOSO FEITOSA, DANIELE TAMIE HAYASAKA, GABRIELA LOPES COELHO, MARIA LETICIA VIEIRA DE SOUSA

Prof. Antonio Almeida de Barros Jr. Prof. Antonio Almeida de Barros Junior

ADMINISTRAÇÃO DE ATIVOS DE TI GERENCIAMENTO DE CONFIGURAÇÃO

Itinerários de Ônibus Relatório Final

Capacidade = 512 x 300 x x 2 x 5 = ,72 GB

ADM041 / EPR806 Sistemas de Informação

Engenharia de Software. Parte I. Introdução. Metodologias para o Desenvolvimento de Sistemas DAS

ISO/IEC 12207: Gerência de Configuração

AUTOR: DAVID DE MIRANDA RODRIGUES CONTATO: CURSO FIC DE PROGRAMADOR WEB VERSÃO: 1.0

Business Intelligence aplicado a área da saúde: potencializando a tomada de decisão

Evolução. Tópicos. Bancos de Dados - Introdução. Melissa Lemos. Evolução dos Sistemas de Informação Esquemas Modelos. Características de SGBDs

Adriano Maranhão BUSINESS INTELLIGENCE (BI),

agility made possible

UNIVERSIDADE FEDERAL DE SANTA MARIA CENTRO DE TECNOLOGIA AULA 14 PROFª BRUNO CALEGARO

5 Framework para coordenação e mediação de Web Services para ambientes de aprendizado à distância

Bancos de Dados. Conceitos F undamentais em S is temas de B ancos de Dados e s uas Aplicações

Modelos. Comunicação com clientes

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5

Casos de Sucesso. Cliente. Deloitte Touche Tohmatsu Consultores LTDA

Hardware (Nível 0) Organização. Interface de Máquina (IM) Interface Interna de Microprogramação (IIMP)

MC536 Bancos de Dados: Teoria e Prática

CRM - Customer Relationship Management

Noções de. Microsoft SQL Server. Microsoft SQL Server

Tecnologia para garantir qualidade e eficiência

Transcrição:

Uma Arquitetura de Gestão de Dados em Ambiente Data Warehouse Alcione Benacchio (UFPR) E mail: alcione@inf.ufpr.br Maria Salete Marcon Gomes Vaz (UEPG, UFPR) E mail: salete@uepg.br Resumo: O ambiente de data warehouse envolve uma coleção de tecnologias, objetivando o auxílio à administração dos dados e aos processos de tomada de decisão. Este artigo apresenta uma arquitetura para gestão de dados descentralizados, levando em consideração um ambiente de data warehouse. Com essa arquitetura os problemas de integração de dados, processos de auditoria e descentralização dos dados são minimizados, pois todos os dados são tratados, organizados e otimizados em uma estrutura de data warehouse. Palavr as chave: Gestão de dados, Data Warehouse, OLAP. 1. Intr odução A atividade de armazenamento, pesquisa e recuperação de dados para tomada de decisão envolvem o desenvolvimento, a priori, da extração, tratamento e integração de dados, a fim de facilitar a reutilização, minimizar problemas de inconsistência e simplificar e diminuir o tempo de tomada de decisão. Existem organizações que possuem seus dados descentralizados, organizados e estruturados de formas diferentes, processados por sistemas diferentes, implicando em difícil integração entre os diversos sistemas e dados. Esses dados precisam ser extraídos, tratados e organizados a fim de ajudar na tomada de decisão (SINGH, 2001). Um repositório integra todos os dados dos sistemas utilizados pela organização, facilita a indexação e a recuperação de dados comuns entre sistemas distintos (BERTINO, 2001; DATE, 2003; SILBERCHATZ, 2006). O objetivo deste artigo é apresentar uma arquitetura com os processos de recuperação dos dados manipulados pelos diversos sistemas e o processo de tratamento e armazenamento desses dados numa estrutura em um ambiente de data warehouse. Para tanto este artigo está estruturado como segue. Na Seção 2 são descritas algumas definições inerentes ao ambiente de data warehouse. Na Seção 3 é apresentada a arquitetura para gestão de dados descentralizados, de folha de pagamento, em ambiente data warehouse. E finalmente, a última seção apresenta as considerações finais deste trabalho. 2. Ambiente de Data Warehouse Com o avanço dos negócios, não basta apenas ter a informação em mãos. É necessário processá la e interpretá la de modo correto, para obter um resultado satisfatório ao utilizá la. Muitas empresas possuem vários sistemas espalhados em várias cidades. Cada sistema manipula dados de modos diferentes. Para a união dos bancos de dados desses sistemas foi desenvolvido um Data Warehouse. O Data Warehouse (BARQUIM, 1997; CHAUDHURI, 1997; COREY, 2001) é um banco de dados que possui uma quantidade de dados muito grande que contribui para o sistema de suporte a decisão da empresa. Esse grande banco de dados se baseia nos banco de dados dos vários sistemas da empresa. Ele é responsável por armazenar as informações de maneira a interpretar os dados conforme um determinado padrão.

Formalmente, um data warehouse é uma coleção de dados orientada por assuntos, integrada, variante no tempo, e não volátil, que tem por objetivo dar suporte aos processos de tomada de decisão (KIMBALL, 2002). O data warehouse cria uma visualização única de dados que residem em diversos bancos de dados físicos. Mas antes que o data warehouse possa ser acessado, com eficiência, é necessário entender quais dados estão disponíveis e onde estão localizados. Os metadados fornecem um catálogo dos dados do data warehouse e ponteiros para esses dados. A Ferramenta OLAP (COREY, 2001; GONÇALVES, 2003) entra com o papel de proporcionar uma solução ao problema de síntese, análise e consolidação de dados. Com o auxilio da ferramenta OLAP o usuário consegue obter as informações desejadas mais facilmente, dentre os dados armazenados. Desenvolver um data warehouse para uma empresa é um tanto complexo. Deve se analisar a arquitetura adequada e a ferramenta que melhor atende às necessidades e expectativas do projeto. Os dados estão por toda à parte. A maioria das organizações não sofre de falta de dados, mas sim de uma abundância de dados redundantes e inconsistentes, difíceis de administrar com eficiência, cada vez mais difíceis de acessar e difíceis de usar para fins de suporte à decisão. Não existem metodologias formais para a implementação de um data warehouse, então há uma busca por ferramentas que se adaptem melhor as características e às expectativas de cada empresa. Na seção seguinte é apresentada uma arquitetura para a gestão de folha de pagamento, que possui sistemas processando dados oriundos de várias fontes, com ferramentas de processamento distintas e com estruturas de armazenamento distintas. 3. Ar quitetura para Gestão de Folha de Pagamento Descentr alizada Com o objetivo de otimizar o fluxo dos processos, durante a realização de auditorias capazes de detectar irregularidades e verificar legalidade das vantagens remuneratórias existentes em uma folha de pagamento descentralizada, propõem se a utilização de um ambiente de Data Warehouse. Nesse contexto, uma empresa com sistemas de informação não padronizados para execução da folha de pagamento, com sistemas processados por diversos órgãos, não permitindo cruzamento de dados dos diversos sistemas, gerando como conseqüência, atrasos e burocratizações no fluxo dos processos organizacionais. Assim, foi construída uma estrutura com todas as informações dos funcionários e das folhas de pagamento processadas, dos diversos órgãos. Em seguida, um mapeamento de cada informação de cada sistema é processado. No mapeamento estão compreendidas todas as regras de transformação necessárias a cada informação. Por exemplo, o sexo tem valor definido como M, F ou I na estrutura origem e valor 0, 1 ou 2 na estrutura destino. Dessa forma o mapeamento desse atributo deve realizar todas as transformações necessárias nas informações de origem para enquadramento na informação destino. Na Figura 1 é apresentada uma arquitetura para solução do problema, bem como uma descrição das características e ações implícitas em cada fase. A fase de extração é responsável por fazer este mapeamento entre dados de origem e dados do Data Warehouse. Este mapeamento é feito através de metadados que descrevem a contextualização das informações.

Figura 1: Fases para Solução do Problema Na solução proposta é definido um extrator para A, B, C e D. Na Estrutura A são os dados de aproximadamente 80% da folha de pagamento, processada por uma empresa de consultoria. Na Estrutura B estão 35 mil funcionários, onde seus dados são processados por seus respectivos órgãos de lotação. Na Estrutura B envolve dados de outros órgãos. Após a análise de cada uma, foi definido um mapeamento das entidades e atributos utilizados na coleta dos dados. Para entidade D foi criada uma interface para o recebimento dos dados obtidos por meios magnéticos. Cada organização que entrega os dados, utilizando esse meio, necessita de um extrator intermediário entre os dados e a entidade D. Isso torna o recebimento flexível quanto ao formato e a variedade de dados que são manipulados, garantindo a integridade dos mapeamentos, regras de transformação e carregamento dos dados. Na fase de transformação são aplicadas regras que determinam padronização e homogeneização dos dados que são armazenados no data warehouse. Essas transformações convertem valores diferentes, mas que possuam o mesmo significado para um valor único que poderá então ser utilizado na mineração dos dados. Por exemplo, em um sistema o atributo sexo é armazenado como 0 para Masculino e 1 para Feminino, enquanto em outro sistema o dado está escrito por extenso Masculino e Feminino. Na fase de Transformação esse será convertido em M e 1 para Masculino e 0 e F para Feminino, atendendo dessa forma o domínio de valores para este atributo. Assim, como na fase de extração, nesta fase os metadados têm

um papel importante, sendo responsável pelo armazenamento das regras de transformação e domínio de valores de atributos. Após os dados terem sido coletados e padronizados eles estão prontos para serem carregados no data warehouse. Essa fase é executada pela camada de carregamento, que é responsável por definir como será feita à atualização. Essa pode ser incremental ou completa. Na forma incremental, são os dados como Vendas, Compras e Folha de Pagamento. Já na forma completa, entidades que não possuem controle de atualização. Na seqüência, o Data Warehouse é onde todos os dados que foram extraídos, transformados e carregados estão armazenados. A partir a armazenamento, podem ser executadas rotinas que identificam duplicidade entre registros, determinam quais as pessoas que estão alocadas em organizações distintas e recebendo vencimentos indevidos. Um Data Mart para a folha de pagamento é criado. É o ponto de acesso a um universo de domínio, ou seja, de um determinado assunto. Ele possui um nível de sumarização mais detalhado como, por exemplo, a folha de pagamento do mês, ou as vendas de determinado mês ou ano. Nesse caso, contempla o contexto permitindo simulações necessárias envolvendo os órgãos que fazem parte da folha de pagamento. O Cubo de dados é uma estrutura de dados multidimensional que apresenta a forma como as informações se relacionam. É composto por uma tabela de fatos e por tabelas de dimensões que representam as formas de consulta e visualização dos dados. Neste contexto o cubo é utilizado para cruzar as informações entre as organizações, auxiliando a busca por irregularidades na folha de pagamento. A ferramenta OLAP, processamento analítico em tempo real, compreende uma categoria de programas que proporcionam ao usuário que a utiliza, a capacidade de realizar análises sobre os dados armazenados em um data warehouse. Esta ferramenta torna possível a análise de várias dimensões sobre dados dimensionais. Nesse contexto, a ferramenta cliente OLAP pode ser um navegador Web ou uma aplicação Desktop. Independente do tipo de cliente, o componente essencial do OLAP é o servidor OLAP, o qual situa se entre o cliente e o sistema gerenciador de banco de dados (SGBD). O servidor OLAP compreende como o dado é organizado e possui funções especiais para analisá lo. Uma vez que os Cubos e Data Marts estejam construídos, a ferramenta OLAP pode ser utilizada para construir os mais diversos relatórios. Estes relatórios são extremamente personalizáveis ao ponto de tornar possível a construção de simulações, como aumento de percentuais dos vencimentos dos funcionários, uma vez que estas ferramentas permitem a criação de fórmulas sobre os dados projetados. 4. Considerações Finais As informações descentralizadas trazem diversos problemas às organizações, tal como a impossibilidade de obtenção de dados confiáveis e precisos. A solução proposta neste artigo, teve como objetivo principal solucionar problemas existentes em organizações como despadronização dos dados, burocracia e lentidão nos processos de negócios. Através da implantação de um sistema de apoio a decisão utilizando à tecnologia de data warehouse foi possível demonstrar grandes vantagens que facilitam a tomada de decisão por

parte dos gerentes e administradores. A implantação de um ambiente de data warehouse padroniza os dados, otimiza os processos e possibilita a construção de vários tipos de relatórios gerenciais, bem como otimização geral dos processos de negócio. Referências BARQUIM, R. C; EDELSTEIN, H. A. Building, Using, and Managing the Data Warehouse. Pretince Hall, 1997. BERTINO, E; CATANIA, B.; ZARRI, G. P. Intelligent Database Systems. Addison Wesley, 2001. CHAUDHURI, SURAJIT E DAYALI, UMESHWAR. An Overview of Data Warehousing and OLAP Technology. Proc. of ACM SIGMOD Records, Mar. 1997. COREY, M.; ABBEY, M; ABRAMSON, I.; TAUB, B. Oracle 8i Data Warehouse. Rio de Janeiro: Campus, 2001. DATE, C. J. Introdução a Sistemas de Bancos de Dados. Tradução da 8 a. Edição Americana. Rio de Janeiro: Elsevier, 2003. GONÇALVES, M. Extração de Dados para Data Warehouse. Rio de Janeiro: Axcel Books, 2003. KIMBALL, ROSS. The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling (Second Edition), Wiley, 2002. SILBERCHATZ, K.; KORTH, H. F.; SUDARSHAN, S. Sistema de Bancos de Dados. Tradução da 5º edição. Editora Makron Books do Brasil. São Paulo SP, 2006. SINGH, H. S. Data Warehouse: Conceitos, Tecnologias, Implementação e Gerenciamento. São Paulo: Makron Books, 2001.