ARTIGO O CONCEITO DE DATAWAREHOUSING APLICADO À GESTÃO DE INFORMAÇÕES EM BIBLIOTECAS



Documentos relacionados
DATA WAREHOUSE. Introdução

Data Warehousing. Leonardo da Silva Leandro. CIn.ufpe.br

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Módulo 4: Gerenciamento de Dados

Data Warehouse. Diogo Matos da Silva 1. Universidade Federal de Ouro Preto, Ouro Preto, MG, Brasil. Banco de Dados II

Sistema. Atividades. Sistema de informações. Tipos de sistemas de informação. Everson Santos Araujo

PLANO DE ENSINO PRÉ-REQUISITOS: ENS

Adriano Maranhão BUSINESS INTELLIGENCE (BI),

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Prof. JUBRAN. Aula 1 - Conceitos Básicos de Sistemas de Informação

04/08/2012 MODELAGEM DE DADOS. PROF. RAFAEL DIAS RIBEIRO, MODELAGEM DE DADOS. Aula 1. Prof. Rafael Dias Ribeiro. M.Sc.


Conceitos de Banco de Dados

Sistemas de Informação Gerenciais (SIG)

UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado)

Material de Apoio. Sistema de Informação Gerencial (SIG)

FATEC Cruzeiro José da Silva. Ferramenta CRM como estratégia de negócios

Data Warehouse. Debora Marrach Renata Miwa Tsuruda

Sistema de Informação Gerencial baseado em Data Warehouse aplicado a uma software house

Tópicos Avançados Business Intelligence. Banco de Dados Prof. Otacílio José Pereira. Unidade 10 Tópicos Avançados Business Inteligence.

Classificação dos Sistemas de Informação

INSTRUÇÃO DE TRABALHO PARA INFORMAÇÕES GERENCIAIS

Sistemas de Informação I

DATA WAREHOUSE. Rafael Ervin Hass Raphael Laércio Zago

Para construção dos modelos físicos, será estudado o modelo Relacional como originalmente proposto por Codd.

Identificar as mudanças que acontecem na forma e no uso de apoio à decisão em empreendimentos de e-business. Identificar o papel e alternativas de

Uma análise de ferramentas de modelagem e gerência de metadados aplicadas ao projeto de BI/DW-UFBA

A IMPORTÂNCIA DO SISTEMA DE INFORMAÇÃO GERENCIAL PARA AS EMPRESAS

SAD orientado a DADOS

Projeto Disciplinar de Infra-Estrutura de Software SILC - SISTEMA DE LOCAÇÃO E CONTROLE

Universidade Federal de Goiás UFG Campus Catalão CAC Departamento de Engenharia de Produção. Sistemas ERP. PCP 3 - Professor Muris Lage Junior

MINISTÉRIO DA EDUCAÇÃO FUNDO NACIONAL DE DESENVOLVIMENTO DA EDUCAÇÃO TERMO DE REFERÊNCIA PARA CONTRATAÇÃO DE PESSOA FÍSICA - CONSULTOR POR PRODUTO

4 Metodologia da Pesquisa

REVIE Rede de Melhores Práticas para MKT e Vendas

DATA WAREHOUSE NO APOIO À TOMADA DE DECISÕES

Complemento I - Noções Introdutórias em Data Warehouses

ADMINISTRAÇÃO DE ATIVOS DE TI GERENCIAMENTO DE CONFIGURAÇÃO

MBA Inteligência Competitiva Com ênfase em BI/CPM. Metadados

PLANEJAMENTO OPERACIONAL - MARKETING E PRODUÇÃO MÓDULO 3 O QUE É PLANEJAMENTO DE VENDAS E OPERAÇÕES?

Laudon & Laudon Essentials of MIS, 5th Edition. Pg. 1.1

GESTÃO DAS INFORMAÇÕES DAS ORGANIZAÇÕES MÓDULO 11

A Grande Importância da Mineração de Dados nas Organizações

UNIDADE 4. Introdução à Metodologia de Desenvolvimento de Sistemas

PROCESSO DE DESENVOLVIMENTO DE SOFTWARE. Modelos de Processo de Desenvolvimento de Software

Gestão do Conhecimento A Chave para o Sucesso Empresarial. José Renato Sátiro Santiago Jr.

O propósito deste trabalho foi o de apresentar os programas de. catalogação cooperativa, centralizada e catalogação-na-publicação, os quais,

Checklist de Projeto de Data Warehouse

ESCRITÓRIO MODELO DA FACULDADE DO GUARUJÁ.

5 Estudo de Caso Material selecionado para o estudo de caso

FTAD Formação Técnica em Administração. Aula 04 Prof. Arlindo Neto

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO

Instituto de Educação Tecnológica Pós-graduação Gestão em Tecnologia da Informação - Turma nº 25 08/04/2015. Computação em Nuvem

Programa de Excelência em Atendimento aos Clientes

UNIVERSIDADE FEDERAL DE SANTA CATARINA CENTRO DE CIÊNCIAS DA EDUCAÇÃO CURSO DE GRADUAÇÃO EM BIBLIOTECONOMIA

Módulo 15 Resumo. Módulo I Cultura da Informação

CRM - Customer Relationship Management

FACULDADE DE ENGENHARIA DE COMPUTAÇÃO. PROJETO FINAL I e II PLANO DE TRABALHO <NOME DO TRABALHO> <Nome do Aluno> <Nome do Orientador>

A importância da. nas Organizações de Saúde

ANALISANDO O INVESTIMENTO EM TECNOLOGIA

Banco de Dados - Senado

ATIVIDADES PRÁTICAS SUPERVISIONADAS

MATERIAL DIDÁTICO: APLICAÇÕES EMPRESARIAIS SISTEMA DE APOIO À DECISÃO (SAD)

FACULDADE KENNEDY BACHARELADO EM SISTEMAS DE INFORMAÇÃO

Apresentação, xix Prefácio à 8a edição, xxi Prefácio à 1a edição, xxiii. Parte I - Empresa e Sistemas, 1

Thalita Moraes PPGI Novembro 2007

O Que é Data Warehouse

Interatividade aliada a Análise de Negócios

Programa do Curso de Pós-Graduação Lato Sensu MBA em Engenharia de Software Orientada a Serviços (SOA)

ESCOLA PAULISTA DE NEGOCIOS DISCIPLINA: ESTRATÉGIA E PLANEJAMENTO CORPORATIVO PROFESSOR: CLAUDEMIR DUCA VASCONCELOS ALUNOS: BRUNO ROSA VIVIANE DINIZ

CENTRO DE ENSINO SUPERIOR DO AMAPÁ

Forneça a próxima onda de inovações empresariais com o Open Network Environment

TÍTULO: IMPLEMENTAÇÃO DE UM SISTEMA DE CONTROLE PATRIMONIAL (SCP) PARA O CORPO DE BOMBEIRO DE MATO GROSSO DO SUL(MS)

EXPERIÊNCIA DE USO DE ARQUITETURA CORPORATIVA NO PROJETO DE RES

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

Introdução ao GED Simone de Abreu

POLÍTICA DE FORMAÇÃO E DESENVOLVIMENTO DE COLEÇÕES DA BIBLIOTECA PROFESSOR PINTO FERREIRA 1

Inteligência Organizacional, Inteligência Empresarial, Inteligência Competitiva, Infra-estrutura de BI mas qual é a diferença?

Sistemas Integrados de Gestão Empresarial

04/08/2012 MODELAGEM DE DADOS. PROF. RAFAEL DIAS RIBEIRO, MODELAGEM DE DADOS. Aula 2. Prof. Rafael Dias Ribeiro. M.Sc.

Referências internas são os artefatos usados para ajudar na elaboração do PT tais como:

OBSERVATÓRIO DE GESTÃO DA INFORMAÇÃO. Palavras-chave: Gestão da Informação. Gestão do conhecimento. OGI. Google alertas. Biblioteconomia.

Definition of a Measurement Guide for Data Warehouse Projects

Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence

Existem três categorias básicas de processos empresariais:

FURB - Universidade Regional de Blumenau TCC - Trabalho de Conclusão de Curso Acadêmico: Fernando Antonio de Lima Orientador: Oscar Dalfovo

SISTEMAS DE GESTÃO São Paulo, Janeiro de 2005

No mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o

CURSO DE GRADUAÇÃO PRESENCIAL SISTEMAS DE INFORMAÇÃO

softwares que cumprem a função de mediar o ensino a distância veiculado através da internet ou espaço virtual. PEREIRA (2007)

ERP. Enterprise Resource Planning. Planejamento de recursos empresariais

Governança Corporativa. A importância da Governança de TI e Segurança da Informação na estratégia empresarial.

Palavras-chave: On-line Analytical Processing, Data Warehouse, Web mining.

REQUISITOS PARA A CRIAÇÃO DE CURSOS NOVOS MESTRADO PROFISSIONAL

Uma Arquitetura de Gestão de Dados em Ambiente Data Warehouse

AGENDA. O Portal Corporativo. Arquitetura da Informação. Metodologia de Levantamento. Instrumentos Utilizados. Ferramentas

Projeto Disciplinar de Infra-Estrutura de Software SISPA FACULDADE SENAC

Gestão de Relacionamento com o Cliente CRM

ISO/IEC 12207: Gerência de Configuração

Transcrição:

O CONCEITO DE DATAWAREHOUSING APLICADO À GESTÃO DE INFORMAÇÕES EM BIBLIOTECAS Maurício Ferreira Santana Resumo: Propõe que a arquitetura de data warehouse seja um referencial para implantação em bibliotecas. Esta proposta tem origem na preocupação com o grande volume de informações existente nesses setores, em nível operacional, gerencial e estratégico, e com uma forma efetiva de geração de informações históricas de acervo, clientes (usuários) e custos para o processo decisório. Através de revisão bibliográfica sobre a arquitetura de data warehouse, apresenta-se a arquitetura proposta por Ralph Kimball, em esquema dimensional, tomando-se como exemplo o processo aquisição. Espera-se que bibliotecas possam se valer desta arquitetura para obter resultados analíticos similares aos de empresas que já lançam mão desta tecnologia. Palavras-chave: Data mart; Data warehouse; Bibliotecas; Gestão da informação; Processo de aquisição THE DATA WAREHOUSING CONCEPT APPLIED TO INFORMATION MANAGEMENT IN LIBRARIES Abstract: Propose the data warehouse architecture as a reference to be applied in libraries. This proposal has began with the concern about the large amount of information existing in these sectors, at the operational, managerial and strategic levels, and as an effective way to generate historical information of collection, customers (users) and costs, for decision making processes. Through literature review about data warehouse architecture, it is presented the architecture proposed by Ralph Kimball, in a dimensional scheme, taking as example the process of "acquisition". It is expected that libraries can use this architecture to obtain analytical results similar to those of companies that already make use of such technology. Keywords: Data mart; Data warehouse; Libraries; Information management; Acquisition process 114

1 INTRODUÇÃO As bibliotecas são os setores que centralizam o conhecimento em uma instituição. Neles estão agrupados os registros do conhecimento (empresarial, acadêmico) nos mais diversos suportes, entre eles livros, periódicos, bases de dados, documentos técnicos, CD- ROMS, fitas magnéticas, etc. As bibliotecas, ao fornecer o produto informação a uma clientela específica (professores, acadêmicos, comunidade, gerentes), devem preocuparse com o fluxo da informação, ou seja, como ela é adquirida, processada, selecionada, tratada, armazenada e como ela chega ao usuário / cliente final. Mas o problema é reunir o conjunto de informações históricas (ou seja, todos os dados do passado ), a fim de obter resultados analíticos. Por outro lado, os sistemas de informação compreendem bancos de dados que armazenam grandes quantidades de registros, podendo ser recuperados de maneira efetiva e gerando informações para o processo decisório. Uma opção de sistema de informação é o data warehouse ( armazém de dados ), que pode ser considerado um sistema com enorme capacidade de armazenamento de dados sobretudo históricos que, quando acessados, fornecem informações de suporte à decisão, usando ferramentas adequadas de business intelligence (inteligência de negócio). Não há relatos, na literatura, da aplicação em larga escala de sistemas de informação que facilitem a tomada de decisão, em âmbito gerencial e estratégico, sobre acervos, recursos financeiros e clientes em bibliotecas (ao contrário de grandes corporações, que já lançam mão desta tecnologia). O data warehouse - e em escala menor o data mart ( mercado de dados ), que abrange um setor de uma determinada unidade de negócio, mas usando os mesmos elementos do data warehouse - ao proporcionar o armazenamento de dados históricos e a geração de informações para a tomada de decisões, apresenta-se como uma solução à necessidade de bibliotecas em otimizar a organização de dados administrativos e estatísticos, capacitando-as à gestão de informações no âmbito gerencial e estratégico. 115

A explosão informacional ocasiona a ampliação de acervos e aumento de demanda, o que faz com que haja a necessidade de prestação de contas para justificar gastos e investimentos nas bibliotecas, por exemplo. A gestão de diversos suportes, tangíveis e intangíveis, como DVD s, CD s, periódicos eletrônicos, bases de dados, etc., exige que os gestores de bibliotecas tenham informações precisas, incluindo informações históricas, para permitir gerenciamento com efetividade. O data mart, dentro do ambiente data warehousing, é uma tecnologia importante para a solução deste problema, pois possibilita a integração dos diversos sistemas legados da biblioteca e armazenamento e recuperação de informações históricas, a custo viável e a curto prazo. 2 DATA WAREHOUSE Data warehouse é um único, completo e consistente depósito de dados obtidos de uma variedade de fontes e construído para os usuários finais, de forma que eles possam compreendê-lo e usá-lo no contexto de seu negócio. Compreende um grande banco de dados que armazena dados de diversas fontes para futura geração de informações integradas, com base nos dados do funcionamento das funções empresariais operacionais de uma organização inteira. É, basicamente, o armazém de dados de uma instituição (DEVLIN, 1997; REZENDE, ABREU, 2000). Na definição de Laudon e Laudon (1999, p. 137), o data warehouse consolida dados extraídos de diversos sistemas de produção e operacionais em um grande banco de dados que pode ser utilizado para relatórios e análises gerenciais. Os dados dos sistemas de processamento das principais transações da organização são reorganizados e combinados com outras informações, inclusive dados históricos, de modo que possam ser usados para a tomada de decisões e análise gerenciais. Na maioria dos casos, os dados dos armazéns de dados só podem ser usados para a obtenção de informações não podem ser desatualizados de modo que o desempenho dos sistemas operacionais subjacentes da empresa não é afetado. Um conceito que merece ser mencionado é o de Inmon (1997, p. 33), no qual afirma que o data warehouse [...] é um banco de dados baseado em assuntos, integrado, não-volátil e variável em relação ao tempo, de apoio às decisões gerenciais. Os elementos presentes neste conceito são descritos abaixo: - Baseado em assuntos: é baseado em assuntos ou negócios da organização, ao contrário dos sistemas operacionais, voltados para as aplicações da empresa. Por 116

exemplo, em um sistema operacional a aplicação é o automóvel, enquanto que no data warehouse o assunto / negócio é cliente; tem-se no sistema operacional vida, e no data warehouse apólice (Ibid., p. 34). - Integrado: os dados a serem carregados no data warehouse devem ser consistentes, ou seja, devem ser atribuídas convenções para a padronização de dados. Por exemplo, se nos sistemas operacionais existirem as aplicações m/f e 1/0 para designar masculino/feminino, no data warehouse estes dados devem ser integrados e codificados, onde serão padronizados como m/f, de acordo com a figura abaixo: Operacional Data Warehouse Aplicação A m, f Aplicação B 1,0 Aplicação C Masc. / fem. m, f Figura 1 Integração dos dados no Data Warehouse Fonte: Adaptado de Sowek, 1997. - Não-volátil: os dados carregados no data warehouse geralmente não sofrem atualizações, não se pode incluir, alterar e excluir dados, somente carregá-los e acessálos. No ambiente operacional (sistemas legados), por exemplo, os dados são bastante recentes, enquanto que no data warehouse os dados são bastante antigos (por isso, denominados históricos). Então não sofrem alterações. - Variável em relação ao tempo: o horizonte de tempo no data warehouse é muito maior que nos sistemas operacionais. Enquanto nestes o horizonte de tempo é normalmente de 60 a 90 dias, naquele o horizonte de tempo é de 5 a 10 anos (Ibid., p. 37). 2.1 Data Mart 117

Segundo Di Domenico (2001,), o data mart pode ser construído independentemente do data warehouse, segundo uma necessidade departamental da organização, ou seja, reunindo dados que geram informações específicas de um setor da empresa. Essa arquitetura é denominada botton-up (de baixo para cima). Constroem-se primeiramente os data marts que posteriormente alimentarão o data warehouse. Inmon categoricamente não recomenda este tipo de arquitetura, por julgar que data marts independentes geram informações duplicadas ou redundantes. Esse argumento não representa empecilho para a construção de um modelo conceitual aplicado a bibliotecas, levando-se em consideração que: - As informações para tomada de decisão em bibliotecas são peculiares do próprio setor, à exceção das informações financeiras. Dados como circulação, empréstimos, consultas, total de títulos e exemplares são dados históricos e exclusivos de bibliotecas. A única ressalva fica a cargo de informações financeiras, como total gasto na compra de livros em um determinado período, por exemplo. Pode haver a necessidade de interação com sistemas legados de outro setor da instituição (setor financeiro). - A implementação de um data mart em bibliotecas pode servir como um referencial para o resto da instituição. - O custo para implantação de um data warehouse é demasiado alto, e o tempo de execução do projeto varia, em média, de dois a cinco anos. Por outro lado, o custo de implantação e tempo de execução de um projeto para data mart é consideravelmente menor. Segundo Di Domenico (2001), o tempo para implementação é, em média, de 120 dias. A opção pelo data mart também é salientada por Miorelli (2000, p. 5): [...] recomenda-se iniciar [o projeto] com data marts integrando-os a um data warehouse ao longo do tempo. Isto justifica-se pelos seguintes aspectos: o custo é bem inferior a implantar um data warehouse na empresa; o tempo de implementação é reduzido; mais fácil assimilar a atuação de uma área de negócio específica a entender todo o processo da empresa. 118

A construção do data mart é validada por Kimball, e Santos e Aranha (2000, p. 10) sintetizam a diferença entre os conceitos de Kimball e Inmon, principais teóricos da arquitetura data warehousing, sobre os data marts: A construção de um data mart é válida tanto sob a ótica de Kimball quanto de Inmon. No entanto a eventual ampliação da solução para a construção de um data warehouse não é possível segundo Inmon e é perfeitamente válida na abordagem de Kimball. Essa diferença de abordagem é mais relativa à terminologia utilizada do que propriamente conceitual. Isso porque Inmon se refere ao data mart como um coleção de dados derivada do data warehouse, enquanto para Kimball o data mart é a própria unidade lógica do data warehouse, ou seja, eles estão falando sobre coisas diferentes. O estudo sobre data warehouse / data marts originou-se na década de setenta, mas seus conceitos foram efetivamente levados ao público a partir de 1992 por Inmon e 1996 por Kimball; a inserção do conceito de data warehouse em bibliotecas na literatura brasileira remonta a 2000, com Di Domenico e em bibliotecas universitárias há um estudo para implantação de um data mart, elaborado por Santos e Aranha (2000). Este estudo é focado na circulação de acervo da biblioteca da Escola de Administração de Empresas de São Paulo, da Fundação Getúlio Vargas (EAESP-FGV), onde foi analisado o perfil dos usuários, a fim de se gerar recomendações de leitura. Aranha (1999) utilizou técnicas de inteligência artificial e data mining (ou bibliomining, segundo NICHOLSON, 2005) para obter recomendações específicas de leitura, propondo sua aplicação também em e- business (tecnologia hoje largamente utilizada em websites como Amazon e Submarino, por exemplo). Outra aplicação para o data warehouse é como apoio à análise bibliométrica (TARAPANOFF, ARAUJO, CORMIER, 2000; GIRIJA, SRIVATSA, 2005). Além do âmbito empresarial, esta tecnologia também tem aplicações em outros segmentos. De acordo com Briggs (2008), a tecnologia de data warehouse foi implantada em uma rede de 75 escolas do estado de Minnesota, e possibilita aos docentes informações sobre localização, avaliações e relatórios de classe dos alunos, de forma integrada. Da mesma forma, Cohen (1999) previu sua utilização em hospitais, para a obtenção de informações sobre pacientes e sobre faturamento. Para este artigo, será utilizado como exemplo para o modelo conceitual o serviço de aquisição, denominado aqui de fato aquisição, baseado no modelo dimensional de Kimball (2002). O fato aquisição será dividido nas modalidades compra, doação e 119

permuta. A compra pode ser de material bibliográfico, periódicos, multimeios, bases de dados, etc. A aquisição por doação é feita através de solicitação ou recebimento de materiais. A permuta é o intercâmbio de documentos bibliográficos, como por exemplo a permuta de periódicos científicos entre bibliotecas universitárias. 3 ELEMENTOS DE UM DATA WAREHOUSE Para uma melhor compreensão da arquitetura de um data warehouse, é fundamental conhecer os seguintes elementos, abaixo. 3.1 Sistemas legados São os sistemas operacionais da instituição. No caso de bibliotecas, podem ser seus sistemas de dados bibliográficos, sistemas de controle de empréstimos e de controle de periódicos. Por fornecerem dados operacionais, não se prestam à tomada de decisão, porém podem fornecer dados históricos. 3.2 Área de estagiamento de dados É definida como a área de armazenamento e conjunto de processos que limpam, transformam, combinam, retiram duplicações, retêm, arquivam e preparam os dadosfonte para uso no data warehouse. 3.3 Modelo dimensional É a forma de modelagem de dados ideal para o data warehouse, pois resume-se em um cubo de dados que iguala as necessidades dos usuários finais de forma simples (KIMBALL, 2002). O modelo entidade-relacionamento, freqüentemente utilizado na elaboração de bases de dados, não pode ser utilizado para o data warehouse, pois não são facilmente compreendidos pelos usuários (Ibid., p. 9). O modelo dimensional é também chamado esquema de estrela (star schema), pois seu diagrama tem tal forma, com uma grande tabela central e outras tabelas em volta. A tabela central é a tabela fato, e as periféricas são as tabelas de dimensão (dimension tables). 120

Dimensão tempo Fato vendas Key_tempo Dia Mês Semestre Dia_feriado Key_tempo Key_produto Key_loja Valor unidade Unidades vendidas Custo Dimensão produto Key_produto Descrição Marca Categoria Dimensão loja Key_loja Nome_loja Endereço Cidade Figura 2 O modelo dimensional Fonte: Adaptado de Kimball, 2002. 3.4 Data marts: mercados de dados Data marts são conhecidos como mercados de dados. Entende-se o data mart como um subconjunto lógico do data warehouse, que fornece informações a nível departamental. No caso proposto, o modelo conceitual do data mart irá fornecer informações para tomada de decisão em bibliotecas, com respaldo teórico baseado em Kimball (2002). É importante ressaltar, entretanto, que um projeto macro de data warehouse que integre todos os setores de uma instituição envolve conhecimento de toda a estrutura da mesma, necessidades específicas de vários usuários, tempo para implementação do projeto, avaliação constante e principalmente gastos com pessoal especializado; equipamentos, software, hardware, infra-estrutura física e treinamento. A opção por data marts 121

departamentais ou pelo data warehouse vai depender, além dos critérios já citados, das necessidades imediatas da unidade de negócio na obtenção de vantagens competitivas. 3.5 Armazenamento de dados operacionais É caracterizado como o ponto de integração com os sistemas operacionais da organização. O armazenamento integra em nível operacional os diferentes sistemas da organização. É um elemento extremamente técnico, pois exige a análise da infraestrutura disponível e da arquitetura de informações da instituição, como a multiplicidade de plataformas de bases de dados. 3.6 Business intelligence Business intelligence engloba ferramentas que efetivamente otimizam o uso do data warehouse. É através dessas ferramentas que as informações oportunas são extraídas do data warehouse, seja em forma de relatórios, gráficos, tabelas ou análises estatísticas. Podem ser classificadas como sistemas de suporte à decisão (Decision Support Systems - DSS), data mining (mineração de dados), processamento analítico online (Online Analytical Processing - OLAP), etc. De acordo com Santos e Aranha (2000, p. 7): Business Intelligence (BI) é uma forma de tornar útil o data warehouse. A aplicação de BI não pressupõe um data warehouse, mas o data warehouse é inútil sem BI. Em relação à administração da biblioteca [...] o processo de BI envolve a extração das informações necessárias a partir do data warehouse, ou data mart, análise dessas informações (por meio de OLAP e relatórios, por exemplo) e tomada de decisões com base nas mesmas, ou seja, envolve uma forma de usar os dados para facilitar a administração. O nível de granularidade (definido adiante) determinará o tipo de ferramenta de Business Intelligence a ser adotada para atuar juntamente com o data warehouse / data mart. 3.7 Metadados Metadados são definidos como dados sobre dados (INMON, 1997; SENSO, PIÑERO, 2003). São dados que definem significado para outros dados, como por exemplo 122

informações de um dicionário de dados ou um catálogo de fichas de uma biblioteca. Inmon (1997) afirma que os metadados englobam o data warehouse e mantêm informações sobre o que está onde no data warehouse. Metadados são utilizados para: - A estrutura dos dados segundo a visão do programador; - A estrutura dos dados segundo a visão do analista do sistema de apoio a decisão; - A fonte de dados que alimenta o data warehouse; - A transformação sofrida pelos dados no momento de sua migração para o data warehouse; - Modelo de dados (por exemplo, dados como key_loja, nome_loja, endereço, cidade, em uma tabela dimensional loja ); - O relacionamento entre o modelo de dados e o data warehouse; - O histórico de extrações. 4 ESTRUTURA DO DATA WAREHOUSE A estrutura de um data warehouse possui os seguintes componentes: metadados, detalhes antigos ou dados históricos, detalhes correntes (onde ocorre a transformação operacional), dados levemente resumidos (aí se situam os data marts) e dados altamente resumidos, conforme figura abaixo. 123

Dados altamente resumidos M E T A D A D O S Data mart Data mart 11 anos 8 anos Dados levemente resumidos Detalhe corrente 1 ano Transformação operacional 5 anos Detalhes antigos Figura 3 Estrutura de um Data Warehouse Fonte: Adaptado de Inmon, 1997. 5 GRANULARIDADE Para que se possa estabelecer com especificidade o nível de detalhe das informações que se deseja como resultado, faz-se necessário estabelecer qual será a granularidade. Granularidade é o processo de definição do nível de detalhamento das informações a serem armazenadas e recuperadas no data warehouse. É o aspecto mais importante do projeto (INMON, 1997), pois diz respeito ao nível de detalhe ou de resumo contido nas unidades de dados existentes no data warehouse. Quanto mais detalhe, mais baixo o nível de granularidade (mais grãos de dados); quanto menos detalhe, mais alto o nível de granularidade (menos grãos de dados). Num projeto de data warehouse ou de data 124

mart, o tipo de informação desejada pelos gestores/usuários para tomar decisões irá ser decisivo para a implantação do projeto, pois do nível de detalhamento dependerá uma série de fatores, como por exemplo a capacidade de armazenamento e processamento do banco de dados. A figura abaixo exemplifica a questão do nível de detalhamento e de volume de dados: A Alto nível de detalhe Baixa granularidade B Baixo nível de detalhe alta granularidade 200 registros / mês 1 registro / mês Os detalhes de cada chamada telefônica feita por um cliente em um mês O resumo das chamadas telefônicas feitas por um cliente em um mês Figura 4 Comparação dos níveis de granularidade Fonte: Adaptado de Inmon, 1997. Por ser um data warehouse departamental o data mart, por princípio, não deve possuir um volume de dados muito grande. Portanto, se a opção é implementar o data mart, os gestores/usuários devem estar cientes de que a obtenção de informações estará em um nível de detalhe levemente resumido, como indica a própria estrutura do data warehouse mostrada anteriormente. Os dados históricos situar-se-ão em um horizonte de tempo que pode variar de cinco a dez anos, segundo Di Domenico (2001), o que é bastante satisfatório no processo gerencial. Entretanto, outro aspecto a ser levado em conta durante o projeto lógico é como as informações a serem extraídas serão quantificadas. Pode-se utilizar o mesmo raciocínio utilizado na figura 4: - Detalhes sobre as permutas realizadas no mês: detalhes correntes, grande volume de dados (inviável no data mart); - Total de permutas efetuadas no semestre, por área: dados levemente resumidos (viável para um data mart). 125

6 ARQUITETURA DE UM DATA MART PARA BIBLIOTECAS A figura 5 apresenta uma arquitetura bottom-up para data marts. Neste modelo estão representados vários data marts, e cada um deles indica fatos específicos: aquisição, circulação, processos técnicos e serviço de referência. Tomando como exemplo o processo de aquisição, pode-se definir que: - A primeira etapa diz respeito ao sistema legado (banco de dados antigo, como por exemplo um módulo de software responsável por armazenar as transações de aquisição). - A segunda etapa é a do estagiamento, onde é feita a limpeza das redundâncias de dados e conseqüente padronização. Por exemplo, onde há dados contendo R$ 50,00, 50,00 ou cinqüenta reais, passará a ser padronizado como R$ 50,00 - A terceira etapa é a consolidação do data mart propriamente dito, onde os dados do processo aquisição são consolidados (banco de dados). - A quarta etapa é a consolidação de todos os data marts em um único banco de dados, que utiliza os dados de diferentes processos para fornecer informações analíticas e completas. 126

Sistemas legados Estagiamento Data marts METADADOS 1 2 3 DATA WAREHOUSE 4 1 Aquisição 2 Circulação 3 Processos técnicos 4 Referência Figura 5 Arquitetura Bottom-up Fonte: O autor A figura 6 apresenta o star schema para o fato aquisição. Nela estão exemplificadas as dimensões tempo, documento e biblioteca. 127

Fato aquisição Dimensão tempo Key_tempo Dia Mês Semestre Dia_feriado Key_tempo Key_documento Key_biblioteca Valor unidade quantidade Dimensão documento Key_documento Tipo_documento Periodicidade Títulos Exemplares Dimensão biblioteca (1...n) Key_biblioteca Nome_biblioteca Endereço Cidade Figura 6 Star Schema para o fato aquisição Fonte: O autor O fato aquisição contém os dados valor unidade e quantidade. Aqui estarão os dados referentes ao preço e total de livros comprados, por exemplo. Esta tabela desdobra-se em outras três: tempo, documento e biblioteca. A dimensão tempo contempla os dados como dia, mês, semestre, feriado. A dimensão documento contém periodicidade (por exemplo, periódico mensal, semestral), títulos (quantidade de títulos de periódicos, livros, etc.) e exemplares. A dimensão biblioteca (1...n) contém a identificação da(s) biblioteca(s). Nesta dimensão pode-se inserir uma biblioteca ou mesmo um sistema de bibliotecas. No caso de um sistema de bibliotecas, a obtenção de informações decisórias pode ser consolidada pelos seus totais ou detalhada por cada uma delas. 128

7 CONCLUSÕES ARTIGO Além da conceituação de data warehousing e de sua arquitetura aplicada aos processos bibliotecários, considera-se relevante apontar as seguintes variáveis - Efetuar estudos de viabilidade: estimar custos com pessoas e tecnologia, bem como avaliar riscos e impactos ao projeto e tempo de execução; - Recursos humanos: internos e externos, inclusive na formação de uma equipe multidisciplinar, que deverá incluir também os futuros usuários; - Hardware: infra-estrutura de rede, armazenamento, processamento ( performance ); - Software: sistema operacional e de bancos de dados, desenvolvimento interno ou externo; - Utilitários para a apresentação de dados: relatórios, gráficos, planilhas, etc. Diante do exposto, espera-se lançar luz aos profissionais de bibliotecas para as possibilidades e vantagens competitivas que a implantação de um sistema de data warehouse pode oferecer. Não se julgou relevante levantar uma quantidade excessiva ou detalhada de dados técnicos sobre tecnologia da informação, pois para esses profissionais, sejam eles gestores ou potenciais usuários do sistema, bastará o conhecimento de seus próprios processos internos, os quais são o cerne do projeto. A formação de equipe multidisciplinar é fundamental para a implantação bem-sucedida de um projeto de data mart / data warehouse. Mais uma vez, enfatiza-se que a análise de dados de caráter gerencial é fundamental no relacionamento com a totalidade da instituição na qual a biblioteca está inserida, seja uma empresa, instituição de ensino ou centro de pesquisa, em âmbito público ou privado. REFERÊNCIAS ARANHA, Francisco. Perfil de usuários da biblioteca Karl A. Boedecker: geração de valor para pesquisadores por meio de cooperação indireta [relatório de pesquisa]. São Paulo: EAESP/FGV, 1999. 59 p. 129

BRIGGS, Linda L. Case Study: Data Warehousing at Hillsborough County Public Schools. The journal: transforming education trough technology, may 2008. Disponível em: <http://thejournal.com/articles/2008/05/28/case-study-data- Warehousing-at-Hillsborough-County-Public-Schools.aspx?p=1>. Acesso em: 14 fev. 2010. COHEN, Michael. Data warehousing for improved decisions. Physicians news, ago. 1999. Disponível em: < http://www.physiciansnews.com/computers/899.html>. Acesso em: 12 fev. 2010. DEVLIN, Barry. Data warehouse: from architecture to implementation. Reading: Addison-Wesley, 1997. 432p. DI DOMENICO, Jorge Antonio. Definição de um ambiente data warehouse em uma instituição de ensino superior. 2001. 137 f. Dissertação (Mestrado em Engenharia de Produção) Universidade Federal de Santa Catarina, Florianópolis. GIRIJA, N.; SRIVATSA, S. K. Constructing the virtual library data warehouse from a blueprint. Information technology journal, v. 4, n. 3, p. 246-25, 02005. INMON, William H. Como construir o data warehouse. Rio de Janeiro: Campus, 1997. 37p. KIMBALL, Ralph. The data warehouse toolkit: the complete guide to dimensional modeling. New York: John Wiley & Sons, 2002. 436p. LAUDON, Kenneth C.; LAUDON, Jane Price. Sistemas de informação: com internet. 4. ed. Rio de Janeiro: LTC, 1999. 389p. MIORELLI, Henrique Salatino. Proposta de um roteiro para projetar: um data warehouse. Bate Byte, Curitiba, n. 100, p. 3-9, ago. 2000. NICHOLSON, Scott. The bibliomining process: data warehousing and data mining for library decision-making. 2003. Disponível em: <http://www.bibliomining.com/nicholson/biblioprocess.htm>. Acesso em: 09 mar. 2009. REZENDE, Denis Alcides; ABREU, Aline França. Tecnologia da informação aplicada a sistemas de informação empresariais: o papel estratégico da informação e dos sistemas de informação nas empresas. São Paulo: Atlas, 2000. 311 p. SANTOS, Erico Resende; ARANHA FILHO, Francisco José Espósito. Implantação de tecnologia de data warehouse em bibliotecas com uso de tecnologia adequada. In: ENANPAD, 24., 2000, Florianópolis. Anais... Disponível em: <http://www.anpad.org.br/evento.php?acao=trabalho&cod_edicao_subsecao=51&cod_ev ento_edicao=4&cod_edicao_trabalho=4030>. Acesso em: 25 fev. 2009. SENSO, José A.; PIÑERO, Antonio de la Rosa. El concepto de metadato: algo más que descripción de recursos electrónicos. Ciência da Informação, Brasília, v. 32, n. 2, p. 95-106, maio/ago. 2003. 130

SOWEK, Carlos Alberto. O que é data warehouse. Bate Byte, Curitiba, n. 62, p. 17-22, mar. 1997. TARAPANOFF, Kira; ARAÚJO JÚNIOR, Rogério Henrique de; CORMIER, Patricia Marie Jeanne. Sociedade da informação e inteligência em unidades de informação. Ciência da informação, Brasília, v. 29, n. 3, p. 91-100, set. /dez. 2000. Maurício Ferreira Santana Graduação: Biblioteconomia, Universidade Federal do Paraná. Pós-graduação: Gestão da Informação e Inovações Tecnológicas, FESP. mfsantana@petrobras.com.br Recebido em: 23/07/2010 Aceito para publicação em: jul/2010 131