Implantação de Tecnologia de Data Warehouse em Bibliotecas com Uso de Tecnologia Adequada

Tamanho: px
Começar a partir da página:

Download "Implantação de Tecnologia de Data Warehouse em Bibliotecas com Uso de Tecnologia Adequada"

Transcrição

1 Implantação de Tecnologia de Data Warehouse em Bibliotecas com Uso de Tecnologia Adequada Autoria: Erico Resende Santos e Francisco José Espósito Aranha Filho 1 RESUMO Projetos de implementação de data warehouses e data marts costumam ser longos e dispendiosos. Nesta pesquisa foi desenvolvido um modelo de implementação de data marts para a circulação do acervo de bibliotecas com uso de tecnologia adequada, ou seja, com foco na solução por oposição a foco na tecnologia em si. Um projeto piloto foi conduzido na biblioteca Karl A. Boedecker em que testou-se, com sucesso, essa metodologia. O resultado obtido serviu de base para um estudo de cooperação indireta, com uso de técnicas de data mining, como forma de gerar recomendações de leitura para os usuários da biblioteca. O data mart desenvolvido permitiu ainda outros estudos do perfil dos usuários e diversas análises que pressupõe o acesso aos dados de circulação do acervo. Estes resultados revelaram a possibilidade de se desenvolver sistemas desse tipo para bibliotecas genéricas, com resultados bastante sofisticados, sem a necessidade de grandes investimentos iniciais e em prazo reduzido. 2 INTRODUÇÃO Com a crescente tendência de publicações em meio eletrônico e com o crescimento da Internet como forma de distribuição de informações, o conceito tradicional de bibliotecas como um local físico para armazenagem de informações deve evoluir para um conceito de portal. Vista como um portal, a biblioteca deve oferecer, além do acervo físico, um conjunto amplo de produtos e serviços como: fornecimento de informações em meio eletrônico (localmente e a distância), fornecimento de índices, catálogos, ferramentas de localização, ajuda ativa na busca por informação etc. (Beaumont, 1998). Seguindo a tendência de tornar-se um portal de informações, é importante que a biblioteca mantenha um foco nos usuários, procurando entender suas necessidades e manter com eles um relacionamento. Uma forma de fazer isso é fornecer uma ajuda ativa aos usuários na localização de obras relevantes para sua pesquisa. Para isso é necessário adquirir um conhecimento dos seus hábitos e interesses, o que passa por um estudo do seu comportamento (Aranha, manuscrito). Exemplos de técnicas para estudar esse comportamento são cooperação indireta e link analysis (Aranha, manuscrito). Essas técnicas estão incluídas no conjunto de técnicas de data mining (item 2.2) e são utilizadas em função da grande quantidade de dados analisados e da característica pouco estruturada do problema. A aplicação dessas técnicas demanda um conjunto acessível, consistente e íntegro de dados. A preparação dos dados é uma parte essencial no processo de data mining (Westphal & Blaxton, 1998). E uma solução frequentemente usada para a disponibilização desses dados são data warehouses (Berry & Linoff, 1997). A proposta dessa pesquisa é a definição de um data mart (extensível para um data warehouse) como forma de dar suporte à aplicação de técnicas de data mining que pressuponham o acesso aos dados de circulação do acervo de bibliotecas (ver itens 2.3 e 2.4 para uma explicação dos termos data mart e data warehouse). 1

2 2.1 PROJETO NA BIBLIOTECA KARL A. BOEDECKER Um projeto piloto de um sistema de recomendações para os usuários foi implementado na biblioteca karl A. Boedecker. Para isso foi implantado um data mart de circulação do acervo da biblioteca. O estudo do perfil dos usuários (Aranha, manuscrito) foi baseado na exploração do histórico de transações de circulação do acervo na biblioteca realizadas no período de 1º de março a 19 de julho de A base de dados inicial continha cerca de transações (entre empréstimos, renovações e devoluções de itens) envolvendo usuários e itens do acervo da biblioteca. 2.2 DATA MINING Data mining é o processo de exploração e análise, por meios automáticos ou semiautomáticos, de um conjunto grande de dados com o objetivo de descobrir padrões e regras significativos (Berry e Linoff, 1997). Esse processo pode ter duas abordagens: teste de hipóteses e síntese de conhecimento. Teste de hipótese refere-se ao uso dos dados para verificar ou negar uma hipótese ou noção prévia. Síntese de conhecimento é a descoberta de uma informação sem nenhuma condição inicial. Pode ser direta (caso em que se deseja explicar um atributo específico em função de outros dados) e indireta (caso em que se procura relações sem foco em um atributo específico). As técnicas de data mining podem ser divididas em: classificação, estimativa, previsão, agrupamento por afinidade, agrupamento e descrição (Berry e Linoff, 1997). O estudo referido envolverá, principalmente, a técnica de agrupamento por afinidade ou análise de relacionamento. Os fatores críticos de sucesso para projetos de data mining são (Hermiz, 1999): 1. Definição de um problema real articulado; 2. Garantia de dados de qualidade e em quantidade para o estudo; 3. Reconhecimento do caráter não estruturado do projeto; 4. Planejamento de aprendizado com o processo. A preocupação desta pesquisa é a abordagem do segundo ponto, ou seja, o desenvolvimento de mecanismos para a manutenção e disponibilização dos dados para a realização do estudo. Isso demanda a construção de uma base acessível, consistente e íntegra de dados, o que levou à proposição do data mart. 2.3 DATA WAREHOUSE O data warehouse é uma coleção de dados não volátil, crescente no tempo, integrada e orientada ao negócio para dar suporte a decisões gerenciais (Inmon, 1996). É a fonte de dados para consulta da organização (Kimball, 1998). Ele tem as seguintes características (Berson e Smith, 1997): É um banco de dados projetado para análise, que usa dados de várias aplicações. É projetado para um pequeno número de usuários com interações longas. É usado basicamente para leitura. É atualizado periodicamente (principalmente com adição de dados). Contém dados atualizados e históricos para fornecer informações do fluxo do negócio no tempo. É formado por poucas e grandes tabelas. Destina-se à realização de consultas que resultam em um conjunto grande de dados e geralmente envolvem leituras de tabelas inteiras e vários relacionamentos. O data warehouse deve ter os seguintes objetivos (Kimball, 1998): Tornar a informação mais acessível. 2

3 Tornar a informação mais consistente, ou seja, informação de qualidade em toda a organização. Os termos usados em uma parte da empresa devem ter o mesmo significado em toda a empresa. Ser uma fonte de informação adaptável e maleável. Deve ser projetado para mudança constante sem que todo o sistema tenha que ser alterado. Ser uma fonte segura para proteger a informação na empresa. Deve ser a base para a tomada de decisão. 2.4 DATA MART O data mart tem definição controversa junto aos autores (especialmente Kimball e Inmon) e fabricantes de ferramentas. Segundo Inmon o data mart é uma coleção de dados relacionados a alguma área da empresa (algum processo específico), organizados para dar suporte à decisão e baseados nas necessidades de um determinado departamento. Ele afirma que o data mart e o data warehouse têm estruturas essencialmente diferentes e um conjunto de data marts dificilmente pode ser integrado e, mesmo que for, não resultará em um data warehouse (Inmon, 1998). Segundo Inmon o data mart é derivado do data warehouse. Kimball define o data mart como um subconjunto lógico do data warehouse. De acordo com sua abordagem, o data warehouse não passa da união de todos os data marts que o constituem (Kimball, 1998). Essa diferença de abordagem se reflete em opiniões controversas de cada autor em relação ao processo de implantação do data warehouse. Ambos concordam que a implantação da solução completa é muito complexa para ser feita de uma vez e ambos concordam que a sustentação do projeto depende da entrega rápida de uma solução parcial que agrade os usuários e justifique o investimento (Gallas, 1999). Mas a solução proposta por cada um é diferente. Kimball propõe a implantação de um data mart por vez, desde que seja feita uma prévia modelagem da organização e que os data marts fiquem conformados de acordo com essa modelagem (ver item 2.5). Inmon propõe a implantação iterativa do data warehouse, ou seja, o sistema começa pequeno e evolui progressivamente em espaços curtos de tempo. Essa evolução é sempre feita com base na modelagem inicial dos dados da organização (Inmon, 1998). Nesse trabalho a motivação inicial é a construção de um data mart apenas e isso é válido tanto sob a ótica de Kimball quanto de Inmon. No entanto a eventual ampliação da solução para a construção de um data warehouse não é possível segundo Inmon e é perfeitamente válida na abordagem de Kimball. A conclusão preliminar a que se chega é que essa diferença de abordagem é mais relativa à terminologia utilizada do que propriamente conceitual. Isso porque Inmon se refere ao data mart como uma coleção de dados derivada do data warehouse, enquanto para Kimball o data mart é a própria unidade lógica do data warehouse, ou seja, eles estão falando de coisas diferentes. No desenvolvimento do projeto piloto na biblioteca Karl A. Boedecker foi adotada a abordagem de Kimball. Pudemos testar a implementação de um pequeno data mart paralelo ao principal para dar suporte ao resultado do sistema de recomendações proposto. No entanto a validação de uma estratégia de implementação como proposta por Kimbal em uma grande organização não é objeto dessa pesquisa. 3

4 2.5 MODELAGEM DIMENSIONAL Para o desenvolvimento de data warehouses o modelo mais viável é o modelo dimensional em oposição ao modelo de entidade relacionamento (Kimball, 1998). O modelo dimensional é composto por uma tabela com uma chave múltipla chamada tabela fato (fact table) e por várias tabelas menores chamadas dimensões (dimension table). Cada dimensão tem uma chave única que corresponde exatamente a um dos componentes da chave múltipla da tabela fato. Para a visualização do modelo usaremos o resultado do item correspondente ao modelo desenvolvido para o projeto piloto da biblioteca. A implementação da solução completa do data warehouse em uma única etapa seria uma tarefa muito difícil. A abordagem proposta por Kimball é a implementação de um data mart de cada vez, ou seja, a abordagem de cada processo de negócio separadamente. Isso corresponde a definir uma fact table de cada vez. A dificuldade que surge então é como unir todos os data marts de forma que o todo fique coerente e possa integrar toda a organização. Se os data marts forem incompatíveis entre si eles nunca poderão compor um data warehouse. Kimball propõe que a modelagem de cada data mart obedeça a uma arquitetura padrão que ele chama de via do data warehouse. Para a construção da via é necessário ter dimensões conformadas e uma definição padronizada para os fatos. Uma dimensão conformada é uma dimensão que significa a mesma coisa em qualquer star schema em que esteja, ou seja, em qualquer data mart. As dimensões conformadas são essenciais para manter a integração de todos os data marts no data warehouse. Da mesma forma os fatos devem estar conformados. Isso significa dizer que se um determinado fato é referenciado com medidas diferentes em dois processos (por exemplo um produto cuja quantidade é medida em unidades em algum processo e em lotes em outro), as duas medidas devem ser expressas nos dois data marts correspondentes e cada uma deve ter um nome diferente. Um aspecto importante no desenho das dimensões é a consideração a respeito da mudança contínua. Existem três estratégias básicas para lidar com essas mudanças: 1. Alterar o registro original perdendo informações históricas. 2. Criar um novo registro usando outro valor para a chave. 3. Criar um campo velho na dimensão para guardar o atributo anterior. O uso dessas estratégias varia em cada caso e a escolha entre elas deve ser baseada no tamanho da dimensão, na velocidade de mudança e na necessidade de se manter informações históricas. O projeto de cada data mart deve levar em conta 4 passos básicos de acordo com Kimball (1998). São eles: 1. Escolha do data mart: Corresponde a escolher o processo do negócio ou a(s) fonte(s) operacional(is) dos dados. É conveniente começar o projeto com a escolha de um data mart de uma única fonte e montar as dimensões conformadas desde o início de maneira que os data marts seguintes possam se plugar na via. 2. Escolha da granularidade das tabelas fato: Corresponde a dizer o que é exatamente cada registro da tabela fato. Geralmente essas tabelas devem ser o mais granulares possível, principalmente para projetos de data mining onde o detalhe é essencial. As medições menos granulares devem ser derivações das tabelas fato construídas de modo a permitir melhora de performance em algumas consultas (tabelas agregadas). 3. Escolha das dimensões: Com a definição da granularidade a escolha das dimensões já estará iniciada. Como o registro da tabela fato corresponde à medição de algum processo, esse processo já estará naturalmente relacionado a algumas dimensões. No entanto o projetista do data mart pode adicionar algumas dimensões de forma a tornar a informação mais completa. Toda dimensão que puder ser relacionada ao fato específico de forma única deve ser adicionada ao modelo. 4

5 4. Escolha das medidas: A escolha da granularidade também já identifica uma série de medidas pertinentes. Essas medidas devem ser totalmente apropriadas à granularidade escolhida para a tabela fato. 2.6 BUSINESS INTELLIGENCE Business Intelligence (BI) é um termo introduzido pelo GartnerGroup no fim da década de 1980 que se refere ao acesso e exploração de dados estruturados relativos a um domínio específico, análise dos dados, desenvolvimento de conhecimento a partir dessa análise e aplicação desse conhecimento para tomada de decisão (Harris e Dresner, 1999). As ferramentas de BI incluem: Construção de consultas ad hoc, Geração de relatórios, DSS (Decision Support Systems), EIS (Executive Information System), Análise estatística (data mining), OLAP (OnLine Analytical Processing), entre outras. Business Intelligence (BI) é uma forma de tornar útil o data warehouse. A aplicação de BI não pressupõe um data warehouse mas o data warehouse é inútil sem BI (Strange, 1999). Em relação à administração da biblioteca, ou ao estudo de data mining, o processo de BI envolve a extração das informações necessárias a partir do data warehouse, ou data mart, análise dessas informações (por meio de OLAP e relatórios, por exemplo) e tomada de decisões com base nas mesmas, ou seja, envolve uma forma de usar os dados para facilitar a administração. 3 O PROJETO NA BIBLIOTECA KARL A. BOEDECKER A Biblioteca Karl A. Boedecker foi fundada em 1954 para dar suporte bibliográfico à EAESP FGV. Conta com acervo de 67 mil exemplares de 47 mil títulos de livros e 3,2 mil exemplares de 1,8 mil títulos de teses e dissertações (Biblioteca Karl A. Boedecker. Relatório Anual 1998, documento interno). A biblioteca conta também com mais de 6 mil usuários cadastrados no sistema dos quais pouco mais de 2 mil estão ativos. A biblioteca atende aos professores, alunos e funcionários da escola, além de instituições externas. Os alunos podem ser dos seguintes cursos: CGAE (Graduação em Administração de Empresas), CGAP (Graduação em Administração Pública), CEAG (Especialização em Administração para Graduados), CEAHS (Especialização em Administração Hospitalar), Doutorado, Mestrado MBA, PECE (Programa de Educação continuada) Alunos de intercâmbio Além dos alunos correntemente matriculados a biblioteca atende também aos exalunos da escola. Em face disso os usuários são classificados de acordo com seu tipo que podem ser todos os citados acima. Em relação aos itens, estes podem ser classificados como livros, teses e dissertações, obras de referência, revistas etc. 5

6 A biblioteca Karl A. Boedecker é uma biblioteca especializada, ou seja, ela se preocupa em atender prioritariamente algumas áreas específicas do conhecimento as quais: ciências aplicadas e sociais voltadas para administração de empresas e economia. Isso não implica ausência total de outras áreas mas a ênfase é dada para estas Situação Tecnológica A biblioteca vem passando por processos de modernização, por exemplo com a instalação, em 1995, do sistema VTLS. O sistema suporta todo o processo transacional da biblioteca como controle de circulação, catalogação, busca por palavras e booleana, controle de literatura básica, controle de periódicos, controle de estoque, relatórios estatísticos etc. O sistema fornece arquivos com estatísticas de transações passadas, no entanto estes arquivos servem apenas como controle e são ineficientes para uso analítico (daí a necessidade observada de um data warehouse no ambiente de administração). Todo o processo de empréstimo já se encontra automatizado, inclusive com o reconhecimento do usuário e dos itens por códigos de barras. Os usuários receberam um cartão com seu código de barras pessoal impresso que facilita essa identificação. Cada código de usuário está associado a uma senha. Os livros também têm código de barras impresso. De todo o acervo da biblioteca apenas cerca de itens estão cadastrados eletronicamente no VTLS. Esses itens são os que circularam depois da implantação do sistema e/ou que foram adquiridos no período após a implantação do sistema. Em função disso apenas esses itens serão cadastrados no data mart. 3.2 MODELAGEM DIMENSIONAL Escolha do Data Mart O modelo de dados desenvolvido partiu das necessidades do estudo do perfil de usuários (Aranha, manuscrito). Para isso foi necessário desenvolver um único data mart relativo às transações (ou circulação do acervo). A principal fonte para os dados é o sistema transacional da biblioteca (VTLS) que gera arquivos flat com todas as transações relativas à circulação do acervo Escolha da Granularidade da Tabela Fato Nesse data mart cada fato, ou seja, cada registro na tabela fato corresponde a uma transação que pode ser dos tipos: empréstimo, renovação e devolução. Esse fato não tem nenhuma medida associada. Trata-se apenas da ocorrência de uma transação relacionando as dimensões especificadas no registro Escolha e Definição das Dimensões Usuários dim_patron A dimensão de usuário tem duas fontes principais de dados. Uma é a escola e a outra a biblioteca. A escola forneceu dados referentes aos alunos como a média do curso e média no vestibular. A biblioteca forneceu dados gerais sobre os usuários como endereço e dados referentes à sua situação como usuário da biblioteca. Os principais requisitos em relação aos usuários é que eles pudessem ser identificáveis, tanto em relação ao seu papel na biblioteca como na escola. Além de poderem ser identificados em função de diversos atributos como endereço, idade, sexo etc. Para cada dimensão foi gerada uma chave para controle interno sem nenhum significado fora do data mart. Essa chave é chamada surrogate key e funciona como uma 6

7 forma de tornar o data mart independente do sistema legado da biblioteca (Kimball, 1998). Além dessa, a dimensão traz outras chaves e códigos para identificação do usuário na biblioteca e na escola. Foram adicionados também campos para descrição de características dos usuários como idade, sexo e tipo do usuário, além de outros dados como endereço completo (separado em vários campos), telefone, e data de cadastro do usuário na biblioteca. A separação de dados como endereço em vários campos é aconselhável para as dimensões pois dessa forma os dados são mais facilmente acessados. Foram adicionados alguns campos relativos ao comportamento dos alunos na escola como desempenho acadêmico, média no vestibular, entre outros. Esses atributos oferecem um problema adicional na modelagem pois não são válidos para todos os tipos de usuários. A questão é se nos casos em que o atributo é inválido (como desempenho acadêmico do professor ou funcionário) o valor deve ser mantido nulo ou não. A princípio mantivemos nulos os valores inválidos. Finalmente a dimensão conta com atributos resultados de processamento externo, ou seja, eles constituem uma agregação de valor à dimensão. O significado desses campos será explicado no item 3.3. Com relação à mudança contínua dessa dimensão, a opção na modelagem é que os dados relativos a usuários antigos nunca sejam descartados. Para isso sempre poderemos criar novas chaves artificiais mesmo que as chaves de produção sejam reutilizadas pela escola ou pela biblioteca. No caso de alteração dos dados de algum usuário, esses dados serão simplesmente alterados diretamente na dimensão. Itens dim_item A dimensão de itens tem duas fontes principais. A primeira são os arquivos de estatística gerados pelo VTLS e outra, a principal, são outros arquivos gerados pelo VTLS que contêm diversos dados sobre todos os livros adquiridos em um determinado período. Seria uma tabela mestre do VTLS sobre os itens. Essa dimensão também contém campos derivados de modelagem e do uso de técnicas de data mining. Foi criada também uma chave artificial além das chaves de produção usadas na biblioteca para identificar o item. Uma das identificações é o call_number. É uma identificação única para um determinado item que agrega o código CDU (ver item abaixo) e o título e nome do autor de forma codificada. Para a atribuição desse código podem ser usadas as tabelas de Cutter, Cutter-Sanborn e PHA entre outras. No caso da PHA, por exemplo, o código é formado pela primeira letra do nome do autor, seguida por um código para o sobrenome (de acordo com a tabela) e a primeira letra do título da obra (Prado, 1992). Foram adicionados também: campos de referência ao assunto do livro (ver próximo item); características básicas dos itens com título, autor, número de páginas data de aquisição etc. e algumas variáveis realimentadas no data_mart por processamento externo (ver item 3.3). Hierarquia de Assuntos O principal requisito em relação a essa dimensão é que ela descreva os itens não só pelos atributos diretos como título, autor, número de páginas etc., mas também com base em uma estrutura hierarquizada de assunto (ou área do conhecimento) de forma que torne fácil o relacionamento entre os itens e dos itens com outras dimensões. Para isso foi desenvolvido um modelo que tirou proveito do sistema de classificação usado pela biblioteca. Existem vários sistemas de classificação, entre os quais o de Melvil Dewey e o CDU. Para bibliotecas gerais o sistema de Melvil Dewey é apropriado. Para bibliotecas mais 7

8 especializadas é interessante o uso do sistema CDU Código Decimal Universal (Prado, 1992). A biblioteca Karl A. Boedecker utiliza o sistema CDU. Esses sistemas procuram sistematizar todas as áreas do conhecimento. Trata-se de um conjunto de códigos estruturados hierarquicamente e partindo de grandes áreas do conhecimento para o mais particular. As áreas mais gerais em que o conhecimento é dividido, segundo o CDU, são: 0 Generalidades: o conhecimento, a cultura, a ciência, o saber, a escrita etc. 1 Filosofia. Psicologia. 2 Religião. Teologia. 3 Ciências sociais. 4 Vaga no momento. 5 Ciências matemáticas, físicas e naturais. Ecologia. 6 Ciências aplicadas. Tecnologia. 7 Artes. Divertimento. Lazer. Esportes. 8 Línguas. Lingüística. Filologia. Literatura. 9 Geografia. Biografia. História e ciências auxiliares. O CDU contém ainda diversos símbolos para classificar as obras segundo lugar, tempo, língua etc. Ou seja, o CDU se presta a uma classificação mais minuciosa que o sistema de Dewey. A grande dificuldade na modelagem dessa dimensão é a definição da hierarquia dos assuntos conforme o código CDU. Para isso foram definidos um campo para o código CDU, cinco campos para definir a hierarquia dos assuntos, desde o nível 1 até o 5 e um campo especial para definir o assunto significativo (ver item 3.3). Um item que tem código CDU igual a , terá assunto_nivel1 igual a 3, assunto_nivel2 igual a 33 e assim por diante. Com relação à mudança contínua essa dimensão se comporta como a dimensão de usuários. Só serão retirados itens quando estes forem descartados ou perdidos, de acordo com a política da biblioteca. Tempo dim_time A dimensão de tempo fornece uma extensa descrição para cada dia do ano e pode ser rapidamente construída para vários anos. Essa dimensão tem por objetivo fornecer uma série de informações a respeito da data em que ocorreu uma determinada transação. A manutenção dessa dimensão envolve apenas acrescentar mais anos quando necessário. Tipos de transação dim_tipo_trans Como a tabela fato representa tanto retiradas como renovações e devoluções, foi necessária a introdução de uma dimensão de tipo de transação. Essa dimensão foi organizada de acordo com a hierarquia de comandos do VTLS. O principal requisito em relação a essa dimensão é que a consulta a um determinado tipo de transação seja imediato, o que pode ser feito através de uma simples restrição em uma consulta. Com relação á mudança contínua, essa dimensão será alterada manualmente sempre que necessário. Auditoria dim_audit A última dimensão acrescentada a esse data mart é a dimensão audit, que permite realizar a auditoria no processamento do data_warehouse. É gerada uma chave artificial para cada novo registro, correspondente a um processamento no data mart, além de campos para identificar a data e hora de início do 8

9 processo em questão, o número de registros processados e o número de registros que apresentaram problemas. A tabela fato correspondente ao processamento auditado é identificada por um campo tipo_carga. Cada tipo de carga é realizado em uma tabela fato diferente. Com relação à mudança contínua, essa dimensão sempre terá registros adicionados. Isso ocorre sempre que se der um novo processamento Escolha das medidas Esse data mart não apresenta medidas para a granularidade escolhida para a tabela fato. Trata-se de uma factless fact table ou tabela fato sem medidas (Kimball, 1998). Foi acrescentado um campo com valor default de 1 para significar uma ocorrência e facilitar a soma em consultas Resultado final O Star Schema resultante pode ser visto na Figura 1. A tabela fato tem cada registro com 5 campos de 4 bytes cada e 1 campo de 1 byte, totalizando 21 bytes. De acordo com os dados colhidos em nossa amostra, se assumirmos uma média de transações mensais (com alguma folga) teríamos transações anuais. Para um histórico de 5 anos de transações esse data mart demandaria portanto um espaço de x 5 x 21 bytes < 8 MB. Normalmente o tamanho das dimensões é desprezado por ser bem menor que da tabela fato (Kimball, 1996). Em face da dimensão reduzida, esse data mart pode perfeitamente ser gerenciado em uma plataforma pequena com resultados satisfatórios. dim_time time_key full_date day_of_week dim_patron patron_key patron_id codigo dim_tipo_trans tipo_trans_key grupo acao_grupo fact_transações time_key item_key patron_key tipo_trans_key audit_key ocorrencia Figura 1. Esquema do data mart de circulação dim_item item_key item_id call_number dim_audit audit_key data_carga status_carga 3.3 AGREGAÇÃO DE VALOR DATA MINING Com base nos dados coletados, de acordo com o modelo apresentado, foi conduzido o estudo apresentado como motivação inicial dessa pesquisa. O estudo desenvolvido pelo professor Francisco Aranha (manuscrito), realizado com o uso de técnicas de data mining, propõe um modelo de cooperação indireta como forma de gerar listas de recomendação de itens para cada pesquisador registrado no sistema. Estas listas estão baseadas no comportamento de outros pesquisadores semelhantes a ele. 9

10 O modelo do data mart foi constantemente trabalhado de forma a possibilitar a execução e comportar os resultados desse estudo, tanto com relação ao modelo conceitual como à automatização do processo de carga e manutenção do sistema. O desenvolvimento do modelo de cooperação indireta (e o conseqüente retrabalho no data mart) segue a linha esquematizada na Figura 2. Data Mart Circulação Estabelecimento de assuntos significativos dim_item item_key Ass_signif lookup_ass_signif ass_signif chave_gr_tematico descricao dim_gr_tematicos chave_gr_tematico descricao n_grupos Processamento manual e interativo dim_patron patron_key patron_id codigo dim_grupos cluster chave_gr_tematico a0 a1 Definição dos grupos temáticos fact_lista item_key patron_key cluster rank dim_gr_tematicos chave_gr_tematico descricao n_grupos Segmentação dos usuários para cada grupo temático dim_item item_key Stored procedure lista_recom() Stored procedure segmenta() Construção de uma lista de recomendação para cada usuário em cada grupo temático dim_patron patron_key rh metod_socio marketing Detalhe_patron patron_key a0 a1 dim_grupos cluster chave_gr_tematico a0 Figura 2. Desenvolvimento do modelo de cooperação indireta Assuntos significativos O assunto significativo (AS) é um artifício utilizado para reduzir a cardinalidade dos assuntos através do tratamento da taxonomia da forma mais conveniente para o problema. Este procedimento é denominado consolidação (Aranha, manuscrito). Com isso os itens são agrupados em segmentos significativos em algum nível da hierarquia de assunto, de acordo com o número de transações associadas. Assim se o assunto , por exemplo, tiver um número grande de transações, ele será o assunto significativo para esse item. Senão a hierarquia será diminuída para 336.7, 336 etc. até que um desses assuntos seja significativo. Em relação ao modelo, a definição dos AS foi contemplada através da adição do atributo ass_signif na dimensão de itens. O estabelecimento dos AS foi realizado manualmente e esses assuntos não serão modificados em uma base regular, ou seja, a manutenção será feita esporadicamente. A automatização desse processo pode ser feita adotando-se um valor mínimo para o número de transações de um determinado assunto comparado com o total (ou um número máximo de assuntos significativos) e adicionando-se uma rotina simples no processo de carga das transações. No entanto foi decidido durante o desenho do sistema que a definição dos AS seria manual. 10

11 Ficou definida uma tabela chamada lookup_ass_signif com todos os AS, sua descrição e uma chave para a dimensão de grupos temáticos. A Tabela 1 mostra cada assunto já relacionado com um grupo temático de acordo com a fase seguinte do projeto: a definição dos grupos temáticos (GT). Tabela 1. Assuntos significativos definidos pela análise. Ass_signif Descrição Grupo temático 659 Publicidade e Propaganda. Relações Públicas. Marketing Marketing. Vendas. Distribuição. Marketing 34 Direito. Jurisprudência. Outros 651 Escritório. Outros 654 Telecomunicações e Telecontrole. Outros 62 Engenharia. Tecnologia em Geral. Outros 36 Assistência. Previdência. Seguridade Social. Outros Administração da Produção. Outros 2 Religião. Teologia. Outros 7 Arte. Esportes. Outros 8 Língua. Literatura. Outros 9 Geografia. Biografia. História. Outros 3 Ciências Sociais. Direito. Administração Outros Teoria Econômica. Conceitos de economia. Economia 339 Comércio Internacional. Economia Dinâmica Econômica. Economia 33 Economia. Economia 30 Metodologia. Metodologia/sociologia/pol./adm.publ. 35 Administração Pública. Governo. Assuntos Militares Metodologia/sociologia/pol./adm.publ. 31 Demografia. Sociologia. Metodologia/sociologia/pol./adm.publ. 32 Política. Metodologia/sociologia/pol./adm.publ. 657 Contabilidade. Contabilidade/materiais Comércio. Contabilidade/materiais Administração de Materiais. Contabilidade/materiais 61 Ciências Médicas. Adm. hospitalar 6 Ciências Aplicadas. Medicina. Tecnologia. Adm. hospitalar Administração. Adm. hospitalar 65 Organização e Administração. RH 1 Filosofia. Psicologia. RH Pessoal. Fator Humano. RH. RH 658 Administração de Empresas. Organização RH 331 Trabalho. Emprego. Economia do Trabalho. RH R Referência. Educação/antropologia 37 Educação. Ensino. Educação/antropologia 0 Generalidades. Ciência e Conhecimento. Educação/antropologia 39 Antropologia. Educação/antropologia 334 Cooperativismo Cooperativa/agricultura 68 Indústria. Cooperativa/agricultura 63 Agricultura. Cooperativa/agricultura 5 Matemática. Ciências Naturais. Finanças 336 Finanças Públicas. Finanças Finanças. Finanças 11

12 3.3.2 Grupos temáticos Esse passo também é realizado manualmente pois a definição não será alterada em uma base regular, ou seja, os 10 GT encontrados permanecerão inalterados até que se decida que devem mudar. A definição leva em conta um agrupamento dos AS de acordo com uma técnica de análise de cesta (Aranha, manuscrito). Cada grupo (ou cesta) de AS é um grupo temático. A análise definiu 10 GT (conforme a Tabela 1) que formaram a dimensão chamada dim_gr_tematicos Segmentação dos usuários A segmentação dos usuários é feita de forma a se encontrarem grupos de usuários semelhantes no seu comportamento quanto à retirada de itens com os mesmos assuntos significativos. O procedimento utilizou um algoritmo de análise de agrupamento (Aranha, manuscrito). Como forma de automatizar o processo esse algoritmo foi desenvolvido em uma stored procedure do SGBD (Sistema Gerenciador de Banco de Dados Informix ). O algoritmo é repetido para todos os grupos temáticos. Primeiramente é construída uma tabela chamada main com todos os usuários do grupo temático corrente e seu perfil de assuntos. Essa tabela é criada e destruída para cada grupo temático com base na tabela detalhe_patron. A tabela detalhe_patron constitui um snowflake, ou tabela marginal do data mart (Kimball, 1998) e serve para caracterizar os usuários com base nos assuntos significativos já consultados pelos mesmos. Ela é atualizada a cada carga no data mart. São definidas então sementes com valores aleatórios para todos os AS a partir da tabela main. Cada semente passa a ser um grupo na dimensão dim_grupos (Tabela 2). Tabela 2. Dim_grupos Colunas Descrição Cluster Chave única para os grupos Chave_gr_tematico Chave externa para o grupo temático correspondente a esse grupo. a0 Valor da semente correspondente a esse grupo nessa coordenada a1 " a9 " Ar " N_usuarios Nº de usuários nesse grupo Aos usuários são então atribuídos grupos de acordo com sua distância em relação às sementes em um processo iterativo até que o resultado seja estável entre duas iterações, ou seja, até que os grupos de cada usuário não se alterem. Com relação ao modelo de dados, a implementação desse agrupamento foi feita pela inclusão de 10 atributos na dimensão de usuários. Cada um desses campos é uma chave externa para a dimensão de grupos. Com isso se torna possível consultar o data mart com base em uma restrição pelo grupo, ou seja, é possível acessar as transações de certo indivíduo e de outros usuários do mesmo grupo (ou semelhantes a ele). Essa é a base para a construção das listas de recomendação, o último passo do processo Listas de recomendação A construção das listas de recomendação envolve na verdade a definição de outra tabela fato que chamamos fact_lista. Essa tabela fato tem três chaves externas para as 12

13 dimensões de usuários, itens e grupos; e uma medida chamada rank que corresponde à relevância da ligação respectiva. A automatização dessa etapa do processo também foi feita com o uso de uma stored procedure chamada lista_recom(). Essa stored procedure simplesmente cria uma tabela temporária com todas as transações que envolvam os grupos do qual participa o usuário em questão e insere na tabela fact_lista os itens distintos com um contador para os itens mais relevantes a medida rank. Para o preenchimento são descartados os itens que o usuário já retirou, de forma que só sejam recomendados os itens novos para ele. 4 ADEQUAÇÃO TECNOLÓGICA A adequação tecnológica diz respeito à adoção de uma solução mínima suficiente para o problema em questão. A conclusão dessa pesquisa é de que o melhor método para garantir essa adequação é a implementação do sistema por etapas, ou seja, de uma forma progressiva. Com relação ao modelo dimensional isso significa implementar um data mart de cada vez, na visão de Kimball, ou implementar o sistema iterativamente, na visão de Inmon. De qualquer forma essa implementação por etapas garante a possibilidade de conseguir resultados preliminares satisfatórios com um menor investimento inicial. O processo proposto por Kimball de implementação de um data mart de cada vez foi testada com sucesso no projeto piloto. Com relação à estrutura tecnológica, a implementação por etapas significa a adoção de uma solução distribuída para o data warehouse. A solução distribuída corresponde à implantação do sistema em vários servidores em uma rede, de forma que o sistema comece pequeno e cresça de acordo com a necessidade. Isso torna o custo inicial com hardware e software bem menor que em uma solução centralizada (Inmom, 1996). Ainda com relação ao hardware necessário, existe também a possibilidade lançada pela HP de adquirir uma máquina com capacity on demand. A máquina é adquirida com um número reduzido de recursos (de processamento e memória) que podem ser aumentados a medida em que forem necessários. Com relação ao back room, ou processo de data stage, a adequação tecnológica pode significar a adoção de uma solução temporária (desenvolvimento de código, por exemplo) nas primeiras fases do projeto. Um tipo de solução provisória também foi testada com sucesso no projeto piloto. E finalmente, com relação ao front room, pode ser adequado realizar processos simples de data mining e visualização sem o uso de uma ferramenta definitiva na fase inicial do projeto. Isso somente será viável se os usuários forem familiarizados com algum tipo de ferramenta de consulta (como o Access, cujo uso como ferramenta de front room foi testado no projeto). Com relação aos recursos humanos necessários, o mais comum nesses projetos é a contração de consultoria especializada (outsource). No caso de bibliotecas de escolas, fica a sugestão do incentivo aos alunos para que desenvolvam pesquisas para implementar os sistemas. 5 CONCLUSÃO Nessa pesquisa foram propostos um modelo e uma metodologia de implantação de um data mart (extensível para um data warehouse) para a circulação do acervo de bibliotecas genéricas. 13

14 O projeto piloto, desenvolvido na biblioteca Karl A. Boedecker, conseguiu testar com sucesso a metodologia proposta, além de ter dado suporte a um estudo de cooperação indireta com uso de técnicas de data mining. Também pudemos testar algumas técnicas de implantação desse tipo de tecnologia, entre elas a implantação de dois data marts relacionados e a realimentação de informações no data mart a partir de processamento externo. A pesquisa desenvolveu também abordagens para a adoção de uma solução tecnologicamente adequada, de forma a viabilizar projetos com baixo orçamento. Essas abordagens têm como enfoque tornar a implantação do sistema progressiva, reduzindo o custo inicial do projeto e permitindo que ele cresça à medida do necessário. Essa adequação tecnológica foi também amplamente testada no projeto piloto. As principais sugestões para a continuação da pesquisa são a integração completa do sistema desenvolvido com a Internet, além do uso do sistema para outros estudos baseadas em técnicas de data mining, como análise de redes. 6 REFERÊNCIAS BIBLIOGRÁFICAS ARANHA, Francisco. E-Service em Bibliotecas: Geração de Valor para Pesquisadores por Meio de Cooperação Indireta. Texto manuscrito ainda não publicado. BEAUMONT, Jane. Trends in Library Automation Endreço eletrônico: link válido em 15/11/1999 BERRY, Michael. J. A, LINOFF, Gordon. Data Mining Techniques for Marketing Sales and Customer Support, New York: John Wiley & Sons, 1997 BERSON, Alex, SMITH, Stephen J. Data Warehousing, Data Mining & OLAP, New York: McGraw-Hill, 1997 CABENA, Peter; et al. Discovering Data Mining. From Concept to Implementation. New York: Prentice Hall, 1997 DONNARD, Heloisa e BOREGAS, Edmilson. A experiência da biblioteca no processo de informatização. Documento apresentado no 1º Encontro Nacional de Usuários do VTLS, realizado na UERJ, Universidade Estadual do Rio de janeiro, RJ, 16 de setembro de 1998 CRESNER, H. Rumors of Data Mining's Demise Are Greatly Exaggerated. Gartner Research and Advisory Services, 11/11/1998. Endereço eletrônico: link válido em 12/04/2000. FARIAS, Andréa. A hora e a vez dos data marts. ComputerWorld, 06/04/1998. Endereço eletrônico: link válido em 15/04/2000. GIURLANI, Silvia. O pragmatismo dos negócios. ComputerWorld, 16/08/1999. Endereço eletrônico: link válido em 15/04/2000. GALLAS, Susan. Kimball Vs. Inmon. DM Review. Setembro Endereço eletrônico: link válido em 15/04/2000. HARRIS, K. e DRESNER, H. Business Intelligence Meets Knowledge Management. Gartner Research and Advisory Services, 01/03/1999. Endereço eletrônico: link válido em 12/04/

15 HERMIZ, Keith B., Ph.D. Critical Success Factors for Data Mining Projects. DM Review, Fevereiro Endereço eletrônico: link válido em 15/04/2000. INMON, Willian H. Building the Data Warehouse. 2.ed. New York: John Wiley & Sons, p. INMON, Willian H. Data Mart Does Not Equal Data Warehouse. DM Review. 01/05/1998. Endereço eletrônico: link válido em 15/04/2000. KIMBALL, Ralph. The Data Warehouse Toolkit: practical techniques for building dimensional data warehouses. New York: John Wiley & Sons, p. KIMBALL, Ralph; et al. The Data Warehouse Lifecycle Toolkit: expert methods for designing, developing, and deploying data warehouses. New York: John Wiley & Sons, p. KOHARI, Moiz. Unix, Windows NT and Linux. DM Review. Abril, Endereço eletrônico: link válido em 15/04/2000. LUMEK, Roberta, Information Technology and Libraries. Library Management, vol. 5 n. 3, MCB University Press. ORFALI, Robert; et al. Client/Server Survival Guide. 3ª ed. New York: John Wiley & Sons, p. PEPPERS, Don, ROGERS, Martha. Is your company ready for one-to-one marketing? Harvard Business Review, January-February 1999, p PRADO, Heloisa de A. Organização e Administração de Bibliotecas. 2.ed. São Paulo: T.A. Queiroz, RAMOS, Tagil O. Data Warehouse perde espaço para Data Mart nas empresas. ComputerWorld. 25/05/1998. Endereço eletrônico: link válido em 15/04/2000. STRANGE, K. Data Warehouse Enthusiasm Conceals Vendor Turmoil. Gartner Research and Advisory Services. 03/02/1999. Endereço eletrônico: link válido em 12/04/2000. STRANGE, K. Key Issues: Data Warehouse Operations and Manageability. Gartner Research and Advisory Services. 04/01/1999. Endereço eletrônico: link válido em 12/04/2000. THOMSEN, Erik. OLAP Solutions: building multidimensional information systems. New York: John Wiley & Sons, p. WESTPHAL, Christopher, BLAXTON Teresa. Data Mining Solutions: methods and tools for solving real-world problems. New York: John Wiley & Sons, p. 15

Aplicação A. Aplicação B. Aplicação C. Aplicação D. Aplicação E. Aplicação F. Aplicação A REL 1 REL 2. Aplicação B REL 3.

Aplicação A. Aplicação B. Aplicação C. Aplicação D. Aplicação E. Aplicação F. Aplicação A REL 1 REL 2. Aplicação B REL 3. Sumário Data Warehouse Modelagem Multidimensional. Data Mining BI - Business Inteligence. 1 2 Introdução Aplicações do negócio: constituem as aplicações que dão suporte ao dia a dia do negócio da empresa,

Leia mais

CONSIDERAÇÕES SOBRE ATIVIDADES DE IDENTIFICAÇÃO, LOCALIZAÇÃO E TRATAMENTO DE DADOS NA CONSTRUÇÃO DE UM DATA WAREHOUSE

CONSIDERAÇÕES SOBRE ATIVIDADES DE IDENTIFICAÇÃO, LOCALIZAÇÃO E TRATAMENTO DE DADOS NA CONSTRUÇÃO DE UM DATA WAREHOUSE CONSIDERAÇÕES SOBRE ATIVIDADES DE IDENTIFICAÇÃO, LOCALIZAÇÃO E TRATAMENTO DE DADOS NA CONSTRUÇÃO DE UM DATA WAREHOUSE Fabio Favaretto Professor adjunto - Programa de Pós Graduação em Engenharia de Produção

Leia mais

SUMÁRIO 1. INTRODUÇÃO... 2 2. O QUE É DATA WAREHOUSE?... 2 3. O QUE DATA WAREHOUSE NÃO É... 4 4. IMPORTANTE SABER SOBRE DATA WAREHOUSE... 5 4.

SUMÁRIO 1. INTRODUÇÃO... 2 2. O QUE É DATA WAREHOUSE?... 2 3. O QUE DATA WAREHOUSE NÃO É... 4 4. IMPORTANTE SABER SOBRE DATA WAREHOUSE... 5 4. SUMÁRIO 1. INTRODUÇÃO... 2 2. O QUE É DATA WAREHOUSE?... 2 3. O QUE DATA WAREHOUSE NÃO É... 4 4. IMPORTANTE SABER SOBRE DATA WAREHOUSE... 5 4.1 Armazenamento... 5 4.2 Modelagem... 6 4.3 Metadado... 6 4.4

Leia mais

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Planejamento Estratégico de TI. Prof.: Fernando Ascani Planejamento Estratégico de TI Prof.: Fernando Ascani Data Warehouse - Conceitos Hoje em dia uma organização precisa utilizar toda informação disponível para criar e manter vantagem competitiva. Sai na

Leia mais

Sistemas de Apoio à Decisão (SAD) - Senado

Sistemas de Apoio à Decisão (SAD) - Senado Sistemas de Apoio à Decisão (SAD) - Senado DW OLAP BI Ilka Kawashita Material preparado :Prof. Marcio Vitorino Sumário OLAP Data Warehouse (DW/ETL) Modelagem Multidimensional Data Mining BI - Business

Leia mais

Módulo 2. Definindo Soluções OLAP

Módulo 2. Definindo Soluções OLAP Módulo 2. Definindo Soluções OLAP Objetivos Ao finalizar este módulo o participante: Recordará os conceitos básicos de um sistema OLTP com seus exemplos. Compreenderá as características de um Data Warehouse

Leia mais

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO @ribeirord FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO Rafael D. Ribeiro, M.Sc,PMP. rafaeldiasribeiro@gmail.com http://www.rafaeldiasribeiro.com.br Lembrando... Aula 4 1 Lembrando... Aula 4 Sistemas de apoio

Leia mais

Modelo de dados do Data Warehouse

Modelo de dados do Data Warehouse Modelo de dados do Data Warehouse Ricardo Andreatto O modelo de dados tem um papel fundamental para o desenvolvimento interativo do data warehouse. Quando os esforços de desenvolvimentos são baseados em

Leia mais

Data Warehouses Uma Introdução

Data Warehouses Uma Introdução Data Warehouses Uma Introdução Alex dos Santos Vieira, Renaldy Pereira Sousa, Ronaldo Ribeiro Goldschmidt 1. Motivação e Conceitos Básicos Com o advento da globalização, a competitividade entre as empresas

Leia mais

Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence

Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence É um conjunto de conceitos e metodologias que, fazem uso de acontecimentos e sistemas e apoiam a tomada de decisões. Utilização de várias fontes de informação para se definir estratégias de competividade

Leia mais

Uma análise multidimensional dos dados estratégicos da empresa usando o recurso OLAP do Microsoft Excel

Uma análise multidimensional dos dados estratégicos da empresa usando o recurso OLAP do Microsoft Excel Uma análise multidimensional dos dados estratégicos da empresa usando o recurso OLAP do Microsoft Excel Carlos Alberto Ferreira Bispo (AFA) cafbispo@siteplanet.com.br Daniela Gibertoni (FATECTQ) daniela@fatectq.com.br

Leia mais

5 Estudo de Caso. 5.1. Material selecionado para o estudo de caso

5 Estudo de Caso. 5.1. Material selecionado para o estudo de caso 5 Estudo de Caso De modo a ilustrar a estruturação e representação de conteúdos educacionais segundo a proposta apresentada nesta tese, neste capítulo apresentamos um estudo de caso que apresenta, para

Leia mais

DESENVOLVIMENTO DE PLUG-INS KETTLE PARA GERAÇÃO DE MONDRIAN SCHEMA A PARTIR DE BASES RELACIONAIS, UTILIZANDO A METODOLOGIA AGILE ROLAP.

DESENVOLVIMENTO DE PLUG-INS KETTLE PARA GERAÇÃO DE MONDRIAN SCHEMA A PARTIR DE BASES RELACIONAIS, UTILIZANDO A METODOLOGIA AGILE ROLAP. DESENVOLVIMENTO DE PLUG-INS KETTLE PARA GERAÇÃO DE MONDRIAN SCHEMA A PARTIR DE BASES RELACIONAIS, UTILIZANDO A METODOLOGIA AGILE ROLAP. Eduardo Cristovo de Freitas Aguiar (PIBIC/CNPq), André Luís Andrade

Leia mais

Data Warehousing. Leonardo da Silva Leandro. CIn.ufpe.br

Data Warehousing. Leonardo da Silva Leandro. CIn.ufpe.br Data Warehousing Leonardo da Silva Leandro Agenda Conceito Elementos básicos de um DW Arquitetura do DW Top-Down Bottom-Up Distribuído Modelo de Dados Estrela Snowflake Aplicação Conceito Em português:

Leia mais

DATA WAREHOUSE. Introdução

DATA WAREHOUSE. Introdução DATA WAREHOUSE Introdução O grande crescimento do ambiente de negócios, médias e grandes empresas armazenam também um alto volume de informações, onde que juntamente com a tecnologia da informação, a correta

Leia mais

Curso Data warehouse e Business Intelligence Fundamentos, Metodologia e Arquitetura

Curso Data warehouse e Business Intelligence Fundamentos, Metodologia e Arquitetura Curso Data warehouse e Business Intelligence Fundamentos, Metodologia e Arquitetura Apresentação Os projetos de Data Warehouse e Business Intelligence são dos mais interessantes e complexos de desenvolver

Leia mais

Business Intelligence e ferramentas de suporte

Business Intelligence e ferramentas de suporte O modelo apresentado na figura procura enfatizar dois aspectos: o primeiro é sobre os aplicativos que cobrem os sistemas que são executados baseados no conhecimento do negócio; sendo assim, o SCM faz o

Leia mais

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE Engenharia de Computação Professor: Rosalvo Ferreira de Oliveira Neto OLPT x OLAP Roteiro OLTP Datawarehouse OLAP Operações OLAP Exemplo com Mondrian e Jpivot

Leia mais

Capítulo 1 - A revolução dos dados, da informação e do conhecimento 1 B12 4

Capítulo 1 - A revolução dos dados, da informação e do conhecimento 1 B12 4 Sumário Capítulo 1 - A revolução dos dados, da informação e do conhecimento 1 B12 4 Capítulo 2 - Reputação corporativa e uma nova ordem empresarial 7 Inovação e virtualidade 9 Coopetição 10 Modelos plurais

Leia mais

Curso Data warehouse e Business Intelligence

Curso Data warehouse e Business Intelligence Curso Data warehouse e Business Intelligence Fundamentos, Metodologia e Arquitetura Apresentação Os projetos de Data Warehouse e Business Intelligence são dos mais interessantes e complexos de desenvolver

Leia mais

Banco de Dados - Senado

Banco de Dados - Senado Banco de Dados - Senado Exercícios OLAP - CESPE Material preparado: Prof. Marcio Vitorino OLAP Material preparado: Prof. Marcio Vitorino Soluções MOLAP promovem maior independência de fornecedores de SGBDs

Leia mais

Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence

Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence Juntamente com o desenvolvimento desses aplicativos surgiram os problemas: & Data Warehouse July Any Rizzo Oswaldo Filho Década de 70: alguns produtos de BI Intensa e exaustiva programação Informação em

Leia mais

Professor: Disciplina:

Professor: Disciplina: Professor: Curso: Esp. Marcos Morais de Sousa marcosmoraisdesousa@gmail.com Sistemas de informação Disciplina: Introdução a SI Noções de sistemas de informação Turma: 01º semestre Prof. Esp. Marcos Morais

Leia mais

Data Warehouse. Diogo Matos da Silva 1. Universidade Federal de Ouro Preto, Ouro Preto, MG, Brasil. Banco de Dados II

Data Warehouse. Diogo Matos da Silva 1. Universidade Federal de Ouro Preto, Ouro Preto, MG, Brasil. Banco de Dados II Data Warehouse Diogo Matos da Silva 1 1 Departamento de Computação Universidade Federal de Ouro Preto, Ouro Preto, MG, Brasil Banco de Dados II Diogo Matos (DECOM - UFOP) Banco de Dados II Jun 2013 1 /

Leia mais

Prova INSS RJ - 2007 cargo: Fiscal de Rendas

Prova INSS RJ - 2007 cargo: Fiscal de Rendas Prova INSS RJ - 2007 cargo: Fiscal de Rendas Material de Apoio de Informática - Prof(a) Ana Lucia 53. Uma rede de microcomputadores acessa os recursos da Internet e utiliza o endereço IP 138.159.0.0/16,

Leia mais

Uma Ferramenta Web para BI focada no Gestor de Informação

Uma Ferramenta Web para BI focada no Gestor de Informação Uma Ferramenta Web para BI focada no Gestor de Informação Mikael de Souza Fernandes 1, Gustavo Zanini Kantorski 12 mikael@cpd.ufsm.br, gustavoz@cpd.ufsm.br 1 Curso de Sistemas de Informação, Universidade

Leia mais

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5 Para entender bancos de dados, é útil ter em mente que os elementos de dados que os compõem são divididos em níveis hierárquicos. Esses elementos de dados lógicos constituem os conceitos de dados básicos

Leia mais

BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES.

BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES. Encontro de Ensino, Pesquisa e Extensão, Presidente Prudente, 22 a 25 de outubro, 2012 88 BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES. Andrios Robert Silva Pereira, Renato Zanutto

Leia mais

CONHECIMENTOS ESPECÍFICOS

CONHECIMENTOS ESPECÍFICOS CONHECIMENTOS ESPECÍFICOS Acerca dos conceitos básicos de gerenciamento de projetos e considerando o PMBOK, julgue os itens a seguir. 51 No gerenciamento de um projeto, deve-se utilizar não apenas as ferramentas

Leia mais

Administração de Sistemas de Informação Gerenciais UNIDADE IV: Fundamentos da Inteligência de Negócios: Gestão da Informação e de Banco de Dados Um banco de dados é um conjunto de arquivos relacionados

Leia mais

Chapter 3. Análise de Negócios e Visualização de Dados

Chapter 3. Análise de Negócios e Visualização de Dados Chapter 3 Análise de Negócios e Visualização de Dados Objetivos de Aprendizado Descrever a análise de negócios (BA) e sua importância par as organizações Listar e descrever brevemente os principais métodos

Leia mais

Uma Arquitetura de Gestão de Dados em Ambiente Data Warehouse

Uma Arquitetura de Gestão de Dados em Ambiente Data Warehouse Uma Arquitetura de Gestão de Dados em Ambiente Data Warehouse Alcione Benacchio (UFPR) E mail: alcione@inf.ufpr.br Maria Salete Marcon Gomes Vaz (UEPG, UFPR) E mail: salete@uepg.br Resumo: O ambiente de

Leia mais

Kimball University: As 10 Regras Essenciais para a Modelagem de Dados Dimensional

Kimball University: As 10 Regras Essenciais para a Modelagem de Dados Dimensional Kimball University: As 10 Regras Essenciais para a Modelagem de Dados Dimensional Margy Ross Presidente Kimball Group Maio de 2009, Intelligent Enterprise.com Tradução livre para a língua portuguesa por

Leia mais

Processo Decisório, OLAP e Relatórios Corporativos OLAP E RELATÓRIOS CORPORATIVOS

Processo Decisório, OLAP e Relatórios Corporativos OLAP E RELATÓRIOS CORPORATIVOS Processo Decisório, OLAP e Relatórios Corporativos OLAP E RELATÓRIOS CORPORATIVOS Sumário Conceitos/Autores chave... 3 1. Introdução... 5 2. OLAP... 6 3. Operações em OLAP... 8 4. Arquiteturas em OLAP...

Leia mais

DATA WAREHOUSE. Rafael Ervin Hass Raphael Laércio Zago

DATA WAREHOUSE. Rafael Ervin Hass Raphael Laércio Zago DATA WAREHOUSE Rafael Ervin Hass Raphael Laércio Zago Roteiro Introdução Aplicações Arquitetura Características Desenvolvimento Estudo de Caso Conclusão Introdução O conceito de "data warehousing" data

Leia mais

Aplicação de Data Warehousing no Cadastro de Ficha Limpa do TSE

Aplicação de Data Warehousing no Cadastro de Ficha Limpa do TSE Aplicação de Data Warehousing no Cadastro de Ficha Limpa do TSE Mateus Ferreira Silva, Luís Gustavo Corrêa Lira, Marcelo Fernandes Antunes, Tatiana Escovedo, Rubens N. Melo mateusferreiras@gmail.com, gustavolira@ymail.com,

Leia mais

PLANO DE ENSINO DO 2º SEMESTRE LETIVO DE 2012

PLANO DE ENSINO DO 2º SEMESTRE LETIVO DE 2012 PLANO DE ENSINO DO 2º SEMESTRE LETIVO DE 2012 Curso: TECNOLOGIA EM GESTÃO COMERCIAL Habilitação: TECNÓLOGO Disciplina: NEGÓCIOS INTELIGENTES (BUSINESS INTELLIGENCE) Período: M V N 4º semestre do Curso

Leia mais

A aplicação do Business Intelligence no segmento de Saúde Pública Ambulatorial

A aplicação do Business Intelligence no segmento de Saúde Pública Ambulatorial A aplicação do Business Intelligence no segmento de Saúde Pública Ambulatorial Gilberto Capatina Valente 1, Newton Naoki Ahagon 1 1 Atech Tecnologias Críticas, São Paulo, SP Resumo Este artigo descreve

Leia mais

Data Warehouse Processos e Arquitetura

Data Warehouse Processos e Arquitetura Data Warehouse - definições: Coleção de dados orientada a assunto, integrada, não volátil e variável em relação ao tempo, que tem por objetivo dar apoio aos processos de tomada de decisão (Inmon, 1997)

Leia mais

Capítulo 2 Data Warehousing

Capítulo 2 Data Warehousing Capítulo 2 Data Warehousing Objetivos de Aprendizado Compreender as definições e os conceitos básicos dos data warehouses Compreender as arquiteturas de data warehousing Descrever os processos usados no

Leia mais

Data Warehouses. Alunos: Diego Antônio Cotta Silveira Filipe Augusto Rodrigues Nepomuceno Marcos Bastos Silva Roger Rezende Ribeiro Santos

Data Warehouses. Alunos: Diego Antônio Cotta Silveira Filipe Augusto Rodrigues Nepomuceno Marcos Bastos Silva Roger Rezende Ribeiro Santos Data Warehouses Alunos: Diego Antônio Cotta Silveira Filipe Augusto Rodrigues Nepomuceno Marcos Bastos Silva Roger Rezende Ribeiro Santos Conceitos Básicos Data Warehouse(DW) Banco de Dados voltado para

Leia mais

OS SISTEMAS DE APOIO À DECISÃO A SERVIÇO DO PROCESSO DE AVALIAÇÃO INSTITUCIONAL Estudo de Caso da Universidade do Vale do Itajaí

OS SISTEMAS DE APOIO À DECISÃO A SERVIÇO DO PROCESSO DE AVALIAÇÃO INSTITUCIONAL Estudo de Caso da Universidade do Vale do Itajaí OS SISTEMAS DE APOIO À DECISÃO A SERVIÇO DO PROCESSO DE AVALIAÇÃO INSTITUCIONAL Estudo de Caso da Universidade do Vale do Itajaí José Leomar Todesco, Dr Universidade do Vale Itajaí UNIVALI Rua Uruguai,

Leia mais

SAD orientado a DADOS

SAD orientado a DADOS Universidade do Contestado Campus Concórdia Curso de Sistemas de Informação Prof.: Maico Petry SAD orientado a DADOS DISCIPLINA: Sistemas de Apoio a Decisão SAD orientado a dados Utilizam grandes repositórios

Leia mais

SISTEMAS DE APOIO À DECISÃO SAD

SISTEMAS DE APOIO À DECISÃO SAD SISTEMAS DE APOIO À DECISÃO SAD Conceitos introdutórios Decisão Escolha feita entre duas ou mais alternativas. Tomada de decisão típica em organizações: Solução de problemas Exploração de oportunidades

Leia mais

Prof. Ronaldo R. Goldschmidt. ronaldo.rgold@gmail.com

Prof. Ronaldo R. Goldschmidt. ronaldo.rgold@gmail.com DATA WAREHOUSES UMA INTRODUÇÃO Prof. Ronaldo R. Goldschmidt ronaldo.rgold@gmail.com 1 DATA WAREHOUSES UMA INTRODUÇÃO Considerações Iniciais Conceitos Básicos Modelagem Multidimensional Projeto de Data

Leia mais

srbo@ufpa.br www.ufpa.br/srbo

srbo@ufpa.br www.ufpa.br/srbo CBSI Curso de Bacharelado em Sistemas de Informação BI Prof. Dr. Sandro Ronaldo Bezerra Oliveira srbo@ufpa.br www.ufpa.br/srbo Tópicos Especiais em Sistemas de Informação Faculdade de Computação Instituto

Leia mais

BUSINESS INTELLIGENCE -Inteligência nos Negócios-

BUSINESS INTELLIGENCE -Inteligência nos Negócios- UNIVERSIDADE SÃO FRANCISCO CENTRO DE CIÊNCIAS JURÍDICAS, HUMANAS E SOCIAIS BUSINESS INTELLIGENCE -Inteligência nos Negócios- Curso: Administração Hab. Sistemas de Informações Disciplina: Gestão de Tecnologia

Leia mais

Thiago Locatelli de OLIVEIRA, Thaynara de Assis Machado de JESUS; Fernando José BRAZ Bolsistas CNPq; Orientador IFC Campus Araquari

Thiago Locatelli de OLIVEIRA, Thaynara de Assis Machado de JESUS; Fernando José BRAZ Bolsistas CNPq; Orientador IFC Campus Araquari DESENVOLVIMENTO DE AMBIENTE PARA A GESTÃO DO CONHECIMENTO RELACIONADO AOS DADOS PRODUZIDOS PELO SISTEMA DE GERENCIAMENTO DE TRANSITO DA CIDADE DE JOINVILLE/SC PARTE I Thiago Locatelli de OLIVEIRA, Thaynara

Leia mais

DESMISTIFICANDO O CONCEITO DE ETL

DESMISTIFICANDO O CONCEITO DE ETL DESMISTIFICANDO O CONCEITO DE ETL Fábio Silva Gomes da Gama e Abreu- FSMA Resumo Este artigo aborda os conceitos de ETL (Extract, Transform and Load ou Extração, Transformação e Carga) com o objetivo de

Leia mais

KDD E MINERAÇÃO DE DADOS:

KDD E MINERAÇÃO DE DADOS: KDD E MINERAÇÃO DE DADOS: Revisão em Data Warehouses Prof. Ronaldo R. Goldschmidt ronaldo@de9.ime.eb.br rribeiro@univercidade.br geocities.yahoo.com.br/ronaldo_goldschmidt 1 DATA WAREHOUSES UMA VISÃO GERAL

Leia mais

KDD UMA VISAL GERAL DO PROCESSO

KDD UMA VISAL GERAL DO PROCESSO KDD UMA VISAL GERAL DO PROCESSO por Fernando Sarturi Prass 1 1.Introdução O aumento das transações comerciais por meio eletrônico, em especial as feitas via Internet, possibilitou as empresas armazenar

Leia mais

Adriano Maranhão BUSINESS INTELLIGENCE (BI),

Adriano Maranhão BUSINESS INTELLIGENCE (BI), Adriano Maranhão BUSINESS INTELLIGENCE (BI), BUSINESS INTELLIGENCE (BI) O termo Business Intelligence (BI), popularizado por Howard Dresner do Gartner Group, é utilizado para definir sistemas orientados

Leia mais

UNIVERSIDADE FEDERAL RURAL DE PERNAMBUCO PRÓ-REITORIA DE ENSINO DE GRADUAÇÃO

UNIVERSIDADE FEDERAL RURAL DE PERNAMBUCO PRÓ-REITORIA DE ENSINO DE GRADUAÇÃO UNIVERSIDADE FEDERAL RURAL DE PERNAMBUCO PRÓ-REITORIA DE ENSINO DE GRADUAÇÃO Rua Dom Manoel de Medeiros, s/n Dois Irmãos 52171-900 Recife-PE Fone: 0xx-81-332060-40 proreitor@preg.ufrpe.br PLANO DE ENSINO

Leia mais

Complemento I - Noções Introdutórias em Data Warehouses

Complemento I - Noções Introdutórias em Data Warehouses Complemento I - Noções Introdutórias em Data Warehouses Esse documento é parte integrante do material fornecido pela WEB para a 2ª edição do livro Data Mining: Conceitos, técnicas, algoritmos, orientações

Leia mais

Data Warehousing Visão Geral do Processo

Data Warehousing Visão Geral do Processo Data Warehousing Visão Geral do Processo Organizações continuamente coletam dados, informações e conhecimento em níveis cada vez maiores,, e os armazenam em sistemas informatizados O número de usuários

Leia mais

1. Centros de Competência de BI

1. Centros de Competência de BI Pagina: 1 1. Centros de Competência de BI Originalmente, o termo Centro de competência de BI (conhecido também como BICC Business Intelligence Competence Center) foi utilizado pelo instituto de pesquisa

Leia mais

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan Faculdade INED Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan 1 Unidade 4.2 2 1 BI BUSINESS INTELLIGENCE BI CARLOS BARBIERI

Leia mais

Integração Access-Excel para produzir um sistema de apoio a decisão que simula um Data Warehouse e OLAP

Integração Access-Excel para produzir um sistema de apoio a decisão que simula um Data Warehouse e OLAP Integração Access-Excel para produzir um sistema de apoio a decisão que simula um Data Warehouse e OLAP Wílson Luiz Vinci (Faculdades IPEP) wilson@cnptia.embrapa.br Marcelo Gonçalves Narciso (Embrapa Informática

Leia mais

1. Biblioteca. 2. Infra-Estrutura. 2.1 Espaço físico

1. Biblioteca. 2. Infra-Estrutura. 2.1 Espaço físico Biblioteca UPIS 1 SUMÁRIO 1. Biblioteca... 3 2. Infra-Estrutura... 3 2.1 Espaço físico... 3 Campus I... 3 Instalações para estudos individuais... 3 Instalações para estudos em grupo... 3 3. Acervo Bibliográfico...

Leia mais

Uma estrutura (framework) para o Business Intelligence (BI)

Uma estrutura (framework) para o Business Intelligence (BI) Uma estrutura conceitural para suporteà decisão que combina arquitetura, bancos de dados (ou data warehouse), ferramentas analíticas e aplicações Principais objetivos: Permitir o acesso interativo aos

Leia mais

DATA WAREHOUSE. Data Warehouse

DATA WAREHOUSE. Data Warehouse DATA WAREHOUSE Data Warehouse Sumário Conceitos / Autores chave... 3 1. Introdução... 5 2. Características de um Data Warehouse... 6 3. Arquitetura de Data Wirehouse... 8 4. Conclusões... 10 Materiais

Leia mais

Oficina. Praça das Três Caixas d Água Porto Velho - RO

Oficina. Praça das Três Caixas d Água Porto Velho - RO Oficina Praça das Três Caixas d Água Porto Velho - RO Oficina Ministrante: Marcel Leite Rios Apresentação Pessoal Marcel Leite Rios Prof. de Informática IFRO Graduado: Sistemas de Informação - ULBRA MBA

Leia mais

PROJETO DE REDES www.projetoderedes.com.br

PROJETO DE REDES www.projetoderedes.com.br PROJETO DE REDES www.projetoderedes.com.br Centro Universitário de Volta Redonda - UniFOA Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro

Leia mais

DATA WAREHOUSING. Data Warehousing

DATA WAREHOUSING. Data Warehousing DATA WAREHOUSING Data Warehousing Sumário Conceitos / Autores chave... 3 1. Introdução... 3 2. Modelos de Data Warehouse... 4 3. Processo de Extração, Transformação e Carga de Dados... 6 4. Data Mart versus

Leia mais

Trata-se de uma estratégia de negócio, em primeira linha, que posteriormente se consubstancia em soluções tecnológicas.

Trata-se de uma estratégia de negócio, em primeira linha, que posteriormente se consubstancia em soluções tecnológicas. CUSTOMER RELATIONSHIP MANAGEMENT Customer Relationship Management CRM ou Gestão de Relacionamento com o Cliente é uma abordagem que coloca o cliente no centro dos processos do negócio, sendo desenhado

Leia mais

Uma Ferramenta WEB para apoio à Decisão em Ambiente Hospitalar

Uma Ferramenta WEB para apoio à Decisão em Ambiente Hospitalar Uma Ferramenta WEB para apoio à Decisão em Ambiente Hospitalar Mikael de Souza Fernandes 1, Gustavo Zanini Kantorski 12 mikael@cpd.ufsm.br, gustavoz@cpd.ufsm.br 1 Curso de Sistemas de Informação, Universidade

Leia mais

Palavras-chave: On-line Analytical Processing, Data Warehouse, Web mining.

Palavras-chave: On-line Analytical Processing, Data Warehouse, Web mining. BUSINESS INTELLIGENCE COM DADOS EXTRAÍDOS DO FACEBOOK UTILIZANDO A SUÍTE PENTAHO Francy H. Silva de Almeida 1 ; Maycon Henrique Trindade 2 ; Everton Castelão Tetila 3 UFGD/FACET Caixa Postal 364, 79.804-970

Leia mais

No mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o

No mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o DATABASE MARKETING No mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o empresário obter sucesso em seu negócio é

Leia mais

Bloco Administrativo

Bloco Administrativo Bloco Administrativo BI Business Intelligence Objetivo O objetivo deste artigo é dar uma visão geral sobre o Módulo Business Intelligence, que se encontra no Bloco Administrativo. Todas informações aqui

Leia mais

ADMINISTRAÇÃO DOS RECURSOS DE DADOS

ADMINISTRAÇÃO DOS RECURSOS DE DADOS Capítulo 7 ADMINISTRAÇÃO DOS RECURSOS DE DADOS 7.1 2003 by Prentice Hall OBJETIVOS Por que as empresas sentem dificuldades para descobrir que tipo de informação precisam ter em seus sistemas de informação?

Leia mais

Engenharia de Software

Engenharia de Software CENTRO UNIVERSITÁRIO NOVE DE JULHO Profº. Edson T. França edson.franca@uninove.br Software Sistemas Conjunto de elementos, entre os quais haja alguma relação Disposição das partes ou dos elementos de um

Leia mais

Tópicos Avançados Business Intelligence. Banco de Dados Prof. Otacílio José Pereira. Unidade 10 Tópicos Avançados Business Inteligence.

Tópicos Avançados Business Intelligence. Banco de Dados Prof. Otacílio José Pereira. Unidade 10 Tópicos Avançados Business Inteligence. Tópicos Avançados Business Intelligence Banco de Dados Prof. Otacílio José Pereira Unidade 10 Tópicos Avançados Business Inteligence Roteiro Introdução Níveis organizacionais na empresa Visão Geral das

Leia mais

Banco de Dados. Aula 1 - Prof. Bruno Moreno 16/08/2011

Banco de Dados. Aula 1 - Prof. Bruno Moreno 16/08/2011 Banco de Dados Aula 1 - Prof. Bruno Moreno 16/08/2011 Roteiro Apresentação do professor e disciplina Definição de Banco de Dados Sistema de BD vs Tradicional Principais características de BD Natureza autodescritiva

Leia mais

UNIVERSIDADE CATÓLICA PORTUGUESA Centro Regional das Beiras Pólo de Viseu Instituto Universitário de Desenvolvimento e Promoção Social

UNIVERSIDADE CATÓLICA PORTUGUESA Centro Regional das Beiras Pólo de Viseu Instituto Universitário de Desenvolvimento e Promoção Social UNIVERSIDADE CATÓLICA PORTUGUESA Centro Regional das Beiras Pólo de Viseu Instituto Universitário de Desenvolvimento e Promoção Social DISCIPLINA Controlo Informático da Gestão LICENCIATURA Informática

Leia mais

BANCO DE DADOS E BUSINESS INTELIGENCE. C/H: 20 horas (20/02, 25/02, 27/02, 04/03, 06/03)

BANCO DE DADOS E BUSINESS INTELIGENCE. C/H: 20 horas (20/02, 25/02, 27/02, 04/03, 06/03) MBA em Gestão de TI MÓDULO: BANCO DE DADOS E BUSINESS INTELIGENCE C/H: 20 horas (20/02, 25/02, 27/02, 04/03, 06/03) PROFESSOR: Edison Andrade Martins Morais prof@edison.eti.br http://www.edison.eti.br

Leia mais

DataDoc 4.0 Sistema de Gestão de Arquivos. Características do Sistema

DataDoc 4.0 Sistema de Gestão de Arquivos. Características do Sistema DataDoc 4.0 Sistema de Gestão de Arquivos O software DataDoc 4.0 tem como finalidade automatizar a gestão de acervos documentais, englobando todas as fases da documentação. Totalmente desenvolvido em plataforma

Leia mais

Sistemas de Apoio à Inteligência do Negócio

Sistemas de Apoio à Inteligência do Negócio Sistemas de Apoio à Inteligência do Negócio http://www.uniriotec.br/~tanaka/sain tanaka@uniriotec.br Visão Geral de Business Intelligence Evolução dos Sistemas de Informação (computadorizados) 1950 s:

Leia mais

AQUISIÇÃO / INVENTÁRIO. Integração dos módulos de aquisição (sugestões/indicações de compra) com o módulo de tratamento da informação

AQUISIÇÃO / INVENTÁRIO. Integração dos módulos de aquisição (sugestões/indicações de compra) com o módulo de tratamento da informação AQUISIÇÃO / INVENTÁRIO / NÃO 1 Integração dos módulos de aquisição (sugestões/indicações de compra) com o módulo de tratamento da informação Registro de sugestões de compra de materiais bibliográficos

Leia mais

Personalização de Sistemas WEB utilizando Data Mining: um estudo de caso aplicado na Biblioteca Central da FURB

Personalização de Sistemas WEB utilizando Data Mining: um estudo de caso aplicado na Biblioteca Central da FURB Personalização de Sistemas WEB utilizando Data Mining: um estudo de caso aplicado na Biblioteca Central da FURB Alberto Pereira de Jesus (FURB) albertop@ifurb.br Evanilde Maria Moser (FURB) emmoser@furb.br

Leia mais

Aplicando Técnicas de Business Intelligence sobre dados de desempenho Acadêmico: Um estudo de caso

Aplicando Técnicas de Business Intelligence sobre dados de desempenho Acadêmico: Um estudo de caso Aplicando Técnicas de Business Intelligence sobre dados de desempenho Acadêmico: Um estudo de caso Ana Magela Rodriguez Almeida 1, Sandro da Silva Camargo 1 1 Curso Engenharia de Computação Universidade

Leia mais

A evolução da tecnologia da informação nos últimos 45 anos

A evolução da tecnologia da informação nos últimos 45 anos A evolução da tecnologia da informação nos últimos 45 anos Denis Alcides Rezende Do processamento de dados a TI Na década de 1960, o tema tecnológico que rondava as organizações era o processamento de

Leia mais

Fundamentos da inteligência de negócios: gestão da informação e de bancos de dados

Fundamentos da inteligência de negócios: gestão da informação e de bancos de dados Fundamentos da inteligência de negócios: gestão da informação e de bancos de dados slide 1 1 Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall Objetivos de estudo Como um banco de dados

Leia mais

CRM Analítico e ferramentas de Business Intelligence na gerência de eventos técnico-científicos

CRM Analítico e ferramentas de Business Intelligence na gerência de eventos técnico-científicos CRM Analítico e ferramentas de Business Intelligence na gerência de eventos técnico-científicos Anelise Birckan Frank Siqueira {anelise, frank}@inf.ufsc.br Resumo Sistemas operacionais de cadastro armazenam

Leia mais

Banco de Dados - Senado

Banco de Dados - Senado Banco de Dados - Senado Introdução Ilka Kawashita Material preparado :Prof. Marcio Vitorino Ementa do Curso n Banco de Dados n Sistemas de Apoio à Decisão (SAD) n ORACLE BANCO DE DADOS (BD) n Modelo Entidade

Leia mais

MSc. Daniele Carvalho Oliveira

MSc. Daniele Carvalho Oliveira MSc. Daniele Carvalho Oliveira AULA 2 Administração de Banco de Dados: MSc. Daniele Oliveira 2 CONCEITOS FUNDAMENTAIS DE BANCO DE DADOS Administração de Banco de Dados: MSc. Daniele Oliveira 3 Conceitos

Leia mais

Aula 03 CLASSIFICAÇÃO DOS SISTEMAS DE INFORMAÇÃO

Aula 03 CLASSIFICAÇÃO DOS SISTEMAS DE INFORMAÇÃO Aula 03 CLASSIFICAÇÃO DOS SISTEMAS DE INFORMAÇÃO Na prática, não existe uma classificação rígida, permitindo aos autores e principalmente as empresas classificar seus sistemas de diversas maneiras. A ênfase

Leia mais

Empresa de Informática e Informação do Município de Belo Horizonte S/A PRODABEL

Empresa de Informática e Informação do Município de Belo Horizonte S/A PRODABEL Empresa de Informática e Informação do Município de Belo Horizonte S/A PRODABEL Diretoria de Sistema - DS Superintendência de Arquitetura de Sistemas - SAS Gerência de Arquitetura de Informação - GAAS

Leia mais

Data Warehouse Granularidade. rogerioaraujo.wordpress.com twitter: @rgildoaraujo - rgildoaraujo@gmail.com 1

Data Warehouse Granularidade. rogerioaraujo.wordpress.com twitter: @rgildoaraujo - rgildoaraujo@gmail.com 1 Data Warehouse Granularidade rogerioaraujo.wordpress.com twitter: @rgildoaraujo - rgildoaraujo@gmail.com 1 Granularidade A granularidade de dados refere-se ao nível de sumarização dos elementos e de detalhe

Leia mais

TÉCNICAS DE INFORMÁTICA WILLIAN FERREIRA DOS SANTOS

TÉCNICAS DE INFORMÁTICA WILLIAN FERREIRA DOS SANTOS TÉCNICAS DE INFORMÁTICA WILLIAN FERREIRA DOS SANTOS Vimos em nossas aulas anteriores: COMPUTADOR Tipos de computadores Hardware Hardware Processadores (CPU) Memória e armazenamento Dispositivos de E/S

Leia mais

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan Faculdade INED Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan 1 Unidade 4.4 2 1 BI BUSINESS INTELLIGENCE BI CARLOS BARBIERI

Leia mais

Padronização de Processos: BI e KDD

Padronização de Processos: BI e KDD 47 Padronização de Processos: BI e KDD Nara Martini Bigolin Departamento da Tecnologia da Informação -Universidade Federal de Santa Maria 98400-000 Frederico Westphalen RS Brazil nara.bigolin@ufsm.br Abstract:

Leia mais

Qualidade de Dados em Data Warehouse

Qualidade de Dados em Data Warehouse Qualidade de Dados em Data Warehouse Prof. Dr. Jorge Rady de Almeida Jr. Escola Politécnica da USP C/1 Relevância do Tema Principal motivação p/ manter alta QD: impactos nos lucros DW: tomada de decisões

Leia mais

Tecnologias e Sistemas de Informação

Tecnologias e Sistemas de Informação Universidade Federal do Vale do São Francisco Curso de Administração Tecnologia e Sistemas de Informação - 02 Prof. Jorge Cavalcanti jorge.cavalcanti@univasf.edu.br www.univasf.edu.br/~jorge.cavalcanti

Leia mais

Conceitos de Banco de Dados

Conceitos de Banco de Dados Conceitos de Banco de Dados Autor: Luiz Antonio Junior 1 INTRODUÇÃO Objetivos Introduzir conceitos básicos de Modelo de dados Introduzir conceitos básicos de Banco de dados Capacitar o aluno a construir

Leia mais

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan Faculdade INED Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan 1 Unidade 4.3 2 1 BI BUSINESS INTELLIGENCE BI CARLOS BARBIERI

Leia mais

Arquitetura de Disseminação de Informações baseada em Datawarehouse 05/04/2006

Arquitetura de Disseminação de Informações baseada em Datawarehouse 05/04/2006 Arquitetura de Disseminação de Informações baseada em Datawarehouse 05/04/2006 Agenda A Informal Perspectiva Histórica Modelos de Arquitetura Benefícios para Gestão Caso de Referência Agenda A Informal

Leia mais

Business Intelligence Um enfoque gerencial para a Inteligência do Negócio.Efrain Turban e outros.tradução. Bookman, 2009.

Business Intelligence Um enfoque gerencial para a Inteligência do Negócio.Efrain Turban e outros.tradução. Bookman, 2009. REFERÊNCIAS o o Business Intelligence Um enfoque gerencial para a Inteligência do Negócio.Efrain Turban e outros.tradução. Bookman, 2009. Competição Analítica - Vencendo Através da Nova Ciência Davenport,

Leia mais

Unidade III PRINCÍPIOS DE SISTEMAS DE. Prof. Luís Rodolfo

Unidade III PRINCÍPIOS DE SISTEMAS DE. Prof. Luís Rodolfo Unidade III PRINCÍPIOS DE SISTEMAS DE INFORMAÇÃO Prof. Luís Rodolfo Vantagens e desvantagens de uma rede para a organização Maior agilidade com o uso intenso de redes de computadores; Grandes interações

Leia mais

COMO OBTER VANTAGEM COMPETITIVA UTILIZANDO BUSINESS INTELLIGENCE?

COMO OBTER VANTAGEM COMPETITIVA UTILIZANDO BUSINESS INTELLIGENCE? COMO OBTER VANTAGEM COMPETITIVA UTILIZANDO BUSINESS INTELLIGENCE? Avanilde Kemczinski Dra. Resumo: Este artigo tem por objetivo definir Business Intelligence e identificar as tecnologias de informação

Leia mais