Modelagem de um Data Warehouse para mineração de dados sobre beneficiários de um plano de Saúde.

Tamanho: px
Começar a partir da página:

Download "Modelagem de um Data Warehouse para mineração de dados sobre beneficiários de um plano de Saúde."

Transcrição

1 Universidade Estadual de Maringá Centro de Tecnologia - Departamento de Informática Especialização em Desenvolvimento de Sistemas para Web Wlademir Amaro de Mello Modelagem de um Data Warehouse para mineração de dados sobre beneficiários de um plano de Saúde. Maringá - Pr Março de 2013

2 Universidade Estadual de Maringá Centro de Tecnologia - Departamento de Informática Especialização em Desenvolvimento de Sistemas para Web Wlademir Amaro de Mello Modelagem de um Data Warehouse para mineração de dados sobre beneficiários de um plano de Saúde. Monografia apresentada ao curso de Especialização em Desenvolvimento de Sistemas para WEB Turma 8. Maringá - Pr Março de 2013

3

4 Universidade Estadual de Maringá Centro de Tecnologia - Departamento de Informática Especialização em Desenvolvimento de Sistemas para Web Wlademir Amaro de Mello Modelagem de um Data Warehouse para mineração de dados sobre beneficiários de um plano de Saúde. Maringá 26 de Março de 2013 Prof. Dra. Maria Madalena Dias Prof. Dr. Renato Balancieri Prof. Dr. Wesley Romão (Orientador) Ass.: Ass.: Ass.:

5 Sumário 1 Introdução Objetivo Geral Objetivos Específicos Metodologia Fundamentação Teórica KDD Seleção de Atributos Data Warehouse Arquitetura de um Data Warehouse Modelagem Dimensional Tecnologia OLAP Estrutura Multidimensional Implementação Ferramentas Utilizadas Área de Negócio e Dados Armazenados Pré-processamento e Transformação dos dados Projeto Conclusões e Trabalhos Futuros Referências Bibliográficas Anexos... 57

6 Lista de Legendas BI CID DW JDBC JCP MD KDD OLAM OLAP OLTP ROLAP SAD SGBD SQL Business Intelligence Classificação Internacional de Doenças Data Warehouse Java Database Connectivety Java Communyt Process Mineração de Dados Knowledge Discovery in Databases On-Line Analytical Mining On-Line Analytical Processing On-Line Transaction Processing Relational On-Line Analytical Processing Sistemas de Apoio à Decisão Sistema Gerenciador de Banco de Dados Structured Query Language

7 Lista de Figuras Figura 1 - Etapas do Processo KDD (Fayyad et al., 1996) Figura 2 - Elementos do DW (Kimball et al, 2002) Figura 3 - Modelo Estrela Figura 4 - Modelo Floco de Neve Figura 5 - Consulta para ranking de Fatos Figura 6 - Estrutura das tabelas GRS_GUIA_EVENTO e GRS_GUIA Figura 7 - Consulta para identificação de Dimensões Figura 8 - Modelo do DW gerado Figura 9 - Tela de Login pública Figura 10 - Pentaho Analysis View Figura 11 - Resultado de consulta multidimensional utilizando filtros... 52

8 Lista de Tabelas Tabela 1 - Tabela de exemplo de Fato Tabela 2 - Tabela de exemplo de Dimensão Tabela 3 - Metadados Utilizados Tabela 4 - Descrição das Tabelas... 41

9

10 Resumo Extrair conhecimentos de bases de dados de corporações tem sido uma realidade nos dias de hoje. Percorrer todas as fases do processo de descoberta de conhecimento sempre que se deseja realizar um estudo sobre Mineração de Dados acaba por ser um processo moroso e custoso. Este trabalho tem como objetivo criar um Data Warehouse utilizando Metadados do SGBD, e em conjunto com uma ferramenta BI (Business Intelligence) disponibilizar consultas multidimensionais e assim atingir o objetivo que é definir um conjunto final de dados para Mineração. O trabalho contribui evidenciando que é possível criar um Data Warehouse com Metadados do SGBD e exportar estes dados para mineração com uma ferramenta de BI. Palavras-Chave: Descoberta de Conhecimento em Banco de Dados, Data Warehouse, Metadados, Mineração de Dados.

11 Abstract Extract knowledge from corporation's databases has been a reality nowadays. Browse all stages whenever you wish to conduct a study on Data Mining turns out to be a lengthy and costly process. This work aims to create a Data Warehouse to DBMS using Meta Data, and in conjunction with a tool BI (Business Intelligence) provide multidimensional queries and thus achieve the goal is to define a final set of data to Data Mining. The work contributes showing that it is possible to create a Data Warehouse DBMS with Meta data and export these data for data mining with a BI tool. Keywords: Knowledge discovery in databases, Data Warehouse, Data Mining, Meta Data.

12 14 1 Introdução Os sistemas de informação vêm abrangendo cada vez mais as regras de negócio dos mais diversos ramos de atividade. Tal fenômeno tem colaborado para que a utilização desses sistemas seja quase uma obrigação, pois, tanto as entidades científicas vêm buscando a introdução, aprimoramento e descoberta de novas tecnologias quanto o mercado de negócios busca se defender de ameaças provenientes da concorrência do meio comercial e falhas em seus processos administrativos. Em busca de alcançar resultados, sistemas têm gerado uma significativa massa de dados em seus SGBDs (Sistemas Gerenciadores de Banco de Dados). Do ponto de vista de espaço para armazenamento, a quantidade de informações não apresenta problema porque nos dias atuais é comum encontrar dispositivos que armazenam mais de um terabyte de dados. O desafio está em visualizar informações além do óbvio que os sistemas já mostram. Base de dados grandes tornam-se problemáticas para consultas e a complexidade em relacionar os dados torna-se mais árdua devido as informações ficarem esparsas e desbalanceadas. O Data Warehouse (DW) é um ambiente com finalidade de extrair, integrar, limpar e dar consistência aos dados provenientes dos sistemas transacionais. Um DW proporciona a consolidação e dimensionamento dos dados, organizando-os e melhorando o desempenho das consultas. Juntando essas características com as ferramentas OLAP (On-Line Analytical Processing) é possível viabilizar a construção de um ambiente no qual os analistas de negócio

13 15 possam facilmente navegar pelos dados, realizando consultas ad hoc, fazendo novos cruzamentos entre as dimensões de análise sem sentir a dificuldade que a vasta quantidade de informações causaria. Uma vez que o DW organiza os dados, pré-selecionados por um especialista de uma área de conhecimento ou "Negócio", esses dados podem ser submetidos a técnicas de mineração de dados com o intuito de descobrir padrões de comportamento e de novos conhecimentos sobre os dados armazenados, sendo que esses conhecimentos dificilmente seriam encontrados diretamente pelo sistema. Neste trabalho é descrita uma experiência de pré-processamento de dados com a utilização de ferramentas de BI (Business Intelligence), afim de gerar dados para utilização de técnicas de Descoberta de Conhecimento em Banco de Dados, também conhecido como KDD (Knowledge Discovery in Databases). O estudo segue um formato de pesquisa bibliográfica, criação e implementação de um DW modelando as tabelas de fatos geradores, utilização e estudo de técnicas como OLAP. Os dados para ensaio e teste das técnicas abordadas se referem ao nicho de negócios de Planos de Saúde Suplementar. 1.1 Objetivo Geral Criar um Data Warehouse com dados de um plano de saúde suplementar integrado com a ferramenta de BI Pentaho de forma a possibilitar a exportação de dados para ensaio com algoritmos de Mineração de Dados.

14 Objetivos Específicos Utilizar os metadados do SGBD para identificar as tabelas de fatos e dimensões para a criação do Data Warehouse. Acelerar o processo de mineração de dados substituindo as fases de seleção, pré-rocessamento e transformação de dados pelo Data Warehouse criado. Parametrização do Data Warehose na ferramenta Pentaho para execução de consultas multidimensionais, filtrar dados conforme necessidade de exclusão de informação e exportação dos dados para um arquivo texto de forma a facilitar a utilização de ferramentas de mineração de dados. 1.3 Metodologia Este trabalho obedece o padrão exploratório, no qual é utilizado dados em que o domínio da aplicação se refere à Administração de Planos de Saúde. A base de dados fornecen objetos para criação de um Data Warehouse que será desenvolvido com a exploração dos Metadados do SGBD. O data warehouse vai ser aplicado no processo de descoberta de conhecimento proposto por Fayyad et al. (1996) descrito com detalhes na Sessão 2.1, sua finalidade é substituir as três

15 17 primeiras fases que são de pré-processamento de dados. Com o apoio da Ferramenta Pentaho e a funcionalidade OLAP, o data warehouse resultante da análise dos Metadados serão trabalhados de forma a serem exportados para Futuros testes de mineração de dados. Este trabalho está dividido em quatro capítulos: trabalho. O primeiro capítulo é introdutório especificando a abrangência do No segundo capítulo é esplanada a teoria sobre os conceitos utilizados no desenvolvimento do projeto. No terceiro capítulo são demonstradas as implementações como a utilização de consultas em visões estáticas do banco que refletem informações dos Metadados fornecendo dados quantitativas referente ao modelo relacional, identificação das tabelas de fatos e suas possíveis dimensões até a definição do modelo do data warehouse gerado. Também é demonstrado como a ferramenta OLAP possibilita consultas e filtros para exportação dos dados. futuros. O quarto capítulo contem as conclusões e sugestões para trabalhos

16 18 2 Fundamentação Teórica Neste capítulo é apresentado o estado da arte demonstrando sobre os assuntos de KDD, Data Warehouse, OLAP e Mineração de Dados. É feita a exposição dos principais conceitos e a importância de cada um no processo decisório, mostrando sua relevância para os dias atuais. 2.1 KDD KDD (KNOWLEDGE DISCOVERY IN DATABASE) é um processo interativo e iterativo, que se desdobra em cinco atividades (Fayyad et al., 1996): Seleção dos Atributos, Pré-processamento, Limpeza dos dados, Transformação dos dados e Mineração de Dados. KDD é interativo devido à interferência do homem colaborando nos processos, utilizando ferramentas computacionais para análise e interpretação dos dados. É Iterativo por ter o nível de acoplamento muito forte entre o progresso das etapas que o processo exige que seja percorrida. O ponto negativo por essa iteratividade é que o resultado satisfatório nem sempre é alcançado.

17 19 Idealizarmos o fluxo proposto no KDD, cada etapa dependente da anterior para sua continuidade, a não identificação de falha em alguma das etapas pode prejudicar as seguintes. Para ser mais claro, supondo que uma falha na transformação de dados aconteça e não seja identificada, a aplicação de alguma técnica de MD sobre os dados gerados, acabaria tornando-se um esforço perdido. Interpretação Pré-processamento Transformação Data Mining Conhecimento Seleção Padrões Dados Dados Relevantes Dados Pré-processados Dados Transformados Figura 1 - Etapas do Processo KDD (Fayyad et al., 1996) A Figura 1 representa um dos processos mais utilizados para descoberta de conhecimento em banco de dados. Segue uma breve descrição das etapas do processo: Seleção: Esta fase possui impacto significativo sobre a qualidade do resultado final, nela é escolhido o conjunto de dados contendo todas as possíveis variáveis (características, atributos) e registros que farão parte da análise. A escolha dos dados pode ficar a critério de um especialista do domínio, ou seja, alguém que realmente entende do assunto em questão. A etapa ainda pode

18 20 ganhar uma complexidade maior se os dados não vierem de uma única fonte, pois hoje as empresas têm sistemas legados 1 que podem ter as informações descentralizadas, o que acrescenta esforço em identificar os relacionamentos entre as informações que não estejam em um mesmo banco de dados e até mesmo um problema para captação da informação. Pré-processamento e Limpeza: A qualidade dos dados tem uma responsabilidade significativa em determinar a eficiência dos algoritmos de mineração. Eliminar dados redundantes e inconsistentes, recuperar dados incompletos e identificar dados discrepantes no conjunto. Transformação dos Dados: Nesta etapa os dados necessitam ser armazenados e formatados para que os algoritmos possam ser aplicados. Como mencionado na etapa de seleção, os dados podem estar descentralizados, ou seja, em base de dados diferentes, então é neste ponto que a dispersão dos dados deve ser eliminada fazendo com que as informações se concentrem em um único repositório central. Após a centralização dos dados é possível enxergar alternativas de melhoras na transformação dos dados e criação de novos atributos, os chamados dados derivados. Mineração de Dados: Quando se procura por assuntos relacionados a BI percebe-se que a Mineração de Dados é a parte do processo no qual se tem mais destaque. De forma automática ou semiautomática é executada uma análise nos 1 Sistemas Legados segundo (Sommerville, 2007), são sistemas antigos e fundamentais para o funcionamento da empresa

19 21 dados que foram tratados e centralizados com o intuito de se obter regras e padrões. Interpretação e Avaliação: Estatísticos, pesquisadores de IA (Inteligência Artificial) e administradores de bancos de dados usam técnicas diferentes para interpretar e avaliar os resultados obtidos com a mineração, acessando assim a informação que não era visível. 2.2 Seleção de Atributos Trata-se de uma técnica em que um subconjunto de atributos é selecionado com a finalidade de se aplicar algoritmos de MD. O resultado deverá fornecer informação referente à qualidade dos atributos na tarefa de extrair conhecimento. O subconjunto dos atributos preferencialmente devem ter uma boa precisão. O ideal é encontrar um subconjunto de atributos que tenha importância para a descoberta de conhecimento relevante. Por inferência pode-se crer que quanto maior o número de atributos em uma base de dados, maior o poder discriminatório do classificador e a facilidade de extrair modelos de conhecimento da base. Porém, quando a teoria vira prática, o mundo real apresenta provas de que nem sempre isso é verdade. Um problema que a quantidade de atributos pode gerar tem um jargão conhecido como Maldição da Dimensionalidade. Analisando a seguinte hipótese: se um objeto que com um atributo contém dez possíveis valores discretos, então tem-se no Maximo, 10 1 = 10 objetos distintos.

20 22 No entanto se alterarmos a quantidade de atributos para cinco então teremos 10 5 totalizando objetos diferentes. Pesquisas sobre seleção de atributos foram iniciadas há muito tempo nas áreas de estatística e reconhecimento de padrões, e só posteriormente passaram a ser tratadas na área de aprendizagem de máquina. Freitas (2002) explana dois tipos de seleção de atributos: Filter e Wrapper. Em ambas exigem a utilização de algoritmos. Wrapper utiliza uma estratégia para executar uma busca ou ordenação de forma guiada por um algoritmo de MD alvo enquanto que Filter não envolve obrigatoriamente o uso de algoritmo de MD final. Ambas possuem vantagens e desvantagens, o tipo Wrapper tende a ser mais preciso porém mais caro computacionalmente, já Filter é bem mais rápido mas pode não fornecer resultados satisfatórios. Ambos os tipos de seleção podem exigir um grande esforço e tempo para aplicação em qualquer tipo de dados. É justamente neste ponto que este trabalho se propõe a melhorar disponibilizando consultas multidimensionais em ferramentas de BI que possam dar agilidade na capitação de dado para aplicação de algum algoritmo de MD.

21 Data Warehouse Os Data Warehouse são tipos especiais de banco de dados cuja popularidade tomou amplitude na década de 90. É definido por Inmon (1997) como um depósito de dados orientado por assunto, integrado e não volátil porque uma vez inseridos os dados não podem ser alterados, embora possam ser excluídos. O Data Warehouse surgiu com a valorização da informação, pois muitas empresas passaram a fazer análises de seus dados para tomar decisões estratégicas. Segundo Gardner (1998), a implantação bem sucedida de um Data Warehouse é considerada um dos primeiros passos para tornar mais fácil a análise de grande quantidade de dados no apoio ao processo decisório. O principal benefício de um projeto de Data Warehouse é gerar um repositório que contenha dados limpos, agregados e consolidados, podendo este ser analisado por ferramentas do tipo OLAP (On-Line Analytical Processing). Tal ponto de vista leva a refletir: se temos um DW, logo os dados prontos para Mineração de Dados. Em aplicações reais, uma forma de promover a integração de tabelas é utilizando DW. A presença de um DW como precursor à mineração de dados, e caso não esteja disponível, muitos dos passos envolvidos na criação do mesmo terão que ser tomados para preparar os dados para a mineração.

22 24 Apesar de esforços de desenvolvedores na arquitetura de software, ainda é natural encontrar características não desejáveis nos dados, como redundância, incompletude e ruídos. Deixando os dados confusos e com pouca viabilização para se extrair informações com um âmbito mais decisório. O DW possibilita a transformação de uma base de dados que utiliza OLTP (On-Line Transaction Processing) para OLAP (On-Line Analytical Processing). OLPT se aplica em processos de informação que executam operações do dia-a-dia da organização, já o OLAP foca os processos de informação que possibilita a tomada de decisão. Segundo Kimball et al. (2002), a utilização de um banco relacional é mais complexa em suas consultas. A formalização de consultas aos dados é muito mais rápida e intuitiva no modelo multidimensional se comparada ao modelo relacional. A realização de consultas em banco de dados relacional exige a navegação entre diversas tabelas, já no modelo multidimensional isto não é necessário, o que o torna mais eficiente e com melhor desempenho. O grande número de join, que é necessário realizar em tabelas no modelo relacional, torna inviável a realização das consultas por usuários que tenham apenas conhecimento do negócio. Os benefícios da modelagem multidimensional é que ela torna os esquemas de dados mais compreensíveis para os usuários finais, e por outro lado ela permite usar armazenamento específico e técnicas de acesso que melhoram o desempenho de consulta se for necessário utilizá-las.

23 25 Data Warehouse não tem o paradigma de modelos de dados normalizados como visto nos SGBDS tradicionais, suas visões buscam armazenamento histórico/temporal dos dados. Ao desnormalizar as tabelas, o projetista do DW busca ganhar desempenho nas consultas, contudo não se deve introduzir redundância em qualquer lugar do modelo Arquitetura de um Data Warehouse Segundo Inmon (1997), um ambiente Data Warehouse tem a possibilidade de conter dois tipos de dados: Primitivos: São dados operacionais ou atômicos, consistem em valores referentes ao momento presente e são baseados em aplicações, podem ser atualizados, detalhados e processados repetidas vezes; Derivados: São dados de apoio à decisão ou sumarizados, geralmente valores históricos, baseados em assuntos ou negócios. São resumidos, ou refinados, não são atualizados, representam valores de momentos já decorridos ou instantâneos, e são processados de forma heurística. Dados Primitivos tem como maior benefício a oferta de pesquisa em base de dados mais ricas, proporcionando análises bem mais minuciosas e cuidadosas sobre os dados, tal fato leva ao ganho nas verificações de histórico, tendências, previsões e elaboração de cenários nas análises. A principal desvantagem é que

24 26 naturalmente o consumo de espaço será maior nos dispositivos de armazenamento. O consumo da capacidade de processamento, para que não haja baixo desempenho nas consultas e análises dos dados, também acabam por agregar custos extras. Dados derivados têm como benefícios estarem resumidos e armazenados em um formato no qual são facilmente consultados, ocupam menos espaço e o desempenho das consultas e das análises dos dados é melhor. A desvantagem é que a sumarização diminui a capacidade de análises e pesquisas. De acordo com Kimball et al. (2002), uma arquitetura geral de um DW tem quatro elementos: Fonte de Dados, Área de data Stage, Dados de Apresentação, Ferramentas para usuário Final. A Figura 2 demonstra a iteração entre os elementos. Fonte de Dados (Operational Source Systems): Base de dados transacionais dos sistemas satélites; Área de estágio de dados (Data Staging Area): Área de armazenamento de um conjunto de processos. Neste ponto é realizado o pré-processamento da informação: limpeza, transformação, combinação, duplicação. Porém ainda não se encontram em fase de apresentação final; Dados de Apresentação (Data Presentation Area): Ponto onde os dados se apresentam divididos por departamento ou visões necessárias para os usuários, logo são organizados e armazenados para consulta direta pelos usuários finais;

25 27 Ferramentas para usuário Final (Data Access Tools): Todas as ferramentas de acesso aos dados, desde ferramentas para análises de negócio até ferramentas de apoio à construção do DW. Figura 2 - Elementos do DW (Kimball et al, 2002) Modelagem Dimensional A modelagem dimensional tem a idéia de um cubo onde cada direção representa uma dimensão de negócio, as tecnologias OLAP fazem utilização deste conceito. A visão dimensional proporciona uma visão privilegiada sobre os dados, permitindo um entendimento melhor sobre problemas que necessitam de uma tomada de decisão (Ballard et al., 1998). De acordo com Ballard et al. (1998), utilizando modelagem dimensional o usuário final pode navegar e explorar os dados de uma forma facilitada.

26 28 É pertinente lembrar que apesar de se tratar de modelagem dimensional os dados que serão refletidos nessa modelagem continuam sendo relacionais. A modelagem dimensional trabalha com três objetos para sua estruturação, Fato, Dimensões de Negócio e Métrica. Cada um destes objetos é uma tabela do banco de dados relacional, podendo ser tabelas construídas provenientes das etapas de preparação de dados, como também podem ser tabelas do próprio sistema que atendam as necessidades de cada um dos tipos de objeto relatados. A identificação da tabela de fatos é o primeiro passo para modelagem dimensional. Os fatos são reunidos na tabela de fatos. Segundo Kimball et al. (1998), as tabelas de fatos normalmente contêm dados numéricos e somatórios. Um Fato representa uma transação de negócio, ou seja, nos sistemas essas tabelas podem ser chamadas de movimentação, têm a característica de serem compostas por chaves estrangeiras e conterem uma informação quantitativa. A idealização de uma tabela de fato pode ser exemplificada com uma guia de atendimento idealizada para planos de saúde suplementar, conforme Tabela 1. GUIA ID (PK) NUMBER BENEFICIARIO (FK) NUMBER DOENCA (FK) NUMBER EVENTO (FK) NUMBER IDADE NUMBER DATA DATE VALOR NUMBER Tabela 1 - Tabela de exemplo de Fato

27 29 O objeto Dimensão é uma tabela em que suas colunas correspondem à descrição de atributos que estão relacionados com a tabela de fatos. No exemplo representado na Tabela 1 ficou explícito os nomes das dimensões, onde cada chave estrangeira representa uma dimensão. Para exemplificar uma tabela de dimensão vamos utilizar a tabela beneficiário (Tabela 2). BENEFICIÁRIO ID (PK) NOME TELEFONE NUMBER VARCHAR VARCHAR DATA_NASCIMENTO DATE CIDADE (FK) NUMBER Tabela 2 - Tabela de exemplo de Dimensão Existem três esquemas utilizados para modelagem dimensional dos dados, são eles: Esquema Estrela (Star esquema), de onde se derivam os próximos dois esquemas, Esquema Floco de Neve (Snowflake esquema) e Esquema Constelação de Fatos (Facts Constallation esquema) (Kimball et al., 2002). O Esquema Estrela (Figura 3) é uma estrutura de tabela que contém muitos relacionamentos em sua estrutura. As ligações partem das chaves estrangeiras contidas em sua estrutura e avançam apenas para o primeiro join com a tabela correspondente, essa regra idealiza o formato de uma estrela, onde o fato é o centro e as dimensões são as pontas. O esquema estrela é mais indicado quando a quantidade de fatos é maior que a quantidade de registros em

28 30 cada dimensão individualmente. As tabelas de dimensão são desnormalizadas para aumentar o desempenho (Han et al., 2011). Figura 3 - Modelo Estrela O esquema Floco de Neve (Figura 4) desdobra as tabelas de dimensões, e normalmente é utilizado quando se tem dimensões grandes que são estáticas ou semiestáticas. Este modelo tem uma vantagem que é subir menos dados para a memória, porém a consulta tem uma perda de desempenho. Figura 4 - Modelo Floco de Neve

29 31 O esquema Constelação de Fatos é a junção de duas tabelas de fato uma ou mais tabela de dimensão em comum. Esse modelo também é chamado de constelação por idealizarem mais de uma estrela Tecnologia OLAP As primeiras tecnologias sobre informação que surgiram vieram do OLTP (On-Line Transaction Processing), onde se encontram as fontes de dados transacionais das mais diversas áreas, também chamada de fonte de dados de sistemas legados das corporações. Segundo Inmon (1997), o tempo de resposta entre OLTP e OLAP é bem diferente. Em uma simples explicação OLTP são os dados que definem as movimentações do sistema, enquanto que OLAP tem a finalidade de explorar os dados das movimentações armazenadas de forma a analisá-las. A iteração sobre as duas é que OLTP fornece dados para análise e OLAP executa as análises sobre os dados. A tecnologia OLAP (On-line Analytical Process) se originou com a evolução dos sistemas de informação, deixaram de apenas armazenar dados e eventos do dia a dia e passaram a permitir tomadas de decisões com base em análises. Visões OLAP parecem ser bem aceitas por usuários finais. Segundo Inmon (2005), OLAP agrada pela característica de proporcionar uma visão fácil e intuitiva dos dados dimensionais, por meio de análises em perspectivas

30 32 diferentes. OLAP é uma abstração, quando se diz OLAP na verdade está se referindo a uma especialização do método de acesso, que são três: MOLAP (Multidimensional OLAP), ROLAP (Relacional OLAP) e por último HOLAP (Híbrido OLAP). MOLAP: Utiliza SGBD Multidimensional facilitando a navegação entre os níveis de informação em tempo real, sua eficiência tende a ser melhor. Um agravante é que todo dado deve ser transformado antes de ser embarcado em SGBD Multidimensional. Arquitetura de aceso aos dados multidimensionais é o melhor, porém ainda existem poucas soluções disponíveis no mercado. ROLAP: Método mais comumente encontrado no mercado, o qual baseiase em SGBDS relacionais e agrega a tecnologia já padronizada SQL. HOLAP: é uma das tendências na arquitetura multidimensional. Os SGBDS mais famosos como Oracle, MSSQL Server e IBM DB2 já vem oferecendo suporte à modelagem multidimensional, o que justifica o híbrido, pois no ambiente relacional já existente é possível mesclar o multidimensional. O OLAP e Mineração de Dados integram todo e qualquer processo de suporte à decisão. A maioria dos sistemas de OLAP tem o foco no provimento de acesso aos dados multidimensionais, enquanto os sistemas de MD lidam com a análise de influência para os dados de uma única dimensão.

31 33 A JCP (Java Communyt Process) tem uma API para servidores de aplicação OLAP chamado de JOLAP, é integrada com o ambiente j2ee (Java 2 Platiform Enterprise Edition). Este modelo suporta conceitos referentes a três áreas que são chave para as aplicações OLAP: metadados, dados e pesquisas. Fornecedores como a IBM, ORACLE e Microsoft já desenvolvem soluções baseadas na API. Uma nova especialização de OLAP também é proposto por Han et al. (2011), o conceito de OLAM (On-Line Analytical Mining), cujo o foco tem sido a integração das tecnologias de MD e OLAP e no desenvolvimento escalável. A implementação de OLAM, apoiará os usuários a realizarem mineração de dados interativos Estrutura Multidimensional A estrutura multidimensional tem a característica de um cubo, no qual uma tabela de fatos proporciona as dimensões. Os cubos são apenas visões lógicas dos dados, chegam à este estado devido às transformações aplicadas na informação. Segundo Thomsen (2006), o cubo de dados tem o benefício de oferecer diferentes visões e granularidade, a consequência é a possibilidade de navegar pelas hierarquias de dados. A estrutura Multidimensional deve dar condições para que a tecnologia OLAP realize algumas funções que modificam a visão da dimensão. Essas funções são descritas por Gray et al. (1996), as operações de cubo de dados

32 34 foram idealizadas visando suporte de múltiplas agregações, ou seja, é uma generalização de dimensional da operação group by. As operações em estruturas multidimensionais são feitas utilizando ferramentas OLAP, recebem o nome de Slice and Dice, que compreende quatro operações: Ranging, Drilling, Rotation/Pivotting e Ranking. A operação Ranging é responsável por, a qualquer momento, alterar o resultado das consultas, inserindo novas posições ou removendo as que estão em foco. A operação Drilling consiste em escolher o que deseja analisar, o analista ainda pode mudar o escopo do que está analisando, porém os dados podem encontrar-se agregados em diversos níveis. O Drilling permite navegação por entre os níveis. Existem três operações OLAP que permitem mudar o escopo dos dados, são elas: Drill-Down, Drill-Up e Drill-Across. A operação Drill Down navega verticalmente na hierarquia, no sentido em que os dados são mais atômicos (valores simples, indivisíveis e monovalorados). Consiste em desagregar dimensões; A operação Drill-Across permite navegar transversalmente no eixo da árvore hierárquica. O Drill-Across é uma operação de grande utilidade, pois permite inserir e retirar posições do corrente cenário;

33 35 O Drill Up ou Roll Up faz parte da operação Drilling e realiza a função inversa do Drill-Down. Ela permite ao usuário uma visão mais agregada das informações. A operação Rotation ou Pivot além de permitir ao analista mudar as posições das dimensões em foco, possui também a flexibilidade de alterar o eixo de visualização dos dados, alterando linhas por colunas, com intuito de facilitar a compreensão. Vale salientar que Rotation não adiciona nem retira posições do cenário, mas permite ao analista alterar a visão que se tem dos dados. Um exemplo desta operação seria alterar uma dada dimensão da horizontal para a vertical, e desta forma o cubo tem a rotação no sentido horário.

Sistemas de Apoio à Decisão (SAD) - Senado

Sistemas de Apoio à Decisão (SAD) - Senado Sistemas de Apoio à Decisão (SAD) - Senado DW OLAP BI Ilka Kawashita Material preparado :Prof. Marcio Vitorino Sumário OLAP Data Warehouse (DW/ETL) Modelagem Multidimensional Data Mining BI - Business

Leia mais

Aplicação A. Aplicação B. Aplicação C. Aplicação D. Aplicação E. Aplicação F. Aplicação A REL 1 REL 2. Aplicação B REL 3.

Aplicação A. Aplicação B. Aplicação C. Aplicação D. Aplicação E. Aplicação F. Aplicação A REL 1 REL 2. Aplicação B REL 3. Sumário Data Warehouse Modelagem Multidimensional. Data Mining BI - Business Inteligence. 1 2 Introdução Aplicações do negócio: constituem as aplicações que dão suporte ao dia a dia do negócio da empresa,

Leia mais

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE Engenharia de Computação Professor: Rosalvo Ferreira de Oliveira Neto OLPT x OLAP Roteiro OLTP Datawarehouse OLAP Operações OLAP Exemplo com Mondrian e Jpivot

Leia mais

DATA WAREHOUSE. Rafael Ervin Hass Raphael Laércio Zago

DATA WAREHOUSE. Rafael Ervin Hass Raphael Laércio Zago DATA WAREHOUSE Rafael Ervin Hass Raphael Laércio Zago Roteiro Introdução Aplicações Arquitetura Características Desenvolvimento Estudo de Caso Conclusão Introdução O conceito de "data warehousing" data

Leia mais

Uma Ferramenta WEB para apoio à Decisão em Ambiente Hospitalar

Uma Ferramenta WEB para apoio à Decisão em Ambiente Hospitalar Uma Ferramenta WEB para apoio à Decisão em Ambiente Hospitalar Mikael de Souza Fernandes 1, Gustavo Zanini Kantorski 12 mikael@cpd.ufsm.br, gustavoz@cpd.ufsm.br 1 Curso de Sistemas de Informação, Universidade

Leia mais

Uma Ferramenta Web para BI focada no Gestor de Informação

Uma Ferramenta Web para BI focada no Gestor de Informação Uma Ferramenta Web para BI focada no Gestor de Informação Mikael de Souza Fernandes 1, Gustavo Zanini Kantorski 12 mikael@cpd.ufsm.br, gustavoz@cpd.ufsm.br 1 Curso de Sistemas de Informação, Universidade

Leia mais

Banco de Dados - Senado

Banco de Dados - Senado Banco de Dados - Senado Exercícios OLAP - CESPE Material preparado: Prof. Marcio Vitorino OLAP Material preparado: Prof. Marcio Vitorino Soluções MOLAP promovem maior independência de fornecedores de SGBDs

Leia mais

Processo Decisório, OLAP e Relatórios Corporativos OLAP E RELATÓRIOS CORPORATIVOS

Processo Decisório, OLAP e Relatórios Corporativos OLAP E RELATÓRIOS CORPORATIVOS Processo Decisório, OLAP e Relatórios Corporativos OLAP E RELATÓRIOS CORPORATIVOS Sumário Conceitos/Autores chave... 3 1. Introdução... 5 2. OLAP... 6 3. Operações em OLAP... 8 4. Arquiteturas em OLAP...

Leia mais

Data Warehouses. Alunos: Diego Antônio Cotta Silveira Filipe Augusto Rodrigues Nepomuceno Marcos Bastos Silva Roger Rezende Ribeiro Santos

Data Warehouses. Alunos: Diego Antônio Cotta Silveira Filipe Augusto Rodrigues Nepomuceno Marcos Bastos Silva Roger Rezende Ribeiro Santos Data Warehouses Alunos: Diego Antônio Cotta Silveira Filipe Augusto Rodrigues Nepomuceno Marcos Bastos Silva Roger Rezende Ribeiro Santos Conceitos Básicos Data Warehouse(DW) Banco de Dados voltado para

Leia mais

Chapter 3. Análise de Negócios e Visualização de Dados

Chapter 3. Análise de Negócios e Visualização de Dados Chapter 3 Análise de Negócios e Visualização de Dados Objetivos de Aprendizado Descrever a análise de negócios (BA) e sua importância par as organizações Listar e descrever brevemente os principais métodos

Leia mais

DESENVOLVIMENTO DE PLUG-INS KETTLE PARA GERAÇÃO DE MONDRIAN SCHEMA A PARTIR DE BASES RELACIONAIS, UTILIZANDO A METODOLOGIA AGILE ROLAP.

DESENVOLVIMENTO DE PLUG-INS KETTLE PARA GERAÇÃO DE MONDRIAN SCHEMA A PARTIR DE BASES RELACIONAIS, UTILIZANDO A METODOLOGIA AGILE ROLAP. DESENVOLVIMENTO DE PLUG-INS KETTLE PARA GERAÇÃO DE MONDRIAN SCHEMA A PARTIR DE BASES RELACIONAIS, UTILIZANDO A METODOLOGIA AGILE ROLAP. Eduardo Cristovo de Freitas Aguiar (PIBIC/CNPq), André Luís Andrade

Leia mais

SUMÁRIO 1. INTRODUÇÃO... 2 2. O QUE É DATA WAREHOUSE?... 2 3. O QUE DATA WAREHOUSE NÃO É... 4 4. IMPORTANTE SABER SOBRE DATA WAREHOUSE... 5 4.

SUMÁRIO 1. INTRODUÇÃO... 2 2. O QUE É DATA WAREHOUSE?... 2 3. O QUE DATA WAREHOUSE NÃO É... 4 4. IMPORTANTE SABER SOBRE DATA WAREHOUSE... 5 4. SUMÁRIO 1. INTRODUÇÃO... 2 2. O QUE É DATA WAREHOUSE?... 2 3. O QUE DATA WAREHOUSE NÃO É... 4 4. IMPORTANTE SABER SOBRE DATA WAREHOUSE... 5 4.1 Armazenamento... 5 4.2 Modelagem... 6 4.3 Metadado... 6 4.4

Leia mais

Fundamentos da inteligência de negócios: gestão da informação e de bancos de dados

Fundamentos da inteligência de negócios: gestão da informação e de bancos de dados Fundamentos da inteligência de negócios: gestão da informação e de bancos de dados slide 1 1 Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall Objetivos de estudo Como um banco de dados

Leia mais

Data Warehousing. Leonardo da Silva Leandro. CIn.ufpe.br

Data Warehousing. Leonardo da Silva Leandro. CIn.ufpe.br Data Warehousing Leonardo da Silva Leandro Agenda Conceito Elementos básicos de um DW Arquitetura do DW Top-Down Bottom-Up Distribuído Modelo de Dados Estrela Snowflake Aplicação Conceito Em português:

Leia mais

Business Intelligence e ferramentas de suporte

Business Intelligence e ferramentas de suporte O modelo apresentado na figura procura enfatizar dois aspectos: o primeiro é sobre os aplicativos que cobrem os sistemas que são executados baseados no conhecimento do negócio; sendo assim, o SCM faz o

Leia mais

Data Warehouses Uma Introdução

Data Warehouses Uma Introdução Data Warehouses Uma Introdução Alex dos Santos Vieira, Renaldy Pereira Sousa, Ronaldo Ribeiro Goldschmidt 1. Motivação e Conceitos Básicos Com o advento da globalização, a competitividade entre as empresas

Leia mais

Analysis Services. Manual Básico

Analysis Services. Manual Básico Analysis Services Manual Básico Construindo um Banco de Dados OLAP... 2 Criando a origem de dados... 3 Definindo as dimensões... 5 Níveis de dimensão e membros... 8 Construindo o cubo... 11 Tabela de fatos...12

Leia mais

IMPLANTAÇÃO DO DW NA ANVISA

IMPLANTAÇÃO DO DW NA ANVISA IMPLANTAÇÃO DO DW NA ANVISA Bruno Nascimento de Ávila 1 Rodrigo Vitorino Moravia 2 Maria Renata Furtado 3 Viviane Rodrigues Silva 4 RESUMO A tecnologia de Business Intelligenge (BI) ou Inteligência de

Leia mais

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO @ribeirord FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO Rafael D. Ribeiro, M.Sc,PMP. rafaeldiasribeiro@gmail.com http://www.rafaeldiasribeiro.com.br Lembrando... Aula 4 1 Lembrando... Aula 4 Sistemas de apoio

Leia mais

Ferramentas Livres de Armazenamento e Mineração de Dados

Ferramentas Livres de Armazenamento e Mineração de Dados Ferramentas Livres de Armazenamento e Mineração de Dados JasperBI, Pentaho, Weka 09/2009 Eng. Pablo Jorge Madril pmadril@summa.com.br Summa Technologies www.summa.com.br Eng. Pablo Jorge Madril pmadril@summa.com.br

Leia mais

Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence

Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence É um conjunto de conceitos e metodologias que, fazem uso de acontecimentos e sistemas e apoiam a tomada de decisões. Utilização de várias fontes de informação para se definir estratégias de competividade

Leia mais

Capítulo 1 - A revolução dos dados, da informação e do conhecimento 1 B12 4

Capítulo 1 - A revolução dos dados, da informação e do conhecimento 1 B12 4 Sumário Capítulo 1 - A revolução dos dados, da informação e do conhecimento 1 B12 4 Capítulo 2 - Reputação corporativa e uma nova ordem empresarial 7 Inovação e virtualidade 9 Coopetição 10 Modelos plurais

Leia mais

Fundamentos da Análise Multidimensional

Fundamentos da Análise Multidimensional Universidade Técnica de Lisboa INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO Informática e Sistemas de Informação Aplicados em Economia Fundamentos da Análise Multidimensional Fundamentos da Análise Multidimensional

Leia mais

Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence

Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence Juntamente com o desenvolvimento desses aplicativos surgiram os problemas: & Data Warehouse July Any Rizzo Oswaldo Filho Década de 70: alguns produtos de BI Intensa e exaustiva programação Informação em

Leia mais

Professor: Disciplina:

Professor: Disciplina: Professor: Curso: Esp. Marcos Morais de Sousa marcosmoraisdesousa@gmail.com Sistemas de informação Disciplina: Introdução a SI Noções de sistemas de informação Turma: 01º semestre Prof. Esp. Marcos Morais

Leia mais

Mineração de Dados: Introdução e Aplicações

Mineração de Dados: Introdução e Aplicações Mineração de Dados: Introdução e Aplicações Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br Apresentação Luiz Merschmann Engenheiro

Leia mais

Modelo de dados do Data Warehouse

Modelo de dados do Data Warehouse Modelo de dados do Data Warehouse Ricardo Andreatto O modelo de dados tem um papel fundamental para o desenvolvimento interativo do data warehouse. Quando os esforços de desenvolvimentos são baseados em

Leia mais

PLANO DE ENSINO PRÉ-REQUISITOS: ENS

PLANO DE ENSINO PRÉ-REQUISITOS: ENS UNIVERSIDADE DO ESTADO DE SANTA CATARINA UDESC CENTRO DE EDUCAÇÃO SUPERIOR DO ALTO VALE DO ITAJAÍ CEAVI PLANO DE ENSINO DEPARTAMENTO: DSI Departamento de Sistema de Informação DISCIPLINA: Data Warehouse

Leia mais

Data Mining: Conceitos e Técnicas

Data Mining: Conceitos e Técnicas Data Mining: Conceitos e Técnicas DM, DW e OLAP Data Warehousing e OLAP para Data Mining O que é data warehouse? De data warehousing para data mining Data Warehousing e OLAP para Data Mining Data Warehouse:

Leia mais

Curso Data warehouse e Business Intelligence

Curso Data warehouse e Business Intelligence Curso Data warehouse e Business Intelligence Fundamentos, Metodologia e Arquitetura Apresentação Os projetos de Data Warehouse e Business Intelligence são dos mais interessantes e complexos de desenvolver

Leia mais

DATA WAREHOUSE. Introdução

DATA WAREHOUSE. Introdução DATA WAREHOUSE Introdução O grande crescimento do ambiente de negócios, médias e grandes empresas armazenam também um alto volume de informações, onde que juntamente com a tecnologia da informação, a correta

Leia mais

Adriano Maranhão BUSINESS INTELLIGENCE (BI),

Adriano Maranhão BUSINESS INTELLIGENCE (BI), Adriano Maranhão BUSINESS INTELLIGENCE (BI), BUSINESS INTELLIGENCE (BI) O termo Business Intelligence (BI), popularizado por Howard Dresner do Gartner Group, é utilizado para definir sistemas orientados

Leia mais

BANCO DE DADOS DISTRIBUÍDOS e DATAWAREHOUSING

BANCO DE DADOS DISTRIBUÍDOS e DATAWAREHOUSING BANCO DE DADOS DISTRIBUÍDOS e DATAWAREHOUSING http://www.uniriotec.br/~tanaka/tin0036 tanaka@uniriotec.br Introdução a Data Warehousing e OLAP Introdução a Data Warehouse e Modelagem Dimensional Visão

Leia mais

Data Warehouse Granularidade. rogerioaraujo.wordpress.com twitter: @rgildoaraujo - rgildoaraujo@gmail.com 1

Data Warehouse Granularidade. rogerioaraujo.wordpress.com twitter: @rgildoaraujo - rgildoaraujo@gmail.com 1 Data Warehouse Granularidade rogerioaraujo.wordpress.com twitter: @rgildoaraujo - rgildoaraujo@gmail.com 1 Granularidade A granularidade de dados refere-se ao nível de sumarização dos elementos e de detalhe

Leia mais

BUSINESS INTELLIGENCE -Inteligência nos Negócios-

BUSINESS INTELLIGENCE -Inteligência nos Negócios- UNIVERSIDADE SÃO FRANCISCO CENTRO DE CIÊNCIAS JURÍDICAS, HUMANAS E SOCIAIS BUSINESS INTELLIGENCE -Inteligência nos Negócios- Curso: Administração Hab. Sistemas de Informações Disciplina: Gestão de Tecnologia

Leia mais

Uma aplicação de Data Warehouse para apoiar negócios

Uma aplicação de Data Warehouse para apoiar negócios Uma aplicação de Data Warehouse para apoiar negócios André Vinicius Gouvêa Monteiro Marcos Paulo Oliveira Pinto Rosa Maria E. Moreira da Costa Universidade do Estado do Rio de Janeiro - UERJ IME - Dept

Leia mais

OLAP: Características, Arquitetura e Ferramentas

OLAP: Características, Arquitetura e Ferramentas INSTITUTO VIANNA JÚNIOR FACULDADES INTEGRADAS VIANNA JÚNIOR OLAP: Características, Arquitetura e Ferramentas Erika Maria Teixeira Araújo 1 Mônica de Lourdes Souza Batista 2 Teresinha Moreira de Magalhães

Leia mais

Aplicação de Data Warehousing no Cadastro de Ficha Limpa do TSE

Aplicação de Data Warehousing no Cadastro de Ficha Limpa do TSE Aplicação de Data Warehousing no Cadastro de Ficha Limpa do TSE Mateus Ferreira Silva, Luís Gustavo Corrêa Lira, Marcelo Fernandes Antunes, Tatiana Escovedo, Rubens N. Melo mateusferreiras@gmail.com, gustavolira@ymail.com,

Leia mais

Tópicos Avançados Business Intelligence. Banco de Dados Prof. Otacílio José Pereira. Unidade 10 Tópicos Avançados Business Inteligence.

Tópicos Avançados Business Intelligence. Banco de Dados Prof. Otacílio José Pereira. Unidade 10 Tópicos Avançados Business Inteligence. Tópicos Avançados Business Intelligence Banco de Dados Prof. Otacílio José Pereira Unidade 10 Tópicos Avançados Business Inteligence Roteiro Introdução Níveis organizacionais na empresa Visão Geral das

Leia mais

Palavras-chave: On-line Analytical Processing, Data Warehouse, Web mining.

Palavras-chave: On-line Analytical Processing, Data Warehouse, Web mining. BUSINESS INTELLIGENCE COM DADOS EXTRAÍDOS DO FACEBOOK UTILIZANDO A SUÍTE PENTAHO Francy H. Silva de Almeida 1 ; Maycon Henrique Trindade 2 ; Everton Castelão Tetila 3 UFGD/FACET Caixa Postal 364, 79.804-970

Leia mais

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Planejamento Estratégico de TI. Prof.: Fernando Ascani Planejamento Estratégico de TI Prof.: Fernando Ascani Data Warehouse - Conceitos Hoje em dia uma organização precisa utilizar toda informação disponível para criar e manter vantagem competitiva. Sai na

Leia mais

CONSIDERAÇÕES SOBRE ATIVIDADES DE IDENTIFICAÇÃO, LOCALIZAÇÃO E TRATAMENTO DE DADOS NA CONSTRUÇÃO DE UM DATA WAREHOUSE

CONSIDERAÇÕES SOBRE ATIVIDADES DE IDENTIFICAÇÃO, LOCALIZAÇÃO E TRATAMENTO DE DADOS NA CONSTRUÇÃO DE UM DATA WAREHOUSE CONSIDERAÇÕES SOBRE ATIVIDADES DE IDENTIFICAÇÃO, LOCALIZAÇÃO E TRATAMENTO DE DADOS NA CONSTRUÇÃO DE UM DATA WAREHOUSE Fabio Favaretto Professor adjunto - Programa de Pós Graduação em Engenharia de Produção

Leia mais

SAD orientado a DADOS

SAD orientado a DADOS Universidade do Contestado Campus Concórdia Curso de Sistemas de Informação Prof.: Maico Petry SAD orientado a DADOS DISCIPLINA: Sistemas de Apoio a Decisão SAD orientado a dados Utilizam grandes repositórios

Leia mais

Data Warehouse. Djenane Cristina Silveira dos Santos¹, Felipe Gomes do Prado¹, José Justino Neto¹, Márcia Taliene Alves de Paiva¹

Data Warehouse. Djenane Cristina Silveira dos Santos¹, Felipe Gomes do Prado¹, José Justino Neto¹, Márcia Taliene Alves de Paiva¹ Data Warehouse. Djenane Cristina Silveira dos Santos¹, Felipe Gomes do Prado¹, José Justino Neto¹, Márcia Taliene Alves de Paiva¹ ¹Ciência da Computação Universidade Federal de Itajubá (UNIFEI) MG Brasil

Leia mais

Data Warehouse Mineração de Dados

Data Warehouse Mineração de Dados Data Warehouse Mineração de Dados Profa. Roberta Macêdo M. Gouveia robertammg@gmail.com 1 18/12/2014 Data Warehouse Data Mining Big Data A mina de ouro debaixo dos bits 2 Data Warehouse: A Memória da Empresa

Leia mais

OLAP em âmbito hospitalar: Transformação de dados de enfermagem para análise multidimensional

OLAP em âmbito hospitalar: Transformação de dados de enfermagem para análise multidimensional OLAP em âmbito hospitalar: Transformação de dados de enfermagem para análise multidimensional João Silva and José Saias m5672@alunos.uevora.pt, jsaias@di.uevora.pt Mestrado em Engenharia Informática, Universidade

Leia mais

Thiago Locatelli de OLIVEIRA, Thaynara de Assis Machado de JESUS; Fernando José BRAZ Bolsistas CNPq; Orientador IFC Campus Araquari

Thiago Locatelli de OLIVEIRA, Thaynara de Assis Machado de JESUS; Fernando José BRAZ Bolsistas CNPq; Orientador IFC Campus Araquari DESENVOLVIMENTO DE AMBIENTE PARA A GESTÃO DO CONHECIMENTO RELACIONADO AOS DADOS PRODUZIDOS PELO SISTEMA DE GERENCIAMENTO DE TRANSITO DA CIDADE DE JOINVILLE/SC PARTE I Thiago Locatelli de OLIVEIRA, Thaynara

Leia mais

ADMINISTRAÇÃO DOS RECURSOS DE DADOS

ADMINISTRAÇÃO DOS RECURSOS DE DADOS Capítulo 7 ADMINISTRAÇÃO DOS RECURSOS DE DADOS 7.1 2003 by Prentice Hall OBJETIVOS Por que as empresas sentem dificuldades para descobrir que tipo de informação precisam ter em seus sistemas de informação?

Leia mais

Uma análise multidimensional dos dados estratégicos da empresa usando o recurso OLAP do Microsoft Excel

Uma análise multidimensional dos dados estratégicos da empresa usando o recurso OLAP do Microsoft Excel Uma análise multidimensional dos dados estratégicos da empresa usando o recurso OLAP do Microsoft Excel Carlos Alberto Ferreira Bispo (AFA) cafbispo@siteplanet.com.br Daniela Gibertoni (FATECTQ) daniela@fatectq.com.br

Leia mais

Prova INSS RJ - 2007 cargo: Fiscal de Rendas

Prova INSS RJ - 2007 cargo: Fiscal de Rendas Prova INSS RJ - 2007 cargo: Fiscal de Rendas Material de Apoio de Informática - Prof(a) Ana Lucia 53. Uma rede de microcomputadores acessa os recursos da Internet e utiliza o endereço IP 138.159.0.0/16,

Leia mais

Bases de Dados aplicadas a Inteligência de Negócios

Bases de Dados aplicadas a Inteligência de Negócios Agenda Bases de Dados aplicadas a Inteligência de Negócios Professor Sérgio Rodrigues professor@sergiorodrigues.net Sistemas de Gerenciamento de Bancos de Dados (SGBD) Tipos de Banco de Dados Noções de

Leia mais

MANUAL BI- Business Intelligence

MANUAL BI- Business Intelligence 1. VISÃO GERAL 1.1 SISTEMA BI Business Intelligence: Segundo Gartner Group, a maior ameaça das empresas da atualidade é o desconhecimento... O Business Intelligence se empenha em eliminar as dúvidas e

Leia mais

Data Warehouse Processos e Arquitetura

Data Warehouse Processos e Arquitetura Data Warehouse - definições: Coleção de dados orientada a assunto, integrada, não volátil e variável em relação ao tempo, que tem por objetivo dar apoio aos processos de tomada de decisão (Inmon, 1997)

Leia mais

Conversão de Base de Dados Relacional para Dimensional para Business Intelligence Utilizando Banco de Dados Mysql

Conversão de Base de Dados Relacional para Dimensional para Business Intelligence Utilizando Banco de Dados Mysql Conversão de Base de Dados Relacional para Dimensional para Business Intelligence Utilizando Banco de Dados Mysql Carlos H. Cardoso 1, Roberto D Nebo 1, Luis A. da Silva 1 1 Curso de Tecnologia em Banco

Leia mais

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Pollyanna Carolina BARBOSA¹; Thiago MAGELA² 1Aluna do Curso Superior Tecnólogo em Análise e Desenvolvimento de Sistemas

Leia mais

Curso Data warehouse e Business Intelligence Fundamentos, Metodologia e Arquitetura

Curso Data warehouse e Business Intelligence Fundamentos, Metodologia e Arquitetura Curso Data warehouse e Business Intelligence Fundamentos, Metodologia e Arquitetura Apresentação Os projetos de Data Warehouse e Business Intelligence são dos mais interessantes e complexos de desenvolver

Leia mais

Plataforma de Business Intelligence

Plataforma de Business Intelligence Plataforma de Business Intelligence ASTEN TECNOLOGIA DA INFORMAÇÃO A Asten é uma empresa do ramo da tecnologia da informação (TI) que tem seu foco na busca por soluções inovadoras. Nosso slogan criando

Leia mais

ACOMPANHAMENTO TESTE 6. Fonte: Carlos Barbieri. Fonte: Carlos Barbieri

ACOMPANHAMENTO TESTE 6. Fonte: Carlos Barbieri. Fonte: Carlos Barbieri PÓS-GRADUAÇÃO LATO SENSU Curso: Banco de Dados Disciplina: Data Warehouse e Business Intelligence Professor: Fernando Zaidan Unidade 2.1 - Cubos 2012 ACOMPANHAMENTO IMPLEMENTAÇÃO 8 7 9 TESTE 6 CONSTRUÇÃO

Leia mais

Gerenciamento de Dados e Gestão do Conhecimento

Gerenciamento de Dados e Gestão do Conhecimento ELC1075 Introdução a Sistemas de Informação Gerenciamento de Dados e Gestão do Conhecimento Raul Ceretta Nunes CSI/UFSM Introdução Gerenciando dados A abordagem de banco de dados Sistemas de gerenciamento

Leia mais

5 Estudo de Caso. 5.1. Material selecionado para o estudo de caso

5 Estudo de Caso. 5.1. Material selecionado para o estudo de caso 5 Estudo de Caso De modo a ilustrar a estruturação e representação de conteúdos educacionais segundo a proposta apresentada nesta tese, neste capítulo apresentamos um estudo de caso que apresenta, para

Leia mais

KDD E MINERAÇÃO DE DADOS:

KDD E MINERAÇÃO DE DADOS: KDD E MINERAÇÃO DE DADOS: Revisão em Data Warehouses Prof. Ronaldo R. Goldschmidt ronaldo@de9.ime.eb.br rribeiro@univercidade.br geocities.yahoo.com.br/ronaldo_goldschmidt 1 DATA WAREHOUSES UMA VISÃO GERAL

Leia mais

Data Warehousing Visão Geral do Processo

Data Warehousing Visão Geral do Processo Data Warehousing Visão Geral do Processo Organizações continuamente coletam dados, informações e conhecimento em níveis cada vez maiores,, e os armazenam em sistemas informatizados O número de usuários

Leia mais

Data Warehouse. Debora Marrach Renata Miwa Tsuruda

Data Warehouse. Debora Marrach Renata Miwa Tsuruda Debora Marrach Renata Miwa Tsuruda Agenda Introdução Contexto corporativo Agenda Introdução Contexto corporativo Introdução O conceito de Data Warehouse surgiu da necessidade de integrar dados corporativos

Leia mais

Uma Arquitetura de Gestão de Dados em Ambiente Data Warehouse

Uma Arquitetura de Gestão de Dados em Ambiente Data Warehouse Uma Arquitetura de Gestão de Dados em Ambiente Data Warehouse Alcione Benacchio (UFPR) E mail: alcione@inf.ufpr.br Maria Salete Marcon Gomes Vaz (UEPG, UFPR) E mail: salete@uepg.br Resumo: O ambiente de

Leia mais

Integração Access-Excel para produzir um sistema de apoio a decisão que simula um Data Warehouse e OLAP

Integração Access-Excel para produzir um sistema de apoio a decisão que simula um Data Warehouse e OLAP Integração Access-Excel para produzir um sistema de apoio a decisão que simula um Data Warehouse e OLAP Wílson Luiz Vinci (Faculdades IPEP) wilson@cnptia.embrapa.br Marcelo Gonçalves Narciso (Embrapa Informática

Leia mais

4 Aplicação da Sistemática

4 Aplicação da Sistemática 4 Aplicação da Sistemática Este capítulo descreve a aplicação da sistemática definida no Capítulo 3 utilizando dados reais de uma estatística pública e aplicando tecnologias avançadas fazendo o uso de

Leia mais

Módulo 5. Implementando Cubos OLAP

Módulo 5. Implementando Cubos OLAP Módulo 5. Implementando Cubos OLAP Objetivos Compreender a importância da manipulação correta da segurança nos dados. Conhecer as operações que podem ser realizadas na consulta de um cubo. Entender o uso

Leia mais

Data Warehouse: uma classificação de seus Custos e Benefícios

Data Warehouse: uma classificação de seus Custos e Benefícios Data Warehouse: uma classificação de seus Custos e Benefícios Marcos Paulo Kohler Caldas (CEFET-ES/CEFET-PR) marcospaulo@cefetes.br Prof. Dr. Luciano Scandelari (CEFET-PR) luciano@cefetpr.br Prof. Dr.

Leia mais

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan Faculdade INED Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan 1 Unidade 4.3 2 1 BI BUSINESS INTELLIGENCE BI CARLOS BARBIERI

Leia mais

Kimball University: As 10 Regras Essenciais para a Modelagem de Dados Dimensional

Kimball University: As 10 Regras Essenciais para a Modelagem de Dados Dimensional Kimball University: As 10 Regras Essenciais para a Modelagem de Dados Dimensional Margy Ross Presidente Kimball Group Maio de 2009, Intelligent Enterprise.com Tradução livre para a língua portuguesa por

Leia mais

INTELIGÊNCIA COMPUTACIONAL

INTELIGÊNCIA COMPUTACIONAL INTELIGÊNCIA COMPUTACIONAL Engenharia de Computação Professor: Rosalvo Ferreira de Oliveira Neto Dados pessoais Rosalvo Ferreira de Oliveira Neto MSc. em ciência da computação (UFPE) rosalvo.oliveira@univasf.edu.br

Leia mais

UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado)

UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado) UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado) SISTEMA INTERNO INTEGRADO PARA CONTROLE DE TAREFAS INTERNAS DE UMA EMPRESA DE DESENVOLVIMENTO

Leia mais

Projeto de Data Warehousing sobre Informações em Saúde para dar Suporte a Análise de Faturamento Hospitalar

Projeto de Data Warehousing sobre Informações em Saúde para dar Suporte a Análise de Faturamento Hospitalar Projeto de Data Warehousing sobre Informações em Saúde para dar Suporte a Análise de Faturamento Hospitalar Newton Shydeo Brandão Miyoshi Joaquim Cezar Felipe Grupo de Informática Biomédica Departamento

Leia mais

Curso de Engenharia de Sistemas e Informática - 5º Ano. Ficha T. Prática n.º 1

Curso de Engenharia de Sistemas e Informática - 5º Ano. Ficha T. Prática n.º 1 Análise Inteligente de Dados Objectivo: Curso de Engenharia de Sistemas e Informática - 5º Ano Ficha T. Prática n.º 1 Estudo do paradigma multidimensional com introdução de uma extensão ao diagrama E/R

Leia mais

Introdução. Motivação. Sistema Gerenciador de Banco de Dados (SGBD) Banco de Dados (BD) Sistema de Banco de Dados (SBD)

Introdução. Motivação. Sistema Gerenciador de Banco de Dados (SGBD) Banco de Dados (BD) Sistema de Banco de Dados (SBD) Pós-graduação em Ciência da Computação CCM-202 Sistemas de Banco de Dados Introdução Profa. Maria Camila Nardini Barioni camila.barioni@ufabc.edu.br Bloco B - sala 937 2 quadrimestre de 2011 Motivação

Leia mais

Prof. Ronaldo R. Goldschmidt. ronaldo.rgold@gmail.com

Prof. Ronaldo R. Goldschmidt. ronaldo.rgold@gmail.com DATA WAREHOUSES UMA INTRODUÇÃO Prof. Ronaldo R. Goldschmidt ronaldo.rgold@gmail.com 1 DATA WAREHOUSES UMA INTRODUÇÃO Considerações Iniciais Conceitos Básicos Modelagem Multidimensional Projeto de Data

Leia mais

Modelando um Data Warehouse GRIMALDO OLIVEIRA

Modelando um Data Warehouse GRIMALDO OLIVEIRA Modelando um Data Warehouse GRIMALDO OLIVEIRA Sobre Grimaldo Grimaldo Oliveira grimaldo_lopes@hotmail.com Formação Mestre em Tecnologias Aplicadas a Educação pela Universidade do Estado da Bahia. Especialização

Leia mais

Globalização => as empresas se concentraram mais nos seus modelos de negócio e deixaram um pouco de

Globalização => as empresas se concentraram mais nos seus modelos de negócio e deixaram um pouco de FERRAMENTAS OLAP HISTÓRICO Desenvolvimento da linguagem APL pela IBM final da década de 60. Surgimento de uma nova classe de ferramentas, que foi chamada de OLAP. Final de década de 90. Atualmente algumas

Leia mais

Banco de Dados. Aula 1 - Prof. Bruno Moreno 16/08/2011

Banco de Dados. Aula 1 - Prof. Bruno Moreno 16/08/2011 Banco de Dados Aula 1 - Prof. Bruno Moreno 16/08/2011 Roteiro Apresentação do professor e disciplina Definição de Banco de Dados Sistema de BD vs Tradicional Principais características de BD Natureza autodescritiva

Leia mais

DB2 Data Warehouse. Alunas: Caroline Beatriz Perlin Elaine Amendola Vanessa Magalhães

DB2 Data Warehouse. Alunas: Caroline Beatriz Perlin Elaine Amendola Vanessa Magalhães DB2 Data Warehouse Alunas: Caroline Beatriz Perlin Elaine Amendola Vanessa Magalhães Agenda Introdução DB2 Data Warehouse Edition (DB2 DWE) Ferramentas Metadados DB2 cube views Materialized Query Tables

Leia mais

Administração de Sistemas de Informação Gerenciais UNIDADE IV: Fundamentos da Inteligência de Negócios: Gestão da Informação e de Banco de Dados Um banco de dados é um conjunto de arquivos relacionados

Leia mais

ESCOLA SUPERIOR ABERTA DO BRASIL ESAB CURSO DE ENGENHARIA DE SISTEMAS RACHEL TEREZA MENEGAZZO

ESCOLA SUPERIOR ABERTA DO BRASIL ESAB CURSO DE ENGENHARIA DE SISTEMAS RACHEL TEREZA MENEGAZZO ESCOLA SUPERIOR ABERTA DO BRASIL ESAB CURSO DE ENGENHARIA DE SISTEMAS RACHEL TEREZA MENEGAZZO IMPLEMENTANDO UMA SOLUÇÃO OLAP UTILIZANDO SOFTWARE LIVRE CURITIBA PR 2009 RACHEL TEREZA MENEGAZZO IMPLEMENANDO

Leia mais

Dado: Fatos conhecidos que podem ser registrados e têm um significado implícito. Banco de Dados:

Dado: Fatos conhecidos que podem ser registrados e têm um significado implícito. Banco de Dados: MC536 Introdução Sumário Conceitos preliminares Funcionalidades Características principais Usuários Vantagens do uso de BDs Tendências mais recentes em SGBDs Algumas desvantagens Modelos de dados Classificação

Leia mais

ADMINISTRAÇÃO DOS RECURSOS DE DADOS

ADMINISTRAÇÃO DOS RECURSOS DE DADOS 7 ADMINISTRAÇÃO DOS RECURSOS DE DADOS OBJETIVOS Por que as empresas sentem dificuldades para descobrir que tipo de informação precisam ter em seus sistemas de informação ão? Como um sistema de gerenciamento

Leia mais

Arquiteturas de DW e Abordagens de Implementação. Arquiteturas e Abordagens de Implementação

Arquiteturas de DW e Abordagens de Implementação. Arquiteturas e Abordagens de Implementação Curso de Dwing TecBD-DI PUC-Rio Prof. Rubens Melo Arquiteturas de DW e Abordagens de Implementação Arquiteturas e Abordagens de Implementação Arquitetura adequada é fundamental Infra-estrutura disponível

Leia mais

Sobre o que falaremos nesta aula?

Sobre o que falaremos nesta aula? Business Intelligence - BI Inteligência de Negócios Prof. Ricardo José Pfitscher Elaborado com base no material de: José Luiz Mendes Gerson Volney Lagmman Introdução Sobre o que falaremos nesta aula? Ferramentas

Leia mais

Banco de Dados. Conceitos e Arquitetura de Sistemas de Banco de Dados. Profa. Flávia Cristina Bernardini

Banco de Dados. Conceitos e Arquitetura de Sistemas de Banco de Dados. Profa. Flávia Cristina Bernardini Banco de Dados Conceitos e Arquitetura de Sistemas de Banco de Dados Profa. Flávia Cristina Bernardini Relembrando... Vantagens da Utilização de SGBD Redundância controlada Consistência dos dados armazenados

Leia mais

srbo@ufpa.br www.ufpa.br/srbo

srbo@ufpa.br www.ufpa.br/srbo CBSI Curso de Bacharelado em Sistemas de Informação BI Prof. Dr. Sandro Ronaldo Bezerra Oliveira srbo@ufpa.br www.ufpa.br/srbo Tópicos Especiais em Sistemas de Informação Faculdade de Computação Instituto

Leia mais

Módulo 4. Construindo uma solução OLAP

Módulo 4. Construindo uma solução OLAP Módulo 4. Construindo uma solução OLAP Objetivos Diferenciar as diversas formas de armazenamento Compreender o que é e como definir a porcentagem de agregação Conhecer a possibilidade da utilização de

Leia mais

Uma aplicação de Data Warehouse para análise do processo de coleta de sangue e de medula óssea

Uma aplicação de Data Warehouse para análise do processo de coleta de sangue e de medula óssea Uma aplicação de Data Warehouse para análise do processo de coleta de sangue e de medula óssea Rogério de Torres Pelito, Gleise Celeste Gonzaga Pereira, Diana Maria da Silva de Souza, André Luiz Alves

Leia mais

A NOVA GERAÇÃO DE SISTEMAS DE APOIO À DECISÃO

A NOVA GERAÇÃO DE SISTEMAS DE APOIO À DECISÃO A NOVA GERAÇÃO DE SISTEMAS DE APOIO À DECISÃO Carlos Alberto Ferreira Bispo Professor da Academia da Força Aérea Estrada de Aguaí S/N - Pirassununga - SP Caixa Postal 1062 - CEP 13630-000 - cafbispo@sc.usp.br

Leia mais

Bloco Administrativo

Bloco Administrativo Bloco Administrativo BI Business Intelligence Objetivo O objetivo deste artigo é dar uma visão geral sobre o Módulo Business Intelligence, que se encontra no Bloco Administrativo. Todas informações aqui

Leia mais

Planejamento e Orçamento

Planejamento e Orçamento Planejamento e Orçamento O SIPLAG Sistema Integrado de Planejamento, Orçamento e Gestão, é um sistema voltado à gestão governamental, permitindo a elaboração do Plano Plurianual, da Lei Orçamentária Anual,

Leia mais

KDD UMA VISAL GERAL DO PROCESSO

KDD UMA VISAL GERAL DO PROCESSO KDD UMA VISAL GERAL DO PROCESSO por Fernando Sarturi Prass 1 1.Introdução O aumento das transações comerciais por meio eletrônico, em especial as feitas via Internet, possibilitou as empresas armazenar

Leia mais

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan Faculdade INED Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan 1 Unidade 4.2 2 1 BI BUSINESS INTELLIGENCE BI CARLOS BARBIERI

Leia mais

Padronização de Processos: BI e KDD

Padronização de Processos: BI e KDD 47 Padronização de Processos: BI e KDD Nara Martini Bigolin Departamento da Tecnologia da Informação -Universidade Federal de Santa Maria 98400-000 Frederico Westphalen RS Brazil nara.bigolin@ufsm.br Abstract:

Leia mais

Business Intelligence. BI CEOsoftware Partner YellowFin

Business Intelligence. BI CEOsoftware Partner YellowFin Business Intelligence BI CEOsoftware Partner YellowFin O que é Business Intelligence Business Intelligence (BI) é a utilização de uma série de ferramentas para coletar, analisar e extrair informações,

Leia mais

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5 Para entender bancos de dados, é útil ter em mente que os elementos de dados que os compõem são divididos em níveis hierárquicos. Esses elementos de dados lógicos constituem os conceitos de dados básicos

Leia mais

Interatividade aliada a Análise de Negócios

Interatividade aliada a Análise de Negócios Interatividade aliada a Análise de Negócios Na era digital, a quase totalidade das organizações necessita da análise de seus negócios de forma ágil e segura - relatórios interativos, análise de gráficos,

Leia mais