HELENA CAROLINA COSTA E LIMA UTILIZAÇÃO DE DATA WAREHOUSE E DATA MINING NO ACOMPANHAMENTO DAS ATIVIDADES DE PESQUISA DO CEULP/ULBRA

Tamanho: px
Começar a partir da página:

Download "HELENA CAROLINA COSTA E LIMA UTILIZAÇÃO DE DATA WAREHOUSE E DATA MINING NO ACOMPANHAMENTO DAS ATIVIDADES DE PESQUISA DO CEULP/ULBRA"

Transcrição

1 HELENA CAROLINA COSTA E LIMA UTILIZAÇÃO DE DATA WAREHOUSE E DATA MINING NO ACOMPANHAMENTO DAS ATIVIDADES DE PESQUISA DO CEULP/ULBRA Palmas - TO 2006

2 HELENA CAROLINA COSTA E LIMA UTILIZAÇÃO DE DATA WAREHOUSE E DATA MINING NO ACOMPANHAMENTO DAS ATIVIDADES DE PESQUISA DO CEULP/ULBRA Relatório apresentado como requisito parcial das disciplinas de Trabalho de Conclusão de Curso em Sistemas de Informação I (TCC I) e Trabalho de Conclusão de Curso em Sistemas de Informação II (TCC II) do curso de Sistemas de Informação, orientado pelo Profº. MSc. Fabiano Fagundes. Palmas - TO 2006 /1

3 HELENA CAROLINA COSTA E LIMA UTILIZAÇÃO DE DATA WAREHOUSE E DATA MINING NO ACOMPANHAMENTO DAS ATIVIDADES DE PESQUISA DO CEULP/ULBRA Relatório apresentado como requisito parcial das disciplinas de Trabalho de Conclusão de Curso em Sistemas de Informação I (TCC I) e Trabalho de Conclusão de Curso em Sistemas de Informação II (TCC II) do curso de Sistemas de Informação, orientado pelo Profº. MSc. Fabiano Fagundes. BANCA EXAMINADORA Prof. M.Sc. Fabiano Fagundes Centro Universitário Luterano de Palmas Prof. M.Sc. Fernando Luiz de Oliveira Centro Universitário Luterano de Palmas Prof. M.Sc. Parcilene Fernandes Brito Centro Universitário Luterano de Palmas Palmas - TO Julho 2006 III

4 SUMÁRIO 1 INTRODUÇÃO REVISÃO DE LITERATURA Data Warehouse Banco de Dados Operacionais X Data Warehouse OLAP (On-Line Analytical Processing) Características de um DW Componentes de um Data Warehouse Modelagem Dimensional Esquema Estrela Tabela de Fatos Tabela de Dimensão Metadados Data Marts Extração de Conhecimento em Bases de Dados - KDD Data Mining Técnicas de Data Mining Ferramentas de Data Mining Funções do Data Mining MATERIAIS E MÉTODOS Metodologia Materiais Local e Período Resultados e Discussões Atividades de Pesquisa do Proict Processo de Descoberta de Conhecimento Conhecimento do Domínio Pré Processamento Modelagem Dimensional Extração de Padrões Pós-Processamento IV

5 Primeira Questão Segunda Questão Terceira Questão Quarta Questão Quinta Questão Sexta Questão Utilização do Conhecimento CONSIDERAÇÕES FINAIS REFÊRENCIAS BIBLIOGRÁFICAS V

6 LISTA DE FIGURAS Figura 1 - Elementos básicos do Data Warehouse [KIMBALL, 2002] Figura 2 - Exemplo de um modelo dimensional utilizando o Esquema Estrela [TISSOT, 2004] Figura 3 - Data Marts Departamentais Figura 4 - Processos do KDD [FIGUEIRA, 1998] Figura 5 - Etapas do processo de um KDD [REZENDE et. al., 2003] Figura 6 Árvore de Decisão Figura 7 - Modelo Dimensional Figura 8 - Carga da Tabela F_Prod_Proict Figura 9 - Carga da Tabela F_Evento Figura 10 - Apresentação da Ferramenta de Data Mining Figura 11 Relação dos Projetos desenvolvidos por Curso Figura 12 Quantidade de Professores por curso Figura 13 Relação de Publicações Jornada e Publicações Externas Figura 14 Projetos Desenvolvidos Figura 15 - Porcentagem das Áreas de Conhecimento Figura 16 Porcentagem dos Projetos Aprovados nas Jornadas Científicas.. 64 Figura 17 Relação entre Quantidade de Artigos e Professores Figura 18 Relação de Carga Horária com Trabalhos Desenvolvidos Figura 19 Média dos Alunos do Proict VI

7 LISTA DE TABELAS Tabela 1 Resumo das diferenças entra BDs Operacionais e DWs Tabela 2 Diferenças entra OLTP e OLAP [VAISMAN, 1998] Tabela 3 Dados dos Alunos Bolsistas de Tabela 4 Representação dos Atributos da tabela F_Prod_Proict Tabela 5 Representação dos Atributos da tabela D_Professores Tabela 6 Representação dos Atributos da tabela D_Aluno Tabela 7 Representação dos Atributos da tabela D_Data Tabela 8 Representação dos Atributos da D_Projeto Tabela 9 Representação dos Atributos da tabela F_Eventos Tabela 10 Representação dos Atributos da D_Evento Tabela 11 Representação dos Atributos da F_Jornada Tabela 12 Representação dos Atributos da D_Artigos Tabela 13 Quantidade de Projetos desenvolvidos Tabela 14 - Relação de Carga Horária com Trabalhos Desenvolvidos VII

8 LISTA DE ABREVIATURAS DW (Data Warehouse) Proict (Projetos de Iniciação Científica) COPPEX (Coordenação de Pesquisa, Pós Graduação e Extensão) CEULP/ULBRA (Centro Universitário Luterano de Palmas) KDD (Knowledge Discovery in Databases) OLTP (On-line Transaction Processing) OLAP (On-line Analytical Processing) DM (Data Mart) VIII

9 RESUMO Tradicionalmente, uma das dificuldades existentes na extração de informações dos dados de um departamento de uma instituição deve-se a falta de integração dos dados relacionados. O mesmo dá-se com os dados pertinentes aos Projetos de Iniciação Científica (Proict), oriundos da COPPEX Coordenação de Pesquisa, Pós Graduação e Extensão do CEULP/ULBRA, Estes documentos encontram-se armazenados em diversos formatos, tais como: tabelas em Word, planilhas eletrônicas, formulários, entre outros. Dessa forma, a realização de uma análise completa desses dados torna-se uma tarefa complexa. A partir do problema apresentado, este trabalho propõe a estruturação de um modelo de Data Warehouse com o objetivo de organizar e integrar as informações dos documentos que compõem o Proict, e utilizar as técnicas de Data Mining para extrair informações que serão úteis para a COPPEX. Palavras-chave: Data Warehouse, Data Mining, Extração de Conhecimento IX

10 1 INTRODUÇÃO Devido ao crescimento das organizações e empresas, a quantidade de informação armazenada em bases de dados, formulários, documentos, tem aumentado consideravelmente, sendo que, a maioria das empresas muitas vezes não possui controle de todas as informações que estão disponíveis, uma vez que estas encontram-se espalhadas em diversos ambientes. Com isso, fazem-se necessários e têm-se buscado meios para organizar estas informações propiciando a geração de conhecimento, de tal forma que os dados que anteriormente eram desconsiderados tornem-se fontes de conhecimento. Estas buscas por conhecimento motivam o desenvolvimento de um ambiente específico, com ferramentas e técnicas de análise de dados que têm por objetivo auxiliar a extração de conhecimento a partir de dados e auxiliar a tomada de decisão [GARCIA et al., 2001]. Para a organização destes dados e interação dos mesmos para extração de conhecimento pode-se utilizar o Data Warehouse (DW) que é um dos processos que realiza a preparação dos dados de um sistema, que dará suporte à tomada de decisão, onde os dados passam por uma série de transformações, entre elas, a limpeza e a verificação de consistência desejada na análise [KIMBALL, 1998]. Estes dados são organizados e armazenados em repositórios para que seja realizada uma análise destes dados com o objetivo de buscar informações úteis para o ambiente que o DW foi aplicado. Anteriormente muitos dados eram inutilizados devido à falta de organização dos mesmos por estarem dispersos em bases relacionais, ou espalhados em relatórios distintos, com isso deixando de ser fonte de informação. Com a estruturação de um projeto de DW, o resultado é um conjunto de informações úteis, que irá servir de auxílio, segurança e irá

11 possibilitar uma visão abrangente para análise de negócios [MACHADO, 2000]. A quantidade de aplicações das tecnologias de DW tem crescido nos últimos anos, e as alterações constantes nessa arquitetura têm permitido o rápido aumento do volume de dados acessados [INMON et al., 1999]. A partir dos dados armazenados em um DW é possível utilizar ferramentas que irão realizar a análise e interpretação dos dados. Um dos meios utilizados é o Data Mining, ferramenta que busca automatizar o processo de extração de conhecimento, auxiliar a descoberta de relacionamento entre os dados tendo como objetivo encontrar padrões válidos e úteis aos mesmos [FAYYAD et al., 1996]. O processo de Data Mining utiliza métodos matemáticos, algoritmos entre outros, para efetuar as análises dos dados, sendo que algumas técnicas que auxiliam a mineração de dados são árvores de decisão, indução de regras, redes neurais, entre outros. O objetivo de se desenvolver um DW e um Data Mining é possibilitar a extração de conhecimento a partir de uma base de dados dimensional, aplicando técnicas que irão auxiliar os administradores e gestores de negócios a analisarem as informações encontradas. Este trabalho visa organizar e implantar um DW juntamente com a utilização de uma ferramenta de Data Mining para os dados de Produção Científica do CEULP/ULBRA, uma vez que estes encontram-se dispersos através de documentos como: relatórios, base de dados e tabelas. O objetivo do trabalho é encontrar informações úteis a serem utilizadas e aplicadas no acompanhamento das Atividades de Pesquisa do CEULP/ULBRA. Para tanto, serão apresentados os passos e etapas necessárias para estruturação do DW, juntamente com os resultados encontrados através da utilização de ferramentas de Data Mining sobre o estudo de caso realizado sobre os dados de Produção Científica do CEULP/ULBRA. XI 11

12 2 REVISÃO DE LITERATURA Para este trabalho, foram desenvolvidos estudos e pesquisas sobre Data Mining e DW, apresentando os fundamentos práticos e teóricos necessários para atingir o objetivo do trabalho proposto. Para isso, serão apresentadas as etapas e os processos que compõem um Data Mining e um DW. 2.1 Data Warehouse Data Warehousing corresponde ao processo de preparar os dados de uma base operacional de forma que esta se torne uma fonte de informações para realizar suporte à tomada de decisões. Nesse processo, os dados sofrem uma série de transformações, entre elas, a limpeza, a verificação de consistência e a totalização em níveis hierárquicos desejados na análise [KIMBALL, 1998]. A construção de um Data Warehouse exige um alto nível de complexidade sendo necessária a utilização de uma metodologia consistente com um trabalho desenvolvido por pessoas capacitadas e ainda um grande investimento em ferramentas para auxiliar a implantação do ambiente [TISSOT, 2004]. O conceito de Data Warehouse pode ser apresentado como: Um conjunto de dados orientado por assuntos, não volátil, variável com o tempo e integrado, criados para dar suporte à decisão [INMON,1997]. É um processo que aglutina dados de fontes heterogêneas, incluindo dados históricos e dados externos a empresa, usados para atender à necessidade de consultas estruturadas e ad-hoc, relatórios analíticos e de suporte à decisão [HARJINDER,1996].

13 É uma coleção de técnicas e tecnologias que juntas disponibilizam um enfoque pragmático e sistemático para tratar com o problema do usuário final que precisa acessar informações que estão distribuídas em vários sistemas da organização [BARQUINI, 1996]. Como resultado de desenvolvimento de um DW, obtém-se um conjunto de subsídios, que irão auxiliar o processo de tomada de decisão, permitindo maior abrangência na visão da empresa para análise de negócios e mais segurança nas decisões a serem tomadas [MACHADO, 2000]. A estrutura de um Data Warehouse compreende a utilização de diversas ferramentas que extraem dados de sistemas operacionais da empresa, um banco de dados que o mantém e sistemas que disponibilizam estes dados aos usuários. Algumas vantagens do DW são: a redução do tempo para a aquisição de informações úteis a tomada de decisão, cancelamento de tarefas operacionais, tais como, identificação e pesquisa de dados, confiabilidade das informações e igualdade de informações sobre o desempenho dos negócios [KIMBALL, 1998]. Assim, a partir de experiências de grandes quantidades de dados inutilizados e falta de conhecimento do que são realmente importantes vividas dentro de empresas, [Kimball, 2002], define alguns objetivos importantes para a utilização de um DW: Fazer com que informações de uma empresa possam ser facilmente acessadas: Permitir fácil acesso aos dados, tanto o conteúdo quanto as ferramentas que serão usadas no DW devem ser de fácil acesso aos usuários, devem retornar os resultados das consultas com menor tempo de espera possível, e os dados devem ser compreensíveis, intuitivos e óbvios. Apresentar informações de modo confiável e consistente: Os dados que irão compor o DW devem ser confiáveis. Mesmo sendo obtidos de várias fontes diferentes, precisam ser filtrados, submetidos a um teste de qualidade e ser liberados somente quando estiverem aptos a serem utilizados. Ser adaptável e flexível a mudanças: as mudanças ocorrem a todo instante, não podendo ser evitadas. Por isso o DW deve ser projetado para acompanhar estas mudanças. 13

14 Segurança das informações: as informações importantes estão armazenadas no DW, por isso deve-se ter o controle ao acesso às informações confidenciais da empresa. Funcionar como a base para tomada de decisões: as informações que pertencem ao DW devem ser apropriadas para auxiliar a tomada de decisões, uma vez que serão apresentadas às evidências a partir dos resultados obtidos. Com a implantação de um DW, é possível estruturar um repositório de dados que será uma fonte de informações que irá auxiliar a tomada de decisão, fazendo com que diversos dados isolados sejam transformados em informações úteis ao ambiente que está sendo trabalhado Banco de Dados Operacionais X Data Warehouse Os dados armazenados em banco de dados tradicionais que utilizam o modelo de Entidade Relacionamento são empregados em diferentes sistemas de aplicação, como exemplo, portais, empresas que possuem um sistema de gerenciamento, entre outros. Estas bases são denominadas operacionais. Já um DW possui um conjunto de dados derivados dos dados operacionais que oferecem suporte à tomada de decisão. Estes dados são referidos como dados "gerenciais", "informacionais" ou "analíticos" [INMON,1996]. Os bancos de dados operacionais são utilizados para armazenar informações de operações obtidas no dia-a-dia, os funcionários registram e executam operações pré-definidas e suas informações podem mudar de acordo com a necessidade da empresa. À medida que vão sofrendo alterações os dados vão sendo excluídos, pois a estrutura não exige grande capacidade de armazenamento. O DW armazena dados tanto detalhados como resumidos, e são voltados às necessidades da gerência no processo de tomada de decisões, possui um armazenamento de informações históricas de anos e através disso possui uma grande capacidade de processamento e armazenamento. A tabela 1 apresenta algumas diferenças definidas por [INMON, 1997] e [KIMBALL, 1998] existentes entre Bancos de Dados Operacionais e um Data Warehouse: 14

15 Tabela 1 Resumo das diferenças entra BDs Operacionais e DWs. Característica Banco de Dados Operacionais Data Warehouses Objetivo Operacional Informativo Tipo de Processamento OLTP (On-line Transaction Processing) OLAP (On-line Analytical Processing) Tipo de Operação Inclusão, Alteração, Exclusão Carga e Consulta Número de Usuários Milhares Centenas Tipo de Usuários Operadores Tomadores de Decisão Interação do Usuário Somente pré-definida Pré-definida e ad-hoc Condições dos Dados Dados Operacionais Dados Analíticos Volume Megabytes Gigabytes Gigabytes Terabytes Histórico 60 a 90 dias 5 a 10 anos Granularidade Detalhados Detalhados e Resumidos Estrutura Estática Variável Acesso a registros Dezenas Milhares Atualização Continua (em tempo real) Periódica (em batch) Integridade Transação A cada Atualização Número de Índices Poucos/Simples Muitos/Complexos Intenção dos Índices Localizar um registro Aperfeiçoar Consultas Para auxiliar os usuários nas funções diárias em BD é utilizado o sistema OLTP (On-Line Transaction Processing). Seu objetivo principal é efetuar o máximo de transações possíveis no menor tempo de processamento. Normalmente estes sistemas são pouco flexíveis ao se tratar de quantidade de relatórios e consultas, pois possui limitações impostas por seu modelo de dados. Nos DWs, que possuem uma quantidade de dados maior e suas consultas são de grande complexidade e os requisitos são difíceis de definir, é necessária a utilização de ferramentas que sejam flexíveis, ou seja, auxiliam na organização e extração de dados de um DW. Para a realização desta análise são utilizados os sistemas OLAP (On-Line Analytical Processing), que permitem aos usuários capacitados, que tenham conhecimento sobre as 15

16 ferramentas, acessarem os dados com maior facilidade, obtendo-se uma visão dimensional dos Dados. As principais diferenças existentes entre os sistemas OLTP e OLAP estão apresentadas na Tabela 2. Tabela 2 Diferenças entra OLTP e OLAP [VAISMAN, 1998] Características Transacional OLTP Analítico OLAP Usuários típicos Usuário em Geral Gerentes, analistas de negócio Aplicação do Sistema Operações do dia-a-dia Análises do negócio Interação do usuário Pré-determinado Ad-hoc Características do trabalho Leitura/gravação Leitura Unidade de Trabalho Transação Consulta Processamento Orientado a processos Orientado a assuntos Atualização Um registro por vez Vários registros por vez A seguir será apresentado o conceito sobre as ferramentas OLAP e suas características e métodos de aplicação OLAP (On-Line Analytical Processing) As ferramentas OLAP são aplicadas na fase final de um DW, sendo utilizadas pelos usuários finais que irão através desta ferramenta acessar e extrair dados em uma base dimensional. Assim, auxiliam o processo tomada de decisão ao realizarem a análise dos dados que compõem os DWs e Data Marts. Segundo [INMON et al., 1999], as ferramentas OLAP são definidas como: uma tecnologia de software que permite aos analistas, gerentes e executivos a obterem os dados de uma forma rápida, consistente e com acesso interativo para uma grande variedade de possíveis visões da informação na empresa. Mais sucintamente, OLAP é um conjunto de funcionalidades que tem, como principal objetivo, facilitar a análise multidimensional [INMON et al., 1999]. As ferramentas OLAP disponibilizam algumas operações para os usuários acessarem os dados. Segundo [KIMBALL, 2002], as principais são: 16

17 Drill Down Esta operação é utilizada para obter resultados mais detalhados, onde os atributos das dimensões atuam como principal ator sobre esta operação. Sendo utilizada para agrupar todos os resultados de uma consulta. Esta operação pode ocorrer de forma automática, onde os atributos são prédefinidos, ou de forma configurável, onde o usuário escolhe qual atributo deseja adicionar a consulta a fim de obter um resultado mais detalhado. Drill Up Uma operação Drill Down acrescenta atributos das dimensões para obter detalhamento nos resultados; Já operação Drill Up exclui do resultado as colunas de agrupamento, sendo que estas não necessitam ser retiradas na mesma seqüência em que estas foram adicionadas, criando um menor nível de detalhamento nas sumarizações. Drill Across A operação Drill Across realiza uma alteração na tabela de fatos que será analisada, conservando o mesmo nível de granularidade e detalhamento da consulta. Várias tabelas de fato, que estão relacionadas em uma ordem de processos interligados, possuem a capacidade de compartilhar das mesmas dimensões, sendo assim possível a execução da operação Drill Across entre elas Características de um DW As características de um DW, segundo [INMON, 1997], são definidas como: orientado por temas ou assuntos, integração dos dados, variáveis no tempo, não-volátil e granularidade dos dados. Estas características serão descritas nos subitem a seguir: 17

18 Orientado por temas As informações que serão armazenadas em um DW são organizadas por temas ou assuntos de acordo com a necessidade da empresa. Os temas que serão armazenados em um ambiente de DW possuem um conjunto de tabelas que estão relacionadas e que possuem informações necessárias para auxiliar a tomada de decisão. Integração dos Dados A integração dos dados é uma outra característica do ambiente de DW. Os dados que estão sendo implantados das bases operacionais são consolidados de maneira que se obtenha um significado uniforme. Um exemplo clássico é do atributo sexo, que pode ser tratado como: m/f, ou 1/0, masculino/feminino, ao serem transportados para o DW, estes dados são convertidos para uma única forma. Variante no Tempo A estrutura dos dados em um DW sempre possui um atributo de tempo, assim, a cada alteração sofrida por um dado, uma nova entrada de dados é gerada, sem que os dados anteriores sejam sobrepostos. Assim, em um DW a data é um componente indispensável sendo considerado como componente chave, pois sua estrutura é projetada através de dimensões de tempo. Ao contrário dos sistemas operacionais, que possuem apenas um sistema de atualização, à medida que novos dados vão sendo inseridos no banco, os antigos são perdidos. Uma das grandes dificuldades encontradas em um ambiente de DW se deve ao fato de que este pode ter dados que não são apenas anuais ou mensais, pois podem existir dados que são diários ou semanais. Os dados devem seguir esta variação de tempo, pois, um dado hoje pode não ter uma informação significativa, porém, no futuro, juntamente com os demais dados que serão inseridos no decorrer do tempo, estes dados podem resultar em informações úteis a serem utilizadas no ambiente em que pertence. 18

19 Não-Volátil Uma vez que os dados armazenados em um DW não sofrem atualizações, estes são carregados apenas uma vez podendo a partir disto serem consultados. Já nos sistemas operacionais existem inúmeras transações de atualizações sendo realizadas a todo o momento, com isso é necessário possuir um grande controle para que não haja nenhuma contradição caso uma transação seja interrompida indevidamente. Em um DW não é necessário este controle, uma vez que os dados estão carregados no DW, estes são disponíveis para serem acessados pelos usuários. Mesmo que os dados sejam armazenados diversas vezes ao longo do tempo, o DW, por possuir o atributo do tempo, permite que estes dados sejam inseridos e consultados n-vezes sem que nenhuma informação se perca. Granularidade A granularidade em um DW refere-se ao nível de detalhes existentes. Em uma consulta, quanto maior o nível de detalhamento dos dados, menor será a granularidade, ou o inverso, quanto menos detalhe na consulta maior será a granularidade. Para [Inmon, 1997], a granularidade é a questão mais importante em um projeto devido ao fato de que ela afeta intensamente o volume de dados existentes no DW, e ainda as consultas que serão realizadas. O balanceamento dos volumes de dados do DW é realizado de acordo com a granularidade de uma consulta. Os dados podem ser divididos em particionamentos que são unidades físicas menores, que têm como objetivo facilitar o trabalho, permitindo flexibilidade no gerenciamento dos dados. Existem diversas formas de divisão dos dados, por exemplo: data, área de pesquisa, área geográfica entre outros. 19

20 2.1.4 Componentes de um Data Warehouse Segundo [KIMBALL, 2002], os componentes que formam um DW completo são: Sistemas Operacionais de Origem Data Staging Area Área de Apresentação de Dados Ferramenta de Acesso a Dados A figura 1 apresenta a forma como estes componentes se relacionam. Sistemas Operacionais de Data Staging Área Área de Apresentação de dados Ferramentas de acesso a dados Origem Extrair Serviços: Filtrar, combinar, e padronizar dimensões de conformidade Carregar NENHUM SERVIÇO DE CONSULTA AO USUÁRIO. Data mart n 1: Dados DIMENSIONAIS e atômicos e de resumo baseado em um único processo de negócio Acessar Ferramentas de consulta especificas. Criadores de relatórios. Extrair Armazenamento de dados: tabelas relacionais e arquivos simples. Barramento do DW: fatos e decisões em conformidade Aplicações de análise. Modelagem: Processamento: previsão, Extrair Classificação e processamento seqüencial. Carregar Data mart n 2... (projetado da mesma forma) Acessar pontuação e exploração de dados. Figura 1 - Elementos básicos do Data Warehouse [KIMBALL, 2002] A figura 1 apresenta os elementos que compõem um DW, estes elementos serão apresentados nos tópicos a seguir: 20

21 Sistemas Operacionais de Origem Sistemas Operacionais de Origem são os sistemas que buscam as transações de dados. As consultas são limitadas sendo realizadas em somente um registro por vez. Os Sistemas Operacionais de Origem são partes externas ao DW, pois não possuem nenhum ou pouco controle sobre o formato e conteúdo dos dados e possuem um pequeno volume de dados históricos. Data Staging Área A Data Staging Area (Área de Preparo de Dados) é uma área de armazenamento, atua de forma abrangente, desde o acesso a base dos sistemas operacionais de origem até área de apresentação dos dados. Um dos requisitos de preparo dos dados é que estes não estejam disponíveis para uso aos usuários, sem permitir consultas e serviços de apresentação de dados, pois os dados devem ser primeiramente transformados e organizados pelos profissionais responsáveis e somente após esta preparo os dados serão disponibilizados para os usuários finais. Esta área de preparo é formada por dados oriundos das fontes externas ao DW, juntamente com um conjunto de técnicas denominadas por ETL (extract + transformation + load), ou seja, extração, transformação e carga. No processo de extração é realizada a leitura dos dados brutos encontrados nas bases de dados de origem. Estes dados são interpretados das fontes externas e compreendidos, com isto, os dados que serão carregados no DW, são reproduzidos para a área de preparo onde futuramente serão utilizados. Após o processo de extração, inicia-se o processo de transformação onde são executadas algumas operações, como filtragem dos dados, limpeza, conflitos de domínio, tratamento de elementos ausentes, padronização dos dados, correção de escrita. O processo de carga utiliza uma estrutura onde os dados são apresentados através de tabelas dimensionais. Após os dados serem indexados, carregados, agregados apropriadamente e feito à verificação da qualidade, os usuários serão avisados que os novos dados estão publicados. 21

22 Área de Apresentação dos Dados A Área de Apresentação de Dados é o ambiente em que os dados são organizados, gravados e disponibilizados aos usuários para realizarem consultas, gerar relatórios e para as demais aplicações de analise. Através das ferramentas de acesso aos dados, estes se tornam acessíveis e visíveis aos usuários. Ferramentas de Acesso a Dados O último componente de um Data Warehouse são as ferramentas de acesso a dados, que serão utilizadas para consultar os dados na área de apresentação. Uma ferramenta pode ser bem simples para a realização de consultas especificas ou mais sofisticada como uma aplicação de modelagem ou mineração de dados, como por exemplo, a ferramenta Crystal Reports que gera relatórios a partir de um DW ou ainda uma ferramenta de mineração de dados que utiliza algoritmos para realizar as consultas desejadas Modelagem Dimensional A maioria dos sistemas de informação que são usados no dia-a-dia de um ambiente é modelada com métodos que retornam respostas rápidas as consultas quando são utilizadas pequenas quantidade de dados. Assim, os sistemas guardam os dados normalizados, sendo o modelo composto basicamente por tabelas e relacionamentos entre si. Em caso de grande volume de dados a serem sumarizados, o modelo relacional normalizado não é totalmente apropriado, neste caso é necessário que os dados sejam transformados para que os dados que se encontram armazenados nestas bases sejam organizados e utilizados de forma útil ao ambiente, isso é possível através do modelo dimensional. A modelagem dimensional é definida por [KIMBALL, 2002], como um processo estruturado desenvolvido para se obter um modelo de dados dimensional. É composto por uma entidade central ou fato, que apresenta a 22

23 melhora dos negócios do cotidiano de uma organização, e um conjunto de entidades menores ou dimensões, que estão localizadas ao redor da entidade central Esquema Estrela O Esquema Estrela é formado por um modelo simples, composto por poucas tabelas e relacionamentos bem estruturados [POE, et al., 1998]. Com isso, facilita a compreensão e leitura dos dados, não apenas para os analistas, mas também para os usuários finais que não estão familiarizados com banco de dados. Possibilita o desenvolvimento de um banco de dados que realiza com facilidade consultas complexas, podendo ser feitas de forma eficiente e de modo direto pelo usuário. A figura 2 apresenta um modelo dimensional utilizando o Esquema Estrela. Figura 2 - Exemplo de um modelo dimensional utilizando o Esquema Estrela [TISSOT, 2004] O Esquema Estrela possui esta nomenclatura devido à disposição das tabelas no modelo, que é formado por uma tabela central, denominada a tabela de fatos, e esta está relacionada com várias outras tabelas, chamadas de tabelas de dimensão (os conceitos de tabelas de fatos e tabelas de dimensão são apresentados nas seções seguintes). 23

24 Tabela de Fatos A tabela de Fatos é a principal tabela que compõe um modelo dimensional, armazenam medições (linha em uma tabela de fatos) numéricas ou métricas de desempenho que está relacionada a um assunto ou processo de negócio. Todo registro de uma tabela de fato está ligado a um conjunto de dimensões que indicam a granularidade dos fatos que estão armazenados e definem qual o alvo destas medidas. Quanto menor a granularidade de um fato, maior será o nível de detalhe armazenado [KIMBALL, 2002] Tabela de Dimensão As tabelas de dimensão sempre acompanham uma tabela de fatos, ela possui os descritores textuais de um processo, as tabelas de dimensão são formadas diversos atributos, que servem de base para definir regras de agrupamento e filtros para consultas em uma tabela de fato. Os atributos nas tabelas de dimensão possuem um papel essencial do DW, por serem a origem de todas as restrições e rótulos de relatórios, os atributos são fundamentais para que o DW seja utilizado e compreendido [KIMBALL, 2002]. Os dados que estão armazenados nas dimensões foram carregados do banco de dados de origem e são utilizados para realização de consultas e abastecimento do DW Metadados Os metadados são definidos normalmente como dados sobre dados, isto é, a abstração dos dados ou mesmo, dados de nível superior que descrevem dados de um nível inferior. Sem a criação de metadados, os dados não possuem significado. Em um DW os metadados apresentam uma importância muito maior que a atribuída no ambiente operativo, é responsável pela integração das bases de dados que constituem o DW [INMON,1997]. Os metadados 24

Data Warehouse Processos e Arquitetura

Data Warehouse Processos e Arquitetura Data Warehouse - definições: Coleção de dados orientada a assunto, integrada, não volátil e variável em relação ao tempo, que tem por objetivo dar apoio aos processos de tomada de decisão (Inmon, 1997)

Leia mais

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO @ribeirord FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO Rafael D. Ribeiro, M.Sc,PMP. rafaeldiasribeiro@gmail.com http://www.rafaeldiasribeiro.com.br Lembrando... Aula 4 1 Lembrando... Aula 4 Sistemas de apoio

Leia mais

SUMÁRIO 1. INTRODUÇÃO... 2 2. O QUE É DATA WAREHOUSE?... 2 3. O QUE DATA WAREHOUSE NÃO É... 4 4. IMPORTANTE SABER SOBRE DATA WAREHOUSE... 5 4.

SUMÁRIO 1. INTRODUÇÃO... 2 2. O QUE É DATA WAREHOUSE?... 2 3. O QUE DATA WAREHOUSE NÃO É... 4 4. IMPORTANTE SABER SOBRE DATA WAREHOUSE... 5 4. SUMÁRIO 1. INTRODUÇÃO... 2 2. O QUE É DATA WAREHOUSE?... 2 3. O QUE DATA WAREHOUSE NÃO É... 4 4. IMPORTANTE SABER SOBRE DATA WAREHOUSE... 5 4.1 Armazenamento... 5 4.2 Modelagem... 6 4.3 Metadado... 6 4.4

Leia mais

Aplicação A. Aplicação B. Aplicação C. Aplicação D. Aplicação E. Aplicação F. Aplicação A REL 1 REL 2. Aplicação B REL 3.

Aplicação A. Aplicação B. Aplicação C. Aplicação D. Aplicação E. Aplicação F. Aplicação A REL 1 REL 2. Aplicação B REL 3. Sumário Data Warehouse Modelagem Multidimensional. Data Mining BI - Business Inteligence. 1 2 Introdução Aplicações do negócio: constituem as aplicações que dão suporte ao dia a dia do negócio da empresa,

Leia mais

Data Warehousing. Leonardo da Silva Leandro. CIn.ufpe.br

Data Warehousing. Leonardo da Silva Leandro. CIn.ufpe.br Data Warehousing Leonardo da Silva Leandro Agenda Conceito Elementos básicos de um DW Arquitetura do DW Top-Down Bottom-Up Distribuído Modelo de Dados Estrela Snowflake Aplicação Conceito Em português:

Leia mais

Sistemas de Apoio à Decisão (SAD) - Senado

Sistemas de Apoio à Decisão (SAD) - Senado Sistemas de Apoio à Decisão (SAD) - Senado DW OLAP BI Ilka Kawashita Material preparado :Prof. Marcio Vitorino Sumário OLAP Data Warehouse (DW/ETL) Modelagem Multidimensional Data Mining BI - Business

Leia mais

Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence

Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence É um conjunto de conceitos e metodologias que, fazem uso de acontecimentos e sistemas e apoiam a tomada de decisões. Utilização de várias fontes de informação para se definir estratégias de competividade

Leia mais

DATA WAREHOUSE. Introdução

DATA WAREHOUSE. Introdução DATA WAREHOUSE Introdução O grande crescimento do ambiente de negócios, médias e grandes empresas armazenam também um alto volume de informações, onde que juntamente com a tecnologia da informação, a correta

Leia mais

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Planejamento Estratégico de TI. Prof.: Fernando Ascani Planejamento Estratégico de TI Prof.: Fernando Ascani Data Warehouse - Conceitos Hoje em dia uma organização precisa utilizar toda informação disponível para criar e manter vantagem competitiva. Sai na

Leia mais

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE Engenharia de Computação Professor: Rosalvo Ferreira de Oliveira Neto OLPT x OLAP Roteiro OLTP Datawarehouse OLAP Operações OLAP Exemplo com Mondrian e Jpivot

Leia mais

Professor: Disciplina:

Professor: Disciplina: Professor: Curso: Esp. Marcos Morais de Sousa marcosmoraisdesousa@gmail.com Sistemas de informação Disciplina: Introdução a SI Noções de sistemas de informação Turma: 01º semestre Prof. Esp. Marcos Morais

Leia mais

DATA WAREHOUSE. Rafael Ervin Hass Raphael Laércio Zago

DATA WAREHOUSE. Rafael Ervin Hass Raphael Laércio Zago DATA WAREHOUSE Rafael Ervin Hass Raphael Laércio Zago Roteiro Introdução Aplicações Arquitetura Características Desenvolvimento Estudo de Caso Conclusão Introdução O conceito de "data warehousing" data

Leia mais

Bloco Administrativo

Bloco Administrativo Bloco Administrativo BI Business Intelligence Objetivo O objetivo deste artigo é dar uma visão geral sobre o Módulo Business Intelligence, que se encontra no Bloco Administrativo. Todas informações aqui

Leia mais

5 Estudo de Caso. 5.1. Material selecionado para o estudo de caso

5 Estudo de Caso. 5.1. Material selecionado para o estudo de caso 5 Estudo de Caso De modo a ilustrar a estruturação e representação de conteúdos educacionais segundo a proposta apresentada nesta tese, neste capítulo apresentamos um estudo de caso que apresenta, para

Leia mais

Data Warehouses. Alunos: Diego Antônio Cotta Silveira Filipe Augusto Rodrigues Nepomuceno Marcos Bastos Silva Roger Rezende Ribeiro Santos

Data Warehouses. Alunos: Diego Antônio Cotta Silveira Filipe Augusto Rodrigues Nepomuceno Marcos Bastos Silva Roger Rezende Ribeiro Santos Data Warehouses Alunos: Diego Antônio Cotta Silveira Filipe Augusto Rodrigues Nepomuceno Marcos Bastos Silva Roger Rezende Ribeiro Santos Conceitos Básicos Data Warehouse(DW) Banco de Dados voltado para

Leia mais

CONSIDERAÇÕES SOBRE ATIVIDADES DE IDENTIFICAÇÃO, LOCALIZAÇÃO E TRATAMENTO DE DADOS NA CONSTRUÇÃO DE UM DATA WAREHOUSE

CONSIDERAÇÕES SOBRE ATIVIDADES DE IDENTIFICAÇÃO, LOCALIZAÇÃO E TRATAMENTO DE DADOS NA CONSTRUÇÃO DE UM DATA WAREHOUSE CONSIDERAÇÕES SOBRE ATIVIDADES DE IDENTIFICAÇÃO, LOCALIZAÇÃO E TRATAMENTO DE DADOS NA CONSTRUÇÃO DE UM DATA WAREHOUSE Fabio Favaretto Professor adjunto - Programa de Pós Graduação em Engenharia de Produção

Leia mais

Business Intelligence e ferramentas de suporte

Business Intelligence e ferramentas de suporte O modelo apresentado na figura procura enfatizar dois aspectos: o primeiro é sobre os aplicativos que cobrem os sistemas que são executados baseados no conhecimento do negócio; sendo assim, o SCM faz o

Leia mais

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA Lizianne Priscila Marques SOUTO 1 1 Faculdade de Ciências Sociais e Aplicadas

Leia mais

Tópicos Avançados Business Intelligence. Banco de Dados Prof. Otacílio José Pereira. Unidade 10 Tópicos Avançados Business Inteligence.

Tópicos Avançados Business Intelligence. Banco de Dados Prof. Otacílio José Pereira. Unidade 10 Tópicos Avançados Business Inteligence. Tópicos Avançados Business Intelligence Banco de Dados Prof. Otacílio José Pereira Unidade 10 Tópicos Avançados Business Inteligence Roteiro Introdução Níveis organizacionais na empresa Visão Geral das

Leia mais

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse Definição escopo do projeto (departamental, empresarial) Grau de redundância dos dados(ods, data staging) Tipo de usuário alvo (executivos, unidades) Definição do ambiente (relatórios e consultas préestruturadas

Leia mais

Data Warehouses Uma Introdução

Data Warehouses Uma Introdução Data Warehouses Uma Introdução Alex dos Santos Vieira, Renaldy Pereira Sousa, Ronaldo Ribeiro Goldschmidt 1. Motivação e Conceitos Básicos Com o advento da globalização, a competitividade entre as empresas

Leia mais

Arquiteturas de DW e Abordagens de Implementação. Arquiteturas e Abordagens de Implementação

Arquiteturas de DW e Abordagens de Implementação. Arquiteturas e Abordagens de Implementação Curso de Dwing TecBD-DI PUC-Rio Prof. Rubens Melo Arquiteturas de DW e Abordagens de Implementação Arquiteturas e Abordagens de Implementação Arquitetura adequada é fundamental Infra-estrutura disponível

Leia mais

SISTEMAS DE APOIO À DECISÃO SAD

SISTEMAS DE APOIO À DECISÃO SAD SISTEMAS DE APOIO À DECISÃO SAD Conceitos introdutórios Decisão Escolha feita entre duas ou mais alternativas. Tomada de decisão típica em organizações: Solução de problemas Exploração de oportunidades

Leia mais

Modelo de dados do Data Warehouse

Modelo de dados do Data Warehouse Modelo de dados do Data Warehouse Ricardo Andreatto O modelo de dados tem um papel fundamental para o desenvolvimento interativo do data warehouse. Quando os esforços de desenvolvimentos são baseados em

Leia mais

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5 Para entender bancos de dados, é útil ter em mente que os elementos de dados que os compõem são divididos em níveis hierárquicos. Esses elementos de dados lógicos constituem os conceitos de dados básicos

Leia mais

SAD orientado a DADOS

SAD orientado a DADOS Universidade do Contestado Campus Concórdia Curso de Sistemas de Informação Prof.: Maico Petry SAD orientado a DADOS DISCIPLINA: Sistemas de Apoio a Decisão SAD orientado a dados Utilizam grandes repositórios

Leia mais

BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES.

BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES. Encontro de Ensino, Pesquisa e Extensão, Presidente Prudente, 22 a 25 de outubro, 2012 88 BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES. Andrios Robert Silva Pereira, Renato Zanutto

Leia mais

Banco de Dados - Senado

Banco de Dados - Senado Banco de Dados - Senado Exercícios OLAP - CESPE Material preparado: Prof. Marcio Vitorino OLAP Material preparado: Prof. Marcio Vitorino Soluções MOLAP promovem maior independência de fornecedores de SGBDs

Leia mais

Data Warehousing Visão Geral do Processo

Data Warehousing Visão Geral do Processo Data Warehousing Visão Geral do Processo Organizações continuamente coletam dados, informações e conhecimento em níveis cada vez maiores,, e os armazenam em sistemas informatizados O número de usuários

Leia mais

KDD UMA VISAL GERAL DO PROCESSO

KDD UMA VISAL GERAL DO PROCESSO KDD UMA VISAL GERAL DO PROCESSO por Fernando Sarturi Prass 1 1.Introdução O aumento das transações comerciais por meio eletrônico, em especial as feitas via Internet, possibilitou as empresas armazenar

Leia mais

Data Mining: Conceitos e Técnicas

Data Mining: Conceitos e Técnicas Data Mining: Conceitos e Técnicas DM, DW e OLAP Data Warehousing e OLAP para Data Mining O que é data warehouse? De data warehousing para data mining Data Warehousing e OLAP para Data Mining Data Warehouse:

Leia mais

Uma Arquitetura de Gestão de Dados em Ambiente Data Warehouse

Uma Arquitetura de Gestão de Dados em Ambiente Data Warehouse Uma Arquitetura de Gestão de Dados em Ambiente Data Warehouse Alcione Benacchio (UFPR) E mail: alcione@inf.ufpr.br Maria Salete Marcon Gomes Vaz (UEPG, UFPR) E mail: salete@uepg.br Resumo: O ambiente de

Leia mais

srbo@ufpa.br www.ufpa.br/srbo

srbo@ufpa.br www.ufpa.br/srbo CBSI Curso de Bacharelado em Sistemas de Informação BI Prof. Dr. Sandro Ronaldo Bezerra Oliveira srbo@ufpa.br www.ufpa.br/srbo Tópicos Especiais em Sistemas de Informação Faculdade de Computação Instituto

Leia mais

Data Warehouse. Debora Marrach Renata Miwa Tsuruda

Data Warehouse. Debora Marrach Renata Miwa Tsuruda Debora Marrach Renata Miwa Tsuruda Agenda Introdução Contexto corporativo Agenda Introdução Contexto corporativo Introdução O conceito de Data Warehouse surgiu da necessidade de integrar dados corporativos

Leia mais

Identificar as mudanças que acontecem na forma e no uso de apoio à decisão em empreendimentos de e-business. Identificar o papel e alternativas de

Identificar as mudanças que acontecem na forma e no uso de apoio à decisão em empreendimentos de e-business. Identificar o papel e alternativas de 1 Identificar as mudanças que acontecem na forma e no uso de apoio à decisão em empreendimentos de e-business. Identificar o papel e alternativas de relatórios dos sistemas de informação gerencial. Descrever

Leia mais

Prof. Msc. Paulo Muniz de Ávila

Prof. Msc. Paulo Muniz de Ávila Prof. Msc. Paulo Muniz de Ávila O que é Data Mining? Mineração de dados (descoberta de conhecimento em bases de dados): Extração de informação interessante (não-trivial, implícita, previamente desconhecida

Leia mais

Data Warehouse Mineração de Dados

Data Warehouse Mineração de Dados Data Warehouse Mineração de Dados Profa. Roberta Macêdo M. Gouveia robertammg@gmail.com 1 18/12/2014 Data Warehouse Data Mining Big Data A mina de ouro debaixo dos bits 2 Data Warehouse: A Memória da Empresa

Leia mais

2 Descoberta de Conhecimento em Bases de Dados 2.1. Introdução

2 Descoberta de Conhecimento em Bases de Dados 2.1. Introdução 2 Descoberta de Conhecimento em Bases de Dados 2.1. Introdução De acordo com [FAYY96], o conceito de descoberta de conhecimento em bases de dados pode ser resumido como o processo não-trivial de identificar

Leia mais

Módulo 2. Definindo Soluções OLAP

Módulo 2. Definindo Soluções OLAP Módulo 2. Definindo Soluções OLAP Objetivos Ao finalizar este módulo o participante: Recordará os conceitos básicos de um sistema OLTP com seus exemplos. Compreenderá as características de um Data Warehouse

Leia mais

Interatividade aliada a Análise de Negócios

Interatividade aliada a Análise de Negócios Interatividade aliada a Análise de Negócios Na era digital, a quase totalidade das organizações necessita da análise de seus negócios de forma ágil e segura - relatórios interativos, análise de gráficos,

Leia mais

PLANO DE ENSINO PRÉ-REQUISITOS: ENS

PLANO DE ENSINO PRÉ-REQUISITOS: ENS UNIVERSIDADE DO ESTADO DE SANTA CATARINA UDESC CENTRO DE EDUCAÇÃO SUPERIOR DO ALTO VALE DO ITAJAÍ CEAVI PLANO DE ENSINO DEPARTAMENTO: DSI Departamento de Sistema de Informação DISCIPLINA: Data Warehouse

Leia mais

Trata-se de uma estratégia de negócio, em primeira linha, que posteriormente se consubstancia em soluções tecnológicas.

Trata-se de uma estratégia de negócio, em primeira linha, que posteriormente se consubstancia em soluções tecnológicas. CUSTOMER RELATIONSHIP MANAGEMENT Customer Relationship Management CRM ou Gestão de Relacionamento com o Cliente é uma abordagem que coloca o cliente no centro dos processos do negócio, sendo desenhado

Leia mais

A importância da. nas Organizações de Saúde

A importância da. nas Organizações de Saúde A importância da Gestão por Informações nas Organizações de Saúde Jorge Antônio Pinheiro Machado Filho Consultor de Negócios www.bmpro.com.br jorge@bmpro.com.br 1. Situação nas Empresas 2. A Importância

Leia mais

Chapter 3. Análise de Negócios e Visualização de Dados

Chapter 3. Análise de Negócios e Visualização de Dados Chapter 3 Análise de Negócios e Visualização de Dados Objetivos de Aprendizado Descrever a análise de negócios (BA) e sua importância par as organizações Listar e descrever brevemente os principais métodos

Leia mais

UNIVERSIDADE CANDIDO MENDES INSTITUTO A VEZ DO MESTRE PÓS GRADUAÇÃO LATO SENSU

UNIVERSIDADE CANDIDO MENDES INSTITUTO A VEZ DO MESTRE PÓS GRADUAÇÃO LATO SENSU UNIVERSIDADE CANDIDO MENDES INSTITUTO A VEZ DO MESTRE PÓS GRADUAÇÃO LATO SENSU DATA WAREHOUSE: INFORMAÇÃO COM QUALIDADE PARA FACILITAR A GERAÇÃO DE ESTRATÉGIAS ALINE DE OLIVEIRA PRATA JAQUEIRA Orientadora:

Leia mais

Fundamentos da inteligência de negócios: gestão da informação e de bancos de dados

Fundamentos da inteligência de negócios: gestão da informação e de bancos de dados Fundamentos da inteligência de negócios: gestão da informação e de bancos de dados slide 1 1 Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall Objetivos de estudo Como um banco de dados

Leia mais

IMPLANTAÇÃO DO DW NA ANVISA

IMPLANTAÇÃO DO DW NA ANVISA IMPLANTAÇÃO DO DW NA ANVISA Bruno Nascimento de Ávila 1 Rodrigo Vitorino Moravia 2 Maria Renata Furtado 3 Viviane Rodrigues Silva 4 RESUMO A tecnologia de Business Intelligenge (BI) ou Inteligência de

Leia mais

PROJETO DE REDES www.projetoderedes.com.br

PROJETO DE REDES www.projetoderedes.com.br PROJETO DE REDES www.projetoderedes.com.br Centro Universitário de Volta Redonda - UniFOA Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro

Leia mais

Sobre o que falaremos nesta aula?

Sobre o que falaremos nesta aula? Business Intelligence - BI Inteligência de Negócios Prof. Ricardo José Pfitscher Elaborado com base no material de: José Luiz Mendes Gerson Volney Lagmman Introdução Sobre o que falaremos nesta aula? Ferramentas

Leia mais

UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado)

UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado) UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado) SISTEMA INTERNO INTEGRADO PARA CONTROLE DE TAREFAS INTERNAS DE UMA EMPRESA DE DESENVOLVIMENTO

Leia mais

UNIVERSIDADE FEDERAL DE MINAS GERAIS BACHARELADO EM SISTEMAS DE INFORMAÇÃO

UNIVERSIDADE FEDERAL DE MINAS GERAIS BACHARELADO EM SISTEMAS DE INFORMAÇÃO UNIVERSIDADE FEDERAL DE MINAS GERAIS BACHARELADO EM SISTEMAS DE INFORMAÇÃO Proposta de Formação Complementar: BUSINESS INTELLIGENCE E SUA APLICAÇÃO À GESTÃO Aluno: Yussif Tadeu de Barcelos Solange Teixeira

Leia mais

Uma aplicação de Data Warehouse para apoiar negócios

Uma aplicação de Data Warehouse para apoiar negócios Uma aplicação de Data Warehouse para apoiar negócios André Vinicius Gouvêa Monteiro Marcos Paulo Oliveira Pinto Rosa Maria E. Moreira da Costa Universidade do Estado do Rio de Janeiro - UERJ IME - Dept

Leia mais

DATA WAREHOUSE. Data Warehouse

DATA WAREHOUSE. Data Warehouse DATA WAREHOUSE Data Warehouse Sumário Conceitos / Autores chave... 3 1. Introdução... 5 2. Características de um Data Warehouse... 6 3. Arquitetura de Data Wirehouse... 8 4. Conclusões... 10 Materiais

Leia mais

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO Fernanda Delizete Madeira 1 ; Aracele Garcia de Oliveira Fassbinder 2 INTRODUÇÃO Data

Leia mais

Administração de Sistemas de Informação Gerenciais UNIDADE IV: Fundamentos da Inteligência de Negócios: Gestão da Informação e de Banco de Dados Um banco de dados é um conjunto de arquivos relacionados

Leia mais

Gestão do Conhecimento: Extração de Informações do Banco de Dados de um Supermercado

Gestão do Conhecimento: Extração de Informações do Banco de Dados de um Supermercado Gestão do Conhecimento: Extração de Informações do Banco de Dados de um Supermercado Alessandro Ferreira Brito 1, Rodrigo Augusto R. S. Baluz 1, Jean Carlo Galvão Mourão 1, Francisco das Chagas Rocha 2

Leia mais

Laudon & Laudon Essentials of MIS, 5th Edition. Pg. 1.1

Laudon & Laudon Essentials of MIS, 5th Edition. Pg. 1.1 Laudon & Laudon Essentials of MIS, 5th Edition. Pg. 1.1 SISTEMA DE APOIO À DECISÃO Grupo: Denilson Neves Diego Antônio Nelson Santiago Sabrina Dantas CONCEITO É UM SISTEMA QUE AUXILIA O PROCESSO DE DECISÃO

Leia mais

Prova INSS RJ - 2007 cargo: Fiscal de Rendas

Prova INSS RJ - 2007 cargo: Fiscal de Rendas Prova INSS RJ - 2007 cargo: Fiscal de Rendas Material de Apoio de Informática - Prof(a) Ana Lucia 53. Uma rede de microcomputadores acessa os recursos da Internet e utiliza o endereço IP 138.159.0.0/16,

Leia mais

05/06/2012. Banco de Dados. Gerenciamento de Arquivos. Gerenciamento de Arquivos Sistema Gerenciador de Banco de Dados Modelos de Dados

05/06/2012. Banco de Dados. Gerenciamento de Arquivos. Gerenciamento de Arquivos Sistema Gerenciador de Banco de Dados Modelos de Dados Banco de Dados Gerenciamento de Arquivos Sistema Gerenciador de Banco de Dados Modelos de Dados Gerenciamento de Arquivos Gerenciamento de Arquivos 1 Gerenciamento de Arquivos Em uma indústria são executadas

Leia mais

CAPÍTULO 7. SISTEMAS DE APOIO À DECISÃO (SAD) SISTEMAS DE SUPORTE À DECISÃO (SSD)

CAPÍTULO 7. SISTEMAS DE APOIO À DECISÃO (SAD) SISTEMAS DE SUPORTE À DECISÃO (SSD) 1 CAPÍTULO 7. SISTEMAS DE APOIO À DECISÃO (SAD) SISTEMAS DE SUPORTE À DECISÃO (SSD) A necessidade dos SAD surgiu em decorrência de diversos fatores, como, por exemplo: Competição cada vez maior entre as

Leia mais

Business Intelligence Um enfoque gerencial para a Inteligência do Negócio.Efrain Turban e outros.tradução. Bookman, 2009.

Business Intelligence Um enfoque gerencial para a Inteligência do Negócio.Efrain Turban e outros.tradução. Bookman, 2009. REFERÊNCIAS o o Business Intelligence Um enfoque gerencial para a Inteligência do Negócio.Efrain Turban e outros.tradução. Bookman, 2009. Competição Analítica - Vencendo Através da Nova Ciência Davenport,

Leia mais

DATA WAREHOUSE & DATA MINING

DATA WAREHOUSE & DATA MINING UNIVERSIDADE FEDERAL DE SANTA CATARINA UFSC Centro Tecnológico - Departamento de Informática e Estatística - INE Disciplina: EPS 5216 Sistemas de Informações Gerenciais Professora: Aline França de Abreu

Leia mais

KDD E MINERAÇÃO DE DADOS:

KDD E MINERAÇÃO DE DADOS: KDD E MINERAÇÃO DE DADOS: Revisão em Data Warehouses Prof. Ronaldo R. Goldschmidt ronaldo@de9.ime.eb.br rribeiro@univercidade.br geocities.yahoo.com.br/ronaldo_goldschmidt 1 DATA WAREHOUSES UMA VISÃO GERAL

Leia mais

Data Warehouse. Djenane Cristina Silveira dos Santos¹, Felipe Gomes do Prado¹, José Justino Neto¹, Márcia Taliene Alves de Paiva¹

Data Warehouse. Djenane Cristina Silveira dos Santos¹, Felipe Gomes do Prado¹, José Justino Neto¹, Márcia Taliene Alves de Paiva¹ Data Warehouse. Djenane Cristina Silveira dos Santos¹, Felipe Gomes do Prado¹, José Justino Neto¹, Márcia Taliene Alves de Paiva¹ ¹Ciência da Computação Universidade Federal de Itajubá (UNIFEI) MG Brasil

Leia mais

Uma Ferramenta Web para BI focada no Gestor de Informação

Uma Ferramenta Web para BI focada no Gestor de Informação Uma Ferramenta Web para BI focada no Gestor de Informação Mikael de Souza Fernandes 1, Gustavo Zanini Kantorski 12 mikael@cpd.ufsm.br, gustavoz@cpd.ufsm.br 1 Curso de Sistemas de Informação, Universidade

Leia mais

Palavras-chave: On-line Analytical Processing, Data Warehouse, Web mining.

Palavras-chave: On-line Analytical Processing, Data Warehouse, Web mining. BUSINESS INTELLIGENCE COM DADOS EXTRAÍDOS DO FACEBOOK UTILIZANDO A SUÍTE PENTAHO Francy H. Silva de Almeida 1 ; Maycon Henrique Trindade 2 ; Everton Castelão Tetila 3 UFGD/FACET Caixa Postal 364, 79.804-970

Leia mais

Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence

Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence Juntamente com o desenvolvimento desses aplicativos surgiram os problemas: & Data Warehouse July Any Rizzo Oswaldo Filho Década de 70: alguns produtos de BI Intensa e exaustiva programação Informação em

Leia mais

Processo Decisório, OLAP e Relatórios Corporativos OLAP E RELATÓRIOS CORPORATIVOS

Processo Decisório, OLAP e Relatórios Corporativos OLAP E RELATÓRIOS CORPORATIVOS Processo Decisório, OLAP e Relatórios Corporativos OLAP E RELATÓRIOS CORPORATIVOS Sumário Conceitos/Autores chave... 3 1. Introdução... 5 2. OLAP... 6 3. Operações em OLAP... 8 4. Arquiteturas em OLAP...

Leia mais

Aplicando Técnicas de Business Intelligence sobre dados de desempenho Acadêmico: Um estudo de caso

Aplicando Técnicas de Business Intelligence sobre dados de desempenho Acadêmico: Um estudo de caso Aplicando Técnicas de Business Intelligence sobre dados de desempenho Acadêmico: Um estudo de caso Ana Magela Rodriguez Almeida 1, Sandro da Silva Camargo 1 1 Curso Engenharia de Computação Universidade

Leia mais

BANCO DE DADOS DISTRIBUÍDOS e DATAWAREHOUSING

BANCO DE DADOS DISTRIBUÍDOS e DATAWAREHOUSING BANCO DE DADOS DISTRIBUÍDOS e DATAWAREHOUSING http://www.uniriotec.br/~tanaka/tin0036 tanaka@uniriotec.br Introdução a Data Warehousing e OLAP Introdução a Data Warehouse e Modelagem Dimensional Visão

Leia mais

ASPECTOS DE CRIAÇÃO E CARGA DE UM AMBIENTE DE DATA WAREHOUSE ANDRÉ FERNANDES DA COSTA FELIPE CURVELLO ANCIÃES

ASPECTOS DE CRIAÇÃO E CARGA DE UM AMBIENTE DE DATA WAREHOUSE ANDRÉ FERNANDES DA COSTA FELIPE CURVELLO ANCIÃES ASPECTOS DE CRIAÇÃO E CARGA DE UM AMBIENTE DE DATA WAREHOUSE ANDRÉ FERNANDES DA COSTA FELIPE CURVELLO ANCIÃES Universidade Federal do Rio De Janeiro UFRJ Instituto de Matemática - IM Departamento de Ciência

Leia mais

Projeto de Arquitetura

Projeto de Arquitetura Projeto de Arquitetura Ian Sommerville 2006 Engenharia de Software, 8ª. edição. Capítulo 11 Slide 1 Objetivos Apresentar projeto de arquitetura e discutir sua importância Explicar as decisões de projeto

Leia mais

Decisão Suporte: Warehousing, OLAP e Data Mining

Decisão Suporte: Warehousing, OLAP e Data Mining Decisão Suporte: Warehousing, OLAP e Data Mining 7-1 Introdução Cada vez mais, organizações estão analizando dados correntes e históricos para identificar padrões úteis e suporte a estratégias de negócios.

Leia mais

Decisão Suporte: Warehousing, OLAP e Data Mining

Decisão Suporte: Warehousing, OLAP e Data Mining Decisão Suporte: Warehousing, OLAP e Data Mining 7-1 Introdução Cada vez mais, organizações estão analizando dados correntes e históricos para identificar padrões úteis e suporte a estratégias de negócios.

Leia mais

Complemento I - Noções Introdutórias em Data Warehouses

Complemento I - Noções Introdutórias em Data Warehouses Complemento I - Noções Introdutórias em Data Warehouses Esse documento é parte integrante do material fornecido pela WEB para a 2ª edição do livro Data Mining: Conceitos, técnicas, algoritmos, orientações

Leia mais

Curso Data warehouse e Business Intelligence

Curso Data warehouse e Business Intelligence Curso Data warehouse e Business Intelligence Fundamentos, Metodologia e Arquitetura Apresentação Os projetos de Data Warehouse e Business Intelligence são dos mais interessantes e complexos de desenvolver

Leia mais

Adriano Maranhão BUSINESS INTELLIGENCE (BI),

Adriano Maranhão BUSINESS INTELLIGENCE (BI), Adriano Maranhão BUSINESS INTELLIGENCE (BI), BUSINESS INTELLIGENCE (BI) O termo Business Intelligence (BI), popularizado por Howard Dresner do Gartner Group, é utilizado para definir sistemas orientados

Leia mais

Curso Data warehouse e Business Intelligence Fundamentos, Metodologia e Arquitetura

Curso Data warehouse e Business Intelligence Fundamentos, Metodologia e Arquitetura Curso Data warehouse e Business Intelligence Fundamentos, Metodologia e Arquitetura Apresentação Os projetos de Data Warehouse e Business Intelligence são dos mais interessantes e complexos de desenvolver

Leia mais

Prof. Ronaldo R. Goldschmidt. ronaldo.rgold@gmail.com

Prof. Ronaldo R. Goldschmidt. ronaldo.rgold@gmail.com DATA WAREHOUSES UMA INTRODUÇÃO Prof. Ronaldo R. Goldschmidt ronaldo.rgold@gmail.com 1 DATA WAREHOUSES UMA INTRODUÇÃO Considerações Iniciais Conceitos Básicos Modelagem Multidimensional Projeto de Data

Leia mais

PLANO DE ENSINO DO 2º SEMESTRE LETIVO DE 2012

PLANO DE ENSINO DO 2º SEMESTRE LETIVO DE 2012 PLANO DE ENSINO DO 2º SEMESTRE LETIVO DE 2012 Curso: TECNOLOGIA EM GESTÃO COMERCIAL Habilitação: TECNÓLOGO Disciplina: NEGÓCIOS INTELIGENTES (BUSINESS INTELLIGENCE) Período: M V N 4º semestre do Curso

Leia mais

Capítulo 1 - A revolução dos dados, da informação e do conhecimento 1 B12 4

Capítulo 1 - A revolução dos dados, da informação e do conhecimento 1 B12 4 Sumário Capítulo 1 - A revolução dos dados, da informação e do conhecimento 1 B12 4 Capítulo 2 - Reputação corporativa e uma nova ordem empresarial 7 Inovação e virtualidade 9 Coopetição 10 Modelos plurais

Leia mais

Complemento II Noções Introdutória em Redes Neurais

Complemento II Noções Introdutória em Redes Neurais Complemento II Noções Introdutória em Redes Neurais Esse documento é parte integrante do material fornecido pela WEB para a 2ª edição do livro Data Mining: Conceitos, técnicas, algoritmos, orientações

Leia mais

Cenário Atual. ... No coração deste ambiente está a idéia do

Cenário Atual. ... No coração deste ambiente está a idéia do Fundamentos DW Cenário Atual Grande e desordenada coleção de aplicações operacionais, frágeis e muitas vezes não integradas... Dificultando a disponibilização de informações estratégicas para tomada de

Leia mais

DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS

DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS Tácio Dias Palhão Mendes Bacharelando em Sistemas de Informação Bolsista de Iniciação Científica da FAPEMIG taciomendes@yahoo.com.br Prof.

Leia mais

BANCO DE DADOS DISTRIBUÍDOS e DATAWAREHOUSING

BANCO DE DADOS DISTRIBUÍDOS e DATAWAREHOUSING BANCO DE DADOS DISTRIBUÍDOS e DATAWAREHOUSING http://www.uniriotec.br/~tanaka/tin0036 tanaka@uniriotec.br Bancos de Dados Distribuídos Conceitos e Arquitetura Vantagens das Arquiteturas C/S (em relação

Leia mais

Data Warehouse: uma classificação de seus Custos e Benefícios

Data Warehouse: uma classificação de seus Custos e Benefícios Data Warehouse: uma classificação de seus Custos e Benefícios Marcos Paulo Kohler Caldas (CEFET-ES/CEFET-PR) marcospaulo@cefetes.br Prof. Dr. Luciano Scandelari (CEFET-PR) luciano@cefetpr.br Prof. Dr.

Leia mais

Aula 02: Conceitos Fundamentais

Aula 02: Conceitos Fundamentais Aula 02: Conceitos Fundamentais Profa. Ms. Rosângela da Silva Nunes 1 de 26 Roteiro 1. Por que mineração de dados 2. O que é Mineração de dados 3. Processo 4. Que tipo de dados podem ser minerados 5. Que

Leia mais

- A crescente necessidade de sistemas inteligentes e de aquisição de conhecimento levaram à necessidade de implementação de Data Warehouses.

- A crescente necessidade de sistemas inteligentes e de aquisição de conhecimento levaram à necessidade de implementação de Data Warehouses. - A crescente necessidade de sistemas inteligentes e de aquisição de conhecimento levaram à necessidade de implementação de. - O que é uma Data Warehouse? - Colecção de bases de dados orientadas por assunto

Leia mais

Data Warehouse. Diogo Matos da Silva 1. Universidade Federal de Ouro Preto, Ouro Preto, MG, Brasil. Banco de Dados II

Data Warehouse. Diogo Matos da Silva 1. Universidade Federal de Ouro Preto, Ouro Preto, MG, Brasil. Banco de Dados II Data Warehouse Diogo Matos da Silva 1 1 Departamento de Computação Universidade Federal de Ouro Preto, Ouro Preto, MG, Brasil Banco de Dados II Diogo Matos (DECOM - UFOP) Banco de Dados II Jun 2013 1 /

Leia mais

Estudar os Sistemas de Processamento de Transação (SPT)

Estudar os Sistemas de Processamento de Transação (SPT) Estudar a Colaboração Empresarial. Objetivos do Capítulo Estudar os Sistemas de Processamento de Transação (SPT) Identificar o papel e alternativas de relatórios dos sistemas de informação gerencial. Estudar

Leia mais

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados Universidade Federal de Pernambuco Graduação em Ciência da Computação Centro de Informática 2006.2 Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento

Leia mais

Dado: Fatos conhecidos que podem ser registrados e têm um significado implícito. Banco de Dados:

Dado: Fatos conhecidos que podem ser registrados e têm um significado implícito. Banco de Dados: MC536 Introdução Sumário Conceitos preliminares Funcionalidades Características principais Usuários Vantagens do uso de BDs Tendências mais recentes em SGBDs Algumas desvantagens Modelos de dados Classificação

Leia mais

ADMINISTRAÇÃO DOS RECURSOS DE DADOS

ADMINISTRAÇÃO DOS RECURSOS DE DADOS 7 ADMINISTRAÇÃO DOS RECURSOS DE DADOS OBJETIVOS Por que as empresas sentem dificuldades para descobrir que tipo de informação precisam ter em seus sistemas de informação ão? Como um sistema de gerenciamento

Leia mais

ADMINISTRAÇÃO DOS RECURSOS DE DADOS

ADMINISTRAÇÃO DOS RECURSOS DE DADOS Capítulo 7 ADMINISTRAÇÃO DOS RECURSOS DE DADOS 7.1 2003 by Prentice Hall OBJETIVOS Por que as empresas sentem dificuldades para descobrir que tipo de informação precisam ter em seus sistemas de informação?

Leia mais

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI Fernando Luiz de Oliveira 1 Thereza Patrícia. P. Padilha 1 Conceição A. Previero 2 Leandro Maciel Almeida 1 RESUMO O processo

Leia mais

TÉCNICAS DE INFORMÁTICA WILLIAN FERREIRA DOS SANTOS

TÉCNICAS DE INFORMÁTICA WILLIAN FERREIRA DOS SANTOS TÉCNICAS DE INFORMÁTICA WILLIAN FERREIRA DOS SANTOS Vimos em nossas aulas anteriores: COMPUTADOR Tipos de computadores Hardware Hardware Processadores (CPU) Memória e armazenamento Dispositivos de E/S

Leia mais

Engenharia de Software

Engenharia de Software CENTRO UNIVERSITÁRIO NOVE DE JULHO Profº. Edson T. França edson.franca@uninove.br Software Sistemas Conjunto de elementos, entre os quais haja alguma relação Disposição das partes ou dos elementos de um

Leia mais

DESENVOLVIMENTO DE PLUG-INS KETTLE PARA GERAÇÃO DE MONDRIAN SCHEMA A PARTIR DE BASES RELACIONAIS, UTILIZANDO A METODOLOGIA AGILE ROLAP.

DESENVOLVIMENTO DE PLUG-INS KETTLE PARA GERAÇÃO DE MONDRIAN SCHEMA A PARTIR DE BASES RELACIONAIS, UTILIZANDO A METODOLOGIA AGILE ROLAP. DESENVOLVIMENTO DE PLUG-INS KETTLE PARA GERAÇÃO DE MONDRIAN SCHEMA A PARTIR DE BASES RELACIONAIS, UTILIZANDO A METODOLOGIA AGILE ROLAP. Eduardo Cristovo de Freitas Aguiar (PIBIC/CNPq), André Luís Andrade

Leia mais

BUSINESS INTELLIGENCE -Inteligência nos Negócios-

BUSINESS INTELLIGENCE -Inteligência nos Negócios- UNIVERSIDADE SÃO FRANCISCO CENTRO DE CIÊNCIAS JURÍDICAS, HUMANAS E SOCIAIS BUSINESS INTELLIGENCE -Inteligência nos Negócios- Curso: Administração Hab. Sistemas de Informações Disciplina: Gestão de Tecnologia

Leia mais

DESMISTIFICANDO O CONCEITO DE ETL

DESMISTIFICANDO O CONCEITO DE ETL DESMISTIFICANDO O CONCEITO DE ETL Fábio Silva Gomes da Gama e Abreu- FSMA Resumo Este artigo aborda os conceitos de ETL (Extract, Transform and Load ou Extração, Transformação e Carga) com o objetivo de

Leia mais