O Processo ETL em Sistemas Data Warehouse
|
|
|
- Sônia Azevedo Maranhão
- 10 Há anos
- Visualizações:
Transcrição
1 O Processo ETL em Sistemas Data Warehouse João Ferreira, Miguel Miranda, António Abelha e José Machado Universidade do Minho, Departamento de Informática, Braga, Portugal [email protected] {miranda,abelha,jmac}@di.uminho.pt Resumo. Extração, Transformação e Carga (Extract Transform Load - ETL) são procedimentos de uma técnica de Data Warehouse (DW), que é responsável pela extracção de dados de várias fontes, a sua limpeza, optimização e inserção desses dados num DW. Este artigo tem como objectivo demonstrar o funcionamento genérico do processo ETL em sistemas DW. O processo ETL é uma das fases mais críticas na construção de um sistema DW, pois é nesta fase que grandes volumes de dados são processados. Será abordado de forma sucinta, o modo como este processamento ocorre, e ainda, as ferramentas de ETL disponíveis no mercado. Por fim, serão abordados quais os critérios a ter em consideração na escolha de uma destas ferramentas. Palavras-chave: Extract Transform Load (ETL), Data Warehouse (DW), Ferramentas ETL. 1 Introdução A ideia principal de um sistema de Data Warehouse (DW) (ilustrado na figura 1), consiste em agregar informação proveniente de uma ou mais Bases de Dados (BD), ou de outras fontes, para posteriormente a tratar, formatar e consolidar numa única estrutura de dados. Um sistema DW está associado a BD com um grande volume de dados devido quer ao volume proveniente das fontes heterogéneas quer da baixa normalização habitualmente utilizada. A estrutura de dados do DW é desenvolvida de forma a facilitar a análise desses dados. Após ser armazenada, estas informação, fica disponivel no DW ou em DataMarts (DM) para consultas que visam ajudar na tomada de decisão. Devido ao custo elevado, o DW muitas vezes é dividido em partes menores, nomeadamente os DM. Um DM consolida apenas as informações de uma determinada área e após a sua criação podem se unir vários DM para formarem um único DW [1]. INForum II Simpósio de Informática, Luís S. Barbosa, Miguel P. Correia (eds), 9-10 Setembro, 2010, pp
2 Figura 1. Esquema da Infra-estrutura de um sistema DW [1] Para a construção de um DW são necessários diferentes passos principalmente ao nível da extracção e processamento de dados. O processo ETL destina-se à extracção e transformação dos dados e termina com a inclusão destes no DW. Esta fase caracteriza-se por englobar procedimentos de limpeza, integração e transformação de dados. Segundo a literatura este é o processo mais crítico e demorado na construção de um DW [1]. Quando o DW se encontra construído, uma das ferramentas mais utilizadas para o acesso e a análise dos dados é o Online Analytical Processing (OLAP). Através desta ferramenta é possível realizar o tratamento dos dados proveniente de diferentes fontes em tempo real, utilizando métodos mais rápidos e eficazes. Permite também usar uma grande variedade de ferramentas de visualizações dos dados e organizá-los através dos critérios de selecção pretendidos. A maior vantagem do OLAP é, no entanto, a capacidade de realizar análises multidimensionais dos dados, associadas a cálculos complexos, análises de tendências e modelação [3,2]. 2 O Processo ETL O ETL é um processo para extrair dados de um sistema de Bases de Dados (BD), sendo esses dados processados, modificados, e posteriormente inseridos numa outra BD. Estudos relatam que o ETL e as ferramentas de limpeza de dados consomem um terço do orçamento num projecto de DW, podendo, no que respeita ao tempo de desenvolvimento de um projecto de DW, chegar a consumir 80% desse valor. Outros estudos mencionam, ainda, que o processo de ETL tem custos na ordem dos 55% do tempo total de execução do projecto de DW [4,5,6]. 758 INForum 2010João Ferreira, Miguel Miranda, António Abelha, José Machado
3 A figura 2 descreve de forma geral o processo de ETL. A camada inferior representa o armazenamento dos dados que são utilizados em todo o processo. No lado esquerdo pode-se observar os dados originais provenientes, na maioria dos casos, de BD ou, então, de ficheiros com formatos heterogéneos, por exemplo de texto. Os dados provenientes destas fontes são obtidos (como é ilustrado na área superior esquerda da figura 2), por rotinas de extracção que fornecem informação igual ou modificada, relativamente à fonte de dados original. Posteriormente, esses dados são propagados para a Data Staging Area (DSA) onde são transformados e limpos antes de serem carregados para o DW. O DW é representado na parte direita da figura e tem como objectivo o armazenamento dos dados. O carregamento dos dados no DW, é realizado através das actividades de carga representadas na parte superior direita da figura. Figura 2. Ilustração do processo de ETL [13]. O ETL é um processo que se divide em três fases fulcrais: 1. Extração; 2. Transformação; 3. Carga. Segundo alguns autores a concepção de um processo ETL incide sobre o mapeamento dos atributos dos dados de uma ou várias fontes para os atributos das tabelas do DW [7,8]. 2.1 Utilização do processo ETL em BD e Ferramentas disponíveis No DW, os dados normalmente utilizados estão localizados em BD multidimensionais. É importante que se tenha consciência que as alterações nos dados O Processo ETL em Sistemas Data Warehouse INForum
4 não afectam as fontes originais, mas sim, os dados no momento de extracção para o repositório da DW. Mais ainda, que os ajustes são modelados de acordo com as necessidades do modelo de DW, atendendo assim às restrições que são necessárias para esse modelo [12]. Depois do processo de transformação ocorre o processo de carga. Neste processam-se os mapeamentos sintácticos e semânticos entre os esquemas, respeitando as restrições de integridade e criando assim uma visão concretizada e unificada das fontes. Este processo é dos mais árduos e complexos de obter devido a sua complexidade que dependerá da heterogeneidade das BD [10] [11]. No mercado existem muitas ferramentas capazes de executar processos de ETL, a tabela 1 apresenta uma visão geral da evolução destas ferramentas [3]. Tabela 1. As várias gerações de ETL ao longo dos anos Ano Título Significado Início de 1990 Codificação manual de ETL Códigos personalizados escitos à mão A primeira geração de Código baseado em ferramentas de ferramentas de ETL ETL Segunda geração de Código baseado em ferramentas de ferramentas de ETL ETL Ferramentas de ETL A maioria das ferramentas eficientes actualmente As ferramentas de ETL disponíveis actualmente encontram-se bem preparadas para o processo de extracção, transformação e carga. Tem-se assistido a inúmeros avanços nestas ferramentas desde 1990, estando actualmente mais direccionadas para o utilizador [3]. Uma boa ferramenta de ETL deve ser capaz de comunicar com as diversas BD e ler diferentes formatos. Actualmente a oferta é elevada, como registado na tabela INForum 2010João Ferreira, Miguel Miranda, António Abelha, José Machado
5 Tabela 2. Diferentes ferramentas de ETL Lista de ferramentas ETL Versão ETL vendedores Oracle Warehouse Builder (OWB) 11gR1 Oracle Data Integrator & Data Services XI 3.0 SAP Business Objects IBM Information Server (Datastage) 8.1 IBM PowerCenter 9.0 Informatica Elixir Repertoire Elixir Data Migrator 7.6 Information Builders SQL Server Integration Services 10 Microsoft Talend Open Studio & Integration Suite 4.0 Talend DataFlow Manager 6.5 Pitney Bowes Business Insight Data Integrator 9.2 Pervasive Open Text Integration Center 7.1 Open Text Transformation Manager ETL Solutions Ltd. Data Manager/Decision Stream 8.2 IBM (Cognos) Clover ETL Javlin ETL4ALL 4.2 IKAN DB2 Warehouse 9.1 IBM Pentaho Data Integration 3.0 Pentaho Adeptia Integration Server 4.9 Adeptia A selecção de uma ferramenta de ETL adequada é uma decisão muito importante a ser tomada. A ferramenta de ETL opera no núcleo do DW, com a extracção de dados de múltiplas fontes e a sua transformação. Estas características tornam-na numa ferramenta acessível para os analistas de sistemas de informação. Ao contrário de outros componentes de uma arquitectura de Data Warehousing, é muito difícil mudar de uma ferramenta ETL para outra, devido à falta de normas, definições de dados e regras de transformação. Ao seleccionar uma ferramenta de ETL devem ser tomados em consideração os seguintes pontos [9]: Suporte à plataforma: Deve ser independente de plataforma, podendo assim correr em qualquer uma. Tipo de fonte independente: Deve ser capaz de ler directamente da fonte de dados, independentemente do seu tipo, saber se é uma fonte de RDBMS (Relational Database Management System), ficheiro simples ou um ficheiro XML. Apoio funcional: Deve apoiar na extracção de dados de múltiplas fontes, na limpeza de dados, e na transformação, agregação, reorganização e operações de carga. Facilidade de uso: Deve ser facilmente usada pelo utilizador. Paralelismo: Deve apoiar as operações de vários segmentos e execução de código paralelo, internamente, de modo que um determinado processo pode tirar proveito do paralelismo inerente da plataforma que está sendo executada. Também deve suportar a carga e equilíbrio entre os servidores e capacidade de lidar com grandes volumes de dados. Quando confrontados com cargas muito O Processo ETL em Sistemas Data Warehouse INForum
6 elevadas de trabalho, a ferramenta deve ser capaz de distribuir tarefas entre múltiplos servidores. Apoio ao nível do debugging: Deve apoiar o tempo de execução e a limpeza da lógica de transformação. O utilizador deve ser capaz de ver os dados antes e depois da transformação. Programação: Deve apoiar o agendamento de tarefas ETL aproveitando, assim, melhor o tempo não necessitando de intervenção humana para completar uma tarefa particular. Deve também ter suporte para programação em linha de comandos usando programação externa. Implementação: Deve suportar a capacidade de agrupar os objectos ETL e implementa-los em ambiente de teste ou de produção, sem a intervenção de um administrador de ETL. Reutilização: Deve apoiar a reutilização da lógica de transformação para que o utilizador não precise reescrever, várias vezes, a mesma lógica de transformação outra vez. 3 Caso de estudo Na sequência da necessidade de validar os dados dos recursos humanos de um centro hospitalar português foi extraída a informação dos seus repositórios para um ambiente de data warehouse. A ferramenta escolhida para o tratamento de dados e construção do repositório foi a release 2 da Oracle Database 11g, que possui embebida em si a plataforma de desenvolvimento de data warehouse denominada Oracle Warehouse Builder. A fonte principal era uma instância Oracle 8i, na qual estavam integrados em diferentes perfis dados de recursos humanos e outros sistemas como o de controlo de ponto. A informação encontrava-se dispersa em mais de uma centena de tabelas com registos processados e a processar. A dispersão de informação obrigou a alterar a fundo o esquema normal de destino procurando uma normalização de nível mais baixo para a construção dos diferentes data marts. Desta forma foram necessários desenvolver métodos para o ETL do repositório dos recursos humanos que garantissem a qualidade da informação e permitissem a construção de um novo repositório que fosse mais adequado para alimentar a DW. Nesta fase tentou-se garantir que toda a informação estava correcta e consistente, teve-se algum receio que dados incorrectos pudessem conduzir a erros críticos de tomada de decisão. Dada esta importância de detecção de erros serão de seguida explicitados alguns objectivos de teste que se estabelecem para o sistema ETL: 3.1 Preenchimento de dados Neste teste procura-se assegurar que todos os dados esperados eram carregados. Comparam-se o número de registos entre os dados das fontes e o número de registos carregados para o DW. 762 INForum 2010João Ferreira, Miguel Miranda, António Abelha, José Machado
7 Comparam-se valores únicos de determinados atributos entre as fontes e os dados carregados para o DW. Procura-se fazer um bom esquema de dados para perceber as limitações dos valores atribuídos. Procura-se validar os conteúdos de cada atributo, ou seja, não permitir que por razões de codificação o limite de caracteres entre cada esquema relacional (fonte e destino) não resulta na falha do fluxo de dados. Transformação de Dados - Neste teste tenta-se assegurar que os dados são transformados correctamente de acordo com as regras de negócio especificadas. Procuram-se criar testes, os mais diversos possíveis para antever algumas situações consequentes. Tenta-se validar o processamento correcto de campos no ETL tais como chaves estrangeiras. Procura-se verificar sempre se os tipos de dados presentes no DW são os que se tinham planeado. E ainda procura-se testar a integridade referencial entre as tabelas. 3.2 Qualidade de dados Neste teste procura-se assegurar que o sistema ETL rejeita ou substituí valores por defeito, corrige ou ignora dados e reporta dados inválidos. Procura-se realizar as conversões dos dados sempre correctamente. Nos casos de atributos NULL procura-se sempre inserir valores equivalentes a "desconhecido". Sempre que algum atributo não está correcto procura-se validar e corrigir o problema. Sempre que aparecem valores duplicados analisam-se os códigos e corrige-se o problema 3.3 Performance e Escalabilidade Nesta fase procura-se, assegurar que o carregamento dos dados e a performance das interrogações são eficientes e que a arquitectura é escalonável. Os carregamentos de teste são efectuados com volumes de dados pequenos para garantir o bom funcionamento. Comparam-se estes valores de performance de carregamento do ETL para antecipar questões de escalabilidade. Assim pontos de fraqueza que sejam detectados podem ser melhorados. Efectuam-se operações simples com junções para validar a performance das interrogações em volumes de dados muito grandes. 3.4 Integridade de dados O Processo ETL em Sistemas Data Warehouse INForum
8 Neste teste procura-se verificar que o processo de ETL funciona correctamente em relação a outros processos de upstream e downstream. 3 Conclusão O processo ETL é o mais complexo e moroso na construção de um sistema DW, devido a aspectos já anteriormente vistos neste artigo. Nos dias de hoje são disponibilizadas diversas ferramentas de ETL no mercado, cada uma com as suas particularidades. Entre estas ferramentas destacam-se a Oracle Warehouse Builder (OWB), SQL Server Integration Services, entre outras referidas no presente artigo. As suas capacidades de tratamento e manipulação de informação, aliadas a facilidade e simplicidade de utilização, tornam-nas uma referência entre as ferramentas ETL abordadas. Na aquisição de uma ferramenta deste tipo é muito importante saber adequar essa escolha ao problema em questão, sendo que a produtividade na obtenção das informações geradas pelo DW irá reflectir o grau de acerto dessa escolha. Referências 1. acedido em 8 Junho Rudman, W.; Brown, C.; Hewitt, C. The use of data mining tools in identifying medication error near misses and adverse drug events. Top Health Information Management; 23(2). p ; Evaluating ETL and Data Integration Platforms acedido 8 Junho Cza. Shilakes, J. Tylman. Enterprise Information Portals. Enterprise Software Team, em acedido em 8 Junho M. Demarest, The politics of data warehousing. acedido em 8 Junho B. Inmon. The Data Warehouse Budget. DM Review Magazine, January 1997, em 7. R. Kimbal, L. Reeves, M. Ross, W. Thornthwaite. The Data Warehouse Lifecycle Toolkit: Expert Methods for Designing, Developing, and Deploying DataWarehouses. John Wiley & Sons, February P. Vassiliadis. Gulliver in the land of data warehousing: practical experiences and observations of a researcher. In Proc. DMDW (Stockholm, Sweden, 2000), pp Rob Karel and Michael Goulde Market Overview: Open Source ETL Tools acedido em 8 Junho Jorg, T., Dessloch, S.: Towards generating ETL processes for incremental loading. IDEAS, , Jorg, T., Dessloch, S.: Formalizing ETL Jobs for Incremental Loading of DataWare-houses. BTW, , Kimball, R., Caserta, J.: The Data Warehouse ETL Toolkit: Practical Techniques for Extracting, Cleaning, Conforming, and Delivering Data. John Wiley & Sons, INForum 2010João Ferreira, Miguel Miranda, António Abelha, José Machado
9 13. Panos Vassiliadis, P., Simitsis, A., Georgantas, P., Terrovitis, M., Skiadopoulos, S.: A generic and customizable frameworkfor the design of ETL scenarios. Information Systens 30, , 2005 O Processo ETL em Sistemas Data Warehouse INForum
DATA WAREHOUSE. Introdução
DATA WAREHOUSE Introdução O grande crescimento do ambiente de negócios, médias e grandes empresas armazenam também um alto volume de informações, onde que juntamente com a tecnologia da informação, a correta
TECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO. SISTEMAS DE GESTÃO DE BASE DE DADOS Microsoft Access TECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO
TECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO Microsoft Access TECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO CONCEITOS BÁSICOS 1 Necessidade das base de dados Permite guardar dados dos mais variados tipos; Permite
Modelo Cascata ou Clássico
Modelo Cascata ou Clássico INTRODUÇÃO O modelo clássico ou cascata, que também é conhecido por abordagem top-down, foi proposto por Royce em 1970. Até meados da década de 1980 foi o único modelo com aceitação
Complemento I - Noções Introdutórias em Data Warehouses
Complemento I - Noções Introdutórias em Data Warehouses Esse documento é parte integrante do material fornecido pela WEB para a 2ª edição do livro Data Mining: Conceitos, técnicas, algoritmos, orientações
Ministério das Finanças Instituto de Informática. Departamento de Sistemas de Informação
Ministério das Finanças Instituto de Informática Departamento de Sistemas de Informação Assiduidade para Calendários Específicos Junho 2010 Versão 6.0-2010 SUMÁRIO 1 OBJECTIVO 4 2 ECRÃ ELIMINADO 4 3 NOVOS
MANUAL DO UTILIZADOR
MANUAL DO UTILIZADOR Versão 1.6 PÁGINA DE PESQUISA A página principal do PacWeb permite a realização de um número muito variado de pesquisas, simples, ou pelo contrário extremamente complexas, dependendo
GereComSaber. Desenvolvimento de Sistemas de Software. Universidade do Minho Conselho de Cursos de Engenharia Licenciatura em Engenharia Informática
Universidade do Minho Conselho de Cursos de Engenharia Licenciatura em Engenharia Informática Desenvolvimento de Sistemas de Software Ano Lectivo de 2009/10 GereComSaber Ana Duarte, André Guedes, Eduardo
Prof. Marcelo Machado Cunha www.marcelomachado.com [email protected]
Prof. Marcelo Machado Cunha www.marcelomachado.com [email protected] Ementa Introdução a Banco de Dados (Conceito, propriedades), Arquivos de dados x Bancos de dados, Profissionais de Banco de dados,
Uma análise de ferramentas de modelagem e gerência de metadados aplicadas ao projeto de BI/DW-UFBA
Universidade Federal da Bahia Instituto de Matemática Departamento de Ciência da Computação MATA67 Projeto Final II Uma análise de ferramentas de modelagem e gerência de metadados aplicadas ao projeto
Adriano Maranhão BUSINESS INTELLIGENCE (BI),
Adriano Maranhão BUSINESS INTELLIGENCE (BI), BUSINESS INTELLIGENCE (BI) O termo Business Intelligence (BI), popularizado por Howard Dresner do Gartner Group, é utilizado para definir sistemas orientados
Interatividade aliada a Análise de Negócios
Interatividade aliada a Análise de Negócios Na era digital, a quase totalidade das organizações necessita da análise de seus negócios de forma ágil e segura - relatórios interativos, análise de gráficos,
Noções de. Microsoft SQL Server. Microsoft SQL Server
Noções de 1 Considerações Iniciais Basicamente existem dois tipos de usuários do SQL Server: Implementadores Administradores 2 1 Implementadores Utilizam o SQL Server para criar e alterar base de dados
GereComSaber. Disciplina de Desenvolvimento de Sistemas de Software. Sistema de Gestão de Serviços em Condomínios
Universidade do Minho Conselho de Cursos de Engenharia Licenciatura em Engenharia Informática 3ºAno Disciplina de Desenvolvimento de Sistemas de Software Ano Lectivo de 2009/2010 GereComSaber Sistema de
GUIA DE FUNCIONAMENTO DA UNIDADE CURRICULAR
Curso Engenharia Informática Ano letivo 2012/13 Unidade Curricular Bases de Dados II ECTS 6 Regime Obrigatório Ano 2º Semestre 1º sem Horas de trabalho globais Docente (s) José Carlos Fonseca Total 168
Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence
Juntamente com o desenvolvimento desses aplicativos surgiram os problemas: & Data Warehouse July Any Rizzo Oswaldo Filho Década de 70: alguns produtos de BI Intensa e exaustiva programação Informação em
GUIA PARA O PREENCHIMENTO DOS FORMULÁRIOS ENTIDADE GESTORA ERP PORTUGAL
GUIA PARA O PREENCHIMENTO DOS FORMULÁRIOS ENTIDADE GESTORA ERP PORTUGAL Versão: 1.0 Data: 05-06-2009 Índice Acesso e estados dos Formulários... 3 Escolha do Formulário e submissão... 4 Bases para a navegação
Base de Dados para Administrações de Condomínios
Base de Dados para Administrações de Condomínios José Pedro Gaiolas de Sousa Pinto: [email protected] Marco António Sousa Nunes Fernandes Silva: [email protected] Pedro Miguel Rosário Alves: [email protected]
Manual do GesFiliais
Manual do GesFiliais Introdução... 3 Arquitectura e Interligação dos elementos do sistema... 4 Configuração do GesPOS Back-Office... 7 Utilização do GesFiliais... 12 Outros modos de utilização do GesFiliais...
Uma peça estratégica para o seu negócio
Uma peça estratégica para o seu negócio INFORMAÇÃO GERAL DA EMPRESA CASO DE SUCESSO EM IMPLEMENTAÇÃO BI PERGUNTAS E RESPOSTAS Fundada em 1997, Habber Tec é uma empresa especializada na oferta de soluções
Tarefa Orientada 18 Tabelas dinâmicas
Tarefa Orientada 18 Tabelas dinâmicas Análise de dados através de tabelas dinâmicas. Conceitos teóricos As Tabelas Dinâmicas são tabelas interactivas que resumem elevadas quantidades de dados, usando estrutura
Manual de Utilizador. Disciplina de Projecto de Sistemas Industriais. Escola Superior de Tecnologia. Instituto Politécnico de Castelo Branco
Escola Superior de Tecnologia Instituto Politécnico de Castelo Branco Departamento de Informática Curso de Engenharia Informática Disciplina de Projecto de Sistemas Industriais Ano Lectivo de 2005/2006
5. Métodos ágeis de desenvolvimento de software
Engenharia de Software 5. Métodos ágeis de desenvolvimento de software Nuno Miguel Gil Fonseca [email protected] Desenvolver e entregar software o mais rapidamente possível é hoje em dia um dos
TECNOLOGIAS DE INFORMAÇÃO E COMUNICAÇÃO
TECNOLOGIAS DE INFORMAÇÃO E COMUNICAÇÃO ACCESS 2010 Conceitos Básicos Ficha Informativa Professor : Vanda Pereira módulo didáctico Conceitos Básicos Necessidade das base de dados Permite guardar dados
Tarefa Orientada 16 Vistas
Tarefa Orientada 16 Vistas Objectivos: Vistas só de leitura Vistas de manipulação de dados Uma vista consiste numa instrução de SELECT que é armazenada como um objecto na base de dados. Deste modo, um
Solutions for Information Technologies. BIS-Navegador. IBM DB2 UDB v8.x
Solutions for Information Technologies BIS-Navegador Manual de Instalação em IBM DB2 UDB v8.x Supporte A suite BIS foi testada e é suportada nos seguintes ambientes e produtos: BIS Client Components: Operating
A VISTA BACKSTAGE PRINCIPAIS OPÇÕES NO ECRÃ DE ACESSO
DOMINE A 110% ACCESS 2010 A VISTA BACKSTAGE Assim que é activado o Access, é visualizado o ecrã principal de acesso na nova vista Backstage. Após aceder ao Access 2010, no canto superior esquerdo do Friso,
Arquitecturas de Software Licenciatura em Engenharia Informática e de Computadores
UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR TÉCNICO Arquitecturas de Software Licenciatura em Engenharia Informática e de Computadores Primeiro Teste 21 de Outubro de 2006, 9:00H 10:30H Nome: Número:
SAD. Paulo Silva, Rodolfo Ribeiro, Vinicius Tavares
SAD Paulo Silva, Rodolfo Ribeiro, Vinicius Tavares DataWarehouse Armazena informações relativas a uma organização em BD Facilita tomada de decisões Dados são coletados de OLTP(séries históricas) Dados
Transição de POC para SNC
Transição de POC para SNC A Grelha de Transição surge no âmbito da entrada em vigor, no ano de 2010, do Sistema de Normalização Contabilística (SNC). O SNC vem promover a melhoria na contabilidade nacional,
DATA WAREHOUSE. Rafael Ervin Hass Raphael Laércio Zago
DATA WAREHOUSE Rafael Ervin Hass Raphael Laércio Zago Roteiro Introdução Aplicações Arquitetura Características Desenvolvimento Estudo de Caso Conclusão Introdução O conceito de "data warehousing" data
Gescom isales. Aplicação Mobile Profissional para Vendedores
Aplicação Mobile Profissional para Vendedores Indíce Introdução... 3 Aplicação... 4 Produtos... 4 Categorias... 4 Produtos... 5 Carrinho de Vendas... 6 Encomendas... 7 Clientes... 10 Sincronização... 11
Prevayler. Perola. André Luís Sales de Moraes Juliana Keiko Yamaguchi Tatiana Yuka Takaki
Prevayler Perola André Luís Sales de Moraes Juliana Keiko Yamaguchi Tatiana Yuka Takaki Prevayler Prevayler é a implementação em Java do conceito de Prevalência. É um framework que prega uma JVM invulnerável
Engenharia de Software Sistemas Distribuídos
Engenharia de Software Sistemas Distribuídos 2 o Semestre de 2009/2010 FEARSe Requisitos para a 1 a entrega 18 de Março de 2010 1 Introdução O projecto conjunto das disciplinas de Engenharia de Software
Conhecendo os usuários de um Sistema de Banco de Dados
Conhecendo os usuários de um Sistema de Banco de Dados Palestra Grupo PET/DSC 09 de Dezembro de 2009 Prof. Carlos Eduardo Pires [email protected] Agenda Conceitos Gerais Sistema de Banco de Dados Tipos
Programação 2ºSemestre MEEC - 2010/2011. Programação 2º Semestre 2010/2011 Enunciado do projecto
Mestrado Integrado em Engenharia Electrotécnica e de Computadores Programação 2º Semestre 2010/2011 Enunciado do projecto O projecto a desenvolver pelos alunos consistirá numa sistema de monitorização,
Curso de Engenharia de Sistemas e Informática - 5º Ano. Ficha T. Prática n.º 1
Análise Inteligente de Dados Objectivo: Curso de Engenharia de Sistemas e Informática - 5º Ano Ficha T. Prática n.º 1 Estudo do paradigma multidimensional com introdução de uma extensão ao diagrama E/R
Gestão dos Níveis de Serviço
A Gestão dos Níveis de Serviço (SLM) Os sistemas e tecnologias de informação e comunicação têm nas empresas um papel cada vez mais importante evoluindo, hoje em dia, para níveis mais elevados de funcionamento
PACWEB Módulo de Pesquisa MANUAL DO UTILIZADOR
MANUAL DO UTILIZADOR Versão 1.3 ÍNDICE 1. INTRODUÇÃO 2 2. INSTALAÇÃO E CONFIGURAÇÃO 3 2.1 INSTALAÇÃO 3 Instalar o Pacweb 3 Alterar o Ficheiro Default.htm 3 Criar um Virtual Directory 3 2.2 CONFIGURAÇÃO
Índice. Como aceder ao serviço de Certificação PME? Como efectuar uma operação de renovação da certificação?
Índice Como aceder ao serviço de Certificação PME? Como efectuar uma operação de renovação da certificação? Como efectuar uma operação de confirmação de estimativas? Como aceder ao Serviço de Certificação
SUMÁRIO 1. INTRODUÇÃO... 2 2. O QUE É DATA WAREHOUSE?... 2 3. O QUE DATA WAREHOUSE NÃO É... 4 4. IMPORTANTE SABER SOBRE DATA WAREHOUSE... 5 4.
SUMÁRIO 1. INTRODUÇÃO... 2 2. O QUE É DATA WAREHOUSE?... 2 3. O QUE DATA WAREHOUSE NÃO É... 4 4. IMPORTANTE SABER SOBRE DATA WAREHOUSE... 5 4.1 Armazenamento... 5 4.2 Modelagem... 6 4.3 Metadado... 6 4.4
Palavras-chave: On-line Analytical Processing, Data Warehouse, Web mining.
BUSINESS INTELLIGENCE COM DADOS EXTRAÍDOS DO FACEBOOK UTILIZANDO A SUÍTE PENTAHO Francy H. Silva de Almeida 1 ; Maycon Henrique Trindade 2 ; Everton Castelão Tetila 3 UFGD/FACET Caixa Postal 364, 79.804-970
Desenvolvimento de uma Aplicação WEB para monitorização de BD Oracle
Desenvolvimento de uma Aplicação WEB para monitorização de BD Oracle Luís Filipe Borges Pinto Resumo: Este projecto consiste na implementação de uma aplicação WEB para monitorização
CONSIDERAÇÕES SOBRE ATIVIDADES DE IDENTIFICAÇÃO, LOCALIZAÇÃO E TRATAMENTO DE DADOS NA CONSTRUÇÃO DE UM DATA WAREHOUSE
CONSIDERAÇÕES SOBRE ATIVIDADES DE IDENTIFICAÇÃO, LOCALIZAÇÃO E TRATAMENTO DE DADOS NA CONSTRUÇÃO DE UM DATA WAREHOUSE Fabio Favaretto Professor adjunto - Programa de Pós Graduação em Engenharia de Produção
FERRAMENTAS E SOLUÇÕES DE APOIO À GESTÃO E MANUTENÇÃO DE ATIVOS
FERRAMENTAS E SOLUÇÕES DE APOIO À GESTÃO E MANUTENÇÃO DE ATIVOS Ivo BRAGA 1 RESUMO Os Serviços de manutenção exigem cada vez mais um elevado nível de complexidade. Mesmo a nível local onde o grau de especialização
A Grande Importância da Mineração de Dados nas Organizações
A Grande Importância da Mineração de Dados nas Organizações Amarildo Aparecido Ferreira Junior¹, Késsia Rita da Costa Marchi¹, Jaime Willian Dias¹ ¹Universidade Paranaense (Unipar) Paranavaí PR Brasil
Entrega de Folhas de Férias
Entrega de Folhas de Férias Questões mais frequentes FAQs Maio/2012 Versão 2.0 DDO É obrigatório adoptar o novo formato para envio da informação de Folhas de Férias estabelecido na legislação em vigor
PAINEL DE ADMINISTRADOR
PAINEL DE ADMINISTRADOR IMPORTANTE: O Painel de administrador APENAS deverá ser utilizado pelo responsável do sistema. são: Nesta aplicação, poderá configurar todo o sistema de facturação. As opções do
Certificação do software de facturação passa a ser obrigatória a partir de 1 de Janeiro de 2011.
NOTÍCIAS Certificação do software de facturação passa a ser obrigatória a partir de 1 de Janeiro de 2011. De acordo com a Portaria n.º 363/2010, de 23 de Junho, todas as empresas com um volume de negócios
COLIBRI Ambiente Colaborativo Multimédia MÓDULO MOODLE. Rui Ribeiro [email protected]. FCCN - Dezembro 2010
COLIBRI Ambiente Colaborativo Multimédia MÓDULO MOODLE FCCN - Dezembro 2010 Rui Ribeiro [email protected] Módulo COLIBRI Concebido por: José Coelho Universidade Aberta Apoiado por: Rui Ribeiro FCCN Vitor
PHC Serviços CS. A gestão de processos de prestação de serviços
PHC Serviços CS A gestão de processos de prestação de serviços A solução que permite controlar diferentes áreas de uma empresa: reclamações e respectivo tratamento; controlo de processos e respectivos
EXCEL TABELAS DINÂMICAS
Informática II Gestão Comercial e da Produção EXCEL TABELAS DINÂMICAS (TÓPICOS ABORDADOS NAS AULAS DE INFORMÁTICA II) Curso de Gestão Comercial e da Produção Ano Lectivo 2002/2003 Por: Cristina Wanzeller
Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence
É um conjunto de conceitos e metodologias que, fazem uso de acontecimentos e sistemas e apoiam a tomada de decisões. Utilização de várias fontes de informação para se definir estratégias de competividade
SISTEMA DE INFORMAÇÃO DAS PARTICIPAÇÕES DO ESTADO
SISTEMA DE INFORMAÇÃO DAS PARTICIPAÇÕES DO ESTADO SIPART (versão Setembro/2004) Manual de Utilização ÍNDICE 1. INTRODUÇÃO...3 2. ACEDER À APLICAÇÃO...4 3. CRIAR NOVO UTILIZADOR...5 4. CARACTERIZAÇÃO GERAL
Planejamento Estratégico de TI. Prof.: Fernando Ascani
Planejamento Estratégico de TI Prof.: Fernando Ascani BI Business Intelligence A inteligência Empresarial, ou Business Intelligence, é um termo do Gartner Group. O conceito surgiu na década de 80 e descreve
GereComSaber. Disciplina de Desenvolvimento de Sistemas de Software. Sistema de Gestão de Serviços em Condomínios
Universidade do Minho Conselho de Cursos de Engenharia Licenciatura em Engenharia Informática 3ºAno Disciplina de Desenvolvimento de Sistemas de Software Ano Lectivo de 2009/2010 GereComSaber Sistema de
Procedimento de Gestão PG 02 Controlo de Documentos e Registos
Índice 1.0. Objectivo. 2 2.0. Campo de aplicação 2 3.0. Referências e definições....... 2 4.0. Responsabilidades... 3 5.0. Procedimento... 3 5.1. Generalidades 3 5.2. Controlo de documentos... 4 5.3. Procedimentos
Soluções de Gestão de Clientes e Impressão Universal
Soluções de Gestão de Clientes e Impressão Universal Manual do utilizador Copyright 2007 Hewlett-Packard Development Company, L.P. Windows é uma marca registada da Microsoft Corporation nos E.U.A. As informações
COMO IMPLEMENTAR UM SISTEMA DE BI
Data Science FEUP 19 maio 2014 COMO IMPLEMENTAR UM SISTEMA DE BI Rui Afeiteira Gestor de projeto, BI4ALL Rui Afeiteira Gestor de projeto Business Intelligence Experiência Relevante Bacardi - Reengenharia
Bases de Dados. Lab 1: Introdução ao ambiente
Departamento de Engenharia Informática 2010/2011 Bases de Dados Lab 1: Introdução ao ambiente 1º semestre O ficheiro bank.sql contém um conjunto de instruções SQL para criar a base de dados de exemplo
Novo Formato de Logins Manual de Consulta
Gestão Integrada de Acessos Novo Formato de Logins Manual de Consulta Gestão Integrada de Acessos Histórico de Alterações Versão Descrição Autor Data 1.0 Versão inicial DSI/PPQ 2014-07-11 Controlo do documento
OLAP em âmbito hospitalar: Transformação de dados de enfermagem para análise multidimensional
OLAP em âmbito hospitalar: Transformação de dados de enfermagem para análise multidimensional João Silva and José Saias [email protected], [email protected] Mestrado em Engenharia Informática, Universidade
Solutions for Information Technologies. BIS-Navegador. Manual de Instalação para Microsoft SQL Server
Solutions for Information Technologies BIS-Navegador Manual de Instalação para Microsoft SQL Server Supporte A suite BIS foi testada e é suportada nos seguintes ambientes e produtos: BIS Client Components:
DEPARTAMENTO DE MATEMÁTICA E CIÊNCIAS EXPERIMENTAIS
DEPARTAMENTO DE MATEMÁTICA E CIÊNCIAS EXPERIMENTAIS Planificação Anual da Disciplina de TIC Módulos 1,2,3-10.ºD CURSO PROFISSIONAL DE TÉCNICO DE APOIO À GESTÃO DESPORTIVA Ano Letivo 2015-2016 Manual adotado:
Um sistema SMS 1 simplificado
1 Introdução Um sistema SMS 1 simplificado Projecto de Redes de Computadores I - 2007/2008 LEIC IST, Tagus Park 10 de Setembro de 2007 Pretende-se com este projecto que os alunos implementem um sistema
bit Tecnologia ao Serviço do Mundo Rural www.ruralbit.pt
bit Tecnologia ao Serviço do Mundo Rural www.ruralbit.pt :: Ruralbit :: http://www.ruralbit.pt :: Índice :: Ruralbit :: http://www.ruralbit.pt :: Pág. 1 Introdução O Pocket Genbeef Base é uma aplicação
Planejamento e Orçamento
Planejamento e Orçamento O SIPLAG Sistema Integrado de Planejamento, Orçamento e Gestão, é um sistema voltado à gestão governamental, permitindo a elaboração do Plano Plurianual, da Lei Orçamentária Anual,
RESUMO DA SOLUÇÃO CA ERwin Modeling. Como eu posso gerenciar a complexidade dos dados e aumentar a agilidade dos negócios?
RESUMO DA SOLUÇÃO CA ERwin Modeling Como eu posso gerenciar a complexidade dos dados e aumentar a agilidade dos negócios? O CA ERwin Modeling fornece uma visão centralizada das principais definições de
Universidade do Minho Licenciatura em Engenharia Informática
Universidade do Minho Licenciatura em Engenharia Informática Disciplina de Desenvolvimento de Sistemas de Software Trabalho Prático Fase 1 Ano Lectivo de 2009/10 GereComSaber Grupo 15 Cláudio Manuel Rigueiro
OFICIAL DA ORDEM MILITAR DE CRISTO MEDALHA DE EDUCAÇÃO FÍSICA E BONS SERVIÇOS. Circular n.º 023-A/2014 Portal F.P.T. - Inscrições (Aditamento)
Circular n.º 023-A/2014 Portal F.P.T. - Inscrições (Aditamento) Exmo. Sr. Presidente, A Direcção da F.P.T. tem emitido, ao longo dos últimos meses, diversas Circulares, com o objectivo de ir informando,
Começo por apresentar uma breve definição para projecto e para gestão de projectos respectivamente.
The role of Project management in achieving Project success Ao longo da desta reflexão vou abordar os seguintes tema: Definir projectos, gestão de projectos e distingui-los. Os objectivos da gestão de
Complemento ao Manual de Utilizador Plataforma de Estágios TIC
Complemento ao Manual de Utilizador Plataforma de Estágios TIC Direccionado para as escolas www.estagiostic.gov.pt Índice 1. Objectivo da Plataforma... 2 2. Acesso restrito... 2 3. Perfis... 2 3.1. O administrador...
Chapter 3. Análise de Negócios e Visualização de Dados
Chapter 3 Análise de Negócios e Visualização de Dados Objetivos de Aprendizado Descrever a análise de negócios (BA) e sua importância par as organizações Listar e descrever brevemente os principais métodos
MANUAL RÁPIDO DE UTILIZAÇÃO
Agrupamento de Escolas n.º 2 de Beja Mário Beirão PLATAFORMA GATO:\> GESTÃO DE EQUIPAMENTOS E EQUIPAMENTOS ON LINE MANUAL RÁPIDO DE UTILIZAÇÃO Novembro de 2009 1 O QUE É O GATO:\>? A aplicação das Tecnologias
PROCESSO DE DESENVOLVIMENTO DE SOFTWARE. Modelos de Processo de Desenvolvimento de Software
PROCESSO DE DESENVOLVIMENTO DE SOFTWARE Introdução Modelos de Processo de Desenvolvimento de Software Os modelos de processos de desenvolvimento de software surgiram pela necessidade de dar resposta às
DESENVOLVIMENTO DE PLUG-INS KETTLE PARA GERAÇÃO DE MONDRIAN SCHEMA A PARTIR DE BASES RELACIONAIS, UTILIZANDO A METODOLOGIA AGILE ROLAP.
DESENVOLVIMENTO DE PLUG-INS KETTLE PARA GERAÇÃO DE MONDRIAN SCHEMA A PARTIR DE BASES RELACIONAIS, UTILIZANDO A METODOLOGIA AGILE ROLAP. Eduardo Cristovo de Freitas Aguiar (PIBIC/CNPq), André Luís Andrade
Direcção Regional de Educação do Algarve
MÓDULO 1 Folha de Cálculo 1. Introdução à folha de cálculo 1.1. Personalização da folha de cálculo 1.2. Estrutura geral de uma folha de cálculo 1.3. O ambiente de da folha de cálculo 2. Criação de uma
WorkinProject 8 Manual de Referência Rápida
WorkinProject 8 Manual de Referência Rápida Flagsoft, Lda 2015 Índice 1. Introdução...3 2. Integrador - Interface com o utilizador...4 3. Registo de actividade - Folha de horas...5 4. Agenda e colaboração...7
Mestrado em Segurança da Informação e Direito no Ciberespaço. Segurança da informação nas organizações Gestão de Configuração
Escola Naval Mestrado em Segurança da Informação e Direito no Ciberespaço Segurança da informação nas organizações Gestão de Configuração Fernando Correia Capitão-de-fragata EN-AEL 14 de Dezembro de 2013
A SÈTIMA. O nosso principal objectivo
03 A SÈTIMA A SÉTIMA produz soluções de software maioritariamente com recurso à WEB, de modo a dar suporte ao crescimento tecnológico que é já a maior realidade do século XXI. Esta aposta deve-se ao facto
GereComSaber. Desenvolvimento de Sistemas de Software. Universidade do Minho Conselho de Cursos de Engenharia Licenciatura em Engenharia Informática
Universidade do Minho Conselho de Cursos de Engenharia Licenciatura em Engenharia Informática Desenvolvimento de Sistemas de Software Ano Lectivo de 2009/10 GereComSaber Ana Duarte, André Guedes, Eduardo
PHC dteamcontrol Interno
PHC dteamcontrol Interno A gestão remota de projetos em aberto A solução via Internet que permite acompanhar os projetos em aberto em que o utilizador se encontra envolvido, gerir eficazmente o seu tempo
Engenharia de Software Sistemas Distribuídos
Engenharia de Software Sistemas Distribuídos 2 o Semestre de 2007/2008 Requisitos para a 1 a entrega Loja Virtual 1 Introdução O enunciado base do projecto conjunto das disciplinas de Engenharia de Software
Modelos. Comunicação com clientes
Material baseado nas notas de aula: Maria Luiza M. Campos IME/2005 Carlos Heuser - livro Projeto de Banco de Dados CasaNova / PUC/RJ Prof. MSc. Edilberto Silva [email protected] Sistemas de Informação Brasília/DF
GIAE VERSÃO 2.1.1 28 JUNHO DE 2011 MUITO IMPORTANTE
GIAE VERSÃO 2.1.1 28 JUNHO DE 2011 MUITO IMPORTANTE Devido a um bug detectado no motor da base de dados, situação agora corrigida pelo fabricante, esta nova actualização do GIAE é disponibilizada numa
Conceitos de Banco de Dados
Conceitos de Banco de Dados Autor: Luiz Antonio Junior 1 INTRODUÇÃO Objetivos Introduzir conceitos básicos de Modelo de dados Introduzir conceitos básicos de Banco de dados Capacitar o aluno a construir
Acronis Servidor de Licença. Manual do Utilizador
Acronis Servidor de Licença Manual do Utilizador ÍNDICE 1. INTRODUÇÃO... 3 1.1 Descrição geral... 3 1.2 Política de licenças... 3 2. SISTEMAS OPERATIVOS SUPORTADOS... 4 3. INSTALAR O SERVIDOR DE LICENÇA
ISEP. Instituto Superior de Engenharia do Porto. Análise de Sistemas Informáticos
ISEP Instituto Superior de Engenharia do Porto Análise de Sistemas Informáticos Armazenamento de Dados em Rede A Revolução do Armazenamento Partilhado A crise económica e a crescente necessidade de armazenamento
Manual do Revisor Oficial de Contas. Projecto de Directriz de Revisão/Auditoria 860
Índice Projecto de Directriz de Revisão/Auditoria 860 PROJECTO DE DIRECTRIZ DE REVISÃO/AUDITORIA 860 Dezembro de 2008 Relatório Sobre o Sistema de Controlo Interno das Instituições de Crédito e Sociedades
P HC XL - Nem calcula o produto que temos para si...
P HC XL - Nem calcula o produto que temos para si... Documento FAQs Poderão ser contemplados campos de utilizadores da ML? Essa possibilidade não existe. Os campos disponíveis são os campos base da tabela
Nagios XI Soluções de Monitorização
Nagios XI Soluções de Monitorização O Nagios é uma solução líder de mercado na área da monitorização e alarmística, desenvolvido pela software house Norte Americana com o mesmo nome. O Nagios XI é uma
Pesquisa e organização de informação
Pesquisa e organização de informação Capítulo 3 A capacidade e a variedade de dispositivos de armazenamento que qualquer computador atual possui, tornam a pesquisa de informação um desafio cada vez maior
Tarefa Orientada 6 Edição de Dados
Tarefa Orientada 6 Edição de Dados Objectivos: Inserção de dados. Alteração de dados. Eliminação de dados. Definição de Listas de Pesquisa (Lookup Lists) O Sistema de Gestão de Bases de Dados MS Access
Plataforma Pentaho. Fagner Fernandes
Plataforma Pentaho Fagner Fernandes Sobre a Pentaho Fundada em 2004 por 5 fundadores Foco em Integração de Dados e Análise de Negócio Diferentes versões de sua Suite: Pentaho Enterprise Edition Pentaho
Diferenças da versão 6.3 para a 6.4
Release Notes Diferenças da versão 6.3 para a 6.4 Melhorias Comuns ao Sistema Help O Help Online foi remodelado e agora é possível acessar os manuais de cada módulo diretamente do sistema. Mapeamento de
Thalita Moraes PPGI Novembro 2007
Thalita Moraes PPGI Novembro 2007 A capacidade dos portais corporativos em capturar, organizar e compartilhar informação e conhecimento explícito é interessante especialmente para empresas intensivas
