FÁTIMA MARGARIDA MARQUES CARLOS DISSERTAÇÃO DE MESTRADO EM INFORMÁTICA 07 08



Documentos relacionados
Gestão da Informação

A Gestão, os Sistemas de Informação e a Informação nas Organizações

DATA WAREHOUSE. Introdução

Sistemas de Informação I

- A crescente necessidade de sistemas inteligentes e de aquisição de conhecimento levaram à necessidade de implementação de Data Warehouses.

Data Warehousing. Leonardo da Silva Leandro. CIn.ufpe.br

Planejamento Estratégico de TI. Prof.: Fernando Ascani

DATA WAREHOUSE NO APOIO À TOMADA DE DECISÕES

Banco de Dados - Senado

Gestão dos Níveis de Serviço

Modelo Cascata ou Clássico

Conceito. As empresas como ecossistemas de relações dinâmicas


w w w. y e l l o w s c i r e. p t

PLANOS DE CONTINGÊNCIAS

PHC dteamcontrol Interno

Data Warehouse. Debora Marrach Renata Miwa Tsuruda

GESTÃO de PROJECTOS. Gestor de Projectos Informáticos. Luís Manuel Borges Gouveia 1

Como elaborar um Plano de Negócios de Sucesso

Indicadores Gerais para a Avaliação Inclusiva

PHC dteamcontrol Interno

TECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO. SISTEMAS DE GESTÃO DE BASE DE DADOS Microsoft Access TECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO

Módulo 4. Construindo uma solução OLAP

Começo por apresentar uma breve definição para projecto e para gestão de projectos respectivamente.

ISO 9000:2000 Sistemas de Gestão da Qualidade Fundamentos e Vocabulário. As Normas da família ISO As Normas da família ISO 9000

PROCEDIMENTOS DE MUDANÇA DE COMERCIALIZADOR - CONSULTA PÚBLICA -

TIC Unidade 2 Base de Dados. Informação é todo o conjunto de dados devidamente ordenados e organizados de forma a terem significado.

INSTRUÇÃO DE TRABALHO PARA INFORMAÇÕES GERENCIAIS

PHC dteamcontrol Externo

Data Warehousing e OLAP

O futuro do planeamento financeiro e análise na Europa

Universidade Federal de Goiás UFG Campus Catalão CAC Departamento de Engenharia de Produção. Sistemas ERP. PCP 3 - Professor Muris Lage Junior

PHC Serviços CS. A gestão de processos de prestação de serviços

DESENVOLVER E GERIR COMPETÊNCIAS EM CONTEXTO DE MUDANÇA (Publicado na Revista Hotéis de Portugal Julho/Agosto 2004)

NCE/10/00116 Relatório final da CAE - Novo ciclo de estudos

XI Mestrado em Gestão do Desporto

Virtualização e Consolidação de Centro de Dados O Caso da UTAD António Costa - acosta@utad.pt

Instrumento que cria uma Rede de Cooperação Jurídica e Judiciária Internacional dos Países de Língua Portuguesa

TECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO - TIC 10º C. Planificação de. Curso Profissional de Técnico de Secretariado

GESTÃO. Gestão dos Processos e Operações Gestão de Sistemas e Tecnologias de Informação (dentro do capítulo 6) CLF

Diagrama de transição de Estados (DTE)

Mestrado em Segurança da Informação e Direito no Ciberespaço. Segurança da informação nas organizações Gestão de Configuração

NP EN ISO 9001:2000 LISTA DE COMPROVAÇÃO

Universidade do Minho Licenciatura em Engenharia Informática

Disciplina de Banco de Dados Introdução

PHC dteamcontrol Interno

Interatividade aliada a Análise de Negócios

Arquitecturas de Software Licenciatura em Engenharia Informática e de Computadores

Estratégia Empresarial. Capítulo 4 Missão e Objectivos. João Pedro Couto

Sistema de Monitorização e Avaliação da Rede Social de Alcochete. Sistema de Monitorização e Avaliação - REDE SOCIAL DE ALCOCHETE

Segurança e Higiene no Trabalho

Procedimento de Gestão PG 02 Controlo de Documentos e Registos

Apresentação da Solução. Divisão Área Saúde. Solução: Gestão de Camas

Sinopse das Unidades Curriculares Mestrado em Marketing e Comunicação. 1.º Ano / 1.º Semestre

1. Introdução. 1.1 Apresentação

Apresentação de Solução

Sistemas de Informação da Empresa

DEPARTAMENTO DE MATEMÁTICA E CIÊNCIAS EXPERIMENTAIS

Processo do Serviços de Manutenção de Sistemas de Informação

CRM. Customer Relationship Management

Engenharia de Software Sistemas Distribuídos

Como organizar um processo de planejamento estratégico

Manual do Revisor Oficial de Contas. Directriz de Revisão/Auditoria 300 ÍNDICE

Thalita Moraes PPGI Novembro 2007

Direcção Regional de Educação do Algarve

GereComSaber. Disciplina de Desenvolvimento de Sistemas de Software. Sistema de Gestão de Serviços em Condomínios

Enquadramento 02. Justificação 02. Metodologia de implementação 02. Destinatários 02. Sessões formativas 03

Fundamentos da Análise Multidimensional

Gerenciamento de projetos.

Procedimento de Gestão PG 01 Gestão do SGQ

GereComSaber. Desenvolvimento de Sistemas de Software. Universidade do Minho Conselho de Cursos de Engenharia Licenciatura em Engenharia Informática

Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence

DEMONSTRAÇÕES FINANCEIRAS COMBINADAS

Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados

Informática. Estrutura e Funcionamento de Computadores Software. Aula 8. Tipos de Software. Aplicação Genérica. Aplicação Específica

CRM. Serviços. Bilhetica. Aplicações. Cartão do Cidadão

Análise de Sistemas. Conceito de análise de sistemas

Cadeira de Tecnologias de Informação. Conceitos fundamentais de sistemas e tecnologias de informação e de gestão do conhecimento.

AVALIAÇÃO DE PROGRAMAS E DE PROJECTOS PEDAGÓGICOS

SAD orientado a DADOS

ADMINISTRAÇÃO DOS RECURSOS DE DADOS

Reengenharia de Processos

Módulo 4: Gerenciamento de Dados

CHECK - LIST - ISO 9001:2000

SISTEMAS DE INFORMAÇÃO PARA GESTÃO

PHC dteamcontrol Externo

Aprend.e Sistema integrado de formação e aprendizagem

Conceitos de Banco de Dados

Chapter 3. Análise de Negócios e Visualização de Dados

Base de Dados para Administrações de Condomínios

Transcrição:

UNIVERSIDADE DE TRÁS-OS-MONTES E ALTO DOURO INSTITUTO POLITÉCNICO DE LEIRIA DATA WAREHOUSE NUM INSTITUTO POLITÉCNICO ORIENTADOR: DOUTORA PAULA OLIVEIRA UTAD CO-ORIENTADOR: DOUTOR LUÍS MARCELINO IPL FÁTIMA MARGARIDA MARQUES CARLOS DISSERTAÇÃO DE MESTRADO EM INFORMÁTICA 07 08

Adoramos a perfeição, porque não a podemos ter; repugná-la-íamos, se a tivéssemos. O perfeito é desumano, porque o humano é imperfeito. Fernando Pessoa

AGRADECIMENTOS AGRADECIMENTOS Gostaríamos de agradecer a todos aqueles que nos querem bem e que nos apoiaram no decorrer deste trabalho. III

ÍNDICE ÍNDICE AGRADECIMENTOS... III ÍNDICE...IV LISTA DE FIGURAS E TABELAS...VI LISTA DE ABREVIATURAS E SIGLAS... VIII RESUMO... 10 PALAVRAS-CHAVE... 10 ABSTRACT... 11 KEYWORDS... 11 CAPÍTULO 1... 12 1.INTRODUÇÃO... 12 1.1. OBJECTIVO GERAL... 13 1.2. OBJECTIVOS ESPECÍFICOS... 13 1.3. JUSTIFICAÇÃO... 14 1.4. METODOLOGIA... 14 1.5. ESTRUTURA... 15 CAPÍTULO 2... 17 2.SISTEMAS DE SUPORTE À DECISÃO... 17 2.1. INTRODUÇÃO... 17 2.2. A INFORMAÇÃO NAS ORGANIZAÇÕES... 18 2.3. AS ORGANIZAÇÕES E OS TIPOS DE SISTEMAS INFORMAÇÃO... 23 2.4. OS SISTEMAS OPERACIONAIS E OS SISTEMAS DE SUPORTE À DECISÃO... 25 2.5. CONCEITO DE DATA WAREHOUSE... 27 2.6. CARACTERÍSTICAS DE DATA WAREHOUSE... 29 2.8. MODELO DE DADOS... 36 2.8.1. FACTOS, DIMENSÕES E VARIÁVEIS... 37 2.8.2. MODELO EM ESTRELA... 37 2.8.3. MODELO EM FLOCOS DE NEVE... 38 2.8.4. MODELO EM CONSTELAÇÃO... 39 2.8.5. PROCESSO DE MODELAÇÃO... 40 2.8.6. ERROS TÍPICOS NA MODELAÇÃO... 42 2.9. EXTRACÇÃO, TRANSFORMAÇÃO E CARREGAMENTO DE DADOS... 44 2.9.1. PROCESSO DE EXTRACÇÃO DE DADOS... 44 2.9.2. PROCESSO DE TRANSFORMAÇÃO DE DADOS... 45 2.9.3.PROCESSO DE CARREGAMENTO DE DADOS... 47 2.9.4. PASSOS TÍPICOS... 47 2.10. ADMINISTRAÇÃO E MANUTENÇÃO... 48 2.10.1. TAREFAS TÍPICAS DE ADMINISTRAÇÃO E GESTÃO... 49 2.10.2. TÉCNICAS DE OPTIMIZAÇÃO... 49 2.11. BUSINESS INTELLIGENCE E DATA MINING... 52 2.12. CUSTOS E BENEFÍCIOS DO DATA WAREHOUSE... 53 2.12.1. CUSTOS... 53 2.12.2. BENEFÍCIOS... 55 2.13. FACTORES CRÍTICOS DE SUCESSO DO DATA WAREHOUSE... 58 CAPÍTULO 3... 62 3. METODOLOGIAS DE DATA WAREHOUSE... 62 3.1. INTRODUÇÃO... 62 3.2. INMON... 63 3.3. KIMBALL... 67 3.4. COMPARAÇÃO DAS METODOLOGIAS DE INMON E KIMBALL... 74 3.5. OUTRAS CONSIDERAÇÕES... 77 3.5.1. PRINCÍPIOS DE CONSTRUÇÃO... 77 3.5.2. ABORDAGEM DE REQUISITOS... 78 IV

ÍNDICE CAPÍTULO 4... 80 4.ENSINO SUPERIOR POLITÉCNICO EM PORTUGAL... 80 4.1. INTRODUÇÃO... 80 4. 2. MISSÃO, ATRIBUIÇÕES E ORGANIZAÇÃO... 83 4. 2.1. MISSÃO... 84 4.2.2. ATRIBUIÇÕES... 84 4. 2.3. ORGANIZAÇÃO... 85 4.3. DESAFIOS... 86 4.4. NECESSIDADE DE INFORMAÇÃO... 87 4.4.1. FACTORES DE SUCESSO... 88 4.4.2. LEI Nº38/2007 DE 16 DE AGOSTO... 89 4.4.3. INDICADORES... 91 CAPÍTULO 5... 94 5. METODOLOGIA APLICADA A UM INSTITUTO POLITÉCNICO... 94 5.1. INTRODUÇÃO... 94 5.2. FASES DA METODOLOGIA... 95 5.3. FASE DE ANÁLISE... 96 5.3.1. ORGANIZAÇÃO... 97 5.3.1.1. CASO DE ESTUDO PLANO GERAL DA ORGANIZAÇÃO... 99 5.3.2. PROJECTO... 100 5.3.2.1. CASO DE ESTUDO PLANO GERAL DO PROJECTO... 103 5.3.3. REQUISITOS... 104 5.3.3.1. CASO DE ESTUDO PLANO GERAL DE REQUISITOS... 106 5.4. FASE DE DESENVOLVIMENTO... 107 5.4.1. MODELO CONCEPTUAL... 107 5.4.1.1. CASO DE ESTUDO PLANO CONCEPTUAL... 109 5.4.2. MODELO LÓGICO... 112 5.4.2.1. CASO DE ESTUDO PLANO LÓGICO... 113 5.5. FASE DE IMPLEMENTAÇÃO... 116 5.5.1. DATA MART... 117 5.5.1.1. CASO DE ESTUDO ESPECIFICAÇÃO DO DATA MART... 118 5.5.2. CASOS DE USO E REGRAS DE NEGÓCIO... 121 5.5.2.1. CASO DE ESTUDO ESPECIFICAÇÃO DE CASOS DE USO E REGRAS DE NEGÓCIO... 121 5.5.3. OUTRAS CONSIDERAÇÕES... 122 5.5.3.1. CASO DE ESTUDO OUTRAS CONSIDERAÇÕES... 123 5.6. FASE DE VERIFICAÇÃO... 123 5.6.1. TESTES E VALIDAÇÃO... 124 5.6.1.1. CASOS DE ESTUDO - TESTES E VALIDAÇÃO... 125 CAPÍTULO 6... 127 6.CONCLUSÃO... 127 FONTES DE INFORMAÇÃO... 130 ANEXOS... 133 ANEXO I INDICADORES... 133 ANEXO II PLANO GERAL DA ORGANIZAÇÃO... 137 ANEXO III PLANO GERAL DO PROJECTO... 138 ANEXO IV PLANO GERAL DE REQUISITOS... 139 ANEXO V PLANO CONCEPTUAL... 141 ANEXO VI PLANO LÓGICO... 141 ANEXO VII ESPECIFICAÇÃO DO DATA MART... 142 ANEXO VIII ESPECIFICAÇÃO DE CASOS DE USO E DE REGRAS DE NEGÓCIO... 143 ANEXO IX ESPECIFICAÇÃO DE OUTRAS CONSIDERAÇÕES... 143 ANEXO X RELATÓRO DE RESULTADOS... 144 V

FIGURAS E TABELAS LISTA DE FIGURAS E TABELAS FIGURA 1 CARACTERÍSTICAS DA DECISÃO ADAPTADO DE [KIMBAL,02]... 21 FIGURA 2 COMPOSIÇÃO DE UM SI ADAPTADO DE [GOUVEIA,04]... 22 FIGURA 3 DIVERSOS TIPOS DE SI ADAPTADO DE [VARAJÃO,05]... 24 FIGURA 4 ARQUITECTURA DE DW ADAPTADO DE [KIMBAL,02]... 31 FIGURA 5 ARQUITECTURA GLOBAL ADAPTADO DE [MACHADO,07]... 32 FIGURA 6 ARQUITECTURA INDEPENDENTE ADAPTADO DE [MACHADO,07]... 33 FIGURA 7 ARQUITECTURA INTEGRADA ADAPTADO DE [MACHADO,07]... 33 FIGURA 8 ARQUITECTURA TOP-DOWN ADAPTADO DE [INMON,97]... 34 FIGURA 9 ARQUITECTURA BOTTOM-UP ADAPTADO DE [INMON,97]... 35 FIGURA 10 MODELO DIMENSIONAL ADAPTADO DE [KIMBAL,02]... 38 FIGURA 11 MODELO FLOCOS DE NEVE ADAPTADO DE [KIMBAL,02]... 39 FIGURA 12 MODELO EM CONSTELAÇÃO ADAPTADO DE [KIMBAL,02]... 40 FIGURA 13 ERROS COMUNS ADAPTADO DE [TDWI,08]... 43 FIGURA 14 ARQUITECTURA NAVEGADOR DE AGREGADOS ADAPTADO DE [INMON,97]... 51 FIGURA 15 CONCEITO DE BI ADAPTADO DE [CRISP,07]... 52 FIGURA 16 CUSTO COM RELATÓRIOS ANTES DO DW (A X B) ADAPTADO DE [INMON1,08]... 56 FIGURA 17 CUSTO COM RELATÓRIOS APÓS O DW (A + B) ADAPTADO DE [INMON1,08]... 57 FIGURA 18 DMS INDEPENDENTES ADAPTADO DE [INMON1,08]... 57 FIGURA 19 DMS A PARTIR DO DW ADAPTADO DE [INMON1,08]... 58 FIGURA 20 FASES DA METODOLOGIA DE DESENVOLVIMENTO ADAPTADO DE [INMON1,08]... 64 FIGURA 21 METH2 ADAPTADO DE [INMON,02]... 65 FIGURA 22 METH3 / METH4 ADAPTADO DE [INMON, 02]... 66 FIGURA 23 CICLO DE VIDA DIMENSIONAL DO NEGÓCIO ADAPTADO DE [KIMBALL, 98]... 67 FIGURA 24 IMPORTÂNCIA DOS PONTOS DE READINESS LITMUS TÊS ADAPTADO DE [KIMBALL, 98]... 68 FIGURA 25 NATUREZA BINÁRIA E DIFERENÇAS NO ENSINO SUPERIOR ADAPTADO DE [CCISP, 06]... 81 FIGURA 26 - FACTORES DE SUCESSO DO ENSINO POLITÉCNICO ADAPTADO DE [TRISTANY,01]... 88 FIGURA 27 FASES DA METODOLOGIA... 96 FIGURA 28 FASE DE ANÁLISE... 97 FIGURA 29 PLANO GERAL DA ORGANIZAÇÃO... 98 FIGURA 30 EXCERTO DO PLANO GERAL DA ORGANIZAÇÃO... 100 FIGURA 31 PLANO GERAL DO PROJECTO... 102 FIGURA 32 EXCERTO DO PLANO GERAL DO PROJECTO... 104 FIGURA 33 PLANO GERAL DE REQUISITOS... 105 FIGURA 34 EXCERTO DO PLANO GERAL DE REQUISITOS... 106 FIGURA 35 FASE DE DESENVOLVIMENTO... 107 FIGURA 36 PLANO CONCEPTUAL... 108 FIGURA 37 EXCERTO DO PLANO CONCEPTUAL... 112 FIGURA 38 PLANO LÓGICO... 113 FIGURA 39 EXCERTO DO PLANO LÓGICO... 116 FIGURA 40 FASE DE IMPLEMENTAÇÃO... 116 FIGURA 41 ESPECIFICAÇÃO DO DATA MART... 118 FIGURA 42 EXCERTO DA ESPECIFICAÇÃO DO DATA MART... 120 FIGURA 43 ESPECIFICAÇÃO DE CASOS DE USO E DE REGRAS DE NEGÓCIO... 121 FIGURA 44 EXCERTO DA ESPECIFICAÇÃO DE CASO DE USO E DE REGRAS DE NEGÓCIO... 122 FIGURA 45 ESPECIFICAÇÃO DE OUTRAS CONSIDERAÇÕES... 122 FIGURA 46 EXCERTO DE OUTRAS CONSIDERAÇÕES... 123 FIGURA 47 FASE DE VERIFICAÇÃO... 123 FIGURA 48 RELATÓRIO DE RESULTADOS... 124 FIGURA 49 EXCERTO DE RELATÓRIO DE RESULTADOS... 125 TABELA 1 NÍVEIS DE INFORMAÇÃO ADAPTADO DE [GOUVEIA, 04]... 19 TABELA 2 CARACTERÍSTICAS DA QUALIDADE DE INFORMAÇÃO ADAPTADO DE [GOUVEIA, 04]... 19 TABELA 3 NÍVEIS DE INFORMAÇÃO ADAPTADO DE [GOUVEIA, 04]... 20 VI

FIGURAS E TABELAS TABELA 4 EVOLUÇÃO DA GESTÃO ADAPTADO DE [GOUVEIA,04]... 22 TABELA 5 NÍVEIS DE GESTÃO DE UMA ORGANIZAÇÃO ADAPTADO DE [GOUVEIA,04]... 24 TABELA 6 LIMITAÇÕES DOS DADOS OLTP ADAPTADO DE [CORTES, 05] E [KIMBAL, 02]... 26 TABELA 7 COMPARAÇÃO ADAPTADO DE [KIMBAL,02]... 28 TABELA 8 OLTP E OLAP ADAPTADO DE [KIMBAL,02]... 28 TABELA 9 ASPECTOS NO PROCESSO DE MODELAÇÃO ADAPTADO DE [KIMBAL,02]... 41 TABELA 10 ESTRUTURA DO MAPA LÓGICO DE DADOS ADAPTADO DE [KIMBAL,02]... 44 TABELA 11 CUSTOS INICIAIS ADAPTADO DE [INMON1,08]... 53 TABELA 12 CUSTOS PERIÓDICOS ADAPTADO DE [INMON1,08]... 54 TABELA 13 EQUIPAS DO DESENVOLVIMENTO DO SISTEMA ADAPTADO DE [KIMBALL, 98]... 70 TABELA 14 TAREFAS NA ELABORAÇÃO DO PROJECTO ADAPTADO DE [KIMBALL, 98]... 71 TABELA 15 TAREFAS DA GESTÃO DE UM PROJECTO ADAPTADO DE [KIMBALL, 98]... 72 TABELA 16 VANTAGENS E DESVANTAGENS BASEADO EM [KIMBAL,04] E [INMON,98]... 77 TABELA 17 CONTEXTO DO ENSINO SUPERIOR ADAPTADO DE [TRISTANY,01]... 83 TABELA 18 MISSÃO DO ENSINO SUPERIOR ADAPTADO DE [DL1,08]... 84 TABELA 19 DESAFIOS DO ENSINO SUPERIOR ADAPTADO DE [MORGADO,05]... 86 TABELA 20 PARÂMETROS DE AVALIAÇÃO DA QUALIDADE ADAPTADO DE [LEI1,08]... 90 TABELA 21 INDICADORES - ADAPTADO DE [ANDRADE, 03]... 93 VII

ABREVIATURAS E SIGLAS LISTA DE ABREVIATURAS E SIGLAS BD BI CDC CGEY CIF DAS DBA DBMS DMS DSS DW EIS ER ETL HOLAP KWS MIS MML MOLAP MUML OAS OCDE ODS BASE DE DADOS BUSINESS INTELLIGENCE CHANGE DATA CAPTURE CAP GEMINI ERNST YONG CORPORATE INFORMATION FACTORY ÁREA DE TRATAMENTO DE DADOS ADMINISTRADOR BASE DADOS DATA BASE MANAGEMENT SYSTEM DATA MARTS SISTEMAS DE SUPORTE À DECISÃO DATA WAREHOUSE SISTEMAS DE SUPORTE EXECUTIVO ENTIDADE E RELACIONAMENTO EXTRACÇÃO, TRANSFORMAÇÃO E CARGA HYBRID OLAP SISTEMAS DE SUPORTE AO CONHECIMENTO SISTEMAS DE GESTÃO PARA GESTÃO MULTIDIMENSIONAL MODELING LANGUAGE MUTIDIMENSIONAL OLAP MULTIDIMENSIONAL UML SISTEMAS DE AUTOMAÇÃO DE ESCRITÓRIO ORGANIZAÇÃO PARA A COOPERAÇÃO E DESENVOLVIMENTO ECONÓMICO OPERATIONAL DATA STORE VIII

FIGURAS E TABELAS OIM OIS OLAP OLTP REMUS ROLAP SCD SCD SGBD SI TIC TPS UML MICROSOFT OPEN INFORMATION MODEL SISTEMA DE INFORMAÇÃO DE ESCRITÓRIO ON-LINE ANALYTICAL PROCESSING SISTEMAS DE PROCESSAMENTO DE TRANSACÇÕES ON-LINE MULTIDIMENSIONAL PURPOSE RELATIONAL OLAP SLOWLY CHANGING DIMENSIONS SLOWLY CHANGING DIMENSIONS SISTEMA DE GESTÃO DE BASES DE DADOS SISTEMA DE INFORMAÇÃO TECNOLOGIAS DE INFORMAÇÃO E COMUNICAÇÃO SISTEMA DE PROCESSAMENTO DE TRANSACÇÕES UNIFIED MODELING LANGUAGE IX

RESUMO RESUMO O Data Warehouse (DW) surgiu como base para os Sistemas de Suporte à Decisão (DSS) integrando fontes de dados dos sistemas transaccionais. A sua crescente popularidade reflecte a necessidade das organizações em obter informações analíticas derivadas dos seus sistemas transaccionais. Ou seja, com a chegada de novas ferramentas tecnológicas de análise de informação, os dirigentes das organizações começaram a exigir dos sistemas transaccionais respostas às suas solicitações, mas como estes sistemas foram desenvolvidos para garantir a operação da organização não estão preparados para gerar e armazenar as informações estratégicas necessárias a um Business Intelligence (BI) eficiente. O DW tem características diferentes do ambiente tradicional e é construído com o objectivo de suprir as necessidades de processamento analítico das organizações. Considera-se que os projectos de DW têm mais hipóteses de sucesso quando desenvolvidos através de uma metodologia consistente que guie o projectista durante as várias fases do projecto. As instituições de ensino superior em Portugal não são excepção ao referido anteriormente. Existe neste tipo de organização uma grande quantidade de sistemas que auxiliam a gestão das suas actividades rotineiras, onde a possibilidade de propiciar aos seus administradores acesso a informações institucionais em tempo real num ambiente único a partir de qualquer computador ligado à Internet, permitirá auxiliar às tomadas de decisão. Assim, com a metodologia proposta foi desenvolvido um caso de estudo com a finalidade de verificar e avaliar a aplicabilidade da metodologia num instituto politécnico. PALAVRAS-CHAVE Sistemas de Informação, Sistemas de Apoio à Decisão, Data Warehouse e ensino superior. 10

ABSTRACT ABSTRACT The Data Warehouse (DW) emerged as a basis for the Decision Support System (DSS) integrating data sources of transactional systems. Their growing popularity reflects the need for organizations to obtain analytical information from their transactional systems. Such systems have different features of traditional environment and are built with the aim of addressing the needs of analytical processing of organizations. It is considered that DW projects have more chance of success if developed through a consistent methodology that guides the designer during the various phases of the project. That is, with the arrival of new technological tools for analyzing information, the leaders of the organizations began to require of transactional systems answers to their requests, but these systems were developed to ensure the operation of the organization and are not prepared to generate and store the strategic information necessary for a Business Intelligence (BI) efficient. Higher education institutions in Portugal are no exception. These institutions have several systems that help the management of their routine activities, where the ability to provide their administrators access to information in real time in a single environment from any computer connected to the Internet, will help the acquisition of decision. So with the proposed methodology was developed a case study for the purpose of verifying and assessing the applicability of it in a polytechnic institute. KEYWORDS Information Systems, Decision Support Systems, Data Warehouse and higher education. 11

INTRODUÇÃO CAPÍTULO 1 1.INTRODUÇÃO A informação é, hoje em dia, um dos motores da actividade humana. De facto, independentemente do tamanho, natureza ou mesmo actividade de uma organização, a verdade é que esta precisa de informação para poder executar e prosseguir a sua missão e cumprir os objectivos a que se propõe. Numa sociedade que cada vez mais privilegia a informação como uma das suas preocupações mais dominantes, a necessidade de existir numa organização a infra-estrutura adequada para a sua recolha, armazenamento, processamento, representação e distribuição faz com que uma parcela apreciável do esforço da organização seja tomada por estas preocupações. Qualquer organização moderna recorre às Tecnologias de Informação e Comunicação (TIC) como forma de garantir a função dos Sistemas de Informação (SI) enquanto infra-estrutura de suporte ao fluxo de informação na organização. Para qualquer um de nós, a realização da mais simples acção, ou a decisão de optar por uma determinada alternativa de acção exige informação. Considerando as diversas situações do nosso dia-a-dia, somos confrontados com a existência de condições exteriores que condicionam o que fazemos e o que decidimos. Por exemplo: o procurar saber qual o estado do trânsito no percurso casa trabalho. Neste caso, quem conseguir obter melhor informação sobre o trânsito, tem maior possibilidade de o evitar e assim conseguir realizar o percurso sem as demoras e os custos associados a este problema. Do mesmo modo que a informação para o indivíduo lhe traz vantagens, para as organizações, essas vantagens são ainda mais evidentes, pois a sua complexidade implica a coordenação e interacção de um conjunto de indivíduos e a resposta a solicitações que lhes são exteriores, com a exigência de padrões de qualidade cada vez mais elevados. Para o efeito, recorrese ao uso de SI baseados em computador que proporcionam actualmente os meios mais adequados, embora não exclusivos, para suporte à tomada de decisão e à acção nas organizações. [Gouveia,04] A presença ubíqua dos computadores é, hoje em dia, uma realidade. A maioria dos processos que nos rodeiam é em grande parte suportada por computadores. Como resultado, verifica-se que a quantidade de informação aumentou: durante o séc. XX, o volume de informação gerado e mantido por algumas empresas cresceu cerca de 100.000 vezes. [Berry,97] 12

INTRODUÇÃO A informação assume-se assim como um factor vital e indispensável para a gestão e competitividade das organizações, sendo que esta pode e deve ser considerada como um activo de elevada importância neste enquadramento. Com o objectivo de dotar as organizações com memória, surgiram neste contexto, os sistemas do tipo Data Warehouse (DW), cuja função é armazenar de forma eficaz e coerente a informação gerada ao longo do tempo pelas várias fontes de informação associadas a uma organização. Um dos problemas que as organizações enfrentam na era da informação é como organizar os dados de forma a transformálos em informações úteis, relevantes e estratégicas para o negócio. Pelas suas características técnicas, um DW deve disponibilizar a informação certa, no sítio certo, no tempo certo, com o custo certo, no sentido de suportar as decisões certas. [Kimball, 98] Dentre as possíveis opções de ferramentas de gestão e organização de informações disponíveis no mercado, DW pode ser uma opção, dado que possibilita explorar os dados transformando-os em informações que apoiam as tomadas de decisão, podendo assim gerar melhores resultados para uma organização. A informação por si só não é um diferencial competitivo para as organizações, mas sim a maneira como ela é utilizada. As organizações dependem da utilização da informação, principalmente para apoio à tomada de decisões. A maioria das aplicações informáticas não respondem às necessidades de informação de quem decide sendo necessário a criação de um ambiente adequado para armazenar e gerir de forma eficiente os dados produzidos no dia-a-dia das organizações. 1.1. OBJECTIVO GERAL O objectivo geral deste trabalho é propor uma metodologia para o desenvolvimento de um ambiente DW para apoio à administração de uma instituição de ensino superior politécnico. 1.2. OBJECTIVOS ESPECÍFICOS Os objectivos específicos deste trabalho estão relacionados com a pesquisa na área das TIC, com relevo na área dos SI e DW. A identificação dos processos de um Sistema de Suporte à Decisão (DSS), bem como a análise das metodologias de desenvolvimento de um DW serão tidos em conta de forma a definir uma metodologia de desenvolvimento de um DW para um estudo de caso concreto, uma instituição de ensino superior politécnico. 13

INTRODUÇÃO Por fim, a elaboração da escrita da tese permitirá reunir os resultados obtidos ao longo da pesquisa, fornecendo um contributo nesta área de conhecimento da sociedade. 1.3. JUSTIFICAÇÃO Diversas organizações possuem as suas actividades apoiadas por SI que tiveram os seguintes objectivos na sua concepção: o automatizar tarefas repetitivas sobre os dados, o minimizar os erros e o agilizar os processos de manipulação da informação, por vezes dispersa em vários sistemas. À medida que esta informação aumenta, as organizações enfrentam problemas da manipulação dessa mesma informação. Tornando-se assim difícil extrair informações adequadas para o suporte à decisão. Adicionando ainda o facto de que estas organizações carecem de integração das suas fontes de informação com informações externas, o que irá depender da compatibilidade da tecnologia e da formatação de dados. Assim, tornase necessário o desenvolvimento de um repositório de dados optimizado para pesquisas e integração, independente dos SI, mas que destes obtivesse a sua informação. Esta informação é extraída, tratada e guardada no DW, podendo ainda servir como fonte organizada para a utilização de Datamining. Este processo, através de inteligência aplicada procura padrões com conhecimento escondido na Base de Dados (BD). Uma vez reconhecidos estes padrões tentam alcançar-se projecções futuras de acontecimentos. Ao nível do ensino superior politécnico o cenário também se verifica. Ou seja, existe informação proveniente de vários sistemas, de onde é necessário extrair informação para apoiar a gestão. Sendo que a sua missão passa por assegurar aos alunos um ensino de elevada qualidade pedagógica e científica, para manter a sua sobrevivência é fundamental conhecer bem o ambiente de acção e os seus intervenientes. Assim, a necessidade de fazer face a esta realidade motivou claramente a escolha do tema. 1.4. METODOLOGIA Para alcançar os objectivos propostos foram superadas várias etapas que juntas integram o trabalho desenvolvido. A primeira etapa do trabalho consistiu no levantamento de fontes de informação, como documentação da Internet, livros e revistas sobre as áreas em que incide esta investigação, ou seja, as TIC com relevo na área de DW. Numa segunda etapa, foram analisadas metodologias de desenvolvimento de um DW e referidas outras considerações acerca dos projectos de SI. 14

INTRODUÇÃO Na terceira etapa foi analisado o ensino superior politécnico em Portugal sobre várias vertentes, nomeadamente a sua estrutura organizacional, a fim de salientar a estrutura de decisão deste tipo de organização. Na quarta etapa, uma vez analisadas as metodologias e a organização, foi definida uma metodologia de desenvolvimento de um DW para um estudo de caso concreto, o ensino superior politécnico. No final, na quinta etapa, com a análise de resultados, foram apresentadas as conclusões obtidas na pesquisa, bem como algumas recomendações para trabalhos futuros relacionados com o tema analisado. 1.5. ESTRUTURA A organização do presente trabalho inicia-se com: os agradecimentos, a elaboração do índice, a apresentação das listas de figuras, tabelas, as abreviaturas e as siglas e o resumo. Depois o trabalho está estruturado em sete capítulos. O primeiro capítulo, apresenta a introdução ao tema, o objectivo geral, os objectivos específicos, a justificação para a escolha do tema, bem como a metodologia e estrutura aplicada no desenvolvimento do trabalho. De seguida no segundo capítulo, existe a referência a conceitos relacionados com os SI, os DSS e o DW. Inicia-se pela importância da informação, passando pelo modelo de dados e as actividades relacionadas com um DW, como o processo de ETL e de administração. Verifica-se ainda os custos e os benefícios associados a um sistema deste tipo. No terceiro capitulo são analisadas e comparadas algumas metodologias de desenvolvimento de DW. Numa primeira etapa consideram-se dois autores Inmon e Kimbal, dada a sua relevância nesta área e numa segunda etapa são recolhidas outras considerações de vários autores estudadas para o trabalho. O capítulo quarto pretende analisar o ensino superior em Portugal, nomeadamente o politécnico. Dada a necessidade de conhecer a realidade dos politécnicos, apresenta-se alguma da sua legislação que está na base da sua criação e do seu modo de funcionamento. A metodologia proposta será o objectivo do quinto capítulo. Partindo do princípio de se conjugar as metodologias apresentadas e das adaptar ao ensino superior, optouse pela elaboração de uma metodologia que suprisse os pontos críticos das metodologias apresentadas. Desta forma, este capítulo apresenta uma metodologia que detalha aspectos contemplados pelas metodologias apresentadas 15

INTRODUÇÃO anteriormente, com destaque na fase de levantamento de requisitos do DW e na troca de opiniões ente utilizadores e técnicos responsáveis pela construção do sistema. Ainda neste capítulo apresenta-se um caso de estudo com base na metodologia abordada que pretende aplicar a proposta do capítulo anterior no ensino superior politécnico. O capítulo seis trata das conclusões obtidas no desenvolvimento do trabalho, bem como refere algumas recomendações para trabalhos futuros. Finalmente, são indicadas as fontes de informação utilizadas no decorrer do trabalho e são apresentados os anexos referenciados ao longo do mesmo. Inicia-se de seguida o capítulo 2 com a exposição do levantamento efectuado face aos SI, os DSS e o DW. 16

SISTEMAS DE SUPORTE À DECISÃO CAPÍTULO 2 2.SISTEMAS DE SUPORTE À DECISÃO O objectivo deste capítulo consiste na análise dos conceitos inerentes aos DSS, sendo iniciando com a análise da informação nas organizações. Dada a crescente dependência das organizações em relação aos meios que utilizam para lidar com a informação, aliada ao crescente aumento do fluxo de informação, justifica o estudo dos SI e do que se entende por informação em particular. 2.1. INTRODUÇÃO No início do século XXI, a sociedade contemporânea caracteriza-se por mutações profundas sem precedentes aos mais variados níveis, fruto de uma evolução de valores, saberes e percepções do mundo, em que é particularmente assinalável a influência de um conjunto diversificado de efeitos e tendências associados à aceleração do progresso científico e tecnológico do domínio da informação. De modo a triunfar em mercados cada vez mais caracterizados por uma mudança acelerada, qualquer organização necessita de dispor de um SI que suporte devidamente as suas necessidades de informação a todos os níveis de decisão, constituindo este um elemento central no desenvolvimento da sua capacidade competitiva. [Varajão,05] As organizações dependem da utilização da informação, principalmente para apoio à tomada de decisões. O processo de tomada de decisão consiste na escolha de uma opção, entre diversas alternativas existentes, seguindo determinados passos previamente estabelecidos que culminam na resolução de um problema. Mas a maioria das aplicações informáticas não se adequam às necessidades de informação de quem decide sendo necessário a criação de um ambiente adequado para armazenamento e gestão eficiente dos dados produzidos no dia-a-dia nas organizações. Isto porque ao existir a partilha de informação numa organização, existe sempre o problema do desenho dos relatórios não ter sido pensado com o propósito da partilha, pelo que partes dos seus conteúdos podem ser desajustados das necessidades de outros utilizadores. Isto justifica-se tendo em conta os seguintes três factores: (i) os relatórios são muitas vezes informação resumida da actividade operacional; (ii) existe falta de uma visão da evolução temporal contínua dos relatórios e (iii) existe dúvidas sobre quem é o real dono da informação. Os factores 17

SISTEMAS DE SUPORTE À DECISÃO enumerados anteriormente leva a uma perda de credibilidade da partilha de informação dentro da organização, mas também leva ao reconhecimento da necessidade de um repositório central de dados para fins analíticos, onde todos podem aceder a informação. [Cortes,05] Ou seja, o volume de dados está a aumentar e as organizações dispõem cada vez mais de menos tempo para as tomadas de decisão. As organizações que não utilizarem meios eficientes para analisar as informações contidas nestes dados serão, cada vez mais, menos competitivas. Os métodos tradicionais de acesso e análise dos dados, baseados na tecnologia de bases de dados relacionais, embora consigam pesquisar e manipular grandes volumes de dados, ainda não permitem analisar e entender, em tempo útil o volume de dados. É necessário utilizar técnicas, produtos e serviços que permitam a extracção e manipulação automatizada de dados e descoberta de conhecimento. É neste contexto que surge o conceito de DSS e DW. 2.2. A INFORMAÇÃO NAS ORGANIZAÇÕES A existência dos SI não é contemporânea dos computadores. De facto, verifica-se que mesmo muito antes de estes existirem, os seres humanos organizavam as suas actividades e recorriam a diferentes tipos de estratégias de forma a suportarem as suas necessidades de informação para apoio à tomada de decisão. De um modo mais geral, o ser humano, enquanto indivíduo, consome informação para tomar decisões e, desta forma concretizar em acção as suas intenções. [Gouveia, 04] O computador insere um novo elemento na relação do indivíduo com a informação. Funciona como um dispositivo de mediação de comunicação à qual o indivíduo recorre para lidar com a informação quer para seu próprio uso, quer para interagir com outros indivíduos. Para o indivíduo, o acesso à informação traduz a possibilidade de melhores meios de actualização e desenvolvimento das suas capacidades, o acesso ao conhecimento e a experiências de terceiros ou apenas a resolução de problemas e necessidades que se lhe colocam. Nas organizações também é necessário o recurso à informação e a forma como esta trata a informação é um dos factores determinantes para o correcto funcionamento de uma organização. É possível distinguir diferentes níveis associados à informação, em função das características intrínsecas que esta possui. Desta forma temos quatro níveis: dados, informação, conhecimento e sabedoria, que são caracterizados na tabela 1. 18

SISTEMAS DE SUPORTE À DECISÃO Dados Elementos atómicos que referenciam, qualificam e descrevem todos os itens necessários à operação do SI. Informação Agregação de dados através de relações de complementaridade entre eles. Conhecimento É o meio de transmitir dados e informação de modo organizado e estruturado para uso futuro. Sabedoria Inclui a capacidade de aplicar a situações novas o conhecimento existente, bem como a previsão de comportamentos por comparação com dados, informação e conhecimento disponível. Tabela 1 Níveis de Informação adaptado de [Gouveia, 04] As características que a informação possui determinam a sua qualidade e permitem estabelecer uma seriação no seu tratamento, recorrendo a um conjunto de critérios que reflectem a sua importância, valor e qualidade. A qualidade da informação pode ser avaliada com base em quatro características principais, enumeradas na tabela 2. Precisa O grau de rigor da informação que revela uma caracterização da realidade o mais fiável possível; informação correcta, verdadeira. Oportuna A velocidade de reacção de uma organização depende também da presença em tempo útil do fluxo de informação apropriado. Completa A presença da informação dispersa pela organização não tem grande valor se não se encontrar disponível. Concisa Informação demasiado extensa ou pormenorizada, que por isso não é utilizada, contraria dois princípios básicos de comunicação: mensagens fáceis de descodificar e fáceis de difundir. Tabela 2 Características da Qualidade de Informação adaptado de [Gouveia, 04] Adicionalmente, deve ser tido em atenção que o real valor da informação depende da sua utilização, da sua precisão e do seu nível de detalhe, logo, nem toda a informação possui o mesmo valor e por isso devem ser especificadas prioridades para o seu tratamento, comunicação e armazenamento. De igual forma a sua origem é importante, sendo de considerar a existência de múltiplas fontes de informação que importa ter em conta e que variam de organização para organização, bem como os seus utilizadores. 19

SISTEMAS DE SUPORTE À DECISÃO A informação suporta a decisão, na medida em que as diferentes actividades do diaa-dia das organizações para serem realizadas consomem dados e informação e geram novos dados. Desta forma é possível considerar a informação como um recurso. Este é necessário para a tomada de decisão e para o suporte da acção. Desta forma possui um valor estratégico para a própria organização. Adicionalmente, é também possível considerar a informação como um activo da organização, uma vez que pode ser contabilizada, sendo possível atribuir um determinado valor de mercado a marcas, listagens de clientes, relatórios da organização, entre outros dados e informação, na posse da organização. [Gouveia, 04] No entanto, nem toda a informação possui a mesma importância ou prioridade para cada indivíduo e para a organização. O fluxo de dados numa organização pode ser caracterizado pelo agrupamento de dados e informação de modo a satisfazer os diferentes processos de tomada de decisão na organização, quer internamente, quer na sua relação com o exterior. Perante a necessidade de garantir que a informação esteja disponível a quem dela necessite é essencial considerar um fluxo de informação, onde dados e informação são armazenados, processados e comunicados com base em diferentes prioridades. Assim, é adequado definir prioridades de tratamento de informação e estabelecer os canais necessários para encaminhar dados e informação. Onde de acordo com essas prioridades e para assegurar o seu fornecimento aos decisores é possível efectuar uma divisão do fluxo por níveis de responsabilidade. Para cada um dos níveis, a informação que possui características e orientações diferentes em termos de audiência, do seu alcance temporal e da sua complexidade, nos três níveis descritos em seguida. [Gouveia, 04] Nível estratégico Informação bastante elaborada que suporta decisão de longo prazo, orientada para os decisores de topo. Nível táctico Responsável pela afectação de recursos e pelo estabelecimento do controlo e da gestão de médio prazo. Nível operacional Nível de controlo e execução de tarefas específicas de curto prazo em que assenta a actividade da organização. Tabela 3 Níveis de Informação adaptado de [Gouveia, 04] A informação, bem como a sua recolha, tratamento e apresentação tem como objectivo final facilitar a tomada de decisões no negócio quer seja de nível operacional, quer táctico, quer mesmo estratégico. As características da decisão podem ser representadas através da figura seguinte. 20