DEFINIÇÃO DE UMA ARQUITETURA DE DATA WAREHOUSING PARA GESTÃO EM CIÊNCIA E TECNOLOGIA NO BRASIL



Documentos relacionados
Data Warehouse. Debora Marrach Renata Miwa Tsuruda

DATA WAREHOUSE. Introdução

Banco de Dados - Senado

DATA WAREHOUSE. Rafael Ervin Hass Raphael Laércio Zago

Data Warehouse Processos e Arquitetura

Data Warehousing. Leonardo da Silva Leandro. CIn.ufpe.br

DATA WAREHOUSE NO APOIO À TOMADA DE DECISÕES

Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

Tópicos Avançados Business Intelligence. Banco de Dados Prof. Otacílio José Pereira. Unidade 10 Tópicos Avançados Business Inteligence.

Adriano Maranhão BUSINESS INTELLIGENCE (BI),

Interatividade aliada a Análise de Negócios

ROTEIRO PARA ELABORAÇÃO DE PROJETOS

Planejamento Estratégico de TI. Prof.: Fernando Ascani

04/08/2012 MODELAGEM DE DADOS. PROF. RAFAEL DIAS RIBEIRO, MODELAGEM DE DADOS. Aula 1. Prof. Rafael Dias Ribeiro. M.Sc.

Conceitos de Banco de Dados

TERMO DE REFERÊNCIA (TR) GAUD VAGA

Módulo 4. Construindo uma solução OLAP

PROCESSO DE DESENVOLVIMENTO DE SOFTWARE. Modelos de Processo de Desenvolvimento de Software

Governança de TI. ITIL v.2&3. parte 1

Oracle Hyperion Essbase

Módulo 4: Gerenciamento de Dados

ARCO - Associação Recreativa dos Correios. Sistema para Gerenciamento de Associações Recreativas Plano de Desenvolvimento de Software Versão <1.

IMPLANTAÇÃO DE UM SISTEMA DE AVALIAÇÃO DE DESEMPENHO NA UFG

Complemento I - Noções Introdutórias em Data Warehouses

TERMO DE REFERÊNCIA Nº 4031 PARA CONTRATAÇÃO DE PESSOA FÍSICA PROCESSO DE SELEÇÃO - EDITAL Nº

04/08/2012 MODELAGEM DE DADOS. PROF. RAFAEL DIAS RIBEIRO, MODELAGEM DE DADOS. Aula 2. Prof. Rafael Dias Ribeiro. M.Sc.

Uma análise de ferramentas de modelagem e gerência de metadados aplicadas ao projeto de BI/DW-UFBA

Processos de gerenciamento de projetos em um projeto

Pequenas e Médias Empresas no Canadá. Pequenos Negócios Conceito e Principais instituições de Apoio aos Pequenos Negócios

Pós-Graduação em Gerenciamento de Projetos práticas do PMI

ADMINISTRAÇÃO DE ATIVOS DE TI GERENCIAMENTO DE CONFIGURAÇÃO

Modelo de dados do Data Warehouse

Gerenciamento de Projetos Modulo II Ciclo de Vida e Organização do Projeto

Data Warehouses Uma Introdução

CHECK - LIST - ISO 9001:2000

Data Warehouse. Diogo Matos da Silva 1. Universidade Federal de Ouro Preto, Ouro Preto, MG, Brasil. Banco de Dados II

TI em Números Como identificar e mostrar o real valor da TI

Sistemas de Informação I

ü Curso - Bacharelado em Sistemas de Informação

2 Diagrama de Caso de Uso

SAD orientado a DADOS

Existem três categorias básicas de processos empresariais:

Programação com acesso a BD. Prof.: Clayton Maciel Costa clayton.maciel@ifrn.edu.br

Kimball University: As 10 Regras Essenciais para a Modelagem de Dados Dimensional

FORMANDO AS LIDERANÇAS DO FUTURO

ISO/IEC 12207: Gerência de Configuração

FATEC Cruzeiro José da Silva. Ferramenta CRM como estratégia de negócios

Princípios de Finanças

Processo de Implementação de um Sistema de Gestão da Qualidade

EDUCAÇÃO SUPERIOR, INOVAÇÃO E PARQUES TECNOLÓGICOS

Universidade Paulista

Universidade Federal de Goiás UFG Campus Catalão CAC Departamento de Engenharia de Produção. Sistemas ERP. PCP 3 - Professor Muris Lage Junior

Módulo 15 Resumo. Módulo I Cultura da Informação

As principais características da abordagem de um banco de dados versus a abordagem de processamento de arquivos são as seguintes:

CAPÍTULO 1 - CONTABILIDADE E GESTÃO EMPRESARIAL A CONTROLADORIA

Gerenciamento de Riscos do Projeto Eventos Adversos

UNIVERSIDADE FEDERAL DO PARANÁ UFPR Bacharelado em Ciência da Computação

Roteiro SENAC. Análise de Riscos. Planejamento do Gerenciamento de Riscos. Planejamento do Gerenciamento de Riscos

Para construção dos modelos físicos, será estudado o modelo Relacional como originalmente proposto por Codd.

Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados

IDÉIAS SOBRE IMPLANTAÇÃO DE SISTEMAS EMPRESARIAIS INTEGRADOS. Prof. Eduardo H. S. Oliveira

Estruturando o modelo de RH: da criação da estratégia de RH ao diagnóstico de sua efetividade

Como melhorar a tomada de decisão. slide 1

Metodologia de Gerenciamento de Projetos da Justiça Federal

Planejamento - 7. Planejamento do Gerenciamento do Risco Identificação dos riscos. Mauricio Lyra, PMP

Gestão de Relacionamento com o Cliente CRM

5 Estudo de Caso Material selecionado para o estudo de caso

SISTEMAS DE GESTÃO São Paulo, Janeiro de 2005

Programa FAPESP. Pesquisa Inovativa EM. Pequenas Empresas

Sistema de Indicadores Online de Ciência, Tecnologia e Inovação

FERRAMENTAS E SOLUÇÕES DE APOIO À GESTÃO E MANUTENÇÃO DE ATIVOS

Banco de Dados I. Apresentação (mini-currículo) Conceitos. Disciplina Banco de Dados. Cont... Cont... Edson Thizon

Prof. Marcelo Machado Cunha

AGILE ROLAP - UMA METODOLOGIA ÁGIL PARA IMPLEMENTAÇÃO DE AMBIENTES DE NEGÓCIOS BASEADO EM SERVIDORES OLAP.

MASTER IN PROJECT MANAGEMENT

Introdução à Banco de Dados. Definição

Feature-Driven Development

11 de maio de Análise do uso dos Resultados _ Proposta Técnica

ADMINISTRAÇÃO DOS RECURSOS DE DADOS

ADMINISTRAÇÃO I. Família Pai, mãe, filhos. Criar condições para a perpetuação da espécie

ENGENHARIA DE SOFTWARE I

Gerenciamento de projetos.

GESTÃO DE PROJETOS PARA A INOVAÇÃO

Pesquisa realizada com os participantes do 12º Seminário Nacional de Gestão de Projetos. Apresentação

GESTÃO DAS INFORMAÇÕES DAS ORGANIZAÇÕES MÓDULO 11

Mapas de Rotas Tecnológicas Roadmaps Conceitos, Tipos e Etapas de Elaboração. LELIO FELLOWS FILHO 05 de julho de 2007

UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado)

Chapter 3. Análise de Negócios e Visualização de Dados

Banco de Dados. Aula 1 - Prof. Bruno Moreno 16/08/2011

Como conduzir com sucesso um projeto de melhoria da qualidade

FLUXO DE CAIXA: Módulo BI (Business Intelligence)

Critérios para certificação de Sites SciELO: critérios, política e procedimentos para a classificação e certificação dos sites da Rede SciELO

GUIA DE CURSO. Tecnologia em Sistemas de Informação. Tecnologia em Desenvolvimento Web. Tecnologia em Análise e Desenvolvimento de Sistemas

Transcrição:

ANDRÉ LUÍS ANDRADE MENOLLI DEFINIÇÃO DE UMA ARQUITETURA DE DATA WAREHOUSING PARA GESTÃO EM CIÊNCIA E TECNOLOGIA NO BRASIL MARINGÁ 2004

ANDRÉ LUÍS ANDRADE MENOLLI DEFINIÇÃO DE UMA ARQUITETURA DE DATA WAREHOUSING PARA GESTÃO EM CIÊNCIA E TECNOLOGIA NO BRASIL Dissertação apresentada ao Programa de Pós-Graduação em Ciência da Computação da Universidade Estadual de Maringá, como requisito parcial para obtenção do grau de Mestre em Ciência da Computação. Orientadora: Profª. Drª. Maria Madalena Dias MARINGÁ 2004

ANDRÉ LUÍS ANDRADE MENOLLI DEFINIÇÃO DE UMA ARQUITETURA DE DATA WAREHOUSING PARA GESTÃO EM CIÊNCIA E TECNOLOGIA NO BRASIL Dissertação apresentada ao Programa de Pós-Graduação em Ciência da Computação da Universidade Estadual de Maringá, como requisito parcial para obtenção do grau de Mestre em Ciência da Computação. Aprovado em 25/06/2004. BANCA EXAMINADORA Profª. Drª. Maria Madalena Dias Universidade Estadual de Maringá UEM Profª. Drª. Itana Maria de Souza Gimenes Universidade Estadual de Maringá UEM Prof. Dr. Roberto Carlos dos Santos Pacheco Universidade Federal de Santa Catarina UFSC

AGRADECIMENTOS Agradeço primeiramente a Deus, que sempre me deu forças e iluminou o meu caminho. Por ter me acompanhado, por ter me dado a vida, saúde, bons amigos e uma ótima família. A minha orientadora, professora Maria Madalena Dias ao professor Wesley Romão e a professora Itana Gimenes, pessoas formidáveis que contribuíram muito para o desenvolvimento do trabalho e para a minha formação como pessoa e pesquisador. Aos grandes amigos do laboratório, que acompanharam e contribuíram para o meu trabalho, em especial ao meu grande amigo Ricardo G. Coelho. Aos meus pais que sempre deram grande apoio, e a meus irmãos que sempre foram grandes amigos, sendo todos eles fundamentais para o meu triunfo. Ao Conselho Nacional de Desenvolvimento Cientifico e Tecnológico - CNPq, pelo ininterrupto apoio financeiro. A todos que direta ou indiretamente contribuíram para a realização deste trabalho.

RESUMO A tecnologia de data warehouse (DW) vem sendo amplamente utilizada em empresas com o objetivo de oferecer organização, gerenciamento e integração de bancos de dados. No processo de descoberta de conhecimento em banco de dados, a primeira etapa é a preparação de dados, em que os dados devem ser organizados e armazenados no data warehouse. A construção de um data warehouse é uma tarefa complexa e trabalhosa por exigir um profundo conhecimento das tecnologias envolvidas, tais como banco de dados e integração de dados, sobre o negócio da empresa e, também, sobre o conteúdo das fontes de dados de origem. A escolha de uma arquitetura de data warehousing é uma das primeiras decisões a serem tomadas na construção de um data warehouse. Atualmente, encontra-se em fase de desenvolvimento no Departamento de Informática da Universidade Estadual de Maringá o projeto Intersul, financiado pelo CNPq e Fundação Araucária, cujo objetivo é desenvolver um sistema informatizado de gestão em Ciência e Tecnologia. Um dos objetivos específicos deste sistema é desenvolver técnicas de extração de conhecimentos aplicáveis à Ciência e Tecnologia. A melhor maneira de se extrair conhecimento é a partir de uma base de dados já preparada, tal como um DW. Neste trabalho é apresentada uma arquitetura de data warehousing em camadas proposta para gestão em Ciência e Tecnologia e é descrito como esta arquitetura é aplicada na construção de um data warehouse para o sistema Intersul que integre as bases Institucionais do CNPq e CAPES. Palavras Chaves: Data Warehouse, Ciência e Tecnologia, Integração de Dados.

ABSTRACT The data warehouse (DW) technology has been widely used in companies with the aim of offering organization, management and database integration. In the data knowledge discovering process, the first step is the data preparation, where the data must be organized and stored in the data warehouse. The construction of a data warehouse is a complex and laborious task because it demands a high knowledge of the involved company business, and also of the contents of data sources and of the involved technologies, such as database and data integration. The choice of a data warehousing architecture is one of the first decisions to be taken in the data warehouse construction. Currently, the Intersul project is in the development phase in the Department of Computer Science of the State University of Maringá, funded by CNPq and Fundação Araucária. The objective of this project is to develop a management system of Science and Technology. One of the specific objectives of this system is to develop knowledge extration techniques applicable to Science and Technology. The best way to extract knowledge, is from an already prepared database, such as a DW. This work presents a data warehousing layer architecture proposal for management in Science and Technology. This architecture is applied in the construction of a data warehouse for the Intersul system that integrates the Institucional bases of CNPq and CAPES. Keywords: Data Warehouse, Science and Technology, Data Integration

LISTA DE ILUSTRAÇÕES Gráfico 1 PIB gasto em Pesquisa e Desenvolvimento financiada por Empresa...18 Gráfico 2 Parcela de Pesquisadores nas Empresas...18 Quadro 1 Distribuição dos Professores na Rede de Ensino...19 Figura 1 Orientação por Assunto...29 Figura 2 Integração de Dados...30 Figura 3 Data Warehouse não-volátil...32 Figura 4 Modelo Estrela...36 Figura 5 Drill Down e Roll Up...38 Figura 6 O balanceamento no gerenciamento da questão da granularidade...39 Figura 7 Data Marts integrados...40 Figura 8 Arquitetura multicamadas para DW...42 Figura 9 Arquitetura Global...43 Figura 10 Fases do Desenvolvimento de Data Marts Incrementais...44 Figura 11 Processo de Desenvolvimento da Pesquisa...52 Figura 12 Arquitetura de DW Modular...59 Figura 13 Arquitetura Proposta por Windom...60 Figura 14 Arquitetura Proposta...61 Figura 15 Módulo de Migração da Camada ETL...64 Figura 16 Matriz de Barramento...68 Figura 17 A Arquitetura do Sistema Intersul...74 Figura 18 A Arquitetura Geral do Sistema...76 Figura 19 Matriz de Barramento do DW...78 Figura 20 Esquema de Criação do Modelo em Oracle...79

Figura 21 Tela do Sistema de Migração de Dados... 80 Figura 22 Modelo Parcial e Simplificado da Área de Estágio...81 Figura 23 Modelo Parcial e Simplificado do Modelo de Dados do DW proposto...86 Figura 24 Esquema de Consulta no DW construído...88 Gráfico 3 Número de Artigos Publicados por Ano...92 Gráfico 4 Graduados no Estado do Paraná...93 Gráfico 5 Média de Tempo de Defesa de Mestrado por Regime Letivo...93 Gráfico 6 Número de Publicações de Livros ou Capítulos de Livros...95 Figura 25 Tela com store procedures da camada ETL... 107 Figura 26 Modelo de Dados da Área de Estágio... 108 Figura 27 Modelo de Dados do Data Mart de Publicação de Artigos... 109 Figura 28 Modelo de Dados do Data Mart de Publicação de Livros... 110 Figura 29 Modelo de Dados do Data Mart de Publicação de Teses... 111 Figura 30 Modelo de Dados do Data Mart de Publicação em Geral... 112

LISTA DE TABELAS Tabela 1 - Vantagens e Desvantagens dos Data Marts incrementais... 45 Tabela 2 - Resumo dos Métodos... 85

LISTA DE SIGLAS C&T CAPES CNPq DM DW DTD ETL EMPRAPA FAP FINEP IBGE MER ODS OLAP OLTP P&D PIB SGBD SQL UEM UML XML Ciência e Tecnologia Coordenação de Aperfeiçoamento de Pessoal de Nível Superior Conselho Nacional de Desenvolvimento Cientifico e Tecnológico Data Mart Data Warehouse Document Type Description Extração, Transformação e Carga Empresa Brasileira de Pesquisa Agropecuária Fundação de Amparo à Pesquisa Financiadora de Estudos e Projetos Instituto Brasileiro de Geografia e Estatísticas Modelo de Entidade/Relacionamento Operational Data Store On-Line Analytic Processing On-Line Transaction Processing Pesquisa e Desenvolvimento Produto interno Bruto Sistema Gerenciador de Banco de Dados Struct Query Language Universidade Estadual de Maringá Unified Modeling Language Extensible Markup Language

SUMÁRIO RESUMO ABSTRACT 1 INTRODUÇÃO... 12 1.1 OBJETIVO...12 1.2 JUSTIFICATIVA...13 1.3 ORGANIZAÇÃO DO TRABALHO...14 2 CIÊNCIA E TECNOLOGIA NO BRASIL... 15 2.1 INTRODUÇÃO...15 2.2 O PERFIL DE CIÊNCIA E TECNOLOGIA NO BRASIL...16 2.3 PLANEJAMENTO EM C&T...20 2.4 INDICADORES E AVALIAÇÃO EM C&T...21 2.5 BASES DE CIÊNCIA E TECNOLOGIA NO BRASIL...24 2.5.1 Plataforma Lattes...24 2.5.2 Diretório de Grupo de Pesquisa no Brasil...25 2.5.3 Plataforma Coleta Capes...25 2.6 CONSIDERAÇÕES FINAIS...26 3 DATA WAREHOUSING... 27 3.1 INTRODUÇÃO...27 3.2 AMBIENTE DE DATA WAREHOUSE...27 3.2.1 Conceitos de DW...27 3.2.2 Características de DW...28 3.2.3 Modelagem de Dados...32 3.2.4 Granularidade...38 3.2.5 Data Mart...40 3.2.6 Arquitetura de Data Warehouse...41 3.2.7 Tipos de Implementações...45 3.2.8 Metadados...46 3.2.9 Povoando o Data Warehouse...48 3.3 CONSIDERAÇÕES FINAIS...50 4 METODOLOGIA DE DESENVOLVIMENTO DA PESQUISA... 51 4.1 INTRODUÇÃO...51 4.2 MODELO DA PESQUISA...51 4.3 PROCESSO DE DESENVOLVIMENTO DA PESQUISA...52 4.3.1 Escolha do Tema...52 4.3.2 Revisão da Literatura...53 4.3.3 Estudo Sobre as Bases de Dados Envolvidas...53 4.3.4 Definição da Arquitetura de Data Warehousing para Gestão em C&T...53 4.3.5 Construção do Data Warehousing Utilizando a Arquitetura Proposta...54 5 A ARQUITETURA PROPOSTA... 55 5.1 INTRODUÇÃO...55 5.2 DIFICULDADES E DESAFIOS NA DEFINIÇÃO DE UMA ARQUITETURA PARA DATA WAREHOUSE...55 5.3 ARQUITETURA PROPOSTA...60 5.3.1 Camada Fonte de Dados...63 5.3.2 Camada ETL...63 5.3.3 Camada Área de Estágio...65 5.3.4 Camada Data Warehouse...67 5.3.5 Camada Área de Análise...69

5.3.6 Metadados...71 5.4 CONSIDERAÇÕES FINAIS...72 6 CONSTRUÇÃO DO DW PARA GESTÃO EM C&T... 74 6.1 INTRODUÇÃO...74 6.2 ABORDAGEM DO PROBLEMA...75 6.3.1 Definição das Fontes de Dados...76 6.3.2 Construção do Sistema...77 6.3.3 Implementação dos Módulos da Camada ETL...78 6.3.4 Modelagem da Área de Estágio...81 6.3.5 Definição da Camada DW...82 6.3.6 Desenvolvimento da Camada Análise...87 6.3.7 Definição do Metadados...88 6.4 Considerações Finais...89 7 ESTUDOS DE CASO... 91 7.1 INTRODUÇÃO...91 7.2 ESTUDOS DE CASO...91 7.2.1 Estudo Sobre a Propriedade Intelectual...91 7.2.2 Titulação...92 7.2.3 Tempo de Defesa nos Programas de Mestrado...93 7.2.4 Número de Publicações de Livros...94 7.3 CONSIDERAÇÕES FINAIS...95 8 CONCLUSÃO E TRABALHOS FUTUROS... 97 REFERÊNCIAS BIBLIOGRÁFICAS... 101 APÊNDICE A PROCEDIMENTOS DA CAMADA ETL... 107 APÊNDICE B MODELOS DE DADOS... 108

12 1 INTRODUÇÃO Muitas empresas de diferentes ramos de atividade e organizações governamentais possuem dados em diversas fontes de dados que contêm informações importantes para o suporte à tomada de decisões. Para que essas decisões possam ser tomadas são necessárias a compreensão e a preparação desses dados, podendo assim os mesmos serem utilizados adequadamente. Com a construção de um DW (Data Warehouse) é possível a integração de diversas fontes de dados, facilitando a tomada de decisões dentro de uma empresa, através da extração de um grande número de informações. Um data warehousing mune os usuários de ferramentas de apoio à tomada de decisões através da integração dos dados de toda a empresa em um repositório de dados. A partir desse repositório, os usuários finais podem extrair relatórios e realizar análises diretas. O resultado da utilização de um DW para o processamento de informações é um ganho direto de produtividade e tempo. Os dados podem ser facilmente acessados e analisados sem o gasto de tempo envolvido na manipulação e no processamento. As decisões podem ser tomadas rapidamente e com maior segurança, pois os dados estão disponíveis no momento exato que se é necessário e com a consistência necessária. Não só empresas, mas qualquer segmento de mercado em que se queira fazer a integração de bases de dados diversas, pode construir um DW, tornando possível a utilização de uma base de dados integrada na tomada de decisões. A construção de um DW é uma tarefa complexa que exige um profundo conhecimento de várias tecnologias e dos sistemas envolvidos, sendo em geral demorada e custosa. A integração de dados também é um grande problema, considerando que, em geral, o DW tem bases de dados de origem em formatos distintos, o que dificulta esta tarefa. 1.1 OBJETIVO Os objetivos principais deste trabalho são a definição de uma arquitetura de data warehousing e a construção de um data warehouse para o sistema Intersul 1 que integre as bases 1 Sistema Inteligente de Apoio à Rede Sul de Pesquisa e Pós-Graduação: http//www.uem.din.uem.br/~intersul

13 Institucionais do CNPq e CAPES com dados regionais. A construção do DW é feita a partir de sistemas transacionais e fontes de dados externas, tendo diferentes tipos de bases de dados, assim como distintos formatos de dados. O DW dará suporte a análise de dados sobre C&T (Ciência e Tecnologia) de pesquisas e pesquisadores regionais. Os objetivos específicos desse trabalho são: apresentar os elementos teóricos relacionados à construção de um data warehousing; discutir o modelo de arquitetura proposto, apresentando de forma detalhada cada uma das camadas da arquitetura; apresentar e comparar tipos de modelagens de dados utilizadas em desenvolvimento de DW; definir um modelo de dados do DW baseado na modelagem dimensional estrela e conjunto com as outras modelagens estudadas; construir um DW para gestão em C&T; apresentar o processo de construção do DW e as dificuldades encontradas neste processo. 1.2 JUSTIFICATIVA A arquitetura utilizada neste trabalho é uma arquitetura em camadas baseada na implementação BUS, que foi definida por Kimball et al. (1998) em conjunto com a metodologia de DM (Data Marts) incrementais. A utilização dessa metodologia permite apresentar resultados mais rápidos, enquanto a construção independente das camadas possibilita a inclusão de novas fontes de dados e a integração de fontes de diferentes formatos. À medida que os sistemas de informação executiva tornam-se mais abrangentes, envolvendo a empresa como um todo, o DW passa a ter um papel de extrema importância por possibilitar análise estratégica, que facilita a tomada de decisões. Na área de C&T, o Brasil conta com algumas bases de dados bastante confiáveis que são de extrema importância para avaliar o sistema de C&T no Brasil. O projeto Intersul, desenvolvido por um grupo de pesquisadores da UEM e UFSC, utilizará essas bases de C&T

com dados regionais e tem como um dos principais objetivos desenvolver técnicas de extração de conhecimentos e tomada de decisão aplicáveis a C&T. 14 Com isso, a construção de um DW para o projeto Intersul é de suma importância, considerando que através do DW é possível a utilização de ferramentas OLAP (On-Line Analytic Processing) e de técnicas de mineração de dados para a extração de dados que permitam avaliar o perfil de pesquisadores e pesquisas brasileiros, auxiliando assim na definição de uso dos recursos destinados à C&T. 1.3 ORGANIZAÇÃO DO TRABALHO Além deste capítulo, este trabalho está dividido em 7 capítulos. No capítulo 2 é apresentada uma pequena introdução sobre ciência e tecnologia no Brasil, demonstrando sua evolução e as principais bases de dados de C&T existentes. No terceiro capítulo é apresentada a fundamentação teórica dos conceitos envolvidos no ambiente de DW. O objetivo é descrever sucintamente os principais conceitos necessários para a implementação de um DW. No quarto capítulo é descrita a metodologia de pesquisa utilizada nesse trabalho. No quinto capítulo é detalhada a arquitetura proposta, suas camadas e relação com os conceitos abordados no segundo e terceiro capítulos. No sexto capítulo, é demonstrado como o DW para gestão em C&T foi construído utilizando a arquitetura descrita no capítulo cinco. No sétimo capítulo são discutidos alguns resultados obtidos através de consultas ao DW construído e no oitavo capítulo são apresentadas a conclusão e sugestões para trabalhos futuros.

15 2 CIÊNCIA E TECNOLOGIA NO BRASIL 2.1 INTRODUÇÃO No século passado, o aumento tecnológico foi de grandes proporções, tendo um crescimento superior a qualquer século antecessor. A partir desse crescimento, novos desafios foram criados, surgindo então novas questões em aberto que necessitam que novas teorias sejam formuladas ou explicadas. Com isso, a ciência teve um aumento significativo na qualidade de suas pesquisas, tornando os pesquisadores profissionais cada vez mais capacitados que trabalham em beneficio da humanidade. No Brasil ou em qualquer país que esteja em desenvolvimento, um ponto-chave é fazer com que escassos recursos destinados a C&T sejam utilizados minimizando os desperdícios, fazendo com que os gastos sejam utilizados seguindo um planejamento prévio. Uma alternativa para se conseguir isto, de acordo com Romão (2002), é aumentar os investimentos em P&D (Pesquisa e Desenvolvimento), fazendo com que, através desta área consiga-se conhecer em detalhes a realidade da infra-estrutura e do potencial de pesquisa no país, assim como o perfil de pesquisa dos pesquisadores. Conseguir mais e melhores resultados com menos recursos é o principal desafio para nações em desenvolvimento como o Brasil. Mesmo o Brasil sendo um país com grandes dificuldades, o sistema de C&T tem sofrido avanços significativos. Nesta área pode-se realçar bases de dados importantes que são consolidadas e confiáveis, através das quais é possível traçar um panorama de C&T sobre qualquer região do país. Destacam-se entre estas bases o Diretório dos Grupos de Pesquisa no Brasil (CNPq, 2003a) e o Sistema de Currículo Lattes (CNPq, 2003b), desenvolvidos no âmbito do Conselho Nacional de Desenvolvimento (CNPq), e o Sistema Coleta da CAPES sobre a pós graduação brasileira (CAPES, 2003). Dentro deste contexto, encontra-se o projeto Intersul, que tem como objetivo desenvolver um sistema informatizado de gestão de C&T. Este projeto terá como público alvo, profissionais vinculados às FAPs (Fundação de Amparo à Pesquisa) e profissionais vinculados às instituições executoras de P&D, tais como: universidades (pró-reitores de pesquisa e pós-

graduação, coordenadores de cursos de pós-graduação), empresas estatais e privadas que desenvolvam pesquisa. 16 O sistema Intersul utilizará dados de C&T da região Sul do Brasil e deverá ser capaz de responder perguntas como: Que tipo de conhecimento é viável e relevante para planejar fomento a C&T? Quais seriam os melhores meios de se obter esses conhecimentos? O projeto Intersul tem como um dos principais objetivo desenvolver técnicas de extração de conhecimentos e tomada de decisão aplicáveis à C&T para contribuir para o processo de avaliação e acompanhamento das agências e tornar disponível, rapidamente, informações sobre o potencial de C&T. Neste capítulo é feita uma breve revisão bibliográfica sobre C&T no Brasil como subsídio à criação de um DW para gestão em C&T. Inicialmente é apresentado um resumo da evolução do sistema de C&T brasileiro. Na seqüência é feita uma breve análise sobre a importância de se realizar planejamento neste contexto e os indicadores de C&T brasileiro. E por fim, são apresentadas as principais bases de ciência e tecnologia no Brasil. 2.2 O PERFIL DE CIÊNCIA E TECNOLOGIA NO BRASIL No Brasil, até a década de 50 não existia um sistema nacional de C&T, o que existia eram trabalhos e iniciativas individuais. O CNPq foi criado em 1951, era o então Conselho Nacional de Pesquisa que, em 1978, foi transformado em Conselho Nacional de Desenvolvimento Cientifico e Tecnológico. A criação da CAPES (Coordenação de Aperfeiçoamento de Pessoal de Nível Superior) também ocorreu em 1951. Seu objetivo era a distribuição de bolsas de estudos no Brasil e no exterior, para assegurar a existência de pessoal especializado para atender às necessidades dos empreendimentos públicos do país, que tinham como objetivo o desenvolvimento econômico e social do Brasil.

17 Foram sendo criadas então novas instituições, organizando a base institucional para a capacitação de recursos humanos, através da implantação da pós-graduação, e para o desenvolvimento de C&T. Um estudo feito por Guimarães (1995) aponta que a Pesquisa Científica e Tecnológica no Brasil é concentrada geograficamente, sendo que 78% dos grupos de pesquisa localizam-se em São Paulo, Rio de Janeiro, Rio Grande do Sul e Minas Gerais. Este estudo revela também que a pesquisa é praticamente realizada por grupos recentes, com cerca de oito anos, e por pesquisadores com titulação bastante diversificada, predominando doutorado e mestrado. De modo geral, é pouco produtiva e caracterizada por Pesquisa Básica. A área de Ciências Humanas apresenta o maior número de grupos de pesquisa. A Pesquisa Básica predomina nas áreas de Ciências Exatas e da Terra e Ciências Biológicas, sendo estas áreas mais consolidadas e produtivas do que aquelas nas quais predomina a pesquisa aplicada. Nos países desenvolvidos, onde o resultado da inovação se faz presente em termos de patentes produzidas e contribuições ao crescimento econômico, a atividade de P&D é predominantemente realizada nas empresas. No Brasil, do total de cientistas e engenheiros atuantes em P&D, em todas as áreas atualmente em torno de 83 mil profissionais, cerca de 68% atuam nas universidades e apenas em torno de 11% exercem suas atividades em centros de pesquisas de empresas privadas (MCT, 2000), enquanto que nos países industrializados pode chegar a 50% (KRIEGER & GALEMBECK, 1996) e mesmo mais de 70% no caso do Japão (ARRUDA, 1994). No Brasil as empresas privadas investem pouco em pesquisa e desenvolvimento, como pode ser visto nos Gráficos 1 e 2.

18 Parcela do PIB gasta em Pesquisa e Desenvolvimento financiada por empresas Em % 1,18 1,62 1,73 1,9 0,78 0,4 0,1 México Brasil Canadá França Alemanha Coréia do Sul EUA Gráfico 1 PIB gasto em Pesquisa e Desenvolvimento financiada por Empresas (Fonte: LEI..., 2004, p. A9) Parcela de pesquisadores na empresas em relação ao total Em% 54,5 47 58,8 65,3 82,5 10,3 12,7 México Brasil Canadá França Alemanha Coréia do Sul EUA Gráfico 2 Parcela de Pesquisadores nas Empresas (Fonte: LEI..., 2004, p. A9) Estudos recentes mostram que no Brasil o pessoal envolvido com C&T está mais concentrado em instituições públicas. Entretanto, nos últimos anos a quantidade de professores envolvidos em pesquisa nas instituições particulares vem tendo um crescimento surpreendente. Apesar da maioria dos pesquisadores ainda estar concentrada nas instituições públicas, é apontada uma tendência de crescimento da pesquisa nas universidades particulares. O Quadro 1 mostra esses números.

19 Professores Universitários em Tempo Integral...73.675 Federais...38.594 Estaduais...20.294 Municipais...758 Privadas...14.029 Quadro 1 Distribuição dos Professores na Rede de Ensino Fonte: (Romão, 2002) O sistema de pós-graduação, que está diretamente ligado à atividade de pesquisa e à produção científica imediata, tem evoluído muito, sendo a cada ano criados novos cursos de Doutorado e Mestrado, o que aumenta a concorrência na distribuição de recursos para pesquisa. Para prosseguir na sua evolução, Krieger (1999 apud Romão et al, p. 6, 2000) destaca os seguintes desafios para a C&T no Brasil: a) promover a educação generalizada; b) aumentar a quantidade e qualidade do pessoal envolvido em C&T; c) aumentar o intercâmbio entre a universidade e o setor produtivo; d) aumentar os investimentos em C&T com relação ao PIB (Produto interno Bruto); e) aumentar a contribuição da indústria nos investimentos de C&T; f) promover projetos estratégicos com impacto socioeconômico; g) obter o desenvolvimento sustentado e a preservação ambiental. Outros estudos, como o realizado por Schwartzman et al. (1995), também apontam um crescimento da ciência e tecnologia no Brasil. Esse estudo concluiu que, nos últimos 25 anos, o Brasil desenvolveu significativamente sua capacidade científica e tecnológica. Revelou também que, desde a última década, este setor vem sendo afetado pela falta de recursos, pela instabilidade institucional e pela falta de definição sobre seu papel na economia, na sociedade e na educação. No Brasil, assim como em outros países em desenvolvimento, além de superar o sistema de carências que ameaça os programas de C&T, transformações deverão ocorrer a partir do uso

das novas tecnologias de informação, na qualificação dos pesquisadores e em sua motivação pelo objeto de estudo. 20 2.3 PLANEJAMENTO EM C&T Para que um país consiga um desenvolvimento próspero, é necessário o planejamento da política científica e tecnológica. Em casos de países como o Brasil, que é um país em desenvolvimento, é necessário um meio eficiente de planejamento e o estabelecimento de políticas. Um dos principais problemas encontrados pelas empresas e instituições é a instabilidade do cenário econômico, exigindo a adoção de uma administração estratégica, onde uma das principais etapas é o planejamento. Uma abordagem que leva em consideração a mudança organizacional é o planejamento estratégico. O planejamento estratégico é um processo iterativo da análise das oportunidades e ameaças e de pontos fortes e fracos visando à busca de uma equação para a definição de objetivos apropriados ao ajustamento da organização às condições ambientais de mudança. Consiste na utilização de um arcabouço de técnicas direcionadas para a elaboração de uma análise ambiental interna e externa da organização, definição da missão, formulação de objetivos estratégicos, quebra e fixação de novos paradigmas, definição do perfil de negócio e área de negócio, grupos de clientes e produtos ou serviços, formulação de políticas e diretrizes e detalhamento destas em projetos e ações estratégicas SILVEIRA (1996 apud ROMÃO, p. 19, 2002). O planejamento estratégico utiliza conceitos de outras áreas, e para adaptar esses conceitos no contexto do planejamento em C&T e viabilizar a sua aplicação, é necessário conhecer as políticas públicas e fatos relevantes a respeito de C&T, para que se consiga analisar as oportunidades e criar um plano estratégico. Para se ter um bom planejamento em C&T, é necessário que o decisor tenha informações precisas e seguras para a tomada de decisão; para isto, deve-se utilizar métodos e meios modernos para a obtenção dessas informações.

21 Em um país que investe algo em torno de 0,7% do PIB em C&T e cujos recursos provêm predominantemente dos cofres públicos, sempre sujeitos a descontinuidades, o componente planejamento é fundamental para a aplicação adequada dos recursos. Em agências de promoção de C&T, como o CNPq, CAPES, FINEP (Financiadora de Estudos e Projetos) e Fundações Estaduais, esse planejamento tem como objetivo criar ações de indução do desenvolvimento científico e tecnológico. Para isto é necessário utilizar conhecimento adequado que em boa parte está disponível na forma de indicadores (ROMÃO, 2002). 2.4 INDICADORES E AVALIAÇÃO EM C&T A avaliação de C&T é um processo vinculado ao fomento, ou seja, é necessária uma análise que produza subsídios para a tomada de decisão, determinando os níveis de distribuição de recursos. Para realizar qualquer tipo de análise de informações, é necessário utilizar informações íntegras e que representem de forma concisa a realidade que se pretende analisar. O uso de indicadores pode viabilizar isto. Na área de C&T utilizam-se alguns indicadores específicos, criados para permitir estudos sobre a atividade científica e tecnológica e auxiliar em tarefas tais como: avaliação da pesquisa, planejamento de política científica, etc (ROMÃO, 2002). As agências em geral, além das metodologias tradicionais, utilizam também metodologias próprias. Um dos benefícios que os indicadores de C&T podem trazer é a melhora nos processos de distribuição de recursos para pesquisa entre os vários objetivos socioeconômicos e as disciplinas científicas. Existem diversas maneiras de se medir a atividade científica através de indicadores. Ela pode ser medida de forma absoluta, relativa, ponderada, etc. De um modo geral, o processo de avaliação pode ser dividido em dois grupos: qualitativo e quantitativo ou pela combinação dos dois métodos. Os indicadores viabilizam a condução de estudos em vários níveis para avaliar, por um lado, indivíduos, grupos, instituições e países e, por outro, periódicos, áreas do conhecimento e setores de atividade (SPINAK, 1998).

22 Para analisar C&T de um segmento ou região, é necessário conhecer alguns conceitos quantitativos criados no contexto da atividade científica, como a cientometria e a bibliometria, além da informetria (ROMÃO 2002). Macias-Chapula (1998) enfatiza que em tudo o que se refere à ciência, os indicadores bibliométricos e cientométricos tornaram-se essenciais. Estes conceitos são apresentados em Taque-Sutcliffe (apud Macias-Chapula, 1998), conforme segue: Bibliometria: é o estudo dos aspectos quantitativos da produção, disseminação e uso da informação registrada. Seus resultados são usados para elaborar previsões e apoiar a tomada de decisões. Cientometria: é o estudo dos aspectos quantitativos da ciência enquanto uma disciplina ou atividade econômica. É aplicada no desenvolvimento de políticas científicas. Sobrepõe-se a bibliometria. Informetria: é o estudo dos aspectos quantitativos da informação em qualquer formato, não apenas dos cientistas. Através destes conceitos é possível abstrair a realidade e estabelecer parâmetros numéricos capazes de resumir informações generalizadas sobre investimentos, produção e tendências no campo da ciência e da tecnologia. Estes parâmetros são conhecidos como indicadores de C&T. Os indicadores mais utilizados na medição da ciência são os bibliométricos, que são métodos quantitativos derivados das publicações científicas. Segundo Katz (2000 apud Niederauer, p. 16, 2002) a avaliação da atividade científica inclui as seguintes medidas bibliométricas: 1. Tamanho: número de artigos publicados; 2. Reconhecimento: número de citações que um artigo recebe; 3. Impacto: relação citação/artigo; 4. Colaboração: número de co-autores nos artigos. O número de artigos, de citações e de co-autorias forma o tripé de indicadores bibliométricos que compõem a rede de monitoração da produtividade científica, havendo uma série de refinamentos e métricas que se constroem a partir deles (CASTRO, 1986; KOSTOFF, 1997). A explicação para derivar indicadores a partir das publicações científicas é simples: publicar os resultados de uma pesquisa é um compromisso dos cientistas. Essa é a maneira pela qual