Uma Sistemática Baseada em Data Warehousing para Apoio ao Governo Eletrônico



Documentos relacionados
perspectivas e abordagens típicas de campos de investigação (Senra & Camargo, 2010).

Marcelo Novaes Coutinho. Um Processo de Gerência de Estratégia de Rastreabilidade: Um Caso em Ambiente Oracle. Dissertação de Mestrado

Ricardo Gomes Clemente. Uma arquitetura para processamento de eventos de log em tempo real. Dissertação de Mestrado

Análise de Persistência de Participantes em Planos de Previdência

Mensuração do Desempenho do Gerenciamento de Portfólio de Projetos: Proposta de Modelo Conceitual

Rafael Jessen Werneck de Almeida Martins. Recomendação de pessoas em redes sociais com base em conexões entre usuários

Um Processo Controlável de Desenvolvimento de Software Focado na Gestão da Qualidade em Pequenos Projetos

Gestão Hospitalar O caso de hospitais privados do Rio de Janeiro

Uma Análise de Práticas na Aplicação de SCRUM em Projetos de Grande Porte

Heloisa Iara Colchete Provenzano. Personalidade e Risco: Um estudo em Finanças Comportamentais. Dissertação de Mestrado

Um Modelo de Componentes de Software com Suporte a Múltiplas Versões

Luiz Fernando Fernandes de Albuquerque. Avaliação de algoritmos online para seleção de links patrocinados. Dissertação de Mestrado

Credit Default Swap: Exemplos de Apreçamento

Uma arquitetura baseada em agentes de software para a automação de processos de gerênciadefalhasemredesde telecomunicações

Máquinas de Estados Hierárquicas em Jogos Eletrônicos

Livia Pires Chaves. Gestão de Estoque na Indústria de Manutenção de Motores Aeronáuticos: Estudo de Caso. Dissertação de Mestrado

Comportamento do Consumidor em Relação à Educação a Distância: Abordagem Funcional das Atitudes Aplicada ao Marketing

Um estudo sobre a geração e narração automática de estórias. Dissertação apresentada como requisito parcial para obtenção

" Controle de Estoque com a Utilização do Sistema Kanban"

Geração automática de suíte de teste para GUI a partir de Rede de Petri

Análise Temporal dos Preços da Commodity Cobre Usando o Modelo Box & Jenkins

Projeto de Data Warehousing sobre Informações em Saúde para dar Suporte a Análise de Faturamento Hospitalar

Sílvio Glicério Mendonça. O impacto dos Sistemas Integrados de Gestão (ERP) nas instituições de ensino. Dissertação de Mestrado (Opção profissional)

Proposta para otimização de processos licitatórios na Companhia Brasileira de Trens Urbanos - CBTU

Processo de Internacionalização na Indústria Calçadista Brasileira: Estudo de Caso da Calçados Azaléia S.A.

Distribuição Eletrônica na Hotelaria: Desenvolvimento de Serviços para a Internet

Palavras-chave: On-line Analytical Processing, Data Warehouse, Web mining.

Antônio Carlos Theóphilo Costa Júnior. Soluções para a Travessia de Firewalls/NAT usando CORBA DISSERTAÇÃO DE MESTRADO

Terceira Idade: Perfil de uso do cartão de crédito

Análise da Eficiência de Empresas de Comércio Eletrônico usando Técnicas da Análise Envoltória de Dados

Empresas com Fundos de Private Equity Possuem Maior Valor e Remuneram Melhor Seus Executivos? Evidencia do Mercado Brasileiro

Análise de Sistemas de Planejamento Avançado (APS): conceituação e avaliação

Dimensionando uma Frota Heterogênea de Veículos Ótima em Tamanho e Composição

5 A Usabilidade das Estatísticas Públicas

Controle de estoque de peças de reposição: revisão da literatura e um estudo de caso

Reflexão e fundamento: a validade universal do juízo de gosto na estética de Kant

Elbio Renato Torres Abib. Escalonamento de Tarefas Divisíveis em Redes Estrela MESTRADO. Informática DEPARTAMENTO DE INFORMÁTICA

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

Dimensionamento de Estoque de Segurança de Derivados de Petróleo: Metodologia e um Estudo de Caso

A Retenção de Clientes no Setor de Ensino: Estudo de Caso em um Curso de Inglês

Leonardo Pereira Rodrigues dos Santos

Wilson Lins Morgado. Método de classificação de risco aplicado ao mercado de seguros de automóveis. Dissertação de Mestrado

José Benedito Alves Junior

Saulo de Souza Ladeira. Técnica, território e ensino a distância: Articulações histórico-teóricas. Dissertação de Mestrado

Logística Lean: Conceituação e aplicação em uma empresa de cosmético.

Aplicação de Data Warehousing no Cadastro de Ficha Limpa do TSE

Análise da Governança Corporativa como Determinante das Despesas de Auditoria e Consultoria no Brasil

Planejamento do sequenciamento de caminhões em um ambiente de produção sob encomenda

Estratégias de TI para a integração eletrônica da informação - um estudo sobre o estado da arte e da prática

PROPOSTA DE UMA ARQUITETURA PARA CONSTRUÇÃO DE UM DATA WAREHOUSE PARA GESTÃO DA SAÚDE PÚBLICA DE UM MUNICÍPIO DO VALE DO ITAJAÍ

CINEMA BRASILEIRO E SUAS POSSIBILIDADES COMO FORMA DE PENSAMENTO ENSAÍSTICO Um percurso através de São-Bernardo, Vidas secas e Insônia

DISSERTAÇÃO DE MESTRADO

Modelo de Controle de Acesso no Projeto de Aplicações na Web Semântica

Vinicius Ribeiro Pereira. Métodos Alternativos no Critério Brasil para Construção de Indicadores Sócio-Econômico: Teoria da Resposta ao Item

Os destinos da tristeza na contemporaneidade

Um método para o planejamento operacional da distribuição: aplicação para casos com abastecimento de granéis líquidos

A contribuição do coaching executivo para o aprendizado individual: a percepção dos executivos

Wilson Reis de Souza Neto. O Teorema de Paris-Harrington. Dissertação de Mestrado

O celular como instrumento de pagamento e controle financeiro pelas classes de baixa renda na cidade do Rio de Janeiro

A Democracia no Pragmatismo de John Dewey

Relato de experiência da implantação de boas práticas de Engenharia de Software em um ambiente heterogêneo

DISSERTAÇÃO DE MESTRADO

Uma Ferramenta Web para BI focada no Gestor de Informação

Impasses e Conflitos na Relação entre TI e Business:

Danielle de Rezende Jorge. Frações contínuas: propriedades ergódicas e de. Dissertação de Mestrado

Identificação de Modelos GARCH Usando Inteligência Computacional

2 Fundamentação Teórica

As práticas de marketing de relacionamento das empresas brasileiras: panorama e desempenho

Adriano Maranhão BUSINESS INTELLIGENCE (BI),

Helena Kale Pimentel Brazão. Orkut: do Escapismo ao Real Mediado, do Usuário ao Sujeito. Dissertação de Mestrado

Aprimoramento das Aquisições na Administração Pública: um Estudo de Caso

Sistemas de Informação (SI) Orientações para as Atividades Práticas Supervisionadas 3º/ e 4º semestres de 2010

O transporte ferroviário de carga no Brasil: Estudo de caso do transporte de combustíveis na Região Sul

Francisco César Borges Blois. Estudo do suprimento de válvulas acionadas manualmente para a Petrobras. Dissertação de Mestrado

Silvano Nogueira Buback. Utilizando aprendizado de máquina para construção de uma ferramenta de apoio a moderação de comentários

DATA WAREHOUSE. Rafael Ervin Hass Raphael Laércio Zago

Uma arquitetura de software para mediação flexível de Web services

Mudança Organizacional em uma Empresa Familiar Brasileira: um estudo de caso

INGLÊS PARA A ÁREA DE TURISMO: análise de necessidades do mercado e de aprendizagem

Jomar Rolland Braga Neto. A Influência do Boca a Boca Online na Decisão de Compra do Consumidor. Dissertação de Mestrado

Terceirização da Operação Logística Estudo de caso sobre a terceirização da Logística de Distribuição de uma Indústria Farmacêutica

Projeto de Serviços: proposta de modelo teórico para sites de compras coletivas

Maria Alice de Faria Nogueira. Consumo e publicidade: Apropriação localizada e mensagem global. Dissertação de Mestrado

Eduarda Machado Lowndes Carpenter. Um Modelo de Análise de Risco de Crédito de Clientes em Relações B2B. Dissertação de Mestrado

Adoção do Serviço de Mensagens de Texto (SMS) pelos usuários de telefonia móvel: Uma proposta baseada no Modelo de Aceitação da Tecnologia

CONSUMO E TRANSFORMAÇÃO DA IMAGEM DO SURFE

Nathalia Tavares Barbosa. Gestão da Mudança Organizacional: O Caso da Empresa GAMA. Dissertação de Mestrado

O efeito da confiança na intenção de uso do mobile banking

Universidade Federal de Santa Maria Curso de Arquivologia. Disciplina de Banco de Dados Aplicados à Arquivística. Versao 1.

Clubes de futebol com boa governança possuem melhor desempenho? Evidências do mercado brasileiro

Roberta Franco Terziani. Estratégias de Entrada no Mercado Brasileiro de Telefonia Móvel Estudo de Caso da Oi. Dissertação de Mestrado

Cinthia Monteiro de Araújo. Formando sujeitos: as alianças entre o ensino de História e a Educação em Direitos Humanos. Dissertação de Mestrado

Pierre Alexandre Charles Burban. Apreçamento de opções exóticas: Uma abordagem pela simulação de Monte-Carlo. Dissertação de Mestrado

Análise do Posicionamento Estratégico na Indústria Bancária Brasileira à Luz da Tipologia de Porter

Country equity: percepções do consumidor chileno sobre o Brasil e a China e seus produtos

Microempresas no Brasil: informalidade e contratos de trabalho

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5

Fundamentos dos Sistemas de Informação Organização de Dados e Informações

Gerenciamento de Risco em Empresas Não Financeiras: Aplicações na Indústria Sucroenergética

Transcrição:

1 Flávia Andrade Rabelo Uma Sistemática Baseada em Data Warehousing para Apoio ao Governo Eletrônico Dissertação de Mestrado Dissertação apresentada como requisito parcial para obtenção do título de Mestre pelo Programa de Pós- Graduação em Informática da PUC-Rio. Orientador: Prof. Rubens Nascimento Melo Rio de Janeiro Agosto de 2010

2 Flávia Andrade Rabelo Uma Sistemática Baseada em Data Warehousing para Apoio ao Governo Eletrônico Dissertação apresentada como requisito parcial para a obtenção do grau de Mestre pelo Programa de Pós-graduação em Informática do Departamento de Informática do Centro Técnico e Científico da PUC-Rio. Aprovada pela Comissão Examinadora abaixo assinada. Prof. Rubens Nascimento Melo Orientador Departamento de Informática PUC-Rio Prof. Julio Cesar Sampaio do Prado Leite Departamento de Informática PUC-Rio Prof. Sean Wolfgand Matsui Siqueira Departamento de Informática Aplicada UNIRIO Prof. José Eugenio Leal Coordenador Setorial do Centro Técnico Científico PUC-Rio Rio de janeiro, 30 de agosto de 2010

3 Todos os direitos reservados. É proibida a reprodução total ou parcial do trabalho sem autorização da universidade, da autora e do orientador Flávia Andrade Rabelo Graduada em Tecnólogo em Processamento de Dados em 1998 pela Universidade Católica de Brasília - UCB. Sua área de interesse acadêmico é Banco de Dados Rabelo, Flávia Andrade Ficha Catalográfica Uma sistemática baseada em data warehousing para apoio ao governo eletrônico / Flávia Andrade Rabelo ; orientador: Rubens Nascimento Melo. 2010. 123 f.: il. (color.) ; 30 cm Dissertação (Mestrado) Pontifícia Universidade Católica do Rio de Janeiro, Departamento de Informática, 2010. Inclui bibliografia 1. Informática Teses. 2. Data warehousing. 3. Governo eletrônico. 4. SaaS. 5. PNAD. I. Melo, Rubens Nascimento. II. Pontifícia Universidade Católica do Rio de Janeiro. Departamento de Informática. III. Título. CDD: 004

4 André e Arthur, com muito amor

5 Agradecimentos Agradeço à todos que contribuíram direta ou indiretamente para que eu pudesse concluir essa etapa. Primeiramente, ao meu orientador professor Rubens, por sempre ter acreditado no meu potencial e ter me guiado até aqui. Muito obrigada! Aos professores Julio Cesar Sampaio do Prado Leite, Sean Wolfgand Matsui Siqueira por aceitarem participar dessa banca e contribuírem para a melhoria dessa pesquisa. Aos amigos Jairo, Elaine e Tatiana pelo auxílio, orientação e suporte. Aos meus amigos do Tribunal Regional Federal, que me incentivaram e compreenderam as minhas faltas e atrasos, em especial, ao meu querido e admirável chefe Roberto. Aos meus amigos e familiares, próximos e distantes, que sempre me deram uma palavra de carinho me ensinando a superar as dificuldades. À CAPES, pelo apoio financeiro, sem o qual este trabalho não poderia ser viabilizado. À Deus, por tudo isso.

6 Resumo Rabelo, Flávia Andrade; Melo, Rubens Nascimento. Uma Sistemática baseada em Data Warehousing para apoio ao Governo Eletrônico. Rio de Janeiro, 2010. 123 p. Dissertação de Mestrado - Departamento de Informática, Pontifícia Universidade Católica do Rio de Janeiro Com o objetivo de se adaptarem à nova forma de relacionamento entre os governos e a sociedade, os governos se deparam com a crescente necessidade de oferecer facilidade no acesso às informações públicas a um público cada vez mais diversificado. Com vistas a contribuir com esse propósito, o objetivo principal desta dissertação consiste no desenvolvimento de uma sistemática baseada em Data Warehousing para apoio ao governo eletrônico. Dessa forma busca-se oferecer um serviço de acesso analítico ás informações para a sociedade via web e com baixo custo. Como prova de conceito da sistemática proposta, são utilizados dados reais de uma estatística pública (PNAD) disponibilizada na web. A aplicação da sistemática a esses dados gera um serviço de acesso analítico às informações estatísticas na web (em forma de cubos para analise). Esta abordagem segue os moldes de SaaS (Software as a Service) ou seja o usuário final pode ter o serviço sem ter que criar e manter uma infraestrutura local para essa análise. O uso de várias tecnologias avançadas guiadas por essa sistemática, visa contribuir com as melhores práticas para o governo eletrônico, bem como a efetiva disponibilização de um protótipo para análise dos dados da PNAD em forma de serviço na web. Palavras-Chave Data Warehousing; Governo Eletrônico; SaaS; PNAD

7 Abstract Rabelo, Flávia Andrade; Melo, Rubens Nascimento (Advisor). A Systematic Based on Data Warehousing to Support the e- Government. Rio de Janeiro, 2010. 123p. MSc. Dissertation Departamento de Informática, Pontifícia Universidade Católica do Rio de Janeiro Aiming to adapt to the new way of relationship between government and society, governments are faced with the growing need to offer easy access to public information to a public that increases everyday. To contribute to this purpose, the main objective of this paper is to develop a system based on Data Warehousing to support the electronic government. Thus, the objective is to offer a service of access to the analytical information to society via Internet and low cost. As a proof of concept of the systematical proposal, it will be used real data from a statistical service (PNAD), available on the web. The systematic application of these data generates an analytical access service to information on the web (in cubes for analysis). This approach follows the SaaS pattern (Software as a Service), that is, the user may use this service without having to create and maintain local infrastructure for this analysis. The use of several advanced technologies guided by that systematic, aims to contribute to best practices for e- government as well as the effective provision of a "demo" version of a cube for PNAD data analysis as a service on the web. Keywords Data Warehousing; e-government; SaaS; PNAD

8 Sumário 1 Introdução 14 1.1. Objetivos 18 1.2. Delimitações da Pesquisa 18 1.3. Motivação 19 1.4. Contribuições Esperadas 19 1.5. Organização da Dissertação 20 2 Fundamentação Teórica 22 2.1. Governo Eletrônico 22 2.2. Transparência 24 2.3. Estatística Pública 26 2.4. OLAP 28 2.5. Data Warehousing 32 2.5.1. Modelagem Dimensional 35 3 Sistemática Proposta 40 3.1. Cenário de Aplicação 41 3.2. Formalização do Problema 42 3.2.1. Etapa 1 Modelos conceituais das estatísticas 43 3.2.2. Etapa 2 - Especificação dos requisitos OLAP 45 3.2.3. Etapa 3 Modelo lógico do Data Warehouse 47 3.2.4. Etapa 4 - Metadados 48 3.2.5. Etapa 5 A Arquitetura 49 3.2.6. Etapa 6 Projeto de ETL e Desenvolvimento 50 3.2.7. Etapa 7 Disponibilizar os dados na Web 52 4 Aplicação da Sistemática 53 4.1. Etapa 1 Modelo Conceitual da Estatística 53 4.2. Etapa 2 Especificação de Requisitos OLAP 56 4.3. Etapa 3- Construção da Modelagem Dimensional 58 4.4. Etapa 4 - Metadados 58

9 4.5. Etapa 5- Definição da Arquitetura 60 4.6. Etapa 6 - Projeto de ETL e desenvolvimento 61 4.7. Etapa 7 Acesso via Web 68 5 A Usabilidade das Estatísticas Públicas 71 5.1. Comparação do processo atual com o proposto 71 5.2. Usabilidade da Informação estatística em formato cúbico 73 5.3. Análise Exploratória da PNAD após a sistemática 74 6 Trabalhos Correlatos 80 6.1. Abordagem do governo americano 80 6.2. Abordagem do governo britânico 82 6.3. Abordagem do governo brasileiro 83 6.4. Consideraçoes finais 85 7 Conclusão e Trabalhos Futuros 87 7.1. Conclusões 87 7.2. Trabalhos futuros 89 7.2.1. Intervalo de Confiança em Pesquisas Amostrais 89 7.2.2. Tecnologia Open Source 89 7.2.3. Entrega de dados geográficos 90 8 Referências Bibliográficas 91 Anexo I 98

10 Lista de figuras Figura 1 - Websites com interatividade para acesso as informações governamentais, outubro 2009 (UN-Survey, 2010) 16 Figura 2 - Degraus da Transparência (Cappelli & Leite, 2008) 24 Figura 3 Arquitetura de DWing (Fonte: autor) 32 Figura 4 Exemplo de um esquema multidimensional 35 Figura 5 Exemplo esquema lógico dimensional estrelado 39 Figura 6 Exemplo de esquema físico dimensional estrelado 39 Figura 7 Resumo da sistemática (fonte: a autora) 43 Figura 8 Esquema dimensional conceitual de uma estatística pública 45 Figura 9 Agrupamento de variáveis 46 Figura 10 Exemplo de esquema lógico dimensional 48 Figura 11 - Arquitetura da sistemática proposta 50 Figura 12 Esquema dimensional resultante 56 Figura 13 - Definição das estruturas das tabelas dimensões 57 Figura 14 - Esquema lógico Dimensional da PNAD Básica 58 Figura 15 - Modelo Físico metadados semânticos 59 Figura 16 - Diagrama da arquitetura na aplicação da sistemática PNAD Básica 61 Figura 17 Trecho do arquivo Pes2008.txt 62 Figura 18 Modelo físico das fontes de dados importados para o ODS 64 Figura 19 - Pessoas que freqüentavam creche ou escola, segundo a rede de ensino - Brasil 2008 68 Figura 20 - População residente, por sexo, segundo os grupos de idade - Brasil 2008 68 Figura 21 - Aplicação Web open source OpenI para acesso OLAP 69 Figura 22 - Aplicação open source Palo Web Cliente para acesso OLAP 70 Figura 23 - Diagrama de atividades em cenários sem a aplicação da sistemática proposta 72 Figura 24 - Diagrama de atividades em cenários, após a aplicação da sistemática proposta 73 Figura 25 - População total do Brasil segundo faixa etária, 2007 e 2008 76 Figura 26 Faixa de Renda per capita familiar do Brasil, 2007 e 2008 77 Figura 27- Faixa de renda segundo a cor, Brasil 2007 79

11 Figura 28 - Ferramentas para acesso e manipulação de dados do site data.gov. 81 Figura 29 Abordagem do governo britânico 83 Figura 30 - Sac SP- Sistema de estatísticas das reclamações feitas a prefeitura de SP 85 Figura 31 - Sistema que busca as linhas de ônibus na cidade de São Paulo 85

12 Lista de tabelas Tabela 1 Definição de Graus (Cappelli, 2009)... 25 Tabela 2 - Formato do arquivo de metadados da PNAD... 62 Tabela 3 - Formato do arquivo de metadados após padronização... 63 Tabela 4 - Tabela pess2008 correspondente aos dados da PNAD... 64 Tabela 5 - Dicionário de variáveis correspondente aos metadados da PNAD... 64 Tabela 6 - Distribuição da população segundo faixa etária.... 76 Tabela 7 Faixa de renda per capita familiar população total... 77 Tabela 8 Faixa de renda segundo a cor, Brasil 2007... 78

13 Lista de siglas e abreviaturas BDM Banco de Dados Multidimensional BI Business Intelligence (inteligência de negócio) DDL Data Definition Language DML Data Manipulation Language DW Data Warehouse(Armazém de dados) DWing Data Warehousing (Processo de construção de DW) eping Programa de Interoperabilidade do Governo ETL Extract Transform Load (Extração Transformação Carga) FOIA Freedom of Information Act IBGE Instituto Brasileiro de Geografia e Estatísticas INEP Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira MDX MultiDimensional expression(linguagem de consulta multidimensional) OCDE Organização de Cooperação para o Desenvolvimento Econômico OLAP On-line Analytical Processing (Processamento Analítico On-Line) OLTP On Line Transaction Process(Sistemas de transação) OMS Organização Mundial de Saúde ONG Organização Não Governamental ONU Organização das Nações Unidas PNAD Pesquisa Nacional por Amostra de Domicílios SaaS Software as a Service(Software como um Serviço) SEADE Sistema Estadual de Análise de Dados SEN Sistema Estatístico Nacional SGBD Sistema Gerenciador de Banco de Dados SGBDM Sistemas Gerenciadores de Banco de Dados Multidimensionais SQL Structured Query Language(Linguagem XML extensible Markup Language(Linguagem de marcação de texto) XMLA XML for Analysis(Linguagem de marcação de texto para Analises) WOLAP Web Olap