Montagem de Armazém de Dados para Instituição de Ensino Superior Pública



Documentos relacionados
Banco de Dados - Senado

DATA WAREHOUSE. Introdução

DATA WAREHOUSE. Rafael Ervin Hass Raphael Laércio Zago

Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence

PLANO DE ENSINO PRÉ-REQUISITOS: ENS

Data Warehouse Granularidade. rogerioaraujo.wordpress.com - rgildoaraujo@gmail.com 1

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

Data Warehouse. Debora Marrach Renata Miwa Tsuruda

Disciplina: Unidade III: Prof.: Período:

Data Warehouse Processos e Arquitetura

GUIA DE CURSO. Tecnologia em Sistemas de Informação. Tecnologia em Desenvolvimento Web. Tecnologia em Análise e Desenvolvimento de Sistemas

Adriano Maranhão BUSINESS INTELLIGENCE (BI),

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Módulo 4. Construindo uma solução OLAP

Data Warehouse. Diogo Matos da Silva 1. Universidade Federal de Ouro Preto, Ouro Preto, MG, Brasil. Banco de Dados II

Pós-Graduação em Gerenciamento de Projetos práticas do PMI

ADMINISTRAÇÃO DOS RECURSOS DE DADOS

Data Warehousing. Leonardo da Silva Leandro. CIn.ufpe.br

Complemento I - Noções Introdutórias em Data Warehouses

IMPLANTAÇÃO DE UM SISTEMA DE AVALIAÇÃO DE DESEMPENHO NA UFG

Tabela e Gráficos Dinâmicos Como estruturar dinamicamente dados no Excel

Uma análise de ferramentas de modelagem e gerência de metadados aplicadas ao projeto de BI/DW-UFBA

ISO/IEC 12207: Gerência de Configuração

A Grande Importância da Mineração de Dados nas Organizações

ACOMPANHAMENTO GERENCIAL SANKHYA

ROTEIRO PARA ELABORAÇÃO DE PROJETOS


TRABALHO DE DIPLOMAÇÃO Regime Modular ORIENTAÇÕES SOBRE O ROTEIRO DO PROJETO FINAL DE SISTEMAS DE INFORMAÇÕES

O Acordo de Haia Relativo ao Registro. Internacional de Desenhos Industriais: Principais características e vantagens

Gestão de Relacionamento com o Cliente CRM

FATEC Cruzeiro José da Silva. Ferramenta CRM como estratégia de negócios

Desenvolvimento de um software de gerenciamento de projetos para utilização na Web

SUGESTÕES PARA ARTICULAÇÃO ENTRE O MESTRADO EM DIREITO E A GRADUAÇÃO

Módulo 4: Gerenciamento de Dados

MANUAL DO TRABALHO DE CONCLUSÃO DE CURSO TECNOLOGIA EM ANÁLISE E DESENVOLVIMENTO DE SISTEMAS FATEC ZONA LESTE

Planejamento Estratégico de TI. Prof.: Fernando Ascani

UNIDADE 4. Introdução à Metodologia de Desenvolvimento de Sistemas

MANUAL DE ATIVIDADES COMPLEME MENTARES CURSO DE ENFERMAGEM. Belo Horizonte

Conceitos de Banco de Dados

Processo de Implementação de um Sistema de Gestão da Qualidade

Banco de Dados I. Apresentação (mini-currículo) Conceitos. Disciplina Banco de Dados. Cont... Cont... Edson Thizon

Gerenciamento de Riscos do Projeto Eventos Adversos

A IMPORTÂNCIA DA GESTÃO DE CUSTOS NA ELABORAÇÃO DO PREÇO DE VENDA

05 - Como faço para acessar um curso no Ambiente Virtual de Aprendizagem Moodle/UFGD.

2 Diagrama de Caso de Uso

UNIVERSIDADE DO OESTE PAULISTA CURSO DE ZOOTECNIA. Regulamento do Trabalho de Conclusão de Curso I e II

No mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o

SISTEMA INTEGRADO DE GESTÃO ACADÊMICA

Seção 2/E Monitoramento, Avaliação e Aprendizagem

MUDANÇAS NA ISO 9001: A VERSÃO 2015

Sistema de Controle de Solicitação de Desenvolvimento

Tópicos Avançados Business Intelligence. Banco de Dados Prof. Otacílio José Pereira. Unidade 10 Tópicos Avançados Business Inteligence.

ATIVIDADES PRÁTICAS SUPERVISIONADAS

Disciplina: Suprimentos e Logística II Professor: Roberto Cézar Datrino Atividade 3: Transportes e Armazenagem

AGILE ROLAP - UMA METODOLOGIA ÁGIL PARA IMPLEMENTAÇÃO DE AMBIENTES DE NEGÓCIOS BASEADO EM SERVIDORES OLAP.

UNIVERSIDADE FEDERAL DO PARANÁ UFPR Bacharelado em Ciência da Computação

CONSIDERAÇÕES SOBRE ATIVIDADES DE IDENTIFICAÇÃO, LOCALIZAÇÃO E TRATAMENTO DE DADOS NA CONSTRUÇÃO DE UM DATA WAREHOUSE

CURSO PRÉ-VESTIBULAR UNE-TODOS: CONTRIBUINDO PARA A EXTENSÃO UNIVERSITÁRIA NA UNIVERSIDADE DO ESTADO DE MATO GROSSO *

DIRETRIZES DE ORIENTAÇÃO DAS ATIVIDADES DO TRABALHO DE CURSO

UNIVERSIDADE, EAD E SOFTWARE LIVRE

EDITAL. EDITAL DIR N o 32/2014 VIAGEM DE ESTUDOS INTERNACIONAL.

SETIS- III Seminário de Tecnologia Inovação e Sustentabilidade 4 e 5 de novembro de 2014.

Universidade Federal de Santa Maria Curso de Arquivologia. Disciplina de Banco de Dados Aplicados à Arquivística. Versao 1.

medida. nova íntegra 1. O com remuneradas terem Isso é bom

CENTRO UNIVERSITÁRIO NEWTON PAIVA CURSO SUPERIOR DE TECNOLOGIA EM ESTÉTICA E COSMÉTICA MANUAL DE ATIVIDADES COMPLENTARES

TÍTULO: IMPLEMENTAÇÃO DE UM SISTEMA DE CONTROLE PATRIMONIAL (SCP) PARA O CORPO DE BOMBEIRO DE MATO GROSSO DO SUL(MS)

04/08/2012 MODELAGEM DE DADOS. PROF. RAFAEL DIAS RIBEIRO, MODELAGEM DE DADOS. Aula 1. Prof. Rafael Dias Ribeiro. M.Sc.

EDITAL SENAI SESI DE INOVAÇÃO. Caráter inovador projeto cujo escopo ainda não possui. Complexidade das tecnologias critério de avaliação que

Prof. Marcelo Henrique dos Santos

REGIMENTO DO CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA E TECNOLOGIA ESPACIAIS ÁREA DE CONCENTRAÇÃO EM ENGENHARIA E GERENCIAMENTO DE SISTEMAS ESPACIAIS

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ CURSO SUPERIOR DE TECNOLOGIA EM ANÁLISE E DESENVOLVIMENTO DE SISTEMAS

INTRODUÇÃO. Enfoque abstrato. Enfoque Intermediário

O modelo unificado de processo. O Rational Unified Process, RUP.

)HUUDPHQWDV &RPSXWDFLRQDLV SDUD 6LPXODomR

ASSESSORIA DE IMPRENSA 1 Felipe Plá Bastos 2

Manual SAGe Versão 1.2 (a partir da versão )

Nome: Login: CA: Cidade: UF CARTÃO RESPOSTA QUESTÃO RESPOSTA QUESTÃO RESPOSTA

FAQ Escrita de Cases

Programa de Apoio Didático Graduação - Perguntas Frequentes

ROTEIRO PARA TREINAMENTO DO SAGRES DIÁRIO Guia do Docente

II. FASE DE PLANEJAMENTO define a maturidade do entendimento do escopo e, o desenvolvimento do Plano do Projeto PP.

Palavras-chave: On-line Analytical Processing, Data Warehouse, Web mining.

SERVIÇO PÚBLICO FEDERAL UNIVERSIDADE FEDERAL DA FRONTEIRA SUL COMISSÃO PERMANENTE DO PROCESSO SELETIVO DÚVIDAS FREQUENTES

Referências internas são os artefatos usados para ajudar na elaboração do PT tais como:

A UTILIZAÇÃO ADEQUADA DO PLANEJAMENTO E CONTROLE DA PRODUÇÃO (PCP), EM UMA INDÚSTRIA.

MODELAGEM DE DADOS MODELAGEM DE DADOS. rafaeldiasribeiro.com.br. Aula 3. Prof. Rafael Dias Ribeiro.

Microsoft Access XP Módulo Um

Curso de planilhas eletrônicas na modalidade EAD: Um relato de experiência

UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado)

Orientação a Objetos

DATA WAREHOUSE NO APOIO À TOMADA DE DECISÕES

Avanços na transparência

Diferenças da versão 6.3 para a 6.4

APLICATIVO WEB PARA O SETOR DE EXTENSÃO IFC VIDEIRA

Roteiro de orientações para uso do Contas Online

Feature-Driven Development

Projeto SIGA-EPT. Manual do usuário Módulo Requisição de Almoxarifado SISTEMA INTEGRADO DE GESTÃO ACADÊMICA

Metodologia de Gerenciamento de Projetos da Justiça Federal

Transcrição:

UNIVERSIDADE ESTADUAL DE GOIÁS UNIDADE UNIVERSITÁRIA DE CIÊNCIAS EXATAS E TECNOLÓGICAS BACHARELADO EM SISTEMAS DE INFORMAÇÃO WALÉRIA CORRÊA DE OLIVEIRA Montagem de Armazém de Dados para Instituição de Ensino Superior Pública Anápolis Novembro, 2012

UNIVERSIDADE ESTADUAL DE GOIÁS UNIDADE UNIVERSITÁRIA DE CIÊNCIAS EXATAS E TECNOLÓGICAS BACHARELADO EM SISTEMAS DE INFORMAÇÃO WALÉRIA CORRÊA DE OLIVEIRA Montagem de Armazém de Dados para Instituição de Ensino Superior Pública Monografia apresentado ao Departamento de Sistemas de Informação da Unidade Universitária de Ciências Exatas e Tecnológicas da Universidade Estadual de Goiás, como requisito parcial para obtenção do grau de Bacharel em Sistemas de Informação. Orientador: Prof. Ms. Ly Freitas Filho Anápolis Novembro, 2012

UNIVERSIDADE ESTADUAL DE GOIÁS UNIDADE UNIVERSITÁRIA DE CIÊNCIAS EXATAS E TECNOLÓGICAS BACHARELADO EM SISTEMAS DE INFORMAÇÃO WALÉRIA CORREA DE OLIVEIRA Montagem de Armazém de Dados para Instituição de Ensino Superior Pública Trabalho de Conclusão de Curso apresentado ao Departamento de Sistemas de Informação da Unidade Universitária de Ciências Exatas e Tecnológicas da Universidade Estadual de Goiás, como requisito parcial para obtenção do grau de Bacharel em Sistemas de Informação. Aprovado por: Anápolis, 27 de novembro de 2012

UNIVERSIDADE ESTADUAL DE GOIÁS Unidade Universitária de Ciências Exatas e Tecnológicas www.ueg.br TERMO DE AUTORIZAÇÃO PARA DISPONIBILIZAÇÃO DE TRABALHOS DE CURSOS NO BANCO DE DADOS ELETRÔNICO DA UNIDADE UNIVERSITÁRIA DE CIÊNCIAS EXATAS E TECNOLÓGICAS - UNUCET Eu, WALÉRIA CORREA DE OLIVEIRA, portador do RG n 5102703 Org. Exp. SPTC- GO, inscrito no CPF nº: 032.824.561-58, domiciliado no logradouro Rua Alameda dos Tamoios Quadra 09 Lote 10, Alexandrina, CEP: 75060-090, na cidade de Anápolis, estado de Goiás. Na qualidade de titular dos direitos de autor que recaem sobre o meu trabalho de conclusão de curso, tipo: Monografia, intitulado - Montagem de Armazém de Dados para Instituição de Ensino Superior Pública, defendido em 27/11/2012, junto a banca examinadora do curso de Sistemas de Informação, com fundamento nas disposições da lei nº 9.610 de 19 de fevereiro de 1998, autorizo a disponibilização [total][do resumo] da obra citada, sem ressarcimento de direitos autorais, para fins de leitura, impressão e/ou downloading pela Internet, a título de divulgação da produção científica gerada pela Universidade Estadual de Goiás / UNUCET de Anápolis, a partir desta data. Assim, autorizo a disponibilização [total][do resumo] do meu trabalho, estando ciente que o conteúdo disponibilizado é de minha inteira responsabilidade. Anápolis, 27 de novembro de 2012.

FICHA CATALOGRÁFICA OLIVEIRA, Waléria Corrêa. Montagem de Armazém de Dados para Instituição de Ensino Superior Pública. [Anápolis] 2012. (UEG / UnUCET, Bacharelado em Sistemas de Informação, 2012). Monografia.Universidade Estadual de Goiás, Unidade Universitária de Ciências Exatas e Tecnológicas. Departamento de Sistemas de Informação. 1. Armazém de Dados 2. Data Mart 3. Data Warehouse REFERÊNCIA BIBLIOGRÁFICA OLIVEIRA, Waléria Corrêa. Montagem de Armazém de Dados para Instituição de Ensino Superior Público. Anápolis, 2012. p. Monografia Curso de Sistemas de Informação, UnUCET, Universidade Estadual de Goiás. CESSÃO DE DIREITOS NOME DO AUTOR: Waléria Corrêa de Oliveira TÍTULO DO TRABALHO: Montagem de Armazém de Dados para Instituição de Ensino Superior Pública. GRAU/ANO: Graduação /2012. É concedida à Universidade Estadual de Goiás permissão para reproduzir cópias deste trabalho, emprestar ou vender tais cópias para propósitos acadêmicos e científicos. O autor reserva outros direitos de publicação e nenhuma parte deste trabalho pode ser reproduzida sem a autorização por escrito do autor. Waléria Corrêa de Oliveira Rua Alameda dos Tamoios Quadra 09 Lote 10 - Alexandrina CEP 75060-090 Anápolis GO Brasil

Dedico este trabalho a Deus por ser meu melhor amigo e à minha sobrinha Sara Corrêa da Silva, na esperança que ela aprenda a tocar teclado.

AGRADECIMENTOS Primeiramente a Deus, a meus pais e irmãos, namorado, amigos e colegas, ao meu orientador e aos professores que me acompanharam no decorrer de minha formação. A todos, os meus sinceros agradecimentos.

LISTA DE ILUSTRAÇÕES Figura 1- Repositório de Metadados (MACHADO, 2009)... 6 Figura 2- Modelo Multidimensional (MACHADO, 2009)... 7 Figura 3- Modelo Físico Estrela (MACHADO 2009)... 9 Figura 4- Modelo Físico Floco de Neve (MACHADO, 2009)... 9 Figura 5- Modelo de Entidade e Relacionamento... 16 Figura 6- Modelo Estrela Data Mart... 18 Figura 7- Data Mart com Atributos e Dimensões- 1... 19 Figura 8- Data Mart com Atributos e Dimensões- 2... 20 Figura 9- Data Mart com Atributos e Dimensões- 3... 21 Figura 10- Modelo Final... 22 Figura 11- Dimensões OLAP - 01... 23 Figura 12- Dimensões OLAP 02...24 Figura 13- Modelo Final...25

LISTA DE ABREVIATURAS E SIGLAS Siglas Descrição DM DW MER SGBD OLAP UEG UnUCET Data Mart Data Warehouse Modelo de Entidade e Relacionamento Sistema Gerenciador de Banco de Dados Online Analytical Processing Universidade Estadual de Goiás Unidade Universitária de Ciências Exatas e Tecnológicas

RESUMO Em diversas situações presentes no cotidiano, pode-se afirmar que a informação tem se mostrado um fator de destaque, seja na economia, indústria, comércio ou educação, a forma como a informação é utilizada e de onde ela provém, pode fazer a diferença na tomada de decisões de uma empresa ou instituição seja ela púbica ou privada. Os Armazéns de Dados surgiram para dar suporte a essa necessidade, garantindo a organização, consistência, dados não voláteis, dentre outras diversas vantagens. Um Armazém de Dados consiste na organização de diversos bancos de dados oriundos da própria instituição, a junção organizada desses bancos dá origem ao que é chamado de Armazém de Dados ou Data Warehouse. Para realizar essa ação é necessário transportar de um modelo relacional já existente para um modelo multidimensional, essa montagem dispõe de ferramentas que proporcionam uma avaliação baseada em fatos históricos. A organização de um arquivo de dados com modelagem multidimensional, permite consultas sob diversas ópticas, podendo responder à questões que um banco de dados comum não seria capaz de proporcionar, como por exemplo: Quanto tem crescido o índice de reprovação de alunos do curso de Sistemas de Informação matriculados na disciplina de Cálculo nos últimos dez anos?. Para melhor entendimento, serão apresentados conceitos como Data Mart que pode ser considerado como uma subdivisão do Armazém de Dados, Metadados entendido como Dados sobre Dados, Ferramentas OLAP que são as possíveis formas de visualização dos dados, dentre outros. É comum a utilização de Armazém de Dados principalmente em instituições financeiras, porém ainda é apresentado como novidade em instituições de ensino. O presente estudo tem como objetivo propor a montagem de um Armazém de Dados para uma Instituição de Ensino Superior Pública, visando proporcionar uma ferramenta que contribua para melhor análise da qualidade dos cursos oferecidos na Universidade Estadual de Goiás Unidade de Ciências Exatas e Tecnológicas, permitindo assim, o aprimoramento dos mesmos. Palavras-chave: Data Warehouse, Data Mart, Armazém de Dados, Metadados.

ABSTRACT In many situations present in our daily lives, we can affirm that the information has been a prominent factor, whether in economics, industry, commerce or education, how the information is used and where it comes from, can make a difference in decision decisions of a company or institution be it public or private, the Data Warehouse emerged to support this need, ensuring the organization, consistency, non-volatile data, among several other advantages. A Data Warehouse is to organize various databases from the institution itself, the junction organized these banks gives rise to what is called "data warehouse" to conduct such action is necessary to move from a relational model to an existing model multidimensional, this mount offers tools that provide an assessment based on historical facts. The organization of a data file with multidimensional modeling, allows queries under various optical and can answer the questions that a common database would not be able to provide, such as: "How much has grown the failure rate of students of Information Systems discipline enrolled in Calculus in the last ten years? ". For better understanding, will be presented as Data Mart concepts that can be regarded as a subdivision of the Data Warehouse, Metadata understood as "data about data", OLAP tools which are the possible ways of data visualization, among others. It is common to use Data Warehouse mainly financial institutions, but it is still presented as a novelty in educational institutions. This study aims to propose the installation of a Data Warehouse to a Public Institution of Higher Education, aiming to provide a tool that contributes to better analyze the quality of the courses offered at the Universidade Estadual de Goiás Unidade de Ciências Exatas e Tecnologicas, allowing the improvement of the same. Keywords: Data Mart, Data Warehouse, Metadata

SUMÁRIO INTRODUÇÃO... 1 CAPÍTULO 1 Fundamentação Teórica... 4 1.1 Armazém de Dados e Data Mart... 4 1.2 Metadados... 5 1.3 Modelo Multidimensional e Operações OLAP (Online Analytical Processing)... 7 1.4 Modelo Físico Star (Estrela)... 9 1.5 Modelo Físíco Snowflake (Floco de Neve)... 9 1.6 Tabelas Fato e Dimensões... 10 CAPÍTULO 2 Metodologia da Pesquisa... 12 2.1 Tipos de Pesquisa... 12 2.2 Universo e Amostra... 13 2.3 Instrumentos utilizados na coleta e tratamento de dados... 13 2.4 Dificuldades Encontradas... 14 CAPÍTULO 3 Estudo de Caso... 15 3.1 Necessidades levantadas... 15 3.2 Modelo de Entidade e Relacionamento... 15 3.3 Criação do Data Mart... 17 CAPÍTULO 4 Modelo Final... 22 4.1 Dimensões OLAP... 23 4.2 Modelo Físico... 25 CONCLUSÃO... 26 REFERÊNCIAS... 28 Apêndice I Cronograma de Atividades do Trabalho de Conclusão de Curso... 30 Apêndice II Pôster apresentado no IV simpósio de Tecnologia da Informação e IV Semana de Iniciação Científica do Curso de Sistemas de Informação UNUCET-UEG.... 31

1 INTRODUÇÃO Dentre os diversos tipos de armazenamento mais utilizados no mundo, encontram -se os Bancos de Dados, por ser a forma mais rápida quando se quer realizar uma pesquisa. Com o crescente desenvolvimento de indústrias, empresas que vão de pequeno à grande porte, instituições de diversos tipos, são necessários bancos cada vez mais robustos e eficientes.(paris, 2012) Para tomada de decisões estratégicas é necessário mais que dados, é preciso um modo de se extrair informações a partir dos mesmos, essa seria a grande necessidade que objetivou a criação dos chamados Armazém de dados, ou em inglês Data Warehouse. Uma vez que a quantidade de dados cresce em uma empresa ou instituição, é possível montar um histórico dos dados através do qual o usuário pode planejar ações e definir estratégias com base em informações geradas através de dados antigos e atuais. Ao longo dos anos, tem-se uma dificuldade em discernir o significado de Dados e Informação, é comum se deparar com pessoas e até mesmo literaturas que consideram que ambas possuem a mesma acepção, é necessário porém, identificar o real sentido de tais palavras, antes de se dar início à um estudo de Armazém de Dados. Enquanto Dado é a representação de fatos que sozinhos não fazem sentido ao homem, Informação são dados organizados de forma útil que possuem um significado conveniente. Um exemplo para diferenciar dados de Informações, são as letras RUOPCMTDOA que aparentemente não possuem algum sentido, no entanto após serem processados geram a informação : COMPUTADOR, em outras palavras a Informação pode ser entendida como o conjunto de dados ordenados e organizados de forma a terem um significado. (FAVARETTO, 2012) Um Armazém de Dados em português, tem esse nome em virtude da alta capacidade de armazenamento não volátil, enquanto um banco de dados comum se preocupa em armazenar dados atuais de forma sintética afim de não comprometer o tempo de resposta à consultas. O Armazém de Dados procura armazenar a maior quantidade de dados possível, para assim proporcionar ao usuário uma análise histórica, transmitindo não apenas dados, mas principalmente a informação ao usuário. (MACHADO, 2009) A montagem de Armazém de Dados em instituições de ensino superior pode viabilizar diversos tipos de análises que proporcionam aprimoriamento na qualidade do ensino.

2 O ingresso em universidades públicas é algo que tem despertado interesse em estudantes de escolas particulares e públicas de ensino médio, visando a melhor qualidade de ensino, os vestibulandos concorrem às disputadas vagas nas universidades públicas. É notório que diversas situações levam a pensar que as chances de alunos de escolas públicas, alcançarem uma vaga nessas instituições são notoriamente menores que alunos oriundos de escolas particulares, porém após a conquista da almejada vaga, seria interessante para a universidade obter informações acerca do aproveitamento dos alunos, levando em consideração o tempo para formação ou a desistência, nos diversos cursos oferecidos. Não existe um banco de dados que proporcione respostas para tais questões, para isso é necessário montar um banco de dados multidimensional onde através de técnicas de mineração de dados, é possível explanar tais informações. O presente estudo propõe uma pesquisa a ser realizada na Universidade Estadual de Goiás, com os cursos de graduação oferecidos na Unidade Universitária de Ciências Exatas e Tecnológicas (UnUCET). A pesquisa relaciona o período de no mínimo oito anos anteriores (2005 a 2011). Para nortear o presente trabalho, colocou-se como problema de pesquisa Seria possível um banco de dados onde é viabilizada a utilização de métodos de pesquisa para avaliação do desempenho dos cursos na Universidade? assim, o objetivo geral dessa pesquisa consiste em Propor a montagem de um Armazém de Dados que possibilite uma posterior mineração de dados para responder questões acerca do desempenho dos cursos de graduação oferecidos na universidade, e dos acadêmicos ingressos nos últimos oito anos. Para alcançar tal resposta, foram definidos objetivos específicos, esses são: Coletar informações acerca de como são armazenados os dados da Universidade. Estudar uma forma de armazenamento de múltiplas dimensões cabível à necessidade da instituição. Propor a montagem de um Armazém de Dados que possibilite a utilização de técnicas de mineração de dados. No primeiro capítulo é encontrado o referencial teórico, que traz assuntos relacionados à conhecimentos científicos acerca do tema, conceitos como: Armazém de Dados, Data Mart, Modelo Multidimensional, Metadados, Sistemas OLAP e Modelos Físicos, são esclarecidos neste capítulo. A Metodologia de Pesquisa usada neste projeto, encontra-se no capítulo dois, onde é possível visualizar as dificuldades obtidas na confecção deste projeto, os tipos de

3 pesquisa escolhidos, forma de tratamento dos dados, instrumentos usados, além do universo e amostra. Para o estudo de caso, destinou-se o capítulo três, no qual foram expostos os dados disponibilizados pela instituição e montagem do atual quadro em que se encontra a UnUCET. Os resultados da pesquisa, assim como a análise pormenorizada dos fatos observados, apresentação dos argumentos e concatenação de das ideias, são apresentadas no capítulo quatro. A conclusão dessa pesquisa propõe a eventual criação de um armazém de dados onde será possível a extração de informações acerca dos cursos de graduação da UnUCET, contribuindo assim, para melhoria nos cursos oferecidos.

4 CAPÍTULO 1 Fundamentação Teórica A Montagem de um Armazém de Dados, vai além de um simples banco de dados com registros históricos. Para uma montagem de alto nível é preciso incorporar conceitos e padrões com o fim de se alcançar a eficácia e a eficiência no projeto. Para montagem do Armazém de dados é necessário um repositório, chamado de Data Mart. Para utilizá-los tem-se duas visões distintas a de Inmon e a de Kimball, que posteriormente serão analisadas mais detalhadamente. Os metadados são necessários para a comunicação entre o sistema de Armazém de Dados e o usuário final, contendo informações acerca dos dados, quais dados existem, como podem ser acessados, como estão armazenados. Em outras palavras, os metadados contém informações sobre os dados que compõe o Armazém de Dados. (MACHADO, 2009) O Armazém de Dados é criado em modelagem multidimensional, ou seja, podemos visualizar os dados sob diversas ópticas, com o fim de obter informação. Para essa visualização é possível contar com as ferramentas OLAP cujas aplicações permitem aos usuários finais o acesso para extrair os dados de suas bases e construir os relatórios capazes de responder às suas questões gerenciais. Como modelos físicos serão apresentados: Star (Estrela) e o Snowflake (Floco de Neve) ambos apresentando tabela Fato e Dimensões. O estudo aborda os conceitos citados com maior detalhe a seguir. (INMON, 1999) 1.1 Armazém de Dados e Data Mart Um Armazém de Dados pode ser entendido como um Depósito de dados onde são armazenadas informações sobre a empresa ou instituição consolidando informações procedidas de bancos de dados pré-existentes para transformação de dados em informações que proporcionem uma análise para tomada de decisões no ambiente institucional. Os Armazéns de Dados surgiram na decada de 80, e tem se tornado cada vez mais conhecidos, de acordo com estatísticas mundiais o tempo gasto com análise de dados para tomada de decisões é siginificativamente menor quando são utilizadas estratégias de Data Warehouse. (DWAREHOUSE, 2012) É importante ressaltar que não existe um Armazém de Dados pronto para ser utilizado sem um trabalho anterior de levantamento de necessidades da instituição e de seus diretores. A construção exige transferência e transformação dos dados existentes em sistemas

5 corporativos para uma base de dados independente. Essa base de dados pode ser disponibilizada para usuários para a consulta de informações. Sua crescente utilização está relacionada à necessidade de domínio de informações estratégicas, assim, o principal objetivo do Armazém de Dados é disponibilizar informações para apoio a decisões da instituição. (MACHADO, 2009). A definição mais usada para Data Mart é que ele representa um subconjunto de dados do Armazém de Dados. Em síntese pode-se dizer que os Data Marts permitem um acesso descentralizado e serve de fonte para os dados que irão compor os bancos de dados individuais. Uma das principais vantagens na utilização do Data Mart é a possibilidade de retorno mais rápido, promovendo maior envolvimento com o usuário final, capaz de avaliar os benefícios extraídos de seu investimento.(henrique, 2012) Existem duas visões principais a respeito da montagem de um Armazém de Dados, Ralph Kimball defende a teoria de que o Armazém de Dados deve ser dividido para depois ser conquistado, ou seja, o mais viável para a empresa é desenvolver Data Marts (Repositório de Dados) e depois integrá-los para assim se obter o Armazém. No final, existira uma série de pontos de conexão que é chamado de tabelas Fato e Dimensão em conformidade. Kimball nomeou esse conceito de Data Warehouse Bus Architeture. Rebatendo a teoria de Kimball, Bill Inmon propõe o inverso, segundo ele é mais interessante construir primeiramente um Armazém de Dados, modelando-se toda a empresa para se chegar a um único modelo corporativo e posteriormente partir para os Data Marts construidos por assuntos. (HENRIQUES, 2012) Nosso estudo será embasado principalmente da teoria de Ralph Kimball, não impedindo, entretanto, a incorporação de estudos realizados por Bill Inmon. 1.2 Metadados Os metadados são considerados em algumas literaturas como Dados sobre Dados. Os sistemas de Armazém de Dados possuem um repositório de metadados, que é uma abstração de dados, em outras palavras, dados de mais alto nível que descrevem dados de níveis inferiores. (ALVES, 2012) Os metadados podem surgir de vários locais no decorrer do projeto, desde documentação de projetos, como materiais utilizados em entrevistas com usuários. Eles facilitam o entendimento dos relacionamentos e a utilidade das informações a partir dos dados.

6 Compondo o DNA do Armazém de Dados, os metadados desempenham importante papel, pois sem eles o Data Warehouse e seus componentes assossiados no ambiente projetado seriam meramente componentes soltos, funcionando independentemente e com objetivos separados. Assim os metadados permitem ao usuário trasformar os dados crus em informações que gerem conhecimento e tragam vantagem competitiva. (ALVES, 2012) Os metadados se dividem em doi grupos: Tecnicos e Negócios, conforme ilustrado na figura 1: Figura 1- Repositório de Metadados (MACHADO, 2009) Os metadados técnicos fornecem aos desenvolvedores e usuários técnicos, a confiança de que os dados estão corretos. Alguns exemplos: Controle de Auditoria; Dependência dos programas; Nomes das tabelas do Armazém de Dados. Já os metadados de Negócios, são a ligação entre os usuários de negócios (executivos e analistas de negócios) e o Data Warehouse. Eles mostram que relatórios, consultas e dados estão no DW, a localização, confiabilidade e contexto dos dados, além de regras de transformação e as origens desses dados. Como exemplo, pode-se citar: Mapeamento dos campos das tabelas Físicas do DW; Informação sobre sumarizações e transformações de dados; Estrutura dos dados com a nomeclatura que possa ser facilmente entendida pelo usuário final. (MACHADO, 2009)

7 A solução para a comunicação entre o sistema de Armazém de Dados e o usuário final são os metadados, que informam ao usuário, qual informação existe no Armazém de Dados e como essas informações podem ser acessadas. Os metadados precisam guardar informações a respeito de como o Armazém foi montado e estruturado, além de especificar quando os dados foram utilizados pela última vez, a fonte do dado e como ele é gerado.(inmon, 1999) 1.3 Modelo Multidimensional e Operações OLAP (Online Analytical Processing) A modelagem Multidimensional é uma técnica de concepção e visualização de um modelo de dados de um conjunto de medidas que descrevem aspectos comuns de negócios. É utilizada especialmente para sumarizar e reestruturar dados e apresentá-los em visões que suportem a análise dos valores desses dados. (HORITA, 2012) Um modelo multidimensional é formado por três elementos básicos: Fatos, Dimensões e Medidas também chamadas Variáveis. Desse modo, a modelagem multidimensional representa os dados com dimensões em vez de tabelas, é possível visualizar na figura 2: Figura 2- Modelo Multidimensional (MACHADO, 2009) As ferramentas OLAP (Online Analytical Processing) são aplicações às quais os usuários finais têm acesso para extrair os dados de suas bases e construir os relatórios capazes de responder às suas questões gerenciais. (MACHADO, 2009) Para entender melhor os tipos de operações OLAP é importante esclarecer o que é Granularidade, este termo refere-se ao nível de sumarização dos elementos e de detalhe

8 disponível nos dados. Quanto mais detalhe existir nos dados, mais baixo será o nível de granularidade consequentemente, quanto menos detalhe existir nos dados, mais alto será o nível de granularidade. (MOREIRA, 2012) Existem quatro tipos de operações em OLAP que são utilizadas para analisar dados: Drill Down e Roll Up A operação é denominada Drill Down quando o usuário aumenta o nível de detalhe da informação, diminuindo assim, o seu grau de granularidade. Enquanto que Roll Up é o inverso, ou seja, quando o usuário diminui o grau de detalhamento e aumenta o nível de granularidade. Drill Across Acontece quando o usuário ignora um nível intermediário dentro de uma mesma dimensão. Por exemplo, temos a dimensão Tempo composta por: Ano, Semestre, Trimestre e Mês. O usuário efetua um Drill Across passando de Ano para Mês. Drill Throught Quando o usuário passa uma informação contida em uma dimensão para uma outra, por exemplo, o usuário está na dimensão Tempo e logo após começa a analisar a informação por Região. Slice and Dice Em palavras simples, significa a redução do escopo dos dados. Slice é a operação que corta o cubo, mantendo a mesma perspectiva de visualização dos dados. Dice é a mudança de perspectiva da visão. É a extração de um subcubo ou a interseção de vários Slices. É como girar um cubo nas próprias mãos. Operações OLAP podem ser combinadas, em outras palavras, pode-se realizar um Slice e um Dice ao mesmo tempo com operações de Drill Down ou Roll Up. (MACHADO, 2009).

9 1.4 Modelo Físico Star (Estrela) Também conhecido como Star schema, sua composição possuiu um conjunto de pequenas entidades (Dimensão) relacionadas com uma entidade central (Fato). Na figura numero três tem-se um fato e ao redor várias dimensões que participam desse fato.(machado, 2009) Figura 3- Modelo Físico Estrela (MACHADO 2009) É importante ressaltar que nesse modelo as dimensões não são normalizadas, ou seja, cada tabela (por exemplo: categoria, departamento) contém suas descrições repetidas nos registros, aumentando assim, o espaço utilizado no disco. (GOLDSCHMIDT, 2012) 1.5 Modelo Físíco Snowflake (Floco de Neve) É o resultado da decomposição de uma ou mais dimensões que possuem hierarquia entre seus membros. O modelo é demonstrado na figura 4: Figura 4- Modelo Físico Floco de Neve (MACHADO, 2009)

10 As tabelas dimensionais se relacionam com as tabelas de Fatos, mas algumas dimensões se relacionam apenas entre elas, isto ocorre para fins de normalização das tabelas dimensionais visando diminuir o espaço ocupado por estas tabelas. Dessa forma, passa -se a utilizar mais tabelas para utilizar as mesmas dimensões, porém é ocupado menos espaço em disco do que no modo estrela. O modelo Snow- Flake tem esse nome porque cada dimensão se divide em outras tabelas, lembrando a forma de um floco de neve. (MACHADO, 2009) 1.6 Tabelas Fato e Dimensões Tudo aquilo que é considerado importante para a tomada de decisões, pode ser considerado um Fato, em palavras simples, a administração da empresa busca fatos históricos para planejamentos futuros. Tambem pode ser entendido como aquilo que pode ser representado numericamente. [...] Característica importante para identificar um fato é que ele é evolutivo, muda suas medidas com o tempo, podendo ser sempre questionado sobre essa evolução ao longo de um espaço de tempo.(machado,2009). Um exemplo para melhor entendimento está na seguinte afirmação: O índice de reprovação em Estrutura de Dados, tem aumentado nos últimos quatro anos. Constitui um Fato, que pode ser mudado ao decorrer dos anos. Os elementos que participam de um fato são no mínimo: Onde aconteceu Quando aconteceu Quem executou O que é o objeto do fato Cada um desses elementos é chamado de Dimensão e são ligados à tabela Fato. Uma Dimensão é um tipo de informação que participa da definição de um fato. As Medidas são os atributos ou variáveis numéricas que representam o fato. (HORITA, 2012) As tabelas Fato são compostas obrigatoriamente por uma chave primaria, composta pelas chaves primarias das tabelas que contém as Dimensões do Fato. Além dessas informações a tabela fato também pode conter medidas que variam de numérica ou sem medida. A seguir, três exemplos de tabela Fato: (MOREIRA, 2012) Aditivas: São numéricas e são somadas com relação à dimensões existêntes, ex: quantidade, valor.

11 Semi- Aditivas: São numéricas mas não podem ser somadas com relação à todas as dimensões. Não- Aditivas: Dados nao numéricos, ex: materia1, materia2.

12 CAPÍTULO 2 Metodologia da Pesquisa A partir da utilização de metodologias e técnicas de extração e concatenação de dados e informações é possível melhor entendimento para propor um resultado ao determinado problema de pesquisa proposto. Este capítulo, tem o intuito de apresentar os tipos de pesquisa realizados, a forma de tratamento dos dados, ambiente, universo e amostra. 2.1 Tipos de Pesquisa Quanto aos fins, este estudo apresenta o tipo de pesquisa como Exploratória e Descritiva. Caracateriza-se por Exploratória, pois foi realizado em área de pouco conhecimento e Descritiva por expor características da amostra estudada, envolvendo técnicas padronizadas e estruturadas de coleta de dados. Existem diversos armazéns de dados no mundo, contudo, a maioria desses armazéns são destinados à empresas privadas ou públicas de grande porte, pouco se tem notícia de Armazém de Dados destinados à entidades de ensino, mais especificamente a instituições de ensino pública. As amostras estudadas foram extraídas de um relatório enviado por parte da instituição, embora a pesquisa não tenha sido totalmente embasada neste relatório, o mesmo serviu como apoio para nortear o estudo, com o fim de ser centrado na realidade da instituição. Quanto aos meios a pesquisa caracteriza-se por Bibliográfica e de Campo. Bibliografica, pois foram analisados materiais publicados, tais como livros e documentos em sítios na internet. As pesquisas bibliográficas foram de fundamental importância neste estudo, os livros, artigos e sítios nos quais foram encontrados materiais para pesquisa, contribuíram para maior conhecimento acerca da montagem de Armazém de Dados, sendo possível um melhor entendimento acerca das etapas e procedimentos a serem seguidos. De campo, pois foram estudados relatórios e procedimentos, disponibilizados por gestores da universidade, acerca de como funciona o armazenamento dos dados dos cursos e acadêmicos da instituição.

13 2.2 Universo e Amostra O ambiente cujo embasamento se faz presente este estudo, é a Universidade Estadual de Goiás, que tem sua sede na Br 153 Fazenda Barrero, contando atualmente com 27 unidades e 38 cursos diferentes, segundo informações no sítio da universidade. Este estudo foi realizado na Unidade Universitaria de Ciências Exatas e tecnológicas, localizada no mesmo prédio onde se encontra a sede. O universo da pesquisa foi a Universidade Estadual de Goiás e para amostra foram coletados dados oriundos dos cursos de graduação oferecidos UnUCET. Os dados foram obtidos por meio de relatório enviado por meio da pró-reitoria de graduação da universidade, disponibilizado na ferramenta Excel. Outros dados também foram obtidos por meio de entrevistas informais realizadas com trabalhadores da instituição. Segundo o relatório disponibilizado pela universidade, o número de cursos oferecidos pela UnUCET são 11 destes 3 são no período matutino e vespertino, 1 matutino, 2 noturnos e 5 são de período integral. 2.3 Instrumentos utilizados na coleta e tratamento de dados Os dados utilizados foram disponibilizados pela instituição no Microsoft Excel- 2007, para elaboração do Diagrama de Entidade e Relacionamento (DER), utilizou-se a ferramenta DBDigner versão 4. Na montagem de banco de dados para estudos e testes durante o tratamento dos dados, utilizou-se o Sistema Gerenciador de Banco de Dados, (SGBD) MySQL versão 5.1. Os dados foram tratados qualitativamente, pois foram retirados nomes das tabelas para entendimento de como funciona o banco de dados acerca do relacionamento entre cursos, disciplinas e acadêmicos atualmente. A partir dos dados disponibilizados pela instituição e das entrevistas realizadas, foi possível compreender de forma mais clara o estudo biblíografico realizado no Capítulo 1, fundamentando as idéias e conceitos estabelecidos, podendo assim chegar ao estudo de caso apresentado no Capítulo 3. A partir de então foi possível propor uma montagem de armazém de dados para a universidade o qual é apresentado no capítulo 4.

14 2.4 Dificuldades Encontradas Para propor um estudo centrado na atual realidade da unidade universitária é necessário a maior confiabilidade possível dos dados estudados. Embora a universidade tenha proposto a disponilização de tais informações, a burocracia do processo acarretou em uma demora que de certa maneira atrasou determinadas etapas do processo de elaboração do estudo. A falta de relatórios que detalhassem de forma mais precisa a atual situação do banco de dados da instituição também ocasionou em uma dificuldade. Contornando as situações que se apresentaram como empecilhos, foi realizado um estudo no qual se buscou a maior veracidade possível dos dados e informações utilizadas.

15 CAPÍTULO 3 Estudo de Caso A Universidade Estadual de Goiás conta atualmente com um número de 27 unidades, cada unidade possui uma determinada quantidade de cursos oferecidos e este número varia de acordo com a cidade. Os cursos são compostos por várias disciplinas, e o número de disciplinas varia de acordo com o curso. Podem existir disciplinas comuns a cursos diferentes, como Cálculo, Probabilidade e Estatística e outras disciplinas presentes em diversos cursos. Um aluno pode estar matriculado em uma ou diversas disciplinas, assim como um professor pode ministrar uma ou várias disciplinas. Os alunos matriculados na instituição podem ser oriundos de escolas públicas ou de escolas particulares. Os professores podem ter diferentes graus de formação e cada curso tem um coordenador. Cada disciplina, assim como o curso tem um tempo de duração específico. 3.1 Necessidades levantadas As principais necessidades visualizadas são relacionadas a seguir: 1. Visualizar ao longo do tempo, o índice de aproveitamento dos cursos de graduação, considerando quanto tempo um aluno leva para se formar. 2. Analisar o desempenho das disciplinas através das médias referentes às notas dos acadêmicos. 3. Analisar o índice de reprovação dos alunos. 4. Analisar o índice de desistência dos acadêmicos de cursos de graduação. 5. Presumir a quantidade de vezes que um professor ministrou a mesma disciplina. 6. Visualizar o índice de acadêmicos oriundos de escolas públicas. 3.2 Modelo de Entidade e Relacionamento Na figura 5, A seguir é possível visualisar um modelo de entidade e relacionamento. Para desenhar esse modelo foi utilizado um relatório disponibilizado pela instituição, por ser um relatório com poucas informações, grande parte dos atributos e tabelas deste modelo foram inseridos por suposição.

16 Figura 5- Modelo de Entidade e Relacionamento A partir do MER- Modelo de Entidade e Relacionamento é possível entender que o aluno está vinculado à disciplina através da matricula, esta por sua vez é alencada ao curso através da entidade DISCIPLINA_TEM_CURSO. A necessidade de uma entidade entre Curso e Disciplina se dá pelo motivo que em um curso existem diversas disciplinas, assim como uma disciplina pode estar presente em um ou mais cursos. Acontece de forma semelhante entre as entidades PROFESSOR e DISCIPLINA e entre ALUNO e DISCIPLINA, por isso criou-se as entidades PROFESSOR_MINISTRA_DISCIPLINA e ALUNO_MATRICULA_DISCIPLINA.

17 tabela: A partir do modelo de entidade e relacionamento é possível simular a seguinte A tabela exemplifica que um mesmo professor pode ministrar diferentes disciplinas, um professor não é vinculado a um único curso. A tabela CURSO é vinculada à tabela DISCIPLINA, ou seja, o aluno João da Silva está matriculado na disciplina Cálculo do curso Sistemas de Informação, porém o aluno não pertence ao curso Sistemas de Informação e sim ao curso Fármácia, segundo a coluna CursoAluno, que é um atributo da entidade Aluno segundo o Modelo de Entidade e Relacionamento citado anteriormente. Embora a linguagem SQL permita consultas sob diversas ópticas, entende-se que é inviável analisar o desempenho dos cursos e disciplinas utilizando apenas o modelo relacional, pois seria necessárias a criação de diversos tipos de consultas, que talvez não chegassem ao resultado esperado, pois o modelo ER (Entidade e Relacionamento) não permite o armazenamento de dados históricos. 3.3 Criação do Data Mart Como descrito no início deste estudo, será seguido o modelo de Ralph Kimball, iniciando a construção do Armazém de Dados a partir do Data Mart, para isso, é necessário analisar as cardinalidades no modelo apresentado, cada relacionamento de Muitos para Muitos é identificado como um Fato. (MACHADO, 2009). As tabelas que possuem cardinalidade Muitos para Muitos, são quatro: CURSO_COMPOE_UNIDADE DISCIPLINA_TEM_CURSO ALUNO_MATRICULA_DISCIPLINA PROFESSOR_MINISTRA_DISCIPLINA

18 O escopo deste estudo abrange apenas a unidade UNUCET, por isso, será descartada a tabela CURSO_COMPOE_UNIDADE. A partir de então, tem-se três tabelas a serem analisadas para a criação das tabelas Fato. DISCIPLINA_TEM_CURSO ALUNO_MATRICULA_DISCIPLINA PROFESSOR_MINISTRA_DISCIPLINA O primeiro fato a se modelar é ALUNO_MATRICULA_DISCIPLINA que se pode resumir em MATRICULA é nela que está o centro do modelo. Ao responder as perguntas citadas no item 1.6 deste estudo é possível identificar as dimensões que participam do fato: Quem? Aluno Onde? Disciplina Quando? Tempo O que é o elemento desse fato? Curso Como neste estudo será utilizado o modelo físico Estrela, na figura 6, segue um esboço de como fica inicialmente o diagrama: Figura 6- Modelo Estrela Data Mart Para a dimensão Tempo serão extraídos alguns atributos da entidade ALUNO_MATRICULA_DISCIPLINA. Para melhor entendimento, segue na figura 7, o modelo estrela, com os atributos pertencentes ao Fato e às Dimensões:

19 Figura 7- Data Mart com Atributos e Dimensões- 1 Na dimensão Tempo é possível visualizar o tempo através das medidas, Semestre e Ano, pois existem cursos que são semestrais, assim como suas disciplinas. A partir do momento em que se tem o modelo, é possível averiguar se o modelo responde aos requisitos citados no item 3.1: 1. Visualizar ao longo do tempo, o índice de aproveitamento dos cursos de graduação, considerando quanto tempo um aluno leva para se formar. O modelo possui o curso do aluno, disciplinas e o tempo que informa as datas de início e conclusão das disciplinas que compõe o curso, logo, é possível inserir a medida tempo_para_formacao, considerando que se o acadêmico estiver com todas as disciplinas concluídas ele esta apto para formar-se. Pode-se considerar que o modelo satisfaz o primeiro requisito.

20 2. Analisar o desempenho das disciplinas através das médias referentes às notas dos acadêmicos: Este requisito também é atendido, pois consta no Fato o atributo nota e medianota, desta maneira, não se faz necessário acrescentar qualquer item. 3. Analisar o índice de reprovação dos alunos: O índice de repovação dos alunos pode ser obtido considerando-se a medianota ou totalassitencia, será inserido uma medida chamada de resultadofinal esse campo poderá ser preenchido como Aprovado ou Reprovado. 4. Analisar o índice de desistência dos acadêmicos de cursos de graduação: Este requisito será tratado de maneira semelhante ao anterior, um atributo chamado desistencia que será preenchido de forma positiva, caso o acadêmico declare desistência da disciplina, ou negativa, caso não haja manifestação de desistência por parte do aluno. Figura 8- Data Mart com Atributos e Dimensões- 2

O Modelo, figura 8, ilustra os atributos resultadofinal e desistencia respectivamente citados nos dois últimos requisitos. 21 5. Visualizar o índice de acadêmicos oriundos de escolas públicas: Este requisito também é atendido pelo modelo acima, pois na dimensão ALUNO é possível enxergar o atributo oriundoescola que indica se o acadêmico é originário de escola pública ou particular. 6. Presumir a quantidade de vezes que um professor ministrou a mesma disciplina. Para cumprir esse requisito, será necessária a inclusão de mais uma dimensão, chamada PROFESSOR. Ao relacionar a dimensão PROFESSOR ao Fato é possível obter o número de ocorrências de um mesmo professor em uma matricula de determinada disciplina, pois o Fato passa a ter a chave estrangeira referente ao Professor como é possível visualizar na figura 9: Figura 9- Data Mart com Atributos e Dimensões- 3

22 CAPÍTULO 4 Modelo Final O modelo final apresentado contém apenas uma tabela Fato, porém, não é necessário que um Data Mart tenha apenas um fato, existem situações em que há necessidade de duas ou mais tabelas Fato utilizando dimensões comuns aos mesmos. O modelo final produzido pode ser considerado de qualidade, pois permite consultas para as quais o mesmo foi elaborado, satisfazendo os principais requisitos apresentados. Na figura 10, a ilustração do modelo final. Figura 10- Modelo Final

23 4.1 Dimensões OLAP No primeiro capítulo, foi apresentado como funciona o modelo multidimensional cuja estrutura é representada por um cubo, onde o fato é o próprio cubo e as dimensões são as diversas faces do mesmo. Ao analisar o modelo físico agora de forma multidimensional é possível visualizar de forma mais clara como podem ser utilizadas as ferramentas OLAP, estudadas também no capítulo 1. Em outras palavras, é possível visualizar quais informações podem ser extraídas a partir do modelo proposto. Figura 11- Dimensões OLAP - 01 A figura 11, ilustra o fato Matrícula, ao explorar o modelo inicial, é possível dizer, por exemplo, que os alunos José e Aline, oriundos de escola pública levaram 1 e 2 semestres respectivamente para concluírem a disciplina de cálculo, enquanto os oriundos de escola particular Maria e Jorge demoraram concernentes 4 e 2 semestres. O requisito de número 1 citado no capítulo 3 item 3.1, pode ser atendido pelo modelo se trocar a dimensão Disciplina pela dimensão Curso. A dimensão Tempo pode ser analisada com medidas semestrais ou anuais, pois existem cursos e disciplinas que são semestrais, enquanto outras são anuais.

24 No exemplo abaixo é possível visualizar outro tipo de informação, proporcionada pelo modelo. Os alunos matriculados no curso de matemática no primeiro semestre de 2.000 levaram em média 7 anos para se formarem, no curso de Física e Química Licenciatura 4 anos e no curso de Farmácia 5 anos. O ano de Ingresso é composto por um último algarismo que identifica o semestre, quando 1 representa o primeiro semestre e quando 2 o segundo semestre do ano em questão. Esse modelo atende aos requisitos citados no capítulo 3 item 3.1, para isso são utilizadas as ferramentas OLAP descritas no capítulo 1 item 1.3, onde é possível visualizar os dados de diferentes formas alternando as dimensões, conforme ilustra a figura 12: Figura 12 Dimensões OLAP - 02 É importante lembrar que os dados apresentados são fictícios, pois não é permitida a divulgação de dados reais da instituição.

25 4.2 Modelo Físico Como o objetivo do estudo não é a criação de um Data Warehouse e sim o estudo da montagem, não será apresentado o script de criação das tabelas, todavia, segue na figura 13 o modelo final com os respectivos tipos de dados. Figura 13- Modelo Final com Tipos de Dados

26 CONCLUSÃO O estudo apresentado teve como objetivo geral propor a montagem de um Armazém de Dados para a Instituição de Ensino Superior Pública Universidade Estadual de Goiás Unidade de Ciências Exatas e Tecnológicas. O estudo visou analisar a viabilidade da possível criação do Armazém de Dados para assim obter respostas a questionamentos gerenciais sobre índices de desempenho dos cursos e ou disciplinas disponibilizadas na Unidade, bem como o aproveitamento de discentes e docentes da instituição. O problema de pesquisa que norteou o estudo foi Seria possível um banco de dados onde é viabilizada a utilização de métodos de pesquisa para avaliação do desempenho dos cursos na Universidade? A resposta ao problema de pesquisa teve como embasamento as bibliografias analisadas que se apresentam de forma condensada no capítulo 1, além do relatório disponibilizado pela instituição, o qual se encontra disponível no apêndice 2 de forma resumida. Segundo apresentado nos capítulos 3 e 4, foi possível modelar um banco multidimensional considerado de alta qualidade, dado que atende as principais necessidades apresentadas, as quais são descritas no capítulo 3, sendo possível considerar como viável a criação do Armazém de dados para a instituição. Para chegar ao resultado esperado, foi imprescindível seguir o cronograma proposto e empenhar-se para alcançar os objetivos específicos. O primeiro objetivo consistia em coletar as informações sobre como são armazenados os dados da universidade, tal objetivo foi alcançado de forma parcial, pois embora a instituição tenha disponibilizado um relatório, eram necessárias mais informações as quais foram inseridas por suposições fundamentadas em pesquisas bibliográficas. O segundo objetivo foi estudar uma forma de armazenamento multidimensional cabível às necessidades da instituição, o estudo foi elaborado com êxito e é apresentado no capítulo 3. A proposição da montagem do Armazém de Dados no qual é possível a aplicação de técnicas de mineração de dados, tais como a utilização de ferramentas OLAP, é apresentado no capítulo 4 efetuando assim, o terceiro objetivo especifico. A pesquisa foi concluída com sucesso, pois atinge o objetivo geral, assim como objetivos específicos e responde ao problema de pesquisa proposto.

27 A recomendação para uma próxima pesquisa é um estudo sobre mineração de dados fundamentado no Armazém de Dados proposto, ou ainda a implementação da proposta de Data Warehouse apresentada no estudo. Por se tratar de uma instituiçao de ensino pública, o custo para a implantação do Armazém de Dados não seria alto, pois a instiuição conta com icentivos do governo, além de ferramentas como SQLServer e outras, disponibilizadas pela Microsoft, sem custos para a universidade, além de professores e alunos disponíveis para pesquisas científicas. Outras possibilidades de possíveis pesquisas é o estudo da montagem de Data Marts para as outras áreas da nstituição, como por exemplo a área financeira, biblioteca, dentre outros. O leque de possíbilidades para estudos fundamentados em Armazém de Dados é grande, com estudo e criatividade pode-se obter estudos de alto padrão de intelectualidade acerca do assunto.

28 REFERÊNCIAS ALVES, R. C. V. Web semântica: uma análise focada no uso de metadados. 2005. 180 f. Dissertação (Mestrado em Ciência da Informação) - Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2005. DWAREHOUSE. Data Warehouse, Data Mining & OLAP. Disponível em : < http://dwarehouse.vilabol.uol.com.br/metadados.htm> Acesso em 02 de abril de2012. FAVARETTO, Fabio. Data Warehouse: Nova Tecnologia para suporte à decisão em Gestão da produção.< www.las.pucpr.br > Acesso em 17 de outubro de 2012. GOLDSCHMIDT, R.R; SOUZA,R.P; VIEIRA, A.S. Data Warehouse Uma Introdução<http://www.fij.br/revista/arq/vol01_01/datawarehouse.pdf> Acesso em 28 de maio de 2012. HENRIQUE, Ozimar. Data Warehouse x Data Mart. Disponível em:< http://ozimar.com/tag/data-warehouse/.>acesso em 18 de maio de 2012. HENRIQUES, Ana.Abordagem Kimbal Vs. Abordagem Inmon. Disponível em: <http://www.slideshare.net/guest2308b5/kimball-vs-inmon> Acesso em 11 de abril de 2012. HORITA, Flavio. Modelagem Dimensional <http://www.flaviohorita.stillit.com.br/index.php> Acesso em 28 de maio de 2012. INMON W.H., WELCH J. D., GLASSEY K. L. Gerenciando Data Warehouse. São Paulo, Editora Makron Books,1999. MACHADO, Felipe Nery Rodrigues.Tecnologia e Projeto de Data Warehouse. São Paulo: Editora Erica, 2009. MOREIRA, Eduardo. Modelo Dimensional para Data Warehouse. Disponível em:< http://imasters.com.br/artigo/3836/gerencia-de-ti/modelo-dimensional-para-datawarehouse.>acesso em 11 de abril de 2012.

29 PARIS, Riliane Alpoim. A Tecnologia de Data Warehouse nas Organizações. Disponível em:< http://www.devmedia.com.br/a-tecnologia-de-data-warehouse-nasorganizac%c3%b5es/5939 > Acesso em 17 de outubro de 2012. SILVA, LARISSA B.B. Metodologia e Modelo Conceitual para o desenvolvimento de cursos extracurriculares a distância, utilizando Sistemas Tutores Inteligentes - Uma proposta para os graduandos de Sistemas de Informação da UEG/UnUCET. Anápolis: UEG, 2011. TIC. Conceitos relativos à Informação. Diponível em : <http://www.aprendercomastics.net/tic/materiaisapoio/informacaoedados.pdf> Acesso em 02 de abril de 2012. VERGARA, Sylvia Constant. Projetos e relatórios de Pesquisa em Administração. São Paulo: Editora Atlas,2007.

30 APÊNDICES Apêndice I Cronograma de Atividades do Trabalho de Conclusão de Curso Cronograma de atividades proposto no projeto do Trabalho de Conclusão de Curso

31 Apêndice II Pôster apresentado no IV simpósio de Tecnologia da Informação e IV Semana de Iniciação Científica do Curso de Sistemas de Informação UNUCET-UEG. Pôster Montagem de Data Warehouse para Instituição de Ensino Superior Pública