UNIVERSIDADE DO ESTADO DE SANTA CATARINA UDESC CENTRO DE EDUCAÇÃO SUPERIOR DO ALTO VALE DO ITAJAÍ CEAVI PLANO DE ENSINO DEPARTAMENTO: DSI Departamento de Sistema de Informação DISCIPLINA: Data Warehouse e Data Mining PROFESSOR: Osmar de Oliveira Braz Junior SIGLA: DAD E-MAIL: osmar.braz@udesc.br CARGA HORÁRIA TOTAL: 72 TEORIA: 72 PRÁTICA: 0 CURSO(S): Sistemas de Informação SEMESTRE/ANO: 2/2012 PRÉ-REQUISITOS: ENS OBJETIVO GERAL DO CURSO: O curso de Bacharelado em Sistemas de Informação objetiva formar profissionais críticos, criativos, investigativos, éticos e empreendedores. Além disso, deverão ser capazes de atuar em ambientes gerais de informática, como no desenvolvimento, análise, implementação, gerenciamento, gestão de contratos, modelagem e gestão de projetos. Inclusive, os profissionais deverão ter a capacidade de desenvolver soluções apoiadas em tecnologias de informação (computação e comunicação), dados e sistemas que abordem processos administrativos e de negócios das organizações. EMENTA: Gestão de Conhecimento. Processo Decisório. Informações Gerenciais e Táticas. Construção de Data Warehouse. Carga, Limpeza e Transformação. Inteligência Artificial. Mineração de Dados. Técnicas de Mineração de Dados. OBJETIVO GERAL DA DISCIPLINA: O aluno estará apto a reconhecer, projetar e implementar os elementos da arquitetura do Data Warehouse. OBJETIVOS ESPECÍFICOS/DISCIPLINA: (i) Projetar um ambiente DW, dado um problema; (ii) Implementar seus principais componentes (ETL, Metadados, Modelagem Dimensional); (iii) Analisar os dados de um modelo dimensional através de uma ferramenta OLAP; (iv) Definir a melhor técnica de Data Mining no processo de KDD; (v) Utilizar alguma ferramenta de suporte em mineração de dados.
CRONOGRAMA DAS ATIVIDADES: Aula Data Horário Conteúdo 01 24/07 20:40 Apresentação do Plano de Ensino, Metodologia de Ensino e Métodos de Avaliação. A Evolução dos Sistemas de Informação Atividades de um Sistema Ambientes e sistemas 02 26/07 20:40 Componentes de um Sistema de Informação Classificação dos Sistemas de Informação Tipos de Decisões Sistemas Gerenciadores de Banco de Dados Gestão da Informação Conhecimento e Estratégia Sistemas de Informação como elemento de apoio na tomada de decisão 03 31/07 20:40 Resolução de exercícios em sala de aula 04 02/08 20:40 Data Warehouse Porque Data Warehouse Crise dos Dados Evolução Programa de Extração Mudança de Enfoque Ciclo de Desenvolvimento Padrões de utilização de Hardware 05 07/08 20:40 Resolução de exercícios em sala de aula 06 09/08 20:40 Data Warehouse Orientado a assuntos, Integrado, Não volátil, Variável em relação do tempo, Estrutura do Data Warehouse Granularidade Estruturação dos Dados 07 14/08 20:40 Resolução de exercícios em sala de aula 08 16/08 20:40 Modelagem de Dados Modelo Entidade e Relacionamento Modelo Relacional 09 21/08 20:40 Resolução de exercícios em sala de aula, modelagem do modelo relacional 10 23/08 20:40 Ferramenta case para modelagem de dados relacional Sistema gerenciador de banco de dados 11 28/08 20:40 Resolução de exercícios em sala de aula criação e povoamento do modelo relacional 12 30/08 20:40 Modelagem Dimensional Elementos Cubo Diferenças com o modelo relacional Representação Esquema estrela e floco de neve Passos para construção do modelo dimensional 13 04/09 20:40 Exercícios aplicando o conteúdo da aula anterior, modelagem e criação do modelo dimensional. 14 06/09 20:40 Revisão para a Prova 1 15 11/09 20:40 1ª Prova (P1): Prova Individual e sem consulta
Evolução, Gestão, Data Warehouse, Modelagem Relacional e Dimensional. 16 13/09 20:40 Área de Staging Tarefas do staging ETL 17 18/09 20:40 Software de ETL, Transformação de dimensões comuns 18 20/09 20:40 Transformação da dimensão tempo 19 25/09 20:40 Transformação de fatos e agendamento de tarefas. Resolução de exercícios em sala de aula 20 27/09 20:40 OLAP Histórico, Arquiteturas, Cubo de decisão Características, OLAP, Drill Across, Drill Down, Drill Up, Drill Throught 21 02/10 20:40 Atividade do Trabalho Semestral, Tema e Contextualização 22 04/10 20:40 Software de OLAP, Instalação e configuração, exemplo 09/10 Semana Acadêmica de Sistema de Informação 11/10 Semana Acadêmica de Sistema de Informação 23 16/10 20:40 Resolução de exercícios em sala de aula 24 18/10 20:40 DataMarts Conceitos Processos 25 23/10 20:40 Metadados Conceitos Tipos de metadados Software de especificação de metadados 26 25/10 20:40 Resolução de exercícios em sala de aula 27 30/10 20:40 Revisão para a Prova 2 28 01/11 20:40 2ª Prova (P2): Individual e sem Consulta. Área de Staging, OLAP, Data Marts e Metadados. 29 06/11 20:40 Arquitetura de Data Warehouse Organização da Base de Dados, Armazenamento e Camadas Projeto de Data Warehouse 30 08/11 20:40 Atividade a distância a ser enviado via AAGI sobre Arquitetura e Projeto de Data Warehouse 31 13/11 20:40 Mineração de Dados Processo de descobrimento de conhecimento em base de dados - KDD Aprendizado de máquina Técnicas de mineração de dados, Classificação, Predição, Agrupamento e Associação. 15/11 FERIADO NACIONAL - Proclamação da República 32 20/11 20:40 Ferramenta para aplicação de Mineração de Dados Exemplos das técnicas de mineração 33 22/11 20:40 Atividade a distância a ser enviado via AAGI sobre Mineração de Dados 34 27/11 20:40 Entrega e Apresentação do Trabalho Semestral 35 29/11 20:40 Revisão para a avaliação 36 04/12 20:40 3ª Prova (P3): Individual e sem Consulta. Arquitetura, Projeto e Data Mining. 37 11/12 20:40 Exame Final da Disciplina
METODOLOGIA PROPOSTA: Aula expositiva e dialogada para apresentação do conteúdo utilizando retroprojetor ou datashow. Resolução de listas de exercícios individualmente e em grupo. Resolução de estudos de casos com debate em sala de aula. Complementado com atividades em laboratório com softwares que permitem implementar os conceitos de Data Warehouse e Data Mining. AVALIAÇÃO: No transcorrer do semestre teremos cinco avaliações. Serão três avaliações escritas individuais e sem consulta referentes ao conteúdo lecionado, listas de exercícios para fixação de temas específicos e um trabalho a ser desenvolvido em dupla e apresentado a turma na forma de um seminário. As avaliações escritas serão avaliadas a clareza e objetividade, demonstração de conhecimento suficiente, capacidade de sistematização das idéias, ausência de dispersão ou de redundância das informações, observância das regras da norma culta. O Trabalho será avaliado os seguintes critérios: - Apresentação Escrita: fundamentação teórica, clareza de idéias e correção gramatical. - Apresentação Oral: fundamentação teórica, clareza de idéias e argumentação. A média é feita através de calculo: Média = (P1 * 20 + P2 * 20 + P3 * 20 + L1 * 10 + T1 * 30) / 100 Onde P1, P2 e P3 são as provas, L1 listas de exercícios e T1 um Trabalho. O exame final será escrito e individual, referente ao conteúdo apresentado durante todo o semestre. Observações: As avaliações escritas após a sua correção serão entregues aos alunos para conferência e depois devolvidos ao professor. O aluno (a) que não realizar as provas na data estabelecida deverá preencher requerimento junto à secretaria para realização de avaliação em nova data. BIBLIOGRAFIA BÁSICA: INMON, W. H. Como construir o Data Warehouse. Rio de Janeiro: Campus, 1997. KIMBALL, R. The Data Warehouse Toolkit: guia completo para modelagem dimensional. Rio de Janeiro: Campus, 2002. LEME FILHO, T. Business Intelligence no Microsoft Excel. Rio de Janeiro: Axcel Books do Brasil, 2004. Machado, F. N. Tecnologia e projeto de Data Warehouse: uma visão multidimensional. São Paulo: Érica, 2004. TURBAN, E.; SHARDA, R.; ARONSON, J.; KING, D. BUSINESS INTELLIGENCE: um enfoque gerencial para a inteligência do negócio. Porto Alegre: Bookman, 2009. BIBLIOGRAFIA COMPLEMENTAR: BARBIERI, C. BI-Business Intelligence: modelagem e tecnologia. Rio de Janeiro: Axcel Books do Brasil, 2001. 2004. DATE, C.J. Introdução a Sistemas de Banco de Dados. 7. ed. Rio de Janeiro: Campus,
ELMASRI, S.N. ; NAVATHE, B.S. Sistemas de Banco de Dados: Fundamentos e Aplicações. 3. ed. Rio de Janeiro: Livros Técnicos e Científicos, 2002. LAUDON, K. C.; LAUDON, J. P. Sistemas de informação com Internet. 4. ed. Rio de Janeiro: LTC, 1999. O BRIAN, J. A. Sistemas de informação e as decisões gerenciais na era da Internet. São Paulo: Saraiva, 2001. SILBERSCHATZ, A.; KORTH, H.F.; SUDARSHAN, S. Sistema de Banco de Dados. 3. ed. São Paulo: Makron Books, 1999.