Pós-Graduação "Lato Sensu" Especialização em Análise de Dados e Data Mining Inscrições Abertas Início das Aulas: 24/03/2015 Dias e horários das aulas: Terça-Feira 19h00 às 22h45 Semanal Quinta-Feira 19h00 às 22h45 Semanal Carga horária: 460 Horas Duração: 18 meses *As informações podem sofrer alterações Objetivo Este curso tem como objetivo principal analisar e extrair informações de dados não estruturados. Apresentar as ferramentas de Análise de Big Data como um processo importante para manipulação de dados e análise estatística de dados, em tempo real, para tomada de decisão e agregar valor no processo de administração de empresas; Apresentar os aspectos fundamentais de programação para que o aluno tenha capacidade de programar em ferramentas de Análise de Big Data. Perfil do Aluno Profissionais das áreas de: computação, TI, analytics, estatísticos, analistas de mídia social, publicitários, gestores de marketing e CRM, profissionais de e-commerce, profissionais do mercado que manipulam e precisam tomar rápidas decisões por meio de grandes bases de dados. Metodologia Aulas expositivas, resolução de exercícios práticos, estudos de casos, laboratórios e debate com especialistas em Big Data. Corpo Docente Composto por professores altamente qualificados com experiência em estatística, computação, TI e especialistas em análise de Big Data.
Módulo I Análise Exploratória de Dados e Amostragem Objetivos: Este módulo visa dar a base onde as técnicas de análise de dados e data mining são aplicados. Busca dar uma visão geral dos conceitos de Economia, Marketing, Finanças e Estatística Básica, onde o estudo e aplicação de modelos de análise quantitativa, análise multivariada e econométricos serão desenvolvidos. Disciplina 1 Introdução ao Data Mining Introdução à Macro e Micro Economia Noções de Macro economia e modelos econômicos: A disciplina tem como objetivo fornecer o instrumental analítico necessário à compreensão dos fenômenos e variáveis macroeconômicas, como inflação, taxa de juros e taxa de câmbio. Princípios básicos de construção de modelos macroeconômicos. Noções de micro economia: O objetivo da disciplina é prover ao aluno o instrumental básico de raciocínio econômico. O programa cobrirá os conceitos básicos de funcionamento de mercado, oferta e procura. Conceitos básicos para análise de dados financeiros e de mercado Conceitos básicos de finanças: Essa disciplina busca dar ao participante os principais conceitos de finanças e suas aplicações. Matemática financeira: Juros compostos, valor presente, valor futuro e taxa interna de retornos, fluxo de caixa, inflação, taxa de câmbio, impostos e ciclo de vida. Risco e Retorno: o modelo CAPM. Mercado de Capitais e Crédito. Derivativos. Mercados Futuros. Opções. Fundamentos e Aplicações de corporate e project finance. Conceitos Básicos de Marketing: Essa disciplina busca dar noções sobre os conceitos básicos de Marketing tais como composto de Marketing, relacionamento com o cliente. Análise Exploratória de Dados Entender as formas iniciais de análise exploratória dos dados. Tomar contato com os dados e entender o conjunto de dados obtidos, sua qualidade, seu poder explicativo. Estudar a qualidade dos dados e sua aplicabilidade em um processo de Data Mining. Serão discutidas as formas de exploração e reconhecimento dos dados extraídos, análise de formas de distribuição. Bancos de Dados e Tipos de Variáveis - Examinando os dados: - Dados Qualitativos - Dados Quantitativos Medidas de posição Medidas de Variabilidade Sumarizando os dados: - Box-plot - Identificação e tratamento de outliers - Dados faltantes - Dados inconsistentes - Distribuição de freqüência e histogramas - Métodos de transformação dos dados e aplicação
Disciplina 2 Fundamentos de Estatística Principais Distribuições Teóricas e Amostragem Identificação e obtenção dos dados a partir de bases de dados operacionais. Entender métodos de extração, seleção e validação de amostras. Principais Distribuições Discretas Principais Distribuições Contínuas Tipos de amostragem e seleção de amostras Casual simples Sistemática Estratificada Conglomerados PPS- Probability Proportional to Size Inferência Estatística Entender as formas iniciais de análise exploratória dos dados. Tomar contato com os dados e entender o conjunto de dados obtidos, sua qualidade, seu poder explicativo. Estudar a qualidade dos dados e sua aplicabilidade em um processo de Data Mining. Serão discutidas as formas de exploração e reconhecimento dos dados extraídos, análise de formas de distribuição. População e amostras Distribuições Amostrais: - Estimação - Teste de Hipótese - Teste de Hipótese não paramétrico Vantagens e desvantagens da amostra e do censo Módulo II - Técnicas Aplicadas a Data Mining Disciplina 3 Estatística Aplicada I Modelos de Regressão Linear Simples e Múltipla Determinar quando a análise de regressão é adequada, suas limitações. Saber interpretar os resultados da análise. Entender e aplicar a análise de regressão para estimações, previsões. Testes estatísticos Previsão, estimação e explicação com regressão linear múltipla Suposições da análise de regressão Interpretação dos resultados Exercícios
Análise de agrupamento Entender o conceito de similaridade entre observações, entender como identificar grupos homogêneos de indivíduos, segmentos e perfis de grupos de indivíduos obtidos. Entender as diferentes técnicas de agrupamento. Objetivos da análise de agrupamento Técnicas de agrupamentos Identificação de grupos e escolha do número de grupos Interpretação dos grupos e perfis que os compõem Técnicas de Classificação Determinar quando a análise de discriminante ou a regressão logística são adequadas. Entender suas limitações. Saber interpretar os resultados da análise. Criar modelos discriminantes e avaliar sua capacidade discriminante, classificatória ou preditiva. Aprender a comparar e testar os modelos para escolha do melhor modelo. Objetivos da regressão logística e análise discriminante Suposições da análise discriminante Identificação e discriminação e classificação de grupos Estimação e previsão através de regressão logística Interpretação dos resultados Comparação e testes dos modelos de regressão e análise discriminante para escolha do melhor modelo Disciplina 4 Estatística Aplicada II Árvore de Decisão Apresentar como a árvore de decisão pode ser utilizada para classificação Principais Distribuições Discretas Principais Distribuições Contínuas Tipos de amostragem e seleção de amostras Casual simples Sistemática Estratificada Conglomerados PPS- Probability Proportional to Size Séries Temporais Entender as formas iniciais de análise exploratória dos dados. Tomar contato com os dados e entender o conjunto de dados obtidos, sua qualidade, seu poder explicativo. Estudar a qualidade dos dados e sua aplicabilidade em um processo de Data Mining. Serão discutidas as formas de exploração e reconhecimento dos dados extraídos, análise de formas de distribuição. População e amostras Distribuições Amostrais: - Estimação - Teste de Hipótese - Teste de Hipótese não paramétrico Vantagens e desvantagens da amostra e do censo
Módulo III - Modelos de Data Mining Disciplina 5 Tópicos Especiais de Data Mining I Acesso e Modelagem de dados para negócios Discutir sobre técnicas e ferramentas de tecnologia de informação para criação, acesso e preparo dos dados para data mining. São explorados conceitos de modelagem de bancos de dados, de acesso a dados. Conceitos de Business Intelligence - Apresentação dos conceitos e objetivos da Business Intelligence - Datawarehouses, datamarts e infra-estrutura para inteligência de negócios - Fases de um projeto de modelagem de negócios; organização e papeis em um projeto; erros a evitar Requisitos de Informação - Determinação dos requisitos de informação - Apresentação de caso para trabalho em grupo - Trabalho em grupo para determinação de requisitos de informação Modelagem Dimensional - Modelagem dimensional - Estrutura dos modelos para inteligência de negócios - Particularidades da modelagem dimensional Alimentação e exploração de dados: - Mercado de softwares para BI - Apresentação de caso prático Análise de Dados com as Ferramentas e Técnicas de Data Mining Apresentar as ferramentas atuais de data mining e explorá-las a partir de informações relativas a aspectos econômicos, financeiros e de mercado. São utilizadas uma ou mais das ferramentas de data mining. Discutir casos aplicados em empresas de diversos setores. Introdução ao Data Mining Este módulo tem como objetivo, mostrar ao participante uma visão geral dos conceitos e objetivos das técnicas de Data Mining O que é Data Mining Data Mining e Tecnologia de Informática Data Mining e Estatística O Processo de Data Mining Softwares para Data Mining Ferramentas de data mining Apresentar as principais ferramentas e produtos de Data Mining existentes no mercado. O que é Data Mining Noções de Clementine Noções de Entreprise Miner Outros pacotes de Data Mining
Credit Scoring Uma das aplicações críticas de data mining na área financeira é o apoio à gestão de risco de crédito. Esta disciplina visa discutir a análise de dados e a construção de modelos de avaliação de risco de crédito através das técnicas mais adequadas a esta aplicação (regressão logística, redes neurais e árvore de decisão) Objetivos da Análise Descrição dos dados Explorando os dados Construção de Modelos: - Modelos de Regressão Logística - Modelos de Arvores de Decisão - Modelos de Redes Neurais Comparação de Modelos Relatórios de Sumarização Disciplina 6 Tópicos Especiais de Data Mining II Algoritmos genéticos A técnica de algoritmos genéticos tem sido usados de maneira integrada às redes neurais tanto para a geração de novas entradas de dados quanto para a geração de novas redes. Esta disciplina propõe apresentar esta técnica e discutir exemplos de aplicação. Conceito de Algoritmos genéticos Conceito de mutação genética Aplicação de algoritmos genéticos em Data Mining Redes Neurais As redes neurais são uma poderosa técnica de estruturação de conhecimento a partir de dados. Esta disciplina tem por objetivo expor os principais modelos de redes neurais e suas aplicações em gestão. Pretende explorar modelos de classificação e de previsão tanto em aplicações financeiras como de marketing. O que são redes neurais e quais aplicações Arquiteturas de redes neurais Modelos multicamadas Construção de aplicações com redes neurais Métodos analíticos para análise de dados Identificação automática de conglomerados (automatic cluster detection) Mostrar de que maneira podem ser utilizados os métodos de detecção automática de clusters para identificação de grupos homogêneos de indivíduos. Objetivos da análise Métodos de detecção Identificação de grupos Softwares de detecção automática Exercícios de aplicação
Link Analysis Apresentar de que maneira a técnica de análise de cestos de compras permite identificar grupos de itens de venda que tendem a ocorrerem em uma mesma transação de compra. Discutir a construção dos modelos. Objetivos da análise Descrição dos dados Análise exploratória de dados Construindo modelos: - Modelos loglineares - Regras de Associação Arvore de Decisão Apresentar o uso de árvore de decisão em problemas de gestão, as técnicas e aplicações de árvore de decisão mais utilizadas. Aplicações de árvore de decisão Modelos de árvore de decisão (CART, CHAID, outras variações) Softwares de árvore de regressão Exemplos e exercícios de aplicação de árvore de decisão Estudos de Caso Carga Horária e Localização O curso possui uma carga horária de 460 horas. Sendo 360 horas de aula e 100 horas para elaboração individual de TCC (trabalho de conclusão de curso). O curso terá carga horária semanal de 8 horas, ministradas à noite as terças e quintas. Horário das aulas: 19:00 horas às 23:00 horas. Localização: FIA Unidade Vila Olímpia Rua do Rocio, 109 Público Alvo Destina-se a profissionais das áreas de administração, economia, engenharia, medicina, direito, tecnologia da informação que buscam desenvolver suas competências no processo de análise quantitativa de dados bem como conduzir a implantação desta atividade na empresa. Certificação A Faculdade FIA de Administração e Negócios mantida pela Fundação Instituto de Administração, responsável pelo Certificado expedirá o Certificado a que farão jus os alunos que obtiverem presença mínima de 75% da carga horária total do curso, e simultaneamente frequência mínima de 50% das aulas ministradas por disciplina, e nota igual ou superior a 7 nas disciplinas, bem como no trabalho de conclusão do curso.