Introdução ao Data Mining. Sumário
|
|
- Maria das Graças Aranha Salgado
- 6 Há anos
- Visualizações:
Transcrição
1 Introdução ao Data Mining Instituto Nacional de Estatística de Abril de 2009 Módulo 1 - Data Warehousing e Data Mining - André Falcão (afalcao@di.fc.ul.pt) Graça Gaspar (gg@di.fc.ul.pt) Sumário Data-mining e sistemas de apoio à decisão Integração de sistemas de Informação Data-warehousing especificidades face aos sistemas de bases de dados normais Interrogações analíticas Conceitos de data-mining Perspectiva histórica Conceitos Objectivos Tarefas Problemas Plataformas 2 1
2 Data mining FAQ O que é data mining? A extração não trivial de informação implícita, previamente desconhecida e potencialmente útil (Frawley and Piatetsky-Shapiro 1992) A ciencia de extrair informação útil de grandes bancos de daos O que podemos conseguir com data mining? Os métodos de Data mining procuram detectar padrões e extrair modelos dos dados. Qualquer padrão ou modelo é uma simplificação da realidade e assim tem um erro associado. Assim, para a grande maioria dos casos não há sucesso absoluto Será que posso usr data mining para resolver os meus problemas? Depende! Existem dados suficientes para serem analisados? São os dados de qualidade?existe um problema válido para investigar? (não trivial nem impossível)uma resposta negativa a qualquer destas questões pode impedir o uso destas técnicas, caso contrário o uso de data mining pode ser a solução! 3 Enquadramento histórico Data mining ao longo do tempo... De Estatística 80s-90s com a vulgarização dos computadores e a promessa da Inteligência Artificial - Machine learning 2000s Com a proliferação de grandes centros de dados - Data mining Os mesmos conceitos, terminologia ocasionalmente diferente! 4 2
3 Data warehousing e Data mining Data Warehousing: Consolidação de dados de muitas fontes num único repositório. Carregamento, sincronização periódica de réplicas. Integração Semântica. Modelo analítico: Interrogações complexas, baseadas em operações típicas de folhas de cálculo com vistas multidimensionais sobre os dados. Data Mining: Análise exploratória; pescar tendências interessantes e anomalias. 5 Data Warehouses Dados integrados, referentes a longos períodos, muitas vezes aumentados com informação de sumarização. Frequentemente com vários terabytes. Tempos de resposta interactivos para interrogações muito complexas; actualizações ad-hoc muito pouco comuns. 6 3
4 DW e OLAP Data warehouses possibilitam análise de dados actuais e históricos com o objectivo de encontrar padrões que suportem a estratégia seguida. Análise complexa, interactiva, exploratória de grandes conjuntos de dados obtidos por integração das várias fontes da organização (por vezes externas). OLAP (On-Line Analytic Processing): Dados são fundamentalmente estáticos. Interrogações Longas só de leitura. Define-se por contraposição a OLTP (On-Line Transaction Processing) 7 OLAP vs OLTP OLTP - On line transaction processing Muitas e pequenas Transações (interrogações e updates) Exemplos: Update do saldo Inscrição numa acção de formação Acrescentar CD ao carrinho de compras Interrogações agem sobre pequenas quantidades de dados de cada vez Actualizações frequentes OLAP On-Line Analytical processing Transações longas, interrogações complexas Exemplos: Total de vendas para cada departamento por mês Identificar quais os CDs mais vendidos Quais as acções com menos de 10 formandos? Interrogações usam enormes quantidades de informação Actualizações pouco frequentes O maior problema é geralmente o uso concorrente Cada interrogação pode envolver muitos recursos 8 4
5 Esquema de DW Sistemas típicos OLTP têm esquemas descentralizados A marca típica de um DW é o Esquema em Estrela (Star Schema) As dimensões aparecem à volta das tabelas de factos centrais 9 Não misturar OLAP com OLTP (I) Diferentes requisitos de desempenho Processamento de transações (OLTP) Tempo de resposta importante Os dados devem estar sempre actuais e serem consistentes Análise de dados (OLAP) Interrogações consumem muitos recursos (CPU, memória e largura de banda) Operam geralmente numa imagem estática dos dados Interrogações OLAP podem dificultar e atrasar interrogações OLTP. Exemplo: Pedido com a soma das vendas pode fazer um lock à tabela de vendas => Novas transações ficam bloqueadas! 10 5
6 Não misturar OLAP com OLTP (II) Diferentes requisitos na modelação dos dados Para processamento de transações (OLTP) Esquema normalizado para consistência Modelos de dados complexos; muitas tabelas Número limitado de interrogações habituais e updates Análise de dados (OLAP) A simplicidade dos dados é fundamental Permite a utilizadores não técnicos fazer interrogações à vontade Esquemas desnormalizados são comuns Poucas junções: Melhoria no desempenho das interrogações Poucas tabelas: O esquema relacional é mais fácil de ser compreendido 11 Não misturar OLAP com OLTP (III) Análise requer dados de muitas fontes Um sistema OLTP está orientado para poucos processos E.g., actualização de contas num banco Um sistema OLAP integra informação de muitos processos: Combinar vendas, compras e inventário Analisar volumes de negócio de várias sucursais É frequente o aparecimento do histórico em OLAP Identificação de padrões a longo prazo Mudanças de padrões com o tempo Terminologia e os esquemas variam entre fontes de dados Integração de dados de várias fontes é um desafio importante e parte constituinte de qualquer sistema de DW 12 6
7 Modelo de dados multidimensional Produto (chave: pid), Localização (locid), Tempo (timeid). 13 Modelação dimensional Os eixos do cubo correspondem aos atributos dos dados Vendas Discretos ou categóricos Dimensões Células contêm medidas agregadas E.g., total de vendas, número de unidades Factos É frequente aparecerem muito mais que 3 dimensões Café Chá Coi Por Cacau Lis Abr Mai Jun 14 7
8 Interrogações OLAP Uma operação comum é agregar uma medida segundo uma ou mais dimensões. Obter o total das vendas. Obter totais de vendas para cada cidade e cada região. Obter os 5 principais produtos em volume de vendas. Pivoting: Agregação selectiva em múltiplas dimensões. Pivoting em Localização e Tempo resulta em: Total Nte Sul Total Interrogações OLAP (II) Roll-up: Agregação em níveis diferentes de uma dimensão da hierarquia Dado o total das vendas por cidade, obter por Rollup as vendas por região. Drill-down: a inversa de roll-up. Dado o total de vendas por região, drill-down para obter o total de vendas por cidade. Por drill-down noutra dimensão, obter o total das vendas por produto para cada estado. Slicing and Dicing: operações que designam restrições por igualdade e intervalo numa ou mais dimensões. 16 8
9 Exemplo OLAP (I) Pivotagem de género/rendimento Drill-down com a raça (dados AdultUCI) 17 Exemplo OLAP (II) Slice and dice 18 9
10 Data Mining Data mining descoberta de informação e padrões em dados (Knowledge Discovery from Data KDD) Métodos Analíticos Métodos Inferênciais (preditivos) Processo de Descoberta de Conhecimento Selecção obtenção de dados de várias fontes Pré-processamento e limpeza Transformação para um formato comum Data mining Ajustamento de Modelos Interpretação e avaliação OLTP Systems Data warehouse Data Mining ETL Selection and browsing 19 Data Mining Termo genérico que se aplica a vários tipos de análise exploratória. Regras de Associação, Árvores de decisão, Classificação, Agrupamento, Redes de Bayes para inferência de causalidade, Visualização. Relacionado com aprendizagem e estatística, mas com o ênfase nas metodologias de análise e algoritmos para processamento de grandes conjuntos de dados. Problema clássico : Market Basket Analysis: Que factores condicionam o aparecimento de outros, descobertos por análise de quantidades colossais de dados. E.g. {fraldas} => {cerveja} 20 10
11 Objectivos Objectivos no uso de data mining Detecção de dependências Saber que atributos dependem de outros Modelação de comportamentos ou eventos Análise de séries temporais e previsão Classificação Detecção de outliers (registos atípicos) Inferência de valores em falta 21 Tarefas básicas Interpretação e análise OLAP Estatísticas e métodos gráficos (visualização) Classificação mapeia os dados em grupos ou classes pre-definidas Classificação supervisionada Reconhecimento de padrões Predição Regressão usada para mapear uma determinada instância num valor real Clustering agrupa dados semelhantes em grupos Método não supervisionado Segmentação Partição 22 11
12 Técnicas comuns Árvores de decisão Regras de associação Clustering Instance based learning Redes neuronais Máquinas de vectores de suporte 23 Plataformas Plataformas de DW tem módulos de data mining: E.g. Microsoft SQL Server Oracle, IBM, SAP-(Business Objects) Plataformas estatísticas A referência que garante o maior nível de controle, confiança e precisão dos resultados. E.g. SAS SPSS S (S-plus) e R (implementação open source do S) 24 12
13 Problemas em data mining (I) Problemas nos dados Outliers (Ruído, Más medições) Dados irrelevantes Dados alterados Dados que faltam Dados não estruturados (multimedia, texto,...) Problemas nos modelos Selecção de modelos é um procedimento complexo Sobre-ajustamento (overfitting) há modelos que se adaptam bem a a uma população mas não são extrapoláveis a outras Bases de dados muito grandes (certos algoritmos não escalam bem) 25 Problemas em data mining (II) Visualizações não apropriadas Gráficos incompletos ou inapropriados Problemas de escala Interpretações abusivas Correlação NÃO É Causalidade! Decobertas de padrões inexistentes. E.g. Em testes para adivinhar 5 cartas (3 diferentes), 25 pessoas acertaram em todas. Logo 0.25% da população tem Percepção Extra Sensorial Desempenho Certos algoritmos simples não são execuíveis por haver muitos dados (muitas linhas e/ou muitas variáveis) Outros algoritmos de complexidade > O(n 2 ) colapsam mesmo com pouca informação A paralelização de processamento não é opção para muitos algoritmos 26 13
14 Preparação de dados Caracterização dos dados Análise de consistência- verificar se a vriabilidade estatística é independente do domínio Análise do domínio - as variáveis devem ter sentido dentro do campo de estudo Enriquecimento dos dados - dados poderão ser originários de várias fontes Análise de distribuições - pesar od dados de acordo com a sua frequência Transformação dos dados - A informação pode ser transformada para uma outra representação (e.g., escalamento, normalização, ACP) Tratamento de valores em falta - Decidir o que fazer com a informação em falta 27 14
Aula 02. Evandro Deliberal
Aula 02 Evandro Deliberal evandro@deljoe.com.br https://www.linkedin.com/in/evandrodeliberal Data Warehouse; Ambiente de Data Warehouse; Processos e ferramentas envolvidas; Arquiteturas de DW; Granularidade;
Leia maisInformática. Business Intelligence (BI), Data Warehouse, OLAP e Data Mining. Prof. Márcio Hunecke
Informática Business Intelligence (BI), Data Warehouse, OLAP e Data Mining Prof. Márcio Hunecke Conceitos de BI Conjunto de ferramentas e técnicas que objetivam dar suporte à tomada de decisão Refere-se
Leia maisSistemas de Apoio à Decisão
Sistemas de Informação e Bases de Dados 2012/2013 Sistemas de Apoio à Decisão Alberto Sardinha Sumário! Data Warehouse! OLAP! Exemplo de OLAP com SQL Server Business Intelligence Development Studio! 2012
Leia maisBases de Dados 2013/2014. Sistemas de Apoio à Decisão: Armazéns de Dados e Prospecção de Dados. Helena Galhardas. Sumário
Bases de Dados 2013/2014 Sistemas de Apoio à Decisão: Armazéns de Dados e Prospecção de Dados Helena Galhardas Sumário Sistemas de Apoio à Decisão Modelo multidimensional Operações OLAP Índices para OLAP
Leia maisConceitos Básicos. Processamento Analítico de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri Prof. Dr. Ricardo Rodrigues Ciferri
Conceitos Básicos Processamento Analítico de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri Prof. Dr. Ricardo Rodrigues Ciferri Data Warehousing Engloba arquiteturas, algoritmos e ferramentas que possibilitam
Leia maisTópicos Especiais em Informática Fatec Indaiatuba 13/07/2017
Inteligência de Negócios Fatec Indaiatuba Prof. Piva Compreender as definições e conceitos básicos da Mineração de Dados (MD) Entender o processo KDD (Knowledge Discovery Data) e MD Descrever as etapas
Leia maisBancos de Dados IV. OLAP e Cubos de Dados. Rogério Costa
Bancos de Dados IV OLAP e Cubos de Dados Rogério Costa rogcosta@inf.puc-rio.br 1 OLAP Online Analytical Processing (OLAP) Análise interativa de dados, permitindo que dados sejam sumarizados e vistos de
Leia maisTÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE
TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE Engenharia de Computação Professor: Rosalvo Ferreira de Oliveira Neto O processo de descoberta do conhecimento - KDD Roteiro Introdução Definição Etapas Desafios
Leia maisSBC - Sistemas Baseados em Conhecimento
Siglas, Símbolos, Abreviaturas DW - Data Warehouse KDD Knowledge Discovery in Database MD Mineração de Dados OLAP - On-line analytical processing SBC - Sistemas Baseados em Conhecimento 1. INTRODUÇÃO O
Leia maisMotivação. Análise de Dados. BD x DW OLTP. Data Warehouse. Revisão Quais as diferenças entre as tecnologias de BD e DW? OLAP Modelos Multidimensionais
Data Warehouse Análise de Dados Motivação Revisão Quais as diferenças entre as tecnologias de BD e? Modelos Multidimensionais BD x OLTP dados volume dados granularidade dados atualização dados uso Característica
Leia maisRoteiro da apresentação
Alexandre Schlöttgen Data Warehouse Curso de Pós Graduação em Ciência da Computação Tópicos Avançados em Modelos de Banco de Dados Profs: Clésio Santos e Nina Edelweiss Junho de 2003 Roteiro da apresentação
Leia maisKDD E MINERAÇÃO DE DADOS
KDD E MINERAÇÃO DE DADOS O Processo de KDD: Visão Geral Prof. Ronaldo R. Goldschmidt ronaldo@de9.ime.eb.br rribeiro@univercidade.br geocities.yahoo.com.br/ronaldo_goldschmidt CARACTERIZAÇÃO ÁREAS DE ORIGEM
Leia maisDescoberta de Conhecimento em Bancos de Dados - KDD
Descoberta de Conhecimento em Bancos de Dados - KDD Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Fases do processo 3. Exemplo do DMC 4. Avaliação
Leia maisExtração de Conhecimento & Mineração de Dados
Extração de Conhecimento & Mineração de Dados Nesta apresentação é dada uma breve introdução à Extração de Conhecimento e Mineração de Dados José Augusto Baranauskas Departamento de Física e Matemática
Leia maisData Analytics Prevenção e deteção de Fraude
www.pwc.pt Data Analytics Prevenção e deteção de Fraude 21 Agenda Auditoria Interna e Fraude Agenda Introdução à Fraude Papel da Auditoria Interna Cases Studies Data Analytics Exemplos Reconhecer 3 Conceito
Leia maisData Mining. O Processo de KDD. Mauricio Reis
1 Data Mining O Processo de KDD Mauricio Reis prof_uva@mreis.info http://mreis.info/uva-2016-9-datamining 2 ROTEIRO 1. Definição 2. Aplicação KDD problema recursos resultados 3. Área de origem 4. Histórico
Leia maisSISTEMAS DE APOIO À INTELIGÊNCIA DE NEGÓCIOS
SISTEMAS DE APOIO À INTELIGÊNCIA DE NEGÓCIOS http://www.uniriotec.br/~tanaka/sain tanaka@uniriotec.br Introdução a OLAP Material baseado em originais de Maria Luiza Campos NCE/UFRJ Atualizado com publicações
Leia maisKDD E MINERAÇÃO DE DADOS
KDD E MINERAÇÃO DE DADOS O Processo de KDD: Visão Geral Prof. Ronaldo R. Goldschmidt Instituto Militar de Engenharia Seção de Engenharia de Computação (SE/8) ronaldo.rgold@ime.eb.br / ronaldo.rgold@gmail.com
Leia maisMineração de Dados - Contextualização. Fonte: Prof. Fabrício J. Barth -
Mineração de Dados - Contextualização Fonte: Prof. Fabrício J. Barth - http://fbarth.net.br/ Mineração de Dados - Contextualização Uso da informação Síntese do conhecimento; Manter, disseminar, organizar,
Leia maisSumário. 1 Introdução 2 BD Orientado a Objetos 3 BD Objeto-Relacional 4 Noções Básicas de Data Warehouse 5 XML e BD XML. Motivação
Sumário 1 Introdução 2 BD Orientado a Objetos 3 BD Objeto-Relacional Noções Básicas de Data Warehouse 5 XML e BD XML Motivação Sistemas de Apoio à Decisão Objetivo análise de dados históricos da organização
Leia maisBancos de Dados IV. Data Warehouse Conceitos. Rogério Costa
Bancos de Dados IV Data Warehouse Conceitos Rogério Costa rogcosta@inf.puc-rio.br 1 Data Warehouse - O que é? Conjunto de dados orientados por assunto, integrado, variável com o tempo e nãovolátil Orientado
Leia maisInteligência nos Negócios (Business Inteligente)
Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 4: OLAP) Fundamentação da disciplina Analise de dados
Leia maisGESTÃO DE DADOS NAS ORGANIZAÇÕES. Prof. Robson Almeida
GESTÃO DE DADOS NAS ORGANIZAÇÕES Prof. Robson Almeida INFRA-ESTRUTURA DE SISTEMAS DE INFORMAÇÃO 3 CONCEITOS Bit: Menor unidade de dados; dígito binário (0,1) Byte: Grupo de bits que representa um único
Leia maisFundamentos de sistemas de informação
Fundamentos de sistemas de informação Unidade 2 - Conceitos básicos de aplicações nas empresas (cont.) Unidade 3 - Tipos de Sistemas de apoio às decisões 1 Ética e TI Fraudes; Crimes eletrônicos; Ameaças
Leia maisRoteiro. PCC142 / BCC444 - Mineração de Dados. Cenário
Roteiro PCC142 / BCC444 - Mineração de Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br www.decom.ufop.br/luiz Introdução Tarefas
Leia maisData Mining. Rodrigo Leite Durães
Rodrigo Leite Durães rodrigo_l_d@yahoo.com.br Processo de mineração de dados e descoberta de informações relevantes em grandes volumes de dados. "... processo não-trivial de identificar, em dados, padrões
Leia maisFenómeno da globalização
Fenómeno da globalização Estamos num mundo em que tudo é possível a qualquer hora e em qualquer lugar Uma empresa não pode ser verdadeiramente global sem ter uma rede de comunicações excelente Um negócio
Leia maisFundamentos da Inteligência de Negócios: Gerenciamento da Informação e de Bancos de Dados by Prentice Hall
Fundamentos da Inteligência de Negócios: Gerenciamento da Informação e de Bancos de Dados 5.1 2007 by Prentice Hall A Abordagem de Banco de Dados para Gerenciamento de Dados Banco de dados: conjunto de
Leia maisData Warehousing: Conceitos Básicos e Arquitetura
Data Warehousing: Conceitos Básicos e Arquitetura Profa. Dra. Cristina Dutra de Aguiar Ciferri Prof. Dr. Ricardo Rodrigues Ciferri Visão do Mercado Crescimento explosivo do uso da tecnologia de data warehousing
Leia maisMaterial Complementar - BI. Grinaldo Lopes de Oliveira Curso Superior de Tecnologia em Análise e Desenvolvimento de Sistemas
Material Complementar - BI Grinaldo Lopes de Oliveira (grinaldo@gmail.com) Curso Superior de Tecnologia em Análise e Desenvolvimento de Sistemas Business Intelligence - Conceito Coleta de dados a partir
Leia maisModelagem Multidimensional
Modelagem Multidimensional Processamento Analítico de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri Prof. Dr. Ricardo Rodrigues Ciferri Modelagem Multidimensional Análises dos usuários de SSD representam
Leia maisKDD, Mineração de Dados e Algoritmo Apriori
Universidade Federal de São Carlos - UFSCar Departamento de Computação - DC Programa de Pós-Graduação em Ciência da Computação - PPGCC KDD, Mineração de Dados e Algoritmo Apriori Aluno: Rodrigo Moura J.
Leia maisDecisão Suporte: Warehousing, OLAP e Data Mining
Decisão Suporte: Warehousing, OLAP e Data Mining 7-1 Introdução Cada vez mais, organizações estão analizando dados correntes e históricos para identificar padrões úteis e suporte a estratégias de negócios.
Leia maisDecisão Suporte: Warehousing, OLAP e Data Mining
Decisão Suporte: Warehousing, OLAP e Data Mining 7-1 Introdução Cada vez mais, organizações estão analizando dados correntes e históricos para identificar padrões úteis e suporte a estratégias de negócios.
Leia maisSistemas de Suporte à Decisão. Suporte à Decisão X Operacional. Banco de Dados Avançado. Data Warehouse. Data Warehouse & Data Mart
Sistemas de Suporte à Decisão Sistemas de Suporte a Decisão (SSD) Permitem armazenar e analisar grandes volumes de dados para extrair informações que auxiliam a compreensão do comportamento dos dados Armazenar
Leia maisMineração de Dados em Biologia Molecular
Mineração de Dados em Biologia Molecular Tópicos André C. P. L. F. de Carvalho Monitor: Valéria Carvalho Data Warehouse e Data warehousing Data warehouse Sistemas de BD online Cubo de dados Operações com
Leia maisMotivação e Conceitos Básicos
Motivação e Conceitos Básicos Processamento Analítico de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri Prof. Dr. Ricardo Rodrigues Ciferri Data Warehousing Engloba arquiteturas, algoritmos e ferramentas
Leia maisFerramenta de Suporte a Decisão caracterizada por Consultas OLAP
Ferramenta de Suporte a Decisão caracterizada por Consultas OLAP Daniel Ricardo Batiston Orientador: Evaristo Baptista Seqüência da apresentação Introdução Objetivos Fundamentação Teórica Sistema atual
Leia maisData Warehousing: Conceitos Básicos e Arquitetura
Data Warehousing: Conceitos Básicos e Arquitetura Profa. Dra. Cristina Dutra de Aguiar Ciferri Prof. Dr. Ricardo Rodrigues Ciferri Visão do Mercado Crescimento explosivo do uso da tecnologia de data warehousing
Leia mais2 Mineração de Dados Processo de Busca de Conhecimento (KDD) 2 Mineração de Dados
2 Mineração de Dados 2 Mineração de Dados A mineração de dados, ou data mining, é uma das principais etapas do processo de busca de conhecimento. Este conceito é utilizado para identificar técnicas avançadas
Leia maisData Mining. Rodrigo Leite Durães
Data Mining Rodrigo Leite Durães Introdução Aplicação de processos de análise inteligentes visando manipulação automática de quantidades imensas de dados Larga aplicação nos mais variados ramos da indústria,
Leia maisO QUE É O BIG DATA? Big Data é o termo que descreve uma quantidade enorme de informações (volume de dados). BIG DATA ALGORITMOS 2
O QUE É O BIG DATA? Big Data é o termo que descreve uma quantidade enorme de informações (volume de dados). BIG DATA ALGORITMOS 2 O QUE É O BIG DATA? Os dados são o novo petróleo O Big Data, tal como o
Leia maisSEFAZ INFORMÁTICA Olap Prof. Márcio Hunecke
SEFAZ INFORMÁTICA Olap Prof. Márcio Hunecke www.acasadoconcurseiro.com.br Informática OLAP Partindo dos primórdios da informatização, quando um sistema que gerava relatórios era a principal fonte de dados
Leia maisAprendizagem de Máquina. Prof. Júlio Cesar Nievola PPGIA - PUCPR
Aprendizagem de Máquina Prof. Júlio Cesar Nievola PPGIA - PUCPR Introdução Justificativa Recente progresso em algoritmos e teoria Disponibilidade crescente de dados online Poder computacional disponível
Leia maisEvandro Deliberal Aula 01
Evandro Deliberal evandro@deljoe.com.br https://www.linkedin.com/in/evandrodeliberal http://www.deljoe.com.br/professor Aula 01 Agenda DATA MINING. Data mining Motivações Grande disponibilidade de dados
Leia maisTÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE
TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE Engenharia de Computação Professor: Rosalvo Ferreira de Oliveira Neto OLPT x OLAP Roteiro OLTP Datawarehouse OLAP Operações OLAP Exemplo com Mondrian e Jpivot
Leia maisMetodologia de Desenvolvimento de Sistemas Informação
Instituto Superior Politécnico de Ciências e Tecnologia Metodologia de Desenvolvimento de Sistemas Informação Prof Pedro Vunge http://pedrovunge.com I Semestre de 2019 Capítulo 2 TECNOLOGIAS PARA DATA
Leia maisData Warehousing. João Gama
Data Warehousing João Gama jgama@ncc.up.pt Motivação O modelo relacional de BD (3FN) foi desenhado para: Flexibilidade para extensões. Eficiência no processamento on-line de transacções. Perspectiva do
Leia maisInteligência nos Negócios (Business Inteligente)
Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 5) Fundamentação da disciplina Analise de dados Decisões
Leia maisO que é preciso para ser Cientista de Dados?
O que é preciso para ser Cientista de Dados? Cássio Socal Cervo Administração de Empresas - PUCRS Ciências Contábeis - PUCRS MBA Gerenciamento de Projetos - FGV/Decision MBA Big Data e Analytics - FGVSP
Leia maisEAD-0750 INTELIGÊNCIA DE NEGÓCIOS. Prof. Sérgio Luiz de Oliveira Assis
H3 EAD-0750 INTELIGÊNCIA DE NEGÓCIOS Prof. Sérgio Luiz de Oliveira Assis sergioassis@usp.br 07 Agenda 1. Visão Geral do Processo ETL 2. Características da área staging 3. A fase 1 do ETL Carga do DW 4.
Leia maisMetodologia CRISP-DM. NeuroTech Ltda.
Metodologia CRISP-DM NeuroTech Ltda. www.neurotech.com.br Conteúdo Metodologias para Mineração de Dados A metodologia CRISP-DM Exemplo de um Projeto de Mineração de Dados Exercício Prático Gerência de
Leia maisAprendizado de Máquina (Machine Learning)
Ciência da Computação (Machine Learning) Aula 01 Motivação, áreas de aplicação e fundamentos Max Pereira Nem todo conhecimento tem o mesmo valor. O que torna determinado conhecimento mais importante que
Leia maisANALYTICS: Dados e Atenção
ANALYTICS: Dados e Atenção O CONCEITO DE ANALYTICS NA INTERNET DAS COISAS BASEIA-SE NA CONSTANTE GERAÇÃO DE DADOS Por Nazareno Andrade Deyvison Bruno, Icaro Ramires, Joabe Pinheiro 1 Agenda Informações
Leia maisFACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS
FACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS PROJETO PEDAGÓGICO CAMPO LIMPO PAULISTA 2015 1. Público
Leia maisModelagem Multidimensional
Profa. Dra. Cristina Dutra de Aguiar Ciferri Prof. Dr. Ricardo Rodrigues Ciferri Análises dos usuários de SSD representam requisições multidimensionais aos dados do DW permitem a identificação de problemas
Leia maisAula 03. Evandro Deliberal
Aula 03 Evandro Deliberal evandro@deljoe.com.br https://www.linkedin.com/in/evandrodeliberal Data Warehouse; Ambiente de Data Warehouse; Processos e ferramentas envolvidas; Arquiteturas de DW; Granularidade;
Leia maisInteligência nos Negócios (Business Inteligente)
Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 4: OLAP) Fundamentação da disciplina Analise de dados
Leia maisBusiness Intelligence :
Business Intelligence : Tecnologia da Informação a serviço do suporte decisório nas organizações. Extraído dos trabalhos de Pablo Passos e Grimaldo Lopes Roteiro Planejamento Estratégico Evitando a Desinformação
Leia maisInteligência do Negócio
Inteligência do Negócio DENISE NEVES 2017 PROFA.DENISE@HOTMAIL.COM Inteligência do Negócio Objetivo Primeiro Bimestre Apresentar ao aluno as etapas de projeto de Business Intelligence. Introdução a Inteligência
Leia maisArquitetura de um Ambiente de Data Warehousing
Arquitetura de um Ambiente de Data Warehousing Processamento Analítico de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri Prof. Dr. Ricardo Rodrigues Ciferri OLAP: Fonte: Arquitetura Vaisman, A., Zimányi,
Leia maisSEFAZ INFORMÁTICA Data Mining Prof. Márcio Hunecke
SEFAZ INFORMÁTICA Data Mining Prof. Márcio Hunecke www.acasadoconcurseiro.com.br Informática DATA MINING Data mining (ou mineração de dados) é o processo de extrair informação válida, previamente desconhecida
Leia maisDesafios na modelação do fluxo de estudantes no sistema de ensino Português
Desafios na modelação do fluxo de estudantes no sistema de ensino Português Luís Correia, Luís Cavique, Ana Paula Cláudio, Beatriz Carmo, Hugo Martiniano, Helena Aidos, Sara Madeira Fórum Estatístico 14
Leia maisBancos de Dados IV. Arquiteturas. Rogério Costa
Bancos de Dados IV Arquiteturas Rogério Costa rogcosta@inf.puc-rio.br 1 Arquiteturas para DW DW Virtuais Fortemente Acoplada (Empresa Inteira) Fracamente Acoplada Arquiteturas para DW DW Virtuais São visões
Leia maisIntrodução ao Data Warehousing e Business Intelligence
INTEGRAÇÃO E PROCESSAMENTO ANALÍTICO DE INFORMAÇÃO Introdução ao Data Warehousing e Business Intelligence António Manuel Silva Ferreira UNIVERSIDADE DE LISBOA FACULDADE DE CIÊNCIAS DEPARTAMENTO DE INFORMÁTICA
Leia maisIntrodução ao Data Mining (Mineração de Dados)
Introdução ao Data Mining (Mineração de Dados) Quem é da área de TI, provavelmente já ouviu sobre Data Mining, mesmo que não saiba o que é. É uma das últimas modas relacionados à BD. Para se ter uma noção
Leia maisPÓS-GRADUAÇÃO LATO SENSU. Curso: Banco de Dados. Disciplina: Laboratório de Data Warehouse e Business Intelligence Professor: Fernando Zaidan
PÓS-GRADUAÇÃO LATO SENSU Curso: Banco de Dados Disciplina: Laboratório de Data Warehouse e Business Intelligence Professor: Fernando Zaidan Unidade 31 2016 Crédito dos Slides: Clever Junior 2 História
Leia maisB A N C O D E D A D O S G E O G R Á F I C O S M A R C O N I D E A R R U D A P E R E I R A
Mineração de Dados Espaciais B A N C O D E D A D O S G E O G R Á F I C O S M A R C O N I D E A R R U D A P E R E I R A Roteiro 2 Introdução Mineração de Dados Estado da Arte Artigo apresentado Conclusão
Leia maisOLAP. Rodrigo Leite Durães.
OLAP Rodrigo Leite Durães. rodrigo_l_d@yahoo.com.br OLAP Definição OLAP (Online analytical processing) é uma categoria de tecnologia de software que possibilita a visualização dos dados armazenados, segundo
Leia maisAgenda. Conceitos Iniciais. Modelos de aprendizado. Oportunidades e casos de uso. Ferramentas. Desafios
Machine Learning Agenda Conceitos Iniciais Modelos de aprendizado Oportunidades e casos de uso Ferramentas Desafios Ronald Bertele Bacharelado em Ciências da Computação - UCS MBA em Gestão de Negócios
Leia maisInteligência nos Negócios (Business Inteligente)
Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 3) Fundamentação da disciplina Analise de dados Decisões
Leia maisSumários das Aulas Teóricas de Análise Inteligente de Dados
Sumários das Aulas Teóricas de Análise Inteligente de Dados N.º Data Sumário Bibliografia de Lição 1 2007/09/173 Apresentação dos conteúdos programáticos e objectivos da disciplina. Normas de avaliação,
Leia maisRoteiro. PCC142 / BCC444 - Mineração de Dados. Por que pré-processar os dados? Introdução. Limpeza de Dados
Roteiro PCC142 / BCC444 - Mineração de Dados Introdução Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br www.decom.ufop.br/luiz
Leia maisData Warehouse Mineração de Dados
Data Warehouse Mineração de Dados Profa. Roberta Macêdo M. Gouveia robertammg@gmail.com 1 18/12/2014 Data Warehouse Data Mining Big Data A mina de ouro debaixo dos bits 2 Data Warehouse: A Memória da Empresa
Leia maisIntrodução à Descoberta de Conhecimento e Mineração de Dados. Rodrigo Leite Durães.
Introdução à Descoberta de Conhecimento e Mineração de Dados Rodrigo Leite Durães. 1 Introdução 2 3 Introdução: por que Data Mining? O problema da explosão da quantidade de dados (data explosion): Ferramentas
Leia maisQualidade. Ana Madureira
Qualidade Ana Madureira Qualidade da Informação A qualidade de uma informação é apreciada em função da sua pertinência (adaptação às necessidades do sistema de gestão). Três características permitem medir
Leia maisSQL. Processamento Analítico de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri Prof. Dr. Ricardo Rodrigues Ciferri
SQL Processamento Analítico de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri Prof. Dr. Ricardo Rodrigues Ciferri Arquitetura de 3 Camadas esquema operações conceitual metáfora do cubo de dados Cube
Leia maisCampus Capivari Análise e Desenvolvimento de Sistemas (ADS) Prof. André Luís Belini /
Campus Capivari Análise e Desenvolvimento de Sistemas (ADS) Prof. André Luís Belini E-mail: prof.andre.luis.belini@gmail.com / andre.belini@ifsp.edu.br MATÉRIA: SIG Aula N : 06 Tema: Fundamentos da inteligência
Leia maisPlano de Estudos. Escola: Instituto de Investigação e Formação Avançada Grau: Programa de Doutoramento Curso: Informática (cód.
Plano de Estudos Escola: Instituto de Investigação e Formação Avançada Grau: Programa de Doutoramento Curso: Informática (cód. 264) 1. o Ano - 1. o Semestre INF9258D Iniciação à Investigação Informática
Leia maisArquitetura de um Ambiente de Data Warehousing
Arquitetura de um Ambiente de Data Warehousing Processamento Analítico de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri Prof. Dr. Ricardo Rodrigues Ciferri Arquitetura Típica usuário usuário... usuário
Leia maisArquitetura de um Ambiente de Data Warehousing
Arquitetura de um Ambiente de Data Warehousing Processamento Analítico de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri Prof. Dr. Ricardo Rodrigues Ciferri Arquitetura Típica usuário usuário... usuário
Leia maisBusiness Intelligence (BI)
Business Intelligence (BI) Conceitos Iniciais Professor: Aurisan Santana CONTEÚDO DO CURSO Business Intelligence (BI): Introdução, Histórico e Conceitos Dado, Informação e Conhecimento Data Warehouse (DW)
Leia maisMineração de Dados e Aprendizado de Máquinas. Rodrigo Leite Durães.
Mineração de Dados e Aprendizado de Máquinas. Rodrigo Leite Durães. O que é mineração de dados Mineração de Dados é um passo no processo de KDD que consiste na aplicação de análise de dados e algoritmos
Leia maisAlternativas para a Interoperabilidade entre Sistemas de Informação Universitários
Faculdade de Engenharia da Universidade do Porto Alternativas para a Interoperabilidade entre Sistemas de Informação Universitários Sérgio Sobral Nunes Dissertação realizada sob a supervisão do Professor
Leia maisDATA WAREHOUSE. Rafael Ervin Hass Raphael Laércio Zago
DATA WAREHOUSE Rafael Ervin Hass Raphael Laércio Zago Roteiro Introdução Aplicações Arquitetura Características Desenvolvimento Estudo de Caso Conclusão Introdução O conceito de "data warehousing" data
Leia maisData Mining: Conceitos e Técnicas
Data Mining: Conceitos e Técnicas DM, DW e OLAP Data Warehousing e OLAP para Data Mining O que é data warehouse? De data warehousing para data mining Data Warehousing e OLAP para Data Mining Data Warehouse:
Leia maisESPECIALIZAÇÃO A DISTÂNCIA EM. Ciência de Dados e Big Data Aplicada à Administração Tributária. Área de conhecimento: Tecnologia da Informação
ESPECIALIZAÇÃO A DISTÂNCIA EM Ciência de Dados e Big Data Aplicada à Administração Tributária Área de conhecimento: Tecnologia da Informação PUC MINAS VIRTUAL CORPO DOCENTE Raphael Rodrigues Campos (Mestre)
Leia maisIntrodução à teoria de Data Warehouse. Prof. Rodrigo Leite Durães
Introdução à teoria de Data Warehouse Prof. Rodrigo Leite Durães rodrigo_l_d@yahoo.com.br Organizações: necessidade de INFORMAÇÃO para tomada de decisões Exemplos: FACULDADE - abertura de mais vagas para
Leia maisMineração de Dados para Detecção de Padrões de Mudança de Cobertura da Terra. Padrões e processos em Dinâmica de uso e Cobertura da Terra
Mineração de Dados para Detecção de Padrões de Mudança de Cobertura da Terra Padrões e processos em Dinâmica de uso e Cobertura da Terra Introdução 1 2 3 4 Capacidade de Armazenamento X Análise e Interpretação
Leia maisQualificando decisões de negócio. Entendendo Business Intelligence
Qualificando decisões de negócio Entendendo Business Intelligence Qualificando decisões de negócio Sobre a Sol7 Primeira empresa brasileira especializada em soluções de Business Intelligence baseados em
Leia maisTCE Informática Pré-Processamento de Dados Prof. Marcelo Ribeiro
TCE Informática Pré-Processamento de Dados Prof. Marcelo Ribeiro www.acasadoconcurseiro.com.br Informática PRÉ-PROCESSAMENTO DE DADOS EM DATA MINING Técnicas de pré-processamento e transformação de dados
Leia maisSQL. Processamento Analítico de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri Prof. Dr. Ricardo Rodrigues Ciferri
SQL Processamento Analítico de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri Prof. Dr. Ricardo Rodrigues Ciferri Arquitetura de 3 Camadas esquema operações conceitual metáfora do cubo de dados Cube
Leia maisPÓS-GRADUAÇÃO LATO SENSU. Curso: Banco de Dados. Disciplina: Data Warehouse e Business Intelligence Professor: Fernando Zaidan
PÓS-GRADUAÇÃO LATO SENSU Curso: Banco de Dados Disciplina: Data Warehouse e Business Intelligence Professor: Fernando Zaidan Unidade 2.2 - Cubos 2016 ACOMPANHAMENTO IMPLEMENTAÇÃO 9 8 7 TESTE 6 CONTACTO
Leia maisíndice 2. Vetores e Tipos Primitivos PARTE 1- O Sistema R 1. Introdução ao Sistema R
índice Os Autores Prólogo XI XIII PARTE 1- O Sistema R 1. Introdução ao Sistema R 1.1. O que é o R? 1.2. Instalar o R 1.3. Edição de Comandos e Ambientes de Desenvolvimento 1.. Objetos, Funções e Packages
Leia maisAula 02: Conceitos Fundamentais
Aula 02: Conceitos Fundamentais Profa. Ms. Rosângela da Silva Nunes 1 de 26 Roteiro 1. Por que mineração de dados 2. O que é Mineração de dados 3. Processo 4. Que tipo de dados podem ser minerados 5. Que
Leia maisInteligência de Negócios Profa.Denise
Inteligência de Negócios Profa.Denise Bancos de Dados Multidimensionais A finalidade de bases de dados multidimensionais (alguns autores chamam de dimensionais) é fornecer subsídio para realização de análises.
Leia maisFerramentas de front-end no mercado. Carlos Sousa, Elivelton Delfino, Jeann Pereira e Jorge Bastos
Ferramentas de front-end no mercado Carlos Sousa, Elivelton Delfino, Jeann Pereira e Jorge Bastos Introdução Conhecidas também por: ferramentas OLAP, surgiram no final da década de 90; São ferramentas
Leia maisPráticas de Contagem. - Data Warehouse. - Workflow. - Mudança de tipo. - Drop-down. - Mudança de tamanho de campo. - Mudança de domínio
FATTO Consultoria e Sistemas - www.fattocs.com.br 1 Práticas de Contagem - Data Warehouse - Workflow - Mudança de tipo - Drop-down - Mudança de tamanho de campo - Mudança de domínio FATTO Consultoria e
Leia maisBanco de Dados Data Mining Data Warehouse Big Data
Universidade Estadual de Mato Grosso do Sul Curso de Computação, Licenciatura Banco de Dados Data Mining Data Warehouse Big Data Prof. José Gonçalves Dias Neto profneto_ti@hotmail.com Data Mining: Introdução
Leia mais