Introdução à Descoberta de. Dados. Professor Celso A A Kaestner, Dr. Eng.

Tamanho: px
Começar a partir da página:

Download "Introdução à Descoberta de. Dados. Professor Celso A A Kaestner, Dr. Eng."

Transcrição

1 Introdução à Descoberta de Conhecimento e Mineração de Dados Professor Celso A A Kaestner, Dr. Eng. 1

2 Site: 2

3 Introdução 3

4 Pesquisa Tradicional Dirigida a Hipóteses 1. Hipótese (Projeto) 2. Experimento 3. Dados (Análise de Dados) 4.Resultados 4

5 Ciência Dirigida por Dados Processo / Experimento DADOS Sem Hipóteses a Priori Nova Ciência de Dados 5

6 Bioinformática Datasets: Genomas Estrutura de Proteínas DNA/Arrays de Proteínas Etc. Ciência Integradora Biologia Sistêmica Biologia de Redes 6

7 Astro-Informática Nova Astronomia: Universo Local vs. Distante Objetos Exóticos/Raros Censo de núcleos ativos de galáxias Busca de planetas extra-solares 7

8 Ecologia Informática Análise de dados ecológicos complexos de um conjunto altamente distribuído de estações de campo, sites de pesquisa, laboratórios, etc. 8

9 Geo-Informática 9

10 Química-Informática Descritores Estruturais Descritores Fisioquímicos Descritores Topológicos Descritores Geométricos 10

11 Economia e Finanças 11

12 World Wide Web 12

13 Introdução: por que Data Mining? O problema da explosão da quantidade de dados (data explosion): Ferramentas de armazenamento automático e a maturidade da tecnologia de banco de dados, bem como o advento da Internet, levaram à criação de imensas massas de dados em data bases, data warehouses e em outros repositórios. 13

14 Introdução: por que Data Mining? 1 byte = 8 bits; 1 Kbyte = bytes; 1 Mbyte ~= bytes; 1 Gbyte ~= bytes; 1 Terabyte ~= = bytes 1 EB = 1 exabyte ~= Tbytes Qual o tamanho das bases de dados? Qual o tamanho da internet? 14

15 Introdução: por que Data Mining? Fonte: Curso de Piatetsky-Shapiro 15

16 Introdução: por que Data Mining? Tamanho da Internet (2003, em Terabytes): Surface Web 167 Deep Web (originals) Instant messaging 274 TOTAL Fonte: How Much Information

17 Introdução: por que Data Mining? Tamanho da Internet indexada: no mínimo bilhões de páginas (Monday, 02 August, 2010) Ver: 1. size/size-indexable-web.pdf

18 Introdução: por que Data Mining? Estamos nos afogando em dados, mas sedentos por informação! 18

19 Introdução: por que Data Mining? A solução: data warehousing e data mining: Data warehousing e on-line analytical processing (OLAP); Extração de conhecimentos interessantes (regras, regularidades, padrões, restrições) a partir das grandes bases de dados. 19

20 Introdução: evolução da tecnologia dos BD 1960s: Coleta de dados, criação de bancos de dados, IMS e DBMS em rede; 1970s: Modelo de dados relacional, implementação de DBMS relacionais; 1980s: RDBMS, modelos de dados avançados (relacional estendido, OO, dedutivo, etc.) e DBMS orientados à aplicação (espaciais, científicos, para engenharia, etc.) 1990s 2000s: Data mining and data warehousing, DBMS multimídia e Web DB; Atual: consolidação da tecnologia, escalabilidade 20

21 Introdução: o que é data mining? Data mining (descoberta de conhecimento em BD): Extração de padrões de informação de interesse: 1. não-trivial, 2. implícita, 3. previamente desconhecida e 4. potencialmente útil, de grandes DBs. 21

22 Introdução: o que é data mining? Dilbert explica... 22

23 Introdução: o que é data mining? Conceitos relacionados: Descoberta de conhecimento em BD (KDD), extração de conhecimento, análise de padrões em dados, information harvesting, business intelligence, etc. O que não é data mining? Data Warehousing; OLAP; Processamento dedutivo de consultas; Sistemas especialistas e pequenos programas estatísticos e de aprendizagem de máquina. 23

24 Introdução: o que é data mining? Gartner Group: Data mining is the process of discovering meaningful new correlations, patterns and trends by sifting through large amounts of data stored in repositories, using pattern recognition technologies as well as statistical and mathematical techniques. 24

25 Introdução: potenciais aplicações Análise de DB e suporte à decisão: Análise e gerenciamento de mercado: Marketing dirigido, gerenciamento de relações com consumidores, análise de mercado, vendas cruzadas, segmentação de mercado; Análise e gerenciamento de risco: Previsões, retenção de clientes, controle de qualidade, análise de competitividade; Análise e gerenciamento de fraudes. 25

26 Introdução: potenciais aplicações Outras aplicações: Mineração de textos (documentos, s, news) e Web mining. Resposta inteligente a consultas. 26

27 Análise e gerenciamento de mercado Onde estão as fontes de dados para análise? Transações com cartões de crédito, cartões de fidelidade, cupons de desconto, requisições de clientes e estudos sobre o estilo de vida dos clientes. Marketing dirigido: Encontra grupos de clientes modelo que compartilham as mesma características: interesses, salário, hábitos de consumo, etc. 27

28 Análise e gerenciamento de mercado Determinação de padrões de compra ao longo do tempo: Conversão de conta simples para conjunta, casamento, etc. Análise de vendas cruzadas: Associações e correlações entre vendas de produtos; Predição baseada na informação de associações. 28

29 Análise e gerenciamento de mercado Perfil do consumidor: data mining pode informar que tipos de consumidores compram quais produtos (agrupamento ou classificação); Identificação dos requisitos dos clientes: Identificação dos melhores produtos para os diferentes clientes; Uso de predição para encontrar quais fatores atrairão os consumidores; 29

30 Análise e gerenciamento de mercado Fornecimento de informação sumarizada: Relatórios multidimensionais sumarizados; Informações estatísticas sumarizadas (tendência central e variação dos dados) 30

31 Análise corporativa e gerenciamento de risco Planejamento financeiro e avaliação de crédito: Análise e previsão de fluxo de caixa; Análise contingente para avaliação de crédito; Análise seccional e temporal (razão financeira, análise de tendência, etc.) Planejamento de recursos: Sumarização e comparação de recursos e gastos; Competição: Monitoramento de competidores e mercado; Agrupamento de clientes em classes e procedimentos de preços baseados em classes; Estratégias para fixação de preços em mercado competitivo. 31

32 Detecção e gerenciamento de fraudes Aplicações: Amplamente utilizado em serviços de cartões de crédito, telefonia celular, convênios de saúde, etc. Abordagem: Uso de dados históricos para construir modelos do comportamento fraudulento e uso de data mining para identificar instâncias similares; 32

33 Detecção e gerenciamento de fraudes Exemplos: Seguros de automóveis: detectar um grupo de pessoas que forjam acidentes para ganhar o seguro; Lavagem de dinheiro: detecção de transações suspeitas de dinheiro (US Treasury's Financial Crimes Enforcement Network) Seguros médicos: detecção de pacientes profissionais e grupos de doutores coniventes. 33

34 Detecção e gerenciamento de fraudes Detecção de tratamento médico inapropriado: A Australian Health Insurance Commission identificou que em muitos casos exames desnecessários eram solicitados (economia de AD$1milhão /ano). Detecção de fraudes telefônicas: Modelo de chamadas telefônicas: destino da chamada, duração, horário e dia da semana; análise de padrões para detectar desvios; A British Telecom identificou grupos de clientes com chamadas freqüentes dentro do grupo, especialmente em telefones celulares, e detectou uma fraude milionária. 34

35 Detecção e gerenciamento de fraudes Venda a varejo: Analistas estimam que 38% das perdas no varejo são devidas a empregados desonestos. 35

36 Esportes: Outras aplicações IBM Advanced Scout analisou as estatísticas dos jogos da NBA (cestas, bloqueios, assistências, faltas, etc) para auxiliar os times do New York Knicks e do Miami Heat; Astronomia: JPL e o Observatório do Monte Palomar descobriram 22 quasars com o auxílio de data mining; Bioinformática: Projeto Genoma e seus derivados. 36

37 Outras aplicações Ajuda ao uso da Internet, comércio eletrônico: IBM Surf-Aid aplica algoritmos de data mining a logs de acessos Web à páginas de vendas, de forma a descobrir preferências e comportamentos dos clientes e efetuar análise da efetividade do Web marketing, melhorar a organização do site Web, etc. (ex-) Blue Martini Company... Amazon, Google... 37

38 A Web como fonte de aplicações Num site de comércio eletrônico, serve canal de negócios e laboratório; Limitado como canal de compra (valor do bem, segurança, privacidade...); Como laboratório serve para testar campanhas, novos produtos, avaliar clientes, etc. 38

39 A Web como fonte de aplicações A amostra de clientes de tendenciosa; O comportamento na internet não é o mesmo do presencial; O custo de um site é elevado; Muitos robôs de busca... (fonte: palestra de Ron Kohavi) 39

40 Análise da Web (fonte: palestra de Ron Kohavi) Tráfego na Web (10/46) por dia do mês; Por dia da semana (11/46); Exemplo por ponto de venda (POS) (12/46); Por hora (13/46); Um exemplo espúreo (14/46); Campanhas por s (20/46); Estudos demográficos (25/46); Robôs de busca (28/46); 40

41 Análise da Web (fonte: palestra de Ron Kohavi) Estatística por visita (29/46); Privacidade (32/46); Exemplos de melhorias (41/46). 41

42 KDD e DM 42

43 Data Mining e Business Intelligence Increasing potential to support business decisions Making Decisions End User Data Presentation Visualization Techniques Data Mining Information Discovery Data Exploration Statistical Analysis, Querying and Reporting Business Analyst Data Analyst Data Warehouses / Data Marts OLAP, MDA Data Sources Paper, Files, Information Providers, Database Systems, OLTP DBA 43

44 KDD e Data Mining Data mining é o coração do processo KDD Data Mining Pattern Evaluation Task-relevant Data Data Warehouse Selection Data Cleaning Data Integration Databases 44

45 KDD e Data Mining Data Pre- Processing Data Mining Post- Processing Integração de Dados Normalização Seleção de atributos Redução de dimensionalidade Descoberta de padrões Associação & correlação Classificação Agrupamento Análise de desvios Avaliação, Seleção, Interpretação e Visualização de padrões Visão simplificada do processo de KDD 45

46 Passos do processo de KDD Estudo sobre o domínio de aplicação: Conhecimento relevante a priori e metas da aplicação; Criação de um dataset alvo: Seleção de dados; Limpeza e pré-processamento dos dados: Pode corresponder a 60 % do esforço; Redução e transformação dos dados: Encontrar atributos relevantes, redução de dimensionalidade, representação de invariantes; 46

47 Passos do processo de KDD Escolha da função de data mining: Sumarização, classificação, regressão, associação, regressão, agrupamento... Escolha do algoritmo de mineração: Busca aos padrões de interesse; Avaliação dos padrões e apresentação do conhecimento: Visualização, transformação, remoção de redundâncias, etc. Uso do conhecimento descoberto. 47

48 Arquitetura de um sistema de DM típico Graphical user interface Pattern evaluation Data mining engine Database or data warehouse server Data cleaning & data integration Filtering Knowledge-base Databases Data Warehouse 48

49 Alguns conceitos fundamentais Instância (item ou registro): Um exemplo, descrito por certo número de atributos: um dia descrito por temperatura, umidade e situação das nuvens; Atributo (característica ou campo): Medida de aspectos de uma instância, como o valor da temperatura; Classe (Rótulo): Agrupamento de instâncias, e.g. dias bons para jogar tênis 49

50 Alguns conceitos fundamentais Base de treinamento: Conjunto de exemplos utilizado para a geração do procedimento / estrutura que servirá para a aplicação em outros casos; Base de testes: Conjunto de exemplos que será utilizado para verificar a eficiência do procedimento de DM gerado. 50

51 Alguns conceitos fundamentais Desafio principal: Encontrar padrões verdadeiros nos dados e evitar o overfitting (padrões que parecem significantes mas são aleatórios ou que só funcionam para o conjunto de treinamento dado) 51

52 DM: em que dados? DB relacionais: Data warehouses; DB tradicionais; DB de transações; DB avançados e repositórios de informação; DB Orientados a Objeto e DB Objeto-Relacionais; DB espaciais; Séries temporais e dados temporais; DB legados e heterogêneos; A Web... 52

53 DM: funcionalidades Associação (correlação e causalidade) Associação multi-dimensional x uni- dimensional; idade(x, )^ ganhos(x, K ) => compra (X, PC ) [suporte = 2%, confiança = 60%] 53

54 DM: regras de associação TID Produce Transações 1 MILK, BREAD, EGGS 2 BREAD, SUGAR 3 BREAD, CEREAL 4 MILK, BREAD, SUGAR 5 MILK, CEREAL 6 BREAD, CEREAL 7 MILK, CEREAL 8 MILK, BREAD, CEREAL, EGGS 9 MILK, BREAD, CEREAL Conjuntos de itens frequentes Milk, Bread (4) Bread, Cereal (3) Milk, Bread, Cereal (2) Regras: Milk => Bread (66%) 54

55 DM: funcionalidades Descrição de conceitos: caracterização e discriminação: Dados podem ser associados em classes; A caracterização de uma classe ou sua discriminação em relação a outras classes é potencialmente útil; Generalização, sumarização, contraste das características dos dados são os objetivos. 55

56 DM: funcionalidades Classificação e predição: Encontrar modelos (funções) que descrevem e distinguem classes ou conceitos para futura predição; Ex: classificar países conforme o clima ou carros conforme o consumo; Apresentação: árvore de decisão, regra de classificação, rede neural; Predição: de valor numérico desconhecido ou perdido; 56

57 DM: classificação Principais abordagens: Estatísticas, Árvores de decisão, redes neurais 57

58 DM: funcionalidades Agrupamento (clustering): O rótulo (nome) da classe é desconhecido: devese agrupar os dados para formar classes; Ex: agrupamento de casas para encontrar padrões de distribuição; O agrupamento é baseado na maximização da similaridade intra-classe e minimização da similaridade inter-classes. 58

59 DM: agrupamento Encontrar agrupamentos naturais das instâncias em dados não-rotulados 59

60 DM: funcionalidades Análise de desvios (outlier analysis): Desvio (outlier): objeto que não está em conformidade com o comportamento geral dos dados; Pode ser considerado como ruído ou exceção mas é útil no caso da detecção de fraudes, análise de eventos raros, etc. 60

61 DM: detecção de outliers Encontrar instâncias inesperadas 61

62 Sumarização; Visualização; DM: funcionalidades Análise de tendências e evolução: Tendência e desvio: análise de regressão DM seqüencial, análise de periodicidade; Análise baseada em similaridade; Outras análises estatísticas e de reconhecimento de padrões. 62

63 DM: sumarização n Descrição de características de um grupo; n Usa de linguagem natural e gráfica; n Usualmente em combinação com a deteção de desvios ou outros métodos. 63

64 DM: visualização Visualizar adequadamente conjuntos de dados, facilitando a análise 64

65 Todos os padrões descobertos são interessantes? Um sistema de DM pode gerar milhares de padrões, nem todos interessantes; Abordagem sugerida: centrada no usuário, baseada em consultas, dirigindo a mineração; Medidas do grau de interesse: Um padrão é interessante se for facilmente compreendido, válido no conjunto de dados novo / de teste com certo grau de certeza, potencialmente útil e anteriormente desconhecido, ou validando alguma hipótese que se deseja confirmar; 65

66 Todos os padrões descobertos são interessantes? Medidas de interesse objetivas e subjetivas: Objetivas: baseadas em estatísticas e na estrutura doa padrões, e.g., suporte, confiança; Subjetivas: baseadas na crença do usuário nos dados, e.g., novidade, não-expectativa, etc. 66

67 Todos os padrões interessantes são encontrados? Completude: encontrar todos os padrões interessantes: O sistema pode encontrar todos os padrões interessantes? Associação x classificação x agrupamento. Otimização: busca apenas dos padrões interessantes: O sistema pode encontrar somente padrões interessantes? Abordagens: Encontrar todos os padrões e descartar (filtrar) os não interessantes; Gerar apenas padrões interessantes: otimização de consultas de mineração. 67

68 DM: um campo multidisciplinar Database Technology Statistics Machine Learning Data Mining Visualization Information Science Other Disciplines 68

69 DM: esquemas de classificação Funcionalidade geral: DM descritivo; DM preditivo. Visões diferentes, classificações diferentes: Tipos de DB a serem minerados; Tipos de conhecimentos a serem descobertos; Técnicas a serem utilizadas; Tipos de aplicações alvo. 69

70 Uma visão multidimensional da classificação de DM DB a serem minerados: DB relacional, transacional, OO, OR, ativo, espacial, sérietemporal, textual, multimídia, herdado, heterogêneo, Web... Conhecimento a ser minerado: Caracterização, agrupamento, associação, classificação, discriminação, tendência, desvios... Funções integradas e mineração em níveis múltiplos; Técnicas utilizadas: Orientada à DB, data warehouse (OLAP), aprendizagem de máquina (ML), estatística, visualização... Aplicações alvo: Varejo, telecomunicações, fraudes, DNA mining, Web mining... 70

71 OLAP mining: uma integração de data warehousing e DM Acoplamento dos sistemas de DM, DBMS e data warehouse; Sem acoplamento, fracamente acoplados, semi-acoplados, acoplados; On-line analytical mining (OLAM): Integração das tecnologias de OLAP e DM; Mineração interativa e conhecimento multi-níveis: Necessidade de minerar conhecimento e padrões em diferentes níveis de abstração utilizando drilling / rolling, etc. Integração de múltiplas funções de mineração: Classificação caracterizada, primeiro agrupamento e depois associação. 71

72 Mining query OLAM Engine Uma arquitetura OLAM User GUI API Data Cube API Mining result OLAP Engine Layer4 User Interface Layer3 OLAP/OLAM MDDB Meta Data Layer2 MDDB Filtering&Integration Databases Database API Data cleaning Data integration Filtering Data Warehouse Layer1 Data Repository 72

73 Pontos centrais em DM Metodologia de mineração e interação com o usuário: Mineração de diferentes tipos de conhecimento nas DB; Mineração interativa em vários níveis de abstração; Incorporação de conhecimento de fundo (background knowledge); Linguagens de consulta para DM e DM ad-hoc; Visualização e apresentação dos resultados de DM; Manuseio de dados incompletos e de ruídos; Avaliação dos padrões: o problema do interesse. Performance e escalabilidade: Eficiência e escalabilidade dos algoritmos de DM; Métodos de DM paralelo, distribuído e incremental. 73

74 Pontos centrais em DM Pontos relacionados à diversidade de tipos de dados: Manuseio de dados relacionais e complexos; Mineração de fluxos de informação de DB heterogêneas e de sistemas de informação globais (Web). Pontos relacionados às aplicações e impactos sociais: Aplicações de descoberta de conhecimento: Ferramentas de DM para domínios específicos; Resposta inteligente a consultas; Controle de processos e processo decisório. Integração do conhecimento descoberto ao conhecimento existente: o problema da fusão de conhecimentos; Proteção de dados, segurança, integração e privacidade. 74

75 Sumário Data mining: descoberta de padrões interessantes em grandes quantidades de dados; DM é uma evolução natural da tecnologia de DB, com grande número de possíveis aplicações; O processo de KDD inclui a limpeza, integração, seleção e transformação dos dados, data mining, avaliação dos padrões e apresentação do conhecimento; A mineração pode ser executada em vários repositórios de informação; Funcionalidades do DM: caracterização, discriminação, associação, classificação, agrupamento, desvios, análise de tendências, etc. Classificação dos sistemas de DM; Pontos centrais em DM. 75

76 Referências J. Han, M. Kamber. Data Mining: Concepts and Techniques. Morgan Kaufmann, R. Goldschmidt; E. Passos. Data Mining: um Guia Prático. Editora Campus, I.H.Witten, E. Frank. Data Mining: Practical Machine Learning Tools and Techniques with JAVA Implementations. Morgan Kaufmann, P. Adriaans, D. Zantinge. Data Mining. Addison-Wesley, U. M. Fayyad, G. Piatetsky-Shapiro, P. Smyth, and R. Uthurusamy. Adv.in Knowledge Discovery and Data Mining. AAAI/MIT Press, A. Berson, S.J. Schimdt. Data Warehousing, Data Mining & OLAP. McGraw-Hill, G. Piatetsky-Shapiro and W. J. Frawley. Knowledge Discovery in Databases. AAAI/MIT Press,

Aula 02: Conceitos Fundamentais

Aula 02: Conceitos Fundamentais Aula 02: Conceitos Fundamentais Profa. Ms. Rosângela da Silva Nunes 1 de 26 Roteiro 1. Por que mineração de dados 2. O que é Mineração de dados 3. Processo 4. Que tipo de dados podem ser minerados 5. Que

Leia mais

Introdução à Descoberta de Conhecimento e Mineração de Dados. Rodrigo Leite Durães.

Introdução à Descoberta de Conhecimento e Mineração de Dados. Rodrigo Leite Durães. Introdução à Descoberta de Conhecimento e Mineração de Dados Rodrigo Leite Durães. 1 Introdução 2 3 Introdução: por que Data Mining? O problema da explosão da quantidade de dados (data explosion): Ferramentas

Leia mais

Data Mining: Conceitos e Técnicas

Data Mining: Conceitos e Técnicas Data Mining: Conceitos e Técnicas DM, DW e OLAP Data Warehousing e OLAP para Data Mining O que é data warehouse? De data warehousing para data mining Data Warehousing e OLAP para Data Mining Data Warehouse:

Leia mais

Prof. Msc. Paulo Muniz de Ávila

Prof. Msc. Paulo Muniz de Ávila Prof. Msc. Paulo Muniz de Ávila O que é Data Mining? Mineração de dados (descoberta de conhecimento em bases de dados): Extração de informação interessante (não-trivial, implícita, previamente desconhecida

Leia mais

4. Que tipos de padrões podem ser minerados. 5. Critérios de classificação de sistemas de Data Mining. 6. Tópicos importantes de estudo em Data Mining

4. Que tipos de padrões podem ser minerados. 5. Critérios de classificação de sistemas de Data Mining. 6. Tópicos importantes de estudo em Data Mining Curso de Data Mining - Aula 1 1. Como surgiu 2. O que é 3. Em que tipo de dados pode ser aplicado 4. Que tipos de padrões podem ser minerados 5. Critérios de classificação de sistemas de Data Mining 6.

Leia mais

Motivação: inundação de informação. Data warehouse. Inteligência computacional aplicada em finanças, comércio e indústria

Motivação: inundação de informação. Data warehouse. Inteligência computacional aplicada em finanças, comércio e indústria Programa de Especialização em Inteligência Computacional Motivação: inundação de informação Morrendo de sede por conhecimento em um oceano de dados Inteligência computacional aplicada em finanças, comércio

Leia mais

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Planejamento Estratégico de TI. Prof.: Fernando Ascani Planejamento Estratégico de TI Prof.: Fernando Ascani Data Mining Os métodos tradicionais de Data Mining são: Classificação Associa ou classifica um item a uma ou várias classes categóricas pré-definidas.

Leia mais

Microsoft Innovation Center

Microsoft Innovation Center Microsoft Innovation Center Mineração de Dados (Data Mining) André Montevecchi andre@montevecchi.com.br Introdução Objetivo BI e Mineração de Dados Aplicações Exemplos e Cases Algoritmos para Mineração

Leia mais

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse Definição escopo do projeto (departamental, empresarial) Grau de redundância dos dados(ods, data staging) Tipo de usuário alvo (executivos, unidades) Definição do ambiente (relatórios e consultas préestruturadas

Leia mais

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Planejamento Estratégico de TI. Prof.: Fernando Ascani Planejamento Estratégico de TI Prof.: Fernando Ascani Data Warehouse - Conceitos Hoje em dia uma organização precisa utilizar toda informação disponível para criar e manter vantagem competitiva. Sai na

Leia mais

Ferramentas Livres de Armazenamento e Mineração de Dados

Ferramentas Livres de Armazenamento e Mineração de Dados Ferramentas Livres de Armazenamento e Mineração de Dados JasperBI, Pentaho, Weka 09/2009 Eng. Pablo Jorge Madril pmadril@summa.com.br Summa Technologies www.summa.com.br Eng. Pablo Jorge Madril pmadril@summa.com.br

Leia mais

Mineração de Dados. Prof. Júlio Cesar Nievola Especialização em Inteligência Computacional PPGIA - PUCPR

Mineração de Dados. Prof. Júlio Cesar Nievola Especialização em Inteligência Computacional PPGIA - PUCPR Mineração de Dados PPGIA - PUCPR Agenda 1. Histórico 2. Definições e Características 3. Processo e Tarefas de DM 4. Pré-Processamento 5. Representação do Conhecimento 6. Principais Tarefas 7. Procedimentos

Leia mais

Data Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento

Data Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento Data Mining Prof Luiz Antonio do Nascimento Data Mining Ferramenta utilizada para análise de dados para gerar, automaticamente, uma hipótese sobre padrões e anomalias identificadas para poder prever um

Leia mais

srbo@ufpa.br www.ufpa.br/srbo

srbo@ufpa.br www.ufpa.br/srbo CBSI Curso de Bacharelado em Sistemas de Informação BI Prof. Dr. Sandro Ronaldo Bezerra Oliveira srbo@ufpa.br www.ufpa.br/srbo Tópicos Especiais em Sistemas de Informação Faculdade de Computação Instituto

Leia mais

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Pollyanna Carolina BARBOSA¹; Thiago MAGELA² 1Aluna do Curso Superior Tecnólogo em Análise e Desenvolvimento de Sistemas

Leia mais

Chapter 3. Análise de Negócios e Visualização de Dados

Chapter 3. Análise de Negócios e Visualização de Dados Chapter 3 Análise de Negócios e Visualização de Dados Objetivos de Aprendizado Descrever a análise de negócios (BA) e sua importância par as organizações Listar e descrever brevemente os principais métodos

Leia mais

KDD E MINERAÇÃO DE DADOS:

KDD E MINERAÇÃO DE DADOS: KDD E MINERAÇÃO DE DADOS: Introdução e Motivação Prof. Ronaldo R. Goldschmidt ronaldo@de9.ime.eb.br rribeiro@univercidade.br geocities.yahoo.com.br/ronaldo_goldschmidt Fatos: Avanços em TI e o crescimento

Leia mais

ADMINISTRAÇÃO DOS RECURSOS DE DADOS

ADMINISTRAÇÃO DOS RECURSOS DE DADOS 7 ADMINISTRAÇÃO DOS RECURSOS DE DADOS OBJETIVOS Por que as empresas sentem dificuldades para descobrir que tipo de informação precisam ter em seus sistemas de informação ão? Como um sistema de gerenciamento

Leia mais

Professor: Disciplina:

Professor: Disciplina: Professor: Curso: Esp. Marcos Morais de Sousa marcosmoraisdesousa@gmail.com Sistemas de informação Disciplina: Introdução a SI Noções de sistemas de informação Turma: 01º semestre Prof. Esp. Marcos Morais

Leia mais

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados Universidade Federal de Pernambuco Graduação em Ciência da Computação Centro de Informática 2006.2 Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento

Leia mais

Mineração de Dados: Introdução e Aplicações

Mineração de Dados: Introdução e Aplicações Mineração de Dados: Introdução e Aplicações Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br Apresentação Luiz Merschmann Engenheiro

Leia mais

Banco de Dados Capítulo 1: Introdução. Especialização em Informática DEINF/UFMA Cláudio Baptista

Banco de Dados Capítulo 1: Introdução. Especialização em Informática DEINF/UFMA Cláudio Baptista Banco de Dados Capítulo 1: Introdução Especialização em Informática DEINF/UFMA Cláudio Baptista O que é um Banco de Dados (BD)? É uma coleção de dados relacionados e armazenados em algum dispositivo. Propriedades

Leia mais

Identificar as mudanças que acontecem na forma e no uso de apoio à decisão em empreendimentos de e-business. Identificar o papel e alternativas de

Identificar as mudanças que acontecem na forma e no uso de apoio à decisão em empreendimentos de e-business. Identificar o papel e alternativas de 1 Identificar as mudanças que acontecem na forma e no uso de apoio à decisão em empreendimentos de e-business. Identificar o papel e alternativas de relatórios dos sistemas de informação gerencial. Descrever

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Tipos de aprendizagem 3. Paradigmas de aprendizagem 4. Modos de aprendizagem

Leia mais

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br MINERAÇÃO DE DADOS APLICADA Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br Processo Weka uma Ferramenta Livre para Data Mining O que é Weka? Weka é um Software livre do tipo open source para

Leia mais

Dado: Fatos conhecidos que podem ser registrados e têm um significado implícito. Banco de Dados:

Dado: Fatos conhecidos que podem ser registrados e têm um significado implícito. Banco de Dados: MC536 Introdução Sumário Conceitos preliminares Funcionalidades Características principais Usuários Vantagens do uso de BDs Tendências mais recentes em SGBDs Algumas desvantagens Modelos de dados Classificação

Leia mais

Programa do Curso de Pós-Graduação Lato Sensu MBA em Business Intelligence (BI)

Programa do Curso de Pós-Graduação Lato Sensu MBA em Business Intelligence (BI) Programa do Curso de Pós-Graduação Lato Sensu MBA em Business Intelligence (BI) Apresentação O programa de Pós-graduação Lato Sensu em Business Intelligence Inteligência Competitiva tem por fornecer conhecimento

Leia mais

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO EPE0147 UTILIZAÇÃO DA MINERAÇÃO DE DADOS EM UMA AVALIAÇÃO INSTITUCIONAL

Leia mais

Gerenciamento de Dados e Gestão do Conhecimento

Gerenciamento de Dados e Gestão do Conhecimento ELC1075 Introdução a Sistemas de Informação Gerenciamento de Dados e Gestão do Conhecimento Raul Ceretta Nunes CSI/UFSM Introdução Gerenciando dados A abordagem de banco de dados Sistemas de gerenciamento

Leia mais

Capítulo 1 - A revolução dos dados, da informação e do conhecimento 1 B12 4

Capítulo 1 - A revolução dos dados, da informação e do conhecimento 1 B12 4 Sumário Capítulo 1 - A revolução dos dados, da informação e do conhecimento 1 B12 4 Capítulo 2 - Reputação corporativa e uma nova ordem empresarial 7 Inovação e virtualidade 9 Coopetição 10 Modelos plurais

Leia mais

Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence

Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence É um conjunto de conceitos e metodologias que, fazem uso de acontecimentos e sistemas e apoiam a tomada de decisões. Utilização de várias fontes de informação para se definir estratégias de competividade

Leia mais

Uma estrutura (framework) para o Business Intelligence (BI)

Uma estrutura (framework) para o Business Intelligence (BI) Uma estrutura conceitural para suporteà decisão que combina arquitetura, bancos de dados (ou data warehouse), ferramentas analíticas e aplicações Principais objetivos: Permitir o acesso interativo aos

Leia mais

SAD. Paulo Silva, Rodolfo Ribeiro, Vinicius Tavares

SAD. Paulo Silva, Rodolfo Ribeiro, Vinicius Tavares SAD Paulo Silva, Rodolfo Ribeiro, Vinicius Tavares DataWarehouse Armazena informações relativas a uma organização em BD Facilita tomada de decisões Dados são coletados de OLTP(séries históricas) Dados

Leia mais

Banco de Dados - Senado

Banco de Dados - Senado Banco de Dados - Senado Exercícios OLAP - CESPE Material preparado: Prof. Marcio Vitorino OLAP Material preparado: Prof. Marcio Vitorino Soluções MOLAP promovem maior independência de fornecedores de SGBDs

Leia mais

Laudon & Laudon Essentials of MIS, 5th Edition. Pg. 1.1

Laudon & Laudon Essentials of MIS, 5th Edition. Pg. 1.1 Laudon & Laudon Essentials of MIS, 5th Edition. Pg. 1.1 SISTEMA DE APOIO À DECISÃO Grupo: Denilson Neves Diego Antônio Nelson Santiago Sabrina Dantas CONCEITO É UM SISTEMA QUE AUXILIA O PROCESSO DE DECISÃO

Leia mais

Apresentação, xix Prefácio à 8a edição, xxi Prefácio à 1a edição, xxiii. Parte I - Empresa e Sistemas, 1

Apresentação, xix Prefácio à 8a edição, xxi Prefácio à 1a edição, xxiii. Parte I - Empresa e Sistemas, 1 Apresentação, xix Prefácio à 8a edição, xxi Prefácio à 1a edição, xxiii Parte I - Empresa e Sistemas, 1 1 SISTEMA EMPRESA, 3 1.1 Teoria geral de sistemas, 3 1.1.1 Introdução e pressupostos, 3 1.1.2 Premissas

Leia mais

DATA WAREHOUSE. Rafael Ervin Hass Raphael Laércio Zago

DATA WAREHOUSE. Rafael Ervin Hass Raphael Laércio Zago DATA WAREHOUSE Rafael Ervin Hass Raphael Laércio Zago Roteiro Introdução Aplicações Arquitetura Características Desenvolvimento Estudo de Caso Conclusão Introdução O conceito de "data warehousing" data

Leia mais

INTELIGÊNCIA COMPUTACIONAL

INTELIGÊNCIA COMPUTACIONAL INTELIGÊNCIA COMPUTACIONAL Engenharia de Computação Professor: Rosalvo Ferreira de Oliveira Neto Dados pessoais Rosalvo Ferreira de Oliveira Neto MSc. em ciência da computação (UFPE) rosalvo.oliveira@univasf.edu.br

Leia mais

DATA WAREHOUSE. Introdução

DATA WAREHOUSE. Introdução DATA WAREHOUSE Introdução O grande crescimento do ambiente de negócios, médias e grandes empresas armazenam também um alto volume de informações, onde que juntamente com a tecnologia da informação, a correta

Leia mais

Inteligência de Negócio. Brian Cowhig

Inteligência de Negócio. Brian Cowhig Inteligência de Negócio Brian Cowhig Inteligência de Negócio O Que é Inteligência de Negócio? Três Níveis de Inteligência de Negócio Database Query OLAP Data Mining Produtos de Inteligência de Negócio

Leia mais

Interatividade aliada a Análise de Negócios

Interatividade aliada a Análise de Negócios Interatividade aliada a Análise de Negócios Na era digital, a quase totalidade das organizações necessita da análise de seus negócios de forma ágil e segura - relatórios interativos, análise de gráficos,

Leia mais

Complemento I - Noções Introdutórias em Data Warehouses

Complemento I - Noções Introdutórias em Data Warehouses Complemento I - Noções Introdutórias em Data Warehouses Esse documento é parte integrante do material fornecido pela WEB para a 2ª edição do livro Data Mining: Conceitos, técnicas, algoritmos, orientações

Leia mais

ADMINISTRAÇÃO DOS RECURSOS DE DADOS

ADMINISTRAÇÃO DOS RECURSOS DE DADOS Capítulo 7 ADMINISTRAÇÃO DOS RECURSOS DE DADOS 7.1 2003 by Prentice Hall OBJETIVOS Por que as empresas sentem dificuldades para descobrir que tipo de informação precisam ter em seus sistemas de informação?

Leia mais

Banco de Dados. Introdução. João Eduardo Ferreira Osvaldo Kotaro Takai. jef@ime.usp.br DCC-IME-USP

Banco de Dados. Introdução. João Eduardo Ferreira Osvaldo Kotaro Takai. jef@ime.usp.br DCC-IME-USP Banco de Dados Introdução João Eduardo Ferreira Osvaldo Kotaro Takai jef@ime.usp.br DCC-IME-USP Importância dos Bancos de Dados A competitividade das empresas depende de dados precisos e atualizados. Conforme

Leia mais

Gestão da Informação. Gestão da Informação. AULA 3 Data Mining

Gestão da Informação. Gestão da Informação. AULA 3 Data Mining Gestão da Informação AULA 3 Data Mining Prof. Edilberto M. Silva Gestão da Informação Agenda Unidade I - DM (Data Mining) Definição Objetivos Exemplos de Uso Técnicas Tarefas Unidade II DM Prático Exemplo

Leia mais

Web Data mining com R: aprendizagem de máquina

Web Data mining com R: aprendizagem de máquina Web Data mining com R: aprendizagem de máquina Fabrício Jailson Barth Faculdade BandTec e VAGAS Tecnologia Junho de 2013 Sumário O que é Aprendizagem de Máquina? Hierarquia de aprendizado. Exemplos de

Leia mais

Banco de Dados. Uma coleção de dados relacionados [ELMASRI/NAVATHE]

Banco de Dados. Uma coleção de dados relacionados [ELMASRI/NAVATHE] 1/6 Banco de Dados O que é um Banco de Dados? Uma coleção de dados relacionados [ELMASRI/NAVATHE] Conjunto de dados integrados que tem por objetivo atender a uma comunidade específica [HEUSER] Um conjunto

Leia mais

COLETA DE INFORMAÇÕES E PREVISÃO DE DEMANDA

COLETA DE INFORMAÇÕES E PREVISÃO DE DEMANDA COLETA DE INFORMAÇÕES E PREVISÃO DE DEMANDA 1) Quais são os componentes de um moderno sistema de informações de marketing? 2) Como as empresas podem coletar informações de marketing? 3) O que constitui

Leia mais

MBA em Gestão de Empreendimentos Turísticos

MBA em Gestão de Empreendimentos Turísticos Prof. Martius V. Rodriguez y Rodriguez, DSc martius@kmpress.com.br MBA em Gestão de Empreendimentos Turísticos Gestão do Conhecimento e Tecnologia da Informação Gestão do Conhecimento evolução conceitual.

Leia mais

Adriano Maranhão BUSINESS INTELLIGENCE (BI),

Adriano Maranhão BUSINESS INTELLIGENCE (BI), Adriano Maranhão BUSINESS INTELLIGENCE (BI), BUSINESS INTELLIGENCE (BI) O termo Business Intelligence (BI), popularizado por Howard Dresner do Gartner Group, é utilizado para definir sistemas orientados

Leia mais

Data Warehousing. Leonardo da Silva Leandro. CIn.ufpe.br

Data Warehousing. Leonardo da Silva Leandro. CIn.ufpe.br Data Warehousing Leonardo da Silva Leandro Agenda Conceito Elementos básicos de um DW Arquitetura do DW Top-Down Bottom-Up Distribuído Modelo de Dados Estrela Snowflake Aplicação Conceito Em português:

Leia mais

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO @ribeirord FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO Rafael D. Ribeiro, M.Sc,PMP. rafaeldiasribeiro@gmail.com http://www.rafaeldiasribeiro.com.br Lembrando... Aula 4 1 Lembrando... Aula 4 Sistemas de apoio

Leia mais

INSTITUTO TECNOLÓGICO DE AERONÁUTICA DIVISÃO DE ENGENHARIA ELETRÔNICA LABORATÓRIO DE GUERRA ELETRÔNICA

INSTITUTO TECNOLÓGICO DE AERONÁUTICA DIVISÃO DE ENGENHARIA ELETRÔNICA LABORATÓRIO DE GUERRA ELETRÔNICA INSTITUTO TECNOLÓGICO DE AERONÁUTICA DIVISÃO DE ENGENHARIA ELETRÔNICA LABORATÓRIO DE GUERRA ELETRÔNICA CURSO DE ESPECIALIZAÇÃO EM ANÁLISE DE AMBIENTE ELETROMAGNÉTICO CEAAE /2008 DISCIPLINA EE-09: Inteligência

Leia mais

ADM041 / EPR806 Sistemas de Informação

ADM041 / EPR806 Sistemas de Informação ADM041 / EPR806 Sistemas de Informação UNIFEI Universidade Federal de Itajubá Prof. Dr. Alexandre Ferreira de Pinho 1 Sistemas de Apoio à Decisão (SAD) Tipos de SAD Orientados por modelos: Criação de diferentes

Leia mais

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS VINICIUS DA SILVEIRA SEGALIN FLORIANÓPOLIS OUTUBRO/2013 Sumário

Leia mais

Pós-Graduação Lato Sensu em ENGENHARIA DE MARKETING

Pós-Graduação Lato Sensu em ENGENHARIA DE MARKETING Pós-Graduação Lato Sensu em ENGENHARIA DE MARKETING Inscrições Abertas: Início das aulas: 28/03/2016 Término das aulas: 10/12/2016 Dias e horários das aulas: Segunda-Feira 18h30 às 22h30 Semanal Quarta-Feira

Leia mais

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Planejamento Estratégico de TI. Prof.: Fernando Ascani Planejamento Estratégico de TI Prof.: Fernando Ascani BI Business Intelligence A inteligência Empresarial, ou Business Intelligence, é um termo do Gartner Group. O conceito surgiu na década de 80 e descreve

Leia mais

Padronização de Processos: BI e KDD

Padronização de Processos: BI e KDD 47 Padronização de Processos: BI e KDD Nara Martini Bigolin Departamento da Tecnologia da Informação -Universidade Federal de Santa Maria 98400-000 Frederico Westphalen RS Brazil nara.bigolin@ufsm.br Abstract:

Leia mais

Universidade de Brasília. Faculdade de Ciência da Informação. Prof a Lillian Alvares

Universidade de Brasília. Faculdade de Ciência da Informação. Prof a Lillian Alvares Universidade de Brasília Faculdade de Ciência da Informação Prof a Lillian Alvares Fóruns Comunidades de Prática Mapeamento do Conhecimento Portal Intranet Extranet Banco de Competências Memória Organizacional

Leia mais

Fundamentos dos Sistemas de Informação Organização de Dados e Informações

Fundamentos dos Sistemas de Informação Organização de Dados e Informações Fundamentos dos Sistemas de Informação Organização de Dados e Informações http://professor.fimes.edu.br/milena milenaresende@fimes.edu.br Sistema de Gerenciamento de Bases de Dados (DBMS) A implementação

Leia mais

Extração de Conhecimento & Mineração de Dados

Extração de Conhecimento & Mineração de Dados Extração de Conhecimento & Mineração de Dados Nesta apresentação é dada uma breve introdução à Extração de Conhecimento e Mineração de Dados José Augusto Baranauskas Departamento de Física e Matemática

Leia mais

DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS

DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS Tácio Dias Palhão Mendes Bacharelando em Sistemas de Informação Bolsista de Iniciação Científica da FAPEMIG taciomendes@yahoo.com.br Prof.

Leia mais

Análise do Ambiente estudo aprofundado

Análise do Ambiente estudo aprofundado Etapa 1 Etapa 2 Etapa 3 Etapa 4 Etapa 5 Disciplina Gestão Estratégica e Serviços 7º Período Administração 2013/2 Análise do Ambiente estudo aprofundado Agenda: ANÁLISE DO AMBIENTE Fundamentos Ambientes

Leia mais

APLICATIVOS CORPORATIVOS

APLICATIVOS CORPORATIVOS Sistema de Informação e Tecnologia FEQ 0411 Prof Luciel Henrique de Oliveira luciel@uol.com.br Capítulo 3 APLICATIVOS CORPORATIVOS PRADO, Edmir P.V.; SOUZA, Cesar A. de. (org). Fundamentos de Sistemas

Leia mais

KDD UMA VISAL GERAL DO PROCESSO

KDD UMA VISAL GERAL DO PROCESSO KDD UMA VISAL GERAL DO PROCESSO por Fernando Sarturi Prass 1 1.Introdução O aumento das transações comerciais por meio eletrônico, em especial as feitas via Internet, possibilitou as empresas armazenar

Leia mais

Introdução à Engenharia de Software

Introdução à Engenharia de Software Introdução à Engenharia de Software Professor: Rômulo César romulodandrade@gmail.com www.romulocesar.com.br Imagem Clássica Objetivo da aula Depois desta aula você terá uma visão sobre o que é a engenharia

Leia mais

Data, Text and Web Mining

Data, Text and Web Mining Data, Text and Web Mining Fabrício J. Barth TerraForum Consultores Junho de 2010 Objetivo Apresentar a importância do tema, os conceitos relacionados e alguns exemplos de aplicações. Data, Text and Web

Leia mais

Criação e uso da Inteligência e Governança do BI

Criação e uso da Inteligência e Governança do BI Criação e uso da Inteligência e Governança do BI Criação e uso da Inteligência e Governança do BI Governança do BI O processo geral de criação de inteligência começa pela identificação e priorização de

Leia mais

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan Faculdade INED Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan 1 Unidade 4.5 2 1 BI BUSINESS INTELLIGENCE BI CARLOS BARBIERI

Leia mais

Universidade de Brasília. Faculdade de Ciência da Informação. Profa. Lillian Alvares

Universidade de Brasília. Faculdade de Ciência da Informação. Profa. Lillian Alvares Universidade de Brasília Faculdade de Ciência da Informação Profa. Lillian Alvares Fóruns / Listas de discussão Espaços para discutir, homogeneizar e compartilhar informações, idéias e experiências que

Leia mais

PLANO DE ENSINO PRÉ-REQUISITOS: ENS

PLANO DE ENSINO PRÉ-REQUISITOS: ENS UNIVERSIDADE DO ESTADO DE SANTA CATARINA UDESC CENTRO DE EDUCAÇÃO SUPERIOR DO ALTO VALE DO ITAJAÍ CEAVI PLANO DE ENSINO DEPARTAMENTO: DSI Departamento de Sistema de Informação DISCIPLINA: Data Warehouse

Leia mais

O que é a ciência de dados (data science). Discussão do conceito. Luís Borges Gouveia Universidade Fernando Pessoa Versão 1.

O que é a ciência de dados (data science). Discussão do conceito. Luís Borges Gouveia Universidade Fernando Pessoa Versão 1. O que é a ciência de dados (data science). Discussão do conceito Luís Borges Gouveia Universidade Fernando Pessoa Versão 1.3, Outubro, 2015 Nota prévia Esta apresentação tem por objetivo, proporcionar

Leia mais

Módulo 4: Gerenciamento de Dados

Módulo 4: Gerenciamento de Dados Módulo 4: Gerenciamento de Dados 1 1. CONCEITOS Os dados são um recurso organizacional decisivo que precisa ser administrado como outros importantes ativos das empresas. A maioria das organizações não

Leia mais

Aplicação A. Aplicação B. Aplicação C. Aplicação D. Aplicação E. Aplicação F. Aplicação A REL 1 REL 2. Aplicação B REL 3.

Aplicação A. Aplicação B. Aplicação C. Aplicação D. Aplicação E. Aplicação F. Aplicação A REL 1 REL 2. Aplicação B REL 3. Sumário Data Warehouse Modelagem Multidimensional. Data Mining BI - Business Inteligence. 1 2 Introdução Aplicações do negócio: constituem as aplicações que dão suporte ao dia a dia do negócio da empresa,

Leia mais

Exemplo de Aplicação do DataMinig

Exemplo de Aplicação do DataMinig Exemplo de Aplicação do DataMinig Felipe E. Barletta Mendes 19 de fevereiro de 2008 INTRODUÇÃO AO DATA MINING A mineração de dados (Data Mining) está inserida em um processo maior denominado Descoberta

Leia mais

INTRODUÇÃO E CONCEITOS BÁSICOS. Prof. Ronaldo R. Goldschmidt

INTRODUÇÃO E CONCEITOS BÁSICOS. Prof. Ronaldo R. Goldschmidt INTRODUÇÃO E CONCEITOS BÁSICOS Prof. Ronaldo R. Goldschmidt Hierarquia Dado - Informação - Conhecimento: Dados são fatos com significado implícito. Podem ser armazenados. Dados Processamento Informação

Leia mais

Capítulo. Gestão de recursos de dados

Capítulo. Gestão de recursos de dados Capítulo 3 1 Gestão de recursos de dados 2 Objectivos de aprendizagem ƒ Explicar a importância da implementação, numa empresa, de processos e tecnologias de gestão de recursos de dados. ƒ Compreender as

Leia mais

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI Fernando Luiz de Oliveira 1 Thereza Patrícia. P. Padilha 1 Conceição A. Previero 2 Leandro Maciel Almeida 1 RESUMO O processo

Leia mais

Tópicos Avançados Business Intelligence. Banco de Dados Prof. Otacílio José Pereira. Unidade 10 Tópicos Avançados Business Inteligence.

Tópicos Avançados Business Intelligence. Banco de Dados Prof. Otacílio José Pereira. Unidade 10 Tópicos Avançados Business Inteligence. Tópicos Avançados Business Intelligence Banco de Dados Prof. Otacílio José Pereira Unidade 10 Tópicos Avançados Business Inteligence Roteiro Introdução Níveis organizacionais na empresa Visão Geral das

Leia mais

Pós-Graduação "Lato Sensu" Especialização em Análise de Dados e Data Mining

Pós-Graduação Lato Sensu Especialização em Análise de Dados e Data Mining Pós-Graduação "Lato Sensu" Especialização em Análise de Dados e Data Mining Inscrições Abertas Início das Aulas: 24/03/2015 Dias e horários das aulas: Terça-Feira 19h00 às 22h45 Semanal Quinta-Feira 19h00

Leia mais

Roteiro. BCC321 - Banco de Dados I. Conceitos Básicos. Conceitos Básicos. O que é um banco de dados (BD)?

Roteiro. BCC321 - Banco de Dados I. Conceitos Básicos. Conceitos Básicos. O que é um banco de dados (BD)? Roteiro BCC321 - Banco de Dados I Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br www.decom.ufop.br/luiz Conceitos Básicos Banco

Leia mais

LISTA DE EXERCÍCIOS. 1. Binário: Bit: Menor unidade de dados; dígito binário (0,1) Byte: Grupo de bits que representa um único caractere

LISTA DE EXERCÍCIOS. 1. Binário: Bit: Menor unidade de dados; dígito binário (0,1) Byte: Grupo de bits que representa um único caractere 1. Binário: LISTA DE EXERCÍCIOS Bit: Menor unidade de dados; dígito binário (0,1) Byte: Grupo de bits que representa um único caractere Campo: Grupo de palavras ou um número completo Registro: Grupo de

Leia mais

Prof. Júlio Cesar Nievola Data Mining PPGIa PUCPR

Prof. Júlio Cesar Nievola Data Mining PPGIa PUCPR Uma exploração preliminar dos dados para compreender melhor suas características. Motivações-chave da exploração de dados incluem Ajudar na seleção da técnica correta para pré-processamento ou análise

Leia mais

A Nova Interface do Data Discovery no MicroStrategy 10. Anderson Santos, Sales Engineer Brazil 11/08/2015

A Nova Interface do Data Discovery no MicroStrategy 10. Anderson Santos, Sales Engineer Brazil 11/08/2015 A Nova Interface do Data Discovery no MicroStrategy 10 Anderson Santos, Sales Engineer Brazil 11/08/2015 Empresas participantes do MicroStrategy 10 Beta Test Pela primeira vez na história, MicroStrategy

Leia mais

MATERIAL DIDÁTICO: APLICAÇÕES EMPRESARIAIS SISTEMA DE APOIO À DECISÃO (SAD)

MATERIAL DIDÁTICO: APLICAÇÕES EMPRESARIAIS SISTEMA DE APOIO À DECISÃO (SAD) AULA 07 MATERIAL DIDÁTICO: APLICAÇÕES EMPRESARIAIS SISTEMA DE APOIO À DECISÃO (SAD) JAMES A. O BRIEN MÓDULO 01 Páginas 286 à 294 1 AULA 07 SISTEMAS DE APOIO ÀS DECISÕES 2 Sistemas de Apoio à Decisão (SAD)

Leia mais

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5 Para entender bancos de dados, é útil ter em mente que os elementos de dados que os compõem são divididos em níveis hierárquicos. Esses elementos de dados lógicos constituem os conceitos de dados básicos

Leia mais

Projeto Pedagógico do Bacharelado em Ciência da Computação. Comissão de Curso e NDE do BCC

Projeto Pedagógico do Bacharelado em Ciência da Computação. Comissão de Curso e NDE do BCC Projeto Pedagógico do Bacharelado em Ciência da Computação Comissão de Curso e NDE do BCC Fevereiro de 2015 Situação Legal do Curso Criação: Resolução CONSU no. 43, de 04/07/2007. Autorização: Portaria

Leia mais

As Novas Tecnologias de Dados, Inteligência Competitiva e Preditiva

As Novas Tecnologias de Dados, Inteligência Competitiva e Preditiva SEMINÁRIO TEMAS ESTRATÉGICOS DO AGROPENSA Pesquisa e Inovação em Automação e Tecnologias da Informação e Comunicação As Novas Tecnologias de Dados, Inteligência Competitiva e Preditiva Brasília, 12 de

Leia mais

Sistemas de Apoio à Decisão (SAD) - Senado

Sistemas de Apoio à Decisão (SAD) - Senado Sistemas de Apoio à Decisão (SAD) - Senado DW OLAP BI Ilka Kawashita Material preparado :Prof. Marcio Vitorino Sumário OLAP Data Warehouse (DW/ETL) Modelagem Multidimensional Data Mining BI - Business

Leia mais

Sistema. Atividades. Sistema de informações. Tipos de sistemas de informação. Everson Santos Araujo everson@everson.com.br

Sistema. Atividades. Sistema de informações. Tipos de sistemas de informação. Everson Santos Araujo everson@everson.com.br Sistema Tipos de sistemas de informação Everson Santos Araujo everson@everson.com.br Um sistema pode ser definido como um complexo de elementos em interação (Ludwig Von Bertalanffy) sistema é um conjunto

Leia mais

Universidade de Brasília. Departamento de Ciência da Informação e Documentação. Prof a.:lillian Alvares

Universidade de Brasília. Departamento de Ciência da Informação e Documentação. Prof a.:lillian Alvares Universidade de Brasília Departamento de Ciência da Informação e Documentação Prof a.:lillian Alvares Fóruns óu s/ Listas de discussão Espaços para discutir, homogeneizar e compartilhar informações, idéias

Leia mais

Projeto 6.12 Aplicação de Data Mining a Dados de Avaliação da Qualidade de Produtos de Software

Projeto 6.12 Aplicação de Data Mining a Dados de Avaliação da Qualidade de Produtos de Software Programa Brasileiro de Qualidade e Produtividade Projeto 6.12 Aplicação de Data Mining a Dados de Avaliação da Qualidade de Produtos de Software Maria Teresa Villalobos Newton Roy Pampa Quispe Regina Maria

Leia mais

Introdução à Computação

Introdução à Computação Aspectos Importantes - Desenvolvimento de Software Motivação A economia de todos países dependem do uso de software. Cada vez mais, o controle dos processos tem sido feito por software. Atualmente, os

Leia mais

Plug and play options, integrating systems Opções de plug and play, integrando sistemas Flavio de Nadai

Plug and play options, integrating systems Opções de plug and play, integrando sistemas Flavio de Nadai Plug and play options, integrating systems Opções de plug and play, integrando sistemas Flavio de Nadai Plug & Play Options Integrating Systems Flávio De Nadai Desenvolvimento de Negócios Utilities & Telecom

Leia mais

UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado)

UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado) UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado) SISTEMA INTERNO INTEGRADO PARA CONTROLE DE TAREFAS INTERNAS DE UMA EMPRESA DE DESENVOLVIMENTO

Leia mais

CRM - Customer Relationship Management

CRM - Customer Relationship Management Profª Carla Mota UCB 2014 Unid 2 aula1 CRM - Customer Relationship Management Estratégia de negócio voltada ao entendimento e a antecipação das necessidades dos clientes atuais e potenciais de uma empresa.

Leia mais

Knowledge Discovery and Data Mining Extensão-UFMS-DCT

Knowledge Discovery and Data Mining Extensão-UFMS-DCT Knowledge Discovery and Data Mining Extensão-UFMS-DCT Introdução ao Processo de KDD Esta introdução se baseou quase que integralmente nas transparências produzidas por: Daniel L. Silver (dsilver@mgmt.dal.ca)

Leia mais

Grupo de Banco de Dados da UFSC

Grupo de Banco de Dados da UFSC Grupo de Banco de Dados da UFSC (GBD / UFSC) Oportunidades de Pesquisa e TCCs 2010 / 2 Objetivo GBD/UFSC Pesquisa e desenvolvimento de soluções para problemas de gerenciamento de dados LISA Laboratório

Leia mais

SISTEMA DE GESTÃO DE PESSOAS SEBRAE/TO UNIDADE: GESTÃO ESTRATÉGICA PROCESSO: TECNOLOGIA DA INFORMAÇÃO

SISTEMA DE GESTÃO DE PESSOAS SEBRAE/TO UNIDADE: GESTÃO ESTRATÉGICA PROCESSO: TECNOLOGIA DA INFORMAÇÃO SISTEMA DE GESTÃO DE PESSOAS SEBRAE/TO UNIDADE: GESTÃO ESTRATÉGICA PROCESSO: TECNOLOGIA DA INFORMAÇÃO Competências Analista 1. Administração de recursos de infra-estrutura de tecnologia da informação 2.

Leia mais