Aula 02: Conceitos Fundamentais



Documentos relacionados
MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Ferramentas Livres de Armazenamento e Mineração de Dados

Data Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados

Introdução à Descoberta de Conhecimento e Mineração de Dados. Rodrigo Leite Durães.

Introdução à Descoberta de. Dados. Professor Celso A A Kaestner, Dr. Eng.

DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS


XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO

Microsoft Innovation Center

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse

Data Mining: Conceitos e Técnicas

Gestão da Informação. Gestão da Informação. AULA 3 Data Mining

Professor: Disciplina:

As Novas Tecnologias de Dados, Inteligência Competitiva e Preditiva

4. Que tipos de padrões podem ser minerados. 5. Critérios de classificação de sistemas de Data Mining. 6. Tópicos importantes de estudo em Data Mining

KDD E MINERAÇÃO DE DADOS:

Data Mining Software Weka. Software Weka. Software Weka 30/10/2012

Aprendizagem de Máquina

Sistemas de Informação

Aplicação A. Aplicação B. Aplicação C. Aplicação D. Aplicação E. Aplicação F. Aplicação A REL 1 REL 2. Aplicação B REL 3.

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos

PLANO DE ENSINO PRÉ-REQUISITOS: ENS

SAD orientado a DADOS

17/10/2012. dados? Processo. Doutorado em Engenharia de Produção Michel J. Anzanello. Doutorado EP - 2. Doutorado EP - 3.

Data Science e Big Data

PENTAHO. História e Apresentação

Universidade de Brasília. Faculdade de Ciência da Informação. Prof a Lillian Alvares

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER

Inteligência de Negócio. Brian Cowhig

ADM041 / EPR806 Sistemas de Informação

Prof. Msc. Paulo Muniz de Ávila

Banco de Dados - Senado

Prof. Júlio Cesar Nievola Data Mining PPGIa PUCPR

Uma Ferramenta Web para BI focada no Gestor de Informação

Padronização de Processos: BI e KDD

DATA WAREHOUSE. Introdução

CONSIDERAÇÕES SOBRE ATIVIDADES DE IDENTIFICAÇÃO, LOCALIZAÇÃO E TRATAMENTO DE DADOS NA CONSTRUÇÃO DE UM DATA WAREHOUSE

Sistemas de Apoio à Decisão (SAD) - Senado

Projeto 6.12 Aplicação de Data Mining a Dados de Avaliação da Qualidade de Produtos de Software

Sumário. Mineração de Dados aplicada à Gestão de Negócios. 1) Mineração de Dados

SAD. Paulo Silva, Rodolfo Ribeiro, Vinicius Tavares

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

Extração de Conhecimento a partir dos Sistemas de Informação

Universidade de Brasília. Departamento de Ciência da Informação e Documentação. Prof a.:lillian Alvares

Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados

Uma análise de ferramentas de modelagem e gerência de metadados aplicadas ao projeto de BI/DW-UFBA

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan

Laudon & Laudon Essentials of MIS, 5th Edition. Pg. 1.1

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

A Grande Importância da Mineração de Dados nas Organizações

Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence

Capítulo 1 - A revolução dos dados, da informação e do conhecimento 1 B12 4

Adriano Maranhão BUSINESS INTELLIGENCE (BI),

ArcGIS for INSPIRE. ArcGIS. ArcGIS for INSPIRE. Discovery. Download. View

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Mineração de Dados. Prof. Júlio Cesar Nievola Especialização em Inteligência Computacional PPGIA - PUCPR


LISTA DE EXERCÍCIOS. 1. Binário: Bit: Menor unidade de dados; dígito binário (0,1) Byte: Grupo de bits que representa um único caractere

INTELIGÊNCIA COMPUTACIONAL

Aprendizagem de Máquina. Ivan Medeiros Monteiro

ADMINISTRAÇÃO DOS RECURSOS DE DADOS

Motivação: inundação de informação. Data warehouse. Inteligência computacional aplicada em finanças, comércio e indústria

Universidade de Brasília. Faculdade de Ciência da Informação. Profa. Lillian Alvares

como ferramenta de análise de informações no mercado de saúde: o caso da Unimed-BH Ana Paula Franco Viegas Pereira

Inteligência Computacional [2COP229]

UNIVERSIDADE CATÓLICA PORTUGUESA Centro Regional das Beiras Pólo de Viseu Instituto Universitário de Desenvolvimento e Promoção Social

Gestão do Conhecimento: Extração de Informações do Banco de Dados de um Supermercado

Paralelização do algoritmo SPRINT usando MyGrid

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Tecnologias da Informação, Comunicação e Sistemas de Inteligência

Chapter 3. Análise de Negócios e Visualização de Dados

O que é a ciência de dados (data science). Discussão do conceito. Luís Borges Gouveia Universidade Fernando Pessoa Versão 1.

INTELIGÊNCIA ARTIFICIAL Data Mining (DM) :alguns conceitos

Sistemas de Apoio à Decisão. Vocabulário e conceitos Vista geral

Grupo de Banco de Dados da UFSC

Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence

Big Data. Como utilizar melhor e mais rápido seus dados e informações utilizando metodologias e tecnologias GED/ECM

Curso de Engenharia de Sistemas e Informática - 5º Ano. Ficha T. Prática n.º 1

Uma Arquitetura de Gestão de Dados em Ambiente Data Warehouse

Data Warehouse Mineração de Dados

KDD UMA VISAL GERAL DO PROCESSO

Mineração de Dados: Introdução e Aplicações

Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS

Data, Text and Web Mining

IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES ENTRE PRODUTOS DE UMA BASE DE DADOS REAL

UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado)

Aprendizagem de Máquina

INSTITUTO TECNOLÓGICO DE AERONÁUTICA DIVISÃO DE ENGENHARIA ELETRÔNICA LABORATÓRIO DE GUERRA ELETRÔNICA

DESENVOLVIMENTO DE PLUG-INS KETTLE PARA GERAÇÃO DE MONDRIAN SCHEMA A PARTIR DE BASES RELACIONAIS, UTILIZANDO A METODOLOGIA AGILE ROLAP.

ADMINISTRAÇÃO DOS RECURSOS DE DADOS

Curso Data warehouse e Business Intelligence Fundamentos, Metodologia e Arquitetura

Thiago Locatelli de OLIVEIRA, Thaynara de Assis Machado de JESUS; Fernando José BRAZ Bolsistas CNPq; Orientador IFC Campus Araquari

Data Warehouses. Alunos: Diego Antônio Cotta Silveira Filipe Augusto Rodrigues Nepomuceno Marcos Bastos Silva Roger Rezende Ribeiro Santos

DATA WAREHOUSE. Rafael Ervin Hass Raphael Laércio Zago

Nome: Login: CA: Cidade: UF CARTÃO RESPOSTA QUESTÃO RESPOSTA QUESTÃO RESPOSTA

Transcrição:

Aula 02: Conceitos Fundamentais Profa. Ms. Rosângela da Silva Nunes 1 de 26

Roteiro 1. Por que mineração de dados 2. O que é Mineração de dados 3. Processo 4. Que tipo de dados podem ser minerados 5. Que tipo de padrões/tarefas podem ser minerados 6. Quais tecnologias são usadas 2 de 26

Por que mineração de dados? Estamos vivendo na era da informação ou Estamos vivendo na era dos dados 3 de 26

O que é mineração de dados Data mining Knowledge Discovery from data Extração de padrões ou conhecimentos interessantes (não-trivial, implícito, previamente desconhecido e potencialmente útil) de um grande conjunto de dados 4 de 26

Outros nomes... Knowledge Extraction Information discovery Information harvesting Data archaeology Data pattern processing Knowledge Discovery in Databases 5 de 26

DM e KDD KDD Knowledge Discovery in Databases É o processo geral de conversão de dados brutos em informações úteis Processo geral de descoberta de conhecimentos úteis previamente desconhecidos a partir de grandes bancos de dados DM Data Mining Parte integral da descoberta de conhecimento em bancos dados Um passo particular do processo de KDD 6 de 26

Processo 7 de 26

Processo visão típica da comunidade estatítica e machine learning Input Data Data Pre- Processing Data Mining Post- Processing Data integration Normalization Feature selection Dimension reduction Pattern discovery Association & correlation Classification Clustering Outlier analysis Pattern evaluation Pattern selection Pattern interpretation Pattern visualization 8 de 26

Business Intelligence e Data Mining Increasing potential to support business decisions Decision Making Data Presentation Visualization Techniques Data Mining Information Discovery End User Business Analyst Data Analyst Data Exploration Statistical Summary, Querying, and Reporting Data Preprocessing/Integration, Data Warehouses Data Sources Paper, Files, Web documents, Scientific experiments, Database Systems DBA 9 de 26

Que tipo de dados podem ser minerados? Conjuntos de dados e aplicações orientada a banco de dados Banco de dados relacional, data warehouse Outros tipos de conjunto de dados Séries de dados temporais, Dados sequenciais Data streams Dados espaciais hipertexto 10 de 26

Que tipo de padrões/tarefas podem ser minerados? 11 de 26

Classificação Tarefas Classificação/Regressão Aprendizado de uma função que pode ser usada para mapear dados em uma de varias classes discretas definidas previamente. Regressão ou Predição Aprendizado de uma função que pode ser sada para mapear os valores associados aos dados em um ou mais valores reais. 12 de 26

Tarefas Classificação 13 de 26

Tarefas Predição 14 de 26

Tarefas Clustering Identificação de grupos de dados onde os dados tem características semelhantes aos do mesmo grupo e onde os grupos tenham características diferentes entre si. 15 de 26

Tarefas Regra de associação Identificação de grupos de dados que apresentam coocorrência entre si (ex. cesta de compras). 60% dos clientes que acessaram /products também acessaram /products/software/webminer.htm 30% dos clientes que acessaram /specialoffer.htm submeteram um pedido on-line para /products/software 16 de 26

Tarefas Detecção de desvios Identificação de dados que deveriam seguir um padrão esperado mas não o fazem. 17 de 26

Tarefas Detecção de desvios 18 de 26

Todos os padrões são interessantes? Um padrão é interessante se Facilmente pode ser compreendido por humanos É válido em dados de teste com um certo grau de certeza Pontencialmente útil Novo Se valida uma hipótese do usuário 19 de 26

Um sistema de mineração de dados pode gerar todos os padrões interessantes? Completeza dos algoritmos Não-realístico Foco da busca Uso de medidas Uso de restrições 20 de 26

Um sistema de mineração de dados gera somente somente padrões interessantes? Problema de otimização Busca através dos padrões gerados para identificar aqueles realmente interessantes Desafio futuos 21 de 26

Quais tecnologias são usadas? Machine Learning Pattern Recognition Statistics Data Mining Visualization Algorithm Database Technology High-Performance Computing 22 de 26

Por que a confluência de múltiplas disciplinas Grande quantidade de dados Algoritmos deve ser altamente escalável para manipular por exemplo terabytes de dados Alta dimensionalidade dos dados Um objeto pode ter centenas de dimensões Alta complexidade dos dados Novas e sofisticadas aplicações 23 de 26

Maiores desafios em Mineração de dados Metodologia Novos tipos de conhecimento Espaço multidimensional Esforço interdisciplinas Manipular ruídos, incetezas e dados incompletos Avaliação de padrões 24 de 26

Maiores desafios em Mineração de Interação com o usuário Mineração interativa dados Incorporação de conhecimento já adquirido Apresentação e visualização dos resultados obtidos Eficiência e Escalabilidade Algoritmos eficientes e escaláveis Métodos de mineração incremental, paralela e distribuída 25 de 26

Maiores desafios em Mineração de dados Tipos diversos de dados Manipular tipos de dados complexos Repositório de dados global e dinâmica Sociedade e Mineração de dados Impacto social Privacidade Invisibilidade 26 de 26