Mineração de Dados. Prof. Júlio Cesar Nievola Especialização em Inteligência Computacional PPGIA - PUCPR
|
|
- Thomaz Fernandes Klettenberg
- 8 Há anos
- Visualizações:
Transcrição
1 Mineração de Dados PPGIA - PUCPR
2 Agenda 1. Histórico 2. Definições e Características 3. Processo e Tarefas de DM 4. Pré-Processamento 5. Representação do Conhecimento 6. Principais Tarefas 7. Procedimentos Experimentais 8. Seleção, Extração e Construção de Atributos 9. Temas de Pesquisa
3 Histórico Década de 60: Coleções de dados, criação de BD Década de 70: Modelos de dados relacionais, implementação de DBMS relacionais Década de 80: RDBMS, modelos avançados de dados (relacional estendido, OO, dedutivo etc.) e DBMS orientados à aplicação (espaciais, científicos, de engenharia etc.). Década de 90: Data mining e data warehousing, bases de dados multimídia, e tecnologia Web
4 Aprendizagem de Máquina Aprendizagem de Máquina Melhoria no desempenho de alguma tarefa através da experiência Data Mining Parte de um processo maior (KDD) interessado em: Melhoria no desempenho Representação inteligível Conhecimento obtido interessante, inovador We are drowning in information, but starving for knowledge! (John Naisbett)
5 Motivações para DM Abundância de dados industriais e comerciais Foco competitivo Gerenciamento do conhecimento Computadores poderosos e baratos Fundamentos avançados em Aprendizagem de máquina & lógica Estatística Sistemas de gerenciamento de BD
6 Cadeia de Valores! " #$ "% &! ' ( % & ) *+ "
7 KDD x DM KDD é a seleção e o processamento de dados para: Identificar conhecimento novo, preciso e útil, & Modelar fenômenos do mundo real Data Mining é o principal componente do processo KDD descoberta de conhecimento em BD
8 O Processo de KDD Consolidação de dados Seleção e Pré-processamento Warehouse Dados Consolidados Data Mining Dados Preparados Interpretação e Avaliação p(x)=0.02 Padrões e Modelos Conhecimento Dados Originais
9 Passos em DM Seleção e Pré-Processamento Limpeza dos dados: (pode exigir 60% do tempo total) Redução de dados: Encontrar características úteis, redução de dimensionalidade e ou de variáveis Determinar a tarefa de DM Sumarização, classificação, regressão, associação, agrupamento Escolha do algoritmo Data mining: busca pelos padrões interessantes Interpretação e avaliação: análise dos resultados Visualização, transformação, remoção de padrões redundantes Uso do conhecimento descoberto
10 Potencial crescente de suporte à tomada de decisão Data mining no processo decisório Tomada de decisão Usuário Final Apresentação dos dados Técnicas de Visualização Data Mining Descoberta de Informações Exploração dos dados Análise estatística, Querying e relatórios Analista comercial Analista de dados Data Warehouses / Data Marts OLAP, MDA Dados originais Papéis, arquivos, fornecedores de informação, Sistemas de BD, OLTP Analista de BD
11 O Processo de DM Consolidação de dados Seleção e Pré-processamento Warehouse Dados Consolidados Data Mining Dados Preparados Interpretação e Avaliação p(x)=0.02 Padrões e Modelos Conhecimento Dados Originais
12 Consolidação de Dados Garbage in Garbage out A qualidade dos resultados está diretamente relacionada com a qualidade dos dados 50%-70% do esforço no processo de DM é gasto com a consolidação e preparação dos dados Os dados não foram armazenados para DM Esta é a maior justificativa para a criação de uma Data Warehouse corporativa
13 Consolidação de Dados Determinar lista preliminar de atributos Consolidar dados em uma base de trabalho Fontes de dados internas e externas Eliminar ou estimar valores faltantes Remover outliers (exceções óbvias) Determinar probabilidades a priori de categorias e analisar influência do volume
14 O Processo de DM Consolidação de dados Seleção e Pré-processamento Warehouse Dados Consolidados Data Mining Dados Preparados Interpretação e Avaliação p(x)=0.02 Padrões e Modelos Conhecimento Dados Originais
15 Pré-processamento Gerar um conjunto de exemplos através de um método de amostragem adequada Reduzir dimensionalidade dos atributos Remover atributos redundantes e/ou correlacionados Combinar atributos (soma, multiplicação, diferença) Reduzir faixa dos valores dos atributos Agrupar valores simbólicos discretos Quantizar valores numéricos contínuos
16 O Processo de KDD Consolidação de dados Seleção e Pré-processamento Warehouse Dados Consolidados Data Mining Dados Preparados Interpretação e Avaliação p(x)=0.02 Padrões e Modelos Conhecimento Dados Originais
17 Tarefas e Métodos em DM Exploração/Descoberta Automática e.g.. descoberta de novos segmentos de mercado Análise de agrupamento Previsão/Classificação e.g.. previsão de vendas brutas a partir de fatores atuais Regressão, redes neurais, algoritmos genéticos, árvores de decisão Explanação/Descrição e.g.. Caracterização de clientes pela demografia e histórico de compra Árvores de decisão, regras de associação x2 f(x),-. / 01-.2! ''' x1 x
18 Exploração e descoberta Agrupamento: particionar um conjunto de dados em um conjunto de classes, chamadas grupos, cujos membros possuam algumas propriedades interessantes em comum Agrupamento numérico baseado em distância Métricas de agrupamento de exemplos (k-nn) Técnicas de visualização podem ser usadas Agrupamento Bayesiano automáticas Busca o número de classes que resulta em um melhor ajuste de uma distribuição de probabilidades aos dados, sendo o AutoClass (NASA) um dos melhores exemplos
19 Previsão e classificação Aprender um modelo preditivo Usar um modelo obtido para prever o valor de algum atributo desconhecido ou faltante baseado em outra informação Classificação de um novo caso Classificar dados baseados em valores de um atributo meta, e.g., classificar cidades baseado no clima, ou classificar carros baseado no consumo Vários métodos: Redes neurais artificiais, árvores de decisão indutivas e sistemas baseados em regras, algoritmos genéticos, algoritmos de agrupamento do vizinho mais próximo, métodos estatísticos (paramétricos, não-paramétricos)
20 Explanação e descrição Aprender uma hipótese generalizada (modelo) a partir de dados selecionados Descrição/Interpretação de modelos fornece novos conhecimentos Métodos: Árvore de decisão indutiva e sistemas baseados em regras Regras de associação
21 O Processo de KDD Consolidação de dados Seleção e Pré-processamento Warehouse Dados Consolidados Data Mining Dados Preparados Interpretação e Avaliação p(x)=0.02 Padrões e Modelos Conhecimento Dados Originais
22 Os padrões descobertos são Um sistema de DM pode gerar muitos padrões Medidas de interesse: Facilmente compreensível por humanos Válidos em novos dados com algum grau de certeza Potencialmente útil Inovador, ou valida alguma hipótese que alguém quer confirmar Medidas Objetivas vs. subjetivas Objetivas: baseadas em estatística e estruturas de padrões Subjetiva: baseada na crença do usuário sobre os dados, e.g., surpresa, inovação, etc. interessantes?
23 Completeza vs.. otimização Completeza: encontrar todos os padrões interessantes Um sistema de DM pode encontrar todos os padrões interessantes? Otimização: busca somente de padrões interessantes Um sistema de DM pode encontrar somente os padrões interessantes? Abordagens Gerar primeiro todos os padrões e então filtrar deixando somente aqueles interessantes Gerar somente os padrões interessantes
24 Interpretação e Avaliação Avaliação Validação estatística e testes de significância Análise qualitativa por especialistas da área Testes-piloto para avaliar precisão do modelo Interpretação Árvore de indução e modelos de regras podem ser lidos diretamente Resultados de agrupamentos podem ser apresentados em gráficos ou tabelados Código pode ser automaticamente gerado por alguns sistemas (modelos de regressão)
25 Principais Tarefas Classificação: aprendizagem supervisionada Usa exemplos de treinamento com classes conhecidas para classificar novos dados Agrupamento: aprendizagem não supervisionada Exemplos de treinamento não possuem informação de classe Atribui classes ou grupos aos dados
26 Tarefa de Classificação Entrada: um conjunto de registros para treinamento, rotulados com uma classe cada Saída: um modelo (classificador) que assinala uma classe a cada caso baseado nos outros atributos Aplicações típicas Aprovação de crédito Diagnóstico médico Análise de efetividade de tratamento
27 Treinamento e Teste Os registros (observações, amostras) são particionados em conjunto de treinamento e conjunto de testes A classificação acontece em duas etapas 1. Treinamento: construção do modelo a partir do conjunto de treinamento 2. Teste: verificação da precisão do modelo obtido usando o conjunto de testes 3. Teste (alternativo): em função da quantidade de dados usa-se o método da correlação cruzada
28 Treinamento e Teste Tipos de Modelos Regras SE-ENTÃO Árvores de decisão Precisão dos modelos Compara-se a classe prevista pelo modelo gerado em casos de teste Taxa de precisão = % do conjunto das amostras do conjunto de testes corretamente classificado pelo modelo gerado
29 Comparação de classificadores Precisão Velocidade Robustez em relação a ruídos e valores faltantes Escalabilidade: eficiência em grandes bases de dados Interpretabilidade do modelo obtido Simplicidade Tamanho da árvore de decisão Tamanho e número de regras Indicadores de qualidade dependentes do domínio
30 Market Basket Analysis 3 4 *5 *5 6 7 :44* 4! :44 4! ; 4* "8 "9 "-
31 MBA - Tarefa Dado: uma BD de transações de clientes, onde cada transação é um conjunto de itens Encontrar grupos de itens que são freqüentemente comprados juntos
32 MBA - Objetivo Extrair informação sobre comportamento de compra Informação obtida pode sugerir Novos leiautes de lojas Novo conjunto de produtos Quais produtos colocar em promoção MBA é aplicável onde um cliente compra vários itens em proximidade Cartões de crédito Serviços de companhias de telecomunicações Serviços bancários Tratamentos médicos
33 Regras de Associação Expressa como produtos e serviços se relacionam uns com os outros e tende a agrupá-los em conjuntos se um conjunto compra fraldas na sexta-feira, então ele também compra cerveja Fácil de entender Ação possível: colocar cerveja próxima de fraldas quando o fim de semana se aproxima
34 Agrupamento Dado: BD grande de dados de clientes, contendo suas propriedades e seu histórico de compras Objetivo: Encontrar grupos de clientes com comportamento similar Encontrar clientes com comportamento não usual
35 Agrupamento Dado: Um conjunto de dados com N dados d-dimensionais Encontrar: Uma partição natural do conjunto de dados em um número de grupos (k) e ruído Os grupos devem ser tais que Itens em um mesmo grupo são similares, ou seja, similaridade intra-grupos é maximizada & Itens de grupos diferentes são diferentes, ou seja, similaridade inter-grupos é minimizada
36 Uso do agrupamento Sem classes pré-definidas Usado como técnica individual para determinar distribuição de dados ou como etapa de préprocessamento para outros algoritmos Auxilia a compreender como objetos pertencentes a um conjunto de dados tendem a se agrupar naturalmente
37 Estudos de agrupamentos Inicialmente Agrupamento é um problema conhecido em estatística Pesquisa mais recente em Aprendizagem de máquina BD Visualização Trabalhos atuais Algoritmos de agrupamento efetivos e eficientes para conjuntos de dados de muito alta dimensionalidade com alto ruído Necessária escalabilidade com relação a Número de pontos de dados (N) Número de dimensões (d) Nível de ruído
38 Métodos Básicos Métodos de particionamento k-means, k-medoids Métodos hierárquicos Aglomerativos/divisivos, BIRCH, CURE Métodos baseados em ligação Métodos baseados em densidade DBSCAN, DENCLUE Métodos estatísticos COBWEB
39 DM - Pesquisas 1. Integração com data warehouse e BD relationais 2. Mineração de dados escalável, paralela/distribuída e incremental 3. Otimização de linguagens para query em Data mining 4. Métodos de DM múltiplos e integrados 5. Ambientes de DM Interativos e exploratórios 6. Mineração de outras formas de dados BD espaço-temporais Textos Multimídia Web
40 Web Mining Por quê? Web sem padrões, grande quantidade de informação não estruturada e heterogênea Muito dinâmica Um novo servidor WWW a cada 2 horas 5 milhões de documentos em milhões de documentos em 1998 Índices se tornam obsoletos muito rapidamente
41 Web content mining Web Mining Minerar o que os mecanismos de Web search encontram Classificação de documentos da Web (Chakrabarti et al 99) warehousing a Meta-Web (Zaïane and Han 98) intelligent query answering em Web search Web usage mining Mineração de Web logs: encontrar padrões de acesso e tendências (Zaiane et al 98) < Rastreamento de características de usuários e sites adaptativos (Perkowitz et al 97) Web structure mining < Descobrir páginas confiáveis: uma página é importante se páginas importantes apontam para ela (Chakrabarti et al 99, Kleinberg 98)
42 Bibliografia Básica Mitchel, T.M. Machine Learning, McGraw- Hill, Dhar, V. & Stein, R. Seven Methods for Transforming Corporate Data into Business Intelligence, Prentice-Hall, Witten, I.H. & Frank, E. Data Mining: Practical Machine Learning Tools and Techniques with Java Implementatins, Morgan Kaufmann Publishers, 1999.
43 Endereços Eletrônicos About SIGKDD Explorations Business Intelligence and Data Warehousing - TDWI Computing Research Repository (CoRR) Data Mining Server Data Storage & Mining Research Center - Index - Data Storage and Mining Research Center - CIO Data Warehousing at Stanford Publications DBMS - August Defining Data Mining DELVE - Data for Evaluating Learning in Valid Experiments DWQ KDnuggets Data Mining, Web Mining, and Knowledge Discovery Guide Knowledge Discovery in Databases and Data Mining MLnet OiS - Find information and resources on Machine Learning, Knowledge Discovery, Data Mining, Case-based Reasoning, and Kno PCAI Artificial Intelligence - Free emagazine, White Papers, Demos, Products, Glossary, Links Sistemas Baseados em Casos The CBR Homepage The Data Warehousing Information Center TWiki. Main. WebHome Welcome to AI Topics
Knowledge Discovery and Data Mining Extensão-UFMS-DCT
Knowledge Discovery and Data Mining Extensão-UFMS-DCT Introdução ao Processo de KDD Esta introdução se baseou quase que integralmente nas transparências produzidas por: Daniel L. Silver (dsilver@mgmt.dal.ca)
Leia maisMINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br
MINERAÇÃO DE DADOS APLICADA Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br Processo Weka uma Ferramenta Livre para Data Mining O que é Weka? Weka é um Software livre do tipo open source para
Leia maisAula 02: Conceitos Fundamentais
Aula 02: Conceitos Fundamentais Profa. Ms. Rosângela da Silva Nunes 1 de 26 Roteiro 1. Por que mineração de dados 2. O que é Mineração de dados 3. Processo 4. Que tipo de dados podem ser minerados 5. Que
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Tipos de aprendizagem 3. Paradigmas de aprendizagem 4. Modos de aprendizagem
Leia maisGerenciamento de Dados e Gestão do Conhecimento
ELC1075 Introdução a Sistemas de Informação Gerenciamento de Dados e Gestão do Conhecimento Raul Ceretta Nunes CSI/UFSM Introdução Gerenciando dados A abordagem de banco de dados Sistemas de gerenciamento
Leia maisFases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse
Definição escopo do projeto (departamental, empresarial) Grau de redundância dos dados(ods, data staging) Tipo de usuário alvo (executivos, unidades) Definição do ambiente (relatórios e consultas préestruturadas
Leia maisProf. Msc. Paulo Muniz de Ávila
Prof. Msc. Paulo Muniz de Ávila O que é Data Mining? Mineração de dados (descoberta de conhecimento em bases de dados): Extração de informação interessante (não-trivial, implícita, previamente desconhecida
Leia maisMineração de Dados: Introdução e Aplicações
Mineração de Dados: Introdução e Aplicações Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br Apresentação Luiz Merschmann Engenheiro
Leia maisExtração de Árvores de Decisão com a Ferramenta de Data Mining Weka
Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka 1 Introdução A mineração de dados (data mining) pode ser definida como o processo automático de descoberta de conhecimento em bases de
Leia maisMicrosoft Innovation Center
Microsoft Innovation Center Mineração de Dados (Data Mining) André Montevecchi andre@montevecchi.com.br Introdução Objetivo BI e Mineração de Dados Aplicações Exemplos e Cases Algoritmos para Mineração
Leia maisSistema de mineração de dados para descobertas de regras e padrões em dados médicos
Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Pollyanna Carolina BARBOSA¹; Thiago MAGELA² 1Aluna do Curso Superior Tecnólogo em Análise e Desenvolvimento de Sistemas
Leia maisDATA WAREHOUSE. Introdução
DATA WAREHOUSE Introdução O grande crescimento do ambiente de negócios, médias e grandes empresas armazenam também um alto volume de informações, onde que juntamente com a tecnologia da informação, a correta
Leia maisData Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento
Data Mining Prof Luiz Antonio do Nascimento Data Mining Ferramenta utilizada para análise de dados para gerar, automaticamente, uma hipótese sobre padrões e anomalias identificadas para poder prever um
Leia maisData Mining: Conceitos e Técnicas
Data Mining: Conceitos e Técnicas DM, DW e OLAP Data Warehousing e OLAP para Data Mining O que é data warehouse? De data warehousing para data mining Data Warehousing e OLAP para Data Mining Data Warehouse:
Leia maisPlanejamento Estratégico de TI. Prof.: Fernando Ascani
Planejamento Estratégico de TI Prof.: Fernando Ascani Data Warehouse - Conceitos Hoje em dia uma organização precisa utilizar toda informação disponível para criar e manter vantagem competitiva. Sai na
Leia maisADM041 / EPR806 Sistemas de Informação
ADM041 / EPR806 Sistemas de Informação UNIFEI Universidade Federal de Itajubá Prof. Dr. Alexandre Ferreira de Pinho 1 Sistemas de Apoio à Decisão (SAD) Tipos de SAD Orientados por modelos: Criação de diferentes
Leia maisExtração de Conhecimento & Mineração de Dados
Extração de Conhecimento & Mineração de Dados Nesta apresentação é dada uma breve introdução à Extração de Conhecimento e Mineração de Dados José Augusto Baranauskas Departamento de Física e Matemática
Leia maisExemplo de Aplicação do DataMinig
Exemplo de Aplicação do DataMinig Felipe E. Barletta Mendes 19 de fevereiro de 2008 INTRODUÇÃO AO DATA MINING A mineração de dados (Data Mining) está inserida em um processo maior denominado Descoberta
Leia maisXIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO
XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO EPE0147 UTILIZAÇÃO DA MINERAÇÃO DE DADOS EM UMA AVALIAÇÃO INSTITUCIONAL
Leia maisData, Text and Web Mining
Data, Text and Web Mining Fabrício J. Barth TerraForum Consultores Junho de 2010 Objetivo Apresentar a importância do tema, os conceitos relacionados e alguns exemplos de aplicações. Data, Text and Web
Leia maisResumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence
É um conjunto de conceitos e metodologias que, fazem uso de acontecimentos e sistemas e apoiam a tomada de decisões. Utilização de várias fontes de informação para se definir estratégias de competividade
Leia maisDWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS
DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS Tácio Dias Palhão Mendes Bacharelando em Sistemas de Informação Bolsista de Iniciação Científica da FAPEMIG taciomendes@yahoo.com.br Prof.
Leia maisLaudon & Laudon Essentials of MIS, 5th Edition. Pg. 1.1
Laudon & Laudon Essentials of MIS, 5th Edition. Pg. 1.1 SISTEMA DE APOIO À DECISÃO Grupo: Denilson Neves Diego Antônio Nelson Santiago Sabrina Dantas CONCEITO É UM SISTEMA QUE AUXILIA O PROCESSO DE DECISÃO
Leia maisCurso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan
Faculdade INED Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan 1 Unidade 4.5 2 1 BI BUSINESS INTELLIGENCE BI CARLOS BARBIERI
Leia maisDado: Fatos conhecidos que podem ser registrados e têm um significado implícito. Banco de Dados:
MC536 Introdução Sumário Conceitos preliminares Funcionalidades Características principais Usuários Vantagens do uso de BDs Tendências mais recentes em SGBDs Algumas desvantagens Modelos de dados Classificação
Leia maisFUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO
@ribeirord FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO Rafael D. Ribeiro, M.Sc,PMP. rafaeldiasribeiro@gmail.com http://www.rafaeldiasribeiro.com.br Lembrando... Aula 4 1 Lembrando... Aula 4 Sistemas de apoio
Leia maisTÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE
TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE Engenharia de Computação Professor: Rosalvo Ferreira de Oliveira Neto Estudos Comparativos Recentes - Behavior Scoring Roteiro Objetivo Critérios de Avaliação
Leia mais17/10/2012. dados? Processo. Doutorado em Engenharia de Produção Michel J. Anzanello. Doutorado EP - 2. Doutorado EP - 3.
Definição de Data Mining (DM) Mineração de Dados (Data Mining) Doutorado em Engenharia de Produção Michel J. Anzanello Processo de explorar grandes quantidades de dados à procura de padrões consistentes
Leia maisTarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS
Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS Sumário Conceitos / Autores chave... 3 1. Introdução... 3 2. Tarefas desempenhadas por Técnicas de 4 Mineração de Dados...
Leia maisWeb Data mining com R: aprendizagem de máquina
Web Data mining com R: aprendizagem de máquina Fabrício Jailson Barth Faculdade BandTec e VAGAS Tecnologia Junho de 2013 Sumário O que é Aprendizagem de Máquina? Hierarquia de aprendizado. Exemplos de
Leia maisNo mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o
DATABASE MARKETING No mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o empresário obter sucesso em seu negócio é
Leia maisProf. Júlio Cesar Nievola Data Mining PPGIa PUCPR
Uma exploração preliminar dos dados para compreender melhor suas características. Motivações-chave da exploração de dados incluem Ajudar na seleção da técnica correta para pré-processamento ou análise
Leia maissrbo@ufpa.br www.ufpa.br/srbo
CBSI Curso de Bacharelado em Sistemas de Informação BI Prof. Dr. Sandro Ronaldo Bezerra Oliveira srbo@ufpa.br www.ufpa.br/srbo Tópicos Especiais em Sistemas de Informação Faculdade de Computação Instituto
Leia maisData Mining Software Weka. Software Weka. Software Weka 30/10/2012
Data Mining Software Weka Prof. Luiz Antonio do Nascimento Software Weka Ferramenta para mineração de dados. Weka é um Software livre desenvolvido em Java. Weka é um É um pássaro típico da Nova Zelândia.
Leia maisUNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS
UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS VINICIUS DA SILVEIRA SEGALIN FLORIANÓPOLIS OUTUBRO/2013 Sumário
Leia maisPós-Graduação "Lato Sensu" Especialização em Análise de Dados e Data Mining
Pós-Graduação "Lato Sensu" Especialização em Análise de Dados e Data Mining Inscrições Abertas Início das Aulas: 24/03/2015 Dias e horários das aulas: Terça-Feira 19h00 às 22h45 Semanal Quinta-Feira 19h00
Leia maisChapter 3. Análise de Negócios e Visualização de Dados
Chapter 3 Análise de Negócios e Visualização de Dados Objetivos de Aprendizado Descrever a análise de negócios (BA) e sua importância par as organizações Listar e descrever brevemente os principais métodos
Leia maisDATA WAREHOUSE. Rafael Ervin Hass Raphael Laércio Zago
DATA WAREHOUSE Rafael Ervin Hass Raphael Laércio Zago Roteiro Introdução Aplicações Arquitetura Características Desenvolvimento Estudo de Caso Conclusão Introdução O conceito de "data warehousing" data
Leia maisInteratividade aliada a Análise de Negócios
Interatividade aliada a Análise de Negócios Na era digital, a quase totalidade das organizações necessita da análise de seus negócios de forma ágil e segura - relatórios interativos, análise de gráficos,
Leia maisMotivação: inundação de informação. Data warehouse. Inteligência computacional aplicada em finanças, comércio e indústria
Programa de Especialização em Inteligência Computacional Motivação: inundação de informação Morrendo de sede por conhecimento em um oceano de dados Inteligência computacional aplicada em finanças, comércio
Leia maisINF 1771 Inteligência Artificial
Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 12 Aprendizado de Máquina Agentes Vistos Anteriormente Agentes baseados em busca: Busca cega Busca heurística Busca local
Leia maisBanco de Dados. Introdução. João Eduardo Ferreira Osvaldo Kotaro Takai. jef@ime.usp.br DCC-IME-USP
Banco de Dados Introdução João Eduardo Ferreira Osvaldo Kotaro Takai jef@ime.usp.br DCC-IME-USP Importância dos Bancos de Dados A competitividade das empresas depende de dados precisos e atualizados. Conforme
Leia maisO que é a ciência de dados (data science). Discussão do conceito. Luís Borges Gouveia Universidade Fernando Pessoa Versão 1.
O que é a ciência de dados (data science). Discussão do conceito Luís Borges Gouveia Universidade Fernando Pessoa Versão 1.3, Outubro, 2015 Nota prévia Esta apresentação tem por objetivo, proporcionar
Leia maisUniversidade de Brasília Departamento de Ciência da Informação e Documentação Programa de Pós Graduação em Ciência da Informação Prof a.
Universidade de Brasília Departamento de Ciência da Informação e Documentação Programa de Pós Graduação em Ciência da Informação Prof a. Lillian Alvares Tecnologia e Gestão O principal papel da Tecnologia
Leia maisUniversidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados
Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados Prof. Celso Kaestner Poker Hand Data Set Aluno: Joyce Schaidt Versão:
Leia maisSISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER
SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI Fernando Luiz de Oliveira 1 Thereza Patrícia. P. Padilha 1 Conceição A. Previero 2 Leandro Maciel Almeida 1 RESUMO O processo
Leia maisBanco de Dados - Senado
Banco de Dados - Senado Exercícios OLAP - CESPE Material preparado: Prof. Marcio Vitorino OLAP Material preparado: Prof. Marcio Vitorino Soluções MOLAP promovem maior independência de fornecedores de SGBDs
Leia maisUNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado)
UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado) SISTEMA INTERNO INTEGRADO PARA CONTROLE DE TAREFAS INTERNAS DE UMA EMPRESA DE DESENVOLVIMENTO
Leia maisMINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO
MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO Fernanda Delizete Madeira 1 ; Aracele Garcia de Oliveira Fassbinder 2 INTRODUÇÃO Data
Leia mais4. Que tipos de padrões podem ser minerados. 5. Critérios de classificação de sistemas de Data Mining. 6. Tópicos importantes de estudo em Data Mining
Curso de Data Mining - Aula 1 1. Como surgiu 2. O que é 3. Em que tipo de dados pode ser aplicado 4. Que tipos de padrões podem ser minerados 5. Critérios de classificação de sistemas de Data Mining 6.
Leia maisAplicação A. Aplicação B. Aplicação C. Aplicação D. Aplicação E. Aplicação F. Aplicação A REL 1 REL 2. Aplicação B REL 3.
Sumário Data Warehouse Modelagem Multidimensional. Data Mining BI - Business Inteligence. 1 2 Introdução Aplicações do negócio: constituem as aplicações que dão suporte ao dia a dia do negócio da empresa,
Leia maisAdministração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados
Universidade Federal de Pernambuco Graduação em Ciência da Computação Centro de Informática 2006.2 Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento
Leia maisAprendizagem de Máquina. Ivan Medeiros Monteiro
Aprendizagem de Máquina Ivan Medeiros Monteiro Definindo aprendizagem Dizemos que um sistema aprende se o mesmo é capaz de melhorar o seu desempenho a partir de suas experiências anteriores. O aprendizado
Leia maisWeb Data Mining com R
Web Data Mining com R Fabrício J. Barth fabricio.barth@gmail.com VAGAS Tecnologia e Faculdade BandTec Maio de 2014 Objetivo O objetivo desta palestra é apresentar conceitos sobre Web Data Mining, fluxo
Leia maisIdentificar as mudanças que acontecem na forma e no uso de apoio à decisão em empreendimentos de e-business. Identificar o papel e alternativas de
1 Identificar as mudanças que acontecem na forma e no uso de apoio à decisão em empreendimentos de e-business. Identificar o papel e alternativas de relatórios dos sistemas de informação gerencial. Descrever
Leia maisINSTITUTO TECNOLÓGICO DE AERONÁUTICA DIVISÃO DE ENGENHARIA ELETRÔNICA LABORATÓRIO DE GUERRA ELETRÔNICA
INSTITUTO TECNOLÓGICO DE AERONÁUTICA DIVISÃO DE ENGENHARIA ELETRÔNICA LABORATÓRIO DE GUERRA ELETRÔNICA CURSO DE ESPECIALIZAÇÃO EM ANÁLISE DE AMBIENTE ELETROMAGNÉTICO CEAAE /2008 DISCIPLINA EE-09: Inteligência
Leia maisHierarquia de modelos e Aprendizagem de Máquina
Hierarquia de modelos e Aprendizagem de Máquina Fabrício Jailson Barth BandTec Maio de 2015 Sumário Introdução: hierarquia de modelos e aprendizagem de máquina. O que é Aprendizagem de Máquina? Hierarquia
Leia maisMATERIAL DIDÁTICO: APLICAÇÕES EMPRESARIAIS SISTEMA DE APOIO À DECISÃO (SAD)
AULA 07 MATERIAL DIDÁTICO: APLICAÇÕES EMPRESARIAIS SISTEMA DE APOIO À DECISÃO (SAD) JAMES A. O BRIEN MÓDULO 01 Páginas 286 à 294 1 AULA 07 SISTEMAS DE APOIO ÀS DECISÕES 2 Sistemas de Apoio à Decisão (SAD)
Leia maisLaboratório de Mídias Sociais
Laboratório de Mídias Sociais Aula 02 Análise Textual de Mídias Sociais parte I Prof. Dalton Martins dmartins@gmail.com Gestão da Informação Universidade Federal de Goiás O que é Análise Textual? Análise
Leia maisConcepção e Elaboração
UNIVERSIDADE ESTADUAL PAULISTA INSTITUTO DE BIOCIÊNCIAS, LETRAS E CIÊNCIAS EXATAS DEPARTAMENTO DE CIÊNCIAS DE COMPUTAÇÃO E ESTATÍSTICA Análise e Projeto Orientado a Objetos Concepção e Elaboração Estudo
Leia maisKDD UMA VISAL GERAL DO PROCESSO
KDD UMA VISAL GERAL DO PROCESSO por Fernando Sarturi Prass 1 1.Introdução O aumento das transações comerciais por meio eletrônico, em especial as feitas via Internet, possibilitou as empresas armazenar
Leia maisProfessor: Disciplina:
Professor: Curso: Esp. Marcos Morais de Sousa marcosmoraisdesousa@gmail.com Sistemas de informação Disciplina: Introdução a SI Noções de sistemas de informação Turma: 01º semestre Prof. Esp. Marcos Morais
Leia maisSistemas de Apoio à Decisão (SAD) - Senado
Sistemas de Apoio à Decisão (SAD) - Senado DW OLAP BI Ilka Kawashita Material preparado :Prof. Marcio Vitorino Sumário OLAP Data Warehouse (DW/ETL) Modelagem Multidimensional Data Mining BI - Business
Leia maisOrganizaçãoe Recuperação de Informação GSI521. Prof. Rodrigo Sanches Miani FACOM/UFU
Organizaçãoe Recuperação de Informação GSI521 Prof. Rodrigo Sanches Miani FACOM/UFU Introdução Organização e Recuperação de Informação(GSI521) Tópicos Recuperação de informação (RI); Breve histórico; O
Leia maisExtração de Requisitos
Extração de Requisitos Extração de requisitos é o processo de transformação das idéias que estão na mente dos usuários (a entrada) em um documento formal (saída). Pode se entender também como o processo
Leia maishttp://www.publicare.com.br/site/5,1,26,5480.asp
Página 1 de 7 Terça-feira, 26 de Agosto de 2008 ok Home Direto da redação Última edição Edições anteriores Vitrine Cross-Docking Assine a Tecnologística Anuncie Cadastre-se Agenda Cursos de logística Dicionário
Leia maisUTILIZANDO O SOFTWARE WEKA
UTILIZANDO O SOFTWARE WEKA O que é 2 Weka: software livre para mineração de dados Desenvolvido por um grupo de pesquisadores Universidade de Waikato, Nova Zelândia Também é um pássaro típico da Nova Zelândia
Leia maisTI em Números Como identificar e mostrar o real valor da TI
TI em Números Como identificar e mostrar o real valor da TI João Maldonado / Victor Costa 15, Outubro de 2013 Agenda Sobre os Palestrantes Sobre a SOLVIX Contextualização Drivers de Custo Modelo de Invenstimento
Leia maisBusiness Intelligence para Computação TítuloForense. Tiago Schettini Batista
Business Intelligence para Computação TítuloForense Tiago Schettini Batista Agenda Empresa; Crescimento de Dados; Business Intelligence; Exemplos (CGU, B2T) A empresa Empresa fundada em 2003 especializada
Leia maisPlanejamento Estratégico de TI. Prof.: Fernando Ascani
Planejamento Estratégico de TI Prof.: Fernando Ascani BI Business Intelligence A inteligência Empresarial, ou Business Intelligence, é um termo do Gartner Group. O conceito surgiu na década de 80 e descreve
Leia maisMódulo 4: Gerenciamento de Dados
Módulo 4: Gerenciamento de Dados 1 1. CONCEITOS Os dados são um recurso organizacional decisivo que precisa ser administrado como outros importantes ativos das empresas. A maioria das organizações não
Leia maisFUNDAÇÃO DE APOIO AO ENSINO TÉCNICO DO ESTADO DO RIO DE JANEIRO FAETERJ Petrópolis Área de Extensão PLANO DE CURSO
FUNDAÇÃO DE APOIO AO ENINO TÉCNICO DO ETADO DO RIO DE JANEIRO PLANO DE CURO 1. Identificação Curso de Extensão: INTRODUÇÃO AO ITEMA INTELIGENTE Professor Regente: José Carlos Tavares da ilva Carga Horária:
Leia mais05/06/2012. Banco de Dados. Gerenciamento de Arquivos. Gerenciamento de Arquivos Sistema Gerenciador de Banco de Dados Modelos de Dados
Banco de Dados Gerenciamento de Arquivos Sistema Gerenciador de Banco de Dados Modelos de Dados Gerenciamento de Arquivos Gerenciamento de Arquivos 1 Gerenciamento de Arquivos Em uma indústria são executadas
Leia maisFACULDADE DE CIÊNCIAS SOCIAIS E TECNOLÓGICAS FACITEC CURSO:
FACULDADE DE CIÊNCIAS SOCIAIS E TECNOLÓGICAS FACITEC CURSO: Bacharelado em Sistemas de Informação DISCIPLINA: Fundamentos de Sistemas de Informação PROFESSOR: Paulo de Tarso Costa de Sousa TURMA: BSI 2B
Leia maisAvaliando o que foi Aprendido
Avaliando o que foi Aprendido Treinamento, teste, validação Predição da performance: Limites de confiança Holdout, cross-validation, bootstrap Comparando algoritmos: o teste-t Predecindo probabilidades:função
Leia maisUniversidade de Brasília. Faculdade de Ciência da Informação. Prof a Lillian Alvares
Universidade de Brasília Faculdade de Ciência da Informação Prof a Lillian Alvares Fóruns Comunidades de Prática Mapeamento do Conhecimento Portal Intranet Extranet Banco de Competências Memória Organizacional
Leia maisProf. Júlio Cesar Nievola Data Mining PPGIa - PUCPR
Muitos dados são coletados e armazenados Web data, e-commerce Compras em departamentos/ supermercados Bancos / Transações com cartão de crédito Computadores se tornaram baratos e mais potentes Pressão
Leia maisIntrodução. Capítulo 1
Capítulo 1 Introdução Em computação, muitos problemas são resolvidos por meio da escrita de um algoritmo que especifica, passo a passo, como resolver um problema. No entanto, não é fácil escrever um programa
Leia maisPrograma do Curso de Pós-Graduação Lato Sensu MBA em Business Intelligence (BI)
Programa do Curso de Pós-Graduação Lato Sensu MBA em Business Intelligence (BI) Apresentação O programa de Pós-graduação Lato Sensu em Business Intelligence Inteligência Competitiva tem por fornecer conhecimento
Leia maisO Processo de KDD. Data Mining SUMÁRIO - AULA1. O processo de KDD. Interpretação e Avaliação. Seleção e Pré-processamento. Consolidação de dados
SUMÁRIO - AULA1 O Processo de KDD O processo de KDD Interpretação e Avaliação Consolidação de dados Seleção e Pré-processamento Warehouse Data Mining Dados Preparados p(x)=0.02 Padrões & Modelos Conhecimento
Leia maisFerramentas Livres de Armazenamento e Mineração de Dados
Ferramentas Livres de Armazenamento e Mineração de Dados JasperBI, Pentaho, Weka 09/2009 Eng. Pablo Jorge Madril pmadril@summa.com.br Summa Technologies www.summa.com.br Eng. Pablo Jorge Madril pmadril@summa.com.br
Leia maisUma estrutura (framework) para o Business Intelligence (BI)
Uma estrutura conceitural para suporteà decisão que combina arquitetura, bancos de dados (ou data warehouse), ferramentas analíticas e aplicações Principais objetivos: Permitir o acesso interativo aos
Leia maisCOLETA DE INFORMAÇÕES E PREVISÃO DE DEMANDA
COLETA DE INFORMAÇÕES E PREVISÃO DE DEMANDA 1) Quais são os componentes de um moderno sistema de informações de marketing? 2) Como as empresas podem coletar informações de marketing? 3) O que constitui
Leia maisGestão da Informação. Gestão da Informação. AULA 3 Data Mining
Gestão da Informação AULA 3 Data Mining Prof. Edilberto M. Silva Gestão da Informação Agenda Unidade I - DM (Data Mining) Definição Objetivos Exemplos de Uso Técnicas Tarefas Unidade II DM Prático Exemplo
Leia maisComplemento II Noções Introdutória em Redes Neurais
Complemento II Noções Introdutória em Redes Neurais Esse documento é parte integrante do material fornecido pela WEB para a 2ª edição do livro Data Mining: Conceitos, técnicas, algoritmos, orientações
Leia maisPadronização de Processos: BI e KDD
47 Padronização de Processos: BI e KDD Nara Martini Bigolin Departamento da Tecnologia da Informação -Universidade Federal de Santa Maria 98400-000 Frederico Westphalen RS Brazil nara.bigolin@ufsm.br Abstract:
Leia maisEMENTAS DAS DISCIPLINAS
EMENTAS DAS DISCIPLINAS CURSO CST ANÁLISE E DESENVOLVIMENTO DE SISTEMAS INTRODUÇÃO À COMPUTAÇÃO 68 A disciplina estuda a área da informática como um todo e os conceitos fundamentais, abrangendo desde a
Leia maisCOMPARAÇÃO DOS MÉTODOS DE SEGMENTAÇÃO DE IMAGENS OTSU, KMEANS E CRESCIMENTO DE REGIÕES NA SEGMENTAÇÃO DE PLACAS AUTOMOTIVAS
COMPARAÇÃO DOS MÉTODOS DE SEGMENTAÇÃO DE IMAGENS OTSU, KMEANS E CRESCIMENTO DE REGIÕES NA SEGMENTAÇÃO DE PLACAS AUTOMOTIVAS Leonardo Meneguzzi 1 ; Marcelo Massoco Cendron 2 ; Manassés Ribeiro 3 INTRODUÇÃO
Leia maisUma análise de ferramentas de modelagem e gerência de metadados aplicadas ao projeto de BI/DW-UFBA
Universidade Federal da Bahia Instituto de Matemática Departamento de Ciência da Computação MATA67 Projeto Final II Uma análise de ferramentas de modelagem e gerência de metadados aplicadas ao projeto
Leia maisDefinition of a Measurement Guide for Data Warehouse Projects
Definition of a Measurement Guide for Data Warehouse Projects Claudia Hazan Serviço Federal de Processamento de Dados (SERPRO) SGAN Quadra 601 Modulo V Brasilia, DF, CEP: 70836-900 BRAZIL 1 Agenda Cenário:
Leia maisPLANO DE ENSINO PRÉ-REQUISITOS: ENS
UNIVERSIDADE DO ESTADO DE SANTA CATARINA UDESC CENTRO DE EDUCAÇÃO SUPERIOR DO ALTO VALE DO ITAJAÍ CEAVI PLANO DE ENSINO DEPARTAMENTO: DSI Departamento de Sistema de Informação DISCIPLINA: Data Warehouse
Leia maisComo melhorar a tomada de decisão. slide 1
Como melhorar a tomada de decisão slide 1 P&G vai do papel ao pixel em busca da gestão do conhecimento Problema: grande volume de documentos em papel atrasavam a pesquisa e o desenvolvimento. Solução:
Leia maisINTELIGÊNCIA COMPUTACIONAL
INTELIGÊNCIA COMPUTACIONAL Engenharia de Computação Professor: Rosalvo Ferreira de Oliveira Neto Dados pessoais Rosalvo Ferreira de Oliveira Neto MSc. em ciência da computação (UFPE) rosalvo.oliveira@univasf.edu.br
Leia maisData Warehouse. Debora Marrach Renata Miwa Tsuruda
Debora Marrach Renata Miwa Tsuruda Agenda Introdução Contexto corporativo Agenda Introdução Contexto corporativo Introdução O conceito de Data Warehouse surgiu da necessidade de integrar dados corporativos
Leia maisFaculdade de Ciência da Informação Profa. Lillian Alvares
Universidade de Brasília Faculdade de Ciência da Informação Profa. Lillian Alvares Tecnologia e Gestão O principal papel da Tecnologia da Informação na Gestão do Conhecimento consiste em: Ampliar o alcance
Leia maisEstudo e Análise da Base de Dados do Portal Corporativo da Sexta Região da Polícia Militar com vista à aplicação de Técnicas de Mineração de Dados1
Estudo e Análise da Base de Dados do Portal Corporativo da Sexta Região da Polícia Militar com vista à aplicação de Técnicas de Mineração de Dados1 Rafaela Giroto, 10º módulo de Ciência da Computação,
Leia maisData Warehouse. Diogo Matos da Silva 1. Universidade Federal de Ouro Preto, Ouro Preto, MG, Brasil. Banco de Dados II
Data Warehouse Diogo Matos da Silva 1 1 Departamento de Computação Universidade Federal de Ouro Preto, Ouro Preto, MG, Brasil Banco de Dados II Diogo Matos (DECOM - UFOP) Banco de Dados II Jun 2013 1 /
Leia maisTencologia em Análise e Desenvolvimento de Sistemas Disciplina: Análise de Sistemas I Conteúdo: Conceitos de Análise de Sistemas Aula 01
Tencologia em Análise e Desenvolvimento de Sistemas Disciplina: Análise de Sistemas I Conteúdo: Conceitos de Análise de Sistemas Aula 01 Prof. Rodrigo Videschi, MBA, PMP Agenda Apresentação Ementa Bibliografia
Leia maisImage Enable: conceito
Image Enable Gestão Eletrônica de Documentos - GED Image Enable: conceito Empresas possuem diversos sistemas para controlar suas operações Sistemas integrados de gestão; Sistemas de Recursos humanos, Contabilidade,
Leia mais