Business Intelligence & Data Mining
|
|
- Alana Lopes Canela
- 8 Há anos
- Visualizações:
Transcrição
1 Business Intelligence & Data Mining Nuno Cavalheiro Marques Prof. Auxiliar DI- FCT/UNL 1
2 Armazenar Informação em Bases de Dados Porquê a utilização de Sistemas de Bases de Dados (SBD)? Armazenamento dos dados de uma forma consistente ( a informação não deve conter informação divergente sobre o mesmo facto), de fácil acesso usando linguagens de consulta e com mecanismos de segurança para o acesso à informação. Sistemas de gestão de Bases de Dados: Até 1970/80 - Sistemas Centralizados. Com a LAN:Sistemas distribuídos e Bases de Dados Distribuídas Sistema Centralizado (1970/80) Sistemas distribuídos 2
3 OLTP/OLAP Um banco quer guardar a informação dos seus clientes e das contas. Para além de guardar a informação, o banco precisa de programas para Fazer débitos e créditos numa conta Abrir e fechar contas Ver o saldo de uma conta Fazer os estratos das contas Sistema transaccional (OLTP): Milhares de acessos simultâneos. Ninguém (incluindo o banco) pode perder dinheiro. Ninguém quer esperar pela transacção (ex. Multibanco, no Natal). Sistema Analítico (OLAP): Analisar os volumes de transacções, num dado dia, a determinada hora, no comércio tradicional e em hipermercados. Decidir se deve ser concedido crédito ao dono de um pequeno negócio. 3
4 Bases de Dados: Classes de Aplicações On Line Transaction Processing (OLTP): SQL; Taxas Elevadas de transacções de Update: Alto nível de concorrência; Técnicas especiais de COMMIT; Arquitecturas especificas (Hardware e Software). On Line Analitical Processing (OLAP): Bons algoritmos de query evaluation; Query Optimization. Arquitecturas especificas (Hardware e Software). Sistemas Integrados: Uma Mistura dos 2. Junção das várias componentes (IBM DB2 e Oracle). SQL Server (Não multi-plataforma, OLAP sem DataMining) 4
5 Consultas à Informação Não basta armazenar os dados. Há que, pelo menos, poder consultar os dados armazenados. O que são consultas? Analisar a informação nas tabelas para obter um conjunto filtrado de informação Há quatro consultas possiveis a uma base de dados: Projecção: Seleccionar um conjunto de campos de uma ou várias tabelas. Selecção: Criar condições que permitam filtrar um conjunto de registos. Junção: Juntar duas tabelas (através de uma relacção) Agregação: Operações estatísticas sobre um grupo de registos com propriedades comuns (ex.: saldo médio de todos os clientes no mesmo balcão). 5
6 Agregação : Operações Estatísticas Estatísticas como, por exemplo, o somatório ou a média Exemplo: Total gasto por cada cliente em cursos Total Curso: Soma([Nº de participantes]*[cust o por Participante]) Agrupar pela empresa (Group By) Seleccionar Σ para agrupar 6
7 Warehousing: : Tabelas de Contingência e Cubo OLAP Cross Tabulation of sales by itemname and color A tabela acima é um exemplo de uma tabela de contingência para análise de dados (também conhecida como pivot-table). Uma tabela de contingência é uma tabela onde: Os valores para um dado atributo (enquanto dimensão) formam as linhas e colunas. Outras dimensões podem ser vistas no topo Os valores em cada célula são agregações sobre os valores das dimensões que especificam essa célula. OBJECTIVO: RESPOSTA RÁPIDA A NOVAS QUESTÕES. 7
8 Meios mecânicos para tratar dados Assumindo os dados numa Bases de Dados ou num Armazéns de Dados (Data Warehousing) As técnicas mecânicas são capazes de: Seleccionar (BD/SQL) Filtrar e agrupar (OLAP/Data Warehousing) E Interpretar os Dados! (Data Mining) Estes processos já são hoje necessários à sobrevivência do/a: Ex: Profissional. Cientista. Organização. A bolsa é já hoje, em grande medida, um jogo de computadores contra computadores! 8
9 Algumas aplicações da Data Mining Analise de compras num supermercado: Quem compra leite também compra pão. Clientes de risco na concessão de crédito Os clientes com menos dinheiro (mas que podem pagar) são os mais lucrativos! Preferências de compra Amazon Clientes de risco Prever os clientes tem maior probabilidade de mudar de operadora de telefone. Lançar uma campanha de marketing para reter o cliente. Apenas investir em publicidade para clientes que têm boa probabilidade de aceitar um determinado produto Segmentação Detecção de fraudes 9
10 OLAP: Data Warehouse Fonte: 10
11 Máquinas para suporte e análise de Bases de Dados com Terabytes - arquitecturas paralelas IBM xseries 345 Com 1CPU: Shared nothing SUN FIRE V40Z Arquitectura PC Armário até 45U. Máquinas preparadas para processamento. Tipicamente com vários GB de RAM. Solução standard para múltiplos nós. Neste momento são possíveis soluções a menos de 900 por CPU. Até 4 CPUs: Shared memory 11
12 Detalhe HP-Alpha Server (max 32 CPUs) At A Glance AlphaServer GS320 systems include: One 1224-MHz CPU module; up to MHz Alpha processors are supported Optional HP Capacity on Demand (CoD) SMP processors for non-disruptive performance growth 16-MB on-board cache per processor Advanced crossbar switch with 7-GB memory bandwidth per building block; up to 57-GB memory bandwidth per system Choice of memory: up to 256-GB memory supported PCI I/O master drawer with 12 configurable PCI slots; up to bit PCI slots supported Up to bit PCI buses with 12.8-GB aggregate I/O bandwidth PCI 10/100 Mbit Ethernet adapter 18.2-GB SCSI disk drive 600-MB CD-ROM drive Enhanced reliability with ECC-protected memory, processor cache, and system data paths Security of RAID storage and online add and removal of CPUs Optional redundant power supplies with N+1 power option Tru64 UNIX or OpenVMS factory installed software (FIS); optional high availability support with Tru64 UNIX and OpenVMS cluster solutions Product warranty, one-year hardware, on-site next business day 12
13 IBM z-series DB2 Sysplex 13
14 KDD & Data Mining Descoberta de conhecimento em Bases de Dados (KDD, ou Knowledge Discovery in Databases): É o processo de identificação de estruturas, válidas, novas, potencialmente úteis e idealmente compreensíveis, nos dados. Data mining é o processo no KDD que, sobre limitações de eficiência na computação aceitáveis, enumera estruturas (padrões ou modelos) sobre os dados. Knowledge Discovery in Databases: Descoberta de Conhecimento em Bases de Dados Data Mining: Mineração de Dados / Extracção de Conhecimento. Fayyad et al. (1996) 14
15 KDD conhecimento Modelos Visualização Base De Dados, Textos Input data Data Mining Dados limpos Agregação Target Data Pré-processamento e limpeza Selecção e amostragem Data Warehouse 15
16 Uma nova área de pesquisa Na intersecção de diversas disciplinas: Bases de Dados. Visualização. Aprendizagem Automática: Estatística. Reconhecimento de Padrões. AI. E ainda, maior relevância (do que na aprendizagem automática) a: Optimização. Supercomputação. Computação Distribuída. 16
17 Visão Histórica da aprendizagem automática e Data Mining 1900:Census Americano realizado com as máquinas de tabulação e cartões prefurados: máquinas para analise (contagem ordenação e agrupamento) de grandes quantidades de informação. O sucesso destas máquinas leva à criação da IBM, nos anos 20 do século XX. 1950: Com os primeiros computadores surge a pesquisa em IA. 1960: Surge o conceito de perceptrão. FIM década: Falhas em atingir os objectivos iniciais levam a cortes orçamentais. Minsky/Papert: O perceptrão apenas pode aprender regras simples (não pode aprender o XOR!) 1970: Expert Systems: o conhecimento de especialistas pode ser facilmente expresso em regras if then (como encontrar as regras certas??) 1980: Algoritmos simples para criar árvores de decisão. Redes neuronais aprendem regras complexas. Os algoritmos genéticos modelam as regras da evolução. 1990: 1995: Primeira conferencia sobre Data Mining/KDD 17
18 Alguns Métodos no Data Mining Segundo a Encyclopedia of Computer Science Previsão (y n =f(x m ); aprende-se f(x m )). Regressão (f é continuo). Classificação (f é discreto). Segmentação de Dados (ou agrupamento - clustering) Aprende-se f (y n, x m ) Resumo de Dados Regras Associativas 18
19 O que é Classificação? O objectivo da classificação é organizar e categorizar os conjuntos de dados em classes distintas. Três fases: Construção do classificador com base na distribuição dos dados (construção). Modelo é avaliado pela classificação de novos dados (teste). Dado o modelo de classificação, e novos dados não classificados, o atributo classe pode ser predicto com base no modelo (classificação). 19
20 O que é um padrão? Um padrão é uma composição de atributos (características) que descreve uma entidade Numa tarefa de classificação um padrão é representado por um par {x, c} : x vector de características; c é valor do atributo classe (conceito por detrás da observação) 20
21 Perceptrão para classificar padrões x 1 x 2 x 3 x 4 x 5 w i1 w i2 w i3 w i4 w i5 Neuronio i Modela o sistema da visão humana (F. Rosenblatt 1956) Um dos primeiros modelos de rede neuronal. Apenas uma camada. y i Stimulus i = wij x j j = x = 1 0 z 0 1 f z = else 0 1 f z) = 1 z + e u u rest f ( ) Resposta ( Sigmoidal z) = e e z z e + e z z bias term ( w x u ) y + = f i 0 0 Heaviside step function ( Hyperbolic tangent i i 21
22 Mapeamento de padrões do perceptrão sigmoid x 0 w 0 x 1 w 1 w 2 x 2 y 1.2 output input /(1+exp(-x))-1 x 2 Decision boundary <0 Slope w 2 /w 1 u = 0 = w x + w x + w x w 0 >0 x 1 22
23 Fronteira de Decisão Linear: exemplo 8 6 TW O-CLASS DATA IN A TW O-DIMENSIONAL FEATURE SPACE Decision Region 1 Decision Region 2 4 Feature Decision Boundary Feature 1 23
24 Treino do perceptrão: : Regra Delta e = d i y i w = λ e ij x j λ=coeficiente de aprendizagem w ij =ligação do neuronio x j ao y i x=(x 1,x 2,...,x n ) entrada RNN y=(y 1,y 2,...,y n ) saída da RNN d=(d 1,d 2,...,d n ) padrão da entrada (x,d) exemplo de treino e=erro da RNN Descida por gradiente na superfície do erro. Garantia de encontrar a configuração de erro minimo numa RNN com uma única camada. Aproximação gradual do comportamento desejado. Simulação y 1 y 2 y 3 w 11 w 12 w 13 w 14 x 1 x 2 x 3 x 4 24
25 8 7 Fronteira de decisão de erro mínimo FEATURE FEATURE 1 25
26 Classificador linear simples pode ser definido para espaços de maior dimensionalidade (superior a 2D) 26
27 pode ser visualizado como um hiperplano d-dimensional 27
28 O que é que acontecería a este conjunto de dados se não fossem descritos pela terceira dimensão? E projectado neste plano? 28
29 Neste caso, não se pode obter uma precisão perfeita com classificador linear simples Poder-se-ia tentar resolver o problema com classificador quadrático ou classificador cúbico simples... 29
30 Classificador não linear: o Multi-Layer Perceptron (MLP) Uma das redes mais populares, versáteis e precisas. RNN Feedforward As camadas ocultas têm de ter uma função de transferencia não linear. Pode aproximar qualquer função y=f(x) Utilizados em: Classificação Controle. Modelação. Previsão. 30
31 Aprendizagem no MLP Aprendizagem Supervisionada Regra Delta Apenas pode treinar redes com uma camada. i.e. Apenas pode resolver problemas que são linearmente separáveis. Minsky-Papert s Perceptrons (1969) Propagação inversa do erro Rumelhart-McClelland (1986) Generalização da Regra Delta Pode treinar qualquer número de camadas. 31
32 Regiões de Decisão num MLP Single-layer HALF PLANE BOUNDED BY HYPERPLANE A B B A A B Two-layer CONVEX OPEN OR CLOSED REGION A B B A A B Three-layer ARBITRARY (complexity limited by number of neurons) A B B A A B 32
33 Um exemplo clássico: : o conjunto de Dados IRIS R. A. Fisher s Iris Dataset. Virginica 3 classes 50 entidades de cada classe Classificar plantas Iris numa das 3 espécies, usando os atributos Petal Length e Petal Width. Setosa Versicolor Iris Setosa Iris Versicolor Iris Virginica 33
34 Classificador para o conjunto IRIS Virginica Setosa Versicolor IF petal width > (0.325 * petal length ) THEN class = Virginica Elseif petal width No conjunto de treino aprender-se-ia a fronteira de decisão que descrimina (perfeitamente) as classes Setosa e Virginica/Versicolor; seguidamente o classificador aprende a discriminar (aproximadamente) entre as classes Virginica and Versicolor. 34
35 IM4D: Construção de um classificador por árvore de decisão e análise do modelo 35
36 Treino e sobre-ajustamento Y Y X Ajuste da curva curva linear Acontece quando o conceito a ser aprendido é demasiado específico, de acordo com os dados de treino. A rede neuronal que classifica perfeitamente a amostra, pode não ser a melhor ruído nos dados de treino os dados de treino podem não corresponder a uma amostra representativa. Melhora-se o modelo no conjunto de treino, mas o mesmo torna-se mais complicado Aumenta o risco de modelar ruído e cuincidências no conjunto de dados. Pode fazer diminuir o poder de classificação do conceito aprendido, para novos casos. X Ajuste da curva com demasiados parâmetros 36
37 Sobre-ajustamento numa rede neuronal Base: 37
38 Ferramentas para a Data Mining Algumas Ferramentas: SAS Enterprise Miner. Intelligent Miner (IBM). Statistica SPSS Darwin (Oracle, descontinuado integração API JAVA). Weka (Open Source, em JAVA). 38
39 Problemas tradicionais na Data Mining KDD: 80% do tempo na preparação dos dados e 20% em mining. Fácil de fazer de forma ad hoc mas é necessário cuidado! Falta de visão de longo termo: O que se quer obter dos dados no futuro? Nem todos os ficheiros estão actualizados Falta de colaboração de um departamento: Dêem-nos as queries que depois enviamos a informação Problemas legais ou de privacidade. Dificuldades em relacionar a informação. Timing: Os dados podem ser relacionados, mas com 6 meses de atraso Problemas de interpretação 39
40 Integração: Oracle 9i Entrepise/AS mar/images/o23instant_f1.jpg 40
41 Algumas Referencias para mais informação Database System Concepts. Silberschatz, Korth, Sudarshan. 4a Edição. McGrawHill (referencia para Bases de Dados) Data Mining by Pieter Adriaans, Dolf Zantinge, SyllogicFirm - Addison-Wesley (referencia introdutória para o Data Mining) Tom M. Mitchell, Machine Learning. McGraw Hill. (referencia para aprendizagem automática). Simon Haykin, Neural networks : a comprehensive foundation. Prentice Hall International, (referencia para Redes Neuronais) Ian H. Witten and Eibe Frank. Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations. Morgan Kaufmann (referencia genérica em Data Mining, introduz o pacote Weka) 41
42 FIM 42
MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br
MINERAÇÃO DE DADOS APLICADA Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br Processo Weka uma Ferramenta Livre para Data Mining O que é Weka? Weka é um Software livre do tipo open source para
Leia maisSistemas de Apoio à Decisão
Sistemas de Apoio à Decisão Data Mining & Optimização Victor Lobo Objectivos gerais Abrir horizontes em temas actuais Aprender técnicas usadas em Sistemas de apoio à decisão ou Business Intelligence Métodos
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Tipos de aprendizagem 3. Paradigmas de aprendizagem 4. Modos de aprendizagem
Leia maisPlanejamento Estratégico de TI. Prof.: Fernando Ascani
Planejamento Estratégico de TI Prof.: Fernando Ascani Data Mining Os métodos tradicionais de Data Mining são: Classificação Associa ou classifica um item a uma ou várias classes categóricas pré-definidas.
Leia maisData Mining II Modelos Preditivos
Data Mining II Modelos Preditivos Prof. Doutor Victor Lobo Mestre André Melo Mestrado em Estatística e Gestão de Informação Objectivo desta disciplina Fazer previsões a partir de dados. Conhecer os principais
Leia maisCriação e uso da Inteligência e Governança do BI
Criação e uso da Inteligência e Governança do BI Criação e uso da Inteligência e Governança do BI Governança do BI O processo geral de criação de inteligência começa pela identificação e priorização de
Leia maisProf. Júlio Cesar Nievola Data Mining PPGIa PUCPR
Uma exploração preliminar dos dados para compreender melhor suas características. Motivações-chave da exploração de dados incluem Ajudar na seleção da técnica correta para pré-processamento ou análise
Leia maisData Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento
Data Mining Prof Luiz Antonio do Nascimento Data Mining Ferramenta utilizada para análise de dados para gerar, automaticamente, uma hipótese sobre padrões e anomalias identificadas para poder prever um
Leia maisAula 02: Conceitos Fundamentais
Aula 02: Conceitos Fundamentais Profa. Ms. Rosângela da Silva Nunes 1 de 26 Roteiro 1. Por que mineração de dados 2. O que é Mineração de dados 3. Processo 4. Que tipo de dados podem ser minerados 5. Que
Leia maisMicrosoft Innovation Center
Microsoft Innovation Center Mineração de Dados (Data Mining) André Montevecchi andre@montevecchi.com.br Introdução Objetivo BI e Mineração de Dados Aplicações Exemplos e Cases Algoritmos para Mineração
Leia maisFases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse
Definição escopo do projeto (departamental, empresarial) Grau de redundância dos dados(ods, data staging) Tipo de usuário alvo (executivos, unidades) Definição do ambiente (relatórios e consultas préestruturadas
Leia maisExtração de Árvores de Decisão com a Ferramenta de Data Mining Weka
Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka 1 Introdução A mineração de dados (data mining) pode ser definida como o processo automático de descoberta de conhecimento em bases de
Leia maisDATA WAREHOUSE. Rafael Ervin Hass Raphael Laércio Zago
DATA WAREHOUSE Rafael Ervin Hass Raphael Laércio Zago Roteiro Introdução Aplicações Arquitetura Características Desenvolvimento Estudo de Caso Conclusão Introdução O conceito de "data warehousing" data
Leia maisInteligência de Negócio. Brian Cowhig
Inteligência de Negócio Brian Cowhig Inteligência de Negócio O Que é Inteligência de Negócio? Três Níveis de Inteligência de Negócio Database Query OLAP Data Mining Produtos de Inteligência de Negócio
Leia maisXIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO
XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO EPE0147 UTILIZAÇÃO DA MINERAÇÃO DE DADOS EM UMA AVALIAÇÃO INSTITUCIONAL
Leia maisMLP (Multi Layer Perceptron)
MLP (Multi Layer Perceptron) André Tavares da Silva andre.silva@udesc.br Roteiro Rede neural com mais de uma camada Codificação de entradas e saídas Decorar x generalizar Perceptron Multi-Camada (MLP -
Leia maisO objetivo da Mineração de Dados é extrair ou minerar conhecimento de grandes volumes de
MINERAÇÃO DE DADOS MINERAÇÃO DE DADOS O objetivo da Mineração de Dados é extrair ou minerar conhecimento de grandes volumes de dados. A mineração de dados é formada por um conjunto de ferramentas e técnicas
Leia maisMineração de Dados: Introdução e Aplicações
Mineração de Dados: Introdução e Aplicações Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br Apresentação Luiz Merschmann Engenheiro
Leia maisData Warehouse Mineração de Dados
Data Warehouse Mineração de Dados Profa. Roberta Macêdo M. Gouveia robertammg@gmail.com 1 18/12/2014 Data Warehouse Data Mining Big Data A mina de ouro debaixo dos bits 2 Data Warehouse: A Memória da Empresa
Leia maisIntrodução a Datamining (previsão e agrupamento)
Introdução a Datamining (previsão e agrupamento) Victor Lobo Mestrado em Estatística e Gestão de Informação E o que fazer depois de ter os dados organizados? Ideias base Aprender com o passado Inferir
Leia maisFigura 5.1.Modelo não linear de um neurônio j da camada k+1. Fonte: HAYKIN, 2001
47 5 Redes Neurais O trabalho em redes neurais artificiais, usualmente denominadas redes neurais ou RNA, tem sido motivado desde o começo pelo reconhecimento de que o cérebro humano processa informações
Leia maisTÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE
TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE Engenharia de Computação Professor: Rosalvo Ferreira de Oliveira Neto Estudos Comparativos Recentes - Behavior Scoring Roteiro Objetivo Critérios de Avaliação
Leia maisADMINISTRAÇÃO DOS RECURSOS DE DADOS
Capítulo 7 ADMINISTRAÇÃO DOS RECURSOS DE DADOS 7.1 2003 by Prentice Hall OBJETIVOS Por que as empresas sentem dificuldades para descobrir que tipo de informação precisam ter em seus sistemas de informação?
Leia maisProf. Msc. Paulo Muniz de Ávila
Prof. Msc. Paulo Muniz de Ávila O que é Data Mining? Mineração de dados (descoberta de conhecimento em bases de dados): Extração de informação interessante (não-trivial, implícita, previamente desconhecida
Leia maisIntrodução aos Sistemas Operativos
Introdução aos Sistemas Operativos Computadores e Redes de Comunicação Mestrado em Gestão de Informação, FEUP 06/07 Sérgio Sobral Nunes mail: sergio.nunes@fe.up.pt web: www.fe.up.pt/~ssn Sumário Definição
Leia maisResumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence
É um conjunto de conceitos e metodologias que, fazem uso de acontecimentos e sistemas e apoiam a tomada de decisões. Utilização de várias fontes de informação para se definir estratégias de competividade
Leia maisDescoberta de Conhecimento em Bases de Dados. Classificação
Universidade Técnica de Lisboa INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO Informática e Sistemas de Informação Aplicados em Economia Descoberta de Conhecimento em Bases de Dados. Classificação Descoberta
Leia maisSISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER
SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI Fernando Luiz de Oliveira 1 Thereza Patrícia. P. Padilha 1 Conceição A. Previero 2 Leandro Maciel Almeida 1 RESUMO O processo
Leia maisADM041 / EPR806 Sistemas de Informação
ADM041 / EPR806 Sistemas de Informação UNIFEI Universidade Federal de Itajubá Prof. Dr. Alexandre Ferreira de Pinho 1 Sistemas de Apoio à Decisão (SAD) Tipos de SAD Orientados por modelos: Criação de diferentes
Leia maisData, Text and Web Mining
Data, Text and Web Mining Fabrício J. Barth TerraForum Consultores Junho de 2010 Objetivo Apresentar a importância do tema, os conceitos relacionados e alguns exemplos de aplicações. Data, Text and Web
Leia maisIntrodução a Datamining (previsão e agrupamento)
E o que fazer depois de ter os dados organizados? Introdução a Datamining (previsão e agrupamento) Victor Lobo Mestrado em Estatística e Gestão de Informação Ideias base Aprender com o passado Inferir
Leia maisCurso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan
Faculdade INED Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan 1 Unidade 4.5 2 1 BI BUSINESS INTELLIGENCE BI CARLOS BARBIERI
Leia maisDEPARTAMENTO DE MATEMÁTICA E CIÊNCIAS EXPERIMENTAIS
DEPARTAMENTO DE MATEMÁTICA E CIÊNCIAS EXPERIMENTAIS Planificação Anual da Disciplina de TIC Módulos 1,2,3-10.ºD CURSO PROFISSIONAL DE TÉCNICO DE APOIO À GESTÃO DESPORTIVA Ano Letivo 2015-2016 Manual adotado:
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Horários Aulas Sala [quinta-feira, 7:30 12:00] Atendimento Segunda
Leia maisPlanejamento Estratégico de TI. Prof.: Fernando Ascani
Planejamento Estratégico de TI Prof.: Fernando Ascani Data Warehouse - Conceitos Hoje em dia uma organização precisa utilizar toda informação disponível para criar e manter vantagem competitiva. Sai na
Leia maisO Processo de KDD. Data Mining SUMÁRIO - AULA1. O processo de KDD. Interpretação e Avaliação. Seleção e Pré-processamento. Consolidação de dados
SUMÁRIO - AULA1 O Processo de KDD O processo de KDD Interpretação e Avaliação Consolidação de dados Seleção e Pré-processamento Warehouse Data Mining Dados Preparados p(x)=0.02 Padrões & Modelos Conhecimento
Leia maisCláusula 1.º Objecto. Cláusula 2.º Especificação da prestação
CADERNO DE ENCARGOS CONTRATAÇÃO DE SERVIÇOS DE PARA A IMPLEMENTAÇÃO DE UM PROJECTO DE ARQUIVO DIGITAL DE INFRA-ESTRUTURAS DE IT O presente Caderno de Encargos compreende as cláusulas a incluir no contrato
Leia mais4. Que tipos de padrões podem ser minerados. 5. Critérios de classificação de sistemas de Data Mining. 6. Tópicos importantes de estudo em Data Mining
Curso de Data Mining - Aula 1 1. Como surgiu 2. O que é 3. Em que tipo de dados pode ser aplicado 4. Que tipos de padrões podem ser minerados 5. Critérios de classificação de sistemas de Data Mining 6.
Leia maisBanco de Dados - Senado
Banco de Dados - Senado Exercícios OLAP - CESPE Material preparado: Prof. Marcio Vitorino OLAP Material preparado: Prof. Marcio Vitorino Soluções MOLAP promovem maior independência de fornecedores de SGBDs
Leia maisData Warehousing e OLAP
Data Warehousing e OLAP Jornadas de Engenharia Informática Instituto Politécnico da Guarda Henrique Madeira Departamento de Engenharia Informática Faculdade de Ciências e Tecnologia Universidade de Coimbra
Leia maisChapter 3. Análise de Negócios e Visualização de Dados
Chapter 3 Análise de Negócios e Visualização de Dados Objetivos de Aprendizado Descrever a análise de negócios (BA) e sua importância par as organizações Listar e descrever brevemente os principais métodos
Leia maisData Mining: Conceitos e Técnicas
Data Mining: Conceitos e Técnicas DM, DW e OLAP Data Warehousing e OLAP para Data Mining O que é data warehouse? De data warehousing para data mining Data Warehousing e OLAP para Data Mining Data Warehouse:
Leia maisContexto de Big Data, Ciência de Dados e KDD
Contexto de Big Data, Ciência de Dados e KDD Fabrício J. Barth! Disciplina de Modelagem Descritiva e Preditiva! Pós-Graduação em Big Data e Analytics 100 10 quantidade de informações Sempre houve:!! Produção
Leia maisConcepção e Elaboração
UNIVERSIDADE ESTADUAL PAULISTA INSTITUTO DE BIOCIÊNCIAS, LETRAS E CIÊNCIAS EXATAS DEPARTAMENTO DE CIÊNCIAS DE COMPUTAÇÃO E ESTATÍSTICA Análise e Projeto Orientado a Objetos Concepção e Elaboração Estudo
Leia maisSAD orientado a DADOS
Universidade do Contestado Campus Concórdia Curso de Sistemas de Informação Prof.: Maico Petry SAD orientado a DADOS DISCIPLINA: Sistemas de Apoio a Decisão SAD orientado a dados Utilizam grandes repositórios
Leia maisENIAC. Introdução aos Computadores e à Programação (Noções Básicas)
ENIAC Introdução aos Computadores e à ção (Noções Básicas) Introdução aos Computadores e à ção (Noções Básicas) 1 Introdução aos Computadores e à ção (Noções Básicas) 2 O transistor foi inventado em 1947
Leia maisGESTÃO. Gestão dos Processos e Operações Gestão de Sistemas e Tecnologias de Informação (dentro do capítulo 6) CLF
GESTÃO Gestão dos Processos e Operações Gestão de Sistemas e Tecnologias de Informação (dentro do capítulo 6) Informação e Decisões Gerir envolve tomar muitas e frequentes decisões Para decidir com eficácia
Leia maisFerramentas Livres de Armazenamento e Mineração de Dados
Ferramentas Livres de Armazenamento e Mineração de Dados JasperBI, Pentaho, Weka 09/2009 Eng. Pablo Jorge Madril pmadril@summa.com.br Summa Technologies www.summa.com.br Eng. Pablo Jorge Madril pmadril@summa.com.br
Leia maisTECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO - TIC 10º C. Planificação de. Curso Profissional de Técnico de Secretariado
Escola Básica e Secundária de Velas Planificação de TECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO - TIC Curso Profissional de Técnico de Secretariado 10º C MÓDULO 1 FOLHA DE CÁLCULO Microsoft Excel Conteúdos
Leia maisSistema de mineração de dados para descobertas de regras e padrões em dados médicos
Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Pollyanna Carolina BARBOSA¹; Thiago MAGELA² 1Aluna do Curso Superior Tecnólogo em Análise e Desenvolvimento de Sistemas
Leia maisKDD E MINERAÇÃO DE DADOS:
KDD E MINERAÇÃO DE DADOS: Introdução e Motivação Prof. Ronaldo R. Goldschmidt ronaldo@de9.ime.eb.br rribeiro@univercidade.br geocities.yahoo.com.br/ronaldo_goldschmidt Fatos: Avanços em TI e o crescimento
Leia maisCadeira de Tecnologias de Informação. Conceitos fundamentais de sistemas e tecnologias de informação e de gestão do conhecimento.
Cadeira de Tecnologias de Informação Ano lectivo 2007/08 Conceitos fundamentais de sistemas e tecnologias de informação e de gestão do conhecimento. Prof. Mário Caldeira Profª Ana Lucas Dr. Fernando Naves
Leia maisProjeto de Redes Neurais e MATLAB
Projeto de Redes Neurais e MATLAB Centro de Informática Universidade Federal de Pernambuco Sistemas Inteligentes IF684 Arley Ristar arrr2@cin.ufpe.br Thiago Miotto tma@cin.ufpe.br Baseado na apresentação
Leia maisA Grande Importância da Mineração de Dados nas Organizações
A Grande Importância da Mineração de Dados nas Organizações Amarildo Aparecido Ferreira Junior¹, Késsia Rita da Costa Marchi¹, Jaime Willian Dias¹ ¹Universidade Paranaense (Unipar) Paranavaí PR Brasil
Leia maisInteligência Empresarial. BI Business Intelligence. Business Intelligence 22/2/2011. Prof. Luiz A. Nascimento
Inteligência Empresarial Prof. Luiz A. Nascimento BI Pode-se traduzir informalmente Business Intelligence como o uso de sistemas inteligentes em negócios. É uma forma de agregar a inteligência humana à
Leia maisPlanejamento Estratégico de TI. Prof.: Fernando Ascani
Planejamento Estratégico de TI Prof.: Fernando Ascani BI Business Intelligence A inteligência Empresarial, ou Business Intelligence, é um termo do Gartner Group. O conceito surgiu na década de 80 e descreve
Leia maisData Mining Software Weka. Software Weka. Software Weka 30/10/2012
Data Mining Software Weka Prof. Luiz Antonio do Nascimento Software Weka Ferramenta para mineração de dados. Weka é um Software livre desenvolvido em Java. Weka é um É um pássaro típico da Nova Zelândia.
Leia maisModelos Pioneiros de Aprendizado
Modelos Pioneiros de Aprendizado Conteúdo 1. Hebb... 2 2. Perceptron... 5 2.1. Perceptron Simples para Classificaçãod e Padrões... 6 2.2. Exemplo de Aplicação e Motivação Geométrica... 9 2.3. Perceptron
Leia maisPlanejamento e Orçamento
Planejamento e Orçamento O SIPLAG Sistema Integrado de Planejamento, Orçamento e Gestão, é um sistema voltado à gestão governamental, permitindo a elaboração do Plano Plurianual, da Lei Orçamentária Anual,
Leia maisSistemas de Apoio à Decisão. Vocabulário e conceitos Vista geral
Sistemas de Apoio à Decisão Vocabulário e conceitos Vista geral Decisão A escolha de uma entre várias alternativas Processo de tomada de decisão (decision making) Avaliar o problema Recolher e verificar
Leia maisUNIVERSIDADE FEDERAL DE SANTA CATARINA
UNIVERSIDADE FEDERAL DE SANTA CATARINA CIÊNCIAS DA COMPUTAÇÃO MÁQUINAS DE COMITÊ APLICADAS À FILTRAGEM DE SPAM Monografia submetida à UNIVERSIDADE FEDERAL DE SANTA CATARINA para a obtenção do grau de BACHAREL
Leia maisUma peça estratégica para o seu negócio
Uma peça estratégica para o seu negócio INFORMAÇÃO GERAL DA EMPRESA CASO DE SUCESSO EM IMPLEMENTAÇÃO BI PERGUNTAS E RESPOSTAS Fundada em 1997, Habber Tec é uma empresa especializada na oferta de soluções
Leia maisSistemas Operacionais. Conceitos de um Sistema Operacional
Sistemas Operacionais Conceitos de um Sistema Operacional Modo usuário e Modo Kernel Como já vimos são ambientes de execução diferentes no processador Há um conjunto de funções privilegiadas acessadas
Leia maisDWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS
DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS Tácio Dias Palhão Mendes Bacharelando em Sistemas de Informação Bolsista de Iniciação Científica da FAPEMIG taciomendes@yahoo.com.br Prof.
Leia maisDATA WAREHOUSE. Introdução
DATA WAREHOUSE Introdução O grande crescimento do ambiente de negócios, médias e grandes empresas armazenam também um alto volume de informações, onde que juntamente com a tecnologia da informação, a correta
Leia maisComparativo de desempenho do Pervasive PSQL v11
Comparativo de desempenho do Pervasive PSQL v11 Um artigo Pervasive PSQL Setembro de 2010 Conteúdo Resumo executivo... 3 O impacto das novas arquiteturas de hardware nos aplicativos... 3 O projeto do Pervasive
Leia maisProf. Sandrina Correia
Tecnologias de I informação de C omunicação 9º ANO Prof. Sandrina Correia TIC Prof. Sandrina Correia 1 Objectivos Definir os conceitos de Hardware e Software Identificar os elementos que compõem um computador
Leia maisInternet Update de PaintManager TM. Manual de instalação e utilização do programa de actualização
Internet Update de PaintManager TM Manual de instalação e utilização do programa de actualização ÍNDICE O que é o programa Internet Update? 3 Como se instala e executa o programa? 3 Aceder ao programa
Leia maisTECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO
TECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO O que é a Informática? A palavra Informática tem origem na junção das palavras: INFORMAÇÃO + AUTOMÁTICA = INFORMÁTICA...e significa, portanto, o tratamento da informação
Leia maisConjunto de instruções do CPU. Arquitectura de um computador. Definição das instruções (1) Definição das instruções (2)
Arquitectura de um computador Caracterizada por: Conjunto de instruções do processador (ISA Estrutura interna do processador (que registadores existem, etc Modelo de memória (dimensão endereçável, alcance
Leia maisPersistência e Banco de Dados em Jogos Digitais
Persistência e Banco de Dados em Jogos Digitais Prof. Marcos Francisco Pereira da Silva Especialista em Engenharia de Software Jogos Digitais - Computação Gráfica 1 Agenda Vantagens de usar a abordagem
Leia maisDesenvolvimento do Módulo de Pré-processamento e Geração de Imagens de. Imagens de Teste do Sistema DTCOURO
Desenvolvimento do Módulo de Pré-processamento e Geração de Imagens de Teste do Sistema DTCOURO Willian Paraguassu Amorim 27 de julho de 2005 1 Título Desenvolvimento do Módulo de Pré-processamento e Geração
Leia maisDado: Fatos conhecidos que podem ser registrados e têm um significado implícito. Banco de Dados:
MC536 Introdução Sumário Conceitos preliminares Funcionalidades Características principais Usuários Vantagens do uso de BDs Tendências mais recentes em SGBDs Algumas desvantagens Modelos de dados Classificação
Leia maisAdministração de Sistemas de Informação I
Administração de Sistemas de Informação I Prof. Farinha Aula 04 Conceito Sistema de Informação é uma série de elementos ou componentes inter-relacionados que coletam (entrada), manipulam e armazenam (processo),
Leia maisAprend.e Sistema integrado de formação e aprendizagem
Aprend.e Sistema integrado de formação e aprendizagem Pedro Beça 1, Miguel Oliveira 1 e A. Manuel de Oliveira Duarte 2 1 Escola Aveiro Norte, Universidade de Aveiro 2 Escola Aveiro Norte, Departamento
Leia maisSistemas de Bases de Dados
Sistemas de Bases de Dados Carlos Viegas Damásio José Alferes e Carlos Viegas Damásio Sistemas de Bases de Dados 2014/15 Objectivos - Em Bases de Dados (2º ano) pretendia-se: Que os estudantes fossem capazes
Leia maisADMINISTRAÇÃO DOS RECURSOS DE DADOS
7 ADMINISTRAÇÃO DOS RECURSOS DE DADOS OBJETIVOS Por que as empresas sentem dificuldades para descobrir que tipo de informação precisam ter em seus sistemas de informação ão? Como um sistema de gerenciamento
Leia maisRedes Neurais. Profa. Flavia Cristina Bernardini
Redes Neurais Profa. Flavia Cristina Bernardini Introdução Cérebro & Computador Modelos Cognitivos Diferentes Cérebro Computador Seqüência de Comandos Reconhecimento de Padrão Lento Rápido Rápido Lento
Leia maisTópicos Avançados Business Intelligence. Banco de Dados Prof. Otacílio José Pereira. Unidade 10 Tópicos Avançados Business Inteligence.
Tópicos Avançados Business Intelligence Banco de Dados Prof. Otacílio José Pereira Unidade 10 Tópicos Avançados Business Inteligence Roteiro Introdução Níveis organizacionais na empresa Visão Geral das
Leia maisPortugalAves Introdução online de dados de Monitorização de Aves Marinhas e RAM
PortugalAves Introdução online de dados de Monitorização de Aves Marinhas e RAM 05.07.2012 Introdução O PortugalAves é uma base de dados espacial na Internet sobre a ocorrência e distribuição de aves em
Leia maisInteligência Artificial. Redes Neurais Artificiais
Curso de Especialização em Sistemas Inteligentes Aplicados à Automação Inteligência Artificial Redes Neurais Artificiais Aulas Práticas no Matlab João Marques Salomão Rodrigo Varejão Andreão Matlab Objetivos:
Leia maisExtração de Conhecimento & Mineração de Dados
Extração de Conhecimento & Mineração de Dados Nesta apresentação é dada uma breve introdução à Extração de Conhecimento e Mineração de Dados José Augusto Baranauskas Departamento de Física e Matemática
Leia maisCOMPARAÇÃO DOS MÉTODOS DE SEGMENTAÇÃO DE IMAGENS OTSU, KMEANS E CRESCIMENTO DE REGIÕES NA SEGMENTAÇÃO DE PLACAS AUTOMOTIVAS
COMPARAÇÃO DOS MÉTODOS DE SEGMENTAÇÃO DE IMAGENS OTSU, KMEANS E CRESCIMENTO DE REGIÕES NA SEGMENTAÇÃO DE PLACAS AUTOMOTIVAS Leonardo Meneguzzi 1 ; Marcelo Massoco Cendron 2 ; Manassés Ribeiro 3 INTRODUÇÃO
Leia maisData Warehouse Mineração de Dados
Data Warehouse Mineração de Dados Profa. Roberta Macêdo M. Gouveia robertammg@gmail.com 1 11/06/2015 DATA WAREHOUSE DATA MINING BIG DATA A mina de ouro debaixo dos bits. 2 Data Warehouse: A Memória da
Leia maisFUNDAÇÃO DE APOIO AO ENSINO TÉCNICO DO ESTADO DO RIO DE JANEIRO FAETERJ Petrópolis Área de Extensão PLANO DE CURSO
FUNDAÇÃO DE APOIO AO ENINO TÉCNICO DO ETADO DO RIO DE JANEIRO PLANO DE CURO 1. Identificação Curso de Extensão: INTRODUÇÃO AO ITEMA INTELIGENTE Professor Regente: José Carlos Tavares da ilva Carga Horária:
Leia maisSolutions for Information Technologies. BIS-Navegador. IBM DB2 UDB v8.x
Solutions for Information Technologies BIS-Navegador Manual de Instalação em IBM DB2 UDB v8.x Supporte A suite BIS foi testada e é suportada nos seguintes ambientes e produtos: BIS Client Components: Operating
Leia maissrbo@ufpa.br www.ufpa.br/srbo
CBSI Curso de Bacharelado em Sistemas de Informação BI Prof. Dr. Sandro Ronaldo Bezerra Oliveira srbo@ufpa.br www.ufpa.br/srbo Tópicos Especiais em Sistemas de Informação Faculdade de Computação Instituto
Leia maisMANUAL DO GESTOR DE FINANÇAS
MANUAL DO GESTOR DE FINANÇAS Manual de utilização e dicas para que conheça melhor esta nova ferramenta do millenniumbcp.pt. e da App Millennium para equipamentos ipad/ iphone / ipod touch.. 1 02 ÍNDICE
Leia maisAULA TEÓRICA 2 Tema 2. Conceitos básicos de informática, computadores e tecnologias de informação. Sistemas de numeração (continuação)
AULA TEÓRICA 2 Tema 2. Conceitos básicos de informática, computadores e tecnologias de informação. Sistemas de numeração (continuação) Digitalização. Arquitectura básica do hardware. Input, processamento,
Leia maisGUIA DE FUNCIONAMENTO DA UNIDADE CURRICULAR
Curso Engenharia Informática Ano letivo 2012-2013 Unidade Curricular Arquitectura de Computadores ECTS 6 Regime Obrigatório Ano 2º Semestre 2ºsem Horas de trabalho globais Docente (s) Luis Figueiredo Total
Leia maisInformática. Estrutura e Funcionamento de Computadores Software. Aula 8. Tipos de Software. Aplicação Genérica. Aplicação Específica
Informática Aula 8 Estrutura e Funcionamento de Computadores Software Comunicação Empresarial 2º Ano Ano lectivo 2003-2004 Tipos de Software Software de Sistema Software Aplicacional Gestão do Sistema
Leia maisWeb Data mining com R: aprendizagem de máquina
Web Data mining com R: aprendizagem de máquina Fabrício Jailson Barth Faculdade BandTec e VAGAS Tecnologia Junho de 2013 Sumário O que é Aprendizagem de Máquina? Hierarquia de aprendizado. Exemplos de
Leia maisProfessor: Disciplina:
Professor: Curso: Esp. Marcos Morais de Sousa marcosmoraisdesousa@gmail.com Sistemas de informação Disciplina: Introdução a SI Noções de sistemas de informação Turma: 01º semestre Prof. Esp. Marcos Morais
Leia maisMatlab - Neural Networw Toolbox. Ana Lívia Soares Silva de Almeida
27 de maio de 2014 O que é a Neural Networw Toolbox? A Neural Network Toolbox fornece funções e aplicativos para a modelagem de sistemas não-lineares complexos que não são facilmente modelados com uma
Leia maisTIC Unidade 2 Base de Dados. Informação é todo o conjunto de dados devidamente ordenados e organizados de forma a terem significado.
Conceitos relativos à Informação 1. Informação O que á a informação? Informação é todo o conjunto de dados devidamente ordenados e organizados de forma a terem significado. 2. Dados Em informática designa-se
Leia maisAULA 01-02-03 SISTEMAS DE GERENCIAMENTO DE BANCO DE DADOS
AULA 01-02-03 SISTEMAS DE GERENCIAMENTO DE BANCO DE DADOS Curso: Sistemas de Informação (Subseqüente) Disciplina: Administração de Banco de Dados Prof. Abrahão Lopes abrahao.lopes@ifrn.edu.br História
Leia maisData Warehouse Mineração de Dados
Data Warehouse Mineração de Dados Profa. Roberta Macêdo M. Gouveia robertammg@gmail.com 1 05/11/2015 DATA WAREHOUSE DATA MINING BIG DATA A mina de ouro debaixo dos bits. 2 Data Warehouse: A Memória da
Leia maisTECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO. SISTEMAS DE GESTÃO DE BASE DE DADOS Microsoft Access TECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO
TECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO Microsoft Access TECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO CONCEITOS BÁSICOS 1 Necessidade das base de dados Permite guardar dados dos mais variados tipos; Permite
Leia mais