Sistemas de Apoio à Decisão! (SAD)!! Decision Support Systems!!



Documentos relacionados
Sistemas de Apoio à Decisão (SAD) Decision Support Systems

GUIA DE FUNCIONAMENTO DA UNIDADE CURRICULAR

Ferramentas Livres de Armazenamento e Mineração de Dados

Aula 02: Conceitos Fundamentais

UNIVERSIDADE CATÓLICA PORTUGUESA Centro Regional das Beiras Pólo de Viseu Instituto Universitário de Desenvolvimento e Promoção Social

Implementing Data Models and Reports with SQL Server 2014 (20466)

Sistemas de Apoio à Decisão

Uma estrutura (framework) para o Business Intelligence (BI)

UNIVERSIDADE ESTADUAL DO OESTE DO PARANÁ PRÓ-REITORIA DE GRADUAÇÃO. PLANO DE ENSINO - PERÍODO LETIVO/ANO 2008 ANO DO CURSO: 5 o

Sistemas de Apoio à Decisão

Aprendizagem de Máquina

PLANO DE ENSINO PRÉ-REQUISITOS: ENS

COMO IMPLEMENTAR UM SISTEMA DE BI

Sistemas de Informação

Padronização de Processos: BI e KDD

Implementing Data Models and Reports with SQL Server 2014 (20466)

Data Mining II Modelos Preditivos

INSTITUTO POLITÉCNICO DE SANTARÉM ESCOLA SUPERIOR DE DESPORTO DE RIO MAIOR. Licenciatura em desporto Gestão das Organizações Desportivas

Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence

Pós-Graduação MBA em Inteligência Competitiva com Business Intelligence(BI) Banco de Dados para BI

Informática e Sistemas de Informação Aplicados em Economia

Data Mining: Conceitos e Técnicas

BASES DE DADOS I LTSI/2. Universidade da Beira Interior, Departamento de Informática Hugo Pedro Proença, 2010/2011

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka

Mineração de Dados: Introdução e Aplicações

:: FERRAMENTAS MRP APLICADAS PDF ::

Serviço Público Inteligente

Uma Ferramenta Web para BI focada no Gestor de Informação

Data Warehouse Mineração de Dados

Visibilidade Mundial. Jet Reports é a solução de reporting escolhida por + de utilizadores em todo o Mundo.

BUSINESS INTELLIGENCE Prof. Fabio Purcino

Licenciatura de EI 2010/2011. Mário Santos / Carlos Ramos

UNIVERSIDADE FEDERAL RURAL DE PERNAMBUCO PRÓ-REITORIA DE ENSINO DE GRADUAÇÃO

Ficha de Unidade Curricular (FUC) de Business Intelligence

Ficha de Unidade Curricular (FUC) de Business Intelligence

Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence

DATA WAREHOUSE PARA ANÁLISE ESTATÍSTICA DOS ERROS DETECTADOS NO SISTEMA DE ASSIMILAÇÃO DE DADOS DO CPTEC/INPE

INSTITUTO POLITÉCNICO DE SANTARÉM ESCOLA SUPERIOR DE DESPORTO DE RIO MAIOR. Licenciatura em desporto Gestão das Organizações Desportivas

Prof. Ronaldo R. Goldschmidt. geocities.yahoo.com.br/ronaldo_goldschmidt

Chapter 3. Análise de Negócios e Visualização de Dados

Inteligência de Negócio. Brian Cowhig

Data Warehousing. Engª Informática e Computação FEUP. 27 de Maio de 2002 DW/ACC/FEUP

Bases de Dados 2007/2008. Aula 1. Referências

Sistemas de Informação

OLAP em âmbito hospitalar: Transformação de dados de enfermagem para análise multidimensional

Sistemas de Apoio à Decisão. Vocabulário e conceitos Vista geral

Data, Text and Web Mining

Banco de Dados. Um momento crucial na organização dos dados é a forma com que cadastramos estes dados, a estrutura de armazenamento que criamos.

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Adriano Maranhão BUSINESS INTELLIGENCE (BI),

DESENVOLVIMENTO DE UM BUSINESS INTELLIGENCE PARA EMPRESA DO SETOR QUÍMICO UTILIZANDO A FERRAMENTA QLIKVIEW

INTELIGÊNCIA COMPUTACIONAL

Digital Cartographic Generalization for Database of Cadastral Maps

Tópicos Avançados Business Intelligence. Banco de Dados Prof. Otacílio José Pereira. Unidade 10 Tópicos Avançados Business Inteligence.

Data Warehouse Mineração de Dados

PLANO DE ENSINO DO 2º SEMESTRE LETIVO DE 2012

Professor: Disciplina:

UNIVERSIDADE LUSÍADA DE LISBOA. Programa da Unidade Curricular INFORMÁTICA Ano Lectivo 2014/2015

Manual de Docência para a Disciplina de Análise Matemática II

Como tornar o seu. Maribel Yasmina* Isabel Ramos*

SAD orientado a DADOS

Business Intelligence Conceitos, Metodologia de Desenvolvimento e Exemplos de BI

SAP Business One, version for HANA. Ralph Oliveira

CMP 151 Modelos Avançados CMP 151. ados de Banco de Dados. Renata de Matos Galante Mirella Moura Moro CMP 151. CMP 151 Modelos Avançados de BD

Tecnologias da Informação, Comunicação e Sistemas de Inteligência

Construção, Território e Ambiente. Construction, Planning and Environment. Semestre do plano de estudos 2

Data Warehouse Mineração de Dados

Engenharia de Requisitos. Professor: Dr. Eduardo Santana de Almeida Universidade Federal da Bahia

English version at the end of this document

Uma peça estratégica para o seu negócio

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

Oracle SQL Developer

Sobre o que falaremos nesta aula?

PROGRAMA. Aquisição dos conceitos teóricos mais importantes sobre bases de dados contextualizados à luz de exemplos da sua aplicação no mundo real.

Ontology Building Process: The Wine Domain

MONITORAMENTO REMOTO DO CONSUMO DE ÁGUA UTILIZANDO SOFTWARE DE INTERFACE HOMEM-MÁQUINA - HIDROAER

As Novas Tecnologias de Dados, Inteligência Competitiva e Preditiva

Apresentação, xix Prefácio à 8a edição, xxi Prefácio à 1a edição, xxiii. Parte I - Empresa e Sistemas, 1

Descoberta de Conhecimento em Bases de Dados. Classificação

Ficha da Unidade Curricular (UC)

Implementing a Data Warehouse with Microsoft SQL Server 2014 (20463)

Introdução A Delphi Com Banco De Dados Firebird (Portuguese Edition)

PROPOSTA DE UMA ARQUITETURA PARA CONSTRUÇÃO DE UM DATA WAREHOUSE PARA GESTÃO DA SAÚDE PÚBLICA DE UM MUNICÍPIO DO VALE DO ITAJAÍ

Quem estiver interessado favor mandar currículo para As vagas são as seguintes: *Analista de BI (2 vagas)*

Empreendedorismo: Dando Asas ao Espírito Empreendedor (Portuguese Edition)

Sistemas de Apoio à Decisão

INTELIGÊNCIA ARTIFICIAL Data Mining (DM) :alguns conceitos

CIS 500 Software Foundations Fall September(continued) IS 500, 8 September(continued) 1

Business Intelligence para Computação TítuloForense. Tiago Schettini Batista

Participatory Map of Rio de Janeiro

Sistemas de Apoio à Decisão (SAD) - Senado

Tese / Thesis Work Análise de desempenho de sistemas distribuídos de grande porte na plataforma Java

Universidade do Minho. Escola de Engenharia. UC transversais Programas Doutorais 1º semestre de outubro 2012

Fundamentos da inteligência de negócios: gestão da informação e de bancos de dados

Planejamento Estratégico de TI. Prof.: Fernando Ascani

CONSIDERAÇÕES SOBRE ATIVIDADES DE IDENTIFICAÇÃO, LOCALIZAÇÃO E TRATAMENTO DE DADOS NA CONSTRUÇÃO DE UM DATA WAREHOUSE

Decisão Suporte: Warehousing, OLAP e Data Mining

Decisão Suporte: Warehousing, OLAP e Data Mining

English version at the end of this document

Transcrição:

Sistemas de Apoio à Decisão (SAD) Decision Support Systems Andreas Wichert MEIC Tagus (Página da cadeira: Fenix) Objectivo Geral n Acumular informação para produzir indicadores de negócio que permitam tomar decisões n Extracção de conhecimento interessante (regras, padrões, restrições) dos dados existentes em grandes BDs 1

Corpo docente n Andreas Wichert - Teóricas n andreas.wichert@tecnico.ulisboa.pt n tel: 214233231 n room: N2 5-7 n - Laboratórios n Andreas Wichert Horário de dúvidas n 5ª-feira, 14H-18H, 2-N5.7 2

Organização das aulas n Teóricas: n Matéria (slides baseados no livro e artigos) n Apresentação de pessoas externas n Práticas/Laboratório: n Exercícios n Utilização do SQL Server 2012 / Windows 7 n Ínicio: 24/2 n Grupos: número de alunos 3 Avaliação n A Nota Final (NF) é dada por: NF = 6.5% (1)NDW +6.5% (2)NDW+6.5% (3)NDW+6.5% (4)NDW+ 6.5% (5)NDM+6.5% (6)NDM+6.5% (7)NDM+6.5% (8)NDM+ 48 % NE n 1,2,3,4 NDW Nota do projectos de Data Warehouse n 5,6,7,8 NDM Nota do projectos de Data Mining n NE Nota do exame n Nota mínima em cada componente parcial é 9,5 val 3

Exame n 1º exame: 13 de Junho n 2º exame: 30 de Junho Data Mining: Concepts and Techniques 4

Reconhecimento n Prof. Jiawei Han n hanj@cs.uiuc.edu n University of Illinois at Urbana-Champaign n http://www-sal.cs.uiuc.edu/~hanj/ Bibliografia - DW n Data Mining: Concepts and Techniques, J. Han & M. Kamber, Morgan Kaufmann, 2001 Jiawei Han, Micheline Kamber, and Jian Pei, Data Mining: Concepts and Techniques, 3rd edition, Morgan Kaufmann, 2011 n The Data Warehouse Toolkit, 2nd ed, Ralph Kimball, Margy Ross, 2002 5

Bibliografia - DM n Machine Learning, T. Mitchell, 1997 n Reconhecimento de padrões métodos estatísticos e neuronais, JORGE SALVADOR MARQUES, 1999, ISTpress, http://istpress.ist.utl.pt/lrecpad.html n Artificial,Intelligence - A Modern Approach, Second Edition, S. Russel and P. Norvig, Prentice Hall, 2003 n Artificial Intelligence - Structures and Strategies for Complex Problem Solving, Second Edition, G. L. Luger and W. A. Stubblefield, Benjamin/Cummings Publishing, 1993 n Relational Data Base: Data collection n Extraction of interesting (non-trivial, implicit, previously unknown and potentially useful) patterns or knowledge from huge amount of data (interesting patterns?) 6

n How to represent data? n By a coordinate system René Descartes 7

Multidimensional databases n A Cartesian coordinate system is determined n By its dimensions Time, place, product, costumer n By its value Sales in or $, n By the resolution Hours, days, months, years 8

n Our coordinate system is defined by our Data Base n What can we do? n Look at the data n Project the data collapse some dimensions, how to do it? n Change the resolution Different resolution 9

n For two dimensions n Spreadsheet (Excel) with spreadsheet formulas calculations n For more than two dimensions n We will require several spreadsheet tables n -> Data explosion n We will look for one Excel table with several dimensions First Part data warehouse n Mapping of data represented in a data base into a coordinate system.. n Navigation in the coordinate system n Projection n Resolution 10

Second part - Data Mining n Statistics n t-test, linear regression n Feature extracting n PCA n Machine Learning J Feature / Vector space n Sample x = " $ $ # $ % $ x 1 x 2.... x d x (1), x (2),.., x (k),.., { x (n ) } R d x y d = (x i y i ) 2 i=1 11

Learning Input output functions 12

What is machine Learning? n Parallels between animals and machine learning n Many techniques derived from efforts of psychologist / biologists to make more sense animal learning through computational models Machine Learning n Changes in the system that perform tasks associated with AI n Recognition n Prediction n Planning n Diagnosis 13

17/02/14 14

n We might add other features that are not correlated with the ones we already have. A precaution should be taken not to reduce the performance by adding such noisy features n Ideally, the best decision boundary should be the one which provides an optimal performance such as in the following figure: 15

n However, our satisfaction is premature because the central aim of designing a classifier is to correctly classify novel input Issue of generalization 16

n We could use several tools n MySQL & Pentaho & Matlab & S & R &. http://www.pentaho.com/ http://www.cs.waikato.ac.nz/ml/weka/ n it would be nice to have one tool J n SASS n SQL Sever (we will use SQL Server 2008) n Oracle n.. 17

Bibliografia SQL Server 2012 n Microsoft SQL Server 2012 Tutorial n Microsoft SQL Server online Books Some Information about SQL Server n General Information about SQL Server: n http://en.wikipedia.org/wiki/microsoft_sql_server n http://technet.microsoft.com/en-us/sqlserver/default.aspx n Data Mining and SQL Server: n http://www.sqlserverdatamining.com 18

We will use SQL Server 2012 (Windows 7) n n Tutorial: SQL Server Management Studio http://technet.microsoft.com/en-us/library/bb934498.aspx n Analysis Services Tutorials (SSAS) n http://technet.microsoft.com/en-us/library/hh231701.aspx n n Multidimensional Modeling (Adventure Works Tutorial) http://technet.microsoft.com/en-us/library/ db55e226-601a-4026-8651-573195555a59 n n Data Mining Tutorials (Analysis Services) http://technet.microsoft.com/en-us/library/bb677206.aspx Programa n Datawarehouse (DW) e Sistemas de Apoio à Decisão n Operações OLAP (Online Analytical Processing) n Modelo multidimensional vs modelo relacional, Teoria da normalização do modelo relacional n CUBE n Desenho de DW n Arquitectura de DW n Implementação de DW 19

Programa n Pré-processamento, transformação e limpeza de dados n Exploração de dados (data mining) n Descrição de conceitos e generalização de dados n Regras de associação n Redes bayesianas n Árvores de decisão n Classificação baseada em instâncias n Análise de clusters n Redes neuronais Informação necessária para apoio à decisão n Características requeridas para a informação utilizada para a tomada de decisão: n precisa n fiável n actualizada n relevante n orientada à acção 20

Sistemas operacionais n Contabilidade, compras, reservas, telecomunicações, etc n Muitas fontes de dados dispersas (ficheiros excel, BD Access) de suporte a aplicações do tipo: SAP, ERPs, etc n Alguns problemas: acesso aos dados díficil, qualidade de dados duvidosa, dados estruturados à aplicação (ex: códigos específicos), suporte a interrogações simples Conceito de um DW n Conjunto centralizado de dados: n temáticos n históricos n datados n integrados que oferece um nível de qualidade adequado às aplicações de decisão 21

Arquitectura geral SAD Metadata OLAP Server other sources Extract Transform Load Refresh Data Warehouse Serve Analysis Query Reports Data mining Operational DBs Data Marts Data Sources Data Storage OLAP Engine Front-End Tools 22