Projecto de Licenciatura

Tamanho: px
Começar a partir da página:

Download "Projecto de Licenciatura"

Transcrição

1 Instituto Politécnico do Porto Instituto Superior de Engenharia do Porto Departamento de Engenharia Informática Projecto de Licenciatura A aluna: Celina Maria Rodrigues Pereira O orientador: Jorge Morais Setembro de 2002

2 Indice Glossário 7 1 Introdução O Tema Os Objectivos A estrutura do Relatório 11 2 O que é o Data Mining? Principais Características de uma ferramenta de Data Mining O Processo de Descoberta de Conhecimento Fase de Selecção Fase de Pré-Processamento Fase de Transformação Fase de Data Mining Objectivos de Data Mining Técnicas de Data Mining Fase de Interpretação e Avaliação Fase de Integração de novo Conhecimento Bases das técnicas de Data Mining A estatística Inteligência Artificial Aprendizagem Automática (Machine Learning) Utilização das ferramentas de Data Mining 28 3 Apresentação de Ferramentas de Data Mining Clementine Como é usado o Clementine Como o Clementine interpreta os dados Como o Clementine lê os dados Intelligent Miner (IM) Utilização do Intelligent Miner Administration Mode Discovery Mode Entidades de Dados, Origens de Dados e Objectos de Data Mining Mining Studies Warehouses (Armazéns) Schema Editor Batch Mode Enterprise Miner Utilização do Enterprise Miner 45 2

3 3.3.2 Três visões sobre o Enterprise Miner Interface Comparação estatística e financeira dos métodos Produção Alice Utilização de Alice Árvores de Decisão Uma ferramenta de Data Mining poderosa para o utilizador Preparação dos dados Árvore de decisão Gráficos Módulos KnowledegeSEEKER Funcionamento do KnowledgeSeeker ª Fase: Preparação dos Dados ª Fase: Análise dos Dados Avaliação dos Dados Selecção e Acesso aos dados Transformação de Dados Valores em Falta Exploração Visualização Estatística Descritiva DBMiner Porquê o uso do DBMiner? Principais características OLAP Browser D Cube Explorer Associação Classificação Clustering Vantagens do DBMiner Miner3D EXCEL Processo de Descoberta de Conhecimento Intellix Designer Como funciona o Intellix Designer? Características do Intellix Descrição da aplicação 78 4 Comparação das Ferramentas Ferramentas avaliadas Plataformas Dados de Entrada e de Saída Algoritmos 89 3

4 4.5 Visualização Automação Forças e Fraquezas das ferramentas 96 5 Conclusão 98 Bibliografia 101 Livros 101 Publicações Electrónicas 101 Informações sobre Data Mining 101 Informações sobre as ferramentas apresentadas 102 Outras bibliografias 102 4

5 Indice das Figuras FIGURA 1: PROCESSO DE DESCOBERTA DE CONHECIMENTO 17 FIGURA 2: ÁRVORE DE DECISÃO 22 FIGURA 3: REDE NEURONAL 24 FIGURA 4: BASES DAS TÉCNICAS DE DATA MINING 26 FIGURA 5: EXEMPLO DA APLICAÇÃO DO FICHEIRO PROJECTO 33 FIGURA 6: INTERFACE DO CLEMENTINE 35 FIGURA 7: MATRIZ DE CORRELAÇÃO DO CLEMENTINE DATA MINING SYSTEM 39 FIGURA 8: GRÁFICO DE CORRELAÇÕES DO CLEMENTINE DATA MINING SYSTEM 39 FIGURA 9: GRÁFICO DE MÚLTIPLAS VARIÁVEIS OBTIDO NO CLEMENTINE DATA MINING SYSTEM 40 FIGURA 10: GRÁFICO DE DISTRIBUIÇÃO DO CLEMENTINE DATA MINING SYSTEM 40 FIGURA 11: UM PROCESSO DE ESTUDO INTEGRADO CONSTRUÍDO A PARTIR DE FERRAMENTAS COMPLETAS 47 FIGURA 12: RESULTADOS GRÁFICOS E DINÂMICOS 47 FIGURA 13: POSSIBILIDADE DE AVALIAR POTÊNCIAS E REGRESSÕES SOBRE INVESTIMENTOS PARA DETERMINAR UMA ESTRATÉGIA 48 FIGURA 14: ÁRVORE DE DECISÃO DE ALICE 52 FIGURA 15: REPRESENTAÇÃO DE ASSOCIAÇÕES COM O DBMINER 66 FIGURA 16: VISUALIZAÇÃO DA CLASSIFICAÇÃO NO DBMINER 68 FIGURA 17: REPRENTAÇÃO DE CLUSTERING NO DBMINER 70 FIGURA 18: UMA VISUALIZAÇÃO POSSÍVEL NO MINER3D 73 FIGURA 19 ARQUITECTURA INTELLIX 75 FIGURA 20: AMBIENTE DE TRABALHO NO INTELLIX 78 FIGURA 21: EXEMPLO DE PROPRIEDADES DE UM DOCUMENTO NO INTELLIX 79 FIGURA 22: EXEMPLO 80 FIGURA 23 ÁREA DE TESTES PARA OS DOCUMENTOS 81 FIGURA 24 - USANDO O ACTIVE KNOWLEDGE ACQUISITION 81 FIGURA 25 - INTERFACE DO WEB - TEST BENCH 82 FIGURA 26 - DISTRIBUIÇÃO DE RESULTADOS 82 FIGURA 27 ESPAÇO EXEMPLO UTILIZADO 83 FIGURA 28: EXEMPLO DE HISTOGRAMAS 92 FIGURA 29: EXEMPLO DE PIE CHART 93 FIGURA 30: EXEMPLO DE LINE PLOT 93 FIGURA 31: EXEMPLO DE CLASSIFICATION DECISION REGIONS 94 5

6 Indice de Tabelas TABELA 1: INFORMAÇÃO PARA CONSTRUÇÃO DE ÁRVORE DE DECISÃO 21 TABELA 2: APRESENTAÇÃO DAS FERRAMENTAS COMPARADA S 84 TABELA 3: PLATAFORMAS 85 TABELA 4: DADOS DE ENTRADA E DE SAÍDA 87 TABELA 5: ALGORITMOS 89 TABELA 6: VISUALIZAÇÃO 91 TABELA 7: AUTOMAÇÃO 95 TABELA 8: FORÇAS E FRAQUEZAS DAS FERRAMENTAS 96 6

7 Glossário Armazéns de dados (Data Warehouse) Sistema de suporte à decisão para armazenar grandes quantidades de informação. Árvore de Decisão Representação gráfica das relações entre um conjunto de dados de variáveis independentes (inputs). Usualmente são representadas em forma de arvores que representam um conjunto de regras. As arvores podem ser binárias ou com múltiplo ramos, dependendo do algoritmo utilizado. C5.0 - Um algoritmo de Machine learning que tem um conjunto de regras que podem ser aplicadas a um conjunto de dados para fazer uma previsão. Este algoritmo foi desenvolvido por J. Ross Quinlan. C5.0 foi o sucessor dos algoritmos C4.5 e ID3 (Iterative Dichotomiser). CART Classification And Regression Trees. Algoritmo estatístico, técnica utilizada na segmentação de uma base de dados. O algoritmo cria árvores binárias e segmentos em duas partes. Este algoritmo foi desenvolvido por L.Briemen em Classificação Processo de divisão de um conjunto de dados em grupos mutuamente exclusivos. Clustering Processo pelo qual um conjunto de dados é dividido em conjuntos agrupados por um valor semelhante ou clusters. Não tem, como o processo de classificação um número pré-definido de classes. Data Mining É a análise de dados para detectar relações ainda não descobertas. Os resultados de um processo de data Mining incluem: associações, correlações, sequências, classificações, clustering e previsões. 7

8 ODBC (Open DataBase Connectivity) Especificação projectada pela Microsoft para permitir ás aplicações do Windows o acesso a dados múltiplos através de um método simples sem considerar os diversos formatos dos arquivos de dados. OLAP Online Analytical Processing. Refere-se a uma aplicação de Base de Dados que permite ao utilizador ver, navegar, manipular e analisar Bases de Dados multi-dimensionais. Redes neuronais de Kohonen Arquitectura neuronal que utiliza aprendizagem automática para fazer analise de clusters. Foi desenvolvida por Teuvo Kohonen. SGBD Sistema Gestor de Bases de Dados 8

9 A cada ano, companhias acumulam mais e mais informações em seus bancos de 1 Introdução Todos os anos, as empresas acumulam cada vez mais informação nas Bases de Dados. Em consequência, estas Bases de Dados passam a conter verdadeiros tesouros de informação sobre vários dos procedimentos dessas companhias. Toda esta informação pode ser usada para melhorar seus procedimentos, permitindo que a empresa detecte tendências e características disfarçadas, e reaja rapidamente a um evento que ainda pode estar por vir. No entanto, apesar do enorme valor desses dados, a maioria das organizações é incapaz de aproveitar totalmente o que está armazenado em seus arquivos. Esta informação preciosa está na verdade implícita escondida sob uma montanha de dados, e não pode ser descoberta utilizando-se sistemas de Bases de Dados convencionais. A solução existe, e chama-se Data Mining. A quantidade de informação armazenada em Bases de Dados está explodindo, e ultrapassa a habilidade técnica e a capacidade humana na sua interpretação. A necessidade de transformar estas Bases de Dados em informações significativas é óbvia. Felizmente, técnicas computacionais foram desenvolvidas para analisar os dados, ou ao menos ajudar o analista a encontrar ordem no caos: conhecimento. Algumas formas de conhecimento existentes são as regras associativas. Para um dado conjunto de itens e um conjunto de registos contendo esses itens, podem existir afinidades entre os registos, que são expressas na forma de regras. As regras de associação mais fortes de uma tabela são as dependências funcionais. 9

10 Data Mining é uma tecnologia usada para revelar informação estratégica escondida em grandes massas de dados. É usada em diversas áreas, como análise de riscos, marketing direcionado, controle de qualidade, análise de dados científicos, etc. Data Mining define o processo automatizado de captura e análise de enormes conjuntos de dados, para extrair um significado. Esta tecnologia está sendo usada para descrever características do passado, assim como predizer tendências para o futuro. Sua utilização permite avanços tecnológicos e descobertas científicas, além de garantir uma vantagem competitiva invejável. 1.1 O Tema Para utilizar a técnica de Data Mining nas Bases de Dados e, consequentemente, utilizar nas empresas interessadas em utilizar esta nova tecnologia, existem muitas empresas que desenvolveram aplicações para manipular as Bases de Dados, segundo as técnicas de Data Mining. O tema associado a este relatório de projecto é o Estudo comparativo das principais ferramentas de extracção de conhcimento em Bases de Dados. 1.2 Os Objectivos Pretende-se, neste trabalho, fazer um levantamento do estado da arte em relação ás ferramentas de extracção de conhecimento em Bases de Dados, comparando as várias caracteristicas a definir no próprio trabalho. Assim dever-se-ão, em primeiro lugar, definir quais as principais características a ter em conta numa possível classificação das ferramentas. Em seguida, fazer a comparação de várias ferramentas existentes (particularmente no ISEP), podendo ser sugerido um modelo de classificação 10

11 geral ou por áreas de actividade: ensino, industria, companhias de seguros, etc A estrutura do Relatório O segundo capítulo explica o que é o Data Mining e para que é utilizado. No primeiro ponto, são descritas as principais caracteristica de uma ferramenta de Data Mining e são dados exemplos de empresas que utilizam esta nova tecnologia. O processo de Descoberta de Conhecimento, em que o Data Mining se insere, é descrito no segundo ponto. É dada uma particular ênfase à fase de Data Mining em que são vistos os objectivos desta fase e as técnicas utilizadas para tratar dos dados segundo as técnicas de Data Mining. No terceiro ponto, é feita uma abordagem sobre as bases das técnicas de Data Mining, explicando que se baseia na estatística e na inteligência artificial. No último ponto deste capitulo, são descritas utilizações das técnicas de Data Mining. O terceiro capítulo descreve as ferramentas de Data Mining que vão ser comparadas, mostrando as principais caracteristica associadas a cada uma e como são utilizadas. As ferramentas apresentadas são as seguintes: Clementine Intelligent Miner Enterprise Miner Alice KnowlwdgeSEEKER DBMiner Miner3D EXCEL Intellix Designer 11

12 Foram escolhidas estas ferramentas e não outras porque pareceram ser as mais utilizadas e as mais interressantes a nível das técnicas de Data Mining. O quarto capítulo faz uma comparação das ferramentas, numa primeira parte recapitula as principais caracteristicas de cada uma, e de seguida faz uma comparação a nível de plataformas utilizadas, algoritmos, visualização e automação. Este capitulo acaba mostrando os pontos fortes e pontos fracos de cada uma. 12

13 2 O que é o Data Mining? Ter uma Base de Dados completa e com muita informação é importante, mas essa informação pode à partida não fazer muito sentido. Não se conseguem retirar grandes conclusões com muitos registos diferentes. Segundo o manual do Clementine, o termo Data Mining refere-se a utilizar uma variedade de técnicas de inteligência artificial e análise de dados para identificar pepitas (nuggets) de conhecimento ou informação no corpo dos dados, extraindo essas informações por forma a serem utilizadas em áreas como suportes de decisão, previsão e estimação. Por oposição às ferramentas OLAP On-Line Analytical Processing, em que a exploração de dados é conduzida pelo utilizador, nas ferramentas de Descoberta de Conhecimento a exploração dos dados toma um carácter semiautónomo de descoberta, através de algoritmos de Data Mining. O poder do Data Mining está em utilizar ferramentas que utilizam vários tipos de algoritmos para procurar padrões nos dados, uma combinação que envolve associações lógicas, estatística, análise e visualização. No ponto 1, vai ser mostrada a utilidade e as caracteristicas do Data Mining. O ponto 2 explica o processo de Descoberta de Conhecimento dando ênfase à fase de Data Mining. O ponto 3 explica a base das técnicas de Data Mining e o ponto 4 mostra a utilização das mesmas. 13

14 2.1 Principais Características de uma ferramenta de Data Mining Os paradigmas de negócio fizeram evoluir e mudar as questões a serem respondidas pelos Sistemas de Informações, ao longo do tempo. A evolução foi a seguinte: Data Collection (anos 60) - "Qual foi o valor total de vendas nos últimos dois anos?" Data Access (anos 80) - "Quanto rendeu a nossa filial A no semestre passado?" Data Warehousing & Decision Support (anos 90) - " Quanto rendeu a nossa filial B no semestre passado? Que consequências teve na filial B? " (drill down/slice-and-slice) Data Mining (Hoje) - "O que irá acontecer com as vendas na filial A no próximo mês? Por quê?" Data Mining é uma técnica que permite buscar em grandes bases de dados, informação que, aparentemente, estão camufladas ou escondidas, permitindo, com isso, agilidade nas tomadas de decisão. Uma empresa que utiliza as técnicas de Data Mining é capaz de : Criar parâmetros para entender o comportamento do consumidor; Identificar afinidades entre as escolhas de produtos e serviços; Prever hábitos de compras; Analisar comportamentos habituais para se detectarem fraudes. As ferramentas de Data Mining podem determinar padrões de comportamento, como associação de produtos durante um processo de 14

15 compras. Com isto as ferramentas de Data Mining indicam a presença de oportunidades em relação ao consumidor. As descobertas de padrões de consumo dão-se por uma lógica de algoritmos com base numa rede neuronal de raciocínios. São ferramentas de descoberta matemáticas, feitas sobre os registos já processados, contra descobertas empíricas. Alguns exemplos: A rede americana Wall-Mart, pioneira no uso de Data Mining, descobriu ao explorar seus números que 60% das mães que compram uma boneca Barbie, levam também uma barra de chocolate; O banco Itaú conseguiu aumentar sua taxa de retorno do envio directo para 30% reduzindo a conta do correio a um quinto, armazenando e analisando a movimentação financeira de seus 3 milhões de clientes nos últimos 18 meses. A Sprint, um dos líderes no mercado americano de telefone de longa distância, desenvolveu, com a análise de Data Mining no seu armazém de dados, um método capaz de prever com 61% de segurança se um consumidor trocaria de companhia telefónica dentro de um período de dois meses. Com um marketing agressivo, conseguiu evitar a deserção de clientes e uma perda de 35 milhões de dólares em facturação. O governo de Massachusetts, nos Estados Unidos, compilava informações financeiras imprimindo telas e mais telas nos terminais de grande porte. Só com papel foram economizados dólares por ano, além de permitir que o orçamento anual fosse assinado e analisado, antes do início do ano fiscal. E o clássico exemplo de uma grande rede de vendas americana que descobriu, através das técnicas de Data Mining, que as vendas de fraldas estavam intimamente ligadas às vendas de cerveja. Explicação, os pais que saiam à noite para comprar fraldas, compravam cerveja também. 15

16 Por isso e por outros inúmeros exemplos, as ferramentas de Data Mining crescem em importância, principalmente porque as empresas preocupam-se com o futuro do negócio. O Data Mining pode ser considerado como sendo uma das fases do processo de descoberta de conhecimento em bases de dados (KDD Knowledge Discovery in Databases), área de pesquisa em evidência no momento, que envolve Inteligência Artificial e base de dados. 2.2 O Processo de Descoberta de Conhecimento Sob a perspectiva de Descoberta de Conhecimento, o Conhecimento é quantificado em termo de utilidade, validade, simplicidade/complexidade e novidade. Estas medidas são aplicadas às relações/modelos sempre sob a perspectiva de Interesse. As fases de Descoberta de Conhecimento são as seguintes: Selecção Pré-processamento Transformação Data Mining Interpretação/Avaliação 16

17 Figura 1: Processo de Descoberta de Conhecimento Fase de Selecção Os dados são escolhidos de acordo com os objectivos de descoberta. Os parâmetros de selecção são o volume de dados necessário, a periodicidade de recolha das amostras e a frequência de repetição dos exercícios de exploração Fase de Pré-Processamento Gera dados generalizados ou reduzidos. A redução dos dados pode ser feita em linhas ou colunas. Na redução em linhas, os atributos categóricos são generalizados e os atributos contínuos são discretizados; para a discretizacão dos atributos contínuos são utilizados dois tipos de algoritmos: não sensíveis à classe ou orientados por classes. Os dados são também normalizados. Na redução em colunas, as variáveis de Entrada não correlacionadas são combinadas e as variáveis correlacionadas são eliminadas. É feita uma análise sensitiva e uma análise dos componentes principais. É utilizada a teoria dos Rough Sets. Também pode ser feita uma aproximação empacotadora ou filtro. 17

18 Converte dados categóricos para valores numéricos e conversão de unidades. Dois termos interessantes aparecem nesta fase: sobre-ajustamento e sub-ajustamento. Utiliza-se o termo sobre-ajustamento quando o modelo prevê os resultados baseados em particularidades dos dados usados no seu treino. Existe subajustamento quando o modelo falha na procura de relações de interesse nos dados, ou disponibiliza relações muito genéricas Fase de Transformação Consiste no tratamento de dados em falta, tratamento de exemplos anormais (dados inconsistentes ou valores isolados), na eliminação de dados em mau estado Fase de Data Mining Envolve a adaptação de modelos, ou extracção de relações a partir dos dados, sem os passos adicionais que fazem parte de todo o processo de Descoberta de Conhecimento Objectivos de Data Mining Quando se implementam as técnicas de Data Mining, procura-se extrair informações para atingir determinados objectivos. São vários os tipos de informação que podemos obter com as técnicas de Data Mining. Isto não quer dizer que só podemos obtê-las através das técnicas de Data Mining, mas com elas conseguimos atingir maior agilidade e abrangência na análise destes. Dentre estes tipos podemos ter: Classificação É a função de aprendizagem que divide (ou classifica) os dados de acordo com um número específico de características. 18

19 As técnicas mais usadas para isso são as Árvores e Regras de Decisão, Redes Neuronais e Raciocínio Baseado em Casos. A classificação pode ajudar a encontrar perfis e características dos clientes. Com isto providencia-se um modelo, utilizado para prever suas acções e desejos. Também pode ajudar a determinar os tipos de promoções que são mais eficientes, para manter determinados tipos de clientes, procurando direccionar melhor os gastos necessários para mantê-los. Clustering Tem por objectivo identificar um conjunto finito de classes ou agrupamentos nos dados. Os conjuntos obtidos podem ser mutuamente exclusivos, hierárquicos ou concorrentes. Os resultados desta operação podem ser usados para sumariar o conteúdo de uma base de dados ou como preparação de dados para outros métodos. As técnicas mais usadas são as Técnicas Estatísticas Algoritmo K-Means e Redes Neuronais. Esta técnica pode ser aplicada a diversos problemas, como detectar defeitos no fabrico de produtos ou encontrar grupos de afinidades para cartões de bancos. Análise de Associações Tem por objectivo gerar todas as associações entre itens de transações que impliquem a presença de outros itens (ex.: determinar produtos vendidos conjuntamente ou relacionar diagnósticos médicos com valores de análises). Por exemplo, um estudo sobre os supermercados pode revelar que quando se compra chá, 55% das vezes também se compram bolachas, a não ser que haja uma promoção num determindao tipo de bolachas, o que implica que se compre mais esse tipo de bolachas e até com uma percentagem maior. 19

20 Análise Sequencial Tem por objectivo gerar todas as associações entre itens de transações ao longo do tempo (ex.: associações de produtos comprados ao longo do tempo: Clientes que compram um PC também compram uma impressora num espaço de tempo inferior a um mês ). Análise de Desvios Foca-se na descoberta de mudanças mais significativas nos dados a partir de valores previamente medidos ou valores normativos (ex.: detecção de desvios em stocks ou análise de desvios em despesas hospitalares). Regressão Consiste em utilizar algumas variáveis ou campos da base de dados para prever valores futuros de outras variáveis de interesse. Podemos então, por exemplo, antever se um cliente irá renovar uma assinatura, se ele irá comprar um determinado tipo de produto e, baseado em padrões, estimar o valor futuro de variáveis contínuas: número de vendas, percentagem de lucro, entre outros Técnicas de Data Mining As principais técnicas de Data Mining são as seguintes: Arvores e Regras de Decisão Dividem o conjunto de dados de modo a construir um modelo que classifica cada registo de acordo com o valor que apresenta no atributo objectivo. As árvores de decisão são uma evolução da técnica de aprendizagem automática. 20

21 Os valores que são encontrados com forte associação são os prognósticos chave ou factores explicativos, normalmente chamados de regras sobre o dados. Possuindo um grupo de dados, com numerosas colunas e linhas, uma ferramenta de árvore de decisão pede ao utilizador para escolher uma das colunas como objecto de saída, mostra o único e mais importante factor correlacionado com aquele objecto de saída como o primeiro ramo (nó) da árvore de decisão. Os outros factores são subsequentemente classificados como sub-nós dos nós anteriores. Isso significa que o utilizador pode rapidamente ver qual o factor que mais direcciona o seu objecto de saída, e o utilizador pode entender porque o factor foi escolhido. Por exemplo, a tabela 1 mostra os dados necessários para a construção da árvore de decisão e a figura 2 representa a árvore de decisão associada. Tempo Temperatura Humidade Vento Jogar Sol Quente Alta Fraco Não Sol Quente Alta Forte Não Coberto Quente Alta Fraco Sim Chuva Normal Alta Fraco Sim Chuva Frio Normal Fraco Não Chuva Frio Normal Forte Não Coberto Frio Normal Forte Sim Sol Normal Alta Fraco Não Sol Frio Normal Fraco Sim Chuva Normal Normal Fraco Sim Tabela 1: Informação para construção de Árvore de Decisão 21

22 Tempo Chuva Sol Vento Nublado Humidade Não Sim Elev. Normal Joga Não Joga Joga Não Joga Joga Figura 2: Árvore de Decisão Uma boa ferramenta baseada em Árvore de Decisão permite que o utilizador explore a árvore de acordo com a sua vontade, do mesmo modo que ele poderá encontrar grupos alvo que lhe interessem mais, e então ampliar o dado exacto associado ao seu grupo alvo. Os utilizadores podem, também, seleccionar os dados fundamentais em qualquer nó da árvore, movendo-o para dentro de uma ferramenta para análise posterior. As árvores de decisão são, quase sempre, usadas em conjunto com a tecnologia de Indução de Regras, mas são muito importantes, no sentido de apresentar os resultados da Indução de Regras num formato com prioridade. A regra mais importante é apresentada na árvore, como nó raiz, e as regras menos relevantes são mostradas nos nós subsequentes. As principais vantagens das árvores de decisão são que elas fazem decisões levando em consideração as regras que são mais relevantes, além de serem compreensíveis para a maioria das pessoas. Ao escolher e apresentar as regras em ordem de importância, as árvores de decisão permitem ao utilizador ver, imediatamente, quais os factores que mais influenciam os seus trabalhos. 22

23 Exemplos de ferramentas: Alice d'isoft, HyperParallel, Discovery, Business Objects BusinessMiner, DataMind, Angoss Knowledge Seeker. Indução de Regras A Indução de Regras, rege-se como uma lista, apresentada aos utilizadores através da detecção de tendências dentro de grupos de dados, ou de "regras" sobre o dado, com pouca interacção do utilizador; O analista de negócio neste caso tem que fazer a oredenação das regras por importância, determinando aquelas que são mais importantes no modelo de Data Mining para os assuntos de negócios envolvidos. Exemplos de ferramentas: IDIS, Knowledge Seeker; Redes Neuronais São constituídas por uma série de nós interligados agrupados em níveis. Os algoritmos mais usados em ferramentas de Descoberta de Conhecimento são: Propagação Retroactiva Classificação; Função Base Radial Classificação; Rede Mapas de Kohonen Clustering. 23

24 Figura 3: Rede Neuronal As redes neuronais oferecem o mais profundo poder de exploração dos dados. Porém é a técnica mais difícil de se entender. As apresentações internas, de como os padrões e os modelos foram achados nos dados, não são mostrados. Estas "caixas pretas" são inexplicáveis, o que faz com que esta técnica seja inaceitável para alguns analistas de negócios. Utilizam um modelo idêntico ao dos neurónios do cérebro humano e suas ligações (sinapses), como suporte para trabalharem com um conjunto de dados. Aprendem a partir do treino sobre esses dados, generalizando padrões, aplicando-os internamente para classificação e previsão de resultados. Cada neurónio tem geralmente um conjunto de pesos que determina como o neurónio avalia a combinação dos sinais de entrada. A entrada para um neurónio pode ser positiva ou negativa. A aprendizagem faz-se pela modificação dos pesos usados pelo neurónio de acordo com a classificação de erros que foi feita pela rede como um todo. As entradas são geralmente pesadas e normalizadas para produzir um procedimento suave. Durante a fase de treino, a rede estabelece os pesos que determinam o comportamento da camada intermédia. Um termo popular chamado propagação retroactiva é usado quando os pesos são ajustados baseados nas estimativas feitas pela rede - suposições incorrectas reduzem os limites para as conexões apropriadas. 24

25 É uma técnica excelente, muito vantajosa, mas que tem dois aspectos negativos. O primeiro é a complexidade dos modelos gerados. O segundo é exigir que o formato dos dados seja imutável; para diferentes representações dos dados surgem resultados diferentes. Exemplos de ferramentas: SPSS Neural Connection, IBM Neural Network Utility, NeuralWare NeuralWorks Predict Análise de cesto de compras (Market Basket Analysis) Técnica de localização que permite através de um cesto de compras, inferir regras a partir de grupos de itens ou produtos que surgem nesta transacção. A análise combinatória dos produtos juntamente com a localização geográfica do cliente, permite promover investimentos em marketing específicos para determinados produtos e regiões. Para vendas não anónimas é possível ainda promover investimentos em marketing para determinados perfis de clientes, focando os seus traços de compra, garantindo maior retorno no investimento. Algoritmos Genéticos Também conhecida como Análise Estatística de séries temporais. Utiliza o algoritmo natural, ou seja, os mecanismos de selecção que a natureza utiliza para a evolução das espécies. É indicada como complemento às técnicas de Raciocínio Baseado em Memória ou Redes Neuronais. Esta técnica consiste no cruzamento de registos e na mutação para seleccionar as possíveis soluções que sobreviverão para a próxima geração até convergir na solução perfeita, ou a solução mais próxima disso. Exemplos de ferramentas: S+, SAS, SPSS. 25

26 2.2.5 Fase de Interpretação e Avaliação Esta fase é associada à visualização dos dados. Realiza um filtragem do conhecimento fazendo o corte das regras e definindo o limite mínimo de confiança das regras geradas. Efectua uma avaliação verificando a precisão e taxa de erro dos resultados obtidos Fase de Integração de novo Conhecimento A integração de conhecimento num repositório central único pode envolver: a modificação do conhecimento já existente (revisão); a eliminação de conhecimento; a resolução de conflitos. 2.3 Bases das técnicas de Data Mining As técnicas de Data Mining estão baseadas na Estatística e Inteligência Artificial, conforme apresentado na figura : Figura 4: Bases das técnicas de Data Mining 26

27 2.3.1 A estatística É a base de todas as outras tecnologias criadas para Data Mining. Conceitos como distribuição normal, variância, análise de regressão, desvio simples, análise de conjuntos, análise de discriminantes e intervalos de confiança, são utilizados para realizar as pesquisas nos dados, bem como analisar e descobrir relacionamentos entre os mesmos Inteligência Artificial Técnicas de heurística são utilizadas para tentar recuperar informação que pode ser útil na descoberta de novas interacções entre os dados. Esta técnica exige mais processamento, conseguido com um bom custo/benefício, mas que resulta no maior aproveitamento nos SGBDs Sistemas Gestores de Bases de Dados e nos módulos de optimização de consulta Aprendizagem Automática (Machine Learning) É o estudo de algoritmos computacionais que melhoram automaticamente ao longo da experiência adquirida. Uma tarefa comum é aprender com o professor, também conhecida como aprendizagem assistida: o professor fornece os rótulos correctos, e a função do algoritmo de aprendizagem automática é construir um modelo que represente o conhecimento requerido de modo a rotular novos exemplos. Por exemplo, um número de parâmetros descrevem a informação detalhada sobre um empréstimo bem como o perfil do requerente desse empréstimo. O banco deve ter um largo número de exemplos descrevendo empréstimos antigos e a informação conhecida a situação destes empréstimos, se foram reembolsados com ou sem problemas. Esta realidade representa o conhecimento do professor. Nesta situação, um algoritmo de 27

Prof. Msc. Paulo Muniz de Ávila

Prof. Msc. Paulo Muniz de Ávila Prof. Msc. Paulo Muniz de Ávila O que é Data Mining? Mineração de dados (descoberta de conhecimento em bases de dados): Extração de informação interessante (não-trivial, implícita, previamente desconhecida

Leia mais

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Planejamento Estratégico de TI. Prof.: Fernando Ascani Planejamento Estratégico de TI Prof.: Fernando Ascani Data Warehouse - Conceitos Hoje em dia uma organização precisa utilizar toda informação disponível para criar e manter vantagem competitiva. Sai na

Leia mais

4. Que tipos de padrões podem ser minerados. 5. Critérios de classificação de sistemas de Data Mining. 6. Tópicos importantes de estudo em Data Mining

4. Que tipos de padrões podem ser minerados. 5. Critérios de classificação de sistemas de Data Mining. 6. Tópicos importantes de estudo em Data Mining Curso de Data Mining - Aula 1 1. Como surgiu 2. O que é 3. Em que tipo de dados pode ser aplicado 4. Que tipos de padrões podem ser minerados 5. Critérios de classificação de sistemas de Data Mining 6.

Leia mais

Professor: Disciplina:

Professor: Disciplina: Professor: Curso: Esp. Marcos Morais de Sousa marcosmoraisdesousa@gmail.com Sistemas de informação Disciplina: Introdução a SI Noções de sistemas de informação Turma: 01º semestre Prof. Esp. Marcos Morais

Leia mais

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse Definição escopo do projeto (departamental, empresarial) Grau de redundância dos dados(ods, data staging) Tipo de usuário alvo (executivos, unidades) Definição do ambiente (relatórios e consultas préestruturadas

Leia mais

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é?

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é? KDD Conceitos o que é? Fases limpeza etc Datamining OBJETIVOS PRIMÁRIOS TAREFAS PRIMÁRIAS Classificação Regressão Clusterização OBJETIVOS PRIMÁRIOS NA PRÁTICA SÃO DESCRIÇÃO E PREDIÇÃO Descrição Wizrule

Leia mais

Gestão da Informação. Gestão da Informação. AULA 3 Data Mining

Gestão da Informação. Gestão da Informação. AULA 3 Data Mining Gestão da Informação AULA 3 Data Mining Prof. Edilberto M. Silva Gestão da Informação Agenda Unidade I - DM (Data Mining) Definição Objetivos Exemplos de Uso Técnicas Tarefas Unidade II DM Prático Exemplo

Leia mais

A versão básica disponibiliza a informação criada no Microsoft Navision em unidades de informação

A versão básica disponibiliza a informação criada no Microsoft Navision em unidades de informação O Business Analytics for Microsoft Business Solutions Navision ajuda-o a ter maior controlo do seu negócio, tomar rapidamente melhores decisões e equipar os seus funcionários para que estes possam contribuir

Leia mais

DATA WAREHOUSE & DATA MINING

DATA WAREHOUSE & DATA MINING UNIVERSIDADE FEDERAL DE SANTA CATARINA UFSC Centro Tecnológico - Departamento de Informática e Estatística - INE Disciplina: EPS 5216 Sistemas de Informações Gerenciais Professora: Aline França de Abreu

Leia mais

EXCEL. Listas como Bases de Dados

EXCEL. Listas como Bases de Dados Informática II Gestão Comercial e da Produção EXCEL Listas como Bases de Dados (TÓPICOS ABORDADOS NAS AULAS DE INFORMÁTICA II) Curso de Gestão Comercial e da Produção Ano Lectivo 2002/2003 Por: Cristina

Leia mais

Inteligência de Negócio. Brian Cowhig

Inteligência de Negócio. Brian Cowhig Inteligência de Negócio Brian Cowhig Inteligência de Negócio O Que é Inteligência de Negócio? Três Níveis de Inteligência de Negócio Database Query OLAP Data Mining Produtos de Inteligência de Negócio

Leia mais

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan Faculdade INED Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan 1 Unidade 4.5 2 1 BI BUSINESS INTELLIGENCE BI CARLOS BARBIERI

Leia mais

CURSO DE PÓS-GRADUAÇÃO

CURSO DE PÓS-GRADUAÇÃO CURSO DE PÓS-GRADUAÇÃO EM ANÁLISE DE DADOS E GESTÃO DE INFORMAÇÃO Grupo de trabalho Armando Mendes Áurea Sousa Fátima Brilhante Rita Marques Brandão Osvaldo Silva Fevereiro 2010 Enquadramento e justificação

Leia mais

SISTEMAS DE APOIO À DECISÃO SAD

SISTEMAS DE APOIO À DECISÃO SAD SISTEMAS DE APOIO À DECISÃO SAD Conceitos introdutórios Decisão Escolha feita entre duas ou mais alternativas. Tomada de decisão típica em organizações: Solução de problemas Exploração de oportunidades

Leia mais

No mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o

No mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o DATABASE MARKETING No mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o empresário obter sucesso em seu negócio é

Leia mais

Mineração de Dados: Introdução e Aplicações

Mineração de Dados: Introdução e Aplicações Mineração de Dados: Introdução e Aplicações Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br Apresentação Luiz Merschmann Engenheiro

Leia mais

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO @ribeirord FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO Rafael D. Ribeiro, M.Sc,PMP. rafaeldiasribeiro@gmail.com http://www.rafaeldiasribeiro.com.br Lembrando... Aula 4 1 Lembrando... Aula 4 Sistemas de apoio

Leia mais

Sistemas de Apoio à Decisão. Vocabulário e conceitos Vista geral

Sistemas de Apoio à Decisão. Vocabulário e conceitos Vista geral Sistemas de Apoio à Decisão Vocabulário e conceitos Vista geral Decisão A escolha de uma entre várias alternativas Processo de tomada de decisão (decision making) Avaliar o problema Recolher e verificar

Leia mais

Extracto on Line Aplicação Local Guia do Utilizador

Extracto on Line Aplicação Local Guia do Utilizador Extracto on Line Aplicação Local Guia do Utilizador Índice 1. Sobre o Guia... 4 1.1 Objectivo... 4 1.2 Utilização do Guia... 4 1.3 Acrónimos e Abreviações... 4 2. Introdução ao Extracto on Line Aplicação

Leia mais

Pós-Graduação "Lato Sensu" Especialização em Análise de Dados e Data Mining

Pós-Graduação Lato Sensu Especialização em Análise de Dados e Data Mining Pós-Graduação "Lato Sensu" Especialização em Análise de Dados e Data Mining Inscrições Abertas Início das Aulas: 24/03/2015 Dias e horários das aulas: Terça-Feira 19h00 às 22h45 Semanal Quinta-Feira 19h00

Leia mais

Data Warehouses. Alunos: Diego Antônio Cotta Silveira Filipe Augusto Rodrigues Nepomuceno Marcos Bastos Silva Roger Rezende Ribeiro Santos

Data Warehouses. Alunos: Diego Antônio Cotta Silveira Filipe Augusto Rodrigues Nepomuceno Marcos Bastos Silva Roger Rezende Ribeiro Santos Data Warehouses Alunos: Diego Antônio Cotta Silveira Filipe Augusto Rodrigues Nepomuceno Marcos Bastos Silva Roger Rezende Ribeiro Santos Conceitos Básicos Data Warehouse(DW) Banco de Dados voltado para

Leia mais

Informática. Conceitos Básicos. Informação e Sistemas de Informação. Aula 3. Introdução aos Sistemas

Informática. Conceitos Básicos. Informação e Sistemas de Informação. Aula 3. Introdução aos Sistemas Informática Aula 3 Conceitos Básicos. Informação e Sistemas de Informação Comunicação Empresarial 2º Ano Ano lectivo 2003-2004 Introdução aos Sistemas A Teoria dos Sistemas proporciona um meio poderoso

Leia mais

Centro Atlântico, Lda., 2011 Ap. 413 4764-901 V. N. Famalicão, Portugal Tel. 808 20 22 21. geral@centroatlantico.pt www.centroatlantico.

Centro Atlântico, Lda., 2011 Ap. 413 4764-901 V. N. Famalicão, Portugal Tel. 808 20 22 21. geral@centroatlantico.pt www.centroatlantico. Reservados todos os direitos por Centro Atlântico, Lda. Qualquer reprodução, incluindo fotocópia, só pode ser feita com autorização expressa dos editores da obra. Microsoft Excel 2010 Colecção: Software

Leia mais

Tecnologias de Informação

Tecnologias de Informação Sistemas Empresariais Enterprise Resource Planning (ERP): Sistema que armazena, processa e organiza todos os dados e processos da empresa de um forma integrada e automatizada Os ERP tem progressivamente

Leia mais

Introdução a Datamining (previsão e agrupamento)

Introdução a Datamining (previsão e agrupamento) E o que fazer depois de ter os dados organizados? Introdução a Datamining (previsão e agrupamento) Victor Lobo Mestrado em Estatística e Gestão de Informação Ideias base Aprender com o passado Inferir

Leia mais

Introdução a Datamining (previsão e agrupamento)

Introdução a Datamining (previsão e agrupamento) Introdução a Datamining (previsão e agrupamento) Victor Lobo Mestrado em Estatística e Gestão de Informação E o que fazer depois de ter os dados organizados? Ideias base Aprender com o passado Inferir

Leia mais

Introdução. Capítulo 1

Introdução. Capítulo 1 Capítulo 1 Introdução Em computação, muitos problemas são resolvidos por meio da escrita de um algoritmo que especifica, passo a passo, como resolver um problema. No entanto, não é fácil escrever um programa

Leia mais

Gestão Total da Manutenção: Sistema GTM

Gestão Total da Manutenção: Sistema GTM Gestão Total da Manutenção: Sistema GTM por Engº João Barata (jbarata@ctcv.pt), CTCV Inovação Centro Tecnológico da Cerâmica e do Vidro 1. - INTRODUÇÃO Os sub-sistemas de gestão, qualquer que seja o seu

Leia mais

Sistemas de Apoio à Decisão

Sistemas de Apoio à Decisão Sistemas de Apoio à Decisão Data Mining & Optimização Victor Lobo Objectivos gerais Abrir horizontes em temas actuais Aprender técnicas usadas em Sistemas de apoio à decisão ou Business Intelligence Métodos

Leia mais

Centro Atlântico, Lda., 2011 Ap. 413 4764-901 V. N. Famalicão, Portugal Tel. 808 20 22 21. geral@centroatlantico.pt www.centroatlantico.

Centro Atlântico, Lda., 2011 Ap. 413 4764-901 V. N. Famalicão, Portugal Tel. 808 20 22 21. geral@centroatlantico.pt www.centroatlantico. Reservados todos os direitos por Centro Atlântico, Lda. Qualquer reprodução, incluindo fotocópia, só pode ser feita com autorização expressa dos editores da obra. Microsoft Access 2010 Colecção: Software

Leia mais

Tarefa Orientada 18 Tabelas dinâmicas

Tarefa Orientada 18 Tabelas dinâmicas Tarefa Orientada 18 Tabelas dinâmicas Análise de dados através de tabelas dinâmicas. Conceitos teóricos As Tabelas Dinâmicas são tabelas interactivas que resumem elevadas quantidades de dados, usando estrutura

Leia mais

geral@centroatlantico.pt www.centroatlantico.pt Impressão e acabamento: Inova 1ª edição: Outubro de 2003 ISBN: 972-8426-76-3 Depósito legal: 202574/03

geral@centroatlantico.pt www.centroatlantico.pt Impressão e acabamento: Inova 1ª edição: Outubro de 2003 ISBN: 972-8426-76-3 Depósito legal: 202574/03 FICHEIROS COM EXEMPLOS Envie um e-mail* para software@centroatlantico.pt para conhecer os endereços de Internet de onde poderá fazer o download dos ficheiros com os exemplos deste livro. * O leitor consente,

Leia mais

http://www.publicare.com.br/site/5,1,26,5480.asp

http://www.publicare.com.br/site/5,1,26,5480.asp Página 1 de 7 Terça-feira, 26 de Agosto de 2008 ok Home Direto da redação Última edição Edições anteriores Vitrine Cross-Docking Assine a Tecnologística Anuncie Cadastre-se Agenda Cursos de logística Dicionário

Leia mais

E se conseguisse reduzir os seus custos de energia até 20%?

E se conseguisse reduzir os seus custos de energia até 20%? E se conseguisse reduzir os seus custos de energia até 20%? Uma solução eficaz de Gestão Energética para o Retalho Eficiência Energética no Retalho Será que está a gastar mais em energia do que necessita?

Leia mais

Data Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento

Data Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento Data Mining Prof Luiz Antonio do Nascimento Data Mining Ferramenta utilizada para análise de dados para gerar, automaticamente, uma hipótese sobre padrões e anomalias identificadas para poder prever um

Leia mais

SERVIÇ OS DO PEDIDO ONLINE DA PROPRIEDADE INTELECTUAL

SERVIÇ OS DO PEDIDO ONLINE DA PROPRIEDADE INTELECTUAL SERVIÇ OS DO PEDIDO ONLINE DA PROPRIEDADE INTELECTUAL Manual de Utilização Direcção dos Serviços de Economia do Governo da RAEM Novembro de 2014 SERVIÇ OS DO PEDIDO ONLINE DA PROPRIEDADE INTELECTUAL Manual

Leia mais

A VISTA BACKSTAGE PRINCIPAIS OPÇÕES NO ECRÃ DE ACESSO

A VISTA BACKSTAGE PRINCIPAIS OPÇÕES NO ECRÃ DE ACESSO DOMINE A 110% ACCESS 2010 A VISTA BACKSTAGE Assim que é activado o Access, é visualizado o ecrã principal de acesso na nova vista Backstage. Após aceder ao Access 2010, no canto superior esquerdo do Friso,

Leia mais

Microsoft Access. Nível I. Pedro Fernandes

Microsoft Access. Nível I. Pedro Fernandes Microsoft Access Nível I Introdução Objectivos Introdução; Criar tabelas; Fazer consultas; Elaborar formulários; Executar relatórios. 2 Introdução aos Sistemas de Gestão de Bases de Dados (SGBD) Desde

Leia mais

EXCEL TABELAS DINÂMICAS

EXCEL TABELAS DINÂMICAS Informática II Gestão Comercial e da Produção EXCEL TABELAS DINÂMICAS (TÓPICOS ABORDADOS NAS AULAS DE INFORMÁTICA II) Curso de Gestão Comercial e da Produção Ano Lectivo 2002/2003 Por: Cristina Wanzeller

Leia mais

GIBDQA: GESTÃO INTEGRADA DE BASES DE DADOS DA QUALIDADE DA ÁGUA

GIBDQA: GESTÃO INTEGRADA DE BASES DE DADOS DA QUALIDADE DA ÁGUA GIBDQA: GESTÃO INTEGRADA DE BASES DE DADOS DA QUALIDADE DA ÁGUA Sandra CARVALHO 1, Pedro GALVÃO 2, Cátia ALVES 3, Luís ALMEIDA 4 e Adélio SILVA 5 RESUMO As empresas de abastecimento de água gerem diariamente

Leia mais

Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence

Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence É um conjunto de conceitos e metodologias que, fazem uso de acontecimentos e sistemas e apoiam a tomada de decisões. Utilização de várias fontes de informação para se definir estratégias de competividade

Leia mais

Módulo 2. Definindo Soluções OLAP

Módulo 2. Definindo Soluções OLAP Módulo 2. Definindo Soluções OLAP Objetivos Ao finalizar este módulo o participante: Recordará os conceitos básicos de um sistema OLTP com seus exemplos. Compreenderá as características de um Data Warehouse

Leia mais

Microsoft Innovation Center

Microsoft Innovation Center Microsoft Innovation Center Mineração de Dados (Data Mining) André Montevecchi andre@montevecchi.com.br Introdução Objetivo BI e Mineração de Dados Aplicações Exemplos e Cases Algoritmos para Mineração

Leia mais

Administração de Sistemas de Informação Gerenciais UNIDADE IV: Fundamentos da Inteligência de Negócios: Gestão da Informação e de Banco de Dados Um banco de dados é um conjunto de arquivos relacionados

Leia mais

Data Mining II Modelos Preditivos

Data Mining II Modelos Preditivos Data Mining II Modelos Preditivos Prof. Doutor Victor Lobo Mestre André Melo Mestrado em Estatística e Gestão de Informação Objectivo desta disciplina Fazer previsões a partir de dados. Conhecer os principais

Leia mais

MANUAL DE UTILIZAÇÃO DA PLATAFORMA MOODLE

MANUAL DE UTILIZAÇÃO DA PLATAFORMA MOODLE MANUAL DE UTILIZAÇÃO DA PLATAFORMA MOODLE A EQUIPA DO PTE 2009/2010 Índice 1. Entrar na plataforma Moodle 3 2. Editar o Perfil 3 3. Configurar disciplina 4 3.1. Alterar definições 4 3.2. Inscrever alunos

Leia mais

COMISSÃO NACIONAL DE PROTECÇÃO DE DADOS. As dinâmicas de grupo e os perfis de consumo

COMISSÃO NACIONAL DE PROTECÇÃO DE DADOS. As dinâmicas de grupo e os perfis de consumo COMISSÃO NACIONAL DE PROTECÇÃO DE DADOS As dinâmicas de grupo e os perfis de consumo O uso de perfis na empresa Os perfis são conjuntos de dados que caracterizam categorias de indivíduos destinados a serem

Leia mais

WorkinProject 8 Manual de Referência Rápida

WorkinProject 8 Manual de Referência Rápida WorkinProject 8 Manual de Referência Rápida Flagsoft, Lda 2015 Índice 1. Introdução...3 2. Integrador - Interface com o utilizador...4 3. Registo de actividade - Folha de horas...5 4. Agenda e colaboração...7

Leia mais

Manual de Access 2007

Manual de Access 2007 Manual de Access 2007 Índice Introdução... 4 Melhor que um conjunto de listas... 5 Amizades com relações... 6 A Estrutura de uma Base de Dados... 8 Ambiente do Microsoft Access 2007... 9 Separadores do

Leia mais

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Planejamento Estratégico de TI. Prof.: Fernando Ascani Planejamento Estratégico de TI Prof.: Fernando Ascani Data Mining Os métodos tradicionais de Data Mining são: Classificação Associa ou classifica um item a uma ou várias classes categóricas pré-definidas.

Leia mais

:: Data Mining. :: Data Mining. Exploração GSI. Técnicas Inteligentes baseadas em BD. :: Análise de Dados Multidimensionais

:: Data Mining. :: Data Mining. Exploração GSI. Técnicas Inteligentes baseadas em BD. :: Análise de Dados Multidimensionais Exploração GSI :: captura e codificação de conhecimento individual e colectivo para estender a base de conhecimento da organização 1 Baseada em tecnologias de BD OLAP (análise de dados multidimensionais)

Leia mais

Ficha prática nº 7. SGBD Microsoft Access e SQL Server

Ficha prática nº 7. SGBD Microsoft Access e SQL Server Instituto Superior Politécnico de Viseu Escola Superior de Tecnologia Departamento de Informática Ficha prática nº 7 SGBD Microsoft Access e SQL Server Objectivo: Criação de uma aplicação em arquitectura

Leia mais

Descoberta de Conhecimento em Bases de Dados. Classificação

Descoberta de Conhecimento em Bases de Dados. Classificação Universidade Técnica de Lisboa INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO Informática e Sistemas de Informação Aplicados em Economia Descoberta de Conhecimento em Bases de Dados. Classificação Descoberta

Leia mais

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br MINERAÇÃO DE DADOS APLICADA Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br Processo Weka uma Ferramenta Livre para Data Mining O que é Weka? Weka é um Software livre do tipo open source para

Leia mais

BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES.

BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES. Encontro de Ensino, Pesquisa e Extensão, Presidente Prudente, 22 a 25 de outubro, 2012 88 BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES. Andrios Robert Silva Pereira, Renato Zanutto

Leia mais

O Processo de KDD. Data Mining SUMÁRIO - AULA1. O processo de KDD. Interpretação e Avaliação. Seleção e Pré-processamento. Consolidação de dados

O Processo de KDD. Data Mining SUMÁRIO - AULA1. O processo de KDD. Interpretação e Avaliação. Seleção e Pré-processamento. Consolidação de dados SUMÁRIO - AULA1 O Processo de KDD O processo de KDD Interpretação e Avaliação Consolidação de dados Seleção e Pré-processamento Warehouse Data Mining Dados Preparados p(x)=0.02 Padrões & Modelos Conhecimento

Leia mais

Escola Superior de Tecnologia de Setúbal. Projecto Final

Escola Superior de Tecnologia de Setúbal. Projecto Final Instituto Politécnico de Setúbal Escola Superior de Tecnologia de Setúbal Departamento de Sistemas e Informática Projecto Final Computação na Internet Ano Lectivo 2002/2003 Portal de Jogos Executado por:

Leia mais

PHC Logística CS. A gestão total da logística de armazém

PHC Logística CS. A gestão total da logística de armazém PHC Logística CS A gestão total da logística de armazém A solução para diminuir os custos de armazém, melhorar o aprovisionamento, racionalizar o espaço físico e automatizar o processo de expedição. BUSINESS

Leia mais

ZSRest/ZSPos. Manual de Stocks. BackOffice

ZSRest/ZSPos. Manual de Stocks. BackOffice BackOffice 1 1. Índice 2. Introdução... 3 3. Iniciar o ZSRest/ZSPos FrontOffice... 4 4. Produto... 5 Activar gestão de stocks... 5 5. Armazém... 7 a) Adicionar Armazém... 8 b) Modificar Armazém... 8 c)

Leia mais

Identificação de Caracteres com Rede Neuronal Artificial com Interface Gráfica

Identificação de Caracteres com Rede Neuronal Artificial com Interface Gráfica Identificação de Caracteres com Rede Neuronal Artificial com Interface Gráfica João Paulo Teixeira*, José Batista*, Anildio Toca**, João Gonçalves**, e Filipe Pereira** * Departamento de Electrotecnia

Leia mais

LABWAY ROAD SHOW 2007 - Sessão #3

LABWAY ROAD SHOW 2007 - Sessão #3 Pedro Coutinho Paulo Rego jpcoutinho@ambidata.pt paulorego@ambidata.pt Agenda Porquê um LIMS? Os Nossos Pontos Fortes O Nosso Objectivo Características do LabWay - LIMS O Processo LabWay - LIMS Projectando

Leia mais

Base de dados I. Base de dados II

Base de dados I. Base de dados II Base de dados I O que é? Uma base de dados é um simples repositório de informação, relacionada com um determinado assunto ou finalidade, armazenada em computador em forma de ficheiros Para que serve? Serve

Leia mais

Gestão de Configurações II

Gestão de Configurações II Gestão de Configurações II Bibliografia Livro: Software Configuration Management Patterns: Effective Teamwork, Practical Integration Gestão de Projecto 14 Padrões de Gestão Os padrões de gestão de configurações

Leia mais

Curriculum DeGóis Guia de preenchimento do Curriculum Vitae (Informação mínima necessária)

Curriculum DeGóis Guia de preenchimento do Curriculum Vitae (Informação mínima necessária) Curriculum DeGóis Guia de preenchimento do Curriculum Vitae (Informação mínima necessária) /curriculum Julho de 2008 Versão 1.1 1 Introdução O objectivo deste guia é auxiliar o utilizador da Plataforma

Leia mais

Aplicação A. Aplicação B. Aplicação C. Aplicação D. Aplicação E. Aplicação F. Aplicação A REL 1 REL 2. Aplicação B REL 3.

Aplicação A. Aplicação B. Aplicação C. Aplicação D. Aplicação E. Aplicação F. Aplicação A REL 1 REL 2. Aplicação B REL 3. Sumário Data Warehouse Modelagem Multidimensional. Data Mining BI - Business Inteligence. 1 2 Introdução Aplicações do negócio: constituem as aplicações que dão suporte ao dia a dia do negócio da empresa,

Leia mais

TIC Unidade 2 Base de Dados. Informação é todo o conjunto de dados devidamente ordenados e organizados de forma a terem significado.

TIC Unidade 2 Base de Dados. Informação é todo o conjunto de dados devidamente ordenados e organizados de forma a terem significado. Conceitos relativos à Informação 1. Informação O que á a informação? Informação é todo o conjunto de dados devidamente ordenados e organizados de forma a terem significado. 2. Dados Em informática designa-se

Leia mais

Fundamentos da inteligência de negócios: gestão da informação e de bancos de dados

Fundamentos da inteligência de negócios: gestão da informação e de bancos de dados Fundamentos da inteligência de negócios: gestão da informação e de bancos de dados slide 1 1 Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall Objetivos de estudo Como um banco de dados

Leia mais

KDD UMA VISAL GERAL DO PROCESSO

KDD UMA VISAL GERAL DO PROCESSO KDD UMA VISAL GERAL DO PROCESSO por Fernando Sarturi Prass 1 1.Introdução O aumento das transações comerciais por meio eletrônico, em especial as feitas via Internet, possibilitou as empresas armazenar

Leia mais

PLANIFICAÇÃO ANUAL DA DISCIPLINA DE TECNOLOGIAS DE INFORMAÇÃO E COMUNICAÇÃO ANO LETIVO DE 2013/2014 Curso CEF Tipo 2

PLANIFICAÇÃO ANUAL DA DISCIPLINA DE TECNOLOGIAS DE INFORMAÇÃO E COMUNICAÇÃO ANO LETIVO DE 2013/2014 Curso CEF Tipo 2 PLANIFICAÇÃO ANUAL DA DISCIPLINA DE TECNOLOGIAS DE INFORMAÇÃO E COMUNICAÇÃO ANO LETIVO DE 2013/2014 Curso CEF Tipo 2 Domínios de referência Competências Conteúdos Calendarização Conceitos Essenciais e

Leia mais

TÉCNICAS DE INFORMÁTICA WILLIAN FERREIRA DOS SANTOS

TÉCNICAS DE INFORMÁTICA WILLIAN FERREIRA DOS SANTOS TÉCNICAS DE INFORMÁTICA WILLIAN FERREIRA DOS SANTOS Vimos em nossas aulas anteriores: COMPUTADOR Tipos de computadores Hardware Hardware Processadores (CPU) Memória e armazenamento Dispositivos de E/S

Leia mais

ANÁLISE ANÁ DE DADOS DAD

ANÁLISE ANÁ DE DADOS DAD ANÁLISE DE DADOS Maputo, Moçambique 2008 Objectivos No final deste módulo espera-se que o participante seja capaz de: Distinguir as etapas na Análise de Dados Qualitativos Distinguir as etapas na Análise

Leia mais

Expanda suas Capacidades Analíticas

Expanda suas Capacidades Analíticas Módulos IBM SPSS Statistics Expanda suas Capacidades Analíticas Um guia resumido dos módulos para o IBM SPSS Statistics Base Destaques Existem vários produtos IBM SPSS para te ajudar em cada fase do projeto

Leia mais

Descrição de um problema de integração: Sistema de vendas online

Descrição de um problema de integração: Sistema de vendas online Integração Empresarial Descrição de um problema de integração: Sistema de vendas online Luís Costa - 8050120 Abril, 2012 1. Introdução Este documento apresenta detalhadamente o processo de negócio de uma

Leia mais

Apresentação do produto Versão Premium 9.0 (GMPE)

Apresentação do produto Versão Premium 9.0 (GMPE) Apresentação do produto Versão Premium 9.0 (GMPE) Qual a importância que o relacionamento com os clientes tem para a sua empresa? Goldmine CRM é para as empresas que atribuem importância máxima à manutenção

Leia mais

Data Warehousing e OLAP

Data Warehousing e OLAP Data Warehousing e OLAP Jornadas de Engenharia Informática Instituto Politécnico da Guarda Henrique Madeira Departamento de Engenharia Informática Faculdade de Ciências e Tecnologia Universidade de Coimbra

Leia mais

Manual de Administração Intranet BNI

Manual de Administração Intranet BNI Manual de Administração Intranet BNI Fevereiro - 2010 Índice 1. Apresentação... 3 2. Conceitos... 5 3. Funcionamento base da intranet... 7 3.1. Autenticação...8 3.2. Entrada na intranet...8 3.3. O ecrã

Leia mais

2 Descoberta de Conhecimento em Bases de Dados 2.1. Introdução

2 Descoberta de Conhecimento em Bases de Dados 2.1. Introdução 2 Descoberta de Conhecimento em Bases de Dados 2.1. Introdução De acordo com [FAYY96], o conceito de descoberta de conhecimento em bases de dados pode ser resumido como o processo não-trivial de identificar

Leia mais

Bases de Dados. O que é uma Base de Dados? Pós-Grduação em SIG

Bases de Dados. O que é uma Base de Dados? Pós-Grduação em SIG Bases de Dados O que é uma Base de Dados? Dados Pode-se começar por tentar dar uma definição do que são Dados. Os dados são factos em bruto, que não são necessáriamente relevantes para qualquer coisa que

Leia mais

Iteração 2 Design inicial

Iteração 2 Design inicial Universidade de Aveiro Departamento de Electrónica, Telecomunicações e Informática Engenharia de Software Iteração 2 Design inicial Projecto: FX-Center Grupo: BEDS David Pacheco (nº 32665) Cesário Lucas

Leia mais

CATÁLOGO DE FORMAÇÃO

CATÁLOGO DE FORMAÇÃO CATÁLOGO DE FORMAÇÃO 2009 CATÁLOGO DE FORMAÇÃO INDICE INDICE...2 ÂMBITO...4 1. GESVEN - GESTÃO DE PESSOAL E VENCIMENTOS CGV02 Gestão Base de Cadastro...5 CGV03 Report Writer (Base)...5 CGV04 Processamento

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Tipos de aprendizagem 3. Paradigmas de aprendizagem 4. Modos de aprendizagem

Leia mais

Data Mining: Conceitos e Técnicas

Data Mining: Conceitos e Técnicas Data Mining: Conceitos e Técnicas DM, DW e OLAP Data Warehousing e OLAP para Data Mining O que é data warehouse? De data warehousing para data mining Data Warehousing e OLAP para Data Mining Data Warehouse:

Leia mais

Edição 2010 Estágios Curriculares

Edição 2010 Estágios Curriculares Edição 2010 Estágios Curriculares Direcção de Auditoria Crédito Descrição Sumária do Projecto 01/24 Desenvolvimento de metodologias de análise dos critérios de validação técnica dos modelos de rating de

Leia mais

MESTRADO EM PESQUISA DE MERCADOS 2006 2007

MESTRADO EM PESQUISA DE MERCADOS 2006 2007 MESTRADO EM PESQUISA DE MERCADOS 2006 2007 PROGRAMA DAS DISCIPLINAS 1 1º trimestre PESQUISA DE MERCADOS Objectivos Pretende-se que os alunos: (a) adquiram os conceitos e semântica próprios do tema, (b)

Leia mais

ADM041 / EPR806 Sistemas de Informação

ADM041 / EPR806 Sistemas de Informação ADM041 / EPR806 Sistemas de Informação UNIFEI Universidade Federal de Itajubá Prof. Dr. Alexandre Ferreira de Pinho 1 Sistemas de Apoio à Decisão (SAD) Tipos de SAD Orientados por modelos: Criação de diferentes

Leia mais

Porque as suas regras de negócio são específicas, precisa de uma sua solução de gestão que permite gerir essa diferença.

Porque as suas regras de negócio são específicas, precisa de uma sua solução de gestão que permite gerir essa diferença. Porquê NEXT Vision Porque as suas regras de negócio são específicas, precisa de uma sua solução de gestão que permite gerir essa diferença.... Poder de adaptação Porque cabe a si decidir como pretende

Leia mais

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA Lizianne Priscila Marques SOUTO 1 1 Faculdade de Ciências Sociais e Aplicadas

Leia mais

PONTDOC. Sistema de Gestão Documental. Dossier de Produto 02.01.2009 DP10.02. www.pontual.pt UGD 1 de 13

PONTDOC. Sistema de Gestão Documental. Dossier de Produto 02.01.2009 DP10.02. www.pontual.pt UGD 1 de 13 PONTDOC Sistema de Gestão Documental Dossier de Produto DP10.02 02.01.2009 www.pontual.pt UGD 1 de 13 PONTDoc Sistema de Gestão Documental A Pontual A Pontual é uma empresa de capitais 100% nacionais,

Leia mais

Portal AEPQ Manual do utilizador

Portal AEPQ Manual do utilizador Pedro Gonçalves Luís Vieira Portal AEPQ Manual do utilizador Setembro 2008 Engenharia Informática - Portal AEPQ Manual do utilizador - ii - Conteúdo 1 Introdução... 1 1.1 Estrutura do manual... 3 1.2 Requisitos...

Leia mais

DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS

DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS Tácio Dias Palhão Mendes Bacharelando em Sistemas de Informação Bolsista de Iniciação Científica da FAPEMIG taciomendes@yahoo.com.br Prof.

Leia mais

Escola Superior de Gestão de Santarém. Instalação e Manutenção de Redes e Sistemas Informáticos. Peça Instrutória G

Escola Superior de Gestão de Santarém. Instalação e Manutenção de Redes e Sistemas Informáticos. Peça Instrutória G Escola Superior de Gestão de Santarém Pedido de Registo do CET Instalação e Manutenção de Redes e Sistemas Informáticos Peça Instrutória G Conteúdo programático sumário de cada unidade de formação TÉCNICAS

Leia mais

IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES ENTRE PRODUTOS DE UMA BASE DE DADOS REAL

IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES ENTRE PRODUTOS DE UMA BASE DE DADOS REAL Universidade Federal de Ouro Preto - UFOP Instituto de Ciências Exatas e Biológicas - ICEB Departamento de Computação - DECOM IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES

Leia mais

Manual do Utilizador

Manual do Utilizador Faculdade de Ciências e Tecnologia da Universidade de Coimbra Departamento de Engenharia Electrotécnica e Computadores Software de Localização GSM para o modem Siemens MC35i Manual do Utilizador Índice

Leia mais

MINERAÇÃO DE DADOS. Mineração de Dados

MINERAÇÃO DE DADOS. Mineração de Dados MINERAÇÃO DE DADOS Mineração de Dados Sumário Conceitos / Autores chave... 3 1. Introdução... 4 2. Conceitos de Mineração de Dados... 5 3. Aplicações de Mineração de Dados... 7 4. Ferramentas de Mineração

Leia mais

Engenharia de Software Sistemas Distribuídos. 2º Semestre, 2007/2008. Departamento Engenharia Informática. Enunciado do projecto: Loja Virtual

Engenharia de Software Sistemas Distribuídos. 2º Semestre, 2007/2008. Departamento Engenharia Informática. Enunciado do projecto: Loja Virtual Engenharia de Software Sistemas Distribuídos 2º Semestre, 2007/2008 Departamento Engenharia Informática Enunciado do projecto: Loja Virtual Fevereiro de 2008 Índice Índice...2 Índice de Figuras...3 1 Introdução...4

Leia mais

BPstat. manual do utilizador. Banco de Portugal BPstat Estatísticas online Manual do Utilizador 1/24

BPstat. manual do utilizador. Banco de Portugal BPstat Estatísticas online Manual do Utilizador 1/24 BPstat manual do utilizador Banco de Portugal BPstat Estatísticas online Manual do Utilizador 1/24 BANCO DE PORTUGAL Av. Almirante Reis, 71 1150-012 Lisboa www.bportugal.pt Edição Departamento de Estatística

Leia mais

.Net Remoting Pizzaria

.Net Remoting Pizzaria .Net Remoting Pizzaria 1º Trabalho Prático Tecnologias de Distribuição e Integração 4º Ano do Mestrado Integrado em Engenharia Informática e Computação João Carlos Figueiredo Rodrigues Prudêncio ei07111@fe.up.pt

Leia mais

Centro de Computação - Unicamp Gerência de Atendimento ao Cliente (e-mail:apoio@turing.unicamp.br) Sumário

Centro de Computação - Unicamp Gerência de Atendimento ao Cliente (e-mail:apoio@turing.unicamp.br) Sumário Sumário Conceitos Microsoft Access 97... 01 Inicialização do Access... 02 Convertendo um Banco de Dados... 03 Criando uma Tabela... 06 Estrutura da Tabela... 07 Propriedades do Campo... 08 Chave Primária...

Leia mais

3 Market Basket Analysis - MBA

3 Market Basket Analysis - MBA 2 Mineração de Dados 3 Market Basket Analysis - MBA Market basket analysis (MBA) ou, em português, análise da cesta de compras, é uma técnica de data mining que faz uso de regras de associação para identificar

Leia mais