Projecto de Licenciatura

Tamanho: px
Começar a partir da página:

Download "Projecto de Licenciatura"

Transcrição

1 Instituto Politécnico do Porto Instituto Superior de Engenharia do Porto Departamento de Engenharia Informática Projecto de Licenciatura A aluna: Celina Maria Rodrigues Pereira O orientador: Jorge Morais Setembro de 2002

2 Indice Glossário 7 1 Introdução O Tema Os Objectivos A estrutura do Relatório 11 2 O que é o Data Mining? Principais Características de uma ferramenta de Data Mining O Processo de Descoberta de Conhecimento Fase de Selecção Fase de Pré-Processamento Fase de Transformação Fase de Data Mining Objectivos de Data Mining Técnicas de Data Mining Fase de Interpretação e Avaliação Fase de Integração de novo Conhecimento Bases das técnicas de Data Mining A estatística Inteligência Artificial Aprendizagem Automática (Machine Learning) Utilização das ferramentas de Data Mining 28 3 Apresentação de Ferramentas de Data Mining Clementine Como é usado o Clementine Como o Clementine interpreta os dados Como o Clementine lê os dados Intelligent Miner (IM) Utilização do Intelligent Miner Administration Mode Discovery Mode Entidades de Dados, Origens de Dados e Objectos de Data Mining Mining Studies Warehouses (Armazéns) Schema Editor Batch Mode Enterprise Miner Utilização do Enterprise Miner 45 2

3 3.3.2 Três visões sobre o Enterprise Miner Interface Comparação estatística e financeira dos métodos Produção Alice Utilização de Alice Árvores de Decisão Uma ferramenta de Data Mining poderosa para o utilizador Preparação dos dados Árvore de decisão Gráficos Módulos KnowledegeSEEKER Funcionamento do KnowledgeSeeker ª Fase: Preparação dos Dados ª Fase: Análise dos Dados Avaliação dos Dados Selecção e Acesso aos dados Transformação de Dados Valores em Falta Exploração Visualização Estatística Descritiva DBMiner Porquê o uso do DBMiner? Principais características OLAP Browser D Cube Explorer Associação Classificação Clustering Vantagens do DBMiner Miner3D EXCEL Processo de Descoberta de Conhecimento Intellix Designer Como funciona o Intellix Designer? Características do Intellix Descrição da aplicação 78 4 Comparação das Ferramentas Ferramentas avaliadas Plataformas Dados de Entrada e de Saída Algoritmos 89 3

4 4.5 Visualização Automação Forças e Fraquezas das ferramentas 96 5 Conclusão 98 Bibliografia 101 Livros 101 Publicações Electrónicas 101 Informações sobre Data Mining 101 Informações sobre as ferramentas apresentadas 102 Outras bibliografias 102 4

5 Indice das Figuras FIGURA 1: PROCESSO DE DESCOBERTA DE CONHECIMENTO 17 FIGURA 2: ÁRVORE DE DECISÃO 22 FIGURA 3: REDE NEURONAL 24 FIGURA 4: BASES DAS TÉCNICAS DE DATA MINING 26 FIGURA 5: EXEMPLO DA APLICAÇÃO DO FICHEIRO PROJECTO 33 FIGURA 6: INTERFACE DO CLEMENTINE 35 FIGURA 7: MATRIZ DE CORRELAÇÃO DO CLEMENTINE DATA MINING SYSTEM 39 FIGURA 8: GRÁFICO DE CORRELAÇÕES DO CLEMENTINE DATA MINING SYSTEM 39 FIGURA 9: GRÁFICO DE MÚLTIPLAS VARIÁVEIS OBTIDO NO CLEMENTINE DATA MINING SYSTEM 40 FIGURA 10: GRÁFICO DE DISTRIBUIÇÃO DO CLEMENTINE DATA MINING SYSTEM 40 FIGURA 11: UM PROCESSO DE ESTUDO INTEGRADO CONSTRUÍDO A PARTIR DE FERRAMENTAS COMPLETAS 47 FIGURA 12: RESULTADOS GRÁFICOS E DINÂMICOS 47 FIGURA 13: POSSIBILIDADE DE AVALIAR POTÊNCIAS E REGRESSÕES SOBRE INVESTIMENTOS PARA DETERMINAR UMA ESTRATÉGIA 48 FIGURA 14: ÁRVORE DE DECISÃO DE ALICE 52 FIGURA 15: REPRESENTAÇÃO DE ASSOCIAÇÕES COM O DBMINER 66 FIGURA 16: VISUALIZAÇÃO DA CLASSIFICAÇÃO NO DBMINER 68 FIGURA 17: REPRENTAÇÃO DE CLUSTERING NO DBMINER 70 FIGURA 18: UMA VISUALIZAÇÃO POSSÍVEL NO MINER3D 73 FIGURA 19 ARQUITECTURA INTELLIX 75 FIGURA 20: AMBIENTE DE TRABALHO NO INTELLIX 78 FIGURA 21: EXEMPLO DE PROPRIEDADES DE UM DOCUMENTO NO INTELLIX 79 FIGURA 22: EXEMPLO 80 FIGURA 23 ÁREA DE TESTES PARA OS DOCUMENTOS 81 FIGURA 24 - USANDO O ACTIVE KNOWLEDGE ACQUISITION 81 FIGURA 25 - INTERFACE DO WEB - TEST BENCH 82 FIGURA 26 - DISTRIBUIÇÃO DE RESULTADOS 82 FIGURA 27 ESPAÇO EXEMPLO UTILIZADO 83 FIGURA 28: EXEMPLO DE HISTOGRAMAS 92 FIGURA 29: EXEMPLO DE PIE CHART 93 FIGURA 30: EXEMPLO DE LINE PLOT 93 FIGURA 31: EXEMPLO DE CLASSIFICATION DECISION REGIONS 94 5

6 Indice de Tabelas TABELA 1: INFORMAÇÃO PARA CONSTRUÇÃO DE ÁRVORE DE DECISÃO 21 TABELA 2: APRESENTAÇÃO DAS FERRAMENTAS COMPARADA S 84 TABELA 3: PLATAFORMAS 85 TABELA 4: DADOS DE ENTRADA E DE SAÍDA 87 TABELA 5: ALGORITMOS 89 TABELA 6: VISUALIZAÇÃO 91 TABELA 7: AUTOMAÇÃO 95 TABELA 8: FORÇAS E FRAQUEZAS DAS FERRAMENTAS 96 6

7 Glossário Armazéns de dados (Data Warehouse) Sistema de suporte à decisão para armazenar grandes quantidades de informação. Árvore de Decisão Representação gráfica das relações entre um conjunto de dados de variáveis independentes (inputs). Usualmente são representadas em forma de arvores que representam um conjunto de regras. As arvores podem ser binárias ou com múltiplo ramos, dependendo do algoritmo utilizado. C5.0 - Um algoritmo de Machine learning que tem um conjunto de regras que podem ser aplicadas a um conjunto de dados para fazer uma previsão. Este algoritmo foi desenvolvido por J. Ross Quinlan. C5.0 foi o sucessor dos algoritmos C4.5 e ID3 (Iterative Dichotomiser). CART Classification And Regression Trees. Algoritmo estatístico, técnica utilizada na segmentação de uma base de dados. O algoritmo cria árvores binárias e segmentos em duas partes. Este algoritmo foi desenvolvido por L.Briemen em Classificação Processo de divisão de um conjunto de dados em grupos mutuamente exclusivos. Clustering Processo pelo qual um conjunto de dados é dividido em conjuntos agrupados por um valor semelhante ou clusters. Não tem, como o processo de classificação um número pré-definido de classes. Data Mining É a análise de dados para detectar relações ainda não descobertas. Os resultados de um processo de data Mining incluem: associações, correlações, sequências, classificações, clustering e previsões. 7

8 ODBC (Open DataBase Connectivity) Especificação projectada pela Microsoft para permitir ás aplicações do Windows o acesso a dados múltiplos através de um método simples sem considerar os diversos formatos dos arquivos de dados. OLAP Online Analytical Processing. Refere-se a uma aplicação de Base de Dados que permite ao utilizador ver, navegar, manipular e analisar Bases de Dados multi-dimensionais. Redes neuronais de Kohonen Arquitectura neuronal que utiliza aprendizagem automática para fazer analise de clusters. Foi desenvolvida por Teuvo Kohonen. SGBD Sistema Gestor de Bases de Dados 8

9 A cada ano, companhias acumulam mais e mais informações em seus bancos de 1 Introdução Todos os anos, as empresas acumulam cada vez mais informação nas Bases de Dados. Em consequência, estas Bases de Dados passam a conter verdadeiros tesouros de informação sobre vários dos procedimentos dessas companhias. Toda esta informação pode ser usada para melhorar seus procedimentos, permitindo que a empresa detecte tendências e características disfarçadas, e reaja rapidamente a um evento que ainda pode estar por vir. No entanto, apesar do enorme valor desses dados, a maioria das organizações é incapaz de aproveitar totalmente o que está armazenado em seus arquivos. Esta informação preciosa está na verdade implícita escondida sob uma montanha de dados, e não pode ser descoberta utilizando-se sistemas de Bases de Dados convencionais. A solução existe, e chama-se Data Mining. A quantidade de informação armazenada em Bases de Dados está explodindo, e ultrapassa a habilidade técnica e a capacidade humana na sua interpretação. A necessidade de transformar estas Bases de Dados em informações significativas é óbvia. Felizmente, técnicas computacionais foram desenvolvidas para analisar os dados, ou ao menos ajudar o analista a encontrar ordem no caos: conhecimento. Algumas formas de conhecimento existentes são as regras associativas. Para um dado conjunto de itens e um conjunto de registos contendo esses itens, podem existir afinidades entre os registos, que são expressas na forma de regras. As regras de associação mais fortes de uma tabela são as dependências funcionais. 9

10 Data Mining é uma tecnologia usada para revelar informação estratégica escondida em grandes massas de dados. É usada em diversas áreas, como análise de riscos, marketing direcionado, controle de qualidade, análise de dados científicos, etc. Data Mining define o processo automatizado de captura e análise de enormes conjuntos de dados, para extrair um significado. Esta tecnologia está sendo usada para descrever características do passado, assim como predizer tendências para o futuro. Sua utilização permite avanços tecnológicos e descobertas científicas, além de garantir uma vantagem competitiva invejável. 1.1 O Tema Para utilizar a técnica de Data Mining nas Bases de Dados e, consequentemente, utilizar nas empresas interessadas em utilizar esta nova tecnologia, existem muitas empresas que desenvolveram aplicações para manipular as Bases de Dados, segundo as técnicas de Data Mining. O tema associado a este relatório de projecto é o Estudo comparativo das principais ferramentas de extracção de conhcimento em Bases de Dados. 1.2 Os Objectivos Pretende-se, neste trabalho, fazer um levantamento do estado da arte em relação ás ferramentas de extracção de conhecimento em Bases de Dados, comparando as várias caracteristicas a definir no próprio trabalho. Assim dever-se-ão, em primeiro lugar, definir quais as principais características a ter em conta numa possível classificação das ferramentas. Em seguida, fazer a comparação de várias ferramentas existentes (particularmente no ISEP), podendo ser sugerido um modelo de classificação 10

11 geral ou por áreas de actividade: ensino, industria, companhias de seguros, etc A estrutura do Relatório O segundo capítulo explica o que é o Data Mining e para que é utilizado. No primeiro ponto, são descritas as principais caracteristica de uma ferramenta de Data Mining e são dados exemplos de empresas que utilizam esta nova tecnologia. O processo de Descoberta de Conhecimento, em que o Data Mining se insere, é descrito no segundo ponto. É dada uma particular ênfase à fase de Data Mining em que são vistos os objectivos desta fase e as técnicas utilizadas para tratar dos dados segundo as técnicas de Data Mining. No terceiro ponto, é feita uma abordagem sobre as bases das técnicas de Data Mining, explicando que se baseia na estatística e na inteligência artificial. No último ponto deste capitulo, são descritas utilizações das técnicas de Data Mining. O terceiro capítulo descreve as ferramentas de Data Mining que vão ser comparadas, mostrando as principais caracteristica associadas a cada uma e como são utilizadas. As ferramentas apresentadas são as seguintes: Clementine Intelligent Miner Enterprise Miner Alice KnowlwdgeSEEKER DBMiner Miner3D EXCEL Intellix Designer 11

12 Foram escolhidas estas ferramentas e não outras porque pareceram ser as mais utilizadas e as mais interressantes a nível das técnicas de Data Mining. O quarto capítulo faz uma comparação das ferramentas, numa primeira parte recapitula as principais caracteristicas de cada uma, e de seguida faz uma comparação a nível de plataformas utilizadas, algoritmos, visualização e automação. Este capitulo acaba mostrando os pontos fortes e pontos fracos de cada uma. 12

13 2 O que é o Data Mining? Ter uma Base de Dados completa e com muita informação é importante, mas essa informação pode à partida não fazer muito sentido. Não se conseguem retirar grandes conclusões com muitos registos diferentes. Segundo o manual do Clementine, o termo Data Mining refere-se a utilizar uma variedade de técnicas de inteligência artificial e análise de dados para identificar pepitas (nuggets) de conhecimento ou informação no corpo dos dados, extraindo essas informações por forma a serem utilizadas em áreas como suportes de decisão, previsão e estimação. Por oposição às ferramentas OLAP On-Line Analytical Processing, em que a exploração de dados é conduzida pelo utilizador, nas ferramentas de Descoberta de Conhecimento a exploração dos dados toma um carácter semiautónomo de descoberta, através de algoritmos de Data Mining. O poder do Data Mining está em utilizar ferramentas que utilizam vários tipos de algoritmos para procurar padrões nos dados, uma combinação que envolve associações lógicas, estatística, análise e visualização. No ponto 1, vai ser mostrada a utilidade e as caracteristicas do Data Mining. O ponto 2 explica o processo de Descoberta de Conhecimento dando ênfase à fase de Data Mining. O ponto 3 explica a base das técnicas de Data Mining e o ponto 4 mostra a utilização das mesmas. 13

14 2.1 Principais Características de uma ferramenta de Data Mining Os paradigmas de negócio fizeram evoluir e mudar as questões a serem respondidas pelos Sistemas de Informações, ao longo do tempo. A evolução foi a seguinte: Data Collection (anos 60) - "Qual foi o valor total de vendas nos últimos dois anos?" Data Access (anos 80) - "Quanto rendeu a nossa filial A no semestre passado?" Data Warehousing & Decision Support (anos 90) - " Quanto rendeu a nossa filial B no semestre passado? Que consequências teve na filial B? " (drill down/slice-and-slice) Data Mining (Hoje) - "O que irá acontecer com as vendas na filial A no próximo mês? Por quê?" Data Mining é uma técnica que permite buscar em grandes bases de dados, informação que, aparentemente, estão camufladas ou escondidas, permitindo, com isso, agilidade nas tomadas de decisão. Uma empresa que utiliza as técnicas de Data Mining é capaz de : Criar parâmetros para entender o comportamento do consumidor; Identificar afinidades entre as escolhas de produtos e serviços; Prever hábitos de compras; Analisar comportamentos habituais para se detectarem fraudes. As ferramentas de Data Mining podem determinar padrões de comportamento, como associação de produtos durante um processo de 14

15 compras. Com isto as ferramentas de Data Mining indicam a presença de oportunidades em relação ao consumidor. As descobertas de padrões de consumo dão-se por uma lógica de algoritmos com base numa rede neuronal de raciocínios. São ferramentas de descoberta matemáticas, feitas sobre os registos já processados, contra descobertas empíricas. Alguns exemplos: A rede americana Wall-Mart, pioneira no uso de Data Mining, descobriu ao explorar seus números que 60% das mães que compram uma boneca Barbie, levam também uma barra de chocolate; O banco Itaú conseguiu aumentar sua taxa de retorno do envio directo para 30% reduzindo a conta do correio a um quinto, armazenando e analisando a movimentação financeira de seus 3 milhões de clientes nos últimos 18 meses. A Sprint, um dos líderes no mercado americano de telefone de longa distância, desenvolveu, com a análise de Data Mining no seu armazém de dados, um método capaz de prever com 61% de segurança se um consumidor trocaria de companhia telefónica dentro de um período de dois meses. Com um marketing agressivo, conseguiu evitar a deserção de clientes e uma perda de 35 milhões de dólares em facturação. O governo de Massachusetts, nos Estados Unidos, compilava informações financeiras imprimindo telas e mais telas nos terminais de grande porte. Só com papel foram economizados dólares por ano, além de permitir que o orçamento anual fosse assinado e analisado, antes do início do ano fiscal. E o clássico exemplo de uma grande rede de vendas americana que descobriu, através das técnicas de Data Mining, que as vendas de fraldas estavam intimamente ligadas às vendas de cerveja. Explicação, os pais que saiam à noite para comprar fraldas, compravam cerveja também. 15

16 Por isso e por outros inúmeros exemplos, as ferramentas de Data Mining crescem em importância, principalmente porque as empresas preocupam-se com o futuro do negócio. O Data Mining pode ser considerado como sendo uma das fases do processo de descoberta de conhecimento em bases de dados (KDD Knowledge Discovery in Databases), área de pesquisa em evidência no momento, que envolve Inteligência Artificial e base de dados. 2.2 O Processo de Descoberta de Conhecimento Sob a perspectiva de Descoberta de Conhecimento, o Conhecimento é quantificado em termo de utilidade, validade, simplicidade/complexidade e novidade. Estas medidas são aplicadas às relações/modelos sempre sob a perspectiva de Interesse. As fases de Descoberta de Conhecimento são as seguintes: Selecção Pré-processamento Transformação Data Mining Interpretação/Avaliação 16

17 Figura 1: Processo de Descoberta de Conhecimento Fase de Selecção Os dados são escolhidos de acordo com os objectivos de descoberta. Os parâmetros de selecção são o volume de dados necessário, a periodicidade de recolha das amostras e a frequência de repetição dos exercícios de exploração Fase de Pré-Processamento Gera dados generalizados ou reduzidos. A redução dos dados pode ser feita em linhas ou colunas. Na redução em linhas, os atributos categóricos são generalizados e os atributos contínuos são discretizados; para a discretizacão dos atributos contínuos são utilizados dois tipos de algoritmos: não sensíveis à classe ou orientados por classes. Os dados são também normalizados. Na redução em colunas, as variáveis de Entrada não correlacionadas são combinadas e as variáveis correlacionadas são eliminadas. É feita uma análise sensitiva e uma análise dos componentes principais. É utilizada a teoria dos Rough Sets. Também pode ser feita uma aproximação empacotadora ou filtro. 17

18 Converte dados categóricos para valores numéricos e conversão de unidades. Dois termos interessantes aparecem nesta fase: sobre-ajustamento e sub-ajustamento. Utiliza-se o termo sobre-ajustamento quando o modelo prevê os resultados baseados em particularidades dos dados usados no seu treino. Existe subajustamento quando o modelo falha na procura de relações de interesse nos dados, ou disponibiliza relações muito genéricas Fase de Transformação Consiste no tratamento de dados em falta, tratamento de exemplos anormais (dados inconsistentes ou valores isolados), na eliminação de dados em mau estado Fase de Data Mining Envolve a adaptação de modelos, ou extracção de relações a partir dos dados, sem os passos adicionais que fazem parte de todo o processo de Descoberta de Conhecimento Objectivos de Data Mining Quando se implementam as técnicas de Data Mining, procura-se extrair informações para atingir determinados objectivos. São vários os tipos de informação que podemos obter com as técnicas de Data Mining. Isto não quer dizer que só podemos obtê-las através das técnicas de Data Mining, mas com elas conseguimos atingir maior agilidade e abrangência na análise destes. Dentre estes tipos podemos ter: Classificação É a função de aprendizagem que divide (ou classifica) os dados de acordo com um número específico de características. 18

19 As técnicas mais usadas para isso são as Árvores e Regras de Decisão, Redes Neuronais e Raciocínio Baseado em Casos. A classificação pode ajudar a encontrar perfis e características dos clientes. Com isto providencia-se um modelo, utilizado para prever suas acções e desejos. Também pode ajudar a determinar os tipos de promoções que são mais eficientes, para manter determinados tipos de clientes, procurando direccionar melhor os gastos necessários para mantê-los. Clustering Tem por objectivo identificar um conjunto finito de classes ou agrupamentos nos dados. Os conjuntos obtidos podem ser mutuamente exclusivos, hierárquicos ou concorrentes. Os resultados desta operação podem ser usados para sumariar o conteúdo de uma base de dados ou como preparação de dados para outros métodos. As técnicas mais usadas são as Técnicas Estatísticas Algoritmo K-Means e Redes Neuronais. Esta técnica pode ser aplicada a diversos problemas, como detectar defeitos no fabrico de produtos ou encontrar grupos de afinidades para cartões de bancos. Análise de Associações Tem por objectivo gerar todas as associações entre itens de transações que impliquem a presença de outros itens (ex.: determinar produtos vendidos conjuntamente ou relacionar diagnósticos médicos com valores de análises). Por exemplo, um estudo sobre os supermercados pode revelar que quando se compra chá, 55% das vezes também se compram bolachas, a não ser que haja uma promoção num determindao tipo de bolachas, o que implica que se compre mais esse tipo de bolachas e até com uma percentagem maior. 19

20 Análise Sequencial Tem por objectivo gerar todas as associações entre itens de transações ao longo do tempo (ex.: associações de produtos comprados ao longo do tempo: Clientes que compram um PC também compram uma impressora num espaço de tempo inferior a um mês ). Análise de Desvios Foca-se na descoberta de mudanças mais significativas nos dados a partir de valores previamente medidos ou valores normativos (ex.: detecção de desvios em stocks ou análise de desvios em despesas hospitalares). Regressão Consiste em utilizar algumas variáveis ou campos da base de dados para prever valores futuros de outras variáveis de interesse. Podemos então, por exemplo, antever se um cliente irá renovar uma assinatura, se ele irá comprar um determinado tipo de produto e, baseado em padrões, estimar o valor futuro de variáveis contínuas: número de vendas, percentagem de lucro, entre outros Técnicas de Data Mining As principais técnicas de Data Mining são as seguintes: Arvores e Regras de Decisão Dividem o conjunto de dados de modo a construir um modelo que classifica cada registo de acordo com o valor que apresenta no atributo objectivo. As árvores de decisão são uma evolução da técnica de aprendizagem automática. 20

21 Os valores que são encontrados com forte associação são os prognósticos chave ou factores explicativos, normalmente chamados de regras sobre o dados. Possuindo um grupo de dados, com numerosas colunas e linhas, uma ferramenta de árvore de decisão pede ao utilizador para escolher uma das colunas como objecto de saída, mostra o único e mais importante factor correlacionado com aquele objecto de saída como o primeiro ramo (nó) da árvore de decisão. Os outros factores são subsequentemente classificados como sub-nós dos nós anteriores. Isso significa que o utilizador pode rapidamente ver qual o factor que mais direcciona o seu objecto de saída, e o utilizador pode entender porque o factor foi escolhido. Por exemplo, a tabela 1 mostra os dados necessários para a construção da árvore de decisão e a figura 2 representa a árvore de decisão associada. Tempo Temperatura Humidade Vento Jogar Sol Quente Alta Fraco Não Sol Quente Alta Forte Não Coberto Quente Alta Fraco Sim Chuva Normal Alta Fraco Sim Chuva Frio Normal Fraco Não Chuva Frio Normal Forte Não Coberto Frio Normal Forte Sim Sol Normal Alta Fraco Não Sol Frio Normal Fraco Sim Chuva Normal Normal Fraco Sim Tabela 1: Informação para construção de Árvore de Decisão 21

22 Tempo Chuva Sol Vento Nublado Humidade Não Sim Elev. Normal Joga Não Joga Joga Não Joga Joga Figura 2: Árvore de Decisão Uma boa ferramenta baseada em Árvore de Decisão permite que o utilizador explore a árvore de acordo com a sua vontade, do mesmo modo que ele poderá encontrar grupos alvo que lhe interessem mais, e então ampliar o dado exacto associado ao seu grupo alvo. Os utilizadores podem, também, seleccionar os dados fundamentais em qualquer nó da árvore, movendo-o para dentro de uma ferramenta para análise posterior. As árvores de decisão são, quase sempre, usadas em conjunto com a tecnologia de Indução de Regras, mas são muito importantes, no sentido de apresentar os resultados da Indução de Regras num formato com prioridade. A regra mais importante é apresentada na árvore, como nó raiz, e as regras menos relevantes são mostradas nos nós subsequentes. As principais vantagens das árvores de decisão são que elas fazem decisões levando em consideração as regras que são mais relevantes, além de serem compreensíveis para a maioria das pessoas. Ao escolher e apresentar as regras em ordem de importância, as árvores de decisão permitem ao utilizador ver, imediatamente, quais os factores que mais influenciam os seus trabalhos. 22

23 Exemplos de ferramentas: Alice d'isoft, HyperParallel, Discovery, Business Objects BusinessMiner, DataMind, Angoss Knowledge Seeker. Indução de Regras A Indução de Regras, rege-se como uma lista, apresentada aos utilizadores através da detecção de tendências dentro de grupos de dados, ou de "regras" sobre o dado, com pouca interacção do utilizador; O analista de negócio neste caso tem que fazer a oredenação das regras por importância, determinando aquelas que são mais importantes no modelo de Data Mining para os assuntos de negócios envolvidos. Exemplos de ferramentas: IDIS, Knowledge Seeker; Redes Neuronais São constituídas por uma série de nós interligados agrupados em níveis. Os algoritmos mais usados em ferramentas de Descoberta de Conhecimento são: Propagação Retroactiva Classificação; Função Base Radial Classificação; Rede Mapas de Kohonen Clustering. 23

24 Figura 3: Rede Neuronal As redes neuronais oferecem o mais profundo poder de exploração dos dados. Porém é a técnica mais difícil de se entender. As apresentações internas, de como os padrões e os modelos foram achados nos dados, não são mostrados. Estas "caixas pretas" são inexplicáveis, o que faz com que esta técnica seja inaceitável para alguns analistas de negócios. Utilizam um modelo idêntico ao dos neurónios do cérebro humano e suas ligações (sinapses), como suporte para trabalharem com um conjunto de dados. Aprendem a partir do treino sobre esses dados, generalizando padrões, aplicando-os internamente para classificação e previsão de resultados. Cada neurónio tem geralmente um conjunto de pesos que determina como o neurónio avalia a combinação dos sinais de entrada. A entrada para um neurónio pode ser positiva ou negativa. A aprendizagem faz-se pela modificação dos pesos usados pelo neurónio de acordo com a classificação de erros que foi feita pela rede como um todo. As entradas são geralmente pesadas e normalizadas para produzir um procedimento suave. Durante a fase de treino, a rede estabelece os pesos que determinam o comportamento da camada intermédia. Um termo popular chamado propagação retroactiva é usado quando os pesos são ajustados baseados nas estimativas feitas pela rede - suposições incorrectas reduzem os limites para as conexões apropriadas. 24

25 É uma técnica excelente, muito vantajosa, mas que tem dois aspectos negativos. O primeiro é a complexidade dos modelos gerados. O segundo é exigir que o formato dos dados seja imutável; para diferentes representações dos dados surgem resultados diferentes. Exemplos de ferramentas: SPSS Neural Connection, IBM Neural Network Utility, NeuralWare NeuralWorks Predict Análise de cesto de compras (Market Basket Analysis) Técnica de localização que permite através de um cesto de compras, inferir regras a partir de grupos de itens ou produtos que surgem nesta transacção. A análise combinatória dos produtos juntamente com a localização geográfica do cliente, permite promover investimentos em marketing específicos para determinados produtos e regiões. Para vendas não anónimas é possível ainda promover investimentos em marketing para determinados perfis de clientes, focando os seus traços de compra, garantindo maior retorno no investimento. Algoritmos Genéticos Também conhecida como Análise Estatística de séries temporais. Utiliza o algoritmo natural, ou seja, os mecanismos de selecção que a natureza utiliza para a evolução das espécies. É indicada como complemento às técnicas de Raciocínio Baseado em Memória ou Redes Neuronais. Esta técnica consiste no cruzamento de registos e na mutação para seleccionar as possíveis soluções que sobreviverão para a próxima geração até convergir na solução perfeita, ou a solução mais próxima disso. Exemplos de ferramentas: S+, SAS, SPSS. 25

26 2.2.5 Fase de Interpretação e Avaliação Esta fase é associada à visualização dos dados. Realiza um filtragem do conhecimento fazendo o corte das regras e definindo o limite mínimo de confiança das regras geradas. Efectua uma avaliação verificando a precisão e taxa de erro dos resultados obtidos Fase de Integração de novo Conhecimento A integração de conhecimento num repositório central único pode envolver: a modificação do conhecimento já existente (revisão); a eliminação de conhecimento; a resolução de conflitos. 2.3 Bases das técnicas de Data Mining As técnicas de Data Mining estão baseadas na Estatística e Inteligência Artificial, conforme apresentado na figura : Figura 4: Bases das técnicas de Data Mining 26

27 2.3.1 A estatística É a base de todas as outras tecnologias criadas para Data Mining. Conceitos como distribuição normal, variância, análise de regressão, desvio simples, análise de conjuntos, análise de discriminantes e intervalos de confiança, são utilizados para realizar as pesquisas nos dados, bem como analisar e descobrir relacionamentos entre os mesmos Inteligência Artificial Técnicas de heurística são utilizadas para tentar recuperar informação que pode ser útil na descoberta de novas interacções entre os dados. Esta técnica exige mais processamento, conseguido com um bom custo/benefício, mas que resulta no maior aproveitamento nos SGBDs Sistemas Gestores de Bases de Dados e nos módulos de optimização de consulta Aprendizagem Automática (Machine Learning) É o estudo de algoritmos computacionais que melhoram automaticamente ao longo da experiência adquirida. Uma tarefa comum é aprender com o professor, também conhecida como aprendizagem assistida: o professor fornece os rótulos correctos, e a função do algoritmo de aprendizagem automática é construir um modelo que represente o conhecimento requerido de modo a rotular novos exemplos. Por exemplo, um número de parâmetros descrevem a informação detalhada sobre um empréstimo bem como o perfil do requerente desse empréstimo. O banco deve ter um largo número de exemplos descrevendo empréstimos antigos e a informação conhecida a situação destes empréstimos, se foram reembolsados com ou sem problemas. Esta realidade representa o conhecimento do professor. Nesta situação, um algoritmo de 27

No mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o

No mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o DATABASE MARKETING No mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o empresário obter sucesso em seu negócio é

Leia mais

A VISTA BACKSTAGE PRINCIPAIS OPÇÕES NO ECRÃ DE ACESSO

A VISTA BACKSTAGE PRINCIPAIS OPÇÕES NO ECRÃ DE ACESSO DOMINE A 110% ACCESS 2010 A VISTA BACKSTAGE Assim que é activado o Access, é visualizado o ecrã principal de acesso na nova vista Backstage. Após aceder ao Access 2010, no canto superior esquerdo do Friso,

Leia mais

Base de Dados para Administrações de Condomínios

Base de Dados para Administrações de Condomínios Base de Dados para Administrações de Condomínios José Pedro Gaiolas de Sousa Pinto: ei03069@fe.up.pt Marco António Sousa Nunes Fernandes Silva: ei03121@fe.up.pt Pedro Miguel Rosário Alves: alves.pedro@fe.up.pt

Leia mais

ISO 9000:2000 Sistemas de Gestão da Qualidade Fundamentos e Vocabulário. As Normas da família ISO 9000. As Normas da família ISO 9000

ISO 9000:2000 Sistemas de Gestão da Qualidade Fundamentos e Vocabulário. As Normas da família ISO 9000. As Normas da família ISO 9000 ISO 9000:2000 Sistemas de Gestão da Qualidade Fundamentos e Vocabulário Gestão da Qualidade 2005 1 As Normas da família ISO 9000 ISO 9000 descreve os fundamentos de sistemas de gestão da qualidade e especifica

Leia mais

Modelo Cascata ou Clássico

Modelo Cascata ou Clássico Modelo Cascata ou Clássico INTRODUÇÃO O modelo clássico ou cascata, que também é conhecido por abordagem top-down, foi proposto por Royce em 1970. Até meados da década de 1980 foi o único modelo com aceitação

Leia mais

TIC Unidade 2 Base de Dados. Informação é todo o conjunto de dados devidamente ordenados e organizados de forma a terem significado.

TIC Unidade 2 Base de Dados. Informação é todo o conjunto de dados devidamente ordenados e organizados de forma a terem significado. Conceitos relativos à Informação 1. Informação O que á a informação? Informação é todo o conjunto de dados devidamente ordenados e organizados de forma a terem significado. 2. Dados Em informática designa-se

Leia mais

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse Definição escopo do projeto (departamental, empresarial) Grau de redundância dos dados(ods, data staging) Tipo de usuário alvo (executivos, unidades) Definição do ambiente (relatórios e consultas préestruturadas

Leia mais

Tarefa Orientada 18 Tabelas dinâmicas

Tarefa Orientada 18 Tabelas dinâmicas Tarefa Orientada 18 Tabelas dinâmicas Análise de dados através de tabelas dinâmicas. Conceitos teóricos As Tabelas Dinâmicas são tabelas interactivas que resumem elevadas quantidades de dados, usando estrutura

Leia mais

Programação 2ºSemestre MEEC - 2010/2011. Programação 2º Semestre 2010/2011 Enunciado do projecto

Programação 2ºSemestre MEEC - 2010/2011. Programação 2º Semestre 2010/2011 Enunciado do projecto Mestrado Integrado em Engenharia Electrotécnica e de Computadores Programação 2º Semestre 2010/2011 Enunciado do projecto O projecto a desenvolver pelos alunos consistirá numa sistema de monitorização,

Leia mais

Escola Superior de Tecnologia de Setúbal. Projecto Final

Escola Superior de Tecnologia de Setúbal. Projecto Final Instituto Politécnico de Setúbal Escola Superior de Tecnologia de Setúbal Departamento de Sistemas e Informática Projecto Final Computação na Internet Ano Lectivo 2002/2003 Portal de Jogos Executado por:

Leia mais

Módulo 4. Construindo uma solução OLAP

Módulo 4. Construindo uma solução OLAP Módulo 4. Construindo uma solução OLAP Objetivos Diferenciar as diversas formas de armazenamento Compreender o que é e como definir a porcentagem de agregação Conhecer a possibilidade da utilização de

Leia mais

por João Gomes, Director Executivo do Instituto de Planeamento e Desenvolvimento do Turismo e Professor Associado da Universidade Fernando Pessoa

por João Gomes, Director Executivo do Instituto de Planeamento e Desenvolvimento do Turismo e Professor Associado da Universidade Fernando Pessoa COMO AUMENTAR AS RECEITAS DE UM NEGÓCIO: O CONCEITO DE GESTÃO DE RECEITAS (revenue management) (Publicado na Revista Hotéis de Portugal Maio/Junho 2004) por João Gomes, Director Executivo do Instituto

Leia mais

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br MINERAÇÃO DE DADOS APLICADA Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br Processo Weka uma Ferramenta Livre para Data Mining O que é Weka? Weka é um Software livre do tipo open source para

Leia mais

O que é a ciência de dados (data science). Discussão do conceito. Luís Borges Gouveia Universidade Fernando Pessoa Versão 1.

O que é a ciência de dados (data science). Discussão do conceito. Luís Borges Gouveia Universidade Fernando Pessoa Versão 1. O que é a ciência de dados (data science). Discussão do conceito Luís Borges Gouveia Universidade Fernando Pessoa Versão 1.3, Outubro, 2015 Nota prévia Esta apresentação tem por objetivo, proporcionar

Leia mais

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Planejamento Estratégico de TI. Prof.: Fernando Ascani Planejamento Estratégico de TI Prof.: Fernando Ascani Data Mining Os métodos tradicionais de Data Mining são: Classificação Associa ou classifica um item a uma ou várias classes categóricas pré-definidas.

Leia mais

TECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO. SISTEMAS DE GESTÃO DE BASE DE DADOS Microsoft Access TECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO

TECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO. SISTEMAS DE GESTÃO DE BASE DE DADOS Microsoft Access TECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO TECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO Microsoft Access TECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO CONCEITOS BÁSICOS 1 Necessidade das base de dados Permite guardar dados dos mais variados tipos; Permite

Leia mais

GereComSaber. Disciplina de Desenvolvimento de Sistemas de Software. Sistema de Gestão de Serviços em Condomínios

GereComSaber. Disciplina de Desenvolvimento de Sistemas de Software. Sistema de Gestão de Serviços em Condomínios Universidade do Minho Conselho de Cursos de Engenharia Licenciatura em Engenharia Informática 3ºAno Disciplina de Desenvolvimento de Sistemas de Software Ano Lectivo de 2009/2010 GereComSaber Sistema de

Leia mais

Data Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento

Data Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento Data Mining Prof Luiz Antonio do Nascimento Data Mining Ferramenta utilizada para análise de dados para gerar, automaticamente, uma hipótese sobre padrões e anomalias identificadas para poder prever um

Leia mais

Capítulo. Sistemas de apoio à decisão

Capítulo. Sistemas de apoio à decisão Capítulo 10 1 Sistemas de apoio à decisão 2 Objectivos de aprendizagem Identificar as alterações que estão a ter lugar na forma e função do apoio à decisão nas empresas de e-business. Identificar os papéis

Leia mais

Segurança e Higiene no Trabalho

Segurança e Higiene no Trabalho Guia Técnico Segurança e Higiene no Trabalho Volume III Análise de Riscos um Guia Técnico de Copyright, todos os direitos reservados. Este Guia Técnico não pode ser reproduzido ou distribuído sem a expressa

Leia mais

Diagrama de transição de Estados (DTE)

Diagrama de transição de Estados (DTE) Diagrama de transição de Estados (DTE) O DTE é uma ferramenta de modelação poderosa para descrever o comportamento do sistema dependente do tempo. A necessidade de uma ferramenta deste tipo surgiu das

Leia mais

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Planejamento Estratégico de TI. Prof.: Fernando Ascani Planejamento Estratégico de TI Prof.: Fernando Ascani BI Business Intelligence A inteligência Empresarial, ou Business Intelligence, é um termo do Gartner Group. O conceito surgiu na década de 80 e descreve

Leia mais

DEPARTAMENTO DE MATEMÁTICA E CIÊNCIAS EXPERIMENTAIS

DEPARTAMENTO DE MATEMÁTICA E CIÊNCIAS EXPERIMENTAIS DEPARTAMENTO DE MATEMÁTICA E CIÊNCIAS EXPERIMENTAIS Planificação Anual da Disciplina de TIC Módulos 1,2,3-10.ºD CURSO PROFISSIONAL DE TÉCNICO DE APOIO À GESTÃO DESPORTIVA Ano Letivo 2015-2016 Manual adotado:

Leia mais

Software PHC com MapPoint

Software PHC com MapPoint Software PHC com MapPoint A análise de informação geográfica A integração entre o Software PHC e o Microsoft Map Point permite a análise de informação geográfica, desde mapas a rotas, com base na informação

Leia mais

SAMUO APP: MANUAL DO ADMINISTRADOR

SAMUO APP: MANUAL DO ADMINISTRADOR as novas tecnologias ao serviço do desenvolvimento de projectos w w w. i m a d i p. c o m CABO VERDE: REALIZAÇÃO DE UMA ACÇÃO- PILOTO PARA A MELHORIA DA GESTÃO NUM GABINETE TÉCNICO SELECCIONADO OFITEC

Leia mais

SERVIÇO DE ANÁLISE DE REDES DE TELECOMUNICAÇÕES APLICABILIDADE PARA CALL-CENTERS VISÃO DA EMPRESA

SERVIÇO DE ANÁLISE DE REDES DE TELECOMUNICAÇÕES APLICABILIDADE PARA CALL-CENTERS VISÃO DA EMPRESA SERVIÇO DE ANÁLISE DE REDES DE TELECOMUNICAÇÕES APLICABILIDADE PARA CALL-CENTERS VISÃO DA EMPRESA Muitas organizações terceirizam o transporte das chamadas em seus call-centers, dependendo inteiramente

Leia mais

EXCEL. Listas como Bases de Dados

EXCEL. Listas como Bases de Dados Informática II Gestão Comercial e da Produção EXCEL Listas como Bases de Dados (TÓPICOS ABORDADOS NAS AULAS DE INFORMÁTICA II) Curso de Gestão Comercial e da Produção Ano Lectivo 2002/2003 Por: Cristina

Leia mais

TECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO - TIC 10º C. Planificação de. Curso Profissional de Técnico de Secretariado

TECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO - TIC 10º C. Planificação de. Curso Profissional de Técnico de Secretariado Escola Básica e Secundária de Velas Planificação de TECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO - TIC Curso Profissional de Técnico de Secretariado 10º C MÓDULO 1 FOLHA DE CÁLCULO Microsoft Excel Conteúdos

Leia mais

Aplicação Administrativa de Gestão

Aplicação Administrativa de Gestão Aplicação Administrativa de Gestão DIAGNIMAGEM, Sociedade Unipessoal, Lda Clínica de Exames e Diagnósticos de Imagiologia A Empresa é constituída por 4 departamentos: Gerência (1) Administrativo/ Contabilidade

Leia mais

Módulo 4: Gerenciamento de Dados

Módulo 4: Gerenciamento de Dados Módulo 4: Gerenciamento de Dados 1 1. CONCEITOS Os dados são um recurso organizacional decisivo que precisa ser administrado como outros importantes ativos das empresas. A maioria das organizações não

Leia mais

Oficina de Multimédia B. ESEQ 12º i 2009/2010

Oficina de Multimédia B. ESEQ 12º i 2009/2010 Oficina de Multimédia B ESEQ 12º i 2009/2010 Conceitos gerais Multimédia Hipertexto Hipermédia Texto Tipografia Vídeo Áudio Animação Interface Interacção Multimédia: É uma tecnologia digital de comunicação,

Leia mais

Referências internas são os artefatos usados para ajudar na elaboração do PT tais como:

Referências internas são os artefatos usados para ajudar na elaboração do PT tais como: Plano de Teste (resumo do documento) I Introdução Identificador do Plano de Teste Esse campo deve especificar um identificador único para reconhecimento do Plano de Teste. Pode ser inclusive um código

Leia mais

SISTEMA DE GESTÃO AMBIENTAL

SISTEMA DE GESTÃO AMBIENTAL Automatização do processo de Controlo Ambiental Auto-controlo ambiental Sendo a Indústria que detém fontes poluidoras (Cimenteiras, Produção de energia, Incineradoras, etc.), uma das mais intervenientes

Leia mais

Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados

Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Um Sistema Gerenciador de Banco de Dados (SGBD) é constituído por um conjunto de dados associados a um conjunto de programas para acesso a esses

Leia mais

1. Ambiente de Trabalho

1. Ambiente de Trabalho 1 Ambiente de Trabalho 1. Ambiente de Trabalho Ao nível do ambiente de trabalho, depois de o Excel 2007 ter introduzido novos componentes (e.g., Botão Office e Friso) e eliminado alguns dos componentes

Leia mais

DESENVOLVER E GERIR COMPETÊNCIAS EM CONTEXTO DE MUDANÇA (Publicado na Revista Hotéis de Portugal Julho/Agosto 2004)

DESENVOLVER E GERIR COMPETÊNCIAS EM CONTEXTO DE MUDANÇA (Publicado na Revista Hotéis de Portugal Julho/Agosto 2004) DESENVOLVER E GERIR COMPETÊNCIAS EM CONTEXTO DE MUDANÇA (Publicado na Revista Hotéis de Portugal Julho/Agosto 2004) por Mónica Montenegro, Coordenadora da área de Recursos Humanos do MBA em Hotelaria e

Leia mais

Manual de Utilizador. Disciplina de Projecto de Sistemas Industriais. Escola Superior de Tecnologia. Instituto Politécnico de Castelo Branco

Manual de Utilizador. Disciplina de Projecto de Sistemas Industriais. Escola Superior de Tecnologia. Instituto Politécnico de Castelo Branco Escola Superior de Tecnologia Instituto Politécnico de Castelo Branco Departamento de Informática Curso de Engenharia Informática Disciplina de Projecto de Sistemas Industriais Ano Lectivo de 2005/2006

Leia mais

DOCBASE. 1. Conceitos gerais. 2. Estrutura da pasta de associações. 3. A área de documentos reservados. 4. Associação de Imagens

DOCBASE. 1. Conceitos gerais. 2. Estrutura da pasta de associações. 3. A área de documentos reservados. 4. Associação de Imagens Documentação, Informática e Desenvolvimento 1 DOCBASE ASSOCIAÇÔES MULTIMÉDIA 1. Conceitos gerais 2. Estrutura da pasta de associações 3. A área de documentos reservados 4. Associação de Imagens 5. Procedimentos

Leia mais

. evolução do conceito. Inspecção 3. Controlo da qualidade 4. Controlo da Qualidade Aula 05. Gestão da qualidade:

. evolução do conceito. Inspecção 3. Controlo da qualidade 4. Controlo da Qualidade Aula 05. Gestão da qualidade: Evolução do conceito 2 Controlo da Qualidade Aula 05 Gestão da :. evolução do conceito. gestão pela total (tqm). introdução às normas iso 9000. norma iso 9000:2000 gestão pela total garantia da controlo

Leia mais

PHC dcontroldoc. O acesso a diversos tipos de ficheiros

PHC dcontroldoc. O acesso a diversos tipos de ficheiros PHC dcontroldoc O acesso a diversos tipos de ficheiros A possibilidade de consultar e introduzir documentos, imagens e outro tipo de ficheiros, a partir de um local com acesso à Internet. BUSINESS AT SPEED

Leia mais

Engenharia Informática

Engenharia Informática Escola Superior de Ciência e Tecnologia Engenharia Informática Análise de Sistemas Informáticos 3º ano Exame 12 de Julho de 2006 Docentes: José Correia e João Paulo Rodrigues Duração: 90 m; Tolerância:

Leia mais

Figura 5.1.Modelo não linear de um neurônio j da camada k+1. Fonte: HAYKIN, 2001

Figura 5.1.Modelo não linear de um neurônio j da camada k+1. Fonte: HAYKIN, 2001 47 5 Redes Neurais O trabalho em redes neurais artificiais, usualmente denominadas redes neurais ou RNA, tem sido motivado desde o começo pelo reconhecimento de que o cérebro humano processa informações

Leia mais

GereComSaber. Desenvolvimento de Sistemas de Software. Universidade do Minho Conselho de Cursos de Engenharia Licenciatura em Engenharia Informática

GereComSaber. Desenvolvimento de Sistemas de Software. Universidade do Minho Conselho de Cursos de Engenharia Licenciatura em Engenharia Informática Universidade do Minho Conselho de Cursos de Engenharia Licenciatura em Engenharia Informática Desenvolvimento de Sistemas de Software Ano Lectivo de 2009/10 GereComSaber Ana Duarte, André Guedes, Eduardo

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Tipos de aprendizagem 3. Paradigmas de aprendizagem 4. Modos de aprendizagem

Leia mais

GESTÃO de PROJECTOS. Gestor de Projectos Informáticos. Luís Manuel Borges Gouveia 1

GESTÃO de PROJECTOS. Gestor de Projectos Informáticos. Luís Manuel Borges Gouveia 1 GESTÃO de PROJECTOS Gestor de Projectos Informáticos Luís Manuel Borges Gouveia 1 Iniciar o projecto estabelecer objectivos definir alvos estabelecer a estratégia conceber a estrutura de base do trabalho

Leia mais

Arquitecturas de Software Licenciatura em Engenharia Informática e de Computadores

Arquitecturas de Software Licenciatura em Engenharia Informática e de Computadores UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR TÉCNICO Arquitecturas de Software Licenciatura em Engenharia Informática e de Computadores Primeiro Teste 21 de Outubro de 2006, 9:00H 10:30H Nome: Número:

Leia mais

DATA WAREHOUSE. Introdução

DATA WAREHOUSE. Introdução DATA WAREHOUSE Introdução O grande crescimento do ambiente de negócios, médias e grandes empresas armazenam também um alto volume de informações, onde que juntamente com a tecnologia da informação, a correta

Leia mais

ISO/IEC 12207: Gerência de Configuração

ISO/IEC 12207: Gerência de Configuração ISO/IEC 12207: Gerência de Configuração Durante o processo de desenvolvimento de um software, é produzida uma grande quantidade de itens de informação que podem ser alterados durante o processo Para que

Leia mais

Trabalhos Práticos. Programação II Curso: Engª Electrotécnica - Electrónica e Computadores

Trabalhos Práticos. Programação II Curso: Engª Electrotécnica - Electrónica e Computadores Trabalhos Práticos Programação II Curso: Engª Electrotécnica - Electrónica e Computadores 1. Objectivos 2. Calendarização 3. Normas 3.1 Relatório 3.2 Avaliação 4. Propostas Na disciplina de Programação

Leia mais

SISTEMAS DE INFORMAÇÃO PARA GESTÃO

SISTEMAS DE INFORMAÇÃO PARA GESTÃO 07-05-2013 1 SISTEMAS DE INFORMAÇÃO PARA GESTÃO Aula I Docente: Eng. Hercílio Duarte 07-05-2013 2 Objectivo Sistemas Modelos Dados Vs. Informação Introdução aos sistemas de Informação 07-05-2013 3 Introdução

Leia mais

Manual de Administração Intranet BNI

Manual de Administração Intranet BNI Manual de Administração Intranet BNI Fevereiro - 2010 Índice 1. Apresentação... 3 2. Conceitos... 5 3. Funcionamento base da intranet... 7 3.1. Autenticação...8 3.2. Entrada na intranet...8 3.3. O ecrã

Leia mais

ADM041 / EPR806 Sistemas de Informação

ADM041 / EPR806 Sistemas de Informação ADM041 / EPR806 Sistemas de Informação UNIFEI Universidade Federal de Itajubá Prof. Dr. Alexandre Ferreira de Pinho 1 Sistemas de Apoio à Decisão (SAD) Tipos de SAD Orientados por modelos: Criação de diferentes

Leia mais

Histórico da Revisão. Versão Descrição Autor. 1.0 Versão Inicial

Histórico da Revisão. Versão Descrição Autor. 1.0 Versão Inicial 1 of 14 27/01/2014 17:33 Sistema de Paginação de Esportes Universitários Documento de Arquitetura de Software Versão 1.0 Histórico da Revisão Data 30 de novembro de 1999 Versão Descrição Autor 1.0 Versão

Leia mais

Utilização do SOLVER do EXCEL

Utilização do SOLVER do EXCEL Utilização do SOLVER do EXCEL 1 Utilização do SOLVER do EXCEL José Fernando Oliveira DEEC FACULDADE DE ENGENHARIA DA UNIVERSIDADE DO PORTO MAIO 1998 Para ilustrar a utilização do Solver na resolução de

Leia mais

Prof. Msc. Paulo Muniz de Ávila

Prof. Msc. Paulo Muniz de Ávila Prof. Msc. Paulo Muniz de Ávila O que é Data Mining? Mineração de dados (descoberta de conhecimento em bases de dados): Extração de informação interessante (não-trivial, implícita, previamente desconhecida

Leia mais

Professor: Disciplina:

Professor: Disciplina: Professor: Curso: Esp. Marcos Morais de Sousa marcosmoraisdesousa@gmail.com Sistemas de informação Disciplina: Introdução a SI Noções de sistemas de informação Turma: 01º semestre Prof. Esp. Marcos Morais

Leia mais

CAP. I ERROS EM CÁLCULO NUMÉRICO

CAP. I ERROS EM CÁLCULO NUMÉRICO CAP. I ERROS EM CÁLCULO NUMÉRICO 0. Introdução Por método numérico entende-se um método para calcular a solução de um problema realizando apenas uma sequência finita de operações aritméticas. A obtenção

Leia mais

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Planejamento Estratégico de TI. Prof.: Fernando Ascani Planejamento Estratégico de TI Prof.: Fernando Ascani Data Warehouse - Conceitos Hoje em dia uma organização precisa utilizar toda informação disponível para criar e manter vantagem competitiva. Sai na

Leia mais

4. Que tipos de padrões podem ser minerados. 5. Critérios de classificação de sistemas de Data Mining. 6. Tópicos importantes de estudo em Data Mining

4. Que tipos de padrões podem ser minerados. 5. Critérios de classificação de sistemas de Data Mining. 6. Tópicos importantes de estudo em Data Mining Curso de Data Mining - Aula 1 1. Como surgiu 2. O que é 3. Em que tipo de dados pode ser aplicado 4. Que tipos de padrões podem ser minerados 5. Critérios de classificação de sistemas de Data Mining 6.

Leia mais

Descoberta de Conhecimento em Bases de Dados. Classificação

Descoberta de Conhecimento em Bases de Dados. Classificação Universidade Técnica de Lisboa INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO Informática e Sistemas de Informação Aplicados em Economia Descoberta de Conhecimento em Bases de Dados. Classificação Descoberta

Leia mais

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados Universidade Federal de Pernambuco Graduação em Ciência da Computação Centro de Informática 2006.2 Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento

Leia mais

- A crescente necessidade de sistemas inteligentes e de aquisição de conhecimento levaram à necessidade de implementação de Data Warehouses.

- A crescente necessidade de sistemas inteligentes e de aquisição de conhecimento levaram à necessidade de implementação de Data Warehouses. - A crescente necessidade de sistemas inteligentes e de aquisição de conhecimento levaram à necessidade de implementação de. - O que é uma Data Warehouse? - Colecção de bases de dados orientadas por assunto

Leia mais

Prognos SMART OPTIMIZATION

Prognos SMART OPTIMIZATION Prognos SMART OPTIMIZATION A resposta aos seus desafios Menos estimativas e mais controlo na distribuição A ISA desenvolveu um novo software que permite o acesso a dados remotos. Através de informação

Leia mais

SERVIÇ OS DO PEDIDO ONLINE DA PROPRIEDADE INTELECTUAL

SERVIÇ OS DO PEDIDO ONLINE DA PROPRIEDADE INTELECTUAL SERVIÇ OS DO PEDIDO ONLINE DA PROPRIEDADE INTELECTUAL Manual de Utilização Direcção dos Serviços de Economia do Governo da RAEM Novembro de 2014 SERVIÇ OS DO PEDIDO ONLINE DA PROPRIEDADE INTELECTUAL Manual

Leia mais

Guia de Utilização. Acesso Universal

Guia de Utilização. Acesso Universal Guia de Utilização Índice PREÂMBULO...3 ACESSO À PLATAFORMA...3 ÁREA DE TRABALHO...4 APRESENTAR PROPOSTAS...9 RECEPÇÃO DE ADJUDICAÇÃO...18 PARAMETRIZAÇÃO DA EMPRESA...19 Acesso universal Proibida a reprodução.

Leia mais

A versão básica disponibiliza a informação criada no Microsoft Navision em unidades de informação

A versão básica disponibiliza a informação criada no Microsoft Navision em unidades de informação O Business Analytics for Microsoft Business Solutions Navision ajuda-o a ter maior controlo do seu negócio, tomar rapidamente melhores decisões e equipar os seus funcionários para que estes possam contribuir

Leia mais

Engenharia de Software Sistemas Distribuídos

Engenharia de Software Sistemas Distribuídos Engenharia de Software Sistemas Distribuídos 2 o Semestre de 2009/2010 FEARSe Requisitos para a 1 a entrega 18 de Março de 2010 1 Introdução O projecto conjunto das disciplinas de Engenharia de Software

Leia mais

PRIMAVERA RISK ANALYSIS

PRIMAVERA RISK ANALYSIS PRIMAVERA RISK ANALYSIS PRINCIPAIS RECURSOS Guia de análise de risco Verificação de programação Risco rápido em modelo Assistente de registro de riscos Registro de riscos Análise de riscos PRINCIPAIS BENEFÍCIOS

Leia mais

Ficha prática nº 7. SGBD Microsoft Access e SQL Server

Ficha prática nº 7. SGBD Microsoft Access e SQL Server Instituto Superior Politécnico de Viseu Escola Superior de Tecnologia Departamento de Informática Ficha prática nº 7 SGBD Microsoft Access e SQL Server Objectivo: Criação de uma aplicação em arquitectura

Leia mais

Prof. Júlio Cesar Nievola Data Mining PPGIa PUCPR

Prof. Júlio Cesar Nievola Data Mining PPGIa PUCPR Uma exploração preliminar dos dados para compreender melhor suas características. Motivações-chave da exploração de dados incluem Ajudar na seleção da técnica correta para pré-processamento ou análise

Leia mais

Semântica para Sharepoint. Busca semântica utilizando ontologias

Semântica para Sharepoint. Busca semântica utilizando ontologias Semântica para Sharepoint Busca semântica utilizando ontologias Índice 1 Introdução... 2 2 Arquitetura... 3 3 Componentes do Produto... 4 3.1 OntoBroker... 4 3.2 OntoStudio... 4 3.3 SemanticCore para SharePoint...

Leia mais

Banco de Dados - Senado

Banco de Dados - Senado Banco de Dados - Senado Exercícios OLAP - CESPE Material preparado: Prof. Marcio Vitorino OLAP Material preparado: Prof. Marcio Vitorino Soluções MOLAP promovem maior independência de fornecedores de SGBDs

Leia mais

FATEC Cruzeiro José da Silva. Ferramenta CRM como estratégia de negócios

FATEC Cruzeiro José da Silva. Ferramenta CRM como estratégia de negócios FATEC Cruzeiro José da Silva Ferramenta CRM como estratégia de negócios Cruzeiro SP 2008 FATEC Cruzeiro José da Silva Ferramenta CRM como estratégia de negócios Projeto de trabalho de formatura como requisito

Leia mais

Perguntas. Que todo usuário deveria fazer antes de comprar um software CAD de baixo custo. Por Robert Green, proprietário da Robert Green Consulting

Perguntas. Que todo usuário deveria fazer antes de comprar um software CAD de baixo custo. Por Robert Green, proprietário da Robert Green Consulting Perguntas Que todo usuário deveria fazer antes de comprar um software CAD de baixo custo Por Robert Green, proprietário da Robert Green Consulting 5 perguntas que todo usuário deveria fazer antes de comprar

Leia mais

A Gestão, os Sistemas de Informação e a Informação nas Organizações

A Gestão, os Sistemas de Informação e a Informação nas Organizações Introdução: Os Sistemas de Informação (SI) enquanto assunto de gestão têm cerca de 30 anos de idade e a sua evolução ao longo destes últimos anos tem sido tão dramática como irregular. A importância dos

Leia mais

Sistema de Certificação de Competências TIC

Sistema de Certificação de Competências TIC Sistema de Certificação de Competências TIC Portal das Escolas Manual de Utilizador INDICE 1 Introdução... 5 1.1 Sistema de formação e certificação de competências TIC...6 1.1.1 Processo de certificação

Leia mais

Controlo da Qualidade Aula 05

Controlo da Qualidade Aula 05 Controlo da Qualidade Aula 05 Gestão da qualidade:. evolução do conceito. gestão pela qualidade total (tqm). introdução às normas iso 9000. norma iso 9001:2000 Evolução do conceito 2 gestão pela qualidade

Leia mais

DEMONSTRAÇÕES FINANCEIRAS COMBINADAS

DEMONSTRAÇÕES FINANCEIRAS COMBINADAS 24 DEMONSTRAÇÕES FINANCEIRAS COMBINADAS Os mercados de capitais na Europa e no mundo exigem informações financeiras significativas, confiáveis, relevantes e comparáveis sobre os emitentes de valores mobiliários.

Leia mais

Conceito. As empresas como ecossistemas de relações dinâmicas

Conceito. As empresas como ecossistemas de relações dinâmicas Conceito As empresas como ecossistemas de relações dinâmicas PÁG 02 Actualmente, face à crescente necessidade de integração dos processos de negócio, as empresas enfrentam o desafio de inovar e expandir

Leia mais

5 Conclusões e Recomendações

5 Conclusões e Recomendações 5 Conclusões e Recomendações 5.1 Conclusões O objetivo deste estudo foi utilizar a base de dados de clientes de uma empresa para desenvolver um modelo de regressão logística que determine o risco de cancelamento

Leia mais

Módulo 15 Resumo. Módulo I Cultura da Informação

Módulo 15 Resumo. Módulo I Cultura da Informação Módulo 15 Resumo Neste módulo vamos dar uma explanação geral sobre os pontos que foram trabalhados ao longo desta disciplina. Os pontos abordados nesta disciplina foram: Fundamentos teóricos de sistemas

Leia mais

O AMBIENTE DE TRABALHO DO WINDOWS

O AMBIENTE DE TRABALHO DO WINDOWS O AMBIENTE DE TRABALHO DO WINDOWS O Windows funciona como um Sistema Operativo, responsável pelo arranque do computador. Um computador que tenha o Windows instalado, quando arranca, entra directamente

Leia mais

WebSphere_Integration_Developer_D_Jan06 Script

WebSphere_Integration_Developer_D_Jan06 Script WebSphere_Integration_Developer_D_Jan06 Script 1a Nesta demonstração, Will Dunlop, um programador de integração da JK, utiliza o IBM, [ IBM], ou WID para construir um novo serviço orientado para os processos

Leia mais

MANUAL DO UTILIZADOR

MANUAL DO UTILIZADOR MANUAL DO UTILIZADOR Versão 1.6 PÁGINA DE PESQUISA A página principal do PacWeb permite a realização de um número muito variado de pesquisas, simples, ou pelo contrário extremamente complexas, dependendo

Leia mais

Faculdade de Ciências da Universidade de Lisboa CURSO DE GPS. Módulo x. (Aula Prática) Reliance - Ashtech. Suas Aplicações Em SIG.

Faculdade de Ciências da Universidade de Lisboa CURSO DE GPS. Módulo x. (Aula Prática) Reliance - Ashtech. Suas Aplicações Em SIG. Faculdade de Ciências da Universidade de Lisboa CURSO DE GPS Módulo x (Aula Prática) Reliance - Ashtech e Suas Aplicações Em SIG (Carlos Antunes) INTODUÇÃO O Sistema Reliance baseia-se na utilização do

Leia mais

Manual de Configuração

Manual de Configuração Manual de Configuração Índice Criar conta de Administrador... 3 Criar Negócio... 5 Back office... 7 Criar Locais... 11 Criar Menu... 13 Itens complexos... 18 One Click... 19 Painel de Pedidos... 20 QR

Leia mais

Tarefa Orientada 2 Criar uma base de dados

Tarefa Orientada 2 Criar uma base de dados Tarefa Orientada 2 Criar uma base de dados Objectivos: Criar uma base de dados vazia. O Sistema de Gestão de Bases de Dados MS Access Criar uma base dados vazia O Access é um Sistema de Gestão de Bases

Leia mais

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO EPE0147 UTILIZAÇÃO DA MINERAÇÃO DE DADOS EM UMA AVALIAÇÃO INSTITUCIONAL

Leia mais

PLANIFICAÇÃO MODULAR ANO LECTIVO 2015 / 2016

PLANIFICAÇÃO MODULAR ANO LECTIVO 2015 / 2016 PLANIFICAÇÃO MODULAR ANO LECTIVO 2015 / 2016 CURSO/CICLO DE FORMAÇÃO Técnico de Eletrotecnia e Técnico de Gestão de Equipamentos Informáticos / 2015/2018 DISCIPLINA: Tecnologias da Informação e Comunicação

Leia mais

04/08/2012 MODELAGEM DE DADOS. PROF. RAFAEL DIAS RIBEIRO, M.Sc. @ribeirord MODELAGEM DE DADOS. Aula 2. Prof. Rafael Dias Ribeiro. M.Sc.

04/08/2012 MODELAGEM DE DADOS. PROF. RAFAEL DIAS RIBEIRO, M.Sc. @ribeirord MODELAGEM DE DADOS. Aula 2. Prof. Rafael Dias Ribeiro. M.Sc. MODELAGEM DE DADOS PROF. RAFAEL DIAS RIBEIRO, M.Sc. @ribeirord MODELAGEM DE DADOS Aula 2 Prof. Rafael Dias Ribeiro. M.Sc. @ribeirord 1 Objetivos: Revisão sobre Banco de Dados e SGBDs Aprender as principais

Leia mais

PHC Serviços CS. A gestão de processos de prestação de serviços

PHC Serviços CS. A gestão de processos de prestação de serviços PHC Serviços CS A gestão de processos de prestação de serviços A solução que permite controlar diferentes áreas de uma empresa: reclamações e respectivo tratamento; controlo de processos e respectivos

Leia mais

XI Mestrado em Gestão do Desporto

XI Mestrado em Gestão do Desporto 2 7 Recursos Humanos XI Mestrado em Gestão do Desporto Gestão das Organizações Desportivas Módulo de Gestão de Recursos Rui Claudino FEVEREIRO, 28 2 8 INDÍCE DOCUMENTO ORIENTADOR Âmbito Objectivos Organização

Leia mais

ORGANIZAÇÃO DO TRABALHO

ORGANIZAÇÃO DO TRABALHO Organização, Processo e Estruturas 1 Organização Processo de estabelecer relações entre as pessoas e os recursos disponíveis tendo em vista os objectivos que a empresa como um todo se propõe atingir. 2

Leia mais

3. Os stocks dos produtos em curso de fabricação, isto é, os stocks entre as diferentes fases do processo produtivo (entre postos de trabalho).

3. Os stocks dos produtos em curso de fabricação, isto é, os stocks entre as diferentes fases do processo produtivo (entre postos de trabalho). GESTÃO DE STOCKS STOCKS Almofada do planeamento e programação FORNECEDOR FABRICO CLIENTE stock MP stock TC stock PA Objectivos da criação de stocks 1. Aumentar a segurança, criando defesas contra as variações

Leia mais

Interatividade aliada a Análise de Negócios

Interatividade aliada a Análise de Negócios Interatividade aliada a Análise de Negócios Na era digital, a quase totalidade das organizações necessita da análise de seus negócios de forma ágil e segura - relatórios interativos, análise de gráficos,

Leia mais

CASO DE ESTUDO SOBRE SIG

CASO DE ESTUDO SOBRE SIG Laboratório Regional de Engenharia Civil Agência Regional da Energia e Ambiente da Região Autónoma da Madeira Câmara Municipal do Funchal Sistema Integrado para a Implementação de Sustentabilidade CASO

Leia mais

Sinopse das Unidades Curriculares Mestrado em Marketing e Comunicação. 1.º Ano / 1.º Semestre

Sinopse das Unidades Curriculares Mestrado em Marketing e Comunicação. 1.º Ano / 1.º Semestre Sinopse das Unidades Curriculares Mestrado em Marketing e Comunicação 1.º Ano / 1.º Semestre Marketing Estratégico Formar um quadro conceptual abrangente no domínio do marketing. Compreender o conceito

Leia mais