Padronização de Processos: BI e KDD

Documentos relacionados
XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO

DATA WAREHOUSE. Introdução

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos

Adriano Maranhão BUSINESS INTELLIGENCE (BI),

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka

Módulo 4: Gerenciamento de Dados

Planejamento Estratégico de TI. Prof.: Fernando Ascani

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO

Material de Apoio. Sistema de Informação Gerencial (SIG)

Administração de CPD Chief Information Office

Professor: Disciplina:

Apresentação, xix Prefácio à 8a edição, xxi Prefácio à 1a edição, xxiii. Parte I - Empresa e Sistemas, 1

Interatividade aliada a Análise de Negócios

GESTÃO DAS INFORMAÇÕES DAS ORGANIZAÇÕES MÓDULO 11

Laudon & Laudon Essentials of MIS, 5th Edition. Pg. 1.1

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados

INSTRUÇÃO DE TRABALHO PARA INFORMAÇÕES GERENCIAIS

A Grande Importância da Mineração de Dados nas Organizações

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS


Desenvolvimento de um Sistema de Apoio à Decisão. Thiago Rafael Zimmermann. Prof. Dr. Oscar Dalfovo

A GESTÃO DO CONHECIMENTO EM PROJETOS COMPLEXOS. Prof. Esp. Cesar Augusto Pereira Peixoto

TERMO DE REFERÊNCIA Nº 4031 PARA CONTRATAÇÃO DE PESSOA FÍSICA PROCESSO DE SELEÇÃO - EDITAL Nº

Nome: Login: CA: Cidade: UF CARTÃO RESPOSTA QUESTÃO RESPOSTA QUESTÃO RESPOSTA

Universidade de Brasília. Faculdade de Ciência da Informação. Prof a Lillian Alvares

FACULDADE DE ADMINISTRAÇÃO - UNIVERSITAS

PROJETO DE REDES

A importância da. nas Organizações de Saúde

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Cadeira de Tecnologias de Informação. Conceitos fundamentais de sistemas e tecnologias de informação e de gestão do conhecimento.

04/08/2012 MODELAGEM DE DADOS. PROF. RAFAEL DIAS RIBEIRO, MODELAGEM DE DADOS. Aula 1. Prof. Rafael Dias Ribeiro. M.Sc.

Nome: Login: CA: Cidade: UF CARTÃO RESPOSTA QUESTÃO RESPOSTA QUESTÃO RESPOSTA

11 de maio de Análise do uso dos Resultados _ Proposta Técnica

DATA WAREHOUSE NO APOIO À TOMADA DE DECISÕES

PLANO DE ENSINO PRÉ-REQUISITOS: ENS

Inteligência Empresarial. BI Business Intelligence. Business Intelligence 22/2/2011. Prof. Luiz A. Nascimento

Existem três categorias básicas de processos empresariais:

Sistemas de Informação Gerenciais (SIG)

Extração de Conhecimento & Mineração de Dados

COMPARAÇÃO DOS MÉTODOS DE SEGMENTAÇÃO DE IMAGENS OTSU, KMEANS E CRESCIMENTO DE REGIÕES NA SEGMENTAÇÃO DE PLACAS AUTOMOTIVAS

Sistemas de Informação Empresarial

Desenvolvendo uma Arquitetura de Componentes Orientada a Serviço SCA

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan

TERMO DE REFERÊNCIA Nº 4030 PARA CONTRATAÇÃO DE PESSOA FÍSICA PROCESSO DE SELEÇÃO - EDITAL Nº

Tema: Big Data, Analytics...a Tecnologia a Favor do RH Palestrante: Alberto Roitman

ADM041 / EPR806 Sistemas de Informação

Prova de Conhecimento para Consultores de Implementação MPS.BR INSTRUÇÕES

BancoEstado ganha eficiência de dados e mais rapidez no desenvolvimento de sistemas com CA ERwin

F I C H A D A D I S C I P L I N A

SISGAP - Sistema Gerenciador de Avaliações Psicopedagógicas

Política de Logística de Suprimento

No mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o

SAD. Paulo Silva, Rodolfo Ribeiro, Vinicius Tavares

FURB - Universidade Regional de Blumenau TCC - Trabalho de Conclusão de Curso Acadêmico: Fernando Antonio de Lima Orientador: Oscar Dalfovo

ISO/IEC 12207: Gerência de Configuração

Aula 02: Conceitos Fundamentais

Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence

Programa do Curso de Pós-Graduação Lato Sensu MBA em Engenharia de Software Orientada a Serviços (SOA)

SISTEMA DE GESTÃO DE PESSOAS SEBRAE/TO UNIDADE: GESTÃO ESTRATÉGICA PROCESSO: TECNOLOGIA DA INFORMAÇÃO

POLÍTICA DE LOGÍSTICA DE SUPRIMENTO DO SISTEMA ELETROBRÁS. Sistema. Eletrobrás

AGILE ROLAP - UMA METODOLOGIA ÁGIL PARA IMPLEMENTAÇÃO DE AMBIENTES DE NEGÓCIOS BASEADO EM SERVIDORES OLAP.

Projeto 2.47 QUALIDADE DE SOFTWARE WEB

Gestão Estratégica de Marketing

Análise e Projeto de Sistemas. Engenharia de Software. Análise e Projeto de Sistemas. Contextualização. Perspectiva Histórica. A Evolução do Software

IMPLANTAÇÃO DE UM SISTEMA DE AVALIAÇÃO DE DESEMPENHO NA UFG

MBA Inteligência Competitiva Com ênfase em BI/CPM. Metadados

DESENVOLVIMENTO DE INTERFACE WEB MULTIUSUÁRIO PARA SISTEMA DE GERAÇÃO AUTOMÁTICA DE QUADROS DE HORÁRIOS ESCOLARES. Trabalho de Graduação

ATIVIDADES PRÁTICAS SUPERVISIONADAS

ü Curso - Bacharelado em Sistemas de Informação

Unidade II GESTÃO DO CONHECIMENTO. Profa. Leonor Cordeiro Brandão

Sistemas de Informação

Banco de Dados. Introdução. João Eduardo Ferreira Osvaldo Kotaro Takai. DCC-IME-USP

Data Warehouse. Diogo Matos da Silva 1. Universidade Federal de Ouro Preto, Ouro Preto, MG, Brasil. Banco de Dados II

MATERIAL DIDÁTICO: APLICAÇÕES EMPRESARIAIS SISTEMA DE APOIO À DECISÃO (SAD)

Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados

Profissionais de Alta Performance

Universidade de Brasília. Departamento de Ciência da Informação e Documentação. Prof a.:lillian Alvares

CRM. Customer Relationship Management

Sistema. Atividades. Sistema de informações. Tipos de sistemas de informação. Everson Santos Araujo

Forneça a próxima onda de inovações empresariais com o Open Network Environment

Gerenciamento de Incidentes

Sistema de Informação Gerencial SIG

Sociedade da Informação

Portaria Inep nº 190 de 12 de julho de 2011 Publicada no Diário Oficial de 13 de julho de 2011, Seção 1, pág. 13

Programa do Curso de Pós-Graduação Lato Sensu MBA em Business Intelligence (BI)

Carga Horária :144h (07/04 a 05/09/2014) 1. JUSTIFICATIVA: 2. OBJETIVO(S):

Banco de Dados I. Apresentação (mini-currículo) Conceitos. Disciplina Banco de Dados. Cont... Cont... Edson Thizon

OBSERVATÓRIO DE GESTÃO DA INFORMAÇÃO. Palavras-chave: Gestão da Informação. Gestão do conhecimento. OGI. Google alertas. Biblioteconomia.

A IMPORTÂNCIA DO SISTEMA DE INFORMAÇÃO GERENCIAL PARA AS EMPRESAS

UNIVERSIDADE FEDERAL RURAL DE PERNAMBUCO PRÓ-REITORIA DE ENSINO DE GRADUAÇÃO

Plano de Trabalho Docente Ensino Técnico

Alta performance: a base para os nossos clientes, a base para o seu futuro.

Análise e Projeto Orientados a Objetos Aula IV Requisitos. Prof.: Bruno E. G. Gomes IFRN

ANALISE DE SISTEMAS. Gabriela Trevisan

UNIVERSIDADE CATÓLICA PORTUGUESA Centro Regional das Beiras Pólo de Viseu Instituto Universitário de Desenvolvimento e Promoção Social

2. A EMPEC 3. UPDATE. 4. Disposições Gerais

Transcrição:

47 Padronização de Processos: BI e KDD Nara Martini Bigolin Departamento da Tecnologia da Informação -Universidade Federal de Santa Maria 98400-000 Frederico Westphalen RS Brazil nara.bigolin@ufsm.br Abstract: The Business Intelligence (BI) and the Knowledge Discovery in Databases(KDD) process are the extraction of interest patterns and features, which are not explicitly stored in databases. Such discovery may play an important role to understanding data, capturing intrinsic relationships between the information. This motivates the study and development of mechanisms to automates knowledge discovery for automatic knowledge acquisition. In this context this work presents a knowledge automatic acquisition cycle,integrating these two processes. Key-Words: Business Intelligence, Knowledge Management, Knowledge Discovery in Databases Resumo: Inteligência Empresarial e Descoberta de Conhecimento em Banco de Dados são os nomes dados a uma vasta categoria de programas aplicativos e tecnologias usadas para extrair, armazenar, analisar e transformar grandes volumes de dados, produzindo conhecimento capaz de auxiliar a empresa a tomar as melhores decisões nos negócios. Isso motivou o estudo e a aplicação de uma técnica de extração de conhecimento para aquisição automática de conhecimento. Nesse contexto, este trabalho propõe um ciclo de aquisição automática de conhecimento, integrando estes dois processos. Palavras-chave: Inteligência Empresarial, Gestão de Conhecimento, Descoberta de Conhecimento. 1. Introdução Tanto a inteligência empresarial (Davenport, 1998; Kimball 2010) quanto o processo de Descoberta de Conhecimento em Banco de Dados (DCBD) (Fayyad, 1996, Herbert 1998) utilizam técnicas de extração de conhecimento para obter conhecimento implícito. O DCBD é um conceito utilizado para denominar a exploração de informações implícitas em grandes volumes de dados. Essa tecnologia surgiu pela necessidade e pela dificuldade de explorar grandes bancos de dados de empresas. A inteligência empresarial é o conhecimento e a previsão dos ambientes interno e externo à empresa, orientando as ações gerenciais, tendo em vista a obtenção de vantagens competitivas (Choo, 1998). Neste contexto, dois enfoques diferentes, porém complementares, foram desenvolvidos, na tentativa de solucionar esses problemas: um, pela comunidade de Banco de Dados e outro, pela comunidade de Inteligência Artificial. A comunidade de Banco de Dados desenvolveu Sistema de Gerenciamento de Banco de Dados (SGBD), que tem por objetivo oferecer ferramentas que possibilitam o armazenamento e a manipulação de grande quantidade de informações estruturada e um

48 acesso rápido a elas. A maior preocupação no desenvolvimento deste tipo de sistema é o aspecto de modelagem dos dados, as linguagens de consulta e a eficiência na recuperação da informação. A comunidade de Inteligência Artificial interessou-se pela mineração de dados (extração de informações implícitas a partir de pequenas quantidades de dados) e a aprendizagem a partir de um pequeno conjunto de informações. A combinação dessas duas abordagens originou a área de Descoberta de Conhecimento em Banco de Dados. As técnicas tradicionais de aprendizagem (em inglês Machine Learning) descobrem conhecimentos implícitos a partir de dados extraídos do mundo real, enquanto as técnicas de mineração utilizam dados extraídos de bancos de dados. No primeiro caso, os dados de entrada para a mineração são representados em uma estrutura simples, e as informações relevantes são definidas pelo especialista. Já no segundo caso, além da estrutura e os tipos de dados serem complexos, o volume das informações é muito grande e, parte deste conjunto, pode ser irrelevante. Assim, é necessário efetuar dois tratamentos: um, para encontrar um subconjunto de informações apropriado (limpeza) e outro para adaptar essas informações em uma estrutura (transformação) aceitável pelas ferramentas de mineração de dados. A seleção das informações relevantes é tão importante quanto o reconhecimento de padrões, pois sem os dados apropriados, dificilmente algum conhecimento útil será extraído do banco de dados. Para selecionar a amostra adequada é fundamental que haja um entendimento do domínio da aplicação e um prévio conhecimento dos dados relevantes, para que se possa estabelecer as metas do processo de descoberta de conhecimento implícito do ponto de vista do usuário. O segundo tratamento consiste em simplificar a estrutura complexa dos dados para um formato reconhecível pelas técnicas de mineração de dados. Neste contexto, este artigo propõe um ciclo para aquisição automática de conhecimento baseado no processo de descoberta de conhecimento em banco de dados e no ciclo de inteligência empresarial. O restante do artigo está organizado da seguinte forma: na próxima seção são descritos o processo de descoberta de conhecimento e o ciclo de inteligência empresarial. Na terceira seção, a proposta do ciclo de aquisição automática de conhecimento é apresentada. Finalmente, as considerações finais são discutidas. 2. Processo de Descoberta de Conhecimento e Ciclo de Inteligência Empresarial Nesta seção serão descritos os dois processos que aquisição de conhecimento, suas etapas e funcionamento. Inicialmente, apresentaremos o processo de descoberta de conhecimento e, após, o ciclo de inteligência empresarial.

49 Figura 1. Processo de Descoberta de Conhecimento O processo de DCBD (Fig. 1) (Fayyad, 1996) e o ciclo de inteligência empresarial (Fig. 2) (Herring 1997) têm o mesmo objetivo, auxiliar na gestão de informação, através de extração de informações implícitas em grandes bancos de dados. O processo de descoberta de conhecimento envolve cinco etapas sucessivas: seleção, processamento e transformação dos dados; mineração de dados; interpretação/avaliação do conhecimento. Essas etapas podem ser generalizadas em três grandes fases: préprocessamento, mineração e pós-processamento de dados. O pré-processamento é uma das fases mais demoradas do processo de DCBD, pois consome cerca de 80 % dos esforços necessários para concluir todo o processo. Nessa fase são realizadas as tarefas de seleção, de processamento e de transformação dos dados. A seleção de dados consiste em selecionar os dados relevantes, para resolver um problema específico. Na etapa de processamento e tratamento de dados, os dados selecionados devem ser tratados e colocados em uma estrutura apropriada que será utilizada na etapa de mineração de dados. A mineração de dados consiste em extrair modelos a partir dos dados selecionados e processados através do uso de algoritmos de aprendizagem. Esses algoritmos permitem a classificação e a caracterização de um conjunto de dados. O resultado desta etapa é um modelo de conhecimento, que pode ser na forma de grafos, de árvores de decisão ou de regras do tipo se premissa então conclusão (Han, 2011). O pós-processamento é realizado através das etapas de avaliação e apresentação dos padrões, que são responsáveis pela identificação e análise dos padrões interessantes que representam informação implícita, bem como, a forma como esta informação será apresentada ao usuário. A interpretação/validação formata o conhecimento obtido e apresenta ao usuário ou reutiliza no sistema. Para Herbert (1998) inteligência empresarial é o conhecimento e previsão dos ambientes interno e externo à empresa, orientando as ações gerenciais, tendo em vista a obtenção de vantagens competitivas.

50 A inteligência empresarial vem como uma tecnologia inovadora na implementação de soluções nesta área, sendo fundamentada em benchmarking e em pesquisa acadêmica. Benchmarking é o processo contínuo de comparar resultados de uma empresa, através de indicadores que irão ajudar a empresa a implementar ações que melhorem suas performances. A inteligência empresarial segue a linha do data warehouse evolutivo. A inteligência empresarial segue três princípios básicos: modularidade, alta orientação ao negócio do cliente e trabalho cooperativo. O conceito de modularidade é utilizado em todos os níveis da inteligência empresarial. É a capacidade de dividir em módulos integráveis formadores do data warehouse evolutivo, possibilitando que sejam desenvolvidos em processos separados. A inteligência empresarial é orientada ao negócio do cliente, oferecendo aos tomadores de decisões uma visibilidade oportuna e consistente dos pontos - chaves dos seus negócios, alcançando todas as funções empresariais de sua empresa de forma integral, clara e objetiva. Para permitir uma melhor aplicação e concentração de recursos humanos e de tempo, o trabalho cooperativo vem com responsabilidade e requisitos bem definidos dos processos. O envolvimento do cliente é essencial no desenvolvimento de projetos de inteligência empresarial e a participação ativa do cliente sustenta a objetividade e a transparência da tecnologia de inteligência empresarial. A tecnologia da informação auxilia no sentido de possibilitar que a partir de dados, obtém-se informações, seguido de conhecimento para auxiliar nas ações a serem tomadas pela empresa. Figura 2. Fluxo de informações Este fluxo de informação é obtido através do uso do ciclo de inteligência empresarial. Este ciclo, adaptado por Herring 1997 é apresentado na abaixo.

51 Avaliação do Processo Análise e Validação Recursos, Competências e Métodos Disseminação e Utilização Coleta, Processamento e Armazenamento Decisores e Usuários da Informação Análise e Validação Figura 3. Ciclo da Inteligência Empresarial Base de Conhecimento e Redes de O ciclo de inteligência empresarial (Terra 2000) é composto de quatro fases: planejamento e coordenação; coleta, processamento e armazenamento; análise e validação da informação; disseminação e utilização. O planejamento e coordenação é a fase na qual são definidos: as necessidades de informatização da empresa, o banco de dados e as funcionalidades do sistema, assim como, os produtos que utilizarão a inteligência empresarial. A coleta, processamento e armazenamento da informação envolvem a busca de fontes de informações para o atendimento às necessidades de estratégia do negócio. Na análise e validação da informação as informações coletadas na etapa anterior, muitas delas sem uma aparente conexão entre si, são analisadas nesta etapa pelas redes de especialistas da área, com o objetivo de verificar a consistência das informações, estabelecer relações e avaliar o impacto destas para a organização. A disseminação e utilização da inteligência encerram o ciclo de inteligência empresarial, quando disponibilizam o resultado do processo para os usuários da inteligência. As mudanças ocasionadas pela tecnologia usada para gerar, disseminar, acessar e usar a informação demanda por habilidades e competências relacionadas ao acesso, uso e disseminação da informação (Paletta, 2014). Na seção seguinte, é proposto e descrito o ciclo de aquisição automática de conhecimento que foi baseado no processo de descoberta de conhecimento em banco de dados e no ciclo de inteligência empresarial. 3. Ciclo do processo de aquisição automática O ciclo foi baseado no processo de descoberta de conhecimento proposto por Fayyad, (1996) e pelo ciclo de Inteligência Empresarial adaptado por Herring (1997). O objetivo final é alimentar um banco de dados com conhecimento adquirido do próprio banco de dados. O ciclo tem oito fases: seleção dos dados, limpeza dos dados, tratamento dos dados, extração do conhecimento, avaliação do conhecimento, interpretação do conhecimento, modelagem do conhecimento e inclusão no banco de dados.

52 O processo inicia pela seleção dos dados, a qual é realizada pelo auxílio da linguagem de consulta do Sistema Gerenciador do Banco de Dados vinculado à aplicação. Nesta etapa são selecionados os dados relevantes para fazer a extração posterior do conhecimento; a limpeza dos dados consiste em retirar os valores inválidos, incorretos e irrelevantes para a extração de conhecimento; a transformação dos dados tem o objetivo de formatar os dados numa estrutura compatível com as ferramentas de extração de conhecimento, que aceitam somente formato simples do tipo atributo/valor e com valores discretizados; a extração é responsável pela mineração de dados e extração dos padrões a partir dos dados fornecidos; a avaliação de conhecimento tem o objetivo de analisar o que foi gerado, se o mesmo é válido e relevante; na interpretação, o auxílio de um especialista do domínio é requerido, para classificar o conhecimento obtido em comprovado, novo ou irrelevante; uma vez o conhecimento validado, a modelagem deste conhecimento é efetuada para a inserção dentro do banco de dados. Nesta etapa uma metodologia de modelagem deve ser utilizada e, finalmente, na fase de inserção, o banco de dados é alimentado com novo conhecimento descoberto. Figura 4. Ciclo da Aquisição Automática de Conhecimento No contexto de uma análise comparativa entre as três metodologias (o processo de descoberta de conhecimento em banco de dados, o ciclo de inteligência empresarial e o ciclo de aquisição automática de conhecimento), pode-se afirmar que a última permite, devido ao nível de simplicidade e detalhamento, que usuários não especialistas de informática possam extrair conhecimento a partir de bancos de dados. Abaixo, segue o quadro das fases do ciclo de AAC, do processo de DCBD e do ciclo de Inteligência Empresarial.

53 Tecnologias Etapas Ciclo de AAC Domínio da Aplicação Seleção, Limpeza e Transformação Extração e Avaliação do Conhecimento Modelagem e Inclusão no Banco de Dados Processo de DCBD Seleção e Processamento Tratamento Mineração Análise/ Interpretação Ciclo de Inteligência Empresarial Planejamento e coordenação Coleta, Processamento e Armazenamento Análise e Validação da Informação Disseminação e Utilização da Inteligência Tabela 1: Quadro comparative O processo de descoberta de conhecimento se mostra mais restrito, comparado aos dois ciclos. O ciclo de Inteligência Empresarial tem seu foco na organização dos processos de uma empresa, enquanto que o ciclo de aquisição automática de conhecimento se situa na exploração das informações utilizando as tecnologias de informações disponíveis. 4. Conclusão Neste trabalho foi proposto um ciclo de aquisição automática de conhecimento e validada com cinco estudos de caso em domínios bem distintos. Este ciclo possibilita uma melhoria na qualidade de prestação de serviços das empresas, independente de seu domínio de atuação. Comprovou-se também que em todos os estudos de caso obteve-se conhecimento novo, relevante e muito importante para a tomada de decisão. Outra conclusão importante é que a partir dos testes realizados, o ciclo de aquisição de conhecimento permitiu extrair informações ocultas e extremamente importantes para a tomada de decisões, que com a utilização de uma ferramenta convencional e experiência de especialista não seria possível de obter-se. A maior contribuição deste trabalho foi a proposta de um ciclo simples e capaz de ser usado em qualquer domínio de aplicação e por profissionais de qualquer área. Neste contexto, a aplicabilidade do ciclo de aquisição de conhecimento em quase todos os domínios de aplicação, torna esta tecnologia como a mais promissora do momento e com sucesso garantido para todas as empresas. Como trabalhos futuros, se pretende modelar, através da metodologia UML, todos os conhecimentos adquiridos e inseri-los em um banco de dados, construindo assim um banco de conhecimento. Todo o conhecimento adquirido e não armazenado pode ser perdido. Uma vez armazenado num banco de dados, pode-se utilizar como fonte de novas descobertas de conhecimento. Pretende-se também integrar as quatro etapas no planejamento estratégico de uma empresa.

54 Referências Bibliográficas Choo, C. W. The knowing organization: how organizations use information to construct meaning, create knowledge, and make decisions. Oxford University Press, 1998. Davenport T.H. and Prusak, L. Conhecimento Empresarial: como as organizações gerenciam o seu capital intelectual. 5 ed. Rio de Janeiro, Campus, 1998, Fayyad, U. et al.. Knowledge discovery and data mining: towards a unifying framework. In: Proceedings of the 2nd International Conference on Knowledge Discovery & Data Mining. Editors: Simoudis, E.; Han, J.; Fayyad, U. August 1996. Han J., Kamber M. and Pei J. Data Mining: Concepts and Techniques, 3 rd ed. The Morgan Kaufmann Series in Data Management Systems. Morgan Kaufmann Publishers, July 2011. Herbert, A. Edelstein. Introduction to Data Mining and Knowledge Discovery, 2º Edition, Two Crows Corporation, 1998. Herring, J. P. Producing CTI that meets management meeds and expectations SCIP Competitive Technology Intelligence Symposium. Boston 1997. Kimball R. Ross M.,Thornthwaite W. Mundy J. Becker B. The Kimball Group Reader: Relentlessly Practical Tools for Data Warehousing and Business Intelligence. 2010. Paletta, C.F. and Maldonado E. P. Inteligência Estratégica e Informação Perfil profissional na Era da WEB 3.0. Revista Inteligência Competitiva. São Paulo, v. 4, n. 2, p. 1-10, abr./jun. 2014. Terra. J C. Gestão do conhecimento: o grande desafio empresarial. Negócio Editora, 2000. São Paulo: