The knowledge discovery in databases with the technique of data mining and Help Desk support system as decision support in the organization



Documentos relacionados
DATA WAREHOUSE. Introdução


Fornecendo Inteligência, para todo o mundo, a mais de 20 anos.

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Planejamento Estratégico de TI. Prof.: Fernando Ascani

MATERIAL DIDÁTICO: APLICAÇÕES EMPRESARIAIS SISTEMA DE APOIO À DECISÃO (SAD)

GESTÃO DAS INFORMAÇÕES DAS ORGANIZAÇÕES MÓDULO 11

INSTRUÇÃO DE TRABALHO PARA INFORMAÇÕES GERENCIAIS

Sistemas de Informação I

Adriano Maranhão BUSINESS INTELLIGENCE (BI),

Teoria Geral de Sistemas. Késsia R. C. Marchi

Identificar as mudanças que acontecem na forma e no uso de apoio à decisão em empreendimentos de e-business. Identificar o papel e alternativas de

Gestão do Conhecimento A Chave para o Sucesso Empresarial. José Renato Sátiro Santiago Jr.

CRM. Customer Relationship Management

Módulo 4: Gerenciamento de Dados

Sistema. Atividades. Sistema de informações. Tipos de sistemas de informação. Everson Santos Araujo

Sistemas de Informação Gerenciais (SIG)

Existem três categorias básicas de processos empresariais:

No mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO

DATA WAREHOUSE NO APOIO À TOMADA DE DECISÕES

UNG CIC Tópicos Especiais de TI. Aula 13

Laudon & Laudon Essentials of MIS, 5th Edition. Pg. 1.1

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados

EMENTAS DAS DISCIPLINAS

CURSO DE GRADUAÇÃO PRESENCIAL SISTEMAS DE INFORMAÇÃO

Material de Apoio. Sistema de Informação Gerencial (SIG)

CAPÍTULO 1 - CONTABILIDADE E GESTÃO EMPRESARIAL A CONTROLADORIA

Módulo 15 Resumo. Módulo I Cultura da Informação

ASSUNTO DA APOSTILA: SISTEMAS DE INFORMAÇÃO E AS DECISÕES GERENCIAIS NA ERA DA INTERNET

SISTEMA DE GESTÃO DE PESSOAS SEBRAE/TO UNIDADE: GESTÃO ESTRATÉGICA PROCESSO: TECNOLOGIA DA INFORMAÇÃO

Como melhorar a tomada de decisão. slide 1

Professor: Disciplina:

Administração de CPD Chief Information Office

Análise e Projeto de Sistemas. Engenharia de Software. Análise e Projeto de Sistemas. Contextualização. Perspectiva Histórica. A Evolução do Software

Capítulo 13: Tecnologia da Informação. Prof.: Roberto Franciscatto

Interatividade aliada a Análise de Negócios

Cadeira de Tecnologias de Informação. Conceitos fundamentais de sistemas e tecnologias de informação e de gestão do conhecimento.

Construção de Modelos de Previsão de Risco de Crédito Utilizando Técnicas de Estatística Multivariada


UNIDADE 4. Introdução à Metodologia de Desenvolvimento de Sistemas

GERENCIAMENTO DO CONHECIMENTO NA EMPRESA DIGITAL

Figura 1 - Processo de transformação de dados em informação. Fonte: (STAIR e REYNOLDS, 2008, p. 6, adaptado).

FURB - Universidade Regional de Blumenau TCC - Trabalho de Conclusão de Curso Acadêmico: Fernando Antonio de Lima Orientador: Oscar Dalfovo

Thalita Moraes PPGI Novembro 2007

Corporativo. Transformar dados em informações claras e objetivas que. Star Soft.

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse

Inteligência Empresarial. BI Business Intelligence. Business Intelligence 22/2/2011. Prof. Luiz A. Nascimento

Projeto Disciplinar de Infra-Estrutura de Software SILC - SISTEMA DE LOCAÇÃO E CONTROLE

A Grande Importância da Mineração de Dados nas Organizações

CONTROLADORIA NO SUPORTE A GESTÃO EMPRESARIAL

Os Sistemas de Informação para as Operações das Empresas e o Comércio Eletrônico Simulado Verdadeiro ou Falso

PROCESSO DE DESENVOLVIMENTO DE SOFTWARE. Modelos de Processo de Desenvolvimento de Software

04/08/2012 MODELAGEM DE DADOS. PROF. RAFAEL DIAS RIBEIRO, MODELAGEM DE DADOS. Aula 1. Prof. Rafael Dias Ribeiro. M.Sc.

FACULDADE KENNEDY BACHARELADO EM SISTEMAS DE INFORMAÇÃO

OBSERVATÓRIO DE GESTÃO DA INFORMAÇÃO. Palavras-chave: Gestão da Informação. Gestão do conhecimento. OGI. Google alertas. Biblioteconomia.

CONSULTA AO MERCADO RFI REQUEST FOR INFORMATION CONSOLIDAÇÃO DE DÚVIDAS APRESENTADAS

Administração de Sistemas de Informação I

O que é a ciência de dados (data science). Discussão do conceito. Luís Borges Gouveia Universidade Fernando Pessoa Versão 1.

Tecnologia da Informação. Prof. Esp. Lucas Cruz

Solução Integrada para Gestão e Operação Empresarial - ERP

SERVIÇO DE ANÁLISE DE REDES DE TELECOMUNICAÇÕES APLICABILIDADE PARA CALL-CENTERS VISÃO DA EMPRESA

Classificação dos Sistemas de Informação

Universidade de Brasília. Faculdade de Ciência da Informação. Prof a Lillian Alvares

15/09/2015. Gestão e Governança de TI. Modelo de Governança em TI. A entrega de valor. A entrega de valor. A entrega de valor. A entrega de valor

Glossário Apresenta a definição dos termos, siglas e abreviações utilizadas no contexto do projeto Citsmart.

TRABALHOS TÉCNICOS Coordenação de Documentação e Informação INOVAÇÃO E GERENCIAMENTO DE PROCESSOS: UMA ANÁLISE BASEADA NA GESTÃO DO CONHECIMENTO

CENTRO UNIVERSITÁRIO ESTÁCIO RADIAL DE SÃO PAULO SÍNTESE DO PROJETO PEDAGÓGICO DE CURSO 1

SAM GERENCIAMENTO DE ATIVOS DE SOFTWARE

Módulo 07 Gestão de Conhecimento

Visão Geral dos Sistemas de Informação

GUIA DE CURSO. Tecnologia em Sistemas de Informação. Tecnologia em Desenvolvimento Web. Tecnologia em Análise e Desenvolvimento de Sistemas

Data Warehouse. Diogo Matos da Silva 1. Universidade Federal de Ouro Preto, Ouro Preto, MG, Brasil. Banco de Dados II

SISTEMAS DE INFORMAÇÃO, ORGANIZAÇÕES, ADMINISTRAÇÃO E ESTRATÉGIA

LISTA DE EXERCÍCIOS. Mede a capacidade de comunicação de computadores e dispositivos. Operam em diferentes plataformas de hardware

Análise Estruturada de Sistemas

Gerenciamento de Dados e Gestão do Conhecimento

PLANOS DE CONTINGÊNCIAS

Respostas da Lista de Exercícios do Módulo 1: Fundamentos dos SI. Resposta do Exercício 1

Requisitos de business intelligence para TI: O que todo gerente de TI deve saber sobre as necessidades reais de usuários comerciais para BI

Programa do Curso de Pós-Graduação Lato Sensu MBA em Engenharia de Software Orientada a Serviços (SOA)

Engenharia de Software III

SISTEMAS DE GESTÃO São Paulo, Janeiro de 2005

Universidade de Brasília Departamento de Ciência da Informação e Documentação Programa de Pós Graduação em Ciência da Informação Prof a.

UNIVERSIDADE FEDERAL DO PARANÁ UFPR Bacharelado em Ciência da Computação

Desenvolvimento de um software de gerenciamento de projetos para utilização na Web

Pós-Graduação em Gerenciamento de Projetos práticas do PMI

ALESSANDRO RODRIGO FRANCO FERNANDO MARTINS RAFAEL ALMEIDA DE OLIVEIRA

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO

GERENCIAMENTO DO CONHECIMENTO NA EMPRESA DIGITAL

TI Aplicada. Aula 02 Áreas e Profissionais de TI. Prof. MSc. Edilberto Silva prof.edilberto.silva@gmail.com

Universidade de Brasília Faculdade de Economia, Administração, Contabilidade e Ciência da Informação e Documentação Departamento de Ciência da

SGQ 22/10/2010. Sistema de Gestão da Qualidade. Gestão da Qualidade Qualquer atividade coordenada para dirigir e controlar uma organização para:

3. Processos, o que é isto? Encontramos vários conceitos de processos, conforme observarmos abaixo:

ADMINISTRAÇÃO DOS RECURSOS DE DADOS

E-business: Como as Empresas Usam os Sistemas de Informação

Transcrição:

O descobrimento do conhecimento em base de dados com a técnica da mineração de dados e o apoio do sistema Help Desk como suporte de decisões na organização Libório de Oliveira Júnior (UTFPR) libajunior@gmail.com Simone Nasser Matos (UTFPR) snasser@utfpr.edu.br Resumo: O grande volume de dados que são armazenados em bancos de dados nas organizações já não admite uma consulta rápida e simples com obtenção de respostas precisas e que auxiliam na tomada de decisões e nos negócios. Sistemas, técnicas e ferramentas tecnológicas são disponibilizadas para a gestão eficiente dos bancos de dados. Objetiva-se investigar aspectos do Knowledge Discovery in Database (KDD) como uma oferta no mercado da tecnologia, bem como da mineração de dados (Data mining) agregados para a obtenção do conhecimento na organização e o papel que pode ser atribuído ao Help Desk nesse processo. Os resultados confirmam o KDD como um recurso da Tecnologia da Informação (TI) que permite à organização ajustar-se as inovações da informática ao realizar etapas por meio de algumas técnicas. Dentre as técnicas, estuda-se o Data mining, que revela rapidamente a informação estratégica presente em grandes volumes de dados. Nessa parceria em busca do conhecimento, o sistema Help Desk pode atuar como facilitador de informações ao usuário. Palavras chave: Informação, Descoberta de conhecimento, Help Desk, Mineração de dados. The knowledge discovery in databases with the technique of data mining and Help Desk support system as decision support in the organization Abstract The large volume of data that is stored in databases in organizations no longer allows a quick and simple to obtain and accurate answers that help in decision making and business. Systems, techniques and technological tools are available for efficient management of databases. It aims to investigate aspects of Knowledge Discovery in Database (KDD) as a market supply of technology and data mining (Data Mining) to households acquire knowledge in the organization and the role that can be attributed Help Desk to this process. The results confirm the KDD as a use of Information Technology (IT) that allows the organization adjust to the innovations of information when making stages through

some techniques. Among the techniques, we study the data mining, which reveals This strategic information quickly in large volumes ata. In this partnership in pursuit of knowledge, the system may Help Desk act as a facilitator of information to the user. Key-words: Information, Knowledge discovery, Help Desk, Data Mining. 1 Introdução Diante do crescente volume de dados que são armazenados nos Centros de Processamento de Dados é preciso compreender que as simples consultas a banco de dados que permitiam a análise desses dados ficaram no passado. A realidade das organizações mostra a necessidade de manutenção do histórico de suas operações e de seus dados, aliado à complexidade das transações e a própria globalização das empresas, fundadas as suas ações nas exigências legais de registros, de modo a valer-se dos avanços tecnológicos no armazenamento de grandes volumes de dados tanto quanto da necessidade em dominar essa base de dados. A referência de Ferro e Lee (2001, p.57) é de que A análise manual se tornou impraticável e métodos eficientes para a análise dos dados auxiliados por computador se tornaram indispensáveis, bem como a extração das informações e padrões que existem nesses dados. A justificativa para essa apreensão dos autores aduz à lacuna que se constitui entre a geração de grandes volumes de dados e a captura de conhecimento criado em todas as áreas da atividade humana. Isto porque as informações são necessárias à promoção do conhecimento, seja sob a forma de criação ou de captura, em qualquer tipo ou tamanho de organização. As informações, portanto, têm um aspecto essencial no fato de se constituírem uma importante fonte do conhecimento, auxiliando a empresa no acesso às ações do passado, situações e condições atuais e o que pode ser idealizado para o futuro, exatamente por ser um item estratégico diferenciado (ARANTES, 1998). Registra-se que: O processo de captura representa a aquisição de conhecimentos, habilidades e experiências necessárias para criar e manter as competências essenciais e áreas de conhecimento selecionadas e mapeadas, possibilitando para que possam ser adequadamente utilizados, esses conhecimentos, habilidades e experiências devem ser formalizados, explicitados e codificados (PEREIRA, 2003, p.9-10). Há dificuldade na capacidade humana, manual, em gerir e analisar todos esses dados e informações disponíveis tornando os métodos de análise dos dados auxiliados por computador ferramenta indispensável, assim como a extração das informações e padrões que esses dados comportam. Uma das ofertas no mercado da TI é descrita como mineração de dados (Data mining), [...] inserida em um processo maior denominado descoberta de conhecimento em banco de dados, Knowledge Discovery in Database (KDD) (BRAGA, 2005, p.15). Conhecer a mineração de dados como ferramentas e a atuação do KDD como alternativa para trabalhar com um grande volume de dados é o propósito deste trabalho de pesquisa, objetivando apontar o processo de descoberta de conhecimento e as técnicas de mineração de dados que podem utilizar o sistema Help Desk como facilitador de informações ao usuário. Os métodos de pesquisa são exploratórios com abordagem bibliográfica em fontes de dados impressas e eletrônicas. 2 A revolução na informática Os bancos de dados de uma organização, que exigem atualização constante a fim de refletirem as novas transações de negócios e demais eventos, devem sofrer manutenção para garantir

precisão dos dados. Os avanços na informática e suas aplicações nas empresas têm formado diversos bancos de dados: citados como os bancos de dados operacionais, armazenam dados detalhados ao apoio dos processos e operações de e-business; há também os bancos de dados distribuídos, contemplando a atividade de organizações que [...] reproduzem e distribuem cópias ou partes de bancos de dados para servidores de rede em uma multiplicidade de locais. Tais bancos de dados distribuídos podem estar em intranets ou extranets, em outras redes da empresa e em servidores de rede na rede mundial de computadores, o WWW. E, o banco de dados externos, com aquisição de uma abundância de informações de bancos de dados internos e externos, mediante pagamento de uma taxa de serviços comerciais on-line disponível em muitas fontes na internet, mais especificamente na WWW (O BRIEN, 2004, p.141-2). O baixo custo da armazenagem eletrônica de informações vinculando-se à intenção de melhor compreender os diversos relacionamentos forneceram subsídios às organizações no desenvolvimento de sistemas formais de registro de eventos importantes em um banco de dados, este, tido como uma representação eletrônica da memória organizacional. Aceita entrada de informações automatizadas, como as informações rotineiras de relatórios financeiros e de mercado, e outras, como a lista de instrumentos motivacionais eficientes para os funcionários, por exemplo, com entrada por meio de um relatório específico, resultando em um armazém de dados internos (HAIR et al., 2003). O uso de computadores, inicialmente de grande porte e, a seguir, de computadores pessoais com o propósito de processar bancos de dados, complexos e com volume significativo de dados tem motivado o uso de métodos estatísticos multivariados que possibilitam rápido acesso aos recursos necessários na abordagem a problemas multivariados de diferente dimensão (HAIR et al., 2005). Independentemente de seu porte, a organização precisa de informações a fim de executar as operações as quais se dispõe, como as vendas, a produção, as compras e as finanças, bem como na elaboração de planos, projetos e avaliação de resultados. Empresas de menor porte obtêm as informações por meio de processo de comunicação direta entre as pessoas que executam operações cotidianamente; ao crescer, no entanto, surge a necessidade de estruturar sistemas para produzir as informações essenciais de forma adequada, surgindo o subsistema de informações, cujo objetivo é produzir as informações necessárias à execução e ao gerenciamento de cada operação e da organização em si (ARANTES, 1998). O computador, sem dúvida, é uma parte do subsistema de informações na organização, atuando num conjunto de funções e procedimentos essenciais à obtenção, processamento, armazenagem e transmissão de dados. Para ser assim, envolve pessoas especializadas em informática, que compreendem os analistas, os programadores e demais profissionais, e equipamento hardware -, procedimentos ou programas para tratamento dos dados, os softwares, e as instalações que integram o subsistema de tratamento de dados (ARANTES, 1998). Acessar as informações que se encontram disponíveis requer formalização de senhas ou passwords específicas a cada usuário, com a função de permitir ou não o acesso a determinado sistema. Havendo um Centro de Informações (CI) a garantia de controle e nível de acesso às informações tem suporte na Unidade de Tecnologia da Informação (UTI) e utiliza recursos tecnológicos e normas técnico-operacionais, os chamados Help-Desk, que atendem e treinam os clientes e usuários em diferentes atividades de informática a serviço (REZENDE, 2003).

2.1 O Knowledge Discovery in Database (KDD) Traduzido para o português, o Knowledge Discovery in Database significa Descoberta de conhecimento em base de dados (KDD), e é definido por Hair et al. (2005, p.534) como Extração de nova informação a partir de bases de dados por meio de uma variedade de processos de descoberta de conhecimento. Criado em 1995 o termo KDD prestou-se a designar o conjunto de processos, técnicas e abordagem formadores do contexto no qual a mineração de dados irá atuar, mediante aplicação do método científico moderno aos problemas contemporâneos do mercado. A ressalva a essa atuação, entretanto, deve ser observada com cuidado, porque o processo de descoberta suplanta hipóteses e contempla evidências e explicações que viabilizam a construção de um modelo, cujos resultados tendem a apresentar valor quando forem confirmados por fatos. Paralelo, a evidência e confirmação denotam um paradigma e, este, em mudança, carrega também hipóteses, evidências e modelos na mesma esteira, salienta Braga (2005). O processo KDD segue algumas etapas, indicadas por Corrêa (2007): a) pré-processamento dos dados; b) mineração de dados; c) pós-processamento. A primeira prepara os dados visando o seu processamento pelas ferramentas de mineração de dados na etapa seguinte do processo de KDD; dentre suas diversas definições, a mineração de dados destina-se à descoberta de dados, ou ainda, de revelar informação estratégica escondida em grandes massas de dados. Quanto ao pós-processamento, se caracteriza pela estruturação do conhecimento obtido através da mineração de dados em forma de relatórios, gráficos, diagramas ou demais formas que permitam acesso ao conhecimento adquirido. O armazém de dados favorece a aprendizagem organizacional, definida como A internalização de informações externas e internas que serão usadas nas tomadas de decisão, em decorrência do papel assumido em tão pouco tempo na seleção de estratégias administrativas visando melhor desempenho na organização (HAIR et al., 2003, p.41). Em razão disso, há um novo instrumento de aprendizagem organizacional disponível: a garimpagem de dados, que utiliza como ferramenta um algoritmo que analisa de modo automático relações potenciais entre eventos armazenados no banco de dados eletrônicos. Essa garimpagem de dados é entendida como a descoberta de conhecimento em bancos de dados, o denominado KDD, assunto desse item (HAIR et al., 2003). Braga (2005) sugere um modelo para geração de conhecimento em bancos de dados KDD, conforme Figura 1, a seguir: Fonte: Braga, 2005, p.15. Figura 1 Esquema para geração de conhecimento em bancos de dados KDD

Fayyad (1996 apud CORRÊA, 2007) indica o KDD como um processo, de várias etapas, com características que incluem a interação e a iteratividade, a fim de identificar padrões compreensíveis, válidos, novos e úteis com base em grandes conjuntos de dados. Hair et al. (2005) apresenta a operação de um armazém de dados dotada de aspectos técnicos diferenciados que englobam a organização e a estrutura de dados, bem como o delineamento de dados. Este armazém de dados requer o estabelecimento e cumprimento de vários passos, dentre os quais são referidos: aquisição de dados: consiste na tarefa inicial e deve encampar todas as fontes, sejam elas internas ou externas à organização, tendo definido como fontes internas de dados aqueles sistemas presentes destinados aos processos operacionais; as fontes externas de dados abrange um leque de variações e alcança informações sobre a clientela, estudos de pesquisa, fontes comerciais, ou base de dados comerciais (HAIR et al., 2005); envolve o estabelecimento de acesso aos dados relevantes (HAIR et al.,2003). Trata-se do conhecimento do domínio de aplicação, fato que inclui o conhecimento relevante e as metas do processo KDD para a aplicação (FERRO; LEE, 2001); seleção do conjunto de eventos a serem analisados; desenvolvimento e uso de regras de seleção e desenvolvimento de um relatório de relações passiveis de afetar o desempenho da empresa (HAIR et al., 2003); criação de um banco de dados alvo, sujo propósito é formar um conjunto de dados ou enfatizar a formação de um subconjunto de variáveis ou exemplo de dados que permitam o descobrimento (FERRO; LEE, 2001). a integração de dados, sendo a fase que une todas as fontes de dados, obtendo uma forma consistência na medida em que há ajustes de características, atributos e nível de agregação (HAIR et al., 2005). a limpeza de dados: é a limpeza dos dados de forma que seja facilitada a compreensão pelo algoritmo (HAIR et al, 2003); consiste na eliminação de erros e de dados com pouca qualidade, a partir da integração de muitas fontes de dados, pois, a qualidade da análise está ligada à qualidade dos dados, fato que se torna um obstáculo na implementação bem sucedida de um armazém de dados (HAIR et al., 2005). Nesta limpeza são realizadas operações essenciais na remoção de ruídos, coleta de informação necessária para modelagem, decisão de estratégias para o manuseio dos campos perdidos (FERRO; LEE, 2001). criação de metadados: definindo metadados, estes elaboram uma descrição completa de um elemento de dados, com seus atributos, fonte original e quaisquer transformações ou resumos. Sua descrição indica um perfil do elemento de dados possibilitando seu uso em qualquer análise, transformação ou resumo superiores (HAIR et al., 2005). importação de dados: dados são importados ao armazém obedecendo-se a intervalos periódicos, formando um arquivo histórico que une os dados ingressantes com os dados existentes em uma base fornecendo uma perspectiva temporal (HAIR et al., 2005). armazenamento de dados: trata-se da fase na qual são realizados a organização e o processamento do banco de dados, inclusive o resumo dos dados em diferentes níveis em antecipação às buscas a serem feitas pelos usuários (HAIR et al., 2005). suporte de decisão: refere-se a aplicações dirigidas a usuários de OLAP ou de processamento de mineração de dados que acessam a base de dados com uma busca específica (HAIR et al., 2005). Aliás, o principal objetivo do Data mining é analisar conjuntos de dados históricos das empresas visando a descoberta do conhecimento que leva ao apoio à decisão, no sentido de propiciar vantagem competitiva estratégica a uma empresa (O BRIEN, 2004).

redução de dados e projeção: inclui a pesquisa sobre formas práticas para representar os dados, associado à meta do processo e o uso de redução dimensionável e métodos de transformação visando redução no número de variáveis encontrar representações invariantes para os dados (FERRO; LEE, 2001). 2.1 Mineração de dados (data mining) Hair et al. (2005, p.535) considera a mineração de dados o Data mining - como a Obtenção de informação acionável, válida e previamente desconhecida de grandes bancos de dados e a aplicação dela em modelos de negócios. A mineração de dados é definida também como a: [...] extração automática de dados sobre padrões, tendências, associações, mudanças e anomalias previamente não-identificadas. Estão baseados nos paradigmas de hipóteses e descobertas e incorporam conceitos de inteligência artificial para que essa função seja possível (ROSINI, 2003, p.47). Outra concepção sobre a mineração de dados é fornecida também por Hair et al. (2003, p.41): Trata-se do processo de garimpar eletronicamente os bancos de dados à procura de informações que identifiquem maneiras de melhorar o desempenho organizacional. Visto como uma das etapas principais do KDD, o Data mining é um processo de descoberta de padrões nos dados, e este processo aparece sob a forma automática ou semi-automática, apoiando-se em quatro áreas essenciais: Aprendizado de Máquina (AM); banco de dados; estatística e visualização (FERRO; LEE, 2001). Em sua atuação o Data mining proporciona a descoberta de novas correlações, padrões e tendências em grande número de empresas e que são armazenados em Data warehouses, certamente em vários terabytes de dados. Pelo fato de utilizar algoritmos avançados de reconhecimento de padrões, e diversas técnicas matemáticas e estatísticas na seleção do grande volume de dados, a mineração de dados extrai informação empresarial estratégica dantes não conhecida (O BRIEN, 2004). A mineração de dados tem como meta relações e padrões de dados em grandes bases de dados; caracterizada por uma orientação exploratória, busca conhecimento obscurecido pelos complexos padrões de associação e dados em volume significativo. Conhecimentos valiosos podem ser encontrados após o processamento de imensas quantias de informação, seguindo-se a hipótese de que ao revelarem-se essas relações no banco de dados, e esta refletir o ambiente de decisão da organização, serão auferidos benefícios à organização (HAIR et al., 2005). Sendo um processo de extração de informações de coleções de dados, a Data mining tem se tornado ferramenta em contextos pouco comuns, como o uso em laboratórios para identificação de funções de genes específicos, codificados por moléculas de DNA, e mesmo na caracterização das propriedades de organismos como os vírus. Nesta atividade, a mineração de dados toma a forma de reconhecimento de padrões e a determinação sobre a significância ou coincidência de tais padrões (BROOKSHEAR, 2003). As ferramentas disponíveis da mineração de dados podem ser combinadas com planilhas e demais ferramentas de desenvolvimento de software de usuário final, de modo a facilitar a análise e o processamento de dados garimpados. Em seus resultados produz cinco tipos de informações: associação; seqüências; classificação; agrupamentos; e previsões (TURBAN; McLEAN; WETHEREBE, 2002). Os sistemas de mineração de dados são interligados a um sistema de banco de dados e, desde a década de 1970, a evolução dos sistemas trouxe o conceito de Business Intelligence (BI), entendido como um conjunto de conceitos e métodos que utilizam os acontecimentos e

sistemas apoiando a tomada de decisões nos negócios da organização. Com este objetivo, dados podem ser adquiridos via sistema de processamento on-line de transações (OLTP), promovendo seu armazenamento em um sistema de banco de dados, a exemplo do Data warehouse, gerando, por sua vez, o subconjunto de dados, o Data marte. Em seguida, tais dados podem ser processados em uma ferramenta de análise, qual seja, a ferramenta de processamento analítico on-line (OLAP), um sistema de informações para executivos (EIS), um sistema de apoio a decisão (DSS) e mesmo um sistema de descoberta e previsão, o Data mining (BRAGA, 2005). No Data mining o processamento dos dados de um Data warehouse serve à identificação de fatores e tendências-chave nos padrões de atividade de negócios. Tal procedimento auxilia os gerentes na tomada de decisões relativas às mudanças estratégicas em suas operações no sentido de obter vantagens competitivas no mercado em que atuam (O BRIEN, 2004). De acordo com Rosini (2003), o OLTP é um processo baseado na consulta e atualização de dados de modo instantâneo, fundado em informações atuais. O diferencial dos sistemas baseado em OLTP é promover respostas rápidas ao usuário que consulta, o que implica em um trabalho com bases de dados normalizadas e otimizadas de modo a receber o impacto imposto pela arquitetura física dos dados, como a exigência de acessos desnecessários à base de dados, ocasionando demora na transação. Já o Data mining auxilia na promoção da extração de valor dos dados corporativos, ao descobrir os padrões ocultos nos dados e que permitem antecipar o comportamento de compra de clientes chave, por exemplo, ou de preparar a empresa no lançamento de novos produtos ou serviços (ROSINI, 2003). Segundo Ferro e Lee (2001, p.58) quanto à escolha da função de Data mining, requer saber: Inclui a decisão do propósito do modelo derivado do algoritmo de data mining (Ex. classificação, regressão e clusterização). Encontrar o algoritmo de data mining: inclui selecionar métodos para serem usados para procurar por modelos nos dados, como decidir quais modelos e parâmetros podem ser apropriados e determinar um método de data mining particular com o modelo global do processo KDD (Ex. o usuário pode estar mais preocupado em entender o modelo do que nas suas capacidades). A razão principal para a criação da mineração de dados tem relação com o advento de um significativo poder computacional quando foi desenvolvido o software Automatic Interaction Detection (AID), [...] que considerava os relacionamentos possíveis entre todos os pares possíveis de dados quantificados dentro de um conjunto de dados, permitindo que um computador mainframe dispusesse uma análise de todas as relações potenciais entre dezenas de variáveis em tempo recorde (HAIR et al., 2003, p. 41). Explicitando a capacidade de análise, um conjunto de dados com 24 variáveis poderia exigir 17.777.216 computações; atualmente, a capacidade computacional moderna admite a realização de tais tipos de análise em um PC ou laptop em segundos, possibilitando ao pesquisador facilidade de encontrar informações precisas à melhoria do desempenho da organização (HAIR et al., 2003). Agregado a Data mining encontra-se o Web mining, definido como O processo de analisar registros de acesso e outras informações ligadas a padrões de navegação e de acesso dos usuários em uma ou mais localidades da Web (TURBAN; McLEAN; WETHEREBE, 2002, p.126). Em sua composição consta como uma aplicação de técnicas de Data mining, e elabora a exploração de conteúdo, um processo de descobrimento de informação a partir de milhões de documentos disponíveis na Web.

Utilizado em diferentes áreas, o Web mining atua na filtragem de informações, como nos e- mails, revistas e jornais; exerce vigilância quanto aos concorrentes na internet e patentes; atua na garimpagem de registros de acesso à Web; promove navegação assistida e realiza serviços que combatem o crime na internet. Ainda, é vital ao comércio eletrônico em razão do imenso número de visitantes, visto como parte relevante da exploração de dados em geral, na execução de funções como o descobrimento de recursos, extração de informações e generalização (TURBAN; McLEAN; WETHEREBE, 2002). Hair et al. (2005) comenta sobre outros tipos de técnicas analíticas que podem ser utilizadas na mineração de dados, incluindo as abordagens descritivas e gráficas até as técnicas multivariadas sofisticadas, como a análise de agrupamentos ou regressão múltipla ou logística, e modelos de aprendizagens novos, como as redes neurais e algoritmos genéticos. Nas redes neurais, sistemas de computação modelados segundo a rede em forma de malha de cérebro de elementos de processamento conectados chamados neurônios, a operação ocorre em paralelo e em interação dinâmica entre si, possibilitando o aprendizado da rede fundado nos dados que ele mesmo processa, de forma a alterar as potencias das interconexões entre os elementos do processamento como resposta a uma mudança nos padrões de dados recebidos e os resultados auferidos (O BRIEN, 2004, p.301). Atuando como facilitadores de informação, além de um suporte técnico, está o Help Desk, um sistema informacional que atua como computação aplicada associado a demais tecnologias que incluem a Data Warehouse, a Intranet/Extranet, a Groupware, e Data Mining, a Digital Whiteboards, entre outras (COÊLHO et al., 2003). A maior utilização da informática no cotidiano da organização revela que é preciso trazer um suporte adequado aos diversos sistemas de informação utilizados e o Help Desk pode se constituir nesse suporte (SILVA, 2007). O sistema Help Desk é assim explicado por Coêlho et al. (2003, p.46): [...] um sistema help desk constitui um mecanismo computacional facilitador de informação do tipo help desk = <Pergunta, Resposta> onde tanto a Pergunta em apreço se refere àquela de clientes e/ou usuários quaisquer;quanto a Resposta do sistema se refere a um apoio informacional bem definido em seu domínio. Santos (2007) enfatiza a integração com o Help Desk e a automatização de abertura de chamados para o tratamento de casos não solucionados pelo gerenciamento de identidade. Dois fatores estão presentes: automatização da criação de chamados para concessão lógica de acesso ainda dependentes de ação manual e automatização de criação de chamados de instalação de pré-requisito para acessos. A compreensão desse suporte é dada por Corrêa: Help-Desk É denominado atendimento de 1º nível. São equipes de atendimento remoto capaz de gerenciar, coordenar e resolver incidentes no menor tempo possível garantindo que nenhuma solicitação seja perdida, esquecida ou ignorada. É composta de técnicos de informática que recebem treinamento para resolver a maior parte dos atendimentos no primeiro contato. Quando se esgotam as alternativas para solução do atendimento executado pelo Help-Desk, o registro é direcionado para a equipe que possui maior capacidade em solucionar aquele registro. A equipe poderá ser uma Mesa especializada (ME) ou Posto avançado (PA). (CORRÊA, 2007, p.11-12). Segundo Cohen (2008), é antiga a expressão Help Desk, presente na linguagem desde os tempos dos mainframes, conceituado como centro de suporte técnico, local para onde as pessoas ligavam com dúvidas de uso.

Lageman (1998) atribuiu o surgimento do termo Help Desk ao aparecimento dos computadores pessoais, em 1980, paralelo ao crescimento da necessidade de suporte aos novos usuários de computadores, comportando gerentes, técnicos e secretárias, fomentando a criação de Centros de Informação (CI s) com a função de auxiliar no uso dos computadores pessoais na empresa. Inicialmente utilizados para atendimento de problemas computacionais, os Help Desk são usados atualmente para qualquer tipo de assistência via telefone, seguindo uma dinâmica específica: os operadores recebem o chamado e interpretam o problema. Com base em sua experiência e conhecimento auxiliam o cliente prestando informações ou recomendando ações que resolvam o problema (SILVA, 2007). Segundo Silva (2007), um sistema de Help Desk é composto por três componentes básicos: Software: auxilia o controle do inventário tecnológico da empresa, revelando os problemas repetidos, tempos médios de atendimento, as soluções usadas nas áreas mais demandantes e identificação da necessidade de treinamentos; Equipe: atua nos níveis de campo e de retaguarda. A equipe de campo faz o atendimento aos problemas, solucionando-os quando possível ou acionando fornecedores internos e externos. Já a equipe de retaguarda é acionada quando um problema técnico supera a capacidade de resolução da equipe de campo. Os analistas de suporte de fornecedores funcionam como uma terceira camada e podem ser requisitados pela equipe de retaguarda, recebendo o problema identificado e já mapeado. Metodologia de serviço: envolve a situação do sistema de Help Desk em relação aos usuários, definindo quais são as estratégias de ação diante de determinado problema, apresentando indicadores de desempenho e identificando novas oportunidades em um processo de melhoria contínua (SILVA, 2007, p.1). Coêlho et al. (2003) associam o Help Desk a tecnologia de gestão do conhecimento enfatizando a sua modelagem com o emprego de metodologias e ferramentas variadas. Interessa-lhes, particularmente, os sistemas construídos com base no conhecimento e assim definem: Sistemas help desk inteligentes são sistemas que servem como um ponto único de intervenção para solução de problemas enfrentados por usuários (usuários de produtos, usuários de serviços, usuários internos, usuários externos) e onde a fonte das soluções computacionais propostas está na representação computacional de conhecimento (COÊLHO et al., 2003, p.49). Com essa definição, é justificado o papel do Help Desk na organização como um processo automático particular ou uma tecnologia da gestão do conhecimento, já que os dois trabalham processos que envolvem o conhecimento e precisam da criação de bases de conhecimento nas organizações. Ainda, a dedicação é quanto à inteligência e à aprendizagem das organizações, a serviço da moderna economia baseada em conhecimento (COÊLHO et al., 2003). O Help Desk tem como objetivo principal evitar a perda de tempo do usuário ao se deparar com alguma dificuldade com a tecnologia. A rápida e eficiente intervenção favorece a redução do impacto no negócio, como propostas não enviadas, sistema bancário inativo e demais conseqüências que surgem. É característica dos departamentos de Help Desk a busca de novos métodos para o aumento de eficiência, em especial, o de promover ao usuário a autoajuda, localizando soluções e orientações por si mesmo (COHEN, 2008). Em seu estudo, Corrêa (2007) concluiu sobre a eficiência do processo KDD e de que a mineração de dados exige dados limpos, padronizados e codificados, criando um conhecimento novo e útil para a gestão do Help Desk.

3 Conclusão A descoberta do conhecimento em bancos de dados KDD é um processo amplo que comporta a mineração de dados, a Data mining, como uma das etapas de seu processo para o efetivo acesso ao conhecimento. Na prática, o KDD requer o cumprimento de etapas e, dentre outras, a da limpeza de dados, uma atribuição que pode ser delegada ao Help Desk permitindo a qualidade de análise em decorrência da qualidade dos dados. Os problemas do contexto real que atingem os bancos de dados não são resolvidos sem a exigência prévia de experiência e conhecimento; o gerenciamento eficaz do volume de dados permite que o KDD trafegue mais rápido e auxilie a tomada de decisão da organização. Referências ARANTES, Nélio. Sistemas de gestão empresarial: conceitos permanentes na administração de empresas válidas. 2. ed. São Paulo: Atlas, 1998. BRAGA, Luis Paulo Vieira. Introdução à mineração de dados. 2. ed. Rio de Janeiro: E- Papers, 2005. Disponível em: <http://books.google.com.br/books?id=blfslqbrzsoc &printsec=copyright&source=gbs_pub_info_s&cad=2#v=onepage&q=&f=false>. Acesso em: 26 ago. 2009. BROOKSHEAR, Glen J. Ciência da computação: uma visão abrangente. 7. ed. Porto Alegre: Bookman, 2003. Disponível em: <http://books.google.com.br/books?id=p0s8f bimfkoc &printsec=copyright&source=gbs_pub_info_s&cad=2#v=onepage&q=&f=true>. Acesso em: 26 ago. 2009. COÊLHO, Álvaro Vinícius de Souza; FERNEDA, Edilson; MARTINS, Agenor de Sousa; BARROS, M. A.; GORGONIO, F. L. Help Desk inteligente em gestão do conhecimento: um tratamento integrador de paradigmas. Inesc Em Revista, Unaí, MG, v. 1, n. 1, p. 46-51, 2003. COHEN, Roberto. Implantação de help desk e service desk. São Paulo: Novatec Editora, 2008. CORRÊA, Ulisses. Mineração de dados de help desk usando rattle o caso Petrobras. 2007. 105f. Dissertação (Mestrado em Administração) Faculdade de Economia e Finanças IBMEC, Rio de Janeiro, 2007. FERRO, Mariza; LEE, Huei Diana. O processo de KDD Knowledge Discovery in Database para aplicações na medicina. SEMINC, p.57-62, 2001. HAIR, Joseph et al. Análise multivariada de dados. 5. ed. Porto Alegre: Bookman, 2005. Disponível em: <http://books.google.com.br/books?id=lxfb5jzxdbuc &printsec=copyright &source=gbs_pub_info_s&cad=2#v=onepage&q=&f=false>. Acesso em: 26 ago. 2009. LAGEMANN, Gerson Volney. RBC para o problema de suporte ao cliente nas empresas de prestação de serviço de software: o caso Datasul. Florianópolis, 1998. Dissertação (Mestrado) - Engenharia de Produção. Universidade Federal de Santa Catarina. Disponível em: <http://www.eps.ufsc.br/disserta98/lagemann/index.html>. Acesso em: 27 ago.2009. HAIR, Joseph F.; MONEY, Arthur.; BABIN, Barry; SAMOEUL, Phillip. Fundamentos de métodos de pesquisa em administração. Porto Alegre: Bookman, 2003. Disponível em: <http://books.google.com.br/books?id=shrikxsqrksc&printsec=copyright&source=gbs_pu b_info_s&cad=2#v=onepage&q=&f=false>. Acesso em: 26 ago. 2009.

O BRIEN, James A. Sistemas de informação e as informações gerenciais na era da internet. 2. ed. São Paulo: Saraiva, 2004. PEREIRA, Heitor José Pereira. Proposição de um modelo organizacional baseado no conhecimento: um estudo de caso em empresa pública. Disponível em: <http://gestaoinstitucional.rio.rj.gov.br/downloads.php?tipo=pdf&arq=doc/dwnl/gestao_do_ Conhecimento/Proposicao_de_um_Modelo_Organizacional.pdf>. Acesso em: 26 ago. 2009. REZENDE, Denis Alcides. Tecnologia da informação aplicada a sistemas de informações empresariais: o papel estratégico da informação e dos sistemas de informação nas empresas. 3. ed. São Paulo: Atlas, 2003. ROSINI, Alessandro marco. Administração de sistemas de informação e a gestão do conhecimento. São Paulo: Pioneira Thompson Learning, 2003. SANTOS, Alfredo. Gerenciamento de identidade. Rio de Janeiro: Brasport, 2007. Disponível em: <http://books.google.com.br/books?id=acfu300zvguc&printsec=copyright&source = gbs_pub_info_s&cad=2#v=onepage&q=&f=false>. Acesso em: 27 ago. 2009. SILVA, Jorge Moacir Farias da. Utilização do raciocínio baseado em casos como apoio a um sistema de Help Desk. 2007. Monografia (Graduação em Sistemas de Informação). Centro Universitário Feevale - Instituto de Ciências Exatas e Tecnológicas - Novo Hamburgo, 2007. Disponível em: <http://nead.feevale.br/tc/files/1001.doc>. Acesso em: 27 ago. 2009. TURBAN, Efraim; McLEAN, Ephraim; WETHEREBE, James. Tecnologia da informação para gestão: transformando os negócios na economia digital. 3. ed. Porto Alegre: Bookman, 2002. Disponível em: <http://books.google.com.br/books? id=d5ekddxqunyc&printsec =copyright&source=gbs_pub_info_s&cad=2#v=onepage&q=&f=false>. Acesso em: 27 ago. 2009.