UNIVERSIDADE CATÓLICA DE GOIÁS DEPARTAMENTO DE COMPUTAÇÃO GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO

Tamanho: px
Começar a partir da página:

Download "UNIVERSIDADE CATÓLICA DE GOIÁS DEPARTAMENTO DE COMPUTAÇÃO GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO"

Transcrição

1 UNIVERSIDADE CATÓLICA DE GOIÁS DEPARTAMENTO DE COMPUTAÇÃO GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO MINERAÇÃO DE DADOS VISÃO GERAL E UMA APLICAÇÃO NO ATLETISMO ALEXANDRE VIEIRA MYTO PAULO ROGÉRIO ASSIS LACERDA NOVEMBRO 2007

2 UNIVERSIDADE CATÓLICA DE GOIÁS DEPARTAMENTO DE COMPUTAÇÃO GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO MINERAÇÃO DE DADOS VISÃO GERAL E UMA APLICAÇÃO NO ATLETISMO Trabalho de Projeto Final de Curso apresentado por Alexandre Vieria Myto e Paulo Rogério Assis Lacerda à Universidade Católica de Goiás, como requisito parcial para obtenção do título de Bacharel em Ciência da Computação aprovado em 27/11/2007 pela Banca Examinadora: Professor Sibelius Lellis Vieira, Dr. - Orientador Professor Wellington Santos Martins, Ph.D. - Examinador Professor Thierson Couto Rosa, M.Sc. - Examinador

3 MINERAÇÃO DE DADOS VISÃO GERAL E UMA APLICAÇÃO NO ATLETISMO ALEXANDRE VIEIRA MYTO PAULO ROGÉRIO ASSIS LACERDA Trabalho de Projeto Final de Curso apresentado por Alexandre Vieira Myto e Paulo Rogério Assis Lacerda à Universidade Católica de Goiás, como parte dos requisitos para obtenção do título de Bacharel em Ciência de Computação. Professor Sibelius Lellis Vieira Professor Jeová Martins Ribeiro Orientador Coordenador Projeto Final de Curso

4 AGRADECIMENTOS Primeiramente a Deus. À nossa família pelo apoio, gratidão e carinho por conduzir nossas vidas nos caminhos da sabedoria e do conhecimento. Ao Professor Sibelius, pelo apoio e confiança depositada. À Coordenação do Departamento de Computação da Universidade Católica de Goiás por ter ajudado de forma inestimável a execução deste trabalho. Ao Professor Ernesto Flávio Batista Borges Pereira pela colaboração e apoio.

5 RESUMO Neste trabalho é apresentada uma descrição sobre a mineração de dados. A mineração de dados tem muitas aplicações atualmente, visto que uma grande quantidade de dados são produzidos, armazenados e necessitam de processamentos para a descoberta de conhecimentos. Em particular, o estudo feito é aplicado em um problema de atletismo, fatores intervenientes na chegada dos cem metros rasos livre. Os dados foram obtidos através de um questionário aplicado em alguns atletas do Brasil. Os resultados foram analisados com auxílio da ferramenta Weka usando duas aplicações de mineração de dados, classificação e associação. Na classificação foi utilizado o algoritmo J.48 e na associação foi utilizado o algoritmo Apriori. Palavras-Chave: Mineração de Dados, Ferramenta Weka, Classificação, Associação.

6 ABSTRACT It is presented in this work a description of data mining. The data mining has many applications nowadays, since a large amount of data is generated, stored and need processing for the discovery of knowledge. In particular, the study is applied on an athletics problem, factors involving the arrival of a hundred meters free. The data was obtained through a questionnaire applied on some athletes from Brazil. The results were analyzed using the tool Weka using two applications of data mining: classification and association. In the classification, the J.48 algorithm was used and in the association the algorithm Apriori was used. Key Words: Data Mining, Tool Weka, Classification, Association.

7 MINERAÇÃO DE DADOS VISÃO GERAL E UMA APLICAÇÃO NO ATLETISMO SUMÁRIO LISTA DE FIGURAS xiv LISTAS DE TABELAS xvi LISTA DE ABREVIATURAS xvii 1. INTRODUÇÃO Justificativa Objetivo Estrutura 4 2. MINERAÇÃO DE DADOS Processo de descoberta de conhecimento Conceituação de mineração de dados Métodos de Mineração de Dados Classificação Associação Apriori Clusterização (Agrupamento) K-Means Padrões seqüenciais/temporais Técnicas de Mineração de Dados Árvore de decisão C Aplicações de mineração de dados Problemas com a obtenção de um banco de dados FATORES INTERVENIENTES NA CHEGADA DOS CEM METROS RASOS Evolução da prova Descrição do problema Base de dados Seleção dos dados Preparação dos dados Construção do modelo Avaliação do modelo 33

8 4. FERRAMENTA DE MINERAÇÃO DE DADOS WEKA Ambiente Weka Arquivo ARFF Explorer Características dos atributos Associação Weka Classificação Weka Atributos utilizados Arquivo no formato ARFF APLICAÇÃO Aplicando as regras A Base de dados Premissas estabelecidas Problemas para executar o método de classificação Novas premissas estabelecidas Resultados obtidos pelo método classificação Matriz de confusão Matriz de confusão para objeto em estudo Associação Problemas para executar o método de associação Resultados obtidos pelo método de associação CONCLUSÕES REFERÊNCIAS BIBLIOGRÁFICAS GLOSSÁRIO APÊNDICE 108

9 LISTA DE FIGURAS Figura Processo de KDD prosto por Fayyad, Piatetsky-Shapiro e Smyth (1996) 31 Figura Forma de Representação de uma Árvore de Decisão 33 Figura Weka GUI Chooser 52 Figura Weka Explorer (Preprocess) 75 Figura Weka Explorer (Classify) 88 Figura Weka Explorer (Cluster) 88 Figura Weka Explorer (Associate) 88 Figura Weka Explorer (Slect attributes) 88 Figura Weka Explorer (Visualize) 88 Figura Weka Explorer (Log) 88 Figura Weka Explorer (Preprocess) 88 Figura Weka Explorer (Visualize All) 88 Figura Arquivo no formato ARFF 88 Figura Árvore de decisão gerada pelo atributo melhor marca 100m 88 Figura Matriz de confusão gerada pelo atributo melhor marca 100m 88 Figura Melhores regras encontradas pelo apriori 88 Figura Exemplo de resultado que resultou em descoberta de informação 88

10 LISTA DE TABELAS Tabela Os 15 melhores tempos de sempre masculino 17 Tabela Os 12 melhores tempos de sempre feminino 83 Tabela Classificação dos pesos para pessoas 88 Tabela 5.2 Classificação dos atletas segundo a fórmula utilizada 88

11 LISTA DE ABREVIATURAS E SIGLAS ARFF CLI cm HPF HPP KDD Kg LMD LME OMS PRODERJ QTDE UCG URL 100m/r 2D Attribute Relation File Format Interface Commad Line centímetro História patológica Familiar História Patológica Pessoal Discovering Knowledge in Data Quilograma Lado da Mão Direita Lado da Mão Esquerda Organização Mundial da Saúde Órgão de Tecnologia da Informação do Estado do Rio de Janeiro Quantidades Universidade Católica de Goiás Uniform Resoucer Locator Cem metros rasos Segunda Dimensão

12 MINERAÇÃO DE DADOS FATORES QUE INFLUENCIAM NA CHEGADA DOS 100M/R CAPÍTULO I INTRODUÇÃO 1.1. Justificativa A mineração de dados ou data mining se refere a mineração ou a descoberta de novas informações em função de padrões ou regras em grandes quantidades de dados. Para ser útil, na prática, a mineração de dados precisa ser realizada eficientemente em grandes arquivos e banco de dados. O volume de dados armazenado nos sistemas das organizações é cada vez maior. Este fenômeno dá-se pela queda no custo dos dispositivos de armazenamento e avanços na área de tecnologia da informação. Devido a incapacidade do ser humano em analisar tamanho volume de dados, muitas informações, possivelmente úteis e importantes, podem não estar sendo devidamente aproveitadas. Em conseqüência disto, surge a necessidade de se desenvolver novas ferramentas e técnicas de extração automática de conhecimento a partir de dados armazenados [16]. Embora recente, a história da mineração de dados já tem casos bem conhecidos. O mais divulgado é o da cadeia norte-americana Wal-Mart, que identificou um hábito curioso dos consumidores. Ao procurar eventuais relações entre o volume de vendas e os dias da semana, o software apontou que, às sextas-feiras, as vendas de cervejas cresciam na mesma proporção que as de fraldas. Crianças bebendo cerveja? Não. Uma investigação mais detalhada revelou que, ao comprar fraldas para seus bebês, os pais aproveitavam para abastecer as reservas de cerveja para o final de semana [35]. Cada classe de aplicação em mineração de dados tem como base um conjunto de algoritmos que serão usados na extração de relações relevantes dentro de uma massa de

13 dados tais como: a classificação, a estimativa, o agrupamento por afinidade, a previsão e a segmentação [32]. Cada uma destas propostas difere quanto à classe de problemas que o método será capaz de resolver. As tecnologias de mineração de dados podem ser aplicadas em grande variedade de contextos de tomada de decisão empresariais. Em particular, áreas de significativo retorno de investimento esperado incluem: Marketing Aplicações como análises do comportamento do consumidor baseadas em padrões de consumo; a definição de estratégias de marketing está presente em propagandas, bem como em localização de lojas, e também em mala direta direcionada; segmentação de clientes, lojas ou produtos; e projeto de catálogos, layouts de lojas e campanhas de publicidade. Finanças Aplicações incluem análise de crédito de clientes, segmentação de contas a receber, análise de performance de investimentos financeiros como ações, bonds e fundos mútuos; avaliação de opções de financiamento; e detecção de fraudes. Produção Aplicações envolvem otimização de recursos como máquinas, força de trabalho e materiais; projeto ótimo de processos de fabricação, layouts de chão de fábrica, e projeto de produto, como de automóveis baseados nos requisitos dos clientes. Saúde Aplicações incluem descoberta de padrões em imagens radiológicas, análise de dados experimentais em microarray (gene-chip) para relação com doenças, análise de efeitos colaterais de remédios e efetividade de certos tratamentos; otimização de processos dentro de um hospital, relação de saúde do paciente com qualificações do médico. Além das áreas citadas acima a mineração de dados pode ser aplicada a várias áreas como: esporte, ciência, tecnologia, web, governo, banco, comércio etc. Atualmente, as ferramentas de mineração de dados utilizam técnicas para extração de conhecimento. Tais técnicas incluem regras de associação, agrupamento (clustering), redes neurais, seqüenciamento e análise estatística. Também utilizam-se as

14 árvores de decisão, que são a representação das regras usadas na classificação ou no agrupamento, e análise estatística, que podem incluir regressão e muitas outras técnicas [26]. Essas técnicas, devido a grande importância dos seus resultados e da grande base de dados, têm sido implementadas em ferramentas de mineração de dados, inclusive em algumas gratuitas, como a ferramenta Weka, que é utilizada neste trabalho Objetivo A mineração de dados pode ser aplicada em varias áreas, inclusive na área do esporte. Detalhes podem decidir uma competição tais como: o treinamento, a alimentação, o porte físico, o nervosismo, a saúde e outros. Umas das competições mais importantes no mundo do atletismo e do esporte é a corrida dos cem metros rasos (100m/r). A mineração de dados pode ser aplicada e útil na análise nesta categoria de atletismo, analisando os fatores do histórico que podem influenciar no resultado e assim, buscando padrões que podem auxiliar na preparação do atleta dos cem metros rasos 100m/r. A corrida dos cem metros rasos (100m/r) é uma modalidade olímpica de atletismo, considerada a prova mais importante das corridas de velocidade, para muitos cheios de nervosismo e de grande tensão emocional. Em razão do alto nível dos atletas e da distância, a prova leva em torno de apenas dez segundos. O objetivo deste trabalho é elaborar um estudo, utilizando técnicas de mineração de dados para analisar um conjunto de fatores dos atletas de cem metros rasos (100m/r) utilizando a ferramenta de mineração de dados Weka. Esta ferramenta oferece execuções de algoritmos de aprendizagem que podem ser facilmente aplicados os dados a serem estudados, além de possuir uma interface amigável e de fácil entendimento Estrutura No capítulo II é descrito o processo de mineração de dados, que é um processo

15 de descoberta de conhecimento (KDD-Discovering Knowledge in Data), sendo apresentada sua definição, seus métodos, técnicas e algumas áreas onde pode ser aplicado. No capítulo III são descritos os fatores intervenientes na chegada dos cem metros rasos, apresentando um pouco sobre a história das corridas dos 100m/r, os problemas a serem tratados, a geração da base de dados, como foram feitas as seleções dos dados que fizeram parte dos processos, quais as análises preliminares foram feitas com os dados, a construção do modelo a ser tratado e a avaliação do modelo. No capítulo IV são apresentadas a ferramenta Weka, algumas propriedades e funções, e como a ferramenta pode ser utilizada. São apresentadas características gerais do Weka, janelas, aplicativos e como utilizar atributos. No capítulo V são apresentados os experimentos, resultados, e problemas recorrentes dos métodos utilizados, o algoritmo Apriori para a associação e o j48 para a classificação. Todos os resultados foram possíveis utilizando a ferramenta Weka (freeware) disponibilizada para fins educativos. futuros. No capítulo VI é apresentado a conclusão do projeto e possíveis trabalhos

16 CAPÍTULO II MINERAÇÃO DE DADOS 2.1. Processo de descoberta de conhecimentos O processo de descoberta de conhecimento de dados surgiu na década de 80, época essa que devido aos novos meios de tecnologias, observou-se um grande crescimento no volume das bases de dados existentes. Alguns dos sistemas que surgiram e contribuíram neste período para o começo deste processo foram os sistemas de reservas de passagens aéreas, sistemas bancários e de cartões de créditos internacionais. Isso despertou a necessidade de extrair conhecimento a partir dessas grandes bases de dados. Essa estratégia é mais conhecida como KDD - Knowledge Data Discovering ou descoberta do conhecimento em dados. O KDD tem como objetivo principal explorar e extrair informações não-triviais em uma base de dados relacional de uma maneira otimizada, passando por algumas fases até chegar em algo consistente para que a partir dela possa obter conhecimento. Com a chegada da globalização, a competitividade entre as empresas no mundo dos negócios vem aumentando intensamente nos últimos anos. As empresas contemporâneas, cientes da necessidade de adaptação a esse cenário, têm investido na captação, no armazenamento, no tratamento e na aplicação da informação com diferencial estratégico e competitivo na condução dos negócios. Recursos da área da Tecnologia da Informação têm sido fundamentais nesse processo. Em particular, muitos sistemas de informação vêm sendo desenvolvidos e utilizados em diversas aplicações [27]. Os bancos de dados contêm informações detalhadas que permitem às empresas acompanhar e controlar processos operacionais. Por outro lado, existe uma demanda cada vez maior por sistemas de informação que auxiliem no processo de tomada de decisão. Gerentes e executivos necessitam de recursos computacionais que forneçam subsídios para apoio ao processo decisório das empresas [27].

17 Conceitualmente, um Data Warehouse é um grande armazém de dados, integrado, não volátil, variável em relação ao tempo, e destinado a auxiliar em decisões de negócios. A orientação à assunto, aliada ao aspecto de integração, permite reunir dados corporativos em um mesmo ambiente de forma a consolidar e apresentar informações sobre um determinado tema. Os dados são não voláteis, pois uma vez carregados no Data Warehouse, estes não podem mais sofrer alterações. Cada conjunto de dados, ao ser carregado em um Data Warehouse, fica vinculado a um rótulo temporal que o identifica dentre os demais. Cada rótulo temporal fica associado, portanto, a uma visão instantânea e sumarizada dos dados operacionais que corresponde ao momento de carga do Data Warehouse. Desta forma, na medida em que o Data Warehouse vai sendo carregado com tais visões, pode-se realizar análises de tendências a partir dos dados [27]. Obter conhecimentos em base de dados é uma área de pesquisa crescente que atrai esforços de pesquisadores. Fundamenta-se no fato de que as grandes bases de dados podem ser uma fonte de conhecimento útil, porém não explicitamente representado, cujo objetivo é desenvolver e validar técnicas, metodologias e ferramentas capazes de extrair o conhecimento implícito nesses dados e representá-lo de forma acessível aos usuários [13]. Transformar os dados em informações que possam auxiliar a tomada de decisões é um processo complexo [20] e pode ser organizado em cinco etapas, conforme ilustra a Figura 2.1.

18 Figura 2.1. Processo de KDD [6]. O primeiro passo no processo de KDD é entender o domínio da aplicação, identificar o problema e definir os objetivos a serem atingidos. O processo inicia com os dados brutos (Base de Dados) e finaliza com a extração de conhecimento, como resultado das seguintes etapas: conjunto-alvo de dados; 1. Seleção: é a extração dos dados visando à aplicação, ou seja, criação de um 2. Pré-Processamento: Engloba qualquer tipo de tratamento que venha a ser realizado nos dados que foram selecionados na fase anterior a fim de assegurar a qualidade (completude, veracidade e integridade). As informações consideradas desnecessárias são removidas. Se os erros não forem descobertos nessa etapa, poderão contribuir para a obtenção de resultados de baixa qualidade [22]. Um exemplo simples pode ser o de corrigir CEPs errados ou até mesmo retirar registros com prefixos de telefones errados [26]; 3. Transformação: identificação de características úteis para representar os da-

19 dos, conforme o objetivo definido, e realizar a redução ou transformação da dimensionalidade dos dados. Nesta fase, os dados devem ser codificados para que possam ficar em uma forma adequada a fim de que o algoritmo de mineração de dados escolhido tenha a interpretação correta dos registros para o seu padrão de uso [27] ou até mesmo pode ser executado para a redução da quantidade de dados [26]. A codificação pode ser: Numérica Categórica, que transforma valores reais em categoria ou intervalos; ou Categórica Numérica que representa numericamente valores de atributos categóricos [27]; 4. Mineração de dados (data mining): combinar os objetivos do processo de KDD com um método particular de mineração de dados e realizar a análise exploratória e seleção de modelo e hipótese, buscando padrões de interesse; 5. Interpretação/Avaliação: validar o conhecimento extraído da base de dados, identificar padrões e interpretá-los, transformando-os em conhecimentos que possam apoiar as decisões [12]; Como exemplo de processo de KDD, imagine um banco de dados mantido por um comerciante. Considere que os dados do cliente incluem nome, CEP, telefone, data da compra, código do item, preço, quantidade e valor total. Várias informações sobre o cliente podem ser obtidas pelo processamento KDD nesse banco de dados. Durante a seleção de dados, podem ser levantados itens específicos ou categorias de itens, ou de lojas em uma dada região ou área de um país. O processo de limpeza dos dados pode corrigir CEPs errados ou eliminar registros com prefixos de telefone errados. O enriquecimento incrementa os dados com fontes adicionais de informações. Por exemplo, pelo telefone ou pelo nome do cliente, a loja pode adquirir outros dados, como idade, renda, risco de crédito, e incluí-los em cada registro. A transformação dos dados e codificação pode ser executada para reduzir a quantidade de dados. Por exemplo, novos códigos podem ser agrupados em categorias de produto como: áudio, vídeo, materiais, dispositivos eletrônicos, câmeras, acessórios, e assim por diante. CEPs podem ser agrupados em regiões geográficas, impostos podem ser divididos em faixas, e assim por diante. Se a mineração de dados é baseado em um data warehouse existente para essa loja, esperamos que a limpeza já tenha sido aplicada. Somente depois desse préprocessamento é que as técnicas de mineração de dados são usadas para extrair diferentes regras e padrões [26].

20 2.2. Conceituação de Mineração de Dados. Como o nome indica, o mineração de dados se refere à mineração ou a descoberta de novas informações em função de padrões ou regras em grandes quantidades de dados. Para ser útil, na prática, a mineração de dados precisa ser realizada eficientemente em grandes arquivos e banco de dados [26]. A mineração de dados é a parte mais importante dentre os processos KDD, pois é nela que se concentra a busca efetiva das novas informações em função de padrões ou regras que há armazenados em grandes arquivos de banco de dados [27]. A mineração de dados é fundamentalizada na união de três grandes tecnologias: estatística clássica, inteligência artificial e machine learning (aprendizado de máquina). Para cada uma dessas tecnologias a mineração de dados se utiliza de meios que possa tirar proveito na busca por padrões. Com o resultado da Mineração de Dados podem ser descobertas as regras de associação, padrões seqüências e as árvores de classificação Métodos de Mineração de Dados Os métodos de Mineração de Dados podem ser classificados pela função que executam ou de acordo com a classe de aplicação em que podem ser usados [12]. Cada classe de aplicação tem como base um conjunto de algoritmos que serão usados na extração de relações relevantes dentro de uma massa de dados (Classificação, Associação, Clusterização, Previsão de Série Seqüências/Temporais) Classificação Para classificar é necessário selecionar um atributo alvo, chamado variável dependente ou classe, cujo valor é usado para elaborar regras de classificação e as variáveis in-

21 dependentes ou atributos preditores [15]. A classificação utiliza dados sobre o passado para encontrar padrões significantes de forma a induzir regras sobre o futuro, isto é, regras que predizem o valor do atributo alvo, através da combinação dos valores dos atributos preditores [4]. A precisão do resultado da classificação é medida pela taxa de erro, que é o percentual de registros classificados incorretamente [4]. A técnica de classificação geralmente utiliza métodos de indução com aprendizado supervisionado. No aprendizado supervisionado, a entrada e saída desejadas são fornecidas por um supervisor externo. Os métodos de indução supervisionados podem ser classificados em conexionistas e simbólicos. Como exemplo podemos citar são as redes neurais, que criam modelos implícitos que são representados em uma arquitetura de nós e ligações com pesos. Já os métodos simbólicos, como exemplo árvores de decisão e regras, criam modelos explícitos [6]. Uma técnica de classificação é considerada útil para mineração de dados se tiver três características [30]: 1. Capacidade de produzir modelos de alta qualidade mesmo quando os dados no conjunto de treinamento estão incompletos. 2. Gerar modelos compreensíveis e explanáveis, de forma a que o usuário possa entender como o sistema toma decisões. 3. Reconhecer o domínio no qual está aplicando a indução e melhorar a qualidade do modelo induzido Associação A regra de associação é uma das principais tecnologias em mineração de dados. Nesta podemos considerar o fato de que se antecedente, então conseqüente ou seja, pode

22 ser entendida da seguinte forma X => Y onde X={x 1, x 2,..., x n }, e Y = {y 1,y 2,..., y n } são conjunto de itens, com x i e y j, que contém itens distintos para todo i e j. Isso na prática implica que possivelmente um cliente que compre X estará sujeito a comprar Y como conseqüência. Por exemplo, em uma padaria um cliente que compre pão geralmente ele também compra leite. [26] Normalmente, regras de associação possuem a forma LME (lado da mão esquerda) => LDM (lado da mão direita), onde LME e LMD são conjuntos de itens, e através da união de LME e LDM representa-se o conjunto de todos os itens comprados pelo cliente. Para que a regra de associação seja interessante, a regra precisa satisfazer algumas medidas. Duas medidas de interesse comuns são suporte e confiança [26]. O suporte é o percentual de transações que contém todos os itens na própria relação LME U LMD. Se o suporte é baixo isso implica que não existe nenhuma evidência significativa que os itens LME U LMD ocorram juntos, já que o conjunto de itens ocorre em apenas uma pequena fração de transações [26]. A confiança da regra é calculada com o suporte (LME U LMD)/suporte(LMD). Podemos analisar a possibilidade de que os itens do LME sejam comprados dado que os itens do LMD foram comprados por um cliente [26]. Existem diversos algoritmos desenvolvidos especificamente para aplicação de descoberta de associações, dentre eles: Apriori (utilizado neste trabalho), DHP (Direct Hashing an Pruning), Partition, DIC (Dynamic Itemset Couting), Eclat, MaxEclat, Clique, MaxClique, Cumulate e EstMerge [27]. As aplicações de técnicas de associação têm seu uso mais difundido na área de marketing, em que se pretende descobrir as associações existentes entre os produtos vendidos. A tecnologia possibilitou às organizações coletar e armazenar grandes quantidades de dados, como é o caso da tecnologia de código de barras sobre os dados de vendas [2]. As grandes redes varejistas estudam as compras dos clientes para descobrir quais as vendas são normalmente realizadas ao mesmo tempo, chamando isso de market basket analysis. Essa análise pode determinar, por exemplo, os produtos que devem estar expostos juntos,

23 objetivando incrementar as vendas [7] Apriori O Apriori é um algoritmo clássico de Mineração de Regras de Associação [2]. Diversos algoritmos tais como GSP, DHP, Partition, DIC, Eclat, MaxEclat, Clique e MaxClique foram inspirados no funcionamento do Apriori e se baseiam no princípio da antimonotonicidade do suporte [27]. Os algoritmos que são utilizados para encontrar regras de associação utilizam as propriedades de fechamento por baixo e antimonotonocidade. No fechamento por baixo é feita a inferência de um superconjunto para um subconjunto. Na antimonotonicidade ajuda a reduzir o espaço de busca por possíveis soluções. Isto é, uma vez que um item for considerado pequeno, qualquer extensão para aquele conjunto de itens, formado pela adição de um ou mais itens ao conjunto, será também um conjunto pequeno [26]. duas etapas [27]: Os algoritmos mencionados a cima podem ser decompostos basicamente em a) Encontrar todos os conjuntos de itens freqüentes (que satisfazem à condição de suporte mínimo), ou seja, encontrar conjunto de itens que mais se relaciona com outro item. b) A partir do conjunto de itens freqüentes, gerar as regras de associação (que satisfazem à condição de confiança mínima) Clusterização (Agrupamento) A clusterização ou agrupamento é um processo de partição de uma população heterogênea em vários subgrupos ou clusters mais homogêneos [13]. No agrupamento, não há classes predefinidas, e os registros são agrupados de acordo com a semelhança, o que a diferencia da tarefa de classificação.

24 Exemplos de agrupamento: agrupar os clientes por região do país, agrupar clientes com comportamento de compra similar [15]; agrupar seções de usuários Web para prever comportamento futuro de usuário [27] K-Means O algoritmo k-means é um método popular da tarefa de Clusterização. Tomase, randomicamente, k pontos de dados (dados numérico) como sendo os elementos centrais dos cluster. Em seguida a cada ponto (ou registro da base de dados) é atribuído um cluster cuja distância deste ponto em relação ao elemento central do cluster é menor para esse ponto. Em seguida para cada cluster é computado o novo elemento central desse cluster, caracterizando a configuração do cluster para iteração seguinte. O processo termina quando os elementos centrais dos clusters param de se modificar, ou após um número limitado de interações que tenha sido especificado pelo usuário [27]. A execução do algoritmo k-means consiste em, primeiro, selecionar aleatoriamente k objetos, que inicialmente representam cada um a média de um cluster. Para cada um dos objetos remanescentes, é feita a atribuição ao cluster ao qual o objeto é mais similar, baseado na distância entre o objeto e a média do cluster. A partir de então, o algoritmo computa as novas médias para cada cluster. Este processo se repete até que uma condição de parada seja atingida [27] Padrões seqüenciais/temporais Este método procura eventos ou compras que ocorrem seqüencialmente em um período de tempo, determinando tendências [12]. Uma aplicação típica é a venda por mala direta, que agrega os dados sobre os produtos adquiridos em cada compra. A descoberta de seqüência irá analisar este conjunto e detectar padrões de produtos comprados durante um determinado tempo. Pode ser útil também para identificar os itens que precedem a compra de um determinado produto [27;20].

25 Técnicas de Mineração de Dados As técnicas utilizadas atualmente em mineração de dados são extensões de métodos analíticos já conhecidos há algum tempo. O que as diferenciam são que as técnicas aqui são mais voltadas a encontrar estratégias para os negócios. Isto acontece graças ao aumento do desempenho dos computadores. As técnicas apresentadas a seguir são extraídas de [14] Árvore de decisão Árvores de decisão dividem os dados em subgrupos com base nos valores das variáveis. O resultado é uma hierarquia de declarações do tipo Se...então..., que são utilizadas principalmente para classificar dados. Há uma onda de interesse em produtos baseados em árvore de decisão, principalmente porque eles são mais rápidos que as redes neurais para alguns problemas organizacionais, e também é mais fácil compreender o seu funcionamento [32]. Árvores de decisão expressam uma forma simples de lógica condicional buscando a representação de uma série de questões que estão escondidas sob a base da dados. Em uma árvore de decisão existem dois tipos de atributos: o decisivo, que é aquele que contém o resultado ao qual queremos chegar, e os não-decisivos que contêm os valores que conduzem a uma decisão. Com a utilização da entropia como ganho de informação, são realizados cálculos sobre os atributos não-decisivos, denominados classes, nos quais é escolhido um nó inicial também chamado raiz. A partir deste nó, será realizada uma série de novos cálculos com o objetivo de decidir a estrutura de formação da árvore a ser gerada. Este processo é repetido até que todos os atributos a serem processados estejam perfeitamente classificados ou caso se tenham processado todos os atributos. Os três principais algoritmos conhecidos que implementam árvores de decisão, são ID3, C4.5 e PERT, sendo que os algoritmo C4.5 e PERT são um aperfeiçoamentos do algoritmo ID3, com alguns conceitos avançados de podagem (técnica de cortar nós da árvore

Prof. Msc. Paulo Muniz de Ávila

Prof. Msc. Paulo Muniz de Ávila Prof. Msc. Paulo Muniz de Ávila O que é Data Mining? Mineração de dados (descoberta de conhecimento em bases de dados): Extração de informação interessante (não-trivial, implícita, previamente desconhecida

Leia mais

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka 1 Introdução A mineração de dados (data mining) pode ser definida como o processo automático de descoberta de conhecimento em bases de

Leia mais

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br MINERAÇÃO DE DADOS APLICADA Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br Processo Weka uma Ferramenta Livre para Data Mining O que é Weka? Weka é um Software livre do tipo open source para

Leia mais

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Planejamento Estratégico de TI. Prof.: Fernando Ascani Planejamento Estratégico de TI Prof.: Fernando Ascani Data Warehouse - Conceitos Hoje em dia uma organização precisa utilizar toda informação disponível para criar e manter vantagem competitiva. Sai na

Leia mais

IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES ENTRE PRODUTOS DE UMA BASE DE DADOS REAL

IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES ENTRE PRODUTOS DE UMA BASE DE DADOS REAL Universidade Federal de Ouro Preto - UFOP Instituto de Ciências Exatas e Biológicas - ICEB Departamento de Computação - DECOM IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES

Leia mais

4. Que tipos de padrões podem ser minerados. 5. Critérios de classificação de sistemas de Data Mining. 6. Tópicos importantes de estudo em Data Mining

4. Que tipos de padrões podem ser minerados. 5. Critérios de classificação de sistemas de Data Mining. 6. Tópicos importantes de estudo em Data Mining Curso de Data Mining - Aula 1 1. Como surgiu 2. O que é 3. Em que tipo de dados pode ser aplicado 4. Que tipos de padrões podem ser minerados 5. Critérios de classificação de sistemas de Data Mining 6.

Leia mais

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Pollyanna Carolina BARBOSA¹; Thiago MAGELA² 1Aluna do Curso Superior Tecnólogo em Análise e Desenvolvimento de Sistemas

Leia mais

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO Fernanda Delizete Madeira 1 ; Aracele Garcia de Oliveira Fassbinder 2 INTRODUÇÃO Data

Leia mais

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO @ribeirord FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO Rafael D. Ribeiro, M.Sc,PMP. rafaeldiasribeiro@gmail.com http://www.rafaeldiasribeiro.com.br Lembrando... Aula 4 1 Lembrando... Aula 4 Sistemas de apoio

Leia mais

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA Lizianne Priscila Marques SOUTO 1 1 Faculdade de Ciências Sociais e Aplicadas

Leia mais

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5 Para entender bancos de dados, é útil ter em mente que os elementos de dados que os compõem são divididos em níveis hierárquicos. Esses elementos de dados lógicos constituem os conceitos de dados básicos

Leia mais

3 Market Basket Analysis - MBA

3 Market Basket Analysis - MBA 2 Mineração de Dados 3 Market Basket Analysis - MBA Market basket analysis (MBA) ou, em português, análise da cesta de compras, é uma técnica de data mining que faz uso de regras de associação para identificar

Leia mais

UTILIZANDO O SOFTWARE WEKA

UTILIZANDO O SOFTWARE WEKA UTILIZANDO O SOFTWARE WEKA O que é 2 Weka: software livre para mineração de dados Desenvolvido por um grupo de pesquisadores Universidade de Waikato, Nova Zelândia Também é um pássaro típico da Nova Zelândia

Leia mais

ADM041 / EPR806 Sistemas de Informação

ADM041 / EPR806 Sistemas de Informação ADM041 / EPR806 Sistemas de Informação UNIFEI Universidade Federal de Itajubá Prof. Dr. Alexandre Ferreira de Pinho 1 Sistemas de Apoio à Decisão (SAD) Tipos de SAD Orientados por modelos: Criação de diferentes

Leia mais

Professor: Disciplina:

Professor: Disciplina: Professor: Curso: Esp. Marcos Morais de Sousa marcosmoraisdesousa@gmail.com Sistemas de informação Disciplina: Introdução a SI Noções de sistemas de informação Turma: 01º semestre Prof. Esp. Marcos Morais

Leia mais

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO EPE0147 UTILIZAÇÃO DA MINERAÇÃO DE DADOS EM UMA AVALIAÇÃO INSTITUCIONAL

Leia mais

Manual de Utilização das Funções Básicas do Sistema ClinicWeb

Manual de Utilização das Funções Básicas do Sistema ClinicWeb Manual de Utilização das Funções Básicas do Sistema ClinicWeb Dezembro/2012 2 Manual de Utilização das Funções Básicas do Sistema ClinicWeb Sumário de Informações do Documento Título do Documento: Resumo:

Leia mais

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é?

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é? KDD Conceitos o que é? Fases limpeza etc Datamining OBJETIVOS PRIMÁRIOS TAREFAS PRIMÁRIAS Classificação Regressão Clusterização OBJETIVOS PRIMÁRIOS NA PRÁTICA SÃO DESCRIÇÃO E PREDIÇÃO Descrição Wizrule

Leia mais

Data Warehouses Uma Introdução

Data Warehouses Uma Introdução Data Warehouses Uma Introdução Alex dos Santos Vieira, Renaldy Pereira Sousa, Ronaldo Ribeiro Goldschmidt 1. Motivação e Conceitos Básicos Com o advento da globalização, a competitividade entre as empresas

Leia mais

Mineração de Dados: Introdução e Aplicações

Mineração de Dados: Introdução e Aplicações Mineração de Dados: Introdução e Aplicações Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br Apresentação Luiz Merschmann Engenheiro

Leia mais

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse Definição escopo do projeto (departamental, empresarial) Grau de redundância dos dados(ods, data staging) Tipo de usuário alvo (executivos, unidades) Definição do ambiente (relatórios e consultas préestruturadas

Leia mais

DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS

DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS Tácio Dias Palhão Mendes Bacharelando em Sistemas de Informação Bolsista de Iniciação Científica da FAPEMIG taciomendes@yahoo.com.br Prof.

Leia mais

http://www.publicare.com.br/site/5,1,26,5480.asp

http://www.publicare.com.br/site/5,1,26,5480.asp Página 1 de 7 Terça-feira, 26 de Agosto de 2008 ok Home Direto da redação Última edição Edições anteriores Vitrine Cross-Docking Assine a Tecnologística Anuncie Cadastre-se Agenda Cursos de logística Dicionário

Leia mais

MVREP- Manual do Gerador de Relatórios. ÍNDICE

MVREP- Manual do Gerador de Relatórios. ÍNDICE ÍNDICE ÍNDICE... 1 CAPÍTULO 01 PREPARAÇÃO DO AMBIENTE... 2 1.1 IMPORTAÇÃO DO DICIONÁRIO DE DADOS... 2 CAPÍTULO 02 CADASTRO E CONFIGURAÇÃO DE RELATÓRIOS... 4 2.1 CADASTRO DE RELATÓRIOS... 4 2.2 SELEÇÃO

Leia mais

Edições Edge do SAP InfiniteInsight Visão geral Viabilizando insights preditivos apenas com cliques de mouse, sem códigos de computador

Edições Edge do SAP InfiniteInsight Visão geral Viabilizando insights preditivos apenas com cliques de mouse, sem códigos de computador Soluções de análise da SAP Edições Edge do SAP InfiniteInsight Visão geral Viabilizando insights preditivos apenas com cliques de mouse, sem códigos de computador Índice 3 Um caso para análise preditiva

Leia mais

Guia de Uso. O Pro-Treino tem uma divisão clara de funções, apresentada a seguir: E três tipos de usuários que executam as funções descritas acima:

Guia de Uso. O Pro-Treino tem uma divisão clara de funções, apresentada a seguir: E três tipos de usuários que executam as funções descritas acima: Sumário 1. Introdução... 2 2. Conceitos básicos... 2 2.1. Fluxo do sistema... 3 2.2. Acesso ao sistema... 4 2.2.1. Login... 4 2.2.2. Logoff... 4 2.2.3. Esqueci minha senha... 5 2.3. Conhecendo o Sistema...

Leia mais

Administração de Sistemas de Informação Gerenciais UNIDADE IV: Fundamentos da Inteligência de Negócios: Gestão da Informação e de Banco de Dados Um banco de dados é um conjunto de arquivos relacionados

Leia mais

Ferramenta: Spider-CL. Manual do Usuário. Versão da Ferramenta: 1.1. www.ufpa.br/spider

Ferramenta: Spider-CL. Manual do Usuário. Versão da Ferramenta: 1.1. www.ufpa.br/spider Ferramenta: Spider-CL Manual do Usuário Versão da Ferramenta: 1.1 www.ufpa.br/spider Histórico de Revisões Data Versão Descrição Autor 14/07/2009 1.0 15/07/2009 1.1 16/07/2009 1.2 20/05/2010 1.3 Preenchimento

Leia mais

BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES.

BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES. Encontro de Ensino, Pesquisa e Extensão, Presidente Prudente, 22 a 25 de outubro, 2012 88 BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES. Andrios Robert Silva Pereira, Renato Zanutto

Leia mais

Unidade 1: O Painel de Controle do Excel *

Unidade 1: O Painel de Controle do Excel * Unidade 1: O Painel de Controle do Excel * material do 2010* 1.0 Introdução O Excel nos ajuda a compreender melhor os dados graças à sua organização em células (organizadas em linhas e colunas) e ao uso

Leia mais

FERRAMENTAS DE COLABORAÇÃO CORPORATIVA

FERRAMENTAS DE COLABORAÇÃO CORPORATIVA FERRAMENTAS DE COLABORAÇÃO CORPORATIVA Manual de Utilização Google Grupos Sumário (Clique sobre a opção desejada para ir direto à página correspondente) Utilização do Google Grupos Introdução... 3 Página

Leia mais

SISTEMAS DE INFORMAÇÃO GERENCIAL

SISTEMAS DE INFORMAÇÃO GERENCIAL SISTEMAS DE INFORMAÇÃO GERENCIAL 2015 Sabemos que as empresas atualmente utilizam uma variedade muito grande de sistemas de informação. Se você analisar qualquer empresa que conheça, constatará que existem

Leia mais

II Torneio de Programação em LabVIEW

II Torneio de Programação em LabVIEW Desenvolvimento da Aplicação II Torneio de Programação em LabVIEW Seção I: Requisitos Gerais A aplicação submetida deverá atender, pelo menos, às exigências de funcionamento descritas na Seção II deste

Leia mais

DATA WAREHOUSE. Introdução

DATA WAREHOUSE. Introdução DATA WAREHOUSE Introdução O grande crescimento do ambiente de negócios, médias e grandes empresas armazenam também um alto volume de informações, onde que juntamente com a tecnologia da informação, a correta

Leia mais

Modelo de dados do Data Warehouse

Modelo de dados do Data Warehouse Modelo de dados do Data Warehouse Ricardo Andreatto O modelo de dados tem um papel fundamental para o desenvolvimento interativo do data warehouse. Quando os esforços de desenvolvimentos são baseados em

Leia mais

Aula 01 - Formatações prontas e condicionais. Aula 01 - Formatações prontas e condicionais. Sumário. Formatar como Tabela

Aula 01 - Formatações prontas e condicionais. Aula 01 - Formatações prontas e condicionais. Sumário. Formatar como Tabela Aula 01 - Formatações prontas e Sumário Formatar como Tabela Formatar como Tabela (cont.) Alterando as formatações aplicadas e adicionando novos itens Removendo a formatação de tabela aplicada Formatação

Leia mais

Guia do Wattbike Expert Software para Iniciantes

Guia do Wattbike Expert Software para Iniciantes Guia do Wattbike Expert Software para Iniciantes 1 Índice Introdução............................................... 3 Conexão do software ao Computador de Desempenho Wattbike tela padrão Polar e edição

Leia mais

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS VINICIUS DA SILVEIRA SEGALIN FLORIANÓPOLIS OUTUBRO/2013 Sumário

Leia mais

MANUAL DO PRESTADOR FATURAMENTO WEB

MANUAL DO PRESTADOR FATURAMENTO WEB MANUAL DO PRESTADOR FATURAMENTO WEB 0 Sumário Introdução... 2 Funcionalidades... 2 Requisitos Necessários... 2 Faturamento Web... 3 Faturamento Simplificado... 4 Faturamento Detalhado... 9 Faturamento

Leia mais

MANUAL DO USUÁRIO. Ferramenta de Fidelização Eletrônica ÁGUA DOCE - SABORES DO BRASIL

MANUAL DO USUÁRIO. Ferramenta de Fidelização Eletrônica ÁGUA DOCE - SABORES DO BRASIL MANUAL DO USUÁRIO Ferramenta de Fidelização Eletrônica ÁGUA DOCE - SABORES DO BRASIL Interface de Controle Franqueado http://abf.e-deploy.com.br/controle/ Versão 1.0 Conteúdo Sobre a e-deploy... 3 Sobre

Leia mais

Microsoft Excel 2000. Alan Cleber Borim - alan.borim@poli.usp.br. http://www.pcs.usp.br/~alan

Microsoft Excel 2000. Alan Cleber Borim - alan.borim@poli.usp.br. http://www.pcs.usp.br/~alan Microsoft Excel 2000 Alan Cleber Borim - alan.borim@poli.usp.br http://www.pcs.usp.br/~alan Microsoft Índice 1.0 Microsoft Excel 2000 3 1.1 Acessando o Excel 3 1.2 Como sair do Excel 3 1.3 Elementos da

Leia mais

G-Bar. Módulo Básico Versão 4.0

G-Bar. Módulo Básico Versão 4.0 G-Bar Software para Gerenciamento de Centrais de Corte e Dobra de Aço Módulo Básico Versão 4.0 Pedidos de Vendas Manual do Usuário 1 As informações contidas neste documento, incluindo links, telas e funcionamento

Leia mais

Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados

Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Um Sistema Gerenciador de Banco de Dados (SGBD) é constituído por um conjunto de dados associados a um conjunto de programas para acesso a esses

Leia mais

Presskit Guia Rápido. Release 2.0. Presskit

Presskit Guia Rápido. Release 2.0. Presskit Presskit Guia Rápido Release 2.0 Presskit 06/07/2009 Sumário 1 Login 2 Login e Senha...................................... 2 Esqueci minha senha.................................. 2 Fale Com o Suporte...................................

Leia mais

Exemplo de Aplicação do DataMinig

Exemplo de Aplicação do DataMinig Exemplo de Aplicação do DataMinig Felipe E. Barletta Mendes 19 de fevereiro de 2008 INTRODUÇÃO AO DATA MINING A mineração de dados (Data Mining) está inserida em um processo maior denominado Descoberta

Leia mais

A Estação da Evolução

A Estação da Evolução Microsoft Excel 2010, o que é isto? Micorsoft Excel é um programa do tipo planilha eletrônica. As planilhas eletrônicas são utilizadas pelas empresas pra a construção e controle onde a função principal

Leia mais

SISTEMAS DE INFORMAÇÃO GERENCIAIS

SISTEMAS DE INFORMAÇÃO GERENCIAIS SISTEMAS DE INFORMAÇÃO GERENCIAIS O PODER DA INFORMAÇÃO Tem PODER quem toma DECISÃO Toma DECISÃO correta quem tem SABEDORIA Tem SABEDORIA quem usa CONHECIMENTO Tem CONHECIMENTO quem possui INFORMAÇÃO (Sem

Leia mais

ÍNDICE... 3 INTRODUÇÃO... 4. A série... 4

ÍNDICE... 3 INTRODUÇÃO... 4. A série... 4 EXCEL 2007 e 2010 2 ÍNDICE ÍNDICE... 3 INTRODUÇÃO... 4 A série... 4 01 LISTA COM VALIDAÇÃO... 5 02 FUNÇÕES FINANCEIRAS... 7 03 FUNÇÃO DE BANCO DE DADOS... 12 04 RÓTULOS... 15 05 TABELA DINÂMICA... 18 06

Leia mais

Data Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento

Data Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento Data Mining Prof Luiz Antonio do Nascimento Data Mining Ferramenta utilizada para análise de dados para gerar, automaticamente, uma hipótese sobre padrões e anomalias identificadas para poder prever um

Leia mais

Módulo 4: Gerenciamento de Dados

Módulo 4: Gerenciamento de Dados Módulo 4: Gerenciamento de Dados 1 1. CONCEITOS Os dados são um recurso organizacional decisivo que precisa ser administrado como outros importantes ativos das empresas. A maioria das organizações não

Leia mais

Gerencie Carteira - PF

Gerencie Carteira - PF Gerencie Carteira - PF Mais negócios para a sua empresa, com melhor resultado e o risco sob controle. Manual do Produto Manual do Produto 1 Índice Produto 02 Meio de acesso 02 Carteira de Clientes Pessoa

Leia mais

APRESENTAÇÃO DO PRODUTO. Mais que um software, o método mais eficaz para conciliar.

APRESENTAÇÃO DO PRODUTO. Mais que um software, o método mais eficaz para conciliar. APRESENTAÇÃO DO PRODUTO Mais que um software, o método mais eficaz para conciliar. Com Conciliac é possível conciliar automaticamente qualquer tipo de transação; Bancos, Cartões de Crédito e Débito, Contas

Leia mais

CSF Designer Intuition SOLUÇÕES DE OUTPUT FIS

CSF Designer Intuition SOLUÇÕES DE OUTPUT FIS SOLUÇÕES DE OUTPUT FIS O CSF Designer Intuition TM da FIS ajuda organizações que lidam com o cliente a criar, de forma instantânea e interativa, documentos comerciais respeitando as regulações vigentes,

Leia mais

Apostilas OBJETIVA Escrevente Técnico Judiciário TJ Tribunal de Justiça do Estado de São Paulo - Concurso Público 2015. Índice

Apostilas OBJETIVA Escrevente Técnico Judiciário TJ Tribunal de Justiça do Estado de São Paulo - Concurso Público 2015. Índice Índice Caderno 2 PG. MS-Excel 2010: estrutura básica das planilhas, conceitos de células, linhas, colunas, pastas e gráficos, elaboração de tabelas e gráficos, uso de fórmulas, funções e macros, impressão,

Leia mais

Manual Easy Chat Data de atualização: 20/12/2010 16:09 Versão atualizada do manual disponível na área de download do software.

Manual Easy Chat Data de atualização: 20/12/2010 16:09 Versão atualizada do manual disponível na área de download do software. 1 - Sumário 1 - Sumário... 2 2 O Easy Chat... 3 3 Conceitos... 3 3.1 Perfil... 3 3.2 Categoria... 4 3.3 Ícone Específico... 4 3.4 Janela Específica... 4 3.5 Ícone Geral... 4 3.6 Janela Geral... 4 4 Instalação...

Leia mais

Guia Rápido de Uso. Aqui seguem os tópicos tratados nesse guia, para que você aprenda a usar o Sistema HOT SMS. SUMÁRIO

Guia Rápido de Uso. Aqui seguem os tópicos tratados nesse guia, para que você aprenda a usar o Sistema HOT SMS. SUMÁRIO 1 Guia Rápido de Uso Aqui seguem os tópicos tratados nesse guia, para que você aprenda a usar o Sistema HOT SMS. SUMÁRIO 1 Acesso ao sistema...3 2 Entenda o Menu...4 3 Como enviar torpedos...6 3.1 Envio

Leia mais

Dicas para usar melhor o Word 2007

Dicas para usar melhor o Word 2007 Dicas para usar melhor o Word 2007 Quem está acostumado (ou não) a trabalhar com o Word, não costuma ter todo o tempo do mundo disponível para descobrir as funcionalidades de versões recentemente lançadas.

Leia mais

Manual do Usuário. SCA - Sistema de Controle de Acesso

Manual do Usuário. SCA - Sistema de Controle de Acesso Manual do Usuário SCA - Sistema de Controle de Acesso Equipe-documentacao@procergs.rs.gov.br Data: Julho/2012 Este documento foi produzido por Praça dos Açorianos, s/n CEP 90010-340 Porto Alegre, RS (51)

Leia mais

Microsoft Innovation Center

Microsoft Innovation Center Microsoft Innovation Center Mineração de Dados (Data Mining) André Montevecchi andre@montevecchi.com.br Introdução Objetivo BI e Mineração de Dados Aplicações Exemplos e Cases Algoritmos para Mineração

Leia mais

Prova INSS RJ - 2007 cargo: Fiscal de Rendas

Prova INSS RJ - 2007 cargo: Fiscal de Rendas Prova INSS RJ - 2007 cargo: Fiscal de Rendas Material de Apoio de Informática - Prof(a) Ana Lucia 53. Uma rede de microcomputadores acessa os recursos da Internet e utiliza o endereço IP 138.159.0.0/16,

Leia mais

MANUAL DO GERENCIADOR ESCOLAR WEB

MANUAL DO GERENCIADOR ESCOLAR WEB CNS LEARNING MANUAL DO GERENCIADOR ESCOLAR WEB Versão Online 13 Índice ÍNDICE... 1 VISÃO GERAL... 2 CONCEITO E APRESENTAÇÃO VISUAL... 2 PRINCIPAIS MÓDULOS... 3 ESTRUTURAÇÃO... 3 CURSOS... 4 TURMAS... 4

Leia mais

Portal Contador Parceiro

Portal Contador Parceiro Portal Contador Parceiro Manual do Usuário Produzido por: Informática Educativa 1. Portal Contador Parceiro... 03 2. Acesso ao Portal... 04 3. Profissionais...11 4. Restrito...16 4.1 Perfil... 18 4.2 Artigos...

Leia mais

Versão 2.2.0 PIMACO AUTOADESIVOS LTDA. Assistente Pimaco + 2.2.0. Ajuda ao Usuário

Versão 2.2.0 PIMACO AUTOADESIVOS LTDA. Assistente Pimaco + 2.2.0. Ajuda ao Usuário Versão 2.2.0 PIMACO AUTOADESIVOS LTDA. Assistente Pimaco + 2.2.0 Ajuda ao Usuário A S S I S T E N T E P I M A C O + 2.2.0 Ajuda ao usuário Índice 1. BÁSICO 1 1. INICIANDO O APLICATIVO 2 2. O AMBIENTE DE

Leia mais

CPqD Gestão Pública. Gestão Escolar Guia de treinamento. Versão do produto: 4.0.0 Edição do documento: 2.0 Abril de 2010

CPqD Gestão Pública. Gestão Escolar Guia de treinamento. Versão do produto: 4.0.0 Edição do documento: 2.0 Abril de 2010 CPqD Gestão Pública Gestão Escolar Guia de treinamento Versão do produto: 4.0.0 Edição do documento: 2.0 Abril de 2010 CPqD Gestão Pública Gestão Escolar Guia de treinamento Versão do produto: 4.0.0 Edição

Leia mais

Requisitos de Software

Requisitos de Software Requisitos de Software Ian Sommerville 2006 Engenharia de Software, 8ª. edição. Capítulo 6 Slide 1 Objetivos Apresentar os conceitos de requisitos de usuário e de sistema Descrever requisitos funcionais

Leia mais

V 1.0 LINAEDUCA - GUIA DE USO

V 1.0 LINAEDUCA - GUIA DE USO V 1.0 LINAEDUCA - GUIA DE USO ARGO Internet ARGO.com.br 2013 Sumário 1. Instalação... 2 1.1 Windows... 2 2 Guia de Uso... 5 2.1 Inicialização... 5 2.1.1 Modo Casa... 5 2.1.2 Modo escola... 6 2.2 Cadastro

Leia mais

ÍNDICE. Sobre o SabeTelemarketing 03. Contato. Ícones comuns à várias telas de gerenciamento. Verificar registros 09. Tela de relatórios 09

ÍNDICE. Sobre o SabeTelemarketing 03. Contato. Ícones comuns à várias telas de gerenciamento. Verificar registros 09. Tela de relatórios 09 ÍNDICE Sobre o SabeTelemarketing 03 Ícones comuns à várias telas de gerenciamento Contato Verificar registros 09 Telas de cadastro e consultas 03 Menu Atalho Nova pessoa Incluir um novo cliente 06 Novo

Leia mais

Universidade Federal de Santa Catarina CAPÍTULO 6 GRÁFICOS NO EXCEL.

Universidade Federal de Santa Catarina CAPÍTULO 6 GRÁFICOS NO EXCEL. CAPÍTULO 6 GRÁFICOS NO EXCEL. Um gráfico no Excel é uma representação gráfica dos números de sua planilha - números transformados em imagens. O Excel examina um grupo de células que tenham sido selecionadas.

Leia mais

Manual de Utilização da Ferramenta de Envio e Gerenciamento de SMS. GFILA OPS Network

Manual de Utilização da Ferramenta de Envio e Gerenciamento de SMS. GFILA OPS Network Manual de Utilização da Ferramenta de Envio e Gerenciamento de SMS GFILA OPS Network Índice 1 Entrando no Sistema... 3 2 Logado como usuário Revenda... 3 3 Logado como usuário Cliente... 5 4 Tipos de campanhas

Leia mais

Manual. Pedido Eletrônico

Manual. Pedido Eletrônico Manual Pedido Eletrônico ÍNDICE 1. Download... 3 2. Instalação... 4 3. Sistema de Digitação SantaCruz... 8 3.1. Configuração... 8 4. Utilização do Sistema Digitação SantaCruz... 11 4.1. Atualizar cadastros...11

Leia mais

KDD UMA VISAL GERAL DO PROCESSO

KDD UMA VISAL GERAL DO PROCESSO KDD UMA VISAL GERAL DO PROCESSO por Fernando Sarturi Prass 1 1.Introdução O aumento das transações comerciais por meio eletrônico, em especial as feitas via Internet, possibilitou as empresas armazenar

Leia mais

Informática Aplicada. Aula 2 Windows Vista. Professora: Cintia Caetano

Informática Aplicada. Aula 2 Windows Vista. Professora: Cintia Caetano Informática Aplicada Aula 2 Windows Vista Professora: Cintia Caetano AMBIENTE WINDOWS O Microsoft Windows é um sistema operacional que possui aparência e apresentação aperfeiçoadas para que o trabalho

Leia mais

Concepção e Elaboração

Concepção e Elaboração UNIVERSIDADE ESTADUAL PAULISTA INSTITUTO DE BIOCIÊNCIAS, LETRAS E CIÊNCIAS EXATAS DEPARTAMENTO DE CIÊNCIAS DE COMPUTAÇÃO E ESTATÍSTICA Análise e Projeto Orientado a Objetos Concepção e Elaboração Estudo

Leia mais

Lidar com números e estatísticas não é fácil. Reunir esses números numa apresentação pode ser ainda mais complicado.

Lidar com números e estatísticas não é fácil. Reunir esses números numa apresentação pode ser ainda mais complicado. , ()! $ Lidar com números e estatísticas não é fácil. Reunir esses números numa apresentação pode ser ainda mais complicado. Uma estratégia muito utilizada para organizar visualmente informações numéricas

Leia mais

Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence

Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence É um conjunto de conceitos e metodologias que, fazem uso de acontecimentos e sistemas e apoiam a tomada de decisões. Utilização de várias fontes de informação para se definir estratégias de competividade

Leia mais

5 Estudo de Caso. 5.1. Material selecionado para o estudo de caso

5 Estudo de Caso. 5.1. Material selecionado para o estudo de caso 5 Estudo de Caso De modo a ilustrar a estruturação e representação de conteúdos educacionais segundo a proposta apresentada nesta tese, neste capítulo apresentamos um estudo de caso que apresenta, para

Leia mais

FERRAMENTAS DE COLABORAÇÃO CORPORATIVA

FERRAMENTAS DE COLABORAÇÃO CORPORATIVA FERRAMENTAS DE COLABORAÇÃO CORPORATIVA Criação de Formulários no Google Drive Sumário (Clique sobre a opção desejada para ir direto à página correspondente) Criação de Formulários no Google Drive Introdução...

Leia mais

Departamento de Tecnologia da Informação DTI Coordenadoria de Relacionamento com o Cliente CRC. Treinamento Básico do Correio Eletrônico

Departamento de Tecnologia da Informação DTI Coordenadoria de Relacionamento com o Cliente CRC. Treinamento Básico do Correio Eletrônico Departamento de Tecnologia da Informação DTI Coordenadoria de Relacionamento com o Cliente CRC Treinamento Básico do Correio Eletrônico Brasília Março de 2012 SUMÁRIO 1. Introdução... 3 1.1 Como acessar

Leia mais

Informática Aplicada

Informática Aplicada Informática Aplicada SO Windows Aula 3 Prof. Walteno Martins Parreira Jr www.waltenomartins.com.br waltenomartins@yahoo.com 2014 APRESENTAÇÃO Todo computador precisa de um sistema operacional. O Windows

Leia mais

Rational Quality Manager. Nome: Raphael Castellano Campus: AKXE Matrícula: 200601124831

Rational Quality Manager. Nome: Raphael Castellano Campus: AKXE Matrícula: 200601124831 Rational Quality Manager Nome: Raphael Castellano Campus: AKXE Matrícula: 200601124831 1 Informações Gerais Informações Gerais sobre o RQM http://www-01.ibm.com/software/awdtools/rqm/ Link para o RQM https://rqmtreina.mvrec.local:9443/jazz/web/console

Leia mais

Visão Geral dos Sistemas de Informação

Visão Geral dos Sistemas de Informação Visão Geral dos Sistemas de Informação Existem muitos tipos de sistemas de informação no mundo real. Todos eles utilizam recursos de hardware, software, rede e pessoas para transformar os recursos de dados

Leia mais

Assim que o usuário entrar nesta ferramenta do sistema a seguinte tela será exibida:

Assim que o usuário entrar nesta ferramenta do sistema a seguinte tela será exibida: O que é o TDMax Web Commerce? O TDMax Web Commerce é uma ferramenta complementar no sistemas de Bilhetagem Eletrônica, tem como principal objetivo proporcionar maior conforto as empresas compradoras de

Leia mais

IF685 Gerenciamento de Dados e Informação - Prof. Robson Fidalgo 1

IF685 Gerenciamento de Dados e Informação - Prof. Robson Fidalgo 1 IF685 Gerenciamento de Dados e Informação - Prof. Robson Fidalgo 1 Banco de Dados Introdução Por: Robson do Nascimento Fidalgo rdnf@cin.ufpe.br IF685 Gerenciamento de Dados e Informação - Prof. Robson

Leia mais

CICLO DE APERFEIÇOAMENTO PROFISSIONAL DOS SERVIDORES MUNICIPAIS DE MARICÁ- RJ EDITOR DE TEXTO - WORD

CICLO DE APERFEIÇOAMENTO PROFISSIONAL DOS SERVIDORES MUNICIPAIS DE MARICÁ- RJ EDITOR DE TEXTO - WORD Faculdade de Administração, Ciências Contábeis e Turismo Pós-Graduação em Gestão de Negócios CICLO DE APERFEIÇOAMENTO PROFISSIONAL DOS SERVIDORES MUNICIPAIS DE MARICÁ- RJ EDITOR DE TEXTO - WORD EMENTA

Leia mais

Utilização de Técnicas de Mineração de Dados como Auxílio na Detecção de Cartéis em Licitações Carlos Vinícius Sarmento Silva Célia Ghedini Ralha

Utilização de Técnicas de Mineração de Dados como Auxílio na Detecção de Cartéis em Licitações Carlos Vinícius Sarmento Silva Célia Ghedini Ralha WCGE II Workshop de Computação Aplicada em Governo Eletrônico Utilização de Técnicas de Mineração de Dados como Auxílio na Detecção de Cartéis em Licitações Carlos Vinícius Sarmento Silva Célia Ghedini

Leia mais

Guia Rápido. Projects & Teamwork

Guia Rápido. Projects & Teamwork Guia Rápido Projects & Teamwork Conteúdo 1. Meu Perfil, tutoriais y ajuda contextual... 3 2. Criar projetos... 6 3. Criar usuários e atribuir usuários a projetos e tarefas... 7 4. Criar e controlar tarefas...10

Leia mais

Passo a Passo do Cadastro Produtos no SIGLA Digital

Passo a Passo do Cadastro Produtos no SIGLA Digital Página 1 de 15 Passo a Passo do Cadastro Produtos no SIGLA Digital O cadastro de produtos permite organizar as informações relativas a produtos e serviços, como grupo, marca, peso, unidades e outros, que

Leia mais

Manual TDMax Web Commerce VERSÃO: 0.1

Manual TDMax Web Commerce VERSÃO: 0.1 Manual TDMax Web Commerce VERSÃO: 0.1 Sumário Visão geral Bilhetagem Eletrônica... 3 1 TDMax Web Commerce... 4 1.1 Requisitos e orientações gerais... 4 2 Acesso... 5 2.1 Como realizar um cadastro usuário

Leia mais

AULA 3: BrOffice Writer Numeração de páginas e outros comandos. Ao final dessa aula, você deverá ser capaz de:

AULA 3: BrOffice Writer Numeração de páginas e outros comandos. Ao final dessa aula, você deverá ser capaz de: AULA 3: BrOffice Writer Numeração de páginas e outros comandos Objetivo Ao final dessa aula, você deverá ser capaz de: Conhecer o controle de exibição do documento; Fazer a correção ortográfica do documento

Leia mais

Produto IV: ATU SAAP. Manual de Referência

Produto IV: ATU SAAP. Manual de Referência Produto IV: ATU SAAP Manual de Referência Pablo Nogueira Oliveira Termo de Referência nº 129275 Contrato Número 2008/000988 Brasília, 30 de outubro de 2008 1 Sistema de Apoio à Ativideade Parlamentar SAAP

Leia mais

MANUAL DO USUÁRIO. Ferramenta de Fidelização Eletrônica ÁGUA DOCE SABORES DO BRASIL. Interface de OPERAÇÃO (no caixa)

MANUAL DO USUÁRIO. Ferramenta de Fidelização Eletrônica ÁGUA DOCE SABORES DO BRASIL. Interface de OPERAÇÃO (no caixa) MANUAL DO USUÁRIO Ferramenta de Fidelização Eletrônica ÁGUA DOCE SABORES DO BRASIL Interface de OPERAÇÃO (no caixa) http://abf.e-deploy.com.br/operacao/ Versão 1.0 Conteúdo Sobre o programa fidelidade

Leia mais

Sincronização do Catálogo de Endereços no MDaemon 6.x com o uso do ComAgent, LDAP, MAPI e WAB

Sincronização do Catálogo de Endereços no MDaemon 6.x com o uso do ComAgent, LDAP, MAPI e WAB Sincronização do Catálogo de Endereços no MDaemon 6.x com o uso do ComAgent, LDAP, MAPI e WAB Alt-N Technologies, Ltd 1179 Corporate Drive West, #103 Arlington, TX 76006 Tel: (817) 652-0204 2002 Alt-N

Leia mais

Análise de Regressão. Tópicos Avançados em Avaliação de Desempenho. Cleber Moura Edson Samuel Jr

Análise de Regressão. Tópicos Avançados em Avaliação de Desempenho. Cleber Moura Edson Samuel Jr Análise de Regressão Tópicos Avançados em Avaliação de Desempenho Cleber Moura Edson Samuel Jr Agenda Introdução Passos para Realização da Análise Modelos para Análise de Regressão Regressão Linear Simples

Leia mais

Introdução à Programação de Computadores

Introdução à Programação de Computadores 1. Objetivos Introdução à Programação de Computadores Nesta seção, vamos discutir os componentes básicos de um computador, tanto em relação a hardware como a software. Também veremos uma pequena introdução

Leia mais

Tutorial do Iniciante. Excel Básico 2010

Tutorial do Iniciante. Excel Básico 2010 Tutorial do Iniciante Excel Básico 2010 O QUE HÁ DE NOVO O Microsoft Excel 2010 é um programa de edição de planilhas eletrônicas muito usado no mercado de trabalho para realizar diversas funções como;

Leia mais

SISTEMAS DE NEGÓCIOS B) INFORMAÇÃO GERENCIAL

SISTEMAS DE NEGÓCIOS B) INFORMAÇÃO GERENCIAL 1 SISTEMAS DE NEGÓCIOS B) INFORMAÇÃO GERENCIAL 1. SISTEMAS DE INFORMAÇÃO GERENCIAL (SIG) Conjunto integrado de pessoas, procedimentos, banco de dados e dispositivos que suprem os gerentes e os tomadores

Leia mais

Guia Rápido de Utilização. Ambiente Virtual de Aprendizagem. Perfil Aluno

Guia Rápido de Utilização. Ambiente Virtual de Aprendizagem. Perfil Aluno Guia Rápido de Utilização Ambiente Virtual de Aprendizagem Perfil Aluno 2015 APRESENTAÇÃO O Moodle é um Ambiente Virtual de Aprendizagem (AVA) open source¹. Esta Plataforma tornouse popular e hoje é utilizada

Leia mais

SisLegis Sistema de Cadastro e Controle de Leis

SisLegis Sistema de Cadastro e Controle de Leis Sistema de Cadastro e Controle de Leis Desenvolvido por Fábrica de Software Coordenação de Tecnologia da Informação Pág 1/22 Módulo: 1 Responsável: Desenvolvimento Ti Data: 01/11/2012 Versão: 1.0 Empresa:

Leia mais

Documentação. Programa de Evolução Contínua Versão 1.80

Documentação. Programa de Evolução Contínua Versão 1.80 Documentação Programa de Evolução Contínua Versão 1.80 Sumário Resumo das Novidades... 3 Configuração das Novidades... 5 Sistema de Compra Recorrente... 5 Novo sistema de importação de Tabelas de Frete...

Leia mais