UNIVERSIDADE FEDERAL FLUMINENSE LUIZ HENRIQUE DE CAMPOS MERSCHMANN CLASSIFICAÇÃO PROBABILÍSTICA BASEADA EM ANÁLISE DE PADRÕES

Tamanho: px
Começar a partir da página:

Download "UNIVERSIDADE FEDERAL FLUMINENSE LUIZ HENRIQUE DE CAMPOS MERSCHMANN CLASSIFICAÇÃO PROBABILÍSTICA BASEADA EM ANÁLISE DE PADRÕES"

Transcrição

1 UNIVERSIDADE FEDERAL FLUMINENSE LUIZ HENRIQUE DE CAMPOS MERSCHMANN CLASSIFICAÇÃO PROBABILÍSTICA BASEADA EM ANÁLISE DE PADRÕES NITERÓI 2007

2 UNIVERSIDADE FEDERAL FLUMINENSE LUIZ HENRIQUE DE CAMPOS MERSCHMANN CLASSIFICAÇÃO PROBABILÍSTICA BASEADA EM ANÁLISE DE PADRÕES Tese de Doutorado submetida ao Programa de Pós-Graduação em Computação da Universidade Federal Fluminense como requisito parcial para a obtenção do título de Doutor. Área de concentração: Otimização Combinatória. Orientador: Alexandre Plastino de Carvalho NITERÓI 2007

3 CLASSIFICAÇÃO PROBABILÍSTICA BASEADA EM ANÁLISE DE PADRÕES Luiz Henrique de Campos Merschmann Tese de Doutorado submetida ao Programa de Pós-Graduação em Computação da Universidade Federal Fluminense como requisito parcial para a obtenção do título de Doutor. Aprovada por: Alexandre Plastino de Carvalho, D.Sc. / IC-UFF (Presidente) Nelson Francisco Favilla Ebecken, D.Sc. / COPPE-UFRJ Andre Carlos Ponce de Leon Ferreira de Carvalho, Ph.D. / ICMC-USP Ana Cristina Bicharra Garcia, Ph.D. / IC-UFF Bianca Zadrozny, Ph.D. / IC-UFF Niterói, 28 de agosto de 2007.

4 Dedico este trabalho à minha mãe, que perdeu noites de sono para que eu dormisse tranqüilo e sonhasse, que acreditou em mim, dando-me conança para que eu lutasse pelos meus sonhos, e que chorou de saudade quando a realização desses sonhos implicou em car longe de mim.

5 Agradecimentos Muitas pessoas contribuíram para que eu concluísse com êxito esta tese de doutorado. Por isso, seguem os meus sinceros agradecimentos a todos que, direta ou indiretamente, me auxiliaram nessa conquista. Inicialmente, agradeço aos meus pais, que não pouparam esforços para que eu pudesse alcançar os meus objetivos. Agradeço especialmente por terem me ensinado que, mesmo nos momentos mais difíceis, não devemos desistir de nossos sonhos. À minha amada Michelle, que com amor, carinho e paciência, compartilhou comigo todas as alegrias e tristezas vividas durante o doutorado. A sua presença iluminou cada instante de nossas vidas durante essa jornada. Ao professor Alexandre Plastino, orientador deste trabalho, por ter aceitado me orientar, pela amizade, paciência e apoio em todos os momentos necessários. Certamente, o seu entusiasmo como pesquisador e a sua postura prossional servirão como exemplo para mim por toda a vida. Aos professores e funcionários da UFF, que muito contribuíram para a minha formação acadêmica. Agradeço de forma especial ao professor Luiz Satoru Ochi, pelo auxílio nos primeiros anos do doutorado, e aos professores que participaram da banca de avaliação desta tese. A todos os amigos que conviveram comigo no Laboratório de Computação da Pós- Graduação, pelo incentivo e companheirismo. Aos amigos Haroldo Gambini Santos e Euler Horta Marinho, que com sábias palavras, muito me ajudaram na vida acadêmica e pessoal. Aos meus familiares, pelo inestimável apoio, incentivo e carinho.

6 Resumo Classicação é uma das tarefas de Mineração de Dados que tem se mostrado útil em diversas áreas de aplicação, em particular, na área de Bioinformática. A revolução genômica resultou em um crescimento exponencial da quantidade de dados biológicos gerados pela comunidade cientíca. Com a nalidade de armazenar toda essa informação biológica gerada, foram criados os bancos de dados biológicos. A necessidade por ferramentas computacionais capazes de realizar análises nesses dados tornou-se cada vez mais evidente, fazendo com que técnicas de mineração de dados começassem a ser empregadas. O trabalho desta tese concentra-se na tarefa de classicação e, inicialmente, na sua aplicação em bioinformática. O objetivo inicial é apresentar um método de classicação de proteínas computacionalmente eciente e capaz de alcançar altas taxas de acurácia, superando resultados apresentados anteriormente na literatura. Os bons resultados, em termos de acurácia preditiva e tempo computacional, obtidos a partir do método proposto nesta tese, demonstram o seu potencial para o problema de classicação de proteínas. Além disso, visando a construção de um classicador adequado para diversos tipos de aplicação, o método proposto inicialmente para o problema de classicação de proteínas foi estendido e mostrou-se eciente também quando utilizado com diferentes tipos de bases de dados pertencentes a aplicações distintas. Palavras-chave: mineração de dados, classicação, bioinformática.

7 Abstract Classication is a data mining task that has been useful in several application areas, particularly, in bioinformatics. The genomic revolution has resulted in an explosive growth of biological data generated by the scientic community. With the aim of storing all of these biological information, biological databases were created. The need for computational tools for analysing biological data becomes evident, resulting in the application of data mining methods in this eld. The work developed in this thesis is related to classication task and, initially, to its application to bioinformatics. The initial goal is to present a computationally ecient method for protein classication capable of yielding highly accurate results, outperforming the results obtained by previous works. The good results in terms of accuracy and time performance obtained by the proposed method show its potential for the protein classication problem. In addition, aiming to construct a suitable classier for several kinds of applications, the method proposed for the protein classication problem was extended, becoming appropriate and ecient for several databases associated with dierent applications. Keywords: data mining, classication, bioinformatics.

8 Glossário ARCS : Association Rule Clustering System; CAEP : Classication by Aggregating Emerging Patterns; CARs : Class Association Rules; CATH : Class/Architecture/Topology/Homology; CBA : Classication Based on Association; CFS : Correlation-based Feature Selection; GI : Ganho de Informação; EM : Expectation Maximization; EPs : Emerging Patterns; GPCR : G-Protein Coupled Receptors; HiSP : Highest Subset Probability; HiSP-Prot : Highest Subset Probability - for Protein Classication Problem; IC : Instituto de Computação; JEP : Jumping Emerging Pattern; KDD : Knowledge Discovery in Database; k-nn : k-nearest Neighbor; MEME : Multiple Expectation Maximization for Motif Elicitation; MS SQL : Microsoft Structured Query Language; NB : NaiveBayes; PCP : Protein Classication Problem; PDB : Protein Data Bank; PIR : Protein Identication Resource; RNA : Redes Neural Articial; SCOP : Structural Classication of Proteins; SVM : Support Vector Machines; UCI : University of California, Irvine; UFF : Universidade Federal Fluminense;

9 Sumário Lista de Figuras Lista de Tabelas x xi 1 Introdução 1 2 Técnicas e Algoritmos de Classicação Introdução O Processo de Classicação Estimativa da Acurácia dos Modelos de Classicação Avaliação dos Métodos de Classicação Pré-Processamento dos Dados Discretização de Atributos Valores Desconhecidos de Atributos Seleção de Atributos Métodos e Algoritmos de Classicação Classicação por Indução de Árvores de Decisão Indução de Árvores de Decisão Extração de Regras de Classicação Considerações Adicionais sobre Árvores de Decisão Classicação Bayesiana Teorema de Bayes Classicação Bayesiana Simples

10 Sumário viii Redes Bayesianas Considerações Adicionais sobre Classicadores Bayesianos Classicação Baseada em Conceitos de Regras de Associação ARCS Classicação Associativa CAEP Outros Classicadores Baseados em Conceitos de Regras de Associação Outros Métodos de Classicação k-nn Máquinas de Vetor de Suporte Classicação por Redes Neurais Classicação de Proteínas Considerações Iniciais O Problema de Classicação de Proteínas Bancos de Dados de Proteínas Trabalhos Relacionados O Método Proposto Avaliação do Método Proposto Avaliação Comparativa Avaliação do Impacto do Desbalanceamento de Classes das Bases de Dados na Classicação HiSP-Prot com Seleção de Motivos Generalização do HiSP-Prot Introdução Características do Método

11 Sumário ix 4.3 O Método Proposto Considerações Adicionais Resultados Experimentais Introdução Avaliação Comparativa Tempo Computacional e Escalabilidade Conclusões 92 Referências 97

12 Lista de Figuras 2.1 Espaço de soluções para um problema contendo quatro atributos [52] Árvore de decisão simples para avaliação de comportamento de consumidores Pseudocódigo do ID Etapa inicial da construção de uma árvore de decisão (a) Exemplo de uma rede Bayesiana e (b) Tabela de probabilidades condicionais da variável X Matriz bidimensional representando as características dos consumidores que compram computadores Hiperplano ótimo para classes linearmente separáveis Exemplo de uma rede neural. A instância de treinamento X = {x 1, x 2,..., x i } está alimentando a rede. Os pesos estão representados por w ji e w kj Exemplo de base de dados de proteína Pseudocódigo do HiSP-Prot Pseudocódigo do pré-processador do HiSP-Prot Comportamento do valor do limite mínimo Pseudocódigo do HiSP Escalabilidade segundo o número de instâncias

13 Lista de Tabelas 2.1 Base de dados de treinamento (*) Cálculo de entropia Base de dados de treinamento Resultados da avaliação comparativa Resultados de desempenho do HiSP-Prot Distribuição das proteínas entre as classes Resultados experimentais do HiSP-Prot com e sem seleção de motivos Resultados de acurácia para as bases de dados do Grupo Comparação do HiSP com as outras técnicas Número de atributos selecionados Resultados de acurácia para as bases de dados do Grupo 2 (todos os métodos utilizaram as bases reduzidas a partir da técnica Correlation-based Feature Selection) Resultados de acurácia para as bases de dados do Grupo 2 (somente o HiSP utilizou as bases reduzidas a partir da técnica Correlation-based Feature Selection) Comparação do HiSP com as outras técnicas Resultados de acurácia para as bases de dados do Grupo 2 (todos os métodos utilizaram as bases reduzidas a partir da técnica Consistency-based Feature Selection) Resultados de acurácia para as bases de dados do Grupo 2 (somente o HiSP utilizou as bases reduzidas a partir da técnica Consistency-based Feature Selection) Comparação do HiSP com as outras técnicas

14 Lista de Tabelas xii 5.10 Resultados de acurácia para as bases de dados do Grupo 2 (todos os métodos utilizaram as bases reduzidas a partir da técnica Information Gain Attribute Ranking) Resultados de acurácia para as bases de dados do Grupo 2 (somente o HiSP utilizou as bases reduzidas a partir da técnica Information Gain Attribute Ranking) Comparação do HiSP com as outras técnicas Tempo de CPU do HiSP para as bases de dados do Grupo Tempo de CPU do HiSP para as bases de dados do Grupo

15 Capítulo 1 Introdução A quantidade de dados disponível no mundo, em ambientes computacionais, tem aumentado consideravelmente a cada dia. A necessidade por ferramentas computacionais capazes de analisar esses dados motivou o surgimento da área de pesquisa e aplicação em ciência da computação conhecida como mineração de dados [29]. Processos de mineração de dados permitem a transformação de dados, uma matéria bruta, em informação e conhecimento úteis em diversas áreas de aplicação, tais como administração, nanças, saúde, educação, marketing, entre outras. O progresso vericado na tecnologia de hardware de computadores e nas técnicas de processamento, armazenamento e transmissão de informações digitais propiciou o acúmulo de grandes quantidades de dados históricos nas últimas décadas, motivando, a partir de 1990, o desenvolvimento de técnicas e ferramentas especícas de mineração de dados. Tais ferramentas realizam análises em dados com o objetivo de extrair informações novas e úteis. De forma simples, tarefas em mineração de dados podem ser denidas como processos automatizados de descoberta de novas informações a partir de grandes massas de dados armazenadas em bancos de dados, arquivos de texto, data warehouses, ou em algum outro repositório de dados. Sendo uma área de estudo extensa e interdisciplinar, a mineração de dados envolve a integração de conceitos e técnicas de diversas áreas, tais como: banco de dados, estatística, inteligência articial, visualização de dados e otimização. Apesar de alguns autores utilizarem o termo mineração de dados como sinônimo de KDD (Knowledge Discovery in Database) [29] processo de descoberta de conhecimento em bases de dados, outros consideram que a mineração de dados representa a etapa central desse processo maior denominado KDD. As outras etapas tratam, basicamente,

16 1 Introdução 2 do pré-processamento dos dados (seleção, limpeza e transformação) e pós-processamento da informação minerada (visualização e análise). Os problemas tratados em mineração de dados são resolvidos por dois grandes grupos de soluções ou tarefas: Tarefas descritivas: têm como objetivo encontrar padrões que descrevam os dados, permitindo sua análise. As principais tarefas descritivas são: Extração de Regras de Associação e Agrupamento (Clustering). Tarefas preditivas: realizam inferências sobre os dados existentes para predizer o comportamento de novos dados. As principais tarefas preditivas são: Classicação e Regressão. Classicação é uma das tarefas mais importantes em mineração de dados, sendo portanto objeto de inúmeras pesquisas. Os resultados apresentados nesta tese concentram-se nessa tarefa e na sua aplicação na área de bioinformática. Dentre as diversas áreas de aplicação das técnicas de mineração de dados, a bioinformática vem se destacando nas últimas décadas. Essa nova área de estudo, também surgida recentemente, trata do armazenamento, organização, análise, interpretação e utilização de informações provenientes de dados biológicos [92]. A revolução genômica resultou num crescimento exponencial da quantidade de dados biológicos gerados pela comunidade cientíca. Com a nalidade de armazenar toda essa informação biológica gerada, foram criados os bancos de dados biológicos [10]. A necessidade por ferramentas capazes de realizar análises nesses dados tornou-se evidente, fazendo com que técnicas de mineração de dados começassem a ser empregadas nesse contexto. Desse modo, diversas técnicas de mineração de dados vêm sendo propostas por pesquisadores para solucionar problemas biológicos [92], tais como: descobrir associações e correlações entre genes, localizar genes especícos em uma seqüência, predizer a estrutura ou a função de uma proteína, agrupar proteínas em famílias de seqüências relacionadas entre si, entre outros. Motivação e Objetivos do Trabalho A construção de classicadores precisos e computacionalmente ecientes para bases de dados grandes, em termos de volume e dimensão, é um importante desao da área de

17 1 Introdução 3 mineração de dados. O intenso interesse por esse tema fez com que diversas técnicas para construção de classicadores fossem propostas, tais como: árvores de decisão [71], k-nn (k-nearest Neighbor) [20], classicadores Bayesianos [26], redes neurais [39], máquinas de vetor de suporte (Support Vector Machines SVM) [89], entre outras. O problema de classicação de proteínas (Protein Classication Problem PCP) vem sendo objeto de vários trabalhos de pesquisa na área de bioinformática. Trata-se de uma importante tarefa para a biologia molecular, uma vez que, através da identicação da classe de uma proteína, é possível inferir quais são as suas funções. Algumas técnicas de classicação têm sido utilizadas com o intuito de predizer a função de proteínas a partir de suas composições de motivos (motifs) [38, 70, 91, 93]. Uma ferramenta computacional de pré-processamento e análise de dados genéticos, denominada GenMiner, foi apresentada em [38]. Nesse trabalho, árvores de decisão foram utilizadas para a classicação das proteínas. No trabalho proposto em [70], desenvolveu-se um algoritmo de indução de regras de classicação a partir de autômatos nitos. As propostas apresentadas em [91, 93] também exploraram a técnica de extração de árvores de decisão com o objetivo de extrair regras para classicar as proteínas. Apesar de esses trabalhos apresentarem resultados promissores para a tarefa de classicação de proteínas, evidenciando que as técnicas utilizadas foram adequadas para resolução do problema em questão, somente em [70] realizaramse experimentos englobando um grande conjunto de proteínas (aproximadamente 40000) armazenado no banco de dados biológico adotado o Prosite [45]. E para esse caso, o método proposto atingiu uma acurácia de somente 41,4%. Esse fato motivou a proposta inicial deste trabalho, cujo objetivo é apresentar um método de classicação de proteínas computacionalmente eciente e capaz de alcançar altas taxas de acurácia, superando resultados apresentados anteriormente, mesmo para bases de dados contendo um grande número de proteínas. Por realizar a classicação tomando como base probabilidades associadas a subconjuntos de valores de atributos que caracterizam as proteínas, o primeiro método proposto nesta tese foi denominado HiSP-Prot (Highest Subset Probability - for Protein Classication Problem). No HiSP-Prot, a classicação de instâncias é baseada em análise de padrões. Considerando que cada instância é descrita por um conjunto de atributos, um padrão corresponde a uma combinação de valores desses atributos que caracteriza uma determinada classe. A idéia central do método é classicar uma instância descobrindo-se quais subconjuntos dos seus valores de atributos melhor caracterizam alguma classe. Desse modo, o classicador

18 1 Introdução 4 atribui a uma nova instância a classe que melhor é descrita pelos seus subconjuntos de valores de atributos. As técnicas apresentadas em [38] e [70] para resolver o PCP foram escolhidas para uma avaliação comparativa com o HiSP-Prot, uma vez que essas abordagens apresentaram os melhores resultados experimentais. Os bons resultados obtidos na avaliação realizada nesta tese mostraram o potencial do método proposto para a resolução do PCP e motivaram a proposta de uma generalização do mesmo. Portanto, o segundo objetivo desta tese é estender o método proposto inicialmente para o PCP (HiSP-Prot), tornando-o adequado e eciente para diferentes tipos de bases de dados pertencentes a aplicações distintas. A generalização do HiSP-Prot foi denominada simplesmente HiSP (Highest Subset Probability). Para avaliar e validar o método HiSP a partir de bases de dados com características distintas e pertencentes a diferentes aplicações, 40 bases de dados de domínio público, freqüentemente utilizadas em experimentos de mineração de dados, foram selecionadas no repositório de dados UCI Machine Learning Repository [12]. A partir dessas bases, resultados que conrmam a eciência do HiSP são obtidos ao compará-lo com importantes técnicas de classicação, tais como: árvores de decisão, k-nn, classicação Bayesiana simples e classicação associativa. O restante desta tese está organizado como especicado a seguir. O Capítulo 2 contém uma denição do processo de classicação e uma revisão bibliográca sobre o tema. O Capítulo 3 apresenta o problema de classicação de proteínas, os trabalhos relacionados, o método proposto para solucionar esse problema, os experimentos computacionais realizados e a análise dos resultados obtidos. A generalização do método proposto para o problema de classicação de proteínas, com o objetivo de torná-lo adequado e eciente para outras aplicações, é descrita no Capítulo 4. O Capítulo 5 relata os resultados obtidos com o método generalizado para experimentos realizados com as 40 bases de dados utilizadas. Por m, o Capítulo 6 apresenta as conclusões deste trabalho e propostas de trabalhos futuros.

19 Capítulo 2 Técnicas e Algoritmos de Classicação 2.1 Introdução Tradicionalmente, a literatura da área de mineração de dados apresenta o processo de KDD (Knowledge Discovery in Database) dividido em seis etapas, as quais englobam duas grandes fases: a preparação dos dados e a sua mineração. O processo de KDD começa com a compreensão do domínio da aplicação e o estabelecimento de objetivos a serem alcançados. A próxima etapa corresponde a uma preparação dos dados. Nessa fase, os dados são pré-processados, ou seja, passam por transformações com o objetivo de carem adequados ao uso pelas técnicas de mineração de dados. Posteriormente, chega-se à fase de mineração dos dados. Uma das tarefas mais importantes em mineração de dados, que tem se mostrado útil em diversas áreas de aplicação, é a classicação. Ela corresponde a uma forma de análise de dados cujo objetivo é construir modelos, a partir de um conjunto de instâncias com características e classes conhecidas, capazes de classicar novas instâncias a partir de suas características. Essa tarefa é considerada preditiva, uma vez que são realizadas inferências sobre dados para se predizer a classe de uma nova instância. Vários métodos de classicação vêm sendo propostos por pesquisadores das áreas de aprendizado de máquina, estatística e mineração de dados. Neste capítulo, uma visão geral do processo de classicação é apresentada na Seção 2.2. As Seções 2.3 e 2.4 discutem técnicas relacionadas com a avaliação dos métodos de classicação. Em seguida, algumas questões relacionadas com o pré-processamento dos dados são abordadas na Seção 2.5. Por m, na Seção 2.6, são apresentados métodos e algoritmos comumente utilizados pela comunidade cientíca para a tarefa de classicação.

20 2.2 O Processo de Classicação O Processo de Classicação O processo de classicação pode ser dividido em duas etapas. Na primeira etapa, conhecida como treinamento, o objetivo é construir modelos que caracterizem as classes a partir dos valores dos atributos das instâncias da base de dados, ou seja, modelos capazes de realizar o mapeamento entre valores de atributos de uma instância e uma determinada classe. A construção desse modelo é realizada por meio de análise de instâncias contidas numa base de dados, as quais são representadas pelos seus atributos. Cada instância pertence a uma classe, denida por um dos atributos, denominado atributo classe. As instâncias analisadas para a construção do modelo constituem uma base de dados conhecida como base de dados de treinamento. Na segunda etapa, o modelo construído é avaliado quanto à sua acurácia preditiva. Se esse teste de acurácia produzir resultados aceitáveis, o modelo poderá ser utilizado na classicação de novas instâncias, ou seja, instâncias cujas classes são desconhecidas. A estimativa da acurácia preditiva do modelo é realizada utilizando-se um conjunto de instâncias cujas classes são conhecidas. Desse modo, por meio de análise comparativa, pode-se calcular o percentual de instâncias corretamente classicadas, ou seja, a precisão (ou acurácia) do modelo para o conjunto de instâncias em questão. Se a acurácia do modelo for estimada a partir das mesmas instâncias utilizadas para sua construção, provavelmente, uma estimativa otimista será obtida. Sendo assim, o mais indicado é utilizar instâncias que não zeram parte do conjunto de treinamento. Essas instâncias constituem a base de dados de teste. Portanto, um procedimento comum antes do início do processo de classicação é a divisão da base de dados inicial (que contém instâncias cujas classes são conhecidas) em base de dados de treinamento e de teste. A Seção 2.3 descreve dois métodos comumente utilizados na estimativa da acurácia de modelos de classicação. 2.3 Estimativa da Acurácia dos Modelos de Classicação A avaliação da acurácia dos modelos de classicação é importante por permitir uma estimativa da precisão do modelo ao classicar dados futuros, ou seja, dados que não foram utilizados no processo de construção do modelo. Além disso, essa estimativa permite a comparação de desempenho entre diferentes classicadores sobre um mesma base de dados de teste.

21 2.3 Estimativa da Acurácia dos Modelos de Classicação 7 Segundo [37], holdout e validação cruzada (cross validation) são dois métodos comumente utilizados na avaliação da acurácia de um classicador. Nos dois métodos, a base de dados inicial é particionada para gerar as bases de dados de treinamento e de teste. No método holdout a base de dados inicial é aleatoriamente dividida nas bases de treinamento e de teste. Geralmente, dois terços dos dados da base inicial são utilizados como base de dados de treinamento, e o restante, como base de dados de teste [51]. Para evitar que a estimativa da acurácia seja inuenciada por uma possível particularidade da partição que compõe a base de dados de teste, na prática, é comum aplicar o método holdout k vezes, gerando assim k pares (treinamento e teste) de bases de dados distintos. Desse modo, a acurácia é obtida a partir da média dos percentuais de acerto obtidos a partir de cada um dos k testes. Na k-validação cruzada (k-fold cross validation) [51], a base de dados inicial é aleatoriamente dividida em k partições de mesmo tamanho (ou aproximadamente do mesmo tamanho). A acurácia corresponde à média dos percentuais de acerto de k iterações. Em cada iteração, cada uma das k partições geradas forma a base de dados de teste e as k 1 partições restantes, a base de dados de treinamento. Segundo [95], uma grande quantidade de testes sobre diversas bases de dados têm mostrado que o valor de k igual a dez é o mais adequado para se obter uma boa estimativa da precisão do classicador. Portanto, na prática, a validação cruzada com k igual a dez vem sendo o método mais utilizado. No entanto, uma única realização da 10-validação cruzada pode não ser suciente para obtenção de uma boa estimativa da acurácia do modelo. Isso pode acontecer devido à aleatoriedade existente na escolha das k partições. Sendo assim, um procedimento geralmente realizado para tentar melhorar a estimativa da acurácia é a repetição da 10-validação cruzada dez vezes. A acurácia será o resultado médio dessas dez execuções. Apesar de o método 10-validação cruzada ser o mais comumente utilizado, outros dois métodos são freqüentemente citados na literatura, o leave-one-out [85] e o bootstrap [28]. O leave-one-out é simplesmente uma n-validação cruzada, onde n é o número de instâncias da base de dados. Já o bootstrap corresponde a um procedimento estatístico de amostragem com reposição. Nesse caso, a base de dados de treinamento é formada por meio de amostragem com reposição na base de dados inicial, e a base de teste, pelos elementos não selecionados para a composição da base de dados de treinamento.

22 2.4 Avaliação dos Métodos de Classicação Avaliação dos Métodos de Classicação Tanto na avaliação de um método de classicação especíco quanto na comparação entre diferentes métodos, os seguintes critérios podem ser levados em consideração [37]: Acurácia preditiva: é a habilidade que o modelo possui de predizer corretamente a classe de uma instância desconhecida. Desempenho: corresponde aos custos computacionais envolvidos na geração e aplicação do modelo. Robustez: é a habilidade do modelo de classicar corretamente instâncias a partir de dados com ruídos e com valores de atributos desconhecidos. Escalabilidade: refere-se à construção eciente de modelos a partir de grandes quantidades de dados. Interpretabilidade: diz respeito ao grau de compreensibilidade proporcionado pelo modelo ao usuário da aplicação. 2.5 Pré-Processamento dos Dados Atualmente, é muito comum existirem bases de dados contendo ruídos, dados inconsistentes e instâncias com valores de atributos desconhecidos. Desse modo, uma fase de preparação dos dados pode ser utilizada com o intuito de melhorar a qualidade dos mesmos. Além disso, transformações podem ser necessárias para adequar os dados ao uso por alguma técnica de mineração de dados especíca. Diversas técnicas de pré-processamento podem ser utilizadas na fase de preparação dos dados. Na Seção 2.5.1, são apresentados alguns métodos de discretização de atributos. Em seguida, na Seção 2.5.2, são mostradas algumas alternativas propostas para lidar com os valores desconhecidos de atributos. Por m, o problema de seleção de atributos é discutido na Seção Discretização de Atributos Diversos algoritmos de mineração de dados trabalham com bases de dados contendo somente atributos discretos. No entanto, na prática, algumas bases de dados possuem

Técnicas de Seleção de Atributos utilizando Paradigmas de Algoritmos Disciplina de Projeto e Análise de Algoritmos

Técnicas de Seleção de Atributos utilizando Paradigmas de Algoritmos Disciplina de Projeto e Análise de Algoritmos Técnicas de Seleção de Atributos utilizando Paradigmas de Algoritmos Disciplina de Projeto e Análise de Algoritmos Theo Silva Lins, Luiz Henrique de Campos Merschmann PPGCC - Programa de Pós-Graduação

Leia mais

Avaliando o que foi Aprendido

Avaliando o que foi Aprendido Avaliando o que foi Aprendido Treinamento, teste, validação Predição da performance: Limites de confiança Holdout, cross-validation, bootstrap Comparando algoritmos: o teste-t Predecindo probabilidades:função

Leia mais

A Preparação dos Dados

A Preparação dos Dados A Preparação dos Dados Escolhas Básicas Objetos, casos, instâncias Objetos do mundo real: carros, arvores, etc Ponto de vista da mineração: um objeto é descrito por uma coleção de características sobre

Leia mais

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é?

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é? KDD Conceitos o que é? Fases limpeza etc Datamining OBJETIVOS PRIMÁRIOS TAREFAS PRIMÁRIAS Classificação Regressão Clusterização OBJETIVOS PRIMÁRIOS NA PRÁTICA SÃO DESCRIÇÃO E PREDIÇÃO Descrição Wizrule

Leia mais

Extração de Conhecimento & Mineração de Dados

Extração de Conhecimento & Mineração de Dados Extração de Conhecimento & Mineração de Dados Nesta apresentação é dada uma breve introdução à Extração de Conhecimento e Mineração de Dados José Augusto Baranauskas Departamento de Física e Matemática

Leia mais

UTILIZANDO O SOFTWARE WEKA

UTILIZANDO O SOFTWARE WEKA UTILIZANDO O SOFTWARE WEKA O que é 2 Weka: software livre para mineração de dados Desenvolvido por um grupo de pesquisadores Universidade de Waikato, Nova Zelândia Também é um pássaro típico da Nova Zelândia

Leia mais

Classificação: Definição. Classificação: conceitos básicos e árvores de decisão. Exemplos de Tarefas de Classificação

Classificação: Definição. Classificação: conceitos básicos e árvores de decisão. Exemplos de Tarefas de Classificação Classificação: Definição Mineração de dados Classificação: conceitos básicos e árvores de decisão Apresentação adaptada do material de apoio do livro: Introduction to Data Mining Tan, Steinbach, Kumar

Leia mais

IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES ENTRE PRODUTOS DE UMA BASE DE DADOS REAL

IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES ENTRE PRODUTOS DE UMA BASE DE DADOS REAL Universidade Federal de Ouro Preto - UFOP Instituto de Ciências Exatas e Biológicas - ICEB Departamento de Computação - DECOM IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES

Leia mais

AVALIAÇÃO DE UMA ABORDAGEM LAZY DE SELEÇÃO DE ATRIBUTOS BASEADA NA MEDIDA DE CONSISTÊNCIA

AVALIAÇÃO DE UMA ABORDAGEM LAZY DE SELEÇÃO DE ATRIBUTOS BASEADA NA MEDIDA DE CONSISTÊNCIA MARCUS VINICIUS SILVA SOARES Orientador: Luiz Henrique de Campos Merschmann AVALIAÇÃO DE UMA ABORDAGEM LAZY DE SELEÇÃO DE ATRIBUTOS BASEADA NA MEDIDA DE CONSISTÊNCIA Ouro Preto Dezembro de 2010 Universidade

Leia mais

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI Fernando Luiz de Oliveira 1 Thereza Patrícia. P. Padilha 1 Conceição A. Previero 2 Leandro Maciel Almeida 1 RESUMO O processo

Leia mais

Mineração de Dados: Introdução e Aplicações

Mineração de Dados: Introdução e Aplicações Mineração de Dados: Introdução e Aplicações Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br Apresentação Luiz Merschmann Engenheiro

Leia mais

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE Engenharia de Computação Professor: Rosalvo Ferreira de Oliveira Neto Estudos Comparativos Recentes - Behavior Scoring Roteiro Objetivo Critérios de Avaliação

Leia mais

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka 1 Introdução A mineração de dados (data mining) pode ser definida como o processo automático de descoberta de conhecimento em bases de

Leia mais

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br MINERAÇÃO DE DADOS APLICADA Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br Processo Weka uma Ferramenta Livre para Data Mining O que é Weka? Weka é um Software livre do tipo open source para

Leia mais

3 Metodologia de Previsão de Padrões de Falha

3 Metodologia de Previsão de Padrões de Falha 3 Metodologia de Previsão de Padrões de Falha Antes da ocorrência de uma falha em um equipamento, ele entra em um regime de operação diferente do regime nominal, como descrito em [8-11]. Para detectar

Leia mais

17/10/2012. dados? Processo. Doutorado em Engenharia de Produção Michel J. Anzanello. Doutorado EP - 2. Doutorado EP - 3.

17/10/2012. dados? Processo. Doutorado em Engenharia de Produção Michel J. Anzanello. Doutorado EP - 2. Doutorado EP - 3. Definição de Data Mining (DM) Mineração de Dados (Data Mining) Doutorado em Engenharia de Produção Michel J. Anzanello Processo de explorar grandes quantidades de dados à procura de padrões consistentes

Leia mais

AVALIAÇÃO COMPARATIVA DE ALGORITMOS PARA SISTEMAS DE RECOMENDAÇÃO EM MÚLTIPLOS DOMÍNIOS: MODELOS INTERPRETÁVEIS APLICADOS A DADOS EDUCACIONAIS

AVALIAÇÃO COMPARATIVA DE ALGORITMOS PARA SISTEMAS DE RECOMENDAÇÃO EM MÚLTIPLOS DOMÍNIOS: MODELOS INTERPRETÁVEIS APLICADOS A DADOS EDUCACIONAIS AVALIAÇÃO COMPARATIVA DE ALGORITMOS PARA SISTEMAS DE RECOMENDAÇÃO EM MÚLTIPLOS DOMÍNIOS: MODELOS INTERPRETÁVEIS APLICADOS A DADOS EDUCACIONAIS Hugo Marques Casarini Faculdade de Engenharia de Computação

Leia mais

Prof. Msc. Paulo Muniz de Ávila

Prof. Msc. Paulo Muniz de Ávila Prof. Msc. Paulo Muniz de Ávila O que é Data Mining? Mineração de dados (descoberta de conhecimento em bases de dados): Extração de informação interessante (não-trivial, implícita, previamente desconhecida

Leia mais

KDD UMA VISAL GERAL DO PROCESSO

KDD UMA VISAL GERAL DO PROCESSO KDD UMA VISAL GERAL DO PROCESSO por Fernando Sarturi Prass 1 1.Introdução O aumento das transações comerciais por meio eletrônico, em especial as feitas via Internet, possibilitou as empresas armazenar

Leia mais

Introdução. Capítulo 1

Introdução. Capítulo 1 Capítulo 1 Introdução Em computação, muitos problemas são resolvidos por meio da escrita de um algoritmo que especifica, passo a passo, como resolver um problema. No entanto, não é fácil escrever um programa

Leia mais

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA Lizianne Priscila Marques SOUTO 1 1 Faculdade de Ciências Sociais e Aplicadas

Leia mais

MINERAÇÃO DE DADOS PARA PADRÕES DE SEQUENCIA

MINERAÇÃO DE DADOS PARA PADRÕES DE SEQUENCIA Universidade Federal de Ouro Preto - UFOP Instituto de Ciências Exatas e Biológicas - ICEB Departamento de Computação - DECOM MINERAÇÃO DE DADOS PARA PADRÕES DE SEQUENCIA Aluna: Cecília Henriques Devêza

Leia mais

O Processo de KDD Knowledge Discovery in Database para Aplicações na Medicina

O Processo de KDD Knowledge Discovery in Database para Aplicações na Medicina SEMINC 2001 57 O Processo de KDD Knowledge Discovery in Database para Aplicações na Medicina MARIZA FERRO HUEI DIANA LEE UNIOESTE - Universidade Estadual do Oeste do Paraná CECE Centro de Engenharias e

Leia mais

Introdução a Datamining (previsão e agrupamento)

Introdução a Datamining (previsão e agrupamento) E o que fazer depois de ter os dados organizados? Introdução a Datamining (previsão e agrupamento) Victor Lobo Mestrado em Estatística e Gestão de Informação Ideias base Aprender com o passado Inferir

Leia mais

Introdução a Datamining (previsão e agrupamento)

Introdução a Datamining (previsão e agrupamento) Introdução a Datamining (previsão e agrupamento) Victor Lobo Mestrado em Estatística e Gestão de Informação E o que fazer depois de ter os dados organizados? Ideias base Aprender com o passado Inferir

Leia mais

Aprendizagem de Máquina. Ivan Medeiros Monteiro

Aprendizagem de Máquina. Ivan Medeiros Monteiro Aprendizagem de Máquina Ivan Medeiros Monteiro Definindo aprendizagem Dizemos que um sistema aprende se o mesmo é capaz de melhorar o seu desempenho a partir de suas experiências anteriores. O aprendizado

Leia mais

Recuperação de imagens por conteúdo baseada em realimentação de relevância e classicador por oresta de caminhos ótimos

Recuperação de imagens por conteúdo baseada em realimentação de relevância e classicador por oresta de caminhos ótimos Recuperação de imagens por conteúdo baseada em realimentação de relevância e classicador por oresta de caminhos ótimos André Tavares da Silva Orientador: Léo Pini Magalhães Co-orientador: Alexandre Xavier

Leia mais

Pré processamento de dados II. Mineração de Dados 2012

Pré processamento de dados II. Mineração de Dados 2012 Pré processamento de dados II Mineração de Dados 2012 Luís Rato Universidade de Évora, 2012 Mineração de dados / Data Mining 1 Redução de dimensionalidade Objetivo: Evitar excesso de dimensionalidade Reduzir

Leia mais

Extração de Conhecimento a partir dos Sistemas de Informação

Extração de Conhecimento a partir dos Sistemas de Informação Extração de Conhecimento a partir dos Sistemas de Informação Gisele Faffe Pellegrini & Katia Collazos Grupo de Pesquisa em Eng. Biomédica Universidade Federal de Santa Catarina Jorge Muniz Barreto Prof.

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Tipos de aprendizagem 3. Paradigmas de aprendizagem 4. Modos de aprendizagem

Leia mais

DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS

DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS Tácio Dias Palhão Mendes Bacharelando em Sistemas de Informação Bolsista de Iniciação Científica da FAPEMIG taciomendes@yahoo.com.br Prof.

Leia mais

Algoritmos Genéticos em Mineração de Dados. Descoberta de Conhecimento. Descoberta do Conhecimento em Bancos de Dados

Algoritmos Genéticos em Mineração de Dados. Descoberta de Conhecimento. Descoberta do Conhecimento em Bancos de Dados Algoritmos Genéticos em Mineração de Dados Descoberta de Conhecimento Descoberta do Conhecimento em Bancos de Dados Processo interativo e iterativo para identificar padrões válidos, novos, potencialmente

Leia mais

Classificação de Imagens de Sensoriamento Remoto usando SVM

Classificação de Imagens de Sensoriamento Remoto usando SVM Raphael Belo da Silva Meloni Classificação de Imagens de Sensoriamento Remoto usando SVM Dissertação de Mestrado Dissertação apresentada como requisito parcial para obtenção do título de Mestre pelo Programa

Leia mais

Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados

Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados Prof. Celso Kaestner Poker Hand Data Set Aluno: Joyce Schaidt Versão:

Leia mais

Aula 02: Conceitos Fundamentais

Aula 02: Conceitos Fundamentais Aula 02: Conceitos Fundamentais Profa. Ms. Rosângela da Silva Nunes 1 de 26 Roteiro 1. Por que mineração de dados 2. O que é Mineração de dados 3. Processo 4. Que tipo de dados podem ser minerados 5. Que

Leia mais

4. Que tipos de padrões podem ser minerados. 5. Critérios de classificação de sistemas de Data Mining. 6. Tópicos importantes de estudo em Data Mining

4. Que tipos de padrões podem ser minerados. 5. Critérios de classificação de sistemas de Data Mining. 6. Tópicos importantes de estudo em Data Mining Curso de Data Mining - Aula 1 1. Como surgiu 2. O que é 3. Em que tipo de dados pode ser aplicado 4. Que tipos de padrões podem ser minerados 5. Critérios de classificação de sistemas de Data Mining 6.

Leia mais

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan Faculdade INED Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan 1 Unidade 4.5 2 1 BI BUSINESS INTELLIGENCE BI CARLOS BARBIERI

Leia mais

O Processo de KDD. Data Mining SUMÁRIO - AULA1. O processo de KDD. Interpretação e Avaliação. Seleção e Pré-processamento. Consolidação de dados

O Processo de KDD. Data Mining SUMÁRIO - AULA1. O processo de KDD. Interpretação e Avaliação. Seleção e Pré-processamento. Consolidação de dados SUMÁRIO - AULA1 O Processo de KDD O processo de KDD Interpretação e Avaliação Consolidação de dados Seleção e Pré-processamento Warehouse Data Mining Dados Preparados p(x)=0.02 Padrões & Modelos Conhecimento

Leia mais

O objetivo da Mineração de Dados é extrair ou minerar conhecimento de grandes volumes de

O objetivo da Mineração de Dados é extrair ou minerar conhecimento de grandes volumes de MINERAÇÃO DE DADOS MINERAÇÃO DE DADOS O objetivo da Mineração de Dados é extrair ou minerar conhecimento de grandes volumes de dados. A mineração de dados é formada por um conjunto de ferramentas e técnicas

Leia mais

ALGORITMO HÍBRIDO PARA SISTEMAS DE RECOMENDAÇÃO UTILIZANDO FILTRAGEM COLABORATIVA E ALGORITMO GENÉTICO

ALGORITMO HÍBRIDO PARA SISTEMAS DE RECOMENDAÇÃO UTILIZANDO FILTRAGEM COLABORATIVA E ALGORITMO GENÉTICO ALGORITMO HÍBRIDO PARA SISTEMAS DE RECOMENDAÇÃO UTILIZANDO FILTRAGEM COLABORATIVA E ALGORITMO GENÉTICO Renan de Oliveira Yamaguti Faculdade de Engenharia de Computação / CEATEC renan.yamaguti@terra.com.br

Leia mais

ÁRVORE DE DECISÃO / ALGORITMO GENÉTICO PARA TRATAR O PROBLEMA DE PEQUENOS DISJUNTOS EM CLASSIFICAÇÃO DE DADOS. Deborah Ribeiro Carvalho

ÁRVORE DE DECISÃO / ALGORITMO GENÉTICO PARA TRATAR O PROBLEMA DE PEQUENOS DISJUNTOS EM CLASSIFICAÇÃO DE DADOS. Deborah Ribeiro Carvalho ÁRVORE DE DECISÃO / ALGORITMO GENÉTICO PARA TRATAR O PROBLEMA DE PEQUENOS DISJUNTOS EM CLASSIFICAÇÃO DE DADOS Deborah Ribeiro Carvalho Orientador: Nelson Francisco Favilla Ebecken Co-Orientador: Alex Alves

Leia mais

Knowledge Discovery and Data Mining Extensão-UFMS-DCT

Knowledge Discovery and Data Mining Extensão-UFMS-DCT Knowledge Discovery and Data Mining Extensão-UFMS-DCT Introdução ao Processo de KDD Esta introdução se baseou quase que integralmente nas transparências produzidas por: Daniel L. Silver (dsilver@mgmt.dal.ca)

Leia mais

Aplicação de Técnicas de Mineração de Dados no Processo de Aprendizagem na Educação a Distância

Aplicação de Técnicas de Mineração de Dados no Processo de Aprendizagem na Educação a Distância Aplicação de Técnicas de Mineração de Dados no Processo de Aprendizagem na Educação a Distância Maxwel Macedo Dias 1, Luiz Alberto da Silva Filho 2, Adriano Del Pino Lino 1, Eloi Luiz Favero 2, Edson Marcos

Leia mais

ADM041 / EPR806 Sistemas de Informação

ADM041 / EPR806 Sistemas de Informação ADM041 / EPR806 Sistemas de Informação UNIFEI Universidade Federal de Itajubá Prof. Dr. Alexandre Ferreira de Pinho 1 Sistemas de Apoio à Decisão (SAD) Tipos de SAD Orientados por modelos: Criação de diferentes

Leia mais

Exemplo de Aplicação do DataMinig

Exemplo de Aplicação do DataMinig Exemplo de Aplicação do DataMinig Felipe E. Barletta Mendes 19 de fevereiro de 2008 INTRODUÇÃO AO DATA MINING A mineração de dados (Data Mining) está inserida em um processo maior denominado Descoberta

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Horários Aulas Sala [quinta-feira, 7:30 12:00] Atendimento Segunda

Leia mais

MINERAÇÃO DE DADOS APLICADA PARA LEVANTAMENTO DO PERFIL DOS ALUNOS DOS CURSOS TÉCNICOS OFERECIDOS PELO CAMPUS CAMPOS DO JORDÃO DO IFSP

MINERAÇÃO DE DADOS APLICADA PARA LEVANTAMENTO DO PERFIL DOS ALUNOS DOS CURSOS TÉCNICOS OFERECIDOS PELO CAMPUS CAMPOS DO JORDÃO DO IFSP MINERAÇÃO DE DADOS APLICADA PARA LEVANTAMENTO DO PERFIL DOS ALUNOS DOS CURSOS TÉCNICOS OFERECIDOS PELO CAMPUS CAMPOS DO JORDÃO DO IFSP 1 Data de entrega dos originais à redação em 15/03/2013 e recebido

Leia mais

Projeto e Análise de Algoritmos Projeto de Algoritmos Tentativa e Erro. Prof. Humberto Brandão humberto@bcc.unifal-mg.edu.br

Projeto e Análise de Algoritmos Projeto de Algoritmos Tentativa e Erro. Prof. Humberto Brandão humberto@bcc.unifal-mg.edu.br Projeto e Análise de Algoritmos Projeto de Algoritmos Tentativa e Erro Prof. Humberto Brandão humberto@bcc.unifal-mg.edu.br Laboratório de Pesquisa e Desenvolvimento Universidade Federal de Alfenas versão

Leia mais

Marcio Cataldi 1, Carla da C. Lopes Achão 2, Bruno Goulart de Freitas Machado 1, Simone Borim da Silva 1 e Luiz Guilherme Ferreira Guilhon 1

Marcio Cataldi 1, Carla da C. Lopes Achão 2, Bruno Goulart de Freitas Machado 1, Simone Borim da Silva 1 e Luiz Guilherme Ferreira Guilhon 1 Aplicação das técnicas de Mineração de Dados como complemento às previsões estocásticas univariadas de vazão natural: estudo de caso para a bacia do rio Iguaçu Marcio Cataldi 1, Carla da C. Lopes Achão

Leia mais

2.1.2 Definição Matemática de Imagem

2.1.2 Definição Matemática de Imagem Capítulo 2 Fundamentação Teórica Este capítulo descreve os fundamentos e as etapas do processamento digital de imagens. 2.1 Fundamentos para Processamento Digital de Imagens Esta seção apresenta as propriedades

Leia mais

3 ALGORITMOS GENÉTICOS : CONCEITOS BÁSICOS E EXTENSÕES VINCULADAS AO PROBLEMA DE MINIMIZAÇÃO DE PERDAS

3 ALGORITMOS GENÉTICOS : CONCEITOS BÁSICOS E EXTENSÕES VINCULADAS AO PROBLEMA DE MINIMIZAÇÃO DE PERDAS 3 ALGORITMOS GENÉTICOS : CONCEITOS BÁSICOS E EXTENSÕES VINCULADAS AO PROBLEMA DE MINIMIZAÇÃO DE PERDAS 3.1 - Conceitos Básicos Entendemos como algoritmo um conjunto predeterminado e bem definido de regras

Leia mais

Data Mining: Conceitos e Técnicas

Data Mining: Conceitos e Técnicas Data Mining: Conceitos e Técnicas DM, DW e OLAP Data Warehousing e OLAP para Data Mining O que é data warehouse? De data warehousing para data mining Data Warehousing e OLAP para Data Mining Data Warehouse:

Leia mais

Árvores de Decisão. Índice

Árvores de Decisão. Índice Árvores de Decisão Índice 1. Introdução... 2 2. Árvores de decisão e a tarefa de classificação... 6 3. Principais conceitos vinculados à indução de árvores de decisão... 15 3.1 Top-Down Induction of Decision

Leia mais

UMA ABORDAGEM DE PODA PARA MÁQUINAS DE APRENDIZADO EXTREMO VIA ALGORITMOS GENÉTICOS

UMA ABORDAGEM DE PODA PARA MÁQUINAS DE APRENDIZADO EXTREMO VIA ALGORITMOS GENÉTICOS UMA ABORDAGEM DE PODA PARA MÁQUINAS DE APRENDIZADO EXTREMO VIA ALGORITMOS GENÉTICOS Alisson S. C. Alencar, Ajalmar R. da Rocha Neto Departamento de Computação, Instituto Federal do Ceará (IFCE). Programa

Leia mais

Aprendizado de classificadores das ementas da Jurisprudência do Tribunal Regional do Trabalho da 2ª. Região - SP

Aprendizado de classificadores das ementas da Jurisprudência do Tribunal Regional do Trabalho da 2ª. Região - SP Aprendizado de classificadores das ementas da Jurisprudência do Tribunal Regional do Trabalho da 2ª. Região - SP Thiago Ferauche, Maurício Amaral de Almeida Laboratório de Pesquisa em Ciência de Serviços

Leia mais

INTRODUÇÃO A MINERAÇÃO DE DADOS UTILIZANDO O WEKA

INTRODUÇÃO A MINERAÇÃO DE DADOS UTILIZANDO O WEKA INTRODUÇÃO A MINERAÇÃO DE DADOS UTILIZANDO O WEKA Marcelo DAMASCENO(1) (1) Instituto Federal de Educação, Ciência e Tecnologia do Rio Grande do Norte/Campus Macau, Rua das Margaridas, 300, COHAB, Macau-RN,

Leia mais

tipos de métodos, técnicas de inteligência artificial e técnicas de otimização. Por fim, concluise com as considerações finais.

tipos de métodos, técnicas de inteligência artificial e técnicas de otimização. Por fim, concluise com as considerações finais. 1. Introdução A previsão de vendas é fundamental para as organizações uma vez que permite melhorar o planejamento e a tomada de decisão sobre o futuro da empresa. Contudo toda previsão carrega consigo

Leia mais

Otimização de Recuperação de Informação usando Algoritmos Genéticos

Otimização de Recuperação de Informação usando Algoritmos Genéticos Otimização de Recuperação de Informação usando Algoritmos Genéticos Neide de Oliveira Gomes, M. Sc., nog@inpi.gov.br Prof. Marco Aurélio C. Pacheco, PhD Programa de Doutorado na área de Métodos de Apoio

Leia mais

3 Estado da arte em classificação de imagens de alta resolução

3 Estado da arte em classificação de imagens de alta resolução 37 3 Estado da arte em classificação de imagens de alta resolução Com a recente disponibilidade de imagens de alta resolução produzidas por sensores orbitais como IKONOS e QUICKBIRD se tornou-se possível

Leia mais

Classificação - avaliação de resultados - 1. Mineração de Dados 2013

Classificação - avaliação de resultados - 1. Mineração de Dados 2013 Classificação - avaliação de resultados - 1 Mineração de Dados 2013 Luís Rato (Capítulo 4 do livro Introduction to Data Mining ) Universidade de Évora, Mineração de dados / Data Mining 1 Desempenho Desempenho

Leia mais

Descoberta de Domínio Conceitual de Páginas Web

Descoberta de Domínio Conceitual de Páginas Web paper:25 Descoberta de Domínio Conceitual de Páginas Web Aluno: Gleidson Antônio Cardoso da Silva gleidson.silva@posgrad.ufsc.br Orientadora: Carina Friedrich Dorneles dorneles@inf.ufsc.br Nível: Mestrado

Leia mais

Pesquisa Operacional

Pesquisa Operacional GOVERNO DO ESTADO DO PARÁ UNIVERSIDADE DO ESTADO DO PARÁ CENTRO DE CIÊNCIAS NATURAIS E TECNOLOGIA DEPARTAMENTO DE ENGENHARIA Pesquisa Operacional Tópico 4 Simulação Rosana Cavalcante de Oliveira, Msc rosanacavalcante@gmail.com

Leia mais

Inteligência Computacional [2COP229]

Inteligência Computacional [2COP229] Inteligência Computacional [2COP229] Mestrado em Ciência da Computação Sylvio Barbon Jr barbon@uel.br (2/24) Tema Aula 1 Introdução ao Reconhecimento de Padrões 1 Introdução 2 Componentes clássicos da

Leia mais

SISTEMA INTELIGENTE PARA AVALIAÇÃO DE RISCOS EM VIAS DE TRANSPORTE TERRESTRE. Custódio Gouvêa Lopes da Motta

SISTEMA INTELIGENTE PARA AVALIAÇÃO DE RISCOS EM VIAS DE TRANSPORTE TERRESTRE. Custódio Gouvêa Lopes da Motta SISTEMA INTELIGENTE PARA AVALIAÇÃO DE RISCOS EM VIAS DE TRANSPORTE TERRESTRE Custódio Gouvêa Lopes da Motta TESE SUBMETIDA AO CORPO DOCENTE DA COORDENAÇÃO DOS PROGRAMAS DE PÓS-GRADUAÇÃO DE ENGENHARIA DA

Leia mais

Padronização de Processos: BI e KDD

Padronização de Processos: BI e KDD 47 Padronização de Processos: BI e KDD Nara Martini Bigolin Departamento da Tecnologia da Informação -Universidade Federal de Santa Maria 98400-000 Frederico Westphalen RS Brazil nara.bigolin@ufsm.br Abstract:

Leia mais

A INTEGRAÇÃO ENTRE ESTATÍSTICA E METROLOGIA

A INTEGRAÇÃO ENTRE ESTATÍSTICA E METROLOGIA A INTEGRAÇÃO ENTRE ESTATÍSTICA E METROLOGIA João Cirilo da Silva Neto jcirilo@araxa.cefetmg.br. CEFET-MG-Centro Federal de Educação Tecnológica de Minas Gerais-Campus IV, Araxá Av. Ministro Olavo Drumonnd,

Leia mais

Mineração de Dados. Prof. Júlio Cesar Nievola Especialização em Inteligência Computacional PPGIA - PUCPR

Mineração de Dados. Prof. Júlio Cesar Nievola Especialização em Inteligência Computacional PPGIA - PUCPR Mineração de Dados PPGIA - PUCPR Agenda 1. Histórico 2. Definições e Características 3. Processo e Tarefas de DM 4. Pré-Processamento 5. Representação do Conhecimento 6. Principais Tarefas 7. Procedimentos

Leia mais

Análise de técnicas de selecção de atributos em Bioinformática

Análise de técnicas de selecção de atributos em Bioinformática Análise de técnicas de selecção de atributos em Bioinformática Rui Mendes 100378011 Bioinformática 10/11 DCC Artigo Base Yvan Saeys, Inaki Inza and Pedro Larranaga. A review of feature selection techniques

Leia mais

http://www.publicare.com.br/site/5,1,26,5480.asp

http://www.publicare.com.br/site/5,1,26,5480.asp Página 1 de 7 Terça-feira, 26 de Agosto de 2008 ok Home Direto da redação Última edição Edições anteriores Vitrine Cross-Docking Assine a Tecnologística Anuncie Cadastre-se Agenda Cursos de logística Dicionário

Leia mais

Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS

Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS Sumário Conceitos / Autores chave... 3 1. Introdução... 3 2. Tarefas desempenhadas por Técnicas de 4 Mineração de Dados...

Leia mais

Experimentos de Mineração de Dados em R Disciplina do curso de Pós-Graduação da UTFPR

Experimentos de Mineração de Dados em R Disciplina do curso de Pós-Graduação da UTFPR Experimentos de Mineração de Dados em R Disciplina do curso de Pós-Graduação da UTFPR Paulo Carvalho Diniz Junior CPGEI / UTFPR Avenida Sete de Setembro, 3165 Curitiba-PR - CEP 80.230-910 E-mail: paulo.carvalho.diniz@gmail.com

Leia mais

Sumário. Mineração de Dados aplicada à Gestão de Negócios. 1) Mineração de Dados

Sumário. Mineração de Dados aplicada à Gestão de Negócios. 1) Mineração de Dados Aula 1 Introdução -Mineração de Dados Prof. Dr. Sylvio Barbon Junior barbon@uel.br Sumário 1) Mineração de Dados 1) Atividades Relacionadas; 2) Desafios; 3) Exemplos de aplicativos; 4) Últimos assuntos;

Leia mais

IC Inteligência Computacional Redes Neurais. Redes Neurais

IC Inteligência Computacional Redes Neurais. Redes Neurais Universidade Federal do Rio de Janeiro PÓS-GRADUAÇÃO / 2008-2 IC Inteligência Computacional Redes Neurais www.labic.nce.ufrj.br Antonio G. Thomé thome@nce.ufrj.br Redes Neurais São modelos computacionais

Leia mais

Aplicação do algoritmo SimpleKMeans em experimento de milho verde

Aplicação do algoritmo SimpleKMeans em experimento de milho verde Aplicação do algoritmo SimpleKMeans em experimento de milho verde Wesley Viana 1, Prof. MSc. Marcos de Moraes Sousa 1, Prof. MSc. Júnio César de Lima 1 Prof. Dr. Milton Sérgio Dornelles 1 1 Instituto Federal

Leia mais

Extensão do WEKA para Métodos de Agrupamento com Restrição de Contigüidade

Extensão do WEKA para Métodos de Agrupamento com Restrição de Contigüidade Extensão do WEKA para Métodos de Agrupamento com Restrição de Contigüidade Carlos Eduardo R. de Mello, Geraldo Zimbrão da Silva, Jano M. de Souza Programa de Engenharia de Sistemas e Computação Universidade

Leia mais

Resolução do Problema de Roteamento de Veículos com Frota Heterogênea via GRASP e Busca Tabu.

Resolução do Problema de Roteamento de Veículos com Frota Heterogênea via GRASP e Busca Tabu. Resolução do Problema de Roteamento de Veículos com Frota Heterogênea via GRASP e Busca Tabu. Camila Leles de Rezende, Denis P. Pinheiro, Rodrigo G. Ribeiro camilalelesproj@yahoo.com.br, denisppinheiro@yahoo.com.br,

Leia mais

Gestão da Informação. Gestão da Informação. AULA 3 Data Mining

Gestão da Informação. Gestão da Informação. AULA 3 Data Mining Gestão da Informação AULA 3 Data Mining Prof. Edilberto M. Silva Gestão da Informação Agenda Unidade I - DM (Data Mining) Definição Objetivos Exemplos de Uso Técnicas Tarefas Unidade II DM Prático Exemplo

Leia mais

Pós-Graduação em Engenharia Elétrica Inteligência Artificial

Pós-Graduação em Engenharia Elétrica Inteligência Artificial Pós-Graduação em Engenharia Elétrica Inteligência Artificial João Marques Salomão Rodrigo Varejão Andreão Inteligência Artificial Definição (Fonte: AAAI ): "the scientific understanding of the mechanisms

Leia mais

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse Definição escopo do projeto (departamental, empresarial) Grau de redundância dos dados(ods, data staging) Tipo de usuário alvo (executivos, unidades) Definição do ambiente (relatórios e consultas préestruturadas

Leia mais

Análise de Regressão. Tópicos Avançados em Avaliação de Desempenho. Cleber Moura Edson Samuel Jr

Análise de Regressão. Tópicos Avançados em Avaliação de Desempenho. Cleber Moura Edson Samuel Jr Análise de Regressão Tópicos Avançados em Avaliação de Desempenho Cleber Moura Edson Samuel Jr Agenda Introdução Passos para Realização da Análise Modelos para Análise de Regressão Regressão Linear Simples

Leia mais

Aplicação A. Aplicação B. Aplicação C. Aplicação D. Aplicação E. Aplicação F. Aplicação A REL 1 REL 2. Aplicação B REL 3.

Aplicação A. Aplicação B. Aplicação C. Aplicação D. Aplicação E. Aplicação F. Aplicação A REL 1 REL 2. Aplicação B REL 3. Sumário Data Warehouse Modelagem Multidimensional. Data Mining BI - Business Inteligence. 1 2 Introdução Aplicações do negócio: constituem as aplicações que dão suporte ao dia a dia do negócio da empresa,

Leia mais

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO @ribeirord FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO Rafael D. Ribeiro, M.Sc,PMP. rafaeldiasribeiro@gmail.com http://www.rafaeldiasribeiro.com.br Lembrando... Aula 4 1 Lembrando... Aula 4 Sistemas de apoio

Leia mais

Probabilidade. Renata Souza. Introdução. Tabelas Estatísticas. População, Amostra e Variáveis. Gráficos e Distribuição de Freqüências

Probabilidade. Renata Souza. Introdução. Tabelas Estatísticas. População, Amostra e Variáveis. Gráficos e Distribuição de Freqüências Probabilidade Introdução Tabelas Estatísticas População, Amostra e Variáveis Gráficos e Distribuição de Freqüências Renata Souza Conceitos Antigos de Estatística stica a) Simples contagem aritmética Ex.:

Leia mais

FACULDADE DE TECNOLOGIA DE SÃO PAULO LUCIANA MENDES. Data Mining Estudo de Técnicas e Aplicações na Área Bancária

FACULDADE DE TECNOLOGIA DE SÃO PAULO LUCIANA MENDES. Data Mining Estudo de Técnicas e Aplicações na Área Bancária FACULDADE DE TECNOLOGIA DE SÃO PAULO LUCIANA MENDES Data Mining Estudo de Técnicas e Aplicações na Área Bancária São Paulo 2011 FACULDADE DE TECNOLOGIA DE SÃO PAULO LUCIANA MENDES Data Mining Estudo de

Leia mais

Aplicativo de Mineração de Dados Aplicado em Bases de Dados Acadêmicas

Aplicativo de Mineração de Dados Aplicado em Bases de Dados Acadêmicas 22 - Encontro Anual de Tecnologia da Informação Aplicativo de Mineração de Dados Aplicado em Bases de Dados Acadêmicas Elisa Maria Vissotto1, Adriane Barbosa Camargo2 1 Universidade Regional Integrada

Leia mais

DESCOBERTA DE CONHECIMENTO EM BASES DE DADOS

DESCOBERTA DE CONHECIMENTO EM BASES DE DADOS DESCOBERTA DE CONHECIMENTO EM BASES DE DADOS Claudio Napolis Costa 1, Jonatas Vieira Coutinho 2, Lúcia Helena de Magalhães 3, Márcio Aarestrup Arbex 4 RESUMO Vários métodos de aprendizado supervisionado

Leia mais

PROJETO DE REDES www.projetoderedes.com.br

PROJETO DE REDES www.projetoderedes.com.br PROJETO DE REDES www.projetoderedes.com.br Centro Universitário de Volta Redonda - UniFOA Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro

Leia mais

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO Fernanda Delizete Madeira 1 ; Aracele Garcia de Oliveira Fassbinder 2 INTRODUÇÃO Data

Leia mais

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO EPE0147 UTILIZAÇÃO DA MINERAÇÃO DE DADOS EM UMA AVALIAÇÃO INSTITUCIONAL

Leia mais

TÉCNICAS DE COMPUTAÇÃO PARALELA PARA MELHORAR O TEMPO DA MINERAÇÃO DE DADOS: Uma análise de Tipos de Coberturas Florestais

TÉCNICAS DE COMPUTAÇÃO PARALELA PARA MELHORAR O TEMPO DA MINERAÇÃO DE DADOS: Uma análise de Tipos de Coberturas Florestais UNIVERSIDADE ESTADUAL DE PONTA GROSSA PRÓ-REITORIA DE PESQUISA E PÓS-GRADUAÇÃO PROGRAMA DE PÓS-GRADUAÇÃO EM COMPUTAÇÃO APLICADA CRISTIAN COSMOSKI RANGEL DE ABREU TÉCNICAS DE COMPUTAÇÃO PARALELA PARA MELHORAR

Leia mais

Herramientas inteligentes para el diagnóstico de transformadores sometidos a esfuerzos electromagnéticos severos

Herramientas inteligentes para el diagnóstico de transformadores sometidos a esfuerzos electromagnéticos severos Herramientas inteligentes para el diagnóstico de transformadores sometidos a esfuerzos electromagnéticos severos Nombre Carlos Guilherme Gonzales Correo cgonzale@cteep.com.br Empresa www.cteep.com.br Cargo

Leia mais

Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II. Mineração de Dados. Sylvio Barbon Junior barbon@uel.br. 26 de junho de 2015 DC-UEL Sylvio Barbon Jr 1

Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II. Mineração de Dados. Sylvio Barbon Junior barbon@uel.br. 26 de junho de 2015 DC-UEL Sylvio Barbon Jr 1 Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II Mineração de Dados Sylvio Barbon Junior barbon@uel.br 26 de junho de 2015 DC-UEL Sylvio Barbon Jr 1 Sumário Etapa I Etapa II Inteligência de Negócios Visão

Leia mais

Conceitos de Mineração de Dados na Web

Conceitos de Mineração de Dados na Web Capítulo 2 Conceitos de Mineração de Dados na Web Rafael Santos Resumo Já não é mais possível apresentar a Web como uma novidade, comentando sobre suas características básicas sua pervasividade e ubiqüidade

Leia mais

Complemento II Noções Introdutória em Redes Neurais

Complemento II Noções Introdutória em Redes Neurais Complemento II Noções Introdutória em Redes Neurais Esse documento é parte integrante do material fornecido pela WEB para a 2ª edição do livro Data Mining: Conceitos, técnicas, algoritmos, orientações

Leia mais

INE 7001 - Procedimentos de Análise Bidimensional de variáveis QUANTITATIVAS utilizando o Microsoft Excel. Professor Marcelo Menezes Reis

INE 7001 - Procedimentos de Análise Bidimensional de variáveis QUANTITATIVAS utilizando o Microsoft Excel. Professor Marcelo Menezes Reis INE 7001 - Procedimentos de Análise Bidimensional de variáveis QUANTITATIVAS utilizando o Microsoft Excel. Professor Marcelo Menezes Reis O objetivo deste texto é apresentar os principais procedimentos

Leia mais

Pós-Graduação "Lato Sensu" Especialização em Análise de Dados e Data Mining

Pós-Graduação Lato Sensu Especialização em Análise de Dados e Data Mining Pós-Graduação "Lato Sensu" Especialização em Análise de Dados e Data Mining Inscrições Abertas Início das Aulas: 24/03/2015 Dias e horários das aulas: Terça-Feira 19h00 às 22h45 Semanal Quinta-Feira 19h00

Leia mais

Satisfação de Restrições. Capítulo 5 (disponível online)

Satisfação de Restrições. Capítulo 5 (disponível online) Satisfação de Restrições Capítulo 5 (disponível online) Sumário Problemas de Satisfação de Restrições (CSPs) Procura com Retrocesso para CSPs Procura Local para CSPs Estrutura dos CSPs Problemas de Satisfação

Leia mais

Processamento de Imagem. Prof. MSc. André Yoshimi Kusumoto andrekusumoto.unip@gmail.com

Processamento de Imagem. Prof. MSc. André Yoshimi Kusumoto andrekusumoto.unip@gmail.com Processamento de Imagem Prof. MSc. André Yoshimi Kusumoto andrekusumoto.unip@gmail.com Visão Computacional Não existe um consenso entre os autores sobre o correto escopo do processamento de imagens, a

Leia mais

Mineração de dados em triagem de risco de saúde

Mineração de dados em triagem de risco de saúde Mineração de dados em triagem de risco de saúde Thales Vaz Maciel 1 ; Vinicius Rosa Seus 2 ; Karina dos Santos Machado 3 ; Eduardo Nunes Borges 4 1234 Centro de Ciências Computacionais, Fundação Universidade

Leia mais

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Planejamento Estratégico de TI. Prof.: Fernando Ascani Planejamento Estratégico de TI Prof.: Fernando Ascani Data Warehouse - Conceitos Hoje em dia uma organização precisa utilizar toda informação disponível para criar e manter vantagem competitiva. Sai na

Leia mais