AVALIAÇÃO COMPARATIVA DE ALGORITMOS PARA SISTEMAS DE RECOMENDAÇÃO EM MÚLTIPLOS DOMÍNIOS: MODELOS INTERPRETÁVEIS APLICADOS A DADOS EDUCACIONAIS

Tamanho: px
Começar a partir da página:

Download "AVALIAÇÃO COMPARATIVA DE ALGORITMOS PARA SISTEMAS DE RECOMENDAÇÃO EM MÚLTIPLOS DOMÍNIOS: MODELOS INTERPRETÁVEIS APLICADOS A DADOS EDUCACIONAIS"

Transcrição

1 AVALIAÇÃO COMPARATIVA DE ALGORITMOS PARA SISTEMAS DE RECOMENDAÇÃO EM MÚLTIPLOS DOMÍNIOS: MODELOS INTERPRETÁVEIS APLICADOS A DADOS EDUCACIONAIS Hugo Marques Casarini Faculdade de Engenharia de Computação / CEATEC Resumo: A previsão da nota que um aprendiz irá obter em tarefas que ainda não realizou pode ser usada para orientar os seus passos no processo de ensino-aprendizagem. Esta nota pode ser prevista a partir dos dados adquiridos durante a interação de estudantes com sistemas tutores, usando métodos de mineração de dados que produzem modelos de fácil interpretação. Tem sido usada uma grande diversidade desses métodos ou algoritmos, principalmente no domínio do comércio eletrônico, mas o seu uso ainda é raro no contexto considerado. Neste artigo discute-se a aplicação de um algoritmo indutor de conjuntos de regras aplicado ao problema de prever se um estudante acertará ou não uma questão, a partir das questões que ele e seus colegas responderam previamente. A avaliação experimental realizada mostrou que o algoritmo apresenta acurácia, precisão e cobertura elevados quando se dispõe de um elevado número de exemplos, mas o mesmo comportamento não se verifica quando isso não ocorre. Palavras-chave: Sistemas de recomendação, modelos de previsão interpretáveis, previsão do desempenho de estudantes. Área do Conhecimento: Ciências Exatas e da Terra Ciência da computação. 1. INTRODUÇÃO O problema da recomendação de uma informação ou item relevante para um determinado indivíduo é um tema que vem ganhando importância tanto no meio acadêmico quanto no comercial. Estes sistemas possuem como objetivo reduzir as inúmeras opções de itens disponíveis, prevendo um ou mais que sejam de possível interesse de um usuário. Para isso, podem ser utilizadas informações diversas como as preferências do usuário e seu respectivo histórico de interações com o sistema. Juan Manuel Adán Coello Grupo de Pesquisa em Sistemas Inteligentes CEATEC Entre as principais abordagens para utilizar essas informações e fazer recomendações de interesse do usuário, destacam-se a filtragem colaborativa (FC) [1] e a mineração de dados baseada em aprendizado de máquina [2], usando, entre outros, métodos que produzem modelos interpretáveis, como as árvores de decisão e as regras de classificação. Os métodos de aprendizado de máquina podem analisar o comportamento passado dos usuários para prever comportamentos futuros. Nos sistemas de recomendação usualmente utilizam-se associações usuário-item. Essas associações referem-se a uma lista de m usuários, e uma lista de n itens que são representadas por uma matriz m x n contendo as avaliações (ratings) dadas aos itens pelo o usuário em questão. Entre as limitações dos algoritmos de FC destacase a incapacidade de recomendar novos itens e de recomendar itens a novos usuários, já que um novo usuário ainda não avaliou nenhum item e um novo item ainda não foi avaliado por usuário algum. Essa situação caracteriza o problema da partida a frio (cold start problem) e é muito comum sua discussão no estudo de sistemas de recomendação. Outros problemas importantes decorrem da presença de matrizes esparsas (muitos espaços vazios) e matrizes muito grandes (diversas dimensões) que dificultam fazer previsões precisas e aumentam as demandas computacionais para fazê-lo. O modelo tradicional para transformação de dados em informação e em conhecimento útil, por exemplo para recomendar itens de interesse de um usuário, consiste em um processamento manual dos dados por especialistas que, então, produzem relatórios que deverão ser analisados. Em muitos casos, devido ao grande volume de dados, esse processo manual torna-se impraticável. O KDD (Knowledge Discovery in Databases ou Descoberta de Conhecimento nas bases de dados) [3] é uma tentativa de solucionar

2 o problema causado pela chamada "era da informação": a sobrecarga de dados. O KDD refere-se ao processo de descoberta de conhecimento, tendo a mineração de dados como uma das etapas do processo. Na Figura 1 podemos ver uma representação do processo de KDD. Figura 1. O processo de KDD Fonte: [2]. Algoritmos de aprendizado de máquina estão entre os principais métodos usados na etapa de mineração de dados do processo de KDD para detectar padrões nos dados disponíveis. O foco do trabalho que deu origem a este artigo são os algoritmos de mineração de dados que produzem modelos interpretáveis por pessoas. O artigo está organizado da seguinte forma: na Seção 2 faz-se uma introdução e discussão sobre o processo de KDD, apresentando detalhes das suas etapas, como destaque para a mineração de dados, a mais relevante para o trabalho descrito neste artigo; na Seção 3 aprofunda-se a discussão sobre algoritmos de mineração de dados que produzem modelos de fácil interpretação, abordagem utilizada no trabalho descrito para prever o desempenho de estudantes; na Seção 4 apresentam-se os resultados de uma avaliação experimental de alguns desses algoritmos quando utilizados com dados educacionais e, finalmente, na Seção 5 são apresentadas algumas considerações finais. 2. DESCOBERTA DE CONHECIMENTO EM BASES DE DADOS (KDD) O processo KDD é definido como o processo não trivial de identificação de padrões novos, potencialmente uteis e inteligíveis a partir de dados [2]. O processo é não trivial já que algum método de busca ou inferência está envolvido, ou seja, não se trata apenas de um processo simples de computar quantidades pré-definidas, como calcular a média de um conjunto de números. Os padrões descobertos devem ser válidos, com algum grau de certeza, em novos dados, potencialmente úteis (trazem algum benefício) e compreensíveis (se não imediatamente, então depois da interpretação). O processo de busca de conhecimento contém uma série de passos: seleção, pré-processamento e limpeza, transformação, mineração de dados e interpretação e avaliação. Conhecer os dados com os quais se irá trabalhar é fundamental para a escolha dos métodos mais adequados de mineração de dados. Os dados podem ser categorizados em quantitativos e qualitativos. Os dados quantitativos são representados por valores numéricos, podendo ainda ser discretos ou contínuos. Já os dados qualitativos contêm valores nominais e ordinais (categóricos). Tendo uma visão inicial dos dados, é necessário explorá-los, buscando conhecê-los melhor e encontrar valores que possam comprometer sua qualidade, tais como valores em branco ou nulos e dados duplicados. À medida em que que os dados vão sendo conhecidos, ocorre a sua preparação ou pré-processamento para que os algoritmos de mineração possam ser aplicados. A etapa de transformação dos dados é necessária como parte da preparação dos dados para o uso dos algoritmos de mineração, já que, por exemplo, alguns algoritmos trabalham apenas com valores numéricos e outros apenas com valores categóricos. Nestes casos, é necessário transformar os valores numéricos em categóricos ou os categóricos em valores numéricos. Em alguns casos o volume de dados é tão grande que torna o processo de análise dos dados e a própria mineração impraticáveis. Nestes casos, as técnicas de redução de dados podem ser aplicadas para que a massa de dados original seja convertida em uma massa de dados menor, porém, sem perder a representatividade dos dados originais. Isto permite que os algoritmos de mineração sejam executados com mais eficiência, mantendo a qualidade do resultado. Geralmente, os repositórios usados no processo de KDD possuem quantidades muito elevadas de registros, de modo que o uso de todos os registros para a construção do modelo de mineração de dados pode ser inviável. Nesse contexto, utiliza-se uma amostra representativa que é dividida em três conjuntos: conjunto de treinamento (conjunto de dados usados para produzir o modelo); conjunto de testes (usado para testar o modelo construído); conjunto de validação (usado para validar o modelo construído). 3. MINERAÇÃO DE DADOS A mineração de dados é um passo no processo de descoberta de conhecimento, que consiste na realização da análise dos dados e na aplicação de algoritmos de descoberta que, sob certas

3 limitações computacionais, produzem um conjunto de padrões (ou modelos) a partir dos dados. As tarefas mais comuns da etapa de mineração de dados são descrição, classificação, estimação ou regressão, predição, agrupamento e associação. A descrição é a tarefa utilizada para descrever os padrões e tendências revelados pelos dados. A classificação visa a identificar a qual classe um determinado registro pertence. A estimação ou regressão visa encontrar uma função que mapeia itens de dados em uma variável de predição real. O agrupamento visa identificar um grupo finito de categorias, ou grupos, que descreva os dados. A associação consiste em identificar quais atributos estão relacionados. Tradicionalmente, os métodos de mineração de dados são divididos em aprendizado supervisionado e não-supervisionado. A diferença entre estes métodos reside no fato de que os métodos não-supervisionados não precisam de uma pré-categorização para os dados, ou seja, não é necessário um atributo alvo. Tais métodos geralmente usam alguma medida de similaridade entre os atributos. As tarefas de agrupamento e associação são consideradas como nãosupervisionadas. Já no aprendizado supervisionado, é usado um conjunto de dados que possuem uma variável alvo pré-definida e os registros são categorizados em relação a ela. As técnicas de classificação podem ser supervisionadas e não-supervisionadas. São usadas para prever valores de variáveis do tipo categóricas. No trabalho descrito neste artigo busca-se construir um modelo para prever uma nota de um estudante em uma atividade ainda não realizada, a partir das suas notas em outras atividades e das notas de outros estudantes nessa e em outras atividades. Este problema pode ser entendido como um problema de predição (da nota da questão não realizada) ou de classificação (prever se o estudante irá errar ou acertar a questão). O conjunto de dados considerado contém informações do tipo múltipla escolha, em que o estudante pode acertar ou errar uma questão, de modo que o problema foi considerando como sendo de classificação. Entre os requisitos do trabalho considerado estava que os modelos gerados fossem facilmente interpretáveis por pessoas. Por esse motivo foram focados algoritmos que produzem modelos classificatórios na forma de árvores de decisão e de regras. Em uma árvore de decisão cada nó indica um teste feito sobre uma variável. As ligações entre os nós representam os valores possíveis do teste do nó superior e as folhas indicam a classe à qual o registro pertence. Após construir uma árvore de decisão, para classificar um novo registro, basta seguir o fluxo na árvore, mediante os testes nos nós não-folha, começando no nó raiz até chegar a uma folha. Um modelo de classificação baseado em regras emprega clausulas da forma SE condição ENTÃO conclusão. No trabalho descrito neste artigo foi empregado o algoritmo RIPPER (Repeated Incremental Pruning to Produce Error Reduction) [4] para produzir conjuntos de regras que permitam prever se um estudante acertará ou não uma questão que ainda não fez. Algoritmos de aprendizado de conjuntos de regras são geralmente comparados com algoritmos de aprendizado de árvores de decisão. Conjuntos de regras apresentam a vantagem de serem fáceis de entender e podem ser representados em lógica de primeira ordem. A sua maior desvantagem é que em geral são pouco escaláveis, à medida que aumenta o conjunto de treinamento, e apresentam dificuldades para tratar de dados com ruído. No entanto, o algoritmo RIPPER não apresenta essas desvantagens. Uma das maiores limitações das de árvores de decisão é o ajuste excessivo (overfitting), ou seja, o modelo produzido funciona muito bem com o conjunto de treinamento, mas não apresenta resultados tão bons com o conjunto de validação (e com dados novos). O RIPPER implementa a técnica REP (Reduced Error Pruning) que é bem sucedida para evitar o ajuste excessivo. Somando as características positivas do RIPPER apresentadas na literatura com o fato de haver uma implementação desse algoritmo no ambiente de mineração de dados Rapidminer 1, disponível para uso do trabalho descrito, este foi o algoritmo de indução de modelos interpretáveis escolhido para aplicar ao problema educacional considerado. 4. AVALIAÇÃO EXPERIMENTAL Nesta seção descreve-se a avaliação experimental conduzida para avaliar o algoritmo de indução de regras RIPPER quando empregado para uma base de dados educacional. A avaliação foi feita no ambiente RapidMiner, que implementa diversos mecanismos e algoritmos para o processo de KDD, inclusive o algoritmo mencionado. Foi empregada a base de dados educacionais assistments_ [5], que consiste em um conjunto de dados coletados entre 2009 e 2010, a partir de uma plataforma online 1

4 que permite que resolvam questões e recebam tutoria online. Essa base está organizada em um formato de tabela com diversas colunas. A base contém respostas de estudantes para questões. O algoritmo foi avaliado procurando focar na facilidade de interpretação dos resultados produzidos e da precisão das previsões feitas. A facilidade de interpretação foi avaliada visualmente, na medida que a intenção é verificar se os modelos produzidos são fáceis de entender a uma pessoa. A precisão foi avaliada por um processo de validação cruzada. O processo implementado no RapidMiner para avaliar os algoritmos consiste na execução de uma sequência de atividades. Incialmente a base original passou por um processo de transformação visando colocá-la no formato requerido pelos algoritmos empregados. Na base transformada, cada linha representa um usuário e cada coluna uma questão respondida pelos usuários. As células definidas por um par linha-coluna indicam se o usuário representado na linha acertou (valor 1) ou errou (valor 0) a questão associada à coluna. Em seguida, transforma esse valor do tipo numérico é transformado para o tipo binominal (true ou false). A base é então filtrada em função do atributo categórico (questão para a qual se deseja fazer previsões), deixando apenas os registros dos estudantes que responderam a essa questão (com acerto ou com erro). Em seguida, é selecionado o atributo (coluna da tabela) correspondente à questão para a qual se deseja treinar (aprender) um modelo (atributo categórico) capaz de predizer o seu valor, associando a esse atributo o papel de rótulo (label), passo necessário para indicar ao algoritmo que este é o atributo para o qual se quer realizar a aprendizagem. No próximo passo do processo, é feita uma amostragem estratificada da base. Esta etapa é necessária pois o computador empregado não tem memória suficiente para executar os algoritmos com toda a base. A amostra estratificada é um subconjunto selecionado aleatoriamente da base original, em que a distribuição de classes é a mesma da base original, isto é, a proporção de registros (linhas da tabela) na amostra correspondente a acertos e a erros é a mesma da base completa. Após fazer a amostragem, é executado um processo de avaliação cruzada para estimar o desempenho estatístico do modelo produzido pelo algoritmo de aprendizado usado em novos dados. Isto envolve um subprocesso de treinamento, onde é treinado, ou aprendido, um modelo, e um subprocesso de teste, onde é aplicado o modelo aprendido e medido o seu desempenho. No processo de validação cruzada, o conjunto de dados, neste caso a amostragem, é particionado em três subconjuntos de mesmo tamanho. Um subconjunto é usado como o conjunto de dados de teste (servirá de entrada para o subprocesso de teste) e dois subconjuntos são usados como os dados de treinamento (serão a entrada do subprocesso de treinamento). O processo de validação cruzada é repetido três vezes, com cada um dos três subconjuntos usado uma vez como dados de teste. Ao final, é feita uma média dos três resultados produzidos para produzir uma estimativa do desempenho do modelo. Após uma fase inicial em que se tentou produzir árvores de decisão, sem muito sucesso, decidiuse focar na utilização do algoritmo de indução de regras RIPPER. Foram utilizados os parâmetros padrão do algoritmo, tal como recomendado pela implementação disponível no Rapidminer, exceto pelo critério utilizado para selecionar os atributos que serão usados na cláusula condicional das regras geradas. O padrão da ferramenta é usar o ganho de informação, mas foram obtidos melhores resultados usando a acurácia. No primeiro caso, a entropia de todos os atributos é calculada e o atributo com a menor entropia é usado na divisão. No segundo caso, é selecionado o atributo que maximiza a acurácia do conjunto de regras. Foram produzidos e avaliados conjuntos de regras para diversas questões. Mostramos aqui os resultados obtidos para duas delas: e A primeira estava representada por 478 exemplos na amostra e a segunda por 95. Os conjuntos de regras produzidos para as questões e são mostrados, respectivamente, na Figura 2 e na Figura 3. Esses conjuntos são o resultado da junção dos conjuntos gerados nas três etapas da validação cruzada. Um conjunto de regras deve ser lido de cima para baixo. Logo, no caso da questão 11948, se o usuário acertou (true) a questão 9663, a previsão é que ele erre a Se essa condição não é verificada, verifica-se se ele acertou a questão Nesse caso, a previsão é que ele erre a questão Após outras três condições que levam à previsão de erro, temos a regra padrão que indica acerto da questão

5 if 9663 = true then false (20 / 1) if = true then false (16 / 2) if 2712 = true then false (11 / 0) if = true then false (11 / 1) if = true then false (234 / 2) else true (18 / 162) correct: 454 out of 478 training examples. Figura 2. Conjunto de regras para a questão if = true then false (9 / 0) if = true then true (0 / 14) if = true then false (8 / 0) if = true then false (4 / 0) if 2672 = true then true (0 / 10) if = true then false (4 / 0) else false (24 / 22) correct: 73 out of 95 training examples Figura 3. Conjunto de regras para a questão O desempenho desse conjunto de regras é mostrado na Figura 4 (copiada diretamente da tela do Rapidminer). Nota-se que a acurácia do conjunto é de 90,81% com um desvio de mais ou menos 4,53%. A acurácia indica o número de previsões corretas feitas. A figura mostra também a precisão e a cobertura desse conjunto de regras. A Figura 5, por sua vez, mostra o desempenho do conjunto de regras gerado para a questão Neste caso, exceto pela cobertura para a classe falso, todas as métricas mostram um pior desempenho. O motivo, provavelmente, seja o reduzido número de exemplos disponíveis para gerar o modelo. 5. CONCLUSÃO O objetivo do plano de trabalho detalhado no artigo consistia em analisar o desempenho de algoritmos de mineração de dados baseados em modelos de fácil interpretação, quando aplicados ao problema de prever o desempenho de estudantes. Para atingir o objetivo foi analisado o desempenho de conjuntos de regras induzidas pelo algoritmo RIPPER, quando aplicados a uma base de dados educacionais. Nos experimentos realizados, verificou-se que o algoritmo apresenta acurácia, precisão e cobertura elevadas quando se dispõe de um número expressivo de exemplos. Por outro lado, quando o número de exemplos é pequeno, o desempenho é bem menor. Pretende-se, dar continuidade ao trabalho, realizando novos experimentos em que será analisado o efeito da variação dos parâmetros do algoritmo estudado. Por fim, cabe ressaltar que a mineração de dados é uma área promissora e que, apesar dos bons Figura 4: Acurácia, precisão e cobertura, conjunto de regras para a questão Figura 5: Acurácia, precisão e cobertura, conjunto de regras para a questão

6 resultados apresentados, ainda tem muito para oferecer. AGRADECIMENTOS À FAPIC/Reitoria pela bolsa de iniciação científica, à PUC-Campinas pelas instalações que permitiram o desenvolvimento deste artigo e as reuniões realizadas, e ao Prof. Dr. Juan Manuel Adán Coello pela orientação e motivação e pelo convite para a participar no trabalho de IC que me permitiu adquirir novos conhecimentos na área de computação. REFERÊNCIAS [1] X. Amatrian, A. Jaimes, N. Oliver e J. M. Pujol. Data Mining Methods for Recommender Systems. Recommender Systems Handbook, pp , [2] U. Fayyad, G. Piatetsky-Shapiro, P. Smyth. From Data mining to Knowledge Discovery in Databases. AI Magazine, 17(3):37-54, Fall [3] I. H. Witten, E. Frank, and M. A. Hall. Data Mining: Practical Machine Learning Tools and Techniques: Practical Machine Learning Tools and Techniques. Morgan Kaufmann, [4] W. W. Cohen, Fast Effective Rule Induction, in Proceedings of the Twelfth International Conference on Machine Learning, Lake Tahoe, California, [5] M. Feng, N. Heffernan e K. Koedinger. Addressing the assessment challenge with an Online System that tutors as it assesses. The Journal of User Modeling and User-Adapted Interaction, 2009.

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI Fernando Luiz de Oliveira 1 Thereza Patrícia. P. Padilha 1 Conceição A. Previero 2 Leandro Maciel Almeida 1 RESUMO O processo

Leia mais

Avaliando o que foi Aprendido

Avaliando o que foi Aprendido Avaliando o que foi Aprendido Treinamento, teste, validação Predição da performance: Limites de confiança Holdout, cross-validation, bootstrap Comparando algoritmos: o teste-t Predecindo probabilidades:função

Leia mais

ALGORITMO HÍBRIDO PARA SISTEMAS DE RECOMENDAÇÃO UTILIZANDO FILTRAGEM COLABORATIVA E ALGORITMO GENÉTICO

ALGORITMO HÍBRIDO PARA SISTEMAS DE RECOMENDAÇÃO UTILIZANDO FILTRAGEM COLABORATIVA E ALGORITMO GENÉTICO ALGORITMO HÍBRIDO PARA SISTEMAS DE RECOMENDAÇÃO UTILIZANDO FILTRAGEM COLABORATIVA E ALGORITMO GENÉTICO Renan de Oliveira Yamaguti Faculdade de Engenharia de Computação / CEATEC renan.yamaguti@terra.com.br

Leia mais

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br MINERAÇÃO DE DADOS APLICADA Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br Processo Weka uma Ferramenta Livre para Data Mining O que é Weka? Weka é um Software livre do tipo open source para

Leia mais

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é?

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é? KDD Conceitos o que é? Fases limpeza etc Datamining OBJETIVOS PRIMÁRIOS TAREFAS PRIMÁRIAS Classificação Regressão Clusterização OBJETIVOS PRIMÁRIOS NA PRÁTICA SÃO DESCRIÇÃO E PREDIÇÃO Descrição Wizrule

Leia mais

Luiz Henrique Marino Cerqueira Faculdade de Engenharia de Computação CEATEC luiz.hmc@puccamp.edu.br

Luiz Henrique Marino Cerqueira Faculdade de Engenharia de Computação CEATEC luiz.hmc@puccamp.edu.br AVALIAÇÃO COMPARATIVA DE ALGORITMOS PARA SISTEMAS DE RECOMENDAÇÃO EM MÚLTIPLOS DOMÍNOS: PREVISÃO DO DESEMPENHO DE ESTUDANTES A PARTIR DE SUA INTERAÇÃO COM UM SISTEMA TUTOR. Luiz Henrique Marino Cerqueira

Leia mais

Prof. Msc. Paulo Muniz de Ávila

Prof. Msc. Paulo Muniz de Ávila Prof. Msc. Paulo Muniz de Ávila O que é Data Mining? Mineração de dados (descoberta de conhecimento em bases de dados): Extração de informação interessante (não-trivial, implícita, previamente desconhecida

Leia mais

O Processo de KDD. Data Mining SUMÁRIO - AULA1. O processo de KDD. Interpretação e Avaliação. Seleção e Pré-processamento. Consolidação de dados

O Processo de KDD. Data Mining SUMÁRIO - AULA1. O processo de KDD. Interpretação e Avaliação. Seleção e Pré-processamento. Consolidação de dados SUMÁRIO - AULA1 O Processo de KDD O processo de KDD Interpretação e Avaliação Consolidação de dados Seleção e Pré-processamento Warehouse Data Mining Dados Preparados p(x)=0.02 Padrões & Modelos Conhecimento

Leia mais

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka 1 Introdução A mineração de dados (data mining) pode ser definida como o processo automático de descoberta de conhecimento em bases de

Leia mais

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA Lizianne Priscila Marques SOUTO 1 1 Faculdade de Ciências Sociais e Aplicadas

Leia mais

DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS

DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS Tácio Dias Palhão Mendes Bacharelando em Sistemas de Informação Bolsista de Iniciação Científica da FAPEMIG taciomendes@yahoo.com.br Prof.

Leia mais

KDD UMA VISAL GERAL DO PROCESSO

KDD UMA VISAL GERAL DO PROCESSO KDD UMA VISAL GERAL DO PROCESSO por Fernando Sarturi Prass 1 1.Introdução O aumento das transações comerciais por meio eletrônico, em especial as feitas via Internet, possibilitou as empresas armazenar

Leia mais

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados Universidade Federal de Pernambuco Graduação em Ciência da Computação Centro de Informática 2006.2 Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento

Leia mais

INTRODUÇÃO A MINERAÇÃO DE DADOS UTILIZANDO O WEKA

INTRODUÇÃO A MINERAÇÃO DE DADOS UTILIZANDO O WEKA INTRODUÇÃO A MINERAÇÃO DE DADOS UTILIZANDO O WEKA Marcelo DAMASCENO(1) (1) Instituto Federal de Educação, Ciência e Tecnologia do Rio Grande do Norte/Campus Macau, Rua das Margaridas, 300, COHAB, Macau-RN,

Leia mais

A Preparação dos Dados

A Preparação dos Dados A Preparação dos Dados Escolhas Básicas Objetos, casos, instâncias Objetos do mundo real: carros, arvores, etc Ponto de vista da mineração: um objeto é descrito por uma coleção de características sobre

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Tipos de aprendizagem 3. Paradigmas de aprendizagem 4. Modos de aprendizagem

Leia mais

O Processo de KDD Knowledge Discovery in Database para Aplicações na Medicina

O Processo de KDD Knowledge Discovery in Database para Aplicações na Medicina SEMINC 2001 57 O Processo de KDD Knowledge Discovery in Database para Aplicações na Medicina MARIZA FERRO HUEI DIANA LEE UNIOESTE - Universidade Estadual do Oeste do Paraná CECE Centro de Engenharias e

Leia mais

Técnicas de Seleção de Atributos utilizando Paradigmas de Algoritmos Disciplina de Projeto e Análise de Algoritmos

Técnicas de Seleção de Atributos utilizando Paradigmas de Algoritmos Disciplina de Projeto e Análise de Algoritmos Técnicas de Seleção de Atributos utilizando Paradigmas de Algoritmos Disciplina de Projeto e Análise de Algoritmos Theo Silva Lins, Luiz Henrique de Campos Merschmann PPGCC - Programa de Pós-Graduação

Leia mais

Aprendizado de classificadores das ementas da Jurisprudência do Tribunal Regional do Trabalho da 2ª. Região - SP

Aprendizado de classificadores das ementas da Jurisprudência do Tribunal Regional do Trabalho da 2ª. Região - SP Aprendizado de classificadores das ementas da Jurisprudência do Tribunal Regional do Trabalho da 2ª. Região - SP Thiago Ferauche, Maurício Amaral de Almeida Laboratório de Pesquisa em Ciência de Serviços

Leia mais

Aula 02: Conceitos Fundamentais

Aula 02: Conceitos Fundamentais Aula 02: Conceitos Fundamentais Profa. Ms. Rosângela da Silva Nunes 1 de 26 Roteiro 1. Por que mineração de dados 2. O que é Mineração de dados 3. Processo 4. Que tipo de dados podem ser minerados 5. Que

Leia mais

Introdução. Capítulo 1

Introdução. Capítulo 1 Capítulo 1 Introdução Em computação, muitos problemas são resolvidos por meio da escrita de um algoritmo que especifica, passo a passo, como resolver um problema. No entanto, não é fácil escrever um programa

Leia mais

Exemplo de Aplicação do DataMinig

Exemplo de Aplicação do DataMinig Exemplo de Aplicação do DataMinig Felipe E. Barletta Mendes 19 de fevereiro de 2008 INTRODUÇÃO AO DATA MINING A mineração de dados (Data Mining) está inserida em um processo maior denominado Descoberta

Leia mais

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Pollyanna Carolina BARBOSA¹; Thiago MAGELA² 1Aluna do Curso Superior Tecnólogo em Análise e Desenvolvimento de Sistemas

Leia mais

Mineração de Dados. Prof. Júlio Cesar Nievola Especialização em Inteligência Computacional PPGIA - PUCPR

Mineração de Dados. Prof. Júlio Cesar Nievola Especialização em Inteligência Computacional PPGIA - PUCPR Mineração de Dados PPGIA - PUCPR Agenda 1. Histórico 2. Definições e Características 3. Processo e Tarefas de DM 4. Pré-Processamento 5. Representação do Conhecimento 6. Principais Tarefas 7. Procedimentos

Leia mais

servidores Web com RapidMiner

servidores Web com RapidMiner Mineração de regras de associação em servidores Web com RapidMiner Fabrício J. Barth fabricio.barth@gmail.com Resumo Este texto apresenta o uso da ferramenta RapidMiner na mineração de regras de associação

Leia mais

Classificação: Definição. Classificação: conceitos básicos e árvores de decisão. Exemplos de Tarefas de Classificação

Classificação: Definição. Classificação: conceitos básicos e árvores de decisão. Exemplos de Tarefas de Classificação Classificação: Definição Mineração de dados Classificação: conceitos básicos e árvores de decisão Apresentação adaptada do material de apoio do livro: Introduction to Data Mining Tan, Steinbach, Kumar

Leia mais

O objetivo da Mineração de Dados é extrair ou minerar conhecimento de grandes volumes de

O objetivo da Mineração de Dados é extrair ou minerar conhecimento de grandes volumes de MINERAÇÃO DE DADOS MINERAÇÃO DE DADOS O objetivo da Mineração de Dados é extrair ou minerar conhecimento de grandes volumes de dados. A mineração de dados é formada por um conjunto de ferramentas e técnicas

Leia mais

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO @ribeirord FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO Rafael D. Ribeiro, M.Sc,PMP. rafaeldiasribeiro@gmail.com http://www.rafaeldiasribeiro.com.br Lembrando... Aula 4 1 Lembrando... Aula 4 Sistemas de apoio

Leia mais

Gestão da Informação. Gestão da Informação. AULA 3 Data Mining

Gestão da Informação. Gestão da Informação. AULA 3 Data Mining Gestão da Informação AULA 3 Data Mining Prof. Edilberto M. Silva Gestão da Informação Agenda Unidade I - DM (Data Mining) Definição Objetivos Exemplos de Uso Técnicas Tarefas Unidade II DM Prático Exemplo

Leia mais

Utilização de Técnicas de Mineração de Dados como Auxílio na Detecção de Cartéis em Licitações Carlos Vinícius Sarmento Silva Célia Ghedini Ralha

Utilização de Técnicas de Mineração de Dados como Auxílio na Detecção de Cartéis em Licitações Carlos Vinícius Sarmento Silva Célia Ghedini Ralha WCGE II Workshop de Computação Aplicada em Governo Eletrônico Utilização de Técnicas de Mineração de Dados como Auxílio na Detecção de Cartéis em Licitações Carlos Vinícius Sarmento Silva Célia Ghedini

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 12 Aprendizado de Máquina Agentes Vistos Anteriormente Agentes baseados em busca: Busca cega Busca heurística Busca local

Leia mais

Detecção de Tentativas de Intrusão em Sistemas por Análise de Tráfego de Rede

Detecção de Tentativas de Intrusão em Sistemas por Análise de Tráfego de Rede Detecção de Tentativas de Intrusão em Sistemas por Análise de Tráfego de Rede Emiliano F. Castejon Instituto Nacional de Pesquisas Espaciais Laboratório Associado de Computação castejon@lac.inpe.br Antonio

Leia mais

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO Fernanda Delizete Madeira 1 ; Aracele Garcia de Oliveira Fassbinder 2 INTRODUÇÃO Data

Leia mais

UNISINOS - UNIVERSIDADE DO VALE DO RIO DOS SINOS

UNISINOS - UNIVERSIDADE DO VALE DO RIO DOS SINOS UNISINOS - UNIVERSIDADE DO VALE DO RIO DOS SINOS Curso: Informática Disciplina: Redes Neurais Prof. Fernando Osório E-mail: osorio@exatas.unisinos.br EXEMPLO DE QUESTÕES DE PROVAS ANTIGAS 1. Supondo que

Leia mais

PROPAGAÇÃO DE INFLUÊNCIA EM REDES SOCIAIS

PROPAGAÇÃO DE INFLUÊNCIA EM REDES SOCIAIS PROPAGAÇÃO DE INFLUÊNCIA EM REDES SOCIAIS Júlia Coelho Furlani Faculdade de Engenharia de Computação / CEATEC juliacfurlani@gmail.com Juan Manuel Adán Coello Grupo de Pesquisa em Sistemas Inteligentes

Leia mais

tipos de métodos, técnicas de inteligência artificial e técnicas de otimização. Por fim, concluise com as considerações finais.

tipos de métodos, técnicas de inteligência artificial e técnicas de otimização. Por fim, concluise com as considerações finais. 1. Introdução A previsão de vendas é fundamental para as organizações uma vez que permite melhorar o planejamento e a tomada de decisão sobre o futuro da empresa. Contudo toda previsão carrega consigo

Leia mais

MINERAÇÃO DE DADOS PARA DETECÇÃO DE SPAMs EM REDES DE COMPUTADORES

MINERAÇÃO DE DADOS PARA DETECÇÃO DE SPAMs EM REDES DE COMPUTADORES MINERAÇÃO DE DADOS PARA DETECÇÃO DE SPAMs EM REDES DE COMPUTADORES Kelton Costa; Patricia Ribeiro; Atair Camargo; Victor Rossi; Henrique Martins; Miguel Neves; Ricardo Fontes. kelton.costa@gmail.com; patriciabellin@yahoo.com.br;

Leia mais

Aprendizagem de Máquina. Ivan Medeiros Monteiro

Aprendizagem de Máquina. Ivan Medeiros Monteiro Aprendizagem de Máquina Ivan Medeiros Monteiro Definindo aprendizagem Dizemos que um sistema aprende se o mesmo é capaz de melhorar o seu desempenho a partir de suas experiências anteriores. O aprendizado

Leia mais

Pesquisa experimental

Pesquisa experimental 1 Aula 7 Interação Humano-Computador (com foco em métodos de pesquisa) Prof. Dr. Osvaldo Luiz de Oliveira 2 Pesquisa experimental Wilhelm Wundt (1832-1920), Pai da Psicologia Experimental. Leituras obrigatórias:

Leia mais

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO EPE0147 UTILIZAÇÃO DA MINERAÇÃO DE DADOS EM UMA AVALIAÇÃO INSTITUCIONAL

Leia mais

Data, Text and Web Mining

Data, Text and Web Mining Data, Text and Web Mining Fabrício J. Barth TerraForum Consultores Junho de 2010 Objetivo Apresentar a importância do tema, os conceitos relacionados e alguns exemplos de aplicações. Data, Text and Web

Leia mais

APLICAÇÃO DE DATA MINING NA IDENTIFICAÇÃO DE PADRÕES EM CRIANÇAS RESPIRADORAS BUCAIS E NASAIS 1.

APLICAÇÃO DE DATA MINING NA IDENTIFICAÇÃO DE PADRÕES EM CRIANÇAS RESPIRADORAS BUCAIS E NASAIS 1. APLICAÇÃO DE DATA MINING NA IDENTIFICAÇÃO DE PADRÕES EM CRIANÇAS RESPIRADORAS BUCAIS E NASAIS 1. SQUIZANI, Cleonice Schell 2 ; MORALES, Yuri 2 ; VIEIRA, Sylvio André Garcia 2 1 Trabalho de pesquisa - UNIFRA

Leia mais

3 Metodologia de Previsão de Padrões de Falha

3 Metodologia de Previsão de Padrões de Falha 3 Metodologia de Previsão de Padrões de Falha Antes da ocorrência de uma falha em um equipamento, ele entra em um regime de operação diferente do regime nominal, como descrito em [8-11]. Para detectar

Leia mais

Paralelização do algoritmo SPRINT usando MyGrid

Paralelização do algoritmo SPRINT usando MyGrid Paralelização do algoritmo SPRINT usando MyGrid Juliana Carvalho, Ricardo Rebouças e Vasco Furtado Universidade de Fortaleza UNIFOR juliana@edu.unifor.br ricardo@sspds.ce.gov.br vasco@unifor.br 1. Introdução

Leia mais

Mineração de Dados: Introdução e Aplicações

Mineração de Dados: Introdução e Aplicações Mineração de Dados: Introdução e Aplicações Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br Apresentação Luiz Merschmann Engenheiro

Leia mais

Padronização de Processos: BI e KDD

Padronização de Processos: BI e KDD 47 Padronização de Processos: BI e KDD Nara Martini Bigolin Departamento da Tecnologia da Informação -Universidade Federal de Santa Maria 98400-000 Frederico Westphalen RS Brazil nara.bigolin@ufsm.br Abstract:

Leia mais

Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II. Mineração de Dados. Sylvio Barbon Junior barbon@uel.br. 26 de junho de 2015 DC-UEL Sylvio Barbon Jr 1

Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II. Mineração de Dados. Sylvio Barbon Junior barbon@uel.br. 26 de junho de 2015 DC-UEL Sylvio Barbon Jr 1 Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II Mineração de Dados Sylvio Barbon Junior barbon@uel.br 26 de junho de 2015 DC-UEL Sylvio Barbon Jr 1 Sumário Etapa I Etapa II Inteligência de Negócios Visão

Leia mais

Árvores de Decisão. Índice

Árvores de Decisão. Índice Árvores de Decisão Índice 1. Introdução... 2 2. Árvores de decisão e a tarefa de classificação... 6 3. Principais conceitos vinculados à indução de árvores de decisão... 15 3.1 Top-Down Induction of Decision

Leia mais

Mineração de dados em triagem de risco de saúde

Mineração de dados em triagem de risco de saúde Mineração de dados em triagem de risco de saúde Thales Vaz Maciel 1 ; Vinicius Rosa Seus 2 ; Karina dos Santos Machado 3 ; Eduardo Nunes Borges 4 1234 Centro de Ciências Computacionais, Fundação Universidade

Leia mais

Extensão do WEKA para Métodos de Agrupamento com Restrição de Contigüidade

Extensão do WEKA para Métodos de Agrupamento com Restrição de Contigüidade Extensão do WEKA para Métodos de Agrupamento com Restrição de Contigüidade Carlos Eduardo R. de Mello, Geraldo Zimbrão da Silva, Jano M. de Souza Programa de Engenharia de Sistemas e Computação Universidade

Leia mais

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan Faculdade INED Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan 1 Unidade 4.5 2 1 BI BUSINESS INTELLIGENCE BI CARLOS BARBIERI

Leia mais

Web Data mining com R: aprendizagem de máquina

Web Data mining com R: aprendizagem de máquina Web Data mining com R: aprendizagem de máquina Fabrício Jailson Barth Faculdade BandTec e VAGAS Tecnologia Junho de 2013 Sumário O que é Aprendizagem de Máquina? Hierarquia de aprendizado. Exemplos de

Leia mais

MESTRADO EM PESQUISA DE MERCADOS 2006 2007

MESTRADO EM PESQUISA DE MERCADOS 2006 2007 MESTRADO EM PESQUISA DE MERCADOS 2006 2007 PROGRAMA DAS DISCIPLINAS 1 1º trimestre PESQUISA DE MERCADOS Objectivos Pretende-se que os alunos: (a) adquiram os conceitos e semântica próprios do tema, (b)

Leia mais

Algoritmos Indutores de Árvores de

Algoritmos Indutores de Árvores de Algoritmos Indutores de Árvores de Decisão Fabrício J. Barth Sistemas Inteligentes Análise e Desenvolvimento de Sistemas Faculdades de Tecnologia Bandeirantes Abril de 2013 Problema: Diagnóstico para uso

Leia mais

O que é a estatística?

O que é a estatística? Elementos de Estatística Prof. Dr. Clécio da Silva Ferreira Departamento de Estatística - UFJF O que é a estatística? Para muitos, a estatística não passa de conjuntos de tabelas de dados numéricos. Os

Leia mais

Estudo e Análise da Base de Dados do Portal Corporativo da Sexta Região da Polícia Militar com vista à aplicação de Técnicas de Mineração de Dados1

Estudo e Análise da Base de Dados do Portal Corporativo da Sexta Região da Polícia Militar com vista à aplicação de Técnicas de Mineração de Dados1 Estudo e Análise da Base de Dados do Portal Corporativo da Sexta Região da Polícia Militar com vista à aplicação de Técnicas de Mineração de Dados1 Rafaela Giroto, 10º módulo de Ciência da Computação,

Leia mais

Introdução a Datamining (previsão e agrupamento)

Introdução a Datamining (previsão e agrupamento) Introdução a Datamining (previsão e agrupamento) Victor Lobo Mestrado em Estatística e Gestão de Informação E o que fazer depois de ter os dados organizados? Ideias base Aprender com o passado Inferir

Leia mais

Um Modelo de Aprendizado de Agentes Inteligentes Baseado em Técnicas de Data Mining

Um Modelo de Aprendizado de Agentes Inteligentes Baseado em Técnicas de Data Mining Um Modelo de Aprendizado de Agentes Inteligentes Baseado em Técnicas de Data Mining Leandro Maciel,Thereza Patrícia P. Padilha Curso de Sistemas de Informação Centro Universitário Luterano de Palmas (CEULP)

Leia mais

Data Mining Software Weka. Software Weka. Software Weka 30/10/2012

Data Mining Software Weka. Software Weka. Software Weka 30/10/2012 Data Mining Software Weka Prof. Luiz Antonio do Nascimento Software Weka Ferramenta para mineração de dados. Weka é um Software livre desenvolvido em Java. Weka é um É um pássaro típico da Nova Zelândia.

Leia mais

Cálculo de amostra para monitoria de qualidade em Call Center

Cálculo de amostra para monitoria de qualidade em Call Center Cálculo de amostra para monitoria de qualidade em Call Center Esta metodologia tem como objetivo definir o tamanho mínimo ideal da amostra, garantindo a representatividade da população de chamadas em um

Leia mais

Data Mining na Web para Inteligência Competitiva

Data Mining na Web para Inteligência Competitiva Data Mining na Web para Inteligência Competitiva Simone de Almeida (CEFET/PR) simonea@pg.cefetpr.br Rui Francisco Martins Marçal (CEFET/PR) marcal@pg.cefetpr.br Luciano Scandelari (CEFET/PR) luciano@cefetpr..br

Leia mais

Introdução a Datamining (previsão e agrupamento)

Introdução a Datamining (previsão e agrupamento) E o que fazer depois de ter os dados organizados? Introdução a Datamining (previsão e agrupamento) Victor Lobo Mestrado em Estatística e Gestão de Informação Ideias base Aprender com o passado Inferir

Leia mais

UTILIZANDO O SOFTWARE WEKA

UTILIZANDO O SOFTWARE WEKA UTILIZANDO O SOFTWARE WEKA O que é 2 Weka: software livre para mineração de dados Desenvolvido por um grupo de pesquisadores Universidade de Waikato, Nova Zelândia Também é um pássaro típico da Nova Zelândia

Leia mais

Estatística Aplicada às Ciências Sociais e Ambientais. Organização da Disciplina. Conteúdo da Aula. Contextualização. Farmácia Industrial UFPR

Estatística Aplicada às Ciências Sociais e Ambientais. Organização da Disciplina. Conteúdo da Aula. Contextualização. Farmácia Industrial UFPR Estatística Aplicada às Ciências Sociais e Ambientais Apresentação Aula 1 Prof. Daniel de Christo Farmácia Industrial UFPR Mestrado em Genética UFPR Lecionando no Ensino Superior desde 2003 Organização

Leia mais

Estatística Aplicada. Gestão de TI. Evanivaldo Castro Silva Júnior

Estatística Aplicada. Gestão de TI. Evanivaldo Castro Silva Júnior Gestão de TI Evanivaldo Castro Silva Júnior Porque estudar Estatística em um curso de Gestão de TI? TI trabalha com dados Geralmente grandes bases de dados Com grande variabilidade Difícil manipulação,

Leia mais

Hierarquia de modelos e Aprendizagem de Máquina

Hierarquia de modelos e Aprendizagem de Máquina Hierarquia de modelos e Aprendizagem de Máquina Fabrício Jailson Barth BandTec Maio de 2015 Sumário Introdução: hierarquia de modelos e aprendizagem de máquina. O que é Aprendizagem de Máquina? Hierarquia

Leia mais

USO DA MINERAÇÃO DE DADOS NA IDENTIFICAÇÃO DE ALUNOS COM PERFIL DE EVASÃO DO ENSINO SUPERIOR

USO DA MINERAÇÃO DE DADOS NA IDENTIFICAÇÃO DE ALUNOS COM PERFIL DE EVASÃO DO ENSINO SUPERIOR CURSO DE CIÊNCIA DA COMPUTAÇÃO Romeu Cornelius Junior USO DA MINERAÇÃO DE DADOS NA IDENTIFICAÇÃO DE ALUNOS COM PERFIL DE EVASÃO DO ENSINO SUPERIOR Santa Cruz do Sul 2015 Romeu Cornelius Junior USO DA MINERAÇÃO

Leia mais

Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS

Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS Sumário Conceitos / Autores chave... 3 1. Introdução... 3 2. Tarefas desempenhadas por Técnicas de 4 Mineração de Dados...

Leia mais

Engenharia de Software II

Engenharia de Software II Engenharia de Software II Aula 10 http://www.ic.uff.br/~bianca/engsoft2/ Aula 10-24/05/2006 1 Ementa Processos de desenvolvimento de software Estratégias e técnicas de teste de software (Caps. 13 e 14

Leia mais

Extração de Conhecimento & Mineração de Dados

Extração de Conhecimento & Mineração de Dados Extração de Conhecimento & Mineração de Dados Nesta apresentação é dada uma breve introdução à Extração de Conhecimento e Mineração de Dados José Augusto Baranauskas Departamento de Física e Matemática

Leia mais

DESENVOLVIMENTO DE UM MÉTODO HÍBRIDO INTEGRANDO OS MÉTODOS: HIERARCHICAL CLUSTERING E BISECTING K-MEANS

DESENVOLVIMENTO DE UM MÉTODO HÍBRIDO INTEGRANDO OS MÉTODOS: HIERARCHICAL CLUSTERING E BISECTING K-MEANS DESENVOLVIMENTO DE UM MÉTODO HÍBRIDO INTEGRANDO OS MÉTODOS: HIERARCHICAL CLUSTERING E BISECTING K-MEANS BENTO, Renan Delazari 1 CHICON, Patricia Mariotto Mozzaquatro 2 Resumo: O presente artigo apresenta

Leia mais

Mineração de Dados Meteorológicos pela Teoria dos Conjuntos Aproximativos para Aplicação na Previsão de Precipitação Sazonal

Mineração de Dados Meteorológicos pela Teoria dos Conjuntos Aproximativos para Aplicação na Previsão de Precipitação Sazonal Anais do CNMAC v.2 ISSN 1984-820X Mineração de Dados Meteorológicos pela Teoria dos Conjuntos Aproximativos para Aplicação na Previsão de Precipitação Sazonal Juliana Aparecida Anochi Instituto Nacional

Leia mais

FILTRAGEM DE INFORMAÇÃO NA WEB USANDO REDE NEURAL DE HOPFIELD E ONTOLOGIA

FILTRAGEM DE INFORMAÇÃO NA WEB USANDO REDE NEURAL DE HOPFIELD E ONTOLOGIA FILTRAGEM DE INFORMAÇÃO NA WEB USANDO REDE NEURAL DE HOPFIELD E ONTOLOGIA Daniel Mandelli Martins Faculdade de Engenharia de Computação CEATEC danielmartins@puc-campinas.edu.br Juan Manuel Adán Coello

Leia mais

Indução de Árvores de Decisão para a Inferência de Redes Gênicas

Indução de Árvores de Decisão para a Inferência de Redes Gênicas PR UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ Ministério da Educação Universidade Tecnológica Federal do Paraná Pró-Reitoria de Pesquisa e Pós-Graduação Relatório Final de Atividades Indução de Árvores

Leia mais

FACULDADE DE TECNOLOGIA DE SÃO PAULO LUCIANA MENDES. Data Mining Estudo de Técnicas e Aplicações na Área Bancária

FACULDADE DE TECNOLOGIA DE SÃO PAULO LUCIANA MENDES. Data Mining Estudo de Técnicas e Aplicações na Área Bancária FACULDADE DE TECNOLOGIA DE SÃO PAULO LUCIANA MENDES Data Mining Estudo de Técnicas e Aplicações na Área Bancária São Paulo 2011 FACULDADE DE TECNOLOGIA DE SÃO PAULO LUCIANA MENDES Data Mining Estudo de

Leia mais

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE Engenharia de Computação Professor: Rosalvo Ferreira de Oliveira Neto Estudos Comparativos Recentes - Behavior Scoring Roteiro Objetivo Critérios de Avaliação

Leia mais

Aplicativo de Mineração de Dados Aplicado em Bases de Dados Acadêmicas

Aplicativo de Mineração de Dados Aplicado em Bases de Dados Acadêmicas 22 - Encontro Anual de Tecnologia da Informação Aplicativo de Mineração de Dados Aplicado em Bases de Dados Acadêmicas Elisa Maria Vissotto1, Adriane Barbosa Camargo2 1 Universidade Regional Integrada

Leia mais

UNIVERSIDADE PRESBITERIANA MACKENZIE

UNIVERSIDADE PRESBITERIANA MACKENZIE UNIVERSIDADE PRESBITERIANA MACKENZIE MARCELO VIANA DONI ANÁLISE DE CLUSTER: MÉTODOS HIERÁRQUICOS E DE PARTICIONAMENTO São Paulo 4 MARCELO VIANA DONI ANÁLISE DE CLUSTER: MÉTODOS HIERÁRQUICOS E DE PARTICIONAMENTO

Leia mais

a) Teste das funções do sistema com outros sistemas b) Teste de componentes que em conjunto compõem a função do sistema

a) Teste das funções do sistema com outros sistemas b) Teste de componentes que em conjunto compõem a função do sistema Simulado CTFL- BSTQB Tempo de duração: 60 minutos 1. Considerando as seguintes afirmações: I. 100% de cobertura de sentença (comando) garante 100% de cobertura de desvio II. 100% de cobertura de desvio

Leia mais

DESCOBERTA DE CONHECIMENTO EM BASES DE DADOS

DESCOBERTA DE CONHECIMENTO EM BASES DE DADOS DESCOBERTA DE CONHECIMENTO EM BASES DE DADOS Claudio Napolis Costa 1, Jonatas Vieira Coutinho 2, Lúcia Helena de Magalhães 3, Márcio Aarestrup Arbex 4 RESUMO Vários métodos de aprendizado supervisionado

Leia mais

IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES ENTRE PRODUTOS DE UMA BASE DE DADOS REAL

IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES ENTRE PRODUTOS DE UMA BASE DE DADOS REAL Universidade Federal de Ouro Preto - UFOP Instituto de Ciências Exatas e Biológicas - ICEB Departamento de Computação - DECOM IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES

Leia mais

Modelagem do Aprendizado de Grupos de Alunos em Ambientes Colaborativos Utilizando Data Mining

Modelagem do Aprendizado de Grupos de Alunos em Ambientes Colaborativos Utilizando Data Mining Modelagem do Aprendizado de Grupos de Alunos em Ambientes Colaborativos Utilizando Data Mining Thereza Patrícia Pereira Padilha 1,2, Leandro Maciel Almeida 1, João Bosco da Mota Alves 2 1 Centro Universitário

Leia mais

KDD E MINERAÇÃO DE DADOS:

KDD E MINERAÇÃO DE DADOS: KDD E MINERAÇÃO DE DADOS: Introdução e Motivação Prof. Ronaldo R. Goldschmidt ronaldo@de9.ime.eb.br rribeiro@univercidade.br geocities.yahoo.com.br/ronaldo_goldschmidt Fatos: Avanços em TI e o crescimento

Leia mais

Análise de Técnicas de Mineração de Dados

Análise de Técnicas de Mineração de Dados Análise de Técnicas de Mineração de Dados Taylor Pablo Evaristo Silva 1, Lívia Márcia Silva 1 1 Universidade Presidente Antônio Carlos - Departamento de Ciência da Computação (UNIPAC) Rua Palma Bageto

Leia mais

MODELO INTEGRADO PARA ANÁLISE DO DESLIGAMENTO DE EMPREGADOS: UM ESTUDO DE CASO

MODELO INTEGRADO PARA ANÁLISE DO DESLIGAMENTO DE EMPREGADOS: UM ESTUDO DE CASO MODELO INTEGRADO PARA ANÁLISE DO DESLIGAMENTO DE EMPREGADOS: UM ESTUDO DE CASO Felipe de Moraes Oliveira Thiago de Melo Rezende PETROBRAS Av. República do Chile 65, Rio de Janeiro RJ. CEP 20031-912 felipe.moraes@petrobras.com.br

Leia mais

Uma aplicação de Inteligência Computacional e Estatística Clássica na Previsão do Mercado de Seguros de Automóveis Brasileiro

Uma aplicação de Inteligência Computacional e Estatística Clássica na Previsão do Mercado de Seguros de Automóveis Brasileiro Uma aplicação de Inteligência Computacional e Estatística Clássica na Previsão do Mercado de Seguros de Automóveis Brasileiro Tiago Mendes Dantas t.mendesdantas@gmail.com Departamento de Engenharia Elétrica,

Leia mais

SISTEMAS DE APOIO À DECISÃO SAD

SISTEMAS DE APOIO À DECISÃO SAD SISTEMAS DE APOIO À DECISÃO SAD Conceitos introdutórios Decisão Escolha feita entre duas ou mais alternativas. Tomada de decisão típica em organizações: Solução de problemas Exploração de oportunidades

Leia mais

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Planejamento Estratégico de TI. Prof.: Fernando Ascani Planejamento Estratégico de TI Prof.: Fernando Ascani Data Warehouse - Conceitos Hoje em dia uma organização precisa utilizar toda informação disponível para criar e manter vantagem competitiva. Sai na

Leia mais

IC Inteligência Computacional Redes Neurais. Redes Neurais

IC Inteligência Computacional Redes Neurais. Redes Neurais Universidade Federal do Rio de Janeiro PÓS-GRADUAÇÃO / 2008-2 IC Inteligência Computacional Redes Neurais www.labic.nce.ufrj.br Antonio G. Thomé thome@nce.ufrj.br Redes Neurais São modelos computacionais

Leia mais

Microsoft Innovation Center

Microsoft Innovation Center Microsoft Innovation Center Mineração de Dados (Data Mining) André Montevecchi andre@montevecchi.com.br Introdução Objetivo BI e Mineração de Dados Aplicações Exemplos e Cases Algoritmos para Mineração

Leia mais

Projeto de Redes Neurais e MATLAB

Projeto de Redes Neurais e MATLAB Projeto de Redes Neurais e MATLAB Centro de Informática Universidade Federal de Pernambuco Sistemas Inteligentes IF684 Arley Ristar arrr2@cin.ufpe.br Thiago Miotto tma@cin.ufpe.br Baseado na apresentação

Leia mais

O Uso da Descoberta de Conhecimento em Base de Dados para Apoiar a Tomada de Decisões

O Uso da Descoberta de Conhecimento em Base de Dados para Apoiar a Tomada de Decisões 1 O Uso da Descoberta de Conhecimento em Base de Dados para Apoiar a Tomada de Decisões José Carlos Almeida Ryan Ribeiro de Eric Rommel G. Dantas Daniel Silva de Lima Patrício Júnior Azevedo Centro de

Leia mais

Descoberta de Conhecimento em Bases de Dados. Classificação

Descoberta de Conhecimento em Bases de Dados. Classificação Universidade Técnica de Lisboa INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO Informática e Sistemas de Informação Aplicados em Economia Descoberta de Conhecimento em Bases de Dados. Classificação Descoberta

Leia mais

Aplicação de Técnicas de Mineração de Dados no Processo de Aprendizagem na Educação a Distância

Aplicação de Técnicas de Mineração de Dados no Processo de Aprendizagem na Educação a Distância Aplicação de Técnicas de Mineração de Dados no Processo de Aprendizagem na Educação a Distância Maxwel Macedo Dias 1, Luiz Alberto da Silva Filho 2, Adriano Del Pino Lino 1, Eloi Luiz Favero 2, Edson Marcos

Leia mais

Noções de Pesquisa e Amostragem. André C. R. Martins

Noções de Pesquisa e Amostragem. André C. R. Martins Noções de Pesquisa e Amostragem André C. R. Martins 1 Bibliografia Silva, N. N., Amostragem probabilística, EDUSP. Freedman, D., Pisani, R. e Purves, R., Statistics, Norton. Tamhane, A. C., Dunlop, D.

Leia mais

Probabilidade. Renata Souza. Introdução. Tabelas Estatísticas. População, Amostra e Variáveis. Gráficos e Distribuição de Freqüências

Probabilidade. Renata Souza. Introdução. Tabelas Estatísticas. População, Amostra e Variáveis. Gráficos e Distribuição de Freqüências Probabilidade Introdução Tabelas Estatísticas População, Amostra e Variáveis Gráficos e Distribuição de Freqüências Renata Souza Conceitos Antigos de Estatística stica a) Simples contagem aritmética Ex.:

Leia mais

Estatística: Conceitos e Organização de Dados. Introdução Conceitos Método Estatístico Dados Estatísticos Tabulação de Dados Gráficos

Estatística: Conceitos e Organização de Dados. Introdução Conceitos Método Estatístico Dados Estatísticos Tabulação de Dados Gráficos Estatística: Conceitos e Organização de Dados Introdução Conceitos Método Estatístico Dados Estatísticos Tabulação de Dados Gráficos Introdução O que é Estatística? É a parte da matemática aplicada que

Leia mais

2.1.2 Definição Matemática de Imagem

2.1.2 Definição Matemática de Imagem Capítulo 2 Fundamentação Teórica Este capítulo descreve os fundamentos e as etapas do processamento digital de imagens. 2.1 Fundamentos para Processamento Digital de Imagens Esta seção apresenta as propriedades

Leia mais

Extração de Conhecimento a partir dos Sistemas de Informação

Extração de Conhecimento a partir dos Sistemas de Informação Extração de Conhecimento a partir dos Sistemas de Informação Gisele Faffe Pellegrini & Katia Collazos Grupo de Pesquisa em Eng. Biomédica Universidade Federal de Santa Catarina Jorge Muniz Barreto Prof.

Leia mais