AVALIAÇÃO COMPARATIVA DE ALGORITMOS PARA SISTEMAS DE RECOMENDAÇÃO EM MÚLTIPLOS DOMÍNIOS: MODELOS INTERPRETÁVEIS APLICADOS A DADOS EDUCACIONAIS

Tamanho: px
Começar a partir da página:

Download "AVALIAÇÃO COMPARATIVA DE ALGORITMOS PARA SISTEMAS DE RECOMENDAÇÃO EM MÚLTIPLOS DOMÍNIOS: MODELOS INTERPRETÁVEIS APLICADOS A DADOS EDUCACIONAIS"

Transcrição

1 AVALIAÇÃO COMPARATIVA DE ALGORITMOS PARA SISTEMAS DE RECOMENDAÇÃO EM MÚLTIPLOS DOMÍNIOS: MODELOS INTERPRETÁVEIS APLICADOS A DADOS EDUCACIONAIS Hugo Marques Casarini Faculdade de Engenharia de Computação / CEATEC Resumo: A previsão da nota que um aprendiz irá obter em tarefas que ainda não realizou pode ser usada para orientar os seus passos no processo de ensino-aprendizagem. Esta nota pode ser prevista a partir dos dados adquiridos durante a interação de estudantes com sistemas tutores, usando métodos de mineração de dados que produzem modelos de fácil interpretação. Tem sido usada uma grande diversidade desses métodos ou algoritmos, principalmente no domínio do comércio eletrônico, mas o seu uso ainda é raro no contexto considerado. Neste artigo discute-se a aplicação de um algoritmo indutor de conjuntos de regras aplicado ao problema de prever se um estudante acertará ou não uma questão, a partir das questões que ele e seus colegas responderam previamente. A avaliação experimental realizada mostrou que o algoritmo apresenta acurácia, precisão e cobertura elevados quando se dispõe de um elevado número de exemplos, mas o mesmo comportamento não se verifica quando isso não ocorre. Palavras-chave: Sistemas de recomendação, modelos de previsão interpretáveis, previsão do desempenho de estudantes. Área do Conhecimento: Ciências Exatas e da Terra Ciência da computação. 1. INTRODUÇÃO O problema da recomendação de uma informação ou item relevante para um determinado indivíduo é um tema que vem ganhando importância tanto no meio acadêmico quanto no comercial. Estes sistemas possuem como objetivo reduzir as inúmeras opções de itens disponíveis, prevendo um ou mais que sejam de possível interesse de um usuário. Para isso, podem ser utilizadas informações diversas como as preferências do usuário e seu respectivo histórico de interações com o sistema. Juan Manuel Adán Coello Grupo de Pesquisa em Sistemas Inteligentes CEATEC Entre as principais abordagens para utilizar essas informações e fazer recomendações de interesse do usuário, destacam-se a filtragem colaborativa (FC) [1] e a mineração de dados baseada em aprendizado de máquina [2], usando, entre outros, métodos que produzem modelos interpretáveis, como as árvores de decisão e as regras de classificação. Os métodos de aprendizado de máquina podem analisar o comportamento passado dos usuários para prever comportamentos futuros. Nos sistemas de recomendação usualmente utilizam-se associações usuário-item. Essas associações referem-se a uma lista de m usuários, e uma lista de n itens que são representadas por uma matriz m x n contendo as avaliações (ratings) dadas aos itens pelo o usuário em questão. Entre as limitações dos algoritmos de FC destacase a incapacidade de recomendar novos itens e de recomendar itens a novos usuários, já que um novo usuário ainda não avaliou nenhum item e um novo item ainda não foi avaliado por usuário algum. Essa situação caracteriza o problema da partida a frio (cold start problem) e é muito comum sua discussão no estudo de sistemas de recomendação. Outros problemas importantes decorrem da presença de matrizes esparsas (muitos espaços vazios) e matrizes muito grandes (diversas dimensões) que dificultam fazer previsões precisas e aumentam as demandas computacionais para fazê-lo. O modelo tradicional para transformação de dados em informação e em conhecimento útil, por exemplo para recomendar itens de interesse de um usuário, consiste em um processamento manual dos dados por especialistas que, então, produzem relatórios que deverão ser analisados. Em muitos casos, devido ao grande volume de dados, esse processo manual torna-se impraticável. O KDD (Knowledge Discovery in Databases ou Descoberta de Conhecimento nas bases de dados) [3] é uma tentativa de solucionar

2 o problema causado pela chamada "era da informação": a sobrecarga de dados. O KDD refere-se ao processo de descoberta de conhecimento, tendo a mineração de dados como uma das etapas do processo. Na Figura 1 podemos ver uma representação do processo de KDD. Figura 1. O processo de KDD Fonte: [2]. Algoritmos de aprendizado de máquina estão entre os principais métodos usados na etapa de mineração de dados do processo de KDD para detectar padrões nos dados disponíveis. O foco do trabalho que deu origem a este artigo são os algoritmos de mineração de dados que produzem modelos interpretáveis por pessoas. O artigo está organizado da seguinte forma: na Seção 2 faz-se uma introdução e discussão sobre o processo de KDD, apresentando detalhes das suas etapas, como destaque para a mineração de dados, a mais relevante para o trabalho descrito neste artigo; na Seção 3 aprofunda-se a discussão sobre algoritmos de mineração de dados que produzem modelos de fácil interpretação, abordagem utilizada no trabalho descrito para prever o desempenho de estudantes; na Seção 4 apresentam-se os resultados de uma avaliação experimental de alguns desses algoritmos quando utilizados com dados educacionais e, finalmente, na Seção 5 são apresentadas algumas considerações finais. 2. DESCOBERTA DE CONHECIMENTO EM BASES DE DADOS (KDD) O processo KDD é definido como o processo não trivial de identificação de padrões novos, potencialmente uteis e inteligíveis a partir de dados [2]. O processo é não trivial já que algum método de busca ou inferência está envolvido, ou seja, não se trata apenas de um processo simples de computar quantidades pré-definidas, como calcular a média de um conjunto de números. Os padrões descobertos devem ser válidos, com algum grau de certeza, em novos dados, potencialmente úteis (trazem algum benefício) e compreensíveis (se não imediatamente, então depois da interpretação). O processo de busca de conhecimento contém uma série de passos: seleção, pré-processamento e limpeza, transformação, mineração de dados e interpretação e avaliação. Conhecer os dados com os quais se irá trabalhar é fundamental para a escolha dos métodos mais adequados de mineração de dados. Os dados podem ser categorizados em quantitativos e qualitativos. Os dados quantitativos são representados por valores numéricos, podendo ainda ser discretos ou contínuos. Já os dados qualitativos contêm valores nominais e ordinais (categóricos). Tendo uma visão inicial dos dados, é necessário explorá-los, buscando conhecê-los melhor e encontrar valores que possam comprometer sua qualidade, tais como valores em branco ou nulos e dados duplicados. À medida em que que os dados vão sendo conhecidos, ocorre a sua preparação ou pré-processamento para que os algoritmos de mineração possam ser aplicados. A etapa de transformação dos dados é necessária como parte da preparação dos dados para o uso dos algoritmos de mineração, já que, por exemplo, alguns algoritmos trabalham apenas com valores numéricos e outros apenas com valores categóricos. Nestes casos, é necessário transformar os valores numéricos em categóricos ou os categóricos em valores numéricos. Em alguns casos o volume de dados é tão grande que torna o processo de análise dos dados e a própria mineração impraticáveis. Nestes casos, as técnicas de redução de dados podem ser aplicadas para que a massa de dados original seja convertida em uma massa de dados menor, porém, sem perder a representatividade dos dados originais. Isto permite que os algoritmos de mineração sejam executados com mais eficiência, mantendo a qualidade do resultado. Geralmente, os repositórios usados no processo de KDD possuem quantidades muito elevadas de registros, de modo que o uso de todos os registros para a construção do modelo de mineração de dados pode ser inviável. Nesse contexto, utiliza-se uma amostra representativa que é dividida em três conjuntos: conjunto de treinamento (conjunto de dados usados para produzir o modelo); conjunto de testes (usado para testar o modelo construído); conjunto de validação (usado para validar o modelo construído). 3. MINERAÇÃO DE DADOS A mineração de dados é um passo no processo de descoberta de conhecimento, que consiste na realização da análise dos dados e na aplicação de algoritmos de descoberta que, sob certas

3 limitações computacionais, produzem um conjunto de padrões (ou modelos) a partir dos dados. As tarefas mais comuns da etapa de mineração de dados são descrição, classificação, estimação ou regressão, predição, agrupamento e associação. A descrição é a tarefa utilizada para descrever os padrões e tendências revelados pelos dados. A classificação visa a identificar a qual classe um determinado registro pertence. A estimação ou regressão visa encontrar uma função que mapeia itens de dados em uma variável de predição real. O agrupamento visa identificar um grupo finito de categorias, ou grupos, que descreva os dados. A associação consiste em identificar quais atributos estão relacionados. Tradicionalmente, os métodos de mineração de dados são divididos em aprendizado supervisionado e não-supervisionado. A diferença entre estes métodos reside no fato de que os métodos não-supervisionados não precisam de uma pré-categorização para os dados, ou seja, não é necessário um atributo alvo. Tais métodos geralmente usam alguma medida de similaridade entre os atributos. As tarefas de agrupamento e associação são consideradas como nãosupervisionadas. Já no aprendizado supervisionado, é usado um conjunto de dados que possuem uma variável alvo pré-definida e os registros são categorizados em relação a ela. As técnicas de classificação podem ser supervisionadas e não-supervisionadas. São usadas para prever valores de variáveis do tipo categóricas. No trabalho descrito neste artigo busca-se construir um modelo para prever uma nota de um estudante em uma atividade ainda não realizada, a partir das suas notas em outras atividades e das notas de outros estudantes nessa e em outras atividades. Este problema pode ser entendido como um problema de predição (da nota da questão não realizada) ou de classificação (prever se o estudante irá errar ou acertar a questão). O conjunto de dados considerado contém informações do tipo múltipla escolha, em que o estudante pode acertar ou errar uma questão, de modo que o problema foi considerando como sendo de classificação. Entre os requisitos do trabalho considerado estava que os modelos gerados fossem facilmente interpretáveis por pessoas. Por esse motivo foram focados algoritmos que produzem modelos classificatórios na forma de árvores de decisão e de regras. Em uma árvore de decisão cada nó indica um teste feito sobre uma variável. As ligações entre os nós representam os valores possíveis do teste do nó superior e as folhas indicam a classe à qual o registro pertence. Após construir uma árvore de decisão, para classificar um novo registro, basta seguir o fluxo na árvore, mediante os testes nos nós não-folha, começando no nó raiz até chegar a uma folha. Um modelo de classificação baseado em regras emprega clausulas da forma SE condição ENTÃO conclusão. No trabalho descrito neste artigo foi empregado o algoritmo RIPPER (Repeated Incremental Pruning to Produce Error Reduction) [4] para produzir conjuntos de regras que permitam prever se um estudante acertará ou não uma questão que ainda não fez. Algoritmos de aprendizado de conjuntos de regras são geralmente comparados com algoritmos de aprendizado de árvores de decisão. Conjuntos de regras apresentam a vantagem de serem fáceis de entender e podem ser representados em lógica de primeira ordem. A sua maior desvantagem é que em geral são pouco escaláveis, à medida que aumenta o conjunto de treinamento, e apresentam dificuldades para tratar de dados com ruído. No entanto, o algoritmo RIPPER não apresenta essas desvantagens. Uma das maiores limitações das de árvores de decisão é o ajuste excessivo (overfitting), ou seja, o modelo produzido funciona muito bem com o conjunto de treinamento, mas não apresenta resultados tão bons com o conjunto de validação (e com dados novos). O RIPPER implementa a técnica REP (Reduced Error Pruning) que é bem sucedida para evitar o ajuste excessivo. Somando as características positivas do RIPPER apresentadas na literatura com o fato de haver uma implementação desse algoritmo no ambiente de mineração de dados Rapidminer 1, disponível para uso do trabalho descrito, este foi o algoritmo de indução de modelos interpretáveis escolhido para aplicar ao problema educacional considerado. 4. AVALIAÇÃO EXPERIMENTAL Nesta seção descreve-se a avaliação experimental conduzida para avaliar o algoritmo de indução de regras RIPPER quando empregado para uma base de dados educacional. A avaliação foi feita no ambiente RapidMiner, que implementa diversos mecanismos e algoritmos para o processo de KDD, inclusive o algoritmo mencionado. Foi empregada a base de dados educacionais assistments_ [5], que consiste em um conjunto de dados coletados entre 2009 e 2010, a partir de uma plataforma online 1

4 que permite que resolvam questões e recebam tutoria online. Essa base está organizada em um formato de tabela com diversas colunas. A base contém respostas de estudantes para questões. O algoritmo foi avaliado procurando focar na facilidade de interpretação dos resultados produzidos e da precisão das previsões feitas. A facilidade de interpretação foi avaliada visualmente, na medida que a intenção é verificar se os modelos produzidos são fáceis de entender a uma pessoa. A precisão foi avaliada por um processo de validação cruzada. O processo implementado no RapidMiner para avaliar os algoritmos consiste na execução de uma sequência de atividades. Incialmente a base original passou por um processo de transformação visando colocá-la no formato requerido pelos algoritmos empregados. Na base transformada, cada linha representa um usuário e cada coluna uma questão respondida pelos usuários. As células definidas por um par linha-coluna indicam se o usuário representado na linha acertou (valor 1) ou errou (valor 0) a questão associada à coluna. Em seguida, transforma esse valor do tipo numérico é transformado para o tipo binominal (true ou false). A base é então filtrada em função do atributo categórico (questão para a qual se deseja fazer previsões), deixando apenas os registros dos estudantes que responderam a essa questão (com acerto ou com erro). Em seguida, é selecionado o atributo (coluna da tabela) correspondente à questão para a qual se deseja treinar (aprender) um modelo (atributo categórico) capaz de predizer o seu valor, associando a esse atributo o papel de rótulo (label), passo necessário para indicar ao algoritmo que este é o atributo para o qual se quer realizar a aprendizagem. No próximo passo do processo, é feita uma amostragem estratificada da base. Esta etapa é necessária pois o computador empregado não tem memória suficiente para executar os algoritmos com toda a base. A amostra estratificada é um subconjunto selecionado aleatoriamente da base original, em que a distribuição de classes é a mesma da base original, isto é, a proporção de registros (linhas da tabela) na amostra correspondente a acertos e a erros é a mesma da base completa. Após fazer a amostragem, é executado um processo de avaliação cruzada para estimar o desempenho estatístico do modelo produzido pelo algoritmo de aprendizado usado em novos dados. Isto envolve um subprocesso de treinamento, onde é treinado, ou aprendido, um modelo, e um subprocesso de teste, onde é aplicado o modelo aprendido e medido o seu desempenho. No processo de validação cruzada, o conjunto de dados, neste caso a amostragem, é particionado em três subconjuntos de mesmo tamanho. Um subconjunto é usado como o conjunto de dados de teste (servirá de entrada para o subprocesso de teste) e dois subconjuntos são usados como os dados de treinamento (serão a entrada do subprocesso de treinamento). O processo de validação cruzada é repetido três vezes, com cada um dos três subconjuntos usado uma vez como dados de teste. Ao final, é feita uma média dos três resultados produzidos para produzir uma estimativa do desempenho do modelo. Após uma fase inicial em que se tentou produzir árvores de decisão, sem muito sucesso, decidiuse focar na utilização do algoritmo de indução de regras RIPPER. Foram utilizados os parâmetros padrão do algoritmo, tal como recomendado pela implementação disponível no Rapidminer, exceto pelo critério utilizado para selecionar os atributos que serão usados na cláusula condicional das regras geradas. O padrão da ferramenta é usar o ganho de informação, mas foram obtidos melhores resultados usando a acurácia. No primeiro caso, a entropia de todos os atributos é calculada e o atributo com a menor entropia é usado na divisão. No segundo caso, é selecionado o atributo que maximiza a acurácia do conjunto de regras. Foram produzidos e avaliados conjuntos de regras para diversas questões. Mostramos aqui os resultados obtidos para duas delas: e A primeira estava representada por 478 exemplos na amostra e a segunda por 95. Os conjuntos de regras produzidos para as questões e são mostrados, respectivamente, na Figura 2 e na Figura 3. Esses conjuntos são o resultado da junção dos conjuntos gerados nas três etapas da validação cruzada. Um conjunto de regras deve ser lido de cima para baixo. Logo, no caso da questão 11948, se o usuário acertou (true) a questão 9663, a previsão é que ele erre a Se essa condição não é verificada, verifica-se se ele acertou a questão Nesse caso, a previsão é que ele erre a questão Após outras três condições que levam à previsão de erro, temos a regra padrão que indica acerto da questão

5 if 9663 = true then false (20 / 1) if = true then false (16 / 2) if 2712 = true then false (11 / 0) if = true then false (11 / 1) if = true then false (234 / 2) else true (18 / 162) correct: 454 out of 478 training examples. Figura 2. Conjunto de regras para a questão if = true then false (9 / 0) if = true then true (0 / 14) if = true then false (8 / 0) if = true then false (4 / 0) if 2672 = true then true (0 / 10) if = true then false (4 / 0) else false (24 / 22) correct: 73 out of 95 training examples Figura 3. Conjunto de regras para a questão O desempenho desse conjunto de regras é mostrado na Figura 4 (copiada diretamente da tela do Rapidminer). Nota-se que a acurácia do conjunto é de 90,81% com um desvio de mais ou menos 4,53%. A acurácia indica o número de previsões corretas feitas. A figura mostra também a precisão e a cobertura desse conjunto de regras. A Figura 5, por sua vez, mostra o desempenho do conjunto de regras gerado para a questão Neste caso, exceto pela cobertura para a classe falso, todas as métricas mostram um pior desempenho. O motivo, provavelmente, seja o reduzido número de exemplos disponíveis para gerar o modelo. 5. CONCLUSÃO O objetivo do plano de trabalho detalhado no artigo consistia em analisar o desempenho de algoritmos de mineração de dados baseados em modelos de fácil interpretação, quando aplicados ao problema de prever o desempenho de estudantes. Para atingir o objetivo foi analisado o desempenho de conjuntos de regras induzidas pelo algoritmo RIPPER, quando aplicados a uma base de dados educacionais. Nos experimentos realizados, verificou-se que o algoritmo apresenta acurácia, precisão e cobertura elevadas quando se dispõe de um número expressivo de exemplos. Por outro lado, quando o número de exemplos é pequeno, o desempenho é bem menor. Pretende-se, dar continuidade ao trabalho, realizando novos experimentos em que será analisado o efeito da variação dos parâmetros do algoritmo estudado. Por fim, cabe ressaltar que a mineração de dados é uma área promissora e que, apesar dos bons Figura 4: Acurácia, precisão e cobertura, conjunto de regras para a questão Figura 5: Acurácia, precisão e cobertura, conjunto de regras para a questão

6 resultados apresentados, ainda tem muito para oferecer. AGRADECIMENTOS À FAPIC/Reitoria pela bolsa de iniciação científica, à PUC-Campinas pelas instalações que permitiram o desenvolvimento deste artigo e as reuniões realizadas, e ao Prof. Dr. Juan Manuel Adán Coello pela orientação e motivação e pelo convite para a participar no trabalho de IC que me permitiu adquirir novos conhecimentos na área de computação. REFERÊNCIAS [1] X. Amatrian, A. Jaimes, N. Oliver e J. M. Pujol. Data Mining Methods for Recommender Systems. Recommender Systems Handbook, pp , [2] U. Fayyad, G. Piatetsky-Shapiro, P. Smyth. From Data mining to Knowledge Discovery in Databases. AI Magazine, 17(3):37-54, Fall [3] I. H. Witten, E. Frank, and M. A. Hall. Data Mining: Practical Machine Learning Tools and Techniques: Practical Machine Learning Tools and Techniques. Morgan Kaufmann, [4] W. W. Cohen, Fast Effective Rule Induction, in Proceedings of the Twelfth International Conference on Machine Learning, Lake Tahoe, California, [5] M. Feng, N. Heffernan e K. Koedinger. Addressing the assessment challenge with an Online System that tutors as it assesses. The Journal of User Modeling and User-Adapted Interaction, 2009.

Avaliando o que foi Aprendido

Avaliando o que foi Aprendido Avaliando o que foi Aprendido Treinamento, teste, validação Predição da performance: Limites de confiança Holdout, cross-validation, bootstrap Comparando algoritmos: o teste-t Predecindo probabilidades:função

Leia mais

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI Fernando Luiz de Oliveira 1 Thereza Patrícia. P. Padilha 1 Conceição A. Previero 2 Leandro Maciel Almeida 1 RESUMO O processo

Leia mais

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br MINERAÇÃO DE DADOS APLICADA Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br Processo Weka uma Ferramenta Livre para Data Mining O que é Weka? Weka é um Software livre do tipo open source para

Leia mais

Luiz Henrique Marino Cerqueira Faculdade de Engenharia de Computação CEATEC luiz.hmc@puccamp.edu.br

Luiz Henrique Marino Cerqueira Faculdade de Engenharia de Computação CEATEC luiz.hmc@puccamp.edu.br AVALIAÇÃO COMPARATIVA DE ALGORITMOS PARA SISTEMAS DE RECOMENDAÇÃO EM MÚLTIPLOS DOMÍNOS: PREVISÃO DO DESEMPENHO DE ESTUDANTES A PARTIR DE SUA INTERAÇÃO COM UM SISTEMA TUTOR. Luiz Henrique Marino Cerqueira

Leia mais

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka 1 Introdução A mineração de dados (data mining) pode ser definida como o processo automático de descoberta de conhecimento em bases de

Leia mais

ALGORITMO HÍBRIDO PARA SISTEMAS DE RECOMENDAÇÃO UTILIZANDO FILTRAGEM COLABORATIVA E ALGORITMO GENÉTICO

ALGORITMO HÍBRIDO PARA SISTEMAS DE RECOMENDAÇÃO UTILIZANDO FILTRAGEM COLABORATIVA E ALGORITMO GENÉTICO ALGORITMO HÍBRIDO PARA SISTEMAS DE RECOMENDAÇÃO UTILIZANDO FILTRAGEM COLABORATIVA E ALGORITMO GENÉTICO Renan de Oliveira Yamaguti Faculdade de Engenharia de Computação / CEATEC renan.yamaguti@terra.com.br

Leia mais

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados Universidade Federal de Pernambuco Graduação em Ciência da Computação Centro de Informática 2006.2 Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento

Leia mais

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Pollyanna Carolina BARBOSA¹; Thiago MAGELA² 1Aluna do Curso Superior Tecnólogo em Análise e Desenvolvimento de Sistemas

Leia mais

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO EPE0147 UTILIZAÇÃO DA MINERAÇÃO DE DADOS EM UMA AVALIAÇÃO INSTITUCIONAL

Leia mais

Prof. Msc. Paulo Muniz de Ávila

Prof. Msc. Paulo Muniz de Ávila Prof. Msc. Paulo Muniz de Ávila O que é Data Mining? Mineração de dados (descoberta de conhecimento em bases de dados): Extração de informação interessante (não-trivial, implícita, previamente desconhecida

Leia mais

O Processo de KDD. Data Mining SUMÁRIO - AULA1. O processo de KDD. Interpretação e Avaliação. Seleção e Pré-processamento. Consolidação de dados

O Processo de KDD. Data Mining SUMÁRIO - AULA1. O processo de KDD. Interpretação e Avaliação. Seleção e Pré-processamento. Consolidação de dados SUMÁRIO - AULA1 O Processo de KDD O processo de KDD Interpretação e Avaliação Consolidação de dados Seleção e Pré-processamento Warehouse Data Mining Dados Preparados p(x)=0.02 Padrões & Modelos Conhecimento

Leia mais

3 Metodologia de Previsão de Padrões de Falha

3 Metodologia de Previsão de Padrões de Falha 3 Metodologia de Previsão de Padrões de Falha Antes da ocorrência de uma falha em um equipamento, ele entra em um regime de operação diferente do regime nominal, como descrito em [8-11]. Para detectar

Leia mais

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA Lizianne Priscila Marques SOUTO 1 1 Faculdade de Ciências Sociais e Aplicadas

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Tipos de aprendizagem 3. Paradigmas de aprendizagem 4. Modos de aprendizagem

Leia mais

Data, Text and Web Mining

Data, Text and Web Mining Data, Text and Web Mining Fabrício J. Barth TerraForum Consultores Junho de 2010 Objetivo Apresentar a importância do tema, os conceitos relacionados e alguns exemplos de aplicações. Data, Text and Web

Leia mais

Exemplo de Aplicação do DataMinig

Exemplo de Aplicação do DataMinig Exemplo de Aplicação do DataMinig Felipe E. Barletta Mendes 19 de fevereiro de 2008 INTRODUÇÃO AO DATA MINING A mineração de dados (Data Mining) está inserida em um processo maior denominado Descoberta

Leia mais

Algoritmos Indutores de Árvores de

Algoritmos Indutores de Árvores de Algoritmos Indutores de Árvores de Decisão Fabrício J. Barth Sistemas Inteligentes Análise e Desenvolvimento de Sistemas Faculdades de Tecnologia Bandeirantes Abril de 2013 Problema: Diagnóstico para uso

Leia mais

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é?

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é? KDD Conceitos o que é? Fases limpeza etc Datamining OBJETIVOS PRIMÁRIOS TAREFAS PRIMÁRIAS Classificação Regressão Clusterização OBJETIVOS PRIMÁRIOS NA PRÁTICA SÃO DESCRIÇÃO E PREDIÇÃO Descrição Wizrule

Leia mais

DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS

DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS Tácio Dias Palhão Mendes Bacharelando em Sistemas de Informação Bolsista de Iniciação Científica da FAPEMIG taciomendes@yahoo.com.br Prof.

Leia mais

Modelo Cascata ou Clássico

Modelo Cascata ou Clássico Modelo Cascata ou Clássico INTRODUÇÃO O modelo clássico ou cascata, que também é conhecido por abordagem top-down, foi proposto por Royce em 1970. Até meados da década de 1980 foi o único modelo com aceitação

Leia mais

O que é a estatística?

O que é a estatística? Elementos de Estatística Prof. Dr. Clécio da Silva Ferreira Departamento de Estatística - UFJF O que é a estatística? Para muitos, a estatística não passa de conjuntos de tabelas de dados numéricos. Os

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 12 Aprendizado de Máquina Agentes Vistos Anteriormente Agentes baseados em busca: Busca cega Busca heurística Busca local

Leia mais

UNISINOS - UNIVERSIDADE DO VALE DO RIO DOS SINOS

UNISINOS - UNIVERSIDADE DO VALE DO RIO DOS SINOS UNISINOS - UNIVERSIDADE DO VALE DO RIO DOS SINOS Curso: Informática Disciplina: Redes Neurais Prof. Fernando Osório E-mail: osorio@exatas.unisinos.br EXEMPLO DE QUESTÕES DE PROVAS ANTIGAS 1. Supondo que

Leia mais

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO Fernanda Delizete Madeira 1 ; Aracele Garcia de Oliveira Fassbinder 2 INTRODUÇÃO Data

Leia mais

Paralelização do algoritmo SPRINT usando MyGrid

Paralelização do algoritmo SPRINT usando MyGrid Paralelização do algoritmo SPRINT usando MyGrid Juliana Carvalho, Ricardo Rebouças e Vasco Furtado Universidade de Fortaleza UNIFOR juliana@edu.unifor.br ricardo@sspds.ce.gov.br vasco@unifor.br 1. Introdução

Leia mais

Professor: Disciplina:

Professor: Disciplina: Professor: Curso: Esp. Marcos Morais de Sousa marcosmoraisdesousa@gmail.com Sistemas de informação Disciplina: Introdução a SI Noções de sistemas de informação Turma: 01º semestre Prof. Esp. Marcos Morais

Leia mais

Aprendizagem de Máquina. Ivan Medeiros Monteiro

Aprendizagem de Máquina. Ivan Medeiros Monteiro Aprendizagem de Máquina Ivan Medeiros Monteiro Definindo aprendizagem Dizemos que um sistema aprende se o mesmo é capaz de melhorar o seu desempenho a partir de suas experiências anteriores. O aprendizado

Leia mais

Aprendizado de classificadores das ementas da Jurisprudência do Tribunal Regional do Trabalho da 2ª. Região - SP

Aprendizado de classificadores das ementas da Jurisprudência do Tribunal Regional do Trabalho da 2ª. Região - SP Aprendizado de classificadores das ementas da Jurisprudência do Tribunal Regional do Trabalho da 2ª. Região - SP Thiago Ferauche, Maurício Amaral de Almeida Laboratório de Pesquisa em Ciência de Serviços

Leia mais

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO @ribeirord FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO Rafael D. Ribeiro, M.Sc,PMP. rafaeldiasribeiro@gmail.com http://www.rafaeldiasribeiro.com.br Lembrando... Aula 4 1 Lembrando... Aula 4 Sistemas de apoio

Leia mais

1. Objectivo Durante uma experiência, medem-se certas variáveis, ex.: concentrações, pressões, temperaturas,

1. Objectivo Durante uma experiência, medem-se certas variáveis, ex.: concentrações, pressões, temperaturas, MODELAÇÃO E DETERMINAÇÃO DE PARÂMETROS CINÉTICOS FILIPE GAMA FREIRE 1. Objectivo Durante uma experiência, medem-se certas variáveis, ex.: concentrações, pressões, temperaturas, etc. a que chamaremos y

Leia mais

ADM041 / EPR806 Sistemas de Informação

ADM041 / EPR806 Sistemas de Informação ADM041 / EPR806 Sistemas de Informação UNIFEI Universidade Federal de Itajubá Prof. Dr. Alexandre Ferreira de Pinho 1 Sistemas de Apoio à Decisão (SAD) Tipos de SAD Orientados por modelos: Criação de diferentes

Leia mais

Aula 02: Conceitos Fundamentais

Aula 02: Conceitos Fundamentais Aula 02: Conceitos Fundamentais Profa. Ms. Rosângela da Silva Nunes 1 de 26 Roteiro 1. Por que mineração de dados 2. O que é Mineração de dados 3. Processo 4. Que tipo de dados podem ser minerados 5. Que

Leia mais

6 Construção de Cenários

6 Construção de Cenários 6 Construção de Cenários Neste capítulo será mostrada a metodologia utilizada para mensuração dos parâmetros estocásticos (ou incertos) e construção dos cenários com respectivas probabilidades de ocorrência.

Leia mais

Web Data mining com R: aprendizagem de máquina

Web Data mining com R: aprendizagem de máquina Web Data mining com R: aprendizagem de máquina Fabrício Jailson Barth Faculdade BandTec e VAGAS Tecnologia Junho de 2013 Sumário O que é Aprendizagem de Máquina? Hierarquia de aprendizado. Exemplos de

Leia mais

Hierarquia de modelos e Aprendizagem de Máquina

Hierarquia de modelos e Aprendizagem de Máquina Hierarquia de modelos e Aprendizagem de Máquina Fabrício Jailson Barth BandTec Maio de 2015 Sumário Introdução: hierarquia de modelos e aprendizagem de máquina. O que é Aprendizagem de Máquina? Hierarquia

Leia mais

Estudo e Análise da Base de Dados do Portal Corporativo da Sexta Região da Polícia Militar com vista à aplicação de Técnicas de Mineração de Dados1

Estudo e Análise da Base de Dados do Portal Corporativo da Sexta Região da Polícia Militar com vista à aplicação de Técnicas de Mineração de Dados1 Estudo e Análise da Base de Dados do Portal Corporativo da Sexta Região da Polícia Militar com vista à aplicação de Técnicas de Mineração de Dados1 Rafaela Giroto, 10º módulo de Ciência da Computação,

Leia mais

Estatística Aplicada. Gestão de TI. Evanivaldo Castro Silva Júnior

Estatística Aplicada. Gestão de TI. Evanivaldo Castro Silva Júnior Gestão de TI Evanivaldo Castro Silva Júnior Porque estudar Estatística em um curso de Gestão de TI? TI trabalha com dados Geralmente grandes bases de dados Com grande variabilidade Difícil manipulação,

Leia mais

Descoberta de Conhecimento em Bases de Dados. Classificação

Descoberta de Conhecimento em Bases de Dados. Classificação Universidade Técnica de Lisboa INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO Informática e Sistemas de Informação Aplicados em Economia Descoberta de Conhecimento em Bases de Dados. Classificação Descoberta

Leia mais

Capítulo 7 Medidas de dispersão

Capítulo 7 Medidas de dispersão Capítulo 7 Medidas de dispersão Introdução Para a compreensão deste capítulo, é necessário que você tenha entendido os conceitos apresentados nos capítulos 4 (ponto médio, classes e frequência) e 6 (média).

Leia mais

MESTRADO EM PESQUISA DE MERCADOS 2006 2007

MESTRADO EM PESQUISA DE MERCADOS 2006 2007 MESTRADO EM PESQUISA DE MERCADOS 2006 2007 PROGRAMA DAS DISCIPLINAS 1 1º trimestre PESQUISA DE MERCADOS Objectivos Pretende-se que os alunos: (a) adquiram os conceitos e semântica próprios do tema, (b)

Leia mais

Técnicas de Seleção de Atributos utilizando Paradigmas de Algoritmos Disciplina de Projeto e Análise de Algoritmos

Técnicas de Seleção de Atributos utilizando Paradigmas de Algoritmos Disciplina de Projeto e Análise de Algoritmos Técnicas de Seleção de Atributos utilizando Paradigmas de Algoritmos Disciplina de Projeto e Análise de Algoritmos Theo Silva Lins, Luiz Henrique de Campos Merschmann PPGCC - Programa de Pós-Graduação

Leia mais

Metodologias de Desenvolvimento de Sistemas. Analise de Sistemas I UNIPAC Rodrigo Videschi

Metodologias de Desenvolvimento de Sistemas. Analise de Sistemas I UNIPAC Rodrigo Videschi Metodologias de Desenvolvimento de Sistemas Analise de Sistemas I UNIPAC Rodrigo Videschi Histórico Uso de Metodologias Histórico Uso de Metodologias Era da Pré-Metodologia 1960-1970 Era da Metodologia

Leia mais

KDD UMA VISAL GERAL DO PROCESSO

KDD UMA VISAL GERAL DO PROCESSO KDD UMA VISAL GERAL DO PROCESSO por Fernando Sarturi Prass 1 1.Introdução O aumento das transações comerciais por meio eletrônico, em especial as feitas via Internet, possibilitou as empresas armazenar

Leia mais

O Processo de KDD Knowledge Discovery in Database para Aplicações na Medicina

O Processo de KDD Knowledge Discovery in Database para Aplicações na Medicina SEMINC 2001 57 O Processo de KDD Knowledge Discovery in Database para Aplicações na Medicina MARIZA FERRO HUEI DIANA LEE UNIOESTE - Universidade Estadual do Oeste do Paraná CECE Centro de Engenharias e

Leia mais

Pesquisa experimental

Pesquisa experimental 1 Aula 7 Interação Humano-Computador (com foco em métodos de pesquisa) Prof. Dr. Osvaldo Luiz de Oliveira 2 Pesquisa experimental Wilhelm Wundt (1832-1920), Pai da Psicologia Experimental. Leituras obrigatórias:

Leia mais

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Planejamento Estratégico de TI. Prof.: Fernando Ascani Planejamento Estratégico de TI Prof.: Fernando Ascani Data Warehouse - Conceitos Hoje em dia uma organização precisa utilizar toda informação disponível para criar e manter vantagem competitiva. Sai na

Leia mais

tipos de métodos, técnicas de inteligência artificial e técnicas de otimização. Por fim, concluise com as considerações finais.

tipos de métodos, técnicas de inteligência artificial e técnicas de otimização. Por fim, concluise com as considerações finais. 1. Introdução A previsão de vendas é fundamental para as organizações uma vez que permite melhorar o planejamento e a tomada de decisão sobre o futuro da empresa. Contudo toda previsão carrega consigo

Leia mais

Módulo 4. Construindo uma solução OLAP

Módulo 4. Construindo uma solução OLAP Módulo 4. Construindo uma solução OLAP Objetivos Diferenciar as diversas formas de armazenamento Compreender o que é e como definir a porcentagem de agregação Conhecer a possibilidade da utilização de

Leia mais

Classificação: Definição. Classificação: conceitos básicos e árvores de decisão. Exemplos de Tarefas de Classificação

Classificação: Definição. Classificação: conceitos básicos e árvores de decisão. Exemplos de Tarefas de Classificação Classificação: Definição Mineração de dados Classificação: conceitos básicos e árvores de decisão Apresentação adaptada do material de apoio do livro: Introduction to Data Mining Tan, Steinbach, Kumar

Leia mais

INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática. (1) Data Mining Conceitos apresentados por

INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática. (1) Data Mining Conceitos apresentados por INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática (1) Data Mining Conceitos apresentados por 1 2 (2) ANÁLISE DE AGRUPAMENTOS Conceitos apresentados por. 3 LEMBRE-SE que PROBLEMA em IA Uma busca

Leia mais

Qualidade de Processo de Software Normas ISO 12207 e 15504

Qualidade de Processo de Software Normas ISO 12207 e 15504 Especialização em Gerência de Projetos de Software Qualidade de Processo de Software Normas ISO 12207 e 15504 Prof. Dr. Sandro Ronaldo Bezerra Oliveira srbo@ufpa.br Qualidade de Software 2009 Instituto

Leia mais

Mineração de Dados: Introdução e Aplicações

Mineração de Dados: Introdução e Aplicações Mineração de Dados: Introdução e Aplicações Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br Apresentação Luiz Merschmann Engenheiro

Leia mais

Microsoft Innovation Center

Microsoft Innovation Center Microsoft Innovation Center Mineração de Dados (Data Mining) André Montevecchi andre@montevecchi.com.br Introdução Objetivo BI e Mineração de Dados Aplicações Exemplos e Cases Algoritmos para Mineração

Leia mais

Introdução. Capítulo 1

Introdução. Capítulo 1 Capítulo 1 Introdução Em computação, muitos problemas são resolvidos por meio da escrita de um algoritmo que especifica, passo a passo, como resolver um problema. No entanto, não é fácil escrever um programa

Leia mais

PROJETO DE REDES www.projetoderedes.com.br

PROJETO DE REDES www.projetoderedes.com.br PROJETO DE REDES www.projetoderedes.com.br Centro Universitário de Volta Redonda - UniFOA Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro

Leia mais

Complemento II Noções Introdutória em Redes Neurais

Complemento II Noções Introdutória em Redes Neurais Complemento II Noções Introdutória em Redes Neurais Esse documento é parte integrante do material fornecido pela WEB para a 2ª edição do livro Data Mining: Conceitos, técnicas, algoritmos, orientações

Leia mais

Engenharia de Software II

Engenharia de Software II Engenharia de Software II Aula 10 http://www.ic.uff.br/~bianca/engsoft2/ Aula 10-24/05/2006 1 Ementa Processos de desenvolvimento de software Estratégias e técnicas de teste de software (Caps. 13 e 14

Leia mais

Objetivos. Engenharia de Software. O Estudo de Viabilidade. Fase do Estudo de Viabilidade. Idéias chave. O que Estudar? O que concluir?

Objetivos. Engenharia de Software. O Estudo de Viabilidade. Fase do Estudo de Viabilidade. Idéias chave. O que Estudar? O que concluir? Engenharia de Software O Estudo de Viabilidade Objetivos O que é um estudo de viabilidade? O que estudar e concluir? Benefícios e custos Análise de Custo/Benefício Alternativas de comparação 1 2 Idéias

Leia mais

Data Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento

Data Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento Data Mining Prof Luiz Antonio do Nascimento Data Mining Ferramenta utilizada para análise de dados para gerar, automaticamente, uma hipótese sobre padrões e anomalias identificadas para poder prever um

Leia mais

PLANEJAMENTO DE CAPACIDADE EM INFRA-ESTRUTURAS SUPORTADAS POR SERVIÇOS TERCEIRIZADOS DE REDE DE COMUNICAÇÃO DE DADOS

PLANEJAMENTO DE CAPACIDADE EM INFRA-ESTRUTURAS SUPORTADAS POR SERVIÇOS TERCEIRIZADOS DE REDE DE COMUNICAÇÃO DE DADOS PLANEJAMENTO DE CAPACIDADE EM INFRA-ESTRUTURAS SUPORTADAS POR SERVIÇOS TERCEIRIZADOS DE REDE DE COMUNICAÇÃO DE DADOS Roosevelt Belchior Lima Neste artigo será apresentada uma proposta de acompanhamento

Leia mais

Árvores de Decisão. Índice

Árvores de Decisão. Índice Árvores de Decisão Índice 1. Introdução... 2 2. Árvores de decisão e a tarefa de classificação... 6 3. Principais conceitos vinculados à indução de árvores de decisão... 15 3.1 Top-Down Induction of Decision

Leia mais

judgment EM PERSPECTIVA:

judgment EM PERSPECTIVA: EM PERSPECTIVA: judgment As teorias de liderança geralmente estão baseadas em características individuais, como o carisma, influência, ética, entre outras, mas um determinante central da performance de

Leia mais

Projeto de Redes Neurais e MATLAB

Projeto de Redes Neurais e MATLAB Projeto de Redes Neurais e MATLAB Centro de Informática Universidade Federal de Pernambuco Sistemas Inteligentes IF684 Arley Ristar arrr2@cin.ufpe.br Thiago Miotto tma@cin.ufpe.br Baseado na apresentação

Leia mais

A Preparação dos Dados

A Preparação dos Dados A Preparação dos Dados Escolhas Básicas Objetos, casos, instâncias Objetos do mundo real: carros, arvores, etc Ponto de vista da mineração: um objeto é descrito por uma coleção de características sobre

Leia mais

Tutorial 5 Questionários

Tutorial 5 Questionários Tutorial 5 Questionários A atividade Questionário no Moodle pode ter várias aplicações, tais como: atividades de autoavaliação, lista de exercícios para verificação de aprendizagem, teste rápido ou ainda

Leia mais

ENGENHARIA DE SOFTWARE I

ENGENHARIA DE SOFTWARE I ENGENHARIA DE SOFTWARE I Prof. Cássio Huggentobler de Costa [cassio.costa@ulbra.br] Twitter: www.twitter.com/cassiocosta_ Agenda da Aula (002) Metodologias de Desenvolvimento de Softwares Métodos Ágeis

Leia mais

Modelagem e Simulação Material 02 Projeto de Simulação

Modelagem e Simulação Material 02 Projeto de Simulação Modelagem e Simulação Material 02 Projeto de Simulação Prof. Simão Sirineo Toscani Projeto de Simulação Revisão de conceitos básicos Processo de simulação Etapas de projeto Cuidados nos projetos de simulação

Leia mais

Noções de Pesquisa e Amostragem. André C. R. Martins

Noções de Pesquisa e Amostragem. André C. R. Martins Noções de Pesquisa e Amostragem André C. R. Martins 1 Bibliografia Silva, N. N., Amostragem probabilística, EDUSP. Freedman, D., Pisani, R. e Purves, R., Statistics, Norton. Tamhane, A. C., Dunlop, D.

Leia mais

O objetivo da Mineração de Dados é extrair ou minerar conhecimento de grandes volumes de

O objetivo da Mineração de Dados é extrair ou minerar conhecimento de grandes volumes de MINERAÇÃO DE DADOS MINERAÇÃO DE DADOS O objetivo da Mineração de Dados é extrair ou minerar conhecimento de grandes volumes de dados. A mineração de dados é formada por um conjunto de ferramentas e técnicas

Leia mais

Aula 01 - Formatações prontas e condicionais. Aula 01 - Formatações prontas e condicionais. Sumário. Formatar como Tabela

Aula 01 - Formatações prontas e condicionais. Aula 01 - Formatações prontas e condicionais. Sumário. Formatar como Tabela Aula 01 - Formatações prontas e Sumário Formatar como Tabela Formatar como Tabela (cont.) Alterando as formatações aplicadas e adicionando novos itens Removendo a formatação de tabela aplicada Formatação

Leia mais

Algoritmos Genéticos em Mineração de Dados. Descoberta de Conhecimento. Descoberta do Conhecimento em Bancos de Dados

Algoritmos Genéticos em Mineração de Dados. Descoberta de Conhecimento. Descoberta do Conhecimento em Bancos de Dados Algoritmos Genéticos em Mineração de Dados Descoberta de Conhecimento Descoberta do Conhecimento em Bancos de Dados Processo interativo e iterativo para identificar padrões válidos, novos, potencialmente

Leia mais

AMBIENTE PARA AUXILIAR O DESENVOLVIMENTO DE PROGRAMAS MONOLÍTICOS

AMBIENTE PARA AUXILIAR O DESENVOLVIMENTO DE PROGRAMAS MONOLÍTICOS UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO BACHARELADO AMBIENTE PARA AUXILIAR O DESENVOLVIMENTO DE PROGRAMAS MONOLÍTICOS Orientando: Oliver Mário

Leia mais

5 Mecanismo de seleção de componentes

5 Mecanismo de seleção de componentes Mecanismo de seleção de componentes 50 5 Mecanismo de seleção de componentes O Kaluana Original, apresentado em detalhes no capítulo 3 deste trabalho, é um middleware que facilita a construção de aplicações

Leia mais

A Computação e as Classificações da Ciência

A Computação e as Classificações da Ciência A Computação e as Classificações da Ciência Ricardo de Almeida Falbo Metodologia de Pesquisa Departamento de Informática Universidade Federal do Espírito Santo Agenda Classificações da Ciência A Computação

Leia mais

Probabilidade. Renata Souza. Introdução. Tabelas Estatísticas. População, Amostra e Variáveis. Gráficos e Distribuição de Freqüências

Probabilidade. Renata Souza. Introdução. Tabelas Estatísticas. População, Amostra e Variáveis. Gráficos e Distribuição de Freqüências Probabilidade Introdução Tabelas Estatísticas População, Amostra e Variáveis Gráficos e Distribuição de Freqüências Renata Souza Conceitos Antigos de Estatística stica a) Simples contagem aritmética Ex.:

Leia mais

METAS E INDICADORES COMO DEFINIR OS INDICADORES?

METAS E INDICADORES COMO DEFINIR OS INDICADORES? METAS E INDICADORES COMO DEFINIR OS INDICADORES? Os indicadores permitem avaliação do desempenho da instituição, segundo três aspectos relevantes: controle, comunicação e melhoria. (MARTINS & MARINI, 2010,

Leia mais

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS VINICIUS DA SILVEIRA SEGALIN FLORIANÓPOLIS OUTUBRO/2013 Sumário

Leia mais

PROPAGAÇÃO DE INFLUÊNCIA EM REDES SOCIAIS

PROPAGAÇÃO DE INFLUÊNCIA EM REDES SOCIAIS PROPAGAÇÃO DE INFLUÊNCIA EM REDES SOCIAIS Júlia Coelho Furlani Faculdade de Engenharia de Computação / CEATEC juliacfurlani@gmail.com Juan Manuel Adán Coello Grupo de Pesquisa em Sistemas Inteligentes

Leia mais

ANÁLISE DOS ERROS NA RESOLUÇÃO DE PROBLEMAS DE EQUAÇÕES DO 1º GRAU DOS ALUNOS DA 6ª SÉRIE

ANÁLISE DOS ERROS NA RESOLUÇÃO DE PROBLEMAS DE EQUAÇÕES DO 1º GRAU DOS ALUNOS DA 6ª SÉRIE ANÁLISE DOS ERROS NA RESOLUÇÃO DE PROBLEMAS DE EQUAÇÕES DO 1º GRAU DOS ALUNOS DA 6ª SÉRIE Adriane Trindade Lopes Universidade do Estado do Pará adriane_lopes18@yahoo.com.br Gleida Tayanna Conde de Sousa

Leia mais

Introdução a Avaliação de Desempenho

Introdução a Avaliação de Desempenho Introdução a Avaliação de Desempenho Avaliar é pronunciar-se sobre as características de um certo sistema. Dado um sistema real qualquer, uma avaliação deste sistema pode ser caracterizada por toda e qualquer

Leia mais

INSTITUTO TECNOLÓGICO DE AERONÁUTICA DIVISÃO DE ENGENHARIA ELETRÔNICA LABORATÓRIO DE GUERRA ELETRÔNICA

INSTITUTO TECNOLÓGICO DE AERONÁUTICA DIVISÃO DE ENGENHARIA ELETRÔNICA LABORATÓRIO DE GUERRA ELETRÔNICA INSTITUTO TECNOLÓGICO DE AERONÁUTICA DIVISÃO DE ENGENHARIA ELETRÔNICA LABORATÓRIO DE GUERRA ELETRÔNICA CURSO DE ESPECIALIZAÇÃO EM ANÁLISE DE AMBIENTE ELETROMAGNÉTICO CEAAE /2008 DISCIPLINA EE-09: Inteligência

Leia mais

AVALIAÇÃO DE IMPACTO NA PRÁTICA GLOSSÁRIO

AVALIAÇÃO DE IMPACTO NA PRÁTICA GLOSSÁRIO 1 AVALIAÇÃO DE IMPACTO NA PRÁTICA GLOSSÁRIO Amostra aleatória. Também conhecida como amostra probabilística. A melhor maneira de evitar uma amostra enviesada ou não-representativa é selecionar uma amostra

Leia mais

Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS

Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS Sumário Conceitos / Autores chave... 3 1. Introdução... 3 2. Tarefas desempenhadas por Técnicas de 4 Mineração de Dados...

Leia mais

Unidade II GESTÃO DO CONHECIMENTO. Profa. Leonor Cordeiro Brandão

Unidade II GESTÃO DO CONHECIMENTO. Profa. Leonor Cordeiro Brandão Unidade II GESTÃO DO CONHECIMENTO Profa. Leonor Cordeiro Brandão Relembrando Vimos alguns conceitos importantes: O que são dados; O que é informação; Quando uma informação se transforma em conhecimento;

Leia mais

Aula 4 Conceitos Básicos de Estatística. Aula 4 Conceitos básicos de estatística

Aula 4 Conceitos Básicos de Estatística. Aula 4 Conceitos básicos de estatística Aula 4 Conceitos Básicos de Estatística Aula 4 Conceitos básicos de estatística A Estatística é a ciência de aprendizagem a partir de dados. Trata-se de uma disciplina estratégica, que coleta, analisa

Leia mais

Estatística: Conceitos e Organização de Dados. Introdução Conceitos Método Estatístico Dados Estatísticos Tabulação de Dados Gráficos

Estatística: Conceitos e Organização de Dados. Introdução Conceitos Método Estatístico Dados Estatísticos Tabulação de Dados Gráficos Estatística: Conceitos e Organização de Dados Introdução Conceitos Método Estatístico Dados Estatísticos Tabulação de Dados Gráficos Introdução O que é Estatística? É a parte da matemática aplicada que

Leia mais

Obtenção de regras de associação sobre compras governamentais: Um estudo de caso 1

Obtenção de regras de associação sobre compras governamentais: Um estudo de caso 1 Obtenção de regras de associação sobre compras governamentais: Um estudo de caso 1 Keila Michelly Bispo da Silva 2, Starlone Oliverio Passos 3,Wesley Vaz 4 Resumo: O processo de compras governamentais

Leia mais

Ferramenta de Testes de Programas para Auxílio na Aprendizagem de Programação

Ferramenta de Testes de Programas para Auxílio na Aprendizagem de Programação Ferramenta de Testes de Programas para Auxílio na Aprendizagem de Programação Denise Santiago (FURB) denise@senior.com.br Maurício Capobianco Lopes (FURB) mclopes@furb.br Resumo. Este artigo apresenta

Leia mais

INTRODUÇÃO A MINERAÇÃO DE DADOS UTILIZANDO O WEKA

INTRODUÇÃO A MINERAÇÃO DE DADOS UTILIZANDO O WEKA INTRODUÇÃO A MINERAÇÃO DE DADOS UTILIZANDO O WEKA Marcelo DAMASCENO(1) (1) Instituto Federal de Educação, Ciência e Tecnologia do Rio Grande do Norte/Campus Macau, Rua das Margaridas, 300, COHAB, Macau-RN,

Leia mais

Classificação - avaliação de resultados - 1. Mineração de Dados 2013

Classificação - avaliação de resultados - 1. Mineração de Dados 2013 Classificação - avaliação de resultados - 1 Mineração de Dados 2013 Luís Rato (Capítulo 4 do livro Introduction to Data Mining ) Universidade de Évora, Mineração de dados / Data Mining 1 Desempenho Desempenho

Leia mais

3 METODOLOGIA DA PESQUISA

3 METODOLOGIA DA PESQUISA 43 3 METODOLOGIA DA PESQUISA Medeiros (2005) esclarece que a pesquisa científica tem por objetivo maior contribuir para o desenvolvimento humano. Para isso, conta com métodos adequados que devem ser planejados

Leia mais

Aula 5 Metodologias de avaliação de impacto

Aula 5 Metodologias de avaliação de impacto Aula 5 Metodologias de avaliação de impacto Metodologias de Avaliação de Impacto Objetiva quantificar as mudanças que o projeto causou na vida dos beneficiários. Plano de Aula Método experimental: regressão

Leia mais

SAD orientado a MODELO

SAD orientado a MODELO Universidade do Contestado Campus Concórdia Curso de Sistemas de Informação Prof.: Maico Petry SAD orientado a MODELO DISCIPLINA: Sistemas de Apoio a Decisão SAD Orientado a Modelo De acordo com ALTER

Leia mais

Requisitos de Software

Requisitos de Software Requisitos de Software Ian Sommerville 2006 Engenharia de Software, 8ª. edição. Capítulo 6 Slide 1 Objetivos Apresentar os conceitos de requisitos de usuário e de sistema Descrever requisitos funcionais

Leia mais

Laboratório de Mídias Sociais

Laboratório de Mídias Sociais Laboratório de Mídias Sociais Aula 02 Análise Textual de Mídias Sociais parte I Prof. Dalton Martins dmartins@gmail.com Gestão da Informação Universidade Federal de Goiás O que é Análise Textual? Análise

Leia mais

Melhoria Contínua PDCA/SDCA e suas ferramentas 06/04/2011

Melhoria Contínua PDCA/SDCA e suas ferramentas 06/04/2011 Melhoria Contínua PDCA/SDCA e suas ferramentas 6/4/211 PRODUTIVIDADE O que é o melhoria contínua? Quando se tem o Gerenciamento da Rotina implantado temos a melhoria tipo escada sempre melhorando o resultado

Leia mais

UTILIZANDO O SOFTWARE WEKA

UTILIZANDO O SOFTWARE WEKA UTILIZANDO O SOFTWARE WEKA O que é 2 Weka: software livre para mineração de dados Desenvolvido por um grupo de pesquisadores Universidade de Waikato, Nova Zelândia Também é um pássaro típico da Nova Zelândia

Leia mais

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE Engenharia de Computação Professor: Rosalvo Ferreira de Oliveira Neto Estudos Comparativos Recentes - Behavior Scoring Roteiro Objetivo Critérios de Avaliação

Leia mais