Previsão do desempenho de estudantes usando algoritmos de filtragem colaborativa baseados em fatoração de matrizes
|
|
- Leandro Gorjão Sabala
- 7 Há anos
- Visualizações:
Transcrição
1 Previsão do desempenho de estudantes usando algoritmos de filtragem colaborativa baseados em fatoração de matrizes Bruno Henrique Sebba Dodorico Faculdade de Engenharia de Computação / CEATEC bruno_lala1@hotmail.com Juan Manuel Adán Coello Grupo de Pesquisa em Sistemas Inteligentes CEATEC juan@puc-campinas.edu.br Resumo: A nota que se prevê que um aprendiz irá obter em tarefas que ainda não realizou pode ser usada para orientar os seus passos no processo de ensino-aprendizagem. Esta nota pode ser prevista a partir dos dados adquiridos durante a interação de estudantes com sistemas tutores, usando algoritmos de filtragem colaborativa. Grande diversidade desses algoritmos têm sido usada, principalmente, no domínio do comércio eletrônico, mas o seu uso ainda é raro no contexto considerado. Esse artigo apresenta algoritmos de fatoração de matrizes que irão prever se um estudante acertará ou não uma questão, a partir de seu perfil e do perfil dos demais estudantes. Na avaliação experimental realizada, o algoritmo de filtragem colaborativa clássico User-kNN obteve maior precisão que os algoritmos baseados em fatoração de matrizes, porém com um maior tempo de execução. Palavras-chave:Sistemas de recomendação, filtragem colaborativa, dados educacionais, fatoração de matrizes, previsão do desempenho de estudantes. Área do Conhecimento: Ciências Exatas e da Terra Ciência da computação. 1. INTRODUÇÃO O problema da recomendação de uma informação ou item relevante para um determinado indivíduo é um tema que vem ganhando importância tanto no meio acadêmico quanto no comercial. Os sistemas de recomendação foram e estão sendo desenvolvidos para solucionar esse problema. Tais sistemas possuem como objetivo reduzir as inúmeras opções de itens disponíveis, prevendo um ou mais que sejam de possível interesse de um usuário. Para isso, são utilizadas informações tais como as preferências do usúario e seu respectivo histórico de interações com o sistema, que consequentemente acabam gerando novos desafios como a falta de quantidade e qualidade de dados. Com isso, surgiram novas técnicas para implementarem esse sistema e uma das mais promissoras e que será utilizada no trabalho descrito no artigo é a Filtragem Colaborativa (FC) [1]. Essa filtragem consiste na análise do comportamento passado dos usuários, ou seja, transações e interações registradas e que servem para identificar novas associações usuário-item. Essas associações se referem a uma lista de m usuários, e uma lista n de itens que são representadas por uma matriz m x n contendo as avaliações (ratings) dadas aos itens pelos usuários em questão. Uma dificuldade dessa técnica de FC é a incapacidade de recomendar itens a novos usuários ou recomendar novos itens a usuários. Essa situação está associada ao problema da partida a frio (Cold Start Problem) e é muito comum sua discussão no estudo de sistemas de recomendação. Outros problemas também são encontrados como o de matrizes esparsas (muitos espaços vazios) e matrizes muito grandes que dificultam o trabalho e a manipulação de seus dados. Outras estratégias de filtragem podem ser citadas, em particular a filtragem demográfica e a filtragem baseada em conteúdo. A
2 filtragem demográfica associa aos usuários informações demográficas (preferência, idade, gênero, localidade), que permitem gerar estereótipos e generalizações de usuários. A filtragem baseada em conteúdo que constrói um perfil para cada usuário e item. Esse perfil guarda as preferências e informações e sua construção pode ser realizada de forma implícita (comportamento e monitoração do usuário) ou explícita (questionários, perguntas). Os métodos de fatoração de matrizes são uma abordagem para a filtragem colaborativa, visando melhor desempenho e precisão na recomendação a ser realizada, assim como escalabilidade, sendo o foco do trabalho descrito neste artigo. O artigo está organizado da seguinte forma: na seção 2 aprofunda-se a discussão sobre filtragem colaborativa, apresentando detalhes dos algoritmos clássicos e usados no trabalho descrito neste artigo; na seção 3 faz-se uma introdução aos algoritmos de fatoração de matrizes, abordagem utilizada neste trabalho para prever o desempenho dos estudantes; na seção 4 apresentam-se os resultados de uma avaliação experimental desses algoritmos estudados e, finalmente, na seção 5 são apresentadas algumas considerações finais. 2. FILTRAGEM COLABORATIVA (FC) Os algoritmos de filtragem colaborativa utilizam as semelhanças entre usuários ou entre itens para prever a avaliação que um usuário daria para um item ainda não avaliado. No restante desta seção serão apresentadas duas abordagens usadas com esse propósito. A primeira baseia-se no algoritmo clássico dos k vizinhos mais próximos (K-Nearest Neighbors KNN) e a segunda nas técnicas de fatoração de matrizes KNN O User-kNN é um algoritmo clássico de filtragem colaborativa considerado como um dos mais simples de todos os algoritmos de aprendizado de máquina. Sua utilização é frequente em sistemas de recomendação. Este algoritmo baseia-se na utilização de um conjunto conhecido como K neighbors, ou seja, k vizinhos, formado pelos k usuários que possuem características semelhantes. Por meio desse conjunto é possível prever a avaliação r ui que um usuário u faria de um item i, como pode ser visto na equação (1)., = + ( ) (, )(, ) (1) (, ) ( ) Para realizar a previsão, o algoritmo necessita ter conhecimento do conjunto de usuário similares ao usuário alvo ( ( ) ), assim como o quão semelhantes eles são (sim(u,v)). As abordagens mais comuns para determinar a semelhança, ou similaridade, entre usuários são a correlação de Pearson, dada pela equação (2) e a similaridade dos cossenos, dada pela equação (3). (, )= (, )=cos(, )= (, )(, ) (, )² (, )²,, (, )² (, )² (2) (3) Na equação (1), sim(u,v) expressa o grau de semelhança entre o usuário u e um usuário v e é o valor médio atribuído por u aos itens por ele avaliados. Importante ressaltar que o algoritmo knn também pode ser baseado em itens, ou seja, forma-se um conjunto de itens similares ( ( ) ), e o procedimento e as equações para a previsão da nota que o usuário daria a um item são as mesmas, considerando um conjunto de todos os usuários que avaliaram os itens (U) ao invés do conjunto de itens avaliados (I) FC BASEADA EM FATORAÇÃO DE MATRIZES Os problemas de matrizes esparsas e de grandes dimensões são comuns nos sistemas de recomendação. Para ajudar a contornar esse problema, existem técnicas de redução de dimensionalidade [3] que transformam o espaço original de alta-dimensionalidade em um de baixa. Uma vez que as matrizes tenham sido reduzidas de dimensão (k), o valor previsto de um item (i) por um usuário (u) pode ser
3 aproximado para o produto escalar entre os usuários (U u) e o vetor de características do item (V i) como pode ser visto na equação 4. Figura 2. Teorema básico do SVD No restante desta seção serão apresentadas duas abordagens usadas com esse objetivo de redução de dimensionalidade. A primeira se trata do método estatístico clássico PCA (Principal Component Analysis) e a segunda de um método de fatoração de matrizes, o SVD (Singular Value Decomposition) PCA O PCA é um método para encontrar padrões em conjuntos de alta dimensionalidade que consiste em obter uma lista ordenada dos componentes que representam a maior variância a partir dos dados. A quantidade de variação capturada pelo primeiro componente é maior do que a quantidade de variação no segundo e assim por diante. Dessa forma, a dimensão é reduzida ao desconsiderar os componentes que pouco contribuem para a variação. Apesar de ser um método importante e bastante utilizado nos sistemas de recomendação, ele apresenta algumas limitações. O PCA pressupõe que o conjunto empírico de dados que está sendo aplicado é uma combinação linear e supõem que o conjunto de dados originial foi elaborado a partir de uma distribuição estatística Gaussiana. Caso essas suposições não forem verdadeiras, não há garantias de que a técnica funcionará de modo significativo SVD O SVD está relacionado ao método PCA. A questão chave em uma decomposição SVD é encontrar um menor espaço de característica dimensional em que os novos recursos representam conceitos e considerar que a força de cada conceito no contexto da coleção é calculável. O SVD baseia-se em que é possível decompor uma matriz usuários x itens em outras três: itens x conceitos, conceitos x conceitos (força dos conceitos) e usuários x conceitos como mostrado na figura 2 e na equação (5). = (5) A diagonal da matriz da força dos conceitos contém os valores singulares e será sempre positiva e em ordem decrescente. O SVD pode contribuir à filtragem colaborativa de duas maneiras. A primeira se trata de descobrir as relações latentes entre usuários e itens. Para isso, preenche-se a matriz da média de avaliações com zeros e se normaliza subtraindo a média do usuário. Na segunda utiliza-se o espaço de baixa dimensão resultante para aprimorar a abordagem knn apresentada na seção 2.1. Uma das limitações do SVD é a dificuldade em recalcular a fatoração cada vez que a matriz que está sendo aplicada é atualizada. A utilização dessa técnica passou a ser levada em consideração após o sucesso que teve no prêmio do Netflix [2]. 3. ALGORITMOS DE FATORAÇÃO DE MATRIZES O termo fatoração de matrizes se refere a uma aproximação que tenta minimizar a discrepância entre a matriz original e o produto dos fatores retornados pelos algoritmos de fatoração de matrizes. Isso se deve à impossibilidade de se realizar uma fatoração exata na prática. Em termos gerais, esses algoritmos caracterizam tanto itens quanto usuários por meio de vetores de variáveis latentes inferidas de padrões de avaliação dos itens. Uma alta correspondência entre essas variáveis de um item e um usuário levam a uma recomendação. O algoritmo 1 mostra o pseudocódigo de um algoritmo de fatoração de matrizes sendo que E ij refere-se ao erro quadrático entre a estimativa e a avaliação e seu cálculo está
4 explícito na equação 6. Esse erro pode ser minimizado utilizando-se o gradiente descendente estocástico [5] para diferenciar a equação em relação às diferentes variáveis latentes e obter as equações de atualização p ik e q kj. Na equação 7 verifica-se o cálculo dos componentes dos vetores de preferências do usuário i e do item j. A variável α refere-se à taxa de aprendizado e controla quanto do erro entra no passo de atualização do valor da variável latente em questão. O RapidMiner [4] possui três variações do algoritmo de fatoração de matrizes e por isso foi escolhido como a ferramenta a ser utilizada para a avaliação do desempenho desses algoritmos no problema de prever o desempenho de estudantes em tarefas ainda não realizadas. 4. AVALIAÇÃO EXPERIMENTAL Para a avaliação dos algoritmos de fatoração de matrizes presentes no RapidMiner foi utilizado a base de dados assistments [7] que consiste em um conjunto de dados coletados no entre 2009 e 2010, a partir de uma plataforma online que permite que professores selecionem questões para que estudantes as resolvam e consigam tutoria imediata. Essa base está organizada em um formato de tabela com diversas colunas e a base recortada, utilizada nos experimentos, representa avaliações feitas por estudantes para questões. Os algoritmos foram avaliados comparando os seus desempenhos relativos e o desempenho de um algoritmo de filtragem colaborativa baseado no knn. A precisão foi avaliada por meio das métricas RMSE(Root Mean Square Error) e MAE (Mean Absolute Error), que medem a diferença entre os valores previstos e os observados. O processo implementado no RapidMiner consiste na execução de uma sequência de atividades. Primeiramente a base de dados é importada na ferramenta, considerando os tipos de cada atributo. Após a importação, filtra-se essa base em função do valor de um dos atributos, no caso o correct que será o atributo que indica se um estudante acertou ou não uma determinada questão (correct = 0 correct = 1) e que será o alvo das previsões. Depois, seleciona-se os atributos que serão trabalhados e definem-se os seus respectivos papéis, ou seja, a identificação do usuário e do item. Antes dessa definição, separa-se a base em duas partições, sendo que uma será o conjunto de treinamento (80% da base original) enquanto a outra será o conjunto de testes (20% da base original). Após isso, aplicam-se os algoritmos de filtragem colaborativa e analisa-se as suas performances. Ao aplicar o algoritmo knn e os algoritmos de fatoração de matrizes, considerando os valores padrões dos parâmetros, foi gerado o gráfico apresentado na figura 3, que compara suas precisões. Observa-se que o algoritmo com aquele com o melhor desempenho, ou seja, menor índice de erros foi o algoritmo User-kNN descrito na seção 2.1. Vale ressaltar que apesar do melhor resultado de precisão, o algoritmo User-KNN foi aquele que teve requereu o maior tempo de execução.
5 Na figura 6, percebe-se que o tempo de execução desse algoritmo aumenta conforme varia-se o parâmetro do número de iterações. Figura 3. Gráfico de comparação dos algoritmos Após essa comparação, decidiu-se focar o estudo no algoritmo de fatoração de matrizes BMF (Biased Matrix Factorization) para trabalhar com a manipulação de valores dos parâmetros a fim de melhorar sua precisão. Os primeiros parâmetros a serem variados foram o número de iterações e o booleano Bold Driver, que se refere a uma técnica específica do BMF. Ao variá-los obteve-se uma leve melhora como pode ser visto nas figuras 4 e 5. Figura 4. Tabela da variação do parâmetro iteration Number Figura 6. Tempo de Execução vs. Número de Iterações Outros parâmetros também trabalhados foram os de regularização da matriz. Por meio de referências [5] [6] e estudos de experimentos anteriores, decidiu-se alterar os três parâmetros de regularização ao mesmo tempo (usuário, item e regularização). Figura 7. MAE vs. Parâmetros de Regularização (usuário,item e regularização) Figura 5. BMF: Erro vs. Número de iterações Conforme apresentado na figura 7, foi possível uma leve melhora da precisão do algoritmo, sem um aumento expressivo do tempo de execução como os outros parâmetros. Apesar da melhora na precisão dos algoritmos de fatoração de matrizes, aquele com o melhor resultado continuou sendo a técnica clássica de filtragem colaborativa User-kNN.
6 5. CONCLUSÃO O objetivo do plano de trabalho detalhado no artigo consistia em analisar o desempenho de algoritmos de filtragem colaborativa baseados em métodos de fatoração de matrizes, quando aplicados ao problema de prever o desempenho de estudantes. Essa análise pode ser interpretada como uma forma de buscar aprimorar a precisão dessa previsão e a escalabilidade dos algoritmos, levando em conta o volume de dados disponível e a densidade da matriz usuário-item construída. Os resultados obtidos experimentalmente mostram que esse aprimoramento é possível por meio da adequada escolha dos parâmetros de cada algoritmo, considerando o domínio e o contexto em que estão sendo aplicados. Systems. ACM Int. Conference on Knowledge Discovery and Data Mining (KDD 07), [7] M. Feng, N. Heffernan e K. Koedinger. Addressing the assessment challenge with an Online System that tutors as it assesses. The Journal of User Modeling and User-Adapted Interaction, AGRADECIMENTOS À FAPIC/Reitoria pela bolsa de iniciação científica, à PUC-Campinas pelas instalações que permitiram o desenvolvimento desse artigo, e ao Prof. Dr. Juan Manuel Adán Coello pela orientação e motivação. REFERÊNCIAS [1] Ò. Celma.The Recommendation Problem. Music Recommendation and Discovery Berlin Heidelberg: Springer- Verlag, [2] R. Bell, Y. Koren e C. Volinsky. Matrix factorization techniques for recommender systems. IEEE Computer Society, [3] X. Amatrian, A. Jaimes, N. Oliver e J. M. Pujol. Data mining methods for recommender systems. Recommender Systems Handbook, [4] M. Mihelcic, N. Antulov-Fantulin, M. Bosnjak e T. Smuc. Extending RapidMiner with recommender systems algorithms. RapidMiner Community Meeting and Conference (RCOMM 12), [5] R. Gemulla, P. J. Haas, E. Nijkamp, Y. Sismanis. Large-Scale Matrix Factorization with Distributed Stochastic Gradient Descent. ACM SIGKDD Int. Conference on Knowledge Discovery and Data Mining (KDD 11), [6] R. Bell, Y. Koren e C. Volinsky. Modeling Relationships at Multiple Scales to Improve Accuracy of Large Recommender
DESENVOLVIMENTO DE ALGORITMO HÍBRIDO PARA SISTEMAS DE RECOMENDAÇÃO: FILTRAGEM COLABORATIVA E ETIQUETAGEM SOCIAL
DESENVOLVIMENTO DE ALGORITMO HÍBRIDO PARA SISTEMAS DE RECOMENDAÇÃO: FILTRAGEM COLABORATIVA E ETIQUETAGEM SOCIAL Ana Paula Sontachi de Oliveira Faculdade de Engenharia de Computação CEATEC anapaula.sontachi@gmail.com
5 Experimentos Conjunto de Dados
Experimentos 48 5 Experimentos Este capítulo apresenta o ambiente experimental utilizado para validar o método de predição do CTR proposto neste trabalho. Na seção 5.1, descrevemos a geração do conjunto
3 Modelos de Fatoração Matricial
27 3 Modelos de Fatoração Matricial 3.1 Introdução Algoritmos baseados em fatoração matricial são as implementações de maior sucesso dos modelos de fatoração latente. Em termos gerais, esta técnica é capaz
SISTEMAS DE RECOMENDAÇÃO
SISTEMAS DE RECOMENDAÇÃO Prof. Dr. Sílvio César Cazella Sumário (FC) Cálculo da Similaridade Cálculo da Predição Limitações da FC 1 A não se constitui em algo novo e apresenta uma proposta diferenciada
2 Sistemas de Recomendação
15 2 Sistemas de Recomendação Sistemas de recomendação são utilizados em portais de vendas e conteúdo com a finalidade de prever a preferência dos usuários. Predições com boa precisão podem resultar em
Cálculo Numérico BCC760
Cálculo Numérico BCC760 Resolução de Sistemas de Equações Lineares Simultâneas Departamento de Computação Página da disciplina http://www.decom.ufop.br/bcc760/ 1 Introdução! Definição Uma equação é dita
3 Sistemas de Recomendação baseados em Filtragem Colaborativa
Sistemas de Recomendação baseados em Filtragem Colaborativa 28 3 Sistemas de Recomendação baseados em Filtragem Colaborativa Os sistemas de recomendação tornaram-se uma importante área de pesquisa desde
Bruno de Figueiredo Melo e Souza. Modelos de fatoração matricial para recomendação de vídeos. Dissertação de Mestrado
Bruno de Figueiredo Melo e Souza Modelos de fatoração matricial para recomendação de vídeos Dissertação de Mestrado Dissertação apresentada como requisito parcial para obtenção do grau de Mestre pelo Programa
Análise e comparação de métodos de recomendações e seus coeficientes para sistemas de recomendação de filmes
Análise e comparação de métodos de recomendações e seus coeficientes para sistemas de recomendação de filmes Jessé Filipe de Queiroz Morais 1 Marco Túlio Alves Nolasco Rodrigues 2 Flávio Luis Cardeal Pádua³
Luiz Henrique Marino Cerqueira Faculdade de Engenharia de Computação CEATEC luiz.hmc@puccamp.edu.br
AVALIAÇÃO COMPARATIVA DE ALGORITMOS PARA SISTEMAS DE RECOMENDAÇÃO EM MÚLTIPLOS DOMÍNOS: PREVISÃO DO DESEMPENHO DE ESTUDANTES A PARTIR DE SUA INTERAÇÃO COM UM SISTEMA TUTOR. Luiz Henrique Marino Cerqueira
Recuperação de Informações por Álgebra Linear Computacional
Recuperação de Informações por Álgebra Linear Computacional MAC499 - Projeto de Iniciação Científica Aluna: Ellen Hidemi Fukuda Orientador: Paulo José da Silva e Silva Departamento de Ciência da Computação
DATA MINING & MACHINE LEARNING (I) Thiago Marzagão
DATA MINING & MACHINE LEARNING (I) Thiago Marzagão problema de trabalhar c/ textos: dimensionalidade A quantidade de colunas cresce rapidamente com a quantidade de documentos problema de trabalhar c/ textos:
Recomendação de Produtos Financeiros. Unindo Inteligência Artificial ao conhecimento de especialistas
Recomendação de Produtos Financeiros Unindo Inteligência Artificial ao conhecimento de especialistas Conteúdo A necessidade por recomendações Sistemas de recomendação Machine Learning e Otimização Criando
SVD. Single Value Decomposition 18/09/2017. Lema. Toda matriz A, com n linhas e d colunas, admite uma fatoração A= UDV T =
SVD Single Value Decomposition Lema. Toda matriz A, com n linhas e d colunas, admite uma fatoração A= UDV T = U é uma matriz com n linhas e r colunas (r rank de A) D é uma matriz diagonal r x r; V é uma
ELABORAÇÃO DE UM SERVIÇO DE RECOMENDAÇÃO COLABORATIVA BASEADA EM MEMÓRIA
ELABORAÇÃO DE UM SERVIÇO DE RECOMENDAÇÃO COLABORATIVA BASEADA EM MEMÓRIA Thiago Machado Mendes - Ifes Campus Cachoeiro de Itapemirim, thiagommendes16@gmail.com Rafael Vargas Mesquita dos Santos - Ifes
SBC - Sistemas Baseados em Conhecimento
Siglas, Símbolos, Abreviaturas DW - Data Warehouse KDD Knowledge Discovery in Database MD Mineração de Dados OLAP - On-line analytical processing SBC - Sistemas Baseados em Conhecimento 1. INTRODUÇÃO O
étodos uméricos SISTEMAS DE EQUAÇÕES LINEARES (Continuação) Prof. Erivelton Geraldo Nepomuceno PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA
étodos uméricos SISTEMAS DE EQUAÇÕES LINEARES (Continuação) Prof. Erivelton Geraldo Nepomuceno PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA UNIVERSIDADE DE JOÃO DEL-REI PRÓ-REITORIA DE PESQUISA CENTRO
1 Introdução Motivação
Introdução 9 1 Introdução 1.1. Motivação Os sistemas de recomendação vêm sendo um tema de pesquisa constante desde os meados dos anos 90, quando surgiram os primeiros artigos sobre filtragem colaborativa
MÉTODOS QUANTITATIVOS PARA CIÊNCIA DA COMPUTAÇÃO EXPERIMENTAL
MÉTODOS QUANTITATIVOS PARA CIÊNCIA DA COMPUTAÇÃO EXPERIMENTAL Pedro Henrique Bragioni Las Casas Pedro.lascasas@dcc.ufmg.br Apresentação baseada nos slides originais de Jussara Almeida e Virgílio Almeida
5 Agregação das Reservas das Entidades
5 Agregação das Reservas das Entidades Neste capítulo é apresentado o procedimento de agregação das reservas das entidades. É importante ressaltar que as entidades probabilísticas sofrem agregação probabilística,
Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas
Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas Wrapper Filtros Muitos algoritmos de AM são projetados de modo a selecionar os
Sistemas de Recomendação Uma abordagem geral
Sistemas de Recomendação Uma abordagem geral Universidade Estadual de Maringá Departamento de Informática Programa de Pós-Graduação Mestrado em Ciência da Computação Disciplina: Seminários II Aluna: Késsia
étodos uméricos SISTEMAS DE EQUAÇÕES LINEARES (Continuação) Prof. Erivelton Geraldo Nepomuceno PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA
étodos uméricos SISTEMAS DE EQUAÇÕES LINEARES (Continuação) Prof. Erivelton Geraldo Nepomuceno PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA UNIVERSIDADE DE JOÃO DEL-REI PRÓ-REITORIA DE PESQUISA CENTRO
Aprendizagem de Máquina
Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Aprendizagem Baseada em Instâncias Plano de Aula Introdução Espaço
Processamento de Imagens CPS755
Processamento de Imagens CPS755 aula 04 - sistemas lineares Antonio Oliveira Ricardo Marroquim 1 / 32 laboratório de processamento de imagens tópicos decomposições (álgebra linear) decomposição QR decomposição
6. Aplicação à Séries de Velocidade do Vento
9. Aplicação à Séries de Velocidade do Vento A geração eólica de energia elétrica vem sendo explorada com mais intensidade desde e para este tipo de geração, a principal variável a ser estudada é a velocidade
Aprendizado de Máquina. Combinando Classificadores
Universidade Federal do Paraná (UFPR) Departamento de Informática (DInf) Aprendizado de Máquina Combinando Classificadores David Menotti, Ph.D. web.inf.ufpr.br/menotti Introdução O uso de vários classificadores
Medidas de Esparsidade para Combinação de Recomendação Baseada em Confiança e Filtragem Colaborativa
Medidas de Esparsidade para Combinação de Recomendação Baseada em Confiança e Filtragem Colaborativa Gabriel de A. V. Azuirson Centro de Informática Universidade Federal de Pernambuco Recife (PE) Email:
Determinação de vícios refrativos oculares utilizando Support Vector Machines
Determinação de vícios refrativos oculares utilizando Support Vector Machines Giampaolo Luiz Libralão, André Ponce de Leon F. de Carvalho, Antonio Valerio Netto, Maria Cristina Ferreira de Oliveira Instituto
Sistemas de Recomendação o que, quando, onde, como você quer, e nem sabia
Comprar livros nos antigamente Sistemas de Recomendação o que, quando, onde, como você quer, e nem sabia Insubstituível Comprar música nos antigamente Ler notícia nos antigamente Encontrar lugares Compra
)XQGDPHQWRVGHSURJUDPDomRPDWHPiWLFD
)XQGDPHQWRVGHSURJUDPDomRPDWHPiWLFD,QWURGXomR A grande maioria dos problemas de engenharia pode ser solucionado de diferentes formas, uma vez que um número muito grande de soluções atende aos critérios
FILTROS ESPACIAIS PASSA-BAIXA
UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL PROGRAMA DE PÓS-GRADUAÇÃO EM COMPUTAÇÃO CMP65 - INTRODUÇÃO AO PROCESSAMENTO DE IMAGENS PROFESSOR JACOB SCARCHANSKI FILTROS ESPACIAIS PASSA-BAIXA POR DANIEL NEHME
CÁLCULO NUMÉRICO. Profa. Dra. Yara de Souza Tadano
CÁLCULO NUMÉRICO Profa. Dra. Yara de Souza Tadano yaratadano@utfpr.edu.br Aula 13 04/2014 Sistemas de Equações Lineares Parte 3 MÉTODOS ITERATIVOS Cálculo Numérico 3/44 MOTIVAÇÃO Os métodos iterativos
Aula 7 Medidas de Distância. Profa. Elaine Faria UFU
Aula 7 Medidas de Distância Profa. Elaine Faria UFU - 2017 Agradecimentos Este material é baseado No livro Tan et al, 2006 Nos slides do prof Andre C. P. L. F. Carvalho Agradecimentos Ao professor André
3 Aprendizado por reforço
3 Aprendizado por reforço Aprendizado por reforço é um ramo estudado em estatística, psicologia, neurociência e ciência da computação. Atraiu o interesse de pesquisadores ligados a aprendizado de máquina
Modelagem para previsão/estimação: uma aplicação Neuro-Fuzzy
Proceeding Series of the Brazilian Society of pplied and Computational Mathematics, Vol., N., 0. Trabalho apresentado no XXXV CNMC, Natal-RN, 0. Modelagem para previsão/estimação: uma aplicação Neuro-Fuzzy
5 Resultados e Discussões
5 Resultados e Discussões Este capítulo apresenta os resultados obtidos no presente trabalho assim como sua discussão. São apresentados os resultados do registro realizado nas imagens capturadas empregando
5 Estudo de Caso e Resultados
5 Estudo de Caso e Resultados 5.1. Introdução Finalizado o desenvolvimento da ferramenta, é indispensável testar suas funcionalidades e a eficácia da aplicação conjunta dos seus módulos de geração de experimentos
ALGORITMO HÍBRIDO PARA SISTEMAS DE RECOMENDAÇÃO UTILIZANDO FILTRAGEM COLABORATIVA E ALGORITMO GENÉTICO
ALGORITMO HÍBRIDO PARA SISTEMAS DE RECOMENDAÇÃO UTILIZANDO FILTRAGEM COLABORATIVA E ALGORITMO GENÉTICO Renan de Oliveira Yamaguti Faculdade de Engenharia de Computação / CEATEC renan.yamaguti@terra.com.br
Projeções Multi-dimensionais
Prof. Fernando V. Paulovich http://www.icmc.usp.br/~paulovic paulovic@icmc.usp.br Instituto de Ciências Matemáticas e de Computação (ICMC) Universidade de São Paulo (USP) 23 de setembro de 2010 Introdução
Caio Santos Bezerra Nóbrega
Universidade Federal de Campina Grande Centro de Engenharia Elétrica e Informática Programa de Pós-Graduação em Ciência da Computação Uma Estratégia para Predição da Taxa de Aprendizagem do Gradiente Descendente
Mineração de Dados. Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri
Mineração de Dados Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri 1 Motivação Aumento da capacidade de processamento e de armazenamento de dados; Baixo custo; Grande quantidade de dados
Aprendizado de Máquina (Machine Learning)
Ciência da Computação (Machine Learning) Aula 01 Motivação, áreas de aplicação e fundamentos Max Pereira Nem todo conhecimento tem o mesmo valor. O que torna determinado conhecimento mais importante que
3 Identificação de Locutor Usando Técnicas de Múltiplos Classificadores em Sub-bandas Com Pesos Não-Uniformes
3 Identificação de Locutor Usando Técnicas de Múltiplos Classificadores em Sub-bandas Com Pesos Não-Uniformes Neste capítulo, é apresentada uma nova proposta de combinação de múltiplos classificadores
Precondicionadores baseados na aproximação da inversa da matriz de coeficientes
Precondicionadores baseados na aproximação da inversa da matriz de coeficientes João Paulo K. Zanardi, Italo C. N. Lima, Programa de Pós Graduação em Eneganharia Mecânica, FEN, UERJ 20940-903, Rio de Janeiro,
Análise de aprendizagem preditiva Revisão Sistemática
Análise de aprendizagem preditiva Revisão Sistemática Lucinéia Barbosa da Costa Chagas 1, Márcia Gonçalves de Oliveira 2 1 Universidade Federal do Espírito Santo (UFES) Avenida Fernando Ferrari, 514 Goiabeiras,
SUPPORT VECTOR MACHINE - SVM
SUPPORT VECTOR MACHINE - SVM Definição 2 Máquinas de Vetores Suporte (Support Vector Machines - SVMs) Proposto em 79 por Vladimir Vapnik Um dos mais importantes acontecimentos na área de reconhecimento
CEFET/RJ. Aprendizado de Máquina - Trabalho 03
CEFET/RJ Programa de Pós-graduação em Ciência da Computação Aprendizado de Máquina - Trabalho 03 Prof. Eduardo Bezerra (ebezerra@cefet-rj.br) Agosto/2018 Conteúdo 1 Introdução 3 2 Sistemas de Recomendação
Profs.: Eduardo Vargas Ferreira Walmes Marques Zeviani
Universidade Federal do Paraná Laboratório de Estatística e Geoinformação - LEG Introdução Profs.: Eduardo Vargas Ferreira Walmes Marques Zeviani O que é Machine Learning? Estatística Machine Learning
Thiago Marzagão LSA, LDA
MINERAÇÃO DE DADOS Thiago Marzagão marzagao.1@osu.edu LSA, LDA Thiago Marzagão (UnB) MINERAÇÃO DE DADOS 1 / 16 problema de trabalhar c/ textos: dimensionalidade A quantidade de colunas cresce rapidamente
Análise de Componentes Principais (PCA)
Análise de Componentes Principais (PCA) Lailson B. Moraes, George D. C. Cavalcanti {lbm4,gdcc}@cin.ufpe.br Roteiro Introdução Características Definição Algoritmo Exemplo Aplicações Vantagens e Desvantagens
Aprendizado de Máquina
Aprendizado de Máquina Árvores de Decisão Luiz Eduardo S. Oliveira Universidade Federal do Paraná Departamento de Informática http://lesoliveira.net Luiz S. Oliveira (UFPR) Aprendizado de Máquina 1 / 28
SIMULAÇÃO DE UM APRENDIZ INFORMAL COM ALGORITMO EVOLUCIONÁRIO
SIMULAÇÃO DE UM APRENDIZ INFORMAL COM ALGORITMO EVOLUCIONÁRIO Breno Antunes Sistemas de Informação CEATEC bee_zaum@hotmail.com Resumo: Este documento apresenta o resultado de um projeto de Iniciação Científica
CC-226 Introdução à Análise de Padrões
CC-226 Introdução à Análise de Padrões Apresentação do Curso Carlos Henrique Q. Forster 1 1 Divisão de Ciência da Computação Instituto Tecnológico de Aeronáutica 25 de fevereiro de 2008 C. H. Q. Forster
Identificação de Pontos Perceptualmente Importantes (PIP) em séries temporais de tópicos extraídos de dados textuais
Universidade de São Paulo Biblioteca Digital da Produção Intelectual - BDPI Departamento de Ciências de Computação - ICMC/SCC Comunicações em Eventos - ICMC/SCC 2015 Identificação de Pontos Perceptualmente
4 Estado da Arte do Kernel PCA
4 Estado da Arte do Kernel PCA Conforme apresentado no Capítulo 1, o Kernel PCA é uma técnica promissora para auxiliar no processo de ajuste de histórico, devido a sua capacidade de extrair parte da estatística
Aprendizado de Máquina (Machine Learning)
Ciência da Computação (Machine Learning) Aula 07 Classificação com o algoritmo knn Max Pereira Classificação com o algoritmo k-nearest Neighbors (knn) Como os filmes são categorizados em gêneros? O que
CEFET/RJ. Aprendizado de Máquina - Trabalho 01
CEFET/RJ Programa de Pós-graduação em Ciência da Computação Aprendizado de Máquina - Trabalho 01 Prof. Eduardo Bezerra (ebezerra@cefet-rj.br) Setembro/2017 Conteúdo 1 Regressão Linear com uma Variável
4 Análise de Dados. 4.1.Procedimentos
4 Análise de Dados 4.1.Procedimentos A idéia inicial para a comparação dos dados foi separá-los em series de 28 ensaios, com a mesma concentração, para depois combinar esses ensaios em uma única série.
Redes Neurais e Sistemas Fuzzy
Redes Neurais e Sistemas Fuzzy O ADALINE e o algoritmo LMS O ADALINE No contexto de classificação, o ADALINE [B. Widrow 1960] pode ser visto como um perceptron com algoritmo de treinamento baseado em minimização
ESTIMATIVA DE RADIAÇÃO SOLAR NA REGIÃO DO MACIÇO DE BATURITÉ: ABORDAGEM VIA REDES NEURAIS ARTIFICIAIS.
ESTIMATIVA DE RADIAÇÃO SOLAR NA REGIÃO DO MACIÇO DE BATURITÉ: ABORDAGEM VIA REDES NEURAIS ARTIFICIAIS. Arini de Menezes Costa 1, Kaio Martins Ramos 2, Hugo Hermano da Costa Castro 3, Antonio Alisson P.
Modelagem da Rede Neural. Modelagem da Rede Neural. Back Propagation. Modelagem da Rede Neural. Modelagem da Rede Neural. Seleção de Variáveis:
Back Propagation Fatores importantes para a modelagem da Rede Neural: Seleção de variáveis; veis; Limpeza dos dados; Representação das variáveis veis de entrada e saída; Normalização; Buscando melhor Generalização
Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação
Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Francisco A. Rodrigues Departamento de Matemática Aplicada e Estatística - SME Conceitos básicos Classificação não-supervisionada:
Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si
Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si Classificação de Dados Os modelos de classificação de dados são preditivos, pois desempenham inferências
Aprendizado de Máquina (Machine Learning)
Ciência da Computação Aprendizado de Máquina (Machine Learning) Aula 07 Classificação com o algoritmo knn Max Pereira Classificação com o algoritmo (knn) Um algoritmo supervisionado usado para classificar
7 Congresso de Pós-Graduação MODELAGEM DE BASE DE CONHECIMENTO PARA TAREFA DE CLASSIFICAÇÃO EM MINERAÇÃO DE DADOS
7 Congresso de Pós-Graduação MODELAGEM DE BASE DE CONHECIMENTO PARA TAREFA DE CLASSIFICAÇÃO EM MINERAÇÃO DE DADOS Autor(es) LIDIA MARTINS DA SILVA Orientador(es) ANA ESTELA ANTUNES DA SILVA 1. Introdução
Teoria do aprendizado
Teoria do aprendizado Marcelo K. Albertini 7 de Agosto de 2014 2/37 Teoria do aprendizado Teoremas não existe almoço grátis Viés e variância Aprendizado PAC Dimensão VC Máquinas de vetores suporte 3/37
Prof.: Eduardo Vargas Ferreira
Universidade Federal do Paraná Laboratório de Estatística e Geoinformação - LEG Introdução Prof.: Eduardo Vargas Ferreira O que é Machine Learning? Estatística Data Mining 2 O que é Machine Learning? Estatística
Aprendizado de Máquina (Machine Learning)
Ciência da Computação (Machine Learning) Aula 02 Representação dos dados Pré-processamento Max Pereira Tipo de Dados Os atributos usados para descrever objetos de dados podem ser de diferentes tipos: Quantitativos
O uso de Máquina de Suporte Vetorial para Regressão (SVR) na Estimação da Estrutura a Termo da Taxa de Juros do Brasil 12
1 Introdução No Brasil, o grande aumento na adesão a planos de previdência privada nos últimos tempos implicou em maiores preocupações de bancos e seguradoras em fazer investimentos visando garantir o
3 Redes Neurais Artificiais
3 Redes Neurais Artificiais 3.1. Introdução A capacidade de implementar computacionalmente versões simplificadas de neurônios biológicos deu origem a uma subespecialidade da inteligência artificial, conhecida
Análise estatística multivariada
Análise estatística multivariada Conjunto de procedimentos para a análise simultânea de duas ou mais medidas de cada caso/observação Os dados coletados p variáveis - de uma amostra de tamanho n podem ser
INTRODUÇÃO AO PROCESSAMENTO DIGITAL DE IMAGENS SENSORIAMENTO REMOTO
INTRODUÇÃO AO PROCESSAMENTO DIGITAL DE IMAGENS SENSORIAMENTO REMOTO PROCESSAMENTO DE IMAGENS Introdução Conceitos básicos Pré-processamento Realce Classificação PROCESSAMENTO DE IMAGENS Extração de Informações
RECONHECIMENTO FACIAL UTILIZANDO EIGENFACES
Universidade Federal do Rio de Janeiro Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia Programa de Engenharia de Sistemas e Computação Rio de Janeiro, RJ Brasil RECONHECIMENTO
Optimização. Carlos Balsa. Departamento de Matemática Escola Superior de Tecnologia e Gestão de Bragança
Optimização Carlos Balsa balsa@ipb.pt Departamento de Matemática Escola Superior de Tecnologia e Gestão de Bragança Matemática Aplicada - Mestrados Eng. Química e Industrial Carlos Balsa Matemática Aplicada
INTERPOLAÇÃO LINEAR E BILINEAR: APLICAÇÃO EM TRANSFORMAÇÕES GEOMÉTRICAS DE IMAGEM INTRODUÇÃO
INTERPOLAÇÃO LINEAR E BILINEAR: APLICAÇÃO EM TRANSFORMAÇÕES GEOMÉTRICAS DE IMAGEM Autores: Giulia Denise Kujat VIEIRA; Milene Karine GUBETTI. Identificação autores: Estudantes do Curso Técnico em Informática
Filtro de Kalman. Teoria e Aplicação para Iniciantes. Prof. Dr. Marco Antonio Leonel Caetano. M&V Consultoria e Treinamento
Filtro de Kalman Teoria e Aplicação para Iniciantes Prof. Dr. Marco Antonio Leonel Caetano M&V Consultoria e Treinamento www.mudancasabruptas.com.br A História da Filtragem de Sinais 930 940 960 Filtro
4 Experimentos com um acervo de vídeos
40 4 Experimentos com um acervo de vídeos Neste capítulo descrevemos os experimentos realizados para testar as abordagens apresentadas. Primeiro, descrevemos as principais características de nosso conjunto
Método de Newton truncado
Método de Newton truncado Marina Andretta ICMC-USP 8 de outubro de 2018 Baseado no livro Numerical Optimization, de J. Nocedal e S. J. Wright. Marina Andretta (ICMC-USP) sme5720 - Otimização não-linear
IMPLEMENTAÇÃO DE SISTEMA DE ATITUDE EM DSP
Anais do 15 O Encontro de Iniciação Científica e Pós-Graduação do ITA XV ENCITA / 2009 Instituto Tecnológico de Aeronáutica São José dos Campos SP Brasil Outubro 19 a 21 2009. IMPLEMENTAÇÃO DE SISTEMA
Aprendizagem de Máquina
Aprendizagem de Máquina Aprendizagem Baseada em Instâncias Alessandro L. Koerich Mestrado/Doutorado em Informática (PPGIa) Pontifícia Universidade Católica do Paraná (PUCPR) Mestrado/Doutorado em Informática
Consultas por Similaridade em Domínios de Dados Complexos
Consultas por Similaridade em Domínios de Dados Complexos Guilherme Felipe Zabot Orientador: Profº Dr Caetano Traina Jr Roteiro Objetivo Introdução Dados Complexos Representação de Dados Complexos Extração
1. Computação Evolutiva
Computação Bioinspirada - 5955010-1 1. Computação Evolutiva Prof. Renato Tinós Programa de Pós-Graduação Em Computação Aplicada Depto. de Computação e Matemática (FFCLRP/USP) 2 Computação Bioinspirada
SEMINÁRIO DOS ARTIGOS:
SEMINÁRIO DOS ARTIGOS: Text Detection and Character Recognition in Scene Images with Unsupervised Feature Learning End-to-End Text Recognition with Convolutional Neural Networks Fernanda Maria Sirlene
SIMULAÇÃO DE UM APRENDIZ FORMAL COM ALGORITMO EVO- LUCIONÁRIO
SIMULAÇÃO DE UM APRENDIZ FORMAL COM ALGORITMO EVO- LUCIONÁRIO Monise Rafaela da Costa Sistemas de Informação CEATEC monise.rc@puccamp.edu.br Resumo: Este documento apresenta o resultado de um trabalho
4 APLICAÇÃO DO MODELO E RESULTADOS
4 APLICAÇÃO DO MODELO E RESULTADOS Neste capítulo, será aplicado o modelo proposto (Holt-Winters com múltiplos ciclos mais a correção devido à ocorrência de feriado e temperatura) e apresentados os resultados
4 Estratégias de agrupamento e desempenho dos receptores
4 Estratégias de agrupamento e desempenho dos receptores O capítulo anterior apresentou exemplos de resultados de desempenho do receptor ótimo por grupos, para N = 6 símbolos. Nestes exemplos os agrupamentos
INF 1771 Inteligência Artificial
Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 18 Aprendizado Não-Supervisionado Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor
APLICAÇÃO DE REDE NEURAL SEM PESO E LOCALITY-SENSITIVE HASHING PARA O PROBLEMA DE COLD-START ITEM EM FILTRAGEM COLABORATIVA. Kleyton Pontes Cotta
APLICAÇÃO DE REDE NEURAL SEM PESO E LOCALITY-SENSITIVE HASHING PARA O PROBLEMA DE COLD-START ITEM EM FILTRAGEM COLABORATIVA Kleyton Pontes Cotta Dissertação de Mestrado apresentada ao Programa de Pós-graduação
Considerações de Desempenho
Back Propagation Considerações de Desempenho Dicas para o BP O uso da função de ativação simétrica geralmente acelera o treinamento TANH +1 logistic linear 0 tanh -1-4 +4 1 Dicas para o BP Os pesos devem
Múltiplos Classificadores
Universidade Federal do Paraná (UFPR) Bacharelado em Informátia Biomédica Múltiplos Classificadores David Menotti www.inf.ufpr.br/menotti/ci171-182 Hoje Múltiplos classificadores Combinação de classificadores
Uma equação linear com n variáveis tem a seguinte forma:
Edgard Jamhour Uma equação linear com n variáveis tem a seguinte forma: a 1 x 1 + a 2 x 2 +... + a n x n = b onde a 1, a 2,..., a n e b são constantes reais. Um sistema de equações lineares é um conjunto
UMA PROPOSTA DE DECOMPOSIÇÃO DE SISTEMAS LINEARES PARA DMPC
UMA PROPOSTA DE DECOMPOSIÇÃO DE SISTEMAS LINEARES PARA DMPC R. R. ROCHA 1 e L. C. OLIVEIRA-LOPES 1 1 Universidade Federal de Uberlândia, Faculdade de Engenharia Química E-mail para contato: rosi.rocha28@gmail.com;
INTRODUÇÃO À CALIBRAÇÃO MULTIVARIADA
INTRODUÇÃO À CALIBRAÇÃO MULTIVARIADA APLICAÇÃO NO CONTROLE DE QUALIDADE DE FÁRMACOS MÓDULO 05 Unidade Universitária de Ciências Exatas e Tecnológicas UnUCET Anápolis 1 2 MÓDULO 05 CALIBRAÇÃO MULTIVARIADA
UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica
REDES NEURAIS ARTIFICIAIS MÁQUINA DE VETOR DE SUPORTE (SUPPORT VECTOR MACHINES) Prof. Dr. André A. P. Biscaro 1º Semestre de 2017 Introdução Poderosa metodologia para resolver problemas de aprendizagem
AVALIAÇÃO DA ESTIMATIVA DE PARÂMETROS PARA MODELOS AR2D APLICADOS NA EXTRAÇÃO DE ATRIBUTOS DE TEXTURA EM IMAGENS DE SENSORIAMENTO REMOTO
AVALIAÇÃO DA ESTIMATIVA DE PARÂMETROS PARA MODELOS AR2D APLICADOS NA EXTRAÇÃO DE ATRIBUTOS DE TEXTURA EM IMAGENS DE SENSORIAMENTO REMOTO GUSTAVO TADEU ZANIBONI 1 LUCIANO VIEIRA DUTRA 1 1 INPE - Instituto
Implementação dos Algoritmos e Resultados
Capítulo 6 Implementação dos Algoritmos e Resultados 6.1 Considerações Iniciais Diversas situações foram exploradas neste trabalho visando analisar qual seria a wavelet mais adequada para sistemas de extração