Roberto Pereira Cavalcante. Filtragem Colaborativa aplicada a Publicidade Direcionada. Dissertação de Mestrado

Documentos relacionados
Bruno de Figueiredo Melo e Souza. Modelos de fatoração matricial para recomendação de vídeos. Dissertação de Mestrado

Estudo Comparativo de Estratégias de Classificação de Páginas Web

Francisco Benjamim Filho. XHITS: Estendendo o Algoritmo HITS para Extração de Tópicos na WWW DISSERTAÇÃO DE MESTRADO

SQLLOMining: Obtenção de Objetos de Aprendizagem utilizando técnicas de Aprendizado de Máquina

Bruno Loureiro Rezende. Um Framework para a Automação de Testes com Linguagens de Especificação Configuráveis DISSERTAÇÃO DE MESTRADO

Mineração de Dados voltada para Recomendação no Âmbito de Marketing de Relacionamento

Iam Vita Jabour. O Impacto de Atributos Estruturais na Identificação de Tabelas e Listas em Documentos HTML. Dissertação de Mestrado

Sistema de recomendação de segundo nível para suporte à produção de matérias jornalísticas

Geraldo da Silva Rocha Netto. Escalonamento Flexível de Workflows com Restrições Temporais. Dissertação de Mestrado

IPOs no Novo Mercado: Estratégias de Capitalização ou de Saída?

Pontifícia Universidade Católica do Rio de Janeiro

Pedro Tiago Barbosa do Couto. Resolução de problemas de transporte rodoviário de cargas utilizando programação inteira DISSERTAÇÃO DE MESTRADO

Entropia de Rényi e Informação Mútua de Cauchy-Schwartz Aplicadas ao Algoritmo de Seleção de Variáveis MIFS-U: Um Estudo Comparativo

Mauricio Kreczmarsky Guimarães Meinicke. Opacidade 3D na Visualização Volumétrica de Dados Sísmicos

Isabela Yumi Ribeiro Kitajima. A influência das gerações na formação da preferência musical Um estudo aplicado à música popular

Um Estudo Sobre Middlewares Adaptáveis

Sistema para Consultas sobre Banco de Dados Relacional Baseado em Palavras-Chave

Rogério José Ramos de Oliveira Magalhães

João Paulo de Freitas Araujo. Algoritmos para acelerar a computação de Árvores de corte de Gomory e Hu. Dissertação de Mestrado

Marketing de Relacionamento: Cross-selling na Telefonia Móvel

Avaliação Probabilística de Reservas de Óleo e Gás Considerando o Efeito da Variação do Preço do Óleo

Utilização de uma estratégia para identificação de fontes de informação na fase de elicitação

Gustavo Simão Rodrigues

Avaliação da Licitação de Lotes de Frequência para LTE Utilizando a Teoria de Opções Reais

Bruno Siqueira Silva. Workflows dinâmicos em gerência de projetos ágeis. Dissertação de Mestrado

Controle da Execução e Disponibilização de Dados para Aplicativos sobre Seqüências Biológicas: o Caso BLAST

Análise e Avaliação do Equity Premium Puzzle no Mercado Acionário Brasileiro sob diferentes Contextos Econômicos

Análise Probabilística de Semântica Latente aplicada a sistemas de recomendação

Uma abordagem baseada em SPH para animação interativa de águas rasas em jogos

Gerenciamento de projetos no âmbito da Economia Criativa Um estudo de caso das Incubadoras Rio Criativo

Elicitação de requisitos de software através da utilização de questionários

Experimentos de Previsão da Estrutura a Termo da Taxa de Juros Americana: Reversão à Media, Inércia e Influência de Variáveis Macroeconômicas

Geração semi-automática de massas de testes funcionais a partir da composição de casos de uso e tabelas de decisão

Rodrigo Pereira David. Técnica de Estimação de Canal Utilizando Símbolos Pilotos em Sistemas OFDM. Dissertação de Mestrado

Gerenciando Conflitos em Reuniões: Uma Estratégia para a Elicitação de Requisitos de Software

Considerações sobre o Afeto em Psicanálise

Aprendizado de Máquina para o Problema de Sentiment Classification

Liquidez e Formação de Preço: Evidência do mercado acionário brasileiro

Relação entre Governança Corporativa e Remuneração de Executivos no Brasil

Felipe Garcez. Vinho Em Restaurantes: Análise dos Fatores Que Inibem Seu Consumo. Dissertação de Mestrado

QEEF-G: Execução Paralela Adaptativa de Consultas Iterativas

Natália Moreira Félix

Francisco Eduardo Torres Cursino de Moura. Uma proposta para Rendering Baseado em Imagens em celulares

Avaliação Preliminar dos Movimentos Aéreos no Aeroporto Internacional Antônio Carlos Jobim Galeão

Gerenciamento Integrado de Riscos de Projetos

Otávio de Pinho Forin Braga. Uma Arquitetura para Síntese de Imagens Fotorrealistas baseada em Técnicas de Monte Carlo DISSERTAÇÃO DE MESTRADO

4 LearnAds: um Framework de Recomendação de Anúncios

A estética como nova forma de conhecimento em Nietzsche

Mercados Futuros Agropecuários no Brasil: Análise dos Contratos e da Formação dos Preços Futuros

Atos de fala, atos falhos: uma aproximação entre as teorias linguísticas de Austin e de Wittgenstein e a psicanálise de Freud e Lacan

Ricardo Fukasawa. Resolução de problemas de logística ferroviária utilizando programação inteira DISSERTAÇÃO DE MESTRADO

Guilherme de Sousa Neves. Previsão de estoque de peças eletrônicas sobressalentes. Dissertação de Mestrado

Adriano Francisco Branco. Um modelo de programação para RSSF com. Dissertação de Mestrado

Renata Thomaz Lins do Nascimento. Visualização por Imagens Auto-animadas de Campos Vetoriais Baseada na sua Topologia. Dissertação de Mestrado

UMA IMPLEMENTAÇÃO DO SERVIÇO WMS SOBRE A BIBLIOTECA TERRALIB

Governança Corporativa: Análise da composição do Conselho de Administração no Setor de Energia Elétrica do Brasil

Integração de Ontologia com Modelagem de Processo: Um Método para Facilitar a Elicitação de Requisitos

Gheisa Roberta Telles Esteves. Modelos de Previsão de Carga de Curto Prazo. Dissertação de Mestrado

Alberto Santos Junqueira de Oliveira. Essa vez que não chega: fila e drama social no Brasil. Dissertação de Mestrado

O Efeito Coorte e o Desenvolvimento das Preferências por Moda Feminina

Compras de itens não críticos: implementação no nível operacional e práticas em uma empresa de petróleo

A competência comunicativa nas provas de redação do Deutsches Sprachdiplom e do Exame Nacional do Ensino Médio

Gabriela Fagundes Dunhofer. A Origem da Obra de Arte. Heidegger e a crítica da representação. Dissertação de Mestrado

O Efeito de Preços de Commodities sobre a Taxa de Câmbio Real para Países Exportadores de Commodities: Uma Análise Empírica

Matchmaking Uma infraestrutura para alinhamento de esquemas

Crime e Poupança: Teoria e Evidências para o Brasil

Criação Automática de Visões Materializadas em SGBDs Relacionais

Proposta de um sistema de suporte à decisão para programação de navios baseado em otimização: um caso prático

Juros Altos no Brasil: uma Abordagem Teórica

Daniel Ferreira Lima. de Bancos Oficiais: Impactos sobre a Competitividade no Mercado de Crédito Brasileiro DISSERTAÇÃO DE MESTRADO

Política Monetária e Investimento no Brasil

Capital Requerido via Simulação Estocástica aplicado ao Seguro de Vida e Fundo de Pensão

Fusões e Aquisições - Geração de valor no Brasil: Um estudo de evento com base no período de 2003 a 2011

A importância da dívida cambial no endividamento público brasileiro

Uma Proposta de Sistema de Dependência a Distância Usando a Plataforma Moodle

Marcos Borges Pessoa. Geração e execução automática de scripts de teste para aplicações web a partir de casos de uso direcionados por comportamento

Coordenação entre pequenos fundos de investimento em um mercado relativamente ilíquido: efeitos sobre volume e preços

Apreçamento de Opções Reais com Dividendos Fixos

Remo Mannarino Filho. O método das divisões: a última proposta dialética de Platão. Dissertação de mestrado

Estudo de Viabilidade da Implementação de Software de Roteamento para Transporte de Funcionários de Refinaria da Petrobras

Thatty de Aguiar Castello Branco. O Maravilhoso e o Fantástico na Literatura Infantil de Monteiro Lobato. Dissertação de Mestrado

Influência de Avaliações Online Negativas na Atitude e na Intenção de Compra

Um ambiente de suporte para uma linguagem de modelagem de sistemas multi-agentes

Análise das Estratégias Competitivas na Indústria Automobilística

Laura Gonçalves Carvalho

Mariana Figueiredo de Castro Pereira

Carlos Roberto da Costa Ferreira. Interpolação Modificada de LSF's. Dissertação de Mestrado

UM ESTUDO SOBRE OS VALORES NO CONSUMO DE PRODUTOS DE BELEZA POR MULHERES DE BAIXA RENDA

Controle Preditivo com Aprendizado por Reforço para Produção de Óleo em Poços Inteligentes

Previsão da Produção Industrial do Brasil: Uma Aplicação do Modelo de Índice de Difusão Linear

Jessica Quintanilha Kubrusly. Métodos Estatísticos para Cálculo de Reservas DEPARTAMENTO DE MATEMÁTICA

Uma meta-ferramenta de geração de diagramas utilizada na engenharia reversa de sistemas legados.

Memes: Conceito de Conteúdo de Informação Como Alternativa de Pesquisa de Posicionamento de Marca

Aposentadoria e o Trade-off entre Renda e Lazer: Implicações para o Valor do Capital Humano de Funcionários Públicos

Aplicação de Opções Reais ao Setor de Circuitos Integrados

Um modelo para cobertura de notícias na Web

Thomas de Campos Tsuchida. Modelagem da localização de pólos de venda de derivados de petróleo. Dissertação de Mestrado (Opção Profissional)

Adriano Medeiros dos Santos. Suporte a Componentes Compostos Para o Middleware SCS. Dissertação de Mestrado

Transcrição:

Roberto Pereira Cavalcante Filtragem Colaborativa aplicada a Publicidade Direcionada Dissertação de Mestrado Dissertação apresentada ao Programa de Pós- Graduação em Informática da PUC-Rio como requisito parcial para obtenção do título de Mestre em Informática. Orientador: Prof. Ruy Luiz Milidiú Rio de Janeiro Abril de 2008

Roberto Pereira Cavalcante Filtragem Colaborativa aplicada a Publicidade Direcionada Dissertação apresentada como requisito parcial para obtenção do título de Mestre pelo Programa de Pós- Graduação em Informática da PUC-Rio. Aprovada pela Comissão Examinadora abaixo assinada. Prof. Ruy Luiz Milidiú Orientador Departamento de Informática PUC-Rio Prof. Daniel Schwabe Departamento de Informática PUC-Rio Prof. Marcus Vinicius Soledade Poggi de Aragão Departamento de Informática PUC-Rio Prof. José Eugenio Leal Coordenador Setorial do Centro Técnico Científico PUC-Rio Rio de Janeiro, 3 de abril de 2008

Todos os direitos reservados. É proibida a reprodução total ou parcial do trabalho sem autorização da universidade, do autor e do orientador. Roberto Pereira Cavalcante Recebeu seu título de Bacharel em Informática pela Pontifícia Universidade Católica do Rio de Janeiro (PUC-Rio) em 2006. Sua experiência acadêmica inclui atuação como monitor na disciplina de Projeto e Análise de Algoritmos. Desde 2004, realiza atividades relacionadas com pesquisa e desenvolvimento no LEARN (Laboratório de Engenharia de Algoritmos e Redes Neurais) da PUC-Rio. Cavalcante, Roberto Pereira Ficha Catalográfica Filtragem Colaborativa aplicada a Publicidade Direcionada / Roberto Pereira Cavalcante; orientador: Ruy Luiz Milidiú. Rio de Janeiro: PUC, Departamento de Informática, 2008. 62 f. : il. (col.) ; 29,7 cm 1. Dissertação (mestrado) Pontifícia Universidade Católica do Rio de Janeiro, Departamento de Informática. Inclui referências bibliográficas. 1. Informática Teses. 2. Filtragem Colaborativa. 3. Aprendizado de Máquina. 4. Publicidade Direcionada. 5. World Wide Web. I. Milidiú, Ruy Luiz. II. Pontifícia Universidade Católica do Rio de Janeiro. Departamento de Informática. III. Título. CDD: 004

Aos meus pais e a Ana Carolina.

Agradecimentos Em primeiro lugar, agradeço aos meus pais, Raimundo (in memoriam) e Luzia, pela constante dedicação, incentivo e apoio em todas as áreas de minha vida. Devo a eles tudo o que sou e o pouco que sei. À minha namorada, Ana Carolina, por ser a pessoa mais especial que já participou da minha vida, pelo amor e carinho que ela me dedica a cada dia, e pela paciência e compreensão com minha ausência durante a produção deste trabalho. E como se não bastasse tudo isso, também pelo grande apoio emocional durante a confecção e pela ajuda na revisão deste texto. Ao meu orientador, Prof. Ruy Luiz Milidiú, por não apenas exercer tão bem o papel de orientador acadêmico, mas também ocupar o papel de grande conselheiro de minha vida profissional, e pela amizade construída ao longo desses três anos e meio de convivência. Aos Profs. Daniel Schwabe e Marcus Poggi de Aragão, por aceitarem o convite para participar da banca examinadora deste trabalho. Aos antigos e atuais colegas do LEARN, por criarem um excelente ambiente de trabalho, permeado de problemas interessantes e discussões inteligentes: Alberto Sardinha, Patrick, Marco (Caveira), Pedro, Fred Liporace, Raúl, Cícero, Julio,

Fred Pessoa (Frodo), Fred Barros, Críston, Tulio, Diogo, Leonardo, Prof. Laber, Eduardo e Caio. Aos professores e funcionários do Departamento de Informática, por comporem essa instituição de ensino de excelência acadêmica, onde pude crescer tanto pessoal e profissionalmente. Aos amigos, por contribuírem para que esses dois anos fossem um pouco menos estressantes. Cito aqui alguns deles, sob o risco de deixar alguém injustamente fora da lista: Saymon, Adem, Vitor, Andrew, Bruno, Estela, Tati, Roberta, Fábio, Daniel Fleischman e Daniel Rocha. Ao CNPq e à FAPERJ, pelo apoio financeiro durante o mestrado, sem o qual a conclusão deste trabalho seria inviável. A todos vocês, muito obrigado!

Resumo Cavalcante, Roberto Pereira; Milidiú, Ruy Luiz. Filtragem Colaborativa aplicada a Publicidade Direcionada. Rio de Janeiro, 2008. 62p. Dissertação de Mestrado - Departamento de Informática, Pontifícia Universidade Católica do Rio de Janeiro. O surgimento da World Wide Web representou uma nova oportunidade de publicidade, disponível para qualquer empresa: a possibilidade de exposição global para uma grande audiência a um custo extremamente pequeno. Como conseqüência disso, surgiu toda uma nova indústria oferecendo serviços relacionados à publicidade de busca, na qual uma empresa anunciante paga por uma posição de destaque em listas de anúncios. A fim de manter a credibilidade e a participação de mercado do serviço que os veicula por exemplo, uma máquina de busca, os anúncios devem ser exibidos apenas para os usuários que se interessem por eles, no que se chama de Publicidade Direcionada. Em virtude disso, surge a necessidade de se utilizar um sistema de recomendação que seja capaz de escolher que anúncios exibir para quais usuários. Nos sistemas de recomendação baseados em filtragem colaborativa, as preferências de outros usuários são utilizadas como atributos para um sistema de aprendizado, pois estas podem ser bastante detalhadas, gerando recomendações não só para os itens mais populares como também para nichos de itens. Neste trabalho, é desenvolvido um sistema de recomendação de anúncios que aplica Filtragem Colaborativa baseada em fatoração de matrizes ao problema de predição do Click-Through Rate, uma métrica em Publicidade Direcionada que expressa a relevância de um anúncio para os usuários que buscam por uma determinada palavra-chave. A fim de validar o método proposto de predição do Click-Through Rate, realizamos vários experimentos em um conjunto de dados sintéticos. Adicionalmente, o trabalho contribui para o projeto do LearnAds, um framework de recomendação de anúncios baseado em Aprendizado de Máquina. Palavras-chave Filtragem Colaborativa, Aprendizado de Máquina, Publicidade Direcionada, World Wide Web

Abstract Cavalcante, Roberto Pereira; Milidiú, Ruy Luiz (Advisor). Collaborative Filtering applied to Targeted Advertising. Rio de Janeiro, 2008. 62p. MSc. Dissertation - Departamento de Informática, Pontifícia Universidade Católica do Rio de Janeiro. The emergence of the World Wide Web represented a new advertising opportunity available to any company: the possibility of global exposure to a large audience at a very small cost. As a result, a whole new industry has emerged by offering services related to search advertising, in which an advertiser pays for a prominent position in lists of ads. In order to maintain the credibility and market share of the service that conveys them for example, a search engine, such ads must be displayed only to users who are interested in them, on what is called Targeted Advertising. Therefore, those services need to use a recommendation system that can choose which ads show to which users. Recommendation systems based on collaborative filtering use the preferences of other users as features to a learning system, since such preferences can be quite detailed, generating recommendations not only for the most popular items but also to item niches. In this work, we develop an ads recommendation system that applies Collaborative Filtering based on matrix factorization to the problem of predicting the Click-Through Rate, a Targeted Advertising metric that expresses the relevance of a particular ad for the users searching for a specific keyword. In order to validate the proposed method of Click-Through Rate prediction, we carry out several experiments on a synthetic data set. Additionally, the work contributes to the design of LearnAds, a framework for ads recommendation systems based on Machine Learning. Keywords Wide Web Collaborative Filtering, Machine Learning, Targeted Advertising, World

Sumário 1 Introdução 11 1.1. Motivação 11 1.2. Trabalhos Relacionados 14 1.3. Objetivo 19 1.4. Organização do Trabalho 20 2 Desenvolvimento da Publicidade de Busca 21 2.1. Leilão de Primeiro Preço Generalizado 21 2.2. Leilão de Segundo Preço Generalizado e o Click-Through Rate 24 3 Sistemas de Recomendação baseados em Filtragem Colaborativa 28 3.1. Recomendação Colaborativa para Predição do CTR 31 3.2. Fatoração de Matrizes 33 4 LearnAds: um Framework de Recomendação de Anúncios 36 4.1. Requisitos Funcionais 36 4.2. Casos de Uso 38 4.3. Diagramas de Seqüência 40 4.4. Diagramas de Classes 44 4.4.1. Camada de Modelo 44 4.4.2. Camada de Controle 46 5 Experimentos 48 5.1. Conjunto de Dados 48 5.2. Metodologia e Métricas de Avaliação 51 5.3. Resultados 53 6 Considerações Finais 57 6.1. Contribuições 57 6.2. Trabalhos Futuros 58

7 Referências Bibliográficas 59