Improved Approximations for the k-hotlink Assignment Problem and for Binary Searching in Trees

Documentos relacionados
Estudo Comparativo de Estratégias de Classificação de Páginas Web

Collusion in Auctions on the Absence of Public Information

Iam Vita Jabour. O Impacto de Atributos Estruturais na Identificação de Tabelas e Listas em Documentos HTML. Dissertação de Mestrado

Measurable Cardinals and Relative Consistency Proofs in Set Theory

Pedro Paiva Zühlke d Oliveira

Gerenciando Conflitos em Reuniões: Uma Estratégia para a Elicitação de Requisitos de Software

João Paulo de Freitas Araujo. Algoritmos para acelerar a computação de Árvores de corte de Gomory e Hu. Dissertação de Mestrado

Ricardo Fukasawa. Resolução de problemas de logística ferroviária utilizando programação inteira DISSERTAÇÃO DE MESTRADO

Elicitação de requisitos de software através da utilização de questionários

Um Estudo Sobre Middlewares Adaptáveis

Controle da Execução e Disponibilização de Dados para Aplicativos sobre Seqüências Biológicas: o Caso BLAST

Francisco Benjamim Filho. XHITS: Estendendo o Algoritmo HITS para Extração de Tópicos na WWW DISSERTAÇÃO DE MESTRADO

Bruno Loureiro Rezende. Um Framework para a Automação de Testes com Linguagens de Especificação Configuráveis DISSERTAÇÃO DE MESTRADO

QEEF-G: Execução Paralela Adaptativa de Consultas Iterativas

Pedro Tiago Barbosa do Couto. Resolução de problemas de transporte rodoviário de cargas utilizando programação inteira DISSERTAÇÃO DE MESTRADO

Sistema de recomendação de segundo nível para suporte à produção de matérias jornalísticas

Aprendizado de Máquina para o Problema de Sentiment Classification

Stochastic Programming with Endogenous Uncertainty: An Application in Humanitarian Logistics

SQLLOMining: Obtenção de Objetos de Aprendizagem utilizando técnicas de Aprendizado de Máquina

Eveline Russo Sacramento. An Approach for Dealing with Inconsistencies in Data Mashups CTC TESE DE DOUTORADO. Programa de Pós-Graduação em Informática

Baaba Abassawah Ghansah. Population Dynamics. Dissertação de Mestrado

Victor Kraemer Wermelinger Sancho Araujo. Avaliação de custos para a produção de biodiesel a partir de óleos residuais fritura

Fabio Mascarenhas de Queiroz. Optimized Compilation of a Dynamic Language to a Managed Runtime Environment TESE DE DOUTORADO

Aplicação da Análise de Sistemas à Definição de Processos de Desenvolvimento de Software

Luzia da Costa Tonon. O Teorema de Cramér-Lundberg via martingais DISSERTAÇÃO DE MESTRADO. Programa de Pós Graduação em Matemática

Sistema para Consultas sobre Banco de Dados Relacional Baseado em Palavras-Chave

Bruno de Figueiredo Melo e Souza. Modelos de fatoração matricial para recomendação de vídeos. Dissertação de Mestrado

Consideração Conjunta da Atenuação por Chuvas e de Interferências Externas na Estimação dos Parâmetros de Desempenho de Enlaces Digitais Terrestres

On the Permutation Flow Shop Scheduling Problem

Fusões e Aquisições - Geração de valor no Brasil: Um estudo de evento com base no período de 2003 a 2011

Geração semi-automática de massas de testes funcionais a partir da composição de casos de uso e tabelas de decisão

Patrícia Helena G. Seize

Relação entre Governança Corporativa e Remuneração de Executivos no Brasil

Gerenciamento de projetos no âmbito da Economia Criativa Um estudo de caso das Incubadoras Rio Criativo

O CONSUMO DAS FAMÍLIAS DE BAIXA RENDA DA REGIÃO METROPOLITANA DE RECIFE: PADRÕES E EVOLUÇÃO DE 2002 A 2009

Uma Aplicação de Algoritmos de Colônias de Formigas em Problemas de Roteirização de Veículos com Janelas de Tempo

Criação Automática de Visões Materializadas em SGBDs Relacionais

Mapeamento Automático de Horizontes e Falhas em Dados Sísmicos 3D baseado no algoritmo de Gás Neural Evolutivo

Marlene Isabel Silva Marchena. Measuring and Implementing the Bullwhip Effect in Supply Chains. Tese de Doutorado

Rodrigo Rodrigues Adão. Household Income and Strategic Default Decision in the Subprime Crisis. Dissertação de Mestrado

Marcos José Gomes Cristovão

Análise da satisfação dos clientes de serviços de cabotagem no Brasil: Um estudo de caso

Mineração de Dados voltada para Recomendação no Âmbito de Marketing de Relacionamento

Otávio de Pinho Forin Braga. Uma Arquitetura para Síntese de Imagens Fotorrealistas baseada em Técnicas de Monte Carlo DISSERTAÇÃO DE MESTRADO

Atos de fala, atos falhos: uma aproximação entre as teorias linguísticas de Austin e de Wittgenstein e a psicanálise de Freud e Lacan

An Environment for Integrating Bibliographical Data based on Mediators

Uma Proposta de Sistema de Dependência a Distância Usando a Plataforma Moodle

Modelagem em Experimentos Mistura-Processo para Otimização de Processos Industriais

Influência de Avaliações Online Negativas na Atitude e na Intenção de Compra

Artur Manoel Passos. Essays in Portfolio Management and Stocks Return Forecasting. M.A. Dissertation

Uma Trajetória do Pensamento Clássico às Questões Contemporâneas

Cálculo de seqüentes de sucedente múltiplo para lógica intuicionista de primeira ordem

Avaliação Preliminar dos Movimentos Aéreos no Aeroporto Internacional Antônio Carlos Jobim Galeão

A Relação Entre Risco Idiossincrático e Retorno no Mercado Acionário Brasileiro

Favoritism and Informational Effects in Public Procurement Auctions

Davi Romero de Vasconcelos. Análise de Estratégias Utilizando Verificação Formal de Modelos. Dissertação de Mestrado

Utilização de uma estratégia para identificação de fontes de informação na fase de elicitação

Marcelo de Mattos Bezerra. Interações no Ensino e na Prática do Design e da Arquitetura. Dissertação de Mestrado

Variação semântica nas construções adverbiais temporais introduzidas por quando na língua portuguesa

Guilherme Frederico Lima de Carvalho e Silva

As provas da existência de Deus nas Meditações Metafísicas de René Descartes

Carlos Roberto da Costa Ferreira. Interpolação Modificada de LSF's. Dissertação de Mestrado

Um Modelo Integrado para o Projeto de Redes Logísticas com Decisões de Localização de Instalações, Produção, Transporte e Estoques.

DISSERTAÇÃO DE MESTRADO

Heidegger e a relação homem-técnica-natureza na crise ambiental contemporânea

Renata Moraes Machado. Ratings Soberanos do Brasil: um estudo sobre os impactos de suas mudanças sobre o spread do c-bond

Análise do Perfil do Investidor: Desenvolvimento e Validação de Questionário Padrão

Finanças Comportamentais: Um estudo empírico sobre o mercado acionário brasileiro

Análise e Avaliação do Equity Premium Puzzle no Mercado Acionário Brasileiro sob diferentes Contextos Econômicos

Nathalia Sisson. Psicanálise em ação: a relação entre técnica e teoria na fabricação da Psicanálise. Dissertação de Mestrado

Tatiana Waintraub. Modelagem da calçada de Copacabana. Dissertação de Mestrado

Renata Thomaz Lins do Nascimento. Visualização por Imagens Auto-animadas de Campos Vetoriais Baseada na sua Topologia. Dissertação de Mestrado

Carolina Bertassoni dos Santos. Natalidade e Política: Hannah Arendt leitora de Agostinho. Dissertação de Mestrado

Bruno Siqueira Silva. Workflows dinâmicos em gerência de projetos ágeis. Dissertação de Mestrado

Geraldo da Silva Rocha Netto. Escalonamento Flexível de Workflows com Restrições Temporais. Dissertação de Mestrado

Lourival Vieira Neto. Lunatik: Scripting de Kernel de Sistema Operacional com Lua. Dissertação de Mestrado

Marcos Borges Pessoa. Geração e execução automática de scripts de teste para aplicações web a partir de casos de uso direcionados por comportamento

Ivan Luiz Gonçalves Pinto. O Progresso da Ciência e o Anarquismo Epistemológico de Karl Paul Feyerabend

Modelagem de restrições de esquemas mediados

Capital Requerido via Simulação Estocástica aplicado ao Seguro de Vida e Fundo de Pensão

Estudo de Viabilidade da Implementação de Software de Roteamento para Transporte de Funcionários de Refinaria da Petrobras

Trigonometria: Fórmulas de Adição e Subtração de Arcos

Carlos Raoni de Alencar Mendes. Códigos de Cobertura: Limites e Heurísticas. Dissertação de Mestrado

Bernardo de Mendonça G. Ferreira. Valoração de uma opção sobre um contrato futuro. Dissertação de Mestrado

Os desafios de interface e de interação na computação ciente de contexto

A Individuação Como Fenômeno Estético: Arte, Corpo e Linguagem no Jovem Nietzsche

O Planejamento e Controle de Produção para uma Fábrica de Vacinas.

Bases do Comprometimento da Geração Y em uma Empresa Pública: um estudo de caso

Bianca Novaes de Mello. As Teorias da Linguagem em Lacan. Tese de Doutorado

Marketing de Relacionamento: Cross-selling na Telefonia Móvel

Integração de Ontologia com Modelagem de Processo: Um Método para Facilitar a Elicitação de Requisitos

Roberto Pereira Cavalcante. Filtragem Colaborativa aplicada a Publicidade Direcionada. Dissertação de Mestrado

Dárlinton Barbosa Feres Carvalho. Um Framework para Construção de Vocabulário e sua Aplicação ao Problema de Seqüenciamento de Carros

APLICAÇÃO DE CONCEITOS DE ENGENHARIA DE FATORES HUMANOS: UM ESTUDO DE CASO EM UMA EMPRESA DE OPERAÇÕES LOGÍSTICAS

Uma Análise de Cenário Legislativo e Operacional dos Operadores de Transporte Multimodal (OTM) no Brasil

Andre Luis Ferreira da Silva. Estabilidade dos Betas de Ações no Mercado Brasileiro: Uma Avaliação em Períodos de Alta Volatilidade

Pontifícia Universidade Católica do Rio de Janeiro

Rogério José Ramos de Oliveira Magalhães

Algoritmos Primais e Duais para o Problema das p-medianas

Transcrição:

Marco Serpa Molinaro Improved Approximations for the k-hotlink Assignment Problem and for Binary Searching in Trees MsC Thesis Thesis presented to the Post graduate Program in Computer Science of the Computer Science Department, PUC Rio as partial fulfillment of the requirements for the degree of Master in Computer Science Adviser: Prof. Eduardo Sany Laber Rio de Janeiro April 2008

Marco Serpa Molinaro Improved Approximations for the k-hotlink Assignment Problem and for Binary Searching in Trees Thesis presented to the Post graduate Program in Computer Science of the Computer Science Department, PUC Rio as partial fulfillment of the requirements for the degree of Master in Computer Science. Approved by the following commission: Prof. Eduardo Sany Laber Adviser Department of Computer Science PUC Rio Prof. Marcus Poggi de Aragão Departamento de Informática PUC-RIO Prof. Valmir Carneiro Barbosa COPPE UFRJ Prof. Jayme Luiz Szwarcfiter COPPE UFRJ Prof. José Eugenio Leal Head of the Science and Engineering Center PUC Rio Rio de Janeiro April 28, 2008

Todos os direitos reservados. É proibida a reprodução total ou parcial do trabalho sem autorização da universidade, do autor e do orientador. Marco Serpa Molinaro Marco Molinaro graduated from Pontifícia Universidade Católica do Rio de Janeiro in Computer Engineering. During his undergraduate years, he participated in multiple research projects funded by CNPq. For the duration of his Masters, he was supported by an academic scholarship and performed theoretical research focusing on approximation algorithms. Ficha Catalográfica Molinaro, Marco Serpa Improved approximations for the k-hotlink Assignment Problem and for binary searching in trees / Marco Serpa Molinaro; adviser: Eduardo Sany Laber. - 2008. 89 f. : il. (col.) ; 30 cm Dissertação (Mestrado em Informática)-Pontifícia Universidade Católica do Rio de Janeiro, Rio de Janeiro, 2008. Inclui bibliografia. 1. Informática Teses. 2. Algoritmos aproximativos. 3. Hotlinks. 4. Busca. 5. Árvores. I Laber, Eduardo Sany. II. Pontifícia Universidade Católica do Rio de Janeiro. Departamento de Informática.. Título. CDD: 004

Acknowledgments To my adviser Professor Eduardo Laber, for his patience and dedication during this time. He has been an amazing source of inspiration, technical knowledge and encouragement. To my family, for giving me the freedom to pursue the professional track I wanted. To my colleagues at PUC Rio, for both stimulating conversations about various scientific topics and for their soothing words during hard times. To professors José Correa and Marcos Kiwi for invaluable discussions on the problems presented in this thesis. To my professors at PUC Rio, in particular to Marcus Poggi and Ruy Milidiú, for their constant guidance and support since my undergraduate days. To CNPq, CAPES and PUC Rio, for the financial support.

Abstract Molinaro, Marco Serpa; Laber, Eduardo Sany. Improved Approximations for the k-hotlink Assignment Problem and for Binary Searching in Trees. Rio de Janeiro, 2008. 89p. MsC Thesis Department of Computer Science, Pontifícia Universidade Católica do Rio de Janeiro. Here we present a study on two optimization problems in trees: the k- Hotlink Assignment Problem and the problem of Binary Searching in Trees. As a result, we obtain improved approximation algorithms for both problem. The k-hotlink Assignment Problem can be defined as follows. Let G = (V,E) be a directed acyclic graph representing a web site, where nodes correspond to pages and arcs to hyperlinks. In this context, hotlinks are defined as shortcuts (new arcs) added to web pages of G in order to reduce the time spent by users to reach their desired information. Here we consider the problem where G is a rooted directed tree and the goal is minimizing the expected time spent by users by assigning at most k hotlinks to each node. For the most studied version of this problem where at most one hotlink can be assigned from each node, we prove the existence of an FPTAS, improving upon the constant factor algorithm recently obtained in [Jacobs, WADS 2007]. In addition, we develop the first constant factor approximation algorithm for the most general version where k hotlinks can be assigned from each node. In the second part of this work, we consider the problem of computing efficient strategies for searching in trees. As a generalization of the classical binary search for ordered lists, suppose one wishes to find a (unknown) specific node of a tree by asking queries to its arcs, where each query indicates the endpoint closer to the desired node. Given the likelihood of each node being the one searched, the objective is to compute a search strategy that minimizes the expected number of queries. Practical applications of this problem include file system synchronization and software testing. Here we present a linear time algorithm which is the first constant factor approximation for this problem. This represents a significant improvement over previous O(log n)-approximation. Keywords Approximation Algorithms. Hotlinks. Search. Trees.

Resumo Molinaro, Marco Serpa; Laber, Eduardo Sany. Improved Approximations for the k-hotlink Assignment Problem and for Binary Searching in Trees. Rio de Janeiro, 2008. 89p. Dissertação de Mestrado Departamento de Informática, Pontifícia Universidade Católica do Rio de Janeiro. Esta tese apresenta um estudo sobre dois problemas de otimização em árvores: o k-hotlink Assignment Problem e o problema de busca binária em árvores. Como resultado, obtemos algoritmos aproximativos melhorados para ambos os problemas. O k-hotlink Assignment Problem pode ser definido da seguinte maneira. Seja G = (V,E) um dígrafo acíclico representando um web site, onde nós correspondem a páginas e arcos correspondem a hyperlinks. Nesse contexto, hotlinks são definidos como atalhos (novos arcos) adicionados a páginas em G de modo a encurtar o tempo gasto por usuários para alcançar as informações desejadas. Aqui consideramos o problema onde G é uma árvore enraizada e o objetivo é minimizar o tempo médio gasto por usuários adicionando no máximo k hotlinks a cada nó. Para a versão mais estudada desse problema onde no máximo um hotlink pode ser atribuído a cada nó, nós provamos a existência de um FPTAS, uma melhora sobre a aproximação de fator constante obtida recentemente em [Jacobs, WADS 2007]. Além disso, desenvolvemos a primeira aproximação de fator constante para a versão mais geral onde k hotlniks podem ser atribuídos a cada nó. Na segunda parte deste trabalho, consideramos o problema de computar eficientemente estratégias para buscar em árvores. Como uma generalização da clássica busca binária em listas ordenadas, suponha que deseja-se encontrar um nó específico (e desconhecido) de uma árvore através de consultas a seus arcos, onde cada consulta indica qual extremidade do arco está mais próxima ao nó desejado. Dada a probabilidade de cada nó ser aquele procurado, o objetivo é encontrar uma estratégia que minimize o número esperado de consultas. Aplicações práticas desse problema incluem sincronização de sistemas de arquivo e criação de testes de software. Apresentamos um algoritmo que executa em tempo linear e que provê a primeira aproximação de fator constante para esse problema. Esse resultado representa uma significante melhora sobre a O(log n)-aproximação conhecida anteriormente. Palavras chave Algoritmos Aproximativos. Hotlinks. Busca. Árvores.

Contents I k-hotlink Assignment Problem 9 1 Introduction 10 2 Preliminaries 15 3 An Exact Exponential Algorithm for the 1-Hotlink Assignment Problem 18 3.1 Solving 1-HAPG 20 4 An FPTAS for the 1-Hotlink Assignment Problem 24 4.1 Proof of Theorem 2 26 5 Constant Factor Approximation for the k-hotlink Assignment Problem 37 5.1 Upper Bound 38 5.2 Entropy Lower Bound 39 5.3 Alternative Lower Lound 42 5.4 Approximation Guarantee 45 II Binary Searching in Trees 47 6 Introduction 48 7 Preliminaries 51 8 Algorithm for Binary Searching in Trees 54 8.1 Upper Bound 56 8.2 Entropy Lower Bound 58 8.3 Alternative Lower Bounds 59 8.4 Approximation Guarantee 60 8.5 Efficient Implementation 61 Bibliography 64 A Hotlink Assignment Problem 68 A.1 Preliminary lemmas 68 A.2 Proofs of lemmas used in Theorem 1 72 A.3 Proof of Lemma 4 76 A.4 Constant factor approximation for the k-hotlink Assignment Problem 78 Solving k-hap with internal weights 78

Approximate no-leaf assignment 78 Algorithm for k-hap with internal weights 82 Proof of Lemma 10 83 B Binary Searching in Trees 85 B.1 Searching in path-like trees 85 B.2 Proofs of lemmas 86 Contents