Implementação de um Content Router semântico para eliminação de tráfego redundante



Documentos relacionados
ARTHUR HENRIQUE COUTINHO UM CONTENT ROUTER SEMÂNTICO PARA ELIMINAÇÃO DE TRÁFEGO REDUNDANTE

1 INTRODUÇÃO Internet Engineering Task Force (IETF) Mobile IP

ADDRESS RESOLUTION PROTOCOL. Thiago de Almeida Correia

Roteamento e Comutação

1º Seminário de Software Livre Tchelinux Software Livre: leve adiante esta idéia. Soluções de Web Caching e Web Acceleration

Centro Tecnológico de Eletroeletrônica César Rodrigues. Atividade Avaliativa

Rede de Computadores II

Serviço de datagrama não confiável Endereçamento hierárquico. Facilidade de fragmentação e remontagem de pacotes

Prof. Samuel Henrique Bucke Brito

Redes de Computadores II INF-3A

Sistemas Distribuídos

Segurança em Sistemas de Informação. Agenda. Conceitos Iniciais

Funcionalidade Escalabilidade Adaptabilidade Gerenciabilidade

PROJETO DE REDES

Protocolo de comunicação para redes móveis aplicado ao trânsito

Sistemas Operacionais Gerência de Dispositivos

Tecnologia da Informação e Comunicação. Euber Chaia Cotta e Silva

Márcio Leandro Moraes Rodrigues. Frame Relay

Intranets. FERNANDO ALBUQUERQUE Departamento de Ciência da Computação Universidade de Brasília 1.INTRODUÇÃO

CONCEITOS INICIAIS. Agenda A diferença entre páginas Web, Home Page e apresentação Web;

UFF-Fundamentos de Sistemas Multimídia. Redes de Distribuição de Conteúdo (CDN)

Guia de Conectividade Worldspan Go Res! A V A N Ç A D O

Capítulo 4 - Roteamento e Roteadores

Prof. Samuel Henrique Bucke Brito

Universidade de Brasília

Há dois tipos de configurações bidirecionais usados na comunicação em uma rede Ethernet:

Push Technologies. Caixa Postal CEP Londrina PR Brasil.

Segurança em Sistemas de Informação Tecnologias associadas a Firewall

Capítulo 3: Implementar a segurança por meio de VLANs

REDES DE COMPUTADORES Prof. Ricardo Rodrigues Barcelar

Uma solução de desempenho para a distribuição de documentos: Habilitando a distribuição de documentos em tempo real para corporações globais

Na Figura a seguir apresento um exemplo de uma "mini-tabela" de roteamento:

Teleprocessamento e Redes (MAB-510) Gabarito da Segunda Lista de Exercícios 01/2010

4. Qual seria o impacto da escolha de uma chave que possua letras repetidas em uma cifra de transposição?

Interconexão de redes locais. Repetidores. Pontes (Bridges) Hubs. Pontes (Bridges) Pontes (Bridges) Existência de diferentes padrões de rede

SISTEMAS DISTRIBUIDOS

Roteiro. Arquitetura. Tipos de Arquitetura. Questionário. Centralizado Descentralizado Hibrido

MPLS MultiProtocol Label Switching

Arquitetura de Rede de Computadores

Redes WAN. Prof. Walter Cunha

COMPONENTES BÁSICOS DE

Rede Corporativa. Tutorial 10 mar 2009 Fabio Montoro. Introdução

Prof. Samuel Henrique Bucke Brito

Rede de Computadores

Cap 03 - Camada de Aplicação Internet (Kurose)

Redes TCP/IP. Prof. M.Sc. Alexandre Fraga de Araújo. INSTITUTO FEDERAL DO ESPÍRITO SANTO Campus Cachoeiro de Itapemirim

Aula Prática Roteador

Veja abaixo um exemplo de um endereço IP de 32 bits:

5.2 MAN s (Metropolitan Area Network) Redes Metropolitanas

DIFERENÇAS ENTRE HUB, SWITCH E ROOTER

Como medir a velocidade da Internet?

3. Explique o motivo pelo qual os protocolos UDP e TCP acrescentam a informação das portas (TSAP) de origem e de destino em seu cabeçalho.

CAMADA DE TRANSPORTE

SISGEP SISTEMA GERENCIADOR PEDAGÓGICO

Entendendo como funciona o NAT

Prof. Samuel Henrique Bucke Brito

SIMULADOR DE ROTEAMENTO DE PACOTES (V. 3 20/05/2010)

Endereçamento IP. Figura 1 Estrutura hierárquica do endereço IP

Redes e Internet do Futuro

01.00 CDNs Introdução

APLICAÇÃO REDE APLICAÇÃO APRESENTAÇÃO SESSÃO TRANSPORTE REDE LINK DE DADOS FÍSICA 1/5 PROTOCOLOS DE REDE

Projeto Tor UFRJ Redes I Alunos: Jhonatas Alfradique, Hugo Klin, Guilherme Almeida

Unidade 3 Visão Geral de Equipamentos de Rede

FICHA INFORMATIVA E DE TRABALHO MÓDULO REDE LOCAL INSTALAÇÃO

Gerência de Redes NOC

Wireshark. Captura de Protocolos da camada de aplicação. Maicon de Vargas Pereira

MÓDULO 8 ARQUITETURA DOS SISTEMAS DE BANCO DE DADOS

ADMINISTRAÇÃO DE SISTEMAS OPERACIONAIS SERVIÇOS DE ACESSO REMOTO (TELNET E TERMINAL SERVICES) Professor Carlos Muniz

Objetivos: i) Verificar o impacto de loops em redes locais ii) Configurar o protocolo STP para remover loops da rede

Introdução Ligação direta Ligação direta Default

:: Telefonia pela Internet

Voltar. Placas de rede

Roteamento e Comutação

Alta disponibilidade utilizando Roteamento Virtual no RouterOS GUILHERME RAMIRES

Aula 20. Roteamento em Redes de Dados. Eytan Modiano MIT

MÓDULO 7 Modelo OSI. 7.1 Serviços Versus Protocolos

UNIDADE II. Fonte: SGC Estácio e Marco Filippetti

O modelo ISO/OSI (Tanenbaum,, 1.4.1)

UNIVERSIDADE FEDERAL DE PERNAMBUCO

GT Computação Colaborativa (P2P)

IP significa Internet Protocol. A Internet é uma rede, e assim como ocorre em qualquer tipo de rede, os seus nós (computadores, impressoras, etc.

Faculdades Santa Cruz - Inove. Plano de Aula Base: Livro - Distributed Systems Professor: Jean Louis de Oliveira.

Fundamentos de Redes de Computadores. Elementos de Redes Locais

Introdução a computação móvel. Middlewares para Rede de Sensores sem Fio. Uma avaliação na ótica de Adaptação ao Contexto

1

Framework de comunicação para Webservices 2P2

Otimização de banda utilizando IPANEMA. Matheus Simões Martins. Curso de Especialização em Redes e Segurança de Sistemas

MPLS. Redes de Longa Distância Prof. Walter Cunha

Redes de Computadores II. Professor Airton Ribeiro de Sousa

Redes Overlay. Estrutura. Exemplo. Um Exemplo Histórico. Aldo Monteiro do Nascimento, Dionei Marcelo Moraes. 08 de novembro de 2006

Redes Definidas por Software

Aula Prática Wi-fi Professor Sérgio Teixeira

Redes WAN MPLS. Redes de Longa Distância Prof. Walter Cunha

Sistemas Operacionais

Sistemas Operacionais

Figura 1 Taxas de transmissão entre as redes

Assumiu em 2002 um novo desafio profissional como empreendedor e Presidente do Teleco.

UNIVERSIDADE FEDERAL DE SANTA CATARINA DEPARTAMENTO DE INFORMÁTICA E ESTÁTISTICA GRADUAÇÃO EM CIÊNCIAS DA COMPUTAÇÃO DISCIPLINA: COMUNICAÇÃO DE DADOS

3 SERVIÇOS IP. 3.1 Serviços IP e alguns aspectos de segurança

Revisão. Karine Peralta

Transcrição:

Implementação de um Content Router semântico para eliminação de tráfego redundante Arthur Henrique Coutinho 1, Bruno Bogaz Zarpelão 1, 1 Departamento de Computação Universidade Estadual de Londrina (UEL) Caixa Postal 10.011 CEP 86057-970 Londrina PR Brasil arthurhcoutinho@gmail.com, brunozarpelao@gmail.com Abstract. The Internet traffic congestion has become a growing problem as consequence of new content being transmitted, characterized by high bandwidth consumption. Such kind of data, when asked, generate redundant traffic that overloads the infoways and the servers. With the reducing storage cost per megabyte, there has been several proposals of router that have hard discs as cache for high solicited data. The called Content Routers cooperate with each other to deliver frequent content without accessing the original server. This work proposes a Content Router whose cooperation on cached data recovery works through semantic routing, extracting meta-data from traffic and using it in the distributed search. Resumo. O congestionamento de tráfego na Internet tornou-se um problema crescente como consequência de novos conteúdos sendo transmitidos, caracterizados por consumirem muita banda. Tais informações, quando muito solicitadas, geram tráfego redundante que congestiona as infovias e os servidores. Com a diminuição do custo de armazenamento por megabyte, surgiram várias propostas de roteadores que possuem discos para cache de dados muito requisistados. Denominados Content Routers, eles colaboram entre si para entregar conteúdo frequente sem que o servidor original seja acessado. Este trabalho propõe um Content Router cuja cooperação na recuperação de dados em cache funciona através de roteamento semântico, extraindo meta-dados do tráfego e utilizando-os nas suas buscas distribuídas. 1. Introdução A Internet evoluiu de uma configuração onde a navegação Web gerava fluxos de pequena monta a cada ação do usuário para um quadro onde uma infovia pode comportar diversos fluxos constantes e de alta prioridade. Aplicações como VoIP, videoconfências e jogos em rede se dão entre computadores em diferentes partes do mundo e demandam baixa latência na comunicação. Atualmente disputam espaço com tráfego intenso de outros serviços, como streaming de vídeo e filmes sob demanda. Essas aplicações caracterizam-se pela disponibilidade mundial ou em larga escala de um mesmo conteúdo. Pelo funcionamento convencional da Internet, os servidores recebem uma nova requisição de conteúdo para cada usuário que se interesse em visualiza-lo, iniciando uma transferência que ocupa banda considerável por um longo tempo. Diferente de um multicast [15], diversos terminais não necessariamente recebem uma mesma informação simultaneamente, mas sim em momentos relativamente próximos. A prioridade é a mesma das comunicações em tempo real, pois a interrupção no tráfego prejudica o uso do serviço em ambos os casos.

Este último caso tem ocorrido cada vez mais e, com a perspectiva de mais crescimento acompanhando os acessos por dispositivos móveis [6], motivou investigações a fim de atacar o chamado tráfego redundante de dados. Esse problema ocorre principalmente em backbones, que devem comportar fluxo somado de diversas subredes físicas e acabam concentrando demandas concorrentes de latências muito baixas. As propostas convergem em um modelo de roteador que armazena o conteúdo redundante em cache, denominado Content Router, e entrega esses dados sem encaminhar a requisição ao servidor original, impedindo que o intenso tráfego se estabeleça através do backbone. Como neste modelo vários roteadores possuem tal capacidade, também há esforços para promover uma colaboração entre eles para encontrar dados em cache pela rota até o servidor. A colaboração entre roteadores exige manutenção de indicadores acerca de nós da rede possuidores do conteúdo armazenado. Por se assemelhar à colaboração entre nós de uma rede P2P para busca de conteúdo específico [7], uma maneira de tornar o roteamento mais distribuído e escalável pode ser por meio de um mecanismo de colaboração entre Content Routers que use meta-dados. Para isso, o algoritmo deve reconhecer a semântica do conteúdo no tráfego e traduzi-lo em palavras-chave. O trabalho está organizado da seguinte maneira: a Seção 2 apresenta os fundamentos teóricos para a solução proposta. A Seção 3 aponta os principais detalhes da solução proposta. A Seção 4 elenca as tarefas necessárias para o sucesso do projeto. A Seção 5 mostra a distribuição dessas tarefas. A Seção 6 vislumbra os benefícios em consequência deste trabalho. 2. Fundamentação Teórico-Metodológica e Estado da Arte Os roteadores funcionam encaminhando pacotes de dados com base no endereço IP presente nos cabeçalhos da camada de Internet. Essa configuração permite redes com topologia no formato estrela, através da qual cada computador conecta-se por apenas um meio físico (cabo ou ondas de rádio) a apenas outra interface central (a do roteador). Assim, pode-se estender outras redes com mesma topologia e permitir que quaisquer dois nós continuem visíveis entre si. Na Internet isso é possível pela interconexão de uma infinidade de roteadores que centralizam sub-redes e recebem tráfego gigantesco. Com tanta informação circulando, usuários muitas vezes podem sofrer com um congestionamento nos roteadores, o que reduz a qualidade do serviço prestado. Estratégias para se lidar com o tráfego excessivo ou reduzi-lo foram desenvolvidas. O protocolo MPLS adiciona meta-dados sobre a camada de Internet, estabelecendo uma camada virtual após a camada física, e é utilizado pelos roteadores para obter informações do tipo de conteúdo presente no pacote. Conforme o conteúdo, o pacote terá maior prioridade em seu encaminhamento. Tal avaliação permite qualidade de serviço (Quality of Service - QoS) para comunicações em tempo real, como chamadas de voz, videoconferências, e streaming sem interrupções. Entretanto, com o aumento da banda ofertada pelos provedores de internet e com conteúdos cada vez mais pesados sendo transferidos, pôde-se observar uma maior responsabilidade da redundância de tráfego sobre o congestionamento das infovias. Em diversos períodos, servidores da rede contendo sites populares apresentam a característica de serem fonte única para múltiplos destinos (single source multiple destinations) [8]. Quando isso ocorre, um número muito elevado de solicitações para a mesma informação trafega por meio de vias já caracterizadas por comportarem tráfego elevado, já que são

parte de muitas rotas em uma vasta região (como, por exemplo, backbones). Grandes empresas investem em espelhamento e distribuição de seus servidores para aliviar a sobrecarga. Outra solução mais tradicional é o emprego de web-caches intermediários para aliviar consideravelmente esse gargalo. O maior provedor de web-cache ainda é o servidor proxy, normalmente instalado nos gateways de grandes redes locais. Como os acessos à web por conexões móveis (3G, 4G e outros) para uso pessoal tendem a crescer, boa parte das solicitações de tráfego advirá cada vez menos de trás de um gateway com cache. Um agravante se deve a algumas características de hardware e sistemas operacionais dos smartphones, que contam com menos memória RAM e não fazem uso de swap, resultando em mais solicitações e em menos cache interno [6]. 2.1. Estado da Arte O foco passou então para o funcionamento dos roteadores, onde o gargalo ocorre de fato. Pesquisas têm apontado soluções convergindo para formas de roteamento distribuído mais sofisticadas. Nesse conceito os roteadores colaboram entre si para que pacotes de rede não precisem completar todos os saltos de uma rota entre dois terminais. A eliminação de tráfego redundante (reduntant traffic elimination - RTE) é observada como uma das principais políticas para ganho de eficiência em redes, juntamente com o monitoramento do consumo de energia [10, 1, 2] e tratamento de concorrência de pacotes devido a buffers limitados [10]. Algumas abordagens para o problema, como as Content Delivery Network (CDN), concentram-se no invetimento das empresas em vários servidores espelhos que possam contar com os roteadores para encaminhar a requisição ao servidor mais próximo, independentemente do endereço IP [4]. Aproveitando-se da redução do custo de armazenamento por byte, outras políticas de RTE sugerem roteadores com discos físicos para cache e um algoritmo que observa a frequência com que um mesmo conteúdo passa pelo trecho com diferentes destinos (Content Router - CR). Os algoritmos propostos nessa última abordagem são baseados em obtenção de fingerprint do conteúdo destacado. O artigo [11] oferece um algoritmo focado em roteadores posicionados nas margens das rotas, mais próximos dos clientes em vez dos servidores. O estudo [13] faz uma proposta semelhante, mas para roteadores mais internos na rede próximos do backbone. Nesse algoritmo, são eleitos para o cache conteúdos estáticos (não gerados por páginas dinâmicas e não criptografados) com alto índice de requisição a partir do lado mais periférico da rede, independentemente do protocolo. Quando o roteador possui partes dos itens solicitados em cache, entrega-as ao cliente sem que o servidor original seja requisitado. Caso contrário, é capaz de calcular uma rota por onde o conteúdo possa estar armazenado, passando por outros roteadores com mesma capacidade até, em um pior caso, chegar ao servidor original. O algoritmo garante a integridade e autenticidade dos dados entregues. Em outro estudo [12], a estratégia de cooperação entre roteadores é reforçada com o objetivo de evitar armazenamento de dados iguais em caches próximos que possam participar de uma mesma rota constantemente. Também foi investigado, em [5], o comportamento do tráfego redundante para se posicionar os caches em roteadores mais estratégicos e foram testadas diversas políticas de hierarquia de caches a fim de observar ganho de desempenho. Outros algoritmos com premissas semelhantes [10, 7, 3] levam em consideração a possibilidade de um conteúdo vir a ser muito solicitado através de heurísticas, antecipando-se em armazena-lo no cache.

No âmbito do roteamento distribuído há algoritmos de roteamento descentralizado para redes peer-to-peer (P2P), mais voltadas a distribuição de conteúdo específico. Semelhantes às propostas de colaboração entre CRs, esses algoritmos criam fingerprints de conteúdos associados à semântica de busca e possíveis interesses. No estudo [7], é proposta uma topologia para a retransmissão de solicitações de pesquisa e uma organização da semântica que descreve os itens vasculhados. Os resultados apontam redução do tamanho das rotas para encontrar itens desejados. 3. Objetivos O objetivo desse trabalho é implementar um algoritmo para Content Routers que trabalhe com semântica de conteúdos ao cooperar com outros roteadores para recuperar informações em cache. Com o roteamento semântico, além de se observar redução de tráfego redundante, o roteador terá maior papel ativo na rede, dependendo menos de um IP fixo como destinatário nos pacotes. Com a orientação por meta-dados semânticos, o algoritmo identificará não apenas conteúdos estáticos, mas também conteúdos não criptografados dinâmicos com grande reincidência, como pesquisas muito comuns em sites de busca. 4. Procedimentos metodológicos/métodos e técnicas O algoritmo de roteamento será implementado para o simulador virtual de redes Mininet [9]. Através da simulação serão levantados switches com a nova rotina, que analisará cada pacote de aplicação de rede independentemente de protocolo, extrairá uma fingerprint (conteúdos estáticos) e/ou meta-dados (conteúdos estáticos e dinâmicos) para o conteúdo ao qual ele se refere. Por conta da extração de meta-dados, as solicitações para os servidores também deverão ser analisadas. 5. Cronograma de Execução Atividades: 1. Estudo sobre Mininet; 2. Estudo sobre roteamento semântico; 3. Estudo sobre Content Routers; 4. Desenvolver um método de extração de meta-dados semânticos; 5. Adaptar o roteamento semântico de redes P2P na cooperação entre Content Routers; 6. Implementação do algoritmo completo; 7. Testes; 8. Coleta de resultados; 9. Preparo da monografia final.

Tabela 1. Cronograma de Execução fev mar abr mai jun jul ago set out Atividade 1 x x Atividade 2 x x Atividade 3 x x Atividade 4 x x Atividade 5 x x Atividade 6 x x x Atividade 7 x x x Atividade 8 x x Atividade 9 x x x x x x x 6. Contribuições e/ou Resultados esperados Com o roteamento semântico na busca por informações em cache, pode-se viabilizar um papel mais ativo dos roteadores na rede, potencializando uma interação com aplicações de busca nos terminais. Uma vez consolidado esse conceito, a extração de meta-dados poderia deixar de ocorrer no roteador para acontecer no terminal ao serem geradas novas solicitações. Isso poderia ocorrer devido à extração proposta nesse trabalho ter fins de retrocompatibilidade. 7. Espaço para assinaturas Londrina, 31 de Março de 2014. Referências Aluno Orientador [1] J. Araujo, F. Giroire, Yaning Liu, R. Modrzejewski, and J. Moulierac. Energy efficient content distribution. In Communications (ICC), 2013 IEEE International Conference on, pages 4233 4238, June 2013. [2] D. Coudert, A.M.C.A. Koster, Truong Khoa Phan, and M. Tieves. Robust redundancy elimination for energy-aware routing. In Green Computing and Communications (GreenCom), 2013 IEEE and Internet of Things (ithings/cpscom), IEEE International Conference on and IEEE Cyber, Physical and Social Computing, pages 179 186, Aug 2013. [3] E. Halepovic, C. Williamson, and M. Ghaderi. Dynabyte: A dynamic sampling algorithm for redundant content detection. In Computer Communications and Networks (ICCCN), 2011 Proceedings of 20th International Conference on, pages 1 8, July 2011.

[4] E. Harahap, J. Wijekoon, R. Tennekoon, F. Yamaguchi, S. Ishida, and H. Nishi. Distributed algorithm for router-based management of replica server in next-cdn infrastructure. In Cyber-Enabled Distributed Computing and Knowledge Discovery (CyberC), 2013 International Conference on, pages 266 272, Oct 2013. [5] Zhe Li, G. Simon, and A. Gravey. Caching policies for in-network caching. In Computer Communications and Networks (ICCCN), 2012 21st International Conference on, pages 1 7, July 2012. [6] Yao Liu, Qi Wei, Lei Guo, Bo Shen, Songqing Chen, and Yingjie Lan. Investigating redundant internet video streaming traffic on ios devices: Causes and solutions. Multimedia, IEEE Transactions on, 16(2):510 520, Feb 2014. [7] Habib Rostami, Jafar Habibi, and Emad Livani. Semantic routing of search queries in {P2P} networks. Journal of Parallel and Distributed Computing, 68(12):1590 1602, 2008. [8] P. Srebrny, T. Plagemann, V. Goebel, and A. Mauthe. Cachecast: Eliminating redundant link traffic for single source multiple destination transfers. In Distributed Computing Systems (ICDCS), 2010 IEEE 30th International Conference on, pages 209 220, June 2010. [9] Mininet Team. Mininet: An instant virtual network on your laptop (or pc). http: //mininet.org. [10] C. Williamson. The edge of smartness. In Distributed Computing Systems Workshops (ICDCSW), 2011 31st International Conference on, pages 40 46, June 2011. [11] W. Wong, M. Giraldi, M.F. Magalhaes, and J. Kangasharju. Content routers: Fetching data on network path. In Communications (ICC), 2011 IEEE International Conference on, pages 1 6, June 2011. [12] W. Wong, Liang Wang, and J. Kangasharju. Neighborhood search and admission control in cooperative caching networks. In Global Communications Conference (GLOBE- COM), 2012 IEEE, pages 2852 2858, Dec 2012. [13] Hao Wu, Jun Li, Tian Pan, and Bin Liu. A novel caching scheme for the backbone of named data networking. In Communications (ICC), 2013 IEEE International Conference on, pages 3634 3638, June 2013. [14] Yong Xu, Yin Liu, and Yao Liu. Algorithm for redundancy elimination in network traffic. In Consumer Electronics, Communications and Networks (CECNet), 2012 2nd International Conference on, pages 1613 1617, April 2012. [15] Yuanzhe Xuan and Chin-Tau Lea. Network-coding multicast networks with qos guarantees. Networking, IEEE/ACM Transactions on, 19(1):265 274, Feb 2011.