GroupUsto.re: Federação de Dados Usando a Plataforma Peer-to-peer



Documentos relacionados
1

Uma métrica para recomendação de federação em rede ponto-a-ponto

Arquitetura dos Sistemas de Informação Distribuídos

DAS Inteligência Artificial Aplicada à Controle de Processos e Automação Industrial

SISTEMAS DISTRIBUÍDOS

Segurança e Escalabilidade em WebLab no Domínio de Redes de Computadores

PEER DATA MANAGEMENT SYSTEM

UNIVERSIDADE FEDERAL DE PERNAMBUCO

A computação na nuvem é um novo modelo de computação que permite ao usuário final acessar uma grande quantidade de aplicações e serviços em qualquer

O que é Grid Computing

Faculdade Integrada do Ceará FIC Graduação em Redes de Computadores

UFG - Instituto de Informática

REDES DE COMPUTADORES

Desenvolvimento de uma Rede de Distribuição de Arquivos. Development of a File Distribution Network

SISTEMAS DISTRIBUIDOS

GT Computação Colaborativa (P2P)

4 Um Exemplo de Implementação

} Monolíticas Aplicações em um computador centralizado. } Em Rede Aplicações com comunicação em rede. } Distribuídas Comunicação e cooperação em rede

Aula 03-04: Modelos de Sistemas Distribuídos

Noções de. Microsoft SQL Server. Microsoft SQL Server

Sistemas Operacionais Gerência de Dispositivos

Sistemas Operacionais

Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro V

Prof. Samuel Henrique Bucke Brito

Introdução ao Modelos de Duas Camadas Cliente Servidor

SISTEMAS DISTRIBUÍDOS

Desenvolvendo uma Arquitetura de Componentes Orientada a Serviço SCA

DESEMPENHO DE REDES. Fundamentos de desempenho e otimização de redes. Prof. Ulisses Cotta Cavalca <ulisses.cotta@gmail.com>

UMA PROPOSTA PARA COMPARAÇÃO DE PROVEDORES DE COMPUTAÇÃO EM NUVEM DESDE UMA PERSPECTIVA DE INTEGRAÇÃO DE APLICAÇÕES 1

Cloud Disk Drive: Uma Abordagem para a Criação de Discos Virtuais de Baixo Custo Utilizando Redes p2p

SMART GRIDS: PHYSICAL-LAYER SECURITY. Proposta de trabalho de graduação. Aluno: Lucas André Pequeno Paes Orientador: Daniel Carvalho da Cunha

CONCEITOS E APLICAÇÕES DA COMPUTAÇÃO EM NUVEM

Bancos de dados distribuídos Prof. Tiago Eugenio de Melo

Sistemas Distribuídos

GT-ATER: Aceleração do Transporte de Dados com o Emprego de Redes de Circuitos Dinâmicos. RP1 - Relatório de detalhamento das atividades

VIRNA. Virtualizador Nacional

Sistemas Distribuídos. Professora: Ana Paula Couto DCC 064

Proposta de Avaliação de Empresas para o uso do SAAS

Resumo. Introdução História Caracteristicas Exemplos Arquitetura Distribuição Vertical vs Distribuição Horizontal Segurança Conclusão

2 Fundamentação Conceitual

Por Antonio Couto. Autor: Antonio Couto Enterprise Architect

Intranets. FERNANDO ALBUQUERQUE Departamento de Ciência da Computação Universidade de Brasília 1.INTRODUÇÃO

CLOUD COMPUTING: COMPARANDO COMO O MUNDO ONLINE PODE SUBSTITUIR OS SERVIÇOS TRADICIONAIS

Telecomunicações. Prof. André Y. Kusumoto

Virtualização de Sistemas Operacionais

Unidade 1. Conceitos Básicos

Arquitetura NUMA 1. Daniel de Angelis Cordeiro. INRIA MOAIS project Laboratoire d Informatique de Grenoble Université de Grenoble, França

Segurança da Informação

MÓDULO 7 Modelo OSI. 7.1 Serviços Versus Protocolos

SIMULADOR DE ROTEAMENTO DE PACOTES (V. 3 20/05/2010)

CONCEITOS INICIAIS. Agenda A diferença entre páginas Web, Home Page e apresentação Web;

IMPLEMENTAÇÃO DAS CAMADAS Inference Machine e Message Service Element PARA UM SERVIDOR DE SISTEMA DE GERENCIAMENTO DE Workflow HOSPITALAR

Sistemas Distribuídos

MSc Eliton Smith Gerenciamento e Administração de Redes

3 Trabalhos Relacionados

Introdução a Computação nas Nuvens

SIMARPE Sistema de Arquivo Permanente

Arquitetura de Redes: Camadas de Protocolos (Parte I) Prof. Eduardo

REDES DE COMPUTADORES

Avaliação de disponibilidade de alternativas arquiteturais em ambientes de Mobile Cloud Computingcom

SEGURANÇA EM PROCESSADORES DE REDE

Tecnologia da Informação. Prof Odilon Zappe Jr

Impactos do Envelhecimento de Software no Desempenho dos Sistemas. Jean Carlos Teixeira de Araujo

Algoritmos. Cláudio Barbosa

Capítulo 3. Avaliação de Desempenho. 3.1 Definição de Desempenho

Revisão. Karine Peralta

1 INTRODUÇÃO Internet Engineering Task Force (IETF) Mobile IP

Desenvolvimento de Sistemas Orientados a Objetos com UML UP/RUP: Projeto

BRAlarmExpert. Software para Gerenciamento de Alarmes. BENEFÍCIOS obtidos com a utilização do BRAlarmExpert:

Armazenamento em nuvem é feito em serviços que poderão ser acessados de diferentes lugares, a qualquer momento e utilizando diferentes dispositivos,

Modelagem e Análise de Dependabilidade de Infraestruturas de Mobile Cloud Computing

Infraestrutura: devo usar a nuvem? Prof. Artur Clayton Jovanelli

Definição São sistemas distribuídos compostos de nós interconectados, aptos a se auto-organizar em topologias de rede, com o intuito de compartilhar

Software de segurança em redes para monitoração de pacotes em uma conexão TCP/IP

Projeto de Sistemas Distribuídos. Prof. Andrêza Leite

Sistemas de Informações Gerenciais

IBM WebSphere DataStage

Modelos de Arquiteturas. Prof. Andrêza Leite

Capítulo 8 - Aplicações em Redes

Roteiro. Arquitetura. Tipos de Arquitetura. Questionário. Centralizado Descentralizado Hibrido

Redes Definidas por Software

Gerência de Redes: Modelos de Gerência de Redes: Modelo FCAPS: Ferramentas de Gerência de Redes:

PROPOSTA PARA APLICAÇÃO DE ENSINO A DISTÂNCIA EM REALIDADE VIRTUAL

João Víctor Rocon Maia Engenharia de Computação - UFES

Tópicos Especiais em Redes de Telecomunicações

MASSACHUSETTS INSTITUTE OF TECHNOLOGY Sloan School of Management

INTEGRAÇÃO DE APLICAÇÕES UTILIZANDO WEB SERVICE 1. Kellen Kristine Perazzoli 2 ; Manassés Ribeiro 3

Processos Técnicos - Aulas 4 e 5

Análise comparativa sobre bases de dados para armazenamento e consulta de dados não estruturados no formato JSON.

3 SCS: Sistema de Componentes de Software

Taxa de Gravação da Memória RAM (MegaBytes / segundo) G5 2.7 Ghz (Mac) Linux Kernel

Planejamento Estratégico de TI. Felipe Pontes

S G O R T A FRAMEWORK TO SUPPORT SMART GRID SOLUTIONS WITH UBIQUITOUS AND AUTONOMIC FEATURES ECDU. INF Seminários Científicos II

Desempenho de Web Servers

Transcrição:

Anais 129 GroupUsto.re: Federação de Dados Usando a Plataforma Peer-to-peer Wilton Oliveira Ferreira 1,2,3, Rodrigo Elia Assad 1,2, Anderson Fonseca e Silva 1,2, Silvio Romero de Lemos Meira 1, Josino Rodrigues Neto 1,2 1 Centro de Informática Universidade Federal de Pernambuco (UFPE) Av. Jornalista Anibal Fernandes, s/n Cidade Universitária 50.740-560 Recife, PE Brazil 2 Usto.re Rua do Apolo, 161 Cais do Apolo - Bairro do Recife 50.030-210 Recife, PE Brazil 3 Centro de Estudos e Sistemas Avançados do Recife (C.E.S.A.R) Rua Bione, 220 Cais do Apolo - Bairro do Recife 50.030-390 Recife, PE Brazil {wof, rea, afs8, srlm, jrn4}@cin.ufpe.br Abstract. Studies and experiment performed pointing the overhead of messages in P2P backup systems as a critical factor of this technology. This factor increases drastically the network usage, in addition, the peers involved in these systems do not always have the same power of message processing and in many cases present limitations in speed of data transfer over the network (latency). This paper proposes a mechanism for creating of federations (groups) of peers in P2P systems backups taking as criterion the equivalence of capacity between peers. Resumo. Estudos e experimentos realizados apontam o overhead de mensagens em sistemas de backup P2P como sendo um fator critico desta tecnologia. Este fator eleva drasticamente o uso da rede, além disso, os peers envolvidos nestes sistemas nem sempre tem o mesmo poder de processamento das mensagens e em muitos casos apresenta limitações na velocidade de transferência de dados pela rede (latência). Este artigo propõe um mecanismo para criação de federações (grupos) de peers em sistemas de backups P2P tomando como critério a equivalência de capacidade entre os peers. 1. Introdução Desde o inicio da década de 1980, o modelo de comunicação P2P (Peer-to-Peer) vem sendo tratado como uma arquitetura, e grandes ferramentas como Napster [Kan 2001] e Gnutella [Kan 2001], foram os propulsores desta nova arquitetura. O crescente número de sistemas P2P estimulou a realização de pesquisas e experimentos, entre os quais foi observada a necessidade de um mecanismo para a auto-organização dos peers. Este mecanismos permite que os peers possam apresentar mais eficiência. Alguns estudos propõem soluções que permitem organizar computadores em forma de federações.

130 IX Workshop de Redes P2P, Dinâmicas, Sociais e Orientadas a Conteúdo O conceito de federação apresentado neste trabalho, trata-se de um paradigma criado para agrupar peers. Este paradigma possibilita o estabelecimento de interligações de grandes escalas em infraestruturas de tecnologias da informação. Desta forma, serviços e aplicações podem ter ligações entre dois ou mais domínios [Tranoris and Denazis 2010]. O PanLab (Pan-European Laboratory) apresenta federação como sendo a capacidade de unir sistemas heterogêneos [Tranoris and Denazis 2010][Wahle et al. 2009], sendo definido da mesma forma por [Wang et al. 2011] e também por [Mancini et al. 2009]. Para a comunidade de Cloud Computing, federação é a capacidade de organizar e gerenciar um ecossistema fundamentado em armazenamento de dados, entidades e/ou serviços [Buyya et al. 2010]. O Usto.re é um sistema construído sobre a arquitetura P2P. Sistemas desta natureza geralmente apresenta grande overhead de tráfego na rede. Com o objetivo de resolver problemas desta natureza, algumas ferramentas utilizadas para a criação de redes P2P apresenta o conceito de grupos de peer [Brookshier et al. 2002]. Porém abordagens desta natureza não levam em consideração uma série de fatores fundamentais para sistemas distribuídos. Este artigo tem como objetivo apresentar um mecanismo para auxiliar na criação de federações de peers. Além desta seção introdutória, este artigo está estruturado da seguinte forma: Seção 2 Trabalhos Relacionados ; Seção 3 Usto.re; Seção 4 GroupUsto.re; Seção 5 Avaliação dos Resultados; Seção 6 Conclusão. 2. Trabalhos Relacionados PerfCloud é um framework completo que implementa mecanismos que oferecem serviços para a criação e gestão de recursos de computação virtual (clusters virtuais) sob uma Grid computacional [Mancini et al. 2009]. Esta ferramenta atua de forma autônoma, dispensando iteração humana. Sendo assim, os clusters podem ser parametrizados exatamente com as características necessária para atender uma requisição. Da mesma forma o CHASE apresenta características semelhantes ao PerfCloud. Trata-se de um framework que possui um motor de automatização da execução de rotinas de software e serviços em cloud ou grid [Mancini et al. 2009]. A proposta desta ferramenta consiste em prover auto-organização da infraestrutura e reduzir custos com personalização de paradigmas destinados a comunicação entre clouds. O FedMi é um framework que integra Data Grids heterogêneas[wang et al. 2011]. A arquitetura FedMi é constituída por três componentes principais, sendo estes: Client Program, Meta Data Server e Proxy Server. Estes três componentes trabalham em conjunto para realizar a interoperabilidade entre Data Grids heterogêneas, que formam uma federação de Data Grids. Já o gmeasure é uma ferramenta criada para compartilhar informações em alta velocidade entre computadores em uma rede P2P. Esta ferramenta apresentam abordagens que têm como principal fundamento a análise das características individuais de cada peer na rede[zhang et al. 2002]. O gmeasure possui como princípio básico a criação de agrupamento de peers com base na latência que os peers trafegam dados pela rede. A latência é um dos principais fatores explorados na proposta apresentada neste artigo. 3. Usto.re O Usto.re é uma solução de data cloud desenvolvida deste o início focada na segurança dos arquivo dos seus usuários.como adicional de segurança cada arquivo antes de ser

Anais 131 salvo e dividido em pedaços e cada pedaço espalhado nos computadores que compõem o a data cloud, e a lógica de reconstrução de cada pedaço é privada da solução Usto.re. O projeto Usto.re, trata-se de uma ferramenta, que toma por base a evolução da proposta inicial em [Duarte 2010], onde foi definido um algoritmo estatístico para garantir a disponibilidade de dados armazenados em ambientes P2P. Esta garantia é dada através do cálculo da probabilidade de falha de cada nó que compõe a rede P2P [Assad et al. 2012]. O Usto.re utiliza plataforma P2P para sua implementação, com isso sua arquitetura ilustrada na Figura 1, apresenta um ambiente distribuído para armazenamento de dados. Figure 1. Arquitetura Usto.re 4. GroupUsto.re O GroupUsto.re é uma ferramenta para recomendação na criação de federações de peers em sistemas P2P. A arquitetura GroupUsto.re, ilustrada na Figura 2, apresenta uma série de vantagens com relação aos trabalhos apresentado na Seção 2. O GroupUsto.re além de recomendar os peers para formação de federação, também monitora as federações já criadas. O GroupUsto.re recomenda modelos de federações de peer seguindo um perfil de capacidade de cada peer. Para determinar o perfil do peer esta ferramenta conta com os valores obtidos pelos agentes presente na arquitetura ilustrada na Figura 2. Figure 2. Arquitetura GroupUsto.re

132 IX Workshop de Redes P2P, Dinâmicas, Sociais e Orientadas a Conteúdo 4.1. Controle de Dados Este módulo é responsável pelo processamento das informações coletadas pelos agentes. As informações obtidas são necessárias para que possa ser definido o perfil de cada peer. As informações coletadas pelos agentes apresentam diferentes formatos. Desta forma, faz-se necessário converter tais informações para uma notação comum (processo conhecido como padronização de dados) [Neto and Moita 1998]. Para resolver este problema, a arquitetura do GroupUsto.re apresenta um serviço denominada padronização de dados, que tem por objetivo organizar os dados de forma a ser interpretado igualmente e com a mesma unidade de representação de valores utilizando a transformação z [Neto and Moita 1998]. A seguir são apresentados os agentes que compõe esta ferramenta. 4.2. Agentes LatenceAgent tem como objetivo verificar a velocidade que o peer transferi dados pela rede utilizando método RTT (Round Trip Time) [Jan and Noblet 2004]; MemoryAgent tem como objetivo verificar a capacidade de memória RAM (Random Access Memory) disponibilizada para uso do sistema P2P; ProcessorAgent tem como objetivo verificar as informações referentes ao número de núcleo de processador disponibilizado para o uso do sistema P2P; StorageAgent tem por objetivo coletar informações referente a capacidade de armazenamento de dados do peer e também a quantidade de espaço já utilizado. HopAgent tem como objetivo medir a quantidade de saltos por roteadores que uma mensagem deve executar para sair da origem e alcançar o destino; AvailabilityAgent tem como objetivo mensurar quanto tempo o peer tem disponível para o sistema; ReliabilityAgent tem como objetivo medir o quanto o peer é confiável com relação a todas as características e serviços por ele disponibilizados. 5. Execução dos Experimentos e Avaliação dos Resultados A verificação de eficiência na criação das federações sugeridas pelo GroupUsto.re foi realizada a partir de um ambiente parcialmente simulado. Inicialmente foram coletados valores de 20 (vinte) peers reais, estes valores foram combinados entre se dando origem a dois novos conjuntos de peers simulados, sendo um conjunto com 1162 peers e o outro conjunto com 3489 peers. O primeiro conjunto com 1162 elementos foi assim escolhido de forma aleatória entre o intervalo de 1000 a 1500 peers. Já o segundo conjunto com 3489 peer foi obtido a partir da multiplicação de aproximadamente 3 vezes o tamanho do primeiro conjunto. O objetivo de um conjunto amostral ser aproximadamente 1/3 menor que o outro é exatamente observar o comportamento do algoritmo quanto a escalabilidade. Para execução do experimento foram criados três perfis de federações contendo os seguintes números de peer: perfil de federação 1 com 10 peers; perfil de federação 2 com 50 peers e perfil de federação 3 com 100 peers. A quantidade de peers em cada federação foi escolhido de forma empírica. Na execução dos experimentos foi primeiramente selecionado o conjunto amostral com 1162 peers e em seguida o GroupUsto.re foi executado para cada perfil de federação. Logo em seguida foi selecionado o conjunto com 3489 amostras e da mesma forma o GroupUsto.re foi executado novamente para cada perfil de federação. Os experimentos obteve como resultado 6 (seis) conjuntos de federações. O objetivo do experimento é apresentar a redução de dissimilaridade entre os peers que

Anais 133 compõe uma federação. Esta dissimilaridade é dada pelo desvio padrão dos valores obtidos pelos agentes presente nos pees, neste caso quanto menor for o desvio padrão maior será a dissimilaridade entre os peers. A verificação de eficiência na sugestão de federação é realizada a partir da comparação de uma federação criada conforme sugestão do GroupUsto.re e um conjunto com o mesmo número de peer da federação escolhidos aleatoriamente. Para verificar a eficiência das federações sugeridas pelo GroupUsto.re foi proposta a seguinte equação: a) C = 1 k S z b) Xk = 1 k z=1 n n P j c) S k = 1 n ( Xi j=1 n 1 X ) 2 i i=1 X k representando a média de valores obtidos por cada agente do peer P j onde k é o número de agente e n é o número de peers observados. A equação b) é executada tanto para a federação quanto para o conjunto selecionado para a verificação de eficiência. Após obter o valor de X k tanto para a federação quanto para o conjunto, é realizado o calculado de desvio padrão amostral representado pela equação c) resultando em S k, onde k é o k-entésimo agente observado para análise e n é o número de peers observados. Por fim a equação c) apresenta o coeficiente de redução de dissimilaridade obtido a partir do somatório dos desvios padrões apresentado pela equação c). Os resultados obtidos nestes experimentos são ilustrados no gráfico da Figura 3. Como pode ser observado, houve redução da dissimilaridade em todos os casos do experimento. Em alguns casos esta redução de dissimilaridade foi maior, já em outros casos a ela foi pouco notável. Figure 3. Resultados das Avaliações 6. Conclusão Como foi observado no gráfico ilustrado na Figura 3, os experimentos apresentaram-se satisfatórios. Com isso conclui-se que o GroupUsto.re sugere organização de peers em federações de forma eficiente. E ainda observando o gráfico é possível notar que quanto maior o número de peer conectados, mais eficiente torna-se o GroupUsto.re. Desta forma conclui-se que esta ferramenta atende satisfatoriamente demandas de escalabilidades do sistema.

134 IX Workshop de Redes P2P, Dinâmicas, Sociais e Orientadas a Conteúdo References Assad, R. E., Garcia, V., Fernando, P., Machado, M., Soares, F., Vieira, T., Trinta, F., and Meira, S. R. L. (2012). Usto.re: Sistema confiável de armazenamento de dados em nuvem utilizando protocolo p2p. Centro de Estudos e Sistemas Avançado de Recife. Brookshier, D., Govoni, D., Krishnan, N., and Soto, J. C. (2002). JXTA: Java P2P Programming. Sams Publishing, United States of America,San Francisco, California. Buyya, R., Ranjan, R., and Calheiros, R. (2010). Intercloud: Utility-oriented federation of cloud computing environments for scaling of application services. In Algorithms and Architectures for Parallel Processing, volume 6081 of Lecture Notes in Computer Science, pages 13 31. Springer Berlin / Heidelberg. Duarte, M. P. (2010). Um algoritmo de disponibilidade em sistemas de backup distribuído seguro usando a plataforma peer-to-peer. Master s thesis, Universidade Federal de Pernambuco - Centro de Informática. Jan, M. and Noblet, A., D. (2004). Performance evaluation of jxta communication layers. Rapport de recherche RR-5350, INRIA. Kan, G. (2001). Peer to Peer: Harnessing the Power of Disruptive Technologies. O Reilly, first edition edition. Mancini, E., Rak, M., and Villano, U. (2009). Perfcloud: Grid services for performanceoriented development of cloud computing applications. In Enabling Technologies: Infrastructures for Collaborative Enterprises, 2009. WETICE 09. 18th IEEE International Workshops on, pages 201 206. Neto, J. M. M. and Moita, G. C. (1998). Uma introdução à análise exploratória de dados multivariados. Química Nova, 21:467 469. Tranoris, C. and Denazis, S. (2010). Federation computing: A pragmatic approach for the future internet. In Network and Service Management (CNSM), 2010 International Conference on, pages 190 197. Wahle, S., Magedanz, T., Gavras, A., Hrasnica, H., and Denazis, S. (2009). Technical infrastructure for a pan-european federation of testbeds. In Testbeds and Research Infrastructures for the Development of Networks Communities and Workshops, 2009. TridentCom 2009. 5th International Conference on, pages 1 8. Wang, C.-M., Chen, H.-M., Hsu, C.-C., and Huang, C.-C. (2011). Fedmi: A federation middleware for integrating heterogeneous data grids. In Parallel and Distributed Processing with Applications (ISPA), 2011 IEEE 9th International Symposium on, pages 127 134. Zhang, X., Liu, J., Zhang, Q., and Zhu, W. (2002). gmeasure: a group-based network performance measurement service for peer-to-peer applications. In Global Telecommunications Conference, 2002. GLOBECOM 02. IEEE, volume 3, pages 2528 2532 vol.3.