UNIVERSIDADE FEDERAL DE CAMPINA GRANDE CENTRO DE ENGENHARIA ELÉTRICA E INFORMÁTICA UNIDADE ACADÊMICA DE SISTEMAS E COMPUTAÇÃO. Deployment DO BEEFS



Documentos relacionados
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE CENTRO DE ENGENHARIA ELÉTRICA E INFORMÁTICA UNIDADE ACADÊMICA DE SISTEMAS E COMPUTAÇÃO. Deployment DO BEEFS

UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - UFCG CENTRO DE ENGENHARIA ELÉTRICA E INFORMÁTICA - CEEI DEPARTAMENTO DE SISTEMAS E COMPUTAÇÃO - DSC

UNIVERSIDADE FEDERAL DE CAMPINA GRANDE CENTRO DE ENGENHARIA ELÉTRICA E INFORMÁTICA UNIDADE ACADÊMICA DE SISTEMAS E COMPUTAÇÃO. Deployment DO BEEFS

Como Instalar Programas no GNU/Linux. Elexsandro Rangel dos Santos

Curso de Linux Básico

Lazarus pelo SVN Linux/Windows

Sistemas Distribuídos

Hardware (Nível 0) Organização. Interface de Máquina (IM) Interface Interna de Microprogramação (IIMP)

ArpPrintServer. Sistema de Gerenciamento de Impressão By Netsource Rev: 02

SISTEMAS DISTRIBUÍDOS

Laboratório de Redes. Professora Marcela Santos

1

Entendendo como funciona o NAT

Satélite. Manual de instalação e configuração. CENPECT Informática cenpect@cenpect.com.br

TUTORIAL PRÁTICO SOBRE Git. Versão 1.1

Roteiro 3: Sistemas Linux arquivos e diretórios

MANUAL DE INSTALAÇÃO 1) ORACLE VIRTUALBOX ; 2) MICROSOFT WINDOWS ; 3) SUMÁRIOS GENEPLUS.

Curso de Introdução ao. Debian GNU/Linux

CSAU Guia: Manual do CSAU 10.0 como implementar e utilizar.

ISO/IEC 12207: Gerência de Configuração

16:21:50. Introdução à Informática com Software Livre

IBM SPSS Modeler - Princípios Básicos do R: Instruções de Instalação

ADMINISTRAÇÃO DE SISTEMA OPERACIONAL DE REDE (AULA 9)

Versão Liberada. Gerpos Sistemas Ltda. Av. Jones dos Santos Neves, nº 160/174

Glossário Apresenta a definição dos termos, siglas e abreviações utilizadas no contexto do projeto Citsmart.

Alterações Easycaptive

Gerenciamento de configuração. Gerenciamento de Configuração. Gerenciamento de configuração. Gerenciamento de configuração. Famílias de sistemas

FACULDADE DE TECNOLOGIA SENAC PELOTAS CURSO TÉCNICO EM INFORMÁTICA PRONATEC PROFESSOR: NATANIEL VIEIRA ALUNOS: ANA CAROLINA, ROMÁRIO, WAGNER.

Sistema Operacional Unidade 8.2 Instalação de aplicativos. QI ESCOLAS E FACULDADES Curso Técnico em Informática

Manual de Instalação. Instalação via apt-get

OCOMON PRIMEIROS PASSOS

Administração de Sistemas Livres

Procedimentos para Reinstalação do Sisloc

Lógica de Programação

Programação Orientada a Objetos com PHP & MySQL Sistema Gerenciador de Banco de Dados: Introdução e configuração de bases de dados com Postgre e MySQL

Noções de. Microsoft SQL Server. Microsoft SQL Server

IBM SPSS Modeler - Princípios Básicos do R: Instruções de Instalação

*HUPRQGR±0DQXDOGR8VXiULR

10 DICAS DE TECNOLOGIA PARA AUMENTAR SUA PRODUTIVIDADE NO TRABALHO

Manual do Visualizador NF e KEY BEST

Manual de backup do banco de dados PostgreSQL - Versão 2. Setembro-2011

Manual de Administração

4 Estrutura do Sistema Operacional Kernel

Manual de Instalação do Agente Citsmart

Aula 01 Visão Geral do Linux

SIMEC Sistema Integrado de Planejamento, Orçamento e Finanças

Curso de Linux Básico com o Linux Educacional

Professor: Macêdo Firmino Disciplina: Sistemas Operacionais de Rede

Sistemas Operacionais

Especificações da oferta Gerenciamento de dispositivos distribuídos: Gerenciamento de ativos

SIMULADO DE INFORMÁTICA BÁSICA TÉCNICO DO MPU PROF. ALEXANDRE LÊNIN / PROF. JUNIOR MARTINS

29/06/ :30 Leite Júnior QUESTÕES CESPE BACKUP

Aula 02. Introdução ao Linux

Entrar neste site/arquivo e estudar esse aplicativo Prof. Ricardo César de Carvalho

5 Mecanismo de seleção de componentes

Hoje é inegável que a sobrevivência das organizações depende de dados precisos e atualizados.

Prof. Rossano Pablo Pinto Dezembro/2012 Versão 0.2 (em construção) Prof. Rossano Pablo Pinto - 1

Introdução ao Tableau Server 7.0

Sistema Gerenciador de Conteúdo OpenCms: um caso de sucesso no CEFET-MG

Faculdade de Tecnologia SENAC Goiás. Disciplina: Gerenciamento de Rede de Computadores. Goiânia, 16 de novembro de 2014.

Ferramenta de apoio a gerência de configuração de software. Aluno: Rodrigo Furlaneto Orientador: Everaldo Artur Grahl

Para funcionamento do Netz, alguns programas devem ser instalados e alguns procedimentos devem ser seguidos. São eles:

Sistema Operacional Unidade 13 Servidor Samba. QI ESCOLAS E FACULDADES Curso Técnico em Informática

Atualizaça o do Maker

Manual de Instalação. SafeSign Standard (Para MAC OS 10.7)

Tópicos. Atualizações e segurança do sistema. Manutenção Preventiva e Corretiva de Software (utilizando o MS Windows XP)

agility made possible

Palavras-chave: i3geo, gvsig, Mapserver, integração, plugin. Contato: ou

Online Help StruxureWare Data Center Expert

INTRODUÇÃO A PORTAIS CORPORATIVOS

SCIM 1.0. Guia Rápido. Instalando, Parametrizando e Utilizando o Sistema de Controle Interno Municipal. Introdução

Aula 4: Montagem e Disponibilização Frameworks Genéricos

IBM Managed Security Services for Agent Redeployment and Reactivation

Manual do Usuário. Resumo

SquidCacheAux para BrazilFW

Disciplina de Banco de Dados Introdução

ACL Linux. O que são ACLs e por que usá-las?

ARCO - Associação Recreativa dos Correios. Sistema para Gerenciamento de Associações Recreativas Plano de Desenvolvimento de Software Versão <1.

Capítulo 2. Processos de Software Pearson Prentice Hall. Todos os direitos reservados. slide 1

Feature-Driven Development

Aplicação Prática de Lua para Web

3 SCS: Sistema de Componentes de Software

FTIN Formação Técnica em Informática Módulo de Administração de Servidores de Rede AULA 03. Prof. Gabriel Silva

SAIBA MAIS SOBRE O LINUX E DESCUBRA QUAL DISTRIBUIÇÃO É MELHOR PARA VOCÊ! CURSO

TUTORIAL VMWARE WORKSTATION 8. Aprenda a instalar e configurar corretamente uma máquina virtual utilizando VMware Workstation com este tutorial

Laboratório de Redes de Computadores e Sistemas Operacionais

LEIA ISTO PRIMEIRO. IBM Tivoli Configuration Manager, Versão 4.2.1

Manual Xerox capture EMBRATEL

Profa. Gislaine Stachissini. Unidade III GOVERNANÇA DE TI

Orientação a Objetos

NetEye Guia de Instalação

Engenharia de Software III

Google Drive: Acesse e organize seus arquivos

AULA 5 Sistemas Operacionais

Versão Melhorias Melhorias Versão 6.0.1

Transcrição:

UNIVERSIDADE FEDERAL DE CAMPINA GRANDE CENTRO DE ENGENHARIA ELÉTRICA E INFORMÁTICA UNIDADE ACADÊMICA DE SISTEMAS E COMPUTAÇÃO GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO RELATÓRIO DE ESTÁGIO Deployment DO BEEFS CARLA DE ARAUJO SOUZA ESTAGIÁRIA RAQUEL VIGOLVINO LOPES ORIENTADORA ACADÊMICA JONHNNY WESLLEY SUPERVISOR TÉCNICO CAMPINA GRANDE, PARAÍBA, BRASIL c CARLA DE A. SOUZA, DEZEMBRO DE 2009

2 DEPLOYMENT DO OURFS Aprovado em BANCA EXAMINADORA Prof a. Dr a. Raquel Vigolvino Lopes ORIENTADORA ACADÊMICA Prof. Dr. Francisco Vilar Brasileiro MEMBRO DA BANCA Prof a. Dr a. Joseana Macêdo Fechine MEMBRO DA BANCA

Resumo O deployment de um sistema computacional envolve configurá-lo para ser usado num ambiente operacional, e essa etapa deve ser feita de forma sistemática, especialmente em sistemas computacionais distribuídos. O BeeFS é um sistema de arquivos distribuído, cujo as atividades de deployment foram realizadas durante esse estágio. Essas atividades foram: criação de pacotes de instalação do BeeFS, instalação de um repositório de pacotes e a instalação do gerenciador de configuração Puppet. Como resultado foram identificados 6 bugs, 3 tasks e 2 features foram sugeridas. Além do deployment, para uma comparação de performance em relação a outros sistemas de arquivos, foi necessário a modificação de um software que monitora e registra as operações em sistemas de arquivos, adicionando a duração e o momento no qual ocorreram.

Sumário 1 Introdução 9 1.1 Objetivos...................................... 10 2 Fundamentação Teórica 11 2.1 Sistema de Arquivos................................ 11 2.2 BeeFS........................................ 12 2.3 Sistemas de gerenciamento de pacotes..................... 13 2.3.1 Objetivos de um sistema de gerenciamento de pacotes........ 13 2.3.2 Definição de pacote............................ 14 2.3.3 Advanced Packaging Tool (APT)..................... 15 2.4 Repositórios e Sistemas de Gerenciamento de Pacotes............ 15 2.4.1 Repositório Reprepro........................... 16 2.5 Gerenciamento de configuração......................... 16 2.5.1 Puppet................................... 16 2.6 Tracers....................................... 17 3 Atividades Realizadas 19 3.1 Monitores de sistema de arquivos........................ 19 3.1.1 TraceFS................................... 19 3

SUMÁRIO 4 3.1.2 LoggedFS.................................. 20 3.1.3 Modificações necessárias......................... 21 3.1.3.1 Problemas identificados..................... 22 3.2 Gerenciamento de pacotes............................ 22 3.2.1 Instalação do repositorio Reprepro.................... 22 3.3 Criação dos pacotes................................ 24 3.3.1 Primeira versão do pacote......................... 25 3.3.1.1 Arquivos de instalação do pacote............... 25 3.3.1.2 Scripts de auxílio à instalação do BeeFS........... 26 3.3.1.3 Instalação............................ 27 3.3.2 Segunda versão do pacote........................ 32 3.3.2.1 Pacote beefs-honeybee................... 32 3.3.2.2 Pacote beefs-common..................... 33 3.3.2.3 Pacote beefs-honeycomb.................. 34 3.3.2.4 Pacote beefs-queenbee................... 34 3.3.2.5 Instalação............................ 35 3.4 Tasks, Features e Bugs identificadas....................... 37 3.4.1 Bugs..................................... 38 3.4.2 Tasks e Features.............................. 39 3.5 Instalação do Puppet................................ 41 3.5.1 Instalação.................................. 41 3.5.2 Configuração................................ 42 4 Consideração Finais 45 4.1 Atividades futuras................................. 45

SUMÁRIO 5 A Plano de Estágio i B Scripts x B.1 Postinst..................................... x B.2 Preinst...................................... xiv B.3 Postrm....................................... xv B.4 Prerm........................................ xvi

Lista de Siglas e Abreviaturas APT Advanced Packaging Tool CPAN Comprehensive Perl Archive Network (Rede de Repositórios Perl) EELA E-science grid facility for Europe and Latin America EXT3 Third Extended File System EXT4 Fourth Extended File System GPLv2 GNU General Public License Version 2 IANA LFS LSD NFS Internet Assigned Numbers Authority Linux File System Laboratório de Sistemas Distribuídos Network File System POSIX Portable Operating System Interface YUM Yellowdog Updater, Modified 6

Lista de Figuras 2.1 Arquitetura do BeeFS............................... 13 3.1 Seleção de serviços do BeeFS.......................... 28 3.2 Seleção de serviços do BeeFS.......................... 28 3.3 Tela para inserir o IP ou nome do servidor BeeFS............... 29 3.4 Tela para inserir a quantidade de espaço que deseja compartilhar...... 29 3.5 Tela para inserir a pasta que armazenará os arquivos brutos......... 30 3.6 Tela para inserir o diretório que montará o BeeFS............... 30 7

Capítulo 1 Introdução O BeeFS é um sistema de arquivos distribuído para uso corporativo desenvolvido por alunos de graduação e pós-graduação do Laboratório de Sistemas Distribuídos, que tem como propósito utilizar o espaço não utilizado das máquinas pertencentes a uma empresa para criar um espaço de armazenamento distribuído. Por exemplo, com a centralização dos arquivos pessoais dos funcionários de uma empresa usando NFS, o espaço que esses arquivos ocuparia nas máquinas dos funcionários torna-se subutilizado. O BeeFS é capaz de agregar um espaço de armazenamento de forma muito mais econômica que servidores dedicados de armazenamento. Por ser um sistema distribuído, a realização de sua instalação de forma sistemática é essencial para um bom funcionamento do sistema. O deployment de um sistema consiste em uma das etapas finais do desenvolvimento de um sistema (15), e envolve configurar o software para ser usado num ambiente operacional, instalando-o em computadores e depois configurando essa instalação para esses computadores específicos. Nessa etapa do processo de desenvolvimento, falhas podem acidentalmente ser introduzidas por meio de configurações, especialmente em sistemas distribuídos. Logo, boas práticas de gerenciamento podem previnir problemas durante o deployment e configuração do sistema. As etapas de configuração e deployment são geralmente atribuídas a administradores de sistemas. Essa atividade demanda tanto conhecimento específico quanto tempo. Para isso, é preciso a participação de uma pessoa com um conhecimento mais profundo para realização do deployment do sistema. 9

1.1 Objetivos 10 Um bom deployment evite problemas de configuração e permite uma fácil instalação, adaptação ao sistema e atualização do aplicativo. o BeeFS é uma ferramenta que, com o fácil acesso/instalação em qualquer desktop, o sistema é capaz de trabalhar com mais espaço disponível, e permite ao usuário fazer uso deste poder de armazenamento. Com o objetivo de realizar o deployment da aplicação, este relatório está divido nas seções em Fundamentação teórica e Tecnologias Utilizadas, com conceitos e softwares durante o estágio, Atividades realizadas, descrevendo todas as atividades desenvolvidas e finalmente as considerações finais. 1.1 Objetivos Realizando o deployment do sistema e configurando os ambientes necessários para execução das atividades que fazem parte do desenvolvimento do BeeFS, o principal objetivo desse trabalho é fornecer um apoio especializado ao desenvolvimento do BeeFS. Como objetivos específicos espera-se: Instalar o BeeFS e gerar um relatório da atividade de instalação, relatando a ocorrência de possíveis problemas; Analisar métodos para realização de tesets de performance, utilizando um ambiente real de trabalho; Configurar os ambientes necessários para realização do deployment; Realizar pesquisas para possíveis soluções de problemas que venham a aparecer por parte da equipe de desenvolvimento do BeeFS.

Capítulo 2 Fundamentação Teórica Este capítulo possui uma breve introdução sobre alguns softwares utilizados e conceitos abordados no estágio. Primeiro é definido o conceito de sistema de arquivo e uma breve explicação sobre o BeeFS, software o qual deu origem a esse estágio. A gerência de pacotes para ambientes GNU/Linux é descrita em seguida e finalmente é feita uma introdução aos programas utilizados no decorrer do estágio. 2.1 Sistema de Arquivos Sistema de arquivos é um sistema computacional para armazenamento e organização de arquivos de computador e a informação contida neles, de forma que torne fácil de achá-los e acessá-los. Sistemas de arquivos podem utilizar um dispositivo de armazenamento como disco rígido ou mídias externas o que envolve a manuntenção da localização física dos arquivos (16). Algumas implementações de sistemas de arquivos provê acessos via rede como no NFS (5) e CODA (2), ou podem ser virtuais e existirem apenas como um método de acesso a informações virtuais, como o procfs (14). Sistemas de arquivos tradicionais organizam os dados de forma hierarquica, atribuindo nomes aos arquivos e cada arquivo possui metadados. O nome tem como objetivo permitir a identificação do arquivo pelo usuário, bem como a localização dos dados na mídia física ou virtual, de acordo com o sistema de arquivos. Em alguns sistemas de arquivos, os nomes dos arquivos possuem uma sintaxe especial como extensões e número de versões, como o NilFS, um sistema de arquivo estruturado em log no qual dados novos são gravados no 11

2.2 BeeFS 12 início do log enquanto dados antigos ainda existem, tornando possível a recuperação de dados em versões passadas (12). Cada arquivo possui um metadado associado. O tamanho da informação contida no arquivo, a quantidade e a localização de blocos alocados para o arquivo, dono, grupo e tempo de criação, bem como permissões de acesso são exemplos de informações contida em seu metadados. A maioria das implementações de sistemas de arquivos oferecem facilidade de iteração com a informação armazenada como operações de criação, mover a localização e apagar arquivos e diretórios. 2.2 BeeFS BeeFS é um sistema de arquivo distribuído para uso corporativo que une o espaço disponível em computadores desktop. Por explorar a infraestrutura já existente que encontra-se subutilizada, BeeFS é capaz de construir uma área de armazenamento de uma forma mais econômica do que servidores dedicados para tal uso (1). Uma das principais características do BeeFS é sua escalabilidade: por não possuir uma máquina centralizada que processaria todos as requisições do sistema de arquivos e o espaço agregado pode facilmente ser incrementado por meio da adição de novas máquina, desde que o sistema operacional instalado no desktop implemente a interface POSIX. BeeFS é baseado numa arquitura híbrida que mistura características das arquiteturas ponto-a-ponto e cliente-servidor. Composto por 3 componentes distintos, os arquivos e seus metadados são armazenados por componentes separados. QueenBee Este componente é instalado de forma centralizada, com o objetivo de armazenar os metadados dos arquivos e é responsável pelo serviço persistência dos metadados e localização dos arquivos; HoneyComb Componente de armazenamento dos dados que armazena colaborativamente os arquivos nas máquinas pertencentes à rede corporativa. Os dados são replicados entre os HoneyCombs instalados na rede para diminuir o impacto de um possível desligamento dos computadores;

2.3 Sistemas de gerenciamento de pacotes 13 HoneyBee Esse componente disponibiliza o acesso aos arquivos armazenados no sistema de arquivos BeeFS. Uma instalação típica do BeeFS consiste em apenas uma QueenBee e vários Honey- Combs acessados pelas HoneyBees como é mostrado na Figura 2.1. Figura 2.1: Arquitetura do BeeFS 2.3 Sistemas de gerenciamento de pacotes Um sistema de gerenciamento de pacotes é uma coleção de ferramentas que automatizam o processo de instalação, atualização, configuração e remoção de pacotes de software de um computador. Distribuições de GNU/Linux e outros sistemas operacionais Unix-like tipicamente consistem em centenas ou até milhares de pacotes de software distintos. 2.3.1 Objetivos de um sistema de gerenciamento de pacotes Sistemas de gerenciamento de pacotes possuem a responsabilidade de organizar todos os pacotes instalados no sistema e também de manter sua usabilidade. Algumas funções adicionais estão presentes apenas em alguns sistemas de gereciamente de pacotes. Tipicamente, as funções de um sistema de gerenciamente de softwares são:

2.3 Sistemas de gerenciamento de pacotes 14 Agrupar pacotes de acordo com a função, para melhor entendimento do usuário; Verificar arquivos checksums para assegurar corretude e completude dos pacotes; Verificar assinaturas digitais que autenticam a origem do pacote; Atualizar o software com a última versão, geralmente disponível por meio de um repositório de software; Gerenciar dependências para assegurar que a instalação do pacote é feita juntamente com todos os requisitos. 2.3.2 Definição de pacote Há duas maneiras de se instalar um software no Linux. A primeira é a partir do código fonte, quando uma sequência de três comandos costuma se repetir sempre: #./configure # make # sudo make install Esta alternativa é complicada, pois o usuário tem que simular o sistema que o desenvolvedor possuía na sua máquina quando criou o programa, o que inclui compiladores, bibliotecas e, geralmente, outros softwares do qual o novo depende. A segunda forma consiste em baixar e instalar um pacote, que nada mais é que um arquivo que contém, entre outras coisas: o código fonte compilado. Tipicamente, um pacote possui os seguintes tipos de arquivos: Bibliotecas; Arquivos de configuração; Páginas de manual; Metadados, por exemplo: versão do software, descrição, autor; Licença de uso;

2.4 Repositórios e Sistemas de Gerenciamento de Pacotes 15 Histórico de mudanças (changelogs) ocorridas do software. Cada pacote possui uma hierarquia de arquivos armazenada de forma compactada. Quando o mesmo é instalado, descompacta-se esta estrutura no sistema de arquivos do sistema operacional, tornando-se pronto para uso. Alguns pacotes permitem que o usuário ajuste certas configurações após a instalação de forma iterativa. Os gerenciadores de pacotes provem uma interface amigável para as etapas de instalação, atualização e remorção. Alguns gerenciadores de pacotes permitem que softwares possam ser instalados clicando-se no instalador do programa que na verdade executa o gerenciador de pacotes passando os parâmetros para instalar aquele software específico. 2.3.3 Advanced Packaging Tool (APT) O APT foi usado, a princípio, na distribuição Debian e suas derivadas. Pode ser definido como uma biblioteca de rotinas que age como uma interface de iteração com o dpkg, software que é a base do gerenciamento de pacotes no Debian, responsável por instalar, desinstalar e atualizar pacotes.deb. O APT extende as funções do dpkg, dentre as quais se destaca a resolução de dependências. Apesar do APT ter origens no Debian, ser usado com pacotes.deb e se manter fiel a esta linha ao longo do seu período de existência, ele pode ser usado com outros formatos de pacotes (.rpm) e outros sistemas como OpenSolaris, Ubuntu GNU/Linux e OS X (9). 2.4 Repositórios e Sistemas de Gerenciamento de Pacotes Um repositório de software consiste num local de armazenamento do qual pacotes de aplicativos estão disponíveis para download. Várias organizações mantem servidores na internet com este propósito, um serviço disponibilizado gratuitamente e sem necessidade de cadastro. Repositórios podem servir apenas pacotes particulares, ou para um sistema operacional inteiro, como o CPAN para a linguagem de programação Perl, como a distribuição GNU/Linux Ubuntu.

2.5 Gerenciamento de configuração 16 Como repositórios de software são destinados a incluir pacotes mantidos por empresas e organizações, a maioria dos repositórios são conhecidos como livres de malware. Se um computador é configurado para usar apenas repositórios digitalmente assinados de um fornecedor com boa reputação, isso reduz significamente a infecção do sistema com malwares. Como efeito colateral, a maioria desses sistemas podem permanecer livre de malware mesmo sem a instalação de um programa anti-virus. A maioria das distribuições GNU/Linux possuem espelhos de seus repositórios principais instalados em várias partes do planeta para aumentar a disponibilidade e descentralizar a distirbuição dos softwares. 2.4.1 Repositório Reprepro Reprepro é uma ferramenta para gerar o repositório que armazena pacotes Debian (.dsc,.deb e.udeb). Um repositório APT consiste em 2 partes: um lista descrevendo o que está disponível e onde está o pacote binário Debian (.deb), instalador binário (.deb), e o código fonte (arquivos com extensão.dsc e.tar.gz ou.orig.tar.gz e.diff.gz) para que ferramentas como APT saibam quais os pacotes disponíveis e como obtê-los. Reprepro gerencia as versões dos pacotes mantendo apenas a versão mais atual. Os arquivos são armazenados utilizando o Berkley DB 1, logo não é necessário a instalação de sistema de banco de dados. 2.5 Gerenciamento de configuração Para realizar a configuração da instalação do BeeFS em máquinas, o uso de uma ferramenta de gerenciamento de configuração centraliza e torna o gerenciamento mais prático e escalável, diminuindo o risco de existir uma configuração inadequada. 2.5.1 Puppet Puppet é um framework voltado para gerenciar de forma eficiente a infraestrutura de um data center. Reduz quantidade de erros de configuração e de downtime, economizando 1 Oracle Berkeley DB é um banco de dados embarcado transacional open source que permite aos desenvolvedores incorporar em suas aplicações.

2.6 Tracers 17 horas de trabalho e provendo uma melhor qualidade de serviço. Puppet permite que administradores de sistemas gastem menos tempo em tarefas técnicas e repetitivas como as atividades administrativas (adicionar usuários, instalar pacotes, atualizar configurações, etc.) independente da quantidade de sistemas, usando o mesmo código, mesmo que as máquinas possuam sistemas operacionais diferentes (6). Por meio de uma linguagem declarativa, é possível descrever a configuração de sistemas; definir versões e pacotes de softwares que devem ser instalados, atualizados ou removidos; assegurar permissões de arquivos, iniciar serviços; realizar cópias de backup de arquivos; entre outros. Com a utilização do Puppet, a instalação do BeeFS pode ser definida numa máquina centralizada servidor do Puppet, e o próprio sistema se encarrega de realizar as especificações de instalação nas máquinas desejadas, no nosso caso as máquinas do Laboratório de Sistemas Distribuídos. 2.6 Tracers Traces de arquivos de sistemas tem sido utilizados por anos para analizar o comportamento de usuários e softwares, contribuindo para avanços nas tecnologias de armazenamento e sistemas de arquivos. Geralmente, a captura desses traces é feita de forma específica e com apenas as informações desejadas pelo seu desenvolvedor, que diminui sua reusabilidade: eles perdem informações consideradas vitais para outros usuários usarem e não pode facilmente ser distribuídos por questões legais de privacidade. Outras formas de trace (nível de bloco, nível NFS, nível de chamada de sistema) todos contém uma ou mais deficiências, limitando sua utilidade para estudos mais amplos (8). Traces de sistemas de arquivos tem sido utilizado no passado para analisar padrões de acesso aos arquivos pelos usuários e performance de software. Estudos utilizando esses logs ajudaram a comunidade a manter manuntenção aos softwares e hardwares em desenvolvimento (10, 11, 13). Além da utilização de traces para estudos de performances (10), existem dois outros usos: análise de segurança do software e debugging. Primeiro, monitoramento de sistema de arquivo é útil para segurança e auditoria. Análise das operações em sistema de arquivos

2.6 Tracers 18 podem ajudar a detectar intrusos a partir da filtragem de acessos por usuários, processos ou programas. Segundo, traces são úteis para debuging de sistemas de arquivos, auxiliando a localizar possíveis bugs e pontos de falha. Um software capaz de monitorar todas operações de um sistema de arquivos e que possui instalação sem requisitar modificações no sistema de arquivos a ser monitorado são particularmente mais adequandos para realização da depuração por não alterar o comportamento do sistema a ser analisado.

Capítulo 3 Atividades Realizadas De acordo com o andamento do estágio, uma atividade não prevista surgiu, que foi a instalação do software Puppet. As outras atividades foram estudar uma forma de obter traces de operações de um sistema de arquivo e a realização do deployment do BeeFS. 3.1 Monitores de sistema de arquivos Uma das formas de realizar uma comparação de desempenho do BeeFS em relação a outros sistemas de arquivos distribuídos, como o NFS, é saber o tempo que leva a execução de cada operação no sistema de arquivo, como gravar ou ler um arquivo. Para tal comparação, a obtenção de um log registrando: o tempo de duração das operações, o momento no qual ocorreram e as informações peculiares de cada operação era necessário, e para isso, foi feita uma busca por softwares dessa natureza. Foram analisados dois programas: TraceFS e Loggedfs. 3.1.1 TraceFS TraceFS é um aplicativo que comporta-se como uma fina camada utilizada para gerar traces de sistemas de arquivos. TraceFS é capaz de ser configurado dinamicamente para capturar qualquer número de eventos no sistema de arquivo por nome de arquivo ou extensão, dono, grupo, processo, quantos acessos por dia, entre outras informações. 19

3.1 Monitores de sistema de arquivos 20 As informações capturadas pelo TraceFS são concebidas para ser auto-explicativas e sucintas. Ele é capaz de, apartir de seus logs, realizar a replicação das operações registradas nos traces, tornando-se um diferencial dentre os softwares de monitoramente de sistema de arquivos. Implementado em 2004, utilizando a linguagem de programação C e distribuído sob a licença GPLv2, teve a última release no dia 12 de outubro de 2007. Desde então, o código não sofreu atualização e as funções utilizadas providas pelo kernel linux foram modificadas ou removidas. Para atender aos requisitos de contabilizar o tempo da execução das operações e o momento de início de cada uma das operações, era necessário modificar parte do codigo do TraceFS, mas atualmente não é possível compilar seu código. Apesar disso, tentativas de modificação foram realizadas, mas sem sucesso. Logo, o uso do TraceFS para monitorar as operações em sistemas de arquivos foi descartado. 3.1.2 LoggedFS LoggedFS é um sistema de arquivos implementado utilizando FUSE 1 o qual permite gravar toda operação que acontece no backend de um sistema de arquivos. LoggedFS possui um aquivo de configuração XML o qual o usuário pode escolher exatamente o que deseja gravar por meio de filtros. Esses filtros podem conter especificações de operações realizadas apenas por determinados usuários, operações (open, read, write, chown, chmod, etc.), nomes dos arquivos e código de retorno de execução entre outros. Os filtros de nomes de arquivos são feitos utilizando expressões regulares. LoggedFS apenas envia a mensagem para o gerenciador de logs syslog quando chamado pelo FUSE e depois permite que o real sistema de arquivos prossiga com a operação. Monitorando todas operações em um sistema de arquivos e de fácil instalação, o LoggedFS faz quase o que era desejado. Entretanto, também era necessário registrar a duração dos tempos de execução e o momento no qual ocorreu cada operação. A implementação do LoggedFS vem sido mantida, o que viabilizou as mudanças para 1 API para implementação de sistemas de arquivos em espaço de usuário

3.1 Monitores de sistema de arquivos 21 capturar todas informações necessárias. 3.1.3 Modificações necessárias Toda operação capturada é armazenada contendo: o momento em que ocorreu, a linha do código que registrou a operação, o tipo de operação, a pasta onde ocorreu a operação, se a execução foi terminada com sucesso ou falha, seguido do identificador e nome do processo e o usuário que o executou. Para maior detalhes sobre a operação, foi adicionado no código do LoggedFS instruções que registram o timestamp 2 de inicio e fim de cada operação. Com esses valores foi possível calcular o tempo total de operação medido, medido em milisegundos, o qual é gravado no log. Esse log, antes da modificação, era gerado da seguinte forma: 06:39:25 (src/loggedfs.cpp:155) statfs /local/ {SUCCESS} [ pid = 2990 /usr/sbin/snmpd uid = 115 ] Após a modifição, a mesma operação foi armazenada assim: 06:39:25 (src/loggedfs.cpp:155) 1259573965 00000 statfs /local/ {SUCCESS} [ pid = 2990 /usr/sbin/snmpd uid = 115 ] Onde a diferença pode ser notada por 2 números adicionais: 1259573965 que representa o timestamp da operação e 00000 que significa a duração da operação, medida em milisegundos. Para uma maior quantidade de log gerado para futura análise, o executável de inicialização do LoggedFS foi modificado para monitorar todos os sistemas de arquivo disponíveis da máquina a ser monitorada. Utilizando os computadores do LSD, os sistemas de arquivos monitorados foram EXT3, EXT4 e NFS. 2 Número inteiro que representa a contagem de segundos iniciado em 19 de janeiro de 1970

3.2 Gerenciamento de pacotes 22 3.1.3.1 Problemas identificados Por fazer uso tecnologia FUSE, o qual requer permissão de super usuário (root) para sua inicialização, a utilização do LoggedFS para monitorar um sistema de arquivo NFS, foi necessária desativar a flag no_root_squash, o que permite que super usuários remotos possam modificar o sistema de arquivos. A desativação dessa opção não é recomendada por motivos de segurança e privacidade. Logo, a pasta correspondente ao diretório pessoal dos usuários não foi monitorada. Atualmente, a instalação do LoggedFS está em fase de avaliação, com apenas 5 máquinas do Laboratório de Sistemas Distribuídos, pois após a modificação, a execução do LoggedFS é interrompida após a ocorrência de uma falha de segmentação, bloqueando o acesso ao sistema de arquivo monitorado. 3.2 Gerenciamento de pacotes O BeeFS possuia uma instalação sem auxílio além do tutorial presente em sua página: para sua execução era necessário apenas de descompactar o software, inserir as informações em seu arquivo de configuração e iniciar o serviço. Porém, ao realizar esse procedimento em várias máquinas repetidamente, foi notado que o uso de um gerenciador de pacotes seria muito mais prático e contribuiria com a disseminação o software pela comunidade. Pensando nisso que foi sugerido o uso de gerenciador de pacotes APT para prover o BeeFS à comunidade. O sistema de gerenciamento APT foi escolhido dentre os existentes pois o ambiente no qual se realizaria o deploy, era em sua maioria, eram computadores com o sistema operacional Ubuntu GNU/Linux e Debian GNU/Linux, os quais fazem uso do gerenciador APT. Além disso, o APT provê uma gerência de versão de pacotes e resolução de dependências do software, facilitando a realização do deploy da aplicação BeeFS. 3.2.1 Instalação do repositorio Reprepro Para a funcionalidade de repositório, foi utilizado o software reprepro (conhecido também como mirroer) para prover esse serviço. Ele é distribuido com uma licença GPLv2. Além

3.2 Gerenciamento de pacotes 23 de disponibilizar o pacote, repositórios de softwares são usados para prover segurança e confiabilidade para seus usuários, por possuir assinatura digital, o que garante que os pacotes ali armazenados não estão corrompidos ou adulterados. Futuramente esse repositório será utilizado para distribuir pacotes de instalação de outros sistemas criado, como o OurGrid, constriído pelo LSD. Utilizamos uma máquina com o sistema operacional Debian GNU/Linux instalado para efetuar a instalação do Reprepro. De acordo com a Linux File System (LFS), que define regras de localização de arquivos de acordo com o uso dentro do sistema operacional (3), a pasta de armazenamento de arquivos mutáveis disponíveis por um servidor HTTP ficam preferencialmente localizados na pasta /var/. Logo, nela foi criado uma pasta na qual todo o repositório foi instalado. O nome da pasta escolhida foi apt, simbolizando que o repositório é compatível com APT. A pasta foi criada, juntamente com a pasta de configuração que deve ser chamada conf, de acordo com as regras do reprepro. # mkdir -p /var/www/apt # mkdir /var/www/apt/conf A pasta conf deve possuir o arquivo de configuração que define as características do repositório. Esses dados ficam descritos dentro do arquivo chamado distributions, no qual podem ser definidos os seguites parâmetros: origem, label, suite, apelido do repositório, arquitetura suportada pelos softwares disponibilizados por ele, componentes e descrição. Com essas opções, o arquivo de configuração criado foi: Origin: LSD Label: unstable Suite: unstable Codename: unstable Architectures: i386 amd64 all Components: main non-free contrib Description: LSD-UFCG Software repository Feito isso, o repositório está instalado e provendo pacotes classificados como unstable. Outras suites de repositórios podem ser adicionadas ao arquivo de configuração, de acordo

3.3 Criação dos pacotes 24 com a necessidade du usuário. No momento existe apenas a suite unstable pois o pacote BeeFS não está com a implementação definitivamente estável. Após a instalação do repositório, para armazenar e prover um pacote à comunidade, é necessario importar os pacotes que deseja-se distribuir. A importação de um pacote pode ser feita da seguinte forma: reprepro includedeb unstable beefs-common_0.1-beta_all.deb Caso o pacote importado já exista no repositório, e a versão existente seja anterior a que se está adicionando, o pacote é substituido. Caso contrário, é dada uma mensagem de erro informando que a importação não foi concluída. A remoção de um pacote do repositório pode ser realizada especificando o nome do pacote e qual suite ele pertence. beefs-common, o comando fica: Utilizando o exemplo da importação do pacote reprepro remove beefs-common unstable Por fim, foi configurado um servidor HTTP (por meio da instalação do pacote apache2) para prover o acesso ao repositório. O servidor HTTP foi configurado para prover acesso ao repositório por meio do endereço http://packages.lsd.ufcg.edu.br/apt. 3.3 Criação dos pacotes Para criação do pacote, foi necessário um estudo sobre como é a organização de um pacote Debian (.deb) e realização do mapeamento dos atuais arquivos de instalação do BeeFS de acordo com a convenção Linux File System (LFS) (3). Toda essa atividade pode ser claramente dividida em 2 fases: primeira e segunda versão de pacote do BeeFS. A primeira versão foi visando um aprimoramento e automização da instalação do BeeFS, e a segunda versão foi uma evolução da versão anterior, com o objetivo de separar os componentes do BeeFS.

3.3 Criação dos pacotes 25 3.3.1 Primeira versão do pacote Utilizando a convenção definida pela LFS os arquivos presentes no software BeeFS foram relocalizados e sua organização de arquivos ficou da seguinte forma: a pasta /etc possui os arquivos de configuração necessários para a inicalização do BeeFS. Na pasta /usr/lib/beefs, está armazenado as bibliotecas e a implementação do BeeFS. Em /usr/sbin/ existe links simbólicos para os executáveis do software. No diretório /var/lib/beefs é armazenado os arquivos criados pelo BeeFS, que corresponde a informações sobre os arquivos armazenados e sobre seus metadados. Por fim, os logs gerados são armazenados na pasta /var/log/beefs. 3.3.1.1 Arquivos de instalação do pacote Um pacote Debian possui, além do software o qual deseja-se instalar, que identificam o pacote e executam operações adicionais de instalação, como parar o serviço antes de uma inicialização ou mudar permissões e usuários de arquivos do software. Esses arquivos seguem a convenção descrita no Guia do Novo Mantenedor Debian (4) que são: conffiles Arquivo que contém a lista de arquivos de configuração do software; control Arquivo contendo a descrição do pacote; copyright Licença de distribuição do BeeFS; debian-binary Contém a versão do pacote (2.0); postinst Script executado após a extração do pacote; preinst Script executado antes da extração do pacote; postrm Script executado após a remorção do pacote; prerm Script executado antes da remorção do pacote; templates Arquivo contendo as perguntas e opções utilizadas na iteratividade com o usuário durante a pós-instalação do pacote. Dentre esses arquivos, o único o qual a existência é obrigatória é o arquivo control. Define uma descrição completa sobre o pacote para que o repositório no qual ele está

3.3 Criação dos pacotes 26 armazenado, tenha conhecimento de seu nome e versão, entre outras informações. No pacote construído do BeeFS, o conteúdo desse arquivo control é: Package: beefs Priority: optional Version: 0.002 Architecture: all Installed-size: 2252 Maintainer: Jonhnny Weslley, Thiago Emmanuel and Alexandro Soares Section: utils Depends: fuse-utils (>=2.7), libfuse2 (>=2.7), sun-java6-jre (>=6) openjdk-6-jre (>=6), debconf (>= 0.5) debconf-2.0 Homepage: http://lsd.ufcg.edu.br/beefs Description: A distribuited filesystem for corporative use BeeFS is a distributed file system for corporative use that harnesses the free disk space of desktops machines (already deployed on the corporation). By exploiting the computational underutilized infrastructure, BeeFS can build an aggregate storage area in a much more economic fashion than the prevalent dedicated servers approach. Furthermore, increases on service s demand (frequently caused by arrival of new corporative users) can be handled on a more precise way, by adding a single desktop (usually a new user comes together a new desktop). Esse arquivo contém, em sequência: o nome do pacote, prioridade de instalação, versão do software, arquitetura, espaço ocupado medido em KB após a instalação, mantenedores do software, sessão relacionada para armazenamento no repositório, software necessários (dependências) para instalação do pacote, homepage do programa e descrição. 3.3.1.2 Scripts de auxílio à instalação do BeeFS O pacote BeeFS possui quatro scripts que são utilizados em sua instalação. postinst Script executado após a extração do pacote. Ele possui a responsabilidade iteragir com o usuário com perguntas sobre a configuração do software. Após receber todas as informações, é adicionado o usuário beefs, caso não existe; é feita uma checagem da existência dos diretórios informados e permissões dos arquivos de configuração. Por fim, esse script inicializa o BeeFS; preinst Script executado antes da extração do pacote. Caso esteja atualizando uma instalação já existente no sistema, esse script é responsável por parar o serviço antes da atualização dos arquivos do BeeFS;

3.3 Criação dos pacotes 27 postrm Script executado após a remorção do pacote caso a opção de remorção for purge, que elimina todos os arquivos do software, dessa forma, todos os arquivos criados como os dados brutos e arquivos de metadados são removidos. Numa simples deconfiguração, esse script não apaga os arquivos citados acima; prerm Script executado antes da remorção do pacote. Possui a responsabilidade de parar o serviço antes da deconfiguração ou purge. A implementação dos scripts postinst, preinst, postrm e prerm podem ser analisados no Apêndice B. 3.3.1.3 Instalação A instalação é feita de forma iterativa, questionando o usuário para inserir as informações básicas de configuração para funcionamento pleno do BeeFS. No inicio da configuração, é questionado quais os serviços que o usuário gostaria de instalar exibindo a tela mostrada na Figura 3.1. Os serviços disponíveis eram: Server, contendo o componente QueenBee, e Client que contem os componentes HoneyComb e HoneyBee. O usuário pode escolher apenas uma opção ou ambas. Se foi escolhido apenas a opção Server, a iteratividade é finalizada e o pacote é configurado para tal serviço. Caso contrário, após essa pergunta, se a opção escolhida seja apenas Client, é perguntado qual o IP ou nome do servidor no qual está instalado o componente QueenBee do BeeFS como é ilustrado na Figura 3.3. Caso ambas as opções foram escolhidas, assume-se automaticamente que a localização do componente Queen- Bee é localhost, e segue-se a configuração exibindo a próxima pergunta. Na Figura 3.4 exibe a tela que pede ao usuário que insira a quantidade de espaço que deseja agregar ao sistema de arquivo. Logo após, pergunta-se qual o diretório que fornecerá esse espaço (Figura 3.5) e por fim pergunta-se qual o diretório que montará o sistema de arquivo BeeFS como mostra a Figura 3.6. Os arquivos do BeeFS, após instalado, ficam organizados na seguinte árvore hierárquica:

3.3 Criação dos pacotes 28 Figura 3.1: Seleção de serviços do BeeFS Figura 3.2: Seleção de serviços do BeeFS

3.3 Criação dos pacotes 29 Figura 3.3: Tela para inserir o IP ou nome do servidor BeeFS Figura 3.4: Tela para inserir a quantidade de espaço que deseja compartilhar

3.3 Criação dos pacotes 30 Figura 3.5: Tela para inserir a pasta que armazenará os arquivos brutos Figura 3.6: Tela para inserir o diretório que montará o BeeFS