Infraestrutura de Redes de Sensores Sem fio para Monitoramento Térmico de CPDs



Documentos relacionados
IW10. Rev.: 02. Especificações Técnicas

SISTEMAS DISTRIBUÍDOS

Projeto de controle e Automação de Antena

Arquitetura de Rede de Computadores

REDE DE COMPUTADORES

1

Quadro de consulta (solicitação do mestre)

TRANSMISSÃO DE DADOS Prof. Ricardo Rodrigues Barcelar

4 Arquitetura básica de um analisador de elementos de redes

UNIVERSIDADE FEDERAL FLUMINENSE GUSTAVO ZANATTA BRUNO. SISTEMA PARA MONITORAMENTO TERMOENERGÉTICO DE CPDs

Projetos I Resumo de TCC. Luiz Rogério Batista De Pieri Mat:

Introdução a computação móvel. Middlewares para Rede de Sensores sem Fio. Uma avaliação na ótica de Adaptação ao Contexto

Introdução ao Modelos de Duas Camadas Cliente Servidor

Sistemas Distribuídos

PROCESSO DE DESENVOLVIMENTO DE SOFTWARE. Modelos de Processo de Desenvolvimento de Software

O que é Gerenciamento de Redes de Computadores? A gerência de redes de computadores consiste no desenvolvimento, integração e coordenação do

Roteamento e Comutação

Como medir a velocidade da Internet?

Gerenciamento de Incidentes

Evolução na Comunicação de

Especificações da oferta Gerenciamento de dispositivos distribuídos: Gerenciamento de ativos

O modelo ISO/OSI (Tanenbaum,, 1.4.1)

Bancos de dados distribuídos Prof. Tiago Eugenio de Melo

MRP II. Planejamento e Controle da Produção 3 professor Muris Lage Junior

Comm5 Tecnologia Manual de utilização da família MI. Manual de Utilização. Família MI

Tecnologia de Redes de Computadores - aula 5

CDE4000 MANUAL 1. INTRODUÇÃO 2. SOFTWARE DE CONFIGURAÇÃO 3. COMUNICAÇÃO

BlackBerry Mobile Voice System

Revisão 7 Junho de 2007

Hardware (Nível 0) Organização. Interface de Máquina (IM) Interface Interna de Microprogramação (IIMP)

Gerência de Redes: Modelos de Gerência de Redes: Modelo FCAPS: Ferramentas de Gerência de Redes:

Protocolo. O que é um protocolo? Humano: que horas são? eu tenho uma pergunta

COMPUTADORES NAS EMPRESAS Cloud Computing Prof. Reginaldo Brito

Claudivan C. Lopes

On Scalability of Software-Defined Networking

O que é isso? O que ocorreu? Como resolver os problemas? Pesquisas no IC-UFF. Computação Verde. Julius Leite

Tabela de roteamento

Assunto: Redes Com Menos Gastos

Como Utilizar Power over Ethernet para Reduzir o Consumo de Energia

TÍTULO: SERVIÇOS HTTP COM GEOPOSICIONAMENTO DE FROTA CATEGORIA: EM ANDAMENTO ÁREA: ENGENHARIAS E ARQUITETURA SUBÁREA: ENGENHARIAS

ICORLI. INSTALAÇÃO, CONFIGURAÇÃO e OPERAÇÃO EM REDES LOCAIS e INTERNET

Entendendo como funciona o NAT

Satélite. Manual de instalação e configuração. CENPECT Informática cenpect@cenpect.com.br

Redes de Computadores

Controle de Múltiplos Pivôs Centrais com um único Conjunto Motor-Bomba

Sistemas Distribuídos. Aleardo Manacero Jr.

3 Trabalhos Relacionados

Arquitetura de Redes: Camadas de Protocolos (Parte I) Prof. Eduardo

ADDRESS RESOLUTION PROTOCOL. Thiago de Almeida Correia

Administração de Sistemas de Informação Gerenciais

SMTP, POP, IMAP, DHCP e SNMP. Professor Leonardo Larback

Relatorio do trabalho pratico 2

FAÇA FÁCIL: DRIVER IGS PARA COMUNICAÇÃO DE PROTOCOLOS PROPRIETÁRIOS INTRODUÇÃO

Engenharia de Sistemas Computacionais

A ESCOLHA CERTA EM COMUNICAÇÕES WIRELESS

3 Um Framework Orientado a Aspectos para Monitoramento e Análise de Processos de Negócio

MÓDULO 7 Modelo OSI. 7.1 Serviços Versus Protocolos

SMART GRID EM ESPAÇOS POPULARES: DESAFIOS E POSSIBILIDADES. Bolsista do PET EEEC/UFG engenheiralaura1@hotmail.com.

Eficiência Energética em data centers. Vitor Souza Villela

Versão Liberada. Gerpos Sistemas Ltda. Av. Jones dos Santos Neves, nº 160/174

Estudo comparativo entre dois tradicionais algoritmos de roteamento: vetor distância e estado de enlace.

Sistemas Distribuídos Capítulos 3 e 4 - Aula 4

1 INTRODUÇÃO Internet Engineering Task Force (IETF) Mobile IP

2 Fundamentação Conceitual

Intranets. FERNANDO ALBUQUERQUE Departamento de Ciência da Computação Universidade de Brasília 1.INTRODUÇÃO

TRANSMISSOR ECF. Sistema de transmissão de arquivos Nota Fiscal Paulista. Manual de Utilização

Protocolo de comunicação para redes móveis aplicado ao trânsito

Manual Software Controle de Jukebox. Manual. Software Controle de Jukebox

BlackBerry Mobile Voice System

Gerenciamento de Problemas

Copyright 2013 VW Soluções

HCT Compatibilidade Manual do Usuário

PROJETO DE REDES

Fundamentos de Redes de Computadores. Elementos de Redes Locais

Visão geral das redes sem fio

IMPLEMENTAÇÃO DE SOCKETS E THREADS NO DESENVOLVIMENTO DE SISTEMAS CLIENTE / SERVIDOR: UM ESTUDO EM VB.NET

GT Computação Colaborativa (P2P)

Objetivos: i) Verificar o impacto de loops em redes locais ii) Configurar o protocolo STP para remover loops da rede

Introdução. Arquitetura de Rede de Computadores. Prof. Pedro Neto

Curso: Redes II (Heterogênea e Convergente) Tema da Aula: Características Roteamento

4 Segmentação Algoritmo proposto

Manual de Instalação. GPRS Universal

Wilson Moraes Góes. Novatec

MOBPROG. Manual rápido de utilização

Roteiro para a escrita do documento de Especificação de Requisitos de Software (ERS)

Protocolo Ethernet e Dispositivos de Interconexão de LANs

ISO/IEC 12207: Gerência de Configuração

5 Mecanismo de seleção de componentes

Veja abaixo um exemplo de um endereço IP de 32 bits:

Tecnologia e Infraestrutura. Conceitos de Redes

Subcamada MAC. O Controle de Acesso ao Meio

09/06/2011. Profª: Luciana Balieiro Cosme

ArpPrintServer. Sistema de Gerenciamento de Impressão By Netsource Rev: 02

5.2 MAN s (Metropolitan Area Network) Redes Metropolitanas

10 DICAS DE TECNOLOGIA PARA AUMENTAR SUA PRODUTIVIDADE NO TRABALHO

Guia de Conectividade Worldspan Go Res! A V A N Ç A D O

Transcrição:

Infraestrutura de Redes de Sensores Sem fio para Monitoramento Térmico de CPDs Gustavo Z. Bruno, Giulio Bottari, Breno Carvalho, Raphael Guerra, Julius Leite Instituto de Computação Universidade Federal Fluminense Niterói, RJ 24210-240 e-mail: {zanatta, gbottari, brenocarvalho, rguerra, julius}@ic.uff.br Resumo A sociedade é cada vez mais dependente de grandes centros de processamento de dados (CPDs). Sistemas de busca, sistemas de comércio eletrônico e computação em nuvem são exemplos de aplicações que necessitam de grandes CPDs. Um dos grandes desafios da Computação Verde é conciliar a demanda computacional desses centros com a necessidade de reduzir o seu custo de operação e o impacto ambiental causado pelo seu alto consumo de energia. Entre os principais responsáveis por esse consumo está o sistema de arrefecimento dessas instalações. Para aumentar a eficiência desses sistemas de arrefecimento primeiramente precisa-se monitorá-los com o objetivo de obter informações sobre o seu comportamento. Para fazer isso de uma maneira indireta e que seja o menos intrusiva possível para a instalação, propõe-se uma rede de sensores sem fio para monitoramento térmico distribuída pelo ambiente. A rede foi implantada em um CPD real e tem uma infraestrutura que permite a ela ser capaz de prover em tempo real os dados térmicos da instalação, com garantia de entrega acima de 99% e com precisão de milissegundos do instante de coleta. I. INTRODUÇÃO As Tecnologias de Informação e Comunicação (TIC) contribuem diretamente para mais de 2% das emissões globais de CO 2. A tendência é que esta quantidade dobre até 2020 [1]. Neste cenário, as TIC ultrapassariam emissões de indústrias altamente poluentes, como a de aviação. Um estudo realizado pela U.S. Environmental Protection Agency [2] em 2007 estimou a demanda de pico desses sistemas em 7 gigawatts. Os CPDs de todo mundo emitiram aproximadamente 116 milhões de toneladas anuais de carbono até 2008, mais que toda emissão da Nigéria [3]. Por conta do calor dissipado pelos diversos equipamentos presentes em um CPD, os servidores precisam de refrigeração adequada para operar de forma confiável. Assim, sistemas de arrefecimento em muitos CPDs são ajustados para operarem em temperaturas muito baixas. Grandes clusters comerciais requerem milhares de processadores e uma grande área para a sua instalação, e na maioria das vezes a instalação, os servidores e a distribuição de carga são heterogêneas. Desta forma, surge naturalmente um desbalanceamento térmico em diversas localidades do CPD. Esse tipo de fenômeno (i.e. ilhas de calor) é bem complexo e difícil de prever sem uma quantidade de informações precisas da instalação. Estima-se que para cada watt gasto com o processamento de dados, outro watt é consumido com arrefecimento [4]. Além disso, os gerentes de CPDs, por falta de informações para diagnosticar a causa real do problema, tendem a aumentar ainda mais a potência do sistema de arrefecimento quando alguns dos servidores se encontram próximos a um limiar térmico operacional. Um sistema de monitoramento baseado em redes de sensores sem fio (RSSF) tem a principal vantagem de ser independente do ambiente a ser monitorado (não-intrusivo), pois a alimentação dos dispositivos é autônoma, através de baterias. Adicionalmente, graças ao baixo consumo, apresenta um grande tempo de vida. Em CPDs, principalmente aqueles que lidam com informações sensíveis (e.g., CPDs de instituições financeiras), a baixa intrusão é condição fundamental para a adoção de qualquer solução de monitoramento. RSSFs também operam de forma eficiente e genérica independentemente das características do CPD monitorado, superando inúmeras restrições que podem ser encontradas em CPDs (i.e. acessibilidade, interação). Além disso, uma RSSF possibilita uma boa granularidade nos dados coletados independentemente do estado dos servidores do CPD (e.g. ligado, dormindo ou desligado). O ambiente do CPD configura uma ampla fonte de interferências a qualquer tipo de comunicação sem fio, principalmente em dispositivos de baixa potência, como os utilizados neste trabalho. Além disso existe a problemática comum a todas RSSF que possuem alimentação por meio de baterias, isto é, baixa longevidade dos nós. Por fim, há a necessidade de garantir uma precisão temporal do instante em que os dados foram coletados. Nesse contexto, o objetivo deste trabalho é investigar a viabilidade de uma rede de sensores sem fio para monitoramento térmico de CPDs. Para tanto, utilizou-se uma rede de sensores funcional instalada em um CPD real que coletou informações térmicas durante a operação normal da instalação. A infraestrutura da rede é baseada na agregação de tecnologias disponíveis para RSSF. A escolha das tecnologias priorizou ampla utilização e bom suporte da comunidade desenvolvedora. Essa solução é genérica, pois pode atender uma grande variedade de tipos de CPDs pelo fato de não necessitar de nenhuma interação direta com os sistemas da instalação. A rede proposta é capaz de coletar dados térmicos relativos ao ambiente do CPD com precisão de milissegundos. Nas próximas seções são apresentados alguns trabalhos relacionados que utilizam RSSF como solução para o problema de monitoramento térmico de CPDs. Na sequência são expostos a topologia da rede, seus componentes e configurações,

bem como protocolos utilizados. Por fim, discutem-se os principais experimentos realizados neste trabalho. II. TRABALHOS RELACIONADOS Dentre as abordagens já existentes para tratar o monitoramento termoenergético em CPDs predomina a característica delas serem altamente intrusivas (e.g. [5]), ou seja, não são transparentes para as aplicações que rodam nos servidores. Esse é o caso das políticas de gerenciamento de energia para CPDs que empregam alteração de frequência de operação do processador, ou desligamento de partes do hardware, por exemplo [6], [7]. Tais abordagens requerem uma avaliação caso-a-caso, de modo a respeitar os requisitos da aplicação. Até o momento, de acordo com o conhecimento dos autores, há duas abordagens baseadas em redes de sensores para o monitoramento térmico de CPDs: o ThermoCast [8] e o RacNet [9]. O ThermoCast é uma modelagem para previsão do comportamento térmico com o foco em grandes CPDs. Essa abordagem utiliza informações em tempo real da carga de trabalho, temperatura e fluxo do ar obtidos através de um conjunto de sensores do ambiente para modelar e prever temperaturas em torno dos servidores. Estes dados são obtidos a partir de sensores de temperatura colocados em alguns servidores. Com o intuito de obter alta previsibilidade, ThermoCast utiliza uma abordagem híbrida que leva em consideração à termodinâmica e as informações de carga. Entretanto, a abordagem é considerada altamente intrusiva, pois o algoritmo para previsão térmica executa distribuído entre os servidores. Além disso, utiliza sensores cabeados para coleta das informações do ambiente em torno dos servidores, e também coleta as informações da carga de trabalho dos servidores em tempo real e distribui a tarefa de modelagem para previsão térmica de anomalias a todos servidores. O RACNet [9] consiste em uma RSSF de grande escala e alta fidelidade para monitoramento ambiental (principalmente térmico) de CPDs. RACNet usa nós sensores, do tipo Genomote, que empregam uma combinação de comunicações com e sem fio. Como contribuição essencial do trabalho, desenvolveu-se um protocolo sem fio escalável e confiável para coleta de dados WRAP (Wireless Reliable Acquisition Protocol). Todavia, a solução tem duas características que deixam a desejar. A primeira delas é o fato de usar fio, mesmo que seja para interligar as cadeias de monitoramento, gerando algum transtorno ao ambiente dos CPDs, e consequentemente aos seus administradores. O segundo ponto é o fato de usarem alimentação USB, característica essa que soluciona o problema da economia de energia em RSSF e proporciona uma granularidade fina nos dados coletados (i.e. uma coleta periódica a cada 30 segundos), porém, acaba tornando a solução mais intrusiva. III. TOPOLOGIA Uma organização comum de CPDs é à disposição dos racks em corredores frios e quentes. A Figura 1 ilustra um corte transversal em um CPD típico. Os racks de servidores são instalados em um piso elevado, e o ar frio é injetado pelo sistema de arrefecimento através de grelhas nos corredores frios. Por sua vez, os servidores sugam ar frio e expelem Figura 1. Dinâmica do fluxo de ar em um CPD típico. ar quente (nos chamados corredores quentes) através de suas ventoinhas. De forma a diminuir a recirculação de ar, os racks são dispostos de forma que as saídas dos servidores (ar quente) fiquem face a face. Além dos desafios impostos pelo sistema de arrefecimento, também existem as diferenças térmicas geradas pelas heterogeneidades do CPD. Essas heterogeneidades causadas pelas diferenças de hardware, software e carga computacional podem gerar um comportamento térmico indesejável no ambiente (i.e. ilhas de calor). De forma a capturar as informações térmicas, os nós são dispostos verticalmente, em várias alturas nos racks. Nos casos em que o nó base estiver muito longe dos nós coletores, são inseridos nós roteadores. A quantidade de sensores por rack varia em função de granularidade da informação térmica desejada. IV. COMPONENTES DA RSSF A RSSF proposta neste trabalho é composta por dois tipos de dispositivos de comunicação e processamento: o modelo Iris [10] e o Micaz [11]. Os dispositivos que estão conectados ao computador são acoplados a uma placa gateway modelo MIB 520 [12] que possibilita a comunicação entre a RSSF e um servidor por meio de uma porta no padrão Universal Serial Bus (USB). Nos demais dispositivos são acoplados a placa de sensoriamento MDA 100 [13] que provê sensoriamento de temperatura e luminosidade. V. CONFIGURAÇÕES DA RSSF Nesta Seção são discutidos detalhes da infraestrutura de suporte utilizada para desenvolvimento da RSSF e do sistema para monitoramento, disponibilização e exibição dos dados. Serão descritos o hardware, a plataforma de desenvolvimento e detalhes dos protocolos utilizados. Durante os estudos iniciais para o desenvolvimento da proposta aqui apresentada optou-se por utilizar "soluções de prateleira" 1. Diante disso, foram escolhidas para desenvolvimento as soluções que possuem maior aceitação na comunidade que trabalha com RSSF. 1 Um software ou hardware pré-desenvolvido por um fornecedor terceiro. Ele pode ser alugado, comprado ou gratuito (código aberto).

A. Sistema Operacional O SO adotado para desenvolvimento da aplicação embarcada para a RSSF é o TinyOS [14] na versão 2.1.2. Ele tem um modelo de programação baseado em componentes, codificado na linguagem NesC [15], um dialeto da linguagem de programação C. O TinyOS é uma estrutura de programação para sistemas embarcados que agrega um conjunto de componentes que permitem a construção de uma aplicação específica para cada contexto. B. Protocolo MAC O protocolo utilizado na camada MAC é o Box-MAC-1 [16], [17], uma versão melhorada do popular Berkeley MAC (B-MAC) [18] para gerenciamento do duty-cycle dos rádios dos nós da RSSF. No Box-MAC-1, quando um nó deseja enviar um pacote ele fica enviando pacotes de despertar até o nó destinatário acordar e fazer a verificação do meio. Assim que o nó destinatário acorda e checa o meio, percebe que tem algum nó desejando enviar algo e ativa seu rádio para receber o pacote. Esta técnica visa a economia de energia permitindo que o rádio dos nós fique desligado por mais tempo quando não há envio de pacotes. No entanto, quanto maior o período que um nó dorme, maior o tempo no pior caso que um nó deve enviar mensagens de despertar. Logo, o tráfego na rede deve ser levado em conta ao definir o tempo máximo que cada nó fica com o rádio desligado. C. Protocolo de Rede O protocolo utilizado para manter a topologia da rede e possibilitar a comunicação por múltiplos saltos é o CTP [19]. Ele provê um serviço básico e bastante comum em redes de sensores, que é coletar dados de vários sensores espalhados no ambiente e transportá-los a um ou mais nós centrais (i.e. roots), como é ilustrado na Figura 2. A ideia básica é a construção automática de uma rede mantendo a topologia em árvore, com uma ou mais raízes dependendo da escala e densidade da RSSF. O protocolo de coleta constrói e mantém um caminho com custo mínimo para o(s) nó(s) que anunciam-se como raiz da árvore. O protocolo é livre de endereço: quando existem múltiplas raízes, ele envia para uma com o custo mínimo e sem saber seu endereço. Não há especificação de destino direta nas mensagens trocadas pelos nós. O endereçamento de destino é indireto e sempre para uma raiz (root) da rede. D. Protocolo para Sincronia de Relógios Para manter os relógios dos nós na rede sincronizados, o FTSP [20] foi utilizado. Esse protocolo possui precisão de microssegundos e é escalável a redes com centenas de nós, mantendo a robustez independentemente de mudanças na topologia da rede e falhas diversas. Periodicamente o nó root de sincronia (i.e. on nó com menor id ativo na RSSF) envia o tempo para os demais nós que o propaga e assim sucessivamente até o tempo convergir em toda a RSSF. O algoritmo utilizado pelo protocolo compensa os erros ao empregar o conceito de MAC timestamp [21], isto é, a timestamp é inserida na camada MAC pouco antes do envio minimizando o risco de acumular atrasos devido a processos internos do nó. O desvio entre as frequências dos relógios é compensado Figura 2. Funcionamento básico do CTP [19]. utilizando uma técnica baseada em regressão linear para evitar o envio frequente de mensagens de sincronia. Neste trabalho fez-se algumas adaptações para adequar o protocolo às necessidades da aplicação. Seguem os detalhes das alterações: (i) a frequência de envio de mensagens de sincronia é de uma mensagem a cada dez minutos; (ii) o período máximo para um nó se declarar root é a expiração de duas vezes o período de sincronia, isto é, se o nó ficar por 20 minutos sem receber a mensagem de sincronia ele se declara root, com exceção do nó com ID 0, que é o nó base, que assim que entra na RSSF já se declara root; (iii) um nó qualquer da rede, após se declarar root, ignora por duas vezes o período de sincronia de mensagens de outro nó root qualquer (esse mecanismo provê mais estabilidade na eleição do root de sincronia); (iv) um nó só pode sinalizar como sincronizado caso tenha pelo menos duas entradas na tabela utilizada para regressão, mas pode disseminar mensagens de sincronia imediatamente após o recebimento da primeira; (v) por fim, se o erro entre o relógio local e o global for maior que 100 milissegundos, a tabela de pontos de referência temporais utilizada no cálculo da regressão linear é apagada. Vale observar que o nó root nesse contexto é o nó responsável pela disseminação do tempo na RSSF, não sendo necessariamente um nó consumidor. E. Protocolo para Disseminação de Código Para facilitar os testes e as futuras atualizações no código da aplicação embarcada, utilizou-se o protocolo Deluge [22]. Esse protocolo fornece uma maneira eficiente para disseminação de grandes conjuntos de dados, como programas binários, para muitos nós pertencentes a uma RSSF, eliminando o trabalho de inserir/atualizar o código em cada sensor individualmente. Combinando este mecanismo com um comando para disseminação e um mecanismo para gerenciamento de boot, ambos providos pelo protocolo, torna-se viável a programação remota dos nós da RSSF. F. Aplicação para Coleta de Informações A aplicação embarcada para coleta de informações tem como função principal a aquisição dos dados térmicos de forma confiável (precisão temporal do instante de coleta). Ela é composta basicamente por uma thread que faz verificações periódicas na temperatura, no estado da bateria e na topologia da rede e transmite esses dados em função de dois fatores: caso

alguma dessas variáveis se alterem mais de que um determinado limiar (e.g. a temperatura varie 0,5 C, a luminosidade do ambiente ou topologia se altere), ou um nó fique sem enviar por um determinado limiar de tempo (e.g. 5 minutos). Esses critérios visam reduzir a quantidade de informações que são geradas pela rede e filtrar variações mínimas de temperatura do ambiente. Os experimentos efetuados para analisar e determinar esses critérios são descritos na Seção VI-A. VI. EXPERIMENTOS A. Avaliação de Estratégias de Agregação de Dados Para execução dessa avaliação, a leitura de dados do ambiente pelos nós da RSSF foi emulado utilizando um trace contendo dados de temperatura reais que foram coletados anteriormente no CPD em que a RSSF foi imlantada. O objetivo é verificar qual estratégia de envio gera menos tráfego na RSSF, no contexto do monitoramento térmico de CPDs, e consequentemente diminui o consumo energético. Para tanto, é feita uma análise do comportamento do número de transmissões em função da estratégia de envio utilizada. O arquivo utilizado para simular os dados coletados pela RSSF continha três valores: uma identificação do nó que fez a leitura do dado, uma timestamp contendo a hora que foi coletado e a temperatura coletada. Tabela I. TRÁFEGO GERADO PELAS ESTRATÉGIAS DE ENVIO. um Delta menor que esse foram desconsiderados. Para obter um equilíbrio entre a necessidade de informações precisas e a necessidade de reduzir o tráfego da RSSF foi escolhido o Delta de 0,5 C. Por fim, o tempo limite máximo para envio é o mínimo possível que atenda as restrições de consumo energético da RSSF sem comprometer a segurança do CPD. Esse parâmetro é estudado com mais detalhes na Seção VI-B e fica definido como cinco minutos. B. Frequência da Verificação de Atividade dos Nós da RSSF O objetivo desse teste é identificar qual é o tempo limite que um ou mais nós podem ficar sem enviar nenhuma informação sem correr o risco de comprometer a supervisão do CPD pela falta de alerta ao administrador do CPD por falha na coleta dos dados pela RSSF. Para a análise foi levada em conta como o pior caso uma situação em que o sistema de arrefecimento falhe completamente. Esse intervalo merece uma atenção especial pois, durante este período, não é possível identificar uma falha na rede. Os dados críticos para execução desse experimento correspondem a uma falha elétrica que desligou o sistema de arrefecimento do CPD monitorado. Os servidores ficaram ativos até que um mecanismo de proteção de hardware os desligassem. A RSSF colocada em torno dos servidores está descrita no layout ilustrado na Figura 3. A taxa de coleta/envio no contexto era de uma amostra de temperatura a cada minuto. Estratégia Parâmetros (segundos) Transmissões Ingênua Coleta/envio a cada 1 6065538 (100%) Aditiva min: 1, max: 30, incr: 1 252093 (4,2%) Aditiva min: 1, max: 10, incr: 1 562455 (9,3%) Aditiva min: 1, max: 8, incr: 1 688039 (11,3%) Aditiva min: 1, max: 2, incr: 1 2934492 (48,4%) Aditiva min: 2, max: 2, incr: 2 3032773 (50,0%) Aditiva min: 3, max: 3, incr: 3 2021850 (33,3%) Faixa delta = 0,001 C; max = 10 684811 (11,3%) Faixa delta = 0,1 C; max = 10 571899 (9,4%) Faixa delta = 0,2 C; max = 10 554298 (9,1%) Faixa delta = 0,2 C; max = 30 202227 (3,3%) Faixa delta = 0,5 C; max = 60 100544 (16,6%) Faixa delta = 0,5 C; max = 600 13420 (0,02%) Faixa delta = 1,0 C; max = 30 195835 (3,2%) Nesse experimento foram abordadas as seguintes estratégias: Ingênua, Aditiva e Faixa. A estratégia Ingênua é a que coleta e envia as amostras térmicas a cada segundo. A estratégia Aditiva consiste em um valor mínimo e máximo para o intervalo de coleta/envio das amostras e um valor para incremento do intervalo do ciclo. Conforme a temperatura permanece estável, o valor do intervalo é incrementado com o valor de incremento, se a temperatura se alterar o valor do incremento volta para o mínimo e o envio volta a ser frequente. A estratégia Faixa consiste em coletar amostras a cada segundo e somente enviá-las quando houver uma variação mínima entre as amostras ou quando atingir um intervalo máximo para envio. Como se pode observar na Tabela I, a melhor abordagem para o nosso cenário é a Faixa. Pode-se observar nos resultados das simulações com essa estratégia que quanto maior o valor do Delta e do tempo máximo para envio menos transmissões ocorrem. Entretanto, quanto maior for o valor do Delta, maior é a granularidade dos dados coletados e mais informações são perdidas. Devido a limitação de hardware, a precisão dos dados coletados pelos nós da RSSF é de 0,2 C, portanto, valores para Figura 3. Layout da RSSF no momento da falha do sistema de arrefecimento. Como se pode observar na Figura 4, após o desligamento do sistema de arrefecimento os servidores (06:25) levaram aproximadamente 40 minutos para desligar, isto é, paralisar todos os serviços que estavam sendo providos pelo CPD naquele instante (07:05). O nó que registrou o maior aumento de temperatura foi o 251. Por estar localizado em cima do rack da esquerda e receber o fluxo de ar direto do sistema de arrefecimento, ele registra um aumento de aproximadamente 8 C nos primeiros dez minutos sem refrigeração. Esse nó, durante todo o período de operação sem refrigeração (das 6:25 até as 7:05), detecta um aumento de 16 C, pois inicialmente estava registrando temperaturas em torno de 17 C e, quando os servidores falharam chegou a registrar 33 C. O nó que registrou temperatura mais elevada foi o 252 que, por estar na saída de um servidor bem em baixo do rack, como ilustrado na Figura 3, tem maior dificuldade de receber o fluxo de ar do

sistema de arrefecimento. Esse nó no instante da falha (06:25) já registrava 39 C chegou a registrar no pior instante (07:05) 50 C. Figura 5. Resultado do experimento variando o intervalo máximo para envio dos dados coletados. Obs.: Gráfico gerado pelo sistema apresentado nesta dissertação. Figura 4. Perfil do comportamento térmico no instante da falha do sistema de arrefecimento. Com base nesse experimento, pode-se observar que o ideal é enviar informações com a maior frequência possível, a fim de detectar a falha de um ou mais nós o quanto antes. Entretanto, em oposição a essa necessidade, tem-se o requisito básico de economizar energia, o que é feito principalmente minimizando o número de transmissões de dados dos nós da RSSF. Com objetivo de manter esse compromisso, e por conta desse experimento não avaliar o impacto da periodicidade de transmissão no consumo energético, foi executado o experimento para avaliar o impacto do tempo limite de envio dos dados coletados no consumo energético do nó descrito na Seção VI-C. C. Impacto do Tempo Limite de Envio dos Dados Coletados no Consumo Energético do Nó Esse experimento tem como objetivo verificar qual o tempo limite máximo possível para envio das informações coletadas de modo que não comprometa o tempo de vida dos nós sensores da RSSF. Para execução desse teste, foram utilizados quatro nós, cada um com um tempo limite para envio distinto, sendo eles: 5, 10, 15 e 30 minutos. Foram escolhidos esses valores pois, em experimentos realizados para intervalos menores que 5 minutos, o consumo energético aumenta de forma significativa, e consequentemente o tempo de vida dos nós cai. Para valores acima que 30 minutos, em caso de falhar a RSSF e coincidentemente acontecer alguma anomalia na instalação, um aviso com esse atraso pode ser muito tarde. Como pode ser visto da Figura 4 a temperatura registrada pelo nó 251 sobe aproximadamente 15 C em 30 minutos. Como se pode observar no gráfico da Figura 5 e diante dos dados exibidos na Tabela II, houve um ganho aproximado de 9,5% em tempo de vida dos nós utilizando o maior intervalo, ou seja 30 minutos, com relação ao menor intervalo, que é de cinco minutos. Assim, optou-se por perder esse ganho em tempo de vida e utilizar o menor intervalo para o tempo máximo para envio do nó, pelo fato desse valor possibilitar uma detecção precoce de falha nos nós da RSSF e no CPD. Tabela II. DETALHAMENTO DE RESULTADOS DO EXPERIMENTO PARA CÁLCULO DO CONSUMO ENERGÉTICO DO nó, VARIANDO O INTERVALO MÁXIMO PARA ENVIO DOS PACOTES. Intervalo de Envio (min) Tempo de vida estimado (dias) Consumo médio/dia (v) 5 0,031 38,05 10 0,030 38,50 20 0,030 38,88 30 0,028 41,69 D. Quantidade de Pacotes Perdidos Variando o Alcance do Rádio Essa simulação tem como objetivo variar a potência de transmissão do rádio dos nós da RSSF para verificar o efeito no número de saltos dos pacotes que trafegam pela RSSF. Excepcionalmente nesse caso foi escolhido utilizar uma simulação no lugar de um experimento prático para ter um controle preciso da potência do rádios dos nós. Para efeito de cálculo levou-se em conta as transmissões e retransmissões de pacotes da aplicação no trajeto dos nós consumidores até o nó root e também considerou o número de pacotes recebidos. Com base nesses valores, é possível calcular o número médio de saltos, bem como das perdas de pacotes (lembrando-se que essa perda não implica no não recebimento das informações pelo nó root, mas sim em reenvio dos pacotes a cada salto por conta de uma transmissão mal sucedida). Para execução da simulação, foi utilizado o simulador de aplicações nativas do TinyOs, o Tossim [23]. A aplicação utilizada para simulação foi o Multihope Osciloscope, presente nos aplicativos exemplos do TinyOs. Tabela III. RESULTADOS DA SIMULAÇÃO PARA CONTAGEM DO NÚMERO DE PACOTES ENCAMINHADOS PERDIDOS VARIANDO A POTÊNCIA DO RÁDIO DOS nós NA RSSF. Atenuação de potência Média de saltos Perdas % 50 db a cada 6 metros. 2.25 42.62 50 db a cada 3 metros. 2.66 43.93 30 db a cada metro. 2.68 41.21 50 db a cada metro. 3.41 67.69 60 db a cada metro. 0 100 Com base nas informações mostradas na Tabela III, podese observar que, quanto maior a atenuação do sinal, maior é o número de saltos e de perdas. Perda implica em retransmissão e como consequência, em maior consumo energético. Concluiu-se então que para fazer sentido reduzir a potência de

transmissão, esta ação deve fornecer um aumento de eficiência energética maior que o gasto com retransmissões a cada salto na RSSF. Para isso, foi feito um experimento prático onde foi medido o consumo energético de dois nós, um com o seu rádio configurado na potência de transmissão máxima e um na mínima disponível. Por meio desse experimento verificouse que não é viável para uma RSSF com mais de um salto no caminho do nó produtor ao root reduzir a potência do rádio, pois o consumo energético global da RSSF tende a ficar maior e consequentemente a longevidade da RSSF menor. VII. CONCLUSÃO Esse trabalho tem como objetivo verificar a viabilidade da utilização de uma RSSF de forma eficiente na coleta de informações térmicas do ambiente de um CPD. Para isso, a abordagem proposta teve que explorar alguns desafios impostos pela utilização RSSFs: confiabilidade, escalabilidade e longevidade. Esses desafios foram encontrados pelo fato do ambiente do CPD configurar uma ampla fonte de interferências a qualquer tipo de comunicação sem fio, principalmente em dispositivos de baixa potência, como os utilizados neste trabalho. Para tratar esses problemas, empregou-se o protocolo CTP ajustado para esse contexto, que aborda esses desafios através da combinação de três mecanismos: manutenção da árvore de coleta de dados dinamicamente; redundância dos pontos de coleta em combinação com a utilização de um protocolo assíncrono para um baixo consumo energético na comunicação, o Box-MAC-1 e, por consequência do atraso na entrega dos pacotes para o nó root em virtude do protocolo MAC utilizado, é também usado o protocolo FTSP para tratar sincronização dos relógios locais dos nós da RSSF. Com base nos diversos experimentos ficou evidente que a RSSF não só é capaz de coletar os dados do CPD, mas além disso faz isso de forma precisa e eficiente energeticamente. A RSSF consegue atingir uma longevidade (tempo de operação sem troca de bateria) que chega aos 40 dias de operação e também provê uma taxa de entrega de pacotes de mais de 99% graças à utilização do protocolo CTP. Características como essas, permitem que esses dados possam ser utilizados, por exemplo, para técnicas que façam a distribuição de carga de trabalho do CPD em função do comportamento térmico da instalação ou, até mesmo em técnicas que busquem detectar e prever anomalias térmicas no CPD. Por fim, as principais contribuições do trabalho são: a definição e implementação de uma RSSF para coleta de dados de um CPD e a experimentação dessa em um ambiente real. [5] D. Meisner, B. T. Gold, and T. F. Wenisch, Powernap: eliminating server idle power, in Architectural Support for Programming Languages and Operating Systems, Março 2009, pp. 205 216. [6] F. Ahmad and T. Vijaykumar, Joint optimization of idle and cooling power in data centers while maintaining response time, in ACM Sigplan Notices, New York, EUA, Março 2010, pp. 243 256. [7] W. Huang, M. Allen-Ware, J. B. Carter, E. Elnozahy, H. Hamann, T. Keller, C. Lefurgy, J. Li, K. Rajamani, and J. Rubio, Tapo: thermalaware power optimization techniques for servers and data centers, in 2nd IEEE Green Computing Conference and Workshops, Orlando, EUA, Julho 2011, pp. 1 8. [8] L. Li, C.-J. M. Liang, J. Liu, S. Nath, A. Terzis, and C. Faloutsos, Thermocast: a cyber-physical forecasting model for data centers, in 17th ACM Conference on Knowledge Discovery and Data Mining, vol. 11, San Diego, EUA, Agosto 2011. [9] C.-J. M. Liang, J. Liu, L. Luo, A. Terzis, and F. Zhao, Racnet: a high-fidelity data center sensing network, in 7th ACM Conference on Embedded Networked Sensor Systems, Novembro 2009, pp. 15 28. [10] MEMSIC, Iris datasheet, http://www.memsic.com. [11], Micaz datasheet, http://www.memsic.com. [12], MIB 520 datasheet, http://www.memsic.com. [13], MDA 100 datasheet, http://www.memsic.com. [14] P. Levis, S. Madden, J. Polastre, R. Szewczyk, K. Whitehouse, A. Woo, D. Gay, J. Hill, M. Welsh, E. Brewer et al., TinyOs: an operating system for sensor networks, in Ambient intelligence. Springer, 2005, pp. 115 148. [15] D. Gay, P. Levis, R. Von Behren, M. Welsh, E. Brewer, and D. Culler, The nesc language: A holistic approach to networked embedded systems, vol. 38, no. 5, pp. 1 11, Maio 2003. [16] D. Moss and P. Levis, Box-macs: Exploiting physical and link layer boundaries in low-power networking, Stanford University, Tech. Rep., 2008. [17] D. Moss, J. Hui, and K. Klues, TEP 105: low power listening, 2007, http://www.tinyos.net/tinyos-2.x/doc/html/tep105.html. [18] J. Polastre, J. Hill, and D. Culler, Versatile low power media access for wireless sensor networks, in ACM 2nd International Conference on Embedded networked Sensor Systems, Baltimore, EUA, Novembro 2004, pp. 95 107. [19] O. Gnawali, R. Fonseca, K. Jamieson, D. Moss, and P. Levis, Collection tree protocol, in 7th ACM Conference on Embedded Networked Sensor Systems, Novembro 2009, pp. 1 14. [20] M. Maróti, B. Kusy, G. Simon, and Á. Lédeczi, The flooding time synchronization protocol, in 2nd ACM International Conference on Embedded Networked Sensor Systems, Baltimore, EUA, Novembro 2004, pp. 39 49. [21] M. Maroti and J. Sallai, TEP 133: packet-level time synchronization, TinyOS Core Working Group, Tech. Rep., 2008, http://www.tinyos.net/tinyos-2.1.0/doc/html/tep133.html. [22] J. Hui, Deluge 2.0 - TinyOs network programming, 2005, http://www.cs.berkeley.edu/ jwhui/deluge/deluge-manual.pdf. [23] P. Levis, N. Lee, M. Welsh, and D. Culler, TOSSIM: Accurate and scalable simulation of entire tinyos applications, in 1st ACM International Conference on Embedded Networked Sensor Systems, Los Angeles, California, EUA, Outubro 2003, pp. 126 137. REFERÊNCIAS [1] K. Christensen, Green networks: Opportunities and challenges, in 34th IEEE Conference on Local Computer Networks, Zurich, Suíça, Outubro 2009, p. 13. [2] EPA, Report to congress on server and data center energy efficiency, 2007. [3] J. Mankoff, R. Kravets, and E. Blevis, Some computer science issues in creating a sustainable world, IEEE Computer, vol. 41, no. 8, pp. 102 105, Agosto 2008. [4] D. Mossé, J. Leite, and A. de Barros, Introdução aos Clusters Verdes de Servidores, in Atualizações em Informática, W. M. Jr. and A. de Carvalho, Eds. Porto Alegre, RS, Brasil: Sociedade Brasileira de Computação, Junho 2010, pp. 41 50.