Arquitetura de núcleo distribuído utilizando o sistema de switch central Z9000 Uma Nota Técnica da Dell
Esta nota técnica serve apenas para fins informativos e pode conter erros de digitação e erros técnicos. O conteúdo é fornecido como está, sem garantias expressas ou implícitas de qualquer tipo. 2011 Dell Inc. Todos os direitos reservados. É estritamente proibida a reprodução deste material em qualquer forma sem a permissão expressa por escrito da Dell Inc. Para mais informações, entre em contato com a Dell. Dell, o logotipo DELL, e o emblema DELL, PowerConnect e PowerVault são marcas registradas da Dell Inc. Symantec e o logotipo de Symantec são marcas registradas da Symantec Corporation ou de seus afiliados nos EUA e em outros países. Microsoft, Windows, Windows Server e Active Directory são marcas registradas da Microsoft Corporation nos Estados Unidos e/ou em outros países. Outras marcas registradas e nomes comerciais podem ser utilizados neste documento como referência às entidades proprietárias das marcas e nomes ou os seus produtos. A Dell Inc. nega qualquer interesse proprietário nas marcas e nomes comerciais que não sejam de sua propriedade. Setembro de 2011 Página ii
Índice Automatizando a rede...2 O desafio dos dados grandes...2 Redes de núcleo distribuído...3 Switch de núcleo distribuído Dell Force10 Z9000...4 Tornando malhas uma realidade...5 Resumo...6 Figuras Figura 1. Arquitetura convencional de datacenter de 3 camadas: Núcleo, Agregação e Acesso...3 Figura 2. Arquitetura de datacenter de núcleo distribuído aberto...3 Figura 3. Desempenho O Z9000 oferece 2,5 Tbps de capacidade de switch...4 Figura 4. redefinindo a economia de malhas com Z9000 Comparação do consumo de energia da expansão horizontal... 5 Figura 5. redefinindo a economia de malhas com Z9000 Comparação da ocupação de espaço da expansão horizontal... 6 Página iii
Automatizando a rede Conforme os datacenters são escalonados para suportar milhares de servidores, os gerentes de TI estão buscando formas melhores de conectar em rede aqueles servidores e reduzir custos e o consumo de energia. Além disso, em ambientes de cluster de datacenters de grande escala, a largura de banda de comunicação entre os nós está se tornando cada vez mais o gargalo principal. Para estes ambientes, as aplicações precisam trocar informações com nós remotos para execução da sua computação local. Por exemplo, os mecanismos de busca da web exigem comunicação paralela com cada nó no cluster para oferecer os resultados mais relevantes e os servidores web podem exigir interação com centenas de subsserviços sendo executados em nós remotos. Os nós de computação localizados entre diferentes switches físicos podem não ter largura de banda total em um projeto de rede hierárquico convencional de switches interconectados. Nestes projetos, a largura de banda total é limitada pela largura de banda disponível na raiz de uma árvore hierárquica de comunicação. A solução é uma arquitetura de núcleo distribuído com base em switches de custo reduzido e alta capacidade. Esta nota descreve o uso do sistema de switch central Z9000 da Dell Force10 em uma arquitetura de núcleo distribuído para tratar destes problemas. O desafio dos Big Data Um número crescente de websites, portais, mecanismos de busca e aplicações analíticas estão lidando com conjuntos extremamente grandes de dados, normalmente conhecidos como Big Data. Os big data refletem conjuntos de dados cujas dimensões estão além da capacidade de ferramentas de software utilizadas para capturar, gerenciar e processar os dados dentro de um tempo decorrido tolerável. As dimensões de big data podem variar de algumas dezenas de terabytes a muitos petabytes de dados em um único conjunto. Big data exigem sistemas com alto desempenho para processar com eficiência grandes quantidades de dados em tempo real ou quase em tempo real. As tecnologias que estão sendo aplicadas a big data são bancos de dados de processamento paralelo em massa (MPP massively parallel processing), grades de mineração de dados, Apache Hadoop Framework, sistemas de arquivos distribuídos, bancos de dados distribuídos, algoritmos MapReduce, plataformas de computação em nuvem, a Internet e sistemas de armazenamento de arquivos. Big data geralmente empregam clusters de computação e técnicas e algoritmos avançados para reduzir os conjuntos de dados e controlar como os dados se movimentam para e dos servidores. Isto também requer novas arquiteturas de rede que se conectem a computadores de uma forma muito rápida e com alto desempenho. Os fornecedores de equipamentos de rede estão reagindo a estas demandas com novas configurações de malha de rede, que suportem grandes clusters de computação. Os designs tradicionais de rede hierárquica são úteis para alguns tipos de datacenters, mas eles não estão bem adaptados para aplicações de clusters de computação de big data, por causa dos padrões predominantes de tráfego leste-oeste (Figura 1). Página 2
Figura 1. Arquitetura convencional de datacenter de 3 camadas: Núcleo, Agregação e Acesso. As arquiteturas tradicionais de datacenter se destacam quando os padrões de tráfego são predominantemente norte e sul, em outras palavras, dentro e fora do datacenter. Mas quando o tráfego é predominantemente leste-oeste na sua natureza, como é o caso com clusters de computação, uma arquitetura de núcleo distribuído é mais adequada para a tarefa. Redes de núcleo distribuído As redes de núcleo distribuído são malhas de alto desempenho personalizadas, capazes de aumentar até mais de 160 Tbps. (Figura 2). Comumente referida como uma arquitetura folha-caule, esta arquitetura emprega dois tipos de nós: um que conecta os servidores ou elementos de topo de rack (nó de folha) e o segundo, que conecta switches (nó de caule). Quando configurado adequadamente, uma rede de Clos de 3 estágios pode ser derivada do sistema folha-caule, oferecendo um desempenho sem bloqueio, de latência extremamente baixa entre quaisquer duas portas da malha. Figura 2. Arquitetura de datacenter de núcleo distribuído aberto Página 3
Há diversas vantagens em uma arquitetura de núcleo distibuído: Econômico: O núcleo pode ser altamente escalonado através do uso de diversos switches Ethernet de baixo custo X sistemas caros em chassi Alto desempenho: Há uma largura de banda bissecional para comunicação de qualquer um com qualquer um Otimizado para Clusters: Qualquer host pode se comunicar com qualquer outro host na rede à largura de banda total da sua interface de rede Ultrarresiliente: Os nós podem ser reiniciados ou substituídos sem perder toda a malha de switches Flexibilidade de Plano de Controle: Uma malha de núcleo distribuído pode utilizar protocolos de IP (OSPF, BGP) ou Ethernet (TRILL) baseados em padrões Switch de núcleo distribuído Dell Force10 Z9000 A maioria dos switches centrais, geralmente sistemas de chassi, não é adequada para um design de núcleo distribuído, pois eles são simplesmente muito grandes e caros demais para utilizar configurações folha e caule em escala. O sistema de switch central Dell Force10 Z9000, no entanto, é construído de forma personalizada para redes folha-caule. O Z9000 é um dispositivo de 800 watts e 2 RU incorporando 32 portas de 40 GbE (128 portas de 10 GbE) e está disponível por uma fração do custo de produtos concorrentes baseados em chassi. O Z9000 é extremamente econômico, especialmente ao construir malhas muito grandes. Em escala, o Z9000 pode suportar até 64 nós de caule e 128 nós de folha para criar um núcleo grande de 160 Tbps em um espaço extremamente pequeno e baixo orçamento de energia. O design e o dimensionamento da rede são derivados destes cálculos: Número de dispositivos na malha: 3N/2 Número de portas da malha: N2/2 N = Número de portas de switch por nó da malha Em 128 portas de 10 GbE por Z9000, o dimensionamento máximo da malha é o seguinte: Número máximo de dispositivos na malha: 192 Número máximo de portas da malha: 8192 Figura 3. Desempenho O Z9000 oferece 2,5 Tbps de capacidade de switch e pode aumentar para 160 Tbps em arquitetura folha e caule. Energia A 800 watts, o Z9000 consome 1/20 da energia dos switches centrais concorrentes, permitindo que proprietários de datacenters permaneçam dentro de limites apertados de orçamento de energia, mesmo com um núcleo altamente escalonado. Embalagem Em 2RU, o Z9000 é um décimo do tamanho de switches centrais concorrentes, tornando-o massivamente escalável com um uso eficiente do espaço. Página 4
O Z9000 emprega tecnologias de plano de controle de camada 2 e camada 3 baseado em padrões. Na camada 3, OSPF e BGP são utilizados para o plano de controle, utilizando ECMP para distribuição de carga pela arquitetura de folha e caule. O recurso de multipath do BGP pode ser habilitado para distribuição de carga entre nós de folha e caule. Um design OSPF multiárea pode ser construído para limitar os domínios de flooding e atingir eficiências de roteamento. Como alternativa, se a malha for arquitetada em Camada 2, o TRILL pode ser utilizado para o plano de controle para possibilitar o suporte de multipath em toda a malha. Em qualquer um dos casos, camada 2 ou camada 3, as arquiteturas de núcleo distribuído baseadas no Z9000 oferecem flexibilidade e controle em escala. Tornando malhas uma realidade Com o Z9000, podem-se construir malhas que aumentem para até 160 Tbps e suportem até 24 mil servidores de 10 GbE (assume a oversubscription de 3:1). No final, entretanto, é a economia por trás da solução que diferencia as soluções de malha baseadas no Z9000 da concorrência. A uma fração do custo, consumo de energia e espaço de sistemas baseados em chassi, o Z9000 e suas soluções de malha basicamente redefinem a economia de malha do datacenter. No fim, isto torna as soluções de malha disponíveis para um conjunto mais amplo de clientes, conforme as soluções se tornarem mais financeiramente viáveis. Figura 4. Redefinindo a economia de malhas com Z9000 Comparação do consumo de energia da expansão horizontal Página 5
Figura 5. Redefinindo a economia de malhas com Z9000 - Comparação da ocupação de espaço da expansão horizontal Resumo As arquiteturas de núcleo distribuído oferecem uma maior escalabilidade, maior largura de banda e maior resiliência como base da rede para datacenters que lidam com quantidades gigantescas de dados e que empregam clusters de computação de grande escala. O Z9000 da Dell Force10 é o único switch central que é construído especificamente para arquiteturas de núcleo distribuído e com otimização de custos para soluções de malha de expansão horizontal de qualquer tamanho. Veja você mesmo o que o Z9000 e a arquitetura de núcleo distribuído podem fazer por você. Página 6