Capacidade de recuperação de cargas de trabalho com o EMC VPLEX



Documentos relacionados
FAMÍLIA EMC VPLEX. Disponibilidade contínua e mobilidade de dados nos datacenters e entre eles

Roteamento e Comutação

Implementando o EMC VPLEX, o Microsoft Hyper-V e o SQL Server com suporte avançado de cluster de failover

DELL POWERVAULT SÉRIE MD ARMAZENAMENTO DE DADOS MODULAR ARMAZENAMENTO DE DADOS DELL POWERVAULT SÉRIE MD

Online Help StruxureWare Data Center Expert

EMC SYMMETRIX VMAX 10K

PROPOSIÇÃO DE VALOR:

A consolidação de servidores traz uma séria de vantagens, como por exemplo:

Cláusula 1.º Objecto. Cláusula 2.º Especificação da prestação

SISTEMA DE ARMAZENAMENTO (STORAGE)

EAGLE TECNOLOGIA E DESIGN CRIAÇÃO DE SERVIDOR CLONE APCEF/RS

Multiplexador. Permitem que vários equipamentos compartilhem um único canal de comunicação

PROPOSTA COMERCIAL CLOUD SERVER

Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro V

Sistemas Distribuídos

GERENCIAMENTO CENTRALIZADO DELL POWERVAULT DL 2000 BASEADO EM TECNOLOGIA SYMANTEC

Avaliação do sistema de armazenamento EMC CLARiiON AX4

FAMÍLIA EMC RECOVERPOINT

Suporte de alto nível, equipe atualizada e a qualidade dos equipamentos HP.

COORDENAÇÃO DE TECNOLOGIA (COTEC) ABRIL/2011

Sistemas Distribuídos. Professora: Ana Paula Couto DCC 064

Forneça a próxima onda de inovações empresariais com o Open Network Environment

Informação é o seu bem mais precioso e você não pode correr riscos de perder dados importantes. Por isso, oferecemos um serviço de qualidade e

IBM Managed Security Services for Agent Redeployment and Reactivation

O EMC XTREMCACHE ACELERA O ORACLE

Consolidação inteligente de servidores com o System Center

5.2 MAN s (Metropolitan Area Network) Redes Metropolitanas

Windows 2008 Server. Windows 2008 Server IFSP Boituva Prof. Sérgio Augusto Godoy.

Introdução ao Modelos de Duas Camadas Cliente Servidor

Clique. Microsoft. Simples.

LAN Design. LAN Switching and Wireless Capítulo 1. Version Cisco Systems, Inc. All rights reserved. Cisco Public 1

Há dois tipos de configurações bidirecionais usados na comunicação em uma rede Ethernet:

Hardware (Nível 0) Organização. Interface de Máquina (IM) Interface Interna de Microprogramação (IIMP)

BlackBerry Mobile Voice System

Arquitetura dos Sistemas de Informação Distribuídos

Otimização do Gerenciamento de Datacenters com o Microsoft System Center

Serviço de Desenho e Implementação de Volume Virtual de HP Storage

FileMaker Pro 13. Utilização de uma Conexão de Área de Trabalho Remota com o FileMaker Pro 13

Conceitos Básicos de Rede. Um manual para empresas com até 75 computadores

Virtualização e Consolidação de Centro de Dados O Caso da UTAD António Costa - acosta@utad.pt

FileMaker Pro 14. Utilização de uma Conexão de Área de Trabalho Remota com o FileMaker Pro 14

MÓDULO 8 ARQUITETURA DOS SISTEMAS DE BANCO DE DADOS

PROPOSIÇÃO DE VALOR:

arcserve Unified Data Protection Resumo da solução de virtualização

Setores Trilhas. Espaço entre setores Espaço entre trilhas

SISTEMAS DISTRIBUÍDOS

Admistração de Redes de Computadores (ARC)

Implementação e planejamento Práticas recomendadas para o EMC VPLEX Hardware VS1 e VS2 com o GeoSynchrony v4.x e v5.x Nota técnica Nov de 2012

TRANSFORME SUA INFRAESTRUTURA DE BANCO DE DADOS

MANUAL DE CONFIGURAÇÃO DO BACKUP

TRABALHO COM GRANDES MONTAGENS

Dados de exibição rápida. Versão R9. Português

Procedimentos para Reinstalação do Sisloc

Engenharia de Software III

AMBIENTES DE MISSÃO CRÍTICA ORACLE COM VMAX 3

Detecção e investigação de ameaças avançadas. INFRAESTRUTURA

Resumo da solução SAP SAP Technology SAP Afaria. Gestão da mobilidade empresarial como vantagem competitiva

4 Estrutura do Sistema Operacional Kernel

Até que Ponto Seus Dados estão Seguros? Por Kris Land, CTO, diretor de tecnologia da InoStor Corp.

Usando plataformas de virtualização VMware com o EMC VPLEX

Programador/a de Informática

1

Desenvolvendo Websites com PHP

SISTEMAS OPERACIONAIS CAPÍTULO 3 CONCORRÊNCIA

Introdução a listas - Windows SharePoint Services - Microsoft Office Online

Gerencie a força de trabalho móvel, sem a complexidade e o custo de uma instalação on-premise

Qual servidor é o mais adequado para você?

Tecnologia de armazenamento Intel (Intel RST) RAID 0, 1, 5, 10, Matrix RAID, RAID -Pronto

10 DICAS DE TECNOLOGIA PARA AUMENTAR SUA PRODUTIVIDADE NO TRABALHO

IMPLEMENTAÇÃO DE SOCKETS E THREADS NO DESENVOLVIMENTO DE SISTEMAS CLIENTE / SERVIDOR: UM ESTUDO EM VB.NET

A computação na nuvem é um novo modelo de computação que permite ao usuário final acessar uma grande quantidade de aplicações e serviços em qualquer

Curso: Redes II (Heterogênea e Convergente) Tema da Aula: Características Roteamento

Banco de Dados I. Apresentação (mini-currículo) Conceitos. Disciplina Banco de Dados. Cont... Cont... Edson Thizon

Sistemas Operacionais

Sistemas Operacionais Gerência de Dispositivos

Capítulo 3: Implementar a segurança por meio de VLANs

Grid e Gerenciamento Multi-Grid

Virtualização e Criação de uma rede Virtual utilizando Virtual Box Professor: João Paulo de Brito Gonçalves

Avaliação da plataforma de armazenamento multiprotocolo EMC Celerra NS20

Manual do BlueBoard 2.0 Palm

ARQUITETURA TRADICIONAL

INDICE 1. INTRODUÇÃO CONFIGURAÇÃO MÍNIMA INSTALAÇÃO INTERLIGAÇÃO DO SISTEMA ALGUNS RECURSOS SERVIDOR BAM...

Sistemas Distribuídos Capítulos 3 e 4 - Aula 4

Guia de Introdução ao Symantec Protection Center. Versão 2.0

Três etapas para proteger os seus sistemas virtuais

Dispositivos Cisco FirePOWER 8000 Series

ADDRESS RESOLUTION PROTOCOL. Thiago de Almeida Correia

Entendendo como funciona o NAT

Soluções de Gerenciamento de Clientes e de Impressão Universal

Banco de Dados Oracle. Faculdade Pernambucana - FAPE

como sincronizar seus contatos

CA Mainframe Chorus for Storage Management Versão 2.0

Prof. Samuel Henrique Bucke Brito

NetEye Guia de Instalação

SISTEMAS OPERACIONAIS LIVRES GERENCIAMENTO DE SERVIÇOS NO WINDOWS. Professor Carlos Muniz

EMC UNIFIED INFRASTRUCTURE MANAGER

Notas da Aula 17 - Fundamentos de Sistemas Operacionais

Transcrição:

Capacidade de recuperação de cargas de trabalho com o EMC VPLEX Planejamento de práticas recomendadas Resumo Este white paper fornece uma breve introdução ao EMC VPLEX e descreve como o VPLEX oferece maior capacidade de recuperação de cargas de trabalho para o data center. As práticas recomendadas para implementações de alta disponibilidade são dadas junto com descrições de como o VPLEX lida com vários cenários de falhas. Maio de 2010

Copyright 2010 EMC Corporation. Todos os direitos reservados. A EMC atesta que as informações apresentadas neste documento são precisas e estão de acordo com as suas práticas comerciais na data de publicação. As informações estão sujeitas a alterações de acordo com seus termos sem aviso prévio. AS INFORMAÇÕES NESTA PUBLICAÇÃO SÃO FORNECIDAS "NO ESTADO EM QUE SE ENCONTRAM". A EMC CORPORATION NÃO GARANTE NEM REPRESENTA NENHUM TIPO DE INFORMAÇÃO CONTIDA NESTA PUBLICAÇÃO E ESPECIFICAMENTE SE ISENTA DAS GARANTIAS IMPLÍCITAS DE COMERCIALIZAÇÃO OU USO PARA UM PROPÓSITO ESPECÍFICO. O uso, a cópia e a distribuição de qualquer software da EMC descrito nesta publicação exigem uma licença de software apropriada. Para obter uma lista mais atualizada de produtos da EMC, consulte EMC Corporation Trademarks no site EMC2.com.br. Todas as outras marcas comerciais utilizadas neste documento pertencem a seus respectivos proprietários. Número da peça h7138.1 Planejamento de práticas recomendadas 2

Índice Resumo executivo...4 Introdução...4 Público... 4 Visão geral da tecnologia VPLEX...4 Arquitetura de clustering EMC VPLEX... 6 Virtualização de dispositivos VPLEX... 6 Visão geral do hardware VPLEX...7 Visão geral da implementação...8 Implementação do VPLEX Local... 8 Quando usar uma implementação de VPLEX Local... 9 Implementação do VPLEX Metro em um data center... 9 Quando usar uma implementação do VPLEX Metro em um data center... 10 Implementação do VPLEX Metro entre data centers... 10 Quando usar uma implementação do VPLEX Metro entre data centers... 11 Capacidade de recuperação de cargas de trabalho...11 Paralisações de storage arrays... 12 Práticas recomendadas... 12 Paralisações de SAN... 12 Prática recomendada... 13 Falhas de componentes do VPLEX... 14 Falha de porta Fibre Channel... 14 Falha do módulo de I/O... 15 Falha de placa... 15 Falha na fonte de alimentação de mecanismo... 15 Falha no ventilador do mecanismo... 16 Falha na sub-rede IP dentro do cluster... 16 Falha no switch Fibre Channel dentro do cluster... 16 Falha no mecanismo VPLEX... 16 Falha na fonte de alimentação em standby... 16 Falha no link entre clusters... 16 Falha no volume de metadados... 17 Falha de registro de regiões danificadas... 17 Falha no servidor de gerenciamento... 17 Falha no no-break... 17 Falhas de clusters VPLEX... 17 Falhas de host... 18 Paralisações do data center... 18 Conclusão...18 Referências...19 Planejamento de práticas recomendadas 3

Resumo executivo A família EMC VPLEX é a solução de última geração em mobilidade das informações e acesso dentro, através e entre data centers. É a primeira plataforma no mundo que oferece agrupamento local e distribuído. O agrupamento local proporciona cooperação imperceptível de elementos físicos em um local. O agrupamento distribuído amplia o acesso entre dois locais à distância. O VPLEX é uma solução destinada a agrupar armazenamento EMC e não-emc. A solução VPLEX complementa a infraestrutura de armazenamento virtual da EMC e fornece uma camada que dá suporte ao armazenamento virtual entre computadores host que executam os aplicativos do data center e os storage arrays que fornecem o armazenamento físico usado por esses aplicativos. Neste white paper, abordamos como o VPLEX pode ser usado para acrescentar níveis maiores de capacidade de recuperação a aplicativos em execução dentro de data centers e entre eles. A essa característica denominamos capacidade de recuperação de cargas de trabalho. Introdução Este white paper demonstra como a tecnologia VPLEX pode ser usada para aumentar a capacidade de recuperação de cargas de trabalho no data center. Combinando técnicas e práticas de uso comum atualmente com práticas recomendadas para a implementação do VPLEX, é possível melhorar a capacidade de recuperação de cargas de trabalho no data center para resistir a paralisações de arrays e até mesmo a eventos de alto impacto, como a manutenção do data center ou quedas de energia. Esses recursos são apresentados com uma breve visão geral da tecnologia VPLEX e casos de uso aplicáveis. Depois, descrevemos o hardware VPLEX e apresentamos implementações comuns desta tecnologia. O restante do artigo descreve como o VPLEX se comporta sob várias condições de falha que podem ocorrer no ambiente. São apresentadas práticas recomendadas para superar cada tipo de falha e para atingir os mais altos níveis de capacidade de recuperação de cargas de trabalho no data center com o VPLEX. Público Este white paper é destinado a arquitetos e administradores de armazenamento que desejam saber como o VPLEX pode ajudar a aumentar a capacidade de recuperação da infraestrutura de armazenamento do data center. Supõe-se familiaridade com os conceitos básicos de storage arrays, SANs (Storage Area Networks, redes de áreas de armazenamento) e infraestrutura de servidores. Visão geral da tecnologia VPLEX O EMC VPLEX apresenta uma nova arquitetura que incorpora lições aprendidas em mais de 20 anos de expertise em design, implementação e aperfeiçoamento de soluções corporativas de cache inteligente e proteção de dados distribuídos. Desenvolvido com base em mecanismos de processador dimensionáveis e altamente disponíveis, a família EMC VPLEX foi projetada para permitir dimensionamento perfeito de pequenas, médias e grandes configurações. O VPLEX reside entre os servidores e os ativos de armazenamento heterogêneo e usa uma arquitetura única de clustering que permite que os servidores em múltiplos data centers tenham acesso de leitura/gravação a dispositivos compartilhados de armazenamento em bloco. Planejamento de práticas recomendadas 4

Entre as características exclusivas desta nova arquitetura estão: Hardware de clustering scale-out, possibilitando que você comece pequeno e cresça com níveis de serviço previsíveis Cache avançado de dados, que utiliza cache SDRAM de grande escala para melhorar o desempenho e reduzir a latência de I/O e o conflito de acesso de arrays Coerência de cache distribuído para compartilhamento, balanceamento e failover automáticos de I/O no cluster Visão consistente de um ou mais LUNs em clusters VPLEX, estejam eles separados por alguns centímetros em um data center ou entre distâncias síncronas, possibilitando novos modelos de alta disponibilidade e realocação de cargas de trabalho Figura 1. Capacidade do sistema EMC VPLEX de agrupar armazenamento heterogêneo O EMC AccessAnywhere, disponível com o VPLEX, é uma revolucionária tecnologia EMC que possibilita compartilhamento, acesso e realocação de uma só cópia de dados à distância. O EMC GeoSynchrony é o sistema operacional do VPLEX. A família VPLEX é composta por dois produtos: VPLEX Local e VPLEX Metro. O VPLEX Local oferece gerenciamento simplificado e mobilidade de dados sem interrupções em arrays heterogêneos. O VPLEX Metro proporciona mobilidade de dados e acesso entre dois clusters VPLEX em distâncias síncronas. Figura 2. Oferta da família EMC VPLEX com limites de arquitetura Com uma arquitetura única de scale-up e scale-out, o cache avançado de dados e a coerência de cache distribuído da família VPLEX oferecem capacidade de recuperação de cargas de trabalho e também compartilhamento, balanceamento e failover automáticos de domínios de armazenamento, além de permitir o acesso local e remoto aos dados com níveis previsíveis de serviço. O VPLEX Local dá suporte ao agrupamento local. O VPLEX Metro fornece recursos de agrupamento distribuído e amplia o acesso entre dois locais em distâncias síncronas. O VPLEX Metro utiliza o AccessAnywhere para permitir uma cópia única dos dados a serem compartilhados, acessados e realocados à distância. A combinação entre um data center virtualizado e o EMC VPLEX oferece aos clientes maneiras totalmente novas de resolver problemas de TI e de apresentar novos modelos de computação. Especificamente, os clientes podem: Planejamento de práticas recomendadas 5

Mover aplicativos virtualizados em data centers Habilitar o balanceamento de cargas de trabalho e a realocação em locais Agregar data centers e prestar serviços de TI "24 horas por dia, para sempre" Arquitetura de clustering EMC VPLEX O VPLEX usa uma exclusiva arquitetura de clustering para ajudar os clientes a remover os limites físicos do data center e para permitir que os servidores de múltiplos data centers tenham acesso de leitura/gravação a dispositivos compartilhados de armazenamento em bloco. A configuração do VPLEX Local é definida por um, dois ou quatro mecanismos VPLEX que são integrados em um só cluster através de suas interconexões de malhas totalmente redundantes entre mecanismos. Essa interconexão de clusters permite adicionar on-line mecanismos VPLEX, fornecendo uma excepcional capacidade de expansão para as configurações do VPLEX Local e do VPLEX Metro. Toda a conectividade entre nós de cluster VPLEX e em configurações do VPLEX Metro é totalmente redundante, garantindo proteção contra pontos únicos de falha. É possível fazer o scale-up de um cluster VPLEX com a adição de mais mecanismos e o scale-out com a conexão de clusters em um VPLEX Metro (dois clusters VPLEX conectados em distâncias longas). O VPLEX Metro ajuda a mover e compartilhar cargas de trabalho (inclusive hosts virtualizados), consolida data centers e otimiza a utilização de recursos nos data centers, tudo de maneira transparente. Além disso, proporciona mobilidade de dados sem interrupções, gerenciamento de armazenamento heterogêneo e maior disponibilidade dos aplicativos. O VPLEX Metro comporta até dois clusters, que podem ficar no mesmo data center em dois locais diferentes em distâncias síncronas (aproximadamente até 100 quilômetros ou 60 milhas). Figura 3. Agrupamento local e distribuído com EMC VPLEX Local e VPLEX Metro O EMC VPLEX mantém as expectativas dos clientes de armazenamento high-end em termos de disponibilidade. A disponibilidade high-end é mais do que somente redundância; ela se traduz em operações e upgrades que não causam interrupções e em estar "sempre on-line". O EMC VPLEX oferece: AccessAnywhere, com conectividade total de recursos em configurações de clusters e Metro-Plex Opções de mobilidade e migração de dados em storage arrays heterogêneos A energia para manter níveis de serviço e recursos à medida que a consolidação cresce Controle simplificado para provisionamento em ambientes complexos Balanceamento dinâmico de carga de dados entre storage arrays Virtualização de dispositivos VPLEX Os recursos de virtualização de dispositivos no VPLEX permitem que dispositivos de armazenamento sejam solicitados como volumes de armazenamento no VPLEX, em que podem ser divididos ou encapsulados como extensões e usados para formar dispositivos compostos que são expostos aos hosts como volumes virtuais. O VPLEX dá suporte a várias transformações diferentes de dispositivos virtuais para físicos, abrangendo: Extensões uma extensão é um dispositivo que forma uma gama de páginas adjacentes de um volume de armazenamento. Uma extensão pode encapsular completamente um volume de armazenamento ou pode definir uma fatia desse volume. Uma página do VPLEX 4.0 consiste em 4 KB de armazenamento. Planejamento de práticas recomendadas 6

RAID 0 um dispositivo RAID 0 é uma agregação de dois ou mais dispositivos nos quais as páginas lógicas de armazenamento são distribuídas em faixas com o objetivo de aumentar o desempenho de I/O pela distribuição dos dados em vários eixos. RAID-C um dispositivo RAID-C é uma agregação de dois ou mais dispositivos que são concatenados logicamente para formar um dispositivo de armazenamento maior. RAID 1 um dispositivo RAID 1 consome dois ou mais dispositivos locais de mesmo tamanho para formar um espelho. Cada um desses dispositivos fornece uma cópia completa dos dados, e as gravações no dispositivo de RAID 1 são aplicadas a cada trecho do espelho. DR-1 um dispositivo DR-1 é um dispositivo de RAID 1 distribuído. É como um RAID 1, mas os trechos do dispositivo espelhado são fornecidos por clusters diferentes de um sistema VPLEX. O VPLEX 4.0 fornece coerência de cache distribuído sobre seus recursos de virtualização de dispositivos. O cache do VPLEX é mantido de forma global e consistente entre as várias placas do sistema. Juntos, os caches das placas mantêm a ilusão e o comportamento de que cada volume virtual é um só disco, embora os dados desse volume possam ser difundidos em vários dispositivos diferentes e distribuídos e acessados por diversos data centers. Visão geral do hardware VPLEX Conforme descrito na seção anterior, cada sistema VPLEX 4.0 é composto por um ou dois clusters VPLEX, cada um constituído de um, dois ou quatro mecanismos. Um mecanismo VPLEX é um chassi que contém duas placas, fontes de alimentação redundante, ventiladores, módulos de I/O e módulos de gerenciamento. As placas são os componentes que fazem o trabalho pesado no sistema e são responsáveis pelo processamento das solicitações de I/O dos hosts, atendendo e mantendo dados no cache distribuído, fornecendo as conversões de I/O de virtual para físico e interagindo com os storage arrays para prover o I/O. A Figura 4 ilustra um VPLEX Metro composto por dois clusters com quatro mecanismos cada. Figura 4. Um VPLEX Metro com dois clusters grandes A Figura 5 é a imagem de um mecanismo VPLEX. Essa foto mostra os 12 módulos de I/O comportados pelo mecanismo, seis alocados em cada placa. Cada placa tem dois módulos de I/O Fibre Channel de Planejamento de práticas recomendadas 7

8 Gb/s com quatro portas, usados para conectividade SAN (host) de front-end, e dois módulos de I/O Fibre Channel de 8 Gb/s com quatro portas, usados para conectividade SAN (storage array) de backend. Cada um desses módulos tem 10 Gb/s de largura de banda efetiva de PCI para as CPUs de suas placas correspondentes. Um quinto módulo de I/O fornece duas portas de conectividade Fibre Channel de 8 Gb/s para comunicação dentro de clusters e duas portas de conectividade Fibre Channel de 8 Gb/s para comunicação entre clusters. O sexto módulo de I/O contém quatro portas Ethernet de 1 Gb/s e não é utilizado atualmente. Figura 5. Um mecanismo VPLEX e seus componentes O mecanismo aloja duas fontes de alimentação redundante, ambas capazes de fornecer alimentação total ao chassi por conta própria. Os módulos de gerenciamento redundante fornecem conectividade IP às placas do servidor de gerenciamento que acompanha cada cluster. Duas sub-redes privadas de IP fornecem conectividade IP redundante entre as placas de um cluster e o servidor de gerenciamento do cluster. Quatro ventiladores redundantes proporcionam refrigeração ao chassi do mecanismo e dão suporte a um modelo de configuração 3+1 que fornece refrigeração suficiente em caso de falha de um ventilador. Cada mecanismo é resguardado por uma fonte de alimentação redundante em standby que fornece alimentação para superar condições de queda temporária de energia que durem até cinco minutos. Os clusters que contêm dois ou mais mecanismos são montados com um par de switches Fibre Channel que fornecem conectividade Fibre Channel redundante e que dão suporte à comunicação dentro de clusters entre as placas. Cada switch Fibre Channel é resguardado por um no-break dedicado que ajuda a superar quedas temporárias de energia. Visão geral da implementação O VPLEX dá suporte a vários modelos diferentes de implementação para se adaptar a diversas necessidades. As próximas seções descrevem esses modelos e quando eles devem ser usados. Implementação do VPLEX Local A Figura 6 ilustra uma implementação típica de um sistema VPLEX Local. Os sistemas VPLEX Local são suportados em configurações pequenas, médias ou grandes que consistem em um, dois ou quatro mecanismos, respectivamente, produzindo sistemas que fornecem duas, quatro ou oito placas. Planejamento de práticas recomendadas 8

Figura 6. Exemplo de uma implementação pequena do VPLEX Local Quando usar uma implementação de VPLEX Local O VPLEX Local é apropriado quando se procura implementar, em um só data center, os recursos de armazenamento virtual da realocação de cargas de trabalho, da capacidade de recuperação de cargas de trabalho e do gerenciamento simplificado de armazenamento quando a capacidade de ajuste de escala do VPLEX Local for suficiente para atender às necessidades desse data center. Se uma escala maior for necessária, considere implementar um VPLEX Metro (abordado a seguir) ou várias instâncias do VPLEX Local. Implementação do VPLEX Metro em um data center A Figura 7 ilustra uma implementação típica de um sistema VPLEX Metro em um só data center. Os sistemas VPLEX Metro contêm dois clusters que, por sua vez, contêm um, dois ou quatro mecanismos. Os clusters em uma implementação VPLEX Metro não precisam ter o mesmo número de mecanismos. Por exemplo, um sistema VPLEX Metro 2 x 4 é compatível com um cluster que contenha dois mecanismos e o outro cluster, quatro mecanismos. Planejamento de práticas recomendadas 9

Figura 7. Exemplo de uma implementação do VPLEX Metro em um data center Quando usar uma implementação do VPLEX Metro em um data center A implementação do VPLEX Metro em um data center é apropriada quando se procura implementar, em um só data center, os recursos de armazenamento virtual da realocação de cargas de trabalho, da capacidade de recuperação de cargas de trabalho e do gerenciamento simplificado de armazenamento quando é necessário mais ajuste de escala que uma solução VPLEX Local pode oferecer ou quando é necessária mais capacidade de recuperação. O VPLEX Metro fornece a seguinte vantagem de capacidade de recuperação adicional em relação ao VPLEX Local. Os dois clusters de um VPLEX Metro podem ser separados em até 100 km. Isso fornece excelente flexibilidade para implementação em um data center e permite que dois clusters sejam implementados em extremidades separadas de uma sala de máquinas ou em pisos diferentes para fornecer melhor isolamento de falhas entre os clusters. Por exemplo, isso permite que os clusters sejam colocados em diferentes zonas de supressão de incêndio, o que pode significar a diferença entre superar uma falha localizada como um incêndio contido e uma paralisação total do sistema. Implementação do VPLEX Metro entre data centers A Figura 8 ilustra uma implementação de um sistema VPLEX Metro entre dois data centers. Essa implementação é semelhante àquela mostrada na seção "Implementação do VPLEX Metro em um data center", mas só aqui os clusters são colocados em data centers separados. Isso normalmente significa que hosts separados se conectam a cada cluster. Os aplicativos colocados em ambiente de cluster podem ter, por exemplo, um conjunto de servidores de aplicativos implementados no data center A e outro conjunto implementado no data center B para ampliar os benefícios da capacidade de recuperação e da realocação de cargas de trabalho. Conforme descrito na seção anterior, é importante saber que uma falha local ou total do cluster principal para um volume distribuído exigirá a retomada manual de I/O no local secundário. Planejamento de práticas recomendadas 10

Figura 8. Exemplo de uma implementação do VPLEX Metro entre data centers Quando usar uma implementação do VPLEX Metro entre data centers Uma implementação do VPLEX Metro entre dois data centers é adequada quando se procura os benefícios adicionais da capacidade de recuperação de cargas de trabalho que são obtidos ao se manter os dados de um aplicativo presentes em ambos os data centers. Essa implementação também é recomendada quando Os aplicativos em um data center precisam acessar dados no outro data center. Um aplicativo precisa redistribuir cargas de trabalho entre os dois data centers. Um data center ficou sem espaço, alimentação ou refrigeração. Capacidade de recuperação de cargas de trabalho Nas próximas seções, estudaremos diversas falhas que podem ocorrer em um data center e veremos como o VPLEX pode ser usado para acrescentar capacidade de recuperação adicional a aplicativos, permitindo que sua carga de trabalho supere essas condições de falha. As seguintes classes de falhas e eventos de serviço são consideradas: Paralisações de storage arrays (planejadas e não planejadas) Paralisações de SAN Falhas de componentes do VPLEX Falhas de clusters VPLEX Falhas de host Paralisações do data center Planejamento de práticas recomendadas 11

Paralisações de storage arrays Para superar paralisações de storage arrays planejadas e não planejadas, o VPLEX dá suporte à capacidade de espelhar os dados de um volume virtual entre dois ou mais volumes de armazenamento 1, usando um dispositivo RAID 1. A Figura 9 fornece uma ilustração de um volume virtual que é espelhado entre dois arrays. Caso um array sofra uma paralisação, planejada ou não, o sistema VPLEX conseguirá continuar processando I/O no trecho sobrevivente do espelho. Com a restauração do volume de armazenamento com defeito, os dados do volume sobrevivente são sincronizados novamente no trecho recuperado. Práticas recomendadas Para dados críticos, recomenda-se espelhar os dados em dois ou mais volumes de armazenamento que são fornecidos por arrays separados. Para obter o melhor desempenho, esses volumes de armazenamento devem ser configurados identicamente e fornecidos pelo mesmo tipo de array. Figura 9. Exemplo de uso de espelhamento de RAID 1 para proteger contra paralisações de arrays Paralisações de SAN Quando um par redundante de malhas Fibre Channel é usado com o VPLEX, as placas do VPLEX devem ser conectadas a ambas as malhas para a conectividade de front-end (lado do host) e, também, para a conectividade de back-end (lado do storage array). Essa implementação, junto com o isolamento das malhas, permite que o sistema VPLEX supere as falhas que derrubam uma malha inteira e permite que o sistema forneça acesso contínuo aos dados superando esse tipo de falha. Os hosts também devem ser conectados a ambas as malhas e usar software de múltiplos caminhos para garantir o acesso 1 Há suporte para até oito trechos por volume de espelho. Planejamento de práticas recomendadas 12

contínuo aos dados na presença dessas falhas. A Figura 10 ilustra uma prática recomendada de uma implementação de malha dupla. Figura 10. Uso recomendado de uma implementação de malha dupla Prática recomendada Recomenda-se que os módulos de I/O sejam conectados a malhas redundantes. Por exemplo, em uma implementação com malhas A e B, recomenda-se que as portas de uma placa sejam conectadas como exibido na Figura 11. Planejamento de práticas recomendadas 13

Figura 11. Atribuições de malhas recomendadas para portas FE e BE Falhas de componentes do VPLEX Todos os componentes críticos de processamento de um sistema VPLEX usam no mínimo redundância em pares para maximizar o acesso aos dados. Esta seção descreve como as falhas de componentes do VPLEX são manipuladas e as práticas recomendadas que devem ser usadas para permitir que os aplicativos tolerem essas falhas. Todas as falhas de componentes que ocorrem em um sistema VPLEX são relatadas por meio de eventos que retornam chamadas ao Centro de Serviços da EMC para garantir a resposta e o reparo em tempo hábil dessas condições de falhas. Falha de porta Fibre Channel Todas as comunicações do VPLEX acontecem sobre caminhos redundantes, permitindo a manutenção da comunicação em caso de falhas de portas. Essa redundância permite que o software de múltiplos caminhos nos servidores host retransmita e redirecione o I/O, contornando as falhas de caminho que ocorrem como resultado das falhas nas portas ou de outros eventos na SAN que levam à perda de caminho. O VPLEX usa sua própria lógica de múltiplos caminhos para manter caminhos redundantes para o armazenamento de back-end de cada placa. Isso permite que o VPLEX supere as falhas nas portas de back-end do VPLEX e também nas portas das malhas de back-end e de arrays que conectam o armazenamento físico ao VPLEX. Os transceptores SFP (Small Form-factor Pluggable, conectáveis com fator-forma pequeno), usados para conectividade com o VPLEX, são FRUs (Field Replaceable Units, unidades substituíveis em campo) recuperáveis. Práticas recomendadas Certifique-se de que haja um caminho de cada host para pelo menos uma porta de front-end na placa A e pelo menos uma porta de front-end na placa B. Se o sistema VPLEX tiver dois ou mais mecanismos, garanta que o host tenha no mínimo um caminho "lado-a" em um mecanismo e no mínimo um "lado-b" em um mecanismo separado. Para disponibilidade máxima, cada host pode ter um caminho para no mínimo uma porta de front-end em cada placa. Use software de múltiplos caminhos nos servidores host para garantir resposta em tempo hábil e I/O contínuo em caso de falhas de caminho. Certifique-se que cada host tenha um caminho para cada volume virtual por meio de cada malha. Planejamento de práticas recomendadas 14

Certifique-se de que o mapeamento e o mascaramento de LUN para cada volume de armazenamento apresentado por um storage array para o VPLEX tenha os volumes de no mínimo duas portas do array em pelo menos duas malhas diferentes e se conecte a pelo menos duas portas diferentes servidas por dois módulos diferentes de I/O de back-end de cada placa em um cluster VPLEX. Certifique-se de que o zoneamento de malha forneça acesso redundante dos hosts às portas de front-end do VPLEX e forneça ao VPLEX o acesso redundante às portas de arrays. Falha do módulo de I/O Os módulos de I/O no VPLEX apresentam funções dedicadas. Cada placa VPLEX tem dois módulos de I/O de front-end, dois módulos de I/O de back-end e um módulo de I/O COM usados para conectividade dentro do cluster e entre clusters. Cada módulo de I/O é uma unidade substituível em campo recuperável. As seguintes seções descrevem o comportamento do sistema e as práticas recomendadas para maximizar a disponibilidade na presença dessas falhas. Módulo de I/O FE Se um módulo de I/O FE falhar, todos os caminhos conectados a ele serão interrompidos e apresentarão falhas. É necessário seguir as práticas recomendadas listadas na página 14 para garantir que os hosts tenham um caminho redundante para seus dados. Durante a remoção e substituição de um módulo de I/O, a placa afetada será redefinida. Módulo de I/O BE Se um módulo de I/O BE falhar, todos os caminhos conectados a ele serão interrompidos e apresentarão falhas. As práticas recomendadas listadas na página 14 devem ser seguidas para garantir que cada placa tenha um caminho redundante para cada volume de armazenamento por meio de um módulo de I/O separado. Durante a remoção e substituição de um módulo de I/O, a placa afetada será redefinida. Módulo de I/O COM Se o módulo de I/O COM de uma placa falhar, a placa será redefinida e todo o serviço prestado pela placa será interrompido. As práticas recomendadas listadas na página 14 garantem que cada host tenha acesso redundante a seu armazenamento virtual por meio de várias placas, de forma que a redefinição de uma única placa não fará com que o host perca o acesso a seu armazenamento. Durante a remoção e substituição de um módulo de I/O, a placa afetada será redefinida. Falha de placa Uma falha de placa ocasiona a perda de todo o serviço dessa placa. Cada mecanismo VPLEX tem um par de placas para redundância. Os clusters VPLEX que contêm dois ou mais mecanismos se beneficiam da redundância adicional fornecida pelas placas adicionais. Cada placa em um cluster é capaz de apresentar o mesmo armazenamento. As práticas recomendadas descritas na página 14 permitem que um host supere as falhas das placas colocando caminhos redundantes para seu armazenamento virtual por meio de portas fornecidas por diferentes placas. A combinação de software de múltiplos caminhos nos hosts e caminhos redundantes por meio de diferentes placas do sistema VPLEX permite que o host supere a perda de uma placa. Em um sistema com vários mecanismos, um host pode manter acesso aos dados no caso pouco provável em que várias placas falhem, já que cada placa no sistema fornece caminhos para seu armazenamento virtual. Cada placa é uma FRU recuperável. Falha na fonte de alimentação de mecanismo As fontes de alimentação do mecanismo VPLEX são totalmente redundantes, e não ocorre nenhuma perda de serviço ou função em caso de falha única de fonte de alimentação. Cada fonte de alimentação é uma FRU recuperável que pode ser removida e substituída sem causar interrupções no sistema. Planejamento de práticas recomendadas 15

Falha no ventilador do mecanismo As unidades de ventilação do mecanismo VPLEX são totalmente redundantes, e não ocorre nenhuma perda de serviço durante o extravio de uma. Cada mecanismo contém quatro unidades de ventilação. Em caso de falha de um ventilador, as três unidades restantes continuarão fornecendo refrigeração suficiente para o sistema. Se dois ventiladores falharem, o mecanismo será desligado automaticamente para impedir que ocorram danos devido a superaquecimento. Cada unidade de ventilador é uma FRU recuperável que pode ser removida e substituída sem causar interrupções no sistema. Falha na sub-rede IP dentro do cluster Cada cluster VPLEX tem um par de sub-redes IP locais privadas que conectam as placas ao servidor de gerenciamento. Essas sub-redes são usadas para tráfego de gerenciamento e também para proteção contra particionamento dentro do cluster. A perda de link em uma dessas sub-redes pode fazer com que alguns membros não possam se comunicar com outros membros nessa sub-rede, mas isso não leva à perda de serviço ou capacidade de gerenciamento devido à presença da sub-rede redundante. Falha no switch Fibre Channel dentro do cluster Cada cluster VPLEX com dois ou mais mecanismos usa um par de switches Fibre Channel dedicados para comunicação interna entre as placas no cluster. Duas malhas Fibre Channel redundantes são criadas; cada switch atende a uma malha diferente. A perda de um só switch Fibre Channel não ocasiona nenhuma perda de processamento ou serviço. Falha no mecanismo VPLEX Em clusters VPLEX com dois ou mais mecanismos, o evento improvável de uma falha no mecanismo ocasionará a perda de serviço das placas dentro dele, mas os volumes virtuais, atendidos pelas placas em outros mecanismos sobreviventes, permanecerão disponíveis. As "Práticas recomendadas" na página 14 descrevem a colocação de caminhos redundantes em um volume virtual em placas de diferentes mecanismos em clusters VPLEX com vários mecanismos. Falha na fonte de alimentação em standby Cada mecanismo VPLEX é resguardado por um par de SPS (Standby Power Supply, fontes de alimentação em standby) que fornecem um tempo de retenção de cinco minutos, permitindo que o sistema supere quedas temporárias de energia. Uma SPS única fornece alimentação suficiente para o mecanismo conectado. O VPLEX fornece um par de SPSs para gerar alta disponibilidade. Cada SPS é uma FRU que pode ser substituída sem causar interrupções nos serviços fornecidos pelo sistema. O tempo de recarga de uma fonte de alimentação em standby é de até 5,5 horas, e as baterias dessa fonte conseguem suportar duas paralisações sequenciais de cinco minutos. Falha no link entre clusters Cada placa em um sistema VPLEX tem dois links dedicados à comunicação entre clusters. Cada um desses links deve ser configurado (por exemplo, zoneado) para fornecer caminhos para cada placa no cluster remoto. Dessa maneira, a conectividade total entre placas permanece disponível, mesmo na presença de uma falha de um só link. Caso uma placa perca ambos os links, todo o I/O entre os dois clusters será suspenso para preservar a semântica de fidelidade da ordem de gravação e garantir que o local remoto mantenha uma imagem recuperável. Quando isso ocorrer, os espelhos remotos serão interrompidos e as regras configuradas pelos usuários, denominadas regras de desconexão, serão executadas para determinar qual cluster VPLEX deve continuar permitindo I/O para determinado espelho remoto. Essas regras podem ser configuradas por dispositivo, permitindo que alguns volumes permaneçam disponíveis em um cluster e que outros volumes permaneçam disponíveis no outro cluster. Uma vez que as falhas de links tenham sido reparadas, será possível restaurar o I/O e iniciar as tarefas de nova sincronização para restaurar os espelhos remotos. Essas ações entrarão em vigor automaticamente, ou é possível configurar os volumes para exigir a retomada manual do I/O, caso seja necessária a Planejamento de práticas recomendadas 16

coordenação com ações de servidores. O I/O para os dispositivos pode entrar em vigor imediatamente sem a necessidade de aguardar que as tarefas de nova sincronização sejam concluídas. Falha no volume de metadados O VPLEX mantém seu estado de configuração, chamado de metadados, em volumes de armazenamento fornecidos pelos storage arrays na SAN. Cada cluster VPLEX mantém seus próprios metadados, que descrevem as informações sobre a configuração local para este cluster, bem como qualquer informação sobre a configuração distribuída compartilhada entre os clusters. Recomenda-se que o volume de metadados para cada cluster seja configurado com vários volumes de armazenamento de back-end fornecidos por diferentes storage arrays do mesmo tipo. Os recursos de proteção de dados fornecidos por esses storage arrays, como RAID 1 e RAID 5, devem ser usados para garantir a integridade dos metadados do sistema. Além disso, é recomendável que as cópias de backup dos metadados sejam feitas sempre que haja alterações na configuração no sistema. O VPLEX usa esses metadados persistentes em uma inicialização total do sistema e carrega as informações sobre configuração em cada placa. Quando são feitas alterações na configuração do sistema, elas são gravadas no volume de metadados. Se o acesso ao volume de metadados for interrompido, as placas do VPLEX continuarão fornecendo seus serviços de virtualização usando a cópia na memória das informações sobre configuração. Se o armazenamento que dá suporte ao dispositivo de metadados permanecer indisponível, um novo dispositivo de metadados deverá ser configurado. Assim que um novo dispositivo tiver sido atribuído e configurado, a cópia na memória do dispositivo de metadados mantido pelo cluster será então registrada no novo dispositivo de metadados. A capacidade de realizar alterações de configuração é suspensa se o acesso ao dispositivo de metadados persistente não estiver disponível. Falha de registro de regiões danificadas O VPLEX Metro usa um registro de regiões danificadas para registrar informações sobre quais regiões de um espelho distribuído interrompido foram atualizadas enquanto um trecho do espelho é desconectado. Essas informações são mantidas para cada trecho de espelho desconectado. Se este volume se tornar inacessível, as placas registrarão o trecho inteiro como desatualizado e exigirão uma nova sincronização total deste trecho do volume, assim que ele for reconectado ao espelho. Falha no servidor de gerenciamento Cada cluster VPLEX tem um servidor de gerenciamento dedicado que fornece acesso de gerenciamento às placas e dá suporte à conectividade de gerenciamento para acesso remoto ao cluster par em um ambiente VPLEX Metro. Como o processamento de I/O das placas do VPLEX não depende dos servidores de gerenciamento, a perda de um servidor de gerenciamento não interromperá o processamento de I/O e os serviços de virtualização fornecidos pelo VPLEX. Falha no no-break Em clusters VPLEX com dois ou mais mecanismos, um par de switches Fibre Channel dá suporte à comunicação dentro do cluster entre as placas nesses mecanismos. Cada switch tem um no-break dedicado que fornece energia reserva no caso de queda temporária de energia. As unidades do nobreak permitirão que os switches Fibre Channel continuem operando por até cinco minutos depois da perda de alimentação. O no-break mais baixo no rack também fornece energia reserva ao servidor de gerenciamento. Falhas de clusters VPLEX O VPLEX Metro dá suporte a duas formas de dispositivos distribuídos: volumes virtuais distribuídos em longas distâncias e volumes virtuais remotos. Os primeiros fornecem cópias sincronizadas (espelhos) dos dados do volume em cada cluster. O volume espelhado é apresentado e se comporta como um só volume e atua de maneira semelhante a um volume virtual que usa um dispositivo RAID 1, mas com o valor agregado de que cada cluster mantém uma cópia dos dados. Os segundos fornecem acesso a um volume virtual cujos dados residem em um cluster. Tal qual os volumes virtuais distribuídos em longas distâncias, os volumes virtuais remotos conseguem aproveitar o cache coerente distribuído Planejamento de práticas recomendadas 17

do VPLEX e seus algoritmos de prefetch para fornecer melhor desempenho que uma solução de extensão de SAN. Para cada volume virtual distribuído em longas distâncias, uma regra de desconexão identifica qual cluster em um VPLEX Metro deve desconectar seu trecho de espelho (removendo-o do serviço) em caso de perda de comunicação entre os dois clusters. Essas regras definem efetivamente um local de tendência (ou um vencedor) caso os clusters percam a comunicação entre si. Existem duas condições que podem fazer com que os clusters percam a comunicação: as falhas no link entre clusters abordadas em "Falha no link entre clusters" e a falha de cluster. Esta seção descreve a segunda classe de falha. Na presença de falha de cluster, qualquer volume virtual distribuído em longas distâncias, que tinha uma regra de desconexão que identificou o local sobrevivente como o local vencedor, continuará recebendo I/O no trecho sobrevivente do dispositivo. Esses volumes, cujas regras de desconexão declararam que este local deve ser desconectado em caso de perda de comunicação, terão seu I/O suspenso. Devido à incapacidade de distinguir uma falha de cluster de uma falha de link, esse comportamento foi projetado para preservar a integridade dos dados nesses dispositivos distribuídos. Existem dois casos de falha para volumes virtuais remotos. Primeiro, em caso de falha do cluster que fornece a mídia física para o volume virtual, o volume virtual remoto ficará completamente inacessível. No segundo cenário, se o cluster remoto falhar (o cluster sem mídia física para este volume), o acesso ao volume virtual permanecerá disponível pelo cluster de hospedagem (o cluster com os dados físicos), mas não pelo cluster remoto. Falhas de host Embora isso não seja um recurso fornecido pelo VPLEX, o clustering com base em host é uma técnica importante para maximizar a capacidade de recuperação de cargas de trabalho. Com essa modalidade de clustering, um aplicativo pode continuar fornecendo o serviço na presença de falhas de host usando um modelo de processamento ativo/ativo ou ativo/passivo. Quando combinado com os recursos do VPLEX acima, o resultado é uma infraestrutura capaz de fornecer níveis muito altos de disponibilidade. Paralisações do data center Um VPLEX Metro distribuído entre dois data centers pode ser usado para proteger contra perda de dados em caso de paralisação de data center com o espelhamento dos dados entre os dois data centers. Essa implementação pode aumentar ainda mais o acesso aos dados na presença de uma paralisação de data center na maneira descrita em "Falhas de clusters VPLEX" (ou seja, se uma paralisação desse tipo ocasionar a perda de um dos clusters VPLEX em um VPLEX Metro). O acesso aos dados permanecerá disponível para volumes virtuais distribuídos em longas distâncias cujo cluster vencedor é o data center sobrevivente. Para aqueles volumes cujo cluster vencedor é o data center com a paralisação, o acesso aos dados desses volumes pode ser restaurado no outro cluster com a chamada de um comando manual para retomar o I/O suspenso. Quando combinado com a lógica de failover para os clusters de hosts, isso fornece uma infraestrutura capaz de restaurar as operações de serviço rapidamente, mesmo se houver uma paralisação não planejada de data center. Algumas paralisações de data center são causadas pela perda de energia no data center. O VPLEX usa fontes de alimentação em standby e no-breaks para superar quedas temporárias de energia com duração de cinco minutos ou menos. Isso deve ser combinado com uma infraestrutura semelhante de suporte para os hosts, equipamentos de rede e storage arrays, a fim de obter uma solução abrangente para tolerar a perda de energia transiente. Para condições de perda de energia que durem mais de cinco minutos, o VPLEX interromperá o fornecimento de serviços de virtualização. As propriedades de cache de write through do VPLEX garantem que os dados do aplicativo sejam gravados nos storage arrays de back-end antes de confirmar os dados para o host. Conclusão O VPLEX oferece grande redundância interna de hardware e software que não só garante a alta disponibilidade dos serviços do VPLEX, mas também melhora a capacidade de recuperação de cargas de trabalho da infraestrutura adjacente. Quando combinado com as práticas recomendadas de clustering com base em host, serviço de múltiplos caminhos, redundância de malha, proteção de mídia de armazenamento e infraestrutura de alimentação em standby, a solução resultante fornece uma base Planejamento de práticas recomendadas 18

sólida para garantir que o armazenamento virtual forneça uma solução sólida para a disponibilidade de armazenamento. Referências Mais informações sobre a infraestrutura de armazenamento virtual e os recursos do VPLEX 4.0 são fornecidas nestes white papers. Notas técnicas das práticas recomendadas de implementação e planejamento para o EMC VPLEX Usando plataformas de virtualização VMware com o EMC VPLEX Planejamento de práticas recomendadas Realocação de armazenamento sem causar interrupções: Eventos planejados com EMC VPLEX Planejamento de práticas recomendadas VMotion over Distance for Microsoft, Oracle, and SAP Enabled by VCE Vblock1, EMC Symmetrix VMAX, EMC CLARiiON, and EMC VPLEX Metro An Architectural Overview Implementando o EMC VPLEX, o Microsoft Hyper-V e o SQL Server com suporte avançado de cluster de failover Tecnologia aplicada Planejamento de práticas recomendadas 19