MARCOS SCHARDONG Como o ASR e SQL Server ajudam a entregar o RPO e RTO de sua Aplicação
Sobre Marcos Schardong marcos@cloudworks.com.br ou busque @marcosschardong CloudWorks MTAC
Agenda Conceitos rápidos Porque Continuidade de Negócio / DR? ASR Cenários Demo
Conceitos Rápidos Business Continuity Plan (BCP) Plano de Continuidade de Negócio Processo contínuo onde seu objetivo é assegurar a sobrevivência a longo prazo da empresa com a introdução de medidas de prevenção para evitar desastres de forma pró-ativa ou a atenuar a gravidade de um desastre inevitável, reduzindo seu impacto. Business Impact Analysis (BIA) Análise de Impacto no Negócio Mede o impacto de um desastre sobre o negócio. O BIA é uma avaliação de riscos concebido para identificar os riscos que podem afetar as operações do negócios e priorizar esses riscos com base em sua probabilidade de ocorrência e potencial impacto.
Conceitos Rápidos Recovery Point Objective (RPO) Objetivo de Ponto de Recuperação Recovery Time Objective (RTO) Objetivo de Tempo de Recuperação O montante máximo (em tempo) de dados que se pode perder em caso de uma disrupção. Respoder a pergunta: Para qual ponto no tempo eu preciso voltar? O máximo de tempo que será necessário, desde a disrupção, para trazer as funções de negócio de acordo com com SLAs, incluindo os dados. Respoder a pergunta: Em quanto tempo eu preciso ter a aplicação / serviço funcionando novamente?
Conceitos Rápidos DR Disaster Recovery High Availability HA Deve ser parte do BCP, onde o foco é proteger a organização no caso de um evento negativo como cyberataques ou desastres naturais. Deve ser feito com base no BIA Visa minimizar ou mitigar o impacto de um downtime. O Impacto do downtime pode ser medido de várias maneiras; Perda de informações, perda de lucros, impacto na imagem, perdas contratuais entre outros
Conceitos Rápidos Backup Failover e Failback Processo de fazer uma cópia de segurança das informações e armazena-las em local seguro para que possa ser recuperado conforme a necessidade Failover é o processo de mudar a localização de um determinado workload. Exemplo, levar a aplicação do site 1 para o site 2. Failback é a volta do workload para o site original. Um failover não é feito apenas em desastres, pode ser planejado.
Diferença entre Data Backup e DR São procedimentos e ferramentas complementares dentro do BCP Backup DR Tendência de rodar diariamente; Longa retenção dos dados; Pode ser usado em caso de falha de algum servidor, desde que o RPO e RTO sejam satisfatórios; Pode voltar dados com granularidade; Pode ser usado logo após um DR. Usado para migrar os serviços (compostos por servidores com aplicações e dados) para locais onde sua utilização seja possível. Traz a garantia de que os serviços estarão disponíveis. Para finalizar um DR, pode ser preciso usar um backup. Exemplo: Um ambiente sobre uma catástrofe e depois que os workloads sobem no site secundário, existem problemas com os dados, nesse caso é feita uma restauração de backup após a mudança de site. Isso deve ser levado em consideração para o RTO.
Porque Continuidade de Negócio / DR? Perda de Dados & Serviços Custo da Disrupção Marca & Capital Compliance Organizações experienciam 4+ disrupções por ano Custo médio da disrupção é de $1.5M/hora Perda da reputação é muitas vezes irreparável Tempo de Recuperação varia de 1 até 9 horas 4 em 10 empresas não reabrem após grandes disastres Confiança do cliente e marca severamente impactados Downtime = Perda de negócios para concorrentes ou até fechamento * Source: EMC Digital Universe with Research and Analysis by IDC, 2014
Proteção deve evoluir com a TI
Desafios Técnicos Quais são nossos requisitos de RPO/RTO para as aplicações que necessitam de Recuperação de Desastres? Que tecnologia de replicação usamos? Como nós podemos nos assegurar sobre a consistência dos bancos de dados e aplicações? Como devemos monitorar o que está sendo feito durante os testes e recuperações?
ASR - Cenários O ASR orquestra replicação entre ambientes e também gerencia a recuperação de desastres. Cenários: VMs de VMware, Hyper-V e servidores Físicos locais para o Azure VMs de VMware, Hyper-V (gerenciadas por SCVMM) e Servidores Físicos entre sites do cliente De Azure para Azure (Regiões diferentes) Beneficios: Planos de recuperação, automação, escolha de tamanho das VMs, testes de failover, entre outros...
ASR - Cenários Microsoft AZURE Microsoft AZURE Microsoft AZURE Microsoft AZURE Microsoft Azure Site Recovery
ASR Planos de Recuperação Planos de recuperação são planos personalizáveis que agrupam computadores para recuperação em conjunto. As customizações podem ser tarefas préexecução da migração da VM do grupo ou pós-execução dessa migração. Exemplos de configurações: A nível de Plataforma Criar um IP público para a VM; Adicionar VM a um load-balancer A nível de Sistema operacional ou Aplicação Realizar updates em tabelas de configurações em um banco de dados Alteração dentro da VM como mudança de string de conexão no banco de dados.
SQL Server e ASR Azure Site Recovery Grupo de disponibilidade Always On Várias instâncias autônomas do SQL Server cada uma executando em um cluster de failover com vários nós ou sem cluster. Os bancos de dados podem ser agrupados em grupos de failover, que podem ser copiados (espelhados) em instâncias do SQL Server, de modo que não exista a necessidade de armazenamento compartilhado. Espelhamento de banco de dados (modo de alta segurança) Protege um único banco de dados para uma única cópia secundária. Disponível nos modos de replicação de alta segurança (síncrona) e de alto desempenho (assíncrono). Não requer um cluster de failover.
SQL Server e ASR Azure Site Recovery SQL Server autônomo O SQL Server e o banco de dados estão hospedados em um único servidor (físico ou virtual). O clustering de host é usado para alta disponibilidade, se o servidor for virtual.
Demo
Ambiente da Demo
Ambiente da Demo
Ambiente da Demo
Recovery Vault
Recovery Vault
Recovery Vault
Recovery Vault
Dúvidas
Obrigado!! Marcos Schardong marcos@cloudworks.com.br