Sistemas Distribuídos - 2012\2 Prof. Vagner J. do Sacramento Rodrigues. Cassandra. Replicação. Leandro, Michelle, Renan



Documentos relacionados
Sistemas Distribuídos

MÓDULO 8 ARQUITETURA DOS SISTEMAS DE BANCO DE DADOS

Introdução ao Modelos de Duas Camadas Cliente Servidor

Disciplina de Banco de Dados Introdução

Redes de Computadores

Finalizando o Pedido (Tarefa G) Prof. Fellipe Aleixo (fellipe.aleixo@ifrn.edu.br)

Prof. Ms. José Eduardo Santarem Segundo Demonstrar o impacto que o tema virtualização tem representado no mercado

Prof. Luiz Fernando. Unidade III ADMINISTRAÇÃO DE

Apresentação do Artigo

PEER DATA MANAGEMENT SYSTEM

AULA 5 Sistemas Operacionais

A memória é um recurso fundamental e de extrema importância para a operação de qualquer Sistema Computacional; A memória trata-se de uma grande

REDE DE COMPUTADORES

Bancos de Dados III. Replicação de Dados. Rogério Costa Replicação

Tecnologia de armazenamento Intel (Intel RST) RAID 0, 1, 5, 10, Matrix RAID, RAID -Pronto

Cálculo utilizando variáveis do tipo DATA

Avaliação de dependabilidade em infraestruturas Eucalyptus geograficamente distribuídas

Estratégia de Implantação do GridUNESP. II Brazilian LHC Computing Workshop - GridUNESP

Revista Eletrônica da FANESE ISSN

Configuração manual.ost Microsoft Office 365

Varnish-Cache: Velocidade e disponibilidade para aplicações WEB

UFF-Fundamentos de Sistemas Multimídia. Redes de Distribuição de Conteúdo (CDN)

Entendendo como funciona o NAT

SISTEMA DE ARQUIVOS. Instrutor: Mawro Klinger

Prof. Luiz Fernando Bittencourt MC714. Sistemas Distribuídos 2 semestre, 2014

DAS5102 Fundamentos da Estrutura da Informação

Faculdades Santa Cruz - Inove. Plano de Aula Base: Livro - Distributed Systems Professor: Jean Louis de Oliveira.

Sistemas Distribuídos

Fundamentos de Sistemas Operacionais

Instalando e configurando DFS (Distributed File System) no Windows Server 2008 R2 em ambiente virtual (VirtualBox)

Instalando e Configurando o DNS Server

ADMINISTRAÇÃO DOS RECURSOS DE DADOS

EAGLE TECNOLOGIA E DESIGN CRIAÇÃO DE SERVIDOR CLONE APCEF/RS

Universidade de Brasília Instituto de Ciências Exatas Departamento de Ciência da Computação

Apresentação PostgreSQL 8.2/ 8.3 Domingos Martins ES

Garantindo a. Máquinas Virtuais do. alta disponibilidade nas. Microsoft Azure MDC305

RAID 1. RAID 0 2. RAID 1

Hoje é inegável que a sobrevivência das organizações depende de dados precisos e atualizados.

Processo de Controle das Reposições da loja

Prof. Luiz Fernando Bittencourt MC714. Sistemas Distribuídos 2 semestre, 2013

29/06/ :30 Leite Júnior QUESTÕES CESPE BACKUP

Prof. Samuel Henrique Bucke Brito

Sistemas Distribuídos. Professora: Ana Paula Couto DCC 064

Bancos de Dados. Conceitos F undamentais em S is temas de B ancos de Dados e s uas Aplicações

Sistemas Distribuídos. Professora: Ana Paula Couto DCC 064

Kaspersky Security for Virtualization. Overview

Sistema de Arquivos EXT3

Senado Federal Questões 2012

Arquitetura de Computadores. Sistemas Operacionais IV

SISTEMAS DE ARQUIVOS Sistemas operacionais

Sistemas Operacionais: Sistema de Arquivos

<Insert Picture Here> Comparativo entre DBSE e DBEE

Apresentação... Nome: Vanderlei Cordeiro Frazão

Amadeus Automatic Update (Mudança de versão)

Tecnologia e Infraestrutura. Conceitos de Redes

LGW4000 Labcom Media Gateway. Labcom Media Gateway Apresentação Geral 10/11/2011

MODELO CLIENTE SERVIDOR

4 Um Exemplo de Implementação

Projeto de Arquitetura

Banco de Dados I. Apresentação (mini-currículo) Conceitos. Disciplina Banco de Dados. Cont... Cont... Edson Thizon

04/08/2012 MODELAGEM DE DADOS. PROF. RAFAEL DIAS RIBEIRO, MODELAGEM DE DADOS. Aula 2. Prof. Rafael Dias Ribeiro. M.Sc.

NanoDataCenters. Aline Kaori Takechi

Consulte a exposição. Qual declaração descreve corretamente como R1 irá determinar o melhor caminho para R2?

Gerência do Sistema de Arquivos. Adão de Melo Neto

Cap. 11 Programando o suprimento. André Jun Nishizawa

AULA 16 - Sistema de Arquivos

Universidade Federal de Santa Maria Curso de Arquivologia. Disciplina de Banco de Dados Aplicados à Arquivística. Versao 1.

Leandro Ramos RAID.

Tópicos Especiais em Informática

MOD 12 Funções Operação de Serviços

Online Help StruxureWare Data Center Expert

Sistema de Arquivos FAT

Aula 01 Introdução ao Gerenciamento de Redes

Sistemas Distribuídos. Professora: Ana Paula Couto DCC 064

Gerência de Redes. Arquitetura de Gerenciamento.

Multiplexador. Permitem que vários equipamentos compartilhem um único canal de comunicação

SEGURANÇA DE REDE DE COMPUTADORES E SEGURANÇA E AUDITORIA DE SISTEMAS

SOLUÇÕES PARA CONTINUIDADE DO NEGÓCIO

Sistemas Distribuídos. Introdução

ADMINISTRAÇÃO DOS RECURSOS DE DADOS

Roteamento em Redes de Computadores

Virtual Local Area Network VLAN

Seminário: Google File System (GFS)

RAID. Redundant Array of Independent Drives. Conjunto Redundante de Discos Independentes

SISTEMAS DISTRIBUÍDOS

LINX POSTOS AUTOSYSTEM

QUESTIONAMENTOS ACERCA DO EDITAL DO PREGÃO ELETRÔNICO AA Nº 10/ BNDES. Em resposta aos questionamentos formulados, o BNDES esclarece:

RAID. Propõe o aumento da confiabilidade e desempenho do armazenamento em disco. RAID (Redundant Array of Independent Disks )

Licenciamento do System Center Server 2012 Server Management

Tópicos Especiais em Redes de Telecomunicações

05/08/2013. Sistemas Distribuídos Cluster. Sistemas Distribuídos Cluster. Agenda. Introdução

SISTEMAS OPERACIONAIS DE REDE

Introdução à Banco de Dados. Definição

Introdução à Computação Móvel IP Móvel. Movimentação de Host. Movimentação de Host. Francisco José da Silva e Silva

Instalando e Configurando o DNS Server

Transcrição:

Sistemas Distribuídos - 2012\2 Prof. Vagner J. do Sacramento Rodrigues Cassandra Replicação Leandro, Michelle, Renan

Replicação Vantagens: maior disponibilidade: os dados permanecem acessíveis diante de falhas maior segurança: dados redundantes Desvantagens: controle de consistência: é preciso manter as réplicas atualizadas

Definições Básicas réplica: cópia de um Row não existe uma réplica principal fator de replicação: número de nós que devem armazenar uma réplica estratégia de replicação: maneira com que as réplicas serão distribuídas entre os nós data center: agrupamento lógico de nós em um cluster com finalidades de replicação rack: agrupamento lógico de nós em um data center endpoint: nó passível de receber uma réplica no processo de replicação

Replicação A estratégia de replicação é definida na criação do Keyspace, juntamente com o fator de replicação.

Replicação A alteração desses parametros pode ser feita via cli, porém exige a reparação dos nós update keyspace Keyspace1 with strategy_options = {replication_factor:3} Durante o período de atualização é preciso estar ciente de que nós podem não responder às consultas

Estratégias de Replicação Basicamente fazem o seguinte: 1. O Snitch retorna uma lista com os endpoints (nós que podem receber uma réplica) 2. Cria um iterador para uma lista formada à partir dos endpoints retornados e seus tokens 3. Insere nos endpoints retornados pelo iterador até que o fator de replicação seja satisfeito Duas estratégias fornecidas: SimpleStrategy NetworkTopologyStrategy

Simple Strategy Rack Unaware Usado em clusters de um único data center Funcionamento: 1. O particionador determina a posição da primeira réplica (primeiro nó que possui token maior que o token da entrada) 2. As N-1 réplicas são alocadas nos próximos nós do anel seguindo o sentido horário (ordem dos tokens)

Simple Strategy fator de replicação = 3

Simple Strategy (vnodes) fator de replicação = 3

Network Topology Strategy Rack aware Usada quando se tem (ou se planeja ter) um cluster com múltiplos data centers Um fator de replicação para cada data center CREATE KEYSPACE exemplo WITH REPLICATION = { 'CLASS' :'NetworkTopologyStrategy', 'dc1': 3, 'dc2':3 };

Network Topology Strategy É criado um anel virtual para cada data center A partir de então, em cada data center se faz o seguinte: 1. A primeira réplica é colocada em um nó determinado pelo particionador. 2. Se percorre o anel em sentido horário onde a próxima réplica é inserida em um nó pertencente a um rack diferente do nó da réplica anterior. Se não existe tal rack, as réplicas restantes são colocadas sem a restrição dos racks

Network Topology Strategy

Network Topology Strategy Nós devem alternar data centers no anel para evitar sobrecargas de réplicas em um único nó

Snitch Fornece informações para o Cassandra à respeito dos nós no cluster Além da replicação, é usado nas requisições para roteamento eficiente Através dele é possível fazer diversas consultas: qual o rack de um nó? qual o datacenter de um nó? quais são os nós mais próximos que eu posso inserir uma réplica? quais os nós de um datacenter?

Snitch Defini-se o tipo do snitch no arquivo de configuração do cassandra Todos os nós devem ter a mesma configuração

SimpleSnitch Não leva em conta organização de racks e data centers Retorna sempre uma lista de todos os nós do anel public String getrack(inetaddress endpoint){ return "rack1";} public String getdatacenter(inetaddress endpoint){ return "datacenter1";} public List<InetAddress> getsortedlistbyproximity(inetaddress address, Collection<InetAddress> unsortedaddress) { List<InetAddress> preferred = new ArrayList<InetAddress>(unsortedAddress); sortbyproximity(address, preferred); return preferred; }

RackInferringSnitch Leva em conta racks e data centers Infere o rack e data center de um nó à partir do seu indereço IP endereço:192.168.80.x data center:168 rack:80

PropertyFileSnitch Leva em conta racks e data centers Obtém o rack e data center de um nó à partir de um arquivo definido pelo usuário ( cassandra-topology.properties) # Data Center 1 192.168.80.1=DC1:RAC1 192.168.80.2=DC1:RAC2 # Data Center 1 192.168.80.3=DC2:RAC1 192.168.80.4=DC2:RAC2

GossipingPropertyFileSnitch Guarda o rack e o data center do nó atual Informações são propagadas para os outros nós através do gossip. Quando o arquivo cassandra-topology.properties o PropertyFileSnitch pode ser usado como Snitch reserva

DynamicSnitching Utilizado para auxiliar o Snitch em operações de leitura Mantém um nó como sendo o mais eficiente para se fazer leituras Utiliza um limiar que define quando esse nó preferencial deve ser substituido

Referências Advantages of replication in distributed systems http://www.indiastudychannel. com/resources/102074-advantages-replication-distributed-system.aspx Replication in Distributed File Systems http://crystal.uta. edu/~kumar/cse6306/papers/smita_repdfs.pdf Apache Cassandra Glossary http://io.typepad.com/glossary. html An Intro to Cassandra and NetworkTopologyStrategy http://www.onsip. com/blog/2011/07/15/intro-to-cassandra-and-networktopologystrategy Cassandra 1.2 create keyspace http://kwlum80.blogspot.com.br/2012/10/cassandra-12- create-keyspace.html Cassandra Wiki - Operations http://wiki.apache.org/cassandra/operations About Replication in Cassandra 1.1 http://www.datastax.com/docs/1. 1/cluster_architecture/replication About data distribution and replication in Cassandra 1.2 http://www.datastax.com/docs/1. 2/cluster_architecture/data_distribution#about-data-distribution-and-replication About Replica Placement Strategy in Cassandra 0.8 http://www.datastax.com/docs/0. 8/cluster_architecture/replication#replication-strategy Types of snitches in Cassandra 1.2 http://www.datastax.com/docs/1. 2/cluster_architecture/snitches http://svn.apache.org/repos/asf/cassandra/trunk/src/java/org/apache/cassandra/locator/