Sistemas Distribuídos
|
|
- Daniela Angelim Rosa
- 7 Há anos
- Visualizações:
Transcrição
1 Sistemas Distribuídos Tolerância a faltas Prof. Emerson Ribeiro de Mello Instituto Federal de Santa Catarina IFSC campus São José mello@ifsc.edu.br 3 de dezembro de /27
2 Algumas definições 2/27
3 Definições: Falha, erro e falta Falha Um processo é considerado falho se durante sua execução apresentar um comportamento diferente daquilo que foi especificado Um processo correto não apresenta falhas durante todo o intervalo de execução que está sendo observado Erro Erro é uma parte do estado do sistema que pode levá-lo a falhar Ex: Durante a transmissão de dados alguns bits são alterados Falta A causa de um erro é chamada de falta Ex: Meio de transmissão defeituoso, condições climáticas 2/27
4 Como lidar com faltas evitadas projetar sistema para minimizar ocorrência de faltas Validação formal, inspeção de código, teste e uso de hardware robusto removidas Uma vez encontradas, podem ser removidas por meio de testes, depuração, substituição de componentes toleradas Assuma que faltas (ou potenciais) sempre existirão Sistema deve continuar funcionando mesmo diante de faltas 3/27
5 Exemplo: falha, erro e falta Tubos pitot são sensores de velocidade que estão susceptíveis a congelamento devido ao mau tempo, gerando problema para o sistema de controle Comportamento esperado: controlar a velocidade da aeronave Falha: Erro: Falta: 4/27
6 Exemplo: falha, erro e falta Tubos pitot são sensores de velocidade que estão susceptíveis a congelamento devido ao mau tempo, gerando problema para o sistema de controle Comportamento esperado: controlar a velocidade da aeronave Falha: Sistema de controle não permite aumentar velocidade Erro: Avião a 400km/h, porém envia o valor de 840km/h Falta: Congelamento do tubo pitot 4/27
7 Tolerância a faltas Sistemas críticos que não podem falhar Usina nuclear, aeronaves, etc Sistemas críticos cuja a falha representa prejuízo financeiro Sistemas bancários, sítios web de comércio eletrônico, etc. 5/27
8 Tolerância a faltas Sistemas críticos que não podem falhar Usina nuclear, aeronaves, etc Sistemas críticos cuja a falha representa prejuízo financeiro Sistemas bancários, sítios web de comércio eletrônico, etc. Sistemas distribuídos são susceptíveis a falhas parciais Alguns componentes do sistema podem falhar e garantir o funcionamento correto depende de detectar, tolerar e recuperar destas falhas Motivos: falhas de hardware, bugs em softwares, erros na transmissão pela rede, etc. 5/27
9 Segurança de funcionamento Para um sistema crítico é desejado que este tenha propriedades de segurança de funcionamento (dependable), o que inclui Disponibilidade (availability) O sistema sempre estará pronto para ser usado Confiabilidade (reliability) O sistema pode ser executado constantemente sem apresentar falhas Segurança (safety) Se o sistema vir a falhar temporariamente, isto não resultará em catástrofes Facilidade de manutenção (maintainability) Indica o quão fácil o sistema que falhou pode ser recuperado 6/27
10 Faltas Categorias Permanente se mantém ao longo do tempo Intermitente ocorre eventualmente devido a instabilidades de hardware ou software Transitória resultado de condições temporárias e que a princípio não se repetirá 7/27
11 Faltas Categorias Permanente se mantém ao longo do tempo Intermitente ocorre eventualmente devido a instabilidades de hardware ou software Transitória resultado de condições temporárias e que a princípio não se repetirá Faltas no processamento ou armazenamento Fail-silent (fail-stop) para de funcionar Fail-silent (fail-restart) ao retornar perde o estado Faltas de comunicação corrupção dos dados falha no enlace falha somente em um sentido particionamento da rede 7/27
12 Tipos de falhas Parada O processo para de funcionar, mas estava funcionando corretamente até então Omissão de recepção O processo não recebe as mensagens enviadas a ele Omissão de envio O processo falha ao enviar as mensagens que se espera que ele envie Arbitrária O processo continua a funcionar, porém produz uma saída incorreta Também chamada de falhas bizantinas 8/27
13 Tipos de falhas Parada O processo para de funcionar, mas estava funcionando corretamente até então Omissão de recepção O processo não recebe as mensagens enviadas a ele Omissão de envio O processo falha ao enviar as mensagens que se espera que ele envie Arbitrária O processo continua a funcionar, porém produz uma saída incorreta Também chamada de falhas bizantinas Qual o tipo de falha para o caso do tubos pitot? 8/27
14 Detector de falhas Detector de falhas é um serviço responsável por verificar se um determinado processo falhou Geralmente implementado localmente dentro de cada processo Algoritmo de detecção de falhas combina detectores de vários processos 9/27
15 Detector de falhas: classificação Detectores não confiáveis indica que o processo é Não suspeito recebeu evidências recentes que o processo não falhou Ex: mensagem foi recebida há pouco tempo Suspeito possui alguma indicação que o processo falhou recentemente Ex: nenhuma mensagem recebida dentro do intervalo esperado Um processo correto, porém com uma execução mais lenta pode ser considerado suspeito 10/27
16 Detector de falhas: classificação Detectores não confiáveis indica que o processo é Não suspeito recebeu evidências recentes que o processo não falhou Ex: mensagem foi recebida há pouco tempo Suspeito possui alguma indicação que o processo falhou recentemente Ex: nenhuma mensagem recebida dentro do intervalo esperado Um processo correto, porém com uma execução mais lenta pode ser considerado suspeito Detectores confiáveis indica que o processo é Não suspeito igual ao anterior Falho conseguiu determinar que o processo falhou 10/27
17 Redundância Técnica que permite tolerar faltas Redundância de informação Inclusão de bits extra em blocos de dados de forma a permitir recuperar corretamente o bloco mesmo se alguns bits forem corrompidos Ex: Código de Hamming, Código Reed-Solomon Redundância temporal Repetir uma ação várias vezes até ter certeza que foi executada Adequada para faltas intermitentes ou transitórias Ex: TCP Redundância física Fazer uso de várias réplicas de um equipamento ou processo Ex: Redundância Modular Tripla (TRM) de Von Neumann, RAID, etc. 11/27
18 Redundância Modular Tripla (TRM) A B C não tolerante (a) a faltas Voter A1 V1 B1 V4 C1 V7 A2 V2 B2 V5 C2 V8 A3 V3 B3 V6 C3 V9 tolerante (b) a faltas 12/27
19 Obtendo Tolerância a faltas em SD 13/27
20 Organização de processos idênticos em grupos Flat group Hierarchical group Coordinator Worker (a) Grupo plano Todos possuem papéis idênticos e toda decisão é tomada de forma coletiva Não existe ponto único de falha, porém a tomada de decisão é mais complicada Grupo hierárquico Todo pedido que chega deve ser encaminhado para o coordenador e este determina para quem encaminhar Vantagens e desvantagens opostas àquelas do grupo plano (b) 13/27
21 Mascaramento de falhas e replicação O agrupamento de processos idênticos permite mascarar um ou mais processos falhos A independência de falhas é quando se busca evitar faltas que afetem todos os processos na Ilha de Santa Catarina em /27
22 Replicação passiva Primário-backup Uma réplica sempre será o mestre (primário) e todas as demais serão escravas (backup) Clientes sempre interagem com a réplica primária Primário sempre atualiza os backups sobre o estado do sistema Se o primário falhar, então um dos backups é promovido a primário fazendo uso de algoritmo de eleição 15/27
23 Replicação ativa Todas as réplicas possuem papéis idênticos Dado um estado inicial e uma sequência de pedidos, todos os processos irão produzir a mesma sequência de respostas e irão terminar em um mesmo estado final Todas as réplicas processam os pedidos de forma independente, porém apresentam respostas idênticas Nada precisa ser feito se uma réplica falhar e ainda houver mais réplicas ativas 16/27
24 Sistemas replicados tolerantes a faltas Um sistema é dito tolerante a k faltas se continuar a funcionar corretamente mesmo se k réplicas de n falharem Total de réplicas para falhas de parada : n k + 1 Basta que uma réplica seja correta Para falhas arbitrárias (falha bizantina) n 2k + 1 para tolerar k faltas A maioria das réplicas deve ser correta 17/27
25 Sistemas replicados tolerantes a faltas Um sistema é dito tolerante a k faltas se continuar a funcionar corretamente mesmo se k réplicas de n falharem Total de réplicas para falhas de parada : n k + 1 Basta que uma réplica seja correta Para falhas arbitrárias (falha bizantina) n 2k + 1 para tolerar k faltas A maioria das réplicas deve ser correta Premissa Todas as mensagens serão processadas na mesma ordem por todos os processos difusão seletiva com ordem total (atomic multicast) 17/27
26 Acordo em sistemas distribuídos sujeitos a faltas Algoritmos de acordo distribuído visam garantir que todos processos corretos acordem sobre um determinado valor em um número finito de passos 18/27
27 Acordo em sistemas distribuídos sujeitos a faltas Algoritmos de acordo distribuído visam garantir que todos processos corretos acordem sobre um determinado valor em um número finito de passos Na prática, sistemas distribuídos assumem processos assíncronos, transmissão unicast e atraso não é limitado 18/27
28 Problema dos Generais Bizantinos Lamport, 82 Surgiu da necessidade de consolidar sinais de sensores de altitude replicados em um avião Ter um único sensor é muito arriscado! Tendo mais de um sensor, como saber qual o valor correto, dado que alguns destes podem falhar? 19/27
29 Problema dos Generais Bizantinos Lamport, 82 Em um cerco ao inimigo existem N generais, cada um liderando uma divisão do Exército Bizantino Todos generais conversam entre em si através de mensageiros Após observarem o inimigo todos os generais devem chegar a um acordo comum Devemos atacar ou partir em retirada? 20/27
30 Problema dos Generais Bizantinos Lamport, 82 Em um cerco ao inimigo existem N generais, cada um liderando uma divisão do Exército Bizantino Todos generais conversam entre em si através de mensageiros Após observarem o inimigo todos os generais devem chegar a um acordo comum Devemos atacar ou partir em retirada? m generais podem ser traidores e enviam informações incorretas a fim de evitar que generais leais cheguem a um acordo 20/27
31 Problema dos Generais Bizantinos Lamport, 82 Algoritmo executado em paralelo por n vezes Dos n generais, um é o comandante e n-1 são seus subordinados O comandante envia mensagem para cada um de seus subordinados C1 Todos subordinados leais obedecem a mesma ordem C2 Se o comandante for leal, então todos subordinados leais obedecem a ordem dada por ele 21/27
32 Problema dos Generais Bizantinos Lamport, 82 Algoritmo executado em paralelo por n vezes Dos n generais, um é o comandante e n-1 são seus subordinados O comandante envia mensagem para cada um de seus subordinados C1 Todos subordinados leais obedecem a mesma ordem C2 Se o comandante for leal, então todos subordinados leais obedecem a ordem dada por ele Se generais só podem se comunicar através de mensagens orais, então só é possível chegar a uma solução se mais de 2/3 dos generais forem leais Com 3 generais e se 1 deles for traidor, então nenhuma solução é possível 21/27
33 Problema dos Generais Bizantinos Lamport, 82 22/27
34 Problema dos Generais Bizantinos Lamport, 82 22/27
35 Problema dos Generais Bizantinos Lamport, 82 Em ambos os casos o subordinado 1 não consegue decidir qual ordem seguir e quem é o traidor solução: n 3m /27
36 Problema dos Generais Bizantinos Lamport, 82 Algoritmo com Mensagens Orais (OM) Solução n 3m + 1 Premissas no sistema de mensagens orais (OM) trocadas entre os generais P1 Toda mensagem enviada é entregue corretamente P2 O receptor da mensagem sabe quem a enviou P3 A perda da mensagem pode ser detectada Se não enviar mensagem, então assume-se a ordem retirar Ou seja, processos síncronos, comunicação ordenada e unicast, atraso da comunicação é limitado P1 e P2 previnem que um traidor interfira na comunicação entre dois outros generais P3 previne que um traidor atrapalhe o acordo simplesmente não enviando mensagens 23/27
37 Problema dos Generais Bizantinos Lamport, 82 Algoritmo com Mensagens Orais (OM) Solução n 3m + 1 Objetivo: cada general construir um vetor V de tamanho n, sendo que se um general i é leal, então V [i] = v i. Caso contrário, V [i] = indefinido. v i é o valor fornecido pelo general i aos demais generais Aquele valor que for considerado pela maioria é o valor a ser assumido pelo general 24/27
38 Problema dos Generais Bizantinos Lamport, 82 Algoritmo com Mensagens Orais (OM) Solução n 3m /27
39 Problema dos Generais Bizantinos Lamport, 82 Algoritmo com Mensagens Orais (OM) Solução n 3m /27
40 Disponibilidade e tolerância a faltas Com a tolerância a falta é possível aumentar o nível de disponibilidade tempodisponivel Disponibilidade = tempodisponivel + tempoindisponivel Disponibilidade 100% é inviável atingir, pois quanto mais próximo de 100%, mais custoso será o sistema classe nível indisponibilidade anual mensal contínuo % 31.5 seg 2.59 seg tolerante a faltas % 5.26 min 25.9 seg alta disponibilidade 99.9% 8.76 horas 43.8 min disponibilidade normal 99% 3.65 dias 7.20 horas Acordos de Nível de Serviço (Service Level Agreements SLA) são geralmente construídos sobre a disponibilidade mensal 26/27
41 Curiosidade na área de redes Visite a página do PoP-SC da RNP e veja sobre a disponibilidade dos enlaces nos últimos 3 anos Na página da RNP veja sobre a disponibilidade da rede IPÊ em /27
Sistemas Distribuídos Capítulo 8 - Aula 13
Sistemas Distribuídos Capítulo 8 - Aula 13 Aula de hoje Aula Passada Exclusão Mútua Algoritmos de Eleição Tolerância a Falhas Conceitos básicos Modelos de falha Redundância Resiliência de Processo 1 Tolerância
Leia maisSistemas Distribuídos: Conceitos e Projeto Resiliência de Processos
Sistemas Distribuídos: Conceitos e Projeto Resiliência de Processos Francisco José da Silva e Silva Laboratório de Sistemas Distribuídos (LSD) Departamento de Informática / UFMA http://www.lsd.ufma.br
Leia maisfalhas em sistemas distribuídos
Tolerância a Falhas falhas em sistemas distribuídos Lamport: A distributed system is a system where I can t get any work done if a machine I ve never heard of crashes. sistemas distribuídos e falhas parciais
Leia maisTolerância a Falhas. June 2, 2010
Tolerância a Falhas June 2, 2010 Sumário Introdução e Terminologia Modelos Redundância Grupos de Processos Leitura Adicional Sumário Introdução e Terminologia Modelos Redundância Grupos de Processos Leitura
Leia maisTolerância a Falhas. Sumário. Acordo Distribuído. December 18, Grupos de Processos
Tolerância a Falhas Acordo Distribuído December 18, 2009 Sumário Grupos de Processos Acordo Distribuído Com falha nas comunicações Modelos de Sincronismo Sistemas Assíncronos Sistemas Síncronos Grupos
Leia maisSistemas Distribuídos Capítulo 8 - Aula 14
Sistemas Distribuídos Capítulo 8 - Aula 14 Aula Passada Tolerância a Falhas Conceitos básicos Modelos de falha Redundância Resiliência de Processo Aula de hoje Comunicação Confiável Cliente-Servidor Comunicação
Leia maisAPLICAÇÕES EM SISTEMAS DISTRIBUÍDOS Prof. Ricardo Rodrigues Barcelar
- Aula 2-1. REVISÃO SOBRE CONCEITOS FUNDAMENTAIS DE SISTEMAS DISTRIBUÍDOS Na primeira parte abordamos conceitos básicos sobre sistemas distribuídos, os quais são imprescindíveis na implementação de sistemas
Leia maisTolerância a Falhas. Sumário. December 18, Introdução e Terminologia. Modelos de Falha
Tolerância a Falhas December 18, 2009 Sumário Introdução e Terminologia Modelos de Falha Tolerância a Falhas (Fault-tolerance) Sistemas distribuídos possuem modos de avaria parcial: Alguns componentes
Leia maisfalhas em sistemas distribuídos
Tolerância a Falhas falhas em sistemas distribuídos Lamport: A distributed system is a system where I can t get any work done if a machine I ve never heard of crashes. sistemas distribuídos e falhas parciais
Leia maisAlgoritmos Distribuídos Modelo Computacional
Algoritmos Distribuídos Modelo Computacional Antonio Alfredo Ferreira Loureiro loureiro@dcc.ufmg.br http://www.dcc.ufmg.br/~loureiro UFMG/ICEx/DCC 1 Modelo Computacional Modelo: Esquema que possibilita
Leia maisSistemas Distribuídos. Professora: Ana Paula Couto DCC 064
Sistemas Distribuídos Professora: Ana Paula Couto DCC 064 Recuperação Capítulo 8 Agenda Introdução Pontos de Verificação Registro de Mensagens Introdução Essência: Quando ocorre uma falha no sistema, é
Leia maisTécnicas para obtenção de Tolerância a Falhas
Técnicas para obtenção de Tolerância a Falhas Tolerância a falhas / defeitos Bibliografia H. Kopetz, Design Principles for Distributed Embedded Applications, Kluwer Academic Publishers, 1997. 1 Tolerância
Leia maisSistemas Distribuídos Capítulo 8 - Aula 15
Sistemas Distribuídos Capítulo 8 - Aula 15 Aula de hoje Aula Passada Comunicação Confiável Cliente-Servidor Comunicação Confiável de Grupo Comunicação Confiável de Grupo Multicast Atômico Sincronia Virtual
Leia maisPROVIDING DEPENDABILITY FOR WEB SERVICES
PROVIDING DEPENDABILITY FOR WEB SERVICES Dário Lima Pedro Venâncio a16435 m2610 Sistemas Distribuídos e Tolerância a Falhas 1 Esta tecnologia tem como finalidade proporcionar interoperabilidade para aplicações
Leia maisSistemas Distribuídos Exclusão Mútua. Edeyson Andrade Gomes
Sistemas Distribuídos Exclusão Mútua Edeyson Andrade Gomes www.edeyson.com.br Roteiro da Aula Introdução Coordenação e Acordo Suposição de Falhas Exclusão Mútua Algoritmos Centralizado Distribuído Anel
Leia maisSistemas Distribuídos
Comunicação em Grupo Referência Sistemas operacionais modernos Andrew S. TANENBAUM Prentice-Hall, 1995 Seção 10.4 pág. 304-311 2 Comunicação em Grupo Suponha que se deseja um serviço de arquivos único
Leia mais(Broadcast - um emissor envia a mensagem para todos os nós do sistema) Multicast um emissor, um grupo de processos como receptores
Comunicação em Grupo (Broadcast - um emissor envia a mensagem para todos os nós do sistema) Multicast um emissor, um grupo de processos como receptores Exemplos de aplicação: - ferramentas de trabalho
Leia mais1- Replicação de Dados - A replicação de dados permite lidar com falhas ao nível dos nós que impeçam o acesso
1- Replicação de Dados - A replicação de dados permite lidar com falhas ao nível dos nós que impeçam o acesso aos dados neles armazenados e com falhas ao nível da comunicação de dados. - Na replicação
Leia maisTolerância a Faltas. Page. Sistema Computacional. Sistema Computacional. Sistema Computacional
Sistema Computacional Tolerância a Faltas Sistema computacional: Formado por um conjunto de componentes internas Contém um estado interno Está sujeito a um conjunto de entradas, ou estímulos externos Tem
Leia maisEngenharia de Software Sistemas Sociotécnicos
Engenharia de Software Sistemas Sociotécnicos Prof. Carlos Lucas uma vela não perde sua chama acendendo outra Apenas 5% dos professores fizeram, fazem e farão a diferença 1 Sistema Sistemas Sociotécnicos
Leia maisRAID: Conceito e Tipos
RAID: Conceito e Tipos RAID significa em português Conjunto Redundante de Discos Independentes/Econômicos (inglês: Redundant Array of Independent/Inexpensive Drives) que tem como objetivos aumentar a velocidade
Leia maisAPLICAÇÕES EM SISTEMAS DISTRIBUÍDOS Prof. Ricardo Rodrigues Barcelar
- Aula 3-1. REVISÃO SOBRE CONCEITOS FUNDAMENTAIS DE SISTEMAS DISTRIBUÍDOS Na segunda parte abordamos o tema tolerância a falhas, assunto este muito relacionado a redes de computadores, mas que nos mostra
Leia maisSistemas Distribuídos. Ricardo Ribeiro dos Santos
Sistemas Distribuídos Ricardo Ribeiro dos Santos ricrs@ec.ucdb.br Curso de Engenharia de Computação UCDB Setembro/2003 Tópicos Sincronização em Sistemas Distribuídos Sincronização de Relógio Estados Globais
Leia maisNível de Enlace. Nível de Enlace. Serviços. Serviços oferecidos os nível de rede
Nível de Enlace Enlace: caminho lógico entre estações. Permite comunicação eficiente e confiável entre dois computadores. Funções: fornecer uma interface de serviço à camada de rede; determinar como os
Leia mais1- Replicação de Dados - A replicação de dados permite lidar com falhas ao nível dos nós que impeçam o acesso
1- Replicação de Dados - A replicação de dados permite lidar com falhas ao nível dos nós que impeçam o acesso aos dados neles armazenados e com falhas ao nível da comunicação de dados. - Na replicação
Leia maisSistemas Distribuídos. Professora: Ana Paula Couto DCC 064
Sistemas Distribuídos Professora: Ana Paula Couto DCC 064 Consistência Causal(3) Neste exemplo temos uma sequência de eventos permitida quando o depósito é consistente por causalidade, mas proibida quando
Leia maisNível de Enlace. Nível de Enlace. Serviços. Serviços. Serviços. Serviços. Serviços oferecidos os nível de rede
Nível de Enlace Enlace: caminho lógico entre estações. Permite comunicação eficiente e confiável entre dois computadores. Funções: fornecer uma interface de serviço à camada de rede; determinar como os
Leia maisDepartamento de Engenharia Informática. Tolerância a Faltas. 8/28/2003 José Alves Marques
Tolerância a Faltas Índice Terminologia Falta, erro, falha Fiabilidade, disponibilidade Replicação Modelo Transaccional Transacções distribuídas Sistema Computacional Sistema computacional: Formado por
Leia maisSistemas entre Pares e Redes Sobrepostas
Redes estruturadas: CAN 1 ricardo.pereira@inesc-id.pt IST 21-10-2009 1 Imagens retiradas de A Scalable Content Addressable Network por Sylvia Ratnasamy, Paul Francis, Mark Handley, Richard Karp, Scott
Leia maisA camada de enlace de dados executa diversas funções específicas. Dentre elas
A camada de enlace de dados executa diversas funções específicas. Dentre elas estão as seguintes: Fornecer uma interface de serviço bem definida à camada de rede. Lidar com erros de transmissão. Regular
Leia maisOrdenação. Sistemas Distribuídos e Tolerância a Falhas. Universidade da Beira Interior 07/08
Ordenação Sistemas Distribuídos e Tolerância a Falhas Universidade da Beira Interior 07/08 Benjamim Marques M1440 Daniel Félix M1441 João Duarte a14951 Índice Introdução Problema FIFO Ordenação Causal
Leia maisArquitectura de Sistemas Paralelos e Distribuídos Comunicação Multicast
Comunicação Multicast MSc. Eugénio Alberto Macumbe Bach. José Tomás Matsimbe A comunicação de uma rede comutada é feita de três formas: unicast, multicast e broadcast: Unicast: Comunicação na qual um quadro
Leia maisTRANSMISSÃO DE DADOS Prof. Ricardo Rodrigues Barcelar
- Aula 1-1. A CAMADA DE ENLACE DE DADOS (Parte 1) Relembrando as aulas do semestre passado quando estudamos os modelos de referência, lembramos que a Camada de Enlace de Dados é a camada responsável pela
Leia maisTempos e Estados Globais. ECO036 - Sistemas Paralelos e Distribuídos
Tempos e Estados Globais ECO036 - Sistemas Paralelos e Distribuídos Tópicos Abordados - Tempo - Relógios e Ordenação de eventos. - Relação Happened- Before - Relógios Lógicos - Vetor de Relógios - Relógios
Leia maisSistemas Distribuídos. Professora: Ana Paula Couto DCC 064
Sistemas Distribuídos Professora: Ana Paula Couto DCC 064 Consistência e Replicação Capítulo 7 Agenda Distribuição de Conteúdo Estado versus operações Protocolos de recuperação de atualizações versus protocolos
Leia maisSistemas Distribuídos. Professora: Ana Paula Couto DCC 064
Sistemas Distribuídos Professora: Ana Paula Couto DCC 064 Comunicação Confiável de Grupo Capítulo 8 Comunicação Confiável de Grupo Camadas de Transporte oferecem comunicação ponto-a-ponto confiável (TCP)
Leia maisSistemas Distribuídos Estados globais. Vinícius Fernandes Soares Mota
Sistemas Distribuídos Estados globais Vinícius Fernandes Soares Mota 1 2 Tópicos Tempo e relógio lógicos (revisão curta) Relógios vetoriais Estados Globais Snapshot distribuído 3 Antes... Por que a sincronização
Leia maisSistemas Distribuídos
Sistemas Distribuídos Deadlocks Referência Sistemas operacionais modernos Andrew S. TANENBAUM Prentice-Hall, 1995 Seção 11.5 pág. 340-344 2 Conteúdo Detecção de deadlock distribuído Detecção centralizada
Leia maisSistemas Distribuídos Capítulo 6 - Aula 12
Sistemas Distribuídos Capítulo 6 - Aula 12 Aula Passada Relógios Lógicos Relógios de Lamport Relógios Vetoriais Aula de hoje Exclusão Mútua Algoritmos de Eleição 1 Exclusão Mútua - Questão fundamental
Leia mais2 Fundamentos Replicação de Dados
2 Fundamentos Neste capítulo serão abordados de forma introdutória os principais conceitos relacionados com replicação de dados. Em seguida, será abordada a metodologia de projeto orientado a domínio que
Leia maisSistemas Distribuídos
Faculdades SENAC Análise e Desenvolvimento de Sistemas 1 de agosto de 2009 Modelo de Interação (Clocks e Eventos) Em SDs é difícil estabelecer limites de tempo sobre o tempo tomado para execução de processos,
Leia maisFiabilidade de Sistema Informáticos
From: Fiabilidade de Sistema Informáticos Engenharia Informática Ramo Sistemas de Informação 4ª ano / 2ª semestre - Basic Concepts and Taxonomy of Dependable and Secure Computing, A. Avizienis, J.C. Laprie
Leia maisModelos Fundamentais. Introdução. Interação. Falhas. Segurança. Prof. Adriano Fiorese
Modelos Fundamentais Introdução Interação Falhas Segurança 1 Introdução Como entender/classificar o comportamento de um sistema: Quais são as principais entidades do sistema? Como elas interagem? Quais
Leia maisTolerância a Falhas com Máquinas de Estado
Sistemas Distribuídos junho de 2013 Histórico Lamport,1984: Using time instead of timeout for fault tolerance in distributed systems Schneider, 1990: Implementing Fault-Tolerant Services using the State
Leia maisSincronização. Tempo e Relógios. Sincronização de Relógios - Algoritmo de Cristian - Algoritmo de Berkeley - Network Time Protocol
Sincronização Tempo e Relógios Sincronização de Relógios - Algoritmo de Cristian - Algoritmo de Berkeley - Network Time Protocol 1 Caso mais simples: Sincronização interna entre dois processos num sistema
Leia maisUm Algoritmo Probabilista de Recuperação de Erros para Difusão Fiável
Um Algoritmo Probabilista de Recuperação de Erros para Difusão Fiável Zhen Xiao, Kennneth P. Birman Apresentação: Henrique Moniz Sumário Introdução: multicast e o contexto do problema Tipos de multicast
Leia maisSistemas de Arquivos Distribuídos. Bruno M. Carvalho Sala: 3F2 Horário: 35M34
Sistemas de Arquivos Distribuídos Bruno M. Carvalho Sala: 3F2 Horário: 35M34 Introdução Serviço de arquivos descreve os serviços oferecidos pelo sistema de arquivos aos clientes Servidor de arquivos processo
Leia maisReplicação. Cleide Luzia Bonfim Possamai 03/05/2018
Replicação Cleide Luzia Bonfim Possamai 03/05/2018 Agenda Conceito Motivação Principais abordagens Replicação single-leader Replicação multi-leader Replicação leaderless Modelos de consistência Conclusão
Leia maisSincronização em Sistemas Distribuídos
Sincronização em Sistemas Distribuídos Universidade Federal do ABC Turma: Ciência da Computação Prof. Dr. Francisco Isidro Massetto Sincronização Como as regiões críticas são implementadas em um SD? Como
Leia maisRedes de Computadores
Redes de Computadores Prof. Marcelo Gonçalves Rubinstein Programa de Pós-Graduação em Engenharia Eletrônica Faculdade de Engenharia Universidade do Estado do Rio de Janeiro Ementa Introdução a Redes de
Leia maisTolerância a falha. Edy Hayashida
Tolerância a falha Edy Hayashida E-mail: edy.hayashida@uol.com.br Introdução Um objetivo importante do projeto de sistemas distribuídos é construir o sistema de modo tal que ele possa se recuperar automaticamente
Leia maisSistemas Distribuídos
Introdução: Comunicação, e Coordenação março de 2015 Comunicação entre Processos troca de mensagens é sempre a primitiva básica sobre essa primitiva podemos construir outras visões da comunicação Mensagens
Leia maisAlgoritmos Distribuídos. AD Modelo Computacional 1
Algoritmos Distribuídos Modelo Computacional Antonio Alfredo Ferreira Loureiro loureiro@dcc.ufmg.br http://www.dcc.ufmg.br/~loureiro AD Modelo Computacional 1 Modelo Computacional Modelo: Esquema que possibilita
Leia maisSISTEMAS DISTRIBUÍDOS
SISTEMAS DISTRIBUÍDOS Introdução Slide 1 Nielsen C. Damasceno Introdução Tanenbaum (2007) definiu que um sistema distribuído é aquele que se apresenta aos seus usuários como um sistema centralizado, mas
Leia maisSISTEMAS DISTRIBUÍDOS
SISTEMAS DISTRIBUÍDOS Capítulo 8 Introdução à replicação e consistência Material de suporte às aulas de Sistemas Distribuídos Copyright DI FCT/ UNL / 1 NOTA PRÉVIA A apresentação utiliza algumas das figuras
Leia maisSistema de entrada e saída (E/S)- Módulos de E/S; tipos de operações de E/S
Sistema de entrada e saída (E/S)- Módulos de E/S; tipos de operações de E/S Explicitar aos alunos os modelos de entrada e saída em um computador e quais barramentos se aplicam a cada componente: memória,
Leia maisSistemas Distribuídos Aula 16
Sistemas Distribuídos Aula 16 Aula passada Relacionando eventos Relógios lógicos Algoritmo de Lamport Propriedades Aula de hoje Limitação de Lamport Relógio de vetores Propriedades Garantindo ordenação
Leia maisIntrodução aos Sistemas Distribuídos
Introdução aos Sistemas Distribuídos Prof. Leonardo Barreto Campos http://sites.google.com/sitew/leonardobcampos 1/29 Sumário Ementa; Bibliografia Calendário Site Introdução Características http://sites.google.com/sitew/leonardobcampos
Leia maisFaculdade Integrada do Ceará FIC Graduação em Redes de Computadores
Faculdade Integrada do Ceará FIC Graduação em Redes de Computadores Disciplina Redes de Banda Larga Prof. Andrey Halysson Lima Barbosa Aula 1 Conceitos básicos de comunicação Sumário Técnicas de transmissão
Leia maisCamada de Enlace de Dados
Camada de Enlace de Dados Camada de Enlace de Dados aborda algoritmos que permitem uma comunicação eficiente e confiável entre dois computadores adjacentes em nível da camada de enlace de dados (adjacentes
Leia maisRedes de Computadores
Redes de Computadores Camada de Transporte Antonio Alfredo Ferreira Loureiro loureiro@dcc.ufmg.br Departamento de Ciência da Computação Universidade Federal de Minas Gerais UFMG/DCC Redes de Computadores
Leia maisSSC643 -Avaliação de Desempenho de Sistemas Computacionais -
Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Departamento de Sistemas de Computação SSC643 -Avaliação de Desempenho de Sistemas Computacionais - Aula 2 Sarita Mazzini Bruschi
Leia maisDirected Diffusion. Danilo Michalczuk Taveira 1. Grupo de Teleinformática e Automação (GTA) Disciplina CPE825 - Roteamento em Redes de Computadores
Directed Diffusion Danilo Michalczuk Taveira 1 1 Universidade Federal do Rio de Janeiro (UFRJ) Grupo de Teleinformática e Automação (GTA) Disciplina CPE825 - Roteamento em Redes de Computadores danilo@gta.ufrj.br
Leia maisSIST706 Sistemas Distribuídos
Slide05 Tolerância a Falhas SIST706 Sistemas Distribuídos 2013/1 Prof. Jéfer Benedett Dörr @: prof.jefer@gmail.com profjefer.wordpress.com Tolerância a Falhas http://www.inf.ufpr.br/elias/sisdis/index.html
Leia maisUNIVERSIDADE ESTADUAL DE PONTA GROSSA SETOR DE CIÊNCIAS AGRÁRIAS E DE TECNOLOGIA DEPARTAMENTO DE INFORMÁTICA
UNIVERSIDADE ESTADUAL DE PONTA GROSSA SETOR DE CIÊNCIAS AGRÁRIAS E DE TECNOLOGIA DEPARTAMENTO DE INFORMÁTICA GABRIEL JOÃO SCHILLER THIAGO MARCOMINI CAIRES ALTA DISPONIBILIDADE PONTA GROSSA 2017 GABRIEL
Leia maisSISTEMAS DISTRIBUÍDOS
SISTEMAS DISTRIBUÍDOS Sincronização Slide 7 Nielsen C. Damasceno Introdução Utilizando Sistemas Distribuídos, uma grande dificuldade que temos é como garantir o acesso exclusivo a um recurso compartilhado,
Leia maisRoteiro. Introdução Sincronização de Relógio Físico Sincronização de Relógio Lógico Exclusão Mútua
Sincronização Roteiro Introdução Sincronização de Relógio Físico Sincronização de Relógio Lógico Exclusão Mútua Introdução A comunicação entre processos é importante, mas não é só isso que importa; Uma
Leia maisSistemas Distribuídos Aula 15
Sistemas Distribuídos Aula 15 Aula passada Relacionando eventos Relógios lógicos Algoritmo de Lamport Propriedades Aula de hoje Limitação de Lamport Relógio de vetores Propriedades Garantindo ordenação
Leia maisRedes de Computadores
Nível de Enlace Inst tituto de Info ormátic ca - UF FRGS Redes de Computadores Camada de enlace de dados Introdução Aula 06 Aplicação Apresentação Sessão Transporte Rede Enlace Físico Protocolo nível de
Leia mais5 Fidedignidade Disponibilidade Confiabilidade Segurança Proteção Privacidade Integridade
99 5 Fidedignidade O objetivo desta seção é apresentar a terminologia comumente utilizada na literatura de tolerância a faltas. Esta introdução é importante para auxiliar na identificação dos aspectos
Leia maisComputação Distribuída
Aula 1 Introdução aos Sistemas Distribuídos Anos 50 - Sistemas Operacionais tipo Lote Aumentar a capacidade de processamento de programas Usuário ia ao computador Processamento Seqüencial Leitoras de cartões
Leia maisRedes de computadores e a Internet. Redes de computadores e a Internet. Prof. Gustavo Wagner. Capítulo 3. Camada de transporte
Redes de computadores e a Internet Redes de computadores e a Internet Prof. Gustavo Wagner Capítulo 3 Camada de transporte Camada de transporte 3.1 Serviços da camada de transporte 3.2 Multiplexação e
Leia maisTolerância a Falhas. Reliable Broadcast e Atomic Commitment. June 2, 2010
Tolerância a Falhas Reliable Broadcast e Atomic Commitment June 2, 2010 Sumário Difusão/Multicast Fiável Multicast Fiável em Grupos Dinâmicos Multicast: Aplicação à Replicação Atomic Commitment Two-phase
Leia maisREDES DE COMPUTADORES
REDES DE COMPUTADORES Prof. Esp. Fabiano Taguchi fabianotaguchi@gmail.com http://fabianotaguchi.wordpress.com BENEFÍCIOS MODELO OSI Menor complexidade; Interfaces padronizadas; Interoperabilidade entre
Leia maisBlockchain em Seguros Realidade e Possibilidades
Blockchain em Seguros Realidade e Possibilidades Agenda Como trabalhamos na Sura Conceitos importantes Aplicações possíveis em seguros Algumas questões que precisam ser resolvidas Onde aplicamos na Seguros
Leia maisSistemas Distribuídos. Capítulo 7 - Aula 16
Sistemas Distribuídos Aula Passada Capítulo 7 - Aula 16 Comunicação Confiável de Grupo Multicast Atômico Sincronia Virtual Ordenação de Mensagens Recuperação Aula de hoje Modelos de Consistência Protocolos
Leia maisSistemas Distribuídos
Sistemas Distribuídos Comunicação em Grupo abril de 2017 Grupos em Aplicações Distribuídas Primitiva de comunicação em grupo um processo envia uma mensagem para um grupo de processos e todos os destinatários
Leia maisRelógio Lógico Algoritmo de Lamport. Relógio Lógico Algoritmo de Lamport. Relógio Físico Algoritmo Centralizado. Relógio Físico Algoritmo Centralizado
Relógio Lógico Algoritmo de Lamport Objetivo: Sincronização de clocks lógicos Os tempos associados aos eventos não são necessariamente próximos ao tempo real. Os processos não precisam estar de acordo
Leia maisSistemas Distribuídos
Sistemas Distribuídos Prof. Emerson Ribeiro de Mello Instituto Federal de Santa Catarina IFSC campus São José mello@ifsc.edu.br 29 de julho de 2015 1/21 Apresentação da disciplina Objetivo da disciplina
Leia maisTolerância a Faltas. Terminologia básica. Tolerância a Faltas. Page 1. Departamento de Engenharia Informática. Departamento de Engenharia Informática
Tolerância a Faltas Tolerância a Faltas Terminologia básica Page 1 1 Sistema Computacional Sistema computacional: Formado por um conjunto de componentes internas Tem um estado interno Sujeito a um conjunto
Leia mais3 Arquitetura para mediação flexível de Web services idênticos
22 3 Arquitetura para mediação flexível de Web services idênticos Este capítulo apresenta uma proposta de arquitetura de software baseada na mediação flexível de Web services idênticos. 3.1. Requisitos
Leia mais# $ % & ' ( ) * ' ( ) *! " " Orientador +, -
#$ %&'()* '()*!"" Orientador +,- ."%&/0#12 3"/%'0)/))&/ )4506 7" %/0)/))&/ 8906 8)) :"'/0)/))&/ '% '); Um roteador recebe em alguma de suas interfaces um pacote vindo da rede local ou da rede externa.
Leia maisOMNET++ APLICADO À ROBÓTICA COOPERATIVA
OMNET++ APLICADO À ROBÓTICA COOPERATIVA Daniel Costa Ramos Doutorando Disciplina de Redes de Comunicação Professor Carlos Montez 07/2014 2/25 Estrutura da Apresentação Introdução Robótica Cooperativa Material
Leia maisSistemas Distribuídos
Sistemas Distribuídos Exclusão Mútua Gustavo Reis gustavo.reis@ifsudestemg.edu.br - Questão fundamental em SDs Concorrência e colaboração entre vários processos Processos vão precisar acessar simultaneamente
Leia maisRedes de Computadores. Prof. MSc André Y. Kusumoto
Redes de Computadores Prof. MSc André Y. Kusumoto andrekusumoto.unip@gmail.com Nível de Rede Comunicação entre dispositivos de uma mesma rede ocorrem de forma direta. Quando a origem e o destino estão
Leia maisRAID. Redundant Array of Independent Disks
RAID Redundant Array of Independent Disks Introdução - RAID A tecnologia RAID (Redundant Array of Independent Disks) foi desenvolvida em 1987 por três pesquisadores (Patterson, Gibson e Katz) na Universidade
Leia mais1. TOLERÂNCIA A FALHAS EM SISTEMAS DISTRIBUÍDOS
13 1. TOLERÂNCIA A FALHAS EM SISTEMAS DISTRIBUÍDOS Na busca de sistemas mais confiáveis, alguns meios foram desenvolvidos para oferecer mais confiança aos sistemas, entre eles está a tolerância a falhas.
Leia maisCamada de Enlace. OSI x IEEE. Arquitetura IEEE 802. Redes. Nível de Enlace: Controle de Erros e Fluxo Multiplexação
Camada de Enlace Redes Nível de Enlace: Controle de Erros e Fluxo Multiplexação Aplicação Apresentação Sessão Transporte Rede Enlace Físico Delimitação e transmissão de quadros Detecção de erros Controle
Leia maisPreparação AV3 Fundamentos de Redes de Computadores
Preparação AV3 Fundamentos de Redes de Computadores 1 - Em uma rede de computadores existem dispositivos responsáveis por distribuir as informações por toda a rede. Quando falamos de dispositivos que atuam
Leia maisSistemas entre Pares e Redes Sobrepostas
1-HOP routing 1 ricardo.pereira@inesc-id.pt IST 2-11-2009 1 Imagens retiradas de One Hop Lookups for Peer-to-Peer Overlays por Anjali Gupta, Barbara Liskov, Rodrigo Rodrigues ou When Multi-Hop Peer-to-Peer
Leia maisSistemas Distribuídos
Sistemas Distribuídos Transações atômicas Conteúdo O modelo transacional Armazenamento estável Primitivas transacionais Propriedades das transações Transações aninhadas Implementação Área de trabalho privada
Leia maisNível de Rede. Funções do nível de rede GCAR
Nível de Rede Funções do nível de rede Multiplexação Endereçamento Mapeamento entre endereços de rede e de enlace Roteamento Estabeleciment/Liberação conexões de rede Controle de Congestionamento 1 Funções
Leia maisEleição de Líder. Alysson Neves Bessani Departamento de Informática Faculdade de Ciências da Universidade de Lisboa
Eleição de Líder Alysson Neves Bessani Departamento de Informática Faculdade de Ciências da Universidade de Lisboa Algoritmos de Eleição Muitos algoritmos distribuídos necessitam de seleccionar um processo
Leia maisTeste de Software. Competência: Entender as técnicas e estratégias de testes de Software
Teste de Software Competência: Entender as técnicas e estratégias de testes de Software Conteúdo Programático Introdução O que é teste de software? Por que é necessário testar um software? Qual a causa
Leia maisIntrodução à Ciência da Computação
1 Universidade Federal Fluminense Campus de Rio das Ostras Curso de Ciência da Computação Introdução à Ciência da Computação Professor: Leandro Soares de Sousa e-mail: leandro.uff.puro@gmail.com site:
Leia maisEngenharia de Confiança. Helena Macedo Reis Luis Fernando de Souza Moro
Engenharia de Confiança Helena Macedo Reis Luis Fernando de Souza Moro 1 Engenharia de Confiança Preocupada com técnicas que aumentam a confiança e diminui os riscos de falhas Falha pode causar perda de
Leia mais