Sistemas de Gerência de Bancos de Dados. 7 - Outras Arquiteturas para SGBDs SGBDs Paralelos

Documentos relacionados
Bases de Dados Paralelas

Universidade Federal do Maranhão

Alcides Pamplona

Bases de Dados Distribuídas

Bancos de Dados Distribuídos. Bancos de Dados Distribuídos. Conteúdo. Motivação. Motivação. Introdução aos BDs Distribuídos.

SSC0611 Arquitetura de Computadores

Banco de Dados Distribuído

UNIOESTE Universidade Estadual do Oeste do Paraná

Como mencionado, David J. DeWitt e Jim Gray [2] afirmam que um sistema paralelo ideal deve apresentar duas propriedades chave:

Arquiteturas de Sistemas de Processamento Paralelo. Arquiteturas MIMD

AULA 03: PROCESSAMENTO PARALELO: MULTIPROCESSADORES

Memória Cache. Walter Fetter Lages.

Organização de Computadores II. Arquiteturas MIMD

ORGANIZAÇÃO E ARQUITETURA DE COMPUTADORES II AULA 04: PROCESSAMENTO PARALELO: MULTICOMPUTADOR

Arquiteturas para SGBD. Laboratório de Bases de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri

Objectivo Melhoria do desempenho Incremento da disponibilidade dos dados Acesso distribuído aos dados

Bancos de Dados Distribuídos. Gabriel Resende Gonçalves 4 de fevereiro de 2014

Universidade Federal do Rio de Janeiro Informática DCC/IM. Arquitetura de Computadores II. Arquiteturas MIMD. Arquiteturas MIMD

Designing Data Intensive Applications

Sistemas MIMD. CES-25 Arquiteturas para Alto Desmpenho. Paulo André Castro

OpenMP: Variáveis de Ambiente

Sistemas Operacionais: O quê? Por quê? Quando?

Sumário. Definição do Plano de Execução

Top. Esp em Banco de Dados

Sistemas de Bancos de Dados Distribuídos

Sistemas de Bancos de Dados Distribuídos

Arquitetura de Computadores. Processamento Paralelo

Sistemas de Gerência de Bancos de Dados. Módulo 1 - Armazenamento

BANCO DE DADOS DISTRIBUÍDOS e DATAWAREHOUSING

Bancos de dados distribuídos Prof. Tiago Eugenio de Melo

Bacharelado em Sistemas de Informação Sistemas Operacionais. Prof. Filipo Mór

ARQUITETURA DE COMPUTADORES

Um Repositório Chave-Valor com Garantia de Localidade de Dados. Patrick A. Bungama Wendel M. de Oliveira Flávio R. C. Sousa Carmem S.

Aula 01. Evandro Deliberal

Arquitetura de Computadores Unidade 2 Organização Funcional dos Sistemas de Computação tópico 2.3 Subsistemas de E/S

Projeto de Bases de Dados Distribuídas

3 Plano de Execução de Consultas

Introdução à Programação Paralela através de Padrões. Denise Stringhini Calebe Bianchini Luciano Silva

SSC0640 Sistemas Operacionais I

Banco de Dados Arquiteturas para SGBDs

Bancos de Dados Paralelos. Alunos: ALLAN ROGER BELLO WILLIAN DIAS TAMAGI

SIST706 Sistemas Distribuídos

2 Conceitos Banco de Dados Paralelos

Sistemas de Gerência de Bancos de Dados

INTRODUÇÃO À ARQUITETURA E ORGANIZAÇÃO DE COMPUTADORES. Função e Estrutura. Introdução Organização e Arquitetura. Organização e Arquitetura

30/5/2011. Sistemas computacionais para processamento paralelo e distribuído

Gerenciamento de Memória

Capítulo 8: Memória Principal. Operating System Concepts 8 th Edition

Sistemas Operacionais

Fundamentos de Sistemas Operacionais. Gerência de Memória. Prof. Edwar Saliba Júnior Março de Unidade Gerência de Memória

Introdução. Pedro Cruz. EEL770 Sistemas Operacionais

04/03/12. Revisão: conceitos básicos de BD. MoAvação para distribuição. Processamento Distribuído. Arquitetura de um SBD Centralizado

ESPECIFICAÇÕES DE UMA REDE DE AUTOMAÇÃO. Taxa de transmissão. Topologia física

TÓPICOS EM COMPUTAÇÃO APLICADA

GBC053 Gerenciamento de Banco de Dados. Plano de Curso e Introdução. Ilmério Reis da Silva UFU/FACOM/BCC

Capítulo 2 Livro do Mário Monteiro Componentes Representação das informações. Medidas de desempenho


Aula 04. Evandro Deliberal

Sistema Distribuído. Sistema Distribuído. Aplicações Distribuídas. Conceitos Básicos

Gerência de Memória. Eduardo Ferreira dos Santos. Abril, Ciência da Computação Centro Universitário de Brasília UniCEUB 1 / 45

Projeto de Sistemas Distribuídos. Considerações

Sis i te t mas a O perac a i c o i nai a s um p ouco c d a a h is i tó t ria i. a... SO His i t s ó t r ó ic i o

Organização de Computadores I

Gerência da Memória Memória Virtual. Adão de Melo Neto

Estrutura da Apresentação. Introdução ao Processamento Paralelo e Distribuído. Conceitos em PPD. Conceitos em PPD 4/26/09.

William Stallings Arquitetura e Organização de Computadores 8 a Edição

Caracterização de Sistemas Distribuídos

Bancos de Dados Distribuídos. Lucas Henrique Samuel Queiroz

AULA 2. Prof.: Jadiel Mestre. Introdução à Informática. Introdução à Informática Componentes de um Sistema de Informação

COMPUTADORES PC 20/9/2010 CRONOGRAMA INFORMÁTICA PREF. MUNICIPAL DE JAGUARÃO - RS O COMPUTADOR, INDEPENDENTE DO TIPO: MAINFRAME NOTEBOOK PALMTOP

Aula 02. Evandro Deliberal

Replicação em sistemas web

Sistemas Operacionais Distribuídos

Hardware: Componentes Básicos. Sistema de Computador Pessoal. Anatomia de um Teclado. Estrutura do Computador. Arquitetura e Organização

Curso: Redes de Computadores

Sistemas Operacionais

Há vários algoritmos para processar junções nested-loop join block nested-loop join indexed nested-loop join merge-join hash-join

Sistemas de Computação. Gerenciamento de memória

23/05/12. Consulta distribuída. Consulta distribuída. Objetivos do processamento de consultas distribuídas

Redes de Computadores. Fundamentos de Sistemas Operacionais - 2º Período

Arquitectura interna de um computador. Organização de um computador. Organização de um computador. Organização de um computador

Arquitetura e Organização de Computadores

Sistemas de Informação. Sistemas Operacionais

Organização e comunicação em plataformas paralelas

LISTA DE EXERCÍCIOS 02

SSC510 Arquitetura de Computadores. 7ª aula

Avaliação de Desempenho. September 28, 2010

Projeto de Bancos de Dados Distribuídos (Parte 01)

Sistemas Operacionais. - Gerência de Memória -

FUNDAMENTOS DE ARQUITETURAS DE COMPUTADORES MEMÓRIA CACHE CAPÍTULO 5. Cristina Boeres

Algoritmos e Lógica de Programação Componentes e Arquitetura

14/03/12. Tipos de fragmentação. Projeto de Bancos de Dados Distribuídos (Parte 01) Correção das regras de fragmentação. Grau de fragmentação

Características de Sistemas Distribuídos

Sistemas Opera r cionais Gerência de Memória

Arquitetura e Organização de Computadores

Sistemas Operacionais. Tipos de SO

Infra-Estrutura de Software. Sistemas Operacionais Revisão

23/05/12. Agenda. Introdução. Introdução. Introdução. Álgebra. Relacional. Cálculo. Relacional

Transcrição:

Sistemas de Gerência de Bancos de Dados 7 - Outras Arquiteturas para SGBDs 7.3 - SGBDs Paralelos 1

Tópicos Introdução Arquiteturas Paralelas Processamento de Consultas Gerência de Transações 2

Introdução SGBDs Paralelos: combinam técnicas de gerência de dados e processamento paralelo para aumentar desempenho e confiabilidade: particionamento do BD em discos controlados por multiprocessadores resulta em aumento da taxa de transferência de dados da memória secundária para memória principal (I/O bandwidth) paralelização do processamento interno de consultas resulta em diminuição do tempo de resposta paralelização do processamento de transações resulta em aumento da capacidade do sistema (throughput) 3

Arquiteturas Paralelas Shared-Memory Architecture (SMP) barramento 4

Arquiteturas Paralelas Shared-Disk Architecture Local Local barramento 5

Arquiteturas Paralelas Shared-Nothing Architecture (MPP) switch Local Local 6

Arquiteturas Paralelas Hierarchical Architecture barramento barramento barramento barramento 7

Arquiteturas Paralelas Cache Only Memory Architecture (COMA) Hardware shared Virtual Memory Cache Memory Cache Memory 8

Estratégias de alocação: Alocação de Dados semelhantes ao caso de BDDs: fragmentação horizontal ( chamada de particionamento ) fragmentação vertical diferenças: número de nós é potencialmente muito maior transferência de dados ou de processos de um nó para outro é muito mais rápida 9

Alocação de Dados Estratégias de Particionamento Completo: tabela distribuída por todos os nós: round-robin: distribuição cíclica Cycle hashing: distribuição dada por uma função de hashing Hash por intervalo: particionamento normal Partition 10

Alocação de Dados Estratégias de Particionamento Completo: indexação em dois níveis: índice global pode ser totalmente replicado aponta para os nós que armazenam as tuplas associadas aos valores de índice Índice Global apontadores para nós índice local aponta para as tuplas associadas aos valores de índice Índice Local 11 apontadores para páginas

Processamento de Consultas Possibilidades para Paralelização: intra-operador: paralelize o processamento de cada operador, quebrando-o em operadores semelhantes sobre os dados particionados adequado para seleção requer algoritmos especiais para join inter-operador: paralelize o plano de execução da consulta, semelhantemente ao caso de SGBDDs 12

Processamento de Consultas Parallel Nested Join: entrada: R1,...Rm - fragmentos de R S1,...Sn - fragmentos de S JP - join predicate saida: T1,...,Tn - fragmentos da resposta for i from 1 to m do in parallel s Ri to each node containing a fragment of S for j from 1 to n do in parallel R := union of Ri Tj := join(r,sj,jp) R1 R2 S1 R1 R2 R1 R2 S2 13

Processamento de Consultas Parallel Associative Join: entrada: R1,...Rm - fragmentos de R S1,...Sn - fragmentos de S, criados por hash h(b) JP - equijoin predicate da forma R.A=S.B saida: T1,...,Tn - fragmentos da resposta for i from 1 to m do in parallel apply h(a) to Ri creating Ri1,...,Rin for each j from 1 to n do s Rij to the node containing Sj for j from 1 to n do in parallel Rj := union of R1j,...,Rnj Tj := join(rj,sj,jp) R11 R12 R21 R22 S1 R11 R21 R12 R22 S2 14

Processamento de Consultas Parallel Hash Join: entrada: R1,...Rm - fragmentos de R S1,...Sn - fragmentos de S JP - equijoin predicate da forma R.A=S.B saida: T1,...,Tn - fragmentos da resposta for i from 1 to m do in parallel apply h(a) to Ri creating Ri1,...,Rip /* h retorna valores entre 1 e p */ for each j from 1 to p do s Rij to the node p for i from 1 to n do in parallel apply h(b) to Si creating Si1,...,Sip for each j from 1 to p do s Sij to the node p R11 R12 R21 R22 S11 S12 for j from 1 to p do in parallel Rj := union of R1j,...,Rpj Sj := union of S1j,...,Spj Tj := join(rj,sj,jp) R11 15 R21 S11 S21 R12 R22 S21 S22 S12 S22

Gerência de Transações Problemas: Inicialização: a inicialização de uma transação é um processo demorado, que não pode ser paralelizado para transações curtas, um SGBD paralelo pode apresentar um desempenho pior do que um centralizado interferência: a paralelização do processamento das transações pode gerar alta contenção por: um dos recursos de hardware, como memória compartilhada um dos recursos de software, como estruturas internas do SGBD paralelo desbalanceamento no particionamento do BD 16