ÁRVORE B+ Vanessa Braganholo Estruturas de Dados e Seus Algoritmos

Documentos relacionados
ÁRVORE B+ Vanessa Braganholo Estruturas de Dados e Seus Algoritmos

Arquivos Indexados. Vanessa Braganholo

Arquivos Indexados. Vanessa Braganholo

ÁRVORE B. Vanessa Braganholo Estruturas de Dados e Seus Algoritmos

Árvores B. Árvores B. Estrutura de Dados II Jairo Francisco de Souza

Árvores B. Árvores B. Estrutura de Dados II Jairo Francisco de Souza

ÁRVORES BINÁRIAS DE BUSCA. Vanessa Braganholo Estruturas de Dados e Seus Algoritmos

Árvores B. Prof. Flávio Humberto Cabral Nunes

Pesquisa em Memória Secundária. Prof. Jonas Potros

Árvores B. Prof. Márcio Bueno. / Fonte: Material da Prof a Ana Eliza Lopes Moura

Árvores B* Letícia Rodrigues Bueno

Árvore-B* Profa. Dra. Cristina Dutra de Aguiar Ciferri

Seja d um número natural. Uma árvore B de ordem d é uma árvore ordenada que é vazia, ou que satisfaz as seguintes condições:

REVISÃO DE PILHAS E FILAS. Vanessa Braganholo Estruturas de Dados e Seus Algoritmos

Acesso Sequencial Indexado

Árvores B. Definição: Seja t a ordem da árvore B. Uma árvore B de ordem t é uma árvore ordenada que é vazia, ou que satisfaz as seguintes condições:

INF 1010 Estruturas de Dados Avançadas

B-Árvores. Siang Wun Song - Universidade de São Paulo - IME/USP. MAC Estruturas de Dados

Árvores. Árvores M-Vias. Métodos de Pesquisa de Dados. de Pesquisa (ANP) VANTAGENS EXEMPLO

Árvore-B + Profa. Dra. Cristina Dutra de Aguiar Ciferri

Árvores. SCC-214 Projeto de Algoritmos. Thiago A. S. Pardo. Um nó após o outro, adjacentes Sem relações hierárquicas entre os nós, em geral

Árvores Genéricas de Busca

Árvores B. Prof. Leandro C. Fernandes. Estruturas de Dados. Adaptado de: Leandro C. Cintra e M.C.F. de Oliveira

Estrutura de Dados. Estrutura de Dados Recursividade. Exemplo: 5! = 5 x 4! 4! = 4 x 3! 3! = 3 X 2! 2! = 2 x 1! 1! = 1 x 0!

Árvores-B + SCC-203 Algoritmos e Estruturas de Dados II. Graça Nunes

SCC Algoritmos e Estruturas de Dados II. 6ª lista de exercícios

Universidade Estadual de Mato Grosso do Sul Bacharelado em Ciência da Computação Algoritmos e Estruturas de Dados II Prof. Fabrício Sérgio de Paula

Árvores-B + SCC-503 Algoritmos e Estruturas de Dados II. Thiago A. S. Pardo Cristina Dutra de Aguiar Ciferri

Árvores-B (Parte IV) Leandro C. Cintra M.C.F. de Oliveira Fonte: Folk & Zoelick, File Structures

Ordem. Árvores-B (Parte IV) Número mínimo de chaves por página. Definição formal das Propriedades de árvores-b /30 1

Teoria da Computação. Aula 9 Pesquisa em Memória Secundária 5COP096. Aula 9 Prof. Dr. Sylvio Barbon Junior. Sylvio Barbon Jr

INE5408 Estruturas de Dados. Gerência de Arquivos

SCC-503 Algoritmos e Estruturas de Dados II. Modificado por Moacir Ponti Jr, do original de:

Introdução. O que é um Banco de Dados (BD)?

Banco de Dados. Perspectiva Histórica dos Bancos de Dados. Prof. Walteno Martins Parreira Jr

Árvores-B + Profa. Dra. Cristina Dutra de Aguiar Ciferri. Algoritmos e Estruturas de Dados II Árvore-B +

Árvore-B. Árvore B. Características Gerais. Sistemas de Banco de Dados. Características Gerais. Revisão

Estruturas de Dados. Profº Carlos Alberto Teixeira Batista

Sistemas de arquivos

Universidade Estadual do Oeste do Parana - UNIOESTE Jhonata R.de Peder Marcelo Schuck

Implementação de Sistemas de Arquivos. Na Aula Anterior... Esquema do Sistema de Arquivos. Nesta Aula 31/10/2016. Estrutura de Baixo Nível de um Disco

Listas de Prioridade. Fonte de consulta: Szwarcfiter, J.; Markezon, L. Estruturas de Dados e seus Algoritmos, 3a. ed. LTC.

Árvores-B (Parte Ib) SCC-203 Algoritmos e Estruturas de Dados II. Graça Nunes

GRAFOS E DIGRAFOS. Vanessa Braganholo Estruturas de Dados e Seus Algoritmos

ÁRVORES E ÁRVORES BINÁRIAS. Vanessa Braganholo Estruturas de Dados e Seus Algoritmos

Matrizes esparsas: definição

Métodos de Pesquisa de Dados (II) Árvore N-ária de Pesquisa

Listas Lineares Ordenadas

TABELAS HASH. Vanessa Braganholo Estruturas de Dados e Seus Algoritmos

ORDENAÇÃO EXTERNA DE ARQUIVOS: GERAÇÃO DE PARTIÇÕES CLASSIFICADAS. Vanessa Braganholo Estruturas de Dados e Seus Algoritmos

Aplicações de listas Outras estruturas

Árvores B Parte IV. Revisão de Inserção. Organização. Variantes. Leandro C. Cintra Maria Cristina F. de Oliveira

Unidade 1 Introdução

GBC053 Gerenciamento de Banco de Dados. Plano de Curso e Introdução. Ilmério Reis da Silva UFU/FACOM/BCC

Lista de Exercícios 04

Árvores B. Árvores B Parte II. Características. Características. Construção Bottom-Up. Leandro C. Cintra Maria Cristina F. de Oliveira.

Algoritmo: Split. Árvores B Parte IV. Algoritmo: Split. Algoritmo: Split. Algoritmo: Split. Procedimento inicial. Parâmetros

Algoritmos e Estruturas de Dados II IEC013

Árvores. N-árias, Binárias, Busca. Vanessa Maia Berny Mestrado em Ciência da Computação

Universidade Estadual de Mato Grosso do Sul Bacharelado em Ciência da Computação Algoritmos e Estruturas de Dados II Prof. Fabrício Sérgio de Paula

Armazenamento em disco com uso de índices

BANCO DE DADOS Índices em BD Árvores B+

ACH2025. Laboratório de Bases de Dados Aula 8. Indexação e Hashing Parte 1. Professora: Fátima L. S. Nunes SISTEMAS DE INFORMAÇÃO

Árvores Estrutura de Dados. Universidade Federal de Juiz de Fora Departamento de Ciência da Computação

BCC202 - Estrutura de Dados I

A inserção da chave 6 da árvore acima resulta na árvore abaixo.

Redes de Computadores. Fundamentos de Sistemas Operacionais - 2º Período

Universidade Federal do Pará Instituto de Ciências Exatas e Naturais Faculdade de Computação. Árvores Balanceadas

PRIMEIRA AVALIAÇÃO IDENTIFICAÇÃO. Nome: 22/09/2010

Técnico em Informática. Banco de Dados. Profª Ana Paula Mandelli

Estruturas de Dados. Prof.: Carlos Alberto Página da Disciplina:

Árvores-B (Parte I) SCC-503 Algoritmos e Estruturas de Dados II. Thiago A. S. Pardo Leandro C. Cintra M.C.F. de Oliveira

Árvores B. Árvore B (ou melhor B+)

Construção de árvores-b. Árvores-B (Parte II) Características Gerais. Características Gerais. Leandro C. Cintra M.C.F. de Oliveira

Estrutura de Dados e Algoritmos e Programação e Computadores II. Aula 4: Listas Estáticas e Dinâmicas

Introdução a Sistemas Gerenciadores de Banco de Dados

Capítulo 11 Sistemas de Arquivos

Aula 32: Encadeamento interior. Modelo de encadeamento interior. Algoritmo de busca por encadeamento interior

10.1. Aula 10: Pilhas. O conceito de pilha. Algoritmos de inserção e remoção. Exemplo: Notação Polonesa

Compactação de Dados. Fonte de consulta: Szwarcfiter, J.; Markezon, L. Estruturas de Dados e seus Algoritmos, 3a. ed. LTC. Seção 12.5 em diante.

Lista de Exercícios sobre Listas Implementadas por Encadeamento

REVISÃO DE C. Vanessa Braganholo Estruturas de Dados e Seus Algoritmos

Árvores-B (Parte II) Leandro C. Cintra M.C.F. de Oliveira Fonte: Folk & Zoelick, File Structures

UNILASALLE Curso de Bacharelado em Ciência da Computação. Estrutura de Dados II Prof. Magalí T. Longhi. Árvores AVL*

Árvores. SCC-202 Algoritmos e Estruturas de Dados I. Lucas Antiqueira

Capítulo 8: Abstrações de dados

Gerência do Sistema de Arquivos. Adão de Melo Neto

Busca em Memória Secundária. Busca em Memória Secundária

INE5408 Estruturas de Dados

Sistemas de Informação. Sistemas Operacionais

SISTEMAS DE GERENCIAMENTO DE BANCO DE DADOS

Quinto Trabalho Prático. Este trabalho tem como objetivo indexar arquivos de dados usando um índice árvore-b.

Sistemas de Arquivos

Universidade Federal de Minas Gerais. Sistemas Operacionais. Aula 11. Sistemas de Arquivos Jornalados (Journaling File Systems)

Sumário. Índices Ordenados: Nível Único. Índices Primários. Bancos de Dados Avançados Índices. Índices: Ordenados em nível único Multiníveis

INTRODUÇÃO AOS SISTEMAS DE ARQUIVO. Prof. Hélio Esperidião

Edital de Seleção 024/2017 PROPESP/UFAM. Prova de Conhecimento. Caderno de Questões

SISTEMA DE GERENCIAMENTO DE BANCO DE DADOS - SGBD

Tabelas Hash. informação, a partir do conhecimento de sua chave. Hashing é uma maneira de organizar dados que:

Transcrição:

ÁRVORE B+ Vanessa Braganholo Estruturas de Dados e Seus Algoritmos

ÁRVORES B+ É semelhante à árvore B, exceto por duas características muito importantes: Armazena dados somente nas folhas os nós internos servem apenas de ponteiros As folhas são encadeadas Isso permite o armazenamento dos dados em um arquivo, e do índice em outro arquivo separado 2

ÁRVORE B+ NA PRÁTICA Árvores B+ são muito importantes por sua eficiência, e muito utilizadas na prática: Os sistemas de arquivo NTFS, ReiserFS, NSS, XFS, e JFS utilizam este tipo de árvore para indexação Sistemas de Gerência de Banco de Dados como IBM DB2, Informix, Microsoft SQL Server, Oracle 8, Sybase ASE, PostgreSQL, Firebird, MySQL e SQLite permitem o uso deste tipo de árvore para indexar tabelas Outros sistemas de gerência de dados como o CouchDB, Tokyo Cabinet e Tokyo Tyrant permitem o uso deste tipo de árvore para acesso a dados 3

EXEMPLO DE ÁRVORE B+ DE ORDEM D = 2 51 09 30 60 80 01 02 04 09 15 20 30 40 46 47 51 52 56 60 65 70 80 83 4

EXEMPLO DE ÁRVORE B+ DE ORDEM D = 2 51 09 30 60 80 01 02 04 09 15 20 30 40 46 47 51 52 56 60 65 70 80 83 Dados (lista encadeada) 5

EXEMPLO DE ÁRVORE B+ DE ORDEM D = 2 51 09 30 60 80 Índice 01 02 04 09 15 20 30 40 46 47 51 52 56 60 65 70 80 83 Dados (lista encadeada) 6

EXEMPLO DE ÁRVORE B+ DE ORDEM D = 2 51 09 30 60 80 Índice 01 02 04 09 15 20 30 40 46 47 51 52 56 60 65 70 80 83 IMPORTANTE: Os valores nos índices repetem valores de chave que aparecem nas folhas (diferente do que acontece nas árvores B) Dados (lista encadeada) 7

BUSCA Só se pode ter certeza de que o registro foi encontrado quando se chega em uma folha 8

INSERÇÃO Quando for necessário particionar um nó durante uma inserção, o mesmo raciocínio do particionamento em Árvore B é utilizado A diferença é que para a página pai sobe somente a chave. O registro fica na folha, juntamente com a sua chave ATENÇÃO: isso vale apenas se o nó que está sendo particionado for uma folha. Se não for folha, o procedimento é o mesmo utilizado na árvore B 9

EXEMPLO DE INSERÇÃO EM ÁRVORE B+ INSERIR CHAVE 32 51 ordem d = 2 Inserir chave 32 Inserção faria página ficar com 2d+1 chaves Solução: particionar o nó 09 30 60 80 01 02 04 09 15 20 30 40 46 47 51 52 56 60 65 70 80 83 10

EXEMPLO DE INSERÇÃO EM ÁRVORE B+ INSERIR CHAVE 32 ordem d = 2 51 09 30 60 80 P 01 02 04 09 15 20 30 40 46 47 51 52 56 60 65 70 80 83 Q Criar nova página Q 11

EXEMPLO DE INSERÇÃO EM ÁRVORE B+ INSERIR CHAVE 32 51 Dividir as chaves entre as duas páginas (30; 32; 40; 46; 47) d chaves na página original P chave d+1 sobe para nó pai W (mas registro é mantido na nova página) d+1 chaves restantes na nova página Q ordem d = 2 40 W 09 30 60 80 P 01 02 04 09 15 20 30 32 51 52 56 60 65 70 80 83 Q 40 46 47 12

EXEMPLO DE INSERÇÃO EM ÁRVORE B+ INSERIR CHAVE 32 51 ordem d = 2 40 W 09 30 60 80 P 01 02 04 09 15 20 30 32 51 52 56 60 65 70 80 83 Q 40 46 47 Ajustar ponteiros da lista encadeada 13

EXEMPLO DE INSERÇÃO EM ÁRVORE B+ INSERIR CHAVE 32 Inserir o 40 em W 51 ordem d = 2 W 09 30 40 60 80 P 01 02 04 09 15 20 30 32 51 52 56 60 65 70 80 83 Q 40 46 47 14

EXCLUSÃO Excluir apenas no nó folha Chaves excluídas continuam nos nós intermediários 15

EXEMPLO DE EXCLUSÃO EM ÁRVORE B+ EXCLUIR CHAVE 30 ordem d = 2 51 09 30 60 80 01 02 04 09 15 20 30 40 46 47 51 52 56 60 65 70 80 83 16

EXEMPLO DE EXCLUSÃO EM ÁRVORE B+ EXCLUIR CHAVE 30 ordem d = 2 O valor 30 continua no índice! 51 09 30 60 80 01 02 04 09 15 20 40 46 47 51 52 56 60 65 70 80 83 17

EXCLUSÃO QUE CAUSA CONCATENAÇÃO Exclusões que causem concatenação de folhas podem se propagar para os nós internos da árvore Importante: Se a concatenação ocorrer na folha: a chave do nó pai não desce para o nó concatenado, pois ele não carrega dados com ele. Ele é simplesmente apagado. Se a concatenação ocorrer em nó interno: usar a mesma lógica utilizada na árvore B 18

EXEMPLO DE EXCLUSÃO EM ÁRVORE B+ EXCLUIR CHAVE 52 ordem d = 2 51 09 30 60 80 01 02 04 09 15 40 46 47 51 52 60 65 80 83 19

EXEMPLO DE EXCLUSÃO EM ÁRVORE B+ EXCLUIR CHAVE 52 ordem d = 2 51 09 30 60 80 W 01 02 04 09 15 40 46 47 51 60 65 80 83 P Q Nó ficou com menos de d entradas necessário tratar isso Soma dos registros de P e Q < 2d Usar concatenação 20

EXEMPLO DE EXCLUSÃO EM ÁRVORE B+ EXCLUIR CHAVE 52 ordem d = 2 51 09 30 60 80 W 01 02 04 09 15 40 46 47 51 60 65 80 83 P Q Concatenação: Passar os registros de Q para P Eliminar a chave em W que divide os ponteiros para as páginas P e Q 21

EXEMPLO DE EXCLUSÃO EM ÁRVORE B+ EXCLUIR CHAVE 52 ordem d = 2 51 09 30 80 W 01 02 04 09 15 40 46 47 51 60 65 80 83 P Q Concatenação: Passar os registros de Q para P Eliminar a chave em W que divide os ponteiros para as páginas P e Q 22

EXEMPLO DE EXCLUSÃO EM ÁRVORE B+ EXCLUIR CHAVE 52 ordem d = 2 51 09 30 80 W 01 02 04 09 15 40 46 47 51 60 65 80 83 P Q Eliminar nó Q 23

EXEMPLO DE EXCLUSÃO EM ÁRVORE B+ EXCLUIR CHAVE 52 ordem d = 2 51 09 30 80 W 01 02 04 09 15 40 46 47 51 60 65 80 83 P Eliminar nó Q 24

EXEMPLO DE EXCLUSÃO EM ÁRVORE B+ EXCLUIR CHAVE 52 ordem d = 2 51 Nó W ficou com menos de d chaves 09 30 80 W 01 02 04 09 15 40 46 47 51 60 65 80 83 P 25

EXEMPLO DE EXCLUSÃO EM ÁRVORE B+ EXCLUIR CHAVE 52 51 W ordem d = 2 P 09 30 80 Q 01 02 04 09 15 40 46 47 51 60 65 80 83 Soma de total de chaves de P e Q < 2d Solução: concatenação 26

EXEMPLO DE EXCLUSÃO EM ÁRVORE B+ EXCLUIR CHAVE 52 W ordem d = 2 P 09 30 51 80 Q Apagar Q 01 02 04 09 15 40 46 47 51 60 65 80 83 27

EXEMPLO DE EXCLUSÃO EM ÁRVORE B+ EXCLUIR CHAVE 52 W ordem d = 2 P Apagar Q 09 30 51 80 01 02 04 09 15 40 46 47 51 60 65 80 83 28

EXEMPLO DE EXCLUSÃO EM ÁRVORE B+ EXCLUIR CHAVE 52 W ordem d = 2 P 09 30 51 80 Como a raiz ficou vazia, apagar a raiz. P é a nova raiz. 01 02 04 09 15 40 46 47 51 60 65 80 83 29

EXEMPLO DE EXCLUSÃO EM ÁRVORE B+ EXCLUIR CHAVE 52 ordem d = 2 P 09 30 51 80 Como a raiz ficou vazia, apagar a raiz. P é a nova raiz. 01 02 04 09 15 40 46 47 51 60 65 80 83 30

EXCLUSÃO QUE CAUSA REDISTRIBUIÇÃO Exclusões que causem redistribuição dos registros nas folhas provocam mudanças no conteúdo do índice, mas não na estrutura (não se propagam) 31

EXEMPLO DE EXCLUSÃO EM ÁRVORE B+ EXCLUIR CHAVE 15 ordem d = 2 51 09 30 60 80 01 02 04 09 15 40 46 47 51 52 56 60 65 70 80 83 32

EXEMPLO DE EXCLUSÃO EM ÁRVORE B+ EXCLUIR CHAVE 15 ordem d = 2 51 09 30 60 80 P Q 01 02 04 09 40 46 47 51 52 56 60 65 70 80 83 Nó ficou com menos de d entradas necessário tratar isso A soma dos registros dos irmãos adjacentes é = 2d Solução: redistribuição 33

EXEMPLO DE EXCLUSÃO EM ÁRVORE B+ EXCLUIR CHAVE 15 ordem d = 2 51 09 30 60 80 P Q 01 02 04 09 40 46 47 51 52 56 60 65 70 80 83 MAS... Se a chave do nó pai não precisa descer (porque não tem conteúdo, tem apenas a chave), porque não podemos concatenar P e Q? Resposta: ao concatenar P e Q, a página concatenada ficaria cheia, e a próxima inserção neste nó causaria um particionamento. Para evitar isso, continuamos obedecendo o critério: fazer concatenação apenas quando a soma da quantidade de chaves < 2d, e, sempre que tivermos as duas opções, optaremos pela redistribuição, que não se propaga. 34

EXEMPLO DE EXCLUSÃO EM ÁRVORE B+ EXCLUIR CHAVE 15 ordem d = 2 51 04 30 60 80 P Q 01 02 04 09 40 46 47 51 52 56 60 65 70 80 83 Note que a chave 4 sobe para W, mas o registro correspondente é colocado em Q. 35

EXEMPLO (MOSTRANDO OS DADOS NAS FOLHAS) Neste exemplo, a árvore B+ tem apenas o nó raiz 45 20 45 RONAN M 49 CLARA F 56 RAQUEL F 68 ADRIEL M 20 MARIANA FF 23 JONAS M 24 MATHIAS M 31 SANDRO M 01 JOSE M 02 MARIA F 05 ANA F 10 MARCOS M 36

CONSIDERAÇÕES SOBRE IMPLEMENTAÇÃO EM DISCO Pode-se utilizar três arquivos: Um arquivo para armazenar os metadados Ponteiro para a raiz da árvore Flag indicando se a raiz é folha Um arquivo para armazenar o índice (nós internos da árvore) Um arquivo para armazenar os dados (folhas da árvore) 37

ESTRUTURA DO ARQUIVO DE ÍNDICE O arquivo de índice estará estruturado em nós (blocos/páginas) Cada nó possui Inteiro representando o número de chaves (m) armazenadas no nó Flag booleano que diz se página aponta para nó folha (TRUE se sim, FALSE se não) Ponteiro para o nó pai (para facilitar a implementação de concatenação) p 0, (s 1, p 1 ), (s 2,p 2 ),..., (s d,p d ), (s d+1,p d+1 ),..., (s 2d+1, p 2d+1 ), onde: p i é um ponteiro para uma página (dentro deste arquivo, se flag é FALSE, no arquivo de dados, se flag é TRUE) s i é uma chave 38

ESTRUTURA DO ARQUIVO DE DADOS O arquivo de dados também estará estruturado em nós (blocos/páginas) Cada nó possui Inteiro representando o número de chaves (m) armazenadas no nó Ponteiro para o nó pai (para facilitar a implementação de concatenação) Ponteiro para a próxima página 2d registros 39

CONSIDERAÇÕES SOBRE IMPLEMENTAÇÃO Se o sistema de armazenamento tem tamanho de bloco de B bytes, e as chaves a serem armazenadas têm tamanho k bytes, a árvore B+ mais eficiente é a de ordem d= (B / k) 1 Exemplo prático: Tamanho do bloco do disco B = 4KB = 4096 bytes Tamanho da chave k = 4 bytes d = (4096/4) 1 = 1023 Quantas chaves cada nó da árvore terá, nessa situação? 2d = 2046 chaves! 40

DICA Como determinar o tamanho do bloco de disco em vários sistemas operacionais: http://arjudba.blogspot.com/2008/07/how-to-determine-os-block-size-for.html 41

EXERCÍCIO: ÁRVORE B+ Passo 1) Desenhar uma árvore B+ de ordem 2 que contenha registros com as seguintes chaves: 1, 2, 3, 8, 15, 35, 36, 38, 39, 41, 43, 45, 51, 59 Como d = 2: Cada nó tem no máximo 4 chaves Cada nó tem no máximo 5 filhos Passo 2) Sobre o resultado do passo 1, excluir os registros de chave: 3, 38, 1, 41 Passo 3) Sobre o resultado do passo 2, incluir os registros de chave: 5, 14, 52, 53, 54 42

EXERCÍCIO: ÁRVORE B+ EM MEMÓRIA Escreva um algoritmo de busca de um registro de chave x em uma árvore B+ armazenada em memória Escreva um algoritmo de inserção de um registro de chave x em uma árvore B+ armazenada em memória Escreva um algoritmo de remoção de um registro de chave x em uma árvore B+ armazenada em memória Em todos os exercícios acima, assuma que são conhecidos: o número de chaves que um determinado nó armazena (m) a ordem da árvore (d) 43

IMPLEMENTAÇÃO Implementar busca, inserção e exclusão em árvore B+ armazenada em disco. Detalhes estão no Google Classroom. 44

REFERÊNCIA Szwarcfiter, J.; Markezon, L. Estruturas de Dados e seus Algoritmos, 3a. ed. LTC. Cap. 5 INSTITUTO DE COMPUTAÇÃO - UFF 45

AGRADECIMENTOS Exemplo cedido por Renata Galante INSTITUTO DE COMPUTAÇÃO - UFF 46