11/8/2010. Tópicos. Organização e Indexação de Dados em Memória Secundária

Documentos relacionados
Uso de Índices na Otimização e Processamento de Consultas. Otimização e Processamento de Consultas. Otimização e Processamento de Consultas

BANCO DE DADOS II Prof. Ricardo Rodrigues Barcelar

GBC053 Gerenciamento de Banco de Dados. Plano de Curso e Introdução. Ilmério Reis da Silva UFU/FACOM/BCC

Banco de Dados - Conceitos. Baseado no material da Profa. Vania Bogorny (UFSC)

ACH2025. Laboratório de Bases de Dados Aula 8. Indexação e Hashing Parte 1. Professora: Fátima L. S. Nunes SISTEMAS DE INFORMAÇÃO

Bancos de Dados Notas de Aula Introdução Prof. Dr. Daniel A. Furtado

Tipos de Índices. Profa. Dra. Cristina Dutra de Aguiar Ciferri

DDL). O resultado da compilação dos parâmetros DDLs é

Banco de Dados I. Prof. Edson Thizon

Introdução. Conceitos Básicos. Conceitos Básicos. Conceitos Básicos

Banco de Dados. Introdução e Definições

Banco de Dados e Aplicações em Negócios: Introdução.

Banco de Dados. Módulo 15 - Estruturas de Indexação

Sistemas da Informação. Banco de Dados I. Edson Thizon

Introdução. descrever os tipos de interfaces e linguagens oferecidas por um SGBD. mostrar o ambiente de programas dos SGBD s

Matéria Introdutória. Banco de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri

Capítulo 11 Sistemas de Arquivos

ACH2024. Aula 22 Hashing Externo - Hashing estático e dinâmico (extensível) Prof Helton Hideraldo Bíscaro

Organização de Arquivos

Sumário. Índices Ordenados: Nível Único. Índices Primários. Bancos de Dados Avançados Índices. Índices: Ordenados em nível único Multiníveis

Introdução a B anco de Dados. INE5206 Introdução à Informática INE/CTC/UFSC Prof. Roberto Willrich

ANÁLISE E PROJETO DE BANCO DE DADOS

PLANO DE ENSINO. PRÉ-REQUISITO: Modelagem e Programação Orientada a Objetos. PROFESSORA RESPONSÁVEL: Roberta Macêdo Marques Gouveia

Aula 2 BD Introdução. Profa. Elaine Faria UFU

Korth Silberschatz Sundarshan. Sistema de Banco de Dados, 5/E

3 Plano de Execução de Consultas

Sistemas de Banco de Dados

LINGUAGEM, TIPOS DE USUÁRIOS DE SGBD E MODELOS DE DADOS

INE 5423 Banco de Dados I

Modelo Relacional: Entidades e Relacionamentos. Cardinalidade. Normalização. Linguagem SQL: DDL e DML.

Aula 16. Tópicos Especiais II Banco de Dados. Prof. Dr. Dilermando Piva Jr.

Introdução. Motivação. Sistema Gerenciador de Banco de Dados (SGBD) Banco de Dados (BD) Sistema de Banco de Dados (SBD)

INF01145 Fundamentos de Banco de Dados Plano de ensino

ACH2025. Laboratório de Bases de Dados Aula 7. Armazenamento Físico. Professora: Fátima L. S. Nunes SISTEMAS DE INFORMAÇÃO

Prof. Benito Piropo Da-Rin. Arquitetura, Organização e Hardware de Computadores - Prof. B. Piropo

Sistemas de Gerência de Bancos de Dados. Módulo 1 - Armazenamento

INE 5423 Banco de Dados I

Banco de Dados. Introdução. Profa. Flávia Cristina Bernardini

GBC053 Gerenciamento de Banco de Dados Introdução à Organização de Arquivos (Métodos de Acesso/Índices)

Laboratório de Banco de Dados. Prof. Luiz Vivacqua.

Capítulo 11: Implementação de Sistemas de Arquivos. Operating System Concepts 8th Edition

2. Conceitos e Arquiteturas de um SGBD

Sumário. Definição do Plano de Execução

Banco de Dados I Módulo V: Indexação em Banco de Dados. (Aulas 1, 2 e 3) Clodis Boscarioli

BANCO DE DADOS Índices em BD Árvores B+

Organização da Informação

slide Pearson Prentice Hall. Todos os direitos reservados.

Bases de Dados. Índices. Discos. transferência lenta. transferência rápida e em blocos (512B ~ 4KB) e aos bytes. memória.

Universidade Estadual do Oeste do Parana - UNIOESTE Jhonata R.de Peder Marcelo Schuck

Ordenação e Busca em Arquivos

Um Repositório Chave-Valor com Garantia de Localidade de Dados. Patrick A. Bungama Wendel M. de Oliveira Flávio R. C. Sousa Carmem S.

indexação e hashing Construção de Índices e Funções Hash Diego Gomes Tomé - MSc. Informática Orientador: Prof. Dr. Eduardo Almeida October 13, 2016

Sistemas Operacionais. Visão Geral

Organização e Arquitetura de Computadores I

Modelo Relacional. Josino Rodrigues

Introdução a Banco de Dados

Bases de Dados. Índices. Discos. transferência rápida e aos bytes. transferência lenta e em blocos (512B ~ 4KB) memória. disco BD / aplicação

Introdução a Ciência da Computação Estrutura e Organização das Informações PROFESSORA CINTIA CAETANO

Organização e Arquitetura de Computadores I

Faculdade Ieducare 4º Semestre Sistemas de Informação Professor: Rhyan Ximenes

ACH2025. Laboratório de Bases de Dados Aula 9. Indexação e Hashing Parte 2. Professora: Fátima L. S. Nunes SISTEMAS DE INFORMAÇÃO

Fundamentos de Arquivos e Armazenamento Secundário

Capítulo 10: Interface de Sistemas de Arquivos. Operating System Concepts 8 th Edition

Introdução. Conceitos Básicos. Conceitos Básicos. Conceitos Básicos

Introdução. Conceitos Básicos. Conceitos Básicos. Conceitos Básicos

Universidade Federal de Campina Grande Departamento de Sistemas e Computação Curso de Bacharelado em Ciência da Computação.

Sistemas Operacionais. Sistema de Arquivos. Edeyson Andrade Gomes.

INF70 Gerenciamento de Banco de Dados 2 Introdução à Organização de Arquivos (Métodos de Acesso/Índices)

Banco de Dados I. Sejam bem-vindos! Prof. Fred Lucena. 1

Cap. 5 Indexação Baseada em Hashing

BANCO DE DADOS. Araújo Lima. Jan / Araújo

BCD29008 Banco de dados

Capítulo 8: Memória Principal. Operating System Concepts 8 th Edition

Profa. Dra. Cristina Dutra de Aguiar Ciferri. Estruturas de Indexação de Dados

Conceitos de Sistemas de Banco de Dados INE 5323

Banco de Dados I. Universidade Veiga de Almeida Luiz Antônio Vivacqua Corrêa Meyer

Sistemas de Arquivos. (Aula 23)

Evandro Deliberal Aula 03

Banco de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri. Banco de Dados Processamento e Otimização de Consultas

BCD29008 Banco de dados

Sistema Gestor de Bancos de Dados (SGBD)

slide Pearson Prentice Hall. Todos os direitos reservados.

Redes de Computadores. Fundamentos de Sistemas Operacionais - 2º Período

Introdução a Banco de Dados

Gerência de Dispositivos. Adão de Melo Neto

Computação L. Apresentação da Disciplina e Conceitos Básicos de Computadores

DISCO MAGNÉTICO Cabeçote Trilha

Sistemas Operacionais Arquivos. Carlos Ferraz Jorge Cavalcanti Fonsêca

Sistemas de Arquivos

Computadores e Programação (DCC/UFRJ)

Curso: Banco de Dados I. Conceitos Iniciais

Hashing. Hashing. Hashing versus Indexação. Hashing. Hashing convencional... Exemplo de espalhamento. Revisão...

Transcrição:

/8/00 Tópicos Organização e Indexação de Dados em Memória Secundária Disciplina Bancos de Dados II Prof Renato Fileto INE/CTC/UF Bancos de dados e acesso a memória secundária Noções de organização de dados em memória secundária Indexação s primários s de agrupamento (clustering) s secundários s em múltiplos níveis B-Trees e B+_Trees Bibliografia e leituras recomendadas Lista de exercícios Acesso a dados em um SGBD A arquitetura interna de um SGBD (figura adaptada de Korth & Silberchatz 994) Modelagem de Dados Interface Processamento de Consultas usuários ingênuos interfaces de aplicativos programadores de aplicativos API s para aplicativos usuários sofisticados consultas administrador do banco de dados esquema do banco de dados Processamento de Transações Acesso aos Dados código objeto pré-compilador DML gerenciador do banco processador de consultas compilador DDL SGBD SGBD gerenciador de acesso aos dados Dados e estruturas de acesso catálogo Níveis de armazenamento de dados Um disco simples Processador Registradores Internos Cache do Processador Memória Principal Cache de Disco Memória Primária Disco Magnético Memória Secundária Fita Memória Terciária

/8/00 Trilhas e setores Pilha de discos Alocação de disco Regs de tabela em páginas de disco Cache de disco Análises de tempo de acesso Consideram somente o número de páginas recuperadas para atender uma requisição Ignoram ganho no acesso a blocos previamente capturados e mantidos na cache de disco Páginas disponíveis em cache não precisam ser acessadas em disco Mas seus valores são perdidos se não gravados em disco antes de ocorrer uma falha Fatores relevantes Número e tamanho dos registros de dados Número de registros armazenados por página de disco Número de páginas de disco ocupadas pelos dados e estruturas de acesso aos mesmos Tempo médio para ler ou escrever uma página

/8/00 Exempo de análise Sejam NroRegs = 30000 TamReg = 00 bytes TamPag = Kbyte = 04 bytes Pode-se calcular NroRegsPorPag = 04 / 00 = 0 registros (4 bytes inutilizados por página) NroPagsOcupadas = 30000 / 0 = 3000 páginas O tempo de acesso depende do tipo de requisição e da estrutura utilizada para a organização e o acesso às páginas de dados Alternativas para organização dos dados em memória secundária Arquivos Heap Melhor opção quando o acesso tipico é um busca sequencial, sem ordem, recuperando todos registros Exemplo um simples arquivo de registros de dados Arquivos Ordenados Melhor opção se os registros devem ser recuperados em alguma ordem, ou quando somente uma porção contígua dos registros ordenados é necessária Ex, possivelmente ordenado, além de vários índices Arquivos Hashed Melhor para seleções de igualdade O arquivo de dados é uma coleção de buckets Bucket = uma página primária e possíveis páginas de overflow Função de Hashing h(k) = endereço do bucket contendo o(s) registro(s) com o valor de busca K Não é adequado para acesso seqüencial ordenado Indexação Tipos de índices Atrib Busca Pont Carmem esparço Nome Cidade Estado Beto Carmen Fernando Pont Atrib Busca secundário denso primário ordenação, inclusive dos dados, pela chave primária Esparso Máxima eficiência de agrupamento (clustering index) ordenação, inclusive dos dados, por atributo(s) não chave (que pode(m) ter valores repetidos) Esparso Eficiência próxima à do índice primário s secundários ordenações distintas (auxiliares) Densos Menos eficientes que os anteriores, porém muito mais eficientes que busca seqüencial primário de agrupamento (clustering index) Codigo Cidade Estado Nome Cidade Estado Atrib Busca 9 049 esparso Pont 8 9 0 6 Atrib Busca esparso Pont André Fernando Gisèle 049 00 06 3

/8/00 de agrupamento com blocos para cada valor de busca secundário Atrib Busca esparço Pont Nome Cidade Estado Nome Cidade Estado Beatriz Carmen Fernanda Paula Pont Atrib Busca Florianópoli s Paula denso s com múltiplos níveis Estrutura de índice em árvore (figura extraída de Ramakrishnan 998) 3 36 9 384 3 64 769 36 79 9 9 037 04 04 Código 4 6 7 04 046 048 Nome Camila Fátima Nilza Pedro Beatriz João André Ney Págs não folha Págs folha Página de overflow Páginas primárias B-Tree de ordem 3 Remoção na B-Tree ^ 8 ^ ^ 8 ^ ^ 3 ^ 7 ^ 9 ^ ^ ^ 3 ^ 7X ^ 9 ^ ^ ^^ = endereço de registro de dado 4

/8/00 Possível resultado da remoção Inserção na B-Tree 8 ^ 8 ^ ^ 3 ^ ^ 9 ^ ^ ^ 3 ^ ^ 9 ^ ^ Possível resultado da inserção B+_Tree (figura extraída de Ramakrishnan 998) 3 ^ 8 ^ Raiz ^ ^ ^ 9 ^ ^ Especificação de índices em SQL Leituras recomendadas CREATE INDEX IndicePorNome ON Pessoa KEY = (nome) CREATE INDEX IndicePorCidadeEstado ON Pessoa KEY = (cidade, estado) CREATE INDEX IndicePorEstadoCidade ON Pessoa KEY = (estado, cidade) Elmasri, R; Navathe, SB Fundamentals of database Systems ed, Benjamin Cummings, 994 Cap 4 Armazenagem de Registros e Organização de Arquivos Cap Estruturas de s para Arquivos Ramakrishnan, R Database management systems McGraw-Hill, 998 Parte 3 Armazenagem e Indexação de Dados Cap 7 Armazenando Dados Discos e Arquivos Cap 8 Organização de Arquivos e s Cap 9 Indexação baseada em Estruturas em Forma de Árvore Cap 0 Indexação baseada em Hashing Abiteboul, S; Buneman, P; Suciu, D Data on the Web from Relations to Semistructured Data and XML Morgan Kaufmann, 000 Seção 8 Indexação