Introdução à Computação: Armazenamento Secundário Ricardo de Sousa Bri.o rbri.o@ufpi.edu.br DIE- UFPI
Objetivos Relacionar os benefícios do armazenamento secundário. Identificar e descrever as mídias de armazenamento que estão disponíveis para computadores pessoais. Estabelecer a diferença entre os principais tipos de armazenamento secundário. Descrever como os dados são armazenados em um disco. Explicar como os dados são organizados, acessados e processados. 2
Armazenamento Secundário Separado do próprio computador. Software e dados armazenados em base quase permanente. Diferentemente da memória, não se perde quando há queda da energia elétrica. Benefícios 3
Benefícios do Armazenamento Secundário Espaço Confiabilidade Conveniência Economia 4
Espaço As organizações armazenam o equivalente a uma sala cheia de dados em discos menores do que uma caixa para guardar pão. Um disquete contém o equivalente a 500 páginas impressas. Um disco óptico pode conter o equivalente a 500 livros. 5
Confiabilidade Dados guardados no armazenamento secundário estão relativamente seguros. O armazenamento secundário é altamente confiável Mais difícil de pessoas despreparadas alterarem dados armazenados em disco. 6
Conveniência Usuários autorizados podem localizar fácil e rapidamente dados armazenados no computador. 7
Economia Diversos fatores criam significativas economias em termos de custos de armazenamento: Menos dispendioso armazenar dados em disco do que comprar e abrigar armários de arquivo. Dados confiáveis e seguros têm uma manutenção menos dispendiosa. Maior velocidade e conveniência para arquivar e recuperar dados. 8
Armazenamento em Disco Magnético Dados representados como pontos magnetizados na superfície de um disco rotativo. Pontos no disco convertidos em impulsos elétricos. Tipos principais: Discos flexíveis Discos rígidos 9
Discos Flexíveis Produzidos com Mylar flexível e revestidos com óxido de ferro. Possuem a proteção de uma jaqueta de plástico rígido. Um disquete de 3,5 polegadas contém 1,44 MB de dados. Variações de alta capacidade: O HiFD, da Sony, contém 200 MB. O SuperDisk, da Imation, está disponível nas versões de 120 e 240 MB. O Zip drive, da Iomega, está disponível nas versões de 100, 250 e 750 MB. 10
Discos Rígidos Lâmina rígida revestida com óxido magnético: Diversas lâminas podem ser combinadas em uma única pilha de discos (disk pack). Unidade de disco um dispositivo que possibilita recuperar dados para serem lidos ou escritos em disco. Unidade de disco para computadores pessoais alojada no gabinete do computador. Grandes sistemas computadorizados podem ter diversas unidades de disco externas. 11
Lendo e Escrevendo Dados O braço de acesso movimenta a cabeça de leitura/gravação sobre uma localização em particular. A cabeça de leitura /gravação paira alguns milionésimos de polegada acima da lâmina. Se a cabeça tocar a lâmina, haverá um crash, e dados serão destruídos. Dados podem ser destruídos se a cabeça entrar em contato com uma mínima matéria estranha na superfície do disco. 12
Lendo e Escrevendo Dados 13
Pilha de Discos (Disk Packs) Cada lâmina tem seu próprio braço de acesso com uma cabeça de leitura/gravação. A maioria das pilhas de discos (disk packs) combina lâminas, braços de acesso e cabeça de leitura/gravação. 14
Discos Rígidos para Computadores Pessoais Módulos lacrados que são montados em um compartimento de 3, 5 polegadas. Capacidade em gigabytes. O acesso a arquivos é muito mais rápido do que o acesso a arquivos em disquetes. Alguns contêm cartuchos removíveis. A unidade Jaz, da Iomega, é muito popular. 15
Conjunto Redundante de Discos (RAID) Um grupo de discos que funciona em conjunto, como uma unidade. O Raid de nível 0 divide dados de um único arquivo em diversas unidades de disco: Denomina-se distribuição de dados (data striping). Aumenta o desempenho. O Raid de nível 1 duplica dados em diversas unidades de disco: Denomina-se espelhamento de disco (disk mirroring). Aumenta a tolerância a falhas. 16
Conjunto Redundante de Discos (RAID) 17
Como os Dados São Organizados " Trilha " Setor " Cluster " Cilindro 18
Trilha A porção circular da superfície do disco que passa sob a cabeça de leitura/gravação. Um disco flexível tem 80 trilhas em cada superfície. O disco rígido pode ter 1.000 ou mais trilhas em cada superfície de cada lâmina. 19
Trilha 20
Setor Cada trilha é dividida em setores que contêm um número fixo de bytes. Tipicamente, 512 bytes por setor. A gravação por zonas atribui mais setores às trilhas que estão nas zonas externas do que àquelas que estão nas zonas internas. Usa o espaço de armazenamento de maneira mais completa. 21
Setor 22
Cluster Um número fixo de setores adjacentes tratados como uma unidade de armazenamento. Tipicamente, de dois a oito setores, dependendo do sistema operacional. 23
Cilindro A trilha sobre cada superfície, que está sob a cabeça de leitura/gravação, em determinada posição das cabeças de leitura/gravação. Quando o arquivo é maior do que a capacidade de uma única trilha, o sistema operacional armazena-o em trilhas que fazem parte do mesmo cilindro. 24
Cilindro 25
Velocidade de Acesso a Disco Tempo de acesso o tempo necessário para acessar dados no disco. Três fatores: Tempo de busca Comutação de cabeças Retardo rotacional Assim que os dados são encontrados, o passo seguinte é a transferência de dados. 26
Tempo de Busca Tempo necessário para que o braço de acesso se posicione sobre uma trilha em particular. Todos os braços de acesso se movem como uma unidade. Todos se posicionam simultaneamente sobre um conjunto de trilhas que compõe um cilindro. 27
Comutação de Cabeças A ativação de uma cabeça de leitura/ gravação em particular sobre uma trilha em particular. Todos os braços de acesso se movem juntos, mas somente uma cabeça de leitura/ gravação pode operar em determinado momento. 28
Retardo Rotacional O tempo necessário para que os dados desejados na trilha passem sob a cabeça de leitura e gravação. Em média, a metade do tempo para uma revolução completa do disco. 29
Transferência de Dados O processo de transferir dados entre sua localizaçao na trilha do disco e a memória. Medidas de desempenho Tempo médio de acesso: Aproximadamente, 10 milissegundos (10 milésimos de segundo). Pode ser melhorado através de cache de disco. Taxa de transferência de dados quão rapidamente dados podem ser transferidos ao serem localizados. Expressa em termos de megabytes por segundo. 30
Cache de Disco Cache de disco uma área especial da memória. Quando a unidade de disco lê dados do disco, ela lê dados adjacentes e os armazena na memória. Quando é emitida a instrução de leitura seguinte, a unidade verifica primeiro se os dados desejados estão na cache de disco. Similar à cache de memória discutida anteriormente. 31
Armazenamento em Disco Óptico Provê um armazenamento barato e compacto com maior capacidade. Um feixe laser varre o disco e capta reflexos de luz da superfície do disco. Categorizado pela capacidade de leitura e gravação. Mídia somente de leitura o usuário pode ler, mas não pode escrever no disco. Gravar uma vez, ler muitas (WORM) o usuário pode gravar no disco uma única vez. Magnético-óptico (MO) combina capacidades magnéticas e ópticas. 32
Discos Compactos CD-ROM a unidade somente pode ler dados de CDs. Um CD-ROM armazena até 700 MB por disco. Principal mídia para distribuição de software. CD-R a unidade pode escrever no disco apenas uma vez. O disco pode ser lido por uma unidade de CD- ROM ou CD-R. CD-RW a unidade pode apagar e sobregravar dados múltiplas vezes. Alguns problemas de compatibilidade podem ser encontrados ao tentar ler discos CD-RW em unidades de CD-ROM. 33
Digital Versatile Disk (DVD) Laser de ondas curtas podem ler pontos densamente empacotados. A unidade de DVD pode ler CD-ROMs. Capacidade até 17 GB. Possibilita armazenar filmes de longa- metragem. O som é melhor do que os de CDs de áudio. Existem diversas versões de DVDs graváveis e regraváveis. 34
Blu-ray Laser de ondas ainda mais curtas podem ler pontos muito densamente empacotados. A unidade de Blu-ray pode ler DVDs e CD-ROMs. Capacidade até 50 GB. Possibilita armazenar filmes em resolução full hd. Permite o armazenamento de áudio em tecnologia dolby truehd. Existem diversas versões de Blu-ray graváveis e regraváveis. 35
Armazenamento em Fita Magnética Fita similar à usada em cassetes de música. Categorizado em termos de densidade. Número de bits por polegada armazenados na fita. Usado principalmente para backup de dados armazenados em sistemas de disco. 36
Sistemas de Backup Imperativo ter cópias de dados importantes armazenadas longe do computador: Discos falham, ocasionalmente. Instalação de software pode causar pane no computador. Usuários cometem erros ao introduzir dados. Fita é uma mídia de backup ideal: Pode copiar o disco rígido inteiro para uma única fita em minutos. O backup pode ser programado para quando o sistema não estiver em uso. 37
Organizando Dados e Acessando Dados Armazenados " Caractere " Campo " Registro " Arquivo " Banco de dados 38
Caractere Uma letra, dígito ou caractere especial. 39
Campo Um conjunto de caracteres relacionados. Descreve uma característica de uma pessoa, lugar ou coisa. Para uma universidade, o prenome de um estudante seria armazenado em um campo. Campo-chave um identificador único de um registro. 40
Registro Uma coleção de campos relacionados. Para uma universidade, todos os campos referentes a um aluno constituem um registro. 41
Arquivo Uma coleção de registros relacionados. Para uma universidade, todos os registros de estudantes compõem um arquivo. 42
Banco de Dados Uma coleção de arquivos relacionados armazenados com mínima redundância (duplicação). Para uma universidade, o arquivo de alunos, o arquivo de bolsistas, o arquivo do corpo docente/ staff, o arquivo de cursos, o arquivo financeiro etc. comporiam um banco de dados. Organizado para tornar mais fácil a recuperação de dados. 43
Visão Geral do Plano de Arquivos Deve idealizar um plano para colocar dados em uma unidade de armazenamento. Fatores-chave: Se os usuários devem acessar dados diretamente (de imediato). Como os dados devem ser organizados Tipo de processamento que se desenvolverá. no disco. 44
Organização de Arquivos Três fatores importantes da organização de arquivos de dados no armazenamento secundário: Seqüencial Direta Indexada 45
Organização Seqüencial de Arquivos Os registros são armazenados em ordem, de acordo com um campo-chave: Se um registro em especial for desejado, todos os registros anteriores devem ser lidos primeiro. Para atualizar um registro, um novo arquivo seqüencial deve ser criado, contendo tanto os registros alterados quanto os não alterados. O armazenamento em fita usa a organização seqüencial. 46
Organização Direta de Arquivos Também chamada de acesso aleatório. Vá diretamente ao registro desejado usando uma chave: O computador não precisa ler todos os registros anteriores. Um algoritmo de randomização (hashing) é usado para determinar o endereço de uma chave específica. Requer armazenamento em disco. 47
Organização Direta de Arquivos 48
Algoritmo de Randomização (Hashing) Aplica uma fórmula matemática à chave para determinar o endereço em disco de determinado registro. Ocorre colisão quando o algoritmo de randomização produz o mesmo endereço em disco para duas chaves diferentes. 49
Organização Indexada de Arquivos Combina elementos dos métodos seqüencial e direto: Registros armazenados seqüencialmente, mas o arquivo também contém um índice. O índice armazenado seqüencialmente contém a chave do registro. Dados acessados pela chave do registro. 50
Processando Dados Armazenados Transações processadas para atualizar um arquivo-mestre: Transações um evento comercial, como uma venda. Arquivo-mestre dados que são atualizados quando ocorre uma transação, como um arquivo de transações ou um arquivo de estoques. Dois métodos principais de processamento de dados: Processamento em lote Processamento de transações 51
Processamento em Lote As transações são coletadas em grupos ou lotes: O lote é processado e o arquivo-mestre é atualizado quando o computador tem poucos usuários on-line. Uso muito eficiente dos recursos do computador. O arquivo-mestre atual apenas é atualizado imediatamente após o processamento. 52
Processamento em Lote 53
Processamento de Transações Técnica de processamento de transações à medida que elas ocorrem. Também chamada de processamento em tempo real e processamento on-line. Terminais devem estar conectados diretamente ao computador. Proporciona atualização imediata do arquivomestre. 54
Processamento de Transações 55