Sistemas de armazenamento João Canas Ferreira Dezembro de 2004 Contém figuras de Computer Architecture: A Quantitative Approach, J. Hennessey & D. Patterson, 3 a. ed., MKP c JCF, 2004 AAC (FEUP/LEIC) Sistemas de armazenamento 1/27
Assuntos 1 Introdução 2 Discos magnéticos 3 Utilização redundante de discos 4 Medidas de desempenho c JCF, 2004 AAC (FEUP/LEIC) Sistemas de armazenamento 2/27
Introdução Sistemas de Entrada/Saída Desempenho de E/S interessa? Porque não executar outros processos? 1. O que é mais importante: débito ou tempo de resposta? 2. Trocar processos pode aumentar actividade E/S. 3. Podem não existir outros processos. Dispositivos de armazenamento 1. discos magnéticos; 2. discos ópticos; 3. bandas magnéticas; 4. memória Flash. Os utilizadores são particularmente sensíveis à integridade da informação. O tempo de acesso tem evoluído muito menos favoravelmente que a capacidade de armazenamento. c JCF, 2004 AAC (FEUP/LEIC) Sistemas de armazenamento 3/27
Introdução Exemplo: Silo de armazenamento c JCF, 2004 AAC (FEUP/LEIC) Sistemas de armazenamento 4/27
Discos magnéticos Discos magnéticos cada prato tem duas superfícies cobertas de material magnético; círculos concêntricos: pistas (5000-30000); as pistas estão divididas em sectores (512 B); gravação em constant bit density; sobre cada superfície existe braço com cabeça de leitura/escrita; cilindro designa o conjunto de sectores sob o braço no mesmo instante; a densidade (bits por unidade de área) tem vindo a aumentar: 100% ao ano entre 1997 e 2001; 2001: 20 10 9 bits/polˆ2 (comercial), 60 10 9 bits/polˆ2 (lab); c JCF, 2004 AAC (FEUP/LEIC) Sistemas de armazenamento 5/27
Organização física Discos magnéticos c JCF, 2004 AAC (FEUP/LEIC) Sistemas de armazenamento 6/27
Discos magnéticos Tempos de operação tempo de acesso soma dos quatro (ou cinco) tempos mencioonados a seguir; tempo de busca tempo que demora a pôr o braço sobre a pista pretendida; latência de rotação tempo que o sector pretendido demora a surgir debaixo do braço após cabeça chegar à pista; tempo de transferência tempo que demora a transferir um sector já posicionado sob a cabeça; controladores de disco e de array têm overhead próprio adicional; a densidade (bits por unidade de área) tem vindo a aumentar: 100% ao ano entre 1997 e 2001; tempo de transferência reduz-se a 40% ao ano; tempo de acesso reduz-se 10% ao ano; c JCF, 2004 AAC (FEUP/LEIC) Sistemas de armazenamento 7/27
Do processador ao disco Discos magnéticos c JCF, 2004 AAC (FEUP/LEIC) Sistemas de armazenamento 8/27
Discos magnéticos Evolução do preço dos discos magnéticos c JCF, 2004 AAC (FEUP/LEIC) Sistemas de armazenamento 9/27
Discos magnéticos Evolução do preço por GB c JCF, 2004 AAC (FEUP/LEIC) Sistemas de armazenamento 10/27
Tempo de busca Discos magnéticos Fórmula empírica para tempo de busca: (em termos de valores mínimo, médio e máximo) em função de d, a distância entre cilindros. T (d) = a d 1 + b (d 1) + c c JCF, 2004 AAC (FEUP/LEIC) Sistemas de armazenamento 11/27
Proximidade Discos magnéticos O tempo de busca médio não leva em conta os efeitos do princípio da proximidade. c JCF, 2004 AAC (FEUP/LEIC) Sistemas de armazenamento 12/27
Discos magnéticos Tempo de acesso para várias tecnologias de armazenamento c JCF, 2004 AAC (FEUP/LEIC) Sistemas de armazenamento 13/27
Discos magnéticos Interface com periféricos c JCF, 2004 AAC (FEUP/LEIC) Sistemas de armazenamento 14/27
Utilização redundante de discos Redundant Arrays of Inexpensive Disks Ou: Redundant Arrays of Independent Disks. Utilização de múltiplos discos em paralelo, com os dados distribuídos, de forma a que os discos sejam acedidos em paralelo, sincronizadament: striping. A Utilização de N discos reduz a fiabilidade de um factor de 1/N. Solução: acrescentar discos redundantes com suficiente informação para reconstriur os dados de um disco que avarie. Problema: Falhas sucessivas: MTTF tempo média até uma avaria: dezenas de anos; MTTR tempo médio até reparação: horas. Utilização de hot spares: discos extra, não usados em operação normal; quando ocorre uma avaria, um hot spare é colocado automaticamente em serviço com a informação do disco avariado recosntruída automaticamente. Muitos sistemas suportam hot swapping. c JCF, 2004 AAC (FEUP/LEIC) Sistemas de armazenamento 15/27
Níveis RAID Utilização redundante de discos Sumário dos tipos de organização RAID: Nível Descrição Faltas Discos (d) Discos (c) Em uso? 0 Nonredundant striped 0 8 0 s 1 Mirrored 1 8 8 s 2 Memory-style EEC 1 8 4 n 3 Bit-interleaved parity 1 8 1 s 4 Block-interleaved parity 1 8 1 s 5 BL-I distributed parity 1 8 1 s 6 P+Q redundacy 2 8 2 n Disco (d): disco de dados Disco (c): discos redundantes (c = check) c JCF, 2004 AAC (FEUP/LEIC) Sistemas de armazenamento 16/27
Utilização redundante de discos RAID 0 e RAID 1 RAID 0 Dados repartidos por discos (striping), mas sem redundância. Os vários discos aparecem com um único disco de grande capacidade. Trata-se de uma técnica de organização antiga, que não é propriamente RAID. RAID 1 Os dados de cada disco são duplicados (mirrored) noutro. Combinação de mirroring e striping: 1. RAID 1+0 ou 10: emparelhar discos e depois distribuir dados (striped mirrors); 2. RAID 0+1 ou 01: criar dois grupos RAID 0 e depois emparelhá-los (mirrored stripes). c JCF, 2004 AAC (FEUP/LEIC) Sistemas de armazenamento 17/27
Utilização redundante de discos Exemplo: RAID 0, 1, 2 c JCF, 2004 AAC (FEUP/LEIC) Sistemas de armazenamento 18/27
RAID 3-6 Utilização redundante de discos O custo da disponibilidade pode ser reduzido a 1/N, em que N é o número de discos do grupo de protecção. RAID 3: Acessos são distribuídos por todos os discos, com informação extra (por exemplo, paridade) guardada num dos discos do grupo de protecção. RAID 4: Em certas aplicações, é importante suportar pequenas escritas (os dados não ocupam todos os discos de um stripe). Para isso, calcula-se novos valores de paridade usando apenas os novos dados e a antiga informação de paridade. RAID 5: No esquema anterior, o grupo de de protecção torna-se um gargalo do processamento, porque deve ser actualizado a cada escrita. Para evitar isso, distribuem-se os blocos de paridade por todos os discos. RAID 6: Acrescentar mais dados de protecção para recuperar de duas falhas simultâneas. c JCF, 2004 AAC (FEUP/LEIC) Sistemas de armazenamento 19/27
Utilização redundante de discos Exemplo: RAID 3, 4, 5, 6 c JCF, 2004 AAC (FEUP/LEIC) Sistemas de armazenamento 20/27
Utilização redundante de discos Pequenas actualizações: RAID 3 vs. RAID 4/RAID 5 c JCF, 2004 AAC (FEUP/LEIC) Sistemas de armazenamento 21/27
RAID 4 vs. RAID 5 Utilização redundante de discos c JCF, 2004 AAC (FEUP/LEIC) Sistemas de armazenamento 22/27
Medidas de desempenho Medidas de desempenho Diversidade (que tipos de periféricos); Capacidade (quantos periféricos); Débito (tarefas [transferências] terminadas por unidade de tempo largura de banda ); tempo de resposta diferença de tempo entre o instante em que a tarefa é terminada e o instante em que é iniciada (colocada em fila); maximizar débito manter buffer cheio; minimizar tempo de resposta manter buffer vazio; empiricamente observa-se que existe um ponto a partir do qual um aumento de débito implica um aumento do tempo de resposta. c JCF, 2004 AAC (FEUP/LEIC) Sistemas de armazenamento 23/27
Medidas de desempenho Débitos vs. tempo de resposta c JCF, 2004 AAC (FEUP/LEIC) Sistemas de armazenamento 24/27
Medidas de desempenho Transacções interactivas Um transacção interactiva (interacção) divide-se em três partes: 1. tempo de introdução tempo que o utilizador demora a introduzir um comando; 2. tempo de resposta do sistema o tempo que vai desde o fim da introdução do comando até que a resposta completa é apresentada; 3. tempo de meditação o tempo que vai desde a recepção da resposta até ao início de nova transacção. Uma redução do tempo de resposta leva a uma redução maior do tempo total da transacção! (dentro de limites: < 1s). c JCF, 2004 AAC (FEUP/LEIC) Sistemas de armazenamento 25/27
Medidas de desempenho Caracterização de transacções interactivas c JCF, 2004 AAC (FEUP/LEIC) Sistemas de armazenamento 26/27
Produtividade Medidas de desempenho c JCF, 2004 AAC (FEUP/LEIC) Sistemas de armazenamento 27/27