Computação de Alto Desempenho na Ótica da Lista TOP500 ou. (Se um computador já é rápido, imaginem um sistema com 131.072 computdores :-)



Documentos relacionados
MAC 412 Organização de Computadores

Siang Wun Song - IME/USP e Universidade Federal do ABC. MAC setembro de 2010

Evolução da Computação de Alto Desempenho sob a Ótica da Lis. ou (Se um processador já é rápido, imaginem um sistema com processadores :-)

Como programar um computador com processadores? ou: Oportunidades e Desafios da Computação Paralela

Evolução da Computação de Alto Desempenho na Ótica da Lista. ou (Se um processador já é rápido, imaginem um sistema com processadores :-)

O estado de arte: a evolução de computação de alto desempenho

Evolução da Computação de Alto Desempenho sob a Ótica da Lis. ou (Se um processador já é rápido, imaginem um sistema com processadores :-)

A Evolução dos Computadores: do ENIAC ao Jaguar

Evolução da Computação de Alto Desempenho sob a Ótica da Lis. ou (Se um processador já é rápido, imaginem um sistema com processadores :-)

A Evolução dos Clusters frente as demais arquiteturas de Alto Desempenho

Palestra - Depto. de Informática - UFMA

Programação e Scheduling

Prof. Marcelo de Sá Barbosa SISTEMAS DISTRIBUIDOS

ALGORÍTMOS PARALELOS (Aula 2) LCAD. Neyval C. Reis Jr. OUTUBRO/2004. Laboratório de Computação de Alto Desempenho DI/UFES

Arquitetura dos Supercomputadores - TOP 500 -

slide 0 Algoritmos Paralelos

Análise de desempenho de processadores ATmega328 utilizando Benchmark Linpack Marcos S. Morgenstern, Lori R. F. Machado Filho, Edson L.

Curso de Instalação e Gestão de Redes Informáticas

Introdução às arquiteturas paralelas e taxonomia de Flynn

Auditoria de senhas em hardware paralelo com o John the Ripper O impacto das tecnologias de processamento paralelo na quebra de senhas

Medidas de Desempenho e a Lei de Amdahl

Introdução à Grid e Cloud Computing

ARQUITETURA E ORGANIZAÇÃO DE COMPUTADORES INTRODUÇÃO AO PARALELISMO: PROCESSADORES SUPERESCALARES. Prof. Dr. Daniel Caetano

} Monolíticas Aplicações em um computador centralizado. } Em Rede Aplicações com comunicação em rede. } Distribuídas Comunicação e cooperação em rede

Sistemas Operacionais. Prof. M.Sc. Sérgio Teixeira. Aula 02 - Estrutura dos Sistemas Operacionais. Cursos de Computação

Resumo. Introdução Cluster Cluster Beowulf Curiosidades Conclução

Multi-processamento. Arquitecturas MIMD de memória partilhada Multi-cores heterogéneos Multi-processadores

MAC 412- Organizãção de Computadores - Siang Wun Song. Um seminário sobre como preparar um seminário

Introdução Processamento Paralelo

Agenda do Mini-Curso. Sérgio Yoshio Fujii. Ethan Boardman.

Prof. Daniel Gondim Informática


Unidade 13: Paralelismo:

FUNDAMENTOS DE HARDWARE COMO FUNCIONA UM PC? Professor Carlos Muniz

Introdução à Programação Paralela através de Padrões. Denise Stringhini Calebe Bianchini Luciano Silva

Sistemas Paralelos e Distribuídos. Prof. Jorge Dantas de Melo Depto. Eng. Comp. e Automação CT - UFRN

Capítulo 1 Introdução

Capítulo 8 Arquitetura de Computadores Paralelos

Portas lógicas e Circuitos. Marcos Monteiro, MBA

Comparativo de desempenho do Pervasive PSQL v11

Sistemas Computacionais II Professor Frederico Sauer

Projetos I Resumo de TCC. Luiz Rogério Batista De Pieri Mat:

Evolução das CPUs: Dual e Quad Core

Introdução ao Processamento Paralelo

Instituto Superior de Engenharia do Porto Administração de Sistemas Informáticos I Clusters

Administração de Sistemas de Informação Gerenciais

Organização e Arquitetura de Computadores I. de Computadores

RISC - Reduced Instruction Set Computer

Algumas características especiais

Organização de Computadores

Sistemas Operacionais. Prof. André Y. Kusumoto

Sistemas Operacionais

Técnico em Informática - Instalação e Manutenção de Computadores PROCESSADORES

Sistemas de Informação

Ricardo Gonçalves 2013/2014. Arquitecturas Multicore

Sistemas MIMD. CES-25 Arquiteturas para Alto Desmpenho. Paulo André Castro

Na Terra ou nas Nuvens, onde fica o HPC?

Introdução à Engenharia de Computação

Máquinas Multiníveis

ALGORÍTMOS PARALELOS LCAD. Neyval C. Reis Jr. OUTUBRO/2004. Laboratório de Computação de Alto Desempenho DI/UFES

Computação de Alta Perfomance com Software Livre (Clusters)

29/3/2011. Primeira unidade de execução (pipe U): unidade de processamento completa, capaz de processar qualquer instrução;

Arquitectura de Sistemas Paralelos e Distribuídos

Contil Informática. Curso Técnico em Informática Processadores Core

Um seminário sobre como preparar um seminário

Sistemas Distribuídos

Mário Severiano site: Tel.: e mseveriano@projetoweb.inf.br

Imagem retirada de documentações de treinamentos oficiais INTEL

Arquitetura de Computadores Paralelos. Introdução Conceitos Básicos Ambientes de Programação Modelos de Programação Paralela

Taxa de Gravação da Memória RAM (MegaBytes / segundo) G5 2.7 Ghz (Mac) Linux Kernel

A história do Processadores O que é o processador Características dos Processadores Vários tipos de Processadores

Professores: Aula 10. Lúcia M. A. Drummond Simone de Lima Martins. Conteúdo: Arquiteturas Avançadas. - Arquiteturas RISC - Processamento Paralelo

O hardware é a parte física do computador, como o processador, memória, placamãe, entre outras. Figura 2.1 Sistema Computacional Hardware

AUTOMAÇÃO DE ESCRITÓRIOS ADE

SIS17 - Arquitetura de Computadores. Introdução (Parte III)

Capítulo 9. Gerenciamento de rede

Arquitetura de Computadores. Ivan Saraiva Silva

Comparação de algoritmos paralelos em uma rede heterogênea de workstations

Arquitetura NUMA 1. Daniel de Angelis Cordeiro. INRIA MOAIS project Laboratoire d Informatique de Grenoble Université de Grenoble, França

INFORMÁTICA BÁSICA AULA 02. Docente: Éberton da Silva Marinho

Arquitetura e Organização de Computadores Aula 5 Consolidando Conhecimentos de Desempenho e Resumindo Prof. Julio Saraçol

CAPA Área de utilização para ilustração MANUAL w-vpn

Sistemas Integrados de Gestão Empresarial

Sistemas Operacionais

ARQUITETURA DE SISTEMAS DISTRIBUÍDOS. Aula 2- Aplicações distribuídas e TI VERDE

Arquitetura de Computadores Paralelismo, CISC X RISC, Interpretação X Tradução, Caminho de dados

SIS17-Arquitetura de Computadores

Capítulo 3. Avaliação de Desempenho. 3.1 Definição de Desempenho

Armazenamento Secundário. SCE-183 Algoritmos e Estruturas de Dados II

Comparação SDs X Scs

Redes de Computadores. Jeronimo Costa Penha Senai CFP - JIP

Montagem e Manutenção. Luís Guilherme A. Pontes

MAC Organização de Computadores Gargalo de Memória

FUNDAMENTOS DE HARDWARE PROCESSADORES. Professor Carlos Muniz

10 DICAS DE TECNOLOGIA PARA AUMENTAR SUA PRODUTIVIDADE NO TRABALHO

Aula 2 Modelo Simplificado de Computador

UTILIZAÇÃO DA COMPETÊNCIA DE TI ATRAVÉS DE UM ABRANGENTE PLANEJAMENTO DE CAPACIDADE E MODELAGEM DE CARGAS DE TRABALHO

Aula 26: Arquiteturas RISC vs. CISC

3. Cite o nome e características do ponto mais alto e do ponto mais baixo de uma onda?

Transcrição:

Computação de Alto Desempenho na Ótica da Lista TOP500 ou (Se um computador já é rápido, imaginem um sistema com 131.072 computdores :-) MAC 412- Organizãção de Computadores - Siang W. Song Fonte: http://www.top500.org/

Evolução da Computação Os primeiros processadores (como o Mark I) tinham ciclos da ordem de alguns segundos Processador hoje: vários GHz - menos de um nanosegundo de ciclo Processador de hoje é 1.000.000.000 vezes mais rápido Computação paralela usa um grande número de processadores, aumentando mais ainda o poder computacional. Veremos a sua evolução na ótica da lista TOP500.

Computação de Alto Desempenho Medida de desempenho: 1 FLOPS = uma operação ponto flutuante por segundo KFLOPS = 2 10 = aprox. 1.000 op/s MFLOPS = 2 20 = aprox. 1.000.000 op/s GFLOPS = 2 30 = aprox. 1.000.000.000 op/s TFLOPS = 2 40 = aprox. 1.000.000.000.000 op/s

Lista TOP500 Lista dos 500 computadores mais poderosos do mundo Divulgada duas vezes por ano: em junho e novembro Interesse tanto para fabricantes como para compradores potenciais Benchmark: LINPACK - um sistema linear de 1000 equações a 1000 incógnitas. Computadores com melhor desempenho LINPACK entram na lista Muito material é disponível no site: http://www.top500.org/

O Primeiro Colocado O computador mais veloz do mundo (em junho/2006): IBM BlueGene (DOE) 131.072 processadores LINPACK: 280,6 TFLOPS Velocidade pico: 367 TFLOPS Tecnologia CMOS de 0,25 micron Em novembro/2006 sai uma nova TOP500 e tudo pode mudar :-)

O Primeiro Colocado O computador mais veloz do mundo (em junho/2006): IBM BlueGene (DOE) 131.072 processadores LINPACK: 280,6 TFLOPS Velocidade pico: 367 TFLOPS Tecnologia CMOS de 0,25 micron Em novembro/2006 sai uma nova TOP500 e tudo pode mudar :-)

Quatro Brasileiros na TOP500 de junho/2006 Posição 171 (Petrobrás) - Cluster IBM xseries Xeon 3.06GHz 1024 processadores (3,755 TFLOPS Linpack) Posição 173 (Petrobrás) - Cluster HP Xeon 3,06 GHz 1.300 processadores (3,739 TFLOPS Linpack) Posição 279 (Petrobrás)- Cluster HP Xeon 3,06 GHz 1.008 processadores (2,992 TFLOPS Linpack) Posição 374 (PGS - Petroleum Geo-Services) - IBM BladeCenter Opteron 2.0GHz Duo core 1232 processadores (1,232 TFLOPS Linpack) Para entrar na lista TOP500, o último colocado apresenta 2,026 TFLOPS Linpack. A USP está comprando um cluster SUN com mais de 600 processadores. Poderá entrar na TOP500 em novembro de 2006 :-)

Quatro Brasileiros na TOP500 de junho/2006 Posição 171 (Petrobrás) - Cluster IBM xseries Xeon 3.06GHz 1024 processadores (3,755 TFLOPS Linpack) Posição 173 (Petrobrás) - Cluster HP Xeon 3,06 GHz 1.300 processadores (3,739 TFLOPS Linpack) Posição 279 (Petrobrás)- Cluster HP Xeon 3,06 GHz 1.008 processadores (2,992 TFLOPS Linpack) Posição 374 (PGS - Petroleum Geo-Services) - IBM BladeCenter Opteron 2.0GHz Duo core 1232 processadores (1,232 TFLOPS Linpack) Para entrar na lista TOP500, o último colocado apresenta 2,026 TFLOPS Linpack. A USP está comprando um cluster SUN com mais de 600 processadores. Poderá entrar na TOP500 em novembro de 2006 :-)

Quatro Brasileiros na TOP500 de junho/2006 Posição 171 (Petrobrás) - Cluster IBM xseries Xeon 3.06GHz 1024 processadores (3,755 TFLOPS Linpack) Posição 173 (Petrobrás) - Cluster HP Xeon 3,06 GHz 1.300 processadores (3,739 TFLOPS Linpack) Posição 279 (Petrobrás)- Cluster HP Xeon 3,06 GHz 1.008 processadores (2,992 TFLOPS Linpack) Posição 374 (PGS - Petroleum Geo-Services) - IBM BladeCenter Opteron 2.0GHz Duo core 1232 processadores (1,232 TFLOPS Linpack) Para entrar na lista TOP500, o último colocado apresenta 2,026 TFLOPS Linpack. A USP está comprando um cluster SUN com mais de 600 processadores. Poderá entrar na TOP500 em novembro de 2006 :-)

Desempenho ao longo do tempo

Perguntas Pergunta: O que vem depois de TFLOPS? Resposta: PFLOPS (Peta Flops) 1 PFLOPS = 2 50 = aprox. 1.000.000.000.000.000 op/s Previsão do Futuro Pergunta: Em que ano teremos computadores de desempenho de PFLOPS?

Perguntas Pergunta: O que vem depois de TFLOPS? Resposta: PFLOPS (Peta Flops) 1 PFLOPS = 2 50 = aprox. 1.000.000.000.000.000 op/s Previsão do Futuro Pergunta: Em que ano teremos computadores de desempenho de PFLOPS?

Perguntas Pergunta: O que vem depois de TFLOPS? Resposta: PFLOPS (Peta Flops) 1 PFLOPS = 2 50 = aprox. 1.000.000.000.000.000 op/s Previsão do Futuro Pergunta: Em que ano teremos computadores de desempenho de PFLOPS?

Predicção do Desempenho

Compradores

Aplicações

Países Compradores

Evolução das Fabricantes Área de alta competição. Difícil prever qual melhor rumo a seguir. Algumas empresas permanecem; outras não.

Fabricantes

Tecnologia de Fabricação ECL - Emitter Coupled Logic: rápida e de alto custo. Tecnologia MOS - Metal Oxide Semiconductor. Primeiros processadores de PCs (e.g. Z80): NMOS. Hoje: CMOS.

Tecnologia

Arquitetura de Computador Um só processador. SMP - Symmetric Multi Processor. MPP - Massively Parallel Processor. SIMD - Single Instruction Multiple Data. Cluster - Network of Workstations. Constelation - cluster of clusters.

Família de Processadores

Arquitetura

Arquitetura do Processador

Sistema Operacional

Notável Avanço em Hardware O rápido avanço em hardware então vai resolver tudo? Não obstante a rápida evolução do hardware, a grande dificuldade está no desenvolvimento de algoritmos para explorar efetivamente o potencial computacional. Não adianta termos 131.072 processadores, se apenas poucos fazem trabalhas úteis a cada momento.

Notável Avanço em Hardware O rápido avanço em hardware então vai resolver tudo? Não obstante a rápida evolução do hardware, a grande dificuldade está no desenvolvimento de algoritmos para explorar efetivamente o potencial computacional. Não adianta termos 131.072 processadores, se apenas poucos fazem trabalhas úteis a cada momento.

Notável Avanço em Hardware O rápido avanço em hardware então vai resolver tudo? Não obstante a rápida evolução do hardware, a grande dificuldade está no desenvolvimento de algoritmos para explorar efetivamente o potencial computacional. Não adianta termos 131.072 processadores, se apenas poucos fazem trabalhas úteis a cada momento.

O Vilão é a Comunicação Um algoritmo sequencial não gasta tempo com comunicação com outros computadores. (Quando só voce está trabalhando, voce não fica falando sozinho :-) Um algoritmo paralelo, dependendo da aplicação, precisa fazer comuicação com outros computadores. (Quando o trabalho é em grupo, em geral a comunicação se torna essencial.) Computador paralelo de memória distribuída: cada processador tem sua memória local.

Granularidade Granularidade fina: quando um processador faz pouca computação e depois já precisa fazer comunicação. Granularidade grossa: quando um processador faz muita computação antes de precisar fazer comunicação. Modelo de computação de granularidade grossa (Coarse-Grained Multicomputer - CGM). Objetivo: minimizar o número de rodadas de comunicação.

Conclusões Computação de alto desempenho caminha para a computação paralela. A tecnologia usada é a CMOS. Fabricantes enfrentam alta competição. Algumas arquiteturas são mais adequadas para numerosos processadores. O novo lugar na lista TOP500 dos Clusters (296 em 500 são clusters).