Arquiteturas Multi e Many cores baseadas em redes-em-chip



Documentos relacionados
Técnicas de Manutenção de Computadores

Aula 26: Arquiteturas RISC vs. CISC

Single-Chip Cloud Computer

Arquitetura de Computadores RISC x CISC. Gustavo Pinto Vilar

Organização e Arquitetura de Computadores I. de Computadores

29/3/2011. Primeira unidade de execução (pipe U): unidade de processamento completa, capaz de processar qualquer instrução;

Evolução das CPUs: Dual e Quad Core

Interface de Comunicação Extensível para a Rede-em-Chip SoCIN

Arquiteturas RISC. (Reduced Instructions Set Computers)

Rede Corporativa. Tutorial 10 mar 2009 Fabio Montoro. Introdução

Virtualização de Sistemas Operacionais

Como Utilizar Power over Ethernet para Reduzir o Consumo de Energia

Guilherme Pina Cardim. Relatório de Sistemas Operacionais I

Hardware de Computadores

SISTEMAS OPERACIONAIS. Maquinas Virtuais e Emuladores

O quê um Processador e qual a sua função?

10 DICAS DE TECNOLOGIA PARA AUMENTAR SUA PRODUTIVIDADE NO TRABALHO

Curso de Instalação e Gestão de Redes Informáticas

Paralelismo. Computadores de alto-desempenho são utilizados em diversas áreas:

Você acha que não precisa de um FPGA? Pense melhor!

DECODIFICADOR DE DISPLAY DE 7 SEGMENTOS COM LATCH

Alguma das vantagens e desvantagens dos computadores ópticos é apresenta a seguir.

Arquitetura de Computadores - Arquitetura RISC. por Helcio Wagner da Silva

Automação de Locais Distantes

Autores Pedro Brochado Luís Oliveira

Solução para coleta de dados e análise de consumo para controlar e otimizar os custos

O que é Gerenciamento de Redes de Computadores? A gerência de redes de computadores consiste no desenvolvimento, integração e coordenação do

Curso: Redes II (Heterogênea e Convergente) Tema da Aula: Características Roteamento

A história do Processadores O que é o processador Características dos Processadores Vários tipos de Processadores

Dinâmicas de Acesso ao Espectro

Air-Fi - sistema sem fio Sinta-se confortável com a confiança e o desempenho líderes do setor.

Introdução a computação móvel. Middlewares para Rede de Sensores sem Fio. Uma avaliação na ótica de Adaptação ao Contexto

7.Conclusão e Trabalhos Futuros

PROJETO DE REDES

Capítulo 9 - Conjunto de Protocolos TCP/IP e Endereçamento. Associação dos Instrutores NetAcademy - Julho de Página

Multiprocessamento. Multiprocessadores com memória distribuída (multicomputador)

Ao longo do presente capítulo será apresentada uma descrição introdutória da tecnologia FPGA e dos módulos básicos que a constitui.

INSTITUTO DE EMPREGO E FORMAÇÃO PROFISSIONAL, I.P.

Taxa de Gravação da Memória RAM (MegaBytes / segundo) G5 2.7 Ghz (Mac) Linux Kernel

CPU Unidade Central de Processamento. História e progresso

Nova plataforma Toyota (TNGA) para produzir Carros cada vez Melhores i

On Scalability of Software-Defined Networking

Sistemas Distribuídos. Aleardo Manacero Jr.

Itinerários de Ônibus Relatório Final

Prof. Esp. Lucas Cruz

Arquitetura de Computadores. Ivan Saraiva Silva

Serial ATA (SATA - Serial Advanced Technology Attachment)

1 INTRODUÇÃO Internet Engineering Task Force (IETF) Mobile IP

Entendendo como funciona o NAT

DIFERENÇAS ENTRE HUB, SWITCH E ROOTER

Introdução Ligação direta Ligação direta Default

Unidade 13: Paralelismo:

Arquitetura de Computadores Paralelismo, CISC X RISC, Interpretação X Tradução, Caminho de dados

Comunicado à Imprensa

Pesquisa Etnográfica

Divulgação do novo telefone da Central de Atendimento da Cemig: Análise da divulgação da Campanha

Otimismo desenvolvedoras de softwares

Características técnicas Baseado no ATMega da empresa AVR, fabricante de micro-controladores em plena ascensão e concorrente do PIC Pode usar ATMega

6 Conclusões e Trabalhos futuros 6.1. Conclusões

Computadores de Programação (MAB353)

ORGANIZAÇÃO DE COMPUTADORES MÓDULO 8

Introdução. Em se tratando de computador, entendemos que memória são dispositivos que armazenam dados com os quais o processador trabalha.

EAGLE TECNOLOGIA E DESIGN CRIAÇÃO DE SERVIDOR CLONE APCEF/RS

Tecnologia PCI express. Introdução. Tecnologia PCI Express

Organização de Computadores

Processadores. Guilherme Pontes

Introdução Processamento Paralelo

Técnicas para Programação Inteira e Aplicações em Problemas de Roteamento de Veículos 14

Introdução ao Modelos de Duas Camadas Cliente Servidor

XDOC. Solução otimizada para armazenamento e recuperação de documentos

MRP II. Planejamento e Controle da Produção 3 professor Muris Lage Junior

Projeto de controle e Automação de Antena

Comparativo de desempenho do Pervasive PSQL v11

ÁREA: CV ( ) CHSA ( ) ECET ( )

Resenha. Fernanda Gabriela Gadelha ROMERO 1

Módulo 4.Estruturas Organizacionais

Conversão Analógica Digital

Considerações no Projeto de Sistemas Cliente/Servidor

Sistemas Operacionais 1/66

ESTUDO PRELIMINAR SOBRE A ESCALABILIDADE DE UM ALGORITMO GENÉTICO PARALELIZADO COM OPENMP. Mateus Fontoura Gomes da Rosa Márcia C.

UNIVERSIDADE FEDERAL DE SANTA MARIA COLÉGIO TÉCNICO INDUSTRIAL DE SANTA MARIA Curso de Eletrotécnica

Seminário Computador Óptico

CENTRO UNIVERSITÁRIO ESTÁCIO RADIAL DE SÃO PAULO SÍNTESE DO PROJETO PEDAGÓGICO DE CURSO 1

Entenda as vantagens dos chips de quatro núcleos

Instalações Máquinas Equipamentos Pessoal de produção

Introdução à Eletrônica de Potência

Solução Integrada para Gestão e Operação Empresarial - ERP


INSTITUTO DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DE SERGIPE COORDENADORIA DE ELETRÔNICA CONTADORES

Computação Paralela. Desenvolvimento de Aplicações Paralelas João Luís Ferreira Sobral Departamento do Informática Universidade do Minho.

Roteamento e Comutação

Por Antonio Couto. Autor: Antonio Couto Enterprise Architect

Prof.: Gilberto Onodera

Conectores de derivação e distribuição de sinais e energia PRV e PPV

Virtualização: VMWare e Xen

Telemetria para Medição de Consumo Especificações Técnicas

Informática I. Aula 4. Aula 4-11/09/2006 1

CONFIRA UMA BREVE DESCRIÇÃO DAS VANTAGENS COMPETITIVAS OBTIDAS A PARTIR DE CADA META COMPETITIVA VANTAGEM DA QUALIDADE

Informática I. Aula 5. Aula 5-13/05/2006 1

Transcrição:

Arquiteturas Multi e Many cores baseadas em redes-em-chip Laboratório de Arquitetura e Redes de Computadores Departamento de Engenharia de Compuatação e Sistemas Digitais Escola Politécnica Universidade de São Paulo 17 de Fevereiro de 2012

Outline 1 Motivação 2 3 4

Multicore NoC Motivação

Multicore NoC Motivação Por que paralelizar?

Lei de Moore Motivação Multicore NoC Figure: Lei de Moore observada até 2010 1 1 The Mythology of Moore s Law (Tom R. Halfhill)

Lei de Moore Motivação Multicore NoC Dois fatores permitiram a observância da Lei de Moore: Redução do tamanho do transistor Diminuição do custo de produção Ambos alcançados graças a melhoria tecnológica na indústria de semicondutores.

Efeitos da lei de Moore Motivação Multicore NoC A redução do tamanhao do transistor impactou muitos aspectos de circuitos integrados: Possibilitou o aumento da frequência (menores atrasos em trilhas mais curtas) Aumentou a densidade superficial de transistores num CI Diminuiu o consumo energético por transistor (se levada em conta apenas a redução de tamanho)

Efeitos da lei de Moore Motivação Multicore NoC Alguns efeitos indesejáveis derivaram dos iniciais: Aumento da potência dissipada (quadrático com o aumento da frequência) Aumento no aquecimento do CI (pelo aumento da densidade e da potência dissipada) Aumento da complexidade do circuito (maior número de componentes) Este último aumentou o tempo de projeto de um novo núcleo, tendo impactos em custo e desempenho industrial

Outro problema Motivação Multicore NoC Figure: Gap entre frequência relativa de processadores e memórias 2 2 www.mentor.com/products/fv/success/sun_0-in_css_4-06

Então, por que paralelizar? Multicore NoC Melhor distribuição espacial dos componentes Núcleos de processamento mais simples Mesmo desempenho obtido com a mesma frequência

Multicore NoC Motivação Por que afinal redes-em-chip?

Primeiras soluções de paralelização Multicore NoC Figure: Topologia em bus 3 3 http://www.ece.unm.edu/~jimp/611/slides/chap8_1.html

Problemas Motivação Multicore NoC Controle de acesso ao bus complexo Solução pouco escalável Saturação rápida do acesso a memória

Solução oposta Motivação Multicore NoC Figure: Topologia full crossbar 4 4 http://www.cs.colostate.edu/~cs551/coursenotes/

Problemas Motivação Multicore NoC Excesso de pontos de controle Alto custo

Multicore NoC Ideia Aplicar conceitos de redes de computadores na comunicação intrachip.

Definição Elementos Topologias Vantagens NoC vs Redes Redes-em-chip - conceitos básicos

Definição Elementos Topologias Vantagens NoC vs Redes Redes-em-chip - conceitos básicos Definição

Definição Elementos Topologias Vantagens NoC vs Redes Redes-em-chip (Network-on-chip ou NoC) Abordagem para comunicação entre diversas unidades de processamento e de memória em um chip Usa conceitos de redes de computadores para a comunicação Solução intermediária entre uma topologia bus e uma topologia Elementos são ligados através de uma rede de switches e trocam mensagens full crossbar

Definição Elementos Topologias Vantagens NoC vs Redes Redes-em-chip - conceitos básicos Principais elementos

Definição Elementos Topologias Vantagens NoC vs Redes Elementos principais PEs ou unidades de processamento são unidades ativas, que iniciam um ciclo de comunicação (por isso chamados de iniciadores ou mestres) Memórias são unidades passivas, recebem mensagens de leitura e/ou escrita e respondem com o dado (no caso da leitura) Switches realizam o roteamento das mensagens

Definição Elementos Topologias Vantagens NoC vs Redes Redes-em-chip - conceitos básicos Topologias

Definição Elementos Topologias Vantagens NoC vs Redes Malha ou Mesh e Torus Figure: Topologia 1d-Mesh Figure: Topologia 1d-Mesh Figure: Topologia 2d-Mesh Figure: Topologia 2d-Mesh

Definição Elementos Topologias Vantagens NoC vs Redes Árvores Figure: Topologia Fattree com canais ponderados Figure: Topologia Butterfly

Definição Elementos Topologias Vantagens NoC vs Redes Redes-em-chip - conceitos básicos Vantagens

Definição Elementos Topologias Vantagens NoC vs Redes Vantagens no uso de NoCs Bom custo/benefício em termos de custos e desempenho Possível criar NoCs mais eficientes ou menos custosas Flexibilidade e adaptabilidade à solução (NoCs específicas para problemas específicos) Permite facilmente a utilização de multiplos domínios de clock, tais quais soluções globalmente assíncrona mas localmente síncrona (GALS).

Definição Elementos Topologias Vantagens NoC vs Redes Exemplos Figure: Um exemplo de NoC com os componentes ao redor a Figure: Abordagem heterogênea b a http://www.design-reuse.com/articles/24448 b http://i.cmpnet.com/embedded/europe/arteris

Definição Elementos Topologias Vantagens NoC vs Redes Redes-em-chip - conceitos básicos Diferenças para redes tradicionais

Definição Elementos Topologias Vantagens NoC vs Redes Vantagens Comparando com as redes de computadores tradicionais, NoCs possibilitam algumas simplificações, pois: Rede estática (não há adições ou remoções de nós) Não há mobilidade Fluxos sempre começam nos PEs (Em geral) cada meio é acessado por apenas 1 unidade (PE, switch ou memória)

Definição Elementos Topologias Vantagens NoC vs Redes Requisitos Em compensação, alguns requisitos adicionais são verificados: Tempo de roteamento muito curto (alguns ciclos de relógio) Área de silício pequena (dezenas de gates) Baixo consumo energético

ReNoC Indústria

ReNoC Indústria Redes-em-chip reconfiguráveis

ReNoC Indústria The ReNoC Reconfigurable Network-on-Chip: Architecture, Configuration Algorithms, and Evaluation (Matthias Bo Stuart, Mikkel Bystrup Stensgaard, Jens Sparsø) Proposta de NoC para computação de propósito geral Apresenta algoritmos de síntese para topologia específica para aplicação A arquitetura gerada permite melhora de eficiência e redução no consumo de energia

ReNoC Indústria Redes-em-chip na indústria

Intel Single-chip Cloud Computer ReNoC Indústria http://techresearch.intel.com/projectdetails.aspx?id=1 48 processadores 24 roteadores 4 memórias DDR

ReNoC Indústria Intel Teraflops Research Chip http://techresearch.intel.com/projectdetails.aspx?id=151 80 núcleos com 2 FPU cada Topologia 2d mesh Frequência de operação 3, 16GHz Potência consumida 62W (comparável a um processador tradicional de hoje) 1, 01 Teraflop (Core i7 980-X Extreme Edition atinge 20 Gigaflops, com 130W )!!!!

DSE SimuEmu Generalidade Programação Trabalhos

DSE SimuEmu Generalidade Programação Trabalhos Exploração do espaço de projeto

DSE SimuEmu Generalidade Programação Trabalhos Exploração do espaço de projeto O número de parâmetros a serem regulados num NoC é grande O número de objetivos conflitantes (tamanho, custo, desempenho, potência, temperatura,... ) também O emprego de técnicas de DSE tem se tornado constante para otimizar NoCs Esses processos, no entanto, são custosos em tempo É preciso encontrar alternativas viáveis para a otimização

DSE SimuEmu Generalidade Programação Trabalhos Simulação x Emulação

DSE SimuEmu Generalidade Programação Trabalhos Simulação é possível? Os designs crescentes tem desencorajado o uso de simulação Computadores atuais não conseguem simular em tempo hábil designs com muitos núcleos Simulações em alto nível são uma alternativa, mas são imprecisas Outra alternativa é a emulação, mas plataformas multi-fpgas grandes são necessárias

DSE SimuEmu Generalidade Programação Trabalhos Um NoC para computação de propósito geral?

DSE SimuEmu Generalidade Programação Trabalhos A maior parte das abordagens são otimizadas para aplicações específicas Seria possível um NoC absolutamente geral para um PC? O uso de benchmarks paralelos padronizados poderia fazer o serviço Mas não existe um benchmark paralelo genérico

DSE SimuEmu Generalidade Programação Trabalhos Como programar para arquiteturas paralelas heterogêneas?

DSE SimuEmu Generalidade Programação Trabalhos Uma programação eficiente exige conhecimento da arquitetura Mas arquiteturas customizáveis estão surgindo com NoCs Além do mais, as abordagens propostas permitem uma adequação da arquitetura à tarefa Como lidar com essa lógica invertida? Ou como criar compiladores genéricos o bastante para uma arquitetura qualquer?

DSE SimuEmu Generalidade Programação Trabalhos Trabalhos Recentes

DSE SimuEmu Generalidade Programação Trabalhos Propostas recentes na literatura Simulação com ns2 QoS em NoCs (QNoC) Reconfiguração dinâmica de NoCs (BiNoC) Tolerância a falhas Roteamento adaptativo (DyAD)

NoCs parecem uma ótima solução para o problema de comunicação intrachip Não existe um NoC definitivo Muitos desafios pela frente Soluções comerciais próximas (e necessárias)

Questões?