ANÁLISE DE DESEMPENHO DAS TOPOLOGIAS PARA SISTEMAS SOC

Documentos relacionados
Avaliação de Topologias de Redes-em-Chip usando Simulação de Sistemas Completos e Aplicações Paralelas

ESPECIFICANDO FORMALMENTE TOPOLOGIAS PARA REDES EM CHIP SPECIFYING FORMALLY TOPOLIGIES FOR NETWORK ON CHIP

Aula 3 Redes de Interconexão

Arquiteturas de Computadores. Programa de Pós-Graduação em Ciência da Computação. Plano da aula

Topologias de Arquiteturas de Comunicação

MODELAGEM DE TRANSISTORES E DE CIRCUITOS ANALÓGICOS CMOS USANDO VERILOG-AMS

VALIDAÇÃO DA REDUÇÃO DO CONSUMO DE POTÊNCIA EM NOC UTILIZANDO ESQUEMAS DE CODIFICAÇÃO

Análise de Desempenho de Topologias para Redes em Chip

Proposta e Avaliação de uma Rede-em-Chip Programável

Universidade Federal de Pernambuco

Visualização Distribuída utilizando Agrupamentos de PCs 10

Implementação de Canais Virtuais em Redes em Chip

Análise de Desempenho de Estratégias de Particionamento de Grafos

SSC0112 Organização de Computadores Digitais I - Turma 2

Avaliação de Desempenho de Redes-em-Chip Sem Fio Single-Hop com NAS Parallel Benchmarks

PALMS - Um Protocolo Simplificado de Multicast na Camada de

Arquiteturas Paralelas

Uma Arquitetura Reconfigurável de Granularidade Grossa Para Multicore

MODELAGEM E OTIMIZAÇÃO DE SOFTWARE AUTOMOTIVOS PROPOSTA DE TRABALHO DE GRADUAÇÃO

( X ) SEMESTRAL - ( ) ANUAL

Implementação de uma plataforma MP-SoC baseada em NoC com solução de diretório para manutenção da coerência de cache

ARQUITETURA DE SISTEMAS DISTRIBUÍDOS. Aula 1- Introdução aos Sistemas Distribuídos

Escalonamento de Aplicações BoT em Ambiente de Nuvem

Arquitetura de núcleo distribuído utilizando o sistema de switch central Z9000. Uma Nota Técnica da Dell

Um Servidor Escalável para Bases Massivas de

AULA 03: PROCESSAMENTO PARALELO: MULTIPROCESSADORES

PROJETO DE UM MODELO DE UM CONVERSOR ANALÓGICO DIGITAL PARA SOC S

Organização Básica de Computadores. Organização Básica de Computadores. Organização Básica de Computadores. Organização Básica de Computadores

30/5/2011. Sistemas computacionais para processamento paralelo e distribuído

Sumário. Introdução a SoCs. Introdução a SoCs. Introdução a SoCs. Introdução a SoCs. Systems on Chips Multiprocessados: MPSoCs

Universidade Federal do Rio de Janeiro Informática DCC/IM. Arquitetura de Computadores II. Arquiteturas MIMD. Arquiteturas MIMD

SSC0611 Arquitetura de Computadores

SSC0611 Arquitetura de Computadores

Modelagem e Simulação de Mecanismos de Sincronização entre Unidades Reconfiguráveis para Projeto Baseado em Redes em Chip

Organização e comunicação em plataformas paralelas

AVALIAÇÃO DE DESEMPENHO EM UMA NOC DE UMA APLICAÇÃO DISTRIBUÍDA UTILIZANDO UM MIDDLEWARE JAVA

PROCESSAMENTO E ANÁLISE DE IMAGENS DE MICROARRANJOS DE DNA

Avaliação de Desempenho de Sistemas Operacionais em dispositivos embarcados para a provisão de serviços em Internet das Coisas

Organização e Arquitetura de Computadores I

Introdução. Redes de Interconexão - Prof a Luiza Mourelle 1

AVALIAÇÃO DE DESEMPENHO DO PROTOCOLO HWMP EM CENÁRIOS REAIS DE REDES MESH COM MÚLTIPLAS INTERFACES E MÚLTIPLOS CANAIS

TOPOLOGIAS. A avaliação das topologias são baseadas em critérios que objetivam fornecer parâmetros de eficiência e praticidade.

Redes P2P Gnutella e Simuladores

PROCESSADORES Unidade de Controle Unidade Aritmética e Lógica efetua memória de alta velocidade registradores Program Counter Instruction Register

PLANO DE ENSINO. Disciplina

UNIVERSIDADE LUSÍADA DE LISBOA. Programa da Unidade Curricular ARQUITECTURA DE COMPUTADORES Ano Lectivo 2013/2014

Encaminhamos a versão revisada do artigo com número de submissão

Arquitecturas Avançadas de Computadores MEEC (2008/09 2º Sem.)

Figura 1: Arquitetura MPSoC baseada em NoC, adaptado de (RUARO et al., 2016)

UNIVERSIDADE FEDERAL DE UBERLÂNDIA UFU

Arquitetura de Computadores

ANÁLISE COMPARATIVA DAS REDES DE INTERCONEXÃO CROSSBAR E DELTA. João Angelo Martini* *

Redes de Computadores

Tópicos Especiais em Redes de Telecomunicações

Projeto em VHDL de um Processador de Rede Intra-Chip

Aula 1 Conceitos Básicos

Programação de Sistemas Distribuídos e Concorrência

Universidade Federal do Rio de Janeiro Pós-Graduação em Informática. Introdução. Gabriel P. Silva. Gabriel P. Silva

Algoritmos Distribuídos para Roteamento em Redes Ad Hoc

Avaliação de consumo de potência no processador MIPS

Introdução à Computação

Leandro da Silva Freitas. Projeto em Nível RT de IPs Digitais

Predição de Utilização de Recursos Computacionais Usando Séries Temporais

27/05/2014 REDES LOCAIS

FUNDAMENTOS DE REDES DE COMPUTADORES. Lista de Exercícios AV1-01. Luiz Leão

Aula 2 Topologias de rede

Disciplina de. Organização de Computadores Digitais

Disciplina de. Organização de Computadores Digitais

Introdução às Redes de Computadores. Prof. Leonardo Barreto Campos

Descobrindo a Computação Ubíqua

Ministério da Educação Universidade Tecnológica Federal do Paraná Câmpus Campo Mourão Diretoria de Relações Empresariais e Comunitárias DECLARAÇÃO

Organização de Computadores I

ARQUITETURA E ORGANIZAÇÃO DE COMPUTADORES. Prof. Gabriel Campos camposg.com.br

Topologias de redes de computadores

Arquiteturas. capítulo

Desenvolvimento de Ferramentas no igeom: Utilizando a Geometria Dinâmica no Ensino

speedup aprimorado aprimorado Fração aprimorada speedup aprimorado Fração aprimorada speedup aprimorado Tempo original Fração aprimorada aprimorado

Prof. Samuel Henrique Bucke Brito

SSC510 Arquitetura de Computadores. 8ª aula

Disciplina de Organização de Computadores Digitais

Análise do Tráfego Interno em uma Rede-em-Chip por meio de Simulação

INTRODUÇÃO À TECNOLOGIA DA INFORMAÇÃO CONCEITO DE REDE DE COMPUTADORES PROFESSOR CARLOS MUNIZ

SSC0611 Arquitetura de Computadores

Computadores. HW e SW

UM FRAMEWORK DE CONECTIVIDADE PARA APLICAÇÕES MÓVEIS EM JAVA ME

Avaliação de protocolo de coêrencia de cache utilizando protótipos virtuais

CoROA: Algoritmo para Coleta de Dados em Redes de Sensores Aquáticas Óptico-Acústicas

Dispositivos de Interconexões de Redes de Computadores

Redes de Computadores

Influência do Compartilhamento de Cache L2 em um Chip Multiprocessado sob Cargas de Trabalho com Conjuntos de Dados Contíguos e Não Contíguos

Uma Abordagem de Gerenciamento Contextual de Recursos Dinâmicos em Ambientes Pervasivos: Estudo de Caso em Aplicações de Home Care

UMA HIERARQUIA DE MEMÓRIA PARA UM MODELO RTL DO PROCESSADOR RISC-V SINTETISÁVEL EM FPGA

William Stallings Arquitetura e Organização de Computadores 8 a Edição. Capítulo 1 Introdução

MODELAGEM DE UM CONVERSOR ESTÁTICO PARA APLICAÇÃO EM REDES DE DISTRIBUIÇÃO MONOFÁSICA 1

Subsistemas de E/S Device Driver Controlador de E/S Dispositivos de E/S Discos Magnéticos Desempenho, redundância, proteção de dados

UNIVERSIDADE LUSÍADA DE LISBOA. Programa da Unidade Curricular ARQUITECTURA DE COMPUTADORES Ano Lectivo 2014/2015

UNIVERSIDADE FEDERAL DE PERNAMBUCO. Análise da Eficiência da Codificação de Huffman em Extensões de Fontes de Informação

Proposta de Dissertação de Mestrado Mapeamento de Redes Virtuais no Substrato Físico

Transcrição:

ANÁLISE DE DESEMPENHO DAS TOPOLOGIAS PARA SISTEMAS SOC Bruno Cesar Puli Dala Rosa (PIBIC/CNPq/FA/Uem), Anderson Faustino Da Silva (Orientador), e-mail: bcesar.g6@gmail.com Universidade Estadual de Maringá / Departamento de informática /Maringá, PR. Área e subárea do conhecimento: Ciências Exatas e da Terra / Ciência da computação Palavras-chave: Arquitetura de computadores, Sistemas em Chip, Topologia de rede. Resumo: O número de produtos que utilizam o sistema SoC cresce rapidamente, devido à inovações na área. Um dos fatores mais importantes no desempenho destes sistemas é a implementação da interconexão entre os componentes no chip, implementações tradicionais vem caindo em desuso com a ascensão das arquiteturas NoC. Nesta nova abordagem a topologia aplicada ao projeto do sistema tem um impacto significativo na qualidade geral do mesmo. Esta pesquisa analisa o desempenho das topologias Butterfly, Clos, Mesh, MultiPath, Tree e PeerToPeer, propostas na literatura, por meio da modelagem em um simulador. Introdução Com o propósito de atender à alta demanda por desempenho computacional diversas estratégias são exploradas nos campos da área de Ciência da Computação. Dentre elas estão os projetos de arquiteturas paralelas, arquiteturas que contemplam mais de um núcleo de processamento. Aos chips que seguem a metodologia de design onde componentes já existentes são combinados em um só chip, dá-se o nome de Sistemas-em-chip (SoC) (SALEH e outros, 2006). Avanços na área vem possibilitando a fabricação de SoCs cada vez mais complexos e computacionalmente poderosos. A interconexão dos componentes nestas arquiteturas é um dos fatores cruciais para seu desempenho, implementações tradicionais da interconexão de componentes em chips consistem na utilização de barramentos e estruturas de barras transversais. Entretanto, tais abordagens apresentam limitações como problemas na latência e na largura da banda, tornando-as cada vez menos viáveis. Com o intuito de solucionar tais limitações, a evolução dos SoC trouxeram uma abordagem do uso de redes de interconexões de propósito

geral no chip (DALLY e TOWLES, 2001). Redes-em-chip (NoC) é uma rede de interconexão baseada no uso de roteadores para interconectar o alto número de componentes. O uso de NoCs permite que o uso de componentes em um único chip seja escalável e específico por meio de escolhas de projeto da topologia no chip. Materiais e métodos A literatura (DUATO e outros, 2003) apresenta as seguintes topologias: Butterfly: É uma topologia de múltiplos níveis onde cada nível possui o mesmo número de roteadores. Clos: Nesta topologia além dos roteadores finais aos quais os processadores estão conectados existe uma camada de roteadores intermediários que se conectam a todos os outros. Mesh: Uma topologia direta, onde todo roteador possui pelo menos um processador associado a ele. MultiPath: Os roteadores são organizados em conjuntos de seis roteadores onde quatro deles possuem processadores associados e os outros dois se conectam a roteadores de outros conjuntos. Tree: Implementa uma árvore binária de roteadores. PeerToPeer: A mais simples das topologias implementadas, onde todos os roteadores possuem processadores conectados a eles e cada roteador é conectado aos demais. Uma questão importante na implementação de NoCs é a quantidade de roteadores necessários. A Tabela 1 apresenta a quantidade de roteadores utilizados por cada topologia. Processadores Tabela 1 Quantidade de roteadores Roteadores Butterfly Clos Mesh MultiPath Tree PeerToPeer 8 16 7 4 6 7 4 16 40 7 8 12 15 8 32 96 13 16 24 31 16 Resultados e Discussão O desempenho de uma topologia está relacionado diretamente a latência necessária para entregar uma mensagem. Desta forma, este projeto analisa a latência de cada topologia para diferentes quantidades de processadores utilizando o padrão uniform_random para injeção de mensagem.

Para realizar a avaliação das topologias, cada uma é modelada no simulador Gem5 (BINKERT e outros, 2011). A Figura 1 apresenta os resultados obtidos para diferentes taxas de injeção. 8 Processadores 16 Processadores 0 10 20 30 40 50 Butterfly Clos Mesh MultiPath Tree Pt2Pt 0 20 40 60 80 100 120 140 Butterfly Clos Mesh MultiPath Tree Pt2Pt 32 Processadores 0 50 100 150 200 250 300 350 Butterfly Clos Mesh MultiPath Tree Pt2Pt

Figura 1 Gráfico de comparação entre os padrões A partir dos resultados obtidos é possível perceber uma diferença no padrão de latência dependendo da quantidade de processadores. Para arquiteturas com 8 processadores, a latência se mantém praticamente constante até uma taxa de injeção de 0.4. Porém quanto a quantidade de processadores aumenta, o crescimento da latência ocorre com uma taxa de injeção menor. De fato, dobrar a quantidade de processadores reduz a taxa pela metade. Além disto, os resultados demonstram que aumentar a quantidade de processadores acarreta em aumentar a latência da rede de interconexão. É importante destacar que aumentar a latência da rede de interconexão degrada o desempenho do sistema. Portanto, uma boa topologia é aquela que mantêm tal valor em um patamar menor, mesmo quando há o aumento da quantidade de processadores. As topologias Clos e MultiPath formam o extremo superior e o extremo inferior. Portanto, o desempenho das demais topologias se encontra entre o desempenho obtido por estas duas topologias. Como o objetivo é ter a menor latência possível, MultiPath é a melhor escolha. Conclusões Devido ao impacto da escolha da topologia no desempenho de SoCs, é importante projetar uma topologia capaz de reduzir a latência nas entregas de mensagens e consequentemente melhorar o desempenho do sistema. Este trabalho comparou o desempenho de diferentes topologias, em diferentes cenários simulados. Os resultados indicam que dentre as topologias Butterfly, Clos, Mesh, MultiPath, Tree e PeerToPeer, MultiPath é a que tem o melhor desempenho. Agradecimentos Agradeço ao CNPq e a UEM por possibilitarem este trabalho. Referências BINKERT, N., BECKMANN, B., BLACK, G., REINHARDT, S. K., SAIDI, A., BASU, A., HESTNESS, J., HOWER, D. R., KRISHNA, T., SARDASHTI, S., SEN, R., SEWELL, K., SHOAIB, M., VAISH, N., HILL, M. D., WOOD, D. A. "The gem5 simulator". ACM SIGARCH Computer Architecture News, vol. 39, no. 2, pp. 1-7, 2011.

DALLY, W. J., TOWLES, B. Route packets, not wires: on-chip interconnection networks, Proceedings of the 38th annual Design Automation Conference. Las Vegas, Nevada, EUA, 2001. DUATO, J., YALAMANCHILI, S., NI, L. M. Interconnection networks: an engineering approach. Morgan Kaufmann, 2003. SALEH, R., WILTON, S., MIRABBASI, S., HU, A., GREENSTREET, M., LEMIEUX, G., PANDE, P. P., GRECU, C., IVANOV, A. System-on-Chip: Reuse and Integration. Proceedings of the IEEE, Pullman, WA, EUA, 2006.