Processador ARM Cortex-A9



Documentos relacionados
Os textos nestas caixas foram adicionados pelo Prof. Joubert

Arquitetura e Organização de Computadores 2

Técnicas de Manutenção de Computadores

Arquitetura e Organização de Computadores 2. Apresentação da Disciplina

Pipelining. Professor: Carlos Bazilio. Pólo Universitário rio de Rio das Ostras

Bits internos e bits externos. Barramentos. Processadores Atuais. Conceitos Básicos Microprocessadores. Sumário. Introdução.

29/3/2011. Primeira unidade de execução (pipe U): unidade de processamento completa, capaz de processar qualquer instrução;

SSC510 Arquitetura de Computadores. 12ª aula

Arquitetura de Von Neumann e os Computadores Modernos

William Stallings Arquitetura e Organização de Computadores 8 a Edição. retrospectiva Pearson Prentice Hall. Todos os direitos reservados.

Infraestrutura de Hardware. Memória Virtual

Universidade Federal do Rio de Janeiro Pós-Graduação em Informática IM-NCE/UFRJ. Pipeline. Gabriel P. Silva. Microarquitetura de Alto Desempenho

O hardware é a parte física do computador, como o processador, memória, placamãe, entre outras. Figura 2.1 Sistema Computacional Hardware

Arquitetura de Computadores - Revisão -

Arquitetura de Computadores I

Sistemas Computacionais II Professor Frederico Sauer

Organização e Arquitetura de Computadores

Capítulo 8 Arquitetura de Computadores Paralelos

Microprocessadores. Cap. 2 Microprocessador, operação de hardware e computação

28/9/2010. Paralelismo no nível de instruções Processadores superescalares

Componentes básicos de um sistema computacional. Cap. 1 (Stallings)

Introdução a Informática. Prof.: Roberto Franciscatto

Evolução das CPUs: Dual e Quad Core

Guilherme Pina Cardim. Relatório de Sistemas Operacionais I

Arquitetura e Organização de Computadores. Capítulo 0 - Introdução

Arquitetura e Organização de Computadores. Capítulo 0 - Introdução

Evolução dos Processadores

Paralelismo. Computadores de alto-desempenho são utilizados em diversas áreas:

28/3/2011. Família Intel 80x86. Arquitetura dos Processadores Intel 80x86

3/9/2010. Ligação da UCP com o barramento do. sistema. As funções básicas dos registradores nos permitem classificá-los em duas categorias:

Estrutura e funcionamento de um sistema informático

Ao longo do presente capítulo será apresentada uma descrição introdutória da tecnologia FPGA e dos módulos básicos que a constitui.

Visão Geral de Pipelining

Capítulo 2 (Livro Texto*) - Notas de Aula - Parte II

Edeyson Andrade Gomes

periféricos: interfaces humano-computador (HCI) arquivo de informação comunicações

Sistemas Operacionais

Unidade Central de Processamento (CPU) Processador. Renan Manola Introdução ao Computador 2010/01

Disciplina: Introdução à Informática Profª Érica Barcelos

Microarquiteturas Avançadas

ANHANGUERA EDUCACIONAL. Capítulo 2. Conceitos de Hardware e Software

Capítulo 4. MARIE (Machine Architecture Really Intuitive and Easy)

Microprocessadores II - ELE 1084

ARQUITETURA DE COMPUTADORES

Introdução aos Sistemas Operativos

Prof. Marcos Ribeiro Quinet de Andrade Universidade Federal Fluminense - UFF Pólo Universitário de Rio das Ostras - PURO

Exemplo: CC1 CC2 CC3 CC4 CC5 CC6 CC7 CC8 CC9 ADD $s0, $t0, $t1 IF ID EX MEM WB SUB $t2, $s0, $t3 IF Stall Stall ID EX MEM WB

Tecnologias de Construção de Memórias e Memórias RAM, entrelaçada e Virtual

ORGANIZAÇÃO DE COMPUTADORES MÓDULO 8

Organização e Arquitetura de computadores

Organização e Arquitetura de Computadores I

Estrutura geral de um computador

Capítulo 1 Introdução

Gerência de Entrada/Saída

O que é Arquitetura de Computadores?

ARQUITETURA E ORGANIZAÇÃO DE COMPUTADORES ARQUITETURAS RISC E CISC. Prof. Dr. Daniel Caetano

Sistemas Operacionais

Processador ( CPU ) E/S. Memória. Sistema composto por Processador, Memória e dispositivos de E/S, interligados por um barramento

Introdução ao Processamento Paralelo

Unidade 4 Paralelismo em Nível de Instrução. Filipe Moura de Lima Gutenberg Pessoa Botelho Neto Thiago Vinícius Freire de Araújo Ribeiro

O Hardware Dentro da Unidade do Sistema

Sistemas Operacionais. Prof. M.Sc. Sérgio Teixeira. Aula 03 Conceitos de Hardware e Software parte 01. Cursos de Computação

Unidade 13: Paralelismo:

Sistemas Processadores e Periféricos Aula 9 - Revisão

Arquitecturas Alternativas. Pipelining Super-escalar VLIW IA-64

Conceitos Básicos. Conceitos Básicos Memória

Tais operações podem utilizar um (operações unárias) ou dois (operações binárias) valores.

Organização e Arquitetura de Computadores. Capítulo 13 Paralelismo no nível de instruções

Capacidade = 512 x 300 x x 2 x 5 = ,72 GB

MEMÓRIA. 0 e 1 únicos elementos do sistema de numeração de base 2

SIS17-Arquitetura de Computadores

ARQUITETURA DE COMPUTADORES

Sistemas Operacionais: Sistema de Arquivos

Microprocessadores II - ELE 1084

Fundamentos em Informática

A história do Processadores O que é o processador Características dos Processadores Vários tipos de Processadores

Arquitetura de Computadores - Processadores Superescalares. por Helcio Wagner da Silva

Sistemas Operativos I

Capítulo 4 Livro do Mário Monteiro Introdução Hierarquia de memória Memória Principal. Memória principal

Memória. Espaço de endereçamento de um programa Endereços reais e virtuais Recolocação dinâmica Segmentação

AULA 1. Informática Básica. Gustavo Leitão. Disciplina: Professor:

CPU - Significado CPU. Central Processing Unit. Unidade Central de Processamento

Universal Serial Bus USB

Máquinas Multiníveis

Arquiteturas RISC. (Reduced Instructions Set Computers)

Introdução à Arquitetura de Computadores

BARRAMENTO DO SISTEMA

Memória principal; Unidade de Controle U C P. Unidade Lógica e Aritmética

Introdução à Organização de Computadores. Sistemas da Computação Prof. Rossano Pablo Pinto, Msc. rossano at gmail com 2 semestre 2007

Introdução à Organização de Computadores. Execução de Programas Prof. Rossano Pablo Pinto, Msc. rossano at gmail com 2 semestre 2007

SIS17 - Arquitetura de Computadores. Introdução (Parte III)

Arquitetura de Computadores. Professor: Vilson Heck Junior

Arquitetura de Computadores RISC x CISC. Gustavo Pinto Vilar

AULA4: PROCESSADORES. Figura 1 Processadores Intel e AMD.

Processadores. Prof. Alexandre Beletti Ferreira

PROJETO LÓGICO DE COMPUTADORES Prof. Ricardo Rodrigues Barcelar

Sistemas Operacionais Carlos Eduardo Portela Serra de Castro

Transcrição:

Erick Nogueira Nascimento (032483) Franz Pietz (076673) Lucas Watanabe (134068) 11 de junho de 2012

Introdução Alto desempenho e economia de energia Arquitetura ARMv7-A Características do processador super-escalável multi-issue pipeline de 8 estágios com especulação execução out-of-order caches L1 com tamanho configurável versões single e multicore Aplicações: celular, tablets, video-games, etc.

Micro Arquitetura Versões Cortex-A9: single core Cortex-A9 MPCore: multicore (2 ou 4 núcleos) Detalhes Superescalar com escalonamento dinâmico Multi-issue Pipeline de 8 estágios com especulação Out-of-order Cache L1 é quatro-associativa de 16, 32 ou 64KB

Micro Arquitetura Consumo de Energia Clock variável (Apple A5) Desligamento de núcleos (OMAP4400 da Texas Instruments)

Cortex-A9 Single Core - Arquitetura

Cortex-A9 Single Core Pipeline Avançado processamento de fetch e predição de branch Prefetching de até quatro instruções Fast-loop Pipeline out-of-order Executa até duas instruções aritméticas completas e duas de load-store, Resolve um branch a cada ciclo. Em média instruções comuns: 9 ciclos instruções complexas: 11 ciclos

Cortex-A9 Single Core - Pipeline

Cortex-A9 Single Core Renomeação de registradores Explícita: mapeamento dos 32 registradores arquiteturais (visíveis ao programador) para os 56 registradores físicos (não visíveis ao programador). Vantagens: remoção dos hazards WAW (write-after-write) e WAR (write-after-read) no pipeline. desdobramento completo de loops pequenos por hardware.

Cortex-A9 Single Core - Renomeação

Cortex-A9 Single Core Hierarquia de memória Cache L1 dividida em I e D (Instruções e Dados) 16KB, 32KB ou 64KB Cache L2: controlador externo (PrimeCell PL310) Razão síncrona de ½ clock, reduzindo a latência Até 8 MB 4-associativa e 16-associativa Suporta paridade e memórias RAMs com correção de erros (ECC)

Cortex-A9 Single Core TLB dois níveis Micro TLB duas TLBs, I e D, a primeira tem 32 entradas, e a segunda tem 32 ou 64 entradas. completamente associativa consulta sua tabela de endereços virtuais para endereços físicos em um único ciclo de clock. Main TLB array de 4 elementos completamente associativo estrutura 2-associativa com 2x32, 2x64, 2x128 e 2x256 entradas.

Cortex-A9 MPCore Cada processador pode ter uma quantidade de cache L1 específica, FPU ou qualquer outro componente diferente do outro núcleo Snoop Control Unit: responsável pela interconexão, como árbitro, comunicação, transferência entre os caches e a memória e todas as funções necessárias para garantir o funcionamento coerente e correto Accelerator Coherence Port (ACP) para coerência de cache

Cortex-A9 MPCore - Arquitetura

Cortex-A9 MPCore - Snoop Control Unit

Características Avançadas Gerenciamento de Energia Previsão de desvio e de retorno de função precisos Uso de caches fisicamente endereçáveis Uso de micro TLBs (um dos dois níveis de TLB) Loops de instrução que são menores do que 64B podem ser executados sem acessos adicionais a cache (além do misses compulsórios) Modos: Run Mode; Standby, Dormant, Shutdown Cada núcleo pode estar em um modo de energia diferente

Características Avançadas Advanced Bus Interface Unit MPCore Até 16 transações de barramento pendentes por processador (núcleo) Transferências de cache L1 para cache L1 diretas Suporte a razão de barramento de meio-clock, síncrona e de baixa latência

Comparação com Cortex-A8 Características gerais Antecessor do Cortex-A9 Vendido como IP: hard IP cores: alto desempenho (tempo ou energia), baixa flexibilidade de configuração soft IP cores: desempenho em geral inferior ao hard, maior flexibilidade Duas instruções por ciclo de clock Clock rate máximo de 1GHz

Comparação com Cortex-A8 Hierarquia de Memória - Cache L1 Par de caches, I e D (Instrução e Dados) 16KB ou 32KB, com blocos de 64B 4-associativa Way-prediction Random replacement Virtualmente indexada Fisicamente tagged Latência: 1 ciclo para hazards do tipo load-use.

Comparação com Cortex-A8 Cache L2 Opcional 128KB a 1MB, com blocos de 64B Organizada em 1 a 4 bancos, permitindo transferências concorrentes Fisicamente indexada e tagged O barramento entre cache L2 e memória pode ser de 64 ou 128bits

Comparação com Cortex-A8 TLB Um nível, e é composta por duas TLBs, I e D Completamente associativas, com 32 entradas Política de substituição round-robin Tamanhos de página para o sistema de memória virtual: 4KB, 16KB, 64KB, 1MB ou 16MB.

Comparação com Cortex-A8 Pipeline 2 instruções por ciclo Superscalar Escalonamento estático CPI médio de 2 ( pipeline stall cycles são o fator preponderante) Previsão de desvio em dois níveis Branch target buffer com 512 entradas, história global de 4K Return stack com 8 entradas

Comparação com Cortex-A8 Comparação Escalonamento estático X escalonamento dinâmico Cortex-A9 é mais rápido por um fator de 1.28 (em média) As medidas (simulações) de desempenho de ambos os processadores foram realizadas com a versão single-core do Cortex-A9 com a mesma taxa de clock e o mesmo tamanho de cache A cache L1 do A8 é de 32KB e a L2 tem 1MB, sendo 8-associativa no A8 e 16-associativa no A9 Melhor desempenho do Cortex-A9 devido ao escalonamento dinâmico, pipeline de multiplicação mais sofisticado, além de um previsor de desvio, uma cache L1 não bloqueante e um prefetch de instrução mais poderosos.

Evolução desde o ARM1136 até o Cortex-A9