Notas de Aula Guilherme Sipahi Arquitetura de Computadores. Arquitetura de Computadores Modernos

Documentos relacionados
Organização de Computadores Digitais. Cap.10: Conjunto de Instruções: Modos de Endereçamento e Formatos

Organização de Sistemas de Computadores

Arquitetura de Computadores Aula 11 - Multiprocessamento

Execução detalhada de instruções

INTRODUÇÃO À TECNOLOGIA DA INFORMAÇÃO ORGANIZAÇÃO COMPUTACIONAL

Processadores. Principal função é executar programas armazenados na memória principal.

SSC0902 Organização e Arquitetura de Computadores

Arquitectura e Organização Interna de Computadores

Execução detalhada de instruções

Organização Básica de Computadores. Organização Básica de Computadores. Organização Básica de Computadores. Organização Básica de Computadores

OBJETIVOS DA AULA GESTÃO DE TECNOLOGIA DA INFORMAÇÃO

ORGANIZAÇÃO DE COMPUTADORES

Matemática / 1ª série / ICC Prof. Eduardo. Unidade 1: Fundamentos. 1 - Introdução ao Computador

Halliday & Resnick Fundamentos de Física

SSC0611 Arquitetura de Computadores

Dependência verdadeira de dados Dependência de recursos Dependência de ramo In-order issue Dynamic issue Vertical waste Horizontal waste Latência

Sistemas Operacionais. Conceitos de Hardware

3. VISÃO DE FUTURO E ESTRATÉGIA DE DESENVOLVIMENTO DE LONGO PRAZO

ARQUITETURA DE COMPUTADORES. Organização de Sistemas Computacionais. Prof.: Agostinho S. Riofrio

Variáveis e Tipo de Dados

Notas de Aula Guilherme Sipahi Arquitetura de Computadores

Descrição do serviço. Visão geral do serviço. Escopo dos serviços Copilot Optimize. Copilot Optimize CAA Escopo

Escola Básica e Secundária de Santa Maria. Ano Letivo 2017/2018. Informação Prova Especial de Avaliação. Tecnologias Específicas

Arquitetura e Organização de Processadores. Aula 1. Introdução Arquitetura e Organização

Introdução à UML. Mas usaremos apenas um sub-conjunto da UML

CPU. Funções: Componentes: Processamento; Controle. UC (Unidade de Controle); Registradores; ALU s, FPU s etc. Arquitetura de Computadores 3

Microarquiteturas Avançadas

Organização e Arquitetura de Computadores I

10. Escreva um programa que leia um texto e duas palavras e substitua todas as ocorrências da primeira palavra com a segunda palavra.

TESTES DE SOFTWARE.

Como Z constitui-se claramente a hipotenusa de um triângulo retângulo, tem-se

Substituição de descodificadores antigos

MINISTÉRIO DA EDUCAÇÃO CENTRO FEDERAL DE EDUCAÇÃO TECNOLÓGICA CELSO SUCKOW DA FONSECA CAMPUS PETRÓPOLIS

SIC Gerenciando Através s da Confiabilidade. Fabiana Pereira da Silva Vale

Infraestrutura de Hardware. Melhorando Desempenho de Pipeline Processadores Superpipeline, Superescalares, VLIW

Manual do Usuário Omnicarreta

Aula 8 Vetores e Ponteiros

ORGANIZAÇÃO E ARQUITETURA DE COMPUTADORES II AULA 02: PROCESSAMENTO PARALELO: PROCESSADORES VETORIAIS

XXVIII OLIMPÍADA BRASILEIRA DE MATEMÁTICA PRIMEIRA FASE NÍVEL 2 (7 a. e 8 a. Ensino Fundamental) GABARITO

Introdução à Organização de Computadores. Sistemas da Computação Prof. Rossano Pablo Pinto, Msc. rossano at gmail com 2 semestre 2007

TVDA - Tested, Validated, Documented Architectures. Arquitecturas de automação testadas e validadas para máquinas.

9º ANO PLANIFICAÇÃO A MÉDIO PRAZO

ALGORITMOS. Expressões e Instruções PrimiKvas. Alessandro J. de Souza DIATINF - IFRN. twi;er.

Actividade Laboratorial Física 12º Ano Condensador Plano

UNIVERSIDADE FEDERAL DE SANTA CATARINA DEPARTAMENTO DE ESTATÍSTICA E INFORMÁTICA BACHARELADO EM SISTEMAS DE INFORMAÇÃO DISCIPLINA DE PROJETOS I

Programa de Serviços Polycom Premier

SOLUÇÕES SOB MEDIDA PARA EMPRESAS INOVADORAS. CRESCIMENTO COM ÉTICA E COMPROMISSO SOCIAL.

Como ajustar o projeto para integrá-lo com o Moodle

PLANIFICAÇÃO A MÉDIO PRAZO

1. A pastilha do processador Intel possui uma memória cache única para dados e instruções. Esse processador tem capacidade de 8 Kbytes e é

1. O Programa. 2. Conteúdo programático

Universidade Federal do Rio de Janeiro Pós-Graduação em Informática. Introdução. Gabriel P. Silva. Gabriel P. Silva

COMPUTADORES COM UM CONJUNTO REDUZIDO DE INSTRUÇÕES. Adão de Melo Neto

Sistemas Operacionais. Adão de Melo Neto

ESTANQUEIDADE DETECÇÃO DE VAZAMENTOS NÃO VISÍVEIS DE LÍQUIDOS SOB PRESSÃO EM TUBULAÇÕES ENTERRADAS INSTRUÇÃO AO CANDIDATO - GERAL IT 088

28/8/13. Processadores. Introdução

CONCEITOS DOS SISTEMAS (DE LÓGICA) FORMAIS: AXIOMAS: são wffs cujas verdades são evidentes, isto é, que sã evidentemente verdadeiras

Especificação do Trabalho 1 NetMap

Universidade Federal do Rio de Janeiro Bacharelado de Ciência da Computação. Arquitetura de Computadores I. RISC versus CISC

Unidade de Controlo Hardwired

AULA 03: FUNCIONAMENTO DE UM COMPUTADOR

Fundamentos de Informática

Organização e Arquitetura de Computadores I

Cálculo do Valor Acrescentado (VA) no Aves

2. Na guia Animações da faixa de opções, no grupo Animação, clique em Mais e selecione a animação desejada.

Arquitetura e Organização de Processadores. Aula 4. Pipelines

O Funcionamento do Processador

PROCESSADORES Unidade de Controle Unidade Aritmética e Lógica efetua memória de alta velocidade registradores Program Counter Instruction Register

No final do trabalho são apresentadas algumas medidas de desempenho do sistema, com e sem o processador acoplado.

PLANIFICAÇÃO A MÉDIO PRAZO

PLANIFICAÇÃO A MÉDIO PRAZO

Sâmia Rodrigues Gorayeb. Arquitetura de Computadores Processadores

Fundamentos de Informática 1ºSemestre

Arquitetura de Computadores. Prof. João Bosco Jr.

Arquiteturas RISC e CISC. Adão de Melo Neto

Módulos de Expansão para Microcontroladores

Algoritmos e Estruturas de Dados 1 Lista de Exercícios 2

Escola Politécnica da Universidade de São Paulo Departamento de Engenharia de Sistemas Eletrônicos - PSI. PSI Projeto de Sistemas Integrados

RISC X CISC - Pipeline

ELT042 - PBL2. Prof. Rodrigo Maximiano A. Almeida Prof Rodrigo de Paula Rodrigues Universidade Federal de Itajubá

Primeira etapa Importância e Diferenças

METODOLOGIA DE ESTUDO E PESQUISA. Profª. Drª. Cenidalva Teixeira ETAPAS DA PESQUISA CIENTÍFICA

DECISÃO EM RECURSO ADMINISTRATIVO N 001- PE 015/2013

Manual de BRB FERRAMENTA DE INTERCÂMBIO ELETRÔNICO DE DADOS. BRB Banco de Brasília SA

Manual de Instalação

Universidade Luterana do Brasil Faculdade de Informática. Disciplina de Engenharia de Software Professor Luís Fernando Garcia

01/03/2015 GP III 1. Tópicos. O T&D é uma das mais poderosas ferramentas de transformação nas organizações.

4 MÉTODO DE CONTROLE DE CUSTOS

o Coesão e Coerência textuais a partir da especificidade do gênero.; Componentes Curriculares por módulo Módulo I Componentes Curriculares

Sugestões para Escrita de Artigos Científicos

Observadores de Estado

Organização e Arquitetura de Computadores. Leslier S. Corrêa

Plano de curso Inspeção de escavadeira Hidráulica de pneus

O Funcionamento do Processador

Procedimento do U.S.HCM/6thEd (2016)

PROCESSADORES SUPERESCALARES FELIPE G. TORRES

1. DO PROCESSO SELETIVO

Plano de curso Inspeção de escavadeira hidráulica de esteira

Transcrição:

Ntas de Aula Guilherme Sipahi Arquitetura de Cmputadres Arquitetura de Cmputadres Mderns Passs da execuçã de um prgrama: 1. Fetch (busca) da nva instruçã da memória p/ registr. 2. PC (prgram cunter) apnta p/ nva instruçã. 3. Determinaçã d tip de instruçã buscada em (1.) 4. Se a instruçã usa uma palavra da memória, determinar ande ela está 5. Se necessári, buscar a palavra na memória 6. Executar a instruçã 7. Vltar p/ 1. - Esses passs dependem da linguagem de máquina d prcessadr. Esta linguagem pde ser implementada diretamente via "hardware" (cmpnentes eletrônics) u via prgrama chamad interpretadr que transfrma essas instruções em um cnjunt de instruções em um cnjunt de instruções mais simples que pdem ser executadas pr um 'hardware' mais simples de ser cnstruíd. - Instruções mais lngas sã mais "caras" para serem implementadas n hardware, prém quand implementadas prvêm ganhs de perfrmance: Busca de cnjunts mais pderss, e mais cmplexs, de instruções. instruções específicas p/ pnt flutuante suprte diret a acess de elements de matrizes uma única instruçã timizada para substituir cnjunts de instruções que aparecem sempre em sequência. - O cust para implementar via hardware estas instruções é alt, justificável apenas p/ high perfrmance cmputer. - O cust de manter cmputadres c/ cnjunts de instruções diferentes também é "alt". Prgramas para um cmputadr nã rdam em utr. Saída: Família de Prcessadres High-End: instruções pr hardware (cnjunt cmplet) Lw-End: interpretadr p/ transfrmar cnjunt cmplet de instruções em instruções mais simples p/ um hardware mais simples. - IBM intrduz term "Arquitetura" p/ descrever este nível de cmpatibilidade. - Vantagens d cmputadr cm instruções interpretadas: Habilidade p/ crrigir instruções incrretamente implementadas, u ainda, para mascarar deficiência de design n hardware básic. Pssibilidade de incluir nvas instruções a um cust mínim, mesm depis da entrega d cmputadr. Design estruturad permite desenvlviment, teste e dcumentaçã eficientes das instruções cmplexas.

- Ns ans 70 praticamente tds s cmputadres eram interpretads. - High end: DEC VAX - várias centenas de instruções - Lw end: 780, Mtrla 6800 (prcessadres de 8 bits cm instruções interpretadas. - Detalhes técnics favreciam também a interpretaçã: Cntrl stres - ROM's rápidas usadas p/ armazenar as micrinstruções. - Um mtrla 6800 interpretava 1 micrinstruções em 100 ns, e uma instruçã típica tinha 10 micrinstruções. Já acess à memória durava 500 ns. Execuçã direta: 1 μs (1 MHz) Execuçã interpretada: 2 μs (ba relaçã cust benefíci) Execuçã de 10 micrinstruções: 6 μs RISC x CISC 1980 - Berkeley: Pattersn e Sequin - RISC (SPARC) 1981 - Stanfrd: Hennessy - MIPS (MIPS) - Em fase inicial: instruções simples p/ serem executadas rapidamente. - Transfrmu-se em: prjetar instruções que pderiam ser iniciadas rapidamente. "Quã lnga é uma instruçã é um fatr mens imprtante d que quantas instruções pdem ser iniciadas pr segund." Primeiras máquinas RISC X CISC na épca (VAX) 50 instruções 200-300 instruções RISC - Reduced Instructin Set Cmputer CISC - Cmplex Instructin Set Cmputer - Se uma instruçã RISC fr 10 vezes mais rápidas que uma CISC e cinc instruções RISC fizerem uma CISC, entã RISC tem melhr desempenh. Pr que nã tems hje apenas máquinas RISC? - Cmpatibilidade cm prgramas p/ máquinas CISC anterires (Intel) - Núcle RISC de nvs prcessadres Intel (486 em diante). Interpreta apenas instruções mens cmuns (mais cmplexas).

Princípis de design (prjet) para Cmputadres Mderns: - Tdas as instruções sã executadas pel hardware Se cmputadr implementar instruções CISC, estas serã quebradas em partes separadas e entã executadas cm uma sequência de micrinstruções. O pass de quebra de instruçã CISC em instruções RISC diminui a perfrmance, mas para instruções mens frequentes pde ser aceitável. - As instruções devem ser fáceis de decdificar Um limite crític na taxa de instruções iniciadas é a decdificaçã das instruções individuais e a determinaçã ds recurss que elas necessitam. Trnar as instruções regulares, fixar seus tamanhs e reduzir númer de camps. Quant mens frmats existirem melhr. - Smente LOADS e STORES devem referenciar a memória Uma das mais simples maneiras de quebrar perações em passs mais simples é carregar e descarregar s perands de registrs, deixand as perações entre registr e a memória para serem executadas em passs separads. Operações entre a memória e s registrs pdem entã ser executadas enquant utras perações sã executadas. - Existência de um grande númer de registrs Manter s dads ns registrs é uma maneira de evitar a demra na busca desses dads na memória.

Paralelism - Aumentar a velcidade d relógi é apenas uma maneira de melhrar a perfrmance. Além dist, implica em busca de tecnlgia de execuçã e em limites físics para cada geraçã de nvas tecnlgias. - Paralelism, u executar mais de uma instruçã pr vez, é uma maneira de garantir velcidade sem necessariamente aumentar a velcidade d relógi. - O paralelism n design de cmputadres apresenta-se em duas frmas gerais: Paralelism a nível de instruçã Paralelism a nível de prcessadres Paralelism a nível de Instruções Prefetch buffer (IBM - 1959) - buscava as instruções na memória antes de serem necessárias e armazenava num buffer (registr). Dividia a execuçã em dis passs: busca e execuçã. Pipeline vai mais além: divide a execuçã da instruçã em várias partes, cada uma cmandada pr uma parte dedicada d hardware, pssibilitand suas execuções em paralel. Cicl de execuçã cm 4 passs (ArsTechnica) Pipeline (linha de mntagem) (ArsTechnica) - 10 passs num pipeline, 1 instruçã 10 x unidades de relógi - 100 instruções a serem executadas, 110 unidades de relógi - diminuind a latência (a instruçã talvez pudesse ser executada num temp melhr). - aumentand a largura de banda (muit mais instruções pr unidade de temp). Pipeline de 8 passs (ArsTechnica)

Arquitetura Superescalar - Dupl Pipeline: uma instruçã de fetch busca um par de instruções executadas em paralel. As duas instruções nã devem cnflitar na busca de recurss. (Fig. 2.5) 486 usava 1 pipeline Pentium 2 pipelines: 1 para qualquer instruçã (u pipeline) e para instruções inteirs simples, e um de flating pint (v pipeline). Regras cmplexas definiam us ds dis pipelines: se as 2ª instruções nã eram infinitamente simples para ser executadas n 2º pipeline, ela era alinhada cm a próxima instruçã e aí executada. Prgramas cm númers inteirs cmpilads especialmente para Pentium rdavam em até metade d temp d mesm prgrama cmpilad para um 486 de mesm clck. Pipeline Superescalar (2 threads) Pipeline Superescalar (múltiplas execuções) (ArsTechnica) ( Tanembaum - fig 2.6) - Ind além de dbrar pipeline. 4 pipelines implica em muitas regras de cnduta e prtant muit mais cmplicad. N entant, a execuçã das instruções, em princípi, leva mais temp d que a busca e a decdificaçã. Entã, se tiverms diverss mecanisms diferentes para pass de execuçã, cmputadr nã tem necessariamente de esperar pela cnclusã desta instruçã, ele pde passar adiante, e se a próxima instruçã nã depende desta, cmeçar sua execuçã antes d términ da primeira.

Paralelism a nível de Prcessadr - Existe um limite para ganh desempenh cm a pipeline u cm a arquitetura superescalar. - Um grande númer de prcessadres que executa a mesma sequência de instruções em diferentes cnjunts de dads. (Cntrle Central) Array Cmputers (Tanembaum fig. 2.7) - Vectr Prcessr: a mesma idéia de perar sbre muit dads de uma vez, prém a matriz de dads é clcada num registr vetrial, um cnjunt de registrs cntígus mais que pdem ser alcads cm um única instruçã de maneira sequencial. Este vetr é entã inserid num pipeline, que executa a instruçã e armazena resultad em utr registradr vetrial. Exempls de cmputadres vetriais CRAY, NEC. Arquitetura de um cmputadr Cray http://chrisfentn.cm/hmebrew-cray-1a/

Multiprcessadres Multiprcessadres (Tanembaum - fig. 2.8) - 1 única área de memória para diversas CPU's - diferente d Array Cmputer pr serem cpu's independentes - sftware deve cntrlar acess à memória de cada um ds prcessadres - Prcessadres rápids acessand a mesma memória pdem causar cnstantemente cnflit n BUS. As sluções pdem ser a utilizaçã de memórias lcais nã acessíveis as utrs prcessadres. Esta memória pde ser usada para armazenar códig e dads que nã sã cmpartilhads. - O cmpartilhament de memória facilita a prgramaçã pis prgramadr nã precisa se precupar cm a presença ds dads na memória de cada prcessadr. Tds s dads estã na mesma memória. - Exempl: Análise de uma ftgrafia de uma célula. A ft está armazenada na memória e cada prcessadr analisa um pedaç. Se huver superpsiçã de pedaçs, nã é necessári transmitir essa infrmaçã para a memória d prcessadr. Se uma segunda ft fr analisada e s pnts a serem bservads nã cincidirem cm s da 1ª ft é só prcessadr buscar a nva psiçã a ser bservada na memória. Multicmputadres Cnectar um grande númer de prcessadres à memória pde ser extremamente difícil. - Sluçã cnectar cmputadres entre si, sem cmpartilhar a memória. Cada prcessadr (u grip deles) cntará cm uma memória própria. Os dads necessáris sã transmitids de um cmputadr para utr através de prtcls de cmunicaçã via rede, e diversas tplgias sã utilizadas: malha 2D malha 3D estrela anel - Multicmputadres sã mais fáceis de cnstruir que multiprcessadres, prém multiprcessadres sã mais fáceis de prgramar - Tentativas de sluçã híbrida. [1] William Stallings - Cmputer Architecture and Organizatin, Pearsn, 5 th Editin