Arquiteturas Paralelas

Tamanho: px
Começar a partir da página:

Download "Arquiteturas Paralelas"

Transcrição

1 I Escola Regional de Alto Desempenho de SP São Paulo - SP 30 e 31 de Julho de 2010 Arquiteturas Paralelas Prof. Dr. Edson T. Midorikawa Departamento de Engenharia de Computação e Sistemas Digitais Escola Politécnica da USP ERAD-SP

2 Apresentação Prof. Edson Midorikawa Formação Graduação em Engenharia Elétrica EPUSP (1986) Mestrado em Engenharia Elétrica EPUSP (1992) Doutorado em Engenharia Elétrica EPUSP (1997) Atividades Professor doutor da Escola Politécnica da USP Membro do LAHPC (Laboratório de Arquitetura e Computação de Alto Desempenho) Áreas de Interesse Arquiteturas paralelas (multicore, hierarquia de memória) Máquinas virtuais (escalonamento de recursos, gerencia de memória, interação MMV-SO) Computação avançada (cluster, grid, cloud computing) ERAD-SP

3 Sumário Introdução Motivação Classificação de Máquinas Paralelas Paralelismo em Arquitetura de Computadores Pipelining Superescalaridade Multithreading Arquiteturas Multicore Arquiteturas Avançadas Multicores Avançados Multiprocessadores GPGPU Clusters ERAD-SP

4 1. Introdução ERAD-SP

5 Motivação Por que estudar Arquitetura de Computadores? Disciplina obrigatória nos cursos de Engenharia de Computação, Ciência da Computação, Sistemas de Informação, etc. Melhor entendimento do funcionamento (e aproveitamento) das máquinas modernas. Cria novas oportunidades de pesquisa em computação avançada. ERAD-SP

6 Motivação Por que pesquisar Arquiteturas Paralelas? Explora alternativas de projeto de novos sistemas para aumento de desempenho e de recursos de microeletrônica. Área de pesquisa com uma comunidade brasileira ativa e atuante em várias áreas (SBAC-PAD) Áreas de atuação: Desenvolvimento de novos modelos de computação Desenvolvimento de novas arquiteturas de sistemas computacionais (processadores multi-core, multiprocessadores, sistemas de cluster, grid e cloud computing) Viabiliza novas aplicações computacionais (modelos matemáticos) Previsão de tempo e de clima Drug design, genômica, proteômica Simulação (car crash, plataforma petrolífera,...) ERAD-SP

7 Motivação Evolução em várias categorias de computadores ENIAC supercomputador NORC CDC-6600 Cray-1 Cray-2 Cray-3 Cray T3E Cray-4? mainframe UNIVAC /360 /370 /390 z/900 PDP-8 PDP-11 VAX minicomputador x RS/6000 Xeon servidor/workstation PPro microcomputador PII PIIIP4 desktop PC Altair Pentium value PC Celeron ERAD-SP

8 Motivação Evolução do desempenho de processadores SPE Cint92 L eveling off P4/3200 * *** 5000 * Pres Pres cott cott (1M (2M ) ) * * * ** 2000 P4/1500 P4/2000 P4/2400 P4/3060 * Northwood B P4/2800 * * P4/2200 P4/1700 PI I I / ** * * PI I I /1000 PI I /400PI I I /500 PI I /300 PI I / * ~ 100*/10 years Pe ntium/200* Pentium Pro/ Pe ntium/133pe * * * * * 100 Pentium/100 Pentium/120 ntium/166 Pe ntium/66 * 50 * 486-D X 4/ /50 * 486/33* 486-DX2/66 * DX2/50 * 486/25 * 10 * 386/33 386/20 * 5 * 386/25 386/16 * 80286/12 2 * 80286/10 1 * 8088/8 0.5 * 0.2 * 8088/ Year ERAD-SP

9 Motivação Fatores para melhora de desempenho f c (MHz) * * 8088 * 286 * Pentium 4 * * * * * * ~100*/10years * * * Pentium III * * * * Pentium II * * ** * * Pentium Pentium Pro * * * 486-DX4 * ~10*/10years 486-DX2 * * * * * * * * * * Aumento da Frequencia do relógio Leveling off * * * Year Year of first volume shipment ERAD-SP

10 Motivação Fatores para melhora de desempenho (2) Lei de Moore ERAD-SP

11 Motivação Fatores para melhora de desempenho (3) Como manter a tendencia de aumento de desempenho dos processadores? O que fazer se não é possível manter continuamente o aumento do clock? Como utilizar eficientemente os transistores disponíveis em um chip? ERAD-SP

12 Motivação Resposta PARALELISMO ERAD-SP

13 Classificação de Máquinas Paralelas Classificação de Flynn Classificação de arquiteturas paralelas genérica de acordo com as características do fluxo de instruções e o fluxo de dados (único ou múltiplo) Michael J. Flynn ERAD-SP

14 Classificação de Máquinas Paralelas SISD Single Instruction, Single Data Um único fluxo de instruções Um único fluxo de dados Contém as arquiteturas tradicionais não paralelas Máquinas de Von Neumann instrução dado UC = unidade de controle UP = unidade de processsamento MEM = memória ERAD-SP

15 Classificação de Máquinas Paralelas SIMD Single Instruction, Multiple Data Um único fluxo de instrução Múltiplos fluxos de dados Execução síncrona da instrução para todos os dados Exemplos: Processadores vetoriais (Cray 1) GPU instrução dados ERAD-SP

16 Classificação de Máquinas Paralelas MISD Multiple Instruction, Single Data Múltiplos fluxos de instrução Um único fluxo de dados Execução de várias instruções em um único dado. UP2 UP Não há exemplos. UCn instruções UPn dado ERAD-SP

17 Classificação de Máquinas Paralelas MIMD Multiple Instruction, Multiple Data Múltiplos fluxos de instruções Múltiplos fluxos de dados Permite a execução de instruções diferentes para cada um dos dados Exemplos: Arquiteturas paralelas atuais Top500.org instruções dados ERAD-SP

18 Máquinas Paralelas Top500.org Lista com os 500 computadores mais rápidos Atualizada duas vezes ao ano (junho e novembro) ERAD-SP

19 ERAD-SP

20 2. Paralelismo em Arquitetura de Computadores ERAD-SP

21 Fontes de Paralelismo Há várias fontes de execução paralela em um computador moderno: Aplicações diferentes; Instâncias de execução da mesma aplicação; Multiprogramação Multitarefa Fluxo de instruções (threads) de uma aplicação; Instruções de um programa (ILP) Processadores multicore ERAD-SP

22 Fontes de Paralelismo Paralelismo no Nível de Instrução (ILP) Permite executar várias instruções em cada ciclo de relógio. Modificações na microarquitetura do processador para possibilitar a execução paralela de instruções. Alternativas: Paralelismo temporal: encadeamento no fluxo de execução das instruções (pipeline); Paralelismo na emissão de instruções: submissão de várias instruções para execução pelo fluxo de dados (VLIW e superescalaridade); Paralelismo de dados: permite executar várias instâncias da mesma instrução para um conjunto de dados (processamento SIMD ou vetorial). ERAD-SP

23 Fontes de Paralelismo Paradigmas de processamento ILP Paralelismo Temporal Paralelismo de Emissão de Instruções Paralelismo de Dados Resolução estática de dependências Resolução dinâmica de dependências Processadores com Pipeline Processadores VLIW Processadores Superscalares extensão SIMD ERAD-SP

24 Evolução do Paralelismo Extensão do paralelismo da execução Processamento Sequencial ILP Paralelismo temporal + paralelismo de envio de instruções + paralelismo de dados Processadores von Neumann tradicionais Processadores Pipelined Processadores Superscalares Processadores Superscalares com extensão SIMD ~ 1985/88 ~ 1990/93 ~ 1994/00 t Nível de redundância de hardware ERAD-SP

25 Pipelining Execução de uma instrução é dividida em etapas: Memória Registradores Memória IF ID EXE MEM WB IF = busca da instrução na memória (inclui atualização do PC) ID = decodificação da instrução + busca de valores em registradores EXE = execução da instrução (ULA ou cálculo de endereços) MEM = acesso à memória ou instrução de desvio WB = escrita resultados nos registradores de saída Uma instrução leva 5 períodos de clock para concluir. ERAD-SP

26 Pipelining Fluxo de dados do processador MIPS didático (COD/4e, Patterson & Hennessy) ERAD-SP

27 Pipelining Inicia a execução de uma instrução por ciclo de clock fluxo de instruções IF ID I1 I2 I1 EXE MEM WB I3 I4 I5 I6 I2 I3 I4 I5 I1 I2 I3 I4 I1 I2 I3 I1 I2 ciclo A cada ciclo de clock, termina-se a execução de uma instrução. ERAD-SP

28 Superescalaridade Em um processador superescalar, várias instruções são submetidas para execução simultaneamente. Memoria Busca instruções Registradores Memoria instruções de instr. ID EXE MEM WB Várias instruções do programa são analisadas para execução paralela. PROBLEMA: dependência de dados entre instruções. ERAD-SP

29 Superescalaridade Dependência de dados Time (cycles) lw $t0, 40($s0) IM lw RF $s DM $t0 RF add $t1, $t0, $s1 sub $t0, $s2, $s3 IM add sub RF $t0 $s1 $s2 $s3 RF $t0 $s1 $s2 $s3 + - DM $t1 $t0 RF and $t2, $s4, $t0 or $t3, $s5, $s6 Stall and IM or IM and or RF $s4 $t0 $s5 $s6 & DM $t2 $t3 RF sw $s7, 80($t3) IM sw RF $t $s7 DM RF ERAD-SP

30 Superescalaridade Para resolver o problema da dependência de dados, um processador superescalar permite a execução fora de ordem das instruções (OOO out of order execution) Time (cycles) lw $t0, 40($s0) or $t3, $s5, $s6 IM lw or RF $s0 40 $s5 $s6 + DM $t0 $t3 RF RAW sw $s7, 80($t3) two cycle latency between load and RAW use of $t0 add $t1, $t0, $s1 WAR sub $t0, $s2, $s3 IM $t3 sw $s RF DM $t0 add $s1 + IM RF $s2 sub $s3 - RF DM $t1 $t0 RF RAW and $t2, $s4, $t0 IM and RF $s4 $t0 & DM $t2 RF ERAD-SP

31 Multithreading Algumas definições: Processo: programa rodando em um computador. Vários processos estão em execução simultaneamente, como p. ex.: browser Web, editor de texto, anti-virus. Thread: parte de um processo. Cada processo pode ter vários threads, como p. ex.: um editor de texto pode ter vários threads para digitação, verificação ortográfica e impressão. Em um processador convencional: Apenas um thread é executado por vez. Quando ocorre uma parada (stall) na execução de um thread (p.ex. acesso à memória), realiza-se uma troca de contexto para outro thread. ERAD-SP

32 Multithreading Em um processador com multithreading, vários threads podem estar ativos ao mesmo tempo: Possui mais de um conjunto de registradores de estado Quando ocorre stall em um thread, outro é colocado em execução imediatamente (não há necessidade de operações de salvamente e carga de estado) Se um thread não usar uma unidade funcional (p.ex. somador, ULA, FPU), outro pode usá-lo Não modifica o paralelismo de instruções de um único thread, mas aumenta o desempenho geral do sistema. ERAD-SP

33 Multithreading A presença de vários conjuntos de registradores de estado é normalmente interpretado pelos sistemas operacionais como se houvesse vários processadores (virtuais), onde os processos podem ser escalonados. Permite um melhor compartilhamento dos recursos do processador Unidades funcionais Memórias cache ERAD-SP

34 Multithreading Simultaneous Multithreading (SMT) Permite executar instruções de threads de vários programas (processos) simultaneamente sem a necessidade de troca de contexto sem multithreading blocked multithreading Interleaved multithreading SMT ciclos cache miss Vantagens Permite a execução simultânea de mais instruções por ciclo Desempenho total se tiver apenas um thread ativo ERAD-SP

35 Multithreading Superescalar (4-way) Superescalar com SMT (4-way/2 threads) Thread Thread 1 Thread 2 ERAD-SP

36 Multithreading Simultaneous Multithreading A Intel implementa a técnica SMT em seus processadores com o nome comercial Hyperthreading (HT) permitindo a execução simultânea de 2 threads por core. Sun UltraSparc T2 (8 threads por core) IBM Power 7 (4 threads por core) ERAD-SP

37 Arquiteturas Multicore ERAD-SP

38 Processadores Multicore Etapa atual no desenvolvimento de novas arquiteturas de processadores. Permite a execução simultânea de múltiplos threads e/ou aplicações. Inclui vários núcleos de processadores na pastilha. ERAD-SP

39 Exemplos de Multicore Intel Core i7 e AMD Phenom X6 ERAD-SP

40 Exemplos de Multicore Intel Xeon 5600 (hexacore) ERAD-SP

41 Exemplos de Multicore Intel Xeon 7500 (8-core) ERAD-SP

42 Exemplos de Multicore AMD Opteron 6000 (12-core) ERAD-SP

43 Intel Processadores Multicore Tilera Tile64 UltraSparc T2 ERAD-SP

44 Paralelismo no Nível de Threads Granularidade do paralelismo TLP (paralelismo no nível de threads) Múltiplos threads ILP (paralelismo no nível de instruções) Thread (fluxo de instruções) ERAD-SP

45 Paralelismo no Nível de Threads Execução paralela de threads De onde vem os vários threads? de aplicações diferentes da mesma aplicação Multiprogramação Multitarefa, Multithreading ERAD-SP

46 Paralelismo no Nível de Threads Implementação de paralelismo no nível de threads em microprocessadores SMP: Symmetric Multiprocessing (CMP: Chip Multiprocessing) Implementação de dois ou mais cores colocados na mesma pastilha SMT: Simultaneous Multithreading (HT: Hyperthreading (Intel)) Implementação de um core multithreaded Core L2/L3 Core pastilha (chip) Core SMT L2/L3 L3/Memória ERAD-SP 2010 L3/Memória 46

47 Paralelismo no Nível de Threads Simultaneous Multithreading Superescalar (4-way) Superescalar com SMT (4-way/2 threads) Thread Thread 1 Thread 2 ERAD-SP

48 Paralelismo no Nível de Threads Simultaneous Multiprocessing Nehalem-EX ERAD-SP

49 Simultaneous Multiprocessing A presença de vários núcleos de processador (core) em um computador pode ser realizada em dois níveis distintos: Multiprocessador: vários chips processadores. Multicore: um único chip processador com vários cores. chip único ERAD-SP

50 Multicore Vários processadores single core agrupados em um único chip (CMP = chip multiprocessor). Replicação real dos recursos de um processador dentro do chip (ao contrário do multithreading) Compatibilidade de código com os multiprocessadores (modelo de memória compartilhada) Incorpora uma hierarquia complexa de memórias cache interna Caches L1 e L2 privados (particulares a cada core) Cache L3 único e compartilhado entre os cores ERAD-SP

51 Multicore Organização interna de um Multicore Principais componentes: Núcleos de processador (cores) Memórias cache Rede de interconexão interna Interface com barramento de E/S externo Controlador de interrupções Timers etc Fonte: ARM, The ARM Cortex-A9 Processors White Paper, ERAD-SP

52 Hierarquia de caches Multicore ERAD-SP

53 Interconexão Interna Multicore Implementação das interconexões Árbitro/Implementações de cache multi-porta Crossbar Anel Aspectos quantitativos, tais como número de fontes e destinos ou requisitos de banda, afetam qual alternativa de implementação é mais benéfica. Número pequeno de fontes e destinos p.ex. Conexão dos dual-cores aos cache L2 compartilhado UltraSPARC T1 (2005) UltraSPARC T2 (2007) Número grande de fontes e destinos Cell BE (2006) XRI (2005) ERAD-SP

54 Multicore Aplicação de multicores vs. SMP e processadores superescalares Instrução Bloco básico Loop Tarefa Processo Fonte: Olukotun et al. Chip Multiprocessor Architecture, ERAD-SP

55 Multicore Breve Histórico Prescott (core original) Smithfield (dois cores Prescott modificados colocados no mesmo die) 2/2004 5/ nm 112 mm mtrs L2: 1 MB Pentium 4 A/E/F series Pentium 4 5xx series 90 nm 2 x 103 mm 2 2 x 115 mtrs L2: 2 MB Pentium D 8xx Pentium EE 840 Pentium D/EE ERAD-SP

56 Multicore Breve Histórico Conroe (die) Kentsfield (dois Conroes no mesmo empacotamento) 7/ nm 143 mm 2 167/291 mtrs 11/ nm 2 x 143 mm 2 2 x 167/291 mtrs Core 2 Duo E 6x00 series Core 2 Extreme QX6x00 series Core2 Extrem X6x00 series ERAD-SP

57 Desafio dos Multicores Os processadores multicore... possuem uma grande capacidade computacional ( lembre-se que um octocore permite executar ao menos 8 threads simultaneamente ); Implementam várias otimizações para execução paralela (caches integrados, alta banda de comunicação, etc); mas Os programas existentes não foram escritos para usar tais recursos. ERAD-SP

58 Desafio dos Multicores É muito importante que a aplicação seja capaz de aproveitar completamente os recursos dos processadores multicore. Conceitos de programação paralela e multithreaded. ERAD-SP

59 ERAD-SP 2010 Fonte: Multi-core Programming, Intel Press,

60 3. Arquiteturas Avançadas ERAD-SP

61 Multicores Avançados IBM Power 7 Lançado em ,2 bilhões de transistores Módulos de até 4 soquetes 4, 6 ou 8 cores por chip 4 threads SMT por core 12 unidades funcionais por core ERAD-SP

62 Multicores Avançados Sun UltraSparc T3 a ser lançado em bilhão de transistores 16 cores 8 threads SMT por core 128 threads por chip SMP com 4 processadores ERAD-SP

63 Manycore Pastilhas de processadores multicore com cores heterogêneos Aplicações Processamento especializado Co-processamento Exemplos: Cell (Sony, Toshiba, IBM) Intel Sandy Bridge AMD Fision ERAD-SP

64 Manycore Cell 1 PPE (PowerPC) 8 SPE PS3 (Cell BE) Roadrunner (PowerXCell 8i) Top 500 #3 ERAD-SP

65 Manycore Cell Fonte: Gshwind M., Chip Multiprocessing and the Cell BE, ACM Computing Frontiers, 2006, ERAD-SP

66 Manycore Cell Circuito de um único SPE Fonte: Gshwind M., Chip Multiprocessing and the Cell BE, ACM Computing Frontiers, 2006, ERAD-SP

67 Manycore CPU + GPU (ex. Intel Sandy Bridge, AMD Fusion) ERAD-SP

68 GPGPU GPGPU = General Purpose computation on Graphics Processing Unit Utilização de GPUs (unidades de processamento gráfico) para execução de computação normalmente realizada em CPUs. Exemplos: NVIDIA ATI ERAD-SP

69 GPGPU GPU Unidade de processamento especializado para acelerar o processamento gráfico 2D e 3D. ERAD-SP

70 GPGPU GPU Arquitetura baseada em SP (streaming processor) e SFU (Special Function Units) ERAD-SP

71 GPGPU CPU vs. GPU Comparação relativa a utilização de área de silício alocada por funcionalidade nas CPUs e GPUs. Fonte: Nvidia, Compute Unified Device Architecture Programming Guide ERAD-SP

72 GPGPU Princípios básicos Multicore streaming multiprocessor (Nvidia) superscalar shader processor (AMD) wide SIMD processor, CPU core (Intel). Processamento vetorial Modelo SIMD Paralelismo de dados Hardware Multithreading Sincronização de barreira ERAD-SP

73 Paralelismo de dados GPGPU Mesma instrução para todos os dados ERAD-SP

74 GPGPU Fonte: Nvidia, Compute Unified Device Architecture Programming Guide ERAD-SP

75 GPGPU Mais informações: gpgpu.org developer.amd.com (ATI) Minicurso 2 (avançado): Programação Paralela: CUDA Raphael Y. de Camargo (UFABC) ERAD-SP 2010 (Material disponível no CD) ERAD-SP

76 Multiprocessadores Um multiprocessador contém vários (chips de) processadores Memória compartilhada entre os processadores Comunicação pela memória Modelo UMA (uniform memory access) Baixa escalabilidade (até poucas dezenas de processadores) Fácil programação (OpenMP, CPar,...) ERAD-SP

77 Arquitetura básica Multiprocessadores ERAD-SP

78 Multiprocessadores Cada processador pode ser um multicore com suporte a multithreading Vários níveis de paralelismo Outras questões importantes Coerência de caches Multiprocessadores NUMA Programação paralela ERAD-SP

79 Coerência de caches Multiprocessadores Várias soluções na literatura. ERAD-SP

80 Multiprocessadores Multiprocessadores NUMA NUMA = Non-Uniform Memory Acess Grupos de processadores com sua respectiva memória Tempos de acesso à memória diferentes Mantém modelo de memória compartilhada (mas precisa cuidados para obter desempenho) ERAD-SP

81 Multiprocessadores Programação Paralela Método de desenvolvimento de programas que explora a disponibilidade de vários processadores/cores para uma única aplicação. Modelos de programação Memória compartilhada (OpenMP, CPar) Memória distribuída (MPI) Mais informações: Minicurso 3 (básico): Programação Paralela: multicores e clusters Profa. Dra. Liria Matsumoto Sato (Poli-USP) (amanhã 31/07 às 14h00) ERAD-SP

82 Clusters Arquitetura de sistema paralelo multiprocessador organizado como um conjunto de processadores interligados através de uma rede de interconexão rápida Interconexão rápida (Myrinet, Infiniband, Gigabit Ethernet) Rede interna de administração (Ethernet) cluster ERAD-SP

83 Clusters Conhecido inicialmente como NOW (Network of Workstations) ou COW (cluster of workstations) Cada nó tem sua própria memória local (não compartilhada) Comunicação por troca de mensagens Difícil programação Modelo de programação diferente Conceito cliente-servidor MPI ERAD-SP

84 Máquinas comerciais Clusters ERAD-SP

85 4. Considerações Finais ERAD-SP

86 Alguns pensamentos: Arquiteturas Paralelas Hoje, a maioria de sistemas computacionais apresenta uma arquitetura paralela. Contudo nossos cursos não apresentam este conteúdo de forma detalhada. É uma grande oportunidade para todos melhorar sua formação com um estudo detalhado deste tópico. ERAD-SP

87 Pensamento final: Arquiteturas Paralelas Precisamos difundir a necessidade em compreender o funcionamento das arquiteturas paralelas e do aprendizado das técnicas de programação paralela e distribuída para usufruirmos dos benefícios destas máquinas. ERAD-SP

88 Bibliografia Algumas referências bibliográficas interessantes para consulta sobre Arquiteturas Paralelas: Akter, S.; Roberts, J. Multi-core Programming. Intel Press, Culler, D.; Singh, J. Parallel Computer Architecture: A Hardware/ Software Approach. Morgan Kaufmann, De Rose, C.; Navaux, P. Arquiteturas Paralelas. Editora Sagra-Luzzatto, (Série Livros Didáticos - Número 15) Grama, A.; Gupta, A.; Karypis, G. and Kumar, V. Introduction to Parallel Computing. 2 nd ed., Addison-Wesley, Hennessy, J.L.; Patterson, D.A. Computer Architecture: A Quantitative Approach. 4 th ed., Morgan Kaufmann, Olukotun, K.; Hammond, L. and Laudon, J. Chip Multiprocessor Architecture: Techniques to Improve Throughput and Latency. Morgan & Claypool, Zomaya, A.Y.H. (ed.) Parallel & Distributed Computing Handbook. McGraw-Hill, ERAD-SP

Multi-processamento. Arquitecturas MIMD de memória partilhada Multi-cores heterogéneos Multi-processadores

Multi-processamento. Arquitecturas MIMD de memória partilhada Multi-cores heterogéneos Multi-processadores Multi-processamento Arquitecturas MIMD de memória partilhada Multi-cores heterogéneos Multi-processadores Arquitecturas MIMD de memória distribuída Massive Parallel Computers Sistemas distribuídos Ainda

Leia mais

SSC510 Arquitetura de Computadores. 12ª aula

SSC510 Arquitetura de Computadores. 12ª aula SSC510 Arquitetura de Computadores 12ª aula EVOLUÇÃO DA ARQUITETURA INTEL PROFA. SARITA MAZZINI BRUSCHI 1 Pentium - Modelos 2 Pentium - Arquiteturas Netburst P7 Sétima geração dos processadores da arquitetura

Leia mais

Sistemas MIMD. CES-25 Arquiteturas para Alto Desmpenho. Paulo André Castro

Sistemas MIMD. CES-25 Arquiteturas para Alto Desmpenho. Paulo André Castro Sistemas MIMD Arquiteturas para Alto Desmpenho Prof. pauloac@ita.br Sala 110 Prédio da Computação www.comp.ita.br/~pauloac Arquiteturas Paralelas (SISD) Single Instruction Stream, Single Data Stream: Monoprocessador

Leia mais

FACULDADE PITÁGORAS DISCIPLINA: ARQUITETURA DE COMPUTADORES

FACULDADE PITÁGORAS DISCIPLINA: ARQUITETURA DE COMPUTADORES FACULDADE PITÁGORAS DISCIPLINA: ARQUITETURA DE COMPUTADORES Prof. Ms. Carlos José Giudice dos Santos cpgcarlos@yahoo.com.br www.oficinadapesquisa.com.br ESQUEMA DE UM COMPUTADOR Uma Unidade Central de

Leia mais

Professores: Aula 10. Lúcia M. A. Drummond Simone de Lima Martins. Conteúdo: Arquiteturas Avançadas. - Arquiteturas RISC - Processamento Paralelo

Professores: Aula 10. Lúcia M. A. Drummond Simone de Lima Martins. Conteúdo: Arquiteturas Avançadas. - Arquiteturas RISC - Processamento Paralelo 1 Professores: Aula 10 Lúcia M. A. Drummond Simone de Lima Martins Conteúdo: Arquiteturas Avançadas - Arquiteturas RISC - Processamento Paralelo 2 Arquiteturas RISC Reduced Instruction Set Computer se

Leia mais

ALGORÍTMOS PARALELOS (Aula 2) LCAD. Neyval C. Reis Jr. OUTUBRO/2004. Laboratório de Computação de Alto Desempenho DI/UFES

ALGORÍTMOS PARALELOS (Aula 2) LCAD. Neyval C. Reis Jr. OUTUBRO/2004. Laboratório de Computação de Alto Desempenho DI/UFES ALGORÍTMOS PARALELOS (Aula 2) Neyval C. Reis Jr. OUTUBRO/2004 LCAD Laboratório de Computação de Alto Desempenho DI/UFES Programa do Curso LCAD 1. Introdução 2. Arquitetura de Computadores 3. Arquiteturas

Leia mais

FACULDADE PITÁGORAS PRONATEC

FACULDADE PITÁGORAS PRONATEC FACULDADE PITÁGORAS PRONATEC DISCIPLINA: ARQUITETURA DE COMPUTADORES Prof. Ms. Carlos José Giudice dos Santos carlos@oficinadapesquisa.com.br www.oficinadapesquisa.com.br Objetivos Ao final desta apostila,

Leia mais

Introdução às arquiteturas paralelas e taxonomia de Flynn

Introdução às arquiteturas paralelas e taxonomia de Flynn Introdução às arquiteturas paralelas e taxonomia de Flynn OBJETIVO: definir computação paralela; o modelo de computação paralela desempenhada por computadores paralelos; e exemplos de uso da arquitetura

Leia mais

Infraestrutura de Hardware. Revisão Pipeline, Superescalar e Multicores

Infraestrutura de Hardware. Revisão Pipeline, Superescalar e Multicores Infraestrutura de Hardware Revisão Pipeline, Superescalar e Multicores Pipeline Pipeline é uma técnica que visa aumentar o nível de paralelismo de execução de instruções ILP (Instruction-Level Paralellism)

Leia mais

Universidade Tuiuti do Paraná Faculdade de Ciências Exatas Hardware. Arquitetura básica de Processadores. Profº André Luiz andreluizsp@gmail.

Universidade Tuiuti do Paraná Faculdade de Ciências Exatas Hardware. Arquitetura básica de Processadores. Profº André Luiz andreluizsp@gmail. Universidade Tuiuti do Paraná Faculdade de Ciências Exatas Hardware Arquitetura básica de Processadores Profº André Luiz andreluizsp@gmail.com 1 Microprocessador Ao comprar um desktop ou notebook, quase

Leia mais

Arquitetura NUMA 1. Daniel de Angelis Cordeiro. INRIA MOAIS project Laboratoire d Informatique de Grenoble Université de Grenoble, França

Arquitetura NUMA 1. Daniel de Angelis Cordeiro. INRIA MOAIS project Laboratoire d Informatique de Grenoble Université de Grenoble, França Arquitetura NUMA 1 Daniel de Angelis Cordeiro INRIA MOAIS project Laboratoire d Informatique de Grenoble Université de Grenoble, França 6 de Outubro de 2010 1 Baseado em slides feitos por Christiane Pousa

Leia mais

Desenvolvimento de Programas Paralelos para Máquinas NUMA: Conceitos e Ferramentas

Desenvolvimento de Programas Paralelos para Máquinas NUMA: Conceitos e Ferramentas 1 Pontifícia Universidade Católica do Rio Grande do Sul Faculdade de Informática Programa de Pós-Graduação em Ciência da Computação Desenvolvimento de Programas Paralelos para Máquinas NUMA: Conceitos

Leia mais

Symmetric Multiprocessing Simultaneous Multithreading Paralelismo ao nível dos dados

Symmetric Multiprocessing Simultaneous Multithreading Paralelismo ao nível dos dados Symmetric Multiprocessing Simultaneous Multithreading Paralelismo ao nível dos dados Luís Nogueira luis@dei.isep.ipp.pt Departamento Engenharia Informática Instituto Superior de Engenharia do Porto SMP,

Leia mais

Arquitetura de Computadores

Arquitetura de Computadores Arquitetura de Computadores Prof. Fábio M. Costa Instituto de Informática UFG 1o. Semestre / 2005 Fundamentos Roteiro Fundamentos Princípios de funcionamento de computadores Perspectiva histórica Tendências

Leia mais

Capítulo 8 Arquitetura de Computadores Paralelos

Capítulo 8 Arquitetura de Computadores Paralelos Capítulo 8 Arquitetura de Computadores Paralelos Necessidade de máquinas com alta capacidade de computação Aumento do clock => alta dissipação de calor Velocidade limitada dos circuitos => velocidade da

Leia mais

Paralelismo. Computadores de alto-desempenho são utilizados em diversas áreas:

Paralelismo. Computadores de alto-desempenho são utilizados em diversas áreas: Computadores de alto-desempenho são utilizados em diversas áreas: - análise estrutural; - previsão de tempo; - exploração de petróleo; - pesquisa em fusão de energia; - diagnóstico médico; - simulações

Leia mais

Arquitetura e Organização de Computadores 2. Apresentação da Disciplina

Arquitetura e Organização de Computadores 2. Apresentação da Disciplina Arquitetura e Organização de Computadores 2 Apresentação da Disciplina 1 Objetivos Gerais da Disciplina Aprofundar o conhecimento sobre o funcionamento interno dos computadores em detalhes Estudar técnicas

Leia mais

ARQUITETURA E ORGANIZAÇÃO DE COMPUTADORES INTRODUÇÃO AO PARALELISMO: PROCESSADORES SUPERESCALARES. Prof. Dr. Daniel Caetano 2012-1

ARQUITETURA E ORGANIZAÇÃO DE COMPUTADORES INTRODUÇÃO AO PARALELISMO: PROCESSADORES SUPERESCALARES. Prof. Dr. Daniel Caetano 2012-1 ARQUITETURA E ORGANIZAÇÃO DE COMPUTADORES INTRODUÇÃO AO PARALELISMO: PROCESSADORES SUPERESCALARES Prof. Dr. Daniel Caetano 2012-1 Lembretes Compreender o funcionamento da Arquitetura Superpipeline Compreender

Leia mais

Evolução das CPUs: Dual e Quad Core

Evolução das CPUs: Dual e Quad Core Evolução das CPUs: Dual e Quad Core Cesar Sposito Mário J. Filho Rodrigo Ferrassa... os computadores sequenciais estão se aproximando do limite físico fundamental em sua energia potencial computacional.

Leia mais

Introdução ao Processador CELL BE

Introdução ao Processador CELL BE 1 Introdução ao Processador CELL BE por: José Ricardo de Oliveira Damico 17 / Maio / 2007 São Paulo SP 2 SUMÁRIO LISTA DE FIGURAS 3 RESUMO 4 1.) INTRODUÇÃO 5 1.1) O que é? 5 2.) Utilização 5 3.) FUNCIONAMENTO

Leia mais

OFICINA DA PESQUISA PROGRAMAÇÃO APLICADA À CIÊNCIA DA COMPUTAÇÃO

OFICINA DA PESQUISA PROGRAMAÇÃO APLICADA À CIÊNCIA DA COMPUTAÇÃO OFICINA DA PESQUISA PROGRAMAÇÃO APLICADA À CIÊNCIA DA COMPUTAÇÃO Prof. Msc. Carlos José Giudice dos Santos carlos@oficinadapesquisa.com.br www.oficinadapesquisa.com.br RELAÇÃO ENTRE PROGRAMAÇÃO E ARQUITETURA

Leia mais

Bits internos e bits externos. Barramentos. Processadores Atuais. Conceitos Básicos Microprocessadores. Sumário. Introdução.

Bits internos e bits externos. Barramentos. Processadores Atuais. Conceitos Básicos Microprocessadores. Sumário. Introdução. Processadores Atuais Eduardo Amaral Sumário Introdução Conceitos Básicos Microprocessadores Barramentos Bits internos e bits externos Clock interno e clock externo Memória cache Co-processador aritmético

Leia mais

COMPUTAÇÃO PARALELA. uma visão geral. Guilherme Galante. v.2.0

COMPUTAÇÃO PARALELA. uma visão geral. Guilherme Galante. v.2.0 COMPUTAÇÃO PARALELA uma visão geral Guilherme Galante v.2.0 Guilherme Galante Bacharel em Informática Unioeste (2003) Mestre em Ciência da Computação UFRGS (2006) Professor Assistente do curso de Informática/Ciência

Leia mais

Computação Heterogênea Programação paralela, clusters e GPUs

Computação Heterogênea Programação paralela, clusters e GPUs Computação Heterogênea Programação paralela, clusters e GPUs Profa. Dra. Denise Stringhini (ICT- Unifesp) Primeiro Encontro do Khronos Chapters Brasil Belo Horizonte, 20/09/2013 Conteúdo Computação heterogênea:

Leia mais

Processador ( CPU ) E/S. Memória. Sistema composto por Processador, Memória e dispositivos de E/S, interligados por um barramento

Processador ( CPU ) E/S. Memória. Sistema composto por Processador, Memória e dispositivos de E/S, interligados por um barramento 1 Processadores Computador Processador ( CPU ) Memória E/S Sistema composto por Processador, Memória e dispositivos de E/S, interligados por um barramento 2 Pastilha 3 Processadores (CPU,, Microcontroladores)

Leia mais

ARQUITETURA DE COMPUTADORES Prof. Ricardo Rodrigues Barcelar http://www.ricardobarcelar.com.br

ARQUITETURA DE COMPUTADORES Prof. Ricardo Rodrigues Barcelar http://www.ricardobarcelar.com.br - Aula 3 - ORGANIZAÇÃO DE SISTEMAS COMPUTACIONAIS - PROCESSADORES 1. INTRODUÇÃO Um computador eletrônico digital é um sistema composto por um conjunto de processadores, memórias e dispositivos de entrada/saída

Leia mais

Organização de Computadores 1

Organização de Computadores 1 Organização de Computadores 1 3 ARQUITETURA DE VON NEUMANN E DESEMPENHO DE COMPUTADORES Prof. Luiz Gustavo A. Martins Tipos de Arquitetura Arquitetura de von Neumann: Conceito de programa armazenado; Dados

Leia mais

Capítulo 9. Arquitecturas Reais e Alternativas

Capítulo 9. Arquitecturas Reais e Alternativas Capítulo 9 Arquitecturas Reais e Alternativas Adaptado dos transparentes das autoras do livro The Essentials of Computer Organization and Architecture Ábaco (3000 AC) do Lat. abacu < Gr. abax, quadro,

Leia mais

Organização e Arquitetura de Computadores I. de Computadores

Organização e Arquitetura de Computadores I. de Computadores Universidade Federal de Campina Grande Departamento de Sistemas e Computação Curso de Bacharelado em Ciência da Computação Organização e Arquitetura de I Organização Básica B de (Parte V, Complementar)

Leia mais

Visão Geral da Arquitetura de Computadores. Prof. Elthon Scariel Dias

Visão Geral da Arquitetura de Computadores. Prof. Elthon Scariel Dias Visão Geral da Arquitetura de Computadores Prof. Elthon Scariel Dias O que é Arquitetura de Computadores? Há várias definições para o termo arquitetura de computadores : É a estrutura e comportamento de

Leia mais

Sistemas Distribuídos Conceitos HW e SW. Edeyson Andrade Gomes www.edeyson.com.br

Sistemas Distribuídos Conceitos HW e SW. Edeyson Andrade Gomes www.edeyson.com.br Sistemas Distribuídos Conceitos HW e SW Edeyson Andrade Gomes www.edeyson.com.br Roteiro da Aula Roteiro da Aula Conceitos de Hardware Conceitos de Software Combinações de SW e HW 3 Sistemas Distribuídos

Leia mais

Microprocessadores II - ELE 1084

Microprocessadores II - ELE 1084 Microprocessadores II - ELE 1084 CAPÍTULO III OS PROCESSADORES 3.1 Gerações de Processadores 3.1 Gerações de Processadores Primeira Geração (P1) Início da arquitetura de 16 bits CPU 8086 e 8088; Arquiteturas

Leia mais

MULTICORE. Sávio R. A. dos Santos Rosa IC - UNICAMP RA 025144. Bruno Cardoso IC - UNICAMP RA 023241. Tiago M. Fernandes IC - UNICAMP RA 025313

MULTICORE. Sávio R. A. dos Santos Rosa IC - UNICAMP RA 025144. Bruno Cardoso IC - UNICAMP RA 023241. Tiago M. Fernandes IC - UNICAMP RA 025313 Bruno Cardoso IC - UNICAMP RA 023241 bruno.cardoso@gmail.com MULTICORE Sávio R. A. dos Santos Rosa IC - UNICAMP RA 025144 savio18@gmail.com Tiago M. Fernandes IC - UNICAMP RA 025313 fernandes.tiago@gmail.com

Leia mais

Arquitectura de Computadores II. Multiprocessadores

Arquitectura de Computadores II. Multiprocessadores Arquitectura de Computadores II LESI - 3º Ano Multiprocessadores João Luís Ferreira Sobral Departamento do Informática Universidade do Minho Janeiro 2002 Uma forma lógica de aumentar o desempenho de uma

Leia mais

Ricardo José Cabeça de Souza ricardo.souza@ifpa.edu.br 2010 Atualização em Hardware Manutenção de Microcomputadores Processador

Ricardo José Cabeça de Souza ricardo.souza@ifpa.edu.br 2010 Atualização em Hardware Manutenção de Microcomputadores Processador Instituto Federal do Pará - IFPA Ricardo José Cabeça de Souza ricardo.souza@ifpa.edu.br 2010 Atualização em Hardware Manutenção de Microcomputadores Processador SUMÁRIO Conceitos Básicos Hardware Software

Leia mais

Arquitetura e Organização de Computadores. Capítulo 7 Multicores, Multiprocessadores e Clusters

Arquitetura e Organização de Computadores. Capítulo 7 Multicores, Multiprocessadores e Clusters Arquitetura e Organização de Computadores Capítulo 7 Multicores, Multiprocessadores e Clusters Material adaptado de: Patterson e Henessy, Computer Organization and Design 4 th Edition 2 Objetivo: conectar

Leia mais

Comparação de algoritmos paralelos em uma rede heterogênea de workstations

Comparação de algoritmos paralelos em uma rede heterogênea de workstations Comparação de algoritmos paralelos em uma rede heterogênea de workstations Marcelo T. Rebonatto, Marcos J. Brusso, Roberto Niche 1, Roni A. Dall Orsoletta 1 Universidade de Passo Fundo Instituto de Ciências

Leia mais

Sistemas Computacionais II Professor Frederico Sauer

Sistemas Computacionais II Professor Frederico Sauer Sistemas Computacionais II Professor Frederico Sauer Livro-texto: Introdução à Organização de Computadores 4ª edição Mário A. Monteiro Livros Técnicos e Científicos Editora. Atenção: Este material não

Leia mais

Análise de desempenho e eficiência energética de aceleradores NVIDIA Kepler

Análise de desempenho e eficiência energética de aceleradores NVIDIA Kepler Análise de desempenho e eficiência energética de aceleradores NVIDIA Kepler Emilio Hoffmann, Bruno M. Muenchen, Taís T. Siqueira, Edson L. Padoin e Philippe O. A. Navaux Universidade Regional do Noroeste

Leia mais

29/3/2011. Primeira unidade de execução (pipe U): unidade de processamento completa, capaz de processar qualquer instrução;

29/3/2011. Primeira unidade de execução (pipe U): unidade de processamento completa, capaz de processar qualquer instrução; Em 1993, foi lançada a primeira versão do processador Pentium, que operava a 60 MHz Além do uso otimizado da memória cache (tecnologia já amadurecida) e da multiplicação do clock, o Pentium passou a utilizar

Leia mais

PROCESSADOR CELL BROADBAND ENGINE (MECANISMO DE BANDA LARGA)

PROCESSADOR CELL BROADBAND ENGINE (MECANISMO DE BANDA LARGA) PROCESSADOR CELL BROADBAND ENGINE (MECANISMO DE BANDA LARGA) SACCA, Juliana 1 ; KOYAMA, Julio César Hiroshi 2 ; TAMAE, Yoshio Rodrigo 3, MUZZI, Fernando Augusto Garcia 3. 1 Acadêmico do Curso de Sistemas

Leia mais

Ricardo Gonçalves 2013/2014. Arquitecturas Multicore

Ricardo Gonçalves 2013/2014. Arquitecturas Multicore Ricardo Gonçalves 2013/2014 Arquitecturas Multicore Outline Introdução Processador Multi-core: o que é? Do multi-processador ao multi-core Evolução dos processadores multi-core Arquitecturas multi-core

Leia mais

AULA1 Introdução a Microprocessadores gerais

AULA1 Introdução a Microprocessadores gerais AULA1 Introdução a Microprocessadores gerais Disciplina: Aplicações Avançadas de Microprocessadores (AAM) Prof. Eduardo Henrique Couto ehcouto@hotmail.com 2014/1 Apresentação do Professor: Cronograma:

Leia mais

SIS17 - Arquitetura de Computadores. Introdução (Parte III)

SIS17 - Arquitetura de Computadores. Introdução (Parte III) SIS17 - Arquitetura de Computadores Introdução (Parte III) Espectro Computacional (Visão Geral) Servidor Estações de Trabalho Mainframe Supercomputador TIPO Computadores de uso comum (pequenos chips) Computadores

Leia mais

Organização de Computadores 2005/2006 Processamento Paralelo

Organização de Computadores 2005/2006 Processamento Paralelo Organização de Computadores 2005/2006 Processamento Paralelo Paulo Ferreira paf a dei.isep.ipp.pt Maio de 2006 Introdução 2 Porquê?...........................................................................................

Leia mais

História. Pioneiros AMD

História. Pioneiros AMD História Pioneiros AMD Marco na História 1969 AMD estabelece sede em Sunnyvale, Califórnia. 1970 AMD lança seu primeiro contador Lógico. 1982 A pedido da IBM, AMD assina um acordo para servir como uma

Leia mais

7 Processamento Paralelo

7 Processamento Paralelo 7 Processamento Paralelo Yes, of course, who has time? Who has time? But then if we do not ever take time, how can we ever have time? (The Matrix) 7.1 Introdução Classificação de Sistemas Paralelos Diversas

Leia mais

Hardware. Objetivos da aula. Fornecer exemplos de processadores Intel. Esclarecer as diferenças e as tecnologias embutidas nos processadores Intel.

Hardware. Objetivos da aula. Fornecer exemplos de processadores Intel. Esclarecer as diferenças e as tecnologias embutidas nos processadores Intel. Hardware UCP Unidade Central de Processamento Características dos processadores Intel Disciplina: Organização e Arquitetura de Computadores Prof. Luiz Antonio do Nascimento Faculdade Nossa Cidade Objetivos

Leia mais

periféricos: interfaces humano-computador (HCI) arquivo de informação comunicações

periféricos: interfaces humano-computador (HCI) arquivo de informação comunicações Introdução aos Sistemas de Computação (6) Análise de componentes num computador Estrutura do tema ISC 1. Representação de informação num computador 2. Organização e estrutura interna dum computador 3.

Leia mais

Arquitetura e Organização de Computadores 2

Arquitetura e Organização de Computadores 2 Arquitetura e Organização de Computadores 2 Escalonamento Estático e Arquiteturas VLIW Dynamic Scheduling, Multiple Issue, and Speculation Modern microarchitectures: Dynamic scheduling + multiple issue

Leia mais

Capítulo 1 Introdução

Capítulo 1 Introdução Capítulo 1 Introdução Programa: Seqüência de instruções descrevendo como executar uma determinada tarefa. Computador: Conjunto do hardware + Software Os circuitos eletrônicos de um determinado computador

Leia mais

Sistemas Operacionais

Sistemas Operacionais Sistemas Operacionais SISTEMAS COM MÚLTIPLOS PROCESSADORES LIVRO TEXTO: CAPÍTULO 13, PÁGINA 243 Prof. Pedro Luís Antonelli Anhanguera Educacional INTRODUÇÃO Arquiteturas que possuem duas ou mais CPUs interligadas

Leia mais

Imagem retirada de documentações de treinamentos oficiais INTEL

Imagem retirada de documentações de treinamentos oficiais INTEL O que é Hyper-Threading (HT)? Hyper-Threading (HT) é uma tecnologia existe nos processadores que visa explorar com mais eficiência o uso da CPU, o grande foco desta tecnologia é evitar ociosidade de processamento

Leia mais

Sistema de Computação

Sistema de Computação Sistema de Computação Máquinas multinível Nível 0 verdadeiro hardware da máquina, executando os programas em linguagem de máquina de nível 1 (portas lógicas); Nível 1 Composto por registrados e pela ALU

Leia mais

Introdução à Organização de Computadores. Sistemas da Computação Prof. Rossano Pablo Pinto, Msc. rossano at gmail com 2 semestre 2007

Introdução à Organização de Computadores. Sistemas da Computação Prof. Rossano Pablo Pinto, Msc. rossano at gmail com 2 semestre 2007 Introdução à Organização de Computadores Sistemas da Computação Prof. Rossano Pablo Pinto, Msc. rossano at gmail com 2 semestre 2007 Tópicos Processadores Memória Principal Memória Secundária Entrada e

Leia mais

Microprocessadores II - ELE 1084

Microprocessadores II - ELE 1084 Microprocessadores II - ELE 1084 CAPÍTULO III PROCESSADORES P5 3.1 Gerações de Processadores 3.1 Gerações de Processadores Quinta Geração (P5) Pentium (586) 32 bits; Instruções MMX; Concorrente K5 (AMD).

Leia mais

HARDWARE Montagem e Manutenção de Computadores Instrutor: Luiz Henrique Goulart 15ª AULA OBJETIVOS: PROCESSADORES EVOLUÇÃO / GERAÇÕES BARRAMENTO (BITS) FREQÜÊNCIA (MHZ) OVERCLOCK ENCAPSULAMENTO APOSTILA

Leia mais

Prof. Marcelo de Sá Barbosa SISTEMAS DISTRIBUIDOS

Prof. Marcelo de Sá Barbosa SISTEMAS DISTRIBUIDOS Prof. Marcelo de Sá Barbosa SISTEMAS DISTRIBUIDOS 1. Introdução a supercomputação 2. Visão geral de Mainframe 3. Cluster de computadores 4. Cluster Beowulf considerações de projeto 5. Cluster x Grid 6.

Leia mais

Ensino de Arquiteturas de Processadores Multi-Core Através de um Sistema de Simulação Completo e da Experiência de um Projeto de Pesquisa *

Ensino de Arquiteturas de Processadores Multi-Core Através de um Sistema de Simulação Completo e da Experiência de um Projeto de Pesquisa * Ensino de Arquiteturas de Processadores Multi-Core Através de um Sistema de Simulação Completo e da Experiência de um Projeto de Pesquisa * Henrique C. Freitas, Marco A. Z. Alves, Nicolas B. Maillard,

Leia mais

Introdução à Organização de Computadores. Execução de Programas Prof. Rossano Pablo Pinto, Msc. rossano at gmail com 2 semestre 2007

Introdução à Organização de Computadores. Execução de Programas Prof. Rossano Pablo Pinto, Msc. rossano at gmail com 2 semestre 2007 Introdução à Organização de Computadores Execução de Programas Prof. Rossano Pablo Pinto, Msc. rossano at gmail com 2 semestre 2007 CPU (Central Processing Unit) é o coordenador de todas as atividades

Leia mais

O que é Arquitetura de Computadores?

O que é Arquitetura de Computadores? O que é Arquitetura de Computadores? Forças Coordenação de um conjunto de níveis de abstração de um computador sobre um grande conjunto de forças de mudança Arquitetura de Computadores = Arquitetura de

Leia mais

Microarquiteturas Avançadas

Microarquiteturas Avançadas Univ ersidade Federal do Rio de Janei ro Info rmátic a DCC/IM Arquitetura de Computadores II Microarquiteturas Avançadas Gabrie l P. Silva Introdução As arquiteturas dos processadores têm evoluído ao longo

Leia mais

PROJETO LÓGICO DE COMPUTADORES Prof. Ricardo Rodrigues Barcelar http://www.ricardobarcelar.com.br

PROJETO LÓGICO DE COMPUTADORES Prof. Ricardo Rodrigues Barcelar http://www.ricardobarcelar.com.br - Aula 6 - ARQUITETURAS AVANÇADAS DE COMPUTADORES 1. INTRODUÇÃO As arquiteturas dos processadores têm evoluído ao longo dos anos, e junto com ela o conceito de arquitetura avançada tem se modificado. Nos

Leia mais

CAPÍTULO 2 ORGANIZAÇÃO DE COMPUTADORES

CAPÍTULO 2 ORGANIZAÇÃO DE COMPUTADORES CAPÍTULO 2 ORGANIZAÇÃO DE COMPUTADORES 2.1 Organização de um Computador Típico : Armazena dados e programas. Processador (CPU - Central Processing Unit): Executa programas armazenados na memória, interpretando

Leia mais

} Monolíticas Aplicações em um computador centralizado. } Em Rede Aplicações com comunicação em rede. } Distribuídas Comunicação e cooperação em rede

} Monolíticas Aplicações em um computador centralizado. } Em Rede Aplicações com comunicação em rede. } Distribuídas Comunicação e cooperação em rede Prof. Samuel Souza } Monolíticas Aplicações em um computador centralizado } Em Rede Aplicações com comunicação em rede } Distribuídas Comunicação e cooperação em rede } Aplicações que são funcionalmente

Leia mais

Arquitetura e Organização de Computadores

Arquitetura e Organização de Computadores Arquitetura e Organização de Computadores Fernando Fonseca Ramos Faculdade de Ciência e Tecnologia de Montes Claros Fundação Educacional Montes Claros 1 Índice 1- Introdução 3- Memórias 4- Dispositivos

Leia mais

Máquinas Multiníveis

Máquinas Multiníveis Infra-Estrutura de Hardware Máquinas Multiníveis Prof. Edilberto Silva www.edilms.eti.br edilms@yahoo.com Sumário Conceitos básicos Classificação de arquiteturas Tendências da tecnologia Família Pentium

Leia mais

Paradigmas de Computação

Paradigmas de Computação UCE- Computação Paralela e Distribuída Paradigmas de Computação João Luís Ferreira Sobral www.di.uminho.pt/~jls jls@... http://alba.di.uminho.pt/... 1 Paradigmas de Computação Paralela Resultados da Aprendizagem!

Leia mais

Microprocessadores II - ELE 1084

Microprocessadores II - ELE 1084 Microprocessadores II - ELE 1084 CAPÍTULO III OS PROCESSADORES 3.1 Gerações de Processadores 3.1 Gerações de Processadores Primeira Geração (P1) Início da arquitetura de 16 bits CPU 8086 e 8088; 20 bits

Leia mais

Arquitetura de Von Neumann e os Computadores Modernos

Arquitetura de Von Neumann e os Computadores Modernos Arquitetura de Von Neumann e os Computadores Modernos Arquitetura de Computadores e Software Básico Aula 5 Flávia Maristela (flaviamsn@ifba.edu.br) Arquitetura de Von Neumann e as máquinas modernas Onde

Leia mais

4 Computação Paralela 4.1. Introdução

4 Computação Paralela 4.1. Introdução 4 Computação Paralela 4.1. Introdução Nos últimos anos observa-se uma tendência cada vez maior do aumento da demanda computacional na resolução de grandes problemas. Exemplos de aplicações que exigem alto

Leia mais

ARQUITETURA DE COMPUTADORES

ARQUITETURA DE COMPUTADORES ARQUITETURA DE COMPUTADORES Aula 10: UCP Evolução - II Evolução dos processadores - II Arquitetura superescalar (ou multiescalar); Exec. fora de ordem / Renomeamento de regs. Tecnologias SIMD / SSE Tecnologia

Leia mais

Manutenção de Computadores Montagem de microcomputadores: Entendendo melhor os processadores. Professor: Francisco Ary

Manutenção de Computadores Montagem de microcomputadores: Entendendo melhor os processadores. Professor: Francisco Ary Manutenção de Computadores Montagem de microcomputadores: Entendendo melhor os processadores Professor: Francisco Ary Introdução O processador é um dos componentes mais importantes (e geralmente o mais

Leia mais

Unidade 4 Paralelismo em Nível de Instrução. Filipe Moura de Lima Gutenberg Pessoa Botelho Neto Thiago Vinícius Freire de Araújo Ribeiro

Unidade 4 Paralelismo em Nível de Instrução. Filipe Moura de Lima Gutenberg Pessoa Botelho Neto Thiago Vinícius Freire de Araújo Ribeiro Unidade 4 Paralelismo em Nível de Instrução Filipe Moura de Lima Gutenberg Pessoa Botelho Neto Thiago Vinícius Freire de Araújo Ribeiro Sumário Introdução O Pipeline Pipeline em diferentes CPUs ARM Cortex-A9

Leia mais

Arquitetura e Organização de Computadores. Capítulo 0 - Introdução

Arquitetura e Organização de Computadores. Capítulo 0 - Introdução Arquitetura e Organização de Computadores Capítulo 0 - Introdução POR QUE ESTUDAR ARQUITETURA DE COMPUTADORES? 2 https://www.cis.upenn.edu/~milom/cis501-fall12/ Entender para onde os computadores estão

Leia mais

Multicomputadores. Universidade Federal do Vale do São Francisco - UNIVASF Colegiado de Engenharia da Computação CECOMP

Multicomputadores. Universidade Federal do Vale do São Francisco - UNIVASF Colegiado de Engenharia da Computação CECOMP Multicomputadores Introdução Vimos que existem dois tipos de processadores paralelos MIMD: Multiprocessadores. Multicomputadores. Nos multiprocessadores, existe uma memória compartilhada que pode ser acessada

Leia mais

Sistemas Paralelos e Distribuídos. Prof. Jorge Dantas de Melo Depto. Eng. Comp. e Automação CT - UFRN

Sistemas Paralelos e Distribuídos. Prof. Jorge Dantas de Melo Depto. Eng. Comp. e Automação CT - UFRN Sistemas Paralelos e Distribuídos Prof. Jorge Dantas de Melo Depto. Eng. Comp. e Automação CT - UFRN Conceitos preliminares Paralelismo refere-se a ocorrência simultânea de eventos em um computador Processamento

Leia mais

Exemplo: CC1 CC2 CC3 CC4 CC5 CC6 CC7 CC8 CC9 ADD $s0, $t0, $t1 IF ID EX MEM WB SUB $t2, $s0, $t3 IF Stall Stall ID EX MEM WB

Exemplo: CC1 CC2 CC3 CC4 CC5 CC6 CC7 CC8 CC9 ADD $s0, $t0, $t1 IF ID EX MEM WB SUB $t2, $s0, $t3 IF Stall Stall ID EX MEM WB 2.3 Dependências de dados (Data Hazards) Ocorre quando uma instrução depende do resultado de outra instrução que ainda está no pipeline. Este tipo de dependência é originado na natureza seqüencial do código

Leia mais

sobre seus registros de forma independente

sobre seus registros de forma independente Técnicas, mercado e fundamentos de processadores multi-núcleo Gêmeos Os processadores de múltiplos núcleos estão conquistando tanto servidores quanto desktops e até mesmo notebooks. Conheça os termos que

Leia mais

LICENCIATURA EM COMPUTAÇÃO PROCESSADOR TEGRA 2

LICENCIATURA EM COMPUTAÇÃO PROCESSADOR TEGRA 2 LICENCIATURA EM COMPUTAÇÃO PROCESSADOR TEGRA 2 SANTO AMARO 2011 ANGELO RAMOS JACKELINE BARBOSA JEANDERVAL SANTOS PROCESSADOR TEGRA 2 Trabalho apresentado ao Instituto Federal de Ciências e Tecnologia da

Leia mais

23/05/2013. Partes do Sistema Computacional. Hardware. Ciclo do Processamento de Dados HARDWARE: CONCEITOS BÁSICOS. Hardware Software Dados Usuários

23/05/2013. Partes do Sistema Computacional. Hardware. Ciclo do Processamento de Dados HARDWARE: CONCEITOS BÁSICOS. Hardware Software Dados Usuários 2 Partes do Sistema Computacional HARDWARE: CONCEITOS BÁSICOS Software Dados Usuários Introdução à Microinformática Prof. João Paulo Lima Universidade Federal Rural de Pernambuco Departamento de Estatística

Leia mais

slide 0 Algoritmos Paralelos

slide 0 Algoritmos Paralelos slide 0 Algoritmos Paralelos Slide 2 Demanda por Velocidade Computational Demanda contínua por maior rapidez computational das máquinas que as atualmente disponíveis. As áreas que exigem maior rapidez

Leia mais

Unidade Central de Processamento (CPU) Processador. Renan Manola Introdução ao Computador 2010/01

Unidade Central de Processamento (CPU) Processador. Renan Manola Introdução ao Computador 2010/01 Unidade Central de Processamento (CPU) Processador Renan Manola Introdução ao Computador 2010/01 Componentes de um Computador (1) Computador Eletrônico Digital É um sistema composto por: Memória Principal

Leia mais

PROCESSADORES HT, DUAL CORE E TURION 64

PROCESSADORES HT, DUAL CORE E TURION 64 FACULDADE DE CIÊNCIAS APLICADAS SAGRADO CORAÇÃO DIRETORIA DE ENSINO SUPERIOR COLEGIADO DE SISTEMAS DE INFORMAÇÃO ALÉCIO FRANÇA ANDRÉ GOMES SANTANA EDUARDO DOS SANTOS SOPRANI CONCEIÇÃO EROS ALVES GUSTAVO

Leia mais

Arquitecturas Paralelas I. Computação Paralela. João Luís Ferreira Sobral www.di.uminho.pt/~jls jls@... http://gec.di.uminho.

Arquitecturas Paralelas I. Computação Paralela. João Luís Ferreira Sobral www.di.uminho.pt/~jls jls@... http://gec.di.uminho. Arquitecturas Paralelas I Computação Paralela João Luís Ferreira Sobral www.di.uminho.pt/~jls jls@... http://gec.di.uminho.pt/lesi/ap1 1 Computação paralela Resultados da Aprendizagem Conceber, implementar

Leia mais

Arquitecturas Paralelas I Computação Paralela em Larga Escala. Introdução

Arquitecturas Paralelas I Computação Paralela em Larga Escala. Introdução Arquitecturas Paralelas I Computação Paralela em Larga Escala LESI - 4º Ano Introdução João Luís Ferreira Sobral Departamento do Informática Universidade do Minho Setembro 2003 Programa Introdução e objectivos

Leia mais

Microprocessadores. Prof. Leonardo Barreto Campos 1

Microprocessadores. Prof. Leonardo Barreto Campos 1 Microprocessadores Prof. Leonardo Barreto Campos 1 Sumário Introdução; Arquitetura de Microprocessadores; Unidade de Controle UC; Unidade Lógica Aritméticas ULA; Arquitetura de von Neumann; Execução de

Leia mais

Paralelização Introdução a vetorização, OpenMP e MPI

Paralelização Introdução a vetorização, OpenMP e MPI 1/45 Paralelização Introdução a vetorização, OpenMP e MPI 1 Conceitos Paulo Penteado IAG / USP pp.penteado@gmail.com Esta apresentação: Arquivos do curso: Artigo relacionado: http://www.ppenteado.net/ast/pp_para_on/pp_para_on_1.pdf

Leia mais

Auditoria de senhas em hardware paralelo com o John the Ripper O impacto das tecnologias de processamento paralelo na quebra de senhas

Auditoria de senhas em hardware paralelo com o John the Ripper O impacto das tecnologias de processamento paralelo na quebra de senhas Auditoria de senhas em hardware paralelo com o John the Ripper O impacto das tecnologias de processamento paralelo na quebra de senhas Claudio André claudio.andre@correios.net.br Motivação Seu computador

Leia mais

Aula 26: Arquiteturas RISC vs. CISC

Aula 26: Arquiteturas RISC vs. CISC Aula 26: Arquiteturas RISC vs CISC Diego Passos Universidade Federal Fluminense Fundamentos de Arquiteturas de Computadores Diego Passos (UFF) Arquiteturas RISC vs CISC FAC 1 / 33 Revisão Diego Passos

Leia mais

Resumo. Introdução Cluster Cluster Beowulf Curiosidades Conclução

Resumo. Introdução Cluster Cluster Beowulf Curiosidades Conclução Cluster Resumo Introdução Cluster Cluster Beowulf Curiosidades Conclução Introdução Sua empresa esta precisando fazer um grande processamento; As Nuvens existentes não são suficientes para sua empresa;

Leia mais

William Stallings Arquitetura e Organização de Computadores 8 a Edição. retrospectiva. 2010 Pearson Prentice Hall. Todos os direitos reservados.

William Stallings Arquitetura e Organização de Computadores 8 a Edição. retrospectiva. 2010 Pearson Prentice Hall. Todos os direitos reservados. William Stallings Arquitetura e Organização de Computadores 8 a Edição retrospectiva slide 1 Organização e arquitetura Arquitetura são os atributos visíveis ao programador. Conjunto de instruções, número

Leia mais

Microprocessadores. Cap. 2 Microprocessador, operação de hardware e computação

Microprocessadores. Cap. 2 Microprocessador, operação de hardware e computação Microprocessadores Cap. 2 Microprocessador, operação de hardware e computação Sumário 2.1 Arquiteturas microprocessadas 2.2. Diagrama de blocos (arquitetura, registradores, ALU, etc.) 2.3. Barramentos

Leia mais

O Processador Intel Itanium II

O Processador Intel Itanium II O Processador Intel Itanium II Claudio Schepke 1 Instituto de Informática Universidade Federal do Rio Grande do Sul Caixa Postal 15064 90501-970 Porto Alegre, RS cschepke@inf.ufrgs.br Resumo. A construção

Leia mais

Duo Core Autor: Luciano Pinheiro dos Santos

Duo Core Autor: Luciano Pinheiro dos Santos 3 Duo Core Autor: Luciano Pinheiro dos Santos 4 História do Core Duo A idéia de processamento duplo adota-se já faz tempo. Esse emprego é mais perceptível nos computadores de grande porte, servidores ou

Leia mais

ANHANGUERA EDUCACIONAL. Capítulo 2. Conceitos de Hardware e Software

ANHANGUERA EDUCACIONAL. Capítulo 2. Conceitos de Hardware e Software ANHANGUERA EDUCACIONAL Capítulo 2 Conceitos de Hardware e Software Hardware Um sistema computacional é um conjunto de de circuitos eletronicos. Unidade funcionais: processador, memória principal, dispositivo

Leia mais

Arquiteturas que Exploram Paralismos: VLIW e Superscalar. Ch9 1

Arquiteturas que Exploram Paralismos: VLIW e Superscalar. Ch9 1 Arquiteturas que Exploram Paralismos: VLIW e Superscalar Ch9 1 Introdução VLIW (Very Long Instruction Word): Compilador empacota um número fixo de operações em uma instrução VLIW As operações dentro de

Leia mais

Computação de Alta Perfomance com Software Livre (Clusters)

Computação de Alta Perfomance com Software Livre (Clusters) Computação de Alta Perfomance com Software Livre (Clusters) 3º Seminário de Tecnologia da Informação UCSal Marcelo Soares Souza (marcelo@cebacad.net) CEBACAD Centro Baiano de Computação de alto Desempenho

Leia mais

PROCESSADORES. INTEL x AMD

PROCESSADORES. INTEL x AMD PROCESSADORES INTEL x AMD 1 Microprocessadores Definição: Um microprocessador é um circuito integrado digital que realiza operações matemáticas e lógicas para cumprir determinada tarefa de acordo com uma

Leia mais