Arquiteturas Paralelas
|
|
|
- Luiz Felipe Faria Borges
- 8 Há anos
- Visualizações:
Transcrição
1 Apresentação Prof. Marcos José Brusso Arquiteturas Paralelas Prof. Ms. Marcos José Brusso Universidade de Passo Fundo Formação Graduação: Ciência da Computação, UPF/1994 Mestrado: Ciência da Computação, UFRG/2000 Atividades Professor Adjunto do ICG/UPF Coordenador da specialização em Desenvolvimento de oftware Coordenador projeto Kelix Prof. Dr. César A. F. De Rose Pontifícia Universidade Católica do Rio Grande do ul 2 Apresentação Prof. César De Rose umário Formação Graduação em Ciência da Computação - PUCR (1990), Mestrado em Ciência da Computação - UFRG (1993) Doutorado em Ciência da Computação pela Universidade de Karlsruhe, Alemanha (1998) Atividades Professor Adjunto da PUCR Coordena o Laboratório de Alto Desempenho da PUCR (LAD-PUCR) Introdução Motivação Classificação de Máquinas Paralelas Tendências na Construção de Máquinas Paralelas Máquinas Agregadas studo de Casos Comparação ntre Modelos Tópicos Atuais Bibliografia 3 4 volução das Arquiteturas Arquitetura Tradicional Uma única unidade ativa Introdução Unidades de / autônomas x.: DMA Multiprogramação 5 6
2 volução das Arquiteturas Hierarquia de Acelerar alimentação da Pipeline de instrução uperescalar Pipeline de dados Máquinas vetoriais L1 L2 F D W F D W F D W L1 L2 Objetivo desta volução Acelerar o processamento dos dados pela Liberando (delegando tarefas) Controle do barramento Tratamento de / Acelerando a alimentação da Hierarquia de memória obrepondo ciclos da Pipeline de instrução Acelerar o processamento dos dados construindo arquiteturas com múltiplas s Arquiteturas Paralelas 7 8 Por Que Pesquisar AP? Motivação Contribui para o ganho de desempenho de arquiteturas convencionais Alternativa para quando limites físicos forem atingidos Alternativa para aplicações com demanda imediata por alto desempenho imulação (previsão do tempo, modelos físicos, biológicos) Computação gráfica Por Que Pesquisar AP? Por Que studar AP? olução de aplicações complexas (científicas, industriais e militares) Meteorologia Prospeção de petróleo Análise de local para perfuração de poços de petróleo imulações físicas Aerodinâmica; energia nuclear Matemática computacional Análise de algoritmos para criptografia Bioinformática imulação computacional da dinâmica molecular de proteínas Domínio da terminologia utilizada na especificação de arquiteturas scolha / Construção da melhor arquitetura para o uso desejado Programação eficiente da máquina No caso de PPD, conhecimento da arquitetura da máquina influencia diretamente o desempenho da aplicação 11 12
3 Por Que studar Classificações? Classificação de Máquinas Paralelas Identificar o critério da classificação Por que é importante Quais as suas implicações Analisar todas as possibilidades Mesmo as classes que não foram implementadas Ou implementações que não deram certo Como ocorreu a evolução da área Como pode evoluir Classificação de Flynn Classe ID Classificação genérica (1970) Diferencia se o fluxo de instruções (instruction stream) e o fluxo de dados (data stream) são múltiplos ou não ingle Instruction tream, ingle Data tream Um único fluxo de instruções Um único fluxo de dados Arquiteturas tradicionais não paralelas Máquinas de von Neumann tradicionais ingle Instruction Multiple Instruction ingle Data ID MID Multiple Data IMD MIMD Classe MID Classe IMD Multiple Instruction tream, ingle Data tream Múltiplos fluxos de instruções Um único fluxo de dados Ainda sem implementação ingle Instruction tream, Multiple Data tream Um único fluxo de instruções Múltiplos fluxos de dados xecução síncrona Arquiteturas Array CM-2, MP
4 Classe MIMD Classificação segundo o Compartilhamento de Multiple Instruction tream, Multiple Data tream Múltiplos fluxos de instruções Múltiplos fluxos de dados Vários programas sobre vários dados Arquiteturas Paralelas Modernas Dependendo da máquina paralela utilizar uma memória compartilhada por todos os processadores, pode-se diferenciar: Multiprocessadores Multicomputadores Multiprocessador Multiprocessador Compartilha uma memória central Arquitetura tradicional com vários processadores Um único espaço de endereçamento Comunicação através da memória Variáveis compartilhadas m um multiprocessador a memória é disputada pelos processadores Muitas vezes endereços são diferentes Posso quebrar memória em diferentes módulos para permitir múltiplos acessos ntrelaçada (interleaved) Bloco único ntrelaçada Multiprocessador Multicomputador Não adianta a memória suportar múltiplos acessos se o barramento suporta apenas uma transação por vez Ideal: rede não bloqueante com suporte a várias transações simultâneas x: Matriz de Chaveamento (crossbar) Não compartilha memória Interligação de várias arquiteturas tradicionais Cada uma possui sua memória local Múltiplos espaços de endereçamento privados Comunicação por troca de mensagens 23 24
5 Classificação egundo o Tipo de Acesso à Multiprocessadores UMA Multiprocessadores UMA NCC-NUMA CC-NUMA C-NUMA COMA Uniform Memory Access centralizada (mesma distância de todos os processadores) Custo único de acesso Necessário tratar coerência das caches Multiprocessadores NUMA Multiprocessadores NUMA Non Uniform Memory Access Único espaço de endereçamento distribuída (distâncias diferentes) Custo não uniforme de acesso à memória m relação ao tratamento do problema de coerência de cache NCC-NUMA Non Cache-Coherent NUMA CC-NUMA Cache-Coherent NUMA Implementada em hardware C-NUMA oftware-coherent NUMA Implementada em software DM (Distributed hared Memory) Multiprocessadores COMA Multicomputadores NORMA Cache-only Memory Architecture s locais são caches (COMA caches) Gerência de caches na MMU Non-Remote Memory Access) Apenas acesso local à memória 29 30
6 Resumo da Classificação Redes de Interconexão Redes de Interconexão Redes státicas Implementa comunicação N:N com redes estáticas ou dinâmicas stática Roteamento em hardware Anel Torus... Dinâmica Chaveadores (switches) Interligadas através de ligações fixas ntre cada componente existe ligação direta dedicada Topologia (estrutura de interligação) determina características da rede No caso das máquinas paralelas são normalmente regulares Redes státicas Anel Baixa escalabilidade (aumento um a um até 12) Problemas com Tolerância a Falhas Uni ou bidirecional Grau do nó: 2 Array linear strela Anel imples Anel Cordado Anel Completo 35 36
7 Torus Malha com extremidades interligadas Roteamento simplificado Boa escalabilidade (aumento linha ou coluna até 12x12) Grau do nó: 4 Redes Dinâmicas Não há topologia fixa Rede adapta-se dinamicamente, por demanda Barramento Matriz de Chaveamento (Crossbar) Redes Multinível Malha Torus Matriz de Chaveamento Roteamento Crossbar Baixa escalabilidade (limite é o número de portas) Alto custo Bidirecional Grau do nó 1 Rede de interconexão normalmente não possui ligações diretas entre todos os nós Mensagem precisa trafegar por nós intermediários para chegar ao destino A condução da mensagem é chamada de roteamento Duas formas de condução Chaveamento de circuito (circuit switching) Chaveamento de pacotes (packet switching) Chaveamento de Circuito Chaveamento de Pacotes Mais usado em redes de telecomunicações stabeleço inicialmente o caminho (alto custo) nvio posteriormente os dados Mais comum em máquinas paralelas Não existe caminho pré-definido em custo inicial Custo adicional em cada nó em reserva de canal 41 42
8 Plataformas Tradicionais para PPD Plataformas Tradicionais para PPD PVP Processadores Vetoriais MP Multiprocessadores imétricos com memória compartilhada MPP Multicomputadores Maciçamente Paralelos com múltiplas memórias locais NOW Redes de stações de Trabalho Arquitetura e características bem diferentes!!! PVP... Parallel Vector Processor Interconexão compartilhada (UMA) Comunicação através da memória Matriz de chaveamento M M M Permite acesso concorrente a memória Baixa escalabilidade (poucos processadores) Grandes registradores, sem caches x: Cray C90, Cray T-90, NC X-4 VP VP VP PVP: xemplos NC X6 Cray T MP P ymmetric Multiprocessor... P compartilhada (UMA) Interconexão Comunicação através da memória Interconexão por barramento Baixa escalabilidade (poucos processadores) Fácil programação x: GI Power Challenge, un parc ntrerprise, ervidor x86 Dual/Quad P MP: xemplos un PARC nterprise T5440 erver (até 4 UltraPARC T2 Plus) IBM eerver p5 550 (2 ou 4 POWR5) 47 48
9 MPP... P Massively Parallel Processors Múltiplas memórias locais Comunicação por troca de mensagens Interconexão por rede de alta velocidade (proprietária) P M P M Interconexão Boa escalabilidade (muitos processadores) Programação mais complicada x: Intel Paragon, Cray T3, Thinking Machines CM-5 M MPP: xemplos IBM P2 Intel Paragon Connection Machine CM NOW Network of Workstations Múltiplas memórias locais Comunicação por troca de mensagens Interconectados por rede tradicional Difícil programação x: PCs interligadas por rede thernet... PC PC PC Rede NOW: xemplo Comparação urge Uma Nova Classe PVP MP MPP NOW Número de Ps Baixo Baixo Alto Médio scalabilidade Baixa Baixa Alta Média Latência de Comunicação Baixa Média Baixa Alta Programação Média Fácil Difícil Difícil PVP MP MPP NOW Máquinas Agregadas Cluster of Workstations (COW) Redes de estações dedicadas ao Processamento Paralelo Interconectadas por novas tecnologias de redes locais (baixa latência) Otimização de NOW Procura aliar vantagens das outras quatro classes 53 54
10 Máquinas Agregadas Baixo custo (NOW) Baixa latência na comunicação (MPP) distribuída (MPP) e/ou compartilhada (MP) Boa escalabilidade (MPP) COW: xemplos Clusters Amazônia e Ombrófila CPAD-PUCR/HP COW: xemplos Construção de COW s HP i-cluster Grenoble Atualmente há duas tendências Interligadas por rede rápida Impulsionada por fabricantes de placas de rede especiais Alto custo por nó compromete escalabildade Máquinas de pequeno e médio porte (dezenas de nós) Interligadas por rede thernet Impulsionada por grandes fabricantes (HP, IBM) Máquinas de grande porte (centenas de nós) Como Obter Baixa Latência Myrinet Placas de interconexão (rede) otimizadas Conexão ponto-a-ponto entre estações Interconexão por redes estáticas ou dinâmicas Implementação de protocolos de rede em HW Implementa troca de mensagens (NORMA) Latência em torno de 2µs Vazão 1.2 GBytes/s Interligação através de switch de alto desempenho 59 60
11 CI InfiniBand calable Coherent Interface Padrão I Implementa troca de mensagens e memória compartilhada (NORMA, NUMA) Latência em torno de 5µs Vazão 6.4 Gbits/s Interligação em anel ou switch de alto desempenho Tecnologia para comunicação Computador/Computador Computador/IO Latência em torno de 1µs Vazão 40 Gb/s uporta Remote Direct Memory Access (RDMA) COW - Configuração Mínima Aproveitamento das máquinas mais rápidas como nós (homogêneo) - 8 nós Aproveitamento de uma máquina como hospedeira Não participa do cluster (simétrico) Bloqueia acesso direto ao cluster Função de console istema Operacional Linux Rede de interconexão de baixa latência ou uso de switch Fast-thernet Configuração Mínima witch Fast-thernet Hospedeira... Cluster... Rede Configuração Avançada Máquinas MP como nós (dual) - 16 nós Redes de interconexão primária e secundária Rede primária para comunicação (rede rápida) Rede secundária para gerência e monitoração Configuração Avançada... Rede ecundária Rede Primária Hospedeiras Console Gerência e Monitoração Acesso remoto Rede 65 66
12 Lista TOP Benchmark: Linpack Última lista: novembro de 2009 Top500: Os Top 5 Rank Computer/Year Vendor Cores Rmax Rpeak Power 1 Jaguar - Cray XT5-H Opteron ix Core 2.6 GHz / 2009 Cray Inc. 2 Roadrunner - BladeCenter Q22/L21 Cluster, PowerXCell 8i 3.2 Ghz / Opteron DC 1.8 GHz, Voltaire Infiniband / 2009 IBM 3 Kraken XT5 - Cray XT5-H Opteron ix Core 2.6 GHz / 2009 Cray Inc. 4 JUGN - Blue Gene/P olution / 2009 IBM Tianhe-1 - NUDT TH-1 Cluster, Xeon 5540/5450, ATI Radeon HD , Infiniband / 2009 NUDT Jaguar -Cray XT5 Top Top500 Tópicos Atuais 71 72
13 MT - imultaneous Multithreading MT - imultaneous multithreading Abordagem multi-thread 2 ou mais threads podem executar simultaneamente no mesmo processador Não há troca de contexto para execução dos threads Processador virtualmente duplicado n processadores lógicos Objetivo: melhor utilização de recursos Intel comercializa como Hyper-Threading Componentes replicados (< 5% da área do chip) Contexto do processo em execução (pilha, regs de controle, etc) Concorrência na execução dos processos Controlador de interrupções Gerência concorrente de interrupções Recursos compartilhados entre processos Unidades de execução Cache Tecnologia Multicore Tecnologia Multicore Múltiplos cores (núcleos de execução) integrados em um único chip Multiplicação total dos recursos de processamento Vantagem: compatibilidade com código existente! xemplo: Intel Core i7 Quad core Agradecimentos: Professores Rafael antos e Gerson Cavalheiro Tecnologia Multicore Bibliografia De Rose, C.; Navaux, P. Arquiteturas Paralelas ditora agra-luzzatto Hwang, Kai; Xu - calable parallel computing, 1998 Culler, D.; ingh, J. - Parallel Computer Architecture, 1999 eitz et. al. - Myrinet, a gigabit-per-second Local Area Network. I Micro, 15, I:I tandard for calable Cherent Interface (CI). I tandard
30/5/2011. Sistemas computacionais para processamento paralelo e distribuído
Arquitetura de Computadores Sistemas computacionais para processamento paralelo e distribuído Prof. Marcos Quinet Universidade Federal Fluminense UFF Pólo Universitário de Rio das Ostras - PURO Processamento
Bacharelado em Sistemas de Informação Sistemas Operacionais. Prof. Filipo Mór
Bacharelado em Sistemas de Informação Sistemas Operacionais Prof. Filipo Mór WWW.FILIPOMOR.COM - REVISÃO ARQUITETURAS PARALELAS Evolução das Arquiteturas Evolução das Arquiteturas Entrada CPU Saída von
Arquiteturas Paralelas
Arquiteturas Paralelas Arquiteturas Paralelas Graduação em Ciência da Computação Universidade do Vale do Rio dos Sinos Prof. Gerson Cavalheiro Programação Paralela e Distribuída 2006 CC / UNISINOS Classificação
Introdução à Programação Paralela através de Padrões. Denise Stringhini Calebe Bianchini Luciano Silva
Introdução à Programação Paralela através de Padrões Denise Stringhini Calebe Bianchini Luciano Silva Sumário Introdução: conceitos de paralelismo Conceitos básicos sobre padrões de programação paralela
SSC510 Arquitetura de Computadores. 6ª aula
SSC510 Arquitetura de Computadores 6ª aula PARALELISMO EM NÍVEL DE PROCESSOS PROFA. SARITA MAZZINI BRUSCHI Tipos de Paralelismo Instrução (granulosidade fina) Paralelismo entre as instruções Arquiteturas
Sistemas Distribuídos
Sistemas Distribuídos Classificação de Flynn Fonte: Professoras. Sarita UFRJ e Thais V. Batista - UFRN Arquiteturas Paralelas Computação Paralela Conceitos Permite a execução das tarefas em menor tempo,
Arquitetura de Computadores Paralelos. Introdução Conceitos Básicos Ambientes de Programação Modelos de Programação Paralela
Arquitetura de Computadores Paralelos Introdução Conceitos Básicos Ambientes de Programação Modelos de Programação Paralela Por que estudar Computação Paralela e Distribuída? Os computadores sequenciais
Multiprogramação leve em arquiteturas multi-core
Multiprogramação leve em arquiteturas multi-core Prof. Dr. Departamento de Informática Universidade Federal de Pelotas Sumário Arquiteturas multi-core Programação multithread Ferramentas de programação
Aula 3 Redes de Interconexão
Aula 3 Redes de Interconexão As redes de interconexão são de fundamental importância nas arquiteturas paralelas Não importa o tipo da arquitetura, todo computador paralelo necessita de uma rede de interconexão
AULA 03: PROCESSAMENTO PARALELO: MULTIPROCESSADORES
ORGANIZAÇÃO E ARQUITETURA DE COMPUTADORES II AULA 03: PROCESSAMENTO PARALELO: MULTIPROCESSADORES Prof. Max Santana Rolemberg Farias [email protected] Colegiado de Engenharia de Computação MULTIPROCESSADORES
Arquitetura de Computadores. Processamento Paralelo
Arquitetura de Computadores Processamento Paralelo 1 Multiprogramação e Multiprocessamento Múltiplas organizações de computadores Single instruction, single data stream - SISD Single instruction, multiple
Organização de Computadores II. Arquiteturas MIMD
Organização de Computadores II Arquiteturas MIMD Arquiteturas UMA Arquiteturas com memória única global. Tempo de acesso uniforme para todos os nós de processamento. Nós de processamento e memória interconectados
Universidade Federal do Rio de Janeiro Informática DCC/IM. Arquitetura de Computadores II. Arquiteturas MIMD. Arquiteturas MIMD
Universidade Federal do Rio de Janeiro Informática DCC/IM Arquitetura de Computadores II Arquiteturas MIMD Arquiteturas MIMD As arquiteturas MIMD dividem-se em dois grandes modelos: Arquiteturas MIMD de
Disciplina de Arquitetura de Computadores
USP - ICMC - SSC SSC 0510 - Informática - 2o. Semestre 2009 Disciplina de Prof. Fernando Santos Osório Email: fosorio [at] { icmc. usp. br, gmail. com } Página Pessoal: http://www.icmc.usp.br/~fosorio/
1 Fundamentos de Processamento de Alto Desempenho
Fundamentos de Processamento de Alto Desempenho César De Rose, Philippe Navaux 3 1 Fundamentos de Processamento de Alto Desempenho César A. F. De Rose (PUCRS [email protected]) 1 Philippe O. A. Navaux
TOP Arquitetura dos supercomputadores
TOP 500 - Arquitetura dos supercomputadores Steven Koiti Tsukamoto Dezembro de 2010 Objetivos Os supercomputadores Top 500 A arquitetura Supercomputadores São máquinas de grande porte, capazes de processar
Programação Distribuída e Paralela. Jorge Barbosa
Programação Distribuída e Paralela Jorge Barbosa 1 Máquinas Paralelas Processadores Memória Rede de interligação Classificação das máquinas paralelas 2 Processador Escalar Processadores Processador que
Multiprocessamento. Patterson & Hennessy Capítulo 9. Arquitetura e Organização de Computadores Juliano M. Vieira (c) 2011
Multiprocessamento Patterson & Hennessy Capítulo 9 Arquitetura e Organização de Computadores Juliano M. Vieira (c) 2011 Tópicos Abordados Tipos comuns SMP (processamento paralelo) NUMA (placas de alto
PARALELISMO NO NÍVEL DO PROCESSADOR
UNIP Universidade Paulista. Campus Brasília. PARALELISMO NO NÍVEL DO PROCESSADOR ALUNO: Lucas da Silva Dias ALUNO: Gleidson Rosa da Silva ALUNO: Gustavo da Silva Martins ALUNO: Marcelo Nery Lima RA: C633EB-1
Processamento Paralelo
Processamento Paralelo por Helcio Wagner da Silva Introdução Tradicionalmente, o computador tem sido visto como uma máquina seqüencial Esta visão nunca foi completamente verdadeira No nível das µo, vários
Topologias de Arquiteturas de Comunicação
ORGANIZAÇÃO E ARQUITETURA DE COMPUTADORES Topologias de Arquiteturas de Comunicação Alexandre Amory Edson Moreno 2 / 31 Índice 1. Introdução 2. Topologias 3. Exercícios 3 / 31 Topologias de Infra-estruturas
ORGANIZAÇÃO E ARQUITETURA DE COMPUTADORES II AULA 04: PROCESSAMENTO PARALELO: MULTICOMPUTADOR
ORGANIZAÇÃO E ARQUITETURA DE COMPUTADORES II AULA 04: PROCESSAMENTO PARALELO: MULTICOMPUTADOR Prof. Max Santana Rolemberg Farias [email protected] Colegiado de Engenharia de Computação MULTICOMPUTADORES
Arquiteturas de Sistemas de Processamento Paralelo. Arquiteturas MIMD
Universidade Federal do Rio de Janeiro Pós-Graduação em Informática DCC/IM - NCE/UFRJ Arquiteturas de Sistemas de Processamento Paralelo Arquiteturas MIMD Arquiteturas MIMD com Memória Distribuída MIMD
Computação de alto desempenho
Computação de alto desempenho Aleardo Manacero Jr. DCCE/UNESP Grupo de Sistemas Paralelos e Distribuídos Programa 1. Introdução 2. Processadores para CAD 3. Sistemas de memória 4. Programação paralela
Computação de alto desempenho
Computação de alto desempenho Aleardo Manacero Jr. DCCE/UNESP Grupo de Sistemas Paralelos e Distribuídos Programa 1. Introdução 2. Processadores para CAD 3. Sistemas de memória 4. Paralelismo usando bibliotecas
Caracterização de Sistemas Distribuídos
Caracterização de Sistemas Distribuídos Roteiro Conceitos de Hardware Conceitos de Software Classificação de Flynn Classificação baseada no acesso a memória 2 Conceitos de HW Múltiplas CPUs Diferentes
Fundamentos de Processamento de Alto Desempenho
2 Fundamentos de rocessamento de Alto Desempenho César A. F. De Rose (UCRS [email protected]) 1 hilippe O. A. Navaux (UFRGS [email protected]) 2 Resumo: Neste curso, apresentam-se os conceitos básicos
speedup aprimorado aprimorado Fração aprimorada speedup aprimorado Fração aprimorada speedup aprimorado Tempo original Fração aprimorada aprimorado
Multiprocessadores - A evolução tecnológica dos processadores iria diminuir drasticamente. 2- O caminho para o aumento de desempenho é de unir mais de um processador para realizar a mesma tarefa em menos
ALGORÍTMOS PARALELOS (Aula 2) LCAD. Neyval C. Reis Jr. OUTUBRO/2004. Laboratório de Computação de Alto Desempenho DI/UFES
ALGORÍTMOS PARALELOS (Aula 2) Neyval C. Reis Jr. OUTUBRO/2004 LCAD Laboratório de Computação de Alto Desempenho DI/UFES Programa do Curso LCAD 1. Introdução 2. Arquitetura de Computadores 3. Arquiteturas
Sistemas distribuídos. Prof. Emiliano Monteiro
Sistemas distribuídos Prof. Emiliano Monteiro Múltiplos processadores São arquiteturas que possuem duas ou mais CPU interligadas e que funcionam em conjunto na execução de tarefas independentes ou no processamento
Evolução da Computação de Alto Desempenho sob a Ótica da Lis. ou (Se um processador já é rápido, imaginem um sistema com processadores :-)
Evolução da Computação de Alto Desempenho sob a Ótica da Lista TOP500 ou (Se um processador já é rápido, imaginem um sistema com 10.649.600 processadores :-) Siang Wun Song IME-USP Computação
Processadores para computação de alto desempenho
Processadores para computação de alto desempenho Aleardo Manacero Jr. DCCE/UNESP Grupo de Sistemas Paralelos e Distribuídos Introdução Nesta aula apresentaremos características de processadores e como
Sistemas Operacionais Distribuídos
Sistemas Operacionais Distribuídos Introdução O uso de redes locais e da Internet está amplamente difundido mesmo para uso doméstico. Mas para que tais recursos físicos sejam aproveitados da melhor forma
Ambientes de computação de alto desempenho no LNCC
Ambientes de computação de alto desempenho no LNCC Roberto Pinto Souto MCTI/LNCC/CSR - CENAPAD-RJ [email protected] 24 de Março de 2014 (Seminário da Pós-graduaçao) 24 de Março de 2014 1 / 78 Roteiro 1 Introdução
Organização Básica de Computadores. Organização Básica de Computadores. Organização Básica de Computadores. Organização Básica de Computadores
Ciência da Computação Arq. e Org. de Computadores Processadores Prof. Sergio Ribeiro Composição básica de um computador eletrônico digital: Processador Memória Memória Principal Memória Secundária Dispositivos
Organização e Arquitetura de Computadores I
Universidade Federal de Campina Grande Centro de Engenharia Elétrica e Informática Unidade Acadêmica de Sistemas e Computação Curso de Bacharelado em Ciência da Computação Organização e Arquitetura de
SSC510 Arquitetura de Computadores. 7ª aula
SSC510 Arquitetura de Computadores 7ª aula ARQUITETURAS SIMD PROFA. SARITA MAZZINI BRUSCHI Arquiteturas SIMD Um único fluxo de dados, vários fluxos de intruções Tipos de arquiteturas Processadores Vetorais
Introdução. Redes de Interconexão - Prof a Luiza Mourelle 1
Introdução Redes de interconexão são utilizadas em diferentes aplicações: barramentos backplane e redes de sistemas; chaves de telefonia; redes internas para modo de transferência assíncrona (ATM) e protocolo
Processamento Paralelo
Processamento Paralelo por Helcio Wagner da Silva Introdução Tradicionalmente, o computador tem sido visto como uma máquina seqüencial Esta visão nunca foi completamente verdadeira No nível das µo, vários
PROCESSADORES Unidade de Controle Unidade Aritmética e Lógica efetua memória de alta velocidade registradores Program Counter Instruction Register
PROCESSADORES Um computador digital consiste em um sistema interconectado de processadores, memória e dispositivos de entrada e saída. A CPU é o cérebro do computador. Sua função é executar programas armazenados
Barramento. Prof. Leonardo Barreto Campos 1
Barramento Prof. Leonardo Barreto Campos 1 Sumário Introdução; Componentes do Computador; Funções dos Computadores; Estrutura de Interconexão; Interconexão de Barramentos Elementos de projeto de barramento;
Arranjo de Processadores
Um arranjo síncrono de processadores paralelos é chamado arranjo de processadores, consistindo de múltiplos elementos processadores (EPs) sob a supervisão de uma unidade de controle (UC) Arranjo de processadores
Arquiteturas Paralelas
ERAD 2001 - Gramado, RS 3 1 Introdução Arquiteturas Paralelas Prof. César A. F. De Rose Pontifícia Universidade Católica do Rio Grande do Sul Programa de Pós-Graduação em Ciência da Computação Cx. Postal
Paralelização de Algoritmos de CFD em Clusters Multi-Core MC7. Escola de Verão Arquiteturas Multi-Core
RSS-Verão-01/08 p.1/36 Paralelização de Algoritmos de CFD em Clusters Multi-Core MC7 Escola de Verão 2008 Arquiteturas Multi-Core Renato S. Silva LNCC - MCT Janeiro de 2008 RSS-Verão-01/08 p.2/36 Objetivo:
SSC0611 Arquitetura de Computadores
SSC0611 Arquitetura de Computadores 17ª Aula Paralelismos nível de tarefas Profa. Sarita Mazzini Bruschi [email protected] Paralelismo no nível de tarefas Paralelismo a nível de thread (TLP Thread-Level
INTRODUÇÃO À ARQUITETURA E ORGANIZAÇÃO DE COMPUTADORES. Função e Estrutura. Introdução Organização e Arquitetura. Organização e Arquitetura
Introdução Organização e Arquitetura INTRODUÇÃO À ARQUITETURA E ORGANIZAÇÃO DE COMPUTADORES Eduardo Max Amaro Amaral Arquitetura são os atributos visíveis ao programador. Conjunto de instruções, número
AULA1 Introdução a Microprocessadores gerais. Disciplina: Aplicações Avançadas de Microprocessadores (AAM)
AULA1 Introdução a Microprocessadores gerais Disciplina: Aplicações Avançadas de Microprocessadores (AAM) Tópicos: Conceitos gerais Evolução dos Microprocessadores Arquiteturas Principais características
Sistemas Operacionais. Conceitos de Hardware
Sistemas Operacionais Conceitos de Hardware Sumário 1. Introdução 7. RISC e CISC 2. Processador 1. Operações de Processamento 2. Unidade de Controle 3. Ciclos de uma Instrução 3. Memória 1. Memória Principal
Desafios do Mapeamento de Processos em Arquiteturas Many-Core
Desafios do Mapeamento de Processos em Arquiteturas Many-Core Professor: Philippe O. A. Navaux Instituto de Informática - UFRGS Escola Regional de Alto Desempenho São Paulo 1 Indíce Evolução dos Processadores
Arquiteturas Paralelas
ORGANIZAÇÃO E ARQUITETURA DE COMPUTADORES Arquiteturas Paralelas Medidas de desempenho Alexandre Amory Edson Moreno Índice 2 1. Introdução 2. Medidas de Desempenho Introdução 3 Aumento de desempenho dos
LISTA DE EXERCÍCIOS #2 (BASEADO NO ENADE COMPUTAÇÃO)
LISTA DE EXERCÍCIOS #2 (BASEADO NO ENADE 2005- COMPUTAÇÃO) 1) Apesar de todo o desenvolvimento, a construção de computadores e processadores continua, basicamente, seguindo a arquitetura clássica de von
Capítulo 8 Arquitetura de Computadores Paralelos
Capítulo 8 Arquitetura de Computadores Paralelos Necessidade de máquinas com alta capacidade de computação Aumento do clock => alta dissipação de calor Velocidade limitada dos circuitos => velocidade da
Programação Concorrente
INE 5410 Programação Concorrente Professor: Lau Cheuk Lung (turma A) INE UFSC [email protected] Conteúdo Programático 1. 2. Programação Concorrente 3. Sincronização 1. Condição de corrida, região critica
Computadores e Programação (DCC/UFRJ)
Computadores e Programação (DCC/UFRJ) Aula 3: 1 2 3 Abstrações do Sistema Operacional Memória virtual Abstração que dá a cada processo a ilusão de que ele possui uso exclusivo da memória principal Todo
Arquitetura e Organização de Processadores. Aula 1. Introdução Arquitetura e Organização
Universidade Federal do Rio Grande do Sul Instituto de Informática Programa de Pós-Graduação em Computação Arquitetura e Organização de Processadores Aula 1 Introdução Arquitetura e Organização 1. Arquitetura
SIST706 Sistemas Distribuídos
Slide01 Introdução e Conceitos de Sistemas Distribuídos SIST706 Sistemas Distribuídos 2013/1 Prof. Jéfer Benedett Dörr @: [email protected] profjefer.wordpress.com Sistema Distribuído Definição de Andrew
MONTAGEM E MANUTENÇÃO DE COMPUTADORES
Álvaro Elias Flôres [email protected] MONTAGEM E MANUTENÇÃO DE COMPUTADORES Introdução A atividade de um computador pode ser definida por um modelo simples: Introdução Na etapa de processamento
Micro-Arquiteturas de Alto Desempenho. Introdução. Ementa
DCC-IM/NCE UFRJ Pós-Graduação em Informática Micro-Arquiteturas de Alto Desempenho Introdução Gabriel P. Silva Ementa Revisão de Organização de Computadores Hierarquia de Memória Memória Virtual Memória
Linguagem de Programação II
Linguagem de Programação II Carlos Eduardo Ba6sta Centro de Informá6ca - UFPB [email protected] Mo6vação Adaptar a estrutura lógica de um problema (Ex.: Servidores Web). Lidar com disposi6vos independentes
Introdução às arquiteturas paralelas e taxonomia de Flynn
Introdução às arquiteturas paralelas e taxonomia de Flynn OBJETIVO: definir computação paralela; o modelo de computação paralela desempenhada por computadores paralelos; e exemplos de uso da arquitetura
Supercomputador Pleiades
Supercomputador Pleiades Introdução ao Processamento Paralelo e Distribuído Renato Marques Dilli Prof. Adenauer C. Yamin Universidade Católica de Pelotas 1 de maio de 2009 Mestrado em Ciência da Computação
Sistemas Operacionais. Adão de Melo Neto
Sistemas Operacionais Adão de Melo Neto 1 Computador Digital (Hardware) 2 Computador Digital Constituído por um conjunto de componentes interligados (hardware): processadores, memórias, registradores,
Estrutura Básica de um Computador
SEL-0415 Introdução à Organização de Computadores Estrutura Básica de um Computador Aula 2 Prof. Dr. Marcelo Andrade da Costa Vieira INTRODUÇÃO n Organização Æ implementação do hardware, componentes, construção
Redes de Computadores. Fundamentos de Sistemas Operacionais - 2º Período
Redes de Computadores Fundamentos de Sistemas Operacionais - 2º Período PARTE I: CONCEITOS BÁSICOS SUMÁRIO 1. VISÃO GERAL: 1.1 Introdução; 1.2 Funções Básicas; 1.3 Máquina de Camadas; 1.5 Tipos de Sistemas
