Contil Informática Curso Tecnico em Informatica Rafael Barros Sales Tecnologo em Redes de Computadores Tecnico em Informatica CREA/AC
Processadores O processador é o cérebro do micro, encarregado de processar a maior parte das informações. Ele é também o componente onde são usadas as tecnologias de fabricação mais recentes. Existem no mundo apenas quatro grandes empresas com tecnologia para fabricar processadores competitivos para micros PC: a Intel (que domina mais de 60% do mercado), a AMD (que disputa diretamente com a Intel), a VIA (que fabrica os chips VIA C3 e C7, embora em pequenas quantidades) e a IBM, que esporadicamente fabrica processadores para outras empresas, como a Transmeta.
Entendendo Os Processadores O processador é o componente mais complexo e frequentemente o mais caro, mas ele não pode fazer nada sozinho. Como todo cérebro, ele precisa de um corpo, que é formado pelos outros componentes do micro, incluindo memória, HD, placa de vídeo e de rede, monitor, teclado e mouse. Vamos falar agora sobre os processadores atuais (de 2000 pra cá), passando a abordar as coisas de forma mais detalhada. Como um novo projeto de processador demora de 3 a 5 anos para ser desenvolvido, os fabricantes aproveitam o mesmo projeto básico em diversos modelos de processadores, incluindo pequenas melhorias e mais cache L2 ao longo do processo. Todos estes processadores baseados na mesma arquitetura podem ser classificados dentro de uma única família e colocados em um galho separado da árvore evolutiva.
Tecnologias de Processadores Por exemplo, a arquitetura NetBurst foi utilizada pela Intel de 2000 a 2006, englobando desde os primeiros modelos do Pentium 4 até o Pentium D, passando por diversas variações, como os Pentium Extreme Edition e os Celerons. Entre 2006 e 2007 ela foi substituída rapidamente pelos processadores baseados na plataforma Core, incluindo os Core 2 Duo, Core 2 Quad, Pentium E e Celerons 4xx. Em vez de tentar abordar os processadores diretamente em ordem cronológica, vamos dividi-los em famílias, falando sobre todos os processadores baseados na arquitetura NetBurst, depois todos os Athlons de 32 bits, seguidos pelos Athlons de 64 bits e pelos processadores baseados na plataforma Core. No final, aproveitei para incluir também um resumo sobre os próximos processadores, criando um panorama do que você pode esperar para os próximos anos.
Pentium4 O Pentium 4 foi lançado em novembro de 2000, trazendo uma arquitetura completamente redesenhada, baseada na idéia do uso de um longo pipeline para permitir que o processador fosse capaz de atingir freqüências de clock elevadas e no uso de um cache L1 muito rápido e um barramento de dados capaz de realizar 4 transferências por ciclo para mantê-lo alimentado com o volume necessário de dados e instruções. O Pentium 4 representa a sétima geração de processadores Intel. A primeira foram os processadores 8086 e 8088, lançados no final da década de 70, que foram seguidos pelos processadores 286, 386 e 486 que bem conhecemos. A quinta geração é representada pelos processadores Pentium e Pentium MMX, enquanto a sexta (também chamada de arquitetura P6) é representada pelos processadores Pentium II e Pentium III (incluindo também o Pentium Pro). Por diversos motivos que vou explicar ao longo deste capítulo, o Pentium 4 acabou se revelando um beco sem saída. Devido à enorme dissipação térmica dos processadores, a Intel não foi capaz de lançar versões com clock acima de 3.8 GHz (a versão de 4.0 GHz, que acabou sendo cancelada no último momento), e operando a freqüências baixas o Pentium 4 perdia facilmente para os processadores AMD. Só em 2006 a Intel conseguiu dar a volta por cima, com o lançamento do Core 2 Duo.
Willamette O Willamette foi a versão inicial do Pentium 4, produzido usando uma técnica de 0.18 micron (a mesma usada na fabricação dos processadores Pentium III com cache integrado), com apenas 256 KB de cache L2. Ele existiu em versões de 1.3 a 2.0 GHz, com o TDP de 48.9 watts (para o de 1.3) a 73.5 watts (para o 2.0). Na época, o consumo elétrico não era considerado uma especificação importante. Se o processador era beberrão demais, você simplesmente gastava um pouco mais, comprando um cooler adequado. Entretanto, com o lançamento de versões mais rápidas do Pentium 4, o TDP chegou aos 130 watts, o que chamou a atenção do público. A partir de um certo ponto, os fabricantes passaram a falar em "eficiência", dando ênfase não apenas ao clock e ao desempenho geral do processador, mas também ao seu consumo elétrico.
Em 2002 a Intel lançou dois modelos (1.7 e 1.8 GHz) do Celeron baseado no core "Willamette-128", que nada mais é do que uma versão do Pentium 4 Willamette com metade do cache L2 desabilitado. Eles foram vendidos apenas em versão soquete 478 e eram relativamente baratos para o padrão dos processadores Intel na época, custando abaixo da faixa dos 100 dólares. Embora o desempenho fosse ruim, essa geração inicial do Celeron baseado no Pentium 4 foi uma forma de a Intel popularizar o uso das placas soquete 478 e assim abrir caminho para as gerações seguintes do Pentium 4. Voltando ao final de 2000, a Intel batizou a nova arquitetura do Pentium 4 de NetBurst. O nome não tem nada a ver com o desempenho em redes ou na internet; é apenas um nome mercadológico usado para tentar ilustrar a arquitetura do processador e suas otimizações com relação ao processamento de grandes volumes de dados. Sempre que ouvir falar em um processador "baseado na arquitetura NetBurst", tenha em mente que se trata de alguma derivação do Pentium 4, como um Pentium D ou Celeron.
Hyper Pipelined Technology O pipeline é um recurso que divide o processador em vários estágios, que trabalham simultaneamente, dividindo o trabalho de processar as instruções. É como uma linha de produção com vários operários, em que cada um monta uma peça, até termos no final o produto completo. O primeiro processador Intel a utilizar esse recurso foi o 486, que possuía 5 estágios. Como o 486 era um processador muito simples (para os padrões atuais), que processava uma instrução de cada vez, ele não precisava de muitos dos componentes usados nos processadores modernos, tais como o ordenador, circuito de branch-prediction e assim por diante. O processador simplesmente recebia cada instrução, fazia a decodificação e em seguida a executava. Enquanto a primeira instrução passava do primeiro para o segundo estágio do pipeline, o primeiro estágio recebia a instrução seguinte e assim por diante.
Execution trace cache O Pentium III possui 32 KB de cache L1, dividido em dois blocos, onde 16 KB são para o armazenamento de dados e os demais 16 KB para o armazenamento de instruções. O Athlon utiliza um cache L1 de 128, novamente dividido em dois blocos separados, que armazenam dados e instruções. No Pentium 4, o bloco do cache L1 destinado a instruções foi substituído pelo Execution trace cache, um tipo de cache ultra-rápido que, em vez de instruções, armazena diretamente uops, que são as instruções já decodificadas, prontas para serem processadas. Isto garante que o cache tenha apenas um ciclo de latência (a instrução é solicitada em um ciclo e recebida no seguinte), o que faz com que o processador não perca praticamente tempo algum ao utilizar dados armazenados no trace cache, ao contrário do que acontecia no Pentium III, onde são perdidos pelo menos dois ciclos em cada leitura, o tempo necessário para decodificar a instrução.
Bus de 400 MHz O execution trace cache oferece tempos de latência muito baixos, mas em troca armazena um volume muito pequeno de dados e instruções. Devido a isso, o processador é muito mais dependente do desempenho do cache L2 e do acesso à memória. O plano inicial era utilizar módulos de memória Rambus em dual-channel. Cada módulo RIMM oferecia (no caso dos módulos PC-800) um barramento de dados de 1.6 GB/s, de forma que combinando a banda oferecida por dois módulos, seria possível obter 3.2 GB/s, o que é 3 vezes o oferecido pelos módulos de memória PC-133 utilizados pelo Pentium III. Para absorver esse grande volume de dados, o Pentium 4 utiliza um barramento quad-pumped, ou seja, capaz de realizar 4 transferências por ciclo. Operando a 100 MHz, temos uma taxa efetiva de 400 MHz, que é a freqüência utilizada nas primeiras placas soquete 423.
Rapid Execution Engine Todo processador atual é dividido em dois componentes básicos, as unidades de execução de inteiros e as unidades de ponto flutuante (FPU). A parte que processa as instruções envolvendo números inteiros é responsável pela maior parte das instruções e pelo desempenho do processador nos aplicativos do dia-a-dia, enquanto as unidades de ponto flutuante são as responsáveis pelo processamento das instruções envolvendo valores complexos, usadas por jogos e aplicativos gráficos. O "Rapid Execution Engine" do Pentium 4 consiste num reforço nas unidades de inteiros do processador. O Pentium 4 possui um total de 3 unidades de processamento de inteiros, duas ALUs, que processam as instruções mais simples e uma terceira ALU, encarregada de decodificar e processar as instruções complexas que, embora em menor quantidade, são as que tomam mais tempo do processador.
SSE2 As "Double Precision Streaming SIMD Extensions" do Pentium 4 são 144 novas instruções de ponto flutuante de dupla precisão. Elas têm basicamente a mesma função das instruções SSE do Pentium III e do 3D-Now! Do Athlon: melhorar o desempenho do processador em aplicativos de ponto flutuante. A diferença é que as instruções do Pentium 4 são mais poderosas que os conjuntos anteriores e podem ser utilizadas em mais situações, o que ajudou o Pentium 4 em alguns aplicativos específicos. O grande problema é que existe um número brutalmente grande de softwares em uso e apenas alguns deles acabam sendo devidamente otimizados para usar novos conjuntos de instruções de forma que no final o ganho acaba não sendo tão grande quanto se espera. O Athlon 64 (e os Semprons de 64 bits) incluem um conjunto de instruções compatível com o SSE2, desenvolvido pela AMD. Isto permite que eles também se beneficiem de aplicativos otimizados para o Pentium 4, equilibrando a balança e valorizando o trabalho dos desenvolvedores.
Northwood O Northwood é a segunda geração do Pentium 4, produzido em uma técnica de 0.13 micron. Ele não inclui mudanças na arquitetura, mas a redução no tamanho físico dos transístores permitiu que fossem adicionados mais 256 KB de cache L2, totalizando 512 KB. Como o Pentium 4 foi originalmente projetado para trabalhar em conjunto com pentes de memória Rambus, que (apesar dos maiores tempos de latência) oferecem taxas de transferência de dados muito elevadas, o desempenho do Willamette era prejudicado de forma significativa ao utilizar memórias SDRAM. O aumento no cache e a popularização das placas com suporte a memórias DDR melhoraram de forma significativa o desempenho do processador, fazendo com que (respeitadas as diferenças no clock) ele passasse a competir em pé de igualdade com o Athlon Thunderbird da AMD. O Northwood foi produzido em versões de 1.6 a 3.06 GHz, englobando tanto modelos com bus de 400 MHz quanto modelos utilizando bus de 533. A série com bus de 400 MHz inclui os modelos de 2.0, 2.2, 2.4, 2.6, 2.8 e 3.0 GHz, enquanto a série com bus de 533 MHz inclui modelos de 2.26, 2.40, 2.53, 2.66, 2.8 e 3.06 GHz
Prescott O Prescott representa a terceira geração do Pentium 4, produzido a partir de 2004, utilizando uma técnica de fabricação de 0.09 micron. A mudança arquitetural mais significativa foi a adição de 11 novos estágios ao já longo pipeline do Northwood. Com isso, o Prescott atingiu a impressionante marca de 31 estágios de pipeline, um número sem precedentes entre os processadores x86. Em um processador atual, o uso de um pipeline mais longo não é exatamente uma boa notícia, muito pelo contrário. Como vimos, aumentar o número de pipelines do processador permite que cada estágio execute um volume menor de processamento. Com isso, o processador passa a ser capaz de operar a freqüências mais altas, mas, em compensação, as instruções demoram um número maior de ciclos de clock para serem processadas (já que precisam percorrer todo o pipeline), o que aumenta brutalmente o tempo perdido em operações de tomada de decisão, onde o processador precisa aguardar o resultado de uma operação para poder processar a seguinte.
Hyper-Threading O Hyper-Threading foi introduzido no final de 2002, na forma de duas versões especiais do Pentium 4 Northwood (soquete 478), que operavam a 2.8 e 3.06 GHz. A partir daí, ele foi utilizado em diversas séries do Prescott. As séries com suporte ao Hyper-Threading eram identificadas pelo logotipo, que continha as letras "HT", em laranja: Com o Hyper-Threading, o processador se apresenta ao sistema operacional como um sistema dual-core. Com isso, o sistema ativa os módulos que ativam o suporte a SMP e passa a dividir o processamento dos aplicativos entre os dois processadores lógicos. Dentro do processador, as instruções são reorganizadas, de forma que o processador possa aproveitar os ciclos ociosos para incluir operações relacionadas ao segundo aplicativo. Aumentar o nível de utilização das unidades de execução resulta em um pequeno ganho de desempenho. Este slide da Intel apresenta o conceito:
Soquete 775 Junto com o Prescott, foi lançado o soquete LGA775 (também chamado de soquete T), que passou a ser utilizado nas placas de alto desempenho. A sigla LGA é abreviação de "Land Grid Array", onde o nome indica a forma como o processador é encaixado, "pousando" sobre a cama de pinos do soquete. Existiram versões do Prescott tanto em versão soquete 478, quanto em versão soquete 775. A partir de então, todos os processadores de alto desempenho passaram a utilizar o novo soquete, transformando a plataforma soquete 478 em uma plataforma de baixo custo.
Smithfield, Cedar Mill e Presler O core Smithfield é uma versão dual-core do Prescott (1 MB de cache para cada core), produzido em uma técnica de 0.09 micron. Ele foi utilizado nas primeiras versões do Pentium D (abrangendo modelos de 2.66 a 3.2 GHz) e também no Pentium Extreme Edition 840. Estes processadores foram produzidos em quantidades limitadas e foram rapidamente substituídos pelos Pentium D baseados no core Presler. Esta imagem mostra o núcleo de um Pentium D baseado no core Smithfield. Como você pode ver, ele nada mais é do que dois Prescotts, que compartilham o mesmo wafer e são unidos diretamente através do FSB, que no caso dos processadores Intel é também usado para ligar o processador à memória e ao chipset.
O sistema de numeração Ao migrar seus processadores para o soquete 775, a Intel adotou o sistema de numeração que ainda é usado até os dias de hoje. Ao contrário da AMD, que até então usava o sistema de numeração como um indicador aproximado de desempenho, o sistema de numeração da Intel é apenas um código que indica a família, a "posição hierárquica" do chip e os recursos adicionais (EM64, suporte a virtualização, etc.) suportados por ele. Isso faz com que, em muitos casos, um processador mais rápido receba um número de identificação muito inferior ao de um processador mais lento, porém de outra família. Por exemplo, a versão de ultra baixo consumo do Pentium M (com core Dothan) de 1.0 GHz recebe o código 723, enquanto um Pentium M "normal", de 1.5 GHz recebe o código 715 e um Prescott de 3.4 GHz recebe o código 551. Um Celeron D de 3.6 GHz baseado no core Cedar Mill-512 recebe o número 365, enquanto um simples Prescott de 2.66 GHz recebe o número 505.
Pentium 4 Os primeiros modelos a adotarem o sistema de numeração foram lançados no final de 2004. A série 5xx é formada pelos processadores Pentium 4 com core Prescott e 1 MB de cache. A leva inicial inclui os modelos 505 (2.66 GHz), 505J (2.66 GHz), 506 (2.66 GHz), 511 (2.8 GHz), 515 (2.93 GHz), 515J (2.96 GHz), 516 (2.66 GHz), 517 (2.93 GHz) 519J (3.06 GHz) e 519K (3.06 GHz), todos utilizando bus de 533 MHz. Além do clock, os processadores são diferenciados pela presença dos recursos especiais, justamente por isso existem tantos modelos com o mesmo clock.
Pentium D Ao lançar o Cedar Mill, a Intel estava preocupada em reduzir o consumo e aumentar a eficiência dos processadores. Embora os Cedar Mill fossem capazes de trabalhar a freqüências ligeiramente superiores aos processadores baseados no core Prescott (o que você pode comprovar ao fazer overclock), a perda de corrente ao operar a freqüências acima de 3.6 GHz era muito alta, o que fez a Intel desistir do lançamento de versões mais rápidas. Ao invés disso, os esforços foram concentrados nos modelos dual-core e na finalização do Core 2 Duo, que viria a ser lançado em Julho de 2006, apenas 6 meses depois das 4 versões do Cedar Mill. Os processadores dual-core baseados na arquitetura NetBurst foram vendidos sob a marca "Pentium D" (de dual). Existiram duas famílias, baseadas nos cores Smithfield (série 8xx) e Presler (9xx).
Extreme Edition No final de 2003, pressionada pela AMD, a Intel criou a série Pentium 4 Extreme Edition (Pentium 4 EE), processadores com mais cache, que foram produzidos em quantidades limitadas e vendidos a preços exorbitantes. A principal função destes processadores foi servir como ferramenta de marketing, atraindo a atenção do público entusiasta. As versões iniciais eram baseadas no core Gallatin, uma versão adaptada do Xeon MP (que por sua vez era baseado no core Northwood), que possuía apenas 512 KB de cache L2, complementados por um generoso cache L3 de 2 MB. O Gallatin ainda era fabricado usando a antiga técnica de 0.13 micron, por isso foi lançado em versões de 3.2 a 3.46 GHz, tanto em versão soquete 478 (de 3.2 e 3.4 GHz) quanto em versão soquete 775 (versões de 3.4 e 3.46 GHz).
Celeron D Como de praxe, a Intel lançou versões atualizadas do Celeron baseadas no core Prescott (com 256 KB de cache) e do Cedar Mill (com 512 KB), que lentamente substituíram os antigos Celerons baseados no Northwood. Apesar do maior número de estágios de pipeline e da maior latência do cache L2 (cortesia do Prescott), o Celeron D acaba sendo consideravelmente mais rápido que um Celeron Northwood do mesmo clock (de 10 a 20%, de acordo com o aplicativo) devido à combinação do maior cache L1 de dados (16 KB x 8 KB), do maior cache L2 e do uso do bus de 533 MHz. Todos os Celeron D utilizam o soquete 775 e bus de 533 MHz. Apesar do "D" no nome, eles não são processadores dual-core. A Intel simplesmente resolveu nomear o Celeron de forma parecida para aproveitar o esforço de marketing feito em torno do Pentium D. O "D" no caso do Celeron não tem nenhum significado especial, é apenas uma letra a mais no nome.