ICCA 07 8th Internal Conference on Computer Architecture FAQ - 05 Ao nível das últimas gerações do IA32 (Pentium III e ) quais as principais diferenças entre os processadores da Intel e da AMD? "IA32 processors: from Intel or AMD? With the new architecture, Intel tried to improve the performance of his processors. The fact is, is a new generation of processors and not an evolution of Pentium III processor architecture or other Pentium architectures.[1] In, the pipelines were increased and it as also a bigger target buffer that the existing in Pentium III, while AMD processors have low energy consumption and produces less heat. The overheating of Intel Prescott processor and his high energy consumption make it slower than Northwood, while AMD processors still have better performances, what made Intel go back and re-adapt Pentium III when for use in notebook computers. AMD Athlon processors, using 12 stages against 20 on generation, and including an I/O Hypertransport system in the processor core, were faster than the first generation of, which have a great dependence on the rest of the machine. On the other side, AMD rates his processor using PR scale for his processor, what made them lost the marketing campaign for Intel, often their processors were faster." Frederico Tavares Ed. AJProença, Arquitectura de Computadores, MICEI, UMinho, 2006/07 Família Pentium III Katmai Coppermine Tualatin Arquitectura de Computadores IA 32 Processors: From Intel or AMD? Frederico Tavares - MICEI 06/07 Novidades do Pentium III 70 Instruções SSE (ou KATMAI) 50 novas instruções para melhorar desempenho vírgula flutuante 12 instruções New media para complementar as 57 MMX já existentes 8 instruções para aumentar a eficiência da cache L1 ( New cacheability )
Família Willamette Northwood Prescott Gallatin Smithfield Novidades do Arquitectura Netburst: RAPID EXECUTION ENGINE : 2 ALU s de instruções simples; 2 GLU s para ler/gravar dados 1 ALU para instruções complexas FSB de 400 MHz até 800 MHz Novidades do Arquitectura Netburst : Hyper Pipelined: 20 estádios de pipeline SSE 2 com 144 novas instruções Execution trace cache : Substitui a cache L1 de instruções: armazena µop s em vez de instruções (12 kb) cache L1 de dados com 8 kb (menor latência) Willamette Northwood Janeiro 2001 0,18 µm FSB 400 MHz Cache L2 256 kb ATC Memórias Rambus Janeiro 2002 0,13 µm FBS 533/800 MHz Cache L2 512 kb ATC Memórias DDR Hyperthreading Cache L3 a 2 Mb (EE) 1º Processador acima dos 3 GHz
Novidades do AMD K6-III TriLevel Cache Cache l1 com 64 kb on-chip (mesma freq.) Cache l2 com 256 kb off-chip (mesma freq) Cache L3 até 2 Mb on-board a 100 MHz. 11 estágios de pipeline Pentium III KATMAI K6-III Cache L1 32 kb on-chip Cache L1 64 kb on-chip Cache L2 512 kb offchip, metade veloc. Proc. Cache L2 256 kb offchip, mesma veloc. Proc. - - - Cache L3 até 2 Mb (100 MHz) 10 stages pipeline 11 stages pipeline Resumindo Pentium III -> K6-III -> Athlon K7 -> Athlon K75 -> Athlon Thunderbird Pentium III KATMAI Largura banda 533 MB/s K6-III Largura banda 800 MB/s 5 operações por ciclo 6 operações por ciclo FP unit 10% inferior à do pentium III
Pentium III Coppermine/tualatin FSB a 66/100/133 MHz Athlon K7/Thunderbird FSB a 200/266 MHz 5 operações por ciclo 9 operações por ciclos Cache L1 32 kb on-chip Cache L1 128 kb on-chip Cache L2 512 kb ou 1 MB off-chip Cache L2 256 kb on-chip Resumindo -> Athlon XP Palomino -> Athlon XP Thoroughbred -> Athlon XP Barton -> Athlon MP Pentium III Coppermine/tualatin Largura banda 1,06 GB/s Athlon K7/Thunderbird Largura banda 1,6 GB/s 70 instruções SSE 24 instruções 3dNow! Pentium III 70 instruções SSE 144 instruções SSE2 10 stages pipeline 20 Stages pipeline Cache L1 32 kb onchip Cache L1 on-chip - 12 kb µop s - 8 kb dados Cache L2 256 kb (onchip) ou 512 kb off-chip Cache L2 256/512 kb on-chip
Cache L1 on-chip - 12 kb µop s - 8 kb dados Athlon XP Cache L1 128 kb on-chip Cache L2 256/512 kb on-chip Cache L2 256 kb on-chip 144 instruções SSE2 + 52 instruções 3DNow! Às já existentes Hyperthreading Não é retro-compatível Athlon XP Multiprocessamento simétrico (até 4 proc.) FSB de 400 MHz a 800 MHz Hypertransport de 266 MHz a 400 MHz Hypertransport permite acesso exclusivo ao chipset, no barramento (um proc. não espera pelo outro) Athlon XP 20/31 stages pipeline 12 stages pipeline 5/7 unidades Proc. Inteiros: - 2/3 ALU s (inst.simples) - 2/2 GLU s - 1/2 ALU (inst.complexas) 9 unidades Proc. Inteiros: - 3 ALU s (inst.simples) - 3 GLU s - 3 ALU (inst.complexas) exemplo Processador Athlon XP 2800+ 2,8 GHz Clock interno 2.250 MHz 2.800 MHz Clock Externo 166 MHz 133 MHz Transferência com a memória 2 dados por pulso de clock ("333 MHz") 4 dados por pulso de clock ("533 MHz") Cache L2 256 KB 512 KB
Resumindo -> Athlon XP Palomino -> Athlon XP Thoroughbred -> Athlon XP Barton -> Athlon MP Performance Performance Performance