Project 47: AMD zeigt Petaflop-Rack mit Epyc und Vega
Dank 20 Epyc-Prozessoren und 80 Vega-Rechenkarten schafft AMDs Project 47 ein volles Petaflop an Rechenleistung und ist zudem extrem effizient. Das System wurde zusammen mit Inventec entwickelt und wird in dieser Form künftig auch verkauft.
AMD hat auf der Grafikmesse Siggraph (Special Interest Group on Computer Graphics) das Project 47 vorgestellt. Dabei handelt es sich um ein Server-Rack das aus hauseigenen CPUs und GPUs besteht. Es liefert eine Leistung von über einem Petaflop bei einfacher Genauigkeit (FP32). Der Großteil der Rechenkapazität im Project 47 stammt von Beschleunigerkarten, die von x86-Prozessoren und zehn Terabyte DDR4-Speicher unterstützt werden.
Im System stecken 20 an 2U-Racks, in jedem davon einer von AMDs neuen Epyc 7601, also CPUs mit 32 Zen-Kernen. Pro Höheneinheit sind vier Radeon Instinct MI25 verbaut, die auf dem Vega-10-Grafikchip basieren und pro Rechenkarte eine Single-Precision-Leistung von 12,5 Teraflops erreichen. Zusammen mit den Prozessoren schafft das Project 47 sogar ein bisschen mehr als ein Petaflop. Die einzelnen Racks werden durch Mellanox' Infini Band verbunden.
Weil jeder Epyc 128 PCIe-Gen3-Lanes aufweist, sind alle Radeon Instinct MI25 mit 16 Bahnen an die CPUs angeschlossen. Bei Intels aktuellen Skylake-SP alias Xeon Scalable Processors wäre hierfür eine reduzierte Lane-Anzahl pro Rechenkarte oder Switches notwendig. Die je 16 GByte HBM2-Stapelspeicher (High Bandwidth Memory) auf den Radeon Instinct MI25, der DDR4-2666-RAM und die eingesetzten PCIe-SSDs mit NVMe-Protokoll stammen von Samsung.
Die Leistung pro Watt ist exzellent
Mit einer Effizienz von 30 Gigaflops pro Watt, also einer Leistungsaufnahme von rund 33 Kilowatt für ein Petaflop, wäre das System derzeit Spitzenreiter in der Green-500-Liste. Dort führt der Tsubame 3.0, ein Supercomputer mit Intels Xeon E5-2680 v4 (Broadwell-EP) und Nvidias Tesla P100 im SMX2-Formfaktor. Er schafft rund 14 Gigaflops pro Watt - genauer 2 Petaflops bei 142 Kilowatt. Bei solchen Systemen ist aber mehr inkludiert als nur die Leistungsaufnahme der Racks an sich, etwa die Gebäudekühlung, und sie rechnen mit FP64 - hier sind die Radeon Instinct MI25 ziemlich langsam (1/16 von FP32).
Gebaut wird das Project 47 von Inventec, es soll ab dem vierten Quartal 2017 über deren exklusiven Distributor Amax verkauft werden.
Je nachdem wie man das Komma interpretiert könnte beides richtig sein.
Wir haben Software für unsere Simulationen der auf modernen Intel CPU Architekturen wie...
Warum sollte sich Golem mehr Mühe geben, als du es für erforderlich hältst? Klick mich
Danke für den Hinweis, wurde korrigiert.