Power9 AIO: IBMs Prozessor-OMI schafft 650 GByte/s Bandbreite
Bisher konnten IBMs Power9 mit 210 GByte/s aus 8 TByte DDR4-Speicher lesen und schreiben. Die Advanved-I/O-Variante liefert nun entweder 320 GByte/s oder rasend schnelle 650 GByte/s bei weniger Kapazität.
IBM hat die nächste Ausbaustufe des Power9 vorgestellt, intern Axone getauft. Die AIO-Version des Prozessors, kurz für Advanced I/O, folgt auf beiden bisherigen Varianten - Nimbus alias SO (Scale Out) und Cumulus alias SU (Scale Up). Der Fokus des Power9 AIO liegt auf einem verbesserten Speichersubsystem, um eine deutlich höhere Bandbreite bei zugleich mehr Speicherkapazität bereitstellen zu können. Die eigentliche Mikroarchitektur der CPU hat IBM nicht überarbeitet, hier gibt es weiterhin bis zu 24 Kerne mit 4fach SMT.
Hierzu ein wenig Hintergrundwissen: Ursprünglich gab es vom Power9 nur die 2017 veröffentlichte SO-Variante, diese nutzt acht direkt angebundene Kanäle für eine mittlere (sustained) Bandbreite von 150 GByte/s und kann bis zu 2 TByte DDR4-Speicher via 16 Modulen ansprechen. Die 2018 eingeführte SU-Variante verwendet acht Memory Buffer, sogenannte Centaur-Chips, für 32 Riegel. Die erreichen eine Datentransferrate von 210 GByte/s, dank spezieller Module sind aber satte 8 TByte pro Sockel möglich - das schaffen weder AMDs Epyc 7002 (Rome) noch Intels Xeon Platinum 8200 (Cascade Lake SP), selbst als absurd teure L-Modelle mit Unterstützung für persistenten Optane-Speicher.
Für den Power9 AIO nutzt IBM die internen 25-GBit-Serdes-Links für ein Open Memory Interface (OMI), genauer das offene OpenCAPI 4.0, um Speicher anzubinden. Mit DDR4-Steckplatz-kompatiblen OMI-Modulen sind so 4 GByte pro Sockel bei einer durchschnittlichen Bandbreite von 320 GByte/s umsetzbar. Werden gar 16 der eigenwillig aussehenden Differential-DIMMs mit Microchip-SMC-1000-Speichercontroller verwendet, steigt die Transferrate auf extreme 650 GByte/s - allerdings sind so einzig 512 GByte Kapazität je Prozessor adressierbar. Zum Vergleich: Die schnellsten Beschleuniger wie ASICs oder GPUs haben HBM2-Speicher mit über 1 TByte/s, aber gerade einmal 32 GByte davon.
Erste Systeme mit dem Power9 AIO will IBM nächstes Jahr ausliefern. Für 2021 ist dann der Power10 geplant: Der wird mit 7-nm- statt mit 14-nm-Technik produziert, genauer Samsungs 7LPP statt Globalfoundries 14HP. Der Power10 hat eine neue Kern-Architektur samt PCIe-Gen5-Lanes und soll eine DRAM-Bandbreite von 800 GByte/s erreichen. In Zukunft sollen die OMI-Module ein Jedec-Standard werden, womit der Speichertyp nicht mehr vom Controller in der CPU festgelegt wird. Power9-Chips werden in einigen Supercomputern verwendet, gerne aber auch für In-Memory-Datenbanken wie SAPs Hana.