Centriq 2400: Qualcomm erläutert 48-Kern-ARM-Chip
Der Centriq 2400 ist die erste Server-CPU mit 10-nm-Fertigung und basiert auf von Qualcomm entwickelten Falkor-Kernen mit ARM-Technik. Die haben allerdings wenig mit den Snapdragons zu tun, sondern nutzen ein paar andere Tricks.
Qualcomm hat auf der Hot Chips 29 im kalifornischen Cupertino den Centriq 2400 besprochen. So heißen die für Server gedachten CPUs auf Basis von 48 ARM-Kernen, die gegen die ARM-, die x86- und die Power-Konkurrenz antreten sollen. Die Chips wurden im Dezember 2016 angekündigt, jedoch abseits der Core-Anzahl ohne Details zur Falkor-Technik. Das ist der englische Name für Fuchur, den Glücksdrachen aus dem Film Die unendlichen Geschichte.
In Cupertino beschränkte sich Qualcomm weitestgehend auf die Architektur, Informationen zur Geschwindigkeit - es sollen über 2 GHz sein - oder zur Leistungsaufnahme gab es nur unter der Hand. Die Centriq 2400 werden in einem 10-nm-Verfahren hergestellt, als Auftragsfertiger wurde wohl TSMC gewählt. Der Prozessor nutzt sechs ECC-Speicherkanäle für DDR4-2667 und kann zwei Riegel pro Channel ansprechen, eine Kompression erhöht die effektive Bandbreite. Peripherie wird über 32 PCIe-Gen3-Lanes angebunden.
Die Falkor-Kerne selbst bestehen aus einem Dualcore-Pärchen mit 24 KByte L0-Instruktionen-Buffer sowie L1D/L1I (32+64 KByte) und teilen sich einen L2-Cache unbekannter Größe. Die Cores und der Puffer können unabhängig voneinander in ihre Schlafmodi versetzt werden. Die Kern-Blöcke sind mit dem RAM-Controller, dem PCIe-Root-Complex, den DMA-Engines, dem L3-Cache und einer Southbridge (GPIO, Sata, USB, etc) per kohärentem Ring verknüpft. Mit im Chip steckt eine Hardware-Beschleunigung für AES, SHA1 und SHA2-256.
Wenig überraschend basieren die Cores auf ARM v8 mit 64 Bit und arbeiten nach Out-of-Order-Prinzip. Sie decodieren im Frontend vier Befehle pro Takt und der Scheduler verteilt sie über acht Ports an das Backend. Falkor kann 1 x 128 Bit Load oder Store ausführen, hinzu kommen einfache Rechenwerke (ALUs) und Multiplizier-Einheiten. Im Blockdiagramm sind auch mehrere VX-Pipelines zu sehen, was auf Vektorberechnungen für Gleitkomma hinweist.
Qualcomm verteilt derzeit Samples an Datacenter-Partner, die Serienproduktion der Centriq 2400 soll Ende 2017 starten. Die Spezifikationen des Mainboards sind Teil des Open Compute Project, im Rahmen des Project Olympus werden die Centriq 2400 auch von Microsoft mit Windows Server verwendet.
Wie bereits erwähnt geht es weniger um höhere Geschwindigkeit, sondern in erster Linie...