Naples-Prozessor: Wie AMD Intel im Serversegment übertrumpfen will

Mit 32 Kernen und acht Speicherkanälen ist Naples ein Chip, den AMD als Hoffnungsträger bezeichnet: Die Zen-basierten Server-CPUs werden in 2-Sockel-Systemen gegen Intels Xeon E5 v4 (Broadwell-EP) und später gegen die Xeon E5 v5 (Skylake-EP) positioniert und sollen zumindest deutlich besser sein als die erstgenannten Prozessoren.

Artikel veröffentlicht am ,
Naples: 32C/64T und 8 Memory-Channels
Naples: 32C/64T und 8 Memory-Channels (Bild: AMD)

Mit dem Ryzen 7 1800X hat AMD vor wenigen Tagen einen Prozessor veröffentlicht, der wie die weiteren Ryzen-Modelle den Desktop-Umsatz des Herstellers steigern dürfte. Der Consumer-Markt allerdings ist längst nicht so lukrativ wie die Serversparte, in der AMD mit einem Marktanteil von rund 1 Prozent seit Jahren praktisch keine Rolle mehr spielt. Das soll sich künftig ändern: Unter dem Codenamen Naples wurde ein Serverchip entwickelt, dessen Auslieferung im zweiten Quartal 2017 beginnt. Spätestens ab dem kommenden Jahr, das sagte CTO Mark Papermaster, sollen die CPUs für einen zweistelligen Marktanteil sorgen.

Um das zu erreichen, zielt AMD auf 2-Sockel-Systeme ab, welche im Serverbereich mit großem Abstand am weitesten verbreitet sind. 4- und 8-Sockel-Plattformen wie IBMs Power9 oder Intels Xeon E7 v4 stellen eine extrem teure Minderheit für Nischenmärkte dar, die AMD vorerst nicht bedienen will und kann. Naples unterstützt zwar einzig 2-Sockel-Systeme, ist in diesem Segment jedoch auf absehbare Zeit einer der mächtigsten Prozessoren überhaupt und könnte bis auf Ausnahmen selbst für Intels kommende Skylake-EP-Generation einen ernstzunehmenden Gegner darstellen. Funktionen wie eine Speicherverschlüsselung (SME, Secure Memory Encryption) plus Secure Encrypted Virtualization (SVE) entsprechen den Secure Guard Extensions (SGX) von Intel, auch hier hat AMD aufgeholt.

  • Zwei Naples weisen 16 Speicherkanäle auf. (Foto: Marc Sauter/Golem.de)
  • AMD vergleicht zwei Naples mit zwei Xeon E5-2699A v4. (Foto: Marc Sauter/Golem.de)
  • Der Workload ist eine seismische Analyse. (Foto: Marc Sauter/Golem.de)
  • Zwei Naples sind doppelt so schnell wie die beiden Xeon. (Foto: Marc Sauter/Golem.de)
  • Für den Benchmark wurden die Naples auf 44C/88T und DDR4-1866 mit 8CH begrenzt. (Bild: AMD)
  • Ohne die künstliche Limitierung ist das AMD-System um den Faktor 2,5 schneller. (Foto: Marc Sauter/Golem.de)
  • Es werden 64C/128T und DDR4-2400 eingesetzt. (Bild: AMD)
  • Bei 4 Milliarden Samples hat das Intel-System zu wenig RAM. (Foto: Marc Sauter/Golem.de)
  • AMD nutzt 16-GByte-Sticks, ergo 512 GByte bei den Naples und 512 GByte bei den Xeon. (Bild: AMD)
  • Vorabsystem mit zwei Naples-CPUs (Foto: Marc Sauter/Golem.de)
  • Ein Naples besteht aus vier Dies und somit 32 Kernen. (Bild: AMD)
  • Die hohe Menge an PCIe-Gen3-Lanes eignet sich für AI-Beschleuniger wie die Radeon Instinct. (Bild: AMD)
  • Dank Data Fabric soll AMDs Serverplattform nahezu linear mit mehr Kernen skalieren. (Foto: Marc Sauter/Golem.de)
  • Das Fabric wird auch bei Ryzen und Vega verwendet. (Foto: Marc Sauter/Golem.de)
  • Auf Zen folgen Zen2 und Zen3. (Foto: Marc Sauter/Golem.de)
Zwei Naples weisen 16 Speicherkanäle auf. (Foto: Marc Sauter/Golem.de)

Die Naples-CPUs basieren auf der gleichen Zen-Mikroarchitektur wie die Ryzen-Chips für Desktoprechner, sie weisen aber bis zu 32 statt 8 Kerne auf. Auch wenn es AMD in den offiziellen Sessions nicht direkt bestätigen wollte, besteht Naples aus vier Dies: Auf einer Folie ist explizit von 8 x 16 PCIe-Lanes bei einem 2-Sockel-System die Rede, was mit dem übereinstimmt, was wir schon seit Monaten immer wieder mitbekommen. Die Chips sind per Infinity Fabric auf einem Träger verbunden, es handelt sich also um zwei MCMs (Multi Chip Modules) und somit um insgesamt acht der sogenannten Zeppelin-Dies.

Es liegt die Vermutung nahe, dass es sich um die gleichen Dies wie bei Ryzen handelt, die Chips also mit der gleichen Maske hergestellt und aus den gleichen Wafern geschnitten werden. Dass jedes Die ein Dualchannel-Interface nutzt und jeder Naples ein Octachannel-Interface, stützt die Quad-MCM-These. Obendrein hat AMD viel Erfahrung mit MCMs, schon die älteren Magny-Cours- (K10.5) und Interlagos-CPUs (Bulldozer) sind aus zwei Dies zusammengesetzte Prozessoren mit 8 sowie 16 Kernen. Folglich stecken in Naples auch Ethernet- Sata- und USB-Ports, da es sich um ein SoC handelt. Details nannte AMD nicht.

Von den 128 PCIe-Gen3-Lanes, die je ein Naples-Chip aufweist, wird allerdings die Hälfte verwendet, um die beiden Prozessoren in einem 2-Sockel-System über je 64 Bahnen per erweitertem Hypertransport miteinander kommunizieren zu lassen. Dennoch beeindruckt die Plattform: Sie verfügt über 64 Kerne und dank SMT über 128 Threads, hinzu kommen 128 PCIe-Lanes für Beschleuniger wie die Radeon Instinct und 16 Speicherkanäle, von denen jeder zwei Module mit DDR4-2400-Geschwindigkeit oder eines mit DDR4-2667 ansprechen kann. Das ermöglicht eine Kapazität von einem halben Terabyte, wenn 16-GByte-DIMMs zum Einsatz kommen. Mit größeren Modulen sind 4 TByte das Limit, ECC sowie NVDIMMs werden unterstützt.

  • Zwei Naples weisen 16 Speicherkanäle auf. (Foto: Marc Sauter/Golem.de)
  • AMD vergleicht zwei Naples mit zwei Xeon E5-2699A v4. (Foto: Marc Sauter/Golem.de)
  • Der Workload ist eine seismische Analyse. (Foto: Marc Sauter/Golem.de)
  • Zwei Naples sind doppelt so schnell wie die beiden Xeon. (Foto: Marc Sauter/Golem.de)
  • Für den Benchmark wurden die Naples auf 44C/88T und DDR4-1866 mit 8CH begrenzt. (Bild: AMD)
  • Ohne die künstliche Limitierung ist das AMD-System um den Faktor 2,5 schneller. (Foto: Marc Sauter/Golem.de)
  • Es werden 64C/128T und DDR4-2400 eingesetzt. (Bild: AMD)
  • Bei 4 Milliarden Samples hat das Intel-System zu wenig RAM. (Foto: Marc Sauter/Golem.de)
  • AMD nutzt 16-GByte-Sticks, ergo 512 GByte bei den Naples und 512 GByte bei den Xeon. (Bild: AMD)
  • Vorabsystem mit zwei Naples-CPUs (Foto: Marc Sauter/Golem.de)
  • Ein Naples besteht aus vier Dies und somit 32 Kernen. (Bild: AMD)
  • Die hohe Menge an PCIe-Gen3-Lanes eignet sich für AI-Beschleuniger wie die Radeon Instinct. (Bild: AMD)
  • Dank Data Fabric soll AMDs Serverplattform nahezu linear mit mehr Kernen skalieren. (Foto: Marc Sauter/Golem.de)
  • Das Fabric wird auch bei Ryzen und Vega verwendet. (Foto: Marc Sauter/Golem.de)
  • Auf Zen folgen Zen2 und Zen3. (Foto: Marc Sauter/Golem.de)
Ohne die künstliche Limitierung ist das AMD-System um den Faktor 2,5 schneller. (Foto: Marc Sauter/Golem.de)

Intels aktuelle Broadwell-EP-Generation alias Xeon E5-2600 v5 ist als 2-Sockel-System bestehend aus zwei Xeon E5-2699A v4 mit 44 Kernen, 88 Threads, 80 PCIe-Gen3-Lanes und acht Speicherkanälen mit je drei DIMMs für 384 GByte Speicher (DDR4-1866) klar schlechter ausgestattet. Um dennoch zu zeigen, dass sich AMDs Zen-Architektur pro Kern nicht verstecken muss, verglich der Hersteller die Berechnung einer seismischen Analyse mit einem 2-Sockel-Naples-System, das auf 88 Threads - bei weiterhin 16 Speicherkanälen - und langsameren Speicher (1,866 statt 2,400) limitiert wurde. Zum CPU-Takt verriet AMD nichts, ein AVX-Offset wie bei Intel scheint aber zu fehlen.

Mit einer Milliarde Samples als Input erledigte die Naples-Plattform die Berechnung doppelt so schnell, mit vollen 64 Kernen und 128 Threads sowie DDR4-2400 zweieinhalb mal so flott. Wird die Anzahl der Input-Samples auf vier Milliarden erhöht, verweigert das Intel-System den Dienst, da die Speicherkapazität nicht ausreicht, sie zu laden. In diesem ausgewählten, sehr bandbreitenlastigen Szenario schlägt sich Naples also exzellent, obgleich die Berechnung auf AVX-Code setzt, der bei Zen mit weniger Durchsatz abgearbeitet wird als bei Broadwell. Ein Grund dafür ist laut AMD die nahezu perfekte Skalierung von einem auf zwei Sockel dank Infinity Fabric, was bei Intels Broadwell-EP-Familie nicht der Fall sei.

  • Zwei Naples weisen 16 Speicherkanäle auf. (Foto: Marc Sauter/Golem.de)
  • AMD vergleicht zwei Naples mit zwei Xeon E5-2699A v4. (Foto: Marc Sauter/Golem.de)
  • Der Workload ist eine seismische Analyse. (Foto: Marc Sauter/Golem.de)
  • Zwei Naples sind doppelt so schnell wie die beiden Xeon. (Foto: Marc Sauter/Golem.de)
  • Für den Benchmark wurden die Naples auf 44C/88T und DDR4-1866 mit 8CH begrenzt. (Bild: AMD)
  • Ohne die künstliche Limitierung ist das AMD-System um den Faktor 2,5 schneller. (Foto: Marc Sauter/Golem.de)
  • Es werden 64C/128T und DDR4-2400 eingesetzt. (Bild: AMD)
  • Bei 4 Milliarden Samples hat das Intel-System zu wenig RAM. (Foto: Marc Sauter/Golem.de)
  • AMD nutzt 16-GByte-Sticks, ergo 512 GByte bei den Naples und 512 GByte bei den Xeon. (Bild: AMD)
  • Vorabsystem mit zwei Naples-CPUs (Foto: Marc Sauter/Golem.de)
  • Ein Naples besteht aus vier Dies und somit 32 Kernen. (Bild: AMD)
  • Die hohe Menge an PCIe-Gen3-Lanes eignet sich für AI-Beschleuniger wie die Radeon Instinct. (Bild: AMD)
  • Dank Data Fabric soll AMDs Serverplattform nahezu linear mit mehr Kernen skalieren. (Foto: Marc Sauter/Golem.de)
  • Das Fabric wird auch bei Ryzen und Vega verwendet. (Foto: Marc Sauter/Golem.de)
  • Auf Zen folgen Zen2 und Zen3. (Foto: Marc Sauter/Golem.de)
Vorabsystem mit zwei Naples-CPUs (Foto: Marc Sauter/Golem.de)

Ein paar Wochen oder Monate nach Naples erscheint allerdings die Skylake-EP-Generation, die Intel bereits an einige wenige Partner wie Facebook und Google verteilt hat. Die Prozessoren nutzen als 2-Sockel-Plattform 56 Kerne, 12 statt 8 Speicherkanäle, flotteren RAM und 88 statt 80 Lanes. Hinzu kommt eine verbesserte Architektur mit überarbeitetem Cache-System und AVX512-Unterstützung. AMD gab sich zurückhaltend optimistisch: Wie sich Naples gegen eine noch nicht veröffentlichte Plattform schlage, könne nicht bewertet werden. Es ist aber davon auszugehen, dass der Hersteller im Bilde ist.

Schlussendlich gibt es zu viele unbekannte Faktoren, um einschätzen zu können, ob Naples ein Erfolg wird - wenngleich die Zeichen erstmals seit Jahren wieder gut stehen. Für AMD entscheidet vor allem dieser Chip darüber, wie es um die Zukunft des Unternehmens bestellt ist.

Nachtrag vom 8. März 2017, 7:00 Uhr

In einer zusätzlichen Folie aus Mark Papermasters Präsentation vom Tech Day spricht AMD bei Naples mit 32 Kernen von einem Package und vier Chips (1P Dies).

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


ms (Golem.de) 07. Mär 2017

Allzu tief ging AMD bisher nicht, abseits von High Bandwidth bei Low Latency in Form von...

David64Bit 07. Mär 2017

Deswegen ist er wahrscheinlich auch überall ausverkauft bzw. alle Mainboards sind...

cb (Golem.de) 07. Mär 2017

So, jetzt ist hoffentlich alles wieder an seinem Platz. Wir bitten für den Fehler um...



Aktuell auf der Startseite von Golem.de
Intel Core i9-14900KS
Intel ist wahnsinnig geworden - zum Glück!

Um den Core i9-14900KS zur schnellsten Allround-CPU zu machen, hat Intel den Weg der Vernunft scheinbar vollständig verlassen. Doch dahinter stecken gute Neuigkeiten für Intel-Kunden.
Ein IMHO von Martin Böckmann

Intel Core i9-14900KS: Intel ist wahnsinnig geworden - zum Glück!
Artikel
  1. Streaming: Twitch verbietet Popos als Leinwand
    Streaming
    Twitch verbietet Popos als Leinwand

    Auf Hinterteile projizierte Streams sind auf Twitch künftig verboten: Der zu Amazon gehörende Dienst geht gegen einen absurden Trend vor.

  2. FTX-Gründer: Sam Bankman-Fried zu 25 Jahren Haft verurteilt
    FTX-Gründer
    Sam Bankman-Fried zu 25 Jahren Haft verurteilt

    Der Richter betonte die Dreistigkeit der Handlungen von Bankman-Fried. Doch die Haftstrafe für den früheren Chef der Kryptobörse FTX liegt weit unter der Forderung der Anklage.

  3. Truth Social: Warum Trumps kleines Netzwerk Milliarden wert wurde
    Truth Social
    Warum Trumps kleines Netzwerk Milliarden wert wurde

    Donald Trumps verlustbringender Twitter-X-Klon Truth Social wird nach seinem Börsengang mit 9 Milliarden US-Dollar bewertet. Es ist eine Spekulationsblase - und eine Investition in eine potenzielle Trump-Präsidentschaft.
    Ein Bericht von Achim Sawall

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • Palit 4070 Super 579,95€ • Xbox-Controller ab 39,99€ • AVM Fritzbox + Repeater -30% • DVDs & Blu-rays -31% • EA -75% • Ubisoft -50% • MindStar: AMD Ryzen 9 7900 339€, MSI RTX 4080 Super Ventus 3X OC 1.099€ • Gratis-Zugaben PS5 Slim & Nintendo Switch OLED beim TV-Kauf [Werbung]
    •  /