Cooper Lake SP & Barlow Pass: Intels CPUs finden Katzen-Bilder doppelt so schnell

Training und Inferencing laufen dank BF16-Unterstützung flotter, auch Intels persistenter Optane-Speicher wird zügiger.

Ein Bericht von veröffentlicht am
Cooper Lake SP im Überblick
Cooper Lake SP im Überblick (Bild: Intel)

Intel hat die 3rd Gen Xeon Scalable alias Cooper Lake SP vorgestellt, vermarktet werden die Server-CPUs als Xeon Platinum 8300H(L) und als Xeon Gold 6300H(L)/5300H. Gedacht sind sie für Systeme, die mit künstlicher Intelligenz arbeiten, denn die Prozessoren nutzen das in diesem Segment beliebte BF16-Format für Training und Inferencing.

Der Marketing-Begriff seitens Intel lautet Deep Learning Boost, wobei darunter bisher schon eine Beschleunigung des INT8-Formats fiel. Die aktuellen Cascade Lake AP/SP unterstützen hierzu die vier VNNI (Vector Neural Network Instructions) für AVX-512, indem sie nur einen Taktzyklus statt drei für entsprechende Matrix-Multiplikationen benötigen. Die Cooper Lake führen dieses Prinzip bei BF16 fort, verglichen zu FP32 verdoppelt sich die Leistung theoretisch.

BF16 ist ein Gleitkomma-Format mit 8 Bits für den Exponenten und 7 Bits für die Mantisse. Dadurch steigt die Geschwindigkeit gegenüber FP32 bei geringerer Präzision, wohingegen INT8 deutlich schneller bei erneut niedrigerer Genauigkeit rechnet. Für Deep Learning ist das Format daher interessant, da es für Training und Inferencing eingesetzt werden kann. Intel selbst unterstützt BF16 bereits mit dem eigenen KI-Beschleuniger von Habana Labs und Nervana, auch die TPUs von Google beherrschen den Umgang mit BF16.

  • Überblick zu Cooper Lake (Bild: Intel)
  • Überblick zu Cooper Lake (Bild: Intel)
  • Überblick zu Cooper Lake (Bild: Intel)
  • Überblick zu Cooper Lake (Bild: Intel)
  • Modelle von Cooper Lake, ausgenommen Off-Roadmap-SKUs (Bild: Intel)
  • Überblick zu Cooper Lake (Bild: Intel)
  • Server-CPU-Roadmap (Bild: Intel)
  • Überblick zu Barlow Pass (Bild: Intel)
  • Überblick zu Barlow Pass (Bild: Intel)
  • Überblick zu Stratix 10 NX (Bild: Intel)
  • Überblick zu Stratix 10 NX (Bild: Intel)
  • Überblick zu SSDs (Bild: Intel)
Überblick zu Cooper Lake (Bild: Intel)

Während die Cascade Lake SP respektive die Purley-Plattform primär für 2-Sockel-Server gedacht ist, positioniert Intel die Cedar-Island-Plattform mit Cooper Lake (CPX6) rein für Systeme mit vier oder acht Sockeln und von drei auf sechs verdoppelten QPI-Links (je 10,4 GT/s) pro CPU. Die Fassung LGA 4189 weist sechs Speicherkanäle für bis zu DDR4-3200 (1DPC) statt DDR4-2933 auf, zudem unterstützen die Cooper Lake auch die zweite Generation des Optane DC Persistent Memory alias Barlow Pass - dazu gleich mehr. Im Vollausbau haben die 14-nm-Server-CPUs bis zu 28 Kerne und 56 Threads sowie 48 PCIe-Gen3-Lanes, da es sich um leicht überarbeitete Cascade Lake SP handelt. Tatsächlich werden die Cooper Lake schon seit vielen Monaten von Facebook eingesetzt.

Mittlerweile will Intel weitere Partner für die CPUs haben - darunter Alibaba, Ant Group, Hisign Technology, Hyve Solutions, Matroid, Neusoft und Tencent. Dank BF16-Unterstützung sollen unter anderem Computerlinguistik für Satzbau- oder Spracherkennung sowie Foto- und Videoanalyse, aber auch Biometrie-Berechnungen und Suchmaschinen um den Faktor 1,58 bis 1,97 beschleunigt werden. Wie schon bei den Cascade Lake SP gibt es auch bei den Cooper Lake das sogenannte Speed Select, genauer SST-BF (Base Frequency) für mehr Basistakt und SST-CP (Clock Priority) für mehr Takt bei Kernen mit priorisierten Tasks.

Neben Cooper Lake gab Intel auch einen Ausblick auf kommende Server-CPU-Generation: Noch 2020 sollen die Ice Lake SP mit bis zu 38 Kernen im 10-nm-Verfahren erscheinen. Sie passen in die Fassung LGA 4189, haben acht Speicherkanäle, nutzen PCIe Gen4 und sind für 2-Sockel-Systeme ausgelegt. 2021 folgen dann die Sapphire Rapids, hier wechselt Intel auf die Fassung LGA 4677, da die Chips ein achtkanaliges Interface für DDR5-Speicher aufweisen und PCIe Gen5 beherrschen. Sapphire Rapids unterstützt die AMX (Advanced Matrix Extensions) für schnelle Matrizen-Multiplikationen mit BF16 und INT8.

  • Überblick zu Cooper Lake (Bild: Intel)
  • Überblick zu Cooper Lake (Bild: Intel)
  • Überblick zu Cooper Lake (Bild: Intel)
  • Überblick zu Cooper Lake (Bild: Intel)
  • Modelle von Cooper Lake, ausgenommen Off-Roadmap-SKUs (Bild: Intel)
  • Überblick zu Cooper Lake (Bild: Intel)
  • Server-CPU-Roadmap (Bild: Intel)
  • Überblick zu Barlow Pass (Bild: Intel)
  • Überblick zu Barlow Pass (Bild: Intel)
  • Überblick zu Stratix 10 NX (Bild: Intel)
  • Überblick zu Stratix 10 NX (Bild: Intel)
  • Überblick zu SSDs (Bild: Intel)
Überblick zu Barlow Pass (Bild: Intel)

Cooper Lake und Ice Lake unterstützen den bereits erwähnten nicht flüchtigen Optane DC Persistent Memory 200 alias Barlow Pass: Mit sechs 256-GByte-DDR4- und sechs 512-GByte-Optane-Riegeln pro Sockel sind 4,5 TByte pro Sockel bei den HL-Modellen möglich. Die L-Ableger erreichen 1,12 TByte pro Sockel durch sechs 64-GByte-DDR4- und sechs 128-GByte-Optane-Module. Barlow Pass ähnelt bisherigen Optane DC Persistent Memory 100 alias Apache Pass, selbst die Anzahl und Kapazität der Speicherchips ist identisch; gleiches gilt für die bis zu 18 Watt pro Riegel. Optimierungen am Controller und bei der Fertigung sollen jedoch die Datentransfer-Rate um durchschnittlich 25 Prozent anheben.

Abseits von Cooper Lake und Barlow Pass hat Intel noch einen FPGA namens Stratix 10 NX vorgestellt. Das Design nutzt HBM2-Speicher und integriert Tensor-Einheiten, welche die INT8-Geschwindigkeit um das 15-Fache steigern. Zu den ersten Partnern gehört Microsoft für die eigene AI-Cloud. Ebenfalls neu sind U.2-SSDs namens Arbordale Plus, genauer die D7-P5600 und die D7-P5500. Beide nutzen PCIe Gen4 und sind für Datacenter gedacht, Intel verwendet den 3D-NAND-Flash v3 mit 96 Schichten und drei Bit pro Zelle (TLC).

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
CPUNodeKerneSockelRAM-KanälePCIeLaunch
Nehalem EPXeon W559045 nm4LGA 13663x DDR3-133336x Gen22009
Westmere EPXeon X569032 nm6LGA 13663x DDR3-133336x Gen22010
Sandy Bridge EPXeon E5-269032 nm8LGA 20114x DDR3-160040x Gen22012
Ivy Bridge EPXeon E5-2690 v222 nm10LGA 20114x DDR3-186640x Gen32013
Haswell EPXeon E5-2699 v322 nm18LGA 2011-34x DDR4-213340x Gen32014
Broadwell EPXeon E5-2699 v414 nm22LGA 2011-34x DDR4-240040x Gen32016
Skylake SPXeon 8180M14+ nm28LGA 36476x DDR4-266648x Gen32017
Cascade Lake SPXeon 8280M14++ nm28LGA 36476x DDR4-2933, Optane48x Gen32019
Ice Lake SPXeon 838010 nm40LGA 41898x DDR4-3200, Optane v264x Gen42021
Sapphire Rapids SP(?)Intel 756LGA 46778x DDR5, Optane v3Gen52022
Emerald Rapids SP(?)Intel 764LGA 46778x DDR5, Optane v3Gen52023
Granite Rapids SP(?)Intel 3(?)LGA 46778x DDR5, Optane v4Gen52024
Sierra Forest SP(?)Intel 3(?)(?)(?)(?)2025
Diamond Rapids SP(?)(?)(?)(?)(?)(?)2025
Xeon-Generationen (Dual Sockel) von Intel im Überblick


Aktuell auf der Startseite von Golem.de
Kapazitätsengpässe
Oranienburg erlaubt keine neuen Hausanschlüsse mehr

Der Strombedarf in Oranienburg ist zu hoch für neue Verbraucher geworden. Ein neues Umspannwerk kommt zu spät für neue Wärmepumpen und Wallboxen.

Kapazitätsengpässe: Oranienburg erlaubt keine neuen Hausanschlüsse mehr
Artikel
  1. Star Wars Outlaws: Spieler sauer wegen Jabbas Schachzug
    Star Wars Outlaws
    Spieler sauer wegen Jabbas Schachzug

    Ein Einsatz für Jabba in den ziemlich teuren Spezialeditionen von Star Wars Outlaws: Damit sorgt Ubisoft bei Spielern für Empörung.

  2. Microsoft: Copilot-App in Windows sammelt keine Benutzerdaten
    Microsoft
    Copilot-App in Windows sammelt keine Benutzerdaten

    Microsoft hat Bedenken von Administratoren bezüglich des unerwarteten Auftretens einer Copilot-Anwendung auf Windows-Systemen ausgeräumt.

  3. Hala Point: Intels Gehirn-Simulator hat die Rechenkapazität einer Eule
    Hala Point
    Intels Gehirn-Simulator hat die Rechenkapazität einer Eule

    Der Hersteller präsentiert das größte neuromorphe System der Welt. Es soll auch die KI-Forschung entscheidend voranbringen.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • AVM Heizkörperregler zum Tiefstpreis • Limitierter Sennheiser-Kopfhörer günstiger! • MindStar: Gigabyte RTX 4070 Super Gaming OC 649€ - günstig wie nie! • Switch-Spar-Sets • HP Omen 16.1" FHD/144 Hz, Ryzen 7 6800H, RTX 3070 Ti -52% • Alternate: Notebook- und Super-Sale [Werbung]
    •  /