Lake Crest: Intels Terminator-Chip mit Terabyte-Bandbreite

Auf dem ersten europäischen AI-Day in München hat Intel Details zu Lake Crest genannt. Der Beschleuniger für künstliche Intelligenz soll bei solchen Anwendungen auch Highend-GPUs schlagen. Dafür ist viel neue Technik nötig.

Ein Bericht von veröffentlicht am
Blockdiagramm von Intels Lake Crest
Blockdiagramm von Intels Lake Crest (Bild: Nico Ernst)

Interposer, HBM2, ein neuartiges Netz direkt im Chip: Intel steckt im Moment viel Knowhow in Lake Crest. Es ist der erste von Grund auf neu entwickelte Beschleuniger für künstliche Intelligenz (AI) des Unternehmens. Lake Crest hatte Intel auf seinem ersten AI-Day in San Francisco angekündigt, nun durfte sein Entwickler Naveen Rao in München erste Details zum Aufbau und zur Architektur verraten. Rao hatte nach zehn Jahren als Chipentwickler und einer darauf folgenden Promotion in Neurowissenschaften das Unternehmen Nervana gegründet, das Intel im August 2016 übernahm.

Intels Lake Crest erinnert an Camerons Terminator

Inhalt:
  1. Lake Crest: Intels Terminator-Chip mit Terabyte-Bandbreite
  2. Vier Stacks schaffen 1 TByte pro Sekunde

Folglich ist Lake Crest die Hardware, auf der die von Nervana entwickelten neuronalen Netze laufen sollen. Bisher werden für solche Anwendungen meist FPGAs genutzt, auch solche von Intel - denn den FPGA-Hersteller Altera hatte Intel ebenfalls aufgekauft, und zwar noch vor Nervana. Der Vorteil der Hardware-Netze gegenüber den programmierbaren FPGAs soll vor allem darin liegen, dass sich ein Chip wie Lake Crest zur Laufzeit an den Code anpasst. Er lernt also auf Hardwareebene dazu und wird immer schneller.

Diesen lernenden Computer hatte James Cameron seinen Terminator im zweiten Teil der Filmserie bereits 1991 beschreiben lassen. Eine weitere Parallele zur Science-Fiction: Intel wählt als Symbolgrafik eine dem Terminator-Chip verblüffend ähnliche Darstellung mit Würfeln, die die Rechenknoten (Nodes) darstellen sollen, die an allen Innenseiten untereinander verbunden sind.

Diese Verbindung ist auch eine der größten Neuerungen von Lake Crest, denn die zwölf Rechenwerke sind direkt an alle anderen über bidirektionale Links mit 100 Gigabit pro Sekunde verbunden. Noch höher ist die Speicherbandbreite, denn mit vier 8-GByte-Modulen aus je einem HBM2-Speicherstapel ist insgesamt ein Terabyte pro Sekunde möglich. Folglich kommt Lake Crest auf 32 GByte eigenen Speicher, den sich die Recheneinheiten teilen müssen.

  • Links der vermeintliche Die-Shot von Lake Crest, es handelt sich aber um einen Haswell-EP (Foto: Nico Ernst)
  • Die 8 Terabit pro Sekunde ergeben sich durch vier HBM2-Stapel (Foto: Nico Ernst)
  • Ein Speicherkanal für jede Recheneinheit (Foto: Nico Ernst)
  • Blockdiagramm von Lake Crest mit zwölf Rechenwerken (Foto: Nico Ernst)
  • Intels Roadmap für AI-Beschleuniger (Foto: Nico Ernst)
Links der vermeintliche Die-Shot von Lake Crest, es handelt sich aber um einen Haswell-EP (Foto: Nico Ernst)

Diese Rechenwerke bezeichnet Intel nicht als Cores, sondern als Processing Cluster, zwölf davon sind vorhanden. Der Begriff Cluster deutet darauf hin, dass wie bei einer GPU einer der Cluster aus mehreren kleineren Einheiten besteht. Im Fall von GPUs sind das Arithmetik-Einheiten (ALUs), die Zahl dieser wiederum wird bei Grafikkarten als Marketing-Argument oft Shader genannt. Den Rekord hält hier bisher AMD mit 4.096 ALUs auf dem Fiji-Chip der Radeon Fury X.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
Vier Stacks schaffen 1 TByte pro Sekunde 
  1. 1
  2. 2
  3.  


Neuro-Chef 04. Feb 2017

Nein, aber des Golems Forum kürzt Links und eingebundene Bilder auf eine IMHO ziemlich...

xmaniac 03. Feb 2017

...aber die letzten Versuche etwas mit den Hochleistungs GPUs gleichzusetzen endeten...

m.lettrich 03. Feb 2017

Also was ich hier sehe ist eine Konsequente Entwicklung eines Produkts für hohen...

Anonymer Nutzer 03. Feb 2017

Dann schick mir bitte einen anatomisch korrekten TX. Danke :-p



Aktuell auf der Startseite von Golem.de
Truth Social
Warum Trumps kleines Netzwerk Milliarden wert wurde

Donald Trumps verlustbringender Twitter-X-Klon Truth Social wird nach seinem Börsengang mit 9 Milliarden US-Dollar bewertet. Es ist eine Spekulationsblase - und eine Investition in eine potenzielle Trump-Präsidentschaft.
Ein Bericht von Achim Sawall

Truth Social: Warum Trumps kleines Netzwerk Milliarden wert wurde
Artikel
  1. Intel Core i9-14900KS: Intel ist wahnsinnig geworden - zum Glück!
    Intel Core i9-14900KS
    Intel ist wahnsinnig geworden - zum Glück!

    Um den Core i9-14900KS zur schnellsten Allround-CPU zu machen, hat Intel den Weg der Vernunft scheinbar vollständig verlassen. Doch dahinter stecken gute Neuigkeiten für Intel-Kunden.
    Ein IMHO von Martin Böckmann

  2. Pushpak: Indiens Spaceshuttle landet autonom
    Pushpak
    Indiens Spaceshuttle landet autonom

    Die indische Raumfahrtagentur Isro arbeitet an einem wiederverwendbaren Raumflugzeug, das bis Ende des Jahrzehnts fürs Weltall einsatzbereit sein soll. Auch der zweite Testflug verlief erfolgreich.

  3. Elektromobilität: Warum der Elektroauto-Hype erst anfängt
    Elektromobilität
    Warum der Elektroauto-Hype erst anfängt

    In den vergangenen Wochen konnte man den Eindruck gewinnen, als sei das Elektroauto schon abgeschrieben. Doch das scheint eine typisch deutsche Debatte zu sein.
    Eine Analyse von Friedhelm Greis

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • Palit 4070 Super 579,95€ • Xbox-Controller ab 39,99€ • AVM Fritzbox + Repeater -30% • DVDs & Blu-rays -31% • EA -75% • Ubisoft -50% • MindStar: AMD Ryzen 9 7900 339€, MSI RTX 4080 Super Ventus 3X OC 1.099€ • Gratis-Zugaben PS5 Slim & Nintendo Switch OLED beim TV-Kauf [Werbung]
    •  /