DGX-1: Nvidias Supercomputerchen mit 8x Tesla P100

Zwei Xeon-Prozessoren, acht Tesla-P100-Beschleuniger mit Pascal-Technik und 170 Teraflops bei halber Genauigkeit: Nvidias neuer DGX-1 ist ein Deep-Learning-Supercomputer im kompakten Rack-Format.

Artikel veröffentlicht am ,
DGX-1
DGX-1 (Bild: Nvidia)

Nvidia hat auf der GPU Technology Conference 2016 in San Jose, Kalifornien, den DGX-1 vorgestellt. CEO Jen-Hsun Huang beschreibt diesen als Supercomputer in a Box für Deep Learning, denn genau genommen handelt es sich um ein Rack in einem abgeschlossenen Gehäuse. Im DGX-1 stecken acht der neuen Tesla-P100-Beschleunigerkarten mit Pascal-Technik, weshalb die theoretische Rechenleistung für den kompakten Formfaktor sehr hoch ausfällt.

  • Nvidias DGX-1 liefert 170 FP16-Teraflops (Foto: Marc Sauter/Golem.de)
  • Im System stecken acht Tesla P100. (Foto: Marc Sauter/Golem.de)
  • Der Mini-Supercomputer kostet 129.000 US-Dollar. (Foto: Marc Sauter/Golem.de)
  • DGX-1 verglichen mit zwei Haswell-EP (Foto: Marc Sauter/Golem.de)
  • DGX-1 gegen vier Titan X (Foto: Marc Sauter/Golem.de)
Nvidias DGX-1 liefert 170 FP16-Teraflops (Foto: Marc Sauter/Golem.de)

Der DGX-1 basiert auf einem Dual-Sockel-Board mit zwei Xeon E5-2698 v3. Die beiden 16-Kern-Chips nutzen die Haswell-Architektur und takten mit 2,3 bis 3,6 GHz. Unterstützt werden die Prozessoren von 512 GByte DDR4-2133-Arbeitsspeicher und vier PCIe-SSDs mit jeweils 1,92 TByte im Raid-0. Die eigentliche Rechenleistung liefern die acht Tesla P100: Eine Karte erreicht 21,2 Teraflops bei für Deep Learning völlig ausreichender halber Genauigkeit (FP16, Half Precision). Aufaddiert sind das satte rund 170 Teraflops.

Um die Kommunikation zwischen den einzelnen GPUs zu beschleunigen, nutzt Nvidia den proprietären NV-Link mit 160 GByte pro Sekunde anstatt Daten über den mit 16 GByte pro Sekunde vergleichsweise langsamen PCIe-3.0-x16-Bus zu schicken. Die Leistungsaufnahme des DGX-1 beläuft sich auf 3.200 Watt, zwei 10-GBit-Ethernet-Anschlüsse verbinden das System mit der Außenwelt, hinzu kommt ein 100-GBit-Quad-Infiniband.

  • Nvidias DGX-1 liefert 170 FP16-Teraflops (Foto: Marc Sauter/Golem.de)
  • Im System stecken acht Tesla P100. (Foto: Marc Sauter/Golem.de)
  • Der Mini-Supercomputer kostet 129.000 US-Dollar. (Foto: Marc Sauter/Golem.de)
  • DGX-1 verglichen mit zwei Haswell-EP (Foto: Marc Sauter/Golem.de)
  • DGX-1 gegen vier Titan X (Foto: Marc Sauter/Golem.de)
DGX-1 gegen vier Titan X (Foto: Marc Sauter/Golem.de)

Nvidia vergleicht die Geschwindigkeit des Deep-Learning-Rechners mit zwei Haswell-16-Kern-Xeons und mit der Digits Devbox: Die beiden Prozessoren erreichen wenig überraschend nur 3 Teraflops, die Devbox aufgrund von vier Titan X immerhin knapp 25 Teraflops. Dank architektonischer Verbesserungen sind die acht Tesla P100 aber um den Faktor 12 schneller, wenn es darum geht, einen Bildererkennungsalgorithmus zu berechnen.

Ab Juni 2016 soll der DGX-1 für 129.000 US-Dollar verfügbar sein.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
SU7
Xiaomi stellt elektrische Sportlimousine für 28.000 Euro vor

Xiaomi positioniert sein Elektroauto SU7 gegen das Tesla Model 3 und heizt den Preiskampf auf dem chinesischen Automarkt weiter an.

SU7: Xiaomi stellt elektrische Sportlimousine für 28.000 Euro vor
Artikel
  1. 20 Jahre Far Cry: Das deutsche Grafikwunder
    20 Jahre Far Cry
    Das deutsche Grafikwunder

    Mit Far Cry feierte der deutsche Entwickler Crytek 2004 ein viel beachtetes Debüt. Kann der Südsee-Shooter auch 20 Jahre später noch beeindrucken?
    Von Benedikt Plass-Fleßenkämper

  2. Apple Vision und Journal-App: Apple verklagt Ex-Mitarbeiter wegen Leaks an die Presse
    Apple Vision und Journal-App
    Apple verklagt Ex-Mitarbeiter wegen Leaks an die Presse

    Apple verklagt einen seiner ehemaligen Softwareentwickler, der vertrauliche Informationen über neue Produkte an die Presse weitergegeben haben soll.

  3. Softwareentwicklung: Events und APIs mit DDD entwerfen
    Softwareentwicklung
    Events und APIs mit DDD entwerfen

    Anforderungen an Software ändern sich schneller als je zuvor. Damit Entwickler da mitkommen, sollten sie Domain-driven Design nutzen. Wie das geht, zeigen wir an einem Beispiel.
    Von Annegret Junker

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • Prime: Filme leihen für 0,99€ • Super Sale bei Alternate • MindStar: CHERRY Xtrfy MZ1 RGB Wireless 79€ • Alternate: Corsair RM750x/RM850x 109,90€/124,90€, ADATA 64 GB DDR5-6000 206,89€, Bosch-Professional-Werkzeuge • Gratis-Zugaben PS5 Slim & Nintendo Switch OLED beim TV-Kauf [Werbung]
    •  /