Quadro GP100: Nvidia steckt schnellsten Chip in eine Workstation-Karte

Gleich sechs neue Quadro-Modelle mit Pascal-Technik: Nvidia hat seine Profi-Grafikkartenreihe aktualisiert, darunter die Quadro GP100 mit HBM2-Speicher und ungewöhnliche Varianten wie die Quadro P2000 mit 5 GByte Videospeicher.

Artikel veröffentlicht am ,
Zwei Quadro GP100 mit NV-Link-Brücke
Zwei Quadro GP100 mit NV-Link-Brücke (Bild: Nvidia)

Nvidia hat zur Solidworks Work 2017 im kalifornischen Los Angeles seine Quadro-Linie aktualisiert. Der Hersteller kündigte sechs neue Modelle an, die Profi-Grafikkarten eignen sich für Workstations und sollen ab März 2017 über Partner wie PNY verfügbar sein. Die Modelle bilden die Nachfolger der bisherigen Quadros mit Grafikchips basierend auf der älteren Kepler- oder Maxwell-Technologie und nutzen die aktuelle Pascal-Architektur. Im oberen Leistungssegment schon seit Sommer 2016 verfügbar sind die Quadro P6000 und Quadro P5000 genannten Karten.

  • Jedes Kepler- und Maxwell-Modell erhält einen Pascal-Nachfolger (Bild: Nvidia)
  • Nvidia sieht die Quadro P6000 und die Quadro GP100 als gleich schnell an (Bild: Nvidia)
  • Die Quadro-Pascal-Familie (Bild: Nvidia)
  • Technische Daten der Quadro GP100 (Bild: Nvidia)
  • Technische Daten der Quadro P4000 (Bild: Nvidia)
  • Technische Daten der Quadro P2000 (Bild: Nvidia)
  • Technische Daten der Quadro P1000 (Bild: Nvidia)
  • Technische Daten der Quadro P600 (Bild: Nvidia)
  • Technische Daten der Quadro P400 (Bild: Nvidia)
Jedes Kepler- und Maxwell-Modell erhält einen Pascal-Nachfolger (Bild: Nvidia)

Der Hersteller baut das Portfolio nach oben wie unten aus: Neues Topmodell ist die Quadro GP100, die nach dem verwendeten GP100-Chip benannt ist. Der weist im Vollausbau bis zu 3.840 Rechenkerne auf, wie bei den Tesla P100 schaltet Nvidia aber nur 3.584 Shader-Einheiten davon frei. Das sind weniger als bei der Quadro P6000, dafür verfügt die Quadro GP100 über High Bandwidth Memory (HBM2). Die vier Speicherstapel erreichen zusammen eine Kapazität von 16 statt 24 GByte, die Datenrate fällt mit 720 statt 432 GByte pro Sekunde höher aus. Die theoretische Rechenleistung liegt bei 10 Teraflops bei einfacher Genauigkeit, was etwas langsamer als bei der Quadro P6000 ist. Dafür weist die Quadro GP100 eine deutlich bessere FP16- und FP64-Geschwindigkeit auf. Die beträgt 2:1 und 1:2 statt 1:64 und 1:32 der FP32-Leistung.

Die Quadro GP100 unterstützt NV-Link

Bei einfacher Genauigkeit sind es die erwähnten 10 Teraflops, bei halber Genauigkeit ergo 20 Teraflops und bei doppelter Genauigkeit rund 5 Teraflops. Exakte Taktraten und die thermische Verlustleistung nannte Nvidia bisher nicht. Verglichen mit einer Quadro P6000 soll die Quadro GP100 in Spec Viewperf 12 Geomean gleich schnell sein, andere Anwendungen profitieren von der höheren Speichertransferrate. Wer mehr als eine Karte nutzen will, kann bis zu zwei Stück via NV-Link in Form einer speziellen Doppelbrücke koppeln.

Unterhalb der Quadro GP100, der Quadro P6000 und der Quadro P5000 positioniert Nvidia die neue Quadro P4000: Sie nutzt einen GP104-Chip, bei dem 1.792 der möglichen 2.048 Rechenkerne freigeschaltet sind, und ein 256 Bit breites Interface mit 8 GByte GDDR5-Speicher. Der GPU-Takt fehlt auch hier, die Datenrate soll bei 243 GByte die Sekunde liegen. Die Karte weist eine TDP von 105 Watt sowie eine Single-Slot-Kühlung auf. Bei der Quadro P2000 verwendet Nvidia einen GP106-Chip mit 1.024 Shader-Einheiten und ein 160-Bit-Interface mit 5 GByte GDDR5 für eine Transferrate von 140 GByte pro Sekunde. Die maximale Leistungsaufnahme beziffert Nvidia mit 75 Watt.

GPUALUsFP32-FLOPSInterfaceTransfer-RateSpeicherTDP
Quadro GP100GP1003.58410,3 Teraflops4.096 Bit720 GByte/s16 GByte HBM2235W
Quadro P6000GP1023.84011,6 Teraflops384 Bit432 GByte/s24 GByte GDDR5X250W
Quadro P5000GP1042.5608,9 Teraflops256 Bit288 GByte/s16 GByte GDDR5X180W
Quadro P4000GP1041.7925,3 Teraflops256 Bit243 GByte/s8 GByte GDDR5105W
Quadro P2000GP1061.0243,0 Teraflops160 Bit140 GByte/s5 GByte GDDR575W
Quadro P1000GP1076401,8 Teraflops128 Bit82 GByte/s4 GByte GDDR547W
Quadro P600GP1073841,1 Teraflops128 Bit64 GByte/s2 GByte GDDR540W
Quadro P400GP1072560,6 Teraflops64 Bit32 GByte/s2 GByte GDDR530W
Quadro-Spezifikationen der P-Serie

Die Quadro P1000 basiert auf einem GP107-Chip mit 640 ALUs und einem 128 Bit breiten Interface für 4 GByte GDDR5 mit 82 GByte die Sekunde. Die Karte soll sich mit 47 Watt begnügen. Die Quadro P600 ist mit 384 Kernen, 128 Bit, 2 GByte GDDR5, 64 GByte die Sekunde und 40 Watt darunter angesiedelt. Unter ihr rangiert die Quadro P400 mit 256 Shader-Einheiten, 64 Bit, 2 GByte GDDR5, 32 GByte pro Sekunde und 30 Watt. Alle Karten sind aktiv gekühlt.

Nachtrag vom 6. Februar 2017, 9:50 Uhr

Wir haben den Artikel mit einer Tabelle inklusive den zuvor unbekannten Angaben erweitert.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


jo-1 07. Feb 2017

Du willst mich nicht verstehen - oder? Wenn es einen Bedarf gibt und der Anwender mit...

Arsenal 06. Feb 2017

Ein wahres Meisterwerk der Technik, um 16 weniger Bits auszurechnen, brauche ich 64 Mal...

HubertHans 06. Feb 2017

Du kannst jetzt schon davon ausgehen, das sie sich fuer 4K bei im Schnitt 60FPS eignet...



Aktuell auf der Startseite von Golem.de
SU7
Xiaomi stellt elektrische Sportlimousine für 28.000 Euro vor

Xiaomi positioniert sein Elektroauto SU7 gegen das Tesla Model 3 und heizt den Preiskampf auf dem chinesischen Automarkt weiter an.

SU7: Xiaomi stellt elektrische Sportlimousine für 28.000 Euro vor
Artikel
  1. 20 Jahre Far Cry: Das deutsche Grafikwunder
    20 Jahre Far Cry
    Das deutsche Grafikwunder

    Mit Far Cry feierte der deutsche Entwickler Crytek 2004 ein viel beachtetes Debüt. Kann der Südsee-Shooter auch 20 Jahre später noch beeindrucken?
    Von Benedikt Plass-Fleßenkämper

  2. Apple: Neue iPads sollen sich wegen OLED-Displays verzögern
    Apple
    Neue iPads sollen sich wegen OLED-Displays verzögern

    Die neuen iPad Pro und iPad Air sollen später als erwartet auf den Markt kommen. Der Grund sind die OLED-Displays beim Pro-Modell.

  3. Softwareentwicklung: Events und APIs mit DDD entwerfen
    Softwareentwicklung
    Events und APIs mit DDD entwerfen

    Anforderungen an Software ändern sich schneller als je zuvor. Damit Entwickler da mitkommen, sollten sie Domain-driven Design nutzen. Wie das geht, zeigen wir an einem Beispiel.
    Von Annegret Junker

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • Prime: Filme leihen für 0,99€ • Super Sale bei Alternate • MindStar: CHERRY Xtrfy MZ1 RGB Wireless 79€ • Alternate: Corsair RM750x/RM850x 109,90€/124,90€, ADATA 64 GB DDR5-6000 206,89€, Bosch-Professional-Werkzeuge • Gratis-Zugaben PS5 Slim & Nintendo Switch OLED beim TV-Kauf [Werbung]
    •  /