Quadro GP100: Nvidia steckt schnellsten Chip in eine Workstation-Karte
Gleich sechs neue Quadro-Modelle mit Pascal-Technik: Nvidia hat seine Profi-Grafikkartenreihe aktualisiert, darunter die Quadro GP100 mit HBM2-Speicher und ungewöhnliche Varianten wie die Quadro P2000 mit 5 GByte Videospeicher.
Nvidia hat zur Solidworks Work 2017 im kalifornischen Los Angeles seine Quadro-Linie aktualisiert. Der Hersteller kündigte sechs neue Modelle an, die Profi-Grafikkarten eignen sich für Workstations und sollen ab März 2017 über Partner wie PNY verfügbar sein. Die Modelle bilden die Nachfolger der bisherigen Quadros mit Grafikchips basierend auf der älteren Kepler- oder Maxwell-Technologie und nutzen die aktuelle Pascal-Architektur. Im oberen Leistungssegment schon seit Sommer 2016 verfügbar sind die Quadro P6000 und Quadro P5000 genannten Karten.
Der Hersteller baut das Portfolio nach oben wie unten aus: Neues Topmodell ist die Quadro GP100, die nach dem verwendeten GP100-Chip benannt ist. Der weist im Vollausbau bis zu 3.840 Rechenkerne auf, wie bei den Tesla P100 schaltet Nvidia aber nur 3.584 Shader-Einheiten davon frei. Das sind weniger als bei der Quadro P6000, dafür verfügt die Quadro GP100 über High Bandwidth Memory (HBM2). Die vier Speicherstapel erreichen zusammen eine Kapazität von 16 statt 24 GByte, die Datenrate fällt mit 720 statt 432 GByte pro Sekunde höher aus. Die theoretische Rechenleistung liegt bei 10 Teraflops bei einfacher Genauigkeit, was etwas langsamer als bei der Quadro P6000 ist. Dafür weist die Quadro GP100 eine deutlich bessere FP16- und FP64-Geschwindigkeit auf. Die beträgt 2:1 und 1:2 statt 1:64 und 1:32 der FP32-Leistung.
Die Quadro GP100 unterstützt NV-Link
Bei einfacher Genauigkeit sind es die erwähnten 10 Teraflops, bei halber Genauigkeit ergo 20 Teraflops und bei doppelter Genauigkeit rund 5 Teraflops. Exakte Taktraten und die thermische Verlustleistung nannte Nvidia bisher nicht. Verglichen mit einer Quadro P6000 soll die Quadro GP100 in Spec Viewperf 12 Geomean gleich schnell sein, andere Anwendungen profitieren von der höheren Speichertransferrate. Wer mehr als eine Karte nutzen will, kann bis zu zwei Stück via NV-Link in Form einer speziellen Doppelbrücke koppeln.
Unterhalb der Quadro GP100, der Quadro P6000 und der Quadro P5000 positioniert Nvidia die neue Quadro P4000: Sie nutzt einen GP104-Chip, bei dem 1.792 der möglichen 2.048 Rechenkerne freigeschaltet sind, und ein 256 Bit breites Interface mit 8 GByte GDDR5-Speicher. Der GPU-Takt fehlt auch hier, die Datenrate soll bei 243 GByte die Sekunde liegen. Die Karte weist eine TDP von 105 Watt sowie eine Single-Slot-Kühlung auf. Bei der Quadro P2000 verwendet Nvidia einen GP106-Chip mit 1.024 Shader-Einheiten und ein 160-Bit-Interface mit 5 GByte GDDR5 für eine Transferrate von 140 GByte pro Sekunde. Die maximale Leistungsaufnahme beziffert Nvidia mit 75 Watt.
GPU | ALUs | FP32-FLOPS | Interface | Transfer-Rate | Speicher | TDP | |
Quadro GP100 | GP100 | 3.584 | 10,3 Teraflops | 4.096 Bit | 720 GByte/s | 16 GByte HBM2 | 235W |
Quadro P6000 | GP102 | 3.840 | 11,6 Teraflops | 384 Bit | 432 GByte/s | 24 GByte GDDR5X | 250W |
Quadro P5000 | GP104 | 2.560 | 8,9 Teraflops | 256 Bit | 288 GByte/s | 16 GByte GDDR5X | 180W |
Quadro P4000 | GP104 | 1.792 | 5,3 Teraflops | 256 Bit | 243 GByte/s | 8 GByte GDDR5 | 105W |
Quadro P2000 | GP106 | 1.024 | 3,0 Teraflops | 160 Bit | 140 GByte/s | 5 GByte GDDR5 | 75W |
Quadro P1000 | GP107 | 640 | 1,8 Teraflops | 128 Bit | 82 GByte/s | 4 GByte GDDR5 | 47W |
Quadro P600 | GP107 | 384 | 1,1 Teraflops | 128 Bit | 64 GByte/s | 2 GByte GDDR5 | 40W |
Quadro P400 | GP107 | 256 | 0,6 Teraflops | 64 Bit | 32 GByte/s | 2 GByte GDDR5 | 30W |
Die Quadro P1000 basiert auf einem GP107-Chip mit 640 ALUs und einem 128 Bit breiten Interface für 4 GByte GDDR5 mit 82 GByte die Sekunde. Die Karte soll sich mit 47 Watt begnügen. Die Quadro P600 ist mit 384 Kernen, 128 Bit, 2 GByte GDDR5, 64 GByte die Sekunde und 40 Watt darunter angesiedelt. Unter ihr rangiert die Quadro P400 mit 256 Shader-Einheiten, 64 Bit, 2 GByte GDDR5, 32 GByte pro Sekunde und 30 Watt. Alle Karten sind aktiv gekühlt.
Nachtrag vom 6. Februar 2017, 9:50 Uhr
Wir haben den Artikel mit einer Tabelle inklusive den zuvor unbekannten Angaben erweitert.
Du willst mich nicht verstehen - oder? Wenn es einen Bedarf gibt und der Anwender mit...
Ein wahres Meisterwerk der Technik, um 16 weniger Bits auszurechnen, brauche ich 64 Mal...
Du kannst jetzt schon davon ausgehen, das sie sich fuer 4K bei im Schnitt 60FPS eignet...