Pascal GP100: Nvidias Grafikchip besteht aus 15 Milliarden Transistoren

15,3 Milliarden Transistoren auf 610 mm² Chipfläche im 16FF-Prozess und 3.840 Shader-Einheiten mit 16 GByte HBM2-Speicher: Nvidia hat den GP100-Grafikchip mit Pascal-Technik vorgestellt.

Artikel veröffentlicht am ,
Nvidia-Chef Jen-Hsun Huang stellt den GP100 vor.
Nvidia-Chef Jen-Hsun Huang stellt den GP100 vor. (Bild: Marc Sauter/Golem.de)

Nvidia-Chef Jen-Hsun Huang hat auf der Keynote der GPU Technology Conference 2016 in San Jose, Kalifornien, den GP100-Grafikchip samt der Tesla-P100-Beschleunigerkarte angekündigt. Die auf der Pascal-Architektur basierende Tesla P100 erreicht eine Geschwindigkeit von 10,6 Teraflops bei einfacher Genauigkeit (FP32), was für Spiele wichtig ist. Die für wissenschaftliche Anwendungen relevante FP64-Performance (doppelte Genauigkeit) gibt Nvidia mit 5,3 Teraflops an - das Verhältnis 2:1 gab es bisher nur bei AMD.

Der GP100-Chip wird im 16FF-Prozess bei der TSMC gefertigt und besteht aus 15 Milliarden Transistoren. Zum Vergleich: Nvidias aktueller GM200 der Titan X integriert 8 Milliarden Transistoren und AMDs Fiji der Fury X 8,9 Milliarden Transistoren. Die Die-Fläche des GP100 gibt Nvidia mit enormen 610 mm² an, was etwas größer als der GM200 (601 mm²) und der Fiji (596 mm²) ist. Der Chip soll sich bereits in der Serienfertigung befinden, was angesichts der Maße erstaunlich ist. Fragen zur Yield-Rate wollte Nvidia nicht beantworten.

  • Nvidia-Chef Jen-Hsun Huang (Foto: Marc Sauter/Golem.de)
  • Jen-Hsun Huang stellt die Tesla P100 vor. (Foto: Marc Sauter/Golem.de)
  • Die Tesla P100 schafft 21,2 Teraflops. (Foto: Marc Sauter/Golem.de)
  • Tesla P100 (Foto: Marc Sauter/Golem.de)
  • Leistungswerte der Tesla P100 (Foto: Marc Sauter/Golem.de)
  • Der Chip wird im 16FF-Prozess hergestellt und nutzt HBM2. (Foto: Marc Sauter/Golem.de)
  • Blockdiagramm des GP100 (Foto: Marc Sauter/Golem.de)
  • Blockdiagramm eines SM eines GP100 (Foto: Marc Sauter/Golem.de)
Die Tesla P100 schafft 21,2 Teraflops. (Foto: Marc Sauter/Golem.de)

Die Basis für den neuen GP100 bilden sechs Graphics Processor Cluster (GPC). Jeder enthält fünf Texture Processor Cluster (TPC) mit zwei Streaming Multiprocessors (SMP) mit 64 Shader- und 40 Textur-Einheiten, was an AMDs GCN erinnert. Insgesamt bietet der Chip ergo 3.840 ALUs und 240 TMUs, der L2-Cache fasst 4 MByte. Hinzu kommen 15,36 MByte an Register-Speicher für schnelle On-Chip-Berechnungen. Das Speicherinterface ist 4.096 Bit breit und nutzt High Bandwidth Memory (HBM2), der mit auf einem Interposer sitzt.

Für die Tesla P100 schaltet Nvidia 3.584 Shader-Einheiten frei und taktet sie mit 1.328 MHz Basis- und 1.480 MHz Boost-Frequenz. Daraus resultieren 21,2 Teraflops bei halber Genauigkeit (FP16). Bei einfacher Genauigkeit (FP32) sind es 10,6 Teraflops und bei doppelter Genauigkeit (FP64) noch 5,3 Teraflops. Nvidia verbaut FP32-Einheiten, die pro Takt zwei FP16-Berechnungen durchführen können, und dedizierte FP64-ALUs. Das 4:2:1-Verhältnis ist untypisch, bisherige Nvidia-Architekturen beherrschen bis zu 3:1 für FP32/FP64. Nicht beschleunigt ist INT8, also Integer mit acht Bit Genauigkeit, was andere Pascal-Chips bei vierfacher FP32-Geschwindigkeit ausführen können (sofern freigeschaltet).

  • Nvidia-Chef Jen-Hsun Huang (Foto: Marc Sauter/Golem.de)
  • Jen-Hsun Huang stellt die Tesla P100 vor. (Foto: Marc Sauter/Golem.de)
  • Die Tesla P100 schafft 21,2 Teraflops. (Foto: Marc Sauter/Golem.de)
  • Tesla P100 (Foto: Marc Sauter/Golem.de)
  • Leistungswerte der Tesla P100 (Foto: Marc Sauter/Golem.de)
  • Der Chip wird im 16FF-Prozess hergestellt und nutzt HBM2. (Foto: Marc Sauter/Golem.de)
  • Blockdiagramm des GP100 (Foto: Marc Sauter/Golem.de)
  • Blockdiagramm eines SM eines GP100 (Foto: Marc Sauter/Golem.de)
Tesla P100 (Foto: Marc Sauter/Golem.de)

Am 4.096-Bit-Interface hängen 16 GByte HBM2 von Samsung. Die vier Stacks liefern eine Datentransfer-Rate von 720 GByte pro Sekunde. Das entspricht rund 1,4 GHz - HBM2 schafft allerdings bis zu 2 GHz. Da die Tesla P100 allerdings keinen GP100-Vollausbau nutzt, ist eine gedrosselte Speichergeschwindigkeit sinnvoll, um die 300 Watt TDP einzuhalten.

Vorerst erhalten Cloud-Plattform-Anbieter Zugriff auf die Tesla-P100-Karten, einzelne Hersteller folgen im ersten Quartal 2017. Ein auf dem GP100 basierendes Geforce-Modell hat Nvidia nicht angekündigt.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Ach 06. Apr 2016

Das Problem ist heutzutage halt, dass der Speicher zum Nadelöhr wird. 4K, 8K und HDRI...

Golressy 06. Apr 2016

Cloud-Plattform-Anbieter erhalten die Karten nur? Da die meisten Clouds ja auf Linux/Unix...

Prypjat 06. Apr 2016

Das ist ein treffender Vergleich. Viele Online Shops haben die Angabe zum Speicher in den...

anonym 06. Apr 2016

ach deswegen gibts den dgx1 mit 8 tesla p100 die per pcie and 2 xeons angebunden sind...



Aktuell auf der Startseite von Golem.de
DeepL Write Pro
DeepL verbessert Texte jetzt in Echtzeit

DeepL veröffentlicht sein erstes Produkt, das auf einem eigenen KI-Modell basiert.

DeepL Write Pro: DeepL verbessert Texte jetzt in Echtzeit
Artikel
  1. General Atomics Mojave: US-Drohne mit Miniguns schießt mit 6.000 Schuss pro Minute
    General Atomics Mojave
    US-Drohne mit Miniguns schießt mit 6.000 Schuss pro Minute

    General Atomics hat eine Großdrohne mit zwei Miniguns getestet, die eine Kadenz von 6.000 Schuss pro Minute erreichen.

  2. Stiftung Warentest: Viele Balkonkraftwerke mit Mängeln
    Stiftung Warentest
    Viele Balkonkraftwerke mit Mängeln

    Die Stiftung Warentest hat acht Balkonkraftwerke genauer unter die Lupe genommen und kommt zu einem ernüchternden Ergebnis: Nur eine einzige Anlage schneidet im Test gut ab.

  3. Elektro-Limousine: BMW wertet den i4 mit neuem Design und Serienextras auf
    Elektro-Limousine
    BMW wertet den i4 mit neuem Design und Serienextras auf

    Der BMW i4 bekommt ein Technik- und Designupdate, das die Attraktivität des vollelektrischen Mittelklasse-Fahrzeugs steigern soll.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Gigabyte GeForce RTX 4070 Ti zum Tiefstpreis • MediaMarkt: Asus Gaming-Laptop 999€ statt 1.599€ • Anker USB-Ladegeräte -45% • OLED-TV von LG 54% günstiger • Gamesplanet Spring Sale [Werbung]
    •  /