Kepler GK110: Größter Chip der Welt mit 7 Mrd. Transistoren und Hyper-Q

Zur Eröffnung der Konferenz GTC hat Nvidia-Chef Jen-Hsun Huang mit dem GK110 seine neue GPU vorgestellt. Der riesige Chip soll Supercomputer und Workstations mit bis zu 2.880 Rechenwerken beschleunigen - aber erst Ende 2012 als Tesla K20.

Artikel veröffentlicht am ,
Kepler für Grafik und Rechenanwendungen
Kepler für Grafik und Rechenanwendungen (Bild: Nico Ernst/Golem.de)

Eigentlich war sie mit besonderer Spannung erwartet worden: die Keynote-Ansprache von Nvidia-Mitbegründer und -Chef Jen-Hsun Huang. Schon im Vorfeld sickerte dann aber durch, dass Huang zur Eröffnung der dritten Ausgabe der GPU Technology Conference (GTC) den neuen Chip Kepler GK110 vorstellen werde, und dass dieser aus etwa 7 Milliarden Transistoren bestehe. Auch Nvidia selbst nannte die Zahl eher beiläufig in den vorab an Journalisten verteilten Unterlagen.

Inhalt:
  1. Kepler GK110: Größter Chip der Welt mit 7 Mrd. Transistoren und Hyper-Q
  2. GPU-Programme parallelisieren sich selbst

Was Huang dann aber auf der Bühne des San Jose Convention Center zeigte, hatte so kaum jemand erwartet - vor allem, weil die zahlreichen neuen Funktionen nicht für die nun erhältlichen Kepler-GPUs und die erste für Rechenanwendungen vorgesehene Karte Tesla K10 gelten, sondern nur für die GPU GK110, die erst im vierten Quartal 2012 auf den Markt kommen soll. GK110 basiert zwar auf der Kepler-Architektur, die auch für die Spielegrafikkarten verwendeten GK104 (Geforce GTX-670, 680, 690) haben mit der neuen GPU aber nur wenig zu tun.

  • Nvidia-Chef Jen-Hsun Huang eröffnet die GTC.
  • Der Kepler GK110 mit drei neuen Funktionen
  • Dichter gepackte Rechenwerke
  • Die Tesla K20 wird die erste Karte mit den neuen Funktionen. (Fotos: Nico Ernst)
  • Die klassischen Anwendungen für GPU-Computing
  • Die ungleichmäßige Auslastung (l.) soll Hyper-Q verhindern.
  • Auslastung der GPU ohne Hyper-Q....
  • ... und mit Hyper-Q. Mehr rechnen in weniger Zeit spart Energie.
  • Nested Loops kann die GPU nun wie rechts zu sehen selbst auflösen.
  • Nicht immer ist es sinnvoll, besonders fein zu parallelisieren.
Die Tesla K20 wird die erste Karte mit den neuen Funktionen. (Fotos: Nico Ernst)

GK110 ist nicht, wie bei früheren Nvidia-Chips, nur ein Ableger der Spiele-GPU mit mehr Rechenwerken, die bei Nvidia Cuda-Cores heißen. Vielmehr gibt es zwar mehr von diesen Einheiten - wie viele hat Nvidia noch nicht verraten -, aber vor allem drei neue Funktionen, die einige der größten Probleme bei GPU-Computing lösen sollen.

Die erste ist "Hyper-Q". So nennt Nvidia die Tatsache, dass der neue Kepler nun von 32 Threads der CPU gefüttert werden kann. Bisher waren GPUs immer dadurch limitiert, dass sie nur über einen Thread mit Befehlen und Daten versorgt werden konnten. Nun, so sagte Huang, könnten auch 32 physikalische Kerne einer CPU gleichzeitig eine einzelne Kepler-GPU ansteuern.

Zwar beherrschten die verschiedenen Schnittstellen, auch DirectX, schon die Verarbeitung von GPU-Befehlen mit mehreren Threads, die GPU selbst war aber immer auf die serielle Übergabe der parallel zu bearbeitenden Daten angewiesen. Diese Beschränkung wird nun aufgehoben, was dafür sorgen soll, dass die GPU immer so weit wie möglich ausgelastet werden kann.

Das klappt auch anders herum: Über eine Cuda-Schnittstelle kann eine CPU mehrere GPUs mit nur einem Thread ansprechen. Das funktioniert unter anderem durch "GPU Direct". Über das Netzwerk - Tesla-Karten stecken in der Regel in Servern - haben die GPUs direkten Zugriff auf den Speicher ihrer Kollegen. Bisher war dafür immer das Kopieren in den Hauptspeicher über die CPU nötig, was viel Zeit gekostet hat.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
GPU-Programme parallelisieren sich selbst 
  1. 1
  2. 2
  3.  


Aktuell auf der Startseite von Golem.de
Keoken Interactive
Spielemacher rühren Fans mit Studioschließung

Mehr als 200 Pitches bei Publishern, aber kein neues Projekt: Das Entwicklerstudio Keoken (Deliver us Mars) macht dicht - auf herzbewegende Art.

Keoken Interactive: Spielemacher rühren Fans mit Studioschließung
Artikel
  1. Energie: Können Windparks sich gegenseitig den Wind wegnehmen?
    Energie
    Können Windparks sich gegenseitig den Wind wegnehmen?

    Inwieweit beeinflussen Windparks den Windfluss für bereits bestehende Windparks? Dieser Frage ist eine Forschungsgruppe an der US-Westküste nachgegangen.

  2. Unterschätzte Wertschätzung: Nicht geschimpft ist nicht gelobt genug
    Unterschätzte Wertschätzung
    Nicht geschimpft ist nicht gelobt genug

    Viele IT-Profis stehen kurz vor dem Burnout oder haben innerlich gekündigt. Mangelnde Wertschätzung ist oft die Ursache. Wie können Führungskräfte gegensteuern?
    Ein Ratgebertext von Marc Favre

  3. Ground-Launched Small Diameter Bomb: Russische Abwehrmaßnahme schaltet US-Präzisionswaffe aus
    Ground-Launched Small Diameter Bomb
    Russische Abwehrmaßnahme schaltet US-Präzisionswaffe aus

    Präzisionsgelenkte US-Munition ist im Ukrainekrieg der russischen elektronischen Kriegsführung teilweise unterlegen. Das zeigt der Einsatz der GLSDB.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Crucial P3 4 TB Acronis 189,99€ • AMD Ryzen 7 5800X 159€ und Ryzen 5 5600X 105,90€ • Fnatic STREAK65 45,59€ • Fractal Design Terra Jade 154,39€ • Lian Li O11 Air Mini 78,89€ • Speicher von Samsung bis -48% • 2023er TVs bis -63% • Amazon Gaming Week • Apple Week bei MediaMarkt [Werbung]
    •  /