Jen-Hsun Huang im Interview

"Fermi war anfangs völlig kaputt"

GTC

Vor Journalisten hat Nvidias CEO und Mitbegründer Jen-Hsun Huang erstmals detailliert erklärt, was den Marktstart der GPU mit dem Codenamen Fermi ein halbes Jahr verzögert hat. Technische Schwierigkeiten trafen dabei auf einen Managementfehler. Vom aktuellen Trend zu CPU-/GPU-Integration hält Huang wenig.

Artikel veröffentlicht am ,
Jen-Hsuan Huang im Gespräch
Jen-Hsuan Huang im Gespräch

Nvidias Fermi ist mit 3 Milliarden Transistoren einer der komplexesten Chips der Halbleitergeschichte. Ihre hohe Leistungsfähigkeit erreicht die GPU durch 512 Rechenwerke - von denen bisher in den schnellsten Modellen nur 480 aktiviert sind - und einen L2-Cache in der Mitte des Dies sowie einige Funktionseinheiten wie die Raster-Engines und Speichercontroller mit festen Aufgaben. Diese drei Bestandteile - Rechenwerke, L2-Cache und Fixed-Function-Units - hat Nvidia laut Huang mit einem "Fabric" verbunden. Der Nvidia-Chef antwortete auf eine Frage nach den Fermi-Problemen des britischen Journalisten Tim Anderson mit einer langen Stellungnahme.

Inhalt:
  1. Jen-Hsun Huang im Interview: "Fermi war anfangs völlig kaputt"
  2. Getrennte Designteams und kein Chef

Dieses Fabric, zu Deutsch: Gewebe, besteht "fast ausschließlich aus Vedrahtungen, mit ganz wenigen anderen Verschaltungen dazwischen". All diese Drähte, die sich in den Layers des Chips horizontal und vertikal überlagern, wiesen bei den ersten Prototypen, die Nvidia von TSMC erhielt, laut dem Jen-Hsun Huang massives Übersprechen auf.

Übersprechen im Fabric

Die Idee des Fabrics war, jede Einheit auf dem Die mehr oder weniger direkt mit jeder anderen zu verschalten - was aber nicht klappte. Huang verglich das mit den im Raum anwesenden Personen: "Stellen Sie sich vor, wir wären alle Prozessoren, und jeder von uns funktioniert gerade. Aber: Wir können nicht miteinander sprechen. Wir sind alle taubstumm."

  • Das Blockdiagramm von Fermi. Daten müssen über das gesamte Die bewegt werden.
  • Huang im Gespräch mit Journalisten
Das Blockdiagramm von Fermi. Daten müssen über das gesamte Die bewegt werden.

Genauso verhielten sich die Einheiten der ersten Fermis: "Wir fanden heraus, dass diese Verbindungen völlig kaputt waren". Weiter ins Detail ging Jen-Hsun Huang aber nicht, er verriet nur so viel: "Wir entwickelten also das ganze Ding neu und brachten es zum Laufen". Damit ist auch erklärt, warum die ersten Fermi-GPUs im A0-Stepping - das in der Halbleiterbranche immer die erste Version eines Chips darstellt - vor genau einem Jahr noch so rar waren, dass Huang keine echte Grafikkarte damit zeigen konnte.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
Getrennte Designteams und kein Chef 
  1. 1
  2. 2
  3.  


Gnrg 24. Sep 2010

Ach, Du hast den Mann im Video zum ersten Mal gesehen? Und dass er für Dich asiatisch...

pool 24. Sep 2010

Tegra ist ein SoC mit einem ARM Prozessorkern. Nicht mit der CPU-GPU Integration im x86...

der gelbe frosch 23. Sep 2010

der wird es wohl besser wissen als ein lurch

da_frag_ich_mich 23. Sep 2010

währ das fermi desinge evt. doch einiges leistungsfähiger bez. ursprünglich mit weniger...



Aktuell auf der Startseite von Golem.de
Intel Core i9-14900KS
Intel ist wahnsinnig geworden - zum Glück!

Um den Core i9-14900KS zur schnellsten Allround-CPU zu machen, hat Intel den Weg der Vernunft scheinbar vollständig verlassen. Doch dahinter stecken gute Neuigkeiten für Intel-Kunden.
Ein IMHO von Martin Böckmann

Intel Core i9-14900KS: Intel ist wahnsinnig geworden - zum Glück!
Artikel
  1. Streaming: Twitch verbietet Popos als Leinwand
    Streaming
    Twitch verbietet Popos als Leinwand

    Auf Hinterteile projizierte Streams sind auf Twitch künftig verboten: Der zu Amazon gehörende Dienst geht gegen einen absurden Trend vor.

  2. Die ultimative Python-Ressource im E-Learning-Format
     
    Die ultimative Python-Ressource im E-Learning-Format

    Zehn Praxisprojekte, 352 Unterrichtseinheiten und über 33 Stunden Videoinhalte: Dieser umfangreiche Online-Kurs bahnt den Weg zur Python-Expertise. Optimal für Neulinge sowie Fortgeschrittene. 20 Prozent Rabatt nur noch bis Sonntag!
    Sponsored Post von Golem Karrierewelt

  3. Truth Social: Warum Trumps kleines Netzwerk Milliarden wert wurde
    Truth Social
    Warum Trumps kleines Netzwerk Milliarden wert wurde

    Donald Trumps verlustbringender Twitter-X-Klon Truth Social wird nach seinem Börsengang mit 9 Milliarden US-Dollar bewertet. Es ist eine Spekulationsblase - und eine Investition in eine potenzielle Trump-Präsidentschaft.
    Ein Bericht von Achim Sawall

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • Palit 4070 Super 579,95€ • Xbox-Controller ab 39,99€ • AVM Fritzbox + Repeater -30% • DVDs & Blu-rays -31% • EA -75% • Ubisoft -50% • MindStar: AMD Ryzen 9 7900 339€, MSI RTX 4080 Super Ventus 3X OC 1.099€ • Gratis-Zugaben PS5 Slim & Nintendo Switch OLED beim TV-Kauf [Werbung]
    •  /