GA100: Nvidias 7-nm-Monster-GPU misst 826 mm²

Die 20-fache AI-Performance einer Tesla V100: Nvidias Ampere A100 reizt das aktuell technisch Mögliche aus.

Artikel von veröffentlicht am
A100 auf SXM4-Board
A100 auf SXM4-Board (Bild: Nvidia)

Nvidia hat den A100 vorgestellt – hinter dieser Bezeichnung verbirgt sich ein Beschleuniger für Supercomputer. Dessen GA100-Chip misst enorme 826 mm² in einem angepassten TSMCs-7-nm-Verfahren ("7N" statt N7 oder N7P) und erreicht laut Nvidia vorerst eine theoretische INT8-Geschwindigkeit von bis zu 1,248 Petaops. Zum Vergleich: Die bisherige Tesla V100 schafft mit 62 Teraops nur 1/20 davon.

Vorerst gibt es den A100-Beschleuniger einzig als SXM4-Mezzanine-Modul. Darauf befinden sich ein GA100-Chip mit Ampere-Architektur und sechs HBM2-Bausteinen. Die 826 mm² der GPU sind am Limit der Fertigungsmaske (Reticle), welches bei 858 mm² liegt. Nvidia zufolge sind 108 SMs mit je 64 Rechenkernen aktiv – das macht 6.912 statt 5.120 ALUs wie bei der Tesla V100. Die 108 SMs stellen nicht den Vollausbau des GA100-Chips mit seinen 54 Milliarden Transistoren dar, physisch sind 128 SMs (8.192 ALUs) vorhanden.


Weitere Golem-Plus-Artikel
Raytracing erklärt: Wie simulierte Lichtstrahlen realistischere Bilder schaffen
Raytracing erklärt: Wie simulierte Lichtstrahlen realistischere Bilder schaffen

Algorithmus des Monats Raytracing erschafft beeindruckende Grafiken - und braucht viel Rechenleistung. Dabei passt der Algorithmus auf eine Visitenkarte.
Von Johannes Hiltscher


Optische Computer erklärt: Wie Licht das Rechnen lernt
Optische Computer erklärt: Wie Licht das Rechnen lernt

Optische Computer sollen beispielsweise KI effizienter machen - aber wie funktionieren sie eigentlich? Und warum sind sie noch immer selten?
Von Johannes Hiltscher


Teamführung: Ins Silo der anderen gucken
Teamführung: Ins Silo der anderen gucken

Plötzlich Führungskraft Wenn Entwickler Engineering Manager werden, müssen sie plötzlich Strategien entwickeln - keine leichte Sache. Was auf jeden Fall hilft: einander fremde Teams zusammenzubringen.
Ein Ratgebertext von Franziska Hauck


Aktuell auf der Startseite von Golem.de
Ehemaliger Entwickler
Die Performance von Windows 11 ist "lächerlich schlecht"

Selbst für ehemalige Angestellte von Microsoft sind manche Eigenarten von Windows offenbar unverständlich. Teilweise hilft selbst teure Hardware nicht.

Ehemaliger Entwickler: Die Performance von Windows 11 ist lächerlich schlecht
Artikel
  1. Elektro-Pick-up: Cybertruck nach Waschstraßenbesuch funktionsunfähig
    Elektro-Pick-up
    Cybertruck nach Waschstraßenbesuch funktionsunfähig

    Ein Tesla-Cybertruck-Besitzer hat ein Problem, nachdem er sein Fahrzeug zu einer routinemäßigen Autowäsche gebracht hat.

  2. Bezahlfunktion: Genehmigung für Apples NFC-Zugang soll im Mai kommen
    Bezahlfunktion
    Genehmigung für Apples NFC-Zugang soll im Mai kommen

    Apple muss Konkurrenten die Nutzung der NFC-Schnittstelle im iPhone für Bezahlfunktionen ermöglichen. Die EU soll die Bedingungen des Herstellers in Kürze genehmigen.

  3. EU-Kommission warnt: Pornhub, Stripchat und Xvideos müssen DSA-Auflagen einhalten
    EU-Kommission warnt
    Pornhub, Stripchat und Xvideos müssen DSA-Auflagen einhalten

    In den kommenden Tagen treten für Pornhub, Stripchat und Xvideos neue Auflagen in Kraft. Unter anderem müssen sie Minderjährigen aus der EU den Zugang zu Pornos verwehren.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
    •  /