Codename Fiji: AMD erklärt High Bandwidth Memory der neuen Grafikkarte

Eine höhere Datentransfer-Rate und dennoch sparsamer: Golem.de hat mit AMDs Technik-Chef über Details zum High Bandwidth Memory, der für die kommende Fiji-Grafikkarte statt GDDR5 als Videospeicher verwendet wird, gesprochen. Einziger vermeintlicher Nachteil ist die derzeit verfügbare Kapazität.

Artikel veröffentlicht am ,
Platine mit GPU und vier HBM-Stacks
Platine mit GPU und vier HBM-Stacks (Bild: AMD)

AMDs nächste High-End-Grafikkarte, Codename Fiji, wird die erste mit High Bandwidth Memory (HBM). Dieser Stapelspeicher ist für Golem.de-Leser nicht neu, schon im Dezember 2014 berichteten wir ausführlich über High Bandwidth Memory und andere Speicher-Technologien. AMD hatte den Einsatz von HBM für eine mit dem Fiji-Chip ausgerüstete Grafikkarte auf dem Financial Analyst Day angekündigt, in einem Briefing ging der Hersteller auf Details ein. Wir sprachen direkt mit AMDs Technik-Chef Joe Macri über den High Bandwidth Memory und dessen Implementierung in künftigen Produkten.

Vorab ein paar Hintergrundinformationen: Der seit vielen Jahren bei Grafikkarten übliche Videospeicher ist GDDR5; einzig sehr günstige Modelle nutzen DDR3-Speicher. Um mit GDDR5 die für heutige Grafikkarte notwendige Datentransfer-Rate zu erzielen und 4 oder mehr GByte zu verbauen, ist eine aufwendige Platine notwendig. AMDs Radeon R9 290X etwa nutzt ein 512 Bit breites Speicher-Interface, und an jedem 32-Bit-Kanal hängt ein Speicherchip. Alle 16 zusammen ergeben 4 oder 8 GByte, Workstation-Karten wie Fire Pro W9100 erreichen 16 GByte mit 32 Speicherbausteinen.

  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
Details zu HBM (Bild: AMD)

High Bandwidth Memory löst die Problematik vergleichsweise elegant: Statt eine Vielzahl an Speicherpackages samt Leitungen auf die Platine zu packen, werden DRAM-Dies gestapelt und als sogenannte Stacks direkt neben dem Grafikchip platziert - die GPU darf also nicht zu groß sein. Beide Bausteine sind durch einen Interposer verbunden, dieser wird bei UMC hergestellt. Der Interposer ist eine spezielle Silizium-Schicht, durch diese wird das Interface gelegt. Auch wenn keine aktiven Bauteile im Interposer stecken, macht dies die Grafikkarte teurer. Das Interface fällt dafür beim Grafikchip etwas kleiner aus als mit GDDR5 und spart somit Energie und wichtige Die-Fläche.

Auch Stacks nehmen weniger elektrische Leistung auf als GDDR5-Speicher, AMD selbst nennt die Hälfte bei gleicher Geschwindigkeit. Interessant ist die angegebene Spannung von 1,3 Volt bei 1 GHz - bisherige Dokumente sprechen von 1,2 Volt. Jeder Stack taktet mit 1 GHz und ist per 1.024-Bit-Interface an den Grafikchip angebunden, insgesamt ergibt dies 512 GByte pro Sekunde. Das ist mehr als heutige GDDR5-Speichersysteme schaffen, wohlgemerkt bei niedrigerer Leistungsaufnahme. Das freiwerdende Energie-Budget steckt AMD in mehr Shader-Einheiten, die TDP von Fiji soll der Radeon R9 290X nicht übersteigen.

  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
Details zu HBM (Bild: AMD)

4 GByte Videospeicher noch nicht offiziell

Der neue Speicherstandard wurde vom Jedec-Konsortium spezifiziert, einziger Fertiger ist derzeit Hynix. Offiziell verfügbar sind Stacks mit vier DRAM-Dies mit je 2 GBit. Ein solcher 4-Hi-Stack bietet also 1 GByte Speicher und zumindest AMDs - von Macri als Cartoons bezeichneten - Schaubildern zufolge ist rund um die GPU nur Platz für vier davon. Das würde 4 GByte Videospeicher für die im Juni erscheinende Fiji-Grafikkarte bedeuten, theoretisch sind aber auch mehr Kapazität pro Die, mehr Dies pro Stack oder mehr Stapel denkbar. Die Fiji-Karte soll unseren Informationen nach eine neue Namensgebung erhalten.

AMD wollte die 4 GByte nicht bestätigen, Joe Macri sagte Golem.de aber, AMD arbeite daran, den Videospeicher möglichst effizient zu nutzen. Heutige Architekturen würden dies nicht machen, da ein breiteres Interface bisher nahezu durchgehend mit mehr Speicher einherging. Auch Nvidia forscht an neuen Techniken um den Footprint zu veringern, etwa an ACAA, einer Kantenglättungsmethode für Forward-Renderer. Die wenigsten Spiele nutzen jedoch mehr als 4 GByte Videospeicher, selbst in 4K.

  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
  • Details zu HBM (Bild: AMD)
Details zu HBM (Bild: AMD)

Die Platine wird Macri zufolge vergleichsweise kurz, der Grafikchip wie auch die HBM-Stacks sind auf gleicher Höhe angeordnet und werden gemeinsam von einer Wasserkühlung abgedeckt. Die früher genannte 8-GByte-Karte könnte erst in einigen Monaten erscheinen, wenn 8-Hi-Stacks mit halbiertem Interface pro DRAM-Die und verdoppelter Kapazität fertig sind.

Eine künftige FirePro-Karte könnte gleich auf eine überarbeitete HBM-Version mit 4 GByte pro Stack - also 16 GByte - setzen. Ähnlich geht Nvidia vor, deren Pascal-Chip verfügt über bis zu 32 GByte. AMD arbeitet zudem an einem HPC-Chip mit Zen-Prozessorkernen, einer integrierten Grafikeinheit und High Bandwidth Memory.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Intel Core i9-14900KS
Intel ist wahnsinnig geworden - zum Glück!

Um den Core i9-14900KS zur schnellsten Allround-CPU zu machen, hat Intel den Weg der Vernunft scheinbar vollständig verlassen. Doch dahinter stecken gute Neuigkeiten für Intel-Kunden.
Ein IMHO von Martin Böckmann

Intel Core i9-14900KS: Intel ist wahnsinnig geworden - zum Glück!
Artikel
  1. Streaming: Twitch verbietet Popos als Leinwand
    Streaming
    Twitch verbietet Popos als Leinwand

    Auf Hinterteile projizierte Streams sind auf Twitch künftig verboten: Der zu Amazon gehörende Dienst geht gegen einen absurden Trend vor.

  2. FTX-Gründer: Sam Bankman-Fried zu 25 Jahren Haft verurteilt
    FTX-Gründer
    Sam Bankman-Fried zu 25 Jahren Haft verurteilt

    Der Richter betonte die Dreistigkeit der Handlungen von Bankman-Fried. Doch die Haftstrafe für den früheren Chef der Kryptobörse FTX liegt weit unter der Forderung der Anklage.

  3. Truth Social: Warum Trumps kleines Netzwerk Milliarden wert wurde
    Truth Social
    Warum Trumps kleines Netzwerk Milliarden wert wurde

    Donald Trumps verlustbringender Twitter-X-Klon Truth Social wird nach seinem Börsengang mit 9 Milliarden US-Dollar bewertet. Es ist eine Spekulationsblase - und eine Investition in eine potenzielle Trump-Präsidentschaft.
    Ein Bericht von Achim Sawall

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • Palit 4070 Super 579,95€ • Xbox-Controller ab 39,99€ • AVM Fritzbox + Repeater -30% • DVDs & Blu-rays -31% • EA -75% • Ubisoft -50% • MindStar: AMD Ryzen 9 7900 339€, MSI RTX 4080 Super Ventus 3X OC 1.099€ • Gratis-Zugaben PS5 Slim & Nintendo Switch OLED beim TV-Kauf [Werbung]
    •  /