Grafikchip: AMD zeigt Vega 10 und erläutert Architektur

Große Veränderungen bei der Vega-Generation: AMD hat HBM2-Stapelspeicher als schnellen Cache, neue Shader-Einheiten und eine verbesserte Geometrie- sowie Rasterizer-Stufe integriert. Hinzu kommt eine hohe FP32/FP16-Leistung und der Vega-10-Chip erweist sich in Doom als flott.

Artikel veröffentlicht am ,
Raja Koduri zeigt den Vega-10-Chip.
Raja Koduri zeigt den Vega-10-Chip. (Bild: Marc Sauter/Golem.de)

AMD hat auf dem Tech Summit im kalifornischen Sonoma erste eigene Informationen zur kommenden Vega-Grafikarchitektur und dem darauf basierenden Vega-10-Grafikchip bekanntgegeben. Eigene deshalb, weil Golem.de-Leser die Neuerung teils schon kennen, denn Sony verwendet in der Playstation 4 Pro eine GPU, die viele Ideen der Vega-Generation beinhaltet. Vor Ort zeigte AMD zwar keine Consumer-Produkte auf Basis eines Vega-Grafikchips, stellte aber ein Prototypsystem mit Doom aus und kündigte den Deep-Learning-Beschleuniger Radeon Instinct MI25 an.

Inhalt:
  1. Grafikchip: AMD zeigt Vega 10 und erläutert Architektur
  2. Front- wie Backend aufgemöbelt

Fünf Jahre lang will AMD an der Vega-Architektur gearbeitet haben, die Technologie soll verglichen mit Polaris über 200 Neuerungen umfassen. Allerdings konkretisierte der Hersteller nicht, was alles aufaddiert wurde. Ungeachtet dessen ist klar, dass AMD zumindest mit dem Vega-10-Chip wieder Marktsegmente anvisiert, die in den vergangenen Jahren vernachlässigt wurden oder durch Vega überhaupt erst erschlossen werden sollen. Als Zeitraum für die Veröffentlichung wurde das erste Halbjahr 2017 genannt.

Laut AMD etwas unter 500 Quadratmillimeter groß

Da AMDs Grafikchef Raja Koduri den Vega-10-Chip bereitwillig für Fotos hochhielt, können wir eine grobe Aussage zur Größe treffen: Die im 14LPP-Verfahren gefertigte GPU dürfte 500 bis 550 mm² aufweisen [Update: AMDs Raja Koduri sagte uns, Vega 10 sei etwas kleiner als 500 mm²]. Damit ist der Grafikchip voluminöser als der Polaris 10 einer Radeon RX 480 (232 mm²), der GP104 einer Geforce GTX 1080 (314 mm²) und der GP102 einer Titan X (471 mm²), aber kompakter als der monströse GP100 einer Tesla P100 (610 mm²). Die werden übrigens alle mit 14LPP-Technik oder 16FF+ gefertigt, sind also vom Prozess-Node her direkt vergleichbar.

  • Raja Koduri zeigt den Vega-10-Chip. (Foto: Marc Sauter/Golem.de)
  • Vega 10 mit zwei HBM2-Stacks (Foto: Marc Sauter/Golem.de)
  • Überblick zu den Neuerungen von Vega (Bild: AMD)
  • Fast alle Funktionseinheiten wurden überarbeitet. (Bild: AMD)
  • Als Videospeicher wird HBM2 genutzt. (Bild: AMD)
  • Angesteuert wird der von einem Cache-Controller. (Bild: AMD)
  • Der virtuelle Adressraum soll so bis zu 512 TByte betragen. (Bild: AMD)
  • Vega 10 schafft elf Polygone pro Takt. (Bild: AMD)
  • Neu sind Primitive Shader. (Bild: AMD)
  • Ein Workgroup Distributor delegiert Aufgaben an die Engines. (Bild: AMD)
  • Die ALUs beherrschen hohe INT8- und FP16-Raten. (Bild: AMD)
  • Der Rasterizer ist weitaus mächtiger. (Bild: AMD)
  • Die ROPs sind den L2-Caches untergeordnet. (Bild: AMD)
  • Das soll Deferred Shading beschleunigen. (Bild: AMD)
  • Doom auf Vega 10 (Foto: Marc Sauter/Golem.de)
Raja Koduri zeigt den Vega-10-Chip. (Foto: Marc Sauter/Golem.de)

Die Fläche des Vega 10 können wir übrigens nur deshalb einigermaßen abschätzen, weil der Chip nach dem Fiji der Fury X der zweite von AMD mit High Bandwidth Memory ist. Konkret verwendet AMD zwei HBM2-Stacks, die jeweils per 1.024 Bit breitem Interface angebunden sind und mit 2 GHz takten. Das ergibt eine Datentransferrate von 512 GByte pro Sekunde, also so viel wie bei der Fury X mit vier HBM1-Stacks mit jeweils 1 GHz. AMD spricht beim Vega 10 von einem High Bandwidth Cache (HBC), da die Speicherarchitektur laut Hersteller massiv von bisherigen Implementierungen abweicht.

  • Raja Koduri zeigt den Vega-10-Chip. (Foto: Marc Sauter/Golem.de)
  • Vega 10 mit zwei HBM2-Stacks (Foto: Marc Sauter/Golem.de)
  • Überblick zu den Neuerungen von Vega (Bild: AMD)
  • Fast alle Funktionseinheiten wurden überarbeitet. (Bild: AMD)
  • Als Videospeicher wird HBM2 genutzt. (Bild: AMD)
  • Angesteuert wird der von einem Cache-Controller. (Bild: AMD)
  • Der virtuelle Adressraum soll so bis zu 512 TByte betragen. (Bild: AMD)
  • Vega 10 schafft elf Polygone pro Takt. (Bild: AMD)
  • Neu sind Primitive Shader. (Bild: AMD)
  • Ein Workgroup Distributor delegiert Aufgaben an die Engines. (Bild: AMD)
  • Die ALUs beherrschen hohe INT8- und FP16-Raten. (Bild: AMD)
  • Der Rasterizer ist weitaus mächtiger. (Bild: AMD)
  • Die ROPs sind den L2-Caches untergeordnet. (Bild: AMD)
  • Das soll Deferred Shading beschleunigen. (Bild: AMD)
  • Doom auf Vega 10 (Foto: Marc Sauter/Golem.de)
Fast alle Funktionseinheiten wurden überarbeitet. (Bild: AMD)

Mit im Chip sitzt ein Speichercontroller, der High Bandwidth Cache Controller (HBCC) heißt. Er verwaltet den HBM2 und soll laut AMD bis zu 512 TByte als virtuellen Adressraum (49 Bit) nutzen, um weitaus mehr Daten als bisher üblich verarbeiten zu können - per Paging in etwa dem RAM oder einer SSD. Als Beispiel diente eine Demo in Radeon ProRender, einem Path Tracer. Die gezeigte Szene in einem Haus soll 200 GByte verwenden und würde dank des High Bandwidth Cache Controllers mit höherer Bildrate dargestellt als ohne. Denkbar sei es laut AMD, den HBM als exklusiven oder inklusiven Cache zu nutzen und zusätzlich Flash-Speicher oder Storage Class Memory einzubinden, was auf eine weitere Radeon Pro SSG hinweisen könnte.

All die Daten im HBM2 bringen aber nichts, wenn der Vega-10-Chip sie nicht effizient verarbeitet. Daher hat AMD vorne wie hinten Verbesserungen implementiert, etwa bei der wichtigen Geometriestufe.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
Front- wie Backend aufgemöbelt 
  1. 1
  2. 2
  3.  


ms (Golem.de) 05. Feb 2017

Die GTX 970 ist ein Sonderfall, da NV den L2 eines MCs gestrichen hat, zudem fehlen ihr...

Anonymer Nutzer 07. Jan 2017

1. 60% mehr Leistung gegenüber der R9 290 2. doppelt VRAM gegenüber der R9 290 3. die...

plutoniumsulfat 06. Jan 2017

Define S?

Schnapsbrenner 06. Jan 2017

Geilo! Vielen Dank für die schnelle Rückmeldung! :)



Aktuell auf der Startseite von Golem.de
Fehlerhaftes Pedal
Tesla muss Cybertruck zurückrufen

Tesla hat beim Cybertruck einen erheblichen Rückschlag erlitten. Das Unternehmen hat eine Rückrufaktion für fast alle 3.878 Cybertrucks gestartet.

Fehlerhaftes Pedal: Tesla muss Cybertruck zurückrufen
Artikel
  1. Ghost Shark: Australien zeigt Prototyp einer riesigen Unterwasserdrohne
    Ghost Shark
    Australien zeigt Prototyp einer riesigen Unterwasserdrohne

    Die Royal Australian Navy hat zusammen mit Anduril Ghost Shark vorgestellt, eine U-Boot-Drohne, die Aufklärungs-, Überwachungs- und Erkundungsmissionen durchführen soll.

  2. Voodoo-X: Bastler bauen eine neue 3dfx Grafikkarte
    Voodoo-X
    Bastler bauen eine neue 3dfx Grafikkarte

    Mit originalen Chips und neuen Designtools soll die bisher beste 3dfx-Grafikkarte entstehen. HDMI und zuschaltbaren Speicher gab es bisher nicht.

  3. Altstore für iPhones ausprobiert: So wenig Spaß macht die Installation alternativer Appstores
    Altstore für iPhones ausprobiert
    So wenig Spaß macht die Installation alternativer Appstores

    Dank DMA lassen sich in Europa endlich alternative App-Marktplätze auf iPhones installieren. Golem.de hat das mit dem Altstore ausprobiert - mit reichlich Frust.
    Ein Erfahrungsbericht von Tobias Költzsch und Daniel Ziegener

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • Spring Sale bei Gamesplanet • Neuer MediaMarkt-Flyer • MindStar: AMD Ryzen 7 7800X3D 339€ • Bose Soundbar günstig wie nie • Samsung Galaxy S23 -37% • MSI OLED Curved 34" UWQHD 175Hz -500€ • Alternate: Deep Cool CH560 Digital Tower-Gehäuse 99,90€ • PS5-Spiele -75% [Werbung]
    •  /