Mali-G72: ARMs Grafikeinheit für Deep-Learning-Smartphones

Die Mali-G72 ist eine GPU für SoCs. Die Bifrost-Architektur von ARM enthält Verbesserungen für VR-Headsets und eine effizientere FP16-Berechnung für Inferencing auf dem Smartphone. Trotz wie gehabt 32 Kernen soll die Leistung um 40 Prozent steigen.

Artikel veröffentlicht am ,
Mali-G72
Mali-G72 (Bild: ARM)

ARM hat die Mali-G72 präsentiert, eine neue GPU für Systems-on-a-Chip (SoC). Die auf dem Tech Day des britischen Entwicklers näher erläuterte Grafikeinheit nutzt wie die vorherige Mali-G71 die neue Bifrost-Architektur, weist aber allerhand überarbeitete Einheiten auf und unterstützt neue Funktionen. Gedacht ist sie für SoCs, die in künftigen Top-Smartphones und VR-Headsets wie den kommenden Google-Daydream-Modellen stecken werden.

  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
Mali-G72 (Bild: ARM)

Laut Hersteller weist die Mali-G72-GPU weiterhin bis zu 32 Kerne auf, wobei die meisten Partner auf MP8- oder MP16-Konfigurationen setzen dürften. ARM zufolge steigt die Geschwindigkeit der Mali-G72 ausgehend von der Mali-G71 um 40 Prozent, dabei erhöhe sich die Rechenleistung pro Fläche um 20 Prozent und die Effizienz um 25 Prozent. Dieser Vergleich wurde wie üblich bei gleichem Fertigungsverfahren durchgeführt. Zu den Taktraten machte ARM keine Angaben, auch die Änderungen an der Mikroarchitektur beleuchteten die Briten kaum.

Als grobe Eckpunkte nennt ARM unter anderem die größeren und optimierten L1-Instruction-Caches, die geweiteten Tile-Buffer, die überarbeiteten Datenpfade für die Ausführungseinheiten und einen doppelt so hohen Durchsatz bei komplexen Berechnungen. Ausführlicher sprach der Hersteller über Deep Learning, Mobile Gaming, Virtual Reality und die in der Bifrost-Technik sowie der Mali-G72 vorhandenen Techniken.

Die PLS-Erweiterung (Pixel Local Storage) soll verglichen mit klassischen Multiple Render Targets (MRT) die Geschwindigkeit bei Deferred Shading stark erhöhen, da deutlich weniger Bandbreite benötigt werde. ARM demonstrierte dies am Beispiel von Afterpulse, einem Mobile-Titel, der Deferred Shading nutzt. Generell ist eine effektivere Nutzung des Speicherinterfaces wichtig, etwa durch AFBC (ARM Frame Buffer Compression).

  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
  • Mali-G72 (Bild: ARM)
Mali-G72 (Bild: ARM)

Sie hilft unter anderem, dass 4x MSAA kaum Leistung kostet und somit Kantenglättung in VR häufiger eingesetzt werden kann. Bei Mali-G72 ebenfalls vorhanden ist Multiview, was ab dem Oculus Mobile SDK 1.0.3 und von der Unity- sowie Unreal-Engine unterstützt wird. Multiview reduziert die CPU- und GPU-Zeit beim Stereoscopic Rendering. Hinzu kommt, dass die Mali-G72 Foveated Rendering beherrscht, sofern das VR-Headset mit Eye Tracking ausgestattet ist, und die App es kann.

Für Deep Learning spricht ARM von einer höheren Effizienz bei FP16-Berechnungen. Hinzu kommen weitere Optimierungen für Inferencing, das lokal auf dem Smartphone stattfinden kann, wenn es am Ladegerät angeschlossen ist. Anwendbare Szenarien sind etwa die Sortierung von Fotos und Videos in Kategorien wie Burgen oder Strand. Hersteller wie Qualcomm haben ähnliche Funktionen integriert, die sich bis heute aber noch nicht durchsetzen konnten.

Die Mali-G72 ist zusammen mit dem CCI-550-Interconnect und den neuen Cortex-Kernen A75 sowie A55 für Systems-on-a-Chip gedacht, die 2018 in Geräten stecken sollen.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Fehlerhaftes Pedal
Tesla muss Cybertruck zurückrufen

Tesla hat beim Cybertruck einen erheblichen Rückschlag erlitten. Das Unternehmen hat eine Rückrufaktion für fast alle 3.878 Cybertrucks gestartet.

Fehlerhaftes Pedal: Tesla muss Cybertruck zurückrufen
Artikel
  1. Ghost Shark: Australien zeigt Prototyp einer riesigen Unterwasserdrohne
    Ghost Shark
    Australien zeigt Prototyp einer riesigen Unterwasserdrohne

    Die Royal Australian Navy hat zusammen mit Anduril Ghost Shark vorgestellt, eine U-Boot-Drohne, die Aufklärungs-, Überwachungs- und Erkundungsmissionen durchführen soll.

  2. Voodoo-X: Bastler bauen eine neue 3dfx Grafikkarte
    Voodoo-X
    Bastler bauen eine neue 3dfx Grafikkarte

    Mit originalen Chips und neuen Designtools soll die bisher beste 3dfx-Grafikkarte entstehen. HDMI und zuschaltbaren Speicher gab es bisher nicht.

  3. US-Airforce: KI-Dogfights gegen menschliche Piloten getestet
    US-Airforce
    KI-Dogfights gegen menschliche Piloten getestet

    Die US-Luftwaffe hat erfolgreich einen Nahkampf zwischen dem X-62A-Testflugzeug mit KI-Steuerung und einem bemannten F-16-Kampfflugzeug durchgeführt.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • Spring Sale bei Gamesplanet • Neuer MediaMarkt-Flyer • MindStar: AMD Ryzen 7 7800X3D 339€ • Bose Soundbar günstig wie nie • Samsung Galaxy S23 -37% • MSI OLED Curved 34" UWQHD 175Hz -500€ • Alternate: Deep Cool CH560 Digital Tower-Gehäuse 99,90€ • PS5-Spiele -75% [Werbung]
    •  /