Entwicklerleitfaden

Load/Execute soll AMDs Bulldozer schneller machen

AMD hat den Leitfaden zur Programmierung der kommenden Prozessoren mit Bulldozer-Architektur veröffentlicht. Darin enthalten ist auch eine bewertete Liste der Neuerungen, die am meisten Tempo bringen sollen.

Artikel veröffentlicht am ,
Das 'shared frontend'
Das 'shared frontend'

Galt bisher AMDs "shared frontend" als architektonisch spannendste Neuerung von AMDs Bulldozer, so sieht das der Chiphersteller selbst etwas anders. Das Unternehmen hat nun den "Software Optimization Guide" für die Bulldozer-Familie (15h laut CPUID-Befehl) als PDF veröffentlicht.

  • Das shared frontend im Detail
  • AMDs Top 12 der Bulldozer-Neuerungen für Programmierer
AMDs Top 12 der Bulldozer-Neuerungen für Programmierer

Darin enthalten ist auch eine Liste der neuen Funktionen, die nach Wirksamkeit für Programmierer sortiert ist. An erster Stelle führt AMD sogenannte "Load-Execute Instructions" auf. Dabei können sowohl Integer- als auch FP-Befehle direkt nach dem Laden aus dem L1-Cache ausgeführt werden - ohne Umweg über den Scheduler. Das soll offenbar dafür sorgen, dass die gegenüber dem Frontend doppelt ausgeführten Scheduler nicht ins Leere laufen, denn nicht unter allen Bedingungen ist eine Umgehung des Schedulers sinnvoll.

So gibt es durchaus selten benutzte Befehle, die so viele Takte beanspruchen, dass eine Neusortierung durch den Scheduler sinnvoll ist. Viele Basisoperationen wie das Addieren oder Subtrahieren besitzen aber Load-Execute-Varianten und sind schneller auszuführen. Vor allem, wenn die Pipeline sonst auf ein Ergebnis warten müsste, ist deren Verwendung ratsam.

Als zweitwichtigste Neuerung aus Sicht der Programmierer gibt AMD "write combining" an. Schreibzugriffe in den Speicher - welche zuerst durch die Caches müssen - können zu je 64 Byte, und damit einer Cache-Line, zusammengefasst werden. Vor allem für I/O-intensive Programme wie einen Gerätetreiber kann das viel Performance bringen. Daher hat AMD dem write combining auch einen eigenen Anhang seines Leitfadens gewidmet.

Die Programmieranleitung ist vor allem für die Hersteller von Compilern wichtig, so dass für die Vielzahl von x86-Architekturen verschiedene Codepfade erzeugt werden können. In der Praxis kommen solche architekturspezifischen Optimierungen nur bei kleinen Teilen von Programmen zum Einsatz, können dort aber sehr effizient sein.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Macbooks
Apple hält 8 GByte RAM weiterhin für ausreichend

Apple verteidigt die Macbooks mit nur 8 GByte RAM: Das reiche für Streaming oder Casual Games aus. Die Realität ist eher anders.

Macbooks: Apple hält 8 GByte RAM weiterhin für ausreichend
Artikel
  1. Projekt Dauerpower: Forscher entwickeln Wechselrichter mit 720 kW Dauerleistung
    Projekt Dauerpower
    Forscher entwickeln Wechselrichter mit 720 kW Dauerleistung

    Elektroautos können ihre hohe Motorleistung oft nur kurzfristig abrufen. Das soll sich durch neue Verfahren bei der Halbleiterproduktion ändern.

  2. Snowmobile: Amazon stellt Datentransfer per Lastwagen ein
    Snowmobile
    Amazon stellt Datentransfer per Lastwagen ein

    Noch 2016 waren die großen Snowmobile-LKW ein Highlight für Amazon Web Services. Nun fällt das Projekt Sparmaßnahmen zum Opfer.

  3. Fortgeschrittene Authentifizierungslösungen beherrschen
     
    Fortgeschrittene Authentifizierungslösungen beherrschen

    Moderne Authentifizierungstechnologien wie PKI, FIDO und WebAuthn sind entscheidend, um sensible Daten bei digitalen Transaktionen zu sichern. Die Golem Karrierewelt stellt diese Techniken in speziellen Workshops vor.
    Sponsored Post von Golem Karrierewelt

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • MindStar: Corsair RGB 32GB DDR5-6000 119€ • Samsung Galaxy S23 -37% • MSI OLED Curved 34" UWQHD 175Hz -500€ • Alternate: Deep Cool CH560 Digital Tower-Gehäuse 99,90€ • PS5-Spiele von Sony -75% • Zum Tiefstpreis: AVM Heizkörperregler & limitierte Sennheiser-Kopfhörer [Werbung]
    •  /