Golem pur

Golem.de ohne Werbung nutzen
Mehrseitige Artikel auf einer Seite lesen
RSS-Volltext-Feed für Artikel
Ab 3,00 € pro Monat

Entwicklerleitfaden

Load/Execute soll AMDs Bulldozer schneller machen

AMD hat den Leitfaden zur Programmierung der kommenden Prozessoren mit Bulldozer-Architektur veröffentlicht. Darin enthalten ist auch eine bewertete Liste der Neuerungen, die am meisten Tempo bringen sollen.

Artikel veröffentlicht am 11. April 2011, 18:24 Uhr, Nico Ernst

Das 'shared frontend'

Galt bisher AMDs "shared frontend" als architektonisch spannendste Neuerung von AMDs Bulldozer, so sieht das der Chiphersteller selbst etwas anders. Das Unternehmen hat nun den "Software Optimization Guide" für die Bulldozer-Familie (15h laut CPUID-Befehl) als PDF veröffentlicht.

AMDs Top 12 der Bulldozer-Neuerungen für Programmierer

Darin enthalten ist auch eine Liste der neuen Funktionen, die nach Wirksamkeit für Programmierer sortiert ist. An erster Stelle führt AMD sogenannte "Load-Execute Instructions" auf. Dabei können sowohl Integer- als auch FP-Befehle direkt nach dem Laden aus dem L1-Cache ausgeführt werden - ohne Umweg über den Scheduler. Das soll offenbar dafür sorgen, dass die gegenüber dem Frontend doppelt ausgeführten Scheduler nicht ins Leere laufen, denn nicht unter allen Bedingungen ist eine Umgehung des Schedulers sinnvoll.

So gibt es durchaus selten benutzte Befehle, die so viele Takte beanspruchen, dass eine Neusortierung durch den Scheduler sinnvoll ist. Viele Basisoperationen wie das Addieren oder Subtrahieren besitzen aber Load-Execute-Varianten und sind schneller auszuführen. Vor allem, wenn die Pipeline sonst auf ein Ergebnis warten müsste, ist deren Verwendung ratsam.

Als zweitwichtigste Neuerung aus Sicht der Programmierer gibt AMD "write combining" an. Schreibzugriffe in den Speicher - welche zuerst durch die Caches müssen - können zu je 64 Byte, und damit einer Cache-Line, zusammengefasst werden. Vor allem für I/O-intensive Programme wie einen Gerätetreiber kann das viel Performance bringen. Daher hat AMD dem write combining auch einen eigenen Anhang seines Leitfadens gewidmet.

Die Programmieranleitung ist vor allem für die Hersteller von Compilern wichtig, so dass für die Vielzahl von x86-Architekturen verschiedene Codepfade erzeugt werden können. In der Praxis kommen solche architekturspezifischen Optimierungen nur bei kleinen Teilen von Programmen zum Einsatz, können dort aber sehr effizient sein.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de

ohne Werbung
mit ausgeschaltetem Javascript
mit RSS-Volltext-Feed

Themenseiten:

Kommentarübersicht

Frage (leicht OT)

konsolero 12. Apr 2011

Habe ich das richtig verstanden, dass nur die Bulldozer Prozessoren mit ausgewählten AM3...

Artikel

Projekt Dauerpower

Forscher entwickeln Wechselrichter mit 720 kW Dauerleistung

Elektroautos können ihre hohe Motorleistung oft nur kurzfristig abrufen. Das soll sich durch neue Verfahren bei der Halbleiterproduktion ändern.
Snowmobile

Amazon stellt Datentransfer per Lastwagen ein

Noch 2016 waren die großen Snowmobile-LKW ein Highlight für Amazon Web Services. Nun fällt das Projekt Sparmaßnahmen zum Opfer.
Fortgeschrittene Authentifizierungslösungen beherrschen

Moderne Authentifizierungstechnologien wie PKI, FIDO und WebAuthn sind entscheidend, um sensible Daten bei digitalen Transaktionen zu sichern. Die Golem Karrierewelt stellt diese Techniken in speziellen Workshops vor.
Sponsored Post von Golem Karrierewelt

Schnäppchen, Rabatte und Top-Angebote

Die besten Deals des Tages

• Daily Deals • MindStar: Corsair RGB 32GB DDR5-6000 119€ • Samsung Galaxy S23 -37% • MSI OLED Curved 34" UWQHD 175Hz -500€ • Alternate: Deep Cool CH560 Digital Tower-Gehäuse 99,90€ • PS5-Spiele von Sony -75% • Zum Tiefstpreis: AVM Heizkörperregler & limitierte Sennheiser-Kopfhörer [Werbung]

Themen
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
#