Project Denver: Nvidias K1 mit 64 Bit optimiert ARM-Programme selbst

Noch immer ist er nicht verfügbar - aber immerhin hat Nvidia nun erklärt, wie sein erster 64-Bit-Chip besonders schnell rechnen soll. In einem eigenen Speicherbereich soll er häufig benötigten Code in native Instruktionen des ARM-Cores umwandeln und neu sortieren.

Artikel veröffentlicht am ,
Der Tegra K1 mit Denver-64-Bit-Dualcore
Der Tegra K1 mit Denver-64-Bit-Dualcore (Bild: Nvidia)

Nicht nur mittels Hardware, sondern auch per Software will Nvidia seine 64-Bit-Version des ARM-SoCs Tegra K1 mit dem Codenamen Denver beschleunigen. Dies geht aus einem Blogeintrag des Chipherstellers hervor, der sich auf einen nichtöffentlichen Vortrag auf der Konferenz Hotchips bezieht.

Mit Denver steht Nvidia wie andere Unternehmen vor dem Problem, dass bisherige Software von den 64-Bit-Fähigkeiten nicht automatisch profitiert. Wie in einer ausführlichen Analyse von Golem.de bereits beschrieben, müssen Programme vom Betriebssystem bis zur App an die neuen Architekturen angepasst werden, um durch 64 Bit nicht nur mehr Speicher, sondern auch mehr Tempo zu erreichen.

  • Nvidia schlägt in eigenen Benchmarks manchmal sogar einen kleinen Haswell. (Bild: Nvidia)
  • Die Optimierung ist Software, der Cache rechts liegt im Hauptspeicher. (Bild: Nvidia)
Die Optimierung ist Software, der Cache rechts liegt im Hauptspeicher. (Bild: Nvidia)

Daher soll es bei Systemen mit dem K1-Denver einen 128 MByte großen Bereich des Hauptspeichers geben, in dem das SoC optimierte Versionen des bereits einmal ausgeführten Codes speichert. Die Programme darin werden für eine erneute Verwendung laut Nvidia in die Micro-Ops der beiden ARM-Kerne übersetzt. Zudem werden die Befehle neu sortiert und nicht benötigte entfernt. Wird der so optimierte Code erneut gebraucht, so wird er zunächst wieder in den 128 KByte großen L1-Cache für Instruktionen geladen. Nvidia gibt in seinem Blogpost offen zu, dass das etwas mehr Overhead erzeugt als ein direktes Laden des originales Codes aus dem Hauptspeicher. Nvidia nennt die Methode Dynamic Code Optimization.

Das Verfahren klingt sehr nach dem, was moderne Prozessoren mit Out-of-Order-Technik ohnehin schon tun - nur wird das in der Regel allein in den Caches und Buffern der CPU selbst abgewickelt, und nicht über eine Art zusätzlichen Cache, der im viel langsameren Hauptspeicher liegt. Nvidia verspricht sich dennoch eine bis zu doppelte Leistung gegenüber reinen ARMv8-Kernen ohne diese Optimierungen.

Dies will Nvidia mit eigenen Benchmarks belegen, bei denen der erste 64-Bit-ARM für Smartphones, Apples A7 aus dem iPhone 5s, durchweg geschlagen wird. Die Leistung des Denver-K1 ist den Messungen zufolge sogar so groß, dass in einigen Tests ein Celeron 2955U von Intel mit Haswell-Architektur das Nachsehen hat. Allerdings ist diese CPU mit 1,4 GHz, nur 2 MByte großem Cache und ohne Turbo der langsamste aktuelle mobile Celeron. Immerhin darf er noch 15 Watt elektrischer Leistung aufnehmen, was beim Denver-K1 für lüfterlose Geräte kaum möglich ist - zum tatsächlichen Energiebedarf hat sich Nvidia aber noch nicht geäußert.

  • Nvidia schlägt in eigenen Benchmarks manchmal sogar einen kleinen Haswell. (Bild: Nvidia)
  • Die Optimierung ist Software, der Cache rechts liegt im Hauptspeicher. (Bild: Nvidia)
Nvidia schlägt in eigenen Benchmarks manchmal sogar einen kleinen Haswell. (Bild: Nvidia)

Die dynamische Optimierung soll für die Software völlig transparent sein, offenbar hat Nvidia also dafür Funktionen im K1 vorgesehen, die nicht eigens angesteuert werden müssen. Dazu könnte vor allem die Reservierung von 128 MByte im RAM gehören, bei entsprechenden Geräten dürfte dann die vom Betriebssystem gemeldete Menge an Hauptspeicher statt etwa 4 GByte nur rund 3,9 GByte betragen.

Noch im Jahr 2014 will Nvidia erste Geräte mit dem 64-Bit-K1 präsentieren, die 32-Bit-Version konnte Golem.de im Shield-Tablet bereits testen. Anders als bisher vorgesehen ist der Denver-K1 nun zuerst ebenfalls in Mobilgeräten zu erwarten, nicht wie Nvidia früher plante, in Servern.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Sport und Gesundheit
Massive Anwenderkritik am neuen Garmin Connect

Unübersichtlich, zu viele Klicks: Die neue Version von Garmin Connect kommt bei Nutzern auffällig schlecht an.

Sport und Gesundheit: Massive Anwenderkritik am neuen Garmin Connect
Artikel
  1. Opendesk vom Zendis ausprobiert: Ein Web-Desktop für die Verwaltung
    Opendesk vom Zendis ausprobiert
    Ein Web-Desktop für die Verwaltung

    Opendesk soll Open-Source-Software in die Behörden bringen, um sie unabhängiger von einzelnen Herstellern zu machen. Wie sieht diese digitale Souveränität aus?
    Von Markus Feilner

  2. Early Access: Erste Tests loben das Solo-Dev-Aufbauspiel Manor Lords
    Early Access
    Erste Tests loben das Solo-Dev-Aufbauspiel Manor Lords

    Meistgewünschtes Spiel auf Steam, programmiert von einem Entwickler: Das in Süddeutschland angesiedelte Manor Lords kommt in Tests gut an.

  3. iPhone: Kongo beschuldigt Apple der Nutzung von Konfliktmineralien
    iPhone
    Kongo beschuldigt Apple der Nutzung von Konfliktmineralien

    Der Kongo beschuldigt Apple, in seinen Produkten Mineralien zu verwenden, die in den vom Krieg gezeichneten östlichen Regionen des Landes illegal abgebaut werden.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Gigabyte GeForce RTX 4070 Ti zum Tiefstpreis • MediaMarkt: Asus Gaming-Laptop 999€ statt 1.599€ • Anker USB-Ladegeräte -45% • OLED-TV von LG 54% günstiger • Gamesplanet Spring Sale [Werbung]
    •  /