Xavier-Tegra: Nvidia entwickelt eigene TPU für autonome Autos

Googles Deep-Learning-Beschleuniger TPU lassen sich nur in der Cloud mieten. Nvidia will ähnliche Chips künftig als Teil seiner Xavier-SoCs verkaufen und als Open Source anbieten.

Artikel veröffentlicht am , /
Xavier-Tegra-SoC mit INT8-Beschleunigung
Xavier-Tegra-SoC mit INT8-Beschleunigung (Bild: Nvidia)

Auf der GTC Europe 2016 in London hat Nvidia den Xavier-Chip vorgestellt. Das SoC nutzt 512 Shader-Kerne mit Volta-Architektur und laut Nvidia auch sogenannte Computer-Vision-Beschleuniger. Dahinter verbergen sich Funktionseinheiten, die pro Takt doppelt so viele INT8- wie FP16-Berechnungen durchführen können. Nvidia bezeichnet diese auf der GTC 2017 nun offiziell als DLA (Deep Learning Accelerator). Gedacht sind die DLA für das Inferencing beim maschinellen Lernen und im Xavier-SoC für den Automotive-Markt.

Dort werden Nvidias Tegras häufig eingesetzt, neuester Partner ist Toyota - der momentan größte Automobilhersteller der Welt. Auf der CES 2017 kündigte Nvidia bereits Audi, ZF und Bosch als Partner an. Den Einsatzzweck für die DLA benennt Nvidia entsprechend sehr deutlich: autonome Autos.

Dedizierte Einheiten zur Modellanwendung

Obwohl Nvidia die DLA zuvor noch als Computer-Vision-Beschleuniger bezeichnet hat, können diese prinzipiell auch für jede andere Deep-Learning-Aufgabe genutzt werden. Mit den DLA lassen sich so zusätzlich zur Modellverarbeitung bei der Bilderkennung auch die Umgebungsdaten unterschiedlicher Sensoren analysieren.

  • Tensorflow- und Caffe-Modelle lassen sich für Nvidias-Hardware optimieren. (Bild: Nvidia)
  • Tensorflow- und Caffe-Modelle lassen sich für Nvidias-Hardware optimieren.  (Bild: Nvidia)
  • Tensorflow- und Caffe-Modelle lassen sich für Nvidias-Hardware optimieren.  (Bild: Nvidia)
  • Tensorflow- und Caffe-Modelle lassen sich für Nvidias-Hardware optimieren.  (Bild: Nvidia)
  • Tensorflow- und Caffe-Modelle lassen sich für Nvidias-Hardware optimieren.  (Bild: Nvidia)
  • Tensorflow- und Caffe-Modelle lassen sich für Nvidias-Hardware optimieren.  (Bild: Nvidia)
  • Der Xavier SoC wird für autonome Autos vermarktet ... (Bild: Nvidia)
  • ... das nutzt künftig auch Toyota. (Bild: Nvidia)
  • Der Xavier SoC enthält DLA für das Inferencing. (Bild: Nvidia)
  • Die Xavier DLA sollen Open Source werden. (Bild: Nvidia)
Tensorflow- und Caffe-Modelle lassen sich für Nvidias-Hardware optimieren. (Bild: Nvidia)

Die DLA-Einheiten sind wie bei den TPU von Google nicht für das Training von neuronalen Netzen gedacht. Das wird von der GPU mit Shader-Kernen erledigt. Stattdessen hat Nvidia die DLA für das sogenannte Inferencing ausgelegt, diese beschleunigen also ein für einen bestimmten Zweck angelerntes Netz, um etwa spezifische Details eines eingelesenen Bildes zu erkennen.

Auf der GTC 2017 in San Jose gab Nvidia eine Leistung von 30 Teraops bei 30 Watt für den Xavier-Chip an, eine frühere Angabe lautete 20 TOPS bei 20 Watt. Googles TPU schaffen bei einer maximalen TDP von 75 Watt bei 700 MHz immerhin 91,8 TOPS. Anders als die DLA von Nvidia im Xavier-SoC können Googles TPU aber nicht gekauft, sondern nur in den Cloud-Diensten von Google gemietet werden.

Vages Open-Source-Versprechen

Bei der Ankündigung der DLA sagte Nvidia-Chef Jensen Huang: "Wir machen die Xavier DLA Open Source". Was genau damit gemeint ist, ist allerdings unklar. Dass Nvidia die eigentliche Hardware offenlegen wird, wäre angesichts der bisherigen Firmenpolitik ein geradezu revolutionärer Umbruch und damit eher unwahrscheinlich.

Vermutlich wird allerdings der Open-Source-Support, etwa durch Treiber, Compiler und Werkzeuge, relativ weitgehend ausfallen. Für die bisherigen Tegra-Chips hat Nvidia zum Beispiel auch den freien Linux-Grafiktreiber Nouveau aktiv unterstützt und an dessen Entwicklung mitgewirkt.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Macbooks
Apple hält 8 GByte RAM weiterhin für ausreichend

Apple verteidigt die Macbooks mit nur 8 GByte RAM: Das reiche für Streaming oder Casual Games aus. Die Realität ist eher anders.

Macbooks: Apple hält 8 GByte RAM weiterhin für ausreichend
Artikel
  1. Snowmobile: Amazon stellt Datentransfer per Lastwagen ein
    Snowmobile
    Amazon stellt Datentransfer per Lastwagen ein

    Noch 2016 waren die großen Snowmobile-LKW ein Highlight für Amazon Web Services. Nun fällt das Projekt Sparmaßnahmen zum Opfer.

  2. Warhorse Studios: Kingdom Come Deliverance 2 für Ende 2024 angekündigt
    Warhorse Studios
    Kingdom Come Deliverance 2 für Ende 2024 angekündigt

    Doppelt so viel Welt, eine Armbrust und Schusswaffen: Heinrich darf in Kingdom Come Deliverance 2 weitere Abenteuer im Mittelalter erleben.

  3. Alex Garlands Civil War: Technisch und erzählerisch ein Meisterwerk
    Alex Garlands Civil War
    Technisch und erzählerisch ein Meisterwerk

    Es ist Science-Fiction, die erschreckend realistisch anmutet. Civil War zeigt die Eskalation in einer gespaltenen Gesellschaft.
    Eine Rezension von Peter Osteried

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • MindStar: Corsair RGB 32GB DDR5-6000 119€ • Samsung Galaxy S23 -37% • MSI OLED Curved 34" UWQHD 175Hz -500€ • Alternate: Deep Cool CH560 Digital Tower-Gehäuse 99,90€ • PS5-Spiele von Sony -75% • Zum Tiefstpreis: AVM Heizkörperregler & limitierte Sennheiser-Kopfhörer [Werbung]
    •  /