Xavier-Tegra: Nvidia entwickelt eigene TPU für autonome Autos

Googles Deep-Learning-Beschleuniger TPU lassen sich nur in der Cloud mieten. Nvidia will ähnliche Chips künftig als Teil seiner Xavier-SoCs verkaufen und als Open Source anbieten.

Artikel veröffentlicht am , /
Xavier-Tegra-SoC mit INT8-Beschleunigung
Xavier-Tegra-SoC mit INT8-Beschleunigung (Bild: Nvidia)

Auf der GTC Europe 2016 in London hat Nvidia den Xavier-Chip vorgestellt. Das SoC nutzt 512 Shader-Kerne mit Volta-Architektur und laut Nvidia auch sogenannte Computer-Vision-Beschleuniger. Dahinter verbergen sich Funktionseinheiten, die pro Takt doppelt so viele INT8- wie FP16-Berechnungen durchführen können. Nvidia bezeichnet diese auf der GTC 2017 nun offiziell als DLA (Deep Learning Accelerator). Gedacht sind die DLA für das Inferencing beim maschinellen Lernen und im Xavier-SoC für den Automotive-Markt.

Dort werden Nvidias Tegras häufig eingesetzt, neuester Partner ist Toyota - der momentan größte Automobilhersteller der Welt. Auf der CES 2017 kündigte Nvidia bereits Audi, ZF und Bosch als Partner an. Den Einsatzzweck für die DLA benennt Nvidia entsprechend sehr deutlich: autonome Autos.

Dedizierte Einheiten zur Modellanwendung

Obwohl Nvidia die DLA zuvor noch als Computer-Vision-Beschleuniger bezeichnet hat, können diese prinzipiell auch für jede andere Deep-Learning-Aufgabe genutzt werden. Mit den DLA lassen sich so zusätzlich zur Modellverarbeitung bei der Bilderkennung auch die Umgebungsdaten unterschiedlicher Sensoren analysieren.

  • Tensorflow- und Caffe-Modelle lassen sich für Nvidias-Hardware optimieren. (Bild: Nvidia)
  • Tensorflow- und Caffe-Modelle lassen sich für Nvidias-Hardware optimieren.  (Bild: Nvidia)
  • Tensorflow- und Caffe-Modelle lassen sich für Nvidias-Hardware optimieren.  (Bild: Nvidia)
  • Tensorflow- und Caffe-Modelle lassen sich für Nvidias-Hardware optimieren.  (Bild: Nvidia)
  • Tensorflow- und Caffe-Modelle lassen sich für Nvidias-Hardware optimieren.  (Bild: Nvidia)
  • Tensorflow- und Caffe-Modelle lassen sich für Nvidias-Hardware optimieren.  (Bild: Nvidia)
  • Der Xavier SoC wird für autonome Autos vermarktet ... (Bild: Nvidia)
  • ... das nutzt künftig auch Toyota. (Bild: Nvidia)
  • Der Xavier SoC enthält DLA für das Inferencing. (Bild: Nvidia)
  • Die Xavier DLA sollen Open Source werden. (Bild: Nvidia)
Tensorflow- und Caffe-Modelle lassen sich für Nvidias-Hardware optimieren. (Bild: Nvidia)

Die DLA-Einheiten sind wie bei den TPU von Google nicht für das Training von neuronalen Netzen gedacht. Das wird von der GPU mit Shader-Kernen erledigt. Stattdessen hat Nvidia die DLA für das sogenannte Inferencing ausgelegt, diese beschleunigen also ein für einen bestimmten Zweck angelerntes Netz, um etwa spezifische Details eines eingelesenen Bildes zu erkennen.

Auf der GTC 2017 in San Jose gab Nvidia eine Leistung von 30 Teraops bei 30 Watt für den Xavier-Chip an, eine frühere Angabe lautete 20 TOPS bei 20 Watt. Googles TPU schaffen bei einer maximalen TDP von 75 Watt bei 700 MHz immerhin 91,8 TOPS. Anders als die DLA von Nvidia im Xavier-SoC können Googles TPU aber nicht gekauft, sondern nur in den Cloud-Diensten von Google gemietet werden.

Vages Open-Source-Versprechen

Bei der Ankündigung der DLA sagte Nvidia-Chef Jensen Huang: "Wir machen die Xavier DLA Open Source". Was genau damit gemeint ist, ist allerdings unklar. Dass Nvidia die eigentliche Hardware offenlegen wird, wäre angesichts der bisherigen Firmenpolitik ein geradezu revolutionärer Umbruch und damit eher unwahrscheinlich.

Vermutlich wird allerdings der Open-Source-Support, etwa durch Treiber, Compiler und Werkzeuge, relativ weitgehend ausfallen. Für die bisherigen Tegra-Chips hat Nvidia zum Beispiel auch den freien Linux-Grafiktreiber Nouveau aktiv unterstützt und an dessen Entwicklung mitgewirkt.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Blaupunkt Ring im Test
Ein Ring, sich zu knechten

Der Blaupunkt Ring ist wesentlich günstiger als die Konkurrenz und zeichnet Sport, Puls, Schritte und Schlaf auf. Mit Android hat er aber aktuell seine Probleme.
Ein Test von Tobias Költzsch

Blaupunkt Ring im Test: Ein Ring, sich zu knechten
Artikel
  1. China-Spionagefall: Überprüfung des Tiktok-Rankings von AfD-Kandidat gefordert
    China-Spionagefall
    Überprüfung des Tiktok-Rankings von AfD-Kandidat gefordert

    Nach der Festnahme des früheren Mitarbeiters des AfD-Spitzenkandidaten für die Europawahl, Maximilian Krah, wegen pro-chinesischer Spionage soll der Erfolg des Politikers bei Tiktok untersucht werden.

  2. Thermonator: Ein Roboterhund mit Flammenwerfer auf dem Rücken
    Thermonator
    Ein Roboterhund mit Flammenwerfer auf dem Rücken

    Ja, ein US-Unternehmen bietet wirklich einen fernsteuerbaren Roboter mit Flammenwerfer und Laservisier an. Kaufen sollte das niemand.

  3. Windows-10-Nachfolger: Gründe für und gegen Windows 11
    Windows-10-Nachfolger
    Gründe für und gegen Windows 11

    Das Supportende von Windows 10 rückt näher und Windows 11 bietet sich als Alternative an. Wir zeigen Argumente für und gegen den Wechsel auf.
    Eine Analyse von Oliver Nickel

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • MacBook Air über 200€ günstiger • MediaMarkt: Asus Gaming-Laptop 999€ statt 1.599€ • Galaxy S23 400€ günstiger • MindStar: Radeon & Geforce-Grafikkarten zu Tiefstpreisen • Anker USB-Ladegeräte -45% • MSI MEG 342CDE OLED 999€ • Gamesplanet Spring Sale [Werbung]
    •  /