DLU: Fujitsu entwickelt Deep-Learning-Chips

Neben eigenen ARM-Prozessoren für den Post-K-Supercomputer arbeitet Fujitsu auch an Deep-Learning-Einheiten. Den DLUs reicht eine niedrige Integer-Präzision, weshalb die Energie-Effizienz extrem hoch ausfallen soll. Vorerst sind dedizierte Beschleuniger angedacht, später dann On-Package-Varianten.

Artikel veröffentlicht am ,
Deep Learning Unit
Deep Learning Unit (Bild: Fujitsu)

Fujitsu hat sich ausführlicher zu seinen kommenden Spezialchips für künstliche Intelligenz geäußert, die erstmals im Frühsommer 2015 öffentlich erwähnt wurden (PDF). Die als Deep Learning Units (DLU) bezeichnete Hardware soll drastisch effizienter ausfallen als die der Konkurrenz, die Japaner sprechen von Faktor zehn. Im Rahmen der International Supercomputing Conference, die im Juni 2017 in Frankfurt stattfand, sagte Fujitsus Senior Director der AI Platform Division, Takumi Maruyama, der Fokus liege auf einer geringen Rechengenauigkeit, da diese ausreichend sei (PDF).

  • Die DLUs sollen besonders effizient sein. (Bild: Fujitsu)
  • Sie verwenden HBM2 und viele SIMD-Einheiten. (Bild: Fujitsu)
  • Die erste Generation wird dediziert, die zweite integriert. (Bild: Fujitsu)
  • Neben den DLUs wird weiter am Post-K-Computer gearbeitet. (Bild: Fujitsu)
Die DLUs sollen besonders effizient sein. (Bild: Fujitsu)

Neben einfacher (FP32) und halber Gleitkommapräzision (FP16) unterstützen die Deep Learning Units daher auch INT16 und INT8, wie es etwa bei Nvidias Tesla-Beschleunigern der Fall ist. Jeder Chip besteht aus multiplen DLUs, die per Fabric untereinander und mit HBM2-Stapelspeicher verbunden sind. Jede Deep Learning Unit weist 16 Deep Learning Elements (DLE) auf, die wiederum acht SIMD-Einheiten samt sehr großen Register Files beinhalten.

Erst dediziert, dann integriert

Vorerst plant Fujitsu, die Spezialchips auf Beschleunigerkarten zu montieren, die mit dem Tofu-Interconnect miteinander sowie mit einem Host-Prozessor verbunden werden. Diese Lösung soll im Fiskaljahr 2018 erscheinen, in Zukunft möchte Fujitsu die Deep Learning Units zur CPU auf das Package setzen. Gleiches hat auch Intel mit den Knights Crest genannten ASICs vor.

Parallel zu den DLUs arbeitet Fujitsu am Post-K, dem Nachfolger des K-Computers. Das neue System nutzt selbst entwickelte ARM-Prozessoren mit den Scalable Vector Extensions für doppelte (FP64), einfache (FP32) sowie halbe Genauigkeit (FP16) und verwendet 512 Bit breite SIMDs.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Macbooks
Apple hält 8 GByte RAM weiterhin für ausreichend

Apple verteidigt die Macbooks mit nur 8 GByte RAM: Das reiche für Streaming oder Casual Games aus. Die Realität ist eher anders.

Macbooks: Apple hält 8 GByte RAM weiterhin für ausreichend
Artikel
  1. Snowmobile: Amazon stellt Datentransfer per Lastwagen ein
    Snowmobile
    Amazon stellt Datentransfer per Lastwagen ein

    Noch 2016 waren die großen Snowmobile-LKW ein Highlight für Amazon Web Services. Nun fällt das Projekt Sparmaßnahmen zum Opfer.

  2. Warhorse Studios: Kingdom Come Deliverance 2 für Ende 2024 angekündigt
    Warhorse Studios
    Kingdom Come Deliverance 2 für Ende 2024 angekündigt

    Doppelt so viel Welt, eine Armbrust und Schusswaffen: Heinrich darf in Kingdom Come Deliverance 2 weitere Abenteuer im Mittelalter erleben.

  3. Alex Garlands Civil War: Technisch und erzählerisch ein Meisterwerk
    Alex Garlands Civil War
    Technisch und erzählerisch ein Meisterwerk

    Es ist Science-Fiction, die erschreckend realistisch anmutet. Civil War zeigt die Eskalation in einer gespaltenen Gesellschaft.
    Eine Rezension von Peter Osteried

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • MindStar: Corsair RGB 32GB DDR5-6000 119€ • Samsung Galaxy S23 -37% • MSI OLED Curved 34" UWQHD 175Hz -500€ • Alternate: Deep Cool CH560 Digital Tower-Gehäuse 99,90€ • PS5-Spiele von Sony -75% • Zum Tiefstpreis: AVM Heizkörperregler & limitierte Sennheiser-Kopfhörer [Werbung]
    •  /