Künstliche Intelligenz ohne Cloud: ARM bringt Cortex-M55 und Ethos-U55
Für Endpoint-AI: Der Cortex-M55 ist ein CPU-Kern für IoT-Geräte, er beherrscht erstmals Vektor-Instruktionen für maschinelles Lernen. Hinzu kommt die Ethos-U55, ein Beschleuniger für neuronale Netzwerke.
Der britische IP-Entwickler ARM hat den Cortex-M55 und die Ethos-U55 vorgestellt, einen CPU-Kern und eine NPU (Neural Processing Unit). Beide sind als Funktionsblöcke für ein System-on-a-Chip gedacht, welches sogenannte Endpoint-AI vollführt. Darunter fallen Geräte für das Internet der Dinge, welche etwa Sensordaten mit künstlicher Intelligenz auswerten, ohne die Informationen über das Internet in die Cloud zu einem Server zu senden.
Beim Cortex-M55 handelt es sich um ein Design, welches durchaus Ähnlichkeiten mit dem älteren Cortex-M33 hat, aber auch einige architektonische Neuerungen aufweist. Zusammen mit mehr Takt soll er so bei generellen Workloads etwa 20 Prozent schneller rechnen. Der Cortex-M55 basiert auf der ARM v8.1 und integriert erstmals Helium, besser bekannt als die M-Profile Vector Extension (MVE). Dahinter verbergen sich sich SIMD-Instruktionen mit 128-Bit-Vektoren, weshalb der Cortex-M55 laut ARM eine 5-fache Geschwindigkeit bei DSP-Berechnungen und eine 15-fache bei maschinellem Lernen aufweisen soll.
NPUs sind bei ARM nicht neu: Mit der Ethos-N77, der Ethos-N57 und der Ethos-N37 gibt es bereits Neural Processing Units für Smartphones. Wie das U bei der Ethos-U55 bereits impliziert, handelt es sich um eine besonders platzsparende und sparsame Variante. Daher fliegt die Programmable Layer Engine (PLE) raus und damit SRAM, der viel Die-Fläche belegt. Die Ethos-U55 ist für 32 bis 256 MACs pro Taktzyklus ausgelegt und beschleunigt Inference-Workloads drastisch. 256 MACs entsprechen zwei Computation Engines (CEs), also einer halben Ethos-N37.
Laut ARM steigt die Leistung verglichen mit einem Cortex-M55 um das 50-Fache, die Energie-Effienz immerhin noch um das 25-Fache. Im Vollausbau ist eine Ethos-U55 allerdings auch doppelt so groß wie ein Cortex-M55, wenn beide im gleichen Fertigungsverfahren entstehen - was in einem SoC für IoT üblicherweise der Fall ist. Bis erste Designs erscheinen, dürfte es wenigstens 18 Monate dauern.