Via Technologies: Centaur zeigt x86-Chip mit AI-Block

Acht CPU-Kerne und ein integrierter Coprozessor für künstliche Intelligenz: Centaur meldet sich nach Jahren mit einem x86-System-on-a-Chip zurück. Das Server-Design unterstützt AVX-512 und ist sehr schnell bei Inferencing.

Artikel veröffentlicht am ,
Block des NCORE für künstliche Intelligenz
Block des NCORE für künstliche Intelligenz (Bild: Centaur)

Centaur hat erstmals seit dem Isaiah alias Nano einen neuen x86-Prozessor vorgestellt (PDF): Das CHA-Design hat acht Kerne, die mit Blick auf den Servereinsatz entwickelt wurden, und enthält einen Coprozessor für Inferencing, also das Ausführen bereits trainierter neuronaler Netze für künstliche Intelligenz.

Der Chip misst laut Centaur weniger als 195 mm², er wird im 16FFC-Verfahren (FinFet Compact) beim weltgrößten Auftragsfertiger TSMC produziert. Er hat 44 PCIe-Gen3-Lanes und bezieht Daten über vier DDR4-3200-Kanäle. Im SoC stecken acht x86-Kerne namens CNS, sie sollen eine hohe Leistung pro Takt (Instructions per Cycle, IPC) aufweisen und derzeit mit 2,5 GHz laufen. Die Cores beherrschen die AVX-512- und die Bfloat16-Befehle, teilen sich 16 MByte L3-Cache und sind per Ringbus verknüpft.

Ebenfalls am Ringbus als eigener Block hängt der AI-Coprozessor, er heißt NCORE. Mit 16FCC kommt der Beschleuniger auf 34,4 mm² der unter 195 mm². Der Block soll immerhin 20 Teraops und 20 TByte/s erreichen: Hier teilt Centaur den NCORE in zwei 8er-Segmente auf, zusammen haben sie satte 16 MByte lokalen Speicher und sind extreme 32.768 Bit breit. Damit lassen sich 4.096 Berechnungen in einem Takt erledigen, was in einer sehr kurzen Latenz für Inferencing resultiert, wichtig etwa für Sprache.

  • Präsentation zum CHA-Design (Bild: Centaur)
  • Präsentation zum CHA-Design (Bild: Centaur)
  • Präsentation zum CHA-Design (Bild: Centaur)
  • Präsentation zum CHA-Design (Bild: Centaur)
  • Präsentation zum CHA-Design (Bild: Centaur)
  • Präsentation zum CHA-Design (Bild: Centaur)
  • Präsentation zum CHA-Design (Bild: Centaur)
  • Präsentation zum CHA-Design (Bild: Centaur)
  • Präsentation zum CHA-Design (Bild: Centaur)
Präsentation zum CHA-Design (Bild: Centaur)

Mit einem frühen Software-Stack, der kaum einen Monat als ist, hat Centaur mit dem CHA-Design den MLPerf-Benchmark durchgeführt: Ein Bild wird in weniger als 330 ms klassifiziert (MobileNet-v1 Stream), was einen Rekord darstellt - der Durchsatz entspricht grob 23 aktuellen Intel-CLX-SP-Kernen (MobileNet-v1 Offline). Die meisten anderen Systeme benötigen dafür eine Host-CPU, an die per PCIe externe Beschleuniger wie Intels NNP-T1000 oder Googles TPU v3 angeschlossen sind. Wann der CHA erscheinen soll, sagte Centaur nicht - ein System gibt es auf der ISC East 2019 in New York City zu sehen.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Intel Core i9-14900KS
Intel ist wahnsinnig geworden - zum Glück!

Um den Core i9-14900KS zur schnellsten Allround-CPU zu machen, hat Intel den Weg der Vernunft scheinbar vollständig verlassen. Doch dahinter stecken gute Neuigkeiten für Intel-Kunden.
Ein IMHO von Martin Böckmann

Intel Core i9-14900KS: Intel ist wahnsinnig geworden - zum Glück!
Artikel
  1. Streaming: Twitch verbietet Popos als Leinwand
    Streaming
    Twitch verbietet Popos als Leinwand

    Auf Hinterteile projizierte Streams sind auf Twitch künftig verboten: Der zu Amazon gehörende Dienst geht gegen einen absurden Trend vor.

  2. FTX-Gründer: Sam Bankman-Fried zu 25 Jahren Haft verurteilt
    FTX-Gründer
    Sam Bankman-Fried zu 25 Jahren Haft verurteilt

    Der Richter betonte die Dreistigkeit der Handlungen von Bankman-Fried. Doch die Haftstrafe für den früheren Chef der Kryptobörse FTX liegt weit unter der Forderung der Anklage.

  3. Truth Social: Warum Trumps kleines Netzwerk Milliarden wert wurde
    Truth Social
    Warum Trumps kleines Netzwerk Milliarden wert wurde

    Donald Trumps verlustbringender Twitter-X-Klon Truth Social wird nach seinem Börsengang mit 9 Milliarden US-Dollar bewertet. Es ist eine Spekulationsblase - und eine Investition in eine potenzielle Trump-Präsidentschaft.
    Ein Bericht von Achim Sawall

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • Palit 4070 Super 579,95€ • Xbox-Controller ab 39,99€ • AVM Fritzbox + Repeater -30% • DVDs & Blu-rays -31% • EA -75% • Ubisoft -50% • MindStar: AMD Ryzen 9 7900 339€, MSI RTX 4080 Super Ventus 3X OC 1.099€ • Gratis-Zugaben PS5 Slim & Nintendo Switch OLED beim TV-Kauf [Werbung]
    •  /