A64FX: Fujitsu erläutert ARM-Chip für Japans Supercomputer

Der A64FX ist die erste CPU mit ARMs Vector-Erweiterung für Supercomputer. Laut Fujitsu rechnet der wassergekühlte Chip schnell und effizient. Er treibt das neue Post-K-System in Japan an.

Artikel veröffentlicht am ,
Prototyp der Hardware des Post-K-Supercomputers
Prototyp der Hardware des Post-K-Supercomputers (Bild: Fujitsu)

Fujitsu hat auf der Hot Chips 30 den A64FX vorgestellt. Der Prozessor hat nichts mit AMDs Athlon 64 FX zu tun, sondern ist eine ARM-basierte CPU für den japanischen Post-K-Supercomputer des Forschungsinstituts Rikagaku Kenkyujo (Riken) nahe Tokio. Der Chip unterstützt unterschiedliche Rechengenauigkeiten und ist der erste, der ARMs sogenannte Scalable Vector Extension (SVE) für Supercomputer mit einer Vektorlänge von 512 Bit integriert.

Der A64FX ist High Performance Computing (HPC) und für künstliche Intelligenz ausgelegt - er kann mit FP64, mit FP32, mit INT16 und mit INT8 umgehen. Hier liefert er er bei 1,8 GHz zwischen über 3,4 Teraflops bis über 21,6 Teraops einen sehr hohen Durchsatz. Die praktische Rechenleistung und erreichte Datentransferrate liegt laut Fujitsu mit über 90 Prozent bei DGEMM und mit über 80 Prozent bei Stream Triad sehr nahe an den theoretischen Werten. Das macht den Chip effizient und verringert so die Kosten im Betrieb, welche bei einem Supercomputer enorm sind.

  • Präsentation des A64FX (Bild: Fujitsu)
  • Präsentation des A64FX (Bild: Fujitsu)
  • Präsentation des A64FX (Bild: Fujitsu)
Präsentation des A64FX (Bild: Fujitsu)

Hergestellt wird der Prozessor im 7-nm-Verfahren, er besteht aus 8,786 Milliarden Transistoren. Interessant ist dabei, dass das Package nur 594 Pins aufweist - ähnlich aufwendige CPUs haben viel mehr. Jeder A64FX hat 48 Compute-Kerne mit reiner 64-Bit-Unterstützung und vier weitere für Verwaltungsaufgaben. Daten erhält der Chip über vier HBM2-Stacks mit 32 GByte und einer Bandbreite von 1 TByte/s, die Node-Kommunikation übernimmt der Tofu-v3-Interconnect. Für Peripherie gibt es 16 PCIe-Gen3-Lanes.

Pro Chip gibt es vier CMGs (Core Memory Groups) mit 13 Cores und 8 MByte L2-Cache sowie einem mit 11 TByte/s extrem schnellen L1-Datenpuffer mit 64 KByte pro Kern. Der L1D ist laut Fujitsu besonders wichtig für den Durchsatz der beiden 512-Bit-Vector-Pipelines. Verglichen mit den Sparc64-XIfx-Chips im aktuellen K-Computer soll der A64FX im Durchschnitt grob die dreifache Geschwindigkeit bei HPC-Messungen und bis zu Faktor neun bei AI-Workloads aufweisen. Fujitsu nutzt Linux mit McKernel und angepassten Compilern und arbeitet eng mit dem Riken für die Software des Post-K zusammen.

Der neue Supercomputer soll 2021 fertiggestellt sein, finale Performance-Angaben oder Werte zur Leistungsaufnahme des Post-K-Systems gibt es nicht.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed

Auch zu diesem Thema:



Aktuell auf der Startseite von Golem.de
Rheinmetall
Köln testet Ladebordsteine in der Praxis

Rheinmetall und die Stadt Köln haben den Startschuss für eine Lade-Infrastruktur in Bordsteinen von Bürgersteigen gegeben.

Rheinmetall: Köln testet Ladebordsteine in der Praxis
Artikel
  1. Sport und Gesundheit: Massive Anwenderkritik am neuen Garmin Connect
    Sport und Gesundheit
    Massive Anwenderkritik am neuen Garmin Connect

    Unübersichtlich, zu viele Klicks: Die neue Version von Garmin Connect kommt bei Nutzern auffällig schlecht an.

  2. Bethesda: Das Next-Gen-Update für Fallout 4 ist da
    Bethesda
    Das Next-Gen-Update für Fallout 4 ist da

    Clients für Xbox Series X/S und PS5, Verbesserungen auf PC und auf der PS4: Der erste größere Patch für Fallout 4 seit 2017 ist da.

  3. Gerichtsurteil: Google verstößt gegen Gesetz zum Kündigungsbutton
    Gerichtsurteil
    Google verstößt gegen Gesetz zum Kündigungsbutton

    Mal wieder hat es ein Unternehmen lieber auf eine Klage ankommen lassen, anstatt ein geltendes Gesetz umzusetzen. Diesmal geht es um Google.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Asus OLED-Monitor zum Tiefstpreis • Gigabyte GeForce RTX 4070 Ti zum Tiefstpreis • MediaMarkt: Asus Gaming-Laptop 999€ statt 1.599€ • Anker USB-Ladegeräte -45% • OLED-TV von LG 54% günstiger • Gamesplanet Spring Sale [Werbung]
    •  /