Colossus MK2 GC200: Graphcore will Nvidias A100 schlagen

In diversen AI-Benchmarks sieht sich Graphcore weit vor Nvidia, wohlgemerkt bei ähnlichem Energiebedarf und Systempreis.

Artikel veröffentlicht am ,
Colossus MK2 GC200
Colossus MK2 GC200 (Bild: Graphcore)

Graphcore hat bekannt gegeben, dass der Colossus MK2 GC200 ausgeliefert wird, und pünktlich zur Verfügbarkeit allerhand Benchmarks des AI-Beschleunigers veröffentlicht: Geht es um künstliche Intelligenz, so soll der Colossus-Chip den A100 von Nvidia locker überholen, teils gar um mehrere Faktoren.

Für einige der Messungen nutzt Graphcore den IPU-Pod64 mit 16 Einschüben, wovon jedes 1U-Blade mit vier Colossus MK2 GC200 ausgestattet ist. Als Vergleich wird Nvidias DGX-A100 in einzelner oder doppelter Form herangezogen, sogar in der aktuellen Version mit dem A100 mit 80 GByte Videospeicher statt nur der Hälfte davon. Die meisten Benchmarks hingegen positionieren einen einzelnen Colossus MK2 GC200 gegen einen einzelnen A100-Beschleuiger.

Bei Natural Language Processing mit BERT soll der Durchsatz beim Training um den Faktor 5,3x höher und beim Inferencing noch 3,4-fach höher ausfallen. Bei Computer Vision per Resnet-50 Training sieht sich Graphcore um den Faktor 2,6 vorne und bei Resnet-50 Inferencing soll die Leistung 4,6-fach höher sein. Auch die Image Classification per Resnext-101 läuft laut Graphcore signifikant schneller: Bei Training sei es Faktor 3,7x und das Inferencing würde gar mit 40-fachem Durchsatz und nur einem Zehntel der Latenz erfolgen.

  • Colossus MK2 GC200 gegen Nvidias A100 (Bild: Graphcore)
  • Colossus MK2 GC200 gegen Nvidias A100 (Bild: Graphcore)
  • Colossus MK2 GC200 gegen Nvidias A100 (Bild: Graphcore)
  • Colossus MK2 GC200 gegen Nvidias A100 (Bild: Graphcore)
  • Colossus MK2 GC200 gegen Nvidias A100 (Bild: Graphcore)
  • Colossus MK2 GC200 gegen Nvidias A100 (Bild: Graphcore)
Colossus MK2 GC200 gegen Nvidias A100 (Bild: Graphcore)

An dieser Stelle sei jedoch erwähnt, dass die Colossus MK2 GC200 mit 823 mm² gigantische Chips sind, die einen mit 900 MByte wahnwitzig großen SRAM enthalten, um Daten lokal vorzuhalten - dagegen nehmen sich die 48 MByte an L2 bei Nvidias A100 geradezu winzig aus. Mit 59,4 Milliarden statt 54 Milliarden Transistoren und ebenfalls der N7-Fertigung von TSMC weisen beide Designs zwar große Ähnlichkeiten auf, der interne Aufbau aber unterscheidet sich drastisch und damit auch die Performance. Denn auch Nvidias A100 dürfte gewisse AI-Benchmarks für sich entscheiden, die zeigt Graphcore aber nicht.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Eheran 13. Dez 2020

3x kürzer 3x schneller 3x langsamer 3x länger 3x kürzere Zeit 3x längere Zeit Aber nicht...

Daniel89 12. Dez 2020

Natürlich denkt man so. Es ist ja auch nur ein kleiner Sprung von einem Dataminer zu...

George99 11. Dez 2020

Colossus and künstliche Intelligenz ist doch schon 1970 nicht gut ausgegangen. Ich hoffe...



Aktuell auf der Startseite von Golem.de
Sport und Gesundheit
Massive Anwenderkritik am neuen Garmin Connect

Unübersichtlich, zu viele Klicks: Die neue Version von Garmin Connect kommt bei Nutzern auffällig schlecht an.

Sport und Gesundheit: Massive Anwenderkritik am neuen Garmin Connect
Artikel
  1. Apple: Tim Cook muss kein Vision-Pro sein
    Apple
    Tim Cook muss kein Vision-Pro sein

    Apple wird oft vorgeworfen, unter Tim Cook langweilig geworden zu sein. Aber braucht Apple wirklich Produkte wie das Vision Pro?
    Ein IMHO von Tobias Költzsch und Daniel Ziegener

  2. Sparen: ARD errichtet Tech-Unit mit ZDF und Deutschlandradio
    Sparen
    ARD errichtet Tech-Unit mit ZDF und Deutschlandradio

    Die öffentlich-rechtlichen Sender haben ein Bekenntnis zu gemeinsamer Technik abgeliefert. Diese steht trotz förderativem Ansatz künftig im Zentrum bei ARD, aber auch beim ZDF und dem Deutschlandradio.

  3. Early Access: Erste Tests loben das Solo-Dev-Aufbauspiel Manor Lords
    Early Access
    Erste Tests loben das Solo-Dev-Aufbauspiel Manor Lords

    Meistgewünschtes Spiel auf Steam, programmiert von einem Entwickler: Das in Süddeutschland angesiedelte Manor Lords kommt in Tests gut an.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Gigabyte GeForce RTX 4070 Ti zum Tiefstpreis • MediaMarkt: Asus Gaming-Laptop 999€ statt 1.599€ • Anker USB-Ladegeräte -45% • OLED-TV von LG 54% günstiger • Gamesplanet Spring Sale [Werbung]
    •  /