IBM Power8: Bandbreiten-Monster steuert bis zu 1 TByte RAM an

IBM hat auf der Konferenz "Hot Chips 25" seinen Power8-Prozessor vorgestellt. Der 12-Kern-Chip bietet rasend schnelle Caches und bindet zudem noch 128 MByte externes EDRAM an. Die Leistung soll doppelt so hoch liegen wie beim Power7+.

Artikel veröffentlicht am ,
Der Power8 bindet acht Memory-Buffer-Chips als L4-Cache an.
Der Power8 bindet acht Memory-Buffer-Chips als L4-Cache an. (Bild: IBM)

Mit dem Power8 hat IBM ein Jahr nach dem Power7+ dessen Nachfolger vorgestellt, der ursprüngliche Power7 erschien bereits 2010. Der neue Chip misst satte 650 mm², den externen EDRAM nicht mitgezählt. Möglich wird ein solches Monster durch IBMs 22-Nanometer-SOI-Fertigung in der Chipfabrik in East Fishkill, New York. Der Power7+ wurde noch in 32 nm produziert, der Power7 in 45 nm.

  • Der Power8 bietet zwölf Kerne mit je 512 KByte L2 und dazu insgesamt 96 MByte L3-Cache. (Bild: IBM/Screenshot: Golem.de)
  • Jede Recheneinheit kann mittels Simultaneous Multithreading acht Threads abarbeiten. (Bild: IBM/Screenshot: Golem.de)
  • Acht EDRAM-Blöcke mit zusammen 128 MByte dienen als externer L4-Cache. (Bild: IBM/Screenshot: Golem.de)
  • Peripherie wird per PCI-Express 3.0 angebunden. (Bild: IBM/Screenshot: Golem.de)
  • Der Power8 im Vergleich zu früheren Power-Prozessoren (Bild: IBM/Screenshot: Golem.de)
  • Gegenüber dem Power7+ soll der Power8 teilweise mehr als doppelt so flott rechnen. (Bild: IBM/Screenshot: Golem.de)
Der Power8 bietet zwölf Kerne mit je 512 KByte L2 und dazu insgesamt 96 MByte L3-Cache. (Bild: IBM/Screenshot: Golem.de)

Die gleich zwölf Kerne des Power8, von denen jeder per Simultaneous Multithreading acht Threads ausführen kann, greifen auf jeweils 512 KByte L2-Cache zurück. Weiterhin teilen sich die Recheneinheiten 96 MByte L3-Cache und obendrauf kommen noch einmal 128 MByte Embedded-DRAM. Letzerer Speicher ist als L4-Cache organisiert und wird mittels acht Memory-Buffer-Chips ermöglicht, der Speichercontroller bindet zudem mittels 32 Kanälen bis zu 1 TByte DDR3-1600-RAM an.

Doppelte Leistung, FIVRs und PCI-E 3.0 ab 2014

Damit die Daten schnell genug ankommen, schaufeln die Kerne ihre Daten aus dem L2-Cache mit 256 GByte pro Sekunde heran und schreiben sie mit 64 GB/s zurück. Der L3-Puffer arbeitet in beide Richtungen mit 128 GB/s und der L4-Cache liest ebenso flott, schreiben kann er mit 64 GB/s. Die 32 Kanäle mit DDR3-1600-Geschwindigkeit erlauben zusammen 410 GB/s, dauerhaft soll der Power8 immerhin noch 230 GByte pro Sekunde schaffen.

Die enorme Datentransferrate erlaubt es dem IBM-Chip zusammen mit seinen zwölf Kernen, die Leistung gegenüber dem Power7+ mit seinen nur acht Recheneinheiten je nach Anwendung mehr als zu verdoppeln - Singlethread ist er immerhin um den Faktor 1,6 flotter. Taktfrequenzen gibt der Hersteller hierbei nicht an, ein Hinweis in der Präsentation lässt aber auf 4 GHz schließen. Der Power7+ kommt auf bis zu 4,4 GHz.

Neben der reinen Rechenleistung sind beim Power8 vor allem die einzelnen Spannungsregler pro CPU-Kern bemerkenswert. Etwas Ähnliches bietet derzeit nur Intels Haswell, hier versorgt ein Regler aber neben den x86-Einheiten noch die GPU sowie den L3-Cache und den System Agent. Daher spricht Intel von FIVRs, also Fully Integrated Voltage Regulators.

Wie beim Mitbewerber bindet der Power8 Peripherie per PCI-Express 3.0 und bis zu 16 Lanes an, auch Transactional Memory wird unterstützt. Erste Chips sollen kommendes Jahr ausgeliefert werden, zu Preis und TDP schweigt IBM bisher.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Interview mit Don Lemon
Elon Musk spricht über Ketamin-Konsum und Raketen-Roadster

Das einstündige Interview hat seinen Moderator den Job gekostet. Viel Neues lässt sich über Elon Musks Drogenkonsum, Weltbild und Zukunftspläne trotzdem nicht lernen.
Von Daniel Ziegener

Interview mit Don Lemon: Elon Musk spricht über Ketamin-Konsum und Raketen-Roadster
Artikel
  1. Blackwell B200: Nvidias stellt riesige Doppel-GPU vor
    Blackwell B200
    Nvidias stellt riesige Doppel-GPU vor

    GTC 2024 Nvidias neue GPU-Architektur startet mit der wohl komplexesten Grafikprozessor aller Zeiten. Ohne TSMCs Cowos-Packaging wäre das nicht möglich gewesen.

  2. Audi Q6 E-Tron vorgestellt: Mehr Verspätung als bei der Bahn
    Audi Q6 E-Tron vorgestellt  
    Mehr Verspätung als bei der Bahn

    Audi bringt zwei Jahre später als geplant den Q6 E-Tron heraus. Eine Proberunde im Prototyp hinterlässt einen guten Eindruck.
    Von Dirk Kunde

  3. Security: So funktioniert Zero Trust
    Security
    So funktioniert Zero Trust

    Wer seine Systeme vor Attacken schützen möchte, kommt um Zero Trust nicht herum. Wir erklären, wie man es auf die eigenen Systeme bringt.
    Von Andre Fritsche

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • Wochenendknaller bis 9 Uhr bei MediaMarkt • MindStar: MSI RTX 4070 Super Ventus 2x OC 589€ - günstig wie nie • Ubisoft Spring Sale (PC) • 8x Panasonic eneloop AA 19,99€ • NBB: Black Weeks bis -70% • be quiet! Shadow Base 800 93,89€ • Hisense 85A6BG 999€ [Werbung]
    •  /