TU104 statt TU106: EVGA verkauft RTX 2060 KO mit höherer Rasterleistung
Bei der Geforce RTX 2060 setzt EVGA keinen TU106-Chip ein, sondern den TU104. Dadurch ist die KO-Edition in einigen Benchmarks deutlich flotter, als zu erwarten wäre. Grund dafür sind offenbar die Raster-Engines.
Vergangene Woche testete Gamers Nexus die Geforce RTX 2060 KO von EVGA und deren ungewöhnliche Performance-Resultate. Zwar stellen die Youtuber fest, dass die Grafikkarte einen TU104-Chip statt der sonst üblichen TU106 verwendet, liefern aber keine technische Erklärung für die höhere Geschwindigkeit bei bestimmten Workloads. Die ist jedoch relativ einfach, denn eine GPU besteht aus weit mehr als nur Shader-Rechenkernen.
Nvidia gliedert die Struktur seiner Grafikchips seit vielen Jahren in mehrere GPCs (Graphics Processor Clusters), welche die Anzahl der Raster-Engines festlegen. Jeder GPC umfasst dann einige TPCs (Texture Processing Clusters) mit den Polymorph-Engines für Tessellation und in den TPCs wiederum stecken die SMs (Shader Multiprocessors) mit den FP32/INT32-Einheiten. Alle Gruppen - GPCs, TPCs, SMs - sind einzeln abschaltbar.
Für eine Geforce RTX 2060 sieht Nvidia vor, dass diese 1.920 Shader-Kerne hat. Weil der TU106-Chip jedoch drei GPCs mit 18 TPCs für 36 SMs respektive 2.304 ALUs aufweist, deaktiviert der Hersteller davon drei TPCs in einem GPC. Die Geforce RTX 2060 hat also immer drei Graphics Processor Clusters und entsprechend auch drei Raster-Engines, da diese in den GPCs stecken.
Beim TU104-Chip hingegen gibt es sechs GPCs und somit auch sechs Raster-Engines, zudem 24 TPCs und ergo 48 SMs für 3.072 Shader-Kerne. Pro GPC gibt es vier TPCs statt sechs TPCs, weshalb nicht das gleiche Verhältnis besteht wie beim TU106. Um also den TU104-Chip auf 1.920 ALUs zu reduzieren, dürfte Nvidia schlicht zwei GPCs deaktivieren und dann in einem GPC noch zwei SMs abschalten.
Unterm Strich hat eine Geforce RTX 2060 mit TU106 also 3 GPCs, 15 TPCs, 30 SMs und 1.920 ALUs. Die Version mit TU104 hat aber vermutlich 4 GPCs und 16 TPCs sowie ebenfalls 30 SMs und 1.920 ALUs. Das würde dann in einem Drittel mehr Rasterleistung resultieren, die sich je nach Anwendungsfall deutlich bemerkbar macht. Hinzu kommt, dass sich beim TU104 auf GPC-Ebene diese Ressourcen weniger TPCs/SMs teilen müssen, was der Leistung ebenfalls zugutekommt.
Ob EVGA bei allen Geforce RTX 2060 KO auf einen TU104 setzt, wissen wir nicht - es bleibt außerdem offen, ob Nvidia den größeren Chip generell für Partner freigibt, damit sie diesen auf der Geforce RTX 2060 anstelle des TU106 verbauen können. Wir haben bei Nvidia diesbezüglich angefragt.
TU102 | TU104 | TU106 | TU116 | TU117 | |
---|---|---|---|---|---|
Fertigung | TSMC 12FFN | TSMC 12FFN | TSMC 12FFN | TSMC 12FFN | TSMC 12FFN |
Die-Size | 754 mm² | 545 mm² | 445 mm² | 284 mm² | 200 mm² |
Transistoren | 18,6 Milliarden | 13,6 Milliarden | 10,8 Milliarden | 6,6 Milliarden | 4,7 Milliarden |
GPCs / TPCs / SMs | 6 / 36 / 72 | 6 / 24 / 48 | 3 / 18 / 36 | 3 / 12 / 24 | 2 / 8 / 16 |
Shader-ALUs (FP32) | 4.608 | 3.072 | 2.304 | 1.536 | 1.024 |
Textureinheiten | 288 | 192 | 144 | 96 | 64 |
RT-Cores v1 | 72 | 48 | 36 | /// | /// |
Tensor-Cores v2 | 576 | 384 | 288 | /// | /// |
L2-Cache | 6 MByte | 4 MByte | 4 MByte | 1,5 MByte | 1 MByte |
Speicher-Interface | 384 Bit | 256 Bit | 256 Bit | 192 Bit | 128 Bit |
ROPs | 96 | 64 | 64 | 48 | 36 |
Hach, ich tu auch immer tun benutzen als Pfälzer ^^ aber nur in der gesprochenen Sprache :D