Ampere RTコアはTuringの4倍に高速化―3080 Tiは2080 Tiから+40%性能アップ【噂】

Moore’s Law Is Dead, HardwareLeaks他の次期GeForce GPUについてのリークネタPart 2。

今回はAmpere GeForce最上位のチップ「GA102」に関する情報がメイン。

前回はこちら。

リーク情報まとめ
最上位カードはCUDAコア数5,376に
GA102 ES品らしきカードがRTX 2080 Ti FE比で+31%の3DMark Time Spyスコアを記録
最適化が進めば2080 Tiから+60～90%の性能になるかも？
レイトレーシング性能はTuring比で4倍に
ESのクーラーはトリプルファン仕様

リーク情報まとめ

まず、5月中旬のGA102に関するリークが以下。

GA102に関するリークその1 (via Moore’s Law Is Dead)

CUDAコア数は5,376
- ES（エンジニアリングサンプル）カードの消費電力は220～230 W
ブーストクロックは2.2 GHz以上
- カットダウン版GA102でも21 TFLOPS超の性能
メモリクロックは18 Gbps
- 帯域幅はRTX 2080 Ti比で+40.3%の864 GB/s

GA102に関するリークその2 (via Moore’s Law Is Dead)

1080pおよび1440p環境では完全にオーバースペックな性能（現状のCPUではGPUの処理速度に釣り合わずボトルネックになる）
4Kゲーミングがミッドレンジにおける標準に
4Kゲームでのラスタライゼーション処理は、RTX 2080 Ti比で最低でも+40%の性能

同じく5月中旬のレイトレーシング関連の情報がこちら。

RTコアの数は必ずしも増えている訳ではないが、コアあたりの性能は大幅に向上する
- Ampere RTコアの命令実行はTuring比で4倍高速
- 仮にRTX 2080 TiにTuring RTコアを載せた場合、文字通りRT性能は4倍になる
SMやL2キャッシュの追加や、Tencorコアの倍増を考慮すると、RT有効時はローエンドAmpereでハイエンドTuringに迫るプレイができる
- TuringはKeplerのようなもの
- NVIDIAは旧カードでRT設定を下げるのではなく、RT性能を向上させることでアップグレードの促進を目論んでいる
TuringではRTをグローバルイルミネーション、シャドウ、反射から選択する必要があり、大幅なパフォーマンス低下が起きていた
- AmpereではGI/シャドウ/反射すべてのRTを、小さいパフォーマンス低下と引き換えに同時実行できる
GA102はTitan RTX比で4～5倍高速にMinecraft RTXが動作する

6月初旬にアップデートされた情報がこちら。

現状のES品はトリプルファン仕様
- リークされたクーラーの外観は本物。製品版でもこれが搭載されるとは限らないが、ES品のクーラーはこの外観
USB-Cは最新のES品では省かれた
クロックは1ヶ月前(5月)から上昇し、2.5 GHz付近になった
- ただし同時に消費電力も上昇した（以前はコアクロック2.3 GHz～でTDPが～230 Wとされていた）
最新のES品ではVRAMにGDDR6Xを搭載。少なくとも21Gbps動作のGDDR6を搭載する（帯域幅は～1TB/sまで拡張される？）
GA102らしき最新ES品は初期サンプルから性能が10～15%向上
- この調子で最適化が進めばTU102比で160～190%の性能になるかも？
これまでにリークされた機能の内いくつかは最終製品に搭載されない
- NVCacheおよびTensor Memory Compressionの実装は検討中ステータス
GA102の発表日は引き続き9月の予定

最上位カードはCUDAコア数5,376に

まずはGA102のコア数とクロック絡みの話。なおGA102というのは、RTX 2080 Tiの後継（RTX 3080 Ti ?)に載ると思われるGPUのコードネーム。RTX 2080 Tiのダイは「TU102-300」だった。

CUDAコア数は5,376
- ES（エンジニアリングサンプル）カードの消費電力は220～230 W
ブーストクロックは2.2 GHz以上
- カットダウン版GA102でも21 TFLOPS超の性能
メモリクロックは18 Gbps

CUDAコア数は5,376基で、初期ES品のブーストクロックは2.2 GHz以上。4,352コアだった2080 Tiから大きく増え、クロックも700 MHz以上高い。消費電力は220～230 Wで、TDP 215 WだったRTX 2080（無印）より少し高い程度に収まっている。2080 TiのTDP 250 W、あるいはTitan RTXの280 Wよりは省電力。

CUDAコア5,376というのはフルダイの数字で、一部のSMを無効化したカットダウン版でも21 TFLOPSを超える処理能力がある（恐らくFP32の話）とのことですが、2080 Tiで13.45 TFLOPS、TITAN RTXで16.31 TFLOPS、CUDAコア数6,912の怪物AmpereカードA100でも19.49 TFLOPSなので、いくらなんでも速すぎかと。

とはいえ、A100はクロックが1.4 GHz前後のため、フルスペックGA102を高クロックでブン回せば20 TFLOPS超えも夢ではない、のかも。

クロックは1ヶ月前(5月)から上昇し、2.5 GHz付近になった
- ただし同時に消費電力も上昇した（以前はコアクロック2.3 GHz～でTDPが～230 Wとされていた）

6月のアップデートでは、5月の初期ES品から2.5 GHz近くまでクロックが伸び、その分だけ消費電力も増えたという話に。消費電力増加はともかく、クロックは流石に盛りすぎに思えるのでフェイクくさい。

GA102 ES品らしきカードがRTX 2080 Ti FE比で+31%の3DMark Time Spyスコアを記録

6月21日にHardwareLeaks.comに載ったリークには、_rogame氏が「NVIDIA従業員のテスト結果であることの裏付けは取れている」と主張する、GA102のES品らしきカードの3D Mark Time Spyスコアが掲載。

https://hardwareleaks.com/2020/06/21/exclusive-first-look-at-nvidias-ampere-gaming-performance/

登録カードの仕様は以下の通り。

仕様	GA102開発サンプル
GPUベンダー	NVIDIA
ブーストコアクロック	1,935 MHz
メモリクロック	6,000 MHz

ブーストクロックで2 GHz未満と控えめですが、あくまでES品なので製品版ではもっと高クロックになるという期待の余地アリ。

3DMark Time Spyスコア (via HardwareLeaks.com)

既存カードのスコアとGA102 ES品の3DMark Time Spyスコア比は以下の通り。

対RTX 2080 Ti Founders Edition: 130.98%
対MSI RTX 2080 Ti Lightning Z: 121.07%
対Titan RTX: 122.14%
対極冷（液体窒素）構成Titan Vスコア: 108.30%
対EVGA RTX 2080 Ti XC（KINGPIN’s OC記録）: 97.82%

ES品でこの性能なら、ここから製品版に向けてクロックが引き上げられるとすれば、RTX 2080 Ti比+40%という目標値も達成できそう。

最適化が進めば2080 Tiから+60～90%の性能になるかも？

最新のES品ではVRAMにGDDR6Xを搭載。少なくとも21Gbps動作のGDDR6を搭載する（帯域幅は～1TB/sまで拡張される？）
GA102らしき最新ES品は初期サンプルから性能が10～15%向上
- この調子で最適化が進めばTU102比で160～190%の性能になるかも？

6月に入ると、最新のES品ではVRAMがGDDR6Xに。GDDR6の可能性もあるが、少なくとも21Gbpsで動作する高クロックメモリであることは確からしい。帯域幅は1TB/sになるかもしれない。

全体の性能は初期サンプルから10～15%向上しており、この調子で最適化が進めばTU102 (2080 Ti)比で160～190%の性能になるかもとのこと。流石に2倍弱の性能には届かないかと……

レイトレーシング性能はTuring比で4倍に

RTコアの数は必ずしも増えている訳ではないが、コアあたりの性能は大幅に向上する
- Ampere RTコアの命令実行はTuring比で4倍高速
- 仮にRTX 2080 TiにTuring RTコアを載せた場合、文字通りRT性能は4倍になる

RTに関しては、前回のリークにもあったようにAmpereでRTコアあたりの性能が大幅に向上しており、Turing比で4倍に達する。コアそのものの性能が上がっているので、Ampereで仮にコア数が増えなくとも性能が4倍になるらしい。

SMやL2キャッシュの追加や、Tencorコアの倍増を考慮すると、RT有効時はローエンドAmpereでハイエンドTuringに迫るプレイができる
- TuringはKeplerのようなもの
- NVIDIAは旧カード(Turin世代)でRT設定を下げるのではなく、RT性能を向上させることでアップグレードを促そうとしている

前回のリークで「RTX 3060でRTX 2080 Ti相当のRT性能になる」とされていたのと一致する内容。「TuringはKeplerのようなもの」と言われている通り、初のRTXカードだったので色々改善点が見つかったと思われる。

TuringではRTをグローバルイルミネーション、シャドウ、反射から選択する必要があり、大幅なパフォーマンス低下が起きていた
- AmpereではGI/シャドウ/反射すべてのRTを、小さいパフォーマンス低下と引き換えに同時実行できる
GA102はTitan RTX比で4～5倍高速にMinecraft RTXが動作する

これまではシャドウだけRTX Onみたいな切り替えても描画が変わってんだか良く分からない、という残念なものでしたが、ようやくRTX Onがまともに動きそうで何より。

ESのクーラーはトリプルファン仕様

ES品搭載のクーラーデザイン (via Moore’s Law Is Dead)

現状のES品はトリプルファン仕様
- リークされたクーラーの外観は本物。製品版でもこれが搭載されるとは限らないが、ES品のクーラーはこの外観
USB-Cは最新のES品では省かれた

ESのクーラーはトリプルファン仕様。事前にリークされていたデザインは本物で、製品版もこのクーラーになるかはともかく、ES品はコレらしい。

初期サンプルで搭載されていたUSB Type-Cコネクタは今は無くなっているとのこと。

これまでにリークされた機能の内いくつかは最終製品に搭載されない可能性
- NVCacheおよびTensor Memory Compressionの実装は検討中ステータス

以前リークされたNVCacheやTensor Memory Compressionなどの機能は検討段階で、製品では実装されない可能性もある模様。

GA102の発表日は引き続き9月の予定

発表日は変わらず9月見込みとのこと。

NVIDIA GEFORCE RTX 2080 Ti Founders Edition

NVIDIA

NVIDIA GeForce RTX 2080 Tiグラフィックス処理ユニット(GPU)搭載、1635MHzのブーストクロック速度、最大デジタル解像度: 7680x4320、Turing GPUアーキテクチャとRTXプラットフォームから電源供給。これにより前世代のグラフィックカードのパフォーマンスを最大6倍にし、ゲームにリアルタイムのレイトレースとAIの力をもたらします。