結局RTX 3080 TiもSamsung 8 nmに―性能は引き出せるが発熱がヤバい【噂】

次期GeForce GPUについてのリークネタまとめPart 3。情報元はMoore’s Law Is Deadほか。

前回のまとめはこちら。

【追記】9月9日、RTX 30シリーズが正式発表されました。

前世代から2倍の性能。RTX 3090/3080/3070が正式リリース

9月1日、NVIDIAからRTX 30シリーズが正式発表されました。発表されたのはGeForce RTX 3090/3080/3070の3製品。RTX 3090/3080/3070の仕様一覧RTX 3...

Ampereは何が「Turing比で2倍」なのか？―技術仕様から見るRTX 30シリーズ

NVIDIAから、Ampereアーキテクチャの技術詳細についてのホワイトペーパーが公開されました。NVIDIAはRTX 3080について、RTX 2080から最大2倍の性能を実現するとアピールしていま...

RTX 30シリーズ(& RTX 20/GTX 10)仕様表まとめ

先日公開されたRTX30シリーズのホワイトペーパーから、スペックシート部分を抜き出してRTX 20シリーズ/GTX 10シリーズと比較した仕様表を作ってみた。すべてFounders Editionでの...

リーク内容一覧
TDPは初期サンプルから上昇、300 W超えの可能性も
- 結局全部Samsung 8 nmで生産されるっぽい
ゲーム性能は2080 Tiから40%高速化を維持、AmpereのIPC向上は確か
接続はPCIe 4.0 x16に、補助電源は12-pin x1の謎端子？
DLSS 3.0は2.0よりも対応タイトルが大きく増える予感、生成画質もアップ
Tensor Memory CompressionはVRAM使用率を2～4割削減
発表は9月、発売は11月中旬以降
GeForce Experienceがログイン不要に

リーク内容一覧

ES品に関する7月のアップデート (via Moore’s Law Is Dead)

クーラーは以前のリーク通り。分厚いのはファンの向きが理由
補助電源コネクタはPCIe 8-pin x2ではなく大きな1ブロックに
GA102の消費電力はストック設定でも300 W超え
オーバークロックできる余地はかなり大きいが、すべての制限を無効化すると消費電力が400Wへ達する可能性がある
6月のリークからポート類の変更は無し
- DisplayPort 2.0, HDMI 2.1, USB-C（初期サンプルのみで現在は非搭載）, PCIe 4.0 x16接続

性能に関する7月のアップデート (via Moore’s Law Is Dead)

ESのVRAMは12GBのまま、フルダイGA102のCUDAコア数は5,376コア
- カットダウン版がどうなるかは不明
- 旧ESと同じくメモリクロックは18 Gbpsのまま
ブーストクロックは2 GHz程度
- ファン回転数を上げてパワーリミットを外せば2.2 GHzまでブーストできるが、TDPは400 Wまで上がる
- （ES品のテスト中）狭い部屋の室温が明らかに上昇していた
4Kにおけるラスタライゼーション処理は40%高速（RTX 2080 Tiとの比較？）
レイトレーシングに関しては以前のリークと変わらず、Turing比で3～4倍の性能
TurigからIPCは“明確に”向上している

Ampereで実装予定の機能についてのアップデート (via Moore’s Law Is Dead)

DLSS 3.0は2.0から“まともに使える”機能に
- TAA対応ゲームであれば使えるように。ただしGame Readyドライバーの対応は必要
- ゲーム開発者はDLSS 3.0対応のため、タイトル毎にプログラミングを行う必要はあるが、2.0以前と比べて実装の手間は削減されている
- 画質はゲームによって差があるが、DLSS 2.0との比較では全体的に向上している
- いくつかの証拠が、NVIDIAがDLSS 3.0を標準で有効にするつもりであることを示している
NVCacheでは、複数タスクを並列処理するため、VRAMだけでなくSSDやDRAMの帯域幅も動的に制御される
Tensor Memory CompressionはVRAM使用率を20～40%削減できる
ゲーマー向けの発表は9月予定から変わらず
- プレス向けドライバーは「Cyberpunk 2077」の発売前に用意される見込み
「NVIDIAコントロールパネル」が刷新され、「GeForce Experience」と「GeForce Now」もコントロールパネルに統合へ
- ログイン不要で使えるように（GeForce ExperienceはGeForceアカウントのログインが必須だった）
- RTX Voiceがアップデート予定
- NVEncは第7世代に、H.264またはH.265の8K/60fps動画のエンコードに対応

TDPは初期サンプルから上昇、300 W超えの可能性も

GA102の消費電力はストック設定でも300 W超え
オーバークロックマージンは大きいが、すべての制限を無効化すると消費電力が400Wへ達する可能性があるフルダイGA102のCUDAコア数は5,376コア
- カットダウン版がどうなるかは不明
ブーストクロックは2 GHz程度
- ファン回転数を上げてパワーリミットを外せば2.2 GHzまでブーストできるが、TDPは400 Wまで上がる
- （ES品のテスト中）狭い部屋の室温が明らかに上昇していた

7月のアップデートでは、CUDAコア数については変更なし。カットダウン無しのフルダイは5,376コアで確からしい。

クロックについてはブーストで2 GHzを軽く超えるという話から一転、2 GHz前後で頭打ちに。クロックが下がったにもかかわらず、消費電力は300 W超えに。

300 W超えとなると従来のクーラー設計では厳しいレベルの発熱になってくるので、Founders Editionのクーラーが突飛な見た目なのも納得できる。

ダイのOCマージンはあるのでリミットを外せば2.2 GHzまで回るものの、TDPが400 Wに達するというから凄まじい。

ラボの試験部屋がどのくらい狭いのか不明ですが、室温が露骨に上がったというからには相当な発熱かと……マジで暖房要らず。

結局全部Samsung 8 nmで生産されるっぽい

この消費電力の悪化については、初期サンプルがTSMC 7 nmプロセスのGA102だったと仮定すると、最新サンプルでSamsungの8 nmにプロセスが変更されたことによるものと推測できる。

Moore’s Law Is Deadも、当初の「最上位SKUのみTSMC 7 nm製造、メインストリームはSamsung 8 nmになる」という話から「上から下まで全てSamsung 8 nmでの生産に切り替えた」と考えている模様。

TSMCのN7と比べると、Samsungの8 nmは-20～30%程度ワットパフォーマンスが落ちるとみられ、NVIDIAは当初目標から2～3割の性能低下、あるいは同割合の消費電力増加という厳しい選択を迫られている状態にあるとMoore’s Law Is Deadでは推測している。

EUVリソグラフィのGPU、2021年まで出てこない説

展開としては、高消費電力でブン回す高性能チップの生産については、Samsungよりも実績のあるTSMCの方が優位でしたという流れなのでさもありなんですが、何故GA102までSamsung生産になったのかはハッキリせず。

パッと思いつく理由としては、「TSMCのN7ラインを確保したものの、A100の生産だけで一杯一杯で、GeForce生産分に回す目処が立たなくなった」とか。

NVIDIAは、年内にNERSC（米国立エネルギー研究科学計算センター）のスーパーコンピューター「Perlmutter」用に6,000枚以上のA100を納入する予定で、つまり、巨大すぎてどう考えても歩留まりが良いとは考えられないA100を、年内に最低でも6,000個作らなくてはいけない状況にある。

他社に遅れてなんとか抑えた規模のN7ラインでは、他のダイを作る余裕なんて無い、というのは想像に難くない。

逆にN7Pは、XsXとPS5も抱えたAMDが、早期に唾を付けて専有しているハズなので、当然空きがない。EUVのN7+は立ち上げから間もなく、そもそも年末までの量産に間に合わない可能性が十分にある。

AMDもRDNA 2になったXsXとPS5のSoCをN7Pで作っており、そうなれば年内発表予定のNavi 2もN7Pでしょう（N7とN7Pはダイ設計の互換性があるが、N7+は互換性が無いため設計からやり直しになる）。

NVIDIA的には、Samsungの7LPPでAmpereを量産できていれば、世界初EUVリソグラフィ生産のGPUという箔も付いて万歳だったんだろうと思いますが、現実は厳しい。

結局、EUV生産のGPUは来年まで出てこないっぽいので、個人的には拍子抜け。

TSMCのN7+やらSamsungの7LPPがうんぬんかんぬん～は以前の記事でもちょっと書いた。

ゲーム性能は2080 Tiから40%高速化を維持、AmpereのIPC向上は確か

4Kにおけるラスタライゼーション処理は40%高速（RTX 2080 Tiとの比較）
TurigからIPCは“明確に”向上している

IPCはTuringから明確に上昇しているとのことなので、+10～20%という以前のリークに近いものが期待できそう。

ここでいうラスタライゼーション性能は、RTXと無関係の従来のゲーム3D描画の性能を指しており、4K解像度でRTX 2080 Tiから40%高速というのは、前から言われていた「4割速い」と合致する。

とは言えこの性能を出すために、爆熱カードを冷やさなくてはいけないと考えると頭が痛い……

レイトレーシングに関しては以前のリークと変わらず、Turing比で3～4倍の性能

これは朗報。RTX自体も軽くなるらしいとはいえ、4倍くらいになってもらわないとCyberpunk 2077がまともに遊べそうにない。

接続はPCIe 4.0 x16に、補助電源は12-pin x1の謎端子？

クーラーは以前のリーク通り。分厚いのはファンの向きが理由
補助電源コネクタはPCIe 8-pin x2ではなく大きな1ブロックに

ESのクーラーは変わらずトリプルファン仕様。クーラーが分厚い（2.5スロットという噂）のは、奇妙なファンの向きが理由とのこと。カードに対して軸が斜めとかだろうか？

ESのトリプルファンクーラーのデザイン (via Moore’s Law Is Dead)

補助電源は12-pin x1という今までにない謎端子らしい。変換アダプターが付属するという話（6-pin x2？）もあるが、だったら最初から8+4なり6+6なりにしない理由が分からない……意味不明ですが、このネタは複数のリーカーから出ているので、本当っぽい。

DisplayPort 2.0, HDMI 2.1, USB-C（初期サンプルのみで現在は非搭載）, PCIe 4.0 x16接続

出力ポートは6月以前リークから変更がなく、DisplayPort 2.0, HDMI 2.1を搭載。

インターフェイスはPCIe 4.0 x16接続になるとのことで、Radeon RX 5000シリーズに続くPCIe 4.0対応カードになる見込み。

DLSS 3.0は2.0よりも対応タイトルが大きく増える予感、生成画質もアップ

DLSS 3.0は2.0から“まともに使える”機能に
- TAA対応ゲームであれば使えるように。ただしGame Readyドライバーの対応は必要
- ゲーム開発者はDLSS 3.0対応のため、タイトル毎にプログラミングを行う必要はあるが、2.0以前と比べて実装の手間は削減されている
- 画質はゲームによって差があるが、DLSS 2.0との比較では全体的に向上している
- いくつかの証拠が、NVIDIAがDLSS 3.0を標準で有効にするつもりであることを示している

DLSSについては以前言われていたようにTAA対応タイトルなら実装が可能になるとのこと。ただしGame Readyドライバーの対応が必要で、これはドライバー側で対応タイトルとして認識されないとDLSSが使えないというニュアンスかな。

残念ながらTAA対応なら何でもオンにできるわけではなく、デベロッパー側で対応のためのプログラミングが必要。ただし2.0以前のような煩雑な作業は不要になったそうなので、対応タイトルの増加に期待したい。

生成される画質も2.0から向上。ゲームよって差はあるものの2.0よりも劣ることはないとのこと。

NVIDIAが標準で有効化するつもりらしいというのはちょっと謎。ゲーム内で設定を上書きできるようにすべきという一言があるので、3.0ではNVIDIAコントロールパネルからオンオフする仕様なのかも（2.0以前はゲーム内に設定がある）。

Tensor Memory CompressionはVRAM使用率を2～4割削減

NVCacheでは、複数タスクを並列処理するため、VRAMだけでなくSSDやDRAMの帯域幅も動的に制御される
Tensor Memory CompressionはVRAM使用率を20～40%削減できる

以前報告されたメモリ圧縮関連については、NVCacheはVRAMだけでなくSSDやDRAMの帯域幅も動的に制御する仕組みとのこと。

Tensor Memory CompressionではVRAM使用率を20～40%削減できるとあるので、結構強力なものらしい。

発表は9月、発売は11月中旬以降

ゲーマー向けの発表は9月予定から変わらず
- プレス向けドライバーは「Cyberpunk 2077」の発売前に用意される見込み

発表は9月予定から変わらず、レビュー機材を受け取ったプレス向けに配布されるベータドライバーは、「Cyberpunk 2077」が発売される11月19日以前に配布される予定とのこと。

これは、レビュー記事のNDA解禁が製品発表後の発売直前もしくは直後のため、RTX 3000シリーズの発売が11月19日以降であることを指している。

9月発表で発売が2ヶ月後というのは、まぁそうでしょうねという感じ。

GeForce Experienceがログイン不要に

「NVIDIAコントロールパネル」が刷新され、「GeForce Experience」と「GeForce Now」もコントロールパネルに統合へ
- ログイン不要で使えるように（GeForce ExperienceはGeForceアカウントのログインが必須だった）
- RTX Voiceがアップデート予定
- NVEncは第7世代に、H.264またはH.265の8K/60fps動画のエンコードに対応

NVIDIAコントロールパネル周りにも手が入るらしく、GeForce ExperienceとGeForce Nowが統合され、ログインも不要に。これはAmpere関係なく朗報。

NVEncは第7世代になり、H.264またはH.265で8K/60fps動画エンコードが可能になるとのこと。高解像度の対応よりもTuringでBフレームに対応したような画質向上があると嬉しいなぁ……

NVIDIA GEFORCE RTX 2080 Ti Founders Edition

NVIDIA

NVIDIA GeForce RTX 2080 Tiグラフィックス処理ユニット(GPU)搭載、1635MHzのブーストクロック速度、最大デジタル解像度: 7680x4320、Turing GPUアーキテクチャとRTXプラットフォームから電源供給。これにより前世代のグラフィックカードのパフォーマンスを最大6倍にし、ゲームにリアルタイムのレイトレースとAIの力をもたらします。

RTX 3090の外観写真がリーク、3スロット厚で長さもある超巨大カード―RTX 3000シリーズの価格は400～1,400ドルか

Twitterにて、@GarnetSunset氏がRTX 3090 Founders Editionらしきカードのスニーク写真を掲載していたので紹介。写真を見るとわかる通り、カード長267 mmのRT...