正式発表まで10日ほどに迫っていますが、Web上で出回っている「GeForce RTX 50」シリーズに関する話をまとめてみました。
発表されたらこのまま更新するか、別記事で正式仕様をまとめる予定です。どこまで当たっているでしょうか?
Blackwellの強化ポイントはキャッシュ / VRAMか
RTX 50シリーズ全般について、一部リーカーからは前世代比で+30~40%の性能向上を実現しており、RTX 5090に関してはRTX 4090から+50~60%と大幅に性能が向上するという話が出ています。
実際にそこまでの性能アップがあるかについては一旦置いておくとして、アーキテクチャ的にBrackwellでの性能向上のキモとなっている可能性が高いのが、Streaming Multiprocessor (SM)のテコ入れ。
AmpareとAda Lovelaceアーキテクチャを比べると、RTコアのスループットが2倍になっているほか、L2キャッシュが増強されたのが主な違いで、RTコアを除けばSM内の設計は変わっていません。
一方Brackwellでは、SM内に配置されているL1キャッシュが強化されるという話がリーカーから出ており、SMあたりの演算スループットが向上が見込まれています。
また最上位コアとなる「GB202」では、Graphics Processing Cluster (GPC)とTexture Processing Cluster (TPC)の構成について、リーカーからGPCが12、GPCあたり8TPCという情報が出ています。
その他構成の変更については情報がないため、TPCあたり2 SM、SMあたり128 CUDAコアという構成はAD102と同じであると仮定した場合、GB202は12GPC×8TPC×2SM×128コアで、合計192SM / 24,576CUDAコアとなります。
製造プロセスは「TSMC 4NP」が有力
続いて製造プロセスについて。
BlackwellアーキテクチャのGPUとしては、データセンター向けのAI用チップである「GB200 / B200」が、GeForce RTX 50シリーズに先んじて既にリリースされています。
Blackwellの名を冠しているものの、RTコアが無いとかそもそも詳細仕様が公開されていないとか色々異なるので、チップそのものはRTX 50シリーズの仕様の参考にはならないので省略しますが、製造プロセスについては「TSMC 4NP」であることが明言されています。
GB200 / B200に関しては、量産開始前に「歩留まりがヤバい」という報道もありましたが、フォトマスクの修正で歩留まりが改善し量産段階に入ったという話なので、そのままRTX 50シリーズに関してもTSMC 4NP製造となる可能性は高め。
TSMC 4NP自体は、Ada Lovelaceアーキテクチャ世代の製造に使われた「TSMC 4N」の改良版にあたるプロセス。TSMC 4Nは、TSMCの5 nm世代ノードのNVIDIA向けカスタムプロセスでした。
ではTSMC 4NPは何ベースなのか、というのは情報が開示されておらず謎。とはいえTSMC 4Nの改良品なので、5 nmベースである可能性が高いというのが現状の予想。
しかし、TSMCは4 nm世代ノードのHPC向けプロセスとして「N4X」プロセスを発表しており、そちらのカスタムであるというのもあり得ない話でもなく、どちらが正しいのか気になるところです。
GeForce RTX 5090 / 5090 D
CUDAコア数2万以上のモンスターGPUになる?
RTX 5090のCUDAコアについては、21,760コア(RTX 4090比+約32.8%)というのが幾つかのリーカーから出ており、有力な数字です。
GPUコアはGB202-300となる見込みで、前述のフルスペックGB202から22SMが無効化。AD102-300 (RTX 4090)では1GPC (6TPC)+1TPCの14SM / 1,792CUDAが無効化されていましたが、GB202-300 (RTX 5090)では1GPC (8TPC)+3TPCが無効化されている計算です。
「FP32を実行できる」というNVIDIAの定義に基づいた数え方ではありますが、CUDAコア2万超えとなれば、フルスペックAD102搭載で約1.8万CUDAコア搭載の「RTX 6000 Ada」や「L40 (Tesla Ada)」をも上回るモンスターチップということになります。
RTX 4090の時点でも大概でしたが、いよいよ「これがGeForce扱いでいいのか?」というレベル。
VRAM容量は32GBに、帯域幅も大幅拡張
VRAMについては、RTX 4090の24GB GDDR6Xから、GDDR7に更新。一部メーカーからのフライング情報から容量も32GBとなることが判明しており、CUDAコアの増量分に近い+約33.3%の容量増となる模様。
メモリバスは512-bitで、RTX 4090で384-bitからさらに拡張。クロックについても実効値28Gbpsというリーク情報があり、メモリバスだけで約+33%、メモリ帯域は約1 TB/sから約1.8 TB/sまで増え+80%という大幅な拡張が見込まれています。
RTX 4090から+50%以上の性能アップ?
CUDAコアは33%増となりますが、数人のリーカーは、RTX 4090を+50~60%上回る性能だと主張しているようです。
消費電力については、補助電源コネクタが12V-2×6 (12VHPWRマイナーチェンジ)×1から変わっていないものの、TGPは12V-2×6コネクタの規格上限である600Wまで増加する模様。RTX 4090の450Wから+約33.3%の増加となります。
ブーストクロックについては、製造プロセスが変わってシュリンクによる電力効率アップがあるとしても、CUDAコアとメモリが+33%増加していることを考慮すると、600W以内でRTX 4090を超えるクロックへ引き上げるのは難しいでしょう。
ということで、「RTX 4090と同じブーストクロック (2,520 MHz)」という仮定のもと、理論FP32演算性能を計算してみると、109.7 TFLOPSとなりました。
RTX 4090でも3 GHz超までオーバークロックすることで100 TFLOPSを達成できたようですが、定格でほぼ110 TFLOPSを実現しているというのは中々夢のある話ではないでしょうか。
一方で、定格で600Wとなると12V-2×6ケーブル1本では殆どOCの余地がないため、各メーカーのOCモデルはデュアル12V-2×6というのが当たり前になりそう。
価格の大幅な上昇もやむ無し
価格に関しては、1,999ドルという数字がリーカーからチラホラ出ていますが、今のところ信頼度の高い情報はなし。
RTX 5090に関しては、AMDが「Radeonのハイエンドは出さない」と表明していることから、競合製品がなく値段を抑える理由もないので、エンスージアスト向けの値段になると思います。
個人的には、AI需要でバックオーダーが長蛇の列になっているB100の存在、容量が増えているだけでなくGDDR7となったことでVRAM自体のコストも上がっていること、ゲーム用途だけで使うには過剰とも言える盛りすぎのスペックを考えると、最低でもRTX 4090の1,599ドル+31%の2,099ドル、インフレ等を加味すると2,499ドル程度になるのではないかと考えています。
仮にMSRP 2,099~2,499ドルとした場合、消費税10%×為替+輸送コストや代理店利益で、国内価格は40~50万円前後といったところではないでしょうか。
50万円になるとしても、エンスージアストとAI用途のビジネス・研究者らの争奪戦になるでしょう。
また今回は中国向けに性能を制限した「GeForce RTX 5090 D」も同時発売となる見込みで、発売と同時期に今まで以上に中国への法人ルートでのRTX xx90出荷が厳しくなるのでは?という話があるため、日本でも中国への転売目的で転売ヤーによる買い漁りが起きるのではないか?と個人的には危惧しています。
RTX 5090の(予測)仕様一覧
以下はリークや推測に基づいた推定仕様の一覧。
モデル | GeForce RTX 5090 | GeForce RTX 5090 D | GeForce RTX 4090 | GeForce RTX 4090 D |
---|---|---|---|---|
発売日 | 2025/01 (?) | 2025/01 (?) | 2022/10/12 | 2023/12/28 |
製造プロセス | 4 nm (TSMC 4NP) (??) | 4 nm (TSMC 4NP) (??) | 5 nm (TSMC 4N) | 5 nm (TSMC 4N) |
アーキテクチャ | Blackwell | Blackwell | Ada Lovelace | Ada Lovelace |
GPU | GB202-300 (??) | GB202-xxx (??) | AD102-300-A1 | AD102-250-A1 |
CUDAコア | 21,760 (??) | 21,760 (??) | 16,384 | 14,592 |
ブーストクロック | ~2,520 MHz (????) | ? | 2,520 MHz | 2,280 MHz |
理論FP32演算性能 | ~109.7 TFLOPS (????) | ? | 82.58 TFLOPS | 73.54 TFLOPS |
VRAM | 32 GB GDDR7 (?) | 32 GB GDDR7 (?) | 24 GB GDDR6X | 24 GB GDDR6X |
メモリバス | 512-bit (??) | 512-bit (??) | 384-bit | 384-bit |
メモリクロック(実効値) | 28 Gbps (??) | ? | 21 Gbps | 21 Gbps |
メモリ帯域 | 1.79 TB/s (??) | ? | 1.01 TB/s | 1.01 TB/s |
TGP | ≦600 W (??) | ≦600 W (??) | 450 W | 425 W |
MSRP | 2,099~2,499ドル (???) | 2,099~2,499ドル (???) | 1,599ドル | 1,599ドル |
GeForce RTX 5080
RTX 5080のGPUコアは、リーカーによればGB202ではなくGB203ベースの「GB203-400」となる見込み。
複数のリーカーが報告しているCUDAコア数は10,752で、RTX 5090と比べると半分未満の数。RTX 4080と比べても差は+1,000ほど、RTX 4080 SUPERとの比較では+500ほどしか変わらないため、RTX 4090対RTX 5090の劇的なアップグレードと比べるとかなり見劣りする数字。
大差ないCUDAコア数にも関わらず、リーカーからは+30~40%の性能アップやRTX 4090に匹敵するという話もチラホラ。
仕様表では、一先ず有り得そうな数字として2,520 MHzでFP32を計算しています。
一方、VRAMに関してはクロックが大きく引き上げられ、32 Gbpsになるとのこと。帯域で見るとRTX 4080から+約40%、RTX 4080 SUPER比でも+約36%のアップです。
容量は残念ながら16 GBで据え置き。似たような性能というRTX 4090が24 GBであるならば、20 GB以上欲しいという声は大きいでしょう。
価格についての有力なリークはなし。とはいえRTX 4090相当の性能が事実であるとすれば、RTX 4090に近い価格を狙ってくると思われます。RTX 5080に関しても、RTX 5090と同じく競合するRadeonカードは出てこないと見込まれているため、安く出てくる可能性は低いでしょう。
RTX 5080の(予測)仕様一覧
モデル | GeForce RTX 5080 | GeForce RTX 4080 SUPER | GeForce RTX 4080 |
---|---|---|---|
発売日 | 2025/01 (?) | 2024/01/31 | 2022/11/16 |
製造プロセス | 4 nm (TSMC 4NP) (??) | 5 nm (TSMC 4N) | 5 nm (TSMC 4N) |
アーキテクチャ | Blackwell | Ada Lovelace | Ada Lovelace |
GPU | GB203-400 (??) | AD103-400-A1 | AD103-300-A1 |
CUDAコア | 10,752 (??) | 10,240 | 9,728 |
ブーストクロック | ~2,520 MHz (????) | 2,550 MHz | 2,505 MHz |
理論FP32演算性能 | ~54.19 TFLOPS (????) | 52.22 TFLOPS | 48.74 TFLOPS |
VRAM | 16 GB GDDR7 (?) | 16 GB GDDR6X | 16 GB GDDR6X |
メモリバス | 256-bit (??) | 256-bit | 256-bit |
メモリクロック(実効値) | 32 Gbps (???) | 23 Gbps | 22.4 Gbps |
メモリ帯域 | 1 TB/s (???) | 736.3 GB/s | 716.8 GB/s |
TGP | ≦400 W (??) | 320 W | 320-bit |
MSRP | 1,299~1,399ドル (????) | 999ドル | 1,199ドル |
コメント