「GeForce RTX 50シリーズ」リーク/推測仕様まとめ【随時更新】

GPU
GPUウワサ
この記事は約13分で読めます。
記事内に広告が含まれる場合があります。

正式発表まで10日ほどに迫っていますが、Web上で出回っている「GeForce RTX 50」シリーズに関する話をまとめてみました。

発表されたらこのまま更新するか、別記事で正式仕様をまとめる予定です。どこまで当たっているでしょうか?

スポンサーリンク

Blackwellの強化ポイントはキャッシュ / VRAMか

RTX 50シリーズ全般について、一部リーカーからは前世代比で+30~40%の性能向上を実現しており、RTX 5090に関してはRTX 4090から+50~60%と大幅に性能が向上するという話が出ています。

性能がラスターなのかRT性能なのか、実アプリでの話なのかは定かでないので期待はしすぎない方が吉。

実際にそこまでの性能アップがあるかについては一旦置いておくとして、アーキテクチャ的にBrackwellでの性能向上のキモとなっている可能性が高いのが、Streaming Multiprocessor (SM)のテコ入れ。

AmpareとAda Lovelaceアーキテクチャを比べると、RTコアのスループットが2倍になっているほか、L2キャッシュが増強されたのが主な違いで、RTコアを除けばSM内の設計は変わっていません。

一方Brackwellでは、SM内に配置されているL1キャッシュが強化されるという話がリーカーから出ており、SMあたりの演算スループットが向上が見込まれています。

特にRTX 5090に関しては、後述するVRAM周りの大幅な改修も見込まれているため、足回りの強化がウリになるかも。

また最上位コアとなる「GB202」では、Graphics Processing Cluster (GPC)とTexture Processing Cluster (TPC)の構成について、リーカーからGPCが12、GPCあたり8TPCという情報が出ています。

その他構成の変更については情報がないため、TPCあたり2 SM、SMあたり128 CUDAコアという構成はAD102と同じであると仮定した場合、GB202は12GPC×8TPC×2SM×128コアで、合計192SM / 24,576CUDAコアとなります。

AD102は、12GPC×6TPC×2SM×128コアの144SM / 18,432CUDA構成で、GB202ではGPCあたりのTPCが2つ増えているのがポイント。

製造プロセスは「TSMC 4NP」が有力

続いて製造プロセスについて。

BlackwellアーキテクチャのGPUとしては、データセンター向けのAI用チップである「GB200 / B200」が、GeForce RTX 50シリーズに先んじて既にリリースされています。

Blackwellの名を冠しているものの、RTコアが無いとかそもそも詳細仕様が公開されていないとか色々異なるので、チップそのものはRTX 50シリーズの仕様の参考にはならないので省略しますが、製造プロセスについては「TSMC 4NP」であることが明言されています。

GB200 / B200に関しては、量産開始前に「歩留まりがヤバい」という報道もありましたが、フォトマスクの修正で歩留まりが改善し量産段階に入ったという話なので、そのままRTX 50シリーズに関してもTSMC 4NP製造となる可能性は高め。

TSMC 4NP自体は、Ada Lovelaceアーキテクチャ世代の製造に使われた「TSMC 4N」の改良版にあたるプロセス。TSMC 4Nは、TSMCの5 nm世代ノードのNVIDIA向けカスタムプロセスでした。

ではTSMC 4NPは何ベースなのか、というのは情報が開示されておらず謎。とはいえTSMC 4Nの改良品なので、5 nmベースである可能性が高いというのが現状の予想。

しかし、TSMCは4 nm世代ノードのHPC向けプロセスとして「N4X」プロセスを発表しており、そちらのカスタムであるというのもあり得ない話でもなく、どちらが正しいのか気になるところです。

N4Xは、N4 / N4Pよりも高電圧で動作クロックを引っ張るためのプロセスなので、4NPがN4Xカスタムである展開の方が、OCマージン的な意味で夢が広がりそう。

GeForce RTX 5090 / 5090 D

CUDAコア数2万以上のモンスターGPUになる?

RTX 5090のCUDAコアについては、21,760コア(RTX 4090比+約32.8%)というのが幾つかのリーカーから出ており、有力な数字です。

GPUコアはGB202-300となる見込みで、前述のフルスペックGB202から22SMが無効化。AD102-300 (RTX 4090)では1GPC (6TPC)+1TPCの14SM / 1,792CUDAが無効化されていましたが、GB202-300 (RTX 5090)では1GPC (8TPC)+3TPCが無効化されている計算です。

「FP32を実行できる」というNVIDIAの定義に基づいた数え方ではありますが、CUDAコア2万超えとなれば、フルスペックAD102搭載で約1.8万CUDAコア搭載の「RTX 6000 Ada」や「L40 (Tesla Ada)」をも上回るモンスターチップということになります。

RTX 4090の時点でも大概でしたが、いよいよ「これがGeForce扱いでいいのか?」というレベル。

Turingアーキテクチャの「TITAN RTX」を最後に消えたTITANが復活して、「TITAN B」みたいな名前で発表されても不思議ではない。

VRAM容量は32GBに、帯域幅も大幅拡張

VRAMについては、RTX 4090の24GB GDDR6Xから、GDDR7に更新。一部メーカーからのフライング情報から容量も32GBとなることが判明しており、CUDAコアの増量分に近い+約33.3%の容量増となる模様。

メモリバスは512-bitで、RTX 4090で384-bitからさらに拡張。クロックについても実効値28Gbpsというリーク情報があり、メモリバスだけで約+33%、メモリ帯域は約1 TB/sから約1.8 TB/sまで増え+80%という大幅な拡張が見込まれています。

スポンサーリンク

RTX 4090から+50%以上の性能アップ?

CUDAコアは33%増となりますが、数人のリーカーは、RTX 4090を+50~60%上回る性能だと主張しているようです。

性能というのがラスターのグラフィックス処理なのかRTグラフィックなのか、TensorコアによるAI処理の話なのかは不明で、「“何かしらの処理”で50%以上の性能アップが期待できるかも」程度に考えておくほうが良いでしょう。

消費電力については、補助電源コネクタが12V-2×6 (12VHPWRマイナーチェンジ)×1から変わっていないものの、TGPは12V-2×6コネクタの規格上限である600Wまで増加する模様。RTX 4090の450Wから+約33.3%の増加となります。

ブーストクロックについては、製造プロセスが変わってシュリンクによる電力効率アップがあるとしても、CUDAコアとメモリが+33%増加していることを考慮すると、600W以内でRTX 4090を超えるクロックへ引き上げるのは難しいでしょう。

ということで、「RTX 4090と同じブーストクロック (2,520 MHz)」という仮定のもと、理論FP32演算性能を計算してみると、109.7 TFLOPSとなりました。

RTX 4090でも3 GHz超までオーバークロックすることで100 TFLOPSを達成できたようですが、定格でほぼ110 TFLOPSを実現しているというのは中々夢のある話ではないでしょうか。

一方で、定格で600Wとなると12V-2×6ケーブル1本では殆どOCの余地がないため、各メーカーのOCモデルはデュアル12V-2×6というのが当たり前になりそう。

GALAXは「GeForce RTX 4090 HOF」の時点でデュアル12V-2×6というイカれたカードを製品化していましたが、RTX 5090 HOFはトリプル12V-2×6になったりするんだろうか……

価格の大幅な上昇もやむ無し

価格に関しては、1,999ドルという数字がリーカーからチラホラ出ていますが、今のところ信頼度の高い情報はなし。

RTX 5090に関しては、AMDが「Radeonのハイエンドは出さない」と表明していることから、競合製品がなく値段を抑える理由もないので、エンスージアスト向けの値段になると思います。

個人的には、AI需要でバックオーダーが長蛇の列になっているB100の存在、容量が増えているだけでなくGDDR7となったことでVRAM自体のコストも上がっていること、ゲーム用途だけで使うには過剰とも言える盛りすぎのスペックを考えると、最低でもRTX 4090の1,599ドル+31%の2,099ドル、インフレ等を加味すると2,499ドル程度になるのではないかと考えています。

仮にMSRP 2,099~2,499ドルとした場合、消費税10%×為替+輸送コストや代理店利益で、国内価格は40~50万円前後といったところではないでしょうか。

50万円になるとしても、エンスージアストとAI用途のビジネス・研究者らの争奪戦になるでしょう。

RTX 5090に関してはGeForceとは名ばかりでもはやゲーマー向けのカードではないため、「値段が高いと思うならターゲット客じゃないから下のグレードを買え」という扱いになると思います。

また今回は中国向けに性能を制限した「GeForce RTX 5090 D」も同時発売となる見込みで、発売と同時期に今まで以上に中国への法人ルートでのRTX xx90出荷が厳しくなるのでは?という話があるため、日本でも中国への転売目的で転売ヤーによる買い漁りが起きるのではないか?と個人的には危惧しています。

RTX 4090が米国の出荷制限対象となって以降、中国向けの制限モデルとしてRTX 4090 Dが発売されましたが、それ以降もダミー企業などを通じて無印RTX 4090が中国内に流れていたようで、来年からそれらへの取り締まりが強化されるという話がある。

RTX 5090の(予測)仕様一覧

以下はリークや推測に基づいた推定仕様の一覧。

?マークは未確定情報。(?)はメーカーからのリークなど確度の高いもの、(??)は実績のあるリーカーなど比較的信憑性がある情報源、(???)は信頼度の低いリーク情報など。(????)は根拠のないウワサや個人的な推測によるもので、話半分にご理解ください。

モデルGeForce RTX 5090GeForce RTX 5090 DGeForce RTX 4090GeForce RTX 4090 D
発売日2025/01 (?)2025/01 (?)2022/10/122023/12/28
製造プロセス4 nm (TSMC 4NP) (??)4 nm (TSMC 4NP) (??)5 nm (TSMC 4N)5 nm (TSMC 4N)
アーキテクチャBlackwellBlackwellAda LovelaceAda Lovelace
GPUGB202-300 (??)GB202-xxx (??)AD102-300-A1AD102-250-A1
CUDAコア21,760 (??)21,760 (??)16,38414,592
ブーストクロック~2,520 MHz (????)?2,520 MHz2,280 MHz
理論FP32演算性能~109.7 TFLOPS (????)?82.58 TFLOPS73.54 TFLOPS
VRAM32 GB GDDR7 (?)32 GB GDDR7 (?)24 GB GDDR6X24 GB GDDR6X
メモリバス512-bit (??)512-bit (??)384-bit384-bit
メモリクロック(実効値)28 Gbps (??)?21 Gbps21 Gbps
メモリ帯域1.79 TB/s (??)?1.01 TB/s1.01 TB/s
TGP≦600 W (??)≦600 W (??)450 W425 W
MSRP2,099~2,499ドル (???)2,099~2,499ドル (???)1,599ドル1,599ドル

GeForce RTX 5080

RTX 5080のGPUコアは、リーカーによればGB202ではなくGB203ベースの「GB203-400」となる見込み。

複数のリーカーが報告しているCUDAコア数は10,752で、RTX 5090と比べると半分未満の数。RTX 4080と比べても差は+1,000ほど、RTX 4080 SUPERとの比較では+500ほどしか変わらないため、RTX 4090対RTX 5090の劇的なアップグレードと比べるとかなり見劣りする数字。

RTX 4080と4080 SUPERは同じAD103ですが、RTX 4080の無効化コアを有効にしたのがRTX 4080 SUPERなので、後々(1年後とかの話ですが)RTX 5080 SUPERあるいはRTX 5080 Tiが出てくる可能性は十分ある。

大差ないCUDAコア数にも関わらず、リーカーからは+30~40%の性能アップやRTX 4090に匹敵するという話もチラホラ。

事実であれば3 GHz超のようなとんでもない高クロックで回るか、Ada世代のL1キャッシュやVRAM帯域がボトルネックになっていた説が浮上しますが、真相は果たして……

仕様表では、一先ず有り得そうな数字として2,520 MHzでFP32を計算しています。

一方、VRAMに関してはクロックが大きく引き上げられ、32 Gbpsになるとのこと。帯域で見るとRTX 4080から+約40%、RTX 4080 SUPER比でも+約36%のアップです。

容量は残念ながら16 GBで据え置き。似たような性能というRTX 4090が24 GBであるならば、20 GB以上欲しいという声は大きいでしょう。

価格についての有力なリークはなし。とはいえRTX 4090相当の性能が事実であるとすれば、RTX 4090に近い価格を狙ってくると思われます。RTX 5080に関しても、RTX 5090と同じく競合するRadeonカードは出てこないと見込まれているため、安く出てくる可能性は低いでしょう。

RTX 4090のVRAMはゲーム用途では過剰なため、NVIDIAのセールストークとしては、「(VRAMが少ない分)RTX 4090の性能を2~300ドル安い価格で得られる、ゲーマーにとって最高のパフォーマンスを提供するGPU」とかアピールしそうだなーと勝手に予想。

スポンサーリンク

RTX 5080の(予測)仕様一覧

?マークは未確定情報。(?)はメーカーからのリークなど確度の高いもの、(??)は実績のあるリーカーなど比較的信憑性がある情報源、(???)は信頼度の低いリーク情報など。(????)は根拠のないウワサや個人的な推測によるもので、話半分にご理解ください。

モデルGeForce RTX 5080GeForce RTX 4080 SUPERGeForce RTX 4080
発売日2025/01 (?)2024/01/312022/11/16
製造プロセス4 nm (TSMC 4NP) (??)5 nm (TSMC 4N)5 nm (TSMC 4N)
アーキテクチャBlackwellAda LovelaceAda Lovelace
GPUGB203-400 (??)AD103-400-A1AD103-300-A1
CUDAコア10,752 (??)10,2409,728
ブーストクロック~2,520 MHz (????)2,550 MHz2,505 MHz
理論FP32演算性能~54.19 TFLOPS (????)52.22 TFLOPS48.74 TFLOPS
VRAM16 GB GDDR7 (?)16 GB GDDR6X16 GB GDDR6X
メモリバス256-bit (??)256-bit256-bit
メモリクロック(実効値)32 Gbps (???)23 Gbps22.4 Gbps
メモリ帯域1 TB/s (???)736.3 GB/s716.8 GB/s
TGP≦400 W (??)320 W320-bit
MSRP1,299~1,399ドル (????)999ドル1,199ドル
ASUS ProArt GeForce RTX 4080 SUPER OC Edition 16GB GDDR6X / PROART-RTX4080S-O16G 国内正規代理店品
ASUS
高い交換性:ProArtは、強力な冷却技術を備えつつ、コンパクトなPCにも対応できるように2.5スロットのフレームに集約されています。
スポンサーリンク

コメント

タイトルとURLをコピーしました