Nintendo Switch 2はPS4/Steam Deckよりも高性能―NVIDIA「T239」SoCから見るSwitch 2の仕様

Game
NVIDIA T234
Gameウワサ
この記事は約13分で読めます。
記事内に広告が含まれる場合があります。

開発コードネーム“Drake”こと、次世代Nintendo Switch(以降Nintendo Switch 2)の搭載チップは「NVIDIA T239」らしいという話。

2021年にはkopite7kimi氏からSwitch 2には「T234」ベースのSoCが搭載されるという投稿がありましたが、それから2年が経過しそれを裏付ける情報が多数発見され、LinuxディストリビューションやハッキングでNVIDIAから流出したデータから、T234のカスタムチップとして「T239」の存在が確認された。

現状T239がSwitch 2搭載チップであるという決定的な情報はありませんが、NVIDIAがT234ベースのカスタムチップを任天堂以外の顧客のためにわざわざ準備している可能性は限りなくゼロに近いため、「T239=Drake」であることはほぼ確実。

スポンサーリンク

Tegra Orin世代の車載向けSoC「T234」ベースのカスタムチップ「T239」

via Digital Foundry

T239は、Jetson Orin用のSoC「T234」をベースとしたカスタムチップ。

T234はJetson AGX Orinなどに搭載されているSoCで、CPUコアに「Cortex-A78AE」、GPUにAmpereアーキテクチャの「GA10B」を搭載する。

T234の製造プロセスは、Ampere世代GeForceと同様Samsung 8Nプロセス(Samsung 8LPUカスタム)で、T239も同じくSamsung 8Nプロセスでの製造とみられる。

製造ラインの争奪戦で競合他社の多いTSMCの7 nm以下プロセスと異なり、RTX 3000シリーズも生産終了している今、Samsung 8 nm製造ラインは空いており、あれだけ売れたSwitchの後継機として初回から生産数を確保するためにも、他のプロセスで製造される可能性は低い。

動作クロックなどは異なるものの、初代SwitchではShield TV向けに生産していた「T210」をほぼそのまま流用していたのに対し、T239は何故カスタム品なのかというと、T234がそのままではSwitch 2に載せられないため。

理由の1つがSoCダイの大きさで、T234はダイサイズが455 mm2もあり、大きすぎてSwitch 2のようなポータブル機のPCBに収まらない。

455 mm2というサイズは据え置きハードであるXbox Series X搭載のSoC(コードネーム“Scarlett”)の360 mm2よりもデカい。

なお初代Swtich搭載のSoC「ODNX02-A2(コードネーム“Erista”)」は118 mm2で、Eristaの16 nmシュリンク品である現行Switchシリーズ搭載SoC「ODNX10-A1(コードネーム“Mariko”)」は100 mm2

T234は車載/組み込み機器向けにしか生産されておらず、Switchに使い回せるコンシューマーデバイス向けのバリアント(Shield TV)があったTegra X1と異なり、深層学習アクセラレーター(Deep Learning Accelerator: DLA)などCPU/GPU以外に色々と盛り込まれており、色々削ればダイサイズを縮小できるものの、どこまで小さくできるかは未知数。

最低でも200 mm2程度に削らないと収まらないのでは……

CPUはCortex-A78Cの8コア構成

まずCPUについて、T234搭載の「Cortex-A78AE」は車載用CPUとして設計されたIPであり、安全規格クリアのためコア動作を別コアで検証する機能などを備えた特殊な仕様で、携帯ゲーム機には適していない。

NVIDIAのLinuxディストリ情報から、T239搭載のCPUは1クラスタの8コア構成であることが判明しているため、CPUにはCortex-A78Cを採用している可能性が高い。

Cortex-A57(高性能)×4コア+A53(省電力)×4コアのbig.LITTLE設計だったTegra X1と比べ、高性能×8コア構成のCortex-A78Cでは、マルチコア性能で大きくアドバンテージがある。

そもそもSwitchではコア構成上big.LITTLEに対応できるというだけで、省電力コアのCortex-A53は使われておらず、事実上4コアで動作している。さらに4コアCortex-A57のうち1コアはシステムUIが専有しており、ゲームを動かしているのは3コアしかない。

一方Cortex-A78Cでは、仮にシステム用に2コアを予約しても6コアでゲームを動かせるため、少なくとも2倍のコア数を確保できる。

T239のCPUクロックは不明ながら、シングルコアの性能も大幅に向上する見込み。

Cortex-A57からA78は、スマホSoCでいうとNexus 6Pなどに搭載のSnapdragon 808/810と、Xiaomi Mi 11 Lite搭載のSnapdragon 780G/782Gに相当する。

Geekbench 5のシングルコアスコアは、Cortex-A57(@2 GHz)が231、Cortex-A78(@ 2.4GHz)が823で、780GがSamsung 5LPEプロセス製造であることや400 MHzのクロック差があることを鑑みても、3倍くらいのシングルコア性能差はありそう。

メモリバスは64-bitから128-bitへ。帯域幅は大きく拡張

メモリに関しては、現行Switchと同じくシステムメモリとVRAMを共用する設計は変わらず、メモリはT239もT234と同様LPDDR5とみられる。

T234のメモリバスは256-bitですが、T239では流出データからメモリバスが128-bitであることが明らかとなっており、LPDDR5と組み合わせた帯域幅は最大102.4 GB/sとなる。

現行Switchのボトルネックの一因がメモリ帯域の狭さで、64-bitバスで帯域幅が25.6 GB/sとかなり狭い。

帯域幅を絞ってT239の電力効率を上げることを任天堂が選択する可能性もありますが、128-bitで68.29 GB/sの「Jetson Orin Nano 8 GB」のような構成になったとしても、現行Switchの2倍以上にはなるハズ。

スポンサーリンク

GPUはAmpere世代のカスタム品

T239のGPUは、T234と同じくAmpereアーキテクチャのGPUで、Jetson向けに作られた構成には存在しない「1,536 CUDAコア/コアクロック1,125 MHz」であることが判明している。

この1,125MHzというクロックは恐らくドック接続時の動作で、携帯モードでは消費電力削減のため数百MHz下がる可能性が高い。現行Switchに倣うなら1/2まで落ちる。

1,125MHzというクロックとCUDAコア数から、単精度浮動小数点数(FP32)の理論演算性能は3.071 TFLOPSとなる。

最近のAAAタイトルが4Kネイティブで動かせるほどの性能ではないものの、初代Switch(393.2 GFLOPS)比で約7.8倍と大きく向上している。

他製品と比較してみると1.4 TFLOPSのXbox One S、1.64 TFLOPSのSteam Deckのおよそ2倍、1.843 TFLOPSのPS4より高性能で、4 TFLOPSのXbox Series Sや4.2 TFLOPSのPS4 Proに及ばず、という具合。

ゲーム用途におけるFP32性能比は非常に大雑把な性能の目安にしかならないので、あくまで参考値ですが、3 TFLOPSはPS5 (10.29 TFLOPS)の1/3以下であり、4Kネイティブや1080p/120fps動作を期待するには厳しい。

CUDAコア数から逆算すると、Streaming Multiprocessor(SM)数は12。

T239のGPUがT234と同じ「GA10B」ベースであると仮定した場合、Tensorコア数は48コアとなる。GA10BはGeForceではなくTesla系列の設計で、(無効化されているだけかもしれませんが)RTコアは非搭載、L2キャッシュも小さくゲーム用途に適していないため、T239がGA10Bベースであるとは考えにくい。

T239がAmpereベースであることは確定しているため、同規模のAmpere GPUであるGeForce系統のGA107(RTX 2050)やGA107S(GeForce MX570)ベースであると考えると、Tensorコア数は48コア、RTコア数が12コアとなる可能性が高い。

この場合、RTコアを搭載しているためハードウェアによるレイトレーシング処理に対応できる。ただし、コア数が少ないためデスクトップ向けのRTX 3000シリーズに匹敵するようなレイトレーシング性能は期待できない。

720pのような低解像度であれば、PS5やXsXレベルのレイトレース描画が期待できる……かも?

T239で面白いのは、Ada Lovelaceアーキテクチャで追加された一部の機能がバックポート(移植)されているところ。具体的には第8世代NvEncエンジンによるハードウェアAV1エンコード対応、省電力機能の改善などが該当する。

現行SwitchでもクリップのSNS投稿機能は実装されているので、PS/XboxのようにSwitch 2単体でYouTube/Twitchなどへのストリーミング機能が実装される可能性はある。

またT239では、フレーム生成を行いフレームレートを疑似的に倍増できる「DLSS3」の実行に必要な「Optical Flowアクセラレーター(OFA)」の搭載も明らかとなっている。ただしOFA自体はRTX 3000シリーズを含むAmpere世代から実装されており、T239が特別なわけではなく「OFA搭載=Switch 2がDLSS3に対応する」ということでもない。

実際、GeForceではAda Lovelace(RTX 4000)世代からのみDLSS3が有効化され、Ampere世代では非対応。理由としてNVIDIAは、「Ampere以前のアーキテクチャではフレーム生成によるフレームレート向上の効果が限定的であるため」としており、T239でもDLSS3が有効化されるかは微妙。

とはいえ多少なりともフレームレートを引き上げられるなら、携帯ゲーム機へのDLSS3の効果は大きいため、実装に期待したいところ。

Switch 2はストレージが高速化?映像出力はHDMI 2.1対応か

via Digital Foundry

T239には、T234には存在しない独自の要素として「ファイル解凍エンジン(File Decompression Engine: FDE)」が追加されていることが流出データから判明している。

FDEはファイルの解凍を高速化するハードウェアアクセラレーターで、ゲームのアセットデータをメモリ上に展開する作業を高速化できるというもの。PS5にも同種のブロックが組み込まれており、高速なNVMe SSDと組み合わせてロード時間を大幅に短縮し、ロード画面を省略できるというのがPS5のウリの1つでもある。

そのためSwitch 2でも、初代Switchのように低速なeMMCストレージではなく、PS5のようなNVMe SSDといった高速ストレージが搭載される可能性はそこそこ高い。

SSDに関してはNVMeはコントローラーの消費電力が大きすぎる(eMMC比)ため、載らないのではという意見も。据え置き機と違って電力要件が厳しいため、タブレットやスマホの例から考えるとUFS採用が現実的なところかも。

また流出情報によれば、対応するDisplayPortの帯域幅はHDMI 2.1に必要な帯域以上ある模様。

ドックは現行品でもHDMI 2.0b対応のため、(ゲームが4Kで動くは別として)4K出力に対応する可能性はある。ゲーマー的にはHDMI 2.1の可変リフレッシュレート(VRR)対応に期待したいところ。

仕様表と比較

ということで、T239の仕様をT234やSwitchなどと比較するとこんな感じ。

Nintendo Switch 2
(T239, Drake)
Jetson Orin (T234)Nintendo Switch (Erista)
(カッコ内Mariko)
Steam DeckPlayStation 4
(カッコ内Slim)
Xbox Series SASUS ROG Ally
(Z1 Extreme)
(カッコ内Z1)
PlayStation 5
発売年2024 (?)20232017 (2019)20222013 (2016)202020232020
製造プロセスSamsung 8NSamsung 8NTSMC 20 nm
(TSMC 16 nm)
TSMC 7 nmTSMC 28 nm
(TSMC 16 nm)
TSMC 7 nmTSMC 4 nmTSMC 7 nm
CPU, コア数Cortex-A78C (?),
8コア
Cortex-A78AE,
6 – 8コア
Cortex-A57,
4コア
Zen2,
4コア/8スレッド
Jaguar, 8コアZen2, 8コアZen3,
8コア/16スレッド
(6コア/12スレッド)
Zen2, 8コア
CPUクロック(?)1.5 – 2.2 GHz1.02GHz2.4 – 3.5 GHz1.6 GHz3.4 – 3.6 GHz3.3 – 5.1 GHz
(3.2 – 4.9 GHz)
最大3.5 GHz
メモリ(VRAM共有)LPDDR5 (?)
8 GB以上 (?)
LPDDR5
4 – 64 GB
DDR4 4 GBLPDDR5 16 GBGDDR5 8 GBGDDR6 10 GBLPDDR5 16 GBGDDR6 16 GB
メモリバス, 帯域幅128-bit,
102.4 GB/s (?)
64 – 256-bit,
34 – 204.8 GB/s
64-bit,
25.6 GB/s
128-bit,
88 GB/s
256-bit,
176GB/s
32-bit 2GB
+128-bit 8GB,
224 GB/s
64-bit,
51.2 GB/s
256-bit,
448GB/s
GPUアーキテクチャAmpereAmpereMaxwell 2.0RDNA 2.0GCN 2.0RDNA 2.0RDNA 3.0RDNA 2.0
GPUクロック1,125 MHz625 MHz – 1.3 GHz384 MHz(携帯モード),
768 MHz(ドックモード)
1,000 – 1,600 MHz800 MHz1,565 MHz1,500 –
2,700 MHz
2,233 MHz
シェーダーコア数
(CUDAコア)
1,536512 – 2,0482565121,1521,280768 (256)2,304
FP32演算性能
(理論値)
3.07 TFLOP0.64 – 5.32 TFLOPS0.2 – 0.39 TFLOPS最大1.64 TFLOPS1.84 TFLOPS4 TFLOPS8.29 TFLOPS
(2.56 TFLOPS)
10.29 TFLOPS
Tensorコア48 (?)16 – 64n/an/an/an/an/an/a
RTコア12 (?)n/an/an/an/an/an/an/a
ダイサイズ(?)455 mm2
(AGX Orin)
118 mm2
(100 mm2)
163 mm2348 mm2
(209 mm2)
197 mm2178 mm2308 mm2
ストレージ64 GB NVMe OR UFS (?)64 GB eMMC
– NVMe
32 – 64 GB eMMC64 GB eMMC
– 512 GB NVMe
500GB HDD512 GB – 1 TB
NVMe
512 GB NVMe825 GB NVMe
(?)は推測値

並べてみると、Z1 Extreme搭載ROG Allyの豪華さ(メモリ帯域以外)が目立つ。その分値段も一番高いけど……

スポンサーリンク

雑感

Switch 2では、今や周回遅れのチップ構成であるSwitchからは大きく世代が進んだものの、2024年以降の発売であることを考えると製造プロセスやアーキテクチャ的に時代遅れな構成であるのも否めず。何にせよPS5やXbox Series S|Xと同じ第9世代ゲーム機として扱えるスペックにはなりそう。

実際にSwitch 2の性能がどの程度になるのかは不明ながら、第9世代機としてPS5と並ぶ性能とはとても言えないまでも、Steam DeckとXbox Series Sの間でSeries S寄りの性能となっているのは、携帯ゲーミング機として考えると中々悪くはない。これで初値3万円台に抑えてくるようなら、コスパ良しといえるのでは?

想定される実ゲームの動作については、Digital FoundryがRTX 2050 Mobileでテストしているので、そちらも時間ができたらまとめたい。

Nintendo Switch Joy-Con(L) ネオンブルー/(R) ネオンレッド
任天堂
いつでも、どこでも、誰とでも。「Nintendo Switch」は、さまざまなプレイシーンにあわせてカタチを変えるゲーム機。 いつでも、どこでも、気の向くままに。自由なプレイスタイルでゲームを楽しむことができます。

コメント