開発コードネーム“Drake”こと、次世代Nintendo Switch(以降Nintendo Switch 2)の搭載チップは「NVIDIA T239」らしいという話。
2021年にはkopite7kimi氏からSwitch 2には「T234」ベースのSoCが搭載されるという投稿がありましたが、それから2年が経過しそれを裏付ける情報が多数発見され、LinuxディストリビューションやハッキングでNVIDIAから流出したデータから、T234のカスタムチップとして「T239」の存在が確認された。
現状T239がSwitch 2搭載チップであるという決定的な情報はありませんが、NVIDIAがT234ベースのカスタムチップを任天堂以外の顧客のためにわざわざ準備している可能性は限りなくゼロに近いため、「T239=Drake」であることはほぼ確実。
Tegra Orin世代の車載向けSoC「T234」ベースのカスタムチップ「T239」
T239は、Jetson Orin用のSoC「T234」をベースとしたカスタムチップ。
T234はJetson AGX Orinなどに搭載されているSoCで、CPUコアに「Cortex-A78AE」、GPUにAmpereアーキテクチャの「GA10B」を搭載する。
T234の製造プロセスは、Ampere世代GeForceと同様Samsung 8Nプロセス(Samsung 8LPUカスタム)で、T239も同じくSamsung 8Nプロセスでの製造とみられる。
動作クロックなどは異なるものの、初代SwitchではShield TV向けに生産していた「T210」をほぼそのまま流用していたのに対し、T239は何故カスタム品なのかというと、T234がそのままではSwitch 2に載せられないため。
理由の1つがSoCダイの大きさで、T234はダイサイズが455 mm2もあり、大きすぎてSwitch 2のようなポータブル機のPCBに収まらない。
CPUはCortex-A78Cの8コア構成
まずCPUについて、T234搭載の「Cortex-A78AE」は車載用CPUとして設計されたIPであり、安全規格クリアのためコア動作を別コアで検証する機能などを備えた特殊な仕様で、携帯ゲーム機には適していない。
NVIDIAのLinuxディストリ情報から、T239搭載のCPUは1クラスタの8コア構成であることが判明しているため、CPUにはCortex-A78Cを採用している可能性が高い。
Cortex-A57(高性能)×4コア+A53(省電力)×4コアのbig.LITTLE設計だったTegra X1と比べ、高性能×8コア構成のCortex-A78Cでは、マルチコア性能で大きくアドバンテージがある。
そもそもSwitchではコア構成上big.LITTLEに対応できるというだけで、省電力コアのCortex-A53は使われておらず、事実上4コアで動作している。さらに4コアCortex-A57のうち1コアはシステムUIが専有しており、ゲームを動かしているのは3コアしかない。
一方Cortex-A78Cでは、仮にシステム用に2コアを予約しても6コアでゲームを動かせるため、少なくとも2倍のコア数を確保できる。
メモリバスは64-bitから128-bitへ。帯域幅は大きく拡張
メモリに関しては、現行Switchと同じくシステムメモリとVRAMを共用する設計は変わらず、メモリはT239もT234と同様LPDDR5とみられる。
T234のメモリバスは256-bitですが、T239では流出データからメモリバスが128-bitであることが明らかとなっており、LPDDR5と組み合わせた帯域幅は最大102.4 GB/sとなる。
現行Switchのボトルネックの一因がメモリ帯域の狭さで、64-bitバスで帯域幅が25.6 GB/sとかなり狭い。
帯域幅を絞ってT239の電力効率を上げることを任天堂が選択する可能性もありますが、128-bitで68.29 GB/sの「Jetson Orin Nano 8 GB」のような構成になったとしても、現行Switchの2倍以上にはなるハズ。
GPUはAmpere世代のカスタム品
T239のGPUは、T234と同じくAmpereアーキテクチャのGPUで、Jetson向けに作られた構成には存在しない「1,536 CUDAコア/コアクロック1,125 MHz」であることが判明している。
この1,125MHzというクロックは恐らくドック接続時の動作で、携帯モードでは消費電力削減のため数百MHz下がる可能性が高い。現行Switchに倣うなら1/2まで落ちる。
1,125MHzというクロックとCUDAコア数から、単精度浮動小数点数(FP32)の理論演算性能は3.071 TFLOPSとなる。
最近のAAAタイトルが4Kネイティブで動かせるほどの性能ではないものの、初代Switch(393.2 GFLOPS)比で約7.8倍と大きく向上している。
CUDAコア数から逆算すると、Streaming Multiprocessor(SM)数は12。
T239のGPUがT234と同じ「GA10B」ベースであると仮定した場合、Tensorコア数は48コアとなる。GA10BはGeForceではなくTesla系列の設計で、(無効化されているだけかもしれませんが)RTコアは非搭載、L2キャッシュも小さくゲーム用途に適していないため、T239がGA10Bベースであるとは考えにくい。
T239がAmpereベースであることは確定しているため、同規模のAmpere GPUであるGeForce系統のGA107(RTX 2050)やGA107S(GeForce MX570)ベースであると考えると、Tensorコア数は48コア、RTコア数が12コアとなる可能性が高い。
T239で面白いのは、Ada Lovelaceアーキテクチャで追加された一部の機能がバックポート(移植)されているところ。具体的には第8世代NvEncエンジンによるハードウェアAV1エンコード対応、省電力機能の改善などが該当する。
現行SwitchでもクリップのSNS投稿機能は実装されているので、PS/XboxのようにSwitch 2単体でYouTube/Twitchなどへのストリーミング機能が実装される可能性はある。
またT239では、フレーム生成を行いフレームレートを疑似的に倍増できる「DLSS3」の実行に必要な「Optical Flowアクセラレーター(OFA)」の搭載も明らかとなっている。ただしOFA自体はRTX 3000シリーズを含むAmpere世代から実装されており、T239が特別なわけではなく「OFA搭載=Switch 2がDLSS3に対応する」ということでもない。
実際、GeForceではAda Lovelace(RTX 4000)世代からのみDLSS3が有効化され、Ampere世代では非対応。理由としてNVIDIAは、「Ampere以前のアーキテクチャではフレーム生成によるフレームレート向上の効果が限定的であるため」としており、T239でもDLSS3が有効化されるかは微妙。
とはいえ多少なりともフレームレートを引き上げられるなら、携帯ゲーム機へのDLSS3の効果は大きいため、実装に期待したいところ。
Switch 2はストレージが高速化?映像出力はHDMI 2.1対応か
T239には、T234には存在しない独自の要素として「ファイル解凍エンジン(File Decompression Engine: FDE)」が追加されていることが流出データから判明している。
FDEはファイルの解凍を高速化するハードウェアアクセラレーターで、ゲームのアセットデータをメモリ上に展開する作業を高速化できるというもの。PS5にも同種のブロックが組み込まれており、高速なNVMe SSDと組み合わせてロード時間を大幅に短縮し、ロード画面を省略できるというのがPS5のウリの1つでもある。
そのためSwitch 2でも、初代Switchのように低速なeMMCストレージではなく、PS5のようなNVMe SSDといった高速ストレージが搭載される可能性はそこそこ高い。
また流出情報によれば、対応するDisplayPortの帯域幅はHDMI 2.1に必要な帯域以上ある模様。
ドックは現行品でもHDMI 2.0b対応のため、(ゲームが4Kで動くは別として)4K出力に対応する可能性はある。ゲーマー的にはHDMI 2.1の可変リフレッシュレート(VRR)対応に期待したいところ。
仕様表と比較
ということで、T239の仕様をT234やSwitchなどと比較するとこんな感じ。
Nintendo Switch 2 (T239, Drake) | Jetson Orin (T234) | Nintendo Switch (Erista) (カッコ内Mariko) | Steam Deck | PlayStation 4 (カッコ内Slim) | Xbox Series S | ASUS ROG Ally (Z1 Extreme) (カッコ内Z1) | PlayStation 5 | |
---|---|---|---|---|---|---|---|---|
発売年 | 2024 (?) | 2023 | 2017 (2019) | 2022 | 2013 (2016) | 2020 | 2023 | 2020 |
製造プロセス | Samsung 8N | Samsung 8N | TSMC 20 nm (TSMC 16 nm) | TSMC 7 nm | TSMC 28 nm (TSMC 16 nm) | TSMC 7 nm | TSMC 4 nm | TSMC 7 nm |
CPU, コア数 | Cortex-A78C (?), 8コア | Cortex-A78AE, 6 – 8コア | Cortex-A57, 4コア | Zen2, 4コア/8スレッド | Jaguar, 8コア | Zen2, 8コア | Zen3, 8コア/16スレッド (6コア/12スレッド) | Zen2, 8コア |
CPUクロック | (?) | 1.5 – 2.2 GHz | 1.02GHz | 2.4 – 3.5 GHz | 1.6 GHz | 3.4 – 3.6 GHz | 3.3 – 5.1 GHz (3.2 – 4.9 GHz) | 最大3.5 GHz |
メモリ(VRAM共有) | LPDDR5 (?) 8 GB以上 (?) | LPDDR5 4 – 64 GB | DDR4 4 GB | LPDDR5 16 GB | GDDR5 8 GB | GDDR6 10 GB | LPDDR5 16 GB | GDDR6 16 GB |
メモリバス, 帯域幅 | 128-bit, 102.4 GB/s (?) | 64 – 256-bit, 34 – 204.8 GB/s | 64-bit, 25.6 GB/s | 128-bit, 88 GB/s | 256-bit, 176GB/s | 32-bit 2GB +128-bit 8GB, 224 GB/s | 64-bit, 51.2 GB/s | 256-bit, 448GB/s |
GPUアーキテクチャ | Ampere | Ampere | Maxwell 2.0 | RDNA 2.0 | GCN 2.0 | RDNA 2.0 | RDNA 3.0 | RDNA 2.0 |
GPUクロック | 1,125 MHz | 625 MHz – 1.3 GHz | 384 MHz(携帯モード), 768 MHz(ドックモード) | 1,000 – 1,600 MHz | 800 MHz | 1,565 MHz | 1,500 – 2,700 MHz | 2,233 MHz |
シェーダーコア数 (CUDAコア) | 1,536 | 512 – 2,048 | 256 | 512 | 1,152 | 1,280 | 768 (256) | 2,304 |
FP32演算性能 (理論値) | 3.07 TFLOP | 0.64 – 5.32 TFLOPS | 0.2 – 0.39 TFLOPS | 最大1.64 TFLOPS | 1.84 TFLOPS | 4 TFLOPS | 8.29 TFLOPS (2.56 TFLOPS) | 10.29 TFLOPS |
Tensorコア | 48 (?) | 16 – 64 | n/a | n/a | n/a | n/a | n/a | n/a |
RTコア | 12 (?) | n/a | n/a | n/a | n/a | n/a | n/a | n/a |
ダイサイズ | (?) | 455 mm2 (AGX Orin) | 118 mm2 (100 mm2) | 163 mm2 | 348 mm2 (209 mm2) | 197 mm2 | 178 mm2 | 308 mm2 |
ストレージ | 64 GB NVMe OR UFS (?) | 64 GB eMMC – NVMe | 32 – 64 GB eMMC | 64 GB eMMC – 512 GB NVMe | 500GB HDD | 512 GB – 1 TB NVMe | 512 GB NVMe | 825 GB NVMe |
雑感
Switch 2では、今や周回遅れのチップ構成であるSwitchからは大きく世代が進んだものの、2024年以降の発売であることを考えると製造プロセスやアーキテクチャ的に時代遅れな構成であるのも否めず。何にせよPS5やXbox Series S|Xと同じ第9世代ゲーム機として扱えるスペックにはなりそう。
実際にSwitch 2の性能がどの程度になるのかは不明ながら、第9世代機としてPS5と並ぶ性能とはとても言えないまでも、Steam DeckとXbox Series Sの間でSeries S寄りの性能となっているのは、携帯ゲーミング機として考えると中々悪くはない。これで初値3万円台に抑えてくるようなら、コスパ良しといえるのでは?
想定される実ゲームの動作については、Digital FoundryがRTX 2050 Mobileでテストしているので、そちらも時間ができたらまとめたい。
コメント