RTX 30シリーズ(& RTX 20/GTX 10)仕様表まとめ【完全版】

GPU
RTX 30 series (Image credit: NVIDIA)
この記事は約8分で読めます。

先日公開されたRTX30シリーズのホワイトペーパーから、スペックシート部分を抜き出してRTX 20シリーズ/GTX 10シリーズと比較した仕様表を作ってみた。

すべてFounders Editionでの数値なので、クロックやFLOPS絡みは実際の製品によって変動アリ。NVIDIAの製品情報ページに記載がないデータも多いのでまとまってるとちょっと便利?

ホワイトペーパーの内容については別記事参照。

スポンサーリンク
スポンサーリンク
GeForce NOW Powered by SoftBank

GeForce RTX 3090 スペックシート

RTX 3090 (GA102)のブロックダイアグラム。グレーアウトは無効化コア ( Image via NVIDIA)
モデルRTX 3090 FETitan RTXRTX 2080 Ti FEGTX 1080 Ti FE
GPUコードネームGA102TU102TU102GP102
製造プロセスSamsung 8NTSMC 12FFNTSMC 12FFN16 nm
トランジスタ数283億186億186億120億
ダイサイズ628.4 mm2754 mm2754 mm2471 mm2
ブーストクロック1,695 MHz1,770 MHz1,635 MHz1,582 MHz
VRAM24,576 MB GDDR6X24,576 MB GDDR611,264 MB GDDR611,264 MB GDDR5X
メモリインターフェイス384-bit384-bit352-bit352-bit
メモリデータレート19.5 Gbps14 Gbps14 Gbps11 Gbps
メモリ帯域幅936 GB/s672 GB/s616 GB/s484 GB/s
消費電力(TGP / TDP)350 W280 W260 W250 W
GPC7666
TPC41363428
SM82726828
CUDAコア数10,4964,6084,3523,584
Tensorコア数328576544n/a
RTコア数827268n/a
ROPs112968888
ピクセルフィルレート193 GPixel/s169.9 GPixel/s136 GPixel/s(?)139.2 GPixel/s(?)
テクスチャユニット数328288272224
テクセルフィルレート566 GTexel/s509.8 GTexel/s444.7 GTexel/s354.4 GTexel/s(?)
L1キャッシュ / 共有メモリ10,496 KB6,912 KB??
L2キャッシュ6,144 KB6,144 KB5,632 KB2,816 KB
レジスタファイルサイズ20,922 KB18,432 KB17,408 KB7,168 KB
FP64 FLOPS556 GFLOPS509.8 GFLOP420.2 GFLOPS354.4 GFLOPS
FP32 FLOPS35.6 TFLOPS16.3 TFLOPS14.2 TFLOPS11.3 TFLOPS
FP16 FLOPS35.6 TFLOPS32.6 TFLOPS28.5 TFLOPS177.2 GFLOPS(?)
BF16 FLOPS35.6 TFLOPSn/an/an/a
INT32 OPS17.8 TOPS16.3 FPS14.2 TOPSn/a
FP16 Tensor FLOPS142 TFLOPS (Dense) /
284 TFLOPS (Sparse)
130.5 TFLOPS113.8 TFLOPSn/a
BF16 Tensor FLOPS71 / 142 TFLOPSn/an/an/a
TF32 Tensor FLOPS35.6 / 71 TFLOPSn/an/an/a
INT8 Tensor OPS284 / 568 TOPS261 TOPS227.7 TOPSn/a
INT4 Tensor OPS568 / 1,136 TOPS522 TOPS455.4 TOPSn/a
※(?)は推測値

GeForce RTX 3080 スペックシート

RTX 3080 (GA102)のブロックダイアグラム (Image via NVIDIA)
モデルRTX 3080 10GB FERTX 2080 Super FERTX 2080 FEGTX 1080 FE
GPUコードネームGA102TU104TU104GP104
製造プロセスSamsung 8NTSMC 12FFNTSMC 12FFN16 nm
トランジスタ数283億136億136億72億
ダイサイズ628.4 mm2545 mm2545 mm2314 mm2
ブーストクロック1,710 MHz1,815 MHz1,800 MHz1,733 MHz
VRAM10,240 MB GDDR6X8,192 MB GDDR68,192 MB GDDR68,192 MB GDDR5X
メモリインターフェイス320-bit256-bit256-bit256-bit
メモリデータレート19 Gbps15.5 Gbps14 Gbps10 Gbps
メモリ帯域幅760 GB/s496 GB/s448 GB/s320 GB/s
消費電力(TGP / TDP)320 W250 W225 W180 W
GPC6664
TPC34242320
SM68484620
CUDAコア数8,7043,0722,9442,560
Tensorコア数272384368n/a
RTコア数684846n/a
ROPs96646464
ピクセルフィルレート164.2 GPixel/s116.2 GPixel/s115.2 GPixel/s?
テクスチャユニット数272192184160
テクセルフィルレート465 GTexel/s348.5 GTexel/s331.2 GTexel/s277.3 GTexel/s
L1キャッシュ / 共有メモリ8,704 KB4,608 KB4,416 KB?
L2キャッシュ5,120 KB4,096 KB4,096 KB2,048 KB
レジスタファイルサイズ17,408 KB12,288 KB11,776 KB5,120 KB
FP32 FLOPS29.8 TFLOPS11.2 TFLOPS10.6 TFLOPS8.9 TFLOPS
FP16 FLOPS29.8 TFLOPS22.3 TFLOPS21.2 TFLOPSn/a
BF16 FLOPS29.8 TFLOPSn/an/an/a
INT32 OPS14.9 TOPS11.2 TOPS10.6 TOPSn/a
FP16 Tensor FLOPS119 TFLOPS (Dense) /
238 TFLOPS (Sparse)
89.2 TFLOPS84.8 TFLOPSn/a
BF16 Tensor FLOPS59.5 / 119 TFLOPSn/an/an/a
TF32 Tensor FLOPS29.8 / 59.5 TFLOPSn/an/an/a
INT8 Tensor OPS238 / 476 TOPS178.4 TOPS169.6 TOPSn/a
INT4 Tensor OPS476 / 952 TOPS356.8 TOPS339.1 TOPSn/a
※(?)は推測値

GeForce RTX 3070 スペックシート

RTX 3070 (GA104)のブロックダイアグラム (Image via NVIDIA)
モデルRTX 3070 FERTX 2070 Super FERTX 2070 FEGTX 1070 FE
GPUコードネームGA104TU104TU106GP104
製造プロセスSamsung 8NTSMC 12FFNTSMC 12FFN16 nm
トランジスタ数174億136億108億72億
ダイサイズ392.5 mm2545 mm2445 mm2314 mm2
ブーストクロック1,725 MHz1,770 MHz1,710 MHz1,683 MHz
VRAM8,192 MB GDDR68,192 MB GDDR68,192 MB GDDR68,192 MB GDDR6
メモリインターフェイス256-bit256-bit256-bit256-bit
メモリデータレート14 Gbps14 Gbps14 Gbps8 Gbps
メモリ帯域幅448 GB/s448 GB/s448 GB/s256 GB/s
消費電力(TGP)220 W215 W185 W150 W
GPC65 / 633
TPC23201815
SM46403636
CUDAコア数5,8882,5602,3041,920
Tensorコア数184320288n/a
RTコア数464036n/a
ROPs96646464
ピクセルフィルレート165.6 GPixel/s113.3 GPixel/s??
テクスチャユニット数184160144120
テクセルフィルレート317.4 GTexel/s283.2 GTexel/s246.2 GTexel/s202 GTexel/s
L1キャッシュ / 共有メモリ5,888 KB3,840 KB??
L2キャッシュ4,096 KB4,096 KB4,096 KB2,048 KB
レジスタファイルサイズ11,776 KB10,240 KB9,216 KB3,840 KB
FP32 FLOPS20.3 TFLOPS9.1 TFLOPS7.9 TFLOPS6.5 TFLOPS
FP16 FLOPS20.3 TFLOPS18.1 TFLOPS15.8 TFLOPn/a
BF16 FLOPS20.3 TFLOPSn/an/an/a
INT32 OPS10.2 TOPS9.1 TOPS7.9 TOPSn/a
FP16 Tensor FLOPS81.3 TFLOPS (Dense) /
162.6 TFLOPS (Sparse)
72.5 TFLOPS63 TFLOPSn/a
BF16 Tensor FLOPS40.6 / 81.3 TFLOPSn/an/an/a
TF32 Tensor FLOPS40.6 / 81.3 TFLOPSn/an/an/a
INT8 Tensor OPS162.6 / 325.2 TOPS145 TOPS126 TOPSn/a
INT4 Tensor OPS325.2 / 650.4 TOPS290 TOPS252.1 TOPSn/a
※(?)は推測値

コメント

タイトルとURLをコピーしました