RTX 30シリーズ(& RTX 20/GTX 10)仕様表まとめ

Computer
RTX 30 series (Image credit: NVIDIA)
ComputerGPUTech
この記事は約10分で読めます。
記事内に広告が含まれる場合があります。

Warning: Undefined array key 5 in /home/vanillasalt/vanillasalt.net/public_html/wp-content/themes/cocoon-child-master/functions.php on line 123

先日公開されたRTX30シリーズのホワイトペーパーから、スペックシート部分を抜き出してRTX 20シリーズ/GTX 10シリーズと比較した仕様表を作ってみた。

すべてFounders Editionでの数値なので、クロックやFLOPS絡みは実際の製品によって変動アリ。NVIDIAの製品情報ページに記載がないデータも多いのでまとまってるとちょっと便利?

ホワイトペーパーの内容については別記事参照。

スポンサーリンク

GeForce RTX 3090 スペックシート

RTX 3090 (GA102)のブロックダイアグラム。グレーアウトは無効化コア ( Image via NVIDIA)
モデルRTX 3090 FETitan RTXRTX 2080 Ti FEGTX 1080 Ti FE
GPUコードネームGA102TU102TU102GP102
製造プロセスSamsung 8NTSMC 12FFNTSMC 12FFN16 nm
トランジスタ数283億186億186億120億
ダイサイズ628.4 mm2754 mm2754 mm2471 mm2
ブーストクロック1,695 MHz1,770 MHz1,635 MHz1,582 MHz
VRAM24,576 MB GDDR6X24,576 MB GDDR611,264 MB GDDR611,264 MB GDDR5X
メモリインターフェイス384-bit384-bit352-bit352-bit
メモリデータレート19.5 Gbps14 Gbps14 Gbps11 Gbps
メモリ帯域幅936 GB/s672 GB/s616 GB/s484 GB/s
消費電力(TGP / TDP)350 W280 W260 W250 W
GPC7666
TPC41363428
SM82726828
CUDAコア数10,4964,6084,3523,584
Tensorコア数328576544n/a
RTコア数827268n/a
ROPs112968888
ピクセルフィルレート193 GPixel/s169.9 GPixel/s136 GPixel/s(?)139.2 GPixel/s(?)
テクスチャユニット数328288272224
テクセルフィルレート566 GTexel/s509.8 GTexel/s444.7 GTexel/s354.4 GTexel/s(?)
L1キャッシュ / 共有メモリ10,496 KB6,912 KB??
L2キャッシュ6,144 KB6,144 KB5,632 KB2,816 KB
レジスタファイルサイズ20,922 KB18,432 KB17,408 KB7,168 KB
FP64 FLOPS556 GFLOPS509.8 GFLOP420.2 GFLOPS354.4 GFLOPS
FP32 FLOPS35.6 TFLOPS16.3 TFLOPS14.2 TFLOPS11.3 TFLOPS
FP16 FLOPS35.6 TFLOPS32.6 TFLOPS28.5 TFLOPS177.2 GFLOPS(?)
BF16 FLOPS35.6 TFLOPSn/an/an/a
INT32 OPS17.8 TOPS16.3 FPS14.2 TOPSn/a
FP16 Tensor FLOPS142 TFLOPS (Dense) /
284 TFLOPS (Sparse)
130.5 TFLOPS113.8 TFLOPSn/a
BF16 Tensor FLOPS71 / 142 TFLOPSn/an/an/a
TF32 Tensor FLOPS35.6 / 71 TFLOPSn/an/an/a
INT8 Tensor OPS284 / 568 TOPS261 TOPS227.7 TOPSn/a
INT4 Tensor OPS568 / 1,136 TOPS522 TOPS455.4 TOPSn/a
※(?)は推測値

GeForce RTX 3080 スペックシート

RTX 3080 (GA102)のブロックダイアグラム (Image via NVIDIA)
モデルRTX 3080 10GB FERTX 2080 Super FERTX 2080 FEGTX 1080 FE
GPUコードネームGA102TU104TU104GP104
製造プロセスSamsung 8NTSMC 12FFNTSMC 12FFN16 nm
トランジスタ数283億136億136億72億
ダイサイズ628.4 mm2545 mm2545 mm2314 mm2
ブーストクロック1,710 MHz1,815 MHz1,800 MHz1,733 MHz
VRAM10,240 MB GDDR6X8,192 MB GDDR68,192 MB GDDR68,192 MB GDDR5X
メモリインターフェイス320-bit256-bit256-bit256-bit
メモリデータレート19 Gbps15.5 Gbps14 Gbps10 Gbps
メモリ帯域幅760 GB/s496 GB/s448 GB/s320 GB/s
消費電力(TGP / TDP)320 W250 W225 W180 W
GPC6664
TPC34242320
SM68484620
CUDAコア数8,7043,0722,9442,560
Tensorコア数272384368n/a
RTコア数684846n/a
ROPs96646464
ピクセルフィルレート164.2 GPixel/s116.2 GPixel/s115.2 GPixel/s?
テクスチャユニット数272192184160
テクセルフィルレート465 GTexel/s348.5 GTexel/s331.2 GTexel/s277.3 GTexel/s
L1キャッシュ / 共有メモリ8,704 KB4,608 KB4,416 KB?
L2キャッシュ5,120 KB4,096 KB4,096 KB2,048 KB
レジスタファイルサイズ17,408 KB12,288 KB11,776 KB5,120 KB
FP32 FLOPS29.8 TFLOPS11.2 TFLOPS10.6 TFLOPS8.9 TFLOPS
FP16 FLOPS29.8 TFLOPS22.3 TFLOPS21.2 TFLOPSn/a
BF16 FLOPS29.8 TFLOPSn/an/an/a
INT32 OPS14.9 TOPS11.2 TOPS10.6 TOPSn/a
FP16 Tensor FLOPS119 TFLOPS (Dense) /
238 TFLOPS (Sparse)
89.2 TFLOPS84.8 TFLOPSn/a
BF16 Tensor FLOPS59.5 / 119 TFLOPSn/an/an/a
TF32 Tensor FLOPS29.8 / 59.5 TFLOPSn/an/an/a
INT8 Tensor OPS238 / 476 TOPS178.4 TOPS169.6 TOPSn/a
INT4 Tensor OPS476 / 952 TOPS356.8 TOPS339.1 TOPSn/a
※(?)は推測値

GeForce RTX 3070 スペックシート

RTX 3070 (GA104)のブロックダイアグラム (Image via NVIDIA)
モデルRTX 3070 FERTX 2070 Super FERTX 2070 FEGTX 1070 FE
GPUコードネームGA104TU104TU106GP104
製造プロセスSamsung 8NTSMC 12FFNTSMC 12FFN16 nm
トランジスタ数174億136億108億72億
ダイサイズ392.5 mm2545 mm2445 mm2314 mm2
ブーストクロック1,725 MHz1,770 MHz1,710 MHz1,683 MHz
VRAM8,192 MB GDDR68,192 MB GDDR68,192 MB GDDR68,192 MB GDDR6
メモリインターフェイス256-bit256-bit256-bit256-bit
メモリデータレート14 Gbps14 Gbps14 Gbps8 Gbps
メモリ帯域幅448 GB/s448 GB/s448 GB/s256 GB/s
消費電力(TGP)220 W215 W185 W150 W
GPC65 / 633
TPC23201815
SM46403636
CUDAコア数5,8882,5602,3041,920
Tensorコア数184320288n/a
RTコア数464036n/a
ROPs96646464
ピクセルフィルレート165.6 GPixel/s113.3 GPixel/s??
テクスチャユニット数184160144120
テクセルフィルレート317.4 GTexel/s283.2 GTexel/s246.2 GTexel/s202 GTexel/s
L1キャッシュ / 共有メモリ5,888 KB3,840 KB??
L2キャッシュ4,096 KB4,096 KB4,096 KB2,048 KB
レジスタファイルサイズ11,776 KB10,240 KB9,216 KB3,840 KB
FP32 FLOPS20.3 TFLOPS9.1 TFLOPS7.9 TFLOPS6.5 TFLOPS
FP16 FLOPS20.3 TFLOPS18.1 TFLOPS15.8 TFLOPn/a
BF16 FLOPS20.3 TFLOPSn/an/an/a
INT32 OPS10.2 TOPS9.1 TOPS7.9 TOPSn/a
FP16 Tensor FLOPS81.3 TFLOPS (Dense) /
162.6 TFLOPS (Sparse)
72.5 TFLOPS63 TFLOPSn/a
BF16 Tensor FLOPS40.6 / 81.3 TFLOPSn/an/an/a
TF32 Tensor FLOPS40.6 / 81.3 TFLOPSn/an/an/a
INT8 Tensor OPS162.6 / 325.2 TOPS145 TOPS126 TOPSn/a
INT4 Tensor OPS325.2 / 650.4 TOPS290 TOPS252.1 TOPSn/a
※(?)は推測値
スポンサーリンク

GeForce RTX 3060 Ti / 3060 スペックシート

モデルRTX 3060 Ti FERTX 3060 FERTX 2060 Super FERTX 2060 FEGTX 1060 6GB FE
GPUコードネームGA104GA106TU106TU106GP106
製造プロセスSamsung 8NSamsung 8NTSMC 12FFNTSMC 12FFN16 nm
トランジスタ数174億132.5億108億108億44億
ダイサイズ392.5 mm2300 mm2445 mm2445 mm2200 mm2
ブーストクロック1,665 MHz1,777 MHz1,650 MHz1,680 MHz1,709 MHz
VRAM8,192 MB GDDR612,288 MB GDDR68,192 MB GDDR68,192 MB GDDR68,192 MB GDDR6
メモリインターフェイス256-bit192-bit256-bit256-bit192-bit
メモリデータレート14 Gbps15 Gbps14 Gbps15 Gbps8 Gbps
メモリ帯域幅448 GB/s360 GB/s448 GB/s336 GB/s192.2 GB/s
消費電力(TGP)200 W170 W175 W160 W120 W
GPC5(?)4(?)333
TPC20(?)171515
SM3828343010
CUDAコア数4,8643,5842,1761,9201,920
Tensorコア数152112272240n/a
RTコア数38283430n/a
ROPs8064644848
ピクセルフィルレート133.2 GPixel/s113.7 GPixel/s113.3 GPixel/s80.64 GPixel/s82.03 GPixel/s
テクスチャユニット数15211213612080
テクセルフィルレート253.1 GTexel/s199 GTexel/s224.4 GTexel/s201.6 GTexel/s136.7 GTexel/s
L1キャッシュ / 共有メモリ4,864 KB3,584 KB3,840 KB1,920 KB480 KB
L2キャッシュ4,096 KB3,072 KB4,096 KB3,072 KB1,536 KB
レジスタファイルサイズ??10,240 KB9,216 KB?
FP32 FLOPS16.2 TFLOPS12.74 TFLOPS7.181 TFLOPS6.451 TFLOPS4.375 TFLOPS
FP16 FLOPS16.2 TFLOPS12.74 TFLOPS14.36 TFLOPS12.9 TFLOP68.36 GFLOPS
BF16 FLOPS16.2 TFLOPS12.74 TFLOPSn/an/an/a
INT32 OPSn/a
FP16 Tensor FLOPSn/a
BF16 Tensor FLOPSn/an/an/a
TF32 Tensor FLOPSn/an/an/a
INT8 Tensor OPSn/a
INT4 Tensor OPSn/a
※(?)は推測値

コメント

タイトルとURLをコピーしました