Evolution
Тема интерфейса

Какие видеокарты поддерживаются?

Поддерживаются следующие графические процессоры (GPU):

  • NVIDIA V100 32GB SXM

  • NVIDIA A100 80GB SXM

  • NVIDIA H100 80GB SXM

В таблице представлены ключевые характеристики доступных GPU.

Характеристика

NVIDIA V100 32GB SXM

NVIDIA A100 80GB SXM

NVIDIA H100 80GB SXM

Память

32 ГБ HBM2

80 ГБ HBM2e

80 ГБ HBM3

Пропускная способность памяти

1 134 ГБ/с (SXM2)

2 039 ГБ/с

3,35 ТБ/с

Пиковая вычислительная производительность

  • FP64 — 7,8 ТFLOPS

  • FP32 — 15,7 ТFLOPS

  • Tensor (FP16) — 125 ТFLOPS

  • FP64 — 9,7 ТFLOPS; FP64 Tensor Core — 19,5 ТFLOPS

  • FP32 — 19,5 ТFLOPS

  • TF32 Tensor Core — 156 / 312 ТFLOPS*

  • BF16 Tensor Core — 312 / 624 ТFLOPS*

  • FP16 Tensor Core — 312 / 624 ТFLOPS*

  • INT8 Tensor Core — 624 / 1 248 TOPS*

  • FP64 — 34 ТFLOPS; FP64 Tensor Core — 67 ТFLOPS

  • FP32 — 67 ТFLOPS

  • TF32 Tensor Core — ~495 / 989 ТFLOPS*

  • BF16 Tensor Core — ~990 / 1 979 ТFLOPS*

  • FP16 Tensor Core — ~990 / 1 979 ТFLOPS*

  • FP8 Tensor Core — 1 979 / 3 958 ТFLOPS*

  • INT8 Tensor Core — 1 979 / 3 958 TOPS*

Интерконнект

NVLink до 300 ГБ/с (SXM2); PCIe Gen3 до 32 ГБ/с

NVLink до 600 ГБ/с (через HGX A100)

NVLink до 900 ГБ/с (SXM); PCIe Gen5 до 128 ГБ/с

Архитектура

GV100 (Volta)

GA100 (Ampere)

GH100 (Hopper)

Количество SM

80

108

132

Количество CUDA-ядер

5 120

6 912

16 896

Количество Tensor Cores

640

432

528

L2-кэш

6 МБ

40 МБ

50 МБ

Техпроцесс

TSMC 12 nm FFN

TSMC 7 nm

TSMC 4N

Количество транзисторов

21,1 млрд

54,2 млрд

~80 млрд

* — значения с учетом sparsity, без sparsity — вдвое ниже