通过增强的张量核心和 TF32 精度加速 AI 模型训练和推理 [1]
支持要求严苛的可视化工作负载,包括复杂的 3D 模型、建筑设计和产品开发 [2]
为创意工作流程中的真实感渲染和光线追踪提供增强性能 [3]
适用于需要大内存容量的应用,使用 NVLink 可扩展至 96GB [4]
支持工程、科学研究和金融建模中的计算密集型仿真 [2]
型号 | 内存 | 内存类型 | 内存带宽 | FP16 TFLOPS | INT8 TOPS | TDP | 价格/小时 |
---|---|---|---|---|---|---|---|
NVIDIA H20
H20
|
96GB | HBM3 | 4.0 TB/s | 148 TFLOPS | 296 TOPS | 400W | $0.75/小时 |
NVIDIA H100
|
141 GB | HBM3 | 3.35 TB/s | 1979 | 3958 | 700W | $1.80/小时 |
NVIDIA L20
L20
|
48GB GDDR6 | HBM3 | 864 GB/s | 59.35 TFLOPS | 239T | 275W | $0.65/小时 |
NVIDIA H200
Latest
|
141 GB | HBM3E | 4.8 TB/s | 2000 | 4000 | 700W | $2.50/小时 |
NVIDIA A6000
|
48GB | GDDR6 | 768 GB/s | 75.6 TFLOPS | 38.7TFLOPS | 300W | $1.19/小时 |
NVIDIA A100
|
80 GB | HBM2E | 1555GB/s | 624 | 1248 | 400W | $0.9/小时 |
型号 | 内存 | 内存类型 | 内存带宽 | CUDA 核心 | 加速时钟 | TDP | 价格/小时 |
---|---|---|---|---|---|---|---|
RTX 5090
RTX 5090
|
32GB | Other | 1792 GB/s | 18874 | 2.7 GHz | 575W | $1/小时 |
RTX 4090
RTX 4090
|
24GB | GDDR6X | 1008 GB/s | 16384 | 2.52 GHz | 450W | $0.35/小时 |
RTX 3090
RTX 3090
|
24 GB | GDDR6X | 1TB/s | 10752 | 2 GHz | 350W | $0.25/小时 |