U
1

选择 GPU 与区域

每个 Worker 使用的 GPU 型号、部署区域与计费方式。

「任何区域」由平台自动调度,无法保证网络卷可用;如需挂载 S3 卷请选择具体区域。

2

选择模板

选择预置推理模板,或配置自定义镜像并保存为模板。

3

扩缩容配置

配置端点名称、扩缩容参数与运行时限制。

*
*
*
*
*
*
*
4

存储配置

配置容器本地磁盘与 S3 网络卷挂载,两者相互独立。

Free 60GB
60 GB

60 GB 免费;超出部分按 $0.0001/GB·hr 按需按量计费。本地磁盘随 Worker 生命周期存在,缩容后数据将被清除。

S3 网络卷与容器磁盘分开计费与挂载,用于持久化数据集与模型权重。

计费方式
按量
GPU 算力
1 × RTX 4090 24GB
GPU 小计
$0.67/hr
容器磁盘
60 GB 内免费
预计合计
$0.67/hr

按 GPU 实际运行秒级计费,缩容到零时不收费