U
1
选择 GPU 与区域
每个 Worker 使用的 GPU 型号、部署区域与计费方式。
按量
灵活按秒计费,用多少付多少。适合流量波动或短期任务,随时启停。
「任何区域」由平台自动调度,无法保证网络卷可用;如需挂载 S3 卷请选择具体区域。
2
选择模板
选择预置推理模板,或配置自定义镜像并保存为模板。
3
扩缩容配置
配置端点名称、扩缩容参数与运行时限制。
*
*
*
*
*
*
*
4
存储配置
配置容器本地磁盘与 S3 网络卷挂载,两者相互独立。
Free 60GB
60 GB前 60 GB 免费;超出部分按 $0.0001/GB·hr 按需按量计费。本地磁盘随 Worker 生命周期存在,缩容后数据将被清除。
S3 网络卷与容器磁盘分开计费与挂载,用于持久化数据集与模型权重。
计费方式
按量
GPU 算力
1 × RTX 4090 24GB
GPU 小计
$0.67/hr
容器磁盘
60 GB 内免费
预计合计
$0.67/hr
按 GPU 实际运行秒级计费,缩容到零时不收费