定价

从创意到企业级的无缝扩展定价

探索我们的模型 APIs 和 GPU 资源的定价。通过透明的费率和灵活的选项,找到符合您需求的合适方案。

模型 APIs

按 Token 透明计费

200+ 个主流大模型统一 API 接入。按实际输入与输出 Token 计费,无套餐绑定,随用随付。

GPT-4o

$2.50 / 1M tokens

输出$10.00 / 1M tokens

Claude 3.5 Sonnet

$3.00 / 1M tokens

输出$15.00 / 1M tokens

DeepSeek V3

$0.27 / 1M tokens

输出$1.10 / 1M tokens

Llama 3.3 70B

$0.35 / 1M tokens

输出$0.40 / 1M tokens

Gemini 2.0 Flash

$0.10 / 1M tokens

输出$0.40 / 1M tokens

价格因模型而异,上表为部分热门模型参考价。完整模型列表与实时定价请查看模型库。

GPUs

灵活的 GPU 算力定价

从按需 GPU 云实例到国内 GPU 实例市场,支持按量、包日、包周、包月等多种计费方式。裸金属服务器适用于长期高负载训练场景。

GPU 云实例

海外区域 GPU 云,按小时计费,支持 Spot 与包周期折扣。

H100 SXM 80GB

按量计费

单价$2.59/hr

RTX 4090 24GB

按量计费

单价$0.67/hr

GeForce RTX 5090 32GB

按量计费

单价$0.60/hr

A100 SXM 80GB

按量计费

单价$1.89/hr

RTX A6000 48GB

按量计费

单价$0.76/hr

GPU 实例市场

国内多区域 GPU 实例,以下为各型号最低按量单价(因区域与库存而异)。

CPU

按量计费(单卡)

起价¥0.60/时

CLOUD CPU

按量计费(单卡)

起价¥0.60/时

RTX 3090

按量计费(单卡)

起价¥0.99/时

RTX 4090

按量计费(单卡)

起价¥1.28/时

RTX 4090 Lite

按量计费(单卡)

起价¥1.28/时

RTX 4090-48G

按量计费(单卡)

起价¥1.89/时

RTX 5090

按量计费(单卡)

起价¥1.89/时

A100-SXM4-40GB

按量计费(单卡)

起价¥2.39/时
Agent 沙盒

灵活的按使用量计费

基于 vCPU 和内存分配按秒计费。无套餐、无锁定、无隐藏费用。为 AI 智能体提供安全、可编程的沙盒运行时。

vCPU

按分配的 vCPU-秒计算

单价$0.0000098 / vCPU-second

Memory

按分配的 GiB-秒计算

单价$0.0000032 / GiB-second

Storage

按小时计量,按天收费。包含前 60 GB

单价$0.00009 / GB-hour

基于用量的计费示例

1 vCPU + 512 MiB RAM

短时智能体任务(5 分钟)

预估费用~$0.0034

2 vCPU + 1 GiB RAM

代码执行任务(1 小时)

预估费用~$0.0821

8 vCPU + 8 GiB RAM

多智能体或 RL 工作负载(1 小时)

预估费用~$0.3744

* 免费层配额:5 个并发沙盒,最长 1 小时会话。充值余额并使用沙盒,即可自动解锁付费层(100 个并发,24 小时会话)。

免费层与付费层

立即试用

从免费层开始,我们赠送 $100。充值余额即可自动解锁生产级资源

免费层
$100 免费使用额度5 个并发沙盒最长 1 小时会话时长每个沙盒 2 vCPU每个沙盒 4 GB RAM无优先调度
付费层
按量付费100 个并发沙盒最长 24 小时会话时长每个沙盒最高 8 vCPU每个沙盒最高 8 GB RAM支持优先调度

账户余额高于 $0 后,将自动解锁付费层。

构建生产级 AI 所需的一切。

200+ 个模型、按需 GPUs 和安全的智能体运行时——统一在一个 API 下。免费开始,随业务增长灵活扩展。