从创意到企业级的无缝扩展定价
探索我们的模型 APIs 和 GPU 资源的定价。通过透明的费率和灵活的选项,找到符合您需求的合适方案。
按 Token 透明计费
200+ 个主流大模型统一 API 接入。按实际输入与输出 Token 计费,无套餐绑定,随用随付。
| 模型 | 输入 | 输出 |
|---|---|---|
| GPT-4o | $2.50 / 1M tokens | $10.00 / 1M tokens |
| Claude 3.5 Sonnet | $3.00 / 1M tokens | $15.00 / 1M tokens |
| DeepSeek V3 | $0.27 / 1M tokens | $1.10 / 1M tokens |
| Llama 3.3 70B | $0.35 / 1M tokens | $0.40 / 1M tokens |
| Gemini 2.0 Flash | $0.10 / 1M tokens | $0.40 / 1M tokens |
GPT-4o
$2.50 / 1M tokens
Claude 3.5 Sonnet
$3.00 / 1M tokens
DeepSeek V3
$0.27 / 1M tokens
Llama 3.3 70B
$0.35 / 1M tokens
Gemini 2.0 Flash
$0.10 / 1M tokens
价格因模型而异,上表为部分热门模型参考价。完整模型列表与实时定价请查看模型库。
灵活的 GPU 算力定价
从按需 GPU 云实例到国内 GPU 实例市场,支持按量、包日、包周、包月等多种计费方式。裸金属服务器适用于长期高负载训练场景。
GPU 云实例
海外区域 GPU 云,按小时计费,支持 Spot 与包周期折扣。
| GPU 型号 | 计费方式 | 单价 |
|---|---|---|
| H100 SXM 80GB | 按量计费 | $2.59/hr |
| RTX 4090 24GB | 按量计费 | $0.67/hr |
| GeForce RTX 5090 32GB | 按量计费 | $0.60/hr |
| A100 SXM 80GB | 按量计费 | $1.89/hr |
| RTX A6000 48GB | 按量计费 | $0.76/hr |
H100 SXM 80GB
按量计费
RTX 4090 24GB
按量计费
GeForce RTX 5090 32GB
按量计费
A100 SXM 80GB
按量计费
RTX A6000 48GB
按量计费
GPU 实例市场
国内多区域 GPU 实例,以下为各型号最低按量单价(因区域与库存而异)。
| GPU 型号 | 计费方式 | 起价 |
|---|---|---|
| CPU | 按量计费(单卡) | ¥0.60/时 |
| CLOUD CPU | 按量计费(单卡) | ¥0.60/时 |
| RTX 3090 | 按量计费(单卡) | ¥0.99/时 |
| RTX 4090 | 按量计费(单卡) | ¥1.28/时 |
| RTX 4090 Lite | 按量计费(单卡) | ¥1.28/时 |
| RTX 4090-48G | 按量计费(单卡) | ¥1.89/时 |
| RTX 5090 | 按量计费(单卡) | ¥1.89/时 |
| A100-SXM4-40GB | 按量计费(单卡) | ¥2.39/时 |
CPU
按量计费(单卡)
CLOUD CPU
按量计费(单卡)
RTX 3090
按量计费(单卡)
RTX 4090
按量计费(单卡)
RTX 4090 Lite
按量计费(单卡)
RTX 4090-48G
按量计费(单卡)
RTX 5090
按量计费(单卡)
A100-SXM4-40GB
按量计费(单卡)
灵活的按使用量计费
基于 vCPU 和内存分配按秒计费。无套餐、无锁定、无隐藏费用。为 AI 智能体提供安全、可编程的沙盒运行时。
| 资源 | 计费依据 | 单价 |
|---|---|---|
| vCPU | 按分配的 vCPU-秒计算 | $0.0000098 / vCPU-second |
| Memory | 按分配的 GiB-秒计算 | $0.0000032 / GiB-second |
| Storage | 按小时计量,按天收费。包含前 60 GB | $0.00009 / GB-hour |
vCPU
按分配的 vCPU-秒计算
Memory
按分配的 GiB-秒计算
Storage
按小时计量,按天收费。包含前 60 GB
基于用量的计费示例
| 示例配置 | 使用示例 | 预估费用 |
|---|---|---|
| 1 vCPU + 512 MiB RAM | 短时智能体任务(5 分钟) | ~$0.0034 |
| 2 vCPU + 1 GiB RAM | 代码执行任务(1 小时) | ~$0.0821 |
| 8 vCPU + 8 GiB RAM | 多智能体或 RL 工作负载(1 小时) | ~$0.3744 |
1 vCPU + 512 MiB RAM
短时智能体任务(5 分钟)
2 vCPU + 1 GiB RAM
代码执行任务(1 小时)
8 vCPU + 8 GiB RAM
多智能体或 RL 工作负载(1 小时)
* 免费层配额:5 个并发沙盒,最长 1 小时会话。充值余额并使用沙盒,即可自动解锁付费层(100 个并发,24 小时会话)。
构建生产级 AI 所需的一切。
200+ 个模型、按需 GPUs 和安全的智能体运行时——统一在一个 API 下。免费开始,随业务增长灵活扩展。
