0x1c Wiki

计费与用量

如何理解请求消耗、余额、模型价格和异常用量。

0x1c 的具体价格、套餐和结算方式以主站控制台为准。本页主要解释新手最容易混淆的几个概念。

一次请求为什么会消耗额度

一次模型调用通常包含:

  • 输入 token:你发给模型的文字、上下文、代码、历史消息。
  • 输出 token:模型回复给你的内容。
  • 工具调用或中间步骤:部分 agent 会多次调用模型。

你在聊天界面里看到的一句话,背后可能对应多次 API 请求。coding agent 尤其明显,因为它可能会读文件、规划、执行、检查、再次修改。

如何降低消耗

常用方法:

  • 测试阶段用更便宜的模型。
  • 不要让 agent 一次读取整个仓库。
  • 明确告诉模型只改指定文件。
  • 长任务拆成小任务。
  • 避免反复粘贴完整日志。
  • 出现循环调用时及时停止工具。

用量异常时先检查什么

  1. 是否有某个客户端一直在后台重试。
  2. 是否把 Key 提交到了公开仓库。
  3. 是否多人共用同一个 Key。
  4. 是否某个 agent 进入长循环。
  5. 是否使用了高价格或长上下文模型。

如果怀疑 Key 泄漏,先删除旧 Key,再创建新 Key。

余额不足

当接口返回 insufficient_quotaquota exceeded 或类似错误时:

  • 检查账号余额或套餐状态。
  • 查看是否有未支付订单。
  • 换用价格更低的模型验证流程。
  • 如果刚充值,等待页面和接口状态同步。

生产环境建议

如果你把 0x1c 用在自己的产品中:

  • 给生产环境单独创建 Key。
  • 给测试环境单独创建 Key。
  • 在服务端限制单用户最大请求次数。
  • 记录请求 ID、模型、耗时和错误码。
  • 不要把 0x1c Key 下发到浏览器前端。

On this page