计费与用量
如何理解请求消耗、余额、模型价格和异常用量。
0x1c 的具体价格、套餐和结算方式以主站控制台为准。本页主要解释新手最容易混淆的几个概念。
一次请求为什么会消耗额度
一次模型调用通常包含:
- 输入 token:你发给模型的文字、上下文、代码、历史消息。
- 输出 token:模型回复给你的内容。
- 工具调用或中间步骤:部分 agent 会多次调用模型。
你在聊天界面里看到的一句话,背后可能对应多次 API 请求。coding agent 尤其明显,因为它可能会读文件、规划、执行、检查、再次修改。
如何降低消耗
常用方法:
- 测试阶段用更便宜的模型。
- 不要让 agent 一次读取整个仓库。
- 明确告诉模型只改指定文件。
- 长任务拆成小任务。
- 避免反复粘贴完整日志。
- 出现循环调用时及时停止工具。
用量异常时先检查什么
- 是否有某个客户端一直在后台重试。
- 是否把 Key 提交到了公开仓库。
- 是否多人共用同一个 Key。
- 是否某个 agent 进入长循环。
- 是否使用了高价格或长上下文模型。
如果怀疑 Key 泄漏,先删除旧 Key,再创建新 Key。
余额不足
当接口返回 insufficient_quota、quota exceeded 或类似错误时:
- 检查账号余额或套餐状态。
- 查看是否有未支付订单。
- 换用价格更低的模型验证流程。
- 如果刚充值,等待页面和接口状态同步。
生产环境建议
如果你把 0x1c 用在自己的产品中:
- 给生产环境单独创建 Key。
- 给测试环境单独创建 Key。
- 在服务端限制单用户最大请求次数。
- 记录请求 ID、模型、耗时和错误码。
- 不要把 0x1c Key 下发到浏览器前端。