模型与路由
如何选择 Claude、Gemini、OpenAI、DeepSeek 等模型,以及模型 ID 应该怎么填写。
0x1c 接入多个模型提供商。最终可用模型、价格、上下文长度和限速以 0x1c 控制台展示为准。
模型 ID 从哪里来
最稳妥的方法是从控制台的模型列表复制完整模型 ID。不要凭记忆手打。
不同系统可能使用不同命名方式,例如:
openai/gpt-4o
anthropic/claude-sonnet-4-5
google/gemini-2.5-flash
deepseek/deepseek-chat也可能使用服务商原始名称,例如:
gpt-4o
claude-sonnet-4-5
gemini-2.5-flash
deepseek-chat如果你不确定,以控制台实际显示为准。
新手怎么选
| 场景 | 推荐方向 |
|---|---|
| 日常问答、翻译、总结 | 选择速度快、价格低的模型 |
| 写代码、改代码、读仓库 | 优先选择 Claude 或 OpenAI 的强推理模型 |
| 长文档、长上下文 | 选择上下文长度更大的模型 |
| 批量处理、脚本任务 | 选择稳定、便宜、吞吐好的模型 |
| 中文问答和通用推理 | 可以尝试 DeepSeek、Gemini 或 OpenAI 模型 |
速度、质量和成本
模型选择通常是在三者之间取平衡:
- 质量越高,价格通常越高。
- 上下文越长,单次请求成本可能越高。
- 批量任务不一定要用最强模型,稳定和便宜更重要。
给新手的默认建议:
- 先用便宜、响应快的模型测试流程。
- 确认工具配置成功后,再切换到更强模型。
- 对 coding agent,优先用代码能力强、工具调用稳定的模型。
上下文长度
上下文长度是模型一次能看到的内容总量,包括你的输入、系统提示、历史对话、工具返回和模型输出。
如果你在 coding agent 里让模型读取很大的仓库,可能会遇到:
- 回复变慢。
- 成本变高。
- 超出上下文限制。
- 模型开始忽略早期信息。
处理方式:
- 让 agent 只读取相关文件。
- 拆成多个小任务。
- 使用支持更大上下文的模型。
- 避免把整份日志、整份代码一次性贴进去。
模型不可用时怎么办
如果客户端报 model_not_found、model not available 或类似错误:
- 回到控制台复制模型 ID。
- 确认账号有该模型权限。
- 确认 Base URL 是
https://0x1c.io/v1。 - 用 curl 单独测试一次。
- 换一个同提供商模型验证是不是单模型问题。