0x1c Wiki

模型与路由

如何选择 Claude、Gemini、OpenAI、DeepSeek 等模型,以及模型 ID 应该怎么填写。

0x1c 接入多个模型提供商。最终可用模型、价格、上下文长度和限速以 0x1c 控制台展示为准。

模型 ID 从哪里来

最稳妥的方法是从控制台的模型列表复制完整模型 ID。不要凭记忆手打。

不同系统可能使用不同命名方式,例如:

openai/gpt-4o
anthropic/claude-sonnet-4-5
google/gemini-2.5-flash
deepseek/deepseek-chat

也可能使用服务商原始名称,例如:

gpt-4o
claude-sonnet-4-5
gemini-2.5-flash
deepseek-chat

如果你不确定,以控制台实际显示为准。

新手怎么选

场景推荐方向
日常问答、翻译、总结选择速度快、价格低的模型
写代码、改代码、读仓库优先选择 Claude 或 OpenAI 的强推理模型
长文档、长上下文选择上下文长度更大的模型
批量处理、脚本任务选择稳定、便宜、吞吐好的模型
中文问答和通用推理可以尝试 DeepSeek、Gemini 或 OpenAI 模型

速度、质量和成本

模型选择通常是在三者之间取平衡:

  • 质量越高,价格通常越高。
  • 上下文越长,单次请求成本可能越高。
  • 批量任务不一定要用最强模型,稳定和便宜更重要。

给新手的默认建议:

  1. 先用便宜、响应快的模型测试流程。
  2. 确认工具配置成功后,再切换到更强模型。
  3. 对 coding agent,优先用代码能力强、工具调用稳定的模型。

上下文长度

上下文长度是模型一次能看到的内容总量,包括你的输入、系统提示、历史对话、工具返回和模型输出。

如果你在 coding agent 里让模型读取很大的仓库,可能会遇到:

  • 回复变慢。
  • 成本变高。
  • 超出上下文限制。
  • 模型开始忽略早期信息。

处理方式:

  • 让 agent 只读取相关文件。
  • 拆成多个小任务。
  • 使用支持更大上下文的模型。
  • 避免把整份日志、整份代码一次性贴进去。

模型不可用时怎么办

如果客户端报 model_not_foundmodel not available 或类似错误:

  1. 回到控制台复制模型 ID。
  2. 确认账号有该模型权限。
  3. 确认 Base URL 是 https://0x1c.io/v1
  4. 用 curl 单独测试一次。
  5. 换一个同提供商模型验证是不是单模型问题。

On this page