按 token 付费
无需订阅。仅按用量付费
Claude 模型
通过 Venice 访问 Opus 4.5/4.6 和 Sonnet 4.5/4.6
Prompt 缓存
Venice 缓存与 Claude Code 协同工作
为何需要路由器
Claude Code 默认直接连接 Anthropic 的 API。要将它与 Venice 一起使用,您需要 claude-code-router —— 一个开源本地代理:前置条件
Venice 账户
带 API 额度
Node.js
v18 或更高
Claude Code
通过 npm 安装
设置
获取您的 API 密钥
从 venice.ai/settings/api 生成密钥。您将在下一步直接在配置文件中粘贴它。
创建配置
创建配置目录:然后使用您喜欢的编辑器创建 粘贴以下配置:
~/.claude-code-router/config.json:如果您在路由器运行时修改
config.json,请使用 ccr restart 重启以应用变更。支持的模型
| 模型 | Venice ID | 最适合 |
|---|---|---|
| Claude Opus 4.5 | claude-opus-4-5 | 复杂推理、大型重构 |
| Claude Sonnet 4.5 | claude-sonnet-4-5 | 快速迭代、日常编码 |
| Claude Opus 4.6 | claude-opus-4-6 | 复杂推理、大型重构 |
| Claude Opus 4.6 Fast | claude-opus-4-6-fast | 低延迟的复杂推理 |
| Claude Sonnet 4.6 | claude-sonnet-4-6 | 快速迭代、日常编码 |
Claude Code 针对 Claude 模型进行了优化。虽然 Venice 提供的其他模型(GPT、DeepSeek、Grok 等)可能可用,但由于 Claude Code 依赖 Claude 特有的功能(如扩展思考),我们无法保证同等体验。对于其他模型,请考虑使用 Venice 的标准 API。
路由器功能
路由器除了基本路由外还提供多个有用功能:即时切换模型
即时切换模型
在 Claude Code 内部使用 当您希望用 Opus 处理复杂任务、用 Sonnet 进行快速迭代时非常有用。
/model 命令可在不重启的情况下切换模型:使用 UI 模式进行可视化配置
使用 UI 模式进行可视化配置
更喜欢图形界面?启动基于 Web 的配置编辑器:这将打开一个浏览器界面来编辑您的
config.json,无需直接接触文件。路由器场景说明
路由器场景说明
Router 配置部分控制哪种模型处理不同类型的任务:| 场景 | 何时使用 |
|---|---|
default | 通用请求 |
think | 推理密集型任务(Plan Mode) |
background | 后台操作 |
longContext | 当上下文超过 longContextThreshold token 时 |
使用日志进行调试
使用日志进行调试
如果出现问题,请检查日志:在配置中设置
"LOG_LEVEL": "debug" 以获得更详细的输出。缓存行为
Venice 的 prompt 缓存 与 Claude Code 原生的缓存标记协同工作。Venice 会自动检测 Claude Code 何时发送cache_control 字段,并相应调整其缓存策略。
| 场景 | 缓存 TTL | 由谁控制 |
|---|---|---|
| 默认(推荐) | 5 分钟 | Claude Code + Venice |
使用 cleancache transformer | 1 小时 | 仅 Venice |
何时不使用 cleancache(大多数用户)
何时不使用 cleancache(大多数用户)
默认配置让两个系统协同工作:
- Claude Code 发送其原生的
cache_control标记 - Venice 在其周围添加 5 分钟 TTL 的缓存
- 两个系统共享 4 块缓存限制
何时使用 cleancache
何时使用 cleancache
在以下情况下,将 这会剥离 Claude Code 的缓存标记,让 Venice 以更长的 TTL 完全控制。
cleancache 添加到 transformer:- 您遇到 4 块缓存限制错误
- 出现奇怪的缓存行为
- 您希望 Venice 在更长的会话中使用 1 小时 TTL
资源
Venice API 文档
完整 API 参考
claude-code-router
源代码与 issues