Model Feature Suffix | Venice API Docs

Venice 在其模型中支持额外能力，这些能力可通过 chat completions 端点上的 venice_parameters 输入来开启。在某些情况下，您可能使用了不允许修改请求体的客户端。对于这些平台，您可以使用 Venice 的模型特性后缀（Model Feature Suffix），通过模型 ID 传递参数。

语法

模型特性后缀遵循以下模式：

<model_id>:<parameter>=<value>

对于多个参数，使用 & 连接：

<model_id>:<parameter1>=<value1>&<parameter2>=<value2>&<parameter3>=<value3>

示例

将 Web Search 设为 Auto

default:enable_web_search=auto

启用 Web Search 并禁用系统 prompt

default:enable_web_search=on&include_venice_system_prompt=false

启用 Web Search 并向响应添加引用

default:enable_web_search=on&enable_web_citations=true

启用 Web Search 并进行完整页面抓取

default:enable_web_search=on&enable_web_scraping=true

使用角色

default:character_slug=alan-watts

隐藏推理模型响应中的思考块

qwen3-4b:strip_thinking_response=true

在支持的推理模型上禁用 Thinking

某些推理模型（如 Qwen 3）支持禁用思考过程。您可以使用以下后缀启用此功能：

qwen3-4b:disable_thinking=true

将 Web Search 结果添加到流式响应中

此选项将启用 web search，在响应正文中添加引用，并将搜索结果作为最终响应消息包含在流中。您可以在我们的 Postman 集合中查看此功能的示例。

qwen3-4b:enable_web_search=on&enable_web_citations=true&include_search_results_in_stream=true

Postman 示例

您可以在我们的 Postman 集合中查看此功能的示例。

​语法

​示例

​将 Web Search 设为 Auto

​启用 Web Search 并禁用系统 prompt

​启用 Web Search 并向响应添加引用

​启用 Web Search 并进行完整页面抓取

​使用角色

​隐藏推理模型响应中的思考块

​在支持的推理模型上禁用 Thinking

​将 Web Search 结果添加到流式响应中

​Postman 示例

语法

示例