跳转到主要内容
Venice 在其模型中支持额外能力,这些能力可通过 chat completions 端点上的 venice_parameters 输入来开启。 在某些情况下,您可能使用了不允许修改请求体的客户端。对于这些平台,您可以使用 Venice 的模型特性后缀(Model Feature Suffix),通过模型 ID 传递参数。

语法

模型特性后缀遵循以下模式:
<model_id>:<parameter>=<value>
对于多个参数,使用 & 连接:
<model_id>:<parameter1>=<value1>&<parameter2>=<value2>&<parameter3>=<value3>

示例

将 Web Search 设为 Auto

default:enable_web_search=auto

启用 Web Search 并禁用系统 prompt

default:enable_web_search=on&include_venice_system_prompt=false

启用 Web Search 并向响应添加引用

default:enable_web_search=on&enable_web_citations=true

启用 Web Search 并进行完整页面抓取

default:enable_web_search=on&enable_web_scraping=true

使用角色

default:character_slug=alan-watts

隐藏推理模型响应中的思考块

qwen3-4b:strip_thinking_response=true

在支持的推理模型上禁用 Thinking

某些推理模型(如 Qwen 3)支持禁用思考过程。您可以使用以下后缀启用此功能:
qwen3-4b:disable_thinking=true

将 Web Search 结果添加到流式响应中

此选项将启用 web search,在响应正文中添加引用,并将搜索结果作为最终响应消息包含在流中。 您可以在我们的 Postman 集合中查看此功能的示例。
qwen3-4b:enable_web_search=on&enable_web_citations=true&include_search_results_in_stream=true

Postman 示例

您可以在我们的 Postman 集合中查看此功能的示例。