Vai al contenuto principale
Venice supporta capacità aggiuntive nei suoi modelli che possono essere attivate tramite l’input venice_parameters sull’endpoint chat completions. In determinate circostanze potresti utilizzare un client che non ti consente di modificare il corpo della richiesta. Per queste piattaforme puoi utilizzare la funzionalità Model Feature Suffix di Venice per passare i flag tramite l’ID del modello.

Sintassi

Il Model Feature Suffix segue questo pattern:
<model_id>:<parameter>=<value>
Per più parametri, concatenali con &:
<model_id>:<parameter1>=<value1>&<parameter2>=<value2>&<parameter3>=<value3>

Esempi

Per impostare la web search su Auto

default:enable_web_search=auto

Per abilitare la web search e disabilitare il system prompt

default:enable_web_search=on&include_venice_system_prompt=false

Per abilitare la web search e aggiungere citazioni alla risposta

default:enable_web_search=on&enable_web_citations=true

Per abilitare la web search con lo scraping completo della pagina

default:enable_web_search=on&enable_web_scraping=true

Per usare un personaggio

default:character_slug=alan-watts

Per nascondere i blocchi di pensiero in una risposta di un modello di ragionamento

qwen3-4b:strip_thinking_response=true

Per disabilitare il pensiero sui modelli di ragionamento supportati

Alcuni modelli di ragionamento (come Qwen 3) supportano la disabilitazione del processo di pensiero. Puoi attivarla usando il suffisso seguente:
qwen3-4b:disable_thinking=true

Per aggiungere i risultati di web search a una risposta in streaming

Questo abiliterà la web search, aggiungerà citazioni al corpo della risposta e includerà i risultati di ricerca nello stream come messaggio finale della risposta. Puoi vedere un esempio nella nostra Postman Collection qui.
qwen3-4b:enable_web_search=on&enable_web_citations=true&include_search_results_in_stream=true

Esempio Postman

Puoi vedere un esempio di questa funzionalità nella nostra Postman Collection qui.