Zum Hauptinhalt springen
Venice unterstützt zusätzliche Funktionen in seinen Modellen, die über den Input venice_parameters am Chat-Completions-Endpoint angesteuert werden können. In bestimmten Fällen verwenden Sie möglicherweise einen Client, der es Ihnen nicht erlaubt, den Request-Body zu ändern. Für diese Plattformen können Sie das Model-Feature-Suffix-Angebot von Venice nutzen, um Flags über die Modell-ID zu übergeben.

Syntax

Das Model Feature Suffix folgt diesem Muster:
<model_id>:<parameter>=<value>
Für mehrere Parameter verknüpfen Sie diese mit &:
<model_id>:<parameter1>=<value1>&<parameter2>=<value2>&<parameter3>=<value3>

Beispiele

Web Search auf Auto setzen

default:enable_web_search=auto

Web Search aktivieren und System-Prompt deaktivieren

default:enable_web_search=on&include_venice_system_prompt=false

Web Search aktivieren und Zitate zur Antwort hinzufügen

default:enable_web_search=on&enable_web_citations=true

Web Search mit vollständigem Page-Scraping aktivieren

default:enable_web_search=on&enable_web_scraping=true

Einen Character verwenden

default:character_slug=alan-watts

Thinking-Blöcke in einer Reasoning-Modell-Antwort ausblenden

qwen3-4b:strip_thinking_response=true

Thinking auf unterstützten Reasoning-Modellen deaktivieren

Bestimmte Reasoning-Modelle (wie Qwen 3) unterstützen das Deaktivieren des Thinking-Prozesses. Sie können dies über das folgende Suffix aktivieren:
qwen3-4b:disable_thinking=true

Web-Search-Ergebnisse zu einer Streaming-Antwort hinzufügen

Dies aktiviert Web Search, fügt Zitate zum Antworttext hinzu und nimmt die Suchergebnisse als finale Antwortnachricht in den Stream auf. Ein Beispiel dazu finden Sie in unserer Postman Collection hier.
qwen3-4b:enable_web_search=on&enable_web_citations=true&include_search_results_in_stream=true

Postman-Beispiel

Sie können ein Beispiel für diese Funktion in unserer Postman Collection hier ansehen.