Einrichtung
Chat-Modelle
VerwendeChatOpenAI mit der Base URL von Venice:
Streaming
Embeddings
Chains
Einfache Chain mit Prompt-Template
Sequenzielle Chain
RAG-Pipeline
Baue eine Retrieval-Augmented-Generation-Pipeline mit Venice:Function Calling mit Agenten
Structured Output
Web-Search-Integration
Nutze Venices integrierte Websuche übervenice_parameters:
Empfohlene Modelle für LangChain
| Anwendungsfall | Modell | Warum |
|---|---|---|
| Allgemeine Chains | venice-uncensored | Schnell, günstig, unzensiert |
| Komplexes Reasoning | zai-org-glm-5-1 | Bestes privates Flaggschiff-Modell |
| Function Calling | zai-org-glm-5-1 | Zuverlässige Tool-Nutzung |
| Vision + Text | qwen3-vl-235b-a22b | Fortschrittliches Vision-Verständnis |
| Code-Generierung | qwen3-coder-480b-a35b-instruct | Für Code optimiert |
| Embeddings (RAG) | text-embedding-bge-m3 | Private Embeddings |
| Budget / hohes Volumen | qwen3-5-9b | $0,10/1M Input |
Alle Modelle ansehen
Durchsuche alle Venice-Modelle mit Preisen und Funktionen