Setup
Modelli chat
UsaChatOpenAI con il base URL di Venice:
Streaming
Embeddings
Chain
Chain semplice con template di prompt
Chain sequenziale
Pipeline RAG
Costruisci una pipeline retrieval-augmented generation con Venice:Function calling con agenti
Output strutturato
Integrazione Web Search
Usa la web search integrata di Venice tramitevenice_parameters:
Modelli consigliati per LangChain
| Caso d’uso | Modello | Perché |
|---|---|---|
| Chain generiche | venice-uncensored | Veloce, economico, senza restrizioni |
| Ragionamento complesso | zai-org-glm-5-1 | Miglior modello di punta privato |
| Function calling | zai-org-glm-5-1 | Uso affidabile dei tool |
| Vision + testo | qwen3-vl-235b-a22b | Comprensione vision avanzata |
| Generazione di codice | qwen3-coder-480b-a35b-instruct | Ottimizzato per il codice |
| Embeddings (RAG) | text-embedding-bge-m3 | Embedding privati |
| Budget / alto volume | qwen3-5-9b | $0,10/1M input |
Vedi tutti i modelli
Sfoglia tutti i modelli Venice con prezzi e capacità