Paga per token
Nessun abbonamento. Paghi solo per ciò che usi
Modelli Claude
Accedi a Opus 4.5/4.6 e Sonnet 4.5/4.6 tramite Venice
Prompt caching
Il caching di Venice funziona insieme a Claude Code
Perché serve un router
Claude Code si connette direttamente all’API di Anthropic per impostazione predefinita. Per usarlo con Venice, hai bisogno di claude-code-router, un proxy locale open source che:Prerequisiti
Account Venice
Con crediti API
Node.js
v18 o superiore
Claude Code
Installato via npm
Configurazione
Ottieni la tua API key
Genera una chiave da venice.ai/settings/api. La incollerai direttamente nel file di configurazione nel prossimo passaggio.
Crea la configurazione
Crea la directory di configurazione:Quindi crea Incolla la seguente configurazione:
~/.claude-code-router/config.json con il tuo editor preferito:Se modifichi
config.json mentre il router è in esecuzione, riavvialo con ccr restart per applicare le modifiche.Modelli supportati
| Modello | ID Venice | Ideale per |
|---|---|---|
| Claude Opus 4.5 | claude-opus-4-5 | Ragionamento complesso, refactor di grandi dimensioni |
| Claude Sonnet 4.5 | claude-sonnet-4-5 | Iterazione veloce, coding quotidiano |
| Claude Opus 4.6 | claude-opus-4-6 | Ragionamento complesso, refactor di grandi dimensioni |
| Claude Opus 4.6 Fast | claude-opus-4-6-fast | Ragionamento complesso con latenza inferiore |
| Claude Sonnet 4.6 | claude-sonnet-4-6 | Iterazione veloce, coding quotidiano |
Claude Code è ottimizzato per i modelli Claude. Sebbene altri modelli disponibili tramite Venice (GPT, DeepSeek, Grok, ecc.) possano funzionare, non possiamo garantire un’esperienza equivalente poiché Claude Code si basa su funzionalità specifiche di Claude come l’extended thinking. Per altri modelli, considera l’uso dell’API standard di Venice.
Funzionalità del router
Il router fornisce diverse funzionalità utili oltre al routing di base:Cambia modello al volo
Cambia modello al volo
Usa il comando Utile quando vuoi Opus per compiti complessi e Sonnet per iterazioni veloci.
/model all’interno di Claude Code per cambiare modello senza riavviare:Configurazione visiva con modalità UI
Configurazione visiva con modalità UI
Preferisci una GUI? Avvia l’editor di configurazione web:Questo apre un’interfaccia browser per modificare il tuo
config.json senza toccare direttamente il file.Scenari del router spiegati
Scenari del router spiegati
La sezione di configurazione
Puoi instradare scenari diversi verso modelli diversi. Ad esempio, usa Sonnet per i compiti in background per risparmiare sui costi.
Router controlla quale modello gestisce diversi tipi di compito:| Scenario | Quando viene usato |
|---|---|
default | Richieste generali |
think | Compiti ad alto contenuto di ragionamento (Plan Mode) |
background | Operazioni in background |
longContext | Quando il contesto supera la soglia longContextThreshold in token |
Debug con i log
Debug con i log
Se qualcosa non funziona, controlla i log:Imposta
"LOG_LEVEL": "debug" nella tua configurazione per un output più verboso.Comportamento della cache
Il prompt caching di Venice funziona insieme ai marker di cache nativi di Claude Code. Venice rileva automaticamente quando Claude Code invia campicache_control e adatta di conseguenza la sua strategia di caching.
| Scenario | TTL della cache | Chi controlla |
|---|---|---|
| Default (consigliato) | 5 minuti | Claude Code + Venice |
Con transformer cleancache | 1 ora | Solo Venice |
Quando NON usare cleancache (la maggior parte degli utenti)
Quando NON usare cleancache (la maggior parte degli utenti)
La configurazione predefinita consente a entrambi i sistemi di cooperare:
- Claude Code invia i suoi marker
cache_controlnativi - Venice aggiunge il caching attorno con un TTL di 5 minuti
- Entrambi i sistemi condividono il limite di 4 blocchi di cache
Quando usare cleancache
Quando usare cleancache
Aggiungi Questo rimuove i marker di cache di Claude Code, dando a Venice il pieno controllo con un TTL più lungo.
cleancache al transformer se:- Stai raggiungendo gli errori del limite di 4 blocchi di cache
- Sperimenti comportamenti strani della cache
- Preferisci il TTL di 1 ora di Venice per sessioni più lunghe
Risorse
Documentazione API Venice
Riferimento completo dell’API
claude-code-router
Codice sorgente e issue