Vai al contenuto principale
Claude Code è lo strumento CLI di Anthropic per il coding agentico. Questa guida ti mostra come eseguirlo tramite Venice AI per l’accesso pay-per-token a Claude Opus 4.5/4.6 e Sonnet 4.5/4.6.

Paga per token

Nessun abbonamento. Paghi solo per ciò che usi

Modelli Claude

Accedi a Opus 4.5/4.6 e Sonnet 4.5/4.6 tramite Venice

Prompt caching

Il caching di Venice funziona insieme a Claude Code

Perché serve un router

Claude Code si connette direttamente all’API di Anthropic per impostazione predefinita. Per usarlo con Venice, hai bisogno di claude-code-router, un proxy locale open source che:

Intercetta

Cattura le richieste in uscita di Claude Code prima che raggiungano Anthropic

Trasforma

Converte il formato della richiesta e mappa gli ID dei modelli (es. claude-opus-4-5)

Reindirizza

Inoltra le richieste a Venice su api.venice.ai/api/v1/chat/completions

Prerequisiti

Account Venice

Con crediti API

Node.js

v18 o superiore

Claude Code

Installato via npm

Configurazione

1

Installa Claude Code

Se non l’hai già fatto, installa la CLI Claude Code di Anthropic:
npm install -g @anthropic-ai/claude-code
2

Installa il router

npm install -g @musistudio/claude-code-router
3

Ottieni la tua API key

Genera una chiave da venice.ai/settings/api. La incollerai direttamente nel file di configurazione nel prossimo passaggio.
4

Crea la configurazione

Crea la directory di configurazione:
mkdir -p ~/.claude-code-router
Quindi crea ~/.claude-code-router/config.json con il tuo editor preferito:
# Usando nano
nano ~/.claude-code-router/config.json

# O usando VS Code
code ~/.claude-code-router/config.json
Incolla la seguente configurazione:
{
  "APIKEY": "",
  "LOG": true,
  "LOG_LEVEL": "info",
  "API_TIMEOUT_MS": 600000,
  "HOST": "127.0.0.1",
  "Providers": [
    {
      "name": "venice",
      "api_base_url": "https://api.venice.ai/api/v1/chat/completions",
      "api_key": "your-venice-api-key-here",
      "models": [
        "claude-opus-4-5",
        "claude-sonnet-4-5",
        "claude-opus-4-6",
        "claude-opus-4-6-fast",
        "claude-sonnet-4-6"
      ],
      "transformer": {
        "use": ["anthropic"]
      }
    }
  ],
  "Router": {
    "default": "venice,claude-opus-4-5",
    "think": "venice,claude-opus-4-5",
    "background": "venice,claude-opus-4-5",
    "longContext": "venice,claude-opus-4-5",
    "longContextThreshold": 100000
  }
}
Se modifichi config.json mentre il router è in esecuzione, riavvialo con ccr restart per applicare le modifiche.
5

Avvio

Avvia il router, poi Claude Code:
ccr start
ccr code
Oppure usa il metodo di attivazione:
eval "$(ccr activate)" && claude

Modelli supportati

ModelloID VeniceIdeale per
Claude Opus 4.5claude-opus-4-5Ragionamento complesso, refactor di grandi dimensioni
Claude Sonnet 4.5claude-sonnet-4-5Iterazione veloce, coding quotidiano
Claude Opus 4.6claude-opus-4-6Ragionamento complesso, refactor di grandi dimensioni
Claude Opus 4.6 Fastclaude-opus-4-6-fastRagionamento complesso con latenza inferiore
Claude Sonnet 4.6claude-sonnet-4-6Iterazione veloce, coding quotidiano
Claude Code è ottimizzato per i modelli Claude. Sebbene altri modelli disponibili tramite Venice (GPT, DeepSeek, Grok, ecc.) possano funzionare, non possiamo garantire un’esperienza equivalente poiché Claude Code si basa su funzionalità specifiche di Claude come l’extended thinking. Per altri modelli, considera l’uso dell’API standard di Venice.

Funzionalità del router

Il router fornisce diverse funzionalità utili oltre al routing di base:
Usa il comando /model all’interno di Claude Code per cambiare modello senza riavviare:
/model venice,claude-sonnet-4-5
Utile quando vuoi Opus per compiti complessi e Sonnet per iterazioni veloci.
Preferisci una GUI? Avvia l’editor di configurazione web:
ccr ui
Questo apre un’interfaccia browser per modificare il tuo config.json senza toccare direttamente il file.
La sezione di configurazione Router controlla quale modello gestisce diversi tipi di compito:
ScenarioQuando viene usato
defaultRichieste generali
thinkCompiti ad alto contenuto di ragionamento (Plan Mode)
backgroundOperazioni in background
longContextQuando il contesto supera la soglia longContextThreshold in token
Puoi instradare scenari diversi verso modelli diversi. Ad esempio, usa Sonnet per i compiti in background per risparmiare sui costi.
Se qualcosa non funziona, controlla i log:
# Log del server (HTTP, chiamate API)
~/.claude-code-router/logs/ccr-*.log

# Log dell'applicazione (decisioni di routing)
~/.claude-code-router/claude-code-router.log
Imposta "LOG_LEVEL": "debug" nella tua configurazione per un output più verboso.

Comportamento della cache

Il prompt caching di Venice funziona insieme ai marker di cache nativi di Claude Code. Venice rileva automaticamente quando Claude Code invia campi cache_control e adatta di conseguenza la sua strategia di caching.
ScenarioTTL della cacheChi controlla
Default (consigliato)5 minutiClaude Code + Venice
Con transformer cleancache1 oraSolo Venice
La configurazione predefinita consente a entrambi i sistemi di cooperare:
  • Claude Code invia i suoi marker cache_control nativi
  • Venice aggiunge il caching attorno con un TTL di 5 minuti
  • Entrambi i sistemi condividono il limite di 4 blocchi di cache
Funziona bene per sessioni di coding attive in cui fai richieste frequenti.
Aggiungi cleancache al transformer se:
  • Stai raggiungendo gli errori del limite di 4 blocchi di cache
  • Sperimenti comportamenti strani della cache
  • Preferisci il TTL di 1 ora di Venice per sessioni più lunghe
"transformer": {
  "use": ["anthropic", "cleancache"]
}
Questo rimuove i marker di cache di Claude Code, dando a Venice il pieno controllo con un TTL più lungo.

Risorse

Documentazione API Venice

Riferimento completo dell’API

claude-code-router

Codice sorgente e issue