Claude Code with Venice | Venice API Docs

Claude Code è lo strumento CLI di Anthropic per il coding agentico. Questa guida ti mostra come eseguirlo tramite Venice AI per l’accesso pay-per-token a Claude Opus 4.5/4.6/4.7/4.8, Sonnet 4.5/4.6/4.7/4.8 e Fable 5.

Paga per token

Nessun abbonamento. Paghi solo per ciò che usi

Modelli Claude

Accedi a Opus 4.5/4.6/4.7/4.8, Sonnet 4.5/4.6/4.7/4.8 e Fable 5 tramite Venice

Prompt caching

Il caching di Venice funziona insieme a Claude Code

Perché serve un router

Claude Code si connette direttamente all’API di Anthropic per impostazione predefinita. Per usarlo con Venice, hai bisogno di claude-code-router, un proxy locale open source che:

Intercetta

Cattura le richieste in uscita di Claude Code prima che raggiungano Anthropic

Trasforma

Converte il formato della richiesta e mappa gli ID dei modelli (es. claude-opus-4-5)

Reindirizza

Inoltra le richieste a Venice su api.venice.ai/api/v1/chat/completions

Prerequisiti

Account Venice

Con crediti API

Node.js

v18 o superiore

Claude Code

Installato via npm

Configurazione

Installa Claude Code

Se non l’hai già fatto, installa la CLI Claude Code di Anthropic:

npm install -g @anthropic-ai/claude-code

Installa il router

npm install -g @musistudio/claude-code-router

Ottieni la tua API key

Genera una chiave da venice.ai/settings/api. La incollerai direttamente nel file di configurazione nel prossimo passaggio.

Crea la configurazione

Crea la directory di configurazione:

mkdir -p ~/.claude-code-router

Quindi crea ~/.claude-code-router/config.json con il tuo editor preferito:

# Usando nano
nano ~/.claude-code-router/config.json

# O usando VS Code
code ~/.claude-code-router/config.json

Incolla la seguente configurazione:

{
  "APIKEY": "",
  "LOG": true,
  "LOG_LEVEL": "info",
  "API_TIMEOUT_MS": 600000,
  "HOST": "127.0.0.1",
  "Providers": [
    {
      "name": "venice",
      "api_base_url": "https://api.venice.ai/api/v1/chat/completions",
      "api_key": "your-venice-api-key-here",
      "models": [
        "claude-opus-4-5",
        "claude-sonnet-4-5",
        "claude-opus-4-6",
        "claude-opus-4-6-fast",
        "claude-sonnet-4-6",
        "claude-opus-4-7",
        "claude-opus-4-7-fast",
        "claude-opus-4-8",
        "claude-opus-4-8-fast",
        "claude-fable-5"
      ],
      "transformer": {
        "use": ["anthropic"]
      }
    }
  ],
  "Router": {
    "default": "venice,claude-opus-4-8",
    "think": "venice,claude-opus-4-8",
    "background": "venice,claude-opus-4-8",
    "longContext": "venice,claude-opus-4-8",
    "longContextThreshold": 100000
  }
}

Se modifichi config.json mentre il router è in esecuzione, riavvialo con ccr restart per applicare le modifiche.

Avvio

Avvia il router, poi Claude Code:

ccr start
ccr code

Oppure usa il metodo di attivazione:

eval "$(ccr activate)" && claude

Modelli supportati

Modello	ID Venice	Ideale per
Claude Opus 4.5	`claude-opus-4-5`	Ragionamento complesso, refactor di grandi dimensioni
Claude Sonnet 4.5	`claude-sonnet-4-5`	Iterazione veloce, coding quotidiano
Claude Opus 4.6	`claude-opus-4-6`	Ragionamento complesso, refactor di grandi dimensioni
Claude Opus 4.6 Fast	`claude-opus-4-6-fast`	Ragionamento complesso con latenza inferiore
Claude Sonnet 4.6	`claude-sonnet-4-6`	Iterazione veloce, coding quotidiano
Claude Opus 4.7	`claude-opus-4-7`	Ragionamento complesso, refactor di grandi dimensioni
Claude Opus 4.7 Fast	`claude-opus-4-7-fast`	Ragionamento complesso con latenza inferiore
Claude Opus 4.8	`claude-opus-4-8`	Ragionamento complesso, refactor di grandi dimensioni
Claude Opus 4.8 Fast	`claude-opus-4-8-fast`	Ragionamento complesso con latenza inferiore
Claude Fable 5	`claude-fable-5`	Attività complesse che richiedono la massima intelligenza

Claude Code è ottimizzato per i modelli Claude. Sebbene altri modelli disponibili tramite Venice (GPT, DeepSeek, Grok, ecc.) possano funzionare, non possiamo garantire un’esperienza equivalente poiché Claude Code si basa su funzionalità specifiche di Claude come l’extended thinking. Per altri modelli, considera l’uso dell’API standard di Venice.

Funzionalità del router

Il router fornisce diverse funzionalità utili oltre al routing di base:

Cambia modello al volo

Usa il comando /model all’interno di Claude Code per cambiare modello senza riavviare:

/model venice,claude-sonnet-4-5

Utile quando vuoi Opus per compiti complessi e Sonnet per iterazioni veloci.

Configurazione visiva con modalità UI

Preferisci una GUI? Avvia l’editor di configurazione web:

ccr ui

Questo apre un’interfaccia browser per modificare il tuo config.json senza toccare direttamente il file.

Scenari del router spiegati

La sezione di configurazione Router controlla quale modello gestisce diversi tipi di compito:

Scenario	Quando viene usato
`default`	Richieste generali
`think`	Compiti ad alto contenuto di ragionamento (Plan Mode)
`background`	Operazioni in background
`longContext`	Quando il contesto supera la soglia `longContextThreshold` in token

Puoi instradare scenari diversi verso modelli diversi. Ad esempio, usa Sonnet per i compiti in background per risparmiare sui costi.

Debug con i log

Se qualcosa non funziona, controlla i log:

# Log del server (HTTP, chiamate API)
~/.claude-code-router/logs/ccr-*.log

# Log dell'applicazione (decisioni di routing)
~/.claude-code-router/claude-code-router.log

Imposta "LOG_LEVEL": "debug" nella tua configurazione per un output più verboso.

Comportamento della cache

Il prompt caching di Venice funziona insieme ai marker di cache nativi di Claude Code. Venice rileva automaticamente quando Claude Code invia campi cache_control e adatta di conseguenza la sua strategia di caching.

Scenario	TTL della cache	Chi controlla
Default (consigliato)	5 minuti	Claude Code + Venice
Con transformer `cleancache`	1 ora	Solo Venice

Quando NON usare cleancache (la maggior parte degli utenti)

La configurazione predefinita consente a entrambi i sistemi di cooperare:

Claude Code invia i suoi marker cache_control nativi
Venice aggiunge il caching attorno con un TTL di 5 minuti
Entrambi i sistemi condividono il limite di 4 blocchi di cache

Funziona bene per sessioni di coding attive in cui fai richieste frequenti.

Quando usare cleancache

Aggiungi cleancache al transformer se:

Stai raggiungendo gli errori del limite di 4 blocchi di cache
Sperimenti comportamenti strani della cache
Preferisci il TTL di 1 ora di Venice per sessioni più lunghe

"transformer": {
  "use": ["anthropic", "cleancache"]
}

Questo rimuove i marker di cache di Claude Code, dando a Venice il pieno controllo con un TTL più lungo.

Documentazione

Per iniziare

Testo e chat

Immagini, video e audio

Ricerca e RAG

Agenti e integrazioni

Strumenti di sviluppo

Strumenti per agenti

SDK e framework

Claude Code

Paga per token

Modelli Claude

Prompt caching

Perché serve un router

Prerequisiti

Account Venice

Node.js

Claude Code

Configurazione

Modelli supportati

Funzionalità del router

Comportamento della cache

Risorse

Documentazione API Venice

claude-code-router

Paga per token

Modelli Claude

Prompt caching

​Perché serve un router

​Prerequisiti

Account Venice

Node.js

Claude Code

​Configurazione

​Modelli supportati

​Funzionalità del router

​Comportamento della cache

​Risorse

Documentazione API Venice

claude-code-router

Perché serve un router

Prerequisiti

Configurazione

Modelli supportati

Funzionalità del router

Comportamento della cache

Risorse