Passer au contenu principal
Claude Code est l’outil CLI d’Anthropic pour le codage agentique. Ce guide vous montre comment l’exécuter via Venice AI pour un accès à l’usage à Claude Opus 4.5/4.6 et Sonnet 4.5/4.6.

Paiement à l'usage

Pas d’abonnement. Payez uniquement ce que vous utilisez

Modèles Claude

Accédez à Opus 4.5/4.6 et Sonnet 4.5/4.6 via Venice

Mise en cache des prompts

Le cache Venice fonctionne en complément de Claude Code

Pourquoi un routeur est nécessaire

Claude Code se connecte directement à l’API d’Anthropic par défaut. Pour l’utiliser avec Venice, vous avez besoin de claude-code-router, un proxy local open source qui :

Intercepte

Capture les requêtes sortantes de Claude Code avant qu’elles n’atteignent Anthropic

Transforme

Convertit le format des requêtes et mappe les identifiants de modèles (par ex. claude-opus-4-5)

Redirige

Achemine les requêtes vers Venice à api.venice.ai/api/v1/chat/completions

Prérequis

Compte Venice

Avec des crédits API

Node.js

v18 ou supérieur

Claude Code

Installé via npm

Configuration

1

Installez Claude Code

Si ce n’est pas déjà fait, installez la CLI Claude Code d’Anthropic :
npm install -g @anthropic-ai/claude-code
2

Installez le routeur

npm install -g @musistudio/claude-code-router
3

Obtenez votre clé API

Générez une clé depuis venice.ai/settings/api. Vous la collerez directement dans le fichier de configuration à l’étape suivante.
4

Créez la configuration

Créez le répertoire de configuration :
mkdir -p ~/.claude-code-router
Puis créez ~/.claude-code-router/config.json avec votre éditeur préféré :
# Avec nano
nano ~/.claude-code-router/config.json

# Ou avec VS Code
code ~/.claude-code-router/config.json
Collez la configuration suivante :
{
  "APIKEY": "",
  "LOG": true,
  "LOG_LEVEL": "info",
  "API_TIMEOUT_MS": 600000,
  "HOST": "127.0.0.1",
  "Providers": [
    {
      "name": "venice",
      "api_base_url": "https://api.venice.ai/api/v1/chat/completions",
      "api_key": "your-venice-api-key-here",
      "models": [
        "claude-opus-4-5",
        "claude-sonnet-4-5",
        "claude-opus-4-6",
        "claude-opus-4-6-fast",
        "claude-sonnet-4-6"
      ],
      "transformer": {
        "use": ["anthropic"]
      }
    }
  ],
  "Router": {
    "default": "venice,claude-opus-4-5",
    "think": "venice,claude-opus-4-5",
    "background": "venice,claude-opus-4-5",
    "longContext": "venice,claude-opus-4-5",
    "longContextThreshold": 100000
  }
}
Si vous modifiez config.json pendant que le routeur tourne, redémarrez-le avec ccr restart pour appliquer les changements.
5

Lancement

Démarrez le routeur, puis Claude Code :
ccr start
ccr code
Ou utilisez la méthode d’activation :
eval "$(ccr activate)" && claude

Modèles pris en charge

ModèleID VeniceIdéal pour
Claude Opus 4.5claude-opus-4-5Raisonnement complexe, refactorisations importantes
Claude Sonnet 4.5claude-sonnet-4-5Itérations rapides, codage quotidien
Claude Opus 4.6claude-opus-4-6Raisonnement complexe, refactorisations importantes
Claude Opus 4.6 Fastclaude-opus-4-6-fastRaisonnement complexe avec latence réduite
Claude Sonnet 4.6claude-sonnet-4-6Itérations rapides, codage quotidien
Claude Code est optimisé pour les modèles Claude. Bien que d’autres modèles disponibles via Venice (GPT, DeepSeek, Grok, etc.) puissent fonctionner, nous ne pouvons pas garantir une expérience équivalente, car Claude Code s’appuie sur des fonctionnalités spécifiques à Claude comme la réflexion étendue. Pour les autres modèles, envisagez d’utiliser l’API standard de Venice.

Fonctionnalités du routeur

Le routeur offre plusieurs fonctionnalités utiles au-delà du routage de base :
Utilisez la commande /model dans Claude Code pour changer de modèle sans redémarrer :
/model venice,claude-sonnet-4-5
Pratique lorsque vous voulez Opus pour les tâches complexes et Sonnet pour les itérations rapides.
Vous préférez une interface graphique ? Lancez l’éditeur de configuration web :
ccr ui
Cela ouvre une interface dans le navigateur pour modifier votre config.json sans toucher au fichier directement.
La section Router de la configuration contrôle quel modèle gère chaque type de tâche :
ScénarioQuand est-il utilisé
defaultRequêtes générales
thinkTâches de raisonnement intensif (Plan Mode)
backgroundOpérations d’arrière-plan
longContextQuand le contexte dépasse longContextThreshold tokens
Vous pouvez router différents scénarios vers différents modèles. Par exemple, utilisez Sonnet pour les tâches d’arrière-plan afin de réduire les coûts.
Si quelque chose ne fonctionne pas, consultez les logs :
# Logs du serveur (HTTP, appels d'API)
~/.claude-code-router/logs/ccr-*.log

# Logs applicatifs (décisions de routage)
~/.claude-code-router/claude-code-router.log
Définissez "LOG_LEVEL": "debug" dans votre configuration pour des sorties plus verbeuses.

Comportement de la mise en cache

Le prompt caching de Venice fonctionne en parallèle des marqueurs de cache natifs de Claude Code. Venice détecte automatiquement lorsque Claude Code envoie des champs cache_control et ajuste sa stratégie de cache en conséquence.
ScénarioTTL du cacheQui contrôle
Par défaut (recommandé)5 minutesClaude Code + Venice
Avec le transformeur cleancache1 heureVenice uniquement
La configuration par défaut permet aux deux systèmes de coopérer :
  • Claude Code envoie ses marqueurs cache_control natifs
  • Venice ajoute un cache autour avec un TTL de 5 minutes
  • Les deux systèmes partagent la limite de 4 blocs de cache
Cela fonctionne bien pour les sessions de codage actives où vous faites des requêtes fréquentes.
Ajoutez cleancache au transformeur si vous :
  • Atteignez des erreurs de limite de 4 blocs de cache
  • Constatez un comportement étrange de mise en cache
  • Préférez le TTL d’1 heure de Venice pour les sessions plus longues
"transformer": {
  "use": ["anthropic", "cleancache"]
}
Cela retire les marqueurs de cache de Claude Code, donnant à Venice un contrôle complet avec un TTL plus long.

Ressources

Docs de l'API Venice

Référence complète de l’API

claude-code-router

Code source et issues