Paiement à l'usage
Pas d’abonnement. Payez uniquement ce que vous utilisez
Modèles Claude
Accédez à Opus 4.5/4.6 et Sonnet 4.5/4.6 via Venice
Mise en cache des prompts
Le cache Venice fonctionne en complément de Claude Code
Pourquoi un routeur est nécessaire
Claude Code se connecte directement à l’API d’Anthropic par défaut. Pour l’utiliser avec Venice, vous avez besoin de claude-code-router, un proxy local open source qui :Transforme
Convertit le format des requêtes et mappe les identifiants de modèles (par ex.
claude-opus-4-5)Prérequis
Compte Venice
Avec des crédits API
Node.js
v18 ou supérieur
Claude Code
Installé via npm
Configuration
Obtenez votre clé API
Générez une clé depuis venice.ai/settings/api. Vous la collerez directement dans le fichier de configuration à l’étape suivante.
Créez la configuration
Créez le répertoire de configuration :Puis créez Collez la configuration suivante :
~/.claude-code-router/config.json avec votre éditeur préféré :Si vous modifiez
config.json pendant que le routeur tourne, redémarrez-le avec ccr restart pour appliquer les changements.Modèles pris en charge
| Modèle | ID Venice | Idéal pour |
|---|---|---|
| Claude Opus 4.5 | claude-opus-4-5 | Raisonnement complexe, refactorisations importantes |
| Claude Sonnet 4.5 | claude-sonnet-4-5 | Itérations rapides, codage quotidien |
| Claude Opus 4.6 | claude-opus-4-6 | Raisonnement complexe, refactorisations importantes |
| Claude Opus 4.6 Fast | claude-opus-4-6-fast | Raisonnement complexe avec latence réduite |
| Claude Sonnet 4.6 | claude-sonnet-4-6 | Itérations rapides, codage quotidien |
Claude Code est optimisé pour les modèles Claude. Bien que d’autres modèles disponibles via Venice (GPT, DeepSeek, Grok, etc.) puissent fonctionner, nous ne pouvons pas garantir une expérience équivalente, car Claude Code s’appuie sur des fonctionnalités spécifiques à Claude comme la réflexion étendue. Pour les autres modèles, envisagez d’utiliser l’API standard de Venice.
Fonctionnalités du routeur
Le routeur offre plusieurs fonctionnalités utiles au-delà du routage de base :Changez de modèle à la volée
Changez de modèle à la volée
Utilisez la commande Pratique lorsque vous voulez Opus pour les tâches complexes et Sonnet pour les itérations rapides.
/model dans Claude Code pour changer de modèle sans redémarrer :Configuration visuelle avec le mode UI
Configuration visuelle avec le mode UI
Vous préférez une interface graphique ? Lancez l’éditeur de configuration web :Cela ouvre une interface dans le navigateur pour modifier votre
config.json sans toucher au fichier directement.Explication des scénarios du routeur
Explication des scénarios du routeur
La section
Vous pouvez router différents scénarios vers différents modèles. Par exemple, utilisez Sonnet pour les tâches d’arrière-plan afin de réduire les coûts.
Router de la configuration contrôle quel modèle gère chaque type de tâche :| Scénario | Quand est-il utilisé |
|---|---|
default | Requêtes générales |
think | Tâches de raisonnement intensif (Plan Mode) |
background | Opérations d’arrière-plan |
longContext | Quand le contexte dépasse longContextThreshold tokens |
Débogage avec les logs
Débogage avec les logs
Si quelque chose ne fonctionne pas, consultez les logs :Définissez
"LOG_LEVEL": "debug" dans votre configuration pour des sorties plus verbeuses.Comportement de la mise en cache
Le prompt caching de Venice fonctionne en parallèle des marqueurs de cache natifs de Claude Code. Venice détecte automatiquement lorsque Claude Code envoie des champscache_control et ajuste sa stratégie de cache en conséquence.
| Scénario | TTL du cache | Qui contrôle |
|---|---|---|
| Par défaut (recommandé) | 5 minutes | Claude Code + Venice |
Avec le transformeur cleancache | 1 heure | Venice uniquement |
Quand NE PAS utiliser cleancache (la plupart des utilisateurs)
Quand NE PAS utiliser cleancache (la plupart des utilisateurs)
La configuration par défaut permet aux deux systèmes de coopérer :
- Claude Code envoie ses marqueurs
cache_controlnatifs - Venice ajoute un cache autour avec un TTL de 5 minutes
- Les deux systèmes partagent la limite de 4 blocs de cache
Quand utiliser cleancache
Quand utiliser cleancache
Ajoutez Cela retire les marqueurs de cache de Claude Code, donnant à Venice un contrôle complet avec un TTL plus long.
cleancache au transformeur si vous :- Atteignez des erreurs de limite de 4 blocs de cache
- Constatez un comportement étrange de mise en cache
- Préférez le TTL d’1 heure de Venice pour les sessions plus longues
Ressources
Docs de l'API Venice
Référence complète de l’API
claude-code-router
Code source et issues