Pay Per Token
Kein Abo. Zahle nur, was du nutzt
Claude-Modelle
Zugriff auf Opus 4.5/4.6 und Sonnet 4.5/4.6 über Venice
Prompt Caching
Venice-Caching funktioniert zusammen mit Claude Code
Warum du einen Router brauchst
Claude Code verbindet sich standardmäßig direkt mit Anthropics API. Um es mit Venice zu verwenden, brauchst du claude-code-router, einen quelloffenen lokalen Proxy, der:Voraussetzungen
Venice-Konto
Mit API-Credits
Node.js
v18 oder höher
Claude Code
Per npm installiert
Einrichtung
API-Schlüssel erstellen
Erstelle einen Schlüssel unter venice.ai/settings/api. Du fügst ihn im nächsten Schritt direkt in die Konfigurationsdatei ein.
Konfiguration erstellen
Erstelle das Konfigurationsverzeichnis:Erstelle dann Füge die folgende Konfiguration ein:
~/.claude-code-router/config.json mit deinem bevorzugten Editor:Wenn du
config.json änderst, während der Router läuft, starte ihn mit ccr restart neu, um die Änderungen anzuwenden.Unterstützte Modelle
| Modell | Venice-ID | Geeignet für |
|---|---|---|
| Claude Opus 4.5 | claude-opus-4-5 | Komplexes Reasoning, große Refactorings |
| Claude Sonnet 4.5 | claude-sonnet-4-5 | Schnelle Iteration, Alltags-Coding |
| Claude Opus 4.6 | claude-opus-4-6 | Komplexes Reasoning, große Refactorings |
| Claude Opus 4.6 Fast | claude-opus-4-6-fast | Komplexes Reasoning mit geringerer Latenz |
| Claude Sonnet 4.6 | claude-sonnet-4-6 | Schnelle Iteration, Alltags-Coding |
Claude Code ist für Claude-Modelle optimiert. Andere über Venice verfügbare Modelle (GPT, DeepSeek, Grok usw.) funktionieren möglicherweise, aber wir können keine gleichwertige Erfahrung garantieren, da Claude Code auf Claude-spezifische Funktionen wie Extended Thinking setzt. Für andere Modelle erwäge die Nutzung der Standard-API von Venice.
Router-Funktionen
Der Router bietet mehrere nützliche Funktionen über das einfache Routing hinaus:Modelle on the fly wechseln
Modelle on the fly wechseln
Verwende den Befehl Nützlich, wenn du Opus für komplexe Aufgaben und Sonnet für schnelle Iterationen verwenden möchtest.
/model innerhalb von Claude Code, um Modelle ohne Neustart zu wechseln:Visuelle Konfiguration im UI-Modus
Visuelle Konfiguration im UI-Modus
Lieber eine GUI? Starte den webbasierten Konfigurations-Editor:Damit öffnet sich eine Browser-Oberfläche zum Bearbeiten deiner
config.json, ohne die Datei direkt anzufassen.Router-Szenarien erklärt
Router-Szenarien erklärt
Der
Du kannst unterschiedliche Szenarien an unterschiedliche Modelle routen. Zum Beispiel Sonnet für Hintergrund-Aufgaben verwenden, um Kosten zu sparen.
Router-Abschnitt der Konfiguration steuert, welches Modell unterschiedliche Aufgabentypen bearbeitet:| Szenario | Wann es verwendet wird |
|---|---|
default | Allgemeine Anfragen |
think | Reasoning-intensive Aufgaben (Plan-Modus) |
background | Hintergrund-Operationen |
longContext | Wenn der Kontext den Wert longContextThreshold an Tokens überschreitet |
Debugging mit Logs
Debugging mit Logs
Wenn etwas nicht funktioniert, prüfe die Logs:Setze
"LOG_LEVEL": "debug" in deiner Konfiguration für ausführlichere Ausgaben.Caching-Verhalten
Venice Prompt Caching funktioniert zusammen mit Claude Codes nativen Cache-Markern. Venice erkennt automatisch, wenn Claude Codecache_control-Felder sendet, und passt seine Caching-Strategie entsprechend an.
| Szenario | Cache-TTL | Wer steuert |
|---|---|---|
| Default (empfohlen) | 5 Minuten | Claude Code + Venice |
Mit cleancache-Transformer | 1 Stunde | Nur Venice |
Wann KEIN cleancache (die meisten Nutzer)
Wann KEIN cleancache (die meisten Nutzer)
Die Standardkonfiguration lässt beide Systeme kooperieren:
- Claude Code sendet seine nativen
cache_control-Marker - Venice fügt Caching mit einer TTL von 5 Minuten hinzu
- Beide Systeme teilen sich das 4-Block-Cache-Limit
Wann cleancache verwenden
Wann cleancache verwenden
Füge Damit werden Claude Codes Cache-Marker entfernt, und Venice erhält die volle Kontrolle mit längerer TTL.
cleancache zum Transformer hinzu, wenn du:- Fehler wegen des 4-Block-Cache-Limits bekommst
- Seltsames Caching-Verhalten erlebst
- Venices 1-Stunden-TTL für längere Sessions bevorzugst
Ressourcen
Venice API Docs
Vollständige API-Referenz
claude-code-router
Quellcode und Issues