Zum Hauptinhalt springen
Claude Code ist Anthropics CLI-Tool für agentisches Coden. Diese Anleitung zeigt dir, wie du es über Venice AI betreibst, um Claude Opus 4.5/4.6 und Sonnet 4.5/4.6 pro Token zu bezahlen.

Pay Per Token

Kein Abo. Zahle nur, was du nutzt

Claude-Modelle

Zugriff auf Opus 4.5/4.6 und Sonnet 4.5/4.6 über Venice

Prompt Caching

Venice-Caching funktioniert zusammen mit Claude Code

Warum du einen Router brauchst

Claude Code verbindet sich standardmäßig direkt mit Anthropics API. Um es mit Venice zu verwenden, brauchst du claude-code-router, einen quelloffenen lokalen Proxy, der:

abfängt

fängt ausgehende Requests von Claude Code ab, bevor sie Anthropic erreichen

transformiert

wandelt das Request-Format um und mappt Modell-IDs (z. B. claude-opus-4-5)

umleitet

leitet die Requests an Venice unter api.venice.ai/api/v1/chat/completions weiter

Voraussetzungen

Venice-Konto

Mit API-Credits

Node.js

v18 oder höher

Claude Code

Per npm installiert

Einrichtung

1

Claude Code installieren

Falls noch nicht geschehen, installiere Anthropics Claude Code CLI:
npm install -g @anthropic-ai/claude-code
2

Router installieren

npm install -g @musistudio/claude-code-router
3

API-Schlüssel erstellen

Erstelle einen Schlüssel unter venice.ai/settings/api. Du fügst ihn im nächsten Schritt direkt in die Konfigurationsdatei ein.
4

Konfiguration erstellen

Erstelle das Konfigurationsverzeichnis:
mkdir -p ~/.claude-code-router
Erstelle dann ~/.claude-code-router/config.json mit deinem bevorzugten Editor:
# Mit nano
nano ~/.claude-code-router/config.json

# Oder mit VS Code
code ~/.claude-code-router/config.json
Füge die folgende Konfiguration ein:
{
  "APIKEY": "",
  "LOG": true,
  "LOG_LEVEL": "info",
  "API_TIMEOUT_MS": 600000,
  "HOST": "127.0.0.1",
  "Providers": [
    {
      "name": "venice",
      "api_base_url": "https://api.venice.ai/api/v1/chat/completions",
      "api_key": "your-venice-api-key-here",
      "models": [
        "claude-opus-4-5",
        "claude-sonnet-4-5",
        "claude-opus-4-6",
        "claude-opus-4-6-fast",
        "claude-sonnet-4-6"
      ],
      "transformer": {
        "use": ["anthropic"]
      }
    }
  ],
  "Router": {
    "default": "venice,claude-opus-4-5",
    "think": "venice,claude-opus-4-5",
    "background": "venice,claude-opus-4-5",
    "longContext": "venice,claude-opus-4-5",
    "longContextThreshold": 100000
  }
}
Wenn du config.json änderst, während der Router läuft, starte ihn mit ccr restart neu, um die Änderungen anzuwenden.
5

Starten

Starte den Router, dann Claude Code:
ccr start
ccr code
Oder verwende die Aktivierungsmethode:
eval "$(ccr activate)" && claude

Unterstützte Modelle

ModellVenice-IDGeeignet für
Claude Opus 4.5claude-opus-4-5Komplexes Reasoning, große Refactorings
Claude Sonnet 4.5claude-sonnet-4-5Schnelle Iteration, Alltags-Coding
Claude Opus 4.6claude-opus-4-6Komplexes Reasoning, große Refactorings
Claude Opus 4.6 Fastclaude-opus-4-6-fastKomplexes Reasoning mit geringerer Latenz
Claude Sonnet 4.6claude-sonnet-4-6Schnelle Iteration, Alltags-Coding
Claude Code ist für Claude-Modelle optimiert. Andere über Venice verfügbare Modelle (GPT, DeepSeek, Grok usw.) funktionieren möglicherweise, aber wir können keine gleichwertige Erfahrung garantieren, da Claude Code auf Claude-spezifische Funktionen wie Extended Thinking setzt. Für andere Modelle erwäge die Nutzung der Standard-API von Venice.

Router-Funktionen

Der Router bietet mehrere nützliche Funktionen über das einfache Routing hinaus:
Verwende den Befehl /model innerhalb von Claude Code, um Modelle ohne Neustart zu wechseln:
/model venice,claude-sonnet-4-5
Nützlich, wenn du Opus für komplexe Aufgaben und Sonnet für schnelle Iterationen verwenden möchtest.
Lieber eine GUI? Starte den webbasierten Konfigurations-Editor:
ccr ui
Damit öffnet sich eine Browser-Oberfläche zum Bearbeiten deiner config.json, ohne die Datei direkt anzufassen.
Der Router-Abschnitt der Konfiguration steuert, welches Modell unterschiedliche Aufgabentypen bearbeitet:
SzenarioWann es verwendet wird
defaultAllgemeine Anfragen
thinkReasoning-intensive Aufgaben (Plan-Modus)
backgroundHintergrund-Operationen
longContextWenn der Kontext den Wert longContextThreshold an Tokens überschreitet
Du kannst unterschiedliche Szenarien an unterschiedliche Modelle routen. Zum Beispiel Sonnet für Hintergrund-Aufgaben verwenden, um Kosten zu sparen.
Wenn etwas nicht funktioniert, prüfe die Logs:
# Server-Logs (HTTP, API-Aufrufe)
~/.claude-code-router/logs/ccr-*.log

# Application-Logs (Routing-Entscheidungen)
~/.claude-code-router/claude-code-router.log
Setze "LOG_LEVEL": "debug" in deiner Konfiguration für ausführlichere Ausgaben.

Caching-Verhalten

Venice Prompt Caching funktioniert zusammen mit Claude Codes nativen Cache-Markern. Venice erkennt automatisch, wenn Claude Code cache_control-Felder sendet, und passt seine Caching-Strategie entsprechend an.
SzenarioCache-TTLWer steuert
Default (empfohlen)5 MinutenClaude Code + Venice
Mit cleancache-Transformer1 StundeNur Venice
Die Standardkonfiguration lässt beide Systeme kooperieren:
  • Claude Code sendet seine nativen cache_control-Marker
  • Venice fügt Caching mit einer TTL von 5 Minuten hinzu
  • Beide Systeme teilen sich das 4-Block-Cache-Limit
Das funktioniert gut für aktive Coding-Sessions, in denen du häufige Anfragen stellst.
Füge cleancache zum Transformer hinzu, wenn du:
  • Fehler wegen des 4-Block-Cache-Limits bekommst
  • Seltsames Caching-Verhalten erlebst
  • Venices 1-Stunden-TTL für längere Sessions bevorzugst
"transformer": {
  "use": ["anthropic", "cleancache"]
}
Damit werden Claude Codes Cache-Marker entfernt, und Venice erhält die volle Kontrolle mit längerer TTL.

Ressourcen

Venice API Docs

Vollständige API-Referenz

claude-code-router

Quellcode und Issues