Claude Code mit Venice | Venice API Docs

Claude Code ist Anthropics CLI-Tool für agentisches Coden. Diese Anleitung zeigt dir, wie du es über Venice AI betreibst, um Claude Opus 4.5/4.6/4.7/4.8, Sonnet 4.5/4.6/4.7/4.8 und Fable 5 pro Token zu bezahlen.

Pay Per Token

Kein Abo. Zahle nur, was du nutzt

Claude-Modelle

Zugriff auf Opus 4.5/4.6/4.7/4.8, Sonnet 4.5/4.6/4.7/4.8 und Fable 5 über Venice

Prompt Caching

Venice-Caching funktioniert zusammen mit Claude Code

Warum du einen Router brauchst

Claude Code verbindet sich standardmäßig direkt mit Anthropics API. Um es mit Venice zu verwenden, brauchst du claude-code-router, einen quelloffenen lokalen Proxy, der:

abfängt

fängt ausgehende Requests von Claude Code ab, bevor sie Anthropic erreichen

transformiert

wandelt das Request-Format um und mappt Modell-IDs (z. B. claude-opus-4-5)

umleitet

leitet die Requests an Venice unter api.venice.ai/api/v1/chat/completions weiter

Voraussetzungen

Venice-Konto

Mit API-Credits

Node.js

v18 oder höher

Claude Code

Per npm installiert

Einrichtung

Claude Code installieren

Falls noch nicht geschehen, installiere Anthropics Claude Code CLI:

npm install -g @anthropic-ai/claude-code

Router installieren

npm install -g @musistudio/claude-code-router

API-Schlüssel erstellen

Erstelle einen Schlüssel unter venice.ai/settings/api. Du fügst ihn im nächsten Schritt direkt in die Konfigurationsdatei ein.

Konfiguration erstellen

Erstelle das Konfigurationsverzeichnis:

mkdir -p ~/.claude-code-router

Erstelle dann ~/.claude-code-router/config.json mit deinem bevorzugten Editor:

# Mit nano
nano ~/.claude-code-router/config.json

# Oder mit VS Code
code ~/.claude-code-router/config.json

Füge die folgende Konfiguration ein:

{
  "APIKEY": "",
  "LOG": true,
  "LOG_LEVEL": "info",
  "API_TIMEOUT_MS": 600000,
  "HOST": "127.0.0.1",
  "Providers": [
    {
      "name": "venice",
      "api_base_url": "https://api.venice.ai/api/v1/chat/completions",
      "api_key": "your-venice-api-key-here",
      "models": [
        "claude-opus-4-5",
        "claude-sonnet-4-5",
        "claude-opus-4-6",
        "claude-opus-4-6-fast",
        "claude-sonnet-4-6",
        "claude-opus-4-7",
        "claude-opus-4-7-fast",
        "claude-opus-4-8",
        "claude-opus-4-8-fast",
        "claude-fable-5"
      ],
      "transformer": {
        "use": ["anthropic"]
      }
    }
  ],
  "Router": {
    "default": "venice,claude-opus-4-8",
    "think": "venice,claude-opus-4-8",
    "background": "venice,claude-opus-4-8",
    "longContext": "venice,claude-opus-4-8",
    "longContextThreshold": 100000
  }
}

Wenn du config.json änderst, während der Router läuft, starte ihn mit ccr restart neu, um die Änderungen anzuwenden.

Starten

Starte den Router, dann Claude Code:

ccr start
ccr code

Oder verwende die Aktivierungsmethode:

eval "$(ccr activate)" && claude

Unterstützte Modelle

Modell	Venice-ID	Geeignet für
Claude Opus 4.5	`claude-opus-4-5`	Komplexes Reasoning, große Refactorings
Claude Sonnet 4.5	`claude-sonnet-4-5`	Schnelle Iteration, Alltags-Coding
Claude Opus 4.6	`claude-opus-4-6`	Komplexes Reasoning, große Refactorings
Claude Opus 4.6 Fast	`claude-opus-4-6-fast`	Komplexes Reasoning mit geringerer Latenz
Claude Sonnet 4.6	`claude-sonnet-4-6`	Schnelle Iteration, Alltags-Coding
Claude Opus 4.7	`claude-opus-4-7`	Komplexes Reasoning, große Refactorings
Claude Opus 4.7 Fast	`claude-opus-4-7-fast`	Komplexes Reasoning mit geringerer Latenz
Claude Opus 4.8	`claude-opus-4-8`	Komplexes Reasoning, große Refactorings
Claude Opus 4.8 Fast	`claude-opus-4-8-fast`	Komplexes Reasoning mit geringerer Latenz
Claude Fable 5	`claude-fable-5`	Komplexe Aufgaben, die höchste Intelligenz erfordern

Claude Code ist für Claude-Modelle optimiert. Andere über Venice verfügbare Modelle (GPT, DeepSeek, Grok usw.) funktionieren möglicherweise, aber wir können keine gleichwertige Erfahrung garantieren, da Claude Code auf Claude-spezifische Funktionen wie Extended Thinking setzt. Für andere Modelle erwäge die Nutzung der Standard-API von Venice.

Router-Funktionen

Der Router bietet mehrere nützliche Funktionen über das einfache Routing hinaus:

Modelle on the fly wechseln

Verwende den Befehl /model innerhalb von Claude Code, um Modelle ohne Neustart zu wechseln:

/model venice,claude-sonnet-4-5

Nützlich, wenn du Opus für komplexe Aufgaben und Sonnet für schnelle Iterationen verwenden möchtest.

Visuelle Konfiguration im UI-Modus

Lieber eine GUI? Starte den webbasierten Konfigurations-Editor:

ccr ui

Damit öffnet sich eine Browser-Oberfläche zum Bearbeiten deiner config.json, ohne die Datei direkt anzufassen.

Router-Szenarien erklärt

Der Router-Abschnitt der Konfiguration steuert, welches Modell unterschiedliche Aufgabentypen bearbeitet:

Szenario	Wann es verwendet wird
`default`	Allgemeine Anfragen
`think`	Reasoning-intensive Aufgaben (Plan-Modus)
`background`	Hintergrund-Operationen
`longContext`	Wenn der Kontext den Wert `longContextThreshold` an Tokens überschreitet

Du kannst unterschiedliche Szenarien an unterschiedliche Modelle routen. Zum Beispiel Sonnet für Hintergrund-Aufgaben verwenden, um Kosten zu sparen.

Debugging mit Logs

Wenn etwas nicht funktioniert, prüfe die Logs:

# Server-Logs (HTTP, API-Aufrufe)
~/.claude-code-router/logs/ccr-*.log

# Application-Logs (Routing-Entscheidungen)
~/.claude-code-router/claude-code-router.log

Setze "LOG_LEVEL": "debug" in deiner Konfiguration für ausführlichere Ausgaben.

Caching-Verhalten

Venice Prompt Caching funktioniert zusammen mit Claude Codes nativen Cache-Markern. Venice erkennt automatisch, wenn Claude Code cache_control-Felder sendet, und passt seine Caching-Strategie entsprechend an.

Szenario	Cache-TTL	Wer steuert
Default (empfohlen)	5 Minuten	Claude Code + Venice
Mit `cleancache`-Transformer	1 Stunde	Nur Venice

Wann KEIN cleancache (die meisten Nutzer)

Die Standardkonfiguration lässt beide Systeme kooperieren:

Claude Code sendet seine nativen cache_control-Marker
Venice fügt Caching mit einer TTL von 5 Minuten hinzu
Beide Systeme teilen sich das 4-Block-Cache-Limit

Das funktioniert gut für aktive Coding-Sessions, in denen du häufige Anfragen stellst.

Wann cleancache verwenden

Füge cleancache zum Transformer hinzu, wenn du:

Fehler wegen des 4-Block-Cache-Limits bekommst
Seltsames Caching-Verhalten erlebst
Venices 1-Stunden-TTL für längere Sessions bevorzugst

"transformer": {
  "use": ["anthropic", "cleancache"]
}

Damit werden Claude Codes Cache-Marker entfernt, und Venice erhält die volle Kontrolle mit längerer TTL.

Dokumentation

Erste Schritte

Text & Chat

Bild, Video & Audio

Suche & RAG

Agenten & Integrationen

Coding-Tools

Agenten-Tools

SDKs & Frameworks

Claude Code

Pay Per Token

Claude-Modelle

Prompt Caching

Warum du einen Router brauchst

Voraussetzungen

Venice-Konto

Node.js

Claude Code

Einrichtung

Unterstützte Modelle

Router-Funktionen

Caching-Verhalten

Ressourcen

Venice API Docs

claude-code-router

Pay Per Token

Claude-Modelle

Prompt Caching

​Warum du einen Router brauchst

​Voraussetzungen

Venice-Konto

Node.js

Claude Code

​Einrichtung

​Unterstützte Modelle

​Router-Funktionen

​Caching-Verhalten

​Ressourcen

Venice API Docs

claude-code-router

Warum du einen Router brauchst

Voraussetzungen

Einrichtung

Unterstützte Modelle

Router-Funktionen

Caching-Verhalten

Ressourcen