Zum Hauptinhalt springen
Der Venice MCP Server ist der offizielle Model Context Protocol-Server für Venice. Er stellt die gesamte Venice-API (Chat, Image, Video, Audio, Music, Embeddings, Web Augment und Characters) als 31 Tools bereit, die jeder MCP-kompatible Agent aufrufen kann.

GitHub: veniceai/venice-mcp-server

Veröffentlicht als @veniceai/mcp-server auf npm. MIT-Lizenz.

31 Tools

Jede Venice-Modalität in einem Konfigurationsblock

Beliebiger MCP-Host

Claude Desktop, Cursor, ChatGPT, LM Studio, Continue und mehr

Wallet-Auth (optional)

Nutze einen API-Schlüssel oder zahle pro Aufruf mit einer SIWE-signierten Wallet über x402

Schnellstart

1

Venice API-Schlüssel besorgen

Erstelle einen unter venice.ai/settings/api. Schritt-für-Schritt-Anleitung im API-Schlüssel-Guide.
2

Venice zur MCP-Host-Konfiguration hinzufügen

Füge dies in die Konfigurationsdatei deines MCP-Hosts ein:
{
  "mcpServers": {
    "venice": {
      "command": "npx",
      "args": ["-y", "@veniceai/[email protected]"],
      "env": { "VENICE_API_KEY": "<your-venice-api-key>" }
    }
  }
}
Übliche Konfigurationspfade:
HostPfad
Claude Desktop (macOS)~/Library/Application Support/Claude/claude_desktop_config.json
Claude Desktop (Windows)%APPDATA%\Claude\claude_desktop_config.json
Cursor~/.cursor/mcp.json
LM Studiomcp.json (aus den MCP-Einstellungen der App)
3

MCP-Host neu starten

Dein Agent hat jetzt Chat, Image, Video, Music, TTS, ASR und 25 weitere Venice-Tools verfügbar.
Die meisten MCP-Hosts geben nur Umgebungsvariablen weiter, die explizit im env-Block aufgeführt sind. System-Env-Vars werden nicht geerbt. Wenn du trotz gesetztem API-Schlüssel 402-Fehler erhältst, prüfe, ob VENICE_API_KEY innerhalb von env in deiner Konfiguration steht.

Was du bekommst

31 Tools für jede Venice-Modalität, 3 Ressourcen (venice://models, venice://styles, venice://voices) und 3 Prompt-Templates.

Chat & Embeddings

ToolBeschreibung
venice_chatOpenAI-kompatible Chat-Completion gegen Venices vollständigen LLM-Katalog.
venice_responsesOpenAI-kompatible Responses-API mit Single- oder Multi-Turn-Tool-Unterstützung.
venice_embeddingsEmbeddings für Texteingabe berechnen.
venice_chat_with_characterChat mit einem Venice-Character per Slug.

Image

ToolBeschreibung
venice_image_generateBild generieren (Flux 2, Lustify SDXL, Anime/WAI, Qwen Image, GPT Image, Nano Banana Pro und mehr).
venice_image_editBild mit einem Prompt bearbeiten.
venice_image_multi_editMehrere Bilder zusammen mit einem Prompt bearbeiten.
venice_image_upscaleBild bis zu 4× hochskalieren.
venice_image_remove_bgBildhintergrund entfernen.
venice_image_stylesBildstil-Presets auflisten.

Video

ToolBeschreibung
venice_video_generateVideo-Generierungsjob in die Queue stellen (Sora 2, Veo 3.1, Kling, Wan, LTX 2, Seedance, Runway Gen-4 und mehr).
venice_video_statusStatus eines Video-Jobs prüfen.
venice_video_completeFertiges Video als heruntergeladen markieren; löscht serverseitige Medien.
venice_video_transcriptionsYouTube-Video-URL transkribieren.
venice_video_quotePreis-Quote vor dem Queue-Eintrag bekommen.

Audio (TTS / ASR)

ToolBeschreibung
venice_ttsText-to-Speech mit geklonten Stimmen und Emotions-Tags.
venice_asrAudio von einer URL transkribieren.
venice_voice_cloneIntegrierte Stimmen auflisten oder eine Stimme aus einem Sample klonen.
venice_audio_quotePreis-Quote für Musikgenerierung bekommen.

Musik

ToolBeschreibung
venice_music_generateMusik-Generierungsjob in die Queue stellen (ace-step-15, elevenlabs-music, minimax-music-v2/v25/v26, stable-audio-25, mmaudio-v2, elevenlabs-sound-effects-v2).
venice_music_statusStatus eines Musik-Jobs prüfen.
venice_music_completeFertigen Musik-Job als heruntergeladen markieren.

Web Augment, Katalog und Crypto

ToolBeschreibung
venice_web_searchIm Web suchen (Firecrawl-basiert).
venice_web_scrapeEine URL in Markdown scrapen.
venice_text_parserText aus PDF/DOCX/EPUB/PPTX/XLSX extrahieren.
venice_list_modelsAktuellen Modellkatalog mit Preisen auflisten.
venice_list_charactersÖffentliche Venice-Characters auflisten.
venice_crypto_rpcJSON-RPC-Aufrufe an Base, Ethereum, Polygon, Arbitrum oder Optimism proxien.

x402 Wallet-Helfer

Nur relevant, wenn du dich per Wallet über x402 statt mit einem API-Schlüssel authentifizierst.
ToolBeschreibung
venice_x402_balancePrepaid-x402-Guthaben für eine EVM- oder Solana-Wallet-Adresse prüfen.
venice_x402_top_up_infoTop-up-Anforderungen abrufen (Netzwerk, USDC-Token, Empfänger, Mindestbetrag).
venice_x402_transactionsLetzte x402-Top-ups und Abbuchungen für eine EVM- oder Solana-Wallet-Adresse auflisten.

Konfiguration

Der Server wird vollständig über Umgebungsvariablen konfiguriert.
Env-VarDefaultHinweise
VENICE_API_KEY(keine)Dein Venice API-Schlüssel. Das einfachste Setup.
VENICE_DEFAULT_CHAT_MODELvenice-uncensored
VENICE_DEFAULT_IMAGE_MODELflux-2-pro
VENICE_DEFAULT_TTS_MODELtts-kokoro
VENICE_DEFAULT_ASR_MODELopenai/whisper-large-v3
VENICE_DISABLE_NSFW0Auf 1 setzen, um NSFW-Capability-Hinweise aus Tool-Beschreibungen zu entfernen.
VENICE_HTTP_TIMEOUT_MS60000
VENICE_SIWX_TOKEN(keiner)x402-Wallet-Mode-Auth-Token. Siehe x402 unten.
Wenn sowohl VENICE_API_KEY als auch VENICE_SIWX_TOKEN gesetzt sind, gewinnt der API-Schlüssel.

x402 Wallet-Modus

Venice unterstützt – zusätzlich zum normalen API-Key-Flow – die Authentifizierung mit einem Sign-In-With-X-Wallet-Token, der durch Prepaid-USDC-Guthaben auf Base oder Solana gedeckt ist. Keine E-Mail, kein Telefon, kein KYC erforderlich: Deine Wallet ist die einzige Identität.
{
  "mcpServers": {
    "venice": {
      "command": "npx",
      "args": ["-y", "@veniceai/[email protected]"],
      "env": { "VENICE_SIWX_TOKEN": "<base64 Sign-In-With-X payload>" }
    }
  }
}
Der MCP-Server leitet VENICE_SIWX_TOKEN bei jedem Venice-API-Aufruf als X-Sign-In-With-X-Header weiter. Der Server sieht nie deinen Private Key. Wallet-Signatur und USDC-Top-up-Autorisierungen erfolgen in deiner eigenen Wallet.
FlowWas passiert
Einmalige EinrichtungSign-In-With-X-Nachricht in deiner Wallet signieren → erzeugt einen SIWX-Token (base64 JSON).
Top-upPOST /api/v1/x402/top-up liefert 402 + Zahlungsanforderungen. Eine USDC-Zahlung für eine der zurückgegebenen Base- oder Solana-Optionen signieren, erneut senden, und Venice schreibt deinem Guthaben gut.
Jeder Inferenz-AufrufMCP-Server sendet X-Sign-In-With-X: <SIWX>; Venice belastet dein Prepaid-Guthaben.
Der Mindest-Top-up beträgt 5 USD. Das Mindest-Guthaben zum Inferenz-Aufruf beträgt $0,10. Nach dem Top-up dauern Aufrufe unter 100 ms, weil die Verrechnung off-chain auf einem schnellen Credit-Konto stattfindet.
Wallets, die mit einem Venice-Konto mit gestaktem DIEM verknüpft sind, verbrauchen aus dem Staking-Guthaben statt aus USDC-Credits — kein Top-up nötig.

Self-Hosting (Streamable HTTP)

Für Team- oder Workspace-Deployments läuft der MCP-Server über HTTP statt stdio:
docker run -p 3333:3333 \
  -e VENICE_API_KEY=<your-venice-api-key> \
  -e VENICE_MCP_AUTH_TOKEN=<choose-a-long-random-token> \
  ghcr.io/veniceai/venice-mcp-server:latest
Der Server ist nun unter http://localhost:3333/mcp erreichbar. HTTP-Clients müssen Authorization: Bearer <VENICE_MCP_AUTH_TOKEN> senden.
/mcp ist ein credential-gestützter Tool-Ausführungs-Endpoint: Aufrufer können den konfigurierten Venice API-Schlüssel oder x402-Guthaben verbrauchen. Wenn der HTTP-Modus außerhalb von Loopback bindet, schlägt der Start fehl, sofern VENICE_MCP_AUTH_TOKEN nicht gesetzt ist. Im Produktivbetrieb das npm-Paket explizit auf eine Version pinnen, statt auf latest zu vertrauen.

Ressourcen

GitHub

Quellcode, Issues und Releases

npm

@veniceai/mcp-server

Venice Skills

Begleitende Skills, die Agenten beibringen, diese Tools zu verwenden

MCP-Spezifikation

Mehr über das Model Context Protocol erfahren