Vai al contenuto principale
Il Venice MCP Server è il server ufficiale Model Context Protocol per Venice. Espone l’intera API Venice (chat, image, video, audio, music, embeddings, web augment e characters) come 31 tool che qualsiasi agente compatibile con MCP può chiamare.

GitHub: veniceai/venice-mcp-server

Pubblicato come @veniceai/mcp-server su npm. Licenza MIT.

31 tool

Ogni modalità Venice in un solo blocco di configurazione

Qualsiasi host MCP

Claude Desktop, Cursor, ChatGPT, LM Studio, Continue e altri

Wallet auth (opzionale)

Porta una API key, oppure paga per chiamata con un wallet firmato SIWE tramite x402

Avvio rapido

1

Ottieni una API key Venice

Generane una da venice.ai/settings/api. Consulta la guida sulle API key per istruzioni passo passo.
2

Aggiungi Venice alla configurazione del tuo host MCP

Inserisci questo nel file di configurazione del tuo host MCP:
{
  "mcpServers": {
    "venice": {
      "command": "npx",
      "args": ["-y", "@veniceai/[email protected]"],
      "env": { "VENICE_API_KEY": "<your-venice-api-key>" }
    }
  }
}
Percorsi di configurazione comuni:
HostPercorso
Claude Desktop (macOS)~/Library/Application Support/Claude/claude_desktop_config.json
Claude Desktop (Windows)%APPDATA%\Claude\claude_desktop_config.json
Cursor~/.cursor/mcp.json
LM Studiomcp.json (dalle impostazioni MCP dell’app)
3

Riavvia il tuo host MCP

Il tuo agente ora ha disponibili chat, image, video, music, TTS, ASR e altri 25 tool Venice.
La maggior parte degli host MCP passa solo variabili d’ambiente esplicitamente elencate nel blocco env. Le variabili d’ambiente a livello di sistema non vengono ereditate. Se vedi errori 402 con una API key impostata, controlla due volte che VENICE_API_KEY sia all’interno di env nella tua configurazione.

Cosa ottieni

31 tool che coprono ogni modalità Venice, 3 resource (venice://models, venice://styles, venice://voices) e 3 template di prompt.

Chat ed embeddings

ToolDescrizione
venice_chatChat completion compatibile con OpenAI sull’intero catalogo LLM di Venice.
venice_responsesAPI Responses compatibile con OpenAI con supporto a tool single- o multi-turn.
venice_embeddingsCalcola gli embedding per testo in input.
venice_chat_with_characterChatta con un personaggio Venice tramite slug.

Image

ToolDescrizione
venice_image_generateGenera un’immagine (Flux 2, Lustify SDXL, Anime/WAI, Qwen Image, GPT Image, Nano Banana Pro e altri).
venice_image_editModifica un’immagine con un prompt.
venice_image_multi_editModifica più immagini insieme con un solo prompt.
venice_image_upscaleEsegui l’upscale di un’immagine fino a 4×.
venice_image_remove_bgRimuovi lo sfondo di un’immagine.
venice_image_stylesElenca i preset di stile dell’immagine.

Video

ToolDescrizione
venice_video_generateMetti in coda una generazione video (Sora 2, Veo 3.1, Kling, Wan, LTX 2, Seedance, Runway Gen-4 e altri).
venice_video_statusControlla lo stato di un job video in coda.
venice_video_completeContrassegna un video completato come scaricato; elimina il media lato server.
venice_video_transcriptionsTrascrivi un URL video di YouTube.
venice_video_quoteOttieni un preventivo prima della messa in coda.

Audio (TTS / ASR)

ToolDescrizione
venice_ttsText-to-speech con voci clonate e tag di emozione.
venice_asrTrascrivi audio da un URL.
venice_voice_cloneElenca le voci integrate o clona una voce da un campione.
venice_audio_quoteOttieni un preventivo per la generazione musicale.

Musica

ToolDescrizione
venice_music_generateMetti in coda la generazione musicale (ace-step-15, elevenlabs-music, minimax-music-v2/v25/v26, stable-audio-25, mmaudio-v2, elevenlabs-sound-effects-v2).
venice_music_statusControlla lo stato di un job musicale in coda.
venice_music_completeContrassegna un job musicale completato come scaricato.

Web augment, catalog e crypto

ToolDescrizione
venice_web_searchCerca sul web (basato su Firecrawl).
venice_web_scrapeEsegui lo scraping di un URL in markdown.
venice_text_parserEstrai testo da PDF/DOCX/EPUB/PPTX/XLSX.
venice_list_modelsElenca il catalogo modelli live con i prezzi.
venice_list_charactersElenca i personaggi Venice pubblici.
venice_crypto_rpcInoltra chiamate JSON-RPC a Base, Ethereum, Polygon, Arbitrum o Optimism.

Helper wallet x402

Rilevante solo se ti autentichi con un wallet tramite x402 invece che con una API key.
ToolDescrizione
venice_x402_balanceControlla il saldo di credito x402 prepagato per un indirizzo wallet EVM o Solana.
venice_x402_top_up_infoRecupera i requisiti di ricarica (rete, token USDC, ricevitore, importo minimo).
venice_x402_transactionsElenca le ricariche x402 recenti e le transazioni di addebito per un indirizzo wallet EVM o Solana.

Configurazione

Il server è configurato interamente tramite variabili d’ambiente.
Variabile d’ambienteDefaultNote
VENICE_API_KEY(nessuno)La tua API key Venice. La configurazione più semplice.
VENICE_DEFAULT_CHAT_MODELvenice-uncensored
VENICE_DEFAULT_IMAGE_MODELflux-2-pro
VENICE_DEFAULT_TTS_MODELtts-kokoro
VENICE_DEFAULT_ASR_MODELopenai/whisper-large-v3
VENICE_DISABLE_NSFW0Imposta a 1 per rimuovere le note sulla capacità NSFW dalle descrizioni dei tool.
VENICE_HTTP_TIMEOUT_MS60000
VENICE_SIWX_TOKEN(nessuno)Token di autenticazione in modalità wallet x402. Consulta x402 più sotto.
Se sono impostati sia VENICE_API_KEY sia VENICE_SIWX_TOKEN, vince l’API key.

Modalità wallet x402

Venice supporta l’autenticazione con un token wallet Sign-In-With-X sostenuto da credito USDC prepagato su Base o Solana, oltre al normale flusso con API key. Nessuna email, numero di telefono o KYC richiesti: il tuo wallet è l’unica identità.
{
  "mcpServers": {
    "venice": {
      "command": "npx",
      "args": ["-y", "@veniceai/[email protected]"],
      "env": { "VENICE_SIWX_TOKEN": "<base64 Sign-In-With-X payload>" }
    }
  }
}
Il server MCP inoltra VENICE_SIWX_TOKEN come header X-Sign-In-With-X su ogni chiamata all’API Venice. Il server non vede mai la tua chiave privata. La firma del wallet e le autorizzazioni di ricarica USDC avvengono nel tuo wallet.
FlussoCosa succede
Configurazione una tantumFirma un messaggio Sign-In-With-X nel tuo wallet → produce un token SIWX (JSON base64).
RicaricaPOST /api/v1/x402/top-up restituisce 402 + requisiti di pagamento. Firma un pagamento USDC per una delle opzioni Base o Solana restituite, reinvia e Venice accredita il tuo saldo.
Ogni chiamata di inferenzaIl server MCP invia X-Sign-In-With-X: <SIWX>; Venice scala dal tuo saldo prepagato.
La ricarica minima è di $5 USD. Il saldo minimo per chiamare l’inferenza è $0,10. Una volta ricaricato, le chiamate sono sotto i 100 ms perché la liquidazione avviene off-chain su un account di credito veloce.
I wallet collegati a un account Venice con DIEM in staking consumano dal saldo di staking invece dei crediti USDC, quindi non è necessaria la ricarica.

Self-hosting (Streamable HTTP)

Per deploy di team o workspace, esegui il server MCP su HTTP invece che su stdio:
docker run -p 3333:3333 \
  -e VENICE_API_KEY=<your-venice-api-key> \
  -e VENICE_MCP_AUTH_TOKEN=<choose-a-long-random-token> \
  ghcr.io/veniceai/venice-mcp-server:latest
Il server è ora disponibile su http://localhost:3333/mcp. I client HTTP devono inviare Authorization: Bearer <VENICE_MCP_AUTH_TOKEN>.
/mcp è un endpoint di esecuzione tool sostenuto da credenziali: i chiamanti possono spendere l’API key Venice configurata o il saldo x402. Quando la modalità HTTP si lega al di fuori del loopback, l’avvio fallisce se VENICE_MCP_AUTH_TOKEN non è impostato. Per la produzione, fissa esplicitamente la versione del pacchetto npm invece di affidarti a latest.

Risorse

GitHub

Codice sorgente, issue e release

npm

@veniceai/mcp-server

Venice Skills

Skill complementari che insegnano agli agenti come usare questi tool

Specifica MCP

Scopri di più sul Model Context Protocol