Saltar al contenido principal
El Venice MCP Server es el servidor oficial de Model Context Protocol para Venice. Expone toda la API de Venice (chat, imagen, vídeo, audio, música, embeddings, web augment y characters) como 31 herramientas que cualquier agente compatible con MCP puede invocar.

GitHub: veniceai/venice-mcp-server

Publicado como @veniceai/mcp-server en npm. Licencia MIT.

31 herramientas

Cada modalidad de Venice en un solo bloque de configuración

Cualquier host MCP

Claude Desktop, Cursor, ChatGPT, LM Studio, Continue y más

Auth con monedero (opcional)

Usa una API key o paga por llamada con un monedero firmado por SIWE vía x402

Inicio rápido

1

Obtén una API key de Venice

Genera una en venice.ai/settings/api. Consulta la guía de API key para instrucciones paso a paso.
2

Añade Venice a la configuración de tu host MCP

Pega esto en el archivo de configuración de tu host MCP:
{
  "mcpServers": {
    "venice": {
      "command": "npx",
      "args": ["-y", "@veniceai/[email protected]"],
      "env": { "VENICE_API_KEY": "<your-venice-api-key>" }
    }
  }
}
Rutas de configuración comunes:
HostRuta
Claude Desktop (macOS)~/Library/Application Support/Claude/claude_desktop_config.json
Claude Desktop (Windows)%APPDATA%\Claude\claude_desktop_config.json
Cursor~/.cursor/mcp.json
LM Studiomcp.json (desde los ajustes de MCP de la app)
3

Reinicia tu host MCP

Tu agente ahora tiene chat, imagen, vídeo, música, TTS, ASR y 25 herramientas más de Venice disponibles.
La mayoría de hosts MCP solo pasan las variables de entorno listadas explícitamente en el bloque env. Las variables de entorno del sistema no se heredan. Si ves errores 402 con una API key configurada, comprueba que VENICE_API_KEY esté dentro de env en tu configuración.

Qué obtienes

31 herramientas que cubren cada modalidad de Venice, 3 recursos (venice://models, venice://styles, venice://voices) y 3 plantillas de prompt.

Chat y embeddings

ToolDescripción
venice_chatChat completion compatible con OpenAI contra todo el catálogo de LLM de Venice.
venice_responsesAPI Responses compatible con OpenAI con soporte de herramientas en uno o múltiples turnos.
venice_embeddingsCalcula embeddings para una entrada de texto.
venice_chat_with_characterChatea con un character de Venice por su slug.

Imagen

ToolDescripción
venice_image_generateGenera una imagen (Flux 2, Lustify SDXL, Anime/WAI, Qwen Image, GPT Image, Nano Banana Pro y más).
venice_image_editEdita una imagen con un prompt.
venice_image_multi_editEdita varias imágenes juntas con un solo prompt.
venice_image_upscaleEscala una imagen hasta 4×.
venice_image_remove_bgElimina el fondo de una imagen.
venice_image_stylesLista los presets de estilo de imagen.

Vídeo

ToolDescripción
venice_video_generateEncola una generación de vídeo (Sora 2, Veo 3.1, Kling, Wan, LTX 2, Seedance, Runway Gen-4 y más).
venice_video_statusComprueba el estado de un trabajo de vídeo en cola.
venice_video_completeMarca un vídeo completado como descargado; borra el contenido del servidor.
venice_video_transcriptionsTranscribe la URL de un vídeo de YouTube.
venice_video_quoteObtén una cotización de precio antes de encolar.

Audio (TTS / ASR)

ToolDescripción
venice_ttsTexto a voz con voces clonadas y etiquetas de emoción.
venice_asrTranscribe audio desde una URL.
venice_voice_cloneLista voces integradas o clona una voz a partir de una muestra.
venice_audio_quoteObtén una cotización de precio para generación de música.

Música

ToolDescripción
venice_music_generateEncola generación de música (ace-step-15, elevenlabs-music, minimax-music-v2/v25/v26, stable-audio-25, mmaudio-v2, elevenlabs-sound-effects-v2).
venice_music_statusComprueba el estado de un trabajo de música en cola.
venice_music_completeMarca un trabajo de música completado como descargado.

Web augment, catálogo y cripto

ToolDescripción
venice_web_searchBusca en la web (respaldado por Firecrawl).
venice_web_scrapeRaspa una URL convirtiéndola en markdown.
venice_text_parserExtrae texto de PDF/DOCX/EPUB/PPTX/XLSX.
venice_list_modelsLista el catálogo de modelos en vivo con precios.
venice_list_charactersLista los characters públicos de Venice.
venice_crypto_rpcProxy de llamadas JSON-RPC a Base, Ethereum, Polygon, Arbitrum u Optimism.

Helpers de monedero x402

Solo relevantes si te autenticas con un monedero mediante x402 en lugar de una API key.
ToolDescripción
venice_x402_balanceComprueba el saldo prepago de créditos x402 para una dirección de monedero EVM o Solana.
venice_x402_top_up_infoObtén los requisitos de recarga (red, token USDC, receptor, importe mínimo).
venice_x402_transactionsLista transacciones recientes de recarga y débito x402 para una dirección de monedero EVM o Solana.

Configuración

El servidor se configura completamente mediante variables de entorno.
Env varPredeterminadoNotas
VENICE_API_KEY(ninguno)Tu API key de Venice. La configuración más simple.
VENICE_DEFAULT_CHAT_MODELvenice-uncensored
VENICE_DEFAULT_IMAGE_MODELflux-2-pro
VENICE_DEFAULT_TTS_MODELtts-kokoro
VENICE_DEFAULT_ASR_MODELopenai/whisper-large-v3
VENICE_DISABLE_NSFW0Establece en 1 para eliminar notas de capacidad NSFW de las descripciones de las tools.
VENICE_HTTP_TIMEOUT_MS60000
VENICE_SIWX_TOKEN(ninguno)Token de auth en modo monedero x402. Consulta x402 más abajo.
Si están establecidos tanto VENICE_API_KEY como VENICE_SIWX_TOKEN, gana la API key.

Modo monedero x402

Venice admite autenticación con un token Sign-In-With-X de monedero respaldado por crédito USDC prepago en Base o Solana, además del flujo normal de API key. No se requiere email, teléfono ni KYC: tu monedero es la única identidad.
{
  "mcpServers": {
    "venice": {
      "command": "npx",
      "args": ["-y", "@veniceai/[email protected]"],
      "env": { "VENICE_SIWX_TOKEN": "<base64 Sign-In-With-X payload>" }
    }
  }
}
El servidor MCP reenvía VENICE_SIWX_TOKEN como cabecera X-Sign-In-With-X en cada llamada a la API de Venice. El servidor nunca ve tu clave privada. La firma del monedero y las autorizaciones de recarga USDC ocurren en tu propio monedero.
FlujoQué ocurre
Configuración únicaFirma un mensaje Sign-In-With-X en tu monedero → produce un token SIWX (JSON en base64).
RecargaPOST /api/v1/x402/top-up devuelve 402 + requisitos de pago. Firma un pago USDC para una de las opciones devueltas de Base o Solana, reenvía y Venice acredita tu saldo.
Cada llamada de inferenciaEl servidor MCP envía X-Sign-In-With-X: <SIWX>; Venice debita tu saldo prepago.
La recarga mínima es de $5 USD. El saldo mínimo para llamar a inferencia es de $0.10. Una vez recargado, las llamadas son sub-100 ms porque la liquidación ocurre off-chain en una cuenta de crédito rápida.
Los monederos vinculados a una cuenta de Venice con DIEM en staking consumen del saldo de staking en lugar de los créditos USDC, por lo que no se necesita recarga.

Self-hosting (HTTP en streaming)

Para despliegues de equipo o workspace, ejecuta el servidor MCP sobre HTTP en lugar de stdio:
docker run -p 3333:3333 \
  -e VENICE_API_KEY=<your-venice-api-key> \
  -e VENICE_MCP_AUTH_TOKEN=<choose-a-long-random-token> \
  ghcr.io/veniceai/venice-mcp-server:latest
El servidor está ahora disponible en http://localhost:3333/mcp. Los clientes HTTP deben enviar Authorization: Bearer <VENICE_MCP_AUTH_TOKEN>.
/mcp es un endpoint de ejecución de tools respaldado por credenciales: los llamadores pueden gastar la API key de Venice configurada o el saldo x402. Cuando el modo HTTP se vincula fuera de loopback, el arranque falla salvo que VENICE_MCP_AUTH_TOKEN esté establecido. En producción, fija explícitamente la versión del paquete npm en lugar de depender de latest.

Recursos

GitHub

Código fuente, issues y releases

npm

@veniceai/mcp-server

Venice Skills

Skills complementarias que enseñan a los agentes cómo usar estas tools

Spec de MCP

Aprende más sobre el Model Context Protocol