Claude Code with Venice | Venice API Docs

Claude Code es la herramienta CLI de Anthropic para programación con agentes. Esta guía te muestra cómo ejecutarlo a través de Venice AI para obtener acceso por uso a Claude Opus 4.5/4.6/4.7/4.8, Sonnet 4.5/4.6/4.7/4.8 y Fable 5.

Pago por token

Sin suscripción. Paga solo por lo que uses

Modelos Claude

Accede a Opus 4.5/4.6/4.7/4.8, Sonnet 4.5/4.6/4.7/4.8 y Fable 5 a través de Venice

Prompt caching

El caching de Venice funciona junto a Claude Code

Por qué necesitas un router

Claude Code se conecta directamente a la API de Anthropic por defecto. Para usarlo con Venice necesitas claude-code-router, un proxy local de código abierto que:

Intercepta

Captura las solicitudes salientes de Claude Code antes de que lleguen a Anthropic

Transforma

Convierte el formato de la solicitud y mapea los IDs de modelo (p. ej., claude-opus-4-5)

Redirige

Reenvía las solicitudes a Venice en api.venice.ai/api/v1/chat/completions

Requisitos previos

Cuenta de Venice

Con créditos de API

Node.js

v18 o superior

Claude Code

Instalado mediante npm

Configuración

Instala Claude Code

Si no lo has hecho aún, instala la CLI Claude Code de Anthropic:

npm install -g @anthropic-ai/claude-code

Instala el router

npm install -g @musistudio/claude-code-router

Obtén tu API key

Genera una clave en venice.ai/settings/api. La pegarás directamente en el archivo de configuración en el siguiente paso.

Crea la configuración

Crea el directorio de configuración:

mkdir -p ~/.claude-code-router

Luego crea ~/.claude-code-router/config.json con tu editor preferido:

# Con nano
nano ~/.claude-code-router/config.json

# O con VS Code
code ~/.claude-code-router/config.json

Pega la siguiente configuración:

{
  "APIKEY": "",
  "LOG": true,
  "LOG_LEVEL": "info",
  "API_TIMEOUT_MS": 600000,
  "HOST": "127.0.0.1",
  "Providers": [
    {
      "name": "venice",
      "api_base_url": "https://api.venice.ai/api/v1/chat/completions",
      "api_key": "your-venice-api-key-here",
      "models": [
        "claude-opus-4-5",
        "claude-sonnet-4-5",
        "claude-opus-4-6",
        "claude-opus-4-6-fast",
        "claude-sonnet-4-6",
        "claude-opus-4-7",
        "claude-opus-4-7-fast",
        "claude-opus-4-8",
        "claude-opus-4-8-fast",
        "claude-fable-5"
      ],
      "transformer": {
        "use": ["anthropic"]
      }
    }
  ],
  "Router": {
    "default": "venice,claude-opus-4-8",
    "think": "venice,claude-opus-4-8",
    "background": "venice,claude-opus-4-8",
    "longContext": "venice,claude-opus-4-8",
    "longContextThreshold": 100000
  }
}

Si modificas config.json mientras el router está en ejecución, reinícialo con ccr restart para aplicar los cambios.

Inicia

Inicia el router y luego Claude Code:

ccr start
ccr code

O usa el método de activación:

eval "$(ccr activate)" && claude

Modelos admitidos

Modelo	ID en Venice	Mejor para
Claude Opus 4.5	`claude-opus-4-5`	Razonamiento complejo, refactorizaciones grandes
Claude Sonnet 4.5	`claude-sonnet-4-5`	Iteración rápida, programación diaria
Claude Opus 4.6	`claude-opus-4-6`	Razonamiento complejo, refactorizaciones grandes
Claude Opus 4.6 Fast	`claude-opus-4-6-fast`	Razonamiento complejo con menor latencia
Claude Sonnet 4.6	`claude-sonnet-4-6`	Iteración rápida, programación diaria
Claude Opus 4.7	`claude-opus-4-7`	Razonamiento complejo, refactorizaciones grandes
Claude Opus 4.7 Fast	`claude-opus-4-7-fast`	Razonamiento complejo con menor latencia
Claude Opus 4.8	`claude-opus-4-8`	Razonamiento complejo, refactorizaciones grandes
Claude Opus 4.8 Fast	`claude-opus-4-8-fast`	Razonamiento complejo con menor latencia
Claude Fable 5	`claude-fable-5`	Tareas complejas que requieren la máxima inteligencia

Claude Code está optimizado para los modelos Claude. Aunque otros modelos disponibles en Venice (GPT, DeepSeek, Grok, etc.) pueden funcionar, no podemos garantizar una experiencia equivalente, ya que Claude Code depende de funciones específicas de Claude como extended thinking. Para otros modelos, considera usar la API estándar de Venice.

Funciones del router

El router ofrece varias funciones útiles más allá del enrutamiento básico:

Cambia de modelo sobre la marcha

Usa el comando /model dentro de Claude Code para cambiar de modelo sin reiniciar:

/model venice,claude-sonnet-4-5

Útil cuando quieres Opus para tareas complejas y Sonnet para iteraciones rápidas.

Configuración visual con modo UI

¿Prefieres una interfaz gráfica? Lanza el editor de configuración basado en web:

ccr ui

Esto abre una interfaz de navegador para editar tu config.json sin tocar el archivo directamente.

Escenarios del router explicados

La sección Router de la configuración controla qué modelo gestiona los distintos tipos de tarea:

Escenario	Cuándo se usa
`default`	Solicitudes generales
`think`	Tareas con mucho razonamiento (Plan Mode)
`background`	Operaciones en segundo plano
`longContext`	Cuando el contexto supera `longContextThreshold` tokens

Puedes enrutar distintos escenarios a distintos modelos. Por ejemplo, usa Sonnet para tareas en segundo plano para ahorrar costes.

Depuración con logs

Si algo no funciona, revisa los logs:

# Logs del servidor (HTTP, llamadas a la API)
~/.claude-code-router/logs/ccr-*.log

# Logs de la aplicación (decisiones de enrutamiento)
~/.claude-code-router/claude-code-router.log

Establece "LOG_LEVEL": "debug" en tu configuración para una salida más detallada.

Comportamiento del caching

El prompt caching de Venice funciona junto a los marcadores de caché nativos de Claude Code. Venice detecta automáticamente cuándo Claude Code envía campos cache_control y ajusta su estrategia de caché en consecuencia.

Escenario	Cache TTL	Quién controla
Predeterminado (recomendado)	5 minutos	Claude Code + Venice
Con el transformer `cleancache`	1 hora	Solo Venice

Cuándo NO usar cleancache (la mayoría de usuarios)

La configuración predeterminada permite que ambos sistemas cooperen:

Claude Code envía sus marcadores nativos cache_control
Venice añade caching alrededor con un TTL de 5 minutos
Ambos sistemas comparten el límite de caché de 4 bloques

Funciona bien para sesiones de programación activas en las que haces solicitudes frecuentes.

Cuándo usar cleancache

Añade cleancache al transformer si:

Estás llegando a errores del límite de caché de 4 bloques
Experimentas comportamiento de caché extraño
Prefieres el TTL de 1 hora de Venice para sesiones más largas

"transformer": {
  "use": ["anthropic", "cleancache"]
}

Esto elimina los marcadores de caché de Claude Code, dando a Venice control total con un TTL más largo.

Documentación

Primeros pasos

Texto y chat

Imagen, vídeo y audio

Herramientas de API

Agentes e integraciones

Herramientas de código

Herramientas para agentes

SDK y frameworks

Claude Code

Pago por token

Modelos Claude

Prompt caching

Por qué necesitas un router

Requisitos previos

Cuenta de Venice

Node.js

Claude Code

Configuración

Modelos admitidos

Funciones del router

Comportamiento del caching

Recursos

Venice API Docs

claude-code-router

Pago por token

Modelos Claude

Prompt caching

​Por qué necesitas un router

​Requisitos previos

Cuenta de Venice

Node.js

Claude Code

​Configuración

​Modelos admitidos

​Funciones del router

​Comportamiento del caching

​Recursos

Venice API Docs

claude-code-router

Por qué necesitas un router

Requisitos previos

Configuración

Modelos admitidos

Funciones del router

Comportamiento del caching

Recursos