Saltar al contenido principal
Claude Code es la herramienta CLI de Anthropic para programación con agentes. Esta guía te muestra cómo ejecutarlo a través de Venice AI para obtener acceso por uso a Claude Opus 4.5/4.6 y Sonnet 4.5/4.6.

Pago por token

Sin suscripción. Paga solo por lo que uses

Modelos Claude

Accede a Opus 4.5/4.6 y Sonnet 4.5/4.6 a través de Venice

Prompt caching

El caching de Venice funciona junto a Claude Code

Por qué necesitas un router

Claude Code se conecta directamente a la API de Anthropic por defecto. Para usarlo con Venice necesitas claude-code-router, un proxy local de código abierto que:

Intercepta

Captura las solicitudes salientes de Claude Code antes de que lleguen a Anthropic

Transforma

Convierte el formato de la solicitud y mapea los IDs de modelo (p. ej., claude-opus-4-5)

Redirige

Reenvía las solicitudes a Venice en api.venice.ai/api/v1/chat/completions

Requisitos previos

Cuenta de Venice

Con créditos de API

Node.js

v18 o superior

Claude Code

Instalado mediante npm

Configuración

1

Instala Claude Code

Si no lo has hecho aún, instala la CLI Claude Code de Anthropic:
npm install -g @anthropic-ai/claude-code
2

Instala el router

npm install -g @musistudio/claude-code-router
3

Obtén tu API key

Genera una clave en venice.ai/settings/api. La pegarás directamente en el archivo de configuración en el siguiente paso.
4

Crea la configuración

Crea el directorio de configuración:
mkdir -p ~/.claude-code-router
Luego crea ~/.claude-code-router/config.json con tu editor preferido:
# Con nano
nano ~/.claude-code-router/config.json

# O con VS Code
code ~/.claude-code-router/config.json
Pega la siguiente configuración:
{
  "APIKEY": "",
  "LOG": true,
  "LOG_LEVEL": "info",
  "API_TIMEOUT_MS": 600000,
  "HOST": "127.0.0.1",
  "Providers": [
    {
      "name": "venice",
      "api_base_url": "https://api.venice.ai/api/v1/chat/completions",
      "api_key": "your-venice-api-key-here",
      "models": [
        "claude-opus-4-5",
        "claude-sonnet-4-5",
        "claude-opus-4-6",
        "claude-opus-4-6-fast",
        "claude-sonnet-4-6"
      ],
      "transformer": {
        "use": ["anthropic"]
      }
    }
  ],
  "Router": {
    "default": "venice,claude-opus-4-5",
    "think": "venice,claude-opus-4-5",
    "background": "venice,claude-opus-4-5",
    "longContext": "venice,claude-opus-4-5",
    "longContextThreshold": 100000
  }
}
Si modificas config.json mientras el router está en ejecución, reinícialo con ccr restart para aplicar los cambios.
5

Inicia

Inicia el router y luego Claude Code:
ccr start
ccr code
O usa el método de activación:
eval "$(ccr activate)" && claude

Modelos admitidos

ModeloID en VeniceMejor para
Claude Opus 4.5claude-opus-4-5Razonamiento complejo, refactorizaciones grandes
Claude Sonnet 4.5claude-sonnet-4-5Iteración rápida, programación diaria
Claude Opus 4.6claude-opus-4-6Razonamiento complejo, refactorizaciones grandes
Claude Opus 4.6 Fastclaude-opus-4-6-fastRazonamiento complejo con menor latencia
Claude Sonnet 4.6claude-sonnet-4-6Iteración rápida, programación diaria
Claude Code está optimizado para los modelos Claude. Aunque otros modelos disponibles en Venice (GPT, DeepSeek, Grok, etc.) pueden funcionar, no podemos garantizar una experiencia equivalente, ya que Claude Code depende de funciones específicas de Claude como extended thinking. Para otros modelos, considera usar la API estándar de Venice.

Funciones del router

El router ofrece varias funciones útiles más allá del enrutamiento básico:
Usa el comando /model dentro de Claude Code para cambiar de modelo sin reiniciar:
/model venice,claude-sonnet-4-5
Útil cuando quieres Opus para tareas complejas y Sonnet para iteraciones rápidas.
¿Prefieres una interfaz gráfica? Lanza el editor de configuración basado en web:
ccr ui
Esto abre una interfaz de navegador para editar tu config.json sin tocar el archivo directamente.
La sección Router de la configuración controla qué modelo gestiona los distintos tipos de tarea:
EscenarioCuándo se usa
defaultSolicitudes generales
thinkTareas con mucho razonamiento (Plan Mode)
backgroundOperaciones en segundo plano
longContextCuando el contexto supera longContextThreshold tokens
Puedes enrutar distintos escenarios a distintos modelos. Por ejemplo, usa Sonnet para tareas en segundo plano para ahorrar costes.
Si algo no funciona, revisa los logs:
# Logs del servidor (HTTP, llamadas a la API)
~/.claude-code-router/logs/ccr-*.log

# Logs de la aplicación (decisiones de enrutamiento)
~/.claude-code-router/claude-code-router.log
Establece "LOG_LEVEL": "debug" en tu configuración para una salida más detallada.

Comportamiento del caching

El prompt caching de Venice funciona junto a los marcadores de caché nativos de Claude Code. Venice detecta automáticamente cuándo Claude Code envía campos cache_control y ajusta su estrategia de caché en consecuencia.
EscenarioCache TTLQuién controla
Predeterminado (recomendado)5 minutosClaude Code + Venice
Con el transformer cleancache1 horaSolo Venice
La configuración predeterminada permite que ambos sistemas cooperen:
  • Claude Code envía sus marcadores nativos cache_control
  • Venice añade caching alrededor con un TTL de 5 minutos
  • Ambos sistemas comparten el límite de caché de 4 bloques
Funciona bien para sesiones de programación activas en las que haces solicitudes frecuentes.
Añade cleancache al transformer si:
  • Estás llegando a errores del límite de caché de 4 bloques
  • Experimentas comportamiento de caché extraño
  • Prefieres el TTL de 1 hora de Venice para sesiones más largas
"transformer": {
  "use": ["anthropic", "cleancache"]
}
Esto elimina los marcadores de caché de Claude Code, dando a Venice control total con un TTL más largo.

Recursos

Venice API Docs

Referencia completa de la API

claude-code-router

Código fuente e issues