Pago por token
Sin suscripción. Paga solo por lo que uses
Modelos Claude
Accede a Opus 4.5/4.6 y Sonnet 4.5/4.6 a través de Venice
Prompt caching
El caching de Venice funciona junto a Claude Code
Por qué necesitas un router
Claude Code se conecta directamente a la API de Anthropic por defecto. Para usarlo con Venice necesitas claude-code-router, un proxy local de código abierto que:Requisitos previos
Cuenta de Venice
Con créditos de API
Node.js
v18 o superior
Claude Code
Instalado mediante npm
Configuración
Obtén tu API key
Genera una clave en venice.ai/settings/api. La pegarás directamente en el archivo de configuración en el siguiente paso.
Crea la configuración
Crea el directorio de configuración:Luego crea Pega la siguiente configuración:
~/.claude-code-router/config.json con tu editor preferido:Si modificas
config.json mientras el router está en ejecución, reinícialo con ccr restart para aplicar los cambios.Modelos admitidos
| Modelo | ID en Venice | Mejor para |
|---|---|---|
| Claude Opus 4.5 | claude-opus-4-5 | Razonamiento complejo, refactorizaciones grandes |
| Claude Sonnet 4.5 | claude-sonnet-4-5 | Iteración rápida, programación diaria |
| Claude Opus 4.6 | claude-opus-4-6 | Razonamiento complejo, refactorizaciones grandes |
| Claude Opus 4.6 Fast | claude-opus-4-6-fast | Razonamiento complejo con menor latencia |
| Claude Sonnet 4.6 | claude-sonnet-4-6 | Iteración rápida, programación diaria |
Claude Code está optimizado para los modelos Claude. Aunque otros modelos disponibles en Venice (GPT, DeepSeek, Grok, etc.) pueden funcionar, no podemos garantizar una experiencia equivalente, ya que Claude Code depende de funciones específicas de Claude como extended thinking. Para otros modelos, considera usar la API estándar de Venice.
Funciones del router
El router ofrece varias funciones útiles más allá del enrutamiento básico:Cambia de modelo sobre la marcha
Cambia de modelo sobre la marcha
Usa el comando Útil cuando quieres Opus para tareas complejas y Sonnet para iteraciones rápidas.
/model dentro de Claude Code para cambiar de modelo sin reiniciar:Configuración visual con modo UI
Configuración visual con modo UI
¿Prefieres una interfaz gráfica? Lanza el editor de configuración basado en web:Esto abre una interfaz de navegador para editar tu
config.json sin tocar el archivo directamente.Escenarios del router explicados
Escenarios del router explicados
La sección
Puedes enrutar distintos escenarios a distintos modelos. Por ejemplo, usa Sonnet para tareas en segundo plano para ahorrar costes.
Router de la configuración controla qué modelo gestiona los distintos tipos de tarea:| Escenario | Cuándo se usa |
|---|---|
default | Solicitudes generales |
think | Tareas con mucho razonamiento (Plan Mode) |
background | Operaciones en segundo plano |
longContext | Cuando el contexto supera longContextThreshold tokens |
Depuración con logs
Depuración con logs
Si algo no funciona, revisa los logs:Establece
"LOG_LEVEL": "debug" en tu configuración para una salida más detallada.Comportamiento del caching
El prompt caching de Venice funciona junto a los marcadores de caché nativos de Claude Code. Venice detecta automáticamente cuándo Claude Code envía camposcache_control y ajusta su estrategia de caché en consecuencia.
| Escenario | Cache TTL | Quién controla |
|---|---|---|
| Predeterminado (recomendado) | 5 minutos | Claude Code + Venice |
Con el transformer cleancache | 1 hora | Solo Venice |
Cuándo NO usar cleancache (la mayoría de usuarios)
Cuándo NO usar cleancache (la mayoría de usuarios)
La configuración predeterminada permite que ambos sistemas cooperen:
- Claude Code envía sus marcadores nativos
cache_control - Venice añade caching alrededor con un TTL de 5 minutos
- Ambos sistemas comparten el límite de caché de 4 bloques
Cuándo usar cleancache
Cuándo usar cleancache
Añade Esto elimina los marcadores de caché de Claude Code, dando a Venice control total con un TTL más largo.
cleancache al transformer si:- Estás llegando a errores del límite de caché de 4 bloques
- Experimentas comportamiento de caché extraño
- Prefieres el TTL de 1 hora de Venice para sesiones más largas
Recursos
Venice API Docs
Referencia completa de la API
claude-code-router
Código fuente e issues