Pagamento por token
Sem assinatura. Pague apenas pelo que usar
Modelos Claude
Acesse Opus 4.5/4.6 e Sonnet 4.5/4.6 através da Venice
Prompt caching
O cache da Venice funciona em conjunto com o Claude Code
Por que você precisa de um router
Por padrão, o Claude Code conecta-se diretamente à API da Anthropic. Para usá-lo com a Venice, você precisa do claude-code-router, um proxy local de código aberto que:Pré-requisitos
Conta Venice
Com créditos de API
Node.js
v18 ou superior
Claude Code
Instalado via npm
Configuração
Obtenha sua chave de API
Gere uma chave em venice.ai/settings/api. Você a colará diretamente no arquivo de configuração na próxima etapa.
Crie a configuração
Crie o diretório de configuração:Em seguida, crie Cole a seguinte configuração:
~/.claude-code-router/config.json com seu editor preferido:Se você modificar
config.json enquanto o router está em execução, reinicie-o com ccr restart para aplicar as mudanças.Modelos suportados
| Modelo | ID na Venice | Melhor para |
|---|---|---|
| Claude Opus 4.5 | claude-opus-4-5 | Raciocínio complexo, grandes refatorações |
| Claude Sonnet 4.5 | claude-sonnet-4-5 | Iteração rápida, codificação do dia a dia |
| Claude Opus 4.6 | claude-opus-4-6 | Raciocínio complexo, grandes refatorações |
| Claude Opus 4.6 Fast | claude-opus-4-6-fast | Raciocínio complexo com menor latência |
| Claude Sonnet 4.6 | claude-sonnet-4-6 | Iteração rápida, codificação do dia a dia |
O Claude Code é otimizado para modelos Claude. Embora outros modelos disponíveis na Venice (GPT, DeepSeek, Grok, etc.) possam funcionar, não podemos garantir uma experiência equivalente, já que o Claude Code depende de recursos específicos do Claude, como extended thinking. Para outros modelos, considere usar a API padrão da Venice.
Recursos do router
O router oferece vários recursos úteis além do roteamento básico:Trocar modelos rapidamente
Trocar modelos rapidamente
Use o comando Útil quando você quer o Opus para tarefas complexas e o Sonnet para iterações rápidas.
/model dentro do Claude Code para trocar de modelo sem reiniciar:Configuração visual com modo UI
Configuração visual com modo UI
Prefere uma GUI? Inicie o editor de configuração baseado em web:Isso abre uma interface no navegador para editar seu
config.json sem tocar diretamente no arquivo.Cenários do router explicados
Cenários do router explicados
A seção
Você pode rotear cenários diferentes para modelos diferentes. Por exemplo, use Sonnet para tarefas em segundo plano para economizar custos.
Router da configuração controla qual modelo lida com cada tipo de tarefa:| Cenário | Quando é usado |
|---|---|
default | Requisições gerais |
think | Tarefas pesadas em raciocínio (Plan Mode) |
background | Operações em segundo plano |
longContext | Quando o contexto excede longContextThreshold tokens |
Depurando com logs
Depurando com logs
Se algo não estiver funcionando, verifique os logs:Defina
"LOG_LEVEL": "debug" na sua configuração para saída mais detalhada.Comportamento de cache
O prompt caching da Venice funciona em conjunto com os marcadores de cache nativos do Claude Code. A Venice detecta automaticamente quando o Claude Code envia camposcache_control e ajusta sua estratégia de cache de acordo.
| Cenário | TTL do cache | Quem controla |
|---|---|---|
| Padrão (recomendado) | 5 minutos | Claude Code + Venice |
Com transformer cleancache | 1 hora | Apenas Venice |
Quando NÃO usar cleancache (maioria dos usuários)
Quando NÃO usar cleancache (maioria dos usuários)
A configuração padrão permite que ambos os sistemas cooperem:
- O Claude Code envia seus marcadores nativos
cache_control - A Venice adiciona cache ao redor deles com um TTL de 5 minutos
- Ambos os sistemas compartilham o limite de 4 blocos de cache
Quando usar cleancache
Quando usar cleancache
Adicione Isso remove os marcadores de cache do Claude Code, dando à Venice controle total com um TTL mais longo.
cleancache ao transformer se você:- Estiver recebendo erros do limite de 4 blocos de cache
- Tiver comportamento estranho de cache
- Preferir o TTL de 1 hora da Venice para sessões mais longas
Recursos
Documentação da API Venice
Referência completa da API
claude-code-router
Código-fonte e issues