Pular para o conteúdo principal
O Claude Code é a ferramenta CLI da Anthropic para codificação agêntica. Este guia mostra como executá-lo via Venice AI para acesso por token (pay-per-token) aos modelos Claude Opus 4.5/4.6 e Sonnet 4.5/4.6.

Pagamento por token

Sem assinatura. Pague apenas pelo que usar

Modelos Claude

Acesse Opus 4.5/4.6 e Sonnet 4.5/4.6 através da Venice

Prompt caching

O cache da Venice funciona em conjunto com o Claude Code

Por que você precisa de um router

Por padrão, o Claude Code conecta-se diretamente à API da Anthropic. Para usá-lo com a Venice, você precisa do claude-code-router, um proxy local de código aberto que:

Intercepta

Captura as requisições de saída do Claude Code antes que cheguem à Anthropic

Transforma

Converte o formato da requisição e mapeia os IDs de modelo (por exemplo, claude-opus-4-5)

Redireciona

Encaminha as requisições para a Venice em api.venice.ai/api/v1/chat/completions

Pré-requisitos

Conta Venice

Com créditos de API

Node.js

v18 ou superior

Claude Code

Instalado via npm

Configuração

1

Instale o Claude Code

Se ainda não instalou, instale o CLI Claude Code da Anthropic:
npm install -g @anthropic-ai/claude-code
2

Instale o router

npm install -g @musistudio/claude-code-router
3

Obtenha sua chave de API

Gere uma chave em venice.ai/settings/api. Você a colará diretamente no arquivo de configuração na próxima etapa.
4

Crie a configuração

Crie o diretório de configuração:
mkdir -p ~/.claude-code-router
Em seguida, crie ~/.claude-code-router/config.json com seu editor preferido:
# Usando nano
nano ~/.claude-code-router/config.json

# Ou usando VS Code
code ~/.claude-code-router/config.json
Cole a seguinte configuração:
{
  "APIKEY": "",
  "LOG": true,
  "LOG_LEVEL": "info",
  "API_TIMEOUT_MS": 600000,
  "HOST": "127.0.0.1",
  "Providers": [
    {
      "name": "venice",
      "api_base_url": "https://api.venice.ai/api/v1/chat/completions",
      "api_key": "your-venice-api-key-here",
      "models": [
        "claude-opus-4-5",
        "claude-sonnet-4-5",
        "claude-opus-4-6",
        "claude-opus-4-6-fast",
        "claude-sonnet-4-6"
      ],
      "transformer": {
        "use": ["anthropic"]
      }
    }
  ],
  "Router": {
    "default": "venice,claude-opus-4-5",
    "think": "venice,claude-opus-4-5",
    "background": "venice,claude-opus-4-5",
    "longContext": "venice,claude-opus-4-5",
    "longContextThreshold": 100000
  }
}
Se você modificar config.json enquanto o router está em execução, reinicie-o com ccr restart para aplicar as mudanças.
5

Inicie

Inicie o router e, em seguida, o Claude Code:
ccr start
ccr code
Ou use o método de ativação:
eval "$(ccr activate)" && claude

Modelos suportados

ModeloID na VeniceMelhor para
Claude Opus 4.5claude-opus-4-5Raciocínio complexo, grandes refatorações
Claude Sonnet 4.5claude-sonnet-4-5Iteração rápida, codificação do dia a dia
Claude Opus 4.6claude-opus-4-6Raciocínio complexo, grandes refatorações
Claude Opus 4.6 Fastclaude-opus-4-6-fastRaciocínio complexo com menor latência
Claude Sonnet 4.6claude-sonnet-4-6Iteração rápida, codificação do dia a dia
O Claude Code é otimizado para modelos Claude. Embora outros modelos disponíveis na Venice (GPT, DeepSeek, Grok, etc.) possam funcionar, não podemos garantir uma experiência equivalente, já que o Claude Code depende de recursos específicos do Claude, como extended thinking. Para outros modelos, considere usar a API padrão da Venice.

Recursos do router

O router oferece vários recursos úteis além do roteamento básico:
Use o comando /model dentro do Claude Code para trocar de modelo sem reiniciar:
/model venice,claude-sonnet-4-5
Útil quando você quer o Opus para tarefas complexas e o Sonnet para iterações rápidas.
Prefere uma GUI? Inicie o editor de configuração baseado em web:
ccr ui
Isso abre uma interface no navegador para editar seu config.json sem tocar diretamente no arquivo.
A seção Router da configuração controla qual modelo lida com cada tipo de tarefa:
CenárioQuando é usado
defaultRequisições gerais
thinkTarefas pesadas em raciocínio (Plan Mode)
backgroundOperações em segundo plano
longContextQuando o contexto excede longContextThreshold tokens
Você pode rotear cenários diferentes para modelos diferentes. Por exemplo, use Sonnet para tarefas em segundo plano para economizar custos.
Se algo não estiver funcionando, verifique os logs:
# Logs do servidor (HTTP, chamadas de API)
~/.claude-code-router/logs/ccr-*.log

# Logs da aplicação (decisões de roteamento)
~/.claude-code-router/claude-code-router.log
Defina "LOG_LEVEL": "debug" na sua configuração para saída mais detalhada.

Comportamento de cache

O prompt caching da Venice funciona em conjunto com os marcadores de cache nativos do Claude Code. A Venice detecta automaticamente quando o Claude Code envia campos cache_control e ajusta sua estratégia de cache de acordo.
CenárioTTL do cacheQuem controla
Padrão (recomendado)5 minutosClaude Code + Venice
Com transformer cleancache1 horaApenas Venice
A configuração padrão permite que ambos os sistemas cooperem:
  • O Claude Code envia seus marcadores nativos cache_control
  • A Venice adiciona cache ao redor deles com um TTL de 5 minutos
  • Ambos os sistemas compartilham o limite de 4 blocos de cache
Isso funciona bem para sessões ativas de codificação onde você faz requisições frequentes.
Adicione cleancache ao transformer se você:
  • Estiver recebendo erros do limite de 4 blocos de cache
  • Tiver comportamento estranho de cache
  • Preferir o TTL de 1 hora da Venice para sessões mais longas
"transformer": {
  "use": ["anthropic", "cleancache"]
}
Isso remove os marcadores de cache do Claude Code, dando à Venice controle total com um TTL mais longo.

Recursos

Documentação da API Venice

Referência completa da API

claude-code-router

Código-fonte e issues