Claude Code com Venice | Documentação da API Venice

O Claude Code é a ferramenta CLI da Anthropic para codificação agêntica. Este guia mostra como executá-lo via Venice AI para acesso por token (pay-per-token) aos modelos Claude Opus 4.5/4.6/4.7/4.8, Sonnet 4.5/4.6/4.7/4.8 e Fable 5.

Pagamento por token

Sem assinatura. Pague apenas pelo que usar

Modelos Claude

Acesse Opus 4.5/4.6/4.7/4.8, Sonnet 4.5/4.6/4.7/4.8 e Fable 5 através da Venice

Prompt caching

O cache da Venice funciona em conjunto com o Claude Code

Por que você precisa de um router

Por padrão, o Claude Code conecta-se diretamente à API da Anthropic. Para usá-lo com a Venice, você precisa do claude-code-router, um proxy local de código aberto que:

Intercepta

Captura as requisições de saída do Claude Code antes que cheguem à Anthropic

Transforma

Converte o formato da requisição e mapeia os IDs de modelo (por exemplo, claude-opus-4-5)

Redireciona

Encaminha as requisições para a Venice em api.venice.ai/api/v1/chat/completions

Pré-requisitos

Conta Venice

Com créditos de API

Node.js

v18 ou superior

Claude Code

Instalado via npm

Configuração

Instale o Claude Code

Se ainda não instalou, instale o CLI Claude Code da Anthropic:

npm install -g @anthropic-ai/claude-code

Instale o router

npm install -g @musistudio/claude-code-router

Obtenha sua chave de API

Gere uma chave em venice.ai/settings/api. Você a colará diretamente no arquivo de configuração na próxima etapa.

Crie a configuração

Crie o diretório de configuração:

mkdir -p ~/.claude-code-router

Em seguida, crie ~/.claude-code-router/config.json com seu editor preferido:

# Usando nano
nano ~/.claude-code-router/config.json

# Ou usando VS Code
code ~/.claude-code-router/config.json

Cole a seguinte configuração:

{
  "APIKEY": "",
  "LOG": true,
  "LOG_LEVEL": "info",
  "API_TIMEOUT_MS": 600000,
  "HOST": "127.0.0.1",
  "Providers": [
    {
      "name": "venice",
      "api_base_url": "https://api.venice.ai/api/v1/chat/completions",
      "api_key": "your-venice-api-key-here",
      "models": [
        "claude-opus-4-5",
        "claude-sonnet-4-5",
        "claude-opus-4-6",
        "claude-opus-4-6-fast",
        "claude-sonnet-4-6",
        "claude-opus-4-7",
        "claude-opus-4-7-fast",
        "claude-opus-4-8",
        "claude-opus-4-8-fast",
        "claude-fable-5"
      ],
      "transformer": {
        "use": ["anthropic"]
      }
    }
  ],
  "Router": {
    "default": "venice,claude-opus-4-8",
    "think": "venice,claude-opus-4-8",
    "background": "venice,claude-opus-4-8",
    "longContext": "venice,claude-opus-4-8",
    "longContextThreshold": 100000
  }
}

Se você modificar config.json enquanto o router está em execução, reinicie-o com ccr restart para aplicar as mudanças.

Inicie

Inicie o router e, em seguida, o Claude Code:

ccr start
ccr code

Ou use o método de ativação:

eval "$(ccr activate)" && claude

Modelos suportados

Modelo	ID na Venice	Melhor para
Claude Opus 4.5	`claude-opus-4-5`	Raciocínio complexo, grandes refatorações
Claude Sonnet 4.5	`claude-sonnet-4-5`	Iteração rápida, codificação do dia a dia
Claude Opus 4.6	`claude-opus-4-6`	Raciocínio complexo, grandes refatorações
Claude Opus 4.6 Fast	`claude-opus-4-6-fast`	Raciocínio complexo com menor latência
Claude Sonnet 4.6	`claude-sonnet-4-6`	Iteração rápida, codificação do dia a dia
Claude Opus 4.7	`claude-opus-4-7`	Raciocínio complexo, grandes refatorações
Claude Opus 4.7 Fast	`claude-opus-4-7-fast`	Raciocínio complexo com menor latência
Claude Opus 4.8	`claude-opus-4-8`	Raciocínio complexo, grandes refatorações
Claude Opus 4.8 Fast	`claude-opus-4-8-fast`	Raciocínio complexo com menor latência
Claude Fable 5	`claude-fable-5`	Tarefas complexas que exigem a maior inteligência

O Claude Code é otimizado para modelos Claude. Embora outros modelos disponíveis na Venice (GPT, DeepSeek, Grok, etc.) possam funcionar, não podemos garantir uma experiência equivalente, já que o Claude Code depende de recursos específicos do Claude, como extended thinking. Para outros modelos, considere usar a API padrão da Venice.

Recursos do router

O router oferece vários recursos úteis além do roteamento básico:

Trocar modelos rapidamente

Use o comando /model dentro do Claude Code para trocar de modelo sem reiniciar:

/model venice,claude-sonnet-4-5

Útil quando você quer o Opus para tarefas complexas e o Sonnet para iterações rápidas.

Configuração visual com modo UI

Prefere uma GUI? Inicie o editor de configuração baseado em web:

ccr ui

Isso abre uma interface no navegador para editar seu config.json sem tocar diretamente no arquivo.

Cenários do router explicados

A seção Router da configuração controla qual modelo lida com cada tipo de tarefa:

Cenário	Quando é usado
`default`	Requisições gerais
`think`	Tarefas pesadas em raciocínio (Plan Mode)
`background`	Operações em segundo plano
`longContext`	Quando o contexto excede `longContextThreshold` tokens

Você pode rotear cenários diferentes para modelos diferentes. Por exemplo, use Sonnet para tarefas em segundo plano para economizar custos.

Depurando com logs

Se algo não estiver funcionando, verifique os logs:

# Logs do servidor (HTTP, chamadas de API)
~/.claude-code-router/logs/ccr-*.log

# Logs da aplicação (decisões de roteamento)
~/.claude-code-router/claude-code-router.log

Defina "LOG_LEVEL": "debug" na sua configuração para saída mais detalhada.

Comportamento de cache

O prompt caching da Venice funciona em conjunto com os marcadores de cache nativos do Claude Code. A Venice detecta automaticamente quando o Claude Code envia campos cache_control e ajusta sua estratégia de cache de acordo.

Cenário	TTL do cache	Quem controla
Padrão (recomendado)	5 minutos	Claude Code + Venice
Com transformer `cleancache`	1 hora	Apenas Venice

Quando NÃO usar cleancache (maioria dos usuários)

A configuração padrão permite que ambos os sistemas cooperem:

O Claude Code envia seus marcadores nativos cache_control
A Venice adiciona cache ao redor deles com um TTL de 5 minutos
Ambos os sistemas compartilham o limite de 4 blocos de cache

Isso funciona bem para sessões ativas de codificação onde você faz requisições frequentes.

Quando usar cleancache

Adicione cleancache ao transformer se você:

Estiver recebendo erros do limite de 4 blocos de cache
Tiver comportamento estranho de cache
Preferir o TTL de 1 hora da Venice para sessões mais longas

"transformer": {
  "use": ["anthropic", "cleancache"]
}

Isso remove os marcadores de cache do Claude Code, dando à Venice controle total com um TTL mais longo.

Documentação

Primeiros passos

Texto e chat

Imagem, vídeo e áudio

Ferramentas de API

Agentes e integrações

Ferramentas de código

Ferramentas para agentes

SDKs e frameworks

Claude Code

Pagamento por token

Modelos Claude

Prompt caching

Por que você precisa de um router

Pré-requisitos

Conta Venice

Node.js

Claude Code

Configuração

Modelos suportados

Recursos do router

Comportamento de cache

Recursos

Documentação da API Venice

claude-code-router

Pagamento por token

Modelos Claude

Prompt caching

​Por que você precisa de um router

​Pré-requisitos

Conta Venice

Node.js

Claude Code

​Configuração

​Modelos suportados

​Recursos do router

​Comportamento de cache

​Recursos

Documentação da API Venice

claude-code-router

Por que você precisa de um router

Pré-requisitos

Configuração

Modelos suportados

Recursos do router

Comportamento de cache

Recursos