토큰 단위 결제
구독 없이 사용한 만큼만 지불
Claude 모델
Venice를 통해 Opus 4.5/4.6 및 Sonnet 4.5/4.6에 접근
Prompt 캐싱
Venice 캐싱이 Claude Code와 함께 작동
라우터가 필요한 이유
Claude Code는 기본적으로 Anthropic API에 직접 연결됩니다. Venice와 함께 사용하려면 다음 작업을 수행하는 오픈소스 로컬 프록시인 claude-code-router가 필요합니다:사전 요구사항
Venice 계정
API 크레딧이 있는 계정
Node.js
v18 이상
Claude Code
npm으로 설치된 상태
설정
API 키 발급
venice.ai/settings/api에서 키를 생성하세요. 다음 단계에서 설정 파일에 직접 붙여넣게 됩니다.
설정 파일 생성
config 디렉터리를 만드세요:그런 다음 원하는 에디터로 다음 설정을 붙여넣으세요:
~/.claude-code-router/config.json을 만드세요:라우터 실행 중에
config.json을 수정한 경우 ccr restart로 재시작해 변경 사항을 적용하세요.지원 모델
| Model | Venice ID | Best For |
|---|---|---|
| Claude Opus 4.5 | claude-opus-4-5 | 복잡한 추론, 대규모 리팩토링 |
| Claude Sonnet 4.5 | claude-sonnet-4-5 | 빠른 반복, 일상적인 코딩 |
| Claude Opus 4.6 | claude-opus-4-6 | 복잡한 추론, 대규모 리팩토링 |
| Claude Opus 4.6 Fast | claude-opus-4-6-fast | 더 낮은 지연 시간으로 복잡한 추론 |
| Claude Sonnet 4.6 | claude-sonnet-4-6 | 빠른 반복, 일상적인 코딩 |
Claude Code는 Claude 모델에 최적화되어 있습니다. Venice를 통해 제공되는 다른 모델(GPT, DeepSeek, Grok 등)도 동작할 수 있지만, Claude Code는 extended thinking 등 Claude 고유 기능에 의존하므로 동일한 경험을 보장할 수는 없습니다. 다른 모델의 경우 Venice의 표준 API 사용을 고려하세요.
라우터 기능
라우터는 기본 라우팅 외에도 몇 가지 유용한 기능을 제공합니다:실시간으로 모델 전환
실시간으로 모델 전환
Claude Code 내부에서 복잡한 작업에는 Opus, 빠른 반복에는 Sonnet 같은 식으로 활용하기 좋습니다.
/model 명령으로 재시작 없이 모델을 전환할 수 있습니다:UI 모드로 시각적 설정
UI 모드로 시각적 설정
GUI를 선호하시나요? 웹 기반 설정 편집기를 실행하세요:파일을 직접 만지지 않고
config.json을 편집할 수 있는 브라우저 인터페이스가 열립니다.라우터 시나리오 설명
라우터 시나리오 설명
Router 설정 섹션은 어떤 모델이 어떤 작업 유형을 처리할지 제어합니다:| Scenario | When it’s used |
|---|---|
default | 일반 요청 |
think | 추론이 많은 작업(Plan Mode) |
background | 백그라운드 작업 |
longContext | context가 longContextThreshold 토큰을 초과할 때 |
로그로 디버깅
로그로 디버깅
동작이 잘 안 된다면 로그를 확인하세요:더 자세한 출력을 보려면 설정에서
"LOG_LEVEL": "debug"로 설정하세요.캐싱 동작
Venice prompt 캐싱은 Claude Code의 네이티브 캐시 마커와 함께 동작합니다. Venice는 Claude Code가cache_control 필드를 보낼 때 이를 자동으로 감지하고 캐싱 전략을 그에 맞게 조정합니다.
| Scenario | Cache TTL | Who Controls |
|---|---|---|
| 기본(권장) | 5분 | Claude Code + Venice |
cleancache transformer 사용 | 1시간 | Venice 단독 |
cleancache를 사용하지 말아야 할 때(대부분의 사용자)
cleancache를 사용하지 말아야 할 때(대부분의 사용자)
기본 설정은 두 시스템이 협력하도록 합니다:
- Claude Code가 네이티브
cache_control마커를 전송 - Venice가 5분 TTL로 그 주변에 캐싱을 추가
- 두 시스템이 4블록 캐시 한도를 공유
cleancache를 사용해야 할 때
cleancache를 사용해야 할 때
다음 경우에는 transformer에 이렇게 하면 Claude Code의 캐시 마커가 제거되고 Venice가 더 긴 TTL로 완전한 제어권을 갖습니다.
cleancache를 추가하세요:- 4블록 캐시 한도 에러를 만나는 경우
- 이상한 캐싱 동작을 경험하는 경우
- 더 긴 세션을 위해 Venice의 1시간 TTL을 선호하는 경우
리소스
Venice API 문서
전체 API 레퍼런스
claude-code-router
소스 코드 및 이슈