설정
기본 구성
OpenAI 호환 인터페이스로 Venice를 CrewAI의 LLM 공급자로 설정하세요:첫 번째 Crew
두 에이전트로 구성된 간단한 리서치 crew를 만들어 봅시다:멀티 에이전트 제품 분석 Crew
전문화된 에이전트로 구성된 더 복잡한 예시:도구 사용하기
웹 검색 등 도구로 에이전트를 강화하세요:SerperDevTool은 serper.dev에서 발급받는 SERPER_API_KEY 환경 변수가 필요합니다. 대안으로 model_kwargs를 통해 venice_parameters: {"enable_web_search": "auto"}를 전달하면 추가 API 키 없이 Venice의 내장 웹 검색을 사용할 수 있습니다. 예시는 LangChain 가이드의 Web Search Integration을 참고하세요.CrewAI를 위한 모델 선택 가이드
각 에이전트 역할에 맞는 Venice 모델을 선택하세요:| Agent Role | Recommended Model | Why |
|---|---|---|
| 복잡한 추론 / 전략 | zai-org-glm-5-1 | 최고의 프라이빗 추론 모델 |
| 비검열 분석 / Red team | venice-uncensored-1-2 | 콘텐츠 필터링 없음 |
| 대량 / 빠른 작업 | qwen3-5-9b | 100만 input 토큰당 0.15로 가장 저렴 |
| 코드 생성 에이전트 | qwen3-coder-480b-a35b-instruct | 코드에 최적화 |
| 비전/멀티모달 작업 | qwen3-vl-235b-a22b | 고급 비전 이해 |
| 예산 절약 팀 | qwen3-5-9b(빠른 모델) + venice-uncensored-1-2(메인) | 저렴한 조합 |
비용 최적화 팁
-
단순한 에이전트에는 더 저렴한 모델을 사용: 모든 에이전트가 플래그십 모델일 필요는 없습니다. 포매팅, 요약, 단순 추출에는
qwen3-4b를 사용하세요. -
창의적/비판적 역할에는
venice-uncensored사용: 빠르고 저렴하며 불편한 분석을 거부하지 않습니다. -
플래그십 모델은 추론용으로만: 복잡한 추론이나 신뢰성 있는 함수 호출이 필요한 에이전트에만
zai-org-glm-5-1을 사용하세요. -
최대 반복 횟수 제한: 토큰 사용 폭주를 막기 위해 에이전트에
max_iter를 설정하세요:
프라이버시 이점
Venice의 프라이버시 보증은 다음과 같은 CrewAI 사용 사례에 이상적입니다:- 기밀 비즈니스 전략 — 데이터 보존 제로(zero retention) 덕분에 경쟁 분석이 비공개로 유지됩니다
- 민감 데이터 처리 — 프라이빗 모델은 사용자 데이터를 로그하거나 저장하지 않습니다
- Red team 훈련 — 비검열 모델은 콘텐츠 필터링 없이 솔직한 피드백을 제공합니다
CrewAI 문서
공식 CrewAI 문서
Venice 모델
모든 Venice 모델 둘러보기