메인 콘텐츠로 건너뛰기
Venice는 chat completions 엔드포인트의 venice_parameters 입력으로 구동될 수 있는 추가 기능을 모델 내에서 지원합니다. 특정 상황에서는 요청 본문을 수정할 수 없는 클라이언트를 사용할 수 있습니다. 이러한 플랫폼의 경우, Venice의 Model Feature Suffix 제공을 활용하여 모델 ID를 통해 플래그를 전달할 수 있습니다.

구문

Model Feature Suffix는 다음 패턴을 따릅니다:
<model_id>:<parameter>=<value>
여러 매개변수의 경우 &로 연결하세요:
<model_id>:<parameter1>=<value1>&<parameter2>=<value2>&<parameter3>=<value3>

예제

웹 검색을 Auto로 설정

default:enable_web_search=auto

웹 검색 활성화 및 시스템 프롬프트 비활성화

default:enable_web_search=on&include_venice_system_prompt=false

웹 검색 활성화 및 응답에 인용 추가

default:enable_web_search=on&enable_web_citations=true

전체 페이지 스크래핑으로 웹 검색 활성화

default:enable_web_search=on&enable_web_scraping=true

캐릭터 사용

default:character_slug=alan-watts

추론 모델 응답에서 사고 블록 숨기기

qwen3-4b:strip_thinking_response=true

지원되는 추론 모델에서 사고 비활성화

특정 추론 모델(Qwen 3 등)은 사고 프로세스 비활성화를 지원합니다. 아래 접미사를 사용하여 활성화할 수 있습니다:
qwen3-4b:disable_thinking=true

스트리밍 응답에 웹 검색 결과 추가

이는 웹 검색을 활성화하고, 응답 본문에 인용을 추가하며, 최종 응답 메시지로 스트림에 검색 결과를 포함합니다. 여기 Postman 컬렉션에서 이 예제를 확인할 수 있습니다.
qwen3-4b:enable_web_search=on&enable_web_citations=true&include_search_results_in_stream=true

Postman 예제

이 기능의 예제는 여기 Postman 컬렉션에서 확인할 수 있습니다.