Speech-to-Text Models | Venice API Docs

Loading models…

사용법

Speech-to-text 모델은 음성 오디오를 텍스트로 전사합니다. Audio Transcriptions API를 통해 액세스할 수 있습니다.

mp3, mp4, mpeg, mpga, m4a, wav, webm, flac, ogg

형식	설명
`json`	기본값. `{ "text": "..." }`를 반환합니다.
`text`	일반 전사 텍스트.
`srt`	타임스탬프가 포함된 SubRip 자막 형식.
`vtt`	타임스탬프가 포함된 WebVTT 자막 형식.
`verbose_json`	세그먼트 수준 타임스탬프와 메타데이터가 포함된 전체 응답.

가격은 입력 오디오의 초당 청구됩니다. 요청 예제와 매개변수 세부 정보는 Audio Transcriptions API를 참조하세요.

⌘I