Speech-to-Text Models | Venice API Docs

Loading models…

Utilizzo

I modelli speech-to-text trascrivono l’audio parlato in testo scritto. Si accede tramite l’API Audio Transcriptions.

mp3, mp4, mpeg, mpga, m4a, wav, webm, flac, ogg

Formato	Descrizione
`json`	Predefinito. Restituisce `{ "text": "..." }`.
`text`	Testo trascritto in chiaro.
`srt`	Formato sottotitoli SubRip con timestamp.
`vtt`	Formato sottotitoli WebVTT con timestamp.
`verbose_json`	Risposta completa con timestamp a livello di segmento e metadati.

I prezzi sono fatturati per secondo di audio in input. Consulta l’API Audio Transcriptions per esempi di richiesta e dettagli sui parametri.

⌘I