Vai al contenuto principale
Loading models…

Utilizzo

I modelli speech-to-text trascrivono l’audio parlato in testo scritto. Si accede tramite l’API Audio Transcriptions.

Formati audio supportati

mp3, mp4, mpeg, mpga, m4a, wav, webm, flac, ogg

Formati di risposta

FormatoDescrizione
jsonPredefinito. Restituisce { "text": "..." }.
textTesto trascritto in chiaro.
srtFormato sottotitoli SubRip con timestamp.
vttFormato sottotitoli WebVTT con timestamp.
verbose_jsonRisposta completa con timestamp a livello di segmento e metadati.
I prezzi sono fatturati per secondo di audio in input. Consulta l’API Audio Transcriptions per esempi di richiesta e dettagli sui parametri.