Loading models…
Utilizzo
I modelli speech-to-text trascrivono l’audio parlato in testo scritto. Si accede tramite l’API Audio Transcriptions.Formati audio supportati
mp3, mp4, mpeg, mpga, m4a, wav, webm, flac, ogg
Formati di risposta
| Formato | Descrizione |
|---|---|
json | Predefinito. Restituisce { "text": "..." }. |
text | Testo trascritto in chiaro. |
srt | Formato sottotitoli SubRip con timestamp. |
vtt | Formato sottotitoli WebVTT con timestamp. |
verbose_json | Risposta completa con timestamp a livello di segmento e metadati. |
I prezzi sono fatturati per secondo di audio in input. Consulta l’API Audio Transcriptions per esempi di richiesta e dettagli sui parametri.