Loading models…
Uso
Modelos de fala para texto transcrevem áudio falado em texto escrito. Eles são acessados pela API de transcrições de áudio.Formatos de áudio suportados
mp3, mp4, mpeg, mpga, m4a, wav, webm, flac, ogg
Formatos de resposta
| Formato | Descrição |
|---|---|
json | Padrão. Retorna { "text": "..." }. |
text | Texto transcrito puro. |
srt | Formato de legenda SubRip com timestamps. |
vtt | Formato de legenda WebVTT com timestamps. |
verbose_json | Resposta completa com timestamps por segmento e metadados. |
A cobrança é por segundo de áudio de entrada. Veja a API de transcrições de áudio para exemplos de requisição e detalhes dos parâmetros.