Pular para o conteúdo principal
Loading models…

Uso

Modelos de fala para texto transcrevem áudio falado em texto escrito. Eles são acessados pela API de transcrições de áudio.

Formatos de áudio suportados

mp3, mp4, mpeg, mpga, m4a, wav, webm, flac, ogg

Formatos de resposta

FormatoDescrição
jsonPadrão. Retorna { "text": "..." }.
textTexto transcrito puro.
srtFormato de legenda SubRip com timestamps.
vttFormato de legenda WebVTT com timestamps.
verbose_jsonResposta completa com timestamps por segmento e metadados.
A cobrança é por segundo de áudio de entrada. Veja a API de transcrições de áudio para exemplos de requisição e detalhes dos parâmetros.