Modelos de fala para texto | Documentação da API Venice

Loading models…

Uso

Modelos de fala para texto transcrevem áudio falado em texto escrito. Eles são acessados pela API de transcrições de áudio.

mp3, mp4, mpeg, mpga, m4a, wav, webm, flac, ogg

Formato	Descrição
`json`	Padrão. Retorna `{ "text": "..." }`.
`text`	Texto transcrito puro.
`srt`	Formato de legenda SubRip com timestamps.
`vtt`	Formato de legenda WebVTT com timestamps.
`verbose_json`	Resposta completa com timestamps por segmento e metadados.

A cobrança é por segundo de áudio de entrada. Veja a API de transcrições de áudio para exemplos de requisição e detalhes dos parâmetros.

⌘I