Speech-to-Text Models | Venice API Docs

Loading models…

Uso

Los modelos de voz a texto transcriben audio hablado en texto escrito. Se acceden mediante la API de transcripciones de audio.

mp3, mp4, mpeg, mpga, m4a, wav, webm, flac, ogg

Formato	Descripción
`json`	Predeterminado. Devuelve `{ "text": "..." }`.
`text`	Texto transcrito plano.
`srt`	Formato de subtítulos SubRip con marcas de tiempo.
`vtt`	Formato de subtítulos WebVTT con marcas de tiempo.
`verbose_json`	Respuesta completa con marcas de tiempo a nivel de segmento y metadatos.

La facturación es por segundo de audio de entrada. Consulta la API de transcripciones de audio para ejemplos de solicitud y detalles de parámetros.

⌘I