Saltar al contenido principal
Loading models…

Uso

Los modelos de voz a texto transcriben audio hablado en texto escrito. Se acceden mediante la API de transcripciones de audio.

Formatos de audio admitidos

mp3, mp4, mpeg, mpga, m4a, wav, webm, flac, ogg

Formatos de respuesta

FormatoDescripción
jsonPredeterminado. Devuelve { "text": "..." }.
textTexto transcrito plano.
srtFormato de subtítulos SubRip con marcas de tiempo.
vttFormato de subtítulos WebVTT con marcas de tiempo.
verbose_jsonRespuesta completa con marcas de tiempo a nivel de segmento y metadatos.
La facturación es por segundo de audio de entrada. Consulta la API de transcripciones de audio para ejemplos de solicitud y detalles de parámetros.