Loading models…
Uso
Los modelos de voz a texto transcriben audio hablado en texto escrito. Se acceden mediante la API de transcripciones de audio.Formatos de audio admitidos
mp3, mp4, mpeg, mpga, m4a, wav, webm, flac, ogg
Formatos de respuesta
| Formato | Descripción |
|---|---|
json | Predeterminado. Devuelve { "text": "..." }. |
text | Texto transcrito plano. |
srt | Formato de subtítulos SubRip con marcas de tiempo. |
vtt | Formato de subtítulos WebVTT con marcas de tiempo. |
verbose_json | Respuesta completa con marcas de tiempo a nivel de segmento y metadatos. |
La facturación es por segundo de audio de entrada. Consulta la API de transcripciones de audio para ejemplos de solicitud y detalles de parámetros.