الانتقال إلى المحتوى الرئيسي
جارٍ تحميل النماذج…

الاستخدام

تقوم نماذج تحويل الكلام إلى نص بنسخ الصوت المنطوق إلى نص مكتوب. يتم الوصول إليها عبر واجهة Audio Transcriptions API.

صيغ الصوت المدعومة

mp3, mp4, mpeg, mpga, m4a, wav, webm, flac, ogg

صيغ الاستجابة

الصيغةالوصف
jsonالافتراضي. يُرجع { "text": "..." }.
textنص منسوخ عادي.
srtصيغة الترجمة SubRip مع طوابع زمنية.
vttصيغة الترجمة WebVTT مع طوابع زمنية.
verbose_jsonاستجابة كاملة مع طوابع زمنية على مستوى المقاطع وبيانات وصفية.
يتم احتساب التسعير لكل ثانية من الصوت المُدخَل. راجع واجهة Audio Transcriptions API للحصول على أمثلة الطلبات وتفاصيل المعاملات.