الانتقال إلى المحتوى الرئيسي
Seedance 2.0 هو نموذج فيديو رائد متعدد الوسائط، متاح على Venice كعائلة من ثلاثة متغيّرات لتوليد الفيديو من النص والصورة والمراجع. متغيّر reference-to-video قويّ بشكل غير معتاد: نقطة نهاية واحدة ومعرّف نموذج واحد يتعاملان مع أربعة سير عمل مميّزة (Reference، Edit، Extend، Stitch) — ويُستنتج سير العمل من شكل التعليمة. يستعرض هذا الدليل المتغيّرات، وسير العمل الأربعة مع التعليمات المعيارية، وحدود الإدخال متعدد الوسائط، والتسعير، وأمثلة curl كاملة.

المتغيّرات

معرّف النموذجالمتغيّردقّات الإخراجملاحظات
seedance-2-0-text-to-videoT2V480p / 720p / 1080pتعليمة نصية فقط
seedance-2-0-image-to-videoI2V480p / 720p / 1080pتثبيت بصورة الإطار الأول (واختياريًا الإطار الأخير)
seedance-2-0-reference-to-videoR2V480p / 720p / 1080pحتى 9 صور مرجعية + 3 فيديوهات مرجعية + 3 مانحات صوتية. يدعم Reference / Edit / Extend / Stitch
seedance-2-0-fast-text-to-videoFast T2V480p / 720pفئة أسرع بجودة أقل
seedance-2-0-fast-image-to-videoFast I2V480p / 720pفئة أسرع بجودة أقل
seedance-2-0-fast-reference-to-videoFast R2V480p / 720pفئة أسرع بجودة أقل؛ نفس مجموعة سير العمل
جميع المتغيّرات غير متزامنة. أرسل عبر POST /api/v1/video/queue، ثم استعلم بـ POST /api/v1/video/retrieve حتى يصبح جسم الاستجابة video/mp4. راجع توليد الفيديو لتدفق الطابور العام.

نموذج «نموذج واحد، أربعة سير عمل»

متغيّر reference-to-video (seedance-2-0-reference-to-video وشقيقه Fast) هو النموذج الأساسي ذاته يخدم أربع مهام مختلفة. يستنتج النموذج المهمة من بادئة التعليمة وشكل مدخلاتك. لا يوجد حقل task أو workflow — فبنية التعليمة هي ما يحدّد التوجيه.
سير العملما يفعلهبادئة التعليمةالمدخلات
Referenceتوليد فيديو جديد باستخدام الملفات المرجعية المرفوعة كمانحات للموضوع / الحركة / الأسلوب / الصوتRefer to ... in <Image|Video|Audio N> to generate ...نص + ≥1 مرجع صورة أو فيديو (0–9 صور، 0–3 فيديوهات)، بالإضافة اختياريًا إلى ما يصل إلى 3 مانحات صوتية
Editتعديل فيديو إدخال واحد مع الحفاظ على الباقيStrictly edit <Video 1>, changing its ...فيديو إدخال واحد + نص (صور اختيارية للتثبيت)
Extendتمديد أمامي / خلفي لمقطع واحدExtend <Video 1>, generate ...فيديو إدخال واحد + نص
Stitchدمج 2–3 مقاطع مع انتقالات مُولَّدة تلقائيًا<Video 1> + <transition description> + followed by <Video 2> + ...2–3 فيديوهات إدخال + نص
بنية التعليمة معيارية وحسّاسة لحالة الأحرف: أقواس زاوية، حرف أول كبير، مسافة واحدة قبل الرقم — <Video 1>، <Image 1>، <Audio 1>.

أنماط سير العمل

سير العمل Reference

استخدم الملفات المرجعية المرفوعة كـمانحات — للموضوع، والمشهد، والحركة، والأسلوب، ونبرة الصوت — لتوليد فيديو جديد كليًا. أنماط التعليمة المعيارية:
Refer to <Subject N> in <Image N> to generate ...
Refer to the [action | camera scene | style | sound effect] in <Video N> to generate ...
Refer to the [tone | timbre] in <Audio N> to generate ...
أمثلة:
  • Refer to <Subject 1> in <Image 1> to generate a 5-second clip of the same character riding a horse through snow.
  • Refer to the camera scene in <Video 1> to generate a similar establishing shot of a futuristic city at dawn.
  • Refer to <Subject 1> in <Image 1> and use the timbre in <Audio 1> for the narrator describing the scene. (يجب اقتران المانحات الصوتية بمرجع صورة أو فيديو واحد على الأقل — الصوت وحده يُرفض)

سير العمل Edit

عدّل فيديو إدخال واحد. كل ما لا يُذكر صراحة في التعليمة يُحفظ. استخدم هذا عندما تريد تغييرًا محليًا (استبدال موضوع، تغيير طقس/لون، إضافة/إزالة عنصر) بدلًا من فيديو جديد كليًا. نمط التعليمة المعياري:
Strictly edit <Video 1>, changing its [original feature] to [new feature] ...
أنماط فرعية لتحكّم أدق:
Add Elements:
  At [timestamp / timing] and [spatial location] of <Video 1>, add [description of intended element].

Remove Elements:
  Remove [element to be deleted] from <Video 1>, keeping the rest of the video content unchanged.

Modify Elements:
  Replace [description of element to be changed] in <Video 1> with [description of intended element].
أمثلة:
  • Strictly edit <Video 1>, changing its weather from sunny to a heavy rainstorm.
  • Add snacks such as fried chicken and pizza to the countertop in <Video 1>.
  • Remove the red car from <Video 1>, keeping the rest of the video content unchanged.
  • Replace the perfume featured in <Video 1> with the face cream from <Image 1>, with all original motions and camera work preserved.
يجمع المثال الأخير بين Edit ومرجع صورة — وهذا مسموح تمامًا، إذ يستخدم النموذج <Image 1> كمانح بصري للاستبدال.

سير العمل Extend

استمر بمقطع واحد للأمام أو للخلف زمنيًا. افتراضيًا يعيد Seedance المحتوى الجديد فقط — وليس الإدخال الأصلي متصلًا بالامتداد. هذا مقصود لاستمرارية الانتقال؛ وإذا أردت الحفاظ على المقطع الأصلي إلى جانب الامتداد، فقل ذلك صراحة:
Extend <Video 1>, generate [description of extended content]
Extend <Video 1> backward, [description of extended content]
Extend <Video 1>, start with <Video 1>, then [description of extended content]      ← يحفظ الإدخال في البداية
Extend <Video 1> backward, [description], and then end with <Video 1>               ← يحفظ الإدخال في النهاية
التعامل مع الانتقال: يستخرج النموذج تلقائيًا إطارات الانتقال للمزج السلس، ولا تُعاد توليد الأجزاء الأصلية من فيديو الإدخال. أمثلة:
  • Extend <Video 1>, generate a dramatic chase scene through narrow alleys at dusk.
  • Extend <Video 1> backward, the same character walking toward the camera before the original shot begins.
  • Extend <Video 1>, start with <Video 1>, then the camera pulls back to reveal a vast landscape.

سير العمل Stitch (إكمال المسار)

اربط 2–3 مقاطع إدخال بانتقالات مُولَّدة بالذكاء الاصطناعي. يجب ألّا تتجاوز المدة الإجمالية المجمّعة للإدخال 15 ثانية. نمط التعليمة المعياري:
<Video 1> + [transition description] + followed by <Video 2> [+ [transition description] + followed by <Video 3>]
أمثلة:
  • <Video 1> + a smooth seamless cut + followed by <Video 2>
  • <Video 1>. The moment a leaf falls to the ground, it sets off a special effect of golden particles. A gust of wind blows by, leading into <Video 2>.
  • <Video 1> + a wisp of smoke transforms into a flock of birds + followed by <Video 2> + a slow dolly-in + followed by <Video 3>
يقصّ النموذج تلقائيًا المقاطع الموصِلة عند نقاط الالتقاء لضمان الاستمرارية.

صيغة التعليمة الموحّدة

عبر سير العمل الأربعة، الصيغة الموصى بها للتأليف هي:
Subject + Motion + Environment (Optional)
       + Camera Movement / Cut (Optional)
       + Aesthetic Description (Optional)
       + Audio (Optional)
  • Subject + Motion: الأساس المنطقي — حدّد «مَن» يؤدّي «أي فعل»
  • Environment + Aesthetics: الخلفية المكانية، الإضاءة، الأسلوب البصري
  • Camera: نوع لقطة أو حركة صريحة
  • Audio: مؤثرات صوتية محيطة أو توجيه صوتي لإخراج غامر
وضع هذه فوق بادئة سير العمل (مثل Strictly edit <Video 1>, changing its <subject + motion + environment + ...>) يُنتج أعلى جودة من المخرجات.

حدود الإدخال متعدد الوسائط

القيم أدناه هي ما يقبله Venice API. الطلبات خارج هذه النطاقات تُرفض على طبقة المخطط برمز 400 قبل الوصول إلى الاستدلال.

الصور

القيدالقيمة
طرق الإدخالURL (http://، https://) أو رابط بيانات Base64 (data:image/...)
الصيغ.jpeg، .png، .webp، .bmp، .tiff، .gif، .heic، .heif
نسبة العرض إلى الارتفاع (W / H)حصرية (0.4, 2.5)
أدنى ضلع≥ 300 بكسل
عدد الصور: I2V الإطار الأول1
عدد الصور: I2V الإطار الأول + الأخير2
عدد الصور: R2V (V2 / Fast)1 – 9

الفيديوهات

القيدالقيمة
طرق الإدخالURL (http://، https://) أو رابط بيانات Base64 (data:video/...)
الصيغ.mp4، .mov
ترميزات الفيديوH.264 / AVC، H.265 / HEVC
ترميزات الصوت (في الحاوية)AAC، MP3
مدة كل مقطع[2, 15] ث (شامل)
الحد الأقصى لعدد المقاطع3 (R2V / Stitch / Extend)
إجمالي المدة المجمّعة≤ 15 ث عبر جميع المقاطع
حجم كل مقطع≤ 50 ميغابايت

الصوت

القيدالقيمة
طرق الإدخالURL (http://، https://) أو رابط بيانات Base64 (data:audio/...)
الصيغ.wav، .mp3
مدة كل مقطع[2, 15] ث
الحد الأقصى لعدد المقاطع3
إجمالي المدة المجمّعة≤ 15 ث عبر جميع المقاطع
حجم كل مقطع≤ 15 ميغابايت
الصوت المرجعي مدعوم على متغيّرات R2V فقط. تُمرَّر كل مدخلة إلى النموذج كعنصر محتوى بدور role: "reference_audio" تشير إليه التعليمة بـ <Audio 1>، <Audio 2>، <Audio 3> — ويستخدم النموذج كل مقطع لنبرة صوت أو مؤثرات صوتية أو موسيقى خلفية اعتمادًا على كيفية صياغة التعليمة. حقل audio_url المفرد القديم يُربط بنفس شكل المحتوى وهو الآن مكافئ لتمرير reference_audio_urls بعنصر واحد.
لا يمكن أن يكون reference_audio_urls المدخل المرجعي الوحيد. يتطلب النموذج مرجع صورة أو فيديو واحدًا على الأقل إلى جانب أي مانح صوتي. اقرن reference_audio_urls بـ reference_image_urls أو reference_video_urls أو image_url أو video_url — تُرفض الطلبات الصوتية فقط.

حجم الطلب

تقبل نقطة نهاية الطابور أجسام JSON حتى 35 ميغابايت. روابط البيانات المضمّنة لفيديوهات كبيرة قد تتجاوز هذا — لـ Stitch متعدد المقاطع خصوصًا، فضّل الـ URLs على base64 المضمّن.

التسعير

استدعِ POST /api/v1/video/quote للحصول على عرض سعر لشكل طلب معيّن قبل إرساله إلى /video/queue. نقطة نهاية الاقتباس هي المصدر المعتمد الوحيد؛ قد تتغيّر تفاصيل التسعير ولا ينبغي تخزينها مؤقتًا أو تكرارها على جانب العميل. عند تضمين فيديو(هات) مرجعية في الطلب، مرّر أيضًا reference_video_total_duration (مجموع كل مدد المقاطع المرجعية بالثواني) لتطابُق عرض السعر مع ما سيحاسب عليه /video/queue:
curl -X POST https://api.venice.ai/api/v1/video/quote \
  -H "Authorization: Bearer $VENICE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "seedance-2-0-reference-to-video",
    "duration": "5s",
    "resolution": "1080p",
    "aspect_ratio": "16:9",
    "reference_video_total_duration": 5
  }'

أمثلة كاملة

جميع الأمثلة تفترض ضبط VENICE_API_KEY في البيئة.

من نص إلى فيديو

curl -X POST https://api.venice.ai/api/v1/video/queue \
  -H "Authorization: Bearer $VENICE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "seedance-2-0-text-to-video",
    "prompt": "A golden retriever frolicking through a sunlit meadow at sunset, slow camera dolly-in, shallow depth of field, warm cinematic lighting.",
    "duration": "5s",
    "aspect_ratio": "16:9",
    "resolution": "1080p"
  }'

من صورة إلى فيديو (الإطار الأول)

curl -X POST https://api.venice.ai/api/v1/video/queue \
  -H "Authorization: Bearer $VENICE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "seedance-2-0-image-to-video",
    "prompt": "The lighthouse keeper turns toward the storm, lantern raised, waves crashing against the rocks.",
    "image_url": "https://example.com/lighthouse.jpg",
    "duration": "5s",
    "resolution": "720p"
  }'
لا يقبل seedance-2-0-image-to-video (ومتغيّره Fast) حقل aspect_ratio — إذ تُشتق نسبة الإخراج تلقائيًا من أبعاد صورة الإدخال. تمرير الحقل يُعيد 400 مع رسالة “This model does not support aspect_ratio”. استخدم متغيّرات T2V أو R2V إذا كنت تحتاج تحكّمًا صريحًا في نسبة العرض إلى الارتفاع.

سير عمل Reference — مانح موضوع

curl -X POST https://api.venice.ai/api/v1/video/queue \
  -H "Authorization: Bearer $VENICE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "seedance-2-0-reference-to-video",
    "prompt": "Refer to <Subject 1> in <Image 1> to generate a 5-second clip of the same character walking through a neon-lit Tokyo street at night.",
    "reference_image_urls": ["https://example.com/character.png"],
    "duration": "5s",
    "aspect_ratio": "9:16",
    "resolution": "1080p"
  }'

سير عمل Reference — مانح موضوع + صوت

curl -X POST https://api.venice.ai/api/v1/video/queue \
  -H "Authorization: Bearer $VENICE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "seedance-2-0-reference-to-video",
    "prompt": "Refer to <Subject 1> in <Image 1> to generate a 5-second clip of the same character walking through a neon-lit Tokyo street at night. Refer to the timbre in <Audio 1> for a soft female voiceover describing the scene.",
    "reference_image_urls": ["https://example.com/character.png"],
    "reference_audio_urls": ["https://example.com/voice-sample.mp3"],
    "duration": "5s",
    "aspect_ratio": "9:16",
    "resolution": "1080p"
  }'

سير عمل Edit

curl -X POST https://api.venice.ai/api/v1/video/queue \
  -H "Authorization: Bearer $VENICE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "seedance-2-0-reference-to-video",
    "prompt": "Strictly edit <Video 1>, changing its weather from sunny to a heavy rainstorm, with all original motions and camera work preserved.",
    "reference_video_urls": ["https://example.com/sunny-scene.mp4"],
    "reference_video_total_duration": 5,
    "duration": "5s",
    "aspect_ratio": "16:9",
    "resolution": "1080p"
  }'

سير عمل Edit مع تثبيت بصورة

curl -X POST https://api.venice.ai/api/v1/video/queue \
  -H "Authorization: Bearer $VENICE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "seedance-2-0-reference-to-video",
    "prompt": "Replace the perfume featured in <Video 1> with the face cream from <Image 1>, with all original motions and camera work preserved.",
    "reference_video_urls": ["https://example.com/perfume-ad.mp4"],
    "reference_image_urls": ["https://example.com/face-cream.png"],
    "reference_video_total_duration": 4,
    "duration": "5s",
    "aspect_ratio": "16:9",
    "resolution": "1080p"
  }'

Extend إلى الأمام

curl -X POST https://api.venice.ai/api/v1/video/queue \
  -H "Authorization: Bearer $VENICE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "seedance-2-0-reference-to-video",
    "prompt": "Extend <Video 1>, generate a dramatic chase scene through narrow alleys at dusk, with neon signs flickering and rain on the pavement.",
    "reference_video_urls": ["https://example.com/alley-intro.mp4"],
    "reference_video_total_duration": 4,
    "duration": "5s",
    "aspect_ratio": "16:9",
    "resolution": "1080p"
  }'

Stitch (3 مقاطع)

curl -X POST https://api.venice.ai/api/v1/video/queue \
  -H "Authorization: Bearer $VENICE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "seedance-2-0-reference-to-video",
    "prompt": "<Video 1> + a wisp of smoke transforms into a flock of birds + followed by <Video 2> + a slow dolly-in + followed by <Video 3>",
    "reference_video_urls": [
      "https://example.com/clip-1.mp4",
      "https://example.com/clip-2.mp4",
      "https://example.com/clip-3.mp4"
    ],
    "reference_video_total_duration": 12,
    "duration": "5s",
    "aspect_ratio": "16:9",
    "resolution": "1080p"
  }'

الاستعلام عن الاكتمال

بعد كل إرسال إلى الطابور، احفظ queue_id المُعاد واستعلم بـ /video/retrieve حتى يصبح جسم الاستجابة video/mp4:
curl -X POST https://api.venice.ai/api/v1/video/retrieve \
  -H "Authorization: Bearer $VENICE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "seedance-2-0-reference-to-video",
    "queue_id": "123e4567-e89b-12d3-a456-426614174000"
  }' \
  -o output.mp4
تكون الاستجابة JSON ({ "status": "queued" | "running" | "failed", ... }) حتى تكتمل المهمة، عندها يتحوّل جسم الاستجابة إلى بايتات video/mp4. راجع توليد الفيديو لنمط الاستعلام الكامل.

استكشاف الأخطاء وإصلاحها

At least one reference is required for this model

يجب أن تتضمن طلبات reference-to-video واحدًا على الأقل من reference_image_urls أو reference_video_urls أو image_references أو video_references. التوليد النصي البحت ليس سير عمل R2V صالحًا — استخدم seedance-2-0-text-to-video بدلًا من ذلك. لا يكفي reference_audio_urls وحده (راجع قسم الصوت أعلاه).

reference_video_urls must have at most 3 videos

يحدّد النموذج الفيديوهات المرجعية بـ 3. إن احتجت إلى مقاطع أكثر، نفّذ Stitch أولًا (3 → 1)، ثم استخدم الإخراج كمرجع لمتابعة لاحقة.

Per clip must be 2–15s / المجموع > 15s

مدة كل مقطع [2, 15] ثانية شاملاً؛ ومجموع كل الفيديوهات المرجعية محدّد أيضًا بـ 15 ثانية. اقتص المقاطع على جانب العميل قبل الإرسال.

تعليمة توجِّه إلى سير العمل الخاطئ

يُستنتج سير العمل من بنية التعليمة. أخطاء توجيه شائعة:
  • ترغب في Extend لكنك تكتب Refer to ... ← يعامل النموذج فيديوك كـمانح، وليس كقماشة للاستمرار
  • ترغب في Stitch لكنك تكتب Refer to ... ← يختار النموذج أحدها كمانح، ويتجاهل الباقي
  • ترغب في Edit لكنك تكتب Generate a video based on <Video 1> ← غامض؛ قد يلجأ النموذج إلى Reference
استخدم البادئات المعيارية كما هي مكتوبة بالضبط: Strictly edit <Video 1>, ...، Extend <Video 1>, ...، <Video 1> + ... + followed by <Video 2>.

عرض السعر لا يطابق المبلغ المُجدوَل

إذا ضمّنت فيديو مرجعيًا ولم تمرّر reference_video_total_duration إلى /video/quote، فقد يختلف عرض السعر عن المبلغ المُجدوَل. مرّر دومًا reference_video_total_duration (مجموع كل مدد المقاطع المرجعية بالثواني) عند وجود فيديوهات مرجعية.

مراجع