الانتقال إلى المحتوى الرئيسي
تفكر بعض النماذج بصوت عالٍ قبل الإجابة. تعمل على المشكلات خطوة بخطوة، ثم تعطيك إجابة نهائية. هذا يجعلها أقوى في الرياضيات والشفرة والمهام كثيفة المنطق.
اطلع على القائمة الكاملة للنماذج والأسعار وحدود السياق في صفحة النماذج. لا تدعم جميع نماذج التفكير المنطقي معامل reasoning_effort. انظر دعم النموذج للتفاصيل.

قراءة المخرجات

تعيد نماذج التفكير المنطقي تفكيرها في حقل reasoning_content منفصل، مع الحفاظ على content نظيفًا:
response = client.chat.completions.create(
    model="zai-org-glm-5-1",
    messages=[{"role": "user", "content": "What is 15% of 240?"}]
)

thinking = response.choices[0].message.reasoning_content
answer = response.choices[0].message.content
يعيد بعض المزودين (Anthropic، Google، OpenAI، Qwen) tokens تفكير مشفرة أو ملخصة. عندما يحدث هذا، يحتوي reasoning_content على عنصر نائب "[Some reasoning content is encrypted]".

البث

عند البث، يصل reasoning_content في الـ delta قبل الإجابة النهائية:
stream = client.chat.completions.create(
    model="zai-org-glm-5-1",
    messages=[{"role": "user", "content": "Explain photosynthesis"}],
    stream=True
)

for chunk in stream:
    if chunk.choices:
        delta = chunk.choices[0].delta
        if delta.reasoning_content:
            print(delta.reasoning_content, end="")
        if delta.content:
            print(delta.content, end="")

جهد التفكير المنطقي

يتحكم معامل reasoning_effort في مقدار التفكير الذي يقوم به النموذج قبل الاستجابة. الجهد الأعلى يعني تفكيرًا أعمق ولكن مزيدًا من الـ tokens وزمن الاستجابة.

القيم المقبولة

القيمةالوصف
noneيعطل التفكير المنطقي تمامًا
minimalتفكير منطقي أساسي بأقل جهد
lowتفكير منطقي خفيف للمشكلات البسيطة
mediumتفكير منطقي متوازن للتعقيد المعتدل
highتفكير منطقي عميق للمشكلات المعقدة
xhighعمق تفكير منطقي عالٍ جدًا
maxالحد الأقصى لقدرة التفكير المنطقي
لا تدعم جميع النماذج جميع القيم. لا تقوم Venice بالتخطيط التلقائي إلى أقرب مستوى مدعوم. القيم غير المدعومة تعيد خطأ 400 من المزود الأساسي. على سبيل المثال، إرسال xhigh إلى Claude أو max إلى GPT-5.2 سيفشل.عند الشك، استخدم low أو medium أو high. هذه هي القيم الأكثر دعمًا على نطاق واسع.

دعم النموذج

OpenAI

النموذجالقيم المدعومة
GPT-5.2none, low, medium, high, xhigh
GPT-5.2 Codex, GPT-5.3 Codexlow, medium, high, xhigh

Anthropic

النموذجالقيم المدعومة
Claude Opus 4.6, Opus 4.6 Fastlow, medium, high, max
Claude Opus 4.5, Sonnet 4.5, Sonnet 4.6low, medium, high

Google

النموذجالقيم المدعومة
Gemini 3 Pro Previewlow, high
Gemini 3.1 Pro Previewlow, medium, high
Gemini 3 Flash Previewminimal, low, medium, high

xAI

نماذج Grok (Grok 4.1 Fast، Grok Code Fast) لا تدعم reasoning_effort. تحديده سيؤدي إلى خطأ.

نماذج أخرى

النموذجالقيم المدعومة
Qwen 3 235B A22B Thinking, Qwen 3.5 35B A3Blow, medium, high
Kimi K2.5low, medium, high
MiniMax M2.5, M2.1low, medium, high
GLM 5.1 seriesتفكير منطقي مدمج فقط، غير قابل للتكوين
DeepSeek R1تفكير منطقي مدمج فقط، غير قابل للتكوين

الاستخدام

مرر reasoning_effort كمعامل عالي المستوى أو استخدم تنسيق reasoning.effort المتداخل:
response = client.chat.completions.create(
    model="minimax-m25",
    messages=[{"role": "user", "content": "Prove that there are infinitely many primes"}],
    extra_body={"reasoning": {"effort": "high"}}
)
التنسيق المسطح "reasoning_effort": "high" مقبول أيضًا.

تعطيل التفكير المنطقي

هناك طريقتان لتعطيل التفكير المنطقي:
الطريقةالصياغةكيف تعمل
reasoning.enabled: false"reasoning": {"enabled": false}مفتاح تبديل على مستوى Venice يمنع إرسال معاملات التفكير المنطقي إلى المزود. موصى به.
reasoning.effort: "none""reasoning": {"effort": "none"}يُمرَّر إلى المزود الذي يقرر كيفية التعامل معه. مدعوم فقط من قبل بعض النماذج (مثل GPT-5.x).
للنماذج التي تدعمها، reasoning.enabled: false هو الخيار الأكثر موثوقية:
النموذجيمكن تعطيله؟
GPT-5.2نعم
GPT-5.2 Codex, GPT-5.3 Codexنعم (لكن جهد none غير مدعوم)
Qwen 3 235B A22B Thinking, Qwen 3.5 35B A3Bنعم
GLM 5.1 seriesنعم
Claude Opus 4.5/4.6/4.6 Fast, Sonnet 4.5/4.6لا (يفكر دائمًا)
Gemini 3 Pro, 3.1 Pro, 3 Flashلا (يفكر دائمًا)
DeepSeek R1لا (يفكر دائمًا)
response = client.chat.completions.create(
    model="openai-gpt-52",
    messages=[{"role": "user", "content": "What's the capital of France?"}],
    extra_body={"reasoning": {"enabled": False}}
)

حدود الـ Tokens

تولد نماذج التفكير المنطقي tokens إجابة مرئية (في content) و tokens تفكير منطقي (في reasoning_content). كلاهما يحتسب من ميزانية الـ tokens الخاصة بك.

تعيين حد للـ tokens

استخدم max_completion_tokens للحد من إجمالي عدد الـ tokens التي يولدها النموذج، بما في ذلك التفكير المنطقي:
{
  "model": "deepseek-v4-flash",
  "messages": [...],
  "max_completion_tokens": 500
}
max_tokens مقبول أيضًا ويتصرف بالطريقة نفسها. إذا تم تعيين كليهما، يأخذ max_completion_tokens الأسبقية. للحصول على المزيد من المخرجات المرئية، ارفع الحد، أو خفّض reasoning_effort، أو عطّل التفكير المنطقي.

قراءة التفصيل

يُظهر كائن usage كيف أُنفقت ميزانيتك:
"usage": {
  "completion_tokens": 501,
  "completion_tokens_details": { "reasoning_tokens": 169 },
  "prompt_tokens": 13,
  "total_tokens": 514
}
في هذا المثال، تم إنفاق 169 token على التفكير المنطقي و 332 على الإجابة المرئية. عند الوصول إلى الحد، يكون finish_reason هو length. الحد الأعلى لكل نموذج متاح كـ maxCompletionTokens على نقطة نهاية /v1/models.

النماذج غير التفكيرية

يتصرف max_tokens و max_completion_tokens بنفس الطريقة على النماذج غير التفكيرية، إذ يحدّان مباشرة المخرجات المرئية.

اكتشاف القدرات

تحقق مما يدعمه النموذج عبر نقطة نهاية /v1/models:
الحقلالمعنى
supportsReasoningالنموذج لديه قدرة تفكير منطقي (chain-of-thought)
supportsReasoningEffortالنموذج يقبل معامل reasoning_effort / reasoning.effort

أفضل الممارسات

  • استخدم الافتراضي medium للاستخدام العام
  • استخدم high أو xhigh للمهام المعقدة (الرياضيات، الشفرة، التحليل)
  • استخدم low للتطبيقات الحساسة لزمن الاستجابة
  • استخدم reasoning.enabled: false أو عيّن الجهد إلى none لتعطيل التفكير المنطقي
  • عند الشك، استخدم low أو medium أو high. هذه هي القيم الأكثر دعمًا على نطاق واسع