تفكر بعض النماذج بصوت عالٍ قبل الإجابة. تعمل على المشكلات خطوة بخطوة، ثم تعطيك إجابة نهائية. هذا يجعلها أقوى في الرياضيات والشفرة والمهام كثيفة المنطق.
اطلع على القائمة الكاملة للنماذج والأسعار وحدود السياق في صفحة النماذج. لا تدعم جميع نماذج التفكير المنطقي معامل reasoning_effort. انظر دعم النموذج للتفاصيل.
قراءة المخرجات
تعيد نماذج التفكير المنطقي تفكيرها في حقل reasoning_content منفصل، مع الحفاظ على content نظيفًا:
response = client.chat.completions.create(
model="zai-org-glm-5-1",
messages=[{"role": "user", "content": "What is 15% of 240?"}]
)
thinking = response.choices[0].message.reasoning_content
answer = response.choices[0].message.content
يعيد بعض المزودين (Anthropic، Google، OpenAI، Qwen) tokens تفكير مشفرة أو ملخصة. عندما يحدث هذا، يحتوي reasoning_content على عنصر نائب "[Some reasoning content is encrypted]".
البث
عند البث، يصل reasoning_content في الـ delta قبل الإجابة النهائية:
stream = client.chat.completions.create(
model="zai-org-glm-5-1",
messages=[{"role": "user", "content": "Explain photosynthesis"}],
stream=True
)
for chunk in stream:
if chunk.choices:
delta = chunk.choices[0].delta
if delta.reasoning_content:
print(delta.reasoning_content, end="")
if delta.content:
print(delta.content, end="")
جهد التفكير المنطقي
يتحكم معامل reasoning_effort في مقدار التفكير الذي يقوم به النموذج قبل الاستجابة. الجهد الأعلى يعني تفكيرًا أعمق ولكن مزيدًا من الـ tokens وزمن الاستجابة.
القيم المقبولة
| القيمة | الوصف |
|---|
none | يعطل التفكير المنطقي تمامًا |
minimal | تفكير منطقي أساسي بأقل جهد |
low | تفكير منطقي خفيف للمشكلات البسيطة |
medium | تفكير منطقي متوازن للتعقيد المعتدل |
high | تفكير منطقي عميق للمشكلات المعقدة |
xhigh | عمق تفكير منطقي عالٍ جدًا |
max | الحد الأقصى لقدرة التفكير المنطقي |
لا تدعم جميع النماذج جميع القيم. لا تقوم Venice بالتخطيط التلقائي إلى أقرب مستوى مدعوم. القيم غير المدعومة تعيد خطأ 400 من المزود الأساسي. على سبيل المثال، إرسال xhigh إلى Claude أو max إلى GPT-5.2 سيفشل.عند الشك، استخدم low أو medium أو high. هذه هي القيم الأكثر دعمًا على نطاق واسع.
دعم النموذج
OpenAI
| النموذج | القيم المدعومة |
|---|
| GPT-5.2 | none, low, medium, high, xhigh |
| GPT-5.2 Codex, GPT-5.3 Codex | low, medium, high, xhigh |
Anthropic
| النموذج | القيم المدعومة |
|---|
| Claude Opus 4.6, Opus 4.6 Fast | low, medium, high, max |
| Claude Opus 4.5, Sonnet 4.5, Sonnet 4.6 | low, medium, high |
Google
| النموذج | القيم المدعومة |
|---|
| Gemini 3 Pro Preview | low, high |
| Gemini 3.1 Pro Preview | low, medium, high |
| Gemini 3 Flash Preview | minimal, low, medium, high |
xAI
نماذج Grok (Grok 4.1 Fast، Grok Code Fast) لا تدعم reasoning_effort. تحديده سيؤدي إلى خطأ.
نماذج أخرى
| النموذج | القيم المدعومة |
|---|
| Qwen 3 235B A22B Thinking, Qwen 3.5 35B A3B | low, medium, high |
| Kimi K2.5 | low, medium, high |
| MiniMax M2.5, M2.1 | low, medium, high |
| GLM 5.1 series | تفكير منطقي مدمج فقط، غير قابل للتكوين |
| DeepSeek R1 | تفكير منطقي مدمج فقط، غير قابل للتكوين |
الاستخدام
مرر reasoning_effort كمعامل عالي المستوى أو استخدم تنسيق reasoning.effort المتداخل:
response = client.chat.completions.create(
model="minimax-m25",
messages=[{"role": "user", "content": "Prove that there are infinitely many primes"}],
extra_body={"reasoning": {"effort": "high"}}
)
التنسيق المسطح "reasoning_effort": "high" مقبول أيضًا.
تعطيل التفكير المنطقي
هناك طريقتان لتعطيل التفكير المنطقي:
| الطريقة | الصياغة | كيف تعمل |
|---|
reasoning.enabled: false | "reasoning": {"enabled": false} | مفتاح تبديل على مستوى Venice يمنع إرسال معاملات التفكير المنطقي إلى المزود. موصى به. |
reasoning.effort: "none" | "reasoning": {"effort": "none"} | يُمرَّر إلى المزود الذي يقرر كيفية التعامل معه. مدعوم فقط من قبل بعض النماذج (مثل GPT-5.x). |
للنماذج التي تدعمها، reasoning.enabled: false هو الخيار الأكثر موثوقية:
| النموذج | يمكن تعطيله؟ |
|---|
| GPT-5.2 | نعم |
| GPT-5.2 Codex, GPT-5.3 Codex | نعم (لكن جهد none غير مدعوم) |
| Qwen 3 235B A22B Thinking, Qwen 3.5 35B A3B | نعم |
| GLM 5.1 series | نعم |
| Claude Opus 4.5/4.6/4.6 Fast, Sonnet 4.5/4.6 | لا (يفكر دائمًا) |
| Gemini 3 Pro, 3.1 Pro, 3 Flash | لا (يفكر دائمًا) |
| DeepSeek R1 | لا (يفكر دائمًا) |
response = client.chat.completions.create(
model="openai-gpt-52",
messages=[{"role": "user", "content": "What's the capital of France?"}],
extra_body={"reasoning": {"enabled": False}}
)
حدود الـ Tokens
تولد نماذج التفكير المنطقي tokens إجابة مرئية (في content) و tokens تفكير منطقي (في reasoning_content). كلاهما يحتسب من ميزانية الـ tokens الخاصة بك.
تعيين حد للـ tokens
استخدم max_completion_tokens للحد من إجمالي عدد الـ tokens التي يولدها النموذج، بما في ذلك التفكير المنطقي:
{
"model": "deepseek-v4-flash",
"messages": [...],
"max_completion_tokens": 500
}
max_tokens مقبول أيضًا ويتصرف بالطريقة نفسها. إذا تم تعيين كليهما، يأخذ max_completion_tokens الأسبقية.
للحصول على المزيد من المخرجات المرئية، ارفع الحد، أو خفّض reasoning_effort، أو عطّل التفكير المنطقي.
قراءة التفصيل
يُظهر كائن usage كيف أُنفقت ميزانيتك:
"usage": {
"completion_tokens": 501,
"completion_tokens_details": { "reasoning_tokens": 169 },
"prompt_tokens": 13,
"total_tokens": 514
}
في هذا المثال، تم إنفاق 169 token على التفكير المنطقي و 332 على الإجابة المرئية. عند الوصول إلى الحد، يكون finish_reason هو length.
الحد الأعلى لكل نموذج متاح كـ maxCompletionTokens على نقطة نهاية /v1/models.
النماذج غير التفكيرية
يتصرف max_tokens و max_completion_tokens بنفس الطريقة على النماذج غير التفكيرية، إذ يحدّان مباشرة المخرجات المرئية.
اكتشاف القدرات
تحقق مما يدعمه النموذج عبر نقطة نهاية /v1/models:
| الحقل | المعنى |
|---|
supportsReasoning | النموذج لديه قدرة تفكير منطقي (chain-of-thought) |
supportsReasoningEffort | النموذج يقبل معامل reasoning_effort / reasoning.effort |
أفضل الممارسات
- استخدم الافتراضي
medium للاستخدام العام
- استخدم
high أو xhigh للمهام المعقدة (الرياضيات، الشفرة، التحليل)
- استخدم
low للتطبيقات الحساسة لزمن الاستجابة
- استخدم
reasoning.enabled: false أو عيّن الجهد إلى none لتعطيل التفكير المنطقي
- عند الشك، استخدم
low أو medium أو high. هذه هي القيم الأكثر دعمًا على نطاق واسع