نماذج التفكير المنطقي

تفكر بعض النماذج بصوت عالٍ قبل الإجابة. تعمل على المشكلات خطوة بخطوة، ثم تعطيك إجابة نهائية. هذا يجعلها أقوى في الرياضيات والشفرة والمهام كثيفة المنطق.

اطلع على القائمة الكاملة للنماذج والأسعار وحدود السياق في صفحة النماذج. لا تدعم جميع نماذج التفكير المنطقي معامل reasoning_effort. انظر دعم النموذج للتفاصيل.

قراءة المخرجات

تعيد نماذج التفكير المنطقي تفكيرها في حقل reasoning_content منفصل، مع الحفاظ على content نظيفًا:

response = client.chat.completions.create(
    model="zai-org-glm-5-1",
    messages=[{"role": "user", "content": "What is 15% of 240?"}]
)

thinking = response.choices[0].message.reasoning_content
answer = response.choices[0].message.content

const response = await client.chat.completions.create({
    model: "zai-org-glm-5-1",
    messages: [{ role: "user", content: "What is 15% of 240?" }]
});

const thinking = response.choices[0].message.reasoning_content;
const answer = response.choices[0].message.content;

curl https://api.venice.ai/api/v1/chat/completions \
  -H "Authorization: Bearer $VENICE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "zai-org-glm-5-1",
    "messages": [{"role": "user", "content": "What is 15% of 240?"}]
  }'

يعيد بعض المزودين (Anthropic، Google، OpenAI، Qwen) tokens تفكير مشفرة أو ملخصة. عندما يحدث هذا، يحتوي reasoning_content على عنصر نائب "[Some reasoning content is encrypted]".

البث

عند البث، يصل reasoning_content في الـ delta قبل الإجابة النهائية:

stream = client.chat.completions.create(
    model="zai-org-glm-5-1",
    messages=[{"role": "user", "content": "Explain photosynthesis"}],
    stream=True
)

for chunk in stream:
    if chunk.choices:
        delta = chunk.choices[0].delta
        if delta.reasoning_content:
            print(delta.reasoning_content, end="")
        if delta.content:
            print(delta.content, end="")

const stream = await client.chat.completions.create({
    model: "zai-org-glm-5-1",
    messages: [{ role: "user", content: "Explain photosynthesis" }],
    stream: true
});

for await (const chunk of stream) {
    if (chunk.choices?.[0]?.delta) {
        const delta = chunk.choices[0].delta;
        if (delta.reasoning_content) process.stdout.write(delta.reasoning_content);
        if (delta.content) process.stdout.write(delta.content);
    }
}

curl https://api.venice.ai/api/v1/chat/completions \
  -H "Authorization: Bearer $VENICE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "zai-org-glm-5-1",
    "messages": [{"role": "user", "content": "Explain photosynthesis"}],
    "stream": true
  }'

جهد التفكير المنطقي

يتحكم معامل reasoning_effort في مقدار التفكير الذي يقوم به النموذج قبل الاستجابة. الجهد الأعلى يعني تفكيرًا أعمق ولكن مزيدًا من الـ tokens وزمن الاستجابة.

القيم المقبولة

القيمة	الوصف
`none`	يعطل التفكير المنطقي تمامًا
`minimal`	تفكير منطقي أساسي بأقل جهد
`low`	تفكير منطقي خفيف للمشكلات البسيطة
`medium`	تفكير منطقي متوازن للتعقيد المعتدل
`high`	تفكير منطقي عميق للمشكلات المعقدة
`xhigh`	عمق تفكير منطقي عالٍ جدًا
`max`	الحد الأقصى لقدرة التفكير المنطقي

لا تدعم جميع النماذج جميع القيم. لا تقوم Venice بالتخطيط التلقائي إلى أقرب مستوى مدعوم. القيم غير المدعومة تعيد خطأ 400 من المزود الأساسي. على سبيل المثال، إرسال xhigh إلى Claude أو max إلى GPT-5.2 سيفشل.عند الشك، استخدم low أو medium أو high. هذه هي القيم الأكثر دعمًا على نطاق واسع.

دعم النموذج

OpenAI

النموذج	القيم المدعومة
GPT-5.2	`none`, `low`, `medium`, `high`, `xhigh`
GPT-5.2 Codex, GPT-5.3 Codex	`low`, `medium`, `high`, `xhigh`

Anthropic

النموذج	القيم المدعومة
Claude Opus 4.6, Opus 4.6 Fast	`low`, `medium`, `high`, `max`
Claude Opus 4.5, Sonnet 4.5, Sonnet 4.6	`low`, `medium`, `high`

Google

النموذج	القيم المدعومة
Gemini 3 Pro Preview	`low`, `high`
Gemini 3.1 Pro Preview	`low`, `medium`, `high`
Gemini 3 Flash Preview	`minimal`, `low`, `medium`, `high`

xAI

نماذج Grok (Grok 4.1 Fast، Grok Code Fast) لا تدعم reasoning_effort. تحديده سيؤدي إلى خطأ.

نماذج أخرى

النموذج	القيم المدعومة
Qwen 3 235B A22B Thinking, Qwen 3.5 35B A3B	`low`, `medium`, `high`
Kimi K2.5	`low`, `medium`, `high`
MiniMax M2.5, M2.1	`low`, `medium`, `high`
GLM 5.1 series	تفكير منطقي مدمج فقط، غير قابل للتكوين
DeepSeek R1	تفكير منطقي مدمج فقط، غير قابل للتكوين

الاستخدام

مرر reasoning_effort كمعامل عالي المستوى أو استخدم تنسيق reasoning.effort المتداخل:

response = client.chat.completions.create(
    model="minimax-m25",
    messages=[{"role": "user", "content": "Prove that there are infinitely many primes"}],
    extra_body={"reasoning": {"effort": "high"}}
)

const response = await client.chat.completions.create({
    model: "minimax-m25",
    messages: [{ role: "user", content: "Prove that there are infinitely many primes" }],
    reasoning: { effort: "high" }
});

curl https://api.venice.ai/api/v1/chat/completions \
  -H "Authorization: Bearer $VENICE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "minimax-m25",
    "messages": [{"role": "user", "content": "Prove that there are infinitely many primes"}],
    "reasoning": {"effort": "high"}
  }'

التنسيق المسطح "reasoning_effort": "high" مقبول أيضًا.

تعطيل التفكير المنطقي

هناك طريقتان لتعطيل التفكير المنطقي:

الطريقة	الصياغة	كيف تعمل
`reasoning.enabled: false`	`"reasoning": {"enabled": false}`	مفتاح تبديل على مستوى Venice يمنع إرسال معاملات التفكير المنطقي إلى المزود. موصى به.
`reasoning.effort: "none"`	`"reasoning": {"effort": "none"}`	يُمرَّر إلى المزود الذي يقرر كيفية التعامل معه. مدعوم فقط من قبل بعض النماذج (مثل GPT-5.x).

للنماذج التي تدعمها، reasoning.enabled: false هو الخيار الأكثر موثوقية:

النموذج	يمكن تعطيله؟
GPT-5.2	نعم
GPT-5.2 Codex, GPT-5.3 Codex	نعم (لكن جهد `none` غير مدعوم)
Qwen 3 235B A22B Thinking, Qwen 3.5 35B A3B	نعم
GLM 5.1 series	نعم
Claude Opus 4.5/4.6/4.6 Fast, Sonnet 4.5/4.6	لا (يفكر دائمًا)
Gemini 3 Pro, 3.1 Pro, 3 Flash	لا (يفكر دائمًا)
DeepSeek R1	لا (يفكر دائمًا)

response = client.chat.completions.create(
    model="openai-gpt-52",
    messages=[{"role": "user", "content": "What's the capital of France?"}],
    extra_body={"reasoning": {"enabled": False}}
)

const response = await client.chat.completions.create({
    model: "openai-gpt-52",
    messages: [{ role: "user", content: "What's the capital of France?" }],
    reasoning: { enabled: false }
});

curl https://api.venice.ai/api/v1/chat/completions \
  -H "Authorization: Bearer $VENICE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai-gpt-52",
    "messages": [{"role": "user", "content": "What is the capital of France?"}],
    "reasoning": {"enabled": false}
  }'

حدود الـ Tokens

تولد نماذج التفكير المنطقي tokens إجابة مرئية (في content) و tokens تفكير منطقي (في reasoning_content). كلاهما يحتسب من ميزانية الـ tokens الخاصة بك.

تعيين حد للـ tokens

استخدم max_completion_tokens للحد من إجمالي عدد الـ tokens التي يولدها النموذج، بما في ذلك التفكير المنطقي:

{
  "model": "deepseek-v4-flash",
  "messages": [...],
  "max_completion_tokens": 500
}

max_tokens مقبول أيضًا ويتصرف بالطريقة نفسها. إذا تم تعيين كليهما، يأخذ max_completion_tokens الأسبقية. للحصول على المزيد من المخرجات المرئية، ارفع الحد، أو خفّض reasoning_effort، أو عطّل التفكير المنطقي.

قراءة التفصيل

يُظهر كائن usage كيف أُنفقت ميزانيتك:

"usage": {
  "completion_tokens": 501,
  "completion_tokens_details": { "reasoning_tokens": 169 },
  "prompt_tokens": 13,
  "total_tokens": 514
}

في هذا المثال، تم إنفاق 169 token على التفكير المنطقي و 332 على الإجابة المرئية. عند الوصول إلى الحد، يكون finish_reason هو length. الحد الأعلى لكل نموذج متاح كـ maxCompletionTokens على نقطة نهاية /v1/models.

النماذج غير التفكيرية

يتصرف max_tokens و max_completion_tokens بنفس الطريقة على النماذج غير التفكيرية، إذ يحدّان مباشرة المخرجات المرئية.

اكتشاف القدرات

تحقق مما يدعمه النموذج عبر نقطة نهاية /v1/models:

الحقل	المعنى
`supportsReasoning`	النموذج لديه قدرة تفكير منطقي (chain-of-thought)
`supportsReasoningEffort`	النموذج يقبل معامل `reasoning_effort` / `reasoning.effort`

أفضل الممارسات

استخدم الافتراضي medium للاستخدام العام
استخدم high أو xhigh للمهام المعقدة (الرياضيات، الشفرة، التحليل)
استخدم low للتطبيقات الحساسة لزمن الاستجابة
استخدم reasoning.enabled: false أو عيّن الجهد إلى none لتعطيل التفكير المنطقي
عند الشك، استخدم low أو medium أو high. هذه هي القيم الأكثر دعمًا على نطاق واسع

التوثيق

البدء

النص والدردشة

الصورة والفيديو والصوت

أدوات الـ API

الوكلاء والتكاملات

أدوات البرمجة

أدوات الوكلاء

حِزم SDK والأُطر

نماذج التفكير المنطقي

قراءة المخرجات

البث

جهد التفكير المنطقي

القيم المقبولة

دعم النموذج

OpenAI

Anthropic

Google

xAI

نماذج أخرى

الاستخدام

تعطيل التفكير المنطقي

حدود الـ Tokens

تعيين حد للـ tokens

قراءة التفصيل

النماذج غير التفكيرية

اكتشاف القدرات

أفضل الممارسات

​قراءة المخرجات

​البث

​جهد التفكير المنطقي

​القيم المقبولة

​دعم النموذج

​OpenAI

​Anthropic

​Google

​xAI

​نماذج أخرى

​الاستخدام

​تعطيل التفكير المنطقي

​حدود الـ Tokens

​تعيين حد للـ tokens

​قراءة التفصيل

​النماذج غير التفكيرية

​اكتشاف القدرات

​أفضل الممارسات

قراءة المخرجات

البث

جهد التفكير المنطقي

القيم المقبولة

دعم النموذج

OpenAI

Anthropic

Google

xAI

نماذج أخرى

الاستخدام

تعطيل التفكير المنطقي

حدود الـ Tokens

تعيين حد للـ tokens

قراءة التفصيل

النماذج غير التفكيرية

اكتشاف القدرات

أفضل الممارسات