امسح ضوئيًا لتحميل تطبيق Gate
qrCode
خيارات تحميل إضافية
لا تذكرني بذلك مرة أخرى اليوم

DeepSeek الجديد V3.2 مع Speciale، يستهدف الأداء والتفكير ليقترب من GPT-5 و Gemini 3

أطلقت DeepSeek يوم 12/2 نموذجين جديدين، وهما DeepSeek-V3.2، وDeepSeek-V3.2-Speciale المخصص لمهارات الاستدلال الرياضي. وذكرت الشركة أن هذين النموذجين يستمران في الاتجاه التجريبي الأصلي، مع هدف رفع مستوى القدرة على الاستدلال، واستخدام الأدوات، وقدرة التفكير العميق بشكل شامل. كما أكدت DeepSeek أن الإصدار الرسمي V3.2 قد أظهر أداءً يمكن مقارنته بـ GPT-5 وGemini-3 Pro في العديد من اختبارات الاستدلال، بينما حقق إصدار Speciale أداءً يصل إلى مستوى الميدالية الذهبية الدولية في مسابقات الرياضيات والمعلومات.

الإصدار التجريبي يقود الطريق، الإصدار الرسمي V3.2 يظهر

عندما أطلق DeepSeek الإصدار V3.2-Exp في سبتمبر، تم تحديده كمنصة تجريبية نحو الجيل التالي من الذكاء الاصطناعي. الإصدار الرسمي الذي تم إطلاقه الآن DeepSeek-V3.2، لم يعد يحمل اسم “Exp”، مما يرمز إلى أن الوظائف أصبحت أكثر نضجًا.

توضيح رسمي، يُظهر الإصدار الجديد V3.2 أداءً قريبًا من GPT-5 وGemini-3 Pro في العديد من اختبارات الاستدلال، ويُبرز بشكل خاص أنها المرة الأولى التي يتم فيها دمج “نمط التفكير” و"تطبيق الأدوات" بشكل وثيق في نموذج واحد، ويدعم في نفس الوقت نمط التفكير وغير نمط التفكير. من الصورة أدناه يمكننا أن نستنتج:

“DeepSeek-V3.2 أثبتت قدرتها على استخدام الأدوات من خلال اختبارات المعايير، مما يجعلها قادرة على المنافسة مع النماذج الرائدة مثل GPT-5 و Gemini-3 Pro.”

تمت ترقية قدرات الاستدلال، ودمج الأدوات هو أبرز ما في الأمر

تُشير DeepSeek إلى أن الميزة البارزة في V3.2 هي إمكانية دمج عملية الاستدلال مع استخدام الأدوات. بعبارة أخرى، يمكن للنموذج أثناء تفكيره في شيء ما استدعاء محركات البحث، وأجهزة الكمبيوتر، ومنفذي الشيفرات، وغيرها من الأدوات الخارجية، مما يجعل عملية معالجة المهام بشكل عام أكثر اكتمالاً، وأكثر استقلالية، وأقرب إلى طريقة معالجة البشر للمشكلات.

Speciale تركز على الاستدلال الطويل، والأداء الرياضي يصل إلى مستوى الميدالية الذهبية

بالإضافة إلى الإصدار القياسي V3.2، أطلقت DeepSeek أيضًا إصدارًا آخر يسمى DeepSeek-V3.2-Speciale. تم تصميم هذا الإصدار خصيصًا للتفكير الرياضي المعقد والمشكلات التي تتطلب تفكيرًا طويل الأمد.

التحديد الرسمي هو استكشاف حدود القدرة على استنتاج نماذج المصدر المفتوح، وحتى رؤية ما يمكن أن تصل إليه النماذج نفسها من حدود. من حيث النتائج، حقق Speciale مستوى الميدالية الذهبية في المسابقات الدولية مثل الأولمبياد الدولي للرياضيات (IMO) والأولمبياد الدولي للمعلومات (IOI)، وكانت أدائه في الاستنتاج يعادل أداء Gemini-3 Pro الأحدث من Google. من الصورة أدناه، يمكننا أن نرى:

“لقد وصلت قدرات الاستدلال لـ DeepSeek-V3.2-Speciale إلى مستوى الميدالية الذهبية في المسابقات الدولية في الرياضيات والمعلومات، حيث تفوقت أو تساوت في الأداء مع GPT-5 و Gemini-3 Pro و Kimi-K2 في عدة اختبارات معيارية للاستدلال والمنافسات البرمجية.”

تم الكشف عن أسلوب تدريب جديد، وتعزيز قدرات الوكيل الذكي

بالإضافة إلى النموذج، كشفت DeepSeek أيضًا عن إنجاز بحثي جديد، وهو أنهم قد طوروا طرقًا جديدة لتدريب وكلاء الذكاء الاصطناعي. يمكن لهؤلاء الوكلاء التفاعل مع البيئة الخارجية، وتحليل البيانات، واتخاذ القرارات دون الحاجة إلى توجيهات مستمرة من البشر.

تؤكد DeepSeek أن هذه هي التقنية الأساسية التي صممتها لتمكين الذكاء الاصطناعي من تحقيق كفاءة أعلى واستجابة أسرع.

استمرار حجم الصوت لشهر واحد، وتواصل تسريع وتيرة البحث والتطوير

حظيت DeepSeek باهتمام عالمي في يناير من هذا العام بسبب نموذج مبتكر. سلسلة V3.2 هذه هي أحدث إنجاز لهم في استمرار زخم البحث بعد نجاحهم السابق. قبل إطلاق V3.2، أصدرت DeepSeek الأسبوع الماضي DeepSeekMath-V2، وهو نموذج مفتوح المصدر يركز على إثبات النظريات الرياضية، مما يدل على أنهم يواصلون تعزيز قدراتهم في مجال المنطق والرياضيات.

تقرير تقني صدر، V3.2 قدرة الاستدلال قريبة من GPT-5 و Kimi

أصدرت DeepSeek أيضًا تقريرًا تقنيًا بعنوان “DeepSeek-V3.2: دفع حدود نماذج اللغة الكبيرة المفتوحة”، مشيرةً إلى أن V3.2 تظهر أداءً مشابهًا لـ GPT-5 و Kimi-k2-thinking في عدة اختبارات معيارية للاستدلال.

هذا التقرير يسلط الضوء أيضًا على أن النماذج مفتوحة المصدر المحلية في الصين لا تزال تنافس على نفس المستوى مع النماذج العالمية الرائدة في مجال الاستدلال.

تقدم هذه المقالة DeepSeek V3.2 و Speciale، حيث تقترب قدرات الاستدلال والأداء من GPT-5 و Gemini 3، ظهرت لأول مرة في أخبار السلسلة ABMedia.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • Gate Fun الساخنعرض المزيد
  • القيمة السوقية:$3.63Kعدد الحائزين:2
    0.00%
  • القيمة السوقية:$3.71Kعدد الحائزين:2
    0.39%
  • القيمة السوقية:$3.6Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$3.6Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$3.87Kعدد الحائزين:5
    1.33%
  • تثبيت