ذكرت صحيفة Jinse Finance أنه اليوم، نحن نطلق إصدارين رسميين: DeepSeek-V3.2 و DeepSeek-V3.2-Speciale. يعتبر DeepSeek-V3.2 أول نموذج لدينا يدمج التفكير في استخدام الأدوات، ويدعم في نفس الوقت وضع التفكير ووضع عدم التفكير في استدعاء الأدوات. قدمنا طريقة لتوليد بيانات تدريب وكيل على نطاق واسع، حيث تم بناء عدد كبير من المهام في التعلم المعزز التي هي “صعبة الحل، وسهلة التحقق” (أكثر من 1800 بيئة، وأكثر من 85,000 تعليمات معقدة)، مما زاد بشكل كبير من قدرة النموذج على التعميم. (DeepSeek)
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
إصدار النسخة الرسمية من DeepSeek V3.2: تعزيز قدرات الوكيل، دمج التفكير والاستدلال
ذكرت صحيفة Jinse Finance أنه اليوم، نحن نطلق إصدارين رسميين: DeepSeek-V3.2 و DeepSeek-V3.2-Speciale. يعتبر DeepSeek-V3.2 أول نموذج لدينا يدمج التفكير في استخدام الأدوات، ويدعم في نفس الوقت وضع التفكير ووضع عدم التفكير في استدعاء الأدوات. قدمنا طريقة لتوليد بيانات تدريب وكيل على نطاق واسع، حيث تم بناء عدد كبير من المهام في التعلم المعزز التي هي “صعبة الحل، وسهلة التحقق” (أكثر من 1800 بيئة، وأكثر من 85,000 تعليمات معقدة)، مما زاد بشكل كبير من قدرة النموذج على التعميم. (DeepSeek)