تم إصدار DeepSeek V4 في أواخر أبريل، وأكد ليانغ وين فنغ داخليًا: نافذة tokens بملايين، وتشغيل كامل على شريحة Huawei Ascend 950 PR

動區BlockTempo

يؤكد مؤسس DeepSeek، ليانغ ونفينغ، بنفسه في تواصل داخلي أن نموذج الجيل الجديد الرائد V4 سيتم إصداره رسميًا في أواخر أبريل. تُظهر التسريبات أن إجمالي عدد المعاملات يقترب من 1 تريليون، ويدعم نافذة سياق تصل إلى حوالي 1 مليون tokens، كما سيتم تنفيذه بالكامل على شرائح هواوي سونجتنغ (Ascend)؛ ويُنظر إليه باعتباره خطوة محورية في الصين لكسر اعتمادها على إنفيديا في مجال الذكاء الاصطناعي.
(ملخص سابق: DeepSeek V4 ترفض إنفيديا وتختار هواوي! علي بابا، ByteDance، Tencent يتسابقون لشراء شريحة هواوي 950 PR)
(إضافة سياقية: DeepSeek أطلقت “وضع الخبراء” و“وضع الرؤية”، فهل V4 هو الظهور الرسمي بعد الإحماء الأخير؟)

وفقًا لما نقلته《Sina Finance》عن مصادر مطلعة، كشف مؤسس DeepSeek، ليانغ ونفينغ، أن نموذج DeepSeek V4 الرائد من الجيل الجديد سيظهر رسميًا في أواخر أبريل. لم تعلن الجهة الرسمية بعد عن تاريخ محدد، لكن مجتمع المطورين شعر مبكرًا بإشارات الإحماء: متغير V4-Lite قيد اختبار على عقد API، وسرعة الاستدلال أعلى بنسبة 30% مقارنة بالجيل السابق، ونسبة استرجاع السياق بسعة 128K tokens وصلت إلى 94%.

ألف مليار معامل، نافذة مئة مليون توكن

استنادًا إلى المعلومات غير المؤكدة المتداولة حاليًا، تعتمد بنية V4 تصميم Mixture-of-Experts(MoE)، ويُقدّر إجمالي عدد المعاملات بنحو 1 تريليون، لكن المعاملات الفعلية التي يتم تفعيلها لكل token تبلغ فقط حوالي 37 مليار، مع الحفاظ على كفاءة الحوسبة على نهج “المُحسِن” الذي اشتهرت به DeepSeek.

بالنسبة لجزء نافذة السياق: من المتوقع أن يدعم V4 سياقًا طويلًا للغاية يصل إلى 1 مليون tokens عبر وحدة Engram جديدة كليًا، بما ينافس النماذج الرائدة الحالية. تتمثل الفكرة الأساسية لـ Engram في الاستعلام عن الذاكرة الشرطية، بحيث يمكن للنموذج الوصول إلى المعرفة بتعقيد O(1)، بدلًا من تضخمها خطيًا مع طول التسلسل.

من ناحية القدرات، تُظهر الاختبارات المعيارية المسربة أن HumanEval يصل إلى 90%، وSWE-bench Verified يتجاوز 80%. وإذا كانت البيانات صحيحة فعلًا، فسوف يقترب أيضًا من النماذج الرائدة السائدة الحالية. أما من ناحية النمط (الوسائط)، فيدعم V4 أصلاً إدخال النص والصور والفيديو، بينما يكون التسعير قرابة $0.30/MTok(للإدخال)، استمرارًا لاستراتيجية DeepSeek منخفضة التكلفة.

يعمل بالكامل على شرائح هواوي: أكبر إشارة سياسية جيوسياسية

بعيدًا عن المواصفات التقنية، فإن أكثر ما يلفت انتباه الجمهور في V4 هو تحول استراتيجية العتاد بشكل كامل: تدّعي الجهة الرسمية أن النموذج بأكمله سيتم تشغيله بالكامل على شريحة هواوي سونجتنغ 950 PR، دون الاعتماد على أي GPU من إنفيديا.

إن تأثير هذا القرار يتجاوز DeepSeek نفسه بكثير. قامت Alibaba وByteDance وTencent بالفعل بشراء كميات كبيرة من شرائح هواوي الجيل القادم. فإذا نجح V4 في التحقق من أن Ascend يمكنها تلبية احتياجات تدريب وتشغيل نماذج رائدة من الطراز الأعلى، فسيكون ذلك أقوى مثال واقعي حتى الآن على سلاسل صناعة الذكاء الاصطناعي في الصين نحو الاستقلالية في مجال الشرائح.

في هذا السياق، قد تتحول إجراءات ضبط صادرات الولايات المتحدة لشرائح إنفيديا بدلًا من ذلك إلى محفز لتسريع نضج النظام البيئي المستقل في الصين.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات