
يتولى مسؤول فريق نماذج Xiaomi الكبيرة، لوو فولي، إجراء مقابلة متعمقة على منصة Bilibili في 24 أبريل (رقم الفيديو: BV1iVoVBgERD)، وتبلغ مدة المقابلة 3.5 ساعات، وهي أول مرة تقدم رؤيتها التقنية بشكل منهجي علنًا بصفة مسؤولة تقنية. وتقول لوو فولي إن سباق المسارات التنافسية للنماذج الكبيرة قد انتقل من عصر الدردشة إلى عصر الوكلاء (Agent)، وأشارت إلى أن “التطور الذاتي” سيكون الحدث الحاسم للـ AGI خلال العام المقبل.

(المصدر: Bilibili)
وفقًا لما ذكرته لوو فولي في مقابلة Bilibili، أشارت إلى أن تركيز منافسة النماذج الكبيرة في عام 2026 سينتقل من جودة الحوار العامة إلى القدرة على التنفيذ الذاتي المستمر في المهام المعقدة. وفي المقابلة، قالت إن النماذج الرائدة حاليًا يمكنها تحسين نفسها تلقائيًا ضمن مهام محددة، وتستمر في تنفيذ ذلك بثبات لمدة تتراوح بين يومين إلى ثلاثة أيام، دون الحاجة إلى تدخل البشر لإجراء تعديلات. كما أكدت في المقابلة أن اختراق قدرة “التطور الذاتي” يعني بدء امتلاك أنظمة الذكاء الاصطناعي لقدرة على التصحيح الذاتي، وحددت أيضًا مسار تقنيات Anthropic والمتغيرات التقنية مثل Claude Opus 4.6 وتأثيرها على النظام البيئي الشامل للذكاء الاصطناعي.
وفقًا لما كشفته لوو فولي في المقابلة، أجرت Xiaomi بالفعل تعديلات كبيرة على استراتيجية توزيع موارد الحوسبة. وشرحت أن نسبة الحوسبة المستخدمة عادةً في الصناعة هي Pre-train:Post-train:Inference = 3:5:1، بينما قامت استراتيجية Xiaomi الحالية بتعديلها إلى 3:1:1، مما يقلص بشكل كبير نسبة التدريب بعد ذلك (post-training)، مع رفع متزامن للاستثمار في موارد مرحلة الاستدلال.
وفي المقابلة، أوضحت أن هذا التحول نابع من نضج استراتيجية Agent RL Scaling، مما يعني أنه لم يعد التدريب بعد ذلك يحتاج إلى تراكم كبير للحوسبة، وأن زيادة الموارد في جانب الاستدلال تعكس احتياج سيناريوهات تطبيق Agent إلى قدرة الاستجابة الفورية.
وبخصوص مشكلة فجوة “عصر” (代差) Pre-train لدى النماذج الكبيرة داخل الصين، قالت لوو فولي في المقابلة إن هذه الفجوة تقلصت من 3 سنوات في الماضي إلى عدة أشهر فقط، وأن محور الاستراتيجية الحالي يتحرك باتجاه Agent RL Scaling. وتشمل مسيرتها المهنية العمل في معهد DAMO التابع لـ Alibaba، وHuanfang Quant (幻方量化)، وDeepSeek (المطور الأساسي لـ DeepSeek-V2)، حيث انضمت إلى Xiaomi في نوفمبر 2025.
وفقًا لإعلان سلسلة MiMo-V2 الذي نشرته Xiaomi رسميًا في 19 مارس 2026، فقد تم إصدار ثلاث موديلات مرة واحدة ضمن هذه الدفعة:
MiMo-V2-Pro: إجمالي عدد المعلمات بالـ 兆 (تريليون)، تمكين المعلمات 42B، بنية الانتباه المختلطة (Hybrid Attention)، دعم سياق يصل إلى المليون، ومعدل إكمال المهام 81%
MiMo-V2-Omni: سيناريوهات Agent متعددة الأنماط (Agent)
MiMo-V2-TTS: سيناريوهات توليد الصوت (TTS)
وفقًا للإعلان، احتلت MiMo-V2-Flash المفتوحة المصدر المرتبة الثانية في قائمة النماذج مفتوحة المصدر عالميًا، وتبلغ سرعة الاستدلال 3 أضعاف DeepSeek-V3.2.
وفقًا لما ذكرته لوو فولي في مقابلة Bilibili في 24 أبريل 2026 (BV1iVoVBgERD)، أشارت في المقابلة إلى أن النماذج الرائدة حاليًا أصبحت قادرة على تحسين نفسها تلقائيًا ضمن مهام محددة والتنفيذ بثبات لمدة تتراوح بين يومين إلى ثلاثة أيام دون الحاجة إلى تدخل بشري، كما صنفت “التطور الذاتي” باعتباره الحدث الأكثر أهمية لتطور AGI خلال العام المقبل.
وفقًا لما كشفت عنه لوو فولي في المقابلة، تم تعديل نسبة توزيع الحوسبة في Xiaomi من Pre-train:Post-train:Inference = 3:5:1 المستخدمة عادةً في الصناعة إلى 3:1:1، مع تقليص كبير لنسبة التدريب بعد ذلك؛ وشرحت أن هذا التعديل نابع من تحسن كفاءة التدريب اللاحق بعد نضج استراتيجية Agent RL Scaling، ومن احتياج سيناريوهات تطبيق Agent إلى قدرة الاستجابة الفورية على جانب الاستدلال.
وفقًا للإعلان الرسمي الذي نشرته Xiaomi في 19 مارس 2026، فإن MiMo-V2-Flash المفتوحة المصدر احتلت المرتبة الثانية في قائمة النماذج مفتوحة المصدر عالميًا، وتبلغ سرعة الاستدلال 3 أضعاف DeepSeek-V3.2، بينما يبلغ معدل إكمال المهام لنسخة flagship MiMo-V2-Pro 81%.
مقالات ذات صلة
يطلق Gemini التداول الوكيل للّعب عبر منصات تداول تديرها الذكاء الاصطناعي للحسابات المشفرة
يقوم Nansen API الآن بدعم بروتوكول Tempo's MPP، مما يتيح لوكلاء الذكاء الاصطناعي الدفع لكل مكالمة