
Le responsable de l’équipe des grands modèles de Xiaomi, Luo Fuli, a accordé une interview approfondie sur la plateforme Bilibili le 24 avril (numéro de la vidéo : BV1iVoVBgERD). La durée de l’interview est de 3,5 heures ; c’est la première fois qu’elle expose publiquement, en tant que responsable technique, ses points de vue techniques de manière systématique. Luo Fuli a déclaré que la compétition autour des grands modèles est passée de l’ère Chat à l’ère Agent, et a indiqué que « l’auto-évolution » serait l’événement clé pour l’AGI au cours de la prochaine année.

(Source : Bilibili)
D’après les propos de Luo Fuli dans l’interview sur Bilibili, elle indique que, en 2026, le centre de gravité de la compétition des grands modèles se déplacera de la qualité de conversation générale vers la capacité d’exécution autonome continue sur des tâches complexes. Pendant l’interview, elle a déclaré que, pour l’instant, les modèles de premier plan peuvent s’optimiser de façon autonome sur des tâches spécifiques, et exécuter de manière stable pendant 2 à 3 jours sans nécessiter d’intervention humaine pour des ajustements. Elle a souligné, pendant l’interview, que la percée de la capacité « d’auto-évolution » signifie que les systèmes d’IA commencent à disposer d’une capacité d’autoréparation, et a également cité les trajectoires techniques d’Anthropic ainsi que des variables techniques comme Claude Opus 4.6, et leur impact sur l’ensemble de l’écosystème de l’IA.
D’après les révélations de Luo Fuli dans l’interview, Xiaomi a déjà effectué d’importants ajustements dans sa stratégie de répartition de la puissance de calcul. Elle explique que, dans l’industrie, le mix de puissance de calcul couramment utilisé est Pre-train:Post-train:Inference = 3:5:1, tandis que la stratégie actuelle de Xiaomi est passée à 3:1:1, ce qui réduit fortement la proportion d’entraînement après pré-entraînement, tout en augmentant simultanément l’investissement de ressources au stade d’inférence.
Dans l’interview, elle explique que ce changement provient de la maturité de la stratégie Agent RL Scaling : l’entraînement postérieur ne nécessite plus d’empiler massivement de la puissance de calcul, et l’augmentation des ressources côté inférence reflète les besoins en réactivité immédiate des scénarios où l’Agent est déployé.
Concernant le problème d’écart entre les générations de Pre-train dans les grands modèles nationaux, Luo Fuli a déclaré, pendant l’interview, que cet écart s’est réduit, passant des 3 années passées à quelques mois ; l’axe central de la stratégie actuelle se déplace vers Agent RL Scaling. Le parcours professionnel de Luo Fuli comprend l’Institut de recherche DingTalk (Alibaba DAMO), la quantification Huanfang et DeepSeek (développement central de DeepSeek-V2), et elle a rejoint Xiaomi en novembre 2025.
D’après l’annonce de la série MiMo-V2 publiée par Xiaomi officiellement le 19 mars 2026, cette fois-ci, trois modèles seront dévoilés en une seule fois :
MiMo-V2-Pro : nombre total de paramètres en milliards, paramètres activés 42B, architecture d’attention hybride, prise en charge d’un contexte jusqu’à un million, taux d’achèvement des tâches 81 %
MiMo-V2-Omni : scénarios d’Agent multi-modal
MiMo-V2-TTS : scénarios de synthèse vocale
D’après l’annonce, MiMo-V2-Flash déjà open source occupe la deuxième place du classement mondial des modèles open source, avec une vitesse d’inférence atteignant 3 fois celle de DeepSeek-V3.2.
D’après les propos de Luo Fuli lors de l’interview sur Bilibili du 24 avril 2026 (BV1iVoVBgERD), elle a indiqué que, pour l’instant, les modèles de premier plan peuvent s’optimiser de façon autonome sur des tâches spécifiques et exécuter de manière stable pendant 2 à 3 jours sans intervention humaine, et qu’elle qualifie « l’auto-évolution » comme l’événement le plus crucial pour le développement de l’AGI au cours de la prochaine année.
D’après les révélations de Luo Fuli dans l’interview, le mix de puissance de calcul de Xiaomi est passé de Pre-train:Post-train:Inference = 3:5:1, couramment utilisé dans l’industrie, à 3:1:1, ce qui réduit fortement la proportion d’entraînement postérieur ; elle explique que cet ajustement découle de l’amélioration de l’efficacité de l’entraînement postérieur après la maturité de la stratégie Agent RL Scaling, ainsi que des besoins des scénarios de déploiement d’Agent en capacités de réponse immédiate côté inférence.
D’après l’annonce officielle publiée par Xiaomi le 19 mars 2026, MiMo-V2-Flash, déjà open source, occupe la deuxième place du classement mondial des modèles open source ; sa vitesse d’inférence est 3 fois celle de DeepSeek-V3.2, et le taux d’achèvement des tâches de l’édition phare MiMo-V2-Pro est de 81 %.
Articles similaires
DeFi United atteint $300M Avec Consensys, engagement de 30K ETH par Lubin
Alphea lance une blockchain Layer 1 native de l’IA avec une exécution par agent autonome
Gate organise une table ronde Space sur le trading avec l’IA le 28 avril : explorer l’IA comme moteur du prochain cycle Web3
Ant Group lance Ling-2.6-1T : modèle à billion de paramètres optimisé pour l’exécution des tâches avec une efficacité élevée en jetons
L’API Nansen prend désormais en charge le protocole MPP de Tempo, permettant aux agents IA de payer par appel