
Trưởng nhóm của đội ngũ mô hình lớn Xiaomi, La Fu-li, vào ngày 24 tháng 4 đã có một cuộc phỏng vấn chuyên sâu trên nền tảng Bilibili (mã video: BV1iVoVBgERD); thời lượng phỏng vấn là 3,5 giờ. Đây là lần đầu tiên bà công khai trình bày một cách có hệ thống các quan điểm kỹ thuật của mình với tư cách là người phụ trách kỹ thuật. La Fu-li cho biết, cuộc đua trong lĩnh vực mô hình lớn đã chuyển từ thời đại Chat sang thời đại Agent, đồng thời chỉ ra rằng “tự tiến hoá” sẽ là sự kiện then chốt đối với AGI trong năm tới.

(Nguồn: Bilibili)
Theo những gì La Fu-li đã nêu trong cuộc phỏng vấn Bilibili, bà cho biết trọng tâm cuộc cạnh tranh mô hình lớn năm 2026 đã chuyển từ chất lượng hội thoại đối thoại chung sang năng lực thực thi tự chủ liên tục trong các nhiệm vụ phức tạp. Trong cuộc phỏng vấn, bà nói rằng hiện nay các mô hình hàng đầu đã có thể tự tối ưu hoá trong các nhiệm vụ cụ thể, đồng thời tiếp tục thực thi ổn định trong 2 đến 3 ngày mà không cần con người can thiệp điều chỉnh. Bà nhấn mạnh trong cuộc phỏng vấn rằng, bước đột phá về năng lực “tự tiến hoá” đồng nghĩa với việc hệ thống AI bắt đầu có khả năng tự sửa lỗi, và đồng thời chỉ rõ các yếu tố kỹ thuật như lộ trình công nghệ của Anthropic cũng như các biến số công nghệ như Claude Opus 4.6 sẽ tác động đến toàn bộ hệ sinh thái AI.
Theo những gì La Fu-li tiết lộ trong cuộc phỏng vấn, Xiaomi đã thực hiện những điều chỉnh lớn đối với chiến lược phân bổ sức mạnh tính toán. Bà giải thích rằng tỷ lệ sức mạnh tính toán thường dùng trong ngành là Pre-train:Post-train:Inference = 3:5:1, còn chiến lược hiện tại của Xiaomi đã được điều chỉnh thành 3:1:1, nén mạnh tỷ lệ huấn luyện sau, đồng thời tăng đầu tư tài nguyên cho giai đoạn suy luận.
Trong cuộc phỏng vấn, bà giải thích rằng sự thay đổi này bắt nguồn từ việc chiến lược Agent RL Scaling đã trở nên trưởng thành, nên huấn luyện sau không còn cần phải “xếp chồng” nhiều sức mạnh tính toán, và việc tăng tài nguyên ở phía suy luận phản ánh nhu cầu về năng lực phản hồi tức thời của các kịch bản triển khai của Agent.
Đối với vấn đề chênh lệch thế hệ Pre-train của các mô hình lớn trong nước, La Fu-li nói trong cuộc phỏng vấn rằng khoảng chênh lệch này đã được rút ngắn từ 3 năm trong quá khứ xuống còn vài tháng; trọng tâm chiến lược hiện tại đang chuyển sang Agent RL Scaling. Hành trình nghề nghiệp của La Fu-li bao gồm Viện Đa Mô Hình (Alibaba DAMO), Huan Fang Quant (Hanfang Quant) và DeepSeek (nhà phát triển cốt lõi DeepSeek-V2), và bà gia nhập Xiaomi vào tháng 11 năm 2025.
Theo thông báo loạt MiMo-V2 do Xiaomi chính thức công bố vào ngày 19 tháng 3 năm 2026, lần này ra mắt đồng thời ba mẫu:
MiMo-V2-Pro:tổng số tham số là…, bật tham số 42B, kiến trúc chú ý hỗn hợp (mix attention), hỗ trợ ngữ cảnh lên đến hàng triệu, tỷ lệ hoàn thành nhiệm vụ 81%
MiMo-V2-Omni:kịch bản Agent đa phương thức
MiMo-V2-TTS:kịch bản tổng hợp giọng nói
Theo thông báo, MiMo-V2-Flash đã được mã nguồn mở hiện đang đứng thứ hai trên bảng xếp hạng mô hình mã nguồn mở toàn cầu, tốc độ suy luận đạt gấp 3 lần DeepSeek-V3.2.
Theo nội dung La Fu-li đã nêu trong cuộc phỏng vấn trên Bilibili vào ngày 24 tháng 4 năm 2026 (BV1iVoVBgERD), bà cho biết hiện nay các mô hình hàng đầu đã có thể tự tối ưu hoá trong các nhiệm vụ cụ thể và thực thi ổn định trong 2 đến 3 ngày mà không cần con người can thiệp, đồng thời bà định tính “tự tiến hoá” là sự kiện then chốt nhất đối với sự phát triển của AGI trong năm tới.
Theo những gì La Fu-li tiết lộ trong cuộc phỏng vấn, tỷ lệ sức mạnh tính toán của Xiaomi đã được điều chỉnh từ Pre-train:Post-train:Inference = 3:5:1 (tỷ lệ quen thuộc trong ngành) thành 3:1:1, nén mạnh tỷ lệ huấn luyện sau; bà giải thích rằng điều chỉnh này xuất phát từ việc hiệu quả của huấn luyện sau được nâng cao sau khi chiến lược Agent RL Scaling trưởng thành, và nhu cầu về năng lực phản hồi tức thời ở phía suy luận do các kịch bản triển khai của Agent.
Theo thông báo chính thức do Xiaomi công bố vào ngày 19 tháng 3 năm 2026, MiMo-V2-Flash đã được mã nguồn mở đang đứng thứ hai trên bảng xếp hạng mô hình mã nguồn mở toàn cầu, tốc độ suy luận đạt gấp 3 lần DeepSeek-V3.2; tỷ lệ hoàn thành nhiệm vụ của phiên bản flagship MiMo-V2-Pro là 81%.
Bài viết liên quan
Gemini Ra mắt giao dịch tác tử (agentic trading) cho giao dịch tự động được hỗ trợ bởi AI
Consensys, Joseph Lubin đóng góp 30,000 ETH cho DeFi United
Alphea Ra Mắt Blockchain Layer 1 Tích Hợp Sẵn Cho AI với Thực Thi Tác Nhân Tự Chủ
Gate tổ chức Space thảo luận bàn tròn về AI Trading vào ngày 28 tháng 4: Khám phá AI như động lực của chu kỳ Web3 tiếp theo
Ant Group Ra Mắt Ling-2.6-1T: Mô Hình Hàng Nghìn Tỷ Tham Số Tối Ưu Cho Việc Thực Thi Tác Vụ Tiết Kiệm Token
API của Nansen Giờ Hỗ Trợ Giao thức MPP của Tempo, Cho Phép Tác nhân AI Thanh toán Theo Từng Lần Gọi