Phân tích 100 nghìn tỷ Token của OpenRouter: Con người thực sự dùng AI để làm gì, sự trỗi dậy của mô hình Trung Quốc và bí mật giữ chân người dùng

2025-12-06 05:57:07

Đang tạo bản tóm tắt

Báo cáo của OpenRouter tiết lộ AI đang bước vào kỷ nguyên đại lý suy luận, các mô hình mã nguồn mở của Trung Quốc nổi bật trên thị trường toàn cầu nhờ khả năng nhập vai và lập trình, đồng thời chia sẻ các kịch bản sử dụng thực tế của người dùng.

(Tóm tắt trước: “Chị Gỗ” khẳng định “AI không phải bong bóng”: Đang sao chép thời khắc bùng nổ tài sản của Internet) (Bổ sung bối cảnh: Google chính thức ra mắt “Gemini 3”! Lên ngôi mô hình AI thông minh nhất thế giới, có gì nổi bật?)

Nền tảng tổng hợp mô hình AI OpenRouter tuần này đã phát hành báo cáo quan trọng hàng năm “Báo cáo hiện trạng AI năm 2025”. Báo cáo này không dựa trên khảo sát hay tin tức thổi phồng, mà dựa trên phân tích thực nghiệm dữ liệu 100 nghìn tỷ (100 Trillion) token được tạo ra trên nền tảng OpenRouter.

Dữ liệu này bao phủ hơn 300 mô hình ngôn ngữ lớn (LLM) và hơn 60 nhà cung cấp, mang đến một góc nhìn mới giúp chúng ta hiểu được AI thực sự “được sử dụng như thế nào” trong thế giới thực.

Chuyển đổi mô hình: Từ “dự đoán từ tiếp theo” sang “đại lý suy luận”

Nếu như trước năm 2024, cuộc đua AI xoay quanh ai có thể viết tiếp mạch lạc hơn, thì chủ đề của năm 2025 chính là “tư duy”. Báo cáo chỉ ra rằng, năm vừa qua đánh dấu bước ngoặt thực sự trong quá trình phát triển của LLM.

o1: Khởi đầu kỷ nguyên mô hình và suy luận

Báo cáo xác định ngày 5 tháng 12 năm 2024 là bước ngoặt quan trọng của ngành, khi OpenAI phát hành mô hình suy luận đầu tiên được áp dụng rộng rãi: o1. Trước đó, ngay cả những mô hình mạnh nhất (như Claude 3.5 Sonnet hoặc GPT-4) về bản chất vẫn chỉ là bộ dự đoán xác suất truyền thẳng một lần. Chúng dựa vào các mẫu trong dữ liệu huấn luyện để mô phỏng suy luận, chứ không thực hiện tính toán nội bộ thực sự.

Sự xuất hiện của o1 đã thay đổi tất cả. Nó đưa vào quá trình tính toán khi suy luận, mô hình sẽ thực hiện nhiều bước cân nhắc nội bộ (Deliberation), lập kế hoạch tiềm ẩn (Latent Planning) và tự điều chỉnh trước khi đưa ra câu trả lời cuối cùng.

Dữ liệu chứng minh: Theo thống kê của OpenRouter, kể từ đầu năm 2025, tỷ lệ token chuyển sang các “mô hình tối ưu hóa suy luận” đã tăng trưởng theo cấp số nhân. Đến cuối năm 2025, hơn 50% lượng token sử dụng liên quan đến các mô hình có khả năng tư duy này. Điều này có nghĩa là, người dùng không còn chỉ coi AI như chatbot, mà xem nó như “bộ não” có thể giải quyết các vấn đề logic phức tạp.

Sự trỗi dậy của quy trình làm việc đại lý

Song song với sự nâng cao khả năng suy luận, “quy trình làm việc đại lý” trở thành một từ khóa quan trọng khác. Người dùng bắt đầu xây dựng các hệ thống tự động hóa phức tạp, để mô hình không chỉ trả lời câu hỏi mà còn “hành động”.

Báo cáo đặc biệt phân tích dữ liệu về “gọi công cụ” – khả năng cho phép mô hình AI sử dụng các công cụ bên ngoài (như tìm kiếm web, thực thi chương trình, truy vấn cơ sở dữ liệu).

Xu hướng: Lượng sử dụng gọi công cụ trong suốt năm 2025 tăng ổn định và rõ rệt.

Cục diện mô hình: Ban đầu, lĩnh vực này do gpt-4o-mini của OpenAI và dòng Claude 3.5 của Anthropic dẫn đầu. Nhưng nửa cuối năm, thị trường trở nên sôi động, Gemini Flash của Google, Grok Code Fast của xAI và GLM 4.5 của Trung Quốc nhanh chóng bắt kịp về khả năng sử dụng công cụ, thúc đẩy tự động hóa cấp doanh nghiệp phổ biến hơn.

Cuộc chiến mở - đóng: Sự trỗi dậy của mô hình Trung Quốc

Về hệ sinh thái mô hình, báo cáo tiết lộ một thế giới hai đường ray: các mô hình đóng nguồn vẫn thống trị doanh thu, nhưng mô hình mã nguồn mở (OSS) chiếm vị trí then chốt trong đổi mới và các lĩnh vực đặc thù.

Mô hình đóng nguồn vẫn chiếm đa số, nhưng mã nguồn mở đang lên

Dù các mô hình đóng nguồn (như GPT-5, Claude 4.5) vẫn chiếm khoảng 70% tổng lượng token tiêu thụ, nhưng trong năm qua, thị phần của mô hình mã nguồn mở tăng trưởng rất nhanh, đã tiến sát 30%.

Điều này cho thấy nhà phát triển và doanh nghiệp ngày càng muốn cân bằng giữa khả năng kiểm soát, quyền riêng tư và chi phí, và mô hình mã nguồn mở chất lượng cao đã cung cấp lựa chọn này.

Sức mạnh thống trị của mô hình mã nguồn mở Trung Quốc

Một phát hiện nổi bật trong báo cáo: các mô hình mã nguồn mở do Trung Quốc phát triển đã trở thành trụ cột của hệ sinh thái mã nguồn mở toàn cầu.

Các nhân tố chủ chốt: Dòng Qwen (通义千问) của Alibaba, DeepSeek (深度求索) và Kimi của Moonshot AI chiếm tỷ trọng rất lớn trong lượng gọi toàn cầu trên OpenRouter.

Lợi thế cạnh tranh: Báo cáo chỉ ra, mô hình Trung Quốc trỗi dậy nhanh chủ yếu nhờ “chu kỳ lặp lại dày đặc” và “chất lượng mô hình cực kỳ cạnh tranh”. Ví dụ, Qwen 2.5 Coder trong lĩnh vực lập trình đã trực tiếp thách thức vị trí của nhiều mô hình đóng nguồn.

Định vị độc đáo: Dữ liệu cho thấy, mô hình mã nguồn mở Trung Quốc có “lọc nội dung” tương đối ít (so với các mô hình phương Tây có rào chắn an toàn nghiêm ngặt), giúp chúng rất được ưa chuộng trên toàn cầu trong các kịch bản sáng tác sáng tạo, nhập vai (Roleplay), viết tiếp truyện…

Sự phát triển “kiểu chữ M” về kích thước mô hình

Bên trong thị trường mã nguồn mở cũng có những thay đổi cấu trúc thú vị:

Sự suy giảm của mô hình nhỏ: Dù Google ra mắt các mô hình nhỏ như Gemma, tổng lượng sử dụng vẫn đang giảm. Người dùng nhận ra giới hạn trí tuệ của mô hình nhỏ khiến chúng khó ứng dụng cho các nhiệm vụ phức tạp.

Kỷ nguyên vàng của mô hình cỡ trung: Các mô hình khoảng 32B (32 tỷ tham số) trở thành “điểm ngọt”. Tiêu biểu là Qwen 2.5 Coder 32B, dòng này cân bằng hoàn hảo giữa hiệu năng và chi phí suy luận, tạo nên “phù hợp mô hình-thị trường” (Model-Market Fit) thành công.

Sự đa dạng của mô hình lớn: Ở phân khúc 70B đến 200B+ tham số, thị trường không bị độc chiếm bởi một mô hình nào mà cạnh tranh đa dạng (như dòng Llama 3, Qwen 72B…), người dùng sẽ chọn các mô hình lớn khác nhau tùy nhiệm vụ cụ thể.

Kịch bản thực tế: Con người thực sự dùng AI để làm gì?

Đây có lẽ là phần truyền cảm hứng nhất của báo cáo. Thông qua hệ thống phân loại GoogleTagClassifier của OpenRouter, nhóm nghiên cứu đã phân loại nội dung của hàng tỷ lượt yêu cầu. Kết quả phá vỡ nhiều định kiến cho rằng “AI chủ yếu dùng cho năng suất kinh doanh”.

Nhập vai

Dữ liệu cho thấy, trò chơi nhập vai là thể loại sử dụng lớn nhất của mô hình mã nguồn mở (OSS), chiếm hơn 60%.

Hiện tượng: Rất nhiều người dùng sử dụng AI để trò chuyện với nhân vật ảo, sáng tác tiểu thuyết tương tác và trải nghiệm game nhập vai. Đây không chỉ là sở thích nhỏ lẻ mà là một thị trường nhu cầu lớn.

Động lực thúc đẩy: Người dùng thích dùng mô hình mã nguồn mở để nhập vai, chủ yếu vì các mô hình này (đặc biệt là từ các phòng thí nghiệm ngoài Mỹ) thường ít kiểm duyệt hơn, mang lại trải nghiệm tương tác phong phú và tự do hơn.

Giá trị thương mại: Những người dùng này thể hiện độ gắn bó cực lớn, họ xây dựng mối liên kết cảm xúc sâu sắc và thói quen sử dụng quanh các mô hình nhất định.

Lập trình

Theo sát phía sau là danh mục lập trình - cũng là một trong những danh mục tăng trưởng nhanh nhất…

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.