Khả năng của Agent theo kịp Opus4.6, giá chỉ 4%: Arcee mở nguồn Trinity Large Thinking

BlockBeatNews

Theo dõi từ 1M AI News, công ty mô hình AI tại Mỹ Arcee đã phát hành Trinity-Large-Thinking, một mô hình suy luận mã nguồn mở dành cho các tác vụ Agent trong thời gian dài. Mô hình sử dụng kiến trúc mô hình chuyên gia hỗn hợp thưa (MoE), tổng tham số 400B, tham số kích hoạt chỉ 13B, và được tải trọng số mở trên Hugging Face theo giấy phép Apache 2.0.

Khác với Trinity-Large-Preview trước đó (chỉ tinh chỉnh theo hướng dẫn), Trinity-Large-Thinking thực hiện “suy nghĩ” suy luận trước khi trả lời, đồng thời các cuộc gọi công cụ nhiều lượt và khả năng mạch lạc trong ngữ cảnh dài cũng như khả năng tuân thủ chỉ dẫn đều được cải thiện; mục tiêu thiết kế cốt lõi là duy trì đầu ra ổn định trong vòng lặp Agent thời gian dài.

Trên bộ chuẩn năng lực Agent PinchBench do Kilo phát triển, mô hình đạt 91.9 điểm, xếp thứ hai, chỉ sau 93.3 của Opus 4.6; trên bộ chuẩn tác vụ Agent Tau2-Airline, đạt 88.0 điểm, cao nhất trong số tất cả các mô hình so sánh. Tuy nhiên hiệu suất ở các bộ chuẩn suy luận tổng quát nhìn chung chỉ ở mức trung bình: GPQA-D đạt 76.3, thấp hơn Kimi-K2.5 (86.9) và Opus 4.6 (89.2); MMLU-Pro đạt 83.4, cũng xếp cuối. Theo phần mô tả chính thức của Arcee, mô hình này ở “nhiều khía cạnh là mô hình mã nguồn mở mạnh nhất ngoài Trung Quốc”.

Giá API của Arcee là $0.90/triệu token cho đầu ra; theo Arcee thì rẻ hơn khoảng 96% so với Opus 4.6. Mô hình cũng được phát hành đồng thời trên nền tảng định tuyến mô hình AI OpenRouter; trong 5 ngày đầu có thể sử dụng miễn phí trên OpenClaw. Kể từ khi Preview được phát hành vào cuối tháng 1, nó đã phục vụ trên OpenRouter hơn 3.37 nghìn tỷ token, là mô hình mã nguồn mở có lượng sử dụng từ Mỹ cao nhất và xếp thứ tư trên toàn cầu trong số các mô hình được OpenClaw ghi nhận; Preview sẽ tiếp tục được cung cấp miễn phí trên OpenRouter.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận