Ramp Labs đề xuất một giải pháp mới để chia sẻ trí nhớ giữa nhiều tác nhân, mức tiêu thụ Token cao nhất giảm 65%

Tin Gate News, ngày 11 tháng 4, công ty cơ sở hạ tầng AI Ramp Labs công bố kết quả nghiên cứu “Latent Briefing”, đạt được chia sẻ bộ nhớ hiệu quả giữa các hệ đa tác tử thông qua việc nén trực tiếp bộ nhớ đệm KV của mô hình lớn, đồng thời giảm mạnh mức tiêu thụ Token mà không làm mất chính xác. Trong các kiến trúc đa tác tử phổ biến, bộ điều phối (Orchestrator) tách nhỏ nhiệm vụ và liên tục gọi đi gọi lại mô hình làm việc (Worker); khi chuỗi suy luận ngày càng kéo dài, lượng Token tăng theo cấp số nhân. Ý tưởng cốt lõi của Latent Briefing là sử dụng cơ chế chú ý để nhận diện phần thực sự quan trọng trong ngữ cảnh, rồi loại bỏ thông tin dư thừa ngay ở lớp biểu diễn, thay vì dựa vào bản tóm tắt của LLM vốn chậm hoặc truy xuất RAG kém ổn định. Trong bài kiểm thử chuẩn LongBench v2, phương pháp này thể hiện ấn tượng: lượng Token tiêu thụ của mô hình Worker giảm 65%, mức tiết kiệm Token cho các tài liệu độ dài trung bình (32k đến 100k) đạt trung vị 49%, độ chính xác tổng thể tăng khoảng 3 điểm phần trăm so với đường cơ sở, trong khi thời gian phát sinh cho mỗi lần nén chỉ khoảng 1,7 giây, nhanh hơn thuật toán gốc khoảng 20 lần. Thí nghiệm sử dụng Claude Sonnet 4 làm bộ điều phối và Qwen3-14B làm mô hình làm việc, bao phủ nhiều kịch bản tài liệu như bài báo học thuật, văn bản pháp lý, tiểu thuyết và báo cáo của chính phủ. Nghiên cứu cũng phát hiện rằng ngưỡng nén tối ưu thay đổi theo độ khó của nhiệm vụ và độ dài tài liệu—các bài toán khó phù hợp với nén mạnh để lọc nhiễu suy luận mang tính đầu cơ, còn tài liệu dài thì phù hợp hơn với nén nhẹ để lưu giữ các thông tin then chốt được phân tán.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Nvidia ra mắt OpenShell v0.0.33 với trình điều khiển MicroVM libkrun để sandbox tác nhân AI

Tin tức Cổng, ngày 21 tháng 4 — Theo quan sát của Beating, gần đây runtime sandbox tác nhân AI mã nguồn mở của Nvidia là OpenShell đã phát hành phiên bản v0.0.33. Bản cập nhật giới thiệu libkrun, một trình điều khiển microVM nhẹ dựa trên KVM, cùng với các tính năng bảo mật được nâng cường

GateNews10phút trước

ProCap Financial hợp tác với Kalshi để ra mắt dịch vụ nghiên cứu thị trường dự đoán ứng dụng AI

Tin từ Gate News, ngày 21 tháng 4 — ProCap Financial, được thành lập bởi doanh nhân tiền mã hóa Anthony Pompliano, đã hợp tác với Kalshi, một nhà điều hành thị trường dự đoán, để ra mắt một dịch vụ nghiên cứu tập trung vào phân tích thị trường dự đoán. Dịch vụ này tận dụng đường ống dữ liệu của Kalshi và các tác nhân AI của ProCap để

GateNews14phút trước

Justin Sun Làm Rõ AI Agent là Động Lực Cốt Lõi cho Sự Tiến Hóa Trí Tuệ Web3

Justin Sun kêu gọi rằng AI Agents sẽ thay thế các tương tác Web3 thủ công, cho phép các DApps tự động dựa trên ý định có khả năng lên kế hoạch và thực thi các tác vụ trên chuỗi, nâng cao năng suất và thúc đẩy việc áp dụng hàng loạt tại Genesis Hackathon. Tóm tắt: Phát biểu của Justin Sun tại Genesis Hackathon nhấn mạnh AI Agents như một chất xúc tác cho Web3, chuyển từ vận hành thủ công sang các quy trình tự động dựa trên ý định có khả năng quản lý tác vụ trên chuỗi và giao dịch xuyên chuỗi, giải quyết các nút thắt tăng trưởng người dùng và thúc đẩy sự áp dụng trên toàn hệ sinh thái.

GateNews46phút trước

Alipay Ra Mắt Thanh Toán Tác Nhân AI Tại Hàng Châu, Đạt 100 Triệu Người Dùng

Tin tức Cổng, ngày 21 tháng 4 — Alipay đã ra mắt dịch vụ thanh toán bằng tác nhân AI tại Hàng Châu, cho phép các tác nhân AI kiểu OpenClaw thực hiện mua sắm và xử lý thanh toán thay mặt người dùng. Tính năng này yêu cầu người dùng phải bật tính năng, xác minh danh tính và phê duyệt từng giao dịch, với các biện pháp kiểm soát rủi ro và cơ chế bồi thường được thiết lập a

GateNews1giờ trước

Moonshot AI 推出具备 300 智能体蜂群能力的 Kimi K2.6,推动自主 AI 系统发展

Moonshot AI 的 Kimi K2.6 扩展并行子智能体到 300 个, 将多领域任务速度提升至 4,000 步,并新增“Skills”工具,可将文档转换为可重用模板。 摘要:Moonshot AI 发布 Kimi K2.6,这是一款开源模型,可将智能体编排规模扩展至 300 个并行子智能体与 4,000 个协同步骤。它提升了跨 Rust、Go 和 Python 的长时域代码能力,增强了前端、DevOps 与性能优化,并引入“Skills”机制:将 PDF、电子表格和 Word 文件转换为可重用任务模板,用于自治的多步骤工作流与持续监控。

GateNews2giờ trước

Tencent Cloud Phát Hành Mã Nguồn Mở Cube Sandbox, Môi Trường Thực Thi Tác Nhân AI Tương Thích với OpenAI và Manus

Tin Cổng, 21 tháng 4 — Tencent Cloud đã công bố việc chính thức phát hành mã nguồn mở Cube Sandbox, một nền tảng môi trường thực thi được thiết kế cho các tác nhân AI. Theo công ty, đây là sandbox đầu tiên trong ngành kết hợp khả năng cô lập ở mức phần cứng với thời gian khởi động dưới 100 mili giây. Cub

GateNews2giờ trước
Bình luận
0/400
Không có bình luận