Ramp Labs เสนอแนวทางใหม่สำหรับการแชร์หน่วยความจำแบบหลายเอเจนต์ โดยการใช้โทเคนสูงสุดลดลง 65%

GateNews

ข่าว Gate News วันที่ 11 เมษายน บริษัทโครงสร้างพื้นฐานด้าน AI Ramp Labs เปิดเผยผลการวิจัย “Latent Briefing” โดยบีบอัดแคช KV ของโมเดลขนาดใหญ่โดยตรงเพื่อทำให้เกิดการแชร์ความจำอย่างมีประสิทธิภาพระหว่างระบบหลายเอเจนต์ (multi-agent) ภายใต้เงื่อนไขที่ไม่ทำให้ความแม่นยกลดลง และลดการใช้ Token ได้อย่างมาก ในสถาปัตยกรรมหลายเอเจนต์ที่เป็นกระแสหลัก ผู้ประสานงาน (Orchestrator)จะแยกงานออกและเรียกใช้โมเดลผู้ปฏิบัติงาน (Worker)ซ้ำ ๆ เมื่อระยะเส้นทางการอนุมาน (inference) ยาวขึ้น ปริมาณ Token ก็จะเพิ่มขึ้นแบบทวีคูณ Latent Briefing มีแนวคิดหลักคือใช้กลไกความสนใจ (attention) เพื่อระบุส่วนที่สำคัญจริง ๆ ในบริบท จากนั้นจึงทิ้งข้อมูลที่ซ้ำซ้อนทันทีในชั้นการแทนค่า (representation) ไม่ใช่พึ่งพาสรุปด้วย LLM ที่ช้ากว่า หรือการค้นคืน RAG ที่เสถียรภาพต่ำ ในการทดสอบเกณฑ์มาตรฐาน LongBench v2 วิธีนี้ทำผลงานได้เด่น: การใช้ Token ของโมเดล Worker ลดลง 65% การประหยัด Token สำหรับเอกสารความยาวปานกลาง (32k ถึง 100k) มีค่ามัธยฐานอยู่ที่ 49% ความแม่นยำโดยรวมสูงขึ้นประมาณ 3 จุดเปอร์เซ็นต์เมื่อเทียบกับฐาน (baseline) และเวลาเพิ่มเติมที่ใช้สำหรับการบีบอัดแต่ละครั้งอยู่ที่ราว 1.7 วินาทีเท่านั้น ทำให้เร็วขึ้นประมาณ 20 เท่าจากอัลกอริทึมเดิม การทดลองใช้ Claude Sonnet 4 เป็นผู้ประสานงาน และ Qwen3-14B เป็นโมเดลผู้ปฏิบัติงาน ครอบคลุมสถานการณ์เอกสารหลายประเภท เช่น บทความวิชาการ เอกสารทางกฎหมาย นวนิยาย และรายงานของรัฐบาล งานวิจัยยังพบว่า “ขีดจำกัดการบีบอัดที่เหมาะสมที่สุด” จะแตกต่างกันตามความยากของงานและความยาวของเอกสาร—งานที่ยากเหมาะกับการบีบอัดแบบก้าวร้าวเพื่อกรองสัญญาณรบกวนจากการอนุมานเชิงคาดเดา (speculative) ขณะที่เอกสารยาวเหมาะกับการบีบอัดแบบเบาเพื่อคงรักษาข้อมูลสำคัญที่กระจายอยู่

news.article.disclaimer

btc.bar.articles

NeoCognition ระดมทุน $40M ล้านดอลลาร์ในรอบเมล็ดพันธุ์สำหรับเอเจนต์ AI ที่เรียนรู้จากงานจริง

Gate News ข้อความ วันที่ 22 เมษายน — ห้องปฏิบัติการวิจัยด้าน AI NeoCognition ประกาศเสร็จสิ้นการระดมทุนรอบเมล็ดพันธุ์ $40 ล้านดอลลาร์ โดยออกจากโหมดซ่อนตัว ก่อตั้งโดยรองศาสตราจารย์ Yu Su จากมหาวิทยาลัย Ohio State University ร่วมกับ Xiang Deng และ Yu Gu บริษัทมีสำนักงานใหญ่ที่เมือง Palo Alto รัฐแคลิฟอร์เนีย เงินรอบนี้

GateNews10 นาที ที่แล้ว

PicWe เปิดตัวกระเป๋าเงิน AI Agent พร้อมการจัดการคีย์บนอุปกรณ์

PicWe ประกาศเปิดตัวเบตาสาธารณะของ PicWe Wallet กระเป๋าเงินคีย์แบบออนดีไวซ์ที่ขับเคลื่อนด้วยเอเจนต์ AI พร้อมไม่มีวลีสำหรับกู้คืน รองรับสินทรัพย์หลายเชน สวอป การทำงานอัตโนมัติที่เข้าถึงด้วย AI และมุ่งหมายที่จะรวมโครงสร้างพื้นฐานด้าน RWA เข้าด้วยกัน PicWe ได้เปิดตัวเบตาสาธารณะของ PicWe Wallet ซึ่งเป็นกระเป๋าเงินที่รองรับ AI Agent เก็บคีย์ไว้บนอุปกรณ์โดยตรง ตัดความจำเป็นของวลีสำหรับกู้คืน และทำให้การทำงานที่สำคัญยังคงอยู่ในเครื่อง กระบวนการเบตานี้รองรับการจัดการสินทรัพย์หลายเชน การสวอป และค่าธรรมเนียมที่ใช้เหรียญสเตเบิลโคอิน พร้อมทั้งเปิดใช้งานการโต้ตอบกับ AI แบบตั้งโปรแกรมได้ ความคิดริเริ่มที่กว้างขึ้นของ PicWe วางตำแหน่งแพลตฟอร์มให้เป็นโครงสร้างพื้นฐานแบบรวมสำหรับสินทรัพย์ในโลกจริง โดยรองรับการออกโทเค็น การหมุนเวียน การชำระบัญชี การชำระเงินข้ามพรมแดน การทำโทเคไนเซชัน และการประสานงานในห่วงโซ่อุปทานสำหรับกรณีการใช้งานระดับองค์กร

GateNews54 นาที ที่แล้ว

Hugging Face ปล่อยโค้ดโอเพนซอร์ส ml-intern ซึ่งเป็นตัวแทน AI สำหรับการวิจัย ML แบบอิสระ

ปล่อยโค้ดโอเพนซอร์ส ml-intern ตัวแทนวิจัย ML แบบอิสระของ Hugging Face ที่อ่านเอกสาร คัดสรรข้อมูล ฝึก ประเมิน และปรับปรุงอย่างต่อเนื่องข้ามสาขาวิทยาศาสตร์ แพทยศาสตร์ และคณิตศาสตร์. บทคัดย่อ: ml-intern ของ Hugging Face เป็นตัวแทนวิจัย ML แบบอิสระโอเพนซอร์สที่อ่านเอกสาร คัดสรรชุดข้อมูล ฝึกบน GPU ในเครื่องหรือบนคลาวด์ ประเมินผลลัพธ์ และวนลูปเพื่อปรับปรุง Built บน smolagents พร้อมทั้งอินเทอร์เฟซแบบ CLI และแบบเว็บ มันนำทางผ่าน arXiv/HF Papers, HF Hub และ HF Jobs การเดโมครอบคลุมตั้งแต่วิทยาศาสตร์ แพทยศาสตร์ ไปจนถึงคณิตศาสตร์ แสดงให้เห็นระบบอัตโนมัติแบบ end-to-end และการเพิ่มสมรรถนะ.

GateNews58 นาที ที่แล้ว

Google Research เปิดตัว ReasoningBank: เอเจนต์ AI เรียนรู้กลยุทธ์การให้เหตุผลจากความสำเร็จและความล้มเหลว

ข่าว Gate News วันที่ 22 เมษายน — Google Research เปิดตัว ReasoningBank ซึ่งเป็นกรอบงานหน่วยความจำของเอเจนต์ที่ช่วยให้เอเจนต์ที่ขับเคลื่อนด้วยโมเดลภาษาขนาดใหญ่สามารถเรียนรู้อย่างต่อเนื่องหลังการใช้งานจริง กรอบงานจะสกัดกลยุทธ์การให้เหตุผลทั่วไปจากทั้งประสบการณ์ที่ทำสำเร็จและที่ทำไม่สำเร็จ เก็บไว้

GateNews1 ชั่วโมง ที่แล้ว

อาจารย์จาก Tsinghua ไต้ จี้เฟิง เปิดตัว Naive.ai และระดมทุน ~$300M ที่มูลค่า $800M

ข่าวประตูเมือง วันที่ 22 เมษายน — ไต้ จี้เฟิง อาจารย์ประจำคณะวิศวกรรมอิเล็กทรอนิกส์แห่งมหาวิทยาลัย Tsinghua ได้ก่อตั้ง Naive.ai ซึ่งเป็นบริษัทที่มุ่งเน้นการฝึกหลังโมเดลแบบโอเพนซอร์สและเอเจนต์ด้าน AI สตาร์ทอัพดังกล่าวระดมทุนได้ราว $300 ล้านดอลลาร์ โดยประเมินมูลค่าอยู่ที่ประมาณ $80

GateNews2 ชั่วโมง ที่แล้ว

AWS ขยายเวิร์กโฟลว์ AI แบบหลายเอเจนต์ รองรับ Claude Opus 4.7 บน Bedrock

ข่าว Gate News วันที่ 22 เมษายน — Amazon Web Services ประกาศขยายความริเริ่ม AI เชิงเอเจนต์ผ่านเวิร์กโฟลว์แบบหลายเอเจนต์ โดยรองรับ Anthropic's Claude Opus 4.7 บน Amazon Bedrock เพื่อช่วยให้ลูกค้าก้าวพ้นจากการทดลองนำร่องด้าน generative AI บริษัทกำลังขยายความสัมพันธ์กับพาร์ทเนอร์ ขณะที่ลูกค้าปรับเปลี่ยนจากเครื่องมือ AI เดี่ยวไปสู่ระบบที่เชื่อมต่อเอเจนต์เฉพาะทางหลายตัว ซึ่งลูกค้า

GateNews2 ชั่วโมง ที่แล้ว
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น