Ramp Labs mengajukan solusi baru untuk berbagi memori antar-multiagen, konsumsi Token tertinggi turun 65%

GateNews

Berita Gerbang, 11 April, perusahaan infrastruktur AI Ramp Labs merilis hasil riset “Latent Briefing”, yang memungkinkan berbagi memori yang efisien antar sistem multi-agen dengan mengompresi langsung cache KV dari model besar. Dengan tidak mengorbankan akurasi, konsumsi Token diturunkan secara signifikan. Dalam arsitektur multi-agen arus utama, orkestrator (Orchestrator) memecah tugas dan berulang kali memanggil model pekerja (Worker); seiring rantai penalaran terus diperpanjang, jumlah Token meningkat secara eksponensial. Gagasan inti dari Latent Briefing adalah menggunakan mekanisme atensi untuk mengidentifikasi bagian konteks yang benar-benar penting, lalu membuang informasi redundan langsung pada level representasi, bukan mengandalkan ringkasan LLM yang lambat atau penelusuran RAG yang kurang stabil. Pada pengujian benchmark LongBench v2, metode ini menunjukkan performa yang menonjol: konsumsi Token model Worker turun 65%, penghematan Token untuk dokumen berukuran menengah (32k hingga 100k) mencapai median 49%, akurasi keseluruhan meningkat sekitar 3 poin persentase dibanding baseline, sementara waktu tambahan untuk setiap kompresi hanya sekitar 1,7 detik—lebih cepat kira-kira 20 kali dibanding algoritma asli. Eksperimen menggunakan Claude Sonnet 4 sebagai orkestrator dan Qwen3-14B sebagai model pekerja, mencakup skenario dokumen beragam seperti makalah akademik, dokumen hukum, novel, serta laporan pemerintah. Penelitian juga menemukan bahwa ambang kompresi optimal berbeda tergantung tingkat kesulitan tugas dan panjang dokumen—masalah yang sulit cocok untuk kompresi yang agresif guna menyaring kebisingan penalaran yang bersifat spekulatif, sementara dokumen panjang lebih cocok untuk kompresi ringan guna mempertahankan informasi kunci yang tersebar.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Pelanggaran Keamanan Vercel Meluas hingga Ratusan Pengguna; Pengembang AI Berisiko Lebih Tinggi

Pesan Berita Gate, 23 April — Vercel mengungkap pada 19 April bahwa insiden keamanannya, yang awalnya dijelaskan memengaruhi "sebagian terbatas pelanggan," telah berkembang menjadi komunitas pengembang yang jauh lebih luas, khususnya mereka yang membangun alur kerja agen AI. Serangan tersebut dapat memengaruhi ratusan pengguna

GateNews2jam yang lalu

OpenAI 推 GPT-5.5: 12M konteks, indeks AA teratas, Terminal-Bench 82.7% menulis ulang tolok ukur agen

OpenAI merilis GPT-5.5, dengan fokus pada pekerjaan berbasis agen dan pemrosesan pengetahuan perusahaan, serta secara bersamaan meluncurkannya di ChatGPT dan Codex. Poin-poinnya mencakup jendela konteks 1200 juta token, AA Intelligence Index 60, dengan mengungguli Claude Opus 4.7 dan Gemini 3.1 Pro; harganya adalah $5 per satu juta token untuk input dan $30 per satu juta token untuk output, pengurangan token output sekitar 40%, biaya aktual meningkat sekitar 20%.

ChainNewsAbmedia3jam yang lalu

MagicBlock Meluncurkan Mirage, Alat Pembayaran Privasi Berbasis Command-Line untuk Solana

Pesan Berita Gate, 23 April — MagicBlock telah merilis Mirage, sebuah alat pembayaran privasi berbasis command-line yang dirancang untuk jaringan Solana. Alat ini memungkinkan pengguna membuat dompet, menyetor dana, dan mengirim transaksi privat melalui perintah terminal, bot, atau agen AI. Mirage dibangun di atas Private

GateNews7jam yang lalu

OpenClaw 2026.4.22 Menyatukan Siklus Hidup Plugin di Codex dan Pi Harness, Mengurangi Waktu Muat Plugin Hingga 90%

Pesan Gate News, 23 April — OpenClaw, platform Agen AI open-source, merilis versi 2026.4.22 pada 22 April, dengan perubahan terbesarnya adalah penyelarasan siklus hidup Codex harness dan Pi harness. Sebelumnya, plugin berperilaku tidak konsisten di antara dua jalur harness tersebut, dengan beberapa hook yang hilang di lingkungan tertentu. Versi baru mengonsolidasikan hook penting termasuk before_prompt_build, before_compaction/after_compaction, after_tool_call, before_message_write, dan llm_input/llm_output/agent_end, sehingga menghilangkan kebutuhan bagi pengembang untuk memelihara implementasi terpisah untuk setiap jalur. Pembaruan ini juga memperkenalkan dukungan middleware async tool_result untuk ekstensi plugin di sisi Codex. Peningkatan performa sangat signifikan: pemuatan plugin kini menggunakan Jiti native, mengurangi waktu startup sebesar 82% hingga 90%, sementara doctor --non-interactive runtime turun sekitar 74%. Tingkat pemikiran default untuk model inferensi telah ditingkatkan dari off/low menjadi medium, memungkinkan keluaran penalaran secara default untuk konfigurasi yang tidak diubah. Perbaikan tambahan mencakup panggilan agen multi-turn Kimi K2.6 yang kini tidak lagi terputus karena korupsi tool_call ID, manajemen memori subprocess Linux yang ditingkatkan dengan penyesuaian oom_score_adj otomatis, serta sistem pemulihan konfigurasi last-known-good baru untuk mencegah crash Gateway akibat penimpaan konfigurasi yang tidak disengaja. Integrasi penyedia baru mencakup kemampuan pembuatan gambar xAI grok-imagine-image dan grok-imagine-image-pro, TTS, dan STT; Tencent Cloud sebagai plugin penyedia resmi dengan model pratinjau Hy3 dan penetapan harga; serta tool web_search bawaan OpenAI, yang menggantikan kanal pencarian terkelola OpenClaw saat pencarian web diaktifkan.

GateNews8jam yang lalu

Google Cloud dan CVC Bermitra untuk Mempercepat Transformasi Agen AI bagi Perusahaan dalam Portofolio

Berita Gate, 23 April — Google Cloud dan raksasa private equity CVC mengumumkan kemitraan strategis untuk mempercepat transformasi agen AI untuk CVC dan ratusan perusahaan dalam portofolio investasinya. Kolaborasi ini akan memanfaatkan platform kecerdasan buatan Google Cloud dan model Gemini untuk mendorong adopsi agen cerdas di seluruh portofolio.

GateNews10jam yang lalu
Komentar
0/400
Tidak ada komentar