文秀AI,開源LLM‘Kimi-K2.6’公開…與GPT-5.4正面比較

robot
摘要生成中

中國人工智慧初創公司Moonshot AI公開了最新開源大型語言模型(LLM)“Kimi-K2.6”。該公司表示,該模型在主要人工智慧基準測試中領先或微幅落後於GPT-5.4和Claude Opus 4.6。

Kimi-K2.6是Moonshot AI“Kimi”系列的最新作品。此模型設計為不僅能處理文本,還能處理圖像等多媒體輸入。Moonshot AI特別說明其聚焦於效率和實際任務執行能力。這意味著不僅是提高了回答質量,還優化了結構,使其能夠利用相同的計算資源執行更複雜的任務。

以較少資源提升性能的結構是關鍵

Kimi-K2.6採用了被稱為“Swiglu”的激活函數。這是一種相比傳統方式能提高硬體利用效率,並能部分簡化模型訓練過程的結構。該方法也已被應用於Meta Platforms的Llama系列等多個開源模型群。

模型內部部署了384個“專家”網路。但並非用戶每次輸入問題時所有這些網路都會同時運行。實際生成回應時,僅選擇性調用8個專家。這種“專家混合”方式只激活所需部分,有利於減少計算量和基礎設施負擔。

此外還搭載了“多頭潛在注意力”技術。這是注意力機制的一種,能更高效地從提示中篩選重要資訊。由於它將資料壓縮成更輕量級的數學表達進行處理,因此相比普通的注意力結構,其硬體需求較低。

圖像理解與智能體協作功能亦獲增強

Kimi-K2.6還配備了擁有40億參數規模的視覺編碼器。該裝置將圖像轉換為模型易於理解的“嵌入”形式。得益於此,Kimi-K2.6不僅能處理句子輸入,還能結合草圖或視覺資料進行工作。

據Moonshot AI稱,該模型僅憑簡單的用戶指示和界面草圖即可生成完整的網站。對於更複雜、耗時的任務,最多可同時投入300個智能體協同工作。據解釋,這種方式是每個智能體將任務分解為細分子步驟進行並行處理,相較於順序執行能提升速度。

此外,通過“群組協作”功能,還可以設計讓人與智能體共同工作的流程。Moonshot AI解釋稱,借此可以在專案內將工作任務分配給人類工作者和人工智慧智能體。公司補充說,與前代相比,其在Rust開發等高難度程式設計任務上的性能也有所提升。

聲稱在高難度評估HLE-Full中領先GPT-5.4

Moonshot AI表示,已在超過20個主要基準測試中將Kimi-K2.6與GPT-5.4、Claude Opus 4.6進行比較。據該公司聲稱,新模型在多項測試中領先於這兩個頂尖模型,或將分差縮小至幾個百分點以內。

尤其在公認最嚴苛的評估之一“HLE-Full”中,Kimi-K2.6獲得了54分。該基準測試由涵蓋100多個學術領域的約2500個博士級別問題組成。Moonshot AI稱,在同一測試中,Claude Opus 4.6獲得53分,GPT-5.4獲得52.1分。

此次發布顯示開源人工智慧競爭正日趨激烈。雖然閉源的頂級模型仍主導市場,但隨著像Kimi-K2.6這樣同時強調效率和任務自動化功能的開源模型增多,企業和開發者的選擇也正變得更加廣泛。

TP AI 注意事項 本文基於TokenPost.ai的語言模型生成摘要。正文主要內容可能被省略或與事實存在出入。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 留言
  • 轉發
  • 分享
留言
請輸入留言內容
請輸入留言內容
暫無留言