Meta與AWS簽署數十億美元雲端合約…向AI代理投入‘Graviton5’

Meta Platforms與亞馬遜雲服務(AWS)簽署了一項價值數十億美元的多年期合約。該合約的核心是AWS自主研發的CPU"Graviton"系列,Meta將從AWS獲得運營大規模AI代理所需的雲基礎設施。

據彭博社報導,通過此次合約,Meta可以獲得數千萬規模的Graviton核心,並且還獲得了根據未來需求進一步增加數量的選擇權。Meta計劃將這些資源用於驅動"代理型AI"。AI代理指的是超越簡單聊天機器人、能與外部應用程序連接並自動執行任務的人工智能形式。

Graviton5的特點與性能

此次合約中備受關注的晶片是AWS於去年12月發布的最新CPU"Graviton5"。該晶片採用3納米工藝製造,搭載了192個核心,基於Arm Holdings的指令集架構。指令集架構相當於定義半導體以何種方式執行運算的"語言"。Arm架構在向量和矩陣運算方面具有優勢,被認為有利於AI任務。

AWS表示,Graviton5比上一代自有CPU性能最高提升25%。性能提升的背後是大規模擴展的L3快取。L3快取是放置在處理器核心附近的記憶體空間,通過縮短資料傳輸距離來提高處理速度。據AWS稱,Graviton5的L3快取比上一代產品大了5倍。

CPU在AI基礎設施中的作用

CPU在AI伺服器中仍然扮演著重要角色。雖然大規模神經網路運算本身主要由圖形處理器(GPU)負責,但CPU負責協調這些GPU並執行各種輔助任務。特別是Meta推進的AI代理往往需要連接外部工具和服務,因此圍繞CPU的處理需求不容小覷。此次合約被視為一個信號,表明Meta不僅在GPU方面,而且在整體AI基礎設施的設計上正變得更加精細。

Graviton5被設計為與AWS的" Nitro系統"協同運行。Nitro系統是一種將部分基礎設施管理工作轉移至獨立加速器,從而幫助CPU將更多資源用於處理客戶應用程序的架構。AWS還解釋說,"Nitro隔離引擎"可以驗證不同客戶的工作負載是否相互分離。這是一種在多租戶環境中同時確保安全性和效率的設計。

Meta的長期AI戰略

Meta基礎設施負責人桑托什·賈納爾丹表示:“AWS是我們長期信賴的雲合作夥伴,通過擴大引入Graviton,我們能夠以適合Meta規模的性能和效率,運營CPU密集型的AI代理工作負載。”

此次發布之所以引人注目,還在於這是Meta在過去一個月內公布的第二個大型CPU合約。此前,Meta已決定引入Arm的新型AGI CPU,並宣布計劃在未來多種下一代晶片設計上展開合作。市場分析認為,Meta正使其AI基礎設施戰略擺脫單一依賴GPU的局面,向CPU、定制晶片和雲資源擴展,為長期競爭做準備。

TP AI注意事項 使用基於TokenPost.ai的語言模型總結了文章。本文可能遺漏了主要內容或與事實不符。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 留言
  • 轉發
  • 分享
留言
請輸入留言內容
請輸入留言內容
暫無留言