廣場
最新
熱門
新聞
我的主頁
發布
Lions_Lionish
2025-07-11 10:11:57
關注
💀 R.I.P. ChatGPT: Grok 4 剛剛打破了每個 AI 基準 💀
xAI剛剛發布了有史以來最強大的AI模型!
經過幾個月的期待,埃隆·馬斯克的團隊正式發布了Grok 4,基準數據絕對瘋狂。它是新的SOTA大型語言模型。
Grok 4 提供了超越其他模型的最新能力:
🧠 人類最後的考試掌握 - 在有史以來最具挑戰性的學術基準上取得了45%的準確率,而其他頂尖模型勉強達到25%。它在每個學術領域都超越了人類的專業知識。
🏆 人工分析第 #1 - 正式被認定爲頂級 AI 模型,智力指數達到 73 分,超越了所有在推理、知識和解決問題能力方面的競爭對手。
🎯 ARC-AGI 冠軍 - 在視覺模式識別中得分16.2%,幾乎是Claude Opus 4表現的兩倍。這個基準測量純粹的智力和推理能力。
💻 編碼主宰 - Grok 4 Code 變體在 SWE-Bench 上達到了 75%,在實際軟件工程任務中超越了其他所有模型。直接集成到開發環境中。
⚡ 多智能體智能 - Grok 4 Heavy 利用協作 AI 代理解決復雜問題,使準確性超越任何單一模型所能達到的水平。
🔮 實時知識 - 與靜態模型不同,Grok 4 訪問來自 X 的實時數據,提供當前的信息和上下文,而其他 AI 則無法匹配。
🚀 經濟天才 - 在商業模擬測試中超越了人類和所有 AI 模型,創造了比最近的競爭對手多 5 倍的收入。
🔧 API訪問 - 每百萬個令牌$3輸入 / $15輸出。反映高級能力的高級定價和用於處理大量文檔的256k令牌上下文窗口。
⚡ 標準Grok 4 - 通過X Premium+訂閱和Grok提供給希望獲得世界級AI而不需要企業價格的用戶。
💰 SuperGrok Heavy - 每月300美元,提前訪問Grok 4 Heavy及其前沿功能。市場上最貴的AI訂閱,但你爲SOTA性能付費。
#aitools
grok4
#artificialintelligence
xAI
#elonmusk
machinelearning
#technology
LLM
#technews
GROK
0.06%
JST
-0.43%
XAI
22.34%
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見
聲明
。
讚賞
按讚
留言
轉發
分享
留言
0/400
留言
暫無留言
熱門話題
查看更多
#
Gate2月透明度報告
9.12萬 熱度
#
加密市場上漲
42.12萬 熱度
#
川普稱伊朗戰事接近尾聲
8.3萬 熱度
#
微策略再砸12.8億美元增持BTC
8624.61萬 熱度
#
黃金白銀走高
20.17萬 熱度
熱門 Gate Fun
查看更多
Gate Fun
KOL
最新發幣
即將上市
成功上市
1
NAI
NeuroAI Token
市值:
$2417.24
持有人數:
2
0.00%
2
King
MiKing
市值:
$0.1
持有人數:
1
0.00%
3
GLPS
GLOBALPIECE
市值:
$2420.68
持有人數:
1
0.00%
4
soil
somoil
市值:
$2448.12
持有人數:
2
0.00%
5
GateClaw
Gate官方龙虾
市值:
$3063.81
持有人數:
5
4.36%
置頂
Gate 廣場內容挖礦獎勵繼續升級!無論您是創作者還是用戶,挖礦新人還是頭部作者都能贏取好禮獲得大獎。現在就進入廣場探索吧!
創作者享受最高60%創作返佣
創作者獎勵加碼1500USDT:更多新人作者能瓜分獎池!
觀眾點擊交易組件交易贏大禮!最高50GT等新春壕禮等你拿!
詳情:https://www.gate.com/announcements/article/49802
網站地圖
💀 R.I.P. ChatGPT: Grok 4 剛剛打破了每個 AI 基準 💀
xAI剛剛發布了有史以來最強大的AI模型!
經過幾個月的期待,埃隆·馬斯克的團隊正式發布了Grok 4,基準數據絕對瘋狂。它是新的SOTA大型語言模型。
Grok 4 提供了超越其他模型的最新能力:
🧠 人類最後的考試掌握 - 在有史以來最具挑戰性的學術基準上取得了45%的準確率,而其他頂尖模型勉強達到25%。它在每個學術領域都超越了人類的專業知識。
🏆 人工分析第 #1 - 正式被認定爲頂級 AI 模型,智力指數達到 73 分,超越了所有在推理、知識和解決問題能力方面的競爭對手。
🎯 ARC-AGI 冠軍 - 在視覺模式識別中得分16.2%,幾乎是Claude Opus 4表現的兩倍。這個基準測量純粹的智力和推理能力。
💻 編碼主宰 - Grok 4 Code 變體在 SWE-Bench 上達到了 75%,在實際軟件工程任務中超越了其他所有模型。直接集成到開發環境中。
⚡ 多智能體智能 - Grok 4 Heavy 利用協作 AI 代理解決復雜問題,使準確性超越任何單一模型所能達到的水平。
🔮 實時知識 - 與靜態模型不同,Grok 4 訪問來自 X 的實時數據,提供當前的信息和上下文,而其他 AI 則無法匹配。
🚀 經濟天才 - 在商業模擬測試中超越了人類和所有 AI 模型,創造了比最近的競爭對手多 5 倍的收入。
🔧 API訪問 - 每百萬個令牌$3輸入 / $15輸出。反映高級能力的高級定價和用於處理大量文檔的256k令牌上下文窗口。
⚡ 標準Grok 4 - 通過X Premium+訂閱和Grok提供給希望獲得世界級AI而不需要企業價格的用戶。
💰 SuperGrok Heavy - 每月300美元,提前訪問Grok 4 Heavy及其前沿功能。市場上最貴的AI訂閱,但你爲SOTA性能付費。
#aitools grok4 #artificialintelligence xAI #elonmusk machinelearning #technology LLM #technews