#OpenAIReleasesGPT-5.4


OpenAI 發布 GPT-5.4:2026年3月在專業 AI 能力方面的重大飛躍

OpenAI 在2026年3月5日宣布推出 GPT-5.4,標誌著其前沿模型系列的重要更新。公司將 GPT-5.4 描述為其最具能力和效率的專為專業工作量身打造的模型。此次發布緊隨 GPT-5 家族的快速迭代,該系列始於2025年8月的首次 GPT-5 推出。GPT-5.4 直接建立在先前版本如 GPT-5.3 Codex 和 GPT-5.2 Thinking 的基礎上,整合了推理、編碼和代理工作流程的改進,形成一個統一的系統。該模型旨在滿足複雜企業任務的需求,這些任務對可靠性、效率和多步執行能力有著極高的要求。

此次發布包括兩個主要版本,以滿足不同用戶需求。GPT-5.4 Thinking 作為預設的推理專用版本,在 ChatGPT 中提供,強調深度問題解決和結構化思考流程。用戶現在可以在完整回應生成前,先看到模型推理的預先計劃,若方向需要修正,還可以在過程中進行調整。此功能提升了透明度和控制力,特別適合專業人士反覆優化輸出。GPT-5.4 Pro 提供最高性能,針對最苛刻的應用,滿足需要在複雜高風險任務中達到巔峰能力的用戶。這兩個版本都代表 OpenAI 在推動更實用、可用於生產的 AI 工具方面的努力。

自2026年3月5日起逐步推出。ChatGPT 中,GPT-5.4 Thinking 取代了之前的 GPT-5.2 Thinking,適用於 Plus、Team 和 Pro 訂閱用戶。遺留的 GPT-5.2 Thinking 存取權在模型選擇器中保留三個月,至2026年6月5日停止支援。企業和教育計劃用戶可以通過管理員設置提前啟用。API 也提供即時存取 GPT-5.4,識別碼為 gpt-5.4,而 GPT-5.4 Pro 則使用 gpt-5.4-pro。Codex,OpenAI 的編碼環境,也整合了新模型。ChatGPT 的上下文窗口保持與先前 Thinking 模型一致,但 API 版本支持高達一百萬個標記,這是一次大幅擴展,能處理非常長的文件、程式碼庫或數據集,無需截斷。

主要技術改進集中在效率和可靠性方面。OpenAI 報告稱,GPT-5.4 在某些任務中使用的標記數明顯較少,某些情境下比早期模型降低了多達47%。這種效率降低了計算成本,也加快了代理工作流程的回應速度。幻覺率顯著降低:單個聲明出錯的可能性降低33%,整體回應的錯誤率較 GPT-5.2 下降18%。這些進步來自於更精細的訓練技術、更好的推理進展整合,以及針對專業場景中常見失誤模式的針對性緩解措施。

一個突出的新增功能是原生電腦操作能力,使 GPT-5.4 成為 OpenAI 首個內建能自主操作電腦和軟體的通用模型。這包括與應用程式互動、導航界面、處理檔案,以及在試算表、簡報和文件等工具中執行多步操作。此功能推進 AI 代理在現實環境中可靠完成任務的能力,支持自動化應用於資料分析、報告生成和軟體測試等領域。模型融合了 GPT-5.3 Codex 的行業領先編碼技術,同時提升工具使用和在多種軟體環境中的性能。

基準測試顯示在專業領域取得了顯著進展。在涉及複雜推理、編碼挑戰和代理模擬的任務中,GPT-5.4 表現優於前代,並在某些領域接近甚至超越人類水平。例如,在需要持續執行的環境中,如作業系統模擬或網絡交互,展現出強勁的結果。這些指標使模型在企業應用中具有競爭力,特別是在一致性比純速度更重要的場景中,與 Anthropic 的 Claude 系列和 Google 的 Gemini 等競爭對手相抗衡。

安全性方面在開發過程中受到特別關注。OpenAI 維持與 GPT-5.3 Codex 相似的高網絡風險等級,並實施全面的緩解措施,以防止在網絡安全領域的濫用。GPT-5.4 Thinking 的系統卡詳細說明了多層保護措施,包括拒絕機制、對有害輸出的監控,以及能力門檻的評估。儘管如此,該發布伴隨著對 OpenAI 合作夥伴關係和內部決策的更廣泛審查,但公司強調將持續遵循負責任部署的原則。

定價反映了模型的先進性和分層存取。標準 GPT-5.4 的 API 收費為每百萬輸入標記2.50美元,輸出部分收費更高,長上下文會話中超過272,000標記的提示則收取雙倍費用。GPT-5.4 Pro 收費較高,適合高性能需求。在微軟的整合產品如 Foundry 中,也採用類似的結構,並提供快取輸入折扣以鼓勵高效使用。這些費用主要針對專業和開發者用戶,他們能從增強的能力中獲益,而免費層的 ChatGPT 用戶則繼續使用較早或較輕量的模型。

此次發布的時機與 OpenAI 越來越頻繁的漸進式更新策略一致。在 GPT-5.3 Instant 發布僅數日後,GPT-5.4 展示了加快迭代的步伐,以保持在前沿 AI 領域的領導地位。分析師認為這是對競爭壓力和用戶反饋的戰略回應,旨在解決先前模型在實務工作流程中的限制。企業採用仍是重點,並推出如 Excel 和 Google Sheets 的金融插件、改進的文件處理和代理可靠性等功能,旨在幫助商業用戶提升生產力。

市場反響大多正面,開發者和專業人士在早期測試中反映出更流暢的編碼輸出、更精緻的知識工作,以及在受控演示中的代理行為效果。一些批評則集中在定價的可及性和在極端情況下的可靠性問題,但基準測試和初步實測都顯示出顯著進步。此次發布彰顯了2026年 AI 進展的快速步伐,月度或雙月的改進不斷重塑大型語言模型在專業環境中的應用預期。

展望未來,GPT-5.4 為 GPT-5 系列的進一步優化奠定了基礎。OpenAI 表示,Thinking 和 Instant 類模型可能會以不同的節奏演進,實現專業化而不破壞用戶體驗。隨著上下文窗口的擴大和代理功能的成熟,該模型家族有望在軟體開發、金融分析等行業推動更自主的系統。目前,GPT-5.4 提供了一個專注於效率、準確性和實用性的升級版本,適合處理複雜工作的用戶。

此發展鞏固了 OpenAI 在不斷演進的 AI 領域中的地位,專業級性能日益成為競爭優勢的關鍵。擁有存取權的用戶可以直接在 ChatGPT 或通過 API 探索這些變化,而在2026年3月5日公告後的數週內,對生產力、自動化和創新的更廣泛影響也將逐步展開。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 3
  • 轉發
  • 分享
留言
0/400
ybaservip
· 1小時前
2026 Go Go Go 👊
回復0
Ryakpandavip
· 1小時前
2026衝衝衝 👊
查看原文回復0
小财神Plutusvip
· 2小時前
馬年大吉,發財發財😘
查看原文回復0