2026-03-08 01:51:58

#OpenAIReleasesGPT-5.4

OpenAI 發布 GPT-5.4：2026年3月在專業 AI 能力方面的重大飛躍

OpenAI 在2026年3月5日宣布推出 GPT-5.4，標誌著其前沿模型系列的重要更新。公司將 GPT-5.4 描述為其最具能力和效率的專為專業工作量身打造的模型。此次發布緊隨 GPT-5 家族的快速迭代，該系列始於2025年8月的首次 GPT-5 推出。GPT-5.4 直接建立在先前版本如 GPT-5.3 Codex 和 GPT-5.2 Thinking 的基礎上，整合了推理、編碼和代理工作流程的改進，形成一個統一的系統。該模型旨在滿足複雜企業任務的需求，這些任務對可靠性、效率和多步執行能力有著極高的要求。

此次發布包括兩個主要版本，以滿足不同用戶需求。GPT-5.4 Thinking 作為預設的推理專用版本，在 ChatGPT 中提供，強調深度問題解決和結構化思考流程。用戶現在可以在完整回應生成前，先看到模型推理的預先計劃，若方向需要修正，還可以在過程中進行調整。此功能提升了透明度和控制力，特別適合專業人士反覆優化輸出。GPT-5.4 Pro 提供最高性能，針對最苛刻的應用，滿足需要在複雜高風險任務中達到巔峰能力的用戶。這兩個版本都代表 OpenAI 在推動更實用、可用於生產的 AI 工具方面的努力。

自2026年3月5日起逐步推出。ChatGPT 中，GPT-5.4 Thinking 取代了之前的 GPT-5.2 Thinking，適用於 Plus、Team 和 Pro 訂閱用戶。遺留的 GPT-5.2 Thinking 存取權在模型選擇器中保留三個月，至2026年6月5日停止支援。企業和教育計劃用戶可以通過管理員設置提前啟用。API 也提供即時存取 GPT-5.4，識別碼為 gpt-5.4，而 GPT-5.4 Pro 則使用 gpt-5.4-pro。Codex，OpenAI 的編碼環境，也整合了新模型。ChatGPT 的上下文窗口保持與先前 Thinking 模型一致，但 API 版本支持高達一百萬個標記，這是一次大幅擴展，能處理非常長的文件、程式碼庫或數據集，無需截斷。

主要技術改進集中在效率和可靠性方面。OpenAI 報告稱，GPT-5.4 在某些任務中使用的標記數明顯較少，某些情境下比早期模型降低了多達47%。這種效率降低了計算成本，也加快了代理工作流程的回應速度。幻覺率顯著降低：單個聲明出錯的可能性降低33%，整體回應的錯誤率較 GPT-5.2 下降18%。這些進步來自於更精細的訓練技術、更好的推理進展整合，以及針對專業場景中常見失誤模式的針對性緩解措施。

一個突出的新增功能是原生電腦操作能力，使 GPT-5.4 成為 OpenAI 首個內建能自主操作電腦和軟體的通用模型。這包括與應用程式互動、導航界面、處理檔案，以及在試算表、簡報和文件等工具中執行多步操作。此功能推進 AI 代理在現實環境中可靠完成任務的能力，支持自動化應用於資料分析、報告生成和軟體測試等領域。模型融合了 GPT-5.3 Codex 的行業領先編碼技術，同時提升工具使用和在多種軟體環境中的性能。

基準測試顯示在專業領域取得了顯著進展。在涉及複雜推理、編碼挑戰和代理模擬的任務中，GPT-5.4 表現優於前代，並在某些領域接近甚至超越人類水平。例如，在需要持續執行的環境中，如作業系統模擬或網絡交互，展現出強勁的結果。這些指標使模型在企業應用中具有競爭力，特別是在一致性比純速度更重要的場景中，與 Anthropic 的 Claude 系列和 Google 的 Gemini 等競爭對手相抗衡。

安全性方面在開發過程中受到特別關注。OpenAI 維持與 GPT-5.3 Codex 相似的高網絡風險等級，並實施全面的緩解措施，以防止在網絡安全領域的濫用。GPT-5.4 Thinking 的系統卡詳細說明了多層保護措施，包括拒絕機制、對有害輸出的監控，以及能力門檻的評估。儘管如此，該發布伴隨著對 OpenAI 合作夥伴關係和內部決策的更廣泛審查，但公司強調將持續遵循負責任部署的原則。

定價反映了模型的先進性和分層存取。標準 GPT-5.4 的 API 收費為每百萬輸入標記2.50美元，輸出部分收費更高，長上下文會話中超過272,000標記的提示則收取雙倍費用。GPT-5.4 Pro 收費較高，適合高性能需求。在微軟的整合產品如 Foundry 中，也採用類似的結構，並提供快取輸入折扣以鼓勵高效使用。這些費用主要針對專業和開發者用戶，他們能從增強的能力中獲益，而免費層的 ChatGPT 用戶則繼續使用較早或較輕量的模型。

此次發布的時機與 OpenAI 越來越頻繁的漸進式更新策略一致。在 GPT-5.3 Instant 發布僅數日後，GPT-5.4 展示了加快迭代的步伐，以保持在前沿 AI 領域的領導地位。分析師認為這是對競爭壓力和用戶反饋的戰略回應，旨在解決先前模型在實務工作流程中的限制。企業採用仍是重點，並推出如 Excel 和 Google Sheets 的金融插件、改進的文件處理和代理可靠性等功能，旨在幫助商業用戶提升生產力。

市場反響大多正面，開發者和專業人士在早期測試中反映出更流暢的編碼輸出、更精緻的知識工作，以及在受控演示中的代理行為效果。一些批評則集中在定價的可及性和在極端情況下的可靠性問題，但基準測試和初步實測都顯示出顯著進步。此次發布彰顯了2026年 AI 進展的快速步伐，月度或雙月的改進不斷重塑大型語言模型在專業環境中的應用預期。

展望未來，GPT-5.4 為 GPT-5 系列的進一步優化奠定了基礎。OpenAI 表示，Thinking 和 Instant 類模型可能會以不同的節奏演進，實現專業化而不破壞用戶體驗。隨著上下文窗口的擴大和代理功能的成熟，該模型家族有望在軟體開發、金融分析等行業推動更自主的系統。目前，GPT-5.4 提供了一個專注於效率、準確性和實用性的升級版本，適合處理複雜工作的用戶。

此發展鞏固了 OpenAI 在不斷演進的 AI 領域中的地位，專業級性能日益成為競爭優勢的關鍵。擁有存取權的用戶可以直接在 ChatGPT 或通過 API 探索這些變化，而在2026年3月5日公告後的數週內，對生產力、自動化和創新的更廣泛影響也將逐步展開。

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

6人按讚了這條動態

讚賞
6
3
轉發
分享

留言

0/400

ybaser

· 1小時前

2026 Go Go Go 👊

回復0

Ryakpanda

· 1小時前

2026衝衝衝 👊

查看原文回復0

小财神Plutus

· 2小時前

馬年大吉，發財發財😘

查看原文回復0

熱門話題
查看更多
#
2月非農意外負增長
90萬熱度
#
加密市場小幅下跌
470.01萬熱度
#
原油價格飆升
48.27萬熱度
#
美伊局勢影響
24.28萬熱度
#
黃金白銀走高
18.25萬熱度

熱門 Gate Fun
查看更多

1
666
666
市值:$2396.55持有人數:1
0.00%
2
arg
argentina
市值:$2420.68持有人數:1
0.00%
3
yisis
yisus
市值:$0.1持有人數:0
0.00%
4
SHIT
SHIT
市值:$0.1持有人數:1
0.00%
5
PTRX
PETRO EXCHANGE
市值:$2406.89持有人數:1
0.00%

#OpenAIReleasesGPT-5.4

熱門話題

2月非農意外負增長

加密市場小幅下跌

原油價格飆升

美伊局勢影響

黃金白銀走高

熱門 Gate Fun

666

666

arg

argentina

yisis

yisus

SHIT

SHIT

PTRX

PETRO EXCHANGE

置頂