menu-icon
anue logo
馬來西亞房產鉅亨號鉅亨買幣
search icon


美股

編程核彈!OpenAI正式發布GPT-5-Codex 獨立上工7小時絕不打混的工程師

鉅亨網新聞中心


OpenAI 周一 (15 日) 推出全新的 GPT-5-Codex,這是在 GPT-5 基礎上專門為軟體工程優化的版本,也是 Codex 有史以來最大的升級,被視為是全面對標 Claude code 的重要進展,但又與 Claude code 有顯著不同。

cover image of news article
(圖:REUTERS/TPG)

GPT-5-Codex 模型的上線是此次更新的核心,專門訓練於真實世界的複雜工程任務,包括從零建造專案、大規模重構、生成測試、調試和程式碼審查。它實現了運算資源的動態調度,可以獨立完成長達 7 小時的複雜重構任務。此外,Codex CLI 經過全面升級,重新設計並支援主流 IDE 插件,如 VS Code,深度整合 GitHub,實現雲端和本地環境的無縫切換。


在程式碼審查能力方面,GPT-5-Codex 能夠自動在 Pull Request 中發現關鍵漏洞,減少無效評論,並直接提出和實作修改建議。這次更新的目標是打造一個能夠深刻理解使用者工作上下文、與開發者並肩作戰的程式設計隊友。

GPT-5-Codex 經過專門訓練,具備更強的可引導性,能更精準地遵循 AGENTS.md 檔案中的指令,產生更高品質的程式碼。在關鍵基準測試中,GPT-5-Codex 的準確率達到 74.5%,超越了 GPT-5 的 72.8%。在極具挑戰性的程式碼重構任務中,其效能提升顯著,準確率從 33.9% 增加至 51.3%。一個典型的例子是,它成功處理了來自 Gitea 的 Pull Request,涉及修改 232 個檔案和 3,541 行程式碼。

GPT-5-Codex 也具備動態調整思考時間的能力,能夠根據任務複雜度動態調整運算資源。對於簡單請求,其回應非常迅速;而對於大型重構等複雜任務,它會投入更多時間進行持久、獨立的執行,測試結果顯示,GPT-5-Codex 能夠連續獨立工作超過 7 個小時,持續迭代方案並修復測試失敗。

在程式碼審查方面,GPT-5-Codex 擅長發現程式碼中的關鍵缺陷,能夠導航程式碼庫並執行程式碼和測試來驗證正確性。評估結果顯示,不正確評論的比例從 13.7% 降至 4.4%,而高影響力評論的比例從 39.4% 提升至 52.4%。這表明 GPT-5-Codex 更聚焦於提出關鍵、有價值的建議,避免資訊過載。

此外,Codex 的生態系統也獲得了全面更新。全新的 Codex CLI 支援附加和分享影像、智慧任務追蹤、強大的工具集和優化的終端 UI。 Codex 現已深入整合到開發者的 IDE 中,支援 VS Code 等,利用使用者已開啟的檔案和選取的程式碼,讓使用者以更短的提示獲得更快、更精準的結果。

使用者現在可以在 ChatGPT Plus、Pro、Business、Edu 和 Enterprise 訂閱方案中使用 GPT-5-Codex,使用額度根據方案不同而異。 Business 和 Enterprise 方案也提供購買額外積分或共享積分池的選項。 GPT-5-Codex 計畫很快透過 API 提供,具體詳情請參閱 OpenAI 的開發者文件。

總之,GPT-5-Codex 是一款旨在提升軟體開發效率和品質的強大工具,能夠在開發的任何地方工作,包括終端、IDE、網頁和 GitHub,大大提高了開發者的工作效率和信心。

文章標籤

section icon

鉅亨講座

看更多
  • 講座
  • 公告


    Empty
    Empty