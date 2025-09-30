鉅亨網編譯陳韋廷 2025-09-30 12:08

AI 研究專家 Julian Schrittwieser 近日撰文駁斥「AI 泡沫論」，警告當前對技術進展的質疑實為對指數級成長的誤判，跟新冠疫情初期對病毒傳播的忽視相似。

這位 Anthropic 研究員在個人部落格中發文指出，人們對 AI「平台期」或「泡沫」的唱衰，本質是低估了技術迭代的速度與潛力。

Schrittwieser 的核心論點來自兩項關鍵研究；一為獨立機構 METR 發布的《衡量 AI 完成長任務的能力》，數據顯示 AI 模型自主執行軟體工程任務的時長正以指數級速度翻倍。7 個月前的 Sonnet 3.7 模型以 50% 成功率完成 1 小時任務，而最新模型如 Grok 4、GPT-5 等，第二項關鍵研究為 OpenAI 的 GDPval 評估，該研究涵蓋 9 大行業 44 個職業，由平均 14 年經驗的行業專家提供任務，結果顯示頂尖 AI 在更廣泛經濟活動中「驚人接近」人類水平，Claude Opus 4.1 甚至幾乎跟行業專家表現一樣，GPT-5 亦緊隨其後。

Schrittwieser 在文中還特別肯定 OpenAI 發布第三方模型超越自家產品的評估，稱其體現「誠信與對有益 AI 的關切」。

針對「AI 僅擅長程式設計、易犯錯」的質疑，Schrittwieser 認為，目前模型在部分任務中的不完美，與早期人們對 AI 程式設計「科幻化」的否定如出一轍。

Schrittwieser 寫道：「因關注當下缺陷而斷言 AI 永難達標，是典型的自欺欺人。」

Schrittwieser 還說，新冠疫情初期對指數級傳播的忽視導致應對滯後，如今對 AI 指數進步的誤讀同樣危險。

基於數據外推，Schrittwieser 明確預測指出，若技術改進持續，2026 年中模型將能自主完成 8 小時工作日任務，到了明年底，至少一個模型將在多行業達到人類專家水平，2027 年底模型更將頻繁超越專家表現。

Schrittwieser 說：「未來模型可能比專家更好，通過推斷圖表直線預測，甚至比多數領域專家更準。」