鉅亨網新聞中心 2025-12-20 19:10

AI「規模法則」未死！Gemini核心大佬爆：Gemini 3正從「模型」進化為「系統」。(圖：Shutterstock)

Google 在大型語言模型領域正醞釀一場重磅變革。近日，Google DeepMind 的 Gemini 預訓練負責人 Sebastian Borgeaud 在首度接受採訪時釋出強烈訊號：未來一年，大模型將在「長上下文處理效率」與「長度擴展」兩大核心維度迎來技術重大創新。

Borgeaud 進一步分享，團隊近期在「注意力機制」上有了出乎意料的突破性觀察，這些發現很可能在接下來幾個月，重新定義他們的研究走向。

同時，他拋出一句令人印象深刻的觀點：「規模法則」並沒有走到盡頭，而是正在轉型進化。

Borgeaud 是 Gemini 3 預訓練階段的核心負責人，並在訪談中指出，Gemini 3 的巨大性能飛躍，並非源於單一的「秘密武器」，而是源自無數細微優化的聚合。

他強調，Google 的研究範式已發生根本性轉變：「我們不再僅僅是在構建一個模型，我們正在建構的是一個完整的系統。」

隨著 AI 發展進入「數據有限」的時代，過去那種單純依賴擴大數據集的粗放模式已走入瓶頸。未來的競爭焦點將轉向如何高效利用資源。

Gemini 3 採用的混合專家模型（MoE）架構，正是這一轉變的體現：從追求單純的「大」，轉向追求「大而高效」。

四大技術尖端重塑 AI 核心架構

展望未來幾個月的技術走向，Sebastian 點出了四個關鍵突破方向：

1. 長上下文的「工作台化」： Google 預計在未來一年內大幅提升長上下文的處理效率與長度。這將使模型從單純的「記憶」轉化為「數位工作台」，能同時分析整個代碼庫或海量科研論文，成為強大代理基礎。

2. 注意力機制的底層演進： Sebastian 爆料，研發團隊最近在注意力機制上有了「非常有趣的發現」，這可能在未來幾個月內重塑研究方向，顯著提升模型的推理與計算效率。

3. 檢索機制的原生回歸： 透過可微分的方式讓模型學會「查資料」，而非死記硬背。這能讓模型動態地從外部海量知識源獲取資訊，突破參數規模的限制。

4. 成本革命： 未來的研究將更加關注如何讓強大模型變得「便宜又好用」，以應對用戶激增帶來的部署成本挑戰。

Noam Shazeer 回歸後的冷思考：規模不再是神話

與此同時，Google 的工程師 Jeff Dean、Transformer 開創者 Noam Shazeer 與 Oriol Vinyals 也進行了對談。

其中， Shazeer 的觀點引發業界熱議。回歸 Google 後的他顯得更加冷靜，並為當前的 AI 熱潮潑了一桶冷水。

他幾乎不主動談「顛覆式創新」，也鮮少拋出令人熱血沸騰的宏大敘事；反而多次提到研發節奏的拿捏、系統運作的穩定性，以及如何讓模型能長時間、可靠地運行。

身為 Transformer 架構的關鍵奠基者，他曾親手推動大型模型從零開始的爆發式成長；然而在大型語言模型聲勢正盛之際，他卻選擇踩下煞車，提出警示：模型給出答案的速度越來越快，但自我檢查與反思的次數卻遠遠不夠。

他也曾在公開場合一再強調：「現在的模型並不缺乏『聰明』，真正不足的是持續推理、在複雜任務中反覆修正自身判斷的能力。」

換句話說，模型規模依然關鍵，但它已不再是左右一切的唯一指標。

當 Noam 談到「推理」時，焦點明顯從「能不能變得更強」轉向「能不能長期保持穩定」。

這也是他回到 Google 之後，首次在公開舞台上展現出這樣的判斷與立場。

這番話聽起來並非否定過去的路線，而更像是坦然承認一個現實：那條單靠不斷堆疊參數就能一路向前的成長曲線，正逐漸逼近它的極限。

頂尖科學家的共識：一次高分，無法定義 AI 的未來

Noam 在對談中提出了一個關鍵概念：慢思考（Slow Thinking）。

這並不只是把研發節奏放慢而已，而是要求團隊不斷回頭追問：這樣做值不值得？成本高不高？未來能不能被大規模複製與長期維持？

當討論走到這一步，所謂的「智慧」不再只是抽象的能力指標，而是一項必須長期投入的工程成本，需要像 CPU、儲存空間一樣，被正式納入帳本精算。

一旦跨出這道門檻，許多過去用來評估 AI 的指標，例如 Benchmark，也開始顯得力有未逮。

在整場會議中，三位頂尖科學家並沒有對排行榜表現出特別的興奮，也未曾用「誰贏了誰」來界定技術進展。

排行榜擅長捕捉瞬間的高光時刻，卻難以回答更關鍵的問題：系統能不能長時間穩定運作？

而 Noam 與 Jeff 反覆強調的，正是這些長期維度：模型是否可靠、是否具備遷移能力，以及能否在複雜任務中持續進行自我修正。

這些核心能力，很難被濃縮成一個漂亮、好看的數字，但它們，才是真正決定 AI 未來走向的關鍵。

Gemini 被視為一套系統，而不只是一個模型

在這場對談中，「系統」（System）一詞被反覆提及，顯然不是修辭上的巧合，而是一種刻意為之的定位。

Noam 與 Jeff 在談論 Gemini 時，刻意避開「更強大的模型」這類說法，反而一再強調，它是一個能長期運作、持續演進的完整系統。

乍聽之下，「系統」與「模型」似乎差別不大，但背後的思維邏輯卻截然不同。

所謂的「模型」，更像是一個階段性的成果，重視的是實驗室裡的即時表現；而「系統」則更接近基礎建設，關注的是穩定度、擴展性，以及在出錯時能否快速修復並持續運轉。

對 Noam 這類高度重視架構設計、研發節奏與工程限制的研究者而言，真正重要的從來不是某一次回應有多快，而是一個系統能否穩健地運行十年、甚至二十年。

在他們的視角裡，Gemini 不是用來證明勝負的戰利品，而是一種「可以長期使用」的智慧形態。

也因此，整場對談沒有急著端出產品式的宣傳語言，沒有劍拔弩張的「對標誰、打敗誰」。