美股

Meta技術長：六個月前就預測到DeepSeek的發展

鉅亨網編譯陳又嘉 2025-02-05 07:02

‌

矽谷因 DeepSeek 掀起波瀾感到不安？Meta(META-US) 技術長 Andrew Bosworth 表示，早在六個月前，他就預測到了這類 AI 發展。

據外媒報導，Bosworth 的 Instagram 追蹤者在周一 (3 日) 詢問他對這家備受關注的中國 AI 實驗室的看法時，他表示，「這發展過程相當有趣。」

‌

Bosworth 在 Instagram 限時動態中說道，「其實我有封電子郵件，證明我在六個月前就預測這類技術會出現，只是不知道會是 DeepSeek。」

「所以，對於我們這些身處業界的人來說，並不如外界的人想像得那麼驚訝。」

DeepSeek 近期推出了其旗艦開源 AI 模型 R1，該模型與 OpenAI 的 o1 模型相媲美，但據稱研發成本低得多。

Bosworth 表示，「我們在 DeepSeek 正式發布前一個月就已經在關注它，後來它成了重大新聞。」「我認為這件事既重要，但又沒有外界渲染得那麼誇張。」

Meta 同樣採取開源策略，允許符合資格的研究人員存取其 Llama AI 模型的個別權重，即 AI 模型在訓練過程中學習到的數值參數。

Bosworth 表示，DeepSeek 的發布是一件「很重要的事，因為這代表開源創新的大幅進步。」他補充道，「他們在模型構建的記憶架構方面做出了一些偉大且新穎的工作，確實推進了推理模型的技術前沿，並且可能透過蒸餾 (distilling) 現有模型來取得進展。」

但他認為 DeepSeek 的發展「值得關注，但稱不上改變世界。」

在 Meta 最近的財報電話會議上，執行長祖克柏 (Mark Zuckerberg) 表示，DeepSeek 確實有「一些創新的技術」，Meta「仍在消化」其影響。

祖克柏談到，「他們的技術有值得學習的地方，我們也希望能將其應用到我們的系統中，這就是這個領域的運作方式，無論這是一家中國競爭對手與否。」

儘管 DeepSeek 展現的成本效益，引發華爾街對科技巨頭在 AI 基礎建設及先進輝達 (Nvidia)(NVDA-US) 晶片上的巨額投資產生質疑。祖克柏表示，Meta 不太可能因此改變其 AI 投資策略，並預計長期內將在 AI 基礎設施上投入數千億美元。

祖克柏表示，「目前來說，對於這對我們基礎建設、資本支出等方面的影響，還很難有明確結論。」

Meta 首席 AI 科學家 Yann LeCun 最近在 Threads 發文稱，DeepSeek 的推出顯示「開源模型正在超越專有模型。」

另一方面，當被問及 DeepSeek 以及開源釋出 AI 模型權重與研究成果的做法時，OpenAI 執行長 Sam Altman 表示，他正在考慮調整策略。

Altman 表示，「是的，我們正在討論。」「我個人認為，在這方面我們站錯了歷史的一邊，必須想辦法制定不同的開源策略。但 OpenAI 內部並非所有人都認同這個觀點，而且這目前也不是我們的首要任務。」

‌