Meta技術長:六個月前就預測到DeepSeek的發展
鉅亨網編譯陳又嘉 2025-02-05 07:02
矽谷因 DeepSeek 掀起波瀾感到不安?Meta(META-US) 技術長 Andrew Bosworth 表示,早在六個月前,他就預測到了這類 AI 發展。
據外媒報導,Bosworth 的 Instagram 追蹤者在周一 (3 日) 詢問他對這家備受關注的中國 AI 實驗室的看法時,他表示,「這發展過程相當有趣。」
Bosworth 在 Instagram 限時動態中說道,「其實我有封電子郵件,證明我在六個月前就預測這類技術會出現,只是不知道會是 DeepSeek。」
「所以,對於我們這些身處業界的人來說,並不如外界的人想像得那麼驚訝。」
DeepSeek 近期推出了其旗艦開源 AI 模型 R1,該模型與 OpenAI 的 o1 模型相媲美,但據稱研發成本低得多。
Bosworth 表示,「我們在 DeepSeek 正式發布前一個月就已經在關注它,後來它成了重大新聞。」「我認為這件事既重要,但又沒有外界渲染得那麼誇張。」
Meta 同樣採取開源策略,允許符合資格的研究人員存取其 Llama AI 模型的個別權重,即 AI 模型在訓練過程中學習到的數值參數。
Bosworth 表示,DeepSeek 的發布是一件「很重要的事,因為這代表開源創新的大幅進步。」他補充道,「他們在模型構建的記憶架構方面做出了一些偉大且新穎的工作,確實推進了推理模型的技術前沿,並且可能透過蒸餾 (distilling) 現有模型來取得進展。」
但他認為 DeepSeek 的發展「值得關注,但稱不上改變世界。」
在 Meta 最近的財報電話會議上,執行長祖克柏 (Mark Zuckerberg) 表示,DeepSeek 確實有「一些創新的技術」,Meta「仍在消化」其影響。
祖克柏談到,「他們的技術有值得學習的地方,我們也希望能將其應用到我們的系統中,這就是這個領域的運作方式,無論這是一家中國競爭對手與否。」
儘管 DeepSeek 展現的成本效益,引發華爾街對科技巨頭在 AI 基礎建設及先進輝達 (Nvidia)(NVDA-US) 晶片上的巨額投資產生質疑。祖克柏表示,Meta 不太可能因此改變其 AI 投資策略,並預計長期內將在 AI 基礎設施上投入數千億美元。
祖克柏表示,「目前來說,對於這對我們基礎建設、資本支出等方面的影響,還很難有明確結論。」
Meta 首席 AI 科學家 Yann LeCun 最近在 Threads 發文稱,DeepSeek 的推出顯示「開源模型正在超越專有模型。」
另一方面,當被問及 DeepSeek 以及開源釋出 AI 模型權重與研究成果的做法時,OpenAI 執行長 Sam Altman 表示,他正在考慮調整策略。
Altman 表示,「是的,我們正在討論。」「我個人認為,在這方面我們站錯了歷史的一邊,必須想辦法制定不同的開源策略。但 OpenAI 內部並非所有人都認同這個觀點,而且這目前也不是我們的首要任務。」
- 如何發揮多重資產策略的最大優勢?
- 掌握全球財經資訊點我下載APP
延伸閱讀
上一篇
下一篇