庫克也按讚!DeepSeek震撼蔓延至矽谷之外 美國會辦公室收警告勿用
鉅亨網編譯陳韋廷 綜合報導 2025-01-31 15:30
近期橫空出世的 DeepSeek 是中國春節前的意外之喜,也對太平洋彼岸的美國科技公司與股市帶來持續震盪,該 AI 新創公司以低成本實現了突破,這一事件觸動了美國科技界的神經。
中國媒體《DeepTech》報導,若跟幾個月前的《黑神話 · 悟空》在歐美受到的追捧相比,DeepSeek 的出現可謂「石破天驚」,充滿了各種不可能、不合理。它講述了一個如何在層層封鎖、勁敵環伺背景下鐵樹生花的故事,讓美國精心設置的 AI 技術小院高牆出現坍塌風險。
蘋果執行長庫克在周四 (30 日) 財報電話會議上被問到如何看待 DeepSeek 時,庫克認為能提高效率的創新是一件好事。
DeepSeek-R1 大模型的出現確實引發矽谷的一場小型地震。華頓商學院教授 Ethan Mollick 對 R1 內部思考過程讚歎道:「DeepSeek 的原始思維鏈非常迷人。它真的讀起來就像一個人在大聲思考。 既迷人又奇特。」
著名風險投資人、Mosaic 瀏覽器共同發明人 Marc Andreessen 也說:「DeepSeek R1 是我見過的最令人驚歎和印象深刻的突破之一,作為開源專案,這是給世界的一份重要禮物。」
上周一 (20 日) 發布的 DeepSeek-R1 模型最重要的突破並非實現了與 OpenAI 的 o1 類似的能力,而是採用了不同的演算法策略。此前,幾乎所有的大模型都遵循著 ChatGPT 定下的模式,也就是先讓模型進行自我強化學習,再以人工參與的監督微調來進行改善。
然而,DeepSeek 透過改進強化學習演算法,實現了僅用強化學習就能實現接近於 o1 的推理能力,其模型甚至自己展現出反思能力,令研發人員直呼意外,而正是上述演算法層面的硬派創新,才讓 DeepSeek-R1 大幅節省算力成本,其 API 呼叫成本相比 OpenAI o1 降低了 90% 到 95%。
正如微軟 AI 前沿研究實驗室首席研究員 Dimitris Papailiopoulos 所說,DeepSeek-R1 最令人驚訝的是其工程簡單性。「DeepSeek 追求準確的答案,而不是詳細說明每個邏輯步驟,這顯著減少了計算時間,同時保持了高效率。」
但中國 AI 產品的後來居上之勢,讓美國人既感到震撼,又如坐針氈。
一些美國官員試圖把 DeepSeek 說成是對 OpenAI 技術的「偷竊」,卻無視 DeepSeek 採用創新演算法架構的事實,美國海軍則基於「潛在安全和道德問題」,要求人員避免以任何形式使用中國 DeepSeek 模型。今年春節期間,DeepSeek 受到大規模惡網攻擊,IP 位址都來自美國。
就在周四,美國指控 DeepSeek 偷竊資料。先是川普 AI 事務主管 David Sacks 聲稱有「確鑿證據」顯示 DeepSeek 利用了 OpenAI 模型的輸出資料,之後微軟研究人員也跳出來表示,與 DeepSeek 有關的人士曾在去年秋天使用 OpenAI 的 API 大規模擷取資料。
美媒《Axios》最新報導也指出,美國眾議院首席行政事務官向國會辦公室發出通知,警告國會辦公室不要使用 DeepSeek 的服務。「當前,DeepSeek 正接受首席行政事務官的審查,目前尚未授權眾議院正式使用該模型。」
- 如何發揮多重資產策略的最大優勢?
- 掌握全球財經資訊點我下載APP
延伸閱讀
下一篇