menu-icon
anue logo
熱門時事鉅亨號鉅亨買幣
search icon

美股

震撼全球AI界的DeepSeek-V3 竟是川普「晶片戰」意外產物

鉅亨網編輯林羿君 綜合報導 2025-01-03 13:48

cover image of news article
震撼全球AI界的DeepSeek-V3 竟是川普晶片戰意外產物。(圖:shutterstock)

中國 AI 創新公司 DeepSeek 日前發表開源全新 DeepSeek-V3 模型,耗時僅兩個月、訓練成本不到 600 萬美元,就足以與 ChatGPT 一較高下,撼動全球 AI 界。而中國這項技術的躍進,可能是川普第一任期對中國進行「晶片封鎖」下的產物。

DeepSeek-V3 這款高達 671B 的大模型,在預訓練階段只用了 2 個月、2048 張 H800 顯示卡及 557.6 萬美元。美國 CNBC 記者親自測試後,也驚呼 DeepSeek-V3 完全能和 OpenAI 掰手腕。OpenAI CEO 奧特曼也發推文按指「複製總比創新容易」。


這是繼電動車與消費品之後,中國團隊在 AI 領域再度上演了「成本屠夫」的好戲。

在外界看來,DeepSeek 在晶片效能較差、資金和 GPU 使用時間更少的情況下,依然能夠取得更好的表現。考慮到他們所面臨的 AI 硬體資源的限制,這項成就尤其值得關注。

2022 年 10 月,為阻止中國成為人工智慧與運算領域的超級大國,美國對中國實施了廣泛的晶片出口限制:這是中美之間持續進行的「晶片戰爭」中的眾多打擊之一。

這些晶片限制的初衷,目的是想透過掐住中國取得頂尖硬體的管道來限制中國在 AI 領域的發展。

DeepSeek-V3 的成功,可能預示著一個有趣的轉折:軟體創新正在突破硬體限制。這反倒讓美國限制中國的戰略變得很諷刺。如果軟體技術越來越強,那用什麼硬體可能都不重要了。

對於人工智慧產業而言,DeepSeek-V3 預示著大型語言模型開發方式可能迎來典範轉移。透過巧妙的工程設計和高效的訓練方法,前沿的人工智慧能力或許可以在不依賴龐大運算資源的情況下實現。隨著 DeepSeek-V3 的出現,市場變得更加多元化,為開發者、內容創作者甚至小型新創公司提供了更多選擇。

當然,如果未來 OpenAI、Meta 等公司利用更龐大的算力集群訓練出性能更為卓越的模型,行業可能會再次掀起對超大規模預訓練的熱潮。


Empty