雜誌

廣東小城高考狀元，意外造出中國AI界鯰魚DeepSeek！揭密深度求索梁文鋒：為何早在6年前密囤萬張輝達顯卡？

今周刊 2025-02-08 10:07

‌

撰文 ‧ 今周刊編輯團隊

cover image of news article — (圖:shutterstock)

「我們不是故意要成為一條鯰魚，只是，不小心成了一條鯰魚⋯⋯。」這是中國 AI 新創公司深度求索（DeepSeek）創辦人梁文鋒，在去年中接受中國媒體採訪時的一段談話。

‌

DeepSeek 與梁文鋒的故事，得先從廣東西南部的小城——湛江說起。

梁文鋒在 1985 年出生於廣東湛江吳川巿的一個小村落——米歷嶺村。據家鄉人的說法，梁文鋒自小就精通數理，初中時期就學完了高中數學，甚至開始自學大學的微積分等課程。

2002 年，梁文鋒以吳川一中「高考狀元」的成績，考上近年直追清華、北大，中國國內綜合排名長期位居前 5 的浙江大學，並在 2006 年及 2010 年，分別取得電子資訊工程和計算機科學的學士和碩士學位。

在美國次貸風暴席捲全球的 2008 年，還在攻讀碩士的梁文鋒，就投入探索「全自動量化交易」的可能性，並於日後成立對沖基金「幻方量化」，從幻方量化成立的第 1 年起，梁文鋒就意識到迫切需要更多的算力，投入 2 億元自主研發深度學習的訓練平台「螢火一號」。據稱，平台搭載了 1100 塊的 GPU 顯卡。

約當同時，梁文鋒開始大量囤積來自輝達的顯卡。在梁文峰參與的一篇技術論文裡寫道，幻方於 2021 年耗資 10 億元推出的改良版「螢火二號」，部署了多達 1 萬張的輝達 A100 顯卡。據中國業內人士估算，幻方的螢火超算平台，算力至少是同業平均的 10 倍以上。

2023 年 5 月，38 歲的梁文鋒宣布進軍 AGI；去年底發表的 DeepSeek-V3，該模型的效能不僅足以對標 OpenAI 最先進模型 GPT-4o，訓練成本更僅約 557.6 萬美元，用了僅約 20 分之 1 的算力資源，就達到了相同的效能。今年 1 月，DeepSeek-R1 模型的發布，更宛如在 AI 界投下一枚深水炸彈。

這家成立僅 1 年多的 AI 新創公司，為何能如此讓全球科技巨擘都為之震顫？或可從梁文鋒獨特的管理與用人哲學，窺探出一絲端倪。

「我們的核心技術職位，基本上以應屆和畢業 1、2 年的人為主。」梁文鋒曾表示，在招募人員上，他首重的是能力，至於經驗，反而是「扣分項」。

根據公開數據，DeepSeek 目前約 140 位的工程師團隊，幾乎清一色都是應屆畢業生或博士在讀生，「工作經驗在 3 到 5 年，已經是最多了，工作超過 8 年的，基本就 pass 了。」一名親近 Deepseek 的獵頭如此觀察。

不僅如此，招募新人時，DeepSeek 還非常看重他們在國際知名程式設計競賽的表現，「基本是『金獎』以下就不要了。」一名協力廠商指出。

梁文鋒除了提供比中國一線科技大廠更優渥的薪資待遇，他授權、無為的管理方式，更是留才關鍵。

「每個人都有自己獨特的成長經歷，都是自帶想法的，不需要 push 他⋯⋯，當一個 idea 顯示出潛力，我們也會自上而下地去調配資源。」梁文鋒曾在訪談中如此形容他的「不干預」哲學。

談及梁文鋒，不少員工對他的形容是，與其說他像個老闆，不如說他更像個「極客」（geek）。梁文鋒的日常，就是看論文、寫代碼、參與小組討論，是少有具備一線研究員能力的公司掌舵者。

梁文鋒曾感嘆，中國 AI 和美國的真正差距，是來自「原創和模仿」的差距。「如果這不改變，中國永遠只能是追隨者。」

如今，DeepSeek 火爆全球，微軟、輝達、亞馬遜等一線美國科技大廠，乃至中國的百度、阿里巴巴等，紛紛高調宣告擁抱 DeepSeek R1 的服務之際，梁文鋒孜孜矻矻追求的「硬派創新」夢想，或許，已在實現的道路上。

來源：《今周刊》第 1468 期
更多精彩內容請至《今周刊》

本文授權自今周刊，原文見此。

你可能也會感興趣》

蝦皮賣家崩潰告白，年營收近億卻失敗了... 他揭低價進中國貨陷阱「剛開始一兩件賺很爽」，為何後來根本賺不到錢？

台積電股價可能跌到 977 元以下、金融股獲利也將大打折？孫慶龍：應等合理價位再進場

掌握全球財經資訊點我下載APP

文章標籤

趨勢分析今周刊輝達 DeepSeek 梁文鋒

延伸閱讀

‌