金色財經
來源:Nathan Lambert,Allen Institute for AI研究員、;編譯:金色財經Claw
從杭州到上海的高鐵上,望着窗外,映入眼簾的是層巒疊嶂的山脊線——風力渦輪機點綴其間,在夕陽餘暉中勾勒出剪影。山巒之間,廣袤的田野與林立的摩天大樓交相輝映。
我帶着深深的謙遜之心從中國歸來。走進一個如此陌生的地方,卻受到如此熱情的歡迎,這是一段令人心暖的人文體驗。我有幸結識了許多此前只能遠觀的AI生態圈中的人們,他們以燦爛的笑容和熱情迎接我,讓我深切感受到我的工作與整個AI生態系統的全球性。
中國AI公司在大語言模型領域天然具備"快速跟隨者"的優勢——這既源於中國在教育與工作上歷久彌深的文化傳統,也得益於其在構建科技公司方面獨特而微妙的方式。
從產出來看,無論是支撐智能體工作流的最新大模型,還是優秀的科學家、海量的數據與強大的算力這些核心要素,中美兩國的實驗室看起來大同小異。真正持久的差異,體現在組織方式與內在驅動力上。
我長期以來認為,中國實驗室之所以能夠如此出色地追趕並保持在前沿水平,部分原因在於其文化與這一使命高度契合。但在未曾與人深入交流之前,我並不覺得貿然將這一直覺歸因於文化是恰當的。與中國頂尖實驗室眾多優秀、謙遜而坦誠的科學家們的對話,使我的許多判斷得以清晰成型。
當今構建最優秀大語言模型的核心,在於對整個技術棧的精細打磨——從數據到架構細節,再到強化學習算法的實現,無一不需要一絲不苟。模型的每一個環節都有提升空間,而將它們有機融合是一個極為複雜的過程:某些天才個體的工作成果,往往需要為整體模型的多目標優化讓路。
美國研究人員在攻克各個單項難題上固然才華橫溢,但美國文化中有一種更強烈的自我表達傾向。作為科學家,為自己的工作發聲往往更容易獲得成功,而當下盛行的"頂尖AI科學家"明星效應更是推波助瀾。這就產生了直接的衝突。據廣泛傳聞,Meta的Llama團隊正是在這種利益驅動下的派系政治壓力中走向瓦解。我也曾聽聞某些實驗室不得不"打點"某位頂級研究員,才能讓其停止抱怨自己的想法未被最終模型採納。不管細節是否屬實,這背後的邏輯是清晰的:自我與對職業晉升的執念,確實會妨礙最優模型的誕生。中美兩國在這種文化氛圍上哪怕只有細微的偏移,也可能對最終產出產生實質性的影響。
這與中國模型的構建者群體密切相關。在中國各大實驗室,有一個顯而易見的現實:核心貢獻者中有相當大比例是在讀學生。這些實驗室都非常年輕,讓我想起Ai2的運作方式——在那裡,學生被視為同等級別的夥伴,直接融入大語言模型團隊。這與美國頂尖實驗室的做法截然不同:OpenAI、Anthropic、Cursor等公司根本不提供實習機會。其他公司如谷歌名義上提供與Gemini相關的實習,但許多人擔心實習項目會被隔離在核心工作之外。
總結一下這種文化上的細微差異如何提升模型構建能力:
更願意從事不那麼光鮮的工作,以此改進最終模型;
初入AI領域的人沒有歷史包袱,不受此前AI炒作周期的束縛,能夠更快地適應現代新技術(事實上,我交流過的一位中國科學家非常主動地將此視為自身優勢);
更少的自我意識使組織架構得以適度擴張,因為少了對規則的鑽營投機;
充沛的人才儲備,擅長在已有概念驗證的基礎上解決問題。
這種更傾向於契合當今語言模型構建所需技能的特質,與一個廣為人知的刻板印象形成了對比——即中國研究人員在開創性的、從零到一的學術研究方面往往較為遜色。在我們訪問的偏學術型實驗室中,許多負責人都談到了如何培育更具抱負的研究文化。與此同時,一些技術領導者對這種科研方式的短期內重塑持懷疑態度,認為這需要對教育和激勵體系進行徹底改革,而這一變革在當前經濟均衡下規模太大,難以在近期實現。這種文化正在培養出在大語言模型構建上極為出色的學生和工程師,而且數量極為充沛。
這些學生也告訴我,中國正在經歷與美國類似的"人才虹吸"現象——許多此前考慮走學術道路的人,如今選擇留在工業界。最妙的一句話,來自一位本想當教授、希望與教育體系保持緊密聯繫的研究員。他感慨道,教育已經被大語言模型解決了——"學生為什麼還要來找我!"
學生們的優勢在於,他們是以全新的眼光看待大語言模型的。過去幾年,大語言模型的核心範式經歷了從規模化混合專家模型(MoE),到規模化強化學習,再到賦能智能體的幾次重大轉變。要在每一次轉變中做到出色,都需要迅速消化海量資訊——既來自更廣泛的學術文獻,也來自公司內部的技術棧。學生們已經習慣了這一點,他們樂於謙遜地放下一切先入為主的假設,一頭扎進去,全身心投入,只為爭取到一個能夠改進模型的機會。
這些學生還有一種令人印象深刻的直接與純粹,少了許多可能分散科學家注意力的哲學性閒談。當我追問他們對AI經濟影響或長期社會風險的看法時,鮮有中國研究人員持有深思熟慮的觀點,也少有人熱衷於在這些議題上施加影響。他們的使命,就是構建最好的模型。
這種差異是微妙的,容易被忽視,但在與某位表達能力極強、英語流利的優秀研究員進行深入交流時,會有最直接的感受——當話題轉向AI更宏觀的哲學層面,對方往往只是簡單地面露困惑,仿佛這是一個分類錯誤的問題。一位研究員甚至引用了Dan Wang關於"中國由工程師治理,而美國由律師治理"的著名論斷,來強調自己專注於建造的心志。在中國,沒有像Dwarkesh或Lex那樣能夠系統性地為科學家打造明星光環的主流媒體平台。
試圖讓中國科學家就人工智慧引發的未來經濟不確定性、超越簡單通用人工智慧(AGI)能力範圍的問題,或關於模型行為方式的道德辯論發表評論,都暴露了這些科學家的成長經歷和教育背景(5月7日編輯 :在原文的這一段中,我錯誤地將不願談論更廣泛的問題歸因於謙遜,謙遜當然可能起到一定作用,但這種習慣也受到他們所受訓練和成長的體系的影響,他們在這個體系中取得了成功,並且擅長駕馭它。我刪除了以下內容:……展現這些科學家的成長經歷和教育背景,以及他們極其謙遜的品質。這不僅僅是對工作的奉獻,他們也不願對不了解的問題發表評論……)。他們對工作極其投入,但成長在一個不鼓勵就社會結構和變革展開辯論和發表意見的體制中。
從宏觀層面看,北京與灣區頗為相似——步行或打個車,就能到達另一家具有競爭力的實驗室。我下了飛機,在去酒店的路上順路拜訪了阿里巴巴的北京園區。此後短短36小時內,我們又接連走訪了智譜AI(Z.ai)、月之暗面(Moonshot AI)、清華大學、美團、小米和零一萬物(01.ai)。滴滴出行方便快捷,選擇XL車型時,常常配備的是帶有按摩椅的電動小型廂式貨車。我們向研究人員問及人才爭奪戰,他們表示與美國的情況非常相似:研究員跳槽早已是家常便飯,去哪裡往往取決於當下哪家公司的氛圍最好。
在中國,大語言模型社區更像一個生態系統,而非相互廝殺的部落。在許多非正式的私下交流中,彼此之間滿是對同行的尊重。所有中國實驗室都對字節跳動的熱門模型豆包(Doubao)心懷敬畏——它是中國唯一一個前沿閉源實驗室。與此同時,所有實驗室都對DeepSeek推崇備至,視其為在研究品味與執行力上最為出色的實驗室。DeepSeek引領方向,卻並不具備贏得市場的商業體量。
相比之下,在美國與實驗室成員私下交流時,火藥味往往很快就上來了。中國研究人員之所以令人印象深刻,還有一點在於:他們常常對商業問題輕描淡寫,表示"那不是我的問題"。而在美國,似乎每個人都對各種生態系統級別的產業趨勢——從數據銷售到算力或融資——念念不忘。
如今,構建一個AI模型之所以如此引人入勝,正是因為它不再只是把一群優秀研究員聚在一棟樓里、打造出一個工程奇蹟那麼簡單。這曾經是過去的模式,但要維繫AI業務,大語言模型正在演變為構建、部署、融資與獲取用戶的綜合體。領先的AI公司存在於複雜的生態系統之中,資金、算力、數據等各類要素匯聚其中,共同推動前沿的持續突破。
對於西方生態系統(以Anthropic和OpenAI為代表),這些要素如何整合以創建和維繫大語言模型,已經有了相當成熟的概念框架。因此,找到中國實驗室在思維方式上的重大差異,恰恰指向了不同公司在押注未來方向上的實質性分歧。當然,這些未來在很大程度上也受到資金和算力約束的左右。
以下是我與這些實驗室交流後,在"AI產業"層面得出的最重要觀察:
1、國內AI需求初現端倪。有一種廣為流傳的假設認為,中國AI市場規模將相對有限,因為中國企業歷來不傾向於為軟體付費,難以催生支撐實驗室營運的大規模推理市場。但這一論斷僅適用於映射至SaaS生態系統的軟體支出——而SaaS在中國曆史上本就體量較小;另一方面,中國顯然存在規模可觀的雲市場。一個關鍵的未解之問——中國實驗室內部對此也爭論不休——是AI領域的企業支出,究竟會跟隨SaaS市場(體量小)的軌跡,還是雲市場(基礎設施級別)的邏輯?總體感覺是,AI正在向雲的方向靠攏,沒有人對圍繞新工具成長起來的市場感到悲觀。
2、大多數開發者都是Claude的忠實用戶。中國的大多數AI開發者對Claude痴迷不已,深感其改變了他們構建軟體的方式——儘管Claude在名義上在中國遭到封鎖。中國曆史上不願為軟體付費這一事實,並不讓我認為推理需求不會迎來大幅增長。中國技術人員如此務實、謙遜、積極進取——這一特質似乎比任何歷史消費習慣都更有說服力。部分中國研究員提到會用Kimi或GLM的CLI等本土工具,但所有人都提到了使用Claude。令人意外的是,Codex幾乎鮮有提及,而它在灣區的人氣顯然正在急劇攀升。
3、中國公司具有強烈的技術自主意識。中國文化正與澎湃的經濟引擎相結合,催生出難以預測的結果。我有一種揮之不去的感受:眾多AI模型折射出的,是中國眾多科技企業當下務實而現實的生存狀態,背後並無什麼宏觀統籌的藍圖。這個行業以對字節跳動和阿里巴巴的敬畏為基調——這兩家巨頭憑藉雄厚資源,被普遍認為將在各大市場占據主導地位。DeepSeek是公認的技術領頭羊,但遠未成為市場領導者:它引領方向,卻並不具備贏得經濟博弈的體量。
這就給美團、螞蟻集團等公司留下了空間——西方人有時會對它們也在構建自己的大模型感到驚訝。事實上,它們將大語言模型視為未來技術產品的核心底座,因此必須打好這個基礎。通過微調通用基礎模型,開放社區能夠提供反饋,使其技術棧更加穩固,同時保留用於自身產品的內部專屬微調版本。行業內盛行的"開放優先"心態,在很大程度上出於實用主義考量:幫助模型獲得有力反饋,回饋開源社區,並藉此更深入地理解自己的模型。
4、政府扶持確實存在,但力度仍不明朗。外界常常斷言,中國政府正在積極助推開放大語言模型競賽。然而,這個政府的權力結構是分散的,各層級對於自身該如何介入並無清晰的行動手冊。北京的各個街道辦事處甚至相互競爭,爭取科技公司在其轄區落地辦公。政府提供的"幫助"幾乎可以肯定涉及簡化審批等行政流程的疏通,但究竟能延伸多遠?政府的各個層級能否協助招募人才?能否協助走私晶片?在整個訪問過程中,政府關注或介入的話題多次被提及,但細節太過零散,不足以形成有據可查的斷言,也無法構建一個關於政府如何左右中國AI走向的自洽世界觀。當然,也沒有任何跡象表明,中國政府的高層曾對模型的任何技術決策施加影響。
5、數據行業遠未成熟。此前已聽聞Anthropic或OpenAI為單個訓練環境支出逾1000萬美元,每年在強化學習前沿探索上的累計花費高達數億美元。因此,我們迫切想了解:中國實驗室是否在從美國公司採購同類環境,還是已有一套鏡像的國內生態系統加以支撐?得到的答案並非"完全沒有數據行業",而是:他們的經驗表明,國內數據行業的質量相對有限,自建環境或數據往往是更優選擇。研究人員自己要花費大量時間搭建強化學習訓練環境,而字節跳動、阿里巴巴等大型公司則擁有內部的數據標註團隊予以支撐。這一切都與前述"自建而非外購"的思維定勢一脈相承。
6、對Nvidia晶片的渴望如饑似渴。Nvidia算力是訓練領域的黃金標準,所有人的進展都因算力不足而受限。若供貨無虞,他們顯然會毫不猶豫地大量採購。其他加速器——包括但不限於華為——在推理應用上普遍獲得正面評價。無數實驗室都已接入華為晶片。
以上這些特點,共同描繪出一幅與西方截然不同的AI生態圖景。若將西方實驗室的運作模式簡單套用到中國同行身上,往往會產生"分類錯誤"的誤判。最關鍵的問題在於:這兩種不同的生態系統,最終是否會孕育出實質上有所差異的模型類型?還是說,中國模型終將只是對3至9個月前美國前沿模型的追隨與重複?
踏上這趟旅程之前,我深知自己對中國了解甚少,而歸來時,卻只感到自己剛剛開始入門。中國不是一個能用規則或配方來概括的地方,它有著截然不同的運作動力與化學反應。這裡的文化古老而深邃,至今仍與國內技術的構建方式深度交融。我還有太多需要學習。
當前美國的諸多權力結構,都將各自對中國的固有認知作為重要的決策參照。然而,在親身與中國幾乎所有主要AI實驗室進行了正式或非正式的對話之後,我深感中國有太多特質和直覺,是西方的決策框架難以有效建模的。即便直接追問這些實驗室為何選擇開放發布頂級模型,"技術所有權意識"與"真心支持生態"之間的內在邏輯,我仍難以完全貫通。
這裡的實驗室務實而靈活,並不是開源的絕對主義者——並非每一個構建的模型都會公開發布——但他們在支持開發者、反哺生態,以及藉此深入理解自身模型方面,有著深刻而刻意的用心。
幾乎每一家中國主要科技公司都在構建自己的通用大語言模型,美團(外賣平台)和小米(綜合消費電子公司)發布開放權重模型便是例證。同等規模的美國公司,大概只會選擇直接採購服務。這些公司構建大語言模型,並非為了追趕時髦、刷存在感,而是源於一種對掌握自身技術棧、把握時代最核心技術的深切渴望。當我從筆記本電腦前抬起頭,視野中總是橫亘着一片吊車的天際線——這與中國更廣泛的文化氣質和建造熱情,形成了再自然不過的呼應。
中國研究人員的人情味、魅力與真誠的熱情,極具人文感召力。在個人層面,我們在美國早已習以為常的那種劍拔弩張的地緣政治敘事,在他們身上絲毫未見。這份簡單的正向能量,是世界需要更多的東西。作為AI社區的一員,我目前更擔憂的,是社區內部成員與群體之間,以國籍為標籤而產生的裂痕。
坦率地說,我希望美國實驗室在AI技術棧的每個維度都保持清晰的領先地位——尤其在我深耕其中的開放模型領域——我是美國人,這是我真實的偏好。但與此同時,我也希望開放生態系統本身能夠在全球範圍內蓬勃生長,因為這可以為世界創造更安全、更普惠、更有價值的AI。而眼下的問題是,美國實驗室是否願意邁出那一步,去贏得並守住這個領導地位。
就在完成這篇文章之際,又有傳言湧現,稱美國總統行政令可能對開放模型施加影響,這將進一步複雜化美國領導力與全球生態系統之間的協同關係——這讓我難以樂觀。
感謝所有在月之暗面、智譜、美團、小米、通義千問、螞蟻靈犀、零一萬物等機構慷慨與我交流的朋友們。每一位都如此熱情好客,如此大方地給予時間。我會持續分享對中國的思考,隨著認識的深化,涵蓋文化與AI兩個維度。有一點毋庸置疑:這些認知,將與AI前沿發展的宏觀敘事直接相關。
來源:金色財經
發佈者對本文章的內容承擔全部責任
在投資加密貨幣前,請務必深入研究,理解相關風險,並謹慎評估自己的風險承受能力。不要因為短期高回報的誘惑而忽視潛在的重大損失。
暢行幣圈交易全攻略,專家駐群實戰交流
▌立即加入鉅亨買幣實戰交流 LINE 社群(點此入群)
不管是新手發問,還是老手交流,只要你想參與加密貨幣現貨交易、合約跟單、合約網格、量化交易、理財產品的投資,都歡迎入群討論學習!
下一篇