menu-icon
anue logo
熱門時事鉅亨號鉅亨買幣
search icon

A股港股

【AI】李飛飛團隊報告:中美AI模型性能差距縮至最小0.3

經濟通新聞 2025-04-10 10:22


  《經濟通通訊社10日專訊》由「AI教母」李飛飛領銜的斯坦福大學人工智能研究所近日發布了最新一期《2025年人工智能指數報告》。長達456頁的報告當中提到,美國在生產頂級AI模型上依然保持領先地位,但中美AI模型性能差距正大幅和迅速縮小。

 

  報告指,2023年,美國領先模型的表現還顯著優於中國同行。在LMSYS聊天機器人競技場中,2024年1月,美國頂級模型的表現比最佳中國模型高出9.26%。到2025年2月,這一差距縮小至僅1.7%。而在MMLU、MMMU、MATH和HumanEval等大模型常見的基準測試中,截至2024年底,中美之間的差異從2023年底的17.5、13.5、24.3和31.6個百分點顯著縮小至0.3、8.1、1.6和3.7個百分點。

 


*阿里成全球重要AI模型第三貢獻者*

 

  報告並提到,2023年掀起的「百模大戰」已走向收斂,重要的AI大模型數量由2023年的105個減少至2024年的61個,明顯減少。報告還羅列了2024年在生產

重要AI模型方面處於領先地位的組織,主要貢獻者的前三名分別為OpenAI(7個模型)、谷歌(6個)和阿里巴巴(4個)。

 

  報告又指,近年前沿的人工智能模型性能趨於一致,多家供應商都提供了功能強大的模型。

除了OpenAI和谷歌外,近年來湧入了一批新的玩家,如Meta的Llama模型、Anthropic的Claude模型、DeepSeek的V3和R1模型、xAI的Grok模型等,前沿模型之間的差距不斷縮小,人工智能領域的競爭越來越激烈。

 

  而隨著DeepSeek掀起了模型開源的浪潮,業內對於開源與閉源之間的態度正在發生變化。在LMSYS聊天機器人競技場排行榜上,2024年1月初,領先閉源模型的表現比頂級開源模型高出8.0%。到2025年2月,這一差距已縮小至1.7%。(sl)

文章標籤


Empty