【AI】李飛飛團隊報告:中美AI模型性能差距縮至最小0.3
經濟通新聞 2025-04-10 10:22
《經濟通通訊社10日專訊》由「AI教母」李飛飛領銜的斯坦福大學人工智能研究所近日發布了最新一期《2025年人工智能指數報告》。長達456頁的報告當中提到,美國在生產頂級AI模型上依然保持領先地位,但中美AI模型性能差距正大幅和迅速縮小。
報告指,2023年,美國領先模型的表現還顯著優於中國同行。在LMSYS聊天機器人競技場中,2024年1月,美國頂級模型的表現比最佳中國模型高出9.26%。到2025年2月,這一差距縮小至僅1.7%。而在MMLU、MMMU、MATH和HumanEval等大模型常見的基準測試中,截至2024年底,中美之間的差異從2023年底的17.5、13.5、24.3和31.6個百分點顯著縮小至0.3、8.1、1.6和3.7個百分點。
*阿里成全球重要AI模型第三貢獻者*
報告並提到,2023年掀起的「百模大戰」已走向收斂,重要的AI大模型數量由2023年的105個減少至2024年的61個,明顯減少。報告還羅列了2024年在生產
重要AI模型方面處於領先地位的組織,主要貢獻者的前三名分別為OpenAI(7個模型)、谷歌(6個)和阿里巴巴(4個)。
報告又指,近年前沿的人工智能模型性能趨於一致,多家供應商都提供了功能強大的模型。
除了OpenAI和谷歌外,近年來湧入了一批新的玩家,如Meta的Llama模型、Anthropic的Claude模型、DeepSeek的V3和R1模型、xAI的Grok模型等,前沿模型之間的差距不斷縮小,人工智能領域的競爭越來越激烈。
而隨著DeepSeek掀起了模型開源的浪潮,業內對於開源與閉源之間的態度正在發生變化。在LMSYS聊天機器人競技場排行榜上,2024年1月初,領先閉源模型的表現比頂級開源模型高出8.0%。到2025年2月,這一差距已縮小至1.7%。(sl)
- 貿易戰再起 新興市場債券還能投資嗎?
- 掌握全球財經資訊點我下載APP
文章標籤
上一篇
下一篇