【AI】字節跳動發布形式化數學推理專用模型Seed Pro…
經濟通新聞
《經濟通通訊社24日專訊》字節跳動Seed團隊宣布推出形式化數學推理專用模型Seed Prover 1.5。據介紹,相比上一代模型,Seed Prover 1.5在16.5小時內,針對IMO 2025的前5道題目生成了完整可編譯驗證的Lean證明代碼,換算成績為35╱42,達到此前IMO評分標準的金牌分數線。
對12道Putnam 2025賽題中的11道生成了可編譯驗證的Lean代碼。在更系統的評估中,該模型在完整的Putnam歷史評估集上解決了88%的問題,在代表碩士數學難度的Fate-H和代表博士生數學難度的Fate-X評估集上,分別解決了80%和33%的問題,刷新了形式化數學推理模型在這幾個評測集上的SOTA表現。
感興趣的數學和AI研究者體驗該模型。(wn)
- AI不炒夢!北祥科服明年拚上櫃
- 掌握全球財經資訊點我下載APP
文章標籤
- 講座
- 公告
上一篇
下一篇