menu-icon
anue logo
熱門時事鉅亨號鉅亨買幣
search icon

開源周





  • DeepSeek 今 (27) 日又有大動作,推出並行計算優化三劍客 DualPipe、EPLB 以及 profile-data,其中一口氣開源兩項堪稱「AI 訓練加速神器」的技術,當中還有創辦人梁文鋒親自參與的 DualPipe 專案。專家認為,這對於動輒需要數百萬美元、耗時數月的大模型訓練來說是一劑「強心針」。






  • DeepSeek 在開源周第四天一連更新 DualPipe、EPLB 以及深入分析 V3/R1 模型中計算與通信重疊機制的優化並行策略等三項專案,讓大模型訓練更快,成本更低,還能保持頂尖性能,值得一提的是,DualPipe 是由 Jiashi Li、Chengqi Deng 和梁文峰共同研發。