menu-icon
anue logo
熱門時事鉅亨號鉅亨買幣
search icon

原生稀疏注意力





    2025-02-19
  • A股

    馬斯克 xAI 發布新一代聊天機器人 Grok 3 之後,DeepSeek 不甘示弱宣布推出用於超快速長文本訓練訓練與推理的「原生稀疏注意力」(Native Sparse Attention,簡稱 NSA)。DeepSeek 18 日在海外社交平台 X 上發佈了一篇純技術論文報告,稱 NSA 針對現代硬件進行了優化設計,能夠加速推理過程,同時降低預訓練成本,且不犧牲性能。