Transformer
近日,DeepSeek AI 團隊在梁文鋒的帶領下發表了一項突破性研究,提出名為「條件記憶」的全新稀疏性維度,透過創新的 Engram 模組有效解決了 Transformer 模型在知識檢索方面的固有低效問題。該研究為大模型架構設計開啟了與混合專家模型 (MoE) 互補的新方向。
國際政經
在 AI 範式加速轉變的背景下,2025 全球機器學習技術大會將於 10 月 16 日至 17 日在北京威斯汀酒店隆重召開。這項盛會將匯集 Transformer 共同發明人、OpenAI 科學家 Lukasz Kaiser 等 50 餘位頂尖專家,共同探討推理模式的歷史、現況與未來。
2026-01-13
2025-09-23