Ai2
科技
矽谷近日的 AI 重點聚焦在中國發展的 DeepSeek,不過,一家美國公司在中國過年期間,也發表了新的模型,並聲稱在多項 AI 基準測試中超越了 DeepSeek V3 和 GPT-4o。Allen Institute for AI (AI2) 發表 Tülu 3 系列模型,Tülu 3 系列包括多個版本, 8B、70B 和最新的 405B,其中 Tülu 3 405B 是目前最大規模的開源 AI 語言模型之一,並且首次應用了完整開放的後訓練 (Post-Training) 方法。
2025-02-05