大型語言模型
自 DeepSeek 橫空出世以來,中國 AI 產業版圖產生顯著變化。這不僅打破了過去中美大型語言模型主導的格局,也讓本土大型語言模型市場進入重新洗牌的階段。如今,包括字節跳動、阿里巴巴 (09988-HK) 、階躍星辰、智譜 AI 與 DeepSeek 等五家企業逐漸穩定成形,被外界視為中國 AI 領域的「五強格局」,產業正加速走向技術深化與應用落地的整合期。
A股
中國科技巨頭小米 (01810-HK) 日前在官方公眾號「Xiaomi MiMo」無預警宣布,正式開源旗下首款推理大型語言模型 MiMo-7B,消息一出震撼整個人工智慧(AI)社群。這款模型從開發到釋出過程全程保密,未曾流出任何消息。根據官方釋出的技術報告,MiMo-7B 僅使用 70 億參數,卻在兩大關鍵任務:數學推理與程式碼生成中,分別超越 OpenAI 的 o1-mini 以及阿里巴巴 (09988-HK) 320 億參數的 Qwen QwQ-32B-Preview。
美股雷達
路透周二 (11 日) 援引兩名知情人士消息報導,臉書母公司 Meta Platforms(META-US) 正在測試與台積電 (2330-TW)(TSM-US) 合作生產的自研人工智慧 (AI) 訓練晶片,目的是要降低對輝達 (NVDA-US) 的依賴、減少基礎設施成本。
科技
美媒《CNBC》周五 (14 日) 報導,隨著中國新創公司深度求索 (DeepSeek) 推出更便宜且高效的人工智慧 (AI) 模型,可能會重塑資料中心的需求,進一步促進這一已經蓬勃發展的行業。資料中心是數位轉型和大型語言模型 (LLMs) 訓練的核心基礎設施,分析師長期預測其將持續成長。
美股雷達
Alphabet 旗下的 Google 周三 (5 日) 宣布更新其 Gemini 系列的大型語言模型 (LLM),並推出一款全新的低成本人工智慧 (AI) 模型,以對抗來自中國競爭對手 DeepSeek 的低價產品。Google 現在提供多個版本的 Gemini 模型,根據價格和效能有所區別。
A股港股
人工智慧 (AI) 領域的發展日新月異,其中,大型語言模型 (LLM) 更是備受矚目。在這一領域中,一家名為 DeepSeek 的中國新創公司異軍突起,不僅在技術上取得了重大突破,更以其獨特的發展模式,引起美國矽谷的關注和震驚。據報導,訓練成本極低的「DeepSeek-V3」只用了 2048 張 H100 的 GPU 集群,且用時僅 53 天。