推理
隨著中國與美國在人工智慧(AI)領域的競爭日益激烈,AI 代理(AI agents)正迅速成為下一個重要戰場。這類技術能自動完成既定任務,被視為改變企業與消費市場的關鍵力量。而中國或將憑藉大幅低於美國的運算推理成本,搶得先機。巴克萊分析師在最新報告中指出:「中國企業和消費者對 AI 代理的採用速度,可能比美國等其他市場更快,因為中國的推理成本比美國低約 90%。
摩根士丹利最新報告指出,AI 推理不僅是一場技術革命,更是一門可以精確計算且回報豐厚的生意。報告對標準的「AI 推理工廠」進行建模,發現無論是輝達 (NVDA-US) 、Google(GOOGL-US) 、亞馬遜 (AMZN-US) ,還是華為的晶片,都能取得可觀利潤,平均毛利率超過 50%。
先進 AI 模型真能達到博士級推理水準嗎?谷歌、OpenAI 旗下模型先前雖在數學奧林匹克 (IMO) 測試中斬獲金牌,讓不少人認為大語言模型 (LLM) 或許已具備攻克博士級科研難題的推理能力,但現實或許並非如此樂觀。AI 媒體《機器之心》報導,專注於超智慧和高級 AI 系統研究的機構 AA-I Technologies,近期推出名為 FormulaOne 的新基準測試,讓一票大模型集體「翻車」。
科技
今年,全球自然語言處理領域的頂級會議 ACL 公布了最佳論文,由 DeepSeek 與北京大學聯合完成的《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》一文斬獲「最佳論文獎」。
美股雷達
IBM(IBM-US) 周二 (8 日) 發表全新一代資料中心晶片與伺服器產品「Power11」,主打比競爭對手更節能、並簡化企業導入人工智慧 (AI) 的流程。這是 IBM 自 2020 年以來首次對其 Power 系列進行重大升級。Power 晶片多年來在資料中心領域與英特爾 (INTC-US)、超微 (AMD-US) 競爭,特別是在金融、製造與醫療等專業領域擁有穩定客群。
美股雷達
OpenAI 開源模型將延後發布。OpenAI 執行長奧特曼(Sam Altman)日前在社群平台 X 上宣布,原定於 6 月初夏問世的 OpenAI 開源 AI 模型,將延後至今年夏末才正式推出。Altman 強調,這款「開放 AI 模型」近期在內部研發中出現了「令人意外且驚豔的進展」,雖然還需更多時間完善,但成果「非常值得等待」。
美股雷達
OpenAI 於週二(10 日)正式推出最新 AI 模型 「o3-pro」,並宣稱這是他們目前為止最強大的推理 AI 模型,超越 o1-pro、Gemini 2.5 Pro 與 Claude 4 Opus。o3-pro 是先前已發布的 o3 推理模型的升級版本,具備更精準的邏輯思考能力,特別適用於物理、數學與程式設計等嚴謹的應用領域。
美股雷達
蘋果近期發表一項具指標性的 AI 研究報告,震撼揭露目前市場上號稱具備「推理能力」的 AI 模型,如 Claude Thinking、DeepSeek-R1、o3-mini,實際上只是進行「進階記憶遊戲」,根本談不上真正的邏輯推理。為了避開常見的訓練資料污染問題,蘋果研究團隊自訂了一組從未出現在資料集中的 邏輯謎題,用來測試 AI 模型是否具備真正的 理解與推理能力。
美股雷達
外界懷疑,中國人工智慧(AI)實驗室 DeepSeek 未經授權使用 Google (GOOGL-US) Gemini 系列模型的輸出內容作為訓練依據。DeepSeek 於上週正式推出升級版推理模型 R1-0528,在多項數學與程式碼基準測試中展現優異效能。
科技界對 DeepSeek 即將推出的 R2 模型充滿期待。然而,迄今為該模型的神秘面紗仍未揭開。 DeepSeek 周三 (28 日) 突然宣布其 R1 車型已完成小版試升級,並將其權重上傳至 HuggingFace。使用者可前往官方網頁、APP 及小程式進行測試,API 介面及使用方式維持不變。
A股港股
根據《麻省理工科技評論》報導,中國 AI 資料中心熱潮,最初由政府推動和投資者追捧,但許多新建的資料中心如今卻面臨使用率低和資金短缺的困境,不僅難以盈利,最終還可能需要政府介入處理這些不良資產。報導稱,就在幾個月前,中國由政府和私人投資者共同推動的資料中心建設熱潮還正處於頂峰。
港股
騰訊 (00700-HK) 周四 (27 日) 正式推出自研快思考模式混元 Turbo S,宣稱是人工智慧領域在反應速度與性價比方面取得重大突破。這款新一代旗艦模型透過架構創新實現「秒級響應」,即日起向開發者和企業用戶開放 API 免費試用,並將逐步集成至騰訊元寶 AI 助手。
A股港股
DeepSeek 開源第二天,他們一大早在官推上發佈消息,開源 DeepEP。DeepEP 是一個專為混合專家 (MoE) 模型訓練和推理設計的開源 EP(專家並行) 通訊庫。此舉迅速在 AI 社群引起廣泛關注,不到一小時,DeepEP 在 GitHub 上的 Star 數就已破千。
美股雷達
OpenAI 周六 (1 日) 正式推出其最新研發的輕量級人工智慧模型 o3-mini。這款模型不僅效能卓越,更首度向免費使用者開放推理功能,顯現 OpenAI 欲挑戰近期風頭正盛的 DeepSeek。去年 12 月,OpenAI 首次宣布了 o3-mini 的計劃,同時透露了更強大的 o3。
美股雷達
近日,中國 AI 公司 DeepSeek 以驚人的低成本和運算資源,成功開發出最先進的 AI 模型,震驚了整個 AI 界和投資界。DeepSeek 公開了其研究論文和模型,供其他開發者使用,引發了兩個關鍵問題:美國是否在 AI 競賽中失去了優勢?以及人們是否真的需要像之前認為的那麼多昂貴的 AI 晶片?DeepSeek 聲稱,其最新模型的訓練成本約為 560 萬美元,且並未使用最強大的 AI 晶片。
科技
最近,關於 OpenAI 是否已秘密開發出 GPT-5 的猜測甚囂塵上。社群網站許多貼文言之鑿鑿,稱 OpenAI 可能確實擁有比 GPT-4 更強大的模型,但選擇不公開發布。許多貼文表明,OpenAI 員工在社群媒體上的言論暗示公司內部取得重大突破,可能已跨越「遞歸自我改進 (Recursive Self-Improvement, RSI)」的門檻。
科技
人工智慧 (AI) 興起引起廣泛的關注,也為各行業創造了新的機會。巴克萊近日發布報告,描繪了一幅清晰的未來 AI 發展藍圖,提出了未來 5 年將經歷的 3 個關鍵階段。巴克萊認為,AI 從當前的「聊天機器人 / 助理時代」開始,到 2026 年的「AI 代理時代」,再到 2027 年的「數位員工與機器人時代」。
美股雷達
一組科技專家周一 (16 日) 發出全球召集,尋求最具挑戰性的問題,以測試人工智慧 (AI) 系統,因為這些系統在處理流行基準測試時已顯得輕而易舉。這個名為「人類的最後考試」的項目旨在確定專家級 AI 的到來。根據組織者的說法,這個項目希望在未來幾年內,隨著能力的提升,仍然保持其相關性。