LLM
科技巨頭 Google(GOOGL-US) 近日投下震撼彈,正式推出一項名為「嵌套學習」(Nested Learning)的全新機器學習範式。這項革命性理論將模型視為一個嵌套的優化問題系統,旨在大幅增強大型語言模型(LLM)處理長上下文的能力,並有望緩解乃至徹底解決 LLM 的「災難性遺忘」問題,實現類似人腦的持續學習能力。
隨著 ChatGPT-5、Claude 3.5、Gemini 1.5 Pro 等推理型大語言模型(LRM)日益普及,來自明尼蘇達大學、萊斯大學、史蒂文斯理工學院以及 Lambda Inc 最新研究發現,這些模型在執行長鏈推理任務時,仍存在一個令人震驚的漏洞「詞語沙拉」(Word Salad)。
美股雷達
人工智慧 (AI) 投資究竟是不是泡沫,已經掀起正反兩派論戰,獨立研究機構 MacroStrategy Partnership 發布報告指出,人為壓低的利率環境中吹大了 AI 泡沫,如今規模已經達到網路泡沫時期的 17 倍、2008 年次貸泡沫的四倍,而 AI 投資的規模已經達到極限。
科技
阿里巴巴 (09988-HK)(BABA-US)通義實驗室在 AI 語音技術領域取得重大突破,周一 (15 日) 正式發表 FunAudio-ASR 端對端語音辨識大模型,該模型的問世為語音辨識技術的發展帶來了新的曙光,並有望在多個領域引發深刻變革。
台股新聞
廣達 (2382-TW) 執行副總暨雲達總經理楊麒令今 (12) 日指出,各國政府與企業積極投入主權 AI 與 GPU 的基礎建設,而廣達也已投入主權 AI 領域,目前有沙烏地阿拉伯的專案洽談中,不過仍需時間發酵。 楊麒令表示,各國政府與企業積極投入主權 AI 與 GPU 的基礎建設,包括美國、英國、歐盟國家、沙烏地阿拉伯、新加坡與中國等,並以國家為單位,採用大型語言模型 (LLM),投資私有 GPU cluster(叢集化) 進行訓練。
科技
先進 AI 模型真能達到博士級推理水準嗎?谷歌、OpenAI 旗下模型先前雖在數學奧林匹克 (IMO) 測試中斬獲金牌,讓不少人認為大語言模型 (LLM) 或許已具備攻克博士級科研難題的推理能力,但現實或許並非如此樂觀。AI 媒體《機器之心》報導,專注於超智慧和高級 AI 系統研究的機構 AA-I Technologies,近期推出名為 FormulaOne 的新基準測試,讓一票大模型集體「翻車」。
美股雷達
AI 新創公司 OpenAI 在美西時間周四 (7 日) 發布備受期待的新一代大模型 GPT-5,並宣布向所有用戶開放使用,包括免費用戶。這是 OpenAI 近年來最受關注的一次升級,執行長奧特曼在發布會上宣稱 GPT-5 能力已從「大學生水準」躍升至「博士級專家」,並強調該模型在綜合能力上已達到全球最高。
科技
《CNBC》周一 (14 日) 報導,獲阿里巴巴 (BABA-US)(09988-HK) 投資支持的中國人工智慧 (AI) 新創月之暗面 (Moonshot) 於上周五 (11 日) 深夜發布開源大型語言模型 (LLM)Kimi K2,主打高效程式碼生成能力與極低成本,直指 OpenAI 的 GPT-4.1 與 Anthropic 的 Claude Opus 4 等市面主流對手,搶攻企業端與開發者市場。
台股新聞
IC 設計大廠聯發科 (2454-TW) 集團轄下的前瞻技術研究單位聯發創新基地 (MediaTek Research) 發布基於 OpenAI Whisper 的 AI 語音辨識開源模型 MediaTek Research Breeze ASR 25,日前已於 HuggingFace 上架。
台股
在數位轉型浪潮席捲全球金融業之際,華南銀行宣布以「雙軌制(Dual-Track)」人工智慧架構邁出重要里程碑,透過建置「AI 應用平台」與「AI 代理人(Agentic AI)」兩大系統,開始將生成式 AI 技術深度整合至金融服務場景。預計今年第四季率先於海外分行導入「多國語言翻譯(AI Translator)」功能,以強化跨境金融服務的效率與品質。
美股雷達
加州聯邦法官本周裁定,Anthropic 和 Meta (META-US) 可以使用受版權保護的書籍「訓練」大型語言模型 (LLM),為人工智慧 (AI) 開發者贏得智慧財產權的法律爭議。但圍繞 AI 開發者使用受保護作品的更大範圍的戰爭遠未結束。
科技
中國人工智慧 (AI) 新創公司深度求索(DeepSeek)尚未決定旗下下一代大型語言模型 R2 的正式發表時間,原因是執行長梁文峰對模型目前的性能表現仍不滿意。根據《The Information》周四 (26 日) 引述兩位知情人士報導,R2 原計畫於 5 月推出,作為大受歡迎的 R1 推理模型後繼版本,並希望能在程式碼生成與非英語語言推理方面有所突破。
美股雷達
Meta (META-US) 周三在一樁涉及其 Llama 人工智慧 (AI) 模型的重大版權訴訟中勝訴,打敗代表 13 位作者的原告方。但法官明確表示,他的判決僅限於此案。美國地區法官 Vince Chhabria 支持 Meta 的論點,認為該公司使用書籍來訓練其大型語言模型(LLM)的行為受到美國版權法合理使用原則的保護。
美股雷達
史丹佛大學電腦科學系教授吳恩達 (Andrew Ng) 周四 (12 日) 在 X 平台發表了一篇深度文章,詳細剖析了一個正在快速崛起的新職業——GenAI 應用工程師。這群人不僅能用 AI 積木塊快速搭建強大應用,還能借助 AI 編程助手以前所未有的速度開發軟體系統。
美股雷達
蘋果近期發表一項具指標性的 AI 研究報告,震撼揭露目前市場上號稱具備「推理能力」的 AI 模型,如 Claude Thinking、DeepSeek-R1、o3-mini,實際上只是進行「進階記憶遊戲」,根本談不上真正的邏輯推理。為了避開常見的訓練資料污染問題,蘋果研究團隊自訂了一組從未出現在資料集中的 邏輯謎題,用來測試 AI 模型是否具備真正的 理解與推理能力。
科技
美國史丹佛大學以人為本 AI 研究院今年 4 月發布第 8 份年度《AI 指數報告》,這份 456 頁的權威報告全面追蹤 2024 年全球 AI 發展脈絡,涵蓋技術研發、經濟影響、政策治理、公眾認知等八大方面,揭示 AI 正以「超預期速度」滲透人類社會。
台股新聞
針對 AI 產業的發展趨勢,台積電 (2330-TW)(TSM-US) 董事長魏哲家指出,AI 由軟體與硬體共同構成,無論是 ChatGPT 還是 DeepSeek 等大型語言模型 (LLM),最終都需仰賴台積電的晶片來提供運算,並重申全世界只要做 AI 的客戶,都正與台積電合作,我們的技術與生產能力都是全球第一,客戶也對我們高度信任,最後也補充只要多買我們股票就不會錯。
基金
中國大陸新創公司 DeepSeek 推出低成本 AI 人工智慧模型,引發市場對全球科技生態系統贏家將由誰當的關注。目前半導體股占 MSCI 世界資訊科技指數 1/3,富達國際對半導體長期看好,建議投資人可留意過去 2 年表現相對落後、但將預算導向 AI 基建發展的半導體股。
台股新聞
NVIDIA GTC Taipei 今 (21) 日登場,國泰金 (2881-TW) 去年推出「國泰生成式 AI 技術發展框架 GAIA」,更以 AI 即服務 (AI as a service, AIaaS) 策略,全面提升集團在數位、數據、技術轉型的效益,發展多元 AI 智能應用。
美股雷達
知名避險基金經理人、Tudor Investment 創辦人瓊斯 (Paul Tudor Jones) 因成功預言 1987 年 10 月股災而一戰成名,他近期警告,人工智慧 (AI) 的發展正迅速突破人類對科技的認知,可能在未來對人類構成極大威脅。