LLM
科技
上周 (11/17-11/22) 全球股市聚焦科技巨頭的 AI 佈局與財報表現。品浩(PIMCO)經濟學家衛艾婷 (Tiffany Wilding) 在最新觀點中指出,AI 應用正加速落地,企業在供應鏈轉移之際,試圖透過提高生產力、減少勞動成本來抵銷更高的營運成本 。
ETF
全球人工智慧(AI)晶片巨擘輝達(NVDA-US)於週三(11/19)公布最新一季財報,數字大幅超出市場預期,再度向市場投下一顆強勁的定心丸。法人指出,台灣為全球半導體與伺服器供應鏈的關鍵核心,可望將持續受惠於這股強勁的 AI 長線動能。投資人可留意能搭上資料中心擴建潮的相關企業,以掌握科技紅利。
美股雷達
谷歌 (GOOGL-US) 正式發布最新一代推理模型 Gemini 3.0 Pro,並同步開放 API 介面及在 谷歌 AI Studio 推出預覽版。這款模型一經發布,即刻橫掃各大評測榜單,以「一夜封神」的姿態震撼了全球 AI 社群。值得玩味的是,OpenAI 執行長奧特曼也隔空向谷歌發來「賀電」,在社群媒體上評價「Gemini 3 看起來很不錯」,谷歌執行長皮查伊(Sundar Pichai)則以一個輕鬆的表情包回應,盡顯王者風範。
美股雷達
傳出最近即將離職的 Meta(META-US) 首席 AI 科學家、圖靈獎得主楊立昆表示,全球大型科技公司投入巨額資金在 ChatGPT、Google Gemini、Meta Llama 這類大型語言模型 (LLM),是個錯誤。楊立昆 16 日在紐約布魯克林的一場活動上說:「LLM 很棒、很實用,也確實值得投入資源,而且未來會有更多人使用它們。
科技巨頭 Google(GOOGL-US) 近日投下震撼彈,正式推出一項名為「嵌套學習」(Nested Learning)的全新機器學習範式。這項革命性理論將模型視為一個嵌套的優化問題系統,旨在大幅增強大型語言模型(LLM)處理長上下文的能力,並有望緩解乃至徹底解決 LLM 的「災難性遺忘」問題,實現類似人腦的持續學習能力。
美股雷達
隨著 ChatGPT-5、Claude 3.5、Gemini 1.5 Pro 等推理型大語言模型(LRM)日益普及,來自明尼蘇達大學、萊斯大學、史蒂文斯理工學院以及 Lambda Inc 最新研究發現,這些模型在執行長鏈推理任務時,仍存在一個令人震驚的漏洞「詞語沙拉」(Word Salad)。
美股雷達
人工智慧 (AI) 投資究竟是不是泡沫,已經掀起正反兩派論戰,獨立研究機構 MacroStrategy Partnership 發布報告指出,人為壓低的利率環境中吹大了 AI 泡沫,如今規模已經達到網路泡沫時期的 17 倍、2008 年次貸泡沫的四倍,而 AI 投資的規模已經達到極限。
科技
阿里巴巴 (09988-HK)(BABA-US)通義實驗室在 AI 語音技術領域取得重大突破,周一 (15 日) 正式發表 FunAudio-ASR 端對端語音辨識大模型,該模型的問世為語音辨識技術的發展帶來了新的曙光,並有望在多個領域引發深刻變革。
台股新聞
廣達 (2382-TW) 執行副總暨雲達總經理楊麒令今 (12) 日指出,各國政府與企業積極投入主權 AI 與 GPU 的基礎建設,而廣達也已投入主權 AI 領域,目前有沙烏地阿拉伯的專案洽談中,不過仍需時間發酵。 楊麒令表示,各國政府與企業積極投入主權 AI 與 GPU 的基礎建設,包括美國、英國、歐盟國家、沙烏地阿拉伯、新加坡與中國等,並以國家為單位,採用大型語言模型 (LLM),投資私有 GPU cluster(叢集化) 進行訓練。
科技
先進 AI 模型真能達到博士級推理水準嗎?谷歌、OpenAI 旗下模型先前雖在數學奧林匹克 (IMO) 測試中斬獲金牌,讓不少人認為大語言模型 (LLM) 或許已具備攻克博士級科研難題的推理能力,但現實或許並非如此樂觀。AI 媒體《機器之心》報導,專注於超智慧和高級 AI 系統研究的機構 AA-I Technologies,近期推出名為 FormulaOne 的新基準測試,讓一票大模型集體「翻車」。
美股雷達
AI 新創公司 OpenAI 在美西時間周四 (7 日) 發布備受期待的新一代大模型 GPT-5,並宣布向所有用戶開放使用,包括免費用戶。這是 OpenAI 近年來最受關注的一次升級,執行長奧特曼在發布會上宣稱 GPT-5 能力已從「大學生水準」躍升至「博士級專家」,並強調該模型在綜合能力上已達到全球最高。
科技
《CNBC》周一 (14 日) 報導,獲阿里巴巴 (BABA-US)(09988-HK) 投資支持的中國人工智慧 (AI) 新創月之暗面 (Moonshot) 於上周五 (11 日) 深夜發布開源大型語言模型 (LLM)Kimi K2,主打高效程式碼生成能力與極低成本,直指 OpenAI 的 GPT-4.1 與 Anthropic 的 Claude Opus 4 等市面主流對手,搶攻企業端與開發者市場。
台股新聞
IC 設計大廠聯發科 (2454-TW) 集團轄下的前瞻技術研究單位聯發創新基地 (MediaTek Research) 發布基於 OpenAI Whisper 的 AI 語音辨識開源模型 MediaTek Research Breeze ASR 25,日前已於 HuggingFace 上架。
台股
在數位轉型浪潮席捲全球金融業之際,華南銀行宣布以「雙軌制(Dual-Track)」人工智慧架構邁出重要里程碑,透過建置「AI 應用平台」與「AI 代理人(Agentic AI)」兩大系統,開始將生成式 AI 技術深度整合至金融服務場景。預計今年第四季率先於海外分行導入「多國語言翻譯(AI Translator)」功能,以強化跨境金融服務的效率與品質。
美股雷達
加州聯邦法官本周裁定,Anthropic 和 Meta (META-US) 可以使用受版權保護的書籍「訓練」大型語言模型 (LLM),為人工智慧 (AI) 開發者贏得智慧財產權的法律爭議。但圍繞 AI 開發者使用受保護作品的更大範圍的戰爭遠未結束。
科技
中國人工智慧 (AI) 新創公司深度求索(DeepSeek)尚未決定旗下下一代大型語言模型 R2 的正式發表時間,原因是執行長梁文峰對模型目前的性能表現仍不滿意。根據《The Information》周四 (26 日) 引述兩位知情人士報導,R2 原計畫於 5 月推出,作為大受歡迎的 R1 推理模型後繼版本,並希望能在程式碼生成與非英語語言推理方面有所突破。
美股雷達
Meta (META-US) 周三在一樁涉及其 Llama 人工智慧 (AI) 模型的重大版權訴訟中勝訴,打敗代表 13 位作者的原告方。但法官明確表示,他的判決僅限於此案。美國地區法官 Vince Chhabria 支持 Meta 的論點,認為該公司使用書籍來訓練其大型語言模型(LLM)的行為受到美國版權法合理使用原則的保護。
美股雷達
史丹佛大學電腦科學系教授吳恩達 (Andrew Ng) 周四 (12 日) 在 X 平台發表了一篇深度文章,詳細剖析了一個正在快速崛起的新職業——GenAI 應用工程師。這群人不僅能用 AI 積木塊快速搭建強大應用,還能借助 AI 編程助手以前所未有的速度開發軟體系統。
美股雷達
蘋果近期發表一項具指標性的 AI 研究報告,震撼揭露目前市場上號稱具備「推理能力」的 AI 模型,如 Claude Thinking、DeepSeek-R1、o3-mini,實際上只是進行「進階記憶遊戲」,根本談不上真正的邏輯推理。為了避開常見的訓練資料污染問題,蘋果研究團隊自訂了一組從未出現在資料集中的 邏輯謎題,用來測試 AI 模型是否具備真正的 理解與推理能力。
科技
美國史丹佛大學以人為本 AI 研究院今年 4 月發布第 8 份年度《AI 指數報告》,這份 456 頁的權威報告全面追蹤 2024 年全球 AI 發展脈絡,涵蓋技術研發、經濟影響、政策治理、公眾認知等八大方面,揭示 AI 正以「超預期速度」滲透人類社會。