GPT
美股雷達
0.4 秒能做什麼?眨一次眼大約需要 0.3 秒,而 Thinking Machines Labs 最新發布的 Interaction Model,把 AI 響應延遲壓到了 0.4 秒,比 OpenAI 的 GPT-realtime-2.0 快了將近三倍。
美股雷達
在人工智慧競逐資安領域升溫之際,OpenAI 宣布向部分受信任用戶開放新一代資安模型 GPT-5.4-Cyber,主打協助辨識與修補軟體漏洞。此舉距離競爭對手 Anthropic 推出自家資安模型 Mythos 僅一週,被視為 AI 資安競賽進一步升級。
美股雷達
微軟 (MSFT-US) 周一 (9 日) 宣布將導入 Anthropic 的人工智慧 (AI) 技術至其 Copilot 服務,推出名為「Copilot Cowork」的新工具,以搶攻快速成長的 AI 代理 (AI agents) 市場。此舉也顯示微軟正進一步拓展與 Anthropic 的合作關係,並降低對 OpenAI 模型的依賴。
美股雷達
阿里巴巴 (Alibaba) 週一 (15 日) 宣布推出新一代人工智慧模型 Qwen3.5,主打可獨立執行複雜任務,並鎖定「代理 AI」(agentic AI) 應用場景。阿里巴巴表示,Qwen3.5 在效能與成本方面大幅升級,使用成本較前一代降低 60%,處理大型工作負載的能力則提升至前一代的 8 倍,同時新增可跨手機與桌面應用程式自主採取行動的「視覺代理能力」。
A股
在全球生成式人工智慧(AI)競爭加速之際,字節跳動正式宣布旗下「豆包」大模型邁入 2.0 階段,推出面向代理時代的系統性升級版本。官方強調,新版本在整體性能上可對標 GPT-5.2 與 Gemini 3 Pro,同時將推理成本降低約一個數量級,為大規模生產環境下的複雜任務執行提供更具競爭力的解決方案。
科技
《CNBC》周一 (14 日) 報導,獲阿里巴巴 (BABA-US)(09988-HK) 投資支持的中國人工智慧 (AI) 新創月之暗面 (Moonshot) 於上周五 (11 日) 深夜發布開源大型語言模型 (LLM)Kimi K2,主打高效程式碼生成能力與極低成本,直指 OpenAI 的 GPT-4.1 與 Anthropic 的 Claude Opus 4 等市面主流對手,搶攻企業端與開發者市場。
美股雷達
蘋果近期發表一項具指標性的 AI 研究報告,震撼揭露目前市場上號稱具備「推理能力」的 AI 模型,如 Claude Thinking、DeepSeek-R1、o3-mini,實際上只是進行「進階記憶遊戲」,根本談不上真正的邏輯推理。為了避開常見的訓練資料污染問題,蘋果研究團隊自訂了一組從未出現在資料集中的 邏輯謎題,用來測試 AI 模型是否具備真正的 理解與推理能力。