美股

Gemini 3.5曝光 Google全時AI Agent「Spark」引爆市場關注

鉅亨網新聞中心2026-05-16 05:30

Google (GOOGL-US) 新一代 AI 模型 Gemini 3.5 尚未正式發布，卻已提前在網路上大規模曝光。根據多名爆料者與開發者流出的資訊，代號「Cappuccino」的 Gemini 3.5 Pro 檢查點已開始產出內容，原先外界預期的「Gemini 3.2」也被直接跳級取代，顯示 Google 正試圖加速 AI 產品節奏，以迎戰 OpenAI 與 Anthropic 日益激烈的競爭。

cover image of news article — （圖：Shutterstock)

科技媒體與社群近期流出的截圖顯示，Gemini 3.5 在多模態生成與互動式應用能力上出現明顯提升。知名爆料者 can 率先公開兩項測試成果，包括 DualShock 4 手把互動式藍圖拆解，以及一個可即時調整光線、配件、速度與車架顏色的「鵜鶘騎自行車」向量插畫。

‌

外界認為，這已不再只是單純 SVG 圖片生成，而是可透過 prompt 直接產生完整互動式 Web 應用程式，代表 Google 正在將大型語言模型與前端互動生成進一步整合。

隨後，Abacus.AI 執行長 Bindu Reddy 公布更多測試數據，指出 Gemini 3.2 Flash 在編碼與推理能力上，已達 OpenAI GPT-5.5 約 92% 的水準，但運行成本卻低 15 至 20 倍。LM Arena 匿名跑分結果也顯示，Gemini Flash 在 SVG 生成、互動式 3D 編碼與動畫處理等領域，已超越 Gemini 3.1 Pro。

市場分析認為，這代表 Google 正在透過蒸餾與稀疏化技術，將大型前沿模型壓縮成更低成本版本，同時維持高品質輸出，以提升模型商業化競爭力。

除了模型本身外，另一項受到高度關注的產品則是全新 AI 代理系統「Gemini Spark」。根據曝光資料，Spark 被定位為「全天候待命的個人 AI 智能體」，能 24 小時協助管理電子郵件、執行線上任務、安排多步驟流程，甚至具備自主執行能力。

不過，Spark 引發外界熱議的原因，還包括其高度權限設計。根據流出的服務描述，Spark 可存取 Google 應用程式、聊天記錄、定時任務、登入網站、位置資訊以及個人偏好資料，並可能將姓名、聯絡資訊與文件分享給第三方服務，以完成指定任務。

更受爭議的是，系統說明中提到，Spark 雖然原則上會在敏感操作前徵求使用者同意，但「可能在未經詢問的情況下分享資訊或完成購買」。也就是說，AI 代理未來可能具備自主下單與自主資料分享能力。

市場認為，Spark 實際上是 Google 內部 Agent 計畫「Remy」的升級版，過去僅限 AI Ultra 訂閱用戶使用，如今則準備全面推向更大規模市場。外界也認為，Spark 的定位，正面對標 Anthropic 推出中的 Conway 代理系統，以及 OpenAI 已部署的 24 小時 Agent 平台。

不過，儘管 Gemini 3.5 聲量持續升高，部分業界人士對其實際競爭力仍保持保留態度。科技記者 Alex Heath 引述多位消息人士指出，即將發布的新 Gemini 模型，大致僅能達到 GPT-5.5 等級，與 Anthropic 最新 Mythos 模型仍有明顯差距。

事實上，Gemini 3 曾憑藉 LM Arena 1501 Elo 成績登頂多項排行榜，但隨著 OpenAI GPT-5.5、Anthropic Opus 4.7 與 Mythos 陸續推出，AI 競爭格局已快速改變。

英國 AI 安全研究所 (AISI) 近期測試指出，Mythos 是首個同時通過兩項高強度網路安全測試的 AI 模型，而 GPT-5.5 僅通過其中一項。AISI 甚至坦言，目前評測框架已逐漸跟不上最新模型能力演進速度。

另一方面，開發者也在最新 Gemini 介面中發現新功能跡象。根據爆料者 Fandu 曝光的模型選擇器畫面，新 Gemini 可能原生支援 MCP 第三方工具接入，並重新設計 Thinking 模式，從原本獨立模式改為全域開關，區分為 Standard 與 Extended 兩種推理模式。

其中，Extended 模式被認為將專門用於複雜問題求解，而新增的「MCP Tool Testing」分類，也意味 Google 可能正在加強外部工具與 Agent 協作能力。

程式設計能力則被視為目前 Google 壓力最大的領域。Alex Heath 指出，Google DeepMind 內部對 AI 編碼競爭感到高度焦慮，尤其是 Anthropic 旗下 Claude 系列，過去一年已逐漸成為開發者社群的主流選擇。

Google 內部使用頻繁的 AI 編程平台 Antigravity，雖然推出 4 個月便取得約 6% 的開發者採用率，但與 Anthropic 的 Claude Code 及 OpenAI 的 Codex 相比，市場影響力仍存在差距。

科技媒體 XDA 實測也指出，在相同任務下，Claude Code 能準確理解複雜創意需求，但 Antigravity 生成結果則明顯較粗糙。此外，Google 多次修改收費模式，也引發開發者對額度與信用制度的不滿。

市場觀察人士認為，AI 編程如今已從工程師工具，進一步擴大至產品經理、設計師等非技術族群。例如 OpenAI Codex 與 Claude Code 已能讓使用者透過自然語言生成原型程式，甚至直接將 Figma 設計稿轉換成前端程式碼。

相較之下，Google 目前尚未推出足以主導此市場的產品。

不過，也有觀點認為 Google 的策略並非單純追趕 AI 編碼工具，而是押注更大規模的多模態 AI 生態。科技評論人士 Haider 指出，Google 真正優勢在於其擁有 Android、Gmail、搜尋與 Chrome 等 10 億級分發入口，一旦 Spark 全面部署，用戶郵件、行程、購物與瀏覽資料，都將成為 Gemini 未來訓練的重要數據來源。

這種結合分發平台與 AI Agent 的模式，被認為是 OpenAI 與 Anthropic 短期內難以複製的競爭優勢。

目前 AI 三強競爭也同步升溫。OpenAI 近期替 Codex 加入 ultrafast 模式，速度提升 2 至 3 倍，並推出企業轉移補貼方案；Anthropic 則同步發布 Opus 4.7 Fast 模式，並將 Claude Code 額度提高 50%。

市場認為，這場競爭表面上是爭奪開發者，但核心其實是搶奪 AI 自我迭代的資料循環。由於 AI 生成的程式碼可再反向成為訓練資料，誰掌握更多開發工具使用者，誰就能更快推動下一代模型進化。

目前 OpenAI 主打高速產品迭代、Anthropic 聚焦模型品質，而 Google 則試圖透過 Agent 與龐大平台生態包圍市場。隨著三大陣營全面加速，市場普遍認為，AI 產業的軍備競賽已正式進入新階段。

‌