美股

Gemini 3.5曝光 Google全時AI Agent「Spark」引爆市場關注

鉅亨網新聞中心

Google (GOOGL-US) 新一代 AI 模型 Gemini 3.5 尚未正式發布,卻已提前在網路上大規模曝光。根據多名爆料者與開發者流出的資訊,代號「Cappuccino」的 Gemini 3.5 Pro 檢查點已開始產出內容,原先外界預期的「Gemini 3.2」也被直接跳級取代,顯示 Google 正試圖加速 AI 產品節奏,以迎戰 OpenAI 與 Anthropic 日益激烈的競爭。

cover image of news article
(圖:Shutterstock)

科技媒體與社群近期流出的截圖顯示,Gemini 3.5 在多模態生成與互動式應用能力上出現明顯提升。知名爆料者 can 率先公開兩項測試成果,包括 DualShock 4 手把互動式藍圖拆解,以及一個可即時調整光線、配件、速度與車架顏色的「鵜鶘騎自行車」向量插畫。


外界認為,這已不再只是單純 SVG 圖片生成,而是可透過 prompt 直接產生完整互動式 Web 應用程式,代表 Google 正在將大型語言模型與前端互動生成進一步整合。

隨後,Abacus.AI 執行長 Bindu Reddy 公布更多測試數據,指出 Gemini 3.2 Flash 在編碼與推理能力上,已達 OpenAI GPT-5.5 約 92% 的水準,但運行成本卻低 15 至 20 倍。LM Arena 匿名跑分結果也顯示,Gemini Flash 在 SVG 生成、互動式 3D 編碼與動畫處理等領域,已超越 Gemini 3.1 Pro。

市場分析認為,這代表 Google 正在透過蒸餾與稀疏化技術,將大型前沿模型壓縮成更低成本版本,同時維持高品質輸出,以提升模型商業化競爭力。

除了模型本身外,另一項受到高度關注的產品則是全新 AI 代理系統「Gemini Spark」。根據曝光資料,Spark 被定位為「全天候待命的個人 AI 智能體」,能 24 小時協助管理電子郵件、執行線上任務、安排多步驟流程,甚至具備自主執行能力。

不過,Spark 引發外界熱議的原因,還包括其高度權限設計。根據流出的服務描述,Spark 可存取 Google 應用程式、聊天記錄、定時任務、登入網站、位置資訊以及個人偏好資料,並可能將姓名、聯絡資訊與文件分享給第三方服務,以完成指定任務。

更受爭議的是,系統說明中提到,Spark 雖然原則上會在敏感操作前徵求使用者同意,但「可能在未經詢問的情況下分享資訊或完成購買」。也就是說,AI 代理未來可能具備自主下單與自主資料分享能力。

市場認為,Spark 實際上是 Google 內部 Agent 計畫「Remy」的升級版,過去僅限 AI Ultra 訂閱用戶使用,如今則準備全面推向更大規模市場。外界也認為,Spark 的定位,正面對標 Anthropic 推出中的 Conway 代理系統,以及 OpenAI 已部署的 24 小時 Agent 平台。

不過,儘管 Gemini 3.5 聲量持續升高,部分業界人士對其實際競爭力仍保持保留態度。科技記者 Alex Heath 引述多位消息人士指出,即將發布的新 Gemini 模型,大致僅能達到 GPT-5.5 等級,與 Anthropic 最新 Mythos 模型仍有明顯差距。

事實上,Gemini 3 曾憑藉 LM Arena 1501 Elo 成績登頂多項排行榜,但隨著 OpenAI GPT-5.5、Anthropic Opus 4.7 與 Mythos 陸續推出,AI 競爭格局已快速改變。

英國 AI 安全研究所 (AISI) 近期測試指出,Mythos 是首個同時通過兩項高強度網路安全測試的 AI 模型,而 GPT-5.5 僅通過其中一項。AISI 甚至坦言,目前評測框架已逐漸跟不上最新模型能力演進速度。

另一方面,開發者也在最新 Gemini 介面中發現新功能跡象。根據爆料者 Fandu 曝光的模型選擇器畫面,新 Gemini 可能原生支援 MCP 第三方工具接入,並重新設計 Thinking 模式,從原本獨立模式改為全域開關,區分為 Standard 與 Extended 兩種推理模式。

其中,Extended 模式被認為將專門用於複雜問題求解,而新增的「MCP Tool Testing」分類,也意味 Google 可能正在加強外部工具與 Agent 協作能力。

程式設計能力則被視為目前 Google 壓力最大的領域。Alex Heath 指出,Google DeepMind 內部對 AI 編碼競爭感到高度焦慮,尤其是 Anthropic 旗下 Claude 系列,過去一年已逐漸成為開發者社群的主流選擇。

Google 內部使用頻繁的 AI 編程平台 Antigravity,雖然推出 4 個月便取得約 6% 的開發者採用率,但與 Anthropic 的 Claude Code 及 OpenAI 的 Codex 相比,市場影響力仍存在差距。

科技媒體 XDA 實測也指出,在相同任務下,Claude Code 能準確理解複雜創意需求,但 Antigravity 生成結果則明顯較粗糙。此外,Google 多次修改收費模式,也引發開發者對額度與信用制度的不滿。

市場觀察人士認為,AI 編程如今已從工程師工具,進一步擴大至產品經理、設計師等非技術族群。例如 OpenAI Codex 與 Claude Code 已能讓使用者透過自然語言生成原型程式,甚至直接將 Figma 設計稿轉換成前端程式碼。

相較之下,Google 目前尚未推出足以主導此市場的產品。

不過,也有觀點認為 Google 的策略並非單純追趕 AI 編碼工具,而是押注更大規模的多模態 AI 生態。科技評論人士 Haider 指出,Google 真正優勢在於其擁有 Android、Gmail、搜尋與 Chrome 等 10 億級分發入口,一旦 Spark 全面部署,用戶郵件、行程、購物與瀏覽資料,都將成為 Gemini 未來訓練的重要數據來源。

這種結合分發平台與 AI Agent 的模式,被認為是 OpenAI 與 Anthropic 短期內難以複製的競爭優勢。

目前 AI 三強競爭也同步升溫。OpenAI 近期替 Codex 加入 ultrafast 模式,速度提升 2 至 3 倍,並推出企業轉移補貼方案;Anthropic 則同步發布 Opus 4.7 Fast 模式,並將 Claude Code 額度提高 50%。

市場認為,這場競爭表面上是爭奪開發者,但核心其實是搶奪 AI 自我迭代的資料循環。由於 AI 生成的程式碼可再反向成為訓練資料,誰掌握更多開發工具使用者,誰就能更快推動下一代模型進化。

目前 OpenAI 主打高速產品迭代、Anthropic 聚焦模型品質,而 Google 則試圖透過 Agent 與龐大平台生態包圍市場。隨著三大陣營全面加速,市場普遍認為,AI 產業的軍備競賽已正式進入新階段。


section icon

鉅亨講座

看更多
  • 講座
  • 公告

    Empty
    Empty