鉅亨網新聞中心 2025-11-19 11:32

谷歌 (GOOGL-US) 正式發布最新一代推理模型 Gemini 3.0 Pro，並同步開放 API 介面及在 谷歌 AI Studio 推出預覽版。這款模型一經發布，即刻橫掃各大評測榜單，以「一夜封神」的姿態震撼了全球 AI 社群。

一發布就屠榜！Gemini 3.0 Pro強到讓OpenAI奧特曼都稱讚 谷歌做對了什麼？(圖:shutterstock)

值得玩味的是，OpenAI 執行長奧特曼也隔空向谷歌發來「賀電」，在社群媒體上評價「Gemini 3 看起來很不錯」，谷歌執行長皮查伊（Sundar Pichai）則以一個輕鬆的表情包回應，盡顯王者風範。

‌



Gemini 3.0 Pro 的強大並非空穴來風，其在關鍵的基準測試中實現了全面「碾壓式」的領先：

數學能力登頂全球： 在被譽為「地獄難度」的數學競賽基準 MathArena 中，當 GPT-5.1 等其他頂級大模型仍在 1% 左右徘徊時，Gemini 3.0 Pro 的得分一舉達到 23.4%，毫無爭議地成為當前全球數學能力最強的 AI。

推理與競技場稱王： 在 LMArena 大模型競技場中，Gemini 3.0 Pro 以 1501 的 Elo 得分高居榜首，證明其在通用推理和問題解決上的卓越能力。

視覺智慧翻倍提升： 更令人震撼的是其跨模態理解能力。Gemini 3.0 Pro 對螢幕截圖的理解準確率高達 72.7%，達到現有最先進水準的兩倍。這項突破有望徹底重塑 AI Agent 操作電腦的互動模式，讓 AI 不再是「視覺障礙者」。

智慧編碼體驗： 儘管在 SWE-Bench 上未取得 SOTA，但其程式設計能力仍穩居第一梯隊。它在 Live Code Bench 的 Elo 得分突破 2400 分，並在工具調用與終端操作基準測試中排名第一。

在更複雜的測驗中，例如 Humanity"s Last Exam，Gemini 3.0 Pro 基礎得分達 37.5%，開啟工具使用後更是直接飆升至 45.8%，遠超競爭對手。在實測應用中，使用者甚至能只說一句話，就透過 Gemini 3.0 Pro 生成一個完整可互動且帶有實體引擎的遊戲、一個頗具設計美學的網站，或是一個複雜的 SVG 互動動畫。

谷歌做對了什麼？

在 AI 泡沫憂慮「血洗」美國科技股的背景下，谷歌母公司 Alphabet)(GOOGL-US) 的股價卻一反常態地刷新新高，成為市場焦點。分析師普遍認為，這一切歸功於谷歌獨特的 「全端」（Full-Stack） 技術模式，正是這一模式為 Gemini 3.0 Pro 的誕生構築了堅不可摧的護城河。

谷歌執行長皮查伊曾表示，谷歌擁有從 晶片、數據、模型到尖端科學 的一系列技術，使其更有能力應對 AI 市場的任何動盪。

Gemini 3.0 Pro 是基於 谷歌 自研的 張量處理單元（TPU） 訓練而成。相較於 CPU 或通用 GPU，TPU 在處理大語言模型所需的大規模計算時速度更快，且配備的大容量高頻寬記憶體能高效運行超大模型與批量資料，使 谷歌 在訓練硬體上無需苦苦等待外部供應，實現了晶片的跨越式發展。

同時，谷歌擁有全球最大的資訊網路和龐大的產品生態，包括谷歌 搜尋、YouTube 等。這為 Gemini 提供了除了公共網路數據之外，海量的、高品質的用戶數據和多元數據源。目前，Gemini 月活躍用戶已超過 6.5 億，每月處理的 Token 總量在一年內增長超過 20 倍。

谷歌也發布了自家的 Agentic 程式設計平台 Google Antigravity，再添一枚「技術砝碼」。實際應用上，最新發布的 Gemini Agent 實驗功能已能自主執行多步驟複雜流程。例如，使用者只需提出「整理一下我的收件匣」，AI 即可自動優先安排待辦事項，並起草郵件回覆供用戶確認。這體現了 Gemini 3.0 Pro 在 Agent 工具使用上的全面領先。

野心不止於此 這只是「熱身」

DeepMind 開發者體驗主管 Omar Sanseviero 在發布後發文稱，當晚的發布會僅是「熱身」，暗示 谷歌 在 AI 領域的佈局和野心遠不止於此。