I/O大會一文速覽 新模型不是重點 谷歌要讓AI進入一切
金色財經
摘要:AI開始「模擬現實」
作者:董雨晴,鳳凰網科技
「這是一個非凡的時刻。這是一個超高速發展的時期。」
北京時間5月20日凌晨,谷歌CEO Sundar Pichai在I/O大會上,用一句話定調了谷歌當前對AI行業的判斷。在鳳凰網科技看來,與其說這是一場技術發布會,不如說谷歌在向外界傳遞一個清晰的信號:當行業還在追逐參數榜時,谷歌已經把戰火燒到了「世界模型」和「極致性價比」兩條新賽道上了。
Gemini Omni正式登場:AI開始「模擬現實」
今天最值得關注的模型更新,不是某個跑分更高的文本模型,而是Gemini Omni。
谷歌將Omni定義為「世界模型」向前邁出的關鍵一步。用Pichai的話說,AI正從預測文本轉向模擬現實,而Omni是第一個「可以從任何輸入生成任何輸出模態」的模型,這次率先落地的是影音輸出。
谷歌DeepMind首席架構師Korai在講解中放出了一段演示:給Omni一個簡單的提示詞「蛋白質摺疊的解說」,模型直接生成了一段講解蛋白質如何從氨基酸鏈摺疊成α螺旋和β摺疊、最終形成三維形狀的影音。並且,這個影音還不是從素材庫拼接的,而是基於模型在訓練中積累的知識直接生成的。換句話說,Omni開始展現出對「直覺物理學」的理解——它沒有在檢索資訊,而是在模擬現實世界的運行邏輯。
行業感到興奮的是Omni在影音編輯上的能力。Korai演示了用戶上傳自己的影音後,Omni能基於音頻、圖像和影音等多種輸入進行跨模態推理,然後自然地對角色、細節、風格進行改變。某種意義上看,這相當於把Nano Banana在圖像編輯上重新定義規則的能力,完整複製到了影音領域。
Omni Flash將從本周二起向Google AI訂閱用戶開放,用戶可以在Gemini應用、Google Photos和YouTube Shorts上體驗。值得注意的是,所有由Omni創建或編輯的內容,都會被嵌入谷歌不可察覺的數字水印,以應對急迫的安全倫理問題。Pichai同時宣布,OpenAI和ElevenLabs正在採用SynthID 2,這種跨行業合作在AI透明度議題上並不多見。
Gemini 3.5 Flash:一場針對成本的「閃電戰」
如果說Omni是谷歌向未來的技術儲備,那Gemini 3.5 Flash就是一把當下刺向市場痛點的快刀。
根據谷歌官方數據,3.5 Flash在幾乎所有基準測試中都超越了上一代旗艦模型3.1 Pro,編碼能力尤其進步巨大,在衡量現實經濟價值任務的GDP Val基準上實現了「非凡飛躍」。但真正的殺傷力不在跑分。
Pichai在台上給出了一組清晰的對比:3.5 Flash的智能處於前沿水平,幾乎與市面上最好的模型持平,但它的輸出速度是其他前沿模型的四倍。在谷歌內部為Anti Gravity平台優化後,速度優勢甚至拉大到12倍。
實際上,這種組合應用在谷歌內部直接改變了遊戲規則。
速度背後是成本邏輯。Pichai罕見地替企業CIO算了一筆賬:「我聽到很多CIO說公司快用完年度Token預算了。假如他們拿出80%的工作負載從別家模型切換到3.5 Flash,一年能省超過10億美元。」這種用真金白銀做武器的話術,等於向企業市場直接攤牌:谷歌要走量、要規模、要用性價比清場。
支撐這種性價比的,也逃不開谷歌自研的第八代TPU。這次谷歌首次採用雙晶片設計(CPU 80和8 I),為訓練和推理分別優化架構。更重要的是,谷歌通過多機多任務訓練框架「Pathways」技術,將訓練分布到全球超過100萬個TPU上,創建了全球最大的訓練集群。Korai透露了一個內部數據:今年3月谷歌內部每天處理0.5兆Token,現在已飆升至每天超過3兆Token,幾周就翻一倍。這種內部大規模使用形成的反饋閉環,正是把成本不斷壓低的核心引擎。
生態卡位:從開發者到購物車,全面「包圍」
模型之外,谷歌今天展示的生態系統打法同樣值得深究。
在開發者側,谷歌發布了Anti Gravity 2.0,一個獨立桌面應用,可以讓用戶編排多個AI智能體並行完成任務:一個寫網站代碼,一個生成品牌素材,一個做產品架構。同時推出的還有命令行界面和SDK,等於給了程序員與谷歌自身產品同等能力的智能體工具包。
在安全領域,谷歌展示了一款名為Covenant的工具,能利用Gemini模型自動查找並直接修補代碼漏洞,而不只是發現。這顯然是在瞄準大型企業對安全自動化日益增長的需求。
但真正能讓谷歌流量入口繼續坐穩的,是搜尋和購物體驗的改造。
搜尋負責人Liz Reid確認,AI Mode模型已升級至3.5 Flash。一組數據佐證了這種AI搜尋的勢能:AI Overviews月活超25億,AI Mode推出僅一年月活破10億,搜尋查詢量在上季度達到歷史最高點。谷歌順勢推出了25年來最大的一次搜尋框升級,支持更長的對話式查詢和AI驅動的建議系統,並將從夏季開始允許用戶創建在後台7×24小時工作的「資訊智能體」。
購物場景的野心更大。谷歌商務負責人Vidhya展示了「Universal Card」智能購物車,能跨設備、跨商家運作:用戶可以在搜尋、YouTube、Gmail中隨時添加商品,購物車在後台自動查優惠、監控降價、補貨提醒,甚至能根據用戶錢包里的多張銀行卡,自動計算用哪張卡結算最劃算。配合已獲得亞馬遜、Meta、微軟等支持的通用商務協議(UCP)和保障支付的AP2協議,谷歌正在搭建一個讓AI智能體安全花錢的完整商業閉環。
在個人助手層面,全新的Gemini Spark定位為7×24小時運行在雲端的個人AI智能體。比較可怕的是,即使你關掉電腦或手機,它仍在後台繼續完成任務。Spark將首先面向可信測試者開放,隨後以每月100美元的新Ultra套餐價格推出。
看完這場發布會的全部內容,我們的一個核心感受是:谷歌已經不再把AI當成單一的產品競賽,而是把它變成了一個從晶片到模型、從開發者到消費者、從搜尋到購物的全棧戰爭。用Omni去定義「理解世界」的技術上限,用3.5 Flash去打穿商業化的價格底線,再用搜尋、地圖、購物、郵件等國民級應用完成場景收割——這套組合拳的背後,是谷歌對自己規模優勢的最大化利用。
當然,挑戰同樣清晰。Spark智能體能否跨過用戶隱私和信任的門檻?Omni的影音生成能力在開放後能否守住安全邊界?這些問題的答案,將決定谷歌這盤AI大棋的終局成色。
來源:金色財經
發佈者對本文章的內容承擔全部責任
在投資加密貨幣前,請務必深入研究,理解相關風險,並謹慎評估自己的風險承受能力。不要因為短期高回報的誘惑而忽視潛在的重大損失。
暢行幣圈交易全攻略,專家駐群實戰交流
▌立即加入鉅亨買幣實戰交流 LINE 社群(點此入群)
不管是新手發問,還是老手交流,只要你想參與加密貨幣現貨交易、合約跟單、合約網格、量化交易、理財產品的投資,都歡迎入群討論學習!
- 讓加密貨幣幫你滾出年化30%現金流
- 掌握全球財經資訊點我下載APP
- 講座
- 公告
上一篇
下一篇