在科技巨頭谷歌的年度開發者盛會上,一系列關于人工智能(AI)的突破性進展震撼發布,預示著AI技術正以前所未有的速度重塑我們的生活和工作方式。
谷歌首席執行官桑達爾·皮查伊以一句輕松的開場白拉開了大會序幕,他強調,谷歌正步入一個名為“Gemini時代”的新紀元,在這個時代,最前沿的AI模型不再受傳統發布周期的束縛,正以驚人的速度推向全球用戶。
皮查伊自豪地宣布,谷歌打破了“性能與價格不可兼得”的行業魔咒。新一代Gemini 2.5 Pro模型在性能飆升的同時,實現了成本的大幅優化。數據顯示,Gemini模型每秒生成的輸出令牌數已躋身全球前三,而單位計算成本較前代下降了40%。這一突破得益于谷歌第七代TPU芯片的賦能,這款專為大規模推理設計的芯片性能較前代提升了10倍,成為支撐谷歌AI基礎設施的“超級引擎”。
技術突破正迅速轉化為觸手可及的產品體驗。谷歌每月通過產品和API處理的AI Token數量從9.7萬億激增至480萬億,增幅超過50倍。開發者生態同樣迎來了爆發式增長,超過700萬開發者通過Gemini API、Google AI Studio和Vertex AI平臺構建應用,其中Vertex AI平臺上的Gemini使用量更是飆升了40倍。
在用戶端,Gemini應用的月活用戶已突破4億,Gemini 2.5 Pro版本的使用量較前代增長了45%。搜索領域的革新尤為顯著,AI概覽功能每月覆蓋15億用戶,成為全球規模最大的生成式AI應用場景。皮查伊透露,谷歌搜索的“下一站”將是AI驅動的交互模式升級,用戶將體驗到更自然、更個性化的信息獲取方式。
谷歌還展示了三個將實驗轉化為產品的研究項目。其中,Project Starlight的3D視頻技術正式落地為全新平臺Google Beam,該平臺通過6攝像頭陣列捕捉用戶動作,結合AI生成3D光場顯示,實現毫米級頭部追蹤和60幀實時渲染。現場演示了與惠普合作設備的沉浸式通話效果,并宣布首批測試設備將于年內推出。
另一個項目是Project Astra,作為實時語音翻譯技術的集大成者,Google Meet現已支持英語與西班牙語的即時互譯,并計劃在未來幾周擴展至更多語種。演示中,系統精準還原了演講者的語氣、節奏甚至表情。

Project Marina定位為“網絡交互智能體”,已具備多任務處理和教學-重復學習能力。皮查伊展示了其如何同時管理10項任務,并通過一次演示學習完成復雜操作。該技術將通過Gemini API開放給開發者,預計夏季面向更廣泛用戶推出。
皮查伊將智能體(Agent)視為AI技術的“下一形態”。他現場演示了Gemini應用中的“代理模式”:用戶只需設定需求,系統即可自動調用Project Marina完成房源篩選、預約看房等操作,用戶全程無需介入。這一功能將率先向訂閱用戶開放。
Gemini 2.5 Pro經過優化,在自然語言理解、代碼生成、復雜推理及多模態處理(圖像/視頻)等領域全面突破性能邊界。而輕量化模型Gemini 2.5 Flash則以更快的推理速度和更低的資源消耗,提供與Pro相近的能力,計劃6月率先開放開發者接入。
本次升級的最大亮點在于原生多模態能力落地,包括全新的文本轉語音(TTS)技術支持24種語言無縫切換,以及用戶僅需上傳草圖并輸入提示詞,系統即可在數十秒內自動解析圖像、生成可交互的3D模型并部署上線。

谷歌還展示了“Gemini Life”場景,用戶維修自行車時,AI可同步調取說明書、分析故障視頻、搜索教學資料、聯系配件供應商,甚至通過語音交互協調維修流程。這種跨模態、主動式服務模式,預示著AI將從被動工具進化為能自主規劃、串聯任務的“數字伙伴”。





















