谷歌首席AI架構(gòu)師科雷·卡武克喬格魯在接受英國(guó)《金融時(shí)報(bào)》專(zhuān)訪時(shí),深入闡述了谷歌最新大語(yǔ)言模型Gemini 3的技術(shù)突破與戰(zhàn)略布局。作為DeepMind CTO兼谷歌首席AI架構(gòu)師,他強(qiáng)調(diào)谷歌正通過(guò)“全棧式”技術(shù)體系,將前沿AI研究轉(zhuǎn)化為用戶(hù)可感知的產(chǎn)品體驗(yàn)。
Gemini 3的核心優(yōu)勢(shì)在于多模態(tài)理解能力的顯著提升。卡武克喬格魯指出,現(xiàn)實(shí)世界的信息呈現(xiàn)形式遠(yuǎn)不止文本,視頻、圖像、PDF等多元內(nèi)容構(gòu)成用戶(hù)需求的關(guān)鍵部分。通過(guò)架構(gòu)優(yōu)化與預(yù)訓(xùn)練技術(shù)改進(jìn),新模型能夠深度解析復(fù)雜內(nèi)容,例如自動(dòng)識(shí)別視頻中的關(guān)鍵場(chǎng)景或從PDF中提取結(jié)構(gòu)化數(shù)據(jù)。這種能力已應(yīng)用于谷歌筆記助手NotebookLM等產(chǎn)品,用戶(hù)上傳文檔后可直接通過(guò)自然語(yǔ)言交互獲取精準(zhǔn)答案。
編程領(lǐng)域的變革尤為突出。Gemini 3的生成式界面將代碼開(kāi)發(fā)轉(zhuǎn)化為交互式學(xué)習(xí)工具。當(dāng)用戶(hù)提出技術(shù)問(wèn)題時(shí),模型不僅提供文字解釋?zhuān)€會(huì)動(dòng)態(tài)生成可視化模擬、數(shù)據(jù)圖表甚至小型應(yīng)用組件。例如,詢(xún)問(wèn)物理現(xiàn)象時(shí),系統(tǒng)可能直接展示交互式實(shí)驗(yàn)?zāi)P停环治鰯?shù)據(jù)時(shí),則自動(dòng)生成可操作的儀表盤(pán)。這種“所見(jiàn)即所學(xué)”的模式,使編程從專(zhuān)業(yè)領(lǐng)域擴(kuò)展為普適性工具。
全棧技術(shù)體系是谷歌的差異化競(jìng)爭(zhēng)力。從定制化AI芯片到分布式數(shù)據(jù)中心,再到覆蓋數(shù)十億用戶(hù)的終端產(chǎn)品,谷歌構(gòu)建了完整的技術(shù)閉環(huán)。卡武克喬格魯透露,Antigravity集成開(kāi)發(fā)環(huán)境的推出標(biāo)志著代碼構(gòu)建方式的革新——基于智能體的自主運(yùn)行機(jī)制,軟件可在更高抽象層級(jí)完成開(kāi)發(fā)任務(wù),顯著減少人工干預(yù)。這種能力源于模型在預(yù)訓(xùn)練階段獲得的潛力挖掘能力,以及后訓(xùn)練階段針對(duì)具體產(chǎn)品的交互優(yōu)化。
用戶(hù)反饋驅(qū)動(dòng)的技術(shù)迭代機(jī)制貫穿研發(fā)全程。Gemini 3的開(kāi)發(fā)周期僅六個(gè)月,其基礎(chǔ)架構(gòu)整合了Gemini 2.5的用戶(hù)使用數(shù)據(jù)。卡武克喬格魯強(qiáng)調(diào),谷歌每天處理海量真實(shí)場(chǎng)景需求,這種“從場(chǎng)景反推技術(shù)”的模式確保研發(fā)方向始終貼近用戶(hù)痛點(diǎn)。例如,模型通過(guò)量化分析避免冗余表達(dá),在“是否過(guò)度奉承”等維度建立評(píng)估體系,使輸出內(nèi)容更符合實(shí)用需求。
針對(duì)通用人工智能(AGI)的探索,谷歌采取務(wù)實(shí)路徑。卡武克喬格魯坦言,目前尚無(wú)構(gòu)建AGI的明確方案,當(dāng)前重點(diǎn)在于開(kāi)發(fā)正確產(chǎn)品、理解用戶(hù)信號(hào)并確保安全可控。他以智能體演進(jìn)為例,指出下一代AI將通過(guò)更強(qiáng)大的交互能力,實(shí)現(xiàn)用戶(hù)與數(shù)字內(nèi)容的深度連接。這種連接不僅限于信息獲取,更涉及創(chuàng)造性協(xié)作——當(dāng)模型質(zhì)量達(dá)到臨界點(diǎn)后,用戶(hù)會(huì)自發(fā)探索創(chuàng)新性應(yīng)用場(chǎng)景,而這些場(chǎng)景反哺技術(shù)優(yōu)化方向。
市場(chǎng)競(jìng)爭(zhēng)態(tài)勢(shì)愈發(fā)激烈。外媒報(bào)道顯示,OpenAI已加速ChatGPT迭代以應(yīng)對(duì)Gemini 3的挑戰(zhàn)。卡武克喬格魯對(duì)此表示,谷歌的競(jìng)爭(zhēng)優(yōu)勢(shì)在于技術(shù)棧的完整性與產(chǎn)品化效率。從芯片設(shè)計(jì)到終端部署的垂直整合能力,使前沿研究能快速轉(zhuǎn)化為規(guī)模化應(yīng)用。這種模式不僅提升開(kāi)發(fā)效率,更通過(guò)真實(shí)用戶(hù)數(shù)據(jù)持續(xù)校準(zhǔn)技術(shù)路線(xiàn),形成“研發(fā)-應(yīng)用-反饋”的良性循環(huán)。















