谷歌推出新一代開源模型Gemma 4，多規(guī)格適配不同硬件且能力出眾

發(fā)布時間：2026-04-04 14:34 來源：快訊作者：楊凌霄

谷歌公司正式發(fā)布新一代開源人工智能模型Gemma 4，宣稱該模型在智能體構(gòu)建與復雜推理任務中實現(xiàn)突破性進展。這款基于Gemini 3技術(shù)架構(gòu)開發(fā)的模型，通過優(yōu)化商業(yè)應用授權(quán)條款，成為當前同規(guī)模開源模型中功能最全面的解決方案。

技術(shù)團隊透露，Gemma 4構(gòu)建于超過140種語言構(gòu)成的訓練數(shù)據(jù)集，重點強化了多步驟決策規(guī)劃與邏輯鏈推演能力。在代碼生成場景中，模型展現(xiàn)出對編程語法結(jié)構(gòu)的深度理解，能夠自動完成函數(shù)調(diào)用鏈設計與異常處理機制搭建。針對智能體開發(fā)需求，研發(fā)人員特別優(yōu)化了環(huán)境感知模塊與任務分解算法，使虛擬助手可自主拆解復雜指令并協(xié)調(diào)多工具協(xié)同工作。

為適應多樣化硬件環(huán)境，此次發(fā)布包含四個參數(shù)規(guī)模的版本矩陣。旗艦版模型配備280億參數(shù)，在配備NVIDIA RTX 4090顯卡的個人電腦上即可實現(xiàn)每秒35 tokens的推理速度，滿足本地化部署需求。針對移動端場景開發(fā)的輕量版僅含7億參數(shù)，通過模型蒸餾技術(shù)將內(nèi)存占用壓縮至1.2GB，支持在搭載驍龍8 Gen3芯片的智能手機上實時運行圖像描述生成任務。

商業(yè)應用層面，谷歌開放了完整的模型微調(diào)接口與量化壓縮工具包。開發(fā)者可通過差異化的參數(shù)調(diào)整策略，在醫(yī)療診斷、金融分析等垂直領域構(gòu)建專業(yè)模型。值得注意的是，新模型采用改進的注意力機制架構(gòu)，在處理長文本時可將上下文窗口擴展至128K tokens，較前代產(chǎn)品提升300%，顯著增強法律文書分析與科研論文解讀等任務的處理能力。

更多>同類內(nèi)容