谷歌公司正式發(fā)布新一代開源人工智能模型Gemma 4,宣稱該模型在智能體構(gòu)建與復雜推理任務中實現(xiàn)突破性進展。這款基于Gemini 3技術(shù)架構(gòu)開發(fā)的模型,通過優(yōu)化商業(yè)應用授權(quán)條款,成為當前同規(guī)模開源模型中功能最全面的解決方案。
技術(shù)團隊透露,Gemma 4構(gòu)建于超過140種語言構(gòu)成的訓練數(shù)據(jù)集,重點強化了多步驟決策規(guī)劃與邏輯鏈推演能力。在代碼生成場景中,模型展現(xiàn)出對編程語法結(jié)構(gòu)的深度理解,能夠自動完成函數(shù)調(diào)用鏈設計與異常處理機制搭建。針對智能體開發(fā)需求,研發(fā)人員特別優(yōu)化了環(huán)境感知模塊與任務分解算法,使虛擬助手可自主拆解復雜指令并協(xié)調(diào)多工具協(xié)同工作。
為適應多樣化硬件環(huán)境,此次發(fā)布包含四個參數(shù)規(guī)模的版本矩陣。旗艦版模型配備280億參數(shù),在配備NVIDIA RTX 4090顯卡的個人電腦上即可實現(xiàn)每秒35 tokens的推理速度,滿足本地化部署需求。針對移動端場景開發(fā)的輕量版僅含7億參數(shù),通過模型蒸餾技術(shù)將內(nèi)存占用壓縮至1.2GB,支持在搭載驍龍8 Gen3芯片的智能手機上實時運行圖像描述生成任務。
商業(yè)應用層面,谷歌開放了完整的模型微調(diào)接口與量化壓縮工具包。開發(fā)者可通過差異化的參數(shù)調(diào)整策略,在醫(yī)療診斷、金融分析等垂直領域構(gòu)建專業(yè)模型。值得注意的是,新模型采用改進的注意力機制架構(gòu),在處理長文本時可將上下文窗口擴展至128K tokens,較前代產(chǎn)品提升300%,顯著增強法律文書分析與科研論文解讀等任務的處理能力。















