智譜近日正式推出其新一代旗艦大模型GLM-5,這款模型在復(fù)雜系統(tǒng)工程和長(zhǎng)程Agent任務(wù)處理方面展現(xiàn)出卓越能力,尤其在代碼生成與Agent應(yīng)用領(lǐng)域達(dá)到開源領(lǐng)域頂尖水平,實(shí)際編程體驗(yàn)已接近國(guó)際領(lǐng)先模型Claude Opus 4.5。該模型的發(fā)布標(biāo)志著國(guó)產(chǎn)大模型在技術(shù)突破與場(chǎng)景落地方面邁出關(guān)鍵一步。
作為國(guó)內(nèi)首個(gè)完成GLM-5全棧適配的云服務(wù)平臺(tái),百度智能云在模型發(fā)布當(dāng)日即實(shí)現(xiàn)底層硬件到上層服務(wù)的無(wú)縫對(duì)接。通過百度百舸AI異構(gòu)計(jì)算平臺(tái)與昆侖芯的深度協(xié)同,企業(yè)用戶可快速完成模型部署,并借助云端算力充分釋放GLM-5的性能優(yōu)勢(shì)。目前,開發(fā)者已能通過百度千帆平臺(tái)直接調(diào)用該模型,加速業(yè)務(wù)創(chuàng)新與場(chǎng)景落地。
在技術(shù)適配層面,百度百舸團(tuán)隊(duì)與智譜研發(fā)團(tuán)隊(duì)展開聯(lián)合攻關(guān),針對(duì)GLM-5的模型架構(gòu)與推理特性進(jìn)行專項(xiàng)優(yōu)化。通過底層算子重構(gòu)與工具鏈升級(jí),團(tuán)隊(duì)在模型上線前完成全鏈路性能調(diào)優(yōu),確保發(fā)布即達(dá)到穩(wěn)定高效的運(yùn)行狀態(tài)。該適配方案同時(shí)支持vLLM、SGLang兩大主流開源推理框架,為不同技術(shù)路線的開發(fā)者提供靈活選擇。
算力優(yōu)化方面,百度混合云基于昆侖芯高性能計(jì)算單元,完成GLM-5的DSA架構(gòu)與MoE混合專家模型適配。通過INT8量化壓縮、MTP多線程并行及雙機(jī)PP流水線等創(chuàng)新技術(shù),模型在昆侖芯集群上的推理吞吐量實(shí)現(xiàn)顯著提升。這種軟硬協(xié)同的優(yōu)化模式,為國(guó)產(chǎn)大模型規(guī)模化應(yīng)用提供了可復(fù)制的技術(shù)路徑。
截至目前,百度百舸平臺(tái)已在昆侖芯XPU上完成GLM、DeepSeek、Qwen等主流大模型的規(guī)模化部署。2025年2月,國(guó)內(nèi)首個(gè)自研萬(wàn)卡AI集群——昆侖芯P800集群在百度智能云成功點(diǎn)亮,隨后于4月擴(kuò)展至3.2萬(wàn)卡規(guī)模。這些基礎(chǔ)設(shè)施的持續(xù)升級(jí),為國(guó)產(chǎn)大模型訓(xùn)練與推理提供了堅(jiān)實(shí)的算力保障。
這場(chǎng)技術(shù)協(xié)同的背后,折射出國(guó)產(chǎn)AI生態(tài)的進(jìn)化邏輯:通過芯片廠商、云服務(wù)提供商與模型研發(fā)方的深度協(xié)作,構(gòu)建從底層算力到上層應(yīng)用的完整閉環(huán)。百度智能云的全棧能力建設(shè),不僅降低了企業(yè)應(yīng)用大模型的技術(shù)門檻,更為AI技術(shù)與實(shí)體經(jīng)濟(jì)的深度融合創(chuàng)造了條件。隨著更多生態(tài)伙伴加入,國(guó)產(chǎn)大模型正在形成開放共贏的創(chuàng)新生態(tài)。















