在近日舉辦的中關(guān)村論壇年會(huì)“人工智能主題日·主題論壇”上,智譜公司首席執(zhí)行官?gòu)堸i圍繞大模型發(fā)展及行業(yè)趨勢(shì)發(fā)表了重要觀點(diǎn)。他透露,公司最新發(fā)布的GLM-5-Turbo基座模型已針對(duì)復(fù)雜任務(wù)場(chǎng)景進(jìn)行深度優(yōu)化,核心目標(biāo)是將模型能力從基礎(chǔ)對(duì)話升級(jí)為具備實(shí)際執(zhí)行力的“生產(chǎn)力工具”。
據(jù)張鵬介紹,GLM-5-Turbo在訓(xùn)練階段即聚焦工具調(diào)用、指令遵循、持續(xù)性任務(wù)處理等關(guān)鍵能力,通過(guò)專項(xiàng)優(yōu)化提升模型在長(zhǎng)鏈路執(zhí)行中的穩(wěn)定性。他特別強(qiáng)調(diào),此類“干活”場(chǎng)景對(duì)模型的要求遠(yuǎn)高于普通對(duì)話,需要智能體自主完成任務(wù)規(guī)劃、上下文壓縮及錯(cuò)誤修正等復(fù)雜操作,這與通用型模型存在本質(zhì)差異。
針對(duì)近期引發(fā)關(guān)注的API價(jià)格調(diào)整問(wèn)題,張鵬坦言這源于服務(wù)成本的實(shí)質(zhì)性上升。他解釋稱,隨著模型規(guī)模擴(kuò)大和能力增強(qiáng),執(zhí)行復(fù)雜任務(wù)時(shí)的Token消耗量呈指數(shù)級(jí)增長(zhǎng),“完成一個(gè)任務(wù)的Token用量可能是簡(jiǎn)單問(wèn)答的百倍”。盡管智譜已通過(guò)優(yōu)化模型架構(gòu)提升效率,但成本壓力仍推動(dòng)公司進(jìn)行了約20%的價(jià)格上調(diào)。
“長(zhǎng)期低價(jià)競(jìng)爭(zhēng)會(huì)扭曲行業(yè)生態(tài)。”張鵬指出,健康的市場(chǎng)環(huán)境需要平衡技術(shù)投入與商業(yè)回報(bào)。他透露,此次調(diào)價(jià)旨在將服務(wù)定價(jià)回歸合理區(qū)間,為持續(xù)迭代模型能力、提供更優(yōu)質(zhì)服務(wù)奠定基礎(chǔ)。這一觀點(diǎn)得到無(wú)問(wèn)芯穹聯(lián)合創(chuàng)始人夏立雪的認(rèn)同,后者表示Agent類產(chǎn)品的爆發(fā)式增長(zhǎng)已導(dǎo)致Token需求激增,系統(tǒng)效率提升成為當(dāng)務(wù)之急。
在談及人工智能發(fā)展瓶頸時(shí),張鵬將算力問(wèn)題置于首位。他直言,當(dāng)前模型創(chuàng)造力和生產(chǎn)效率的提升幅度驚人,部分場(chǎng)景可實(shí)現(xiàn)十倍級(jí)效率躍升,但算力短缺正成為制約技術(shù)落地的關(guān)鍵因素。“用戶不能接受提問(wèn)后模型長(zhǎng)時(shí)間無(wú)響應(yīng),這要求行業(yè)必須突破算力限制。”他以行業(yè)調(diào)侃語(yǔ)“講卡傷感情,沒(méi)卡沒(méi)感情”形容當(dāng)前困境,并指出新一輪算力競(jìng)爭(zhēng)已拉開(kāi)帷幕。
據(jù)公開(kāi)信息顯示,GLM-5-Turbo的升級(jí)方向與OpenClaw等前沿項(xiàng)目高度契合,均試圖通過(guò)增強(qiáng)模型自主執(zhí)行能力拓展AI應(yīng)用邊界。業(yè)內(nèi)人士分析,此類技術(shù)突破或?qū)⒅匦露x人機(jī)協(xié)作模式,但同時(shí)也對(duì)底層基礎(chǔ)設(shè)施提出更高要求。隨著智譜等企業(yè)逐步完善商業(yè)閉環(huán),大模型賽道有望進(jìn)入技術(shù)驅(qū)動(dòng)與市場(chǎng)回報(bào)良性互動(dòng)的新階段。















