国产精品自拍视频在线-亚洲一区二区三区品视频-日本一区二区三区麻烦视频-国偷自产视频一区二区三区久-巨乳少妇av中文字幕-日韩最新免费中文字幕在线观看-成人污污污视频在线免费观看-污污污网站在线免费看-国产欧美高清在线观看视频

媒體界 - 推動(dòng)中國(guó)媒體行業(yè)創(chuàng)新,促進(jìn)業(yè)內(nèi)人士交流分享!

智譜GLM-4.7強(qiáng)勢(shì)登場(chǎng):代碼工具推理全升級(jí),國(guó)產(chǎn)開(kāi)源模型再攀高峰

   發(fā)布時(shí)間:2025-12-23 23:01 作者:任飛揚(yáng)

在人工智能領(lǐng)域,國(guó)產(chǎn)大模型正以驚人的速度崛起。近日,智譜推出的GLM-4.7模型引發(fā)廣泛關(guān)注,這款在IPO前夕亮相的模型,憑借多項(xiàng)技術(shù)突破,成為全球開(kāi)源模型中的佼佼者。

從專業(yè)測(cè)評(píng)數(shù)據(jù)來(lái)看,GLM-4.7在多個(gè)維度展現(xiàn)出強(qiáng)勁實(shí)力。在Code Arena面向全球開(kāi)發(fā)者的編碼盲測(cè)中,該模型在Web開(kāi)發(fā)方向排名第六,超越GPT-5.2與Claude Sonnet 4.5,成為全球排名最高的開(kāi)源模型,同時(shí)穩(wěn)居國(guó)產(chǎn)模型榜首。在代碼能力方面,SWE-bench?Verified測(cè)試中取得73.8%的成績(jī),LiveCodeBench?V6測(cè)試中達(dá)到84.9%,整體水平與Claude Sonnet 4.5持平,處于開(kāi)源模型第一梯隊(duì)。復(fù)雜推理任務(wù)中,HLE成績(jī)?cè)诠ぞ咻o助條件下提升至42.8%,較GLM?4.6提升超12個(gè)百分點(diǎn),甚至超過(guò)GPT?5.1 High。工具調(diào)用能力同樣出色,在τ2?Bench中取得87.4%的成績(jī),BrowseComp在開(kāi)啟上下文管理后提升至67.5%,在多輪網(wǎng)頁(yè)任務(wù)和交互式工具調(diào)用場(chǎng)景中表現(xiàn)穩(wěn)定。

這些亮眼成績(jī)的背后,是模型內(nèi)部思考機(jī)制的重大調(diào)整。GLM?4.7在“交錯(cuò)思考”基礎(chǔ)上,引入保留式思考與輪級(jí)思考控制機(jī)制。模型在每次生成和工具調(diào)用前會(huì)先進(jìn)行推理,并在多輪任務(wù)中自動(dòng)保留已有思考結(jié)果,避免重復(fù)推導(dǎo)。開(kāi)發(fā)者還可按輪次決定是否啟用推理過(guò)程,在簡(jiǎn)單請(qǐng)求中降低時(shí)延,在復(fù)雜任務(wù)中提升穩(wěn)定性。這種設(shè)計(jì)增強(qiáng)了長(zhǎng)任務(wù)執(zhí)行的一致性和可控性,為模型在代碼智能體、終端任務(wù)和工具協(xié)同類基準(zhǔn)上的整體提升提供了支撐。模型還針對(duì)前端美學(xué)、長(zhǎng)文本穩(wěn)定性、網(wǎng)頁(yè)生成結(jié)構(gòu)等細(xì)節(jié)進(jìn)行了優(yōu)化。

為了驗(yàn)證GLM?4.7在實(shí)際開(kāi)發(fā)任務(wù)中的表現(xiàn),智譜對(duì)100個(gè)真實(shí)編程任務(wù)進(jìn)行了對(duì)比測(cè)試,涵蓋前端開(kāi)發(fā)、后端邏輯和指令遵循三個(gè)核心方向。結(jié)果顯示,前端任務(wù)中,GLM?4.7相較4.6版本勝率提升至64.6%;指令遵循場(chǎng)景中達(dá)到58.3%;后端方向勝率穩(wěn)定在46.7%。在多技能聯(lián)動(dòng)能力方面,GLM-4.7在Z.ai上線了全棧技能環(huán)境,接入全新Skills模塊,支持調(diào)用ASR語(yǔ)音識(shí)別、TTS語(yǔ)音合成、GLM?4.6V視覺(jué)模型等多個(gè)模塊進(jìn)行統(tǒng)一調(diào)度,實(shí)現(xiàn)了多模態(tài)任務(wù)中的路徑規(guī)劃和動(dòng)作執(zhí)行,打通了工具之間的“調(diào)度邏輯”。

在實(shí)際互動(dòng)任務(wù)測(cè)試中,GLM-4.7的表現(xiàn)同樣令人驚艷。在3D控制任務(wù)中,模型輸出可直接運(yùn)行的HTML代碼,構(gòu)建出包含5000多個(gè)粒子的立體圣誕樹(shù),頂部帶有輝光效果的星星。移動(dòng)鼠標(biāo)時(shí),粒子會(huì)產(chǎn)生斥力波紋,形成流動(dòng)的視覺(jué)效果。系統(tǒng)還能調(diào)用攝像頭識(shí)別用戶手勢(shì),張開(kāi)手掌時(shí)圣誕樹(shù)炸開(kāi)變?yōu)檎掌瑝Γ笥乙苿?dòng)手掌照片墻會(huì)旋轉(zhuǎn),握拳時(shí)所有元素收攏歸位,形成完整動(dòng)畫(huà)。代碼中還集成了性能優(yōu)化機(jī)制,確保頁(yè)面在不依賴構(gòu)建工具的情況下保持高幀率和流暢度。在UI生成任務(wù)中,輸入“1:1復(fù)刻iOS系統(tǒng)”提示詞后,模型生成了模仿iOS的主頁(yè)面,Safari、Siri等圖標(biāo)均可點(diǎn)擊,日歷、天氣等功能頁(yè)可交互,計(jì)算器能進(jìn)行基礎(chǔ)運(yùn)算,圖標(biāo)風(fēng)格和顏色搭配也具備基本審美。在前端代碼實(shí)現(xiàn)任務(wù)中,模型生成了完整的雙人格斗游戲界面,風(fēng)格高度還原Switch主機(jī)Joy-Con手柄配色和布局,左側(cè)藍(lán)色手柄,右側(cè)紅色手柄,中間是游戲主屏幕。游戲中有兩個(gè)火柴人角色,頭頂有動(dòng)態(tài)血條,UI顯示當(dāng)前波次與敵人數(shù)量等信息,操作體驗(yàn)上,左右玩家可通過(guò)鍵盤(pán)不同按鍵控制角色移動(dòng)、攻擊和釋放技能,整體界面結(jié)構(gòu)、角色邏輯和按鍵響應(yīng)完整,具備真實(shí)游戲框架感,且內(nèi)置節(jié)奏感強(qiáng)的格斗BGM。

GLM-4.7的開(kāi)源代碼在全球社區(qū)中已被下載超6000萬(wàn)次,付費(fèi)API使用量長(zhǎng)期居于OpenRouter全球前十,逐步進(jìn)入開(kāi)發(fā)者的實(shí)際工具列表。在智譜即將登陸港交所的背景下,GLM-4.7的上線成為國(guó)產(chǎn)大模型企業(yè)從科研模型、開(kāi)源生態(tài)向“真實(shí)使用”與“市場(chǎng)驗(yàn)證”過(guò)渡的一個(gè)縮影,標(biāo)志著開(kāi)源國(guó)產(chǎn)模型正從“對(duì)標(biāo)國(guó)際”邁向“領(lǐng)跑、實(shí)用”。

 
 
更多>同類內(nèi)容
全站最新
熱門(mén)內(nèi)容
本欄最新