国产精品自拍视频在线-亚洲一区二区三区品视频-日本一区二区三区麻烦视频-国偷自产视频一区二区三区久-巨乳少妇av中文字幕-日韩最新免费中文字幕在线观看-成人污污污视频在线免费观看-污污污网站在线免费看-国产欧美高清在线观看视频

媒體界 - 推動(dòng)中國(guó)媒體行業(yè)創(chuàng)新,促進(jìn)業(yè)內(nèi)人士交流分享!

從推理到行動(dòng):林俊旸揭秘Qwen試錯(cuò),大模型未來(lái)轉(zhuǎn)向智能體思維

   發(fā)布時(shí)間:2026-03-28 19:19 作者:馮璃月

在人工智能領(lǐng)域,一場(chǎng)關(guān)于發(fā)展方向的深刻討論正愈演愈烈。近期,前阿里千問(wèn)技術(shù)負(fù)責(zé)人林俊旸在離職后首次公開(kāi)發(fā)聲,憑借一篇題為《從“推理”思維到“智能體思維”》的長(zhǎng)文,為這場(chǎng)討論注入了新的思考,引發(fā)了行業(yè)內(nèi)的廣泛關(guān)注。他明確指出,大模型的未來(lái)并非單純比拼推理鏈的長(zhǎng)度,而是要學(xué)會(huì)“為行動(dòng)而思考”,通過(guò)與世界的互動(dòng)來(lái)解決實(shí)際問(wèn)題。

這篇長(zhǎng)文不僅是對(duì)千問(wèn)研發(fā)歷程的深度復(fù)盤(pán),更是對(duì)整個(gè)AI行業(yè)未來(lái)走向的一次重新審視。當(dāng)OpenAI的o1、DeepSeek-R1等模型將“推理模型時(shí)代”推向高潮時(shí),林俊旸卻提出了一個(gè)更為根本的問(wèn)題:大模型究竟應(yīng)該以何種方式思考?答案,或許就隱藏在從“推理思維”到“智能體思維”的范式轉(zhuǎn)變之中。

回顧千問(wèn)團(tuán)隊(duì)的探索歷程,2025年初的一次大膽嘗試令人印象深刻。團(tuán)隊(duì)試圖將“思考模式”與“指令模式”融合于同一模型之中,打造出后來(lái)的Qwen3。林俊旸的初衷十分美好:一個(gè)先進(jìn)的模型應(yīng)當(dāng)具備自動(dòng)調(diào)節(jié)算力投入的能力,根據(jù)問(wèn)題的難易程度靈活應(yīng)對(duì)——簡(jiǎn)單問(wèn)題直接作答,復(fù)雜問(wèn)題深入思考,難題則全力推演。然而,現(xiàn)實(shí)卻給了他們沉重的一擊。合并后的模型在思考時(shí)變得啰嗦猶豫,指令模式也失去了原有的干脆、穩(wěn)定與低成本優(yōu)勢(shì)。問(wèn)題并非出在模型架構(gòu)上,而是源于兩種模式在數(shù)據(jù)分布和行為目標(biāo)上的巨大差異,強(qiáng)行融合只會(huì)導(dǎo)致“兩頭受損”,而非相互補(bǔ)充。

這次失敗讓林俊旸深刻認(rèn)識(shí)到,單純延長(zhǎng)推理鏈、堆砌算力并非AI發(fā)展的終極答案。當(dāng)整個(gè)行業(yè)都在熱衷于探討“如何讓模型思考得更久”時(shí),他卻開(kāi)始思考:AI的思考究竟應(yīng)該服務(wù)于什么目的?

要解答這個(gè)問(wèn)題,就需要深入理解推理思維與智能體思維這兩種截然不同的“大腦”模式。推理思維,以O(shè)penAIo1、DeepSeek-R1為代表,其核心在于靜態(tài)、內(nèi)部、獨(dú)白式的長(zhǎng)推理鏈。它的目標(biāo)在于追求思考的質(zhì)量和正確性,例如解數(shù)學(xué)題、編寫(xiě)代碼或通過(guò)基準(zhǔn)測(cè)試。在實(shí)現(xiàn)方式上,模型在封閉環(huán)境中獨(dú)自思考,通過(guò)延長(zhǎng)推理鏈、增加計(jì)算量來(lái)輸出越來(lái)越長(zhǎng)的“思考過(guò)程”文本。然而,這種思維模式的局限性也十分明顯:它只能回答問(wèn)題,卻無(wú)法解決問(wèn)題——即便知道答案,也缺乏將其付諸實(shí)踐的能力;能夠生成方案,卻無(wú)法確保方案的落地執(zhí)行。

相比之下,智能體思維則是一種全新的方向。它強(qiáng)調(diào)為行動(dòng)而思考,在環(huán)境中思考,并通過(guò)反饋閉環(huán)不斷修正自身。其目標(biāo)并非“思考得足夠久”,而是“利用思考來(lái)支撐有效行動(dòng)”,在與世界的互動(dòng)中持續(xù)推進(jìn)任務(wù)。在實(shí)現(xiàn)方式上,模型不再孤立地進(jìn)行推演,而是邊思考邊行動(dòng)——調(diào)用各種工具、獲取反饋信息、在失敗后調(diào)整計(jì)劃,并在多輪交互中保持思路的一致性。這種思維模式賦予了模型處理純推理模型無(wú)法解決的問(wèn)題的能力,例如何時(shí)停止思考并采取行動(dòng)、選擇何種工具、整合嘈雜的環(huán)境信息、修訂計(jì)劃以及維持多輪交互的一致性等。

Anthropic的Claude系列為林俊旸提供了關(guān)鍵啟發(fā)。Claude3.7作為“可控預(yù)算的混合推理模型”,以及Claude4在推理與工具調(diào)用之間的交錯(cuò)進(jìn)行,都表明思考不再僅僅是為了展示,而是為了服務(wù)于編碼、工具調(diào)用、長(zhǎng)時(shí)任務(wù)和智能體工作流等實(shí)際需求。

智能體思維的落地實(shí)施,離不開(kāi)一個(gè)核心概念——HarnessEngineering(駕馭工程)。林俊旸將其比喻為AI的“腳手架”和模型的“操作系統(tǒng)”。如果把大模型比作“引擎”,那么Harness就是圍繞引擎打造的“車(chē)”——沒(méi)有它,再?gòu)?qiáng)大的引擎也無(wú)法發(fā)揮作用。從本質(zhì)上講,Harness是為AI搭建一個(gè)包含環(huán)境、工具、約束、反饋循環(huán)和多智能體協(xié)同機(jī)制的完整系統(tǒng)。它的作用在于將“裸模型”轉(zhuǎn)化為能夠在現(xiàn)實(shí)任務(wù)中持續(xù)行動(dòng)、修正并完成工作的Agent(智能體)。用公式表示就是:Agent=Model+Harness——模型是大腦,而Harness則是手腳、眼睛和控制系統(tǒng)。

Harness的核心價(jià)值在于解決“執(zhí)行難題”。很多時(shí)候,模型執(zhí)行任務(wù)失敗并非因?yàn)椴粔蚵斆鳎怯捎谕獠肯到y(tǒng)過(guò)于復(fù)雜混亂,導(dǎo)致模型迷失方向、重復(fù)失敗或忘記目標(biāo)。Harness正是為了解決這些問(wèn)題而設(shè)計(jì)的:它能夠協(xié)調(diào)模型調(diào)用API、數(shù)據(jù)庫(kù)、代碼執(zhí)行器等工具,使“思考”能夠落地為“行動(dòng)”;通過(guò)將行動(dòng)結(jié)果反饋給模型,讓它了解“做對(duì)了沒(méi)有”,并據(jù)此修正策略;設(shè)定規(guī)則和沙箱環(huán)境,防止模型“作弊”(如直接搜索答案、濫用工具);協(xié)調(diào)規(guī)劃器、領(lǐng)域?qū)<液妥又悄荏w之間的分工,使復(fù)雜任務(wù)能夠高效推進(jìn)。

然而,在智能體時(shí)代,核心競(jìng)爭(zhēng)力將轉(zhuǎn)向系統(tǒng)工程能力。環(huán)境設(shè)計(jì)將成為“一等研究對(duì)象”,環(huán)境的穩(wěn)定性、真實(shí)性、覆蓋面和反饋豐富度將變得至關(guān)重要——就像在SFT時(shí)代人們癡迷于數(shù)據(jù)多樣性一樣,現(xiàn)在需要癡迷于環(huán)境質(zhì)量。訓(xùn)推協(xié)同也將成為關(guān)鍵,訓(xùn)練和推理需要緊密結(jié)合,使模型能夠在接近生產(chǎn)的環(huán)境中學(xué)習(xí),解決“推理側(cè)等待反饋、訓(xùn)練側(cè)斷糧”的低效問(wèn)題。反作弊與魯棒性也不容忽視,需要防范“獎(jiǎng)勵(lì)作弊”行為,提升評(píng)估器和環(huán)境的抗利用能力。同時(shí),多智能體接口的設(shè)計(jì)也至關(guān)重要,需要建立高效的協(xié)同機(jī)制,讓不同智能體能夠各司其職,控制上下文,避免污染。

智能體思維的終極意義在于推動(dòng)AI從“被動(dòng)回答問(wèn)題的百科全書(shū)”轉(zhuǎn)變?yōu)椤爸鲃?dòng)解決問(wèn)題的數(shù)字行動(dòng)者”。以安排商務(wù)晚宴為例,傳統(tǒng)大模型可能會(huì)為你生成菜單、推薦餐廳并撰寫(xiě)邀請(qǐng)函,但聯(lián)系餐廳、預(yù)訂、發(fā)送邀請(qǐng)和確認(rèn)等后續(xù)工作仍需你自己完成。而AI智能體則只需你提供“下周三8人晚宴,人均500元,CEO海鮮過(guò)敏”等基本信息,它就能自動(dòng)查詢(xún)?nèi)諝v、篩選餐廳、預(yù)訂場(chǎng)地、發(fā)送邀請(qǐng)并提醒你進(jìn)行最終確認(rèn)。

這場(chǎng)從推理思維到智能體思維、從訓(xùn)練模型到訓(xùn)練系統(tǒng)、從比拼算法到比拼Harness工程能力的變革,并非技術(shù)細(xì)節(jié)的簡(jiǎn)單優(yōu)化,而是AI從“能思考”到“能做事”的本質(zhì)跨越。隨著這一變革的深入推進(jìn),真正的AI強(qiáng)者將不再是“會(huì)解題的學(xué)霸”,而是“能辦事的實(shí)干家”。我們也將迎來(lái)一個(gè)AI真正融入日常生活、切實(shí)解決實(shí)際問(wèn)題的新時(shí)代。

 
 
更多>同類(lèi)內(nèi)容
全站最新
熱門(mén)內(nèi)容
本欄最新