阿里再推Qwen3.6-Plus：國產(chǎn)編程模型新標(biāo)桿，展現(xiàn)強大工程交付力

發(fā)布時間：2026-04-02 18:05 來源：快訊作者：吳婷

阿里云近日正式推出新一代大語言模型Qwen3.6-Plus，將其定位為“國產(chǎn)最強編程模型”。這款模型在編程能力評測中表現(xiàn)突出，在智能體編程SWE-bench系列評測和真實世界智能體任務(wù)Claw-eval等權(quán)威測試中，編程表現(xiàn)超越參數(shù)規(guī)模達其2至3倍的GLM-5、Kimi-K2.5等同類產(chǎn)品，編程能力已接近全球頂尖的Claude系列模型。

在邏輯推理測試中，Qwen3.6-Plus展現(xiàn)出深度思考能力。面對經(jīng)典悖論題“甲說乙說謊，乙說丙說謊，丙稱甲乙均說謊，且僅一人說真話”，該模型未采用概率猜測，而是通過“假設(shè)—驗證—排除”的完整鏈路逐步推導(dǎo)。它先假設(shè)甲說真話進行驗證，發(fā)現(xiàn)矛盾后轉(zhuǎn)向丙的陳述，最終鎖定乙為唯一說真話者。整個過程結(jié)構(gòu)嚴(yán)密，每步推導(dǎo)均有依據(jù)，體現(xiàn)了真正的邏輯分析能力。

在復(fù)雜指令執(zhí)行測試中，Qwen3.6-Plus同樣表現(xiàn)優(yōu)異。當(dāng)被要求“用300字以內(nèi)寫自我介紹，開頭須為反問句，禁用‘領(lǐng)先、智能、賦能’三詞，結(jié)尾需用比喻，語氣模仿資深科技記者”時，該模型精準(zhǔn)滿足所有條件。其生成的文本信息密度高、表達克制，既規(guī)避了行業(yè)術(shù)語，又保持了專業(yè)記者的敘事風(fēng)格，完全擺脫了傳統(tǒng)AI輸出的機械感，達到可直接作為商業(yè)稿件發(fā)布的標(biāo)準(zhǔn)。

工程交付能力測試進一步驗證了Qwen3.6-Plus的實用性。面對“開發(fā)具備選題、生成、打分功能的AI短視頻腳本工具網(wǎng)站”的需求，該模型未局限于代碼生成，而是從產(chǎn)品架構(gòu)層面進行系統(tǒng)設(shè)計。它首先拆解宏觀需求，明確目標(biāo)用戶與核心功能模塊，隨后規(guī)劃技術(shù)棧選型、前后端分離方案及數(shù)據(jù)流轉(zhuǎn)機制，完整設(shè)計了用戶從選題到優(yōu)化的全流程。模型還提供了交互提示詞設(shè)計、接口代碼示例及部署成本優(yōu)化建議，展現(xiàn)出從創(chuàng)意到落地的完整產(chǎn)品化能力。

行業(yè)分析認(rèn)為，Qwen3.6-Plus的發(fā)布標(biāo)志著國產(chǎn)大模型評價標(biāo)準(zhǔn)從“知識廣度”和“趣味性”轉(zhuǎn)向“穩(wěn)定性”與“工程化”。當(dāng)AI模型能夠像資深員工一樣獨立完成任務(wù)拆解、規(guī)避業(yè)務(wù)風(fēng)險并輸出系統(tǒng)性方案時，其角色已從對話輔助工具升級為獨立的數(shù)字生產(chǎn)單元。在數(shù)字勞動力快速普及的背景下，企業(yè)與個人的核心競爭力正轉(zhuǎn)向如何高效整合和利用這些智能資源。

目前，Qwen3.6-Plus已上線阿里云百煉平臺，輸入價格低至每百萬Tokens 2元；千問3.6基礎(chǔ)版則通過悟空、千問APP等渠道向開發(fā)者和個人用戶開放體驗。

更多>同類內(nèi)容