全球AI編程大模型盲測新榜揭曉，阿里Qwen3.6-Plus躋身全球第二中國第一

發(fā)布時間：2026-04-04 14:38 來源：快訊作者：楊凌霄

在AI編程能力的全球競技場上，中國科技企業(yè)再次交出一份亮眼成績單。阿里巴巴最新發(fā)布的大語言模型Qwen 3.6-Plus，在權威盲測平臺LMArena旗下Code Arena榜單中斬獲React專項第二名，成為首個在該領域超越國際頂尖模型的中國大模型。這一突破性成果不僅刷新了國產(chǎn)模型的技術高度，更標志著中國AI在工程化應用層面實現(xiàn)重要跨越。

作為AI領域最具公信力的盲測平臺之一，LMArena通過真實用戶匿名評測、實時動態(tài)排名的機制，構建起全球大模型性能的"試金石"。其Code Arena榜單聚焦AI編程能力，在Agent技術浪潮下愈發(fā)受到行業(yè)關注。本次評測的React專項被視為當前AI代碼生成領域的技術制高點，要求模型在無人干預的條件下，獨立完成從項目初始化到調(diào)試運行的全流程開發(fā)，對工程思維和端到端能力提出嚴苛考驗。

數(shù)據(jù)顯示，Qwen 3.6-Plus以1452分的成績緊追Anthropic的Claude-Opus-4.6-Thinking（1540分），領先OpenAI最新發(fā)布的GPT-5.0-High達4分，較Google的Gemini 3.1 Pro Preview更是高出12分。這種以更小參數(shù)量實現(xiàn)更優(yōu)性能的表現(xiàn)，在權威編程評測中已成常態(tài)——千問3.6系列此前已在多項測試中超越參數(shù)量數(shù)倍于己的GLM-5、Kimi-K2.5等模型，確立了國產(chǎn)模型在代碼生成領域的標桿地位。

該模型于4月2日正式發(fā)布后，立即在全球開發(fā)者社區(qū)引發(fā)強烈反響。其原生支持的多模態(tài)理解與推理能力，配合在代碼生成和Agent任務中的突出表現(xiàn)，使阿里在全球AI實驗室排名中躍升至第四位，形成與Anthropic、OpenAI、Google三強鼎立的競爭格局。特別值得關注的是，Qwen 3.6-Plus在全面評估AI編程能力的Code Arena總榜中，同樣位居國產(chǎn)模型首位。

據(jù)研發(fā)團隊透露，此次發(fā)布的Qwen 3.6-Plus僅是千問3.6系列的首款模型。按照規(guī)劃，后續(xù)將陸續(xù)開源不同參數(shù)規(guī)模的版本，并計劃于近期推出性能更強的旗艦模型Qwen 3.6-Max。這種"基礎模型+開源生態(tài)+旗艦產(chǎn)品"的立體化布局，預示著中國AI企業(yè)正在構建覆蓋全場景的技術矩陣，為全球開發(fā)者提供更具競爭力的解決方案。

更多>同類內(nèi)容