国产精品自拍视频在线-亚洲一区二区三区品视频-日本一区二区三区麻烦视频-国偷自产视频一区二区三区久-巨乳少妇av中文字幕-日韩最新免费中文字幕在线观看-成人污污污视频在线免费观看-污污污网站在线免费看-国产欧美高清在线观看视频

媒體界 - 推動中國媒體行業(yè)創(chuàng)新,促進業(yè)內(nèi)人士交流分享!

全球AI編程大模型盲測新榜揭曉,阿里Qwen3.6-Plus躋身全球第二中國第一

   發(fā)布時間:2026-04-04 14:38 作者:楊凌霄

在AI編程能力的全球競技場上,中國科技企業(yè)再次交出一份亮眼成績單。阿里巴巴最新發(fā)布的大語言模型Qwen 3.6-Plus,在權威盲測平臺LMArena旗下Code Arena榜單中斬獲React專項第二名,成為首個在該領域超越國際頂尖模型的中國大模型。這一突破性成果不僅刷新了國產(chǎn)模型的技術高度,更標志著中國AI在工程化應用層面實現(xiàn)重要跨越。

作為AI領域最具公信力的盲測平臺之一,LMArena通過真實用戶匿名評測、實時動態(tài)排名的機制,構建起全球大模型性能的"試金石"。其Code Arena榜單聚焦AI編程能力,在Agent技術浪潮下愈發(fā)受到行業(yè)關注。本次評測的React專項被視為當前AI代碼生成領域的技術制高點,要求模型在無人干預的條件下,獨立完成從項目初始化到調(diào)試運行的全流程開發(fā),對工程思維和端到端能力提出嚴苛考驗。

數(shù)據(jù)顯示,Qwen 3.6-Plus以1452分的成績緊追Anthropic的Claude-Opus-4.6-Thinking(1540分),領先OpenAI最新發(fā)布的GPT-5.0-High達4分,較Google的Gemini 3.1 Pro Preview更是高出12分。這種以更小參數(shù)量實現(xiàn)更優(yōu)性能的表現(xiàn),在權威編程評測中已成常態(tài)——千問3.6系列此前已在多項測試中超越參數(shù)量數(shù)倍于己的GLM-5、Kimi-K2.5等模型,確立了國產(chǎn)模型在代碼生成領域的標桿地位。

該模型于4月2日正式發(fā)布后,立即在全球開發(fā)者社區(qū)引發(fā)強烈反響。其原生支持的多模態(tài)理解與推理能力,配合在代碼生成和Agent任務中的突出表現(xiàn),使阿里在全球AI實驗室排名中躍升至第四位,形成與Anthropic、OpenAI、Google三強鼎立的競爭格局。特別值得關注的是,Qwen 3.6-Plus在全面評估AI編程能力的Code Arena總榜中,同樣位居國產(chǎn)模型首位。

據(jù)研發(fā)團隊透露,此次發(fā)布的Qwen 3.6-Plus僅是千問3.6系列的首款模型。按照規(guī)劃,后續(xù)將陸續(xù)開源不同參數(shù)規(guī)模的版本,并計劃于近期推出性能更強的旗艦模型Qwen 3.6-Max。這種"基礎模型+開源生態(tài)+旗艦產(chǎn)品"的立體化布局,預示著中國AI企業(yè)正在構建覆蓋全場景的技術矩陣,為全球開發(fā)者提供更具競爭力的解決方案。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
本欄最新