阿里巴巴正式推出新一代開源大模型千問Qwen3.5-Plus,在性能指標(biāo)上與Gemini 3 Pro持平,成為全球最強的開源模型。該模型總參數(shù)達3970億,但實際激活參數(shù)僅170億,通過架構(gòu)創(chuàng)新實現(xiàn)了以小博大的技術(shù)突破。相較于萬億參數(shù)的Qwen3-Max,新模型不僅性能更優(yōu),部署顯存占用降低60%,推理吞吐量最高可提升19倍,API調(diào)用成本每百萬Token僅0.8元,僅為Gemini 3 Pro的十八分之一。
千問3.5系列最顯著的技術(shù)革新在于從純文本模型向原生多模態(tài)模型的跨越。不同于前代僅基于文本token訓(xùn)練,新模型采用視覺與文本混合預(yù)訓(xùn)練方式,新增中英文、多語言、STEM學(xué)科及推理數(shù)據(jù),使模型具備"觀察"世界的能力。在MMLU-Pro知識推理評測中取得87.8分,超越GPT-5.2;博士級難題GPQA測評達88.4分,優(yōu)于Claude 4.5;指令遵循IFBench以76.5分刷新紀(jì)錄,在通用Agent、搜索Agent等基準(zhǔn)測試中全面領(lǐng)先Gemini 3 Pro和GPT-5.2。
視覺能力的飛躍成為千問3.5的核心優(yōu)勢。在多模態(tài)推理、視覺問答、文本識別、空間智能、視頻理解等權(quán)威評測中均取得最佳成績。該模型支持長達2小時(100萬token上下文)的視頻直接輸入,可完成長視頻內(nèi)容分析與摘要生成。更突破性地將視覺理解與代碼能力融合,通過圖搜和生圖工具,能將手繪界面草圖直接轉(zhuǎn)換為前端代碼,或通過截圖定位修復(fù)UI問題,使視覺編程成為實用生產(chǎn)力工具。在學(xué)科解題、任務(wù)規(guī)劃等場景中,其空間定位和帶圖推理能力較專項模型Qwen3-VL提升顯著。
模型效率的革命性提升源于架構(gòu)創(chuàng)新。研究團隊將斬獲2025 NeurIPS最佳論文的門控技術(shù),與線性注意力機制、稀疏混合專家(MoE)架構(gòu)深度融合,在保持3970億總參數(shù)規(guī)模的同時,將激活參數(shù)壓縮至170億。通過訓(xùn)練穩(wěn)定優(yōu)化和多token預(yù)測技術(shù),在32K常用上下文場景中推理吞吐量提升8.6倍,256K超長上下文場景下最高提升19倍。阿里云AI基礎(chǔ)設(shè)施的創(chuàng)新支持,使混合數(shù)據(jù)訓(xùn)練吞吐量接近純文本模型水平,F(xiàn)P8/FP32精度策略在訓(xùn)練數(shù)十萬億token時,內(nèi)存占用減少50%,訓(xùn)練速度提升10%。
在Agent應(yīng)用領(lǐng)域,千問3.5實現(xiàn)重大突破。模型可自主操作手機電腦完成復(fù)雜任務(wù),移動端支持更多主流應(yīng)用與指令,PC端能處理跨應(yīng)用數(shù)據(jù)整理、自動化流程等高階操作。團隊構(gòu)建的異步強化學(xué)習(xí)框架將端到端加速比提升至3-5倍,插件式智能體支持規(guī)模擴展至百萬級。1月15日上線的全球首個消費級AI購物Agent,在春節(jié)期間6天內(nèi)協(xié)助用戶完成1.2億筆訂單交易,驗證了大規(guī)模真實場景商業(yè)化能力。
自2023年開源以來,千問系列已發(fā)布400余個模型,覆蓋全尺寸、全模態(tài)領(lǐng)域,全球下載量突破10億次,單月下載量超過DeepSeek、meta、OpenAI等企業(yè)2至8倍的總和。開發(fā)者基于千問開發(fā)的衍生模型超20萬個,形成全球最大開源生態(tài)。為滿足多語言需求,千問3.5擴展支持201種語言,詞表規(guī)模從15萬增至25萬,小語種編碼效率最高提升60%。目前千問APP和PC端已接入Qwen3.5-Plus,開發(fā)者可通過魔搭社區(qū)、HuggingFace下載模型,或通過阿里云百煉平臺調(diào)用API服務(wù)。據(jù)悉,阿里將持續(xù)開源不同規(guī)格的千問3.5系列模型,性能更強的旗艦版Qwen3.5-Max即將發(fā)布。















