阿里開源千問Qwen3.5-Plus：性能比肩Gemini 3 Pro，推理效率大幅提升

發(fā)布時間：2026-02-16 21:16 來源：快訊作者：趙靜

阿里巴巴正式推出新一代開源大模型千問Qwen3.5-Plus，在性能指標(biāo)上與Gemini 3 Pro持平，成為全球最強的開源模型。該模型總參數(shù)達3970億，但實際激活參數(shù)僅170億，通過架構(gòu)創(chuàng)新實現(xiàn)了以小博大的技術(shù)突破。相較于萬億參數(shù)的Qwen3-Max，新模型不僅性能更優(yōu)，部署顯存占用降低60%，推理吞吐量最高可提升19倍，API調(diào)用成本每百萬Token僅0.8元，僅為Gemini 3 Pro的十八分之一。

千問3.5系列最顯著的技術(shù)革新在于從純文本模型向原生多模態(tài)模型的跨越。不同于前代僅基于文本token訓(xùn)練，新模型采用視覺與文本混合預(yù)訓(xùn)練方式，新增中英文、多語言、STEM學(xué)科及推理數(shù)據(jù)，使模型具備"觀察"世界的能力。在MMLU-Pro知識推理評測中取得87.8分，超越GPT-5.2；博士級難題GPQA測評達88.4分，優(yōu)于Claude 4.5；指令遵循IFBench以76.5分刷新紀(jì)錄，在通用Agent、搜索Agent等基準(zhǔn)測試中全面領(lǐng)先Gemini 3 Pro和GPT-5.2。

視覺能力的飛躍成為千問3.5的核心優(yōu)勢。在多模態(tài)推理、視覺問答、文本識別、空間智能、視頻理解等權(quán)威評測中均取得最佳成績。該模型支持長達2小時（100萬token上下文）的視頻直接輸入，可完成長視頻內(nèi)容分析與摘要生成。更突破性地將視覺理解與代碼能力融合，通過圖搜和生圖工具，能將手繪界面草圖直接轉(zhuǎn)換為前端代碼，或通過截圖定位修復(fù)UI問題，使視覺編程成為實用生產(chǎn)力工具。在學(xué)科解題、任務(wù)規(guī)劃等場景中，其空間定位和帶圖推理能力較專項模型Qwen3-VL提升顯著。

模型效率的革命性提升源于架構(gòu)創(chuàng)新。研究團隊將斬獲2025 NeurIPS最佳論文的門控技術(shù)，與線性注意力機制、稀疏混合專家（MoE）架構(gòu)深度融合，在保持3970億總參數(shù)規(guī)模的同時，將激活參數(shù)壓縮至170億。通過訓(xùn)練穩(wěn)定優(yōu)化和多token預(yù)測技術(shù)，在32K常用上下文場景中推理吞吐量提升8.6倍，256K超長上下文場景下最高提升19倍。阿里云AI基礎(chǔ)設(shè)施的創(chuàng)新支持，使混合數(shù)據(jù)訓(xùn)練吞吐量接近純文本模型水平，F(xiàn)P8/FP32精度策略在訓(xùn)練數(shù)十萬億token時，內(nèi)存占用減少50%，訓(xùn)練速度提升10%。

在Agent應(yīng)用領(lǐng)域，千問3.5實現(xiàn)重大突破。模型可自主操作手機電腦完成復(fù)雜任務(wù)，移動端支持更多主流應(yīng)用與指令，PC端能處理跨應(yīng)用數(shù)據(jù)整理、自動化流程等高階操作。團隊構(gòu)建的異步強化學(xué)習(xí)框架將端到端加速比提升至3-5倍，插件式智能體支持規(guī)模擴展至百萬級。1月15日上線的全球首個消費級AI購物Agent，在春節(jié)期間6天內(nèi)協(xié)助用戶完成1.2億筆訂單交易，驗證了大規(guī)模真實場景商業(yè)化能力。

自2023年開源以來，千問系列已發(fā)布400余個模型，覆蓋全尺寸、全模態(tài)領(lǐng)域，全球下載量突破10億次，單月下載量超過DeepSeek、meta、OpenAI等企業(yè)2至8倍的總和。開發(fā)者基于千問開發(fā)的衍生模型超20萬個，形成全球最大開源生態(tài)。為滿足多語言需求，千問3.5擴展支持201種語言，詞表規(guī)模從15萬增至25萬，小語種編碼效率最高提升60%。目前千問APP和PC端已接入Qwen3.5-Plus，開發(fā)者可通過魔搭社區(qū)、HuggingFace下載模型，或通過阿里云百煉平臺調(diào)用API服務(wù)。據(jù)悉，阿里將持續(xù)開源不同規(guī)格的千問3.5系列模型，性能更強的旗艦版Qwen3.5-Max即將發(fā)布。

更多>同類內(nèi)容