馬斯克在社交平臺X上對阿里通義千問團(tuán)隊(duì)發(fā)布的Qwen3.5小模型系列給予高度評價(jià),稱其“令人印象深刻的智能密度”。這批覆蓋0.8B、2B、4B和9B四個(gè)參數(shù)規(guī)格的模型甫一發(fā)布,便在海外科技圈引發(fā)廣泛關(guān)注,開發(fā)者紛紛探討其技術(shù)突破與應(yīng)用潛力。
Qwen3.5系列模型采用“門控增量網(wǎng)絡(luò)與稀疏混合專家”結(jié)合的混合注意力架構(gòu),注意力層按3:1比例配置Gated DeltaNet與Gated Attention層。這一設(shè)計(jì)使模型在前向傳播時(shí)僅激活必要網(wǎng)絡(luò)部分,顯著降低算力消耗與推理延遲,同時(shí)支持長達(dá)26萬Token的上下文窗口,并引入“思考”與“非思考”雙模式,兼顧深度邏輯推理與快速響應(yīng)需求。
多模態(tài)能力是該系列的核心亮點(diǎn)。通過“早期融合”訓(xùn)練機(jī)制,文本、圖像、視頻數(shù)據(jù)在底層統(tǒng)一處理,而非簡單疊加視覺編碼器。這種架構(gòu)使小參數(shù)模型在視覺問答、OCR文檔理解等任務(wù)中表現(xiàn)優(yōu)異:0.8B模型在視覺任務(wù)MathVista上得分62.2,OCRBench達(dá)74.5;2B模型的OCRBench進(jìn)一步提升至84.5;9B模型更以MMLU-Pro得分82.5超越參數(shù)量為其三倍的上一代Qwen3-30B,并在視覺任務(wù)上領(lǐng)先GPT-5-Nano與Gemini 2.5 Flash Lite。
硬件適配性方面,0.8B與2B模型采用24層結(jié)構(gòu),隱藏維度分別為1024和2048,專為物聯(lián)網(wǎng)設(shè)備與主流手機(jī)設(shè)計(jì),可直接原生運(yùn)行;4B模型為32層結(jié)構(gòu),隱藏維度2560,適配消費(fèi)級移動(dòng)硬件;9B模型隱藏維度擴(kuò)展至4096,F(xiàn)FN維度達(dá)12288,可在Mac上流暢運(yùn)行。開發(fā)者已演示在iPhone 17 Pro上通過MLX框架本地運(yùn)行Qwen3.5-2B 6-bit版本,實(shí)時(shí)完成視覺理解與問答任務(wù)。
開源社區(qū)對Qwen3.5系列反應(yīng)熱烈。知名推理工具Ollama迅速宣布支持全系模型,提供原生工具調(diào)用、思維鏈推理與多模態(tài)功能,用戶可通過一行命令部署運(yùn)行。海外開發(fā)者評價(jià)稱,9B模型性能與120B參數(shù)量的ChatGPT開源模型相當(dāng),但體積僅為其十三分之一,且完全免費(fèi),可運(yùn)行于筆記本電腦乃至手機(jī)端。另有開發(fā)者指出,當(dāng)前僅需3萬美元硬件即可實(shí)現(xiàn)一年前需20萬美元GPU配置的推理能力,每十億參數(shù)的智能密度成為關(guān)鍵指標(biāo)。
阿里千問技術(shù)負(fù)責(zé)人曾解釋開源初衷:小模型起源于降低學(xué)生研究成本的實(shí)驗(yàn)需求,7B規(guī)模已讓許多碩博生無力承擔(dān)實(shí)驗(yàn)費(fèi)用,而1.8B模型的開源可幫助更多人完成學(xué)業(yè)。這一理念推動(dòng)Qwen系列持續(xù)開源,客觀上降低了AI技術(shù)使用門檻。普通用戶現(xiàn)可通過PocketPal AI應(yīng)用本地運(yùn)行Qwen3.5系列,無需API調(diào)用,模型推理全程在設(shè)備端完成,并支持中文界面切換。
硬件協(xié)同是Qwen3.5系列的核心應(yīng)用場景。阿里已將模型嵌入AI眼鏡等可穿戴設(shè)備,實(shí)現(xiàn)毫秒級端側(cè)視覺解析,解決云端大模型在物理場景中的延遲瓶頸。例如,用戶通過AI眼鏡詢問前方障礙物時(shí),端側(cè)需實(shí)時(shí)完成場景解析與反饋,延遲超過三秒將失去實(shí)用價(jià)值。類似技術(shù)還可應(yīng)用于iPhone“視覺智能”功能,通過攝像頭實(shí)時(shí)解析餐廳或商品信息,并直接喚起購買流程,全程無需云端交互。
工業(yè)領(lǐng)域同樣存在大量本地推理需求。IoT設(shè)備、工廠傳感器與醫(yī)療監(jiān)測終端等場景對數(shù)據(jù)隱私敏感,端側(cè)小模型可實(shí)時(shí)處理第一視角多模態(tài)數(shù)據(jù),成為關(guān)鍵基礎(chǔ)設(shè)施。隨著蘋果開發(fā)帶攝像頭的AirPods與智能眼鏡,這些設(shè)備將化身用戶的“第二雙眼睛和耳朵”,進(jìn)一步推動(dòng)端云協(xié)同架構(gòu)的普及——復(fù)雜問題交由云端大模型處理,日常任務(wù)則由端側(cè)小模型獨(dú)立完成。















