阿里旗下千問系列大模型迎來重要更新,昨日正式開源Qwen3.5家族四款小尺寸模型:0.8B、2B、4B和9B參數(shù)版本。這組模型在保持原生多模態(tài)能力的基礎(chǔ)上,通過架構(gòu)優(yōu)化實現(xiàn)了性能與資源消耗的精準(zhǔn)平衡,覆蓋從邊緣設(shè)備到輕量級服務(wù)器的全場景需求。
0.8B與2B版本以極致輕量化設(shè)計成為端側(cè)部署標(biāo)桿。這兩個模型體積較前代縮減40%,推理速度提升2.3倍,在移動設(shè)備上可實現(xiàn)每秒15次以上的實時響應(yīng)。測試數(shù)據(jù)顯示,搭載2B模型的智能手表在保持72小時續(xù)航的同時,能流暢完成語音交互、健康監(jiān)測等復(fù)雜任務(wù)。IoT領(lǐng)域?qū)<抑赋觯@類模型將推動智能家居設(shè)備真正具備本地化AI能力,減少對云端服務(wù)的依賴。
4B版本作為智能體開發(fā)的核心基座,在多模態(tài)理解方面表現(xiàn)突出。該模型可同時處理文本、圖像和簡單語音指令,在機(jī)器人導(dǎo)航、自動化客服等場景中展現(xiàn)出強(qiáng)大適應(yīng)性。某科技公司使用4B模型開發(fā)的會議助手,能實時轉(zhuǎn)錄并分析多語言對話內(nèi)容,準(zhǔn)確率較傳統(tǒng)方案提升18個百分點(diǎn)。
9B模型憑借"小體積大智慧"的特性引發(fā)關(guān)注。盡管參數(shù)規(guī)模不足百億,其綜合性能已接近GPT-oss-120B的83%,在數(shù)學(xué)推理、代碼生成等任務(wù)中表現(xiàn)尤為亮眼。阿里工程師透露,該模型采用動態(tài)注意力機(jī)制,在顯存占用僅12GB的服務(wù)器上即可運(yùn)行,特別適合中小企業(yè)搭建經(jīng)濟(jì)型AI服務(wù)平臺。
此次開源使千問3.5家族形成完整的產(chǎn)品矩陣:既有397B參數(shù)的旗艦?zāi)P停灿懈采w122B、35B、27B的中型方案,現(xiàn)在更補(bǔ)充了四款小尺寸模型。這種全譜系布局讓開發(fā)者能根據(jù)具體場景自由選擇,從資源受限的嵌入式設(shè)備到大型數(shù)據(jù)中心均可找到適配方案。國際AI評測機(jī)構(gòu)的數(shù)據(jù)顯示,千問系列在同等參數(shù)規(guī)模下的性能表現(xiàn)持續(xù)領(lǐng)先行業(yè)平均水平。
值得關(guān)注的是,特斯拉創(chuàng)始人埃隆·馬斯克在社交平臺對這組模型作出評價,稱其"在有限參數(shù)中實現(xiàn)了驚人的智能密度"。這一來自行業(yè)領(lǐng)袖的認(rèn)可,為千問系列在全球開發(fā)者社區(qū)贏得了更多關(guān)注。目前,相關(guān)模型已在GitHub和Hugging Face平臺開放下載,配套的部署工具包和開發(fā)文檔也同步上線。















