国产精品自拍视频在线-亚洲一区二区三区品视频-日本一区二区三区麻烦视频-国偷自产视频一区二区三区久-巨乳少妇av中文字幕-日韩最新免费中文字幕在线观看-成人污污污视频在线免费观看-污污污网站在线免费看-国产欧美高清在线观看视频

媒體界 - 推動中國媒體行業(yè)創(chuàng)新,促進業(yè)內人士交流分享!

阿里開源Qwen3.5小尺寸模型系列,性能亮眼引馬斯克關注網(wǎng)友熱議

   發(fā)布時間:2026-03-03 15:36 作者:周偉

阿里巴巴近日宣布開源四款Qwen3.5系列小尺寸模型,分別為Qwen3.5-0.8B、Qwen3.5-2B、Qwen3.5-4B和Qwen3.5-9B。這些模型專為筆記本電腦等端側設備設計,標志著大模型技術在消費級硬件上的應用邁出重要一步。

在性能評測中,Qwen3.5-9B表現(xiàn)尤為突出。該模型在GPQA Diamond、MMMU-Pro等權威基準測試中超越GPT-OSS-20B、GPT-5 nano等競品,甚至在MMMU-Pro測試中以13分優(yōu)勢領先GPT-5-Nano。更引人注目的是,這個能在筆記本電腦運行的模型,其性能已接近云端部署的旗艦級模型。Qwen3.5-4B雖為更小版本,但在多語言知識、視覺推理等任務上展現(xiàn)出與更大模型相當?shù)膶嵙Γ瑑H在純數(shù)學推理方面存在差距。

技術架構方面,四款模型均基于Qwen3.5統(tǒng)一基座開發(fā),采用Apache 2.0開源協(xié)議允許商業(yè)應用。開發(fā)者可通過LoRA或全量微調技術,使用消費級顯卡即可完成模型適配。不同尺寸模型各有側重:0.8B和2B版本以輕量化見長,適合移動設備和實時交互場景;4B版本作為多模態(tài)基座模型,可平衡性能與資源消耗;9B版本則在緊湊結構中實現(xiàn)媲美GPT-OSS-120B的性能,成為服務器端部署的高性價比選擇。

開發(fā)者社區(qū)對這系列模型反響熱烈。有開發(fā)者在Mac mini上部署Qwen3.5-9B配合OpenClaw系統(tǒng),構建出成本低于初級員工月薪的AI工作站。另一位開發(fā)者使用AMD Ryzen AI Max+395處理器配合Q4_K_XL量化算法,在256k上下文窗口下實現(xiàn)每秒30個token的處理速度,且顯存占用不足16GB。這些實踐驗證了模型在端側設備的實際可行性。

關于模型的應用邊界,開發(fā)者社區(qū)存在不同觀點。支持者認為這些模型已達到Gemini 3 Flash等云端模型的水平,可在邊緣計算場景發(fā)揮實效;批評者則指出4B模型在復雜推理任務中正確率不足50%,數(shù)學測試正確率僅15%,尚不能作為完整的思考伙伴。這種爭議恰恰反映出端側大模型在實用性與局限性之間的微妙平衡。

隨著這四款模型的加入,Qwen3.5家族已形成完整的產(chǎn)品矩陣:包含1個397B參數(shù)的超大模型、3個中型模型(122B、35B、27B參數(shù))以及新發(fā)布的4個小尺寸模型。所有模型代碼已在魔搭社區(qū)和Hugging Face平臺開放下載,為全球開發(fā)者提供多樣化的技術選擇。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新