微博15億參數(shù)小模型VibeThinker：7800美元成本，數(shù)學賽場逆襲“大塊頭”

發(fā)布時間：2025-11-21 07:30 來源：快訊作者：蘇婉清

當全球AI領域陷入“參數(shù)至上”的激烈競爭時，微博AI團隊以一場顛覆性突破，為行業(yè)開辟了全新的發(fā)展路徑。近日，微博正式推出自主研發(fā)的開源大模型VibeThinker，這款僅含15億參數(shù)的“輕量級選手”，在國際權威數(shù)學競賽基準測試中，以驚人表現(xiàn)擊敗了參數(shù)規(guī)模達6710億的DeepSeek R1模型，引發(fā)全球AI研究界的廣泛關注。

在傳統(tǒng)認知中，AI模型的參數(shù)量被視為衡量其能力的核心指標。行業(yè)普遍認為，復雜推理能力需要千億級參數(shù)支撐，小模型因參數(shù)不足難以應對高難度任務。然而，微博AI團隊通過優(yōu)化模型架構與訓練范式，創(chuàng)新提出“頻譜到信號原理”（SSP）訓練方法，成功挖掘出小模型的隱藏潛力。VibeThinker在AIME24、AIME25及HMMT25等高難度數(shù)學測試中，表現(xiàn)超越參數(shù)量超其400倍的DeepSeek-R1-0120版本，與4560億參數(shù)的MiniMax-M1效果相當，甚至可媲美Gemini 2.5 flash和Claude Opus 4等頂尖模型。在編程算法測試集LiveCodeBench v6中，其成績也追平了歐洲領先AI企業(yè)Minstral.AI的Magistral-Medium-2506版本。

這一突破不僅重新定義了AI模型的評價標準，更以極致的成本效益顛覆了行業(yè)格局。據公開數(shù)據，2025年主流大模型單次后訓練成本普遍在數(shù)十萬美元級別。例如，上海AI企業(yè)MiniMax今年6月發(fā)布的M1模型，訓練成本約53.5萬美元；DeepSeek的R1模型訓練總成本（含基礎模型開發(fā)）約630萬美元。相比之下，VibeThinker的后訓練過程（含SFT和RL階段）僅消耗3900個GPU小時，按市場租賃價格計算，總成本僅7800美元，成本效益比達到30至60倍。這一優(yōu)勢意味著，前沿AI技術不再為科技巨頭所壟斷，中小型機構和研究團隊也能以極低門檻參與創(chuàng)新，推動行業(yè)向更開放、多元的方向發(fā)展。

技術突破的最終價值在于落地應用。微博已將AI技術深度融入平臺生態(tài)，構建起覆蓋多場景的智能服務體系。2024年，微博自主研發(fā)的“知微”大語言模型通過備案，并陸續(xù)推出智搜、內容總結、AI互動號等功能。其中，微博智搜通過分析平臺海量內容構建可信知識圖譜，實現(xiàn)精準需求捕捉與情感場景理解，6月月活躍用戶突破5000萬；評論羅伯特作為AI互動賬號，從毒舌風格進化出溫情與聰明版本，全網粉絲近200萬，成為用戶熱議的交流對象。

隨著VibeThinker的發(fā)布，微博AI戰(zhàn)略邁入新階段。公司計劃深度融合心理等垂直領域的數(shù)據資產，打造更懂公眾情緒、更能服務社會需求的專屬模型。這一模型不僅將優(yōu)化現(xiàn)有AI產品體驗，更可能裂變出兼具社交屬性與智能服務的全新生態(tài)。例如，VibeThinker的技術有望降低微博智搜的算力損耗和實時互動場景的AI響應成本，使平臺在規(guī)模化投入AI能力時無需承擔過高資源壓力，進一步釋放生態(tài)創(chuàng)新能力。

目前，VibeThinker仍處于實驗性版本階段，其研發(fā)重點聚焦于強化小模型在數(shù)學與編程領域的能力，尚未針對日常聊天等場景進行優(yōu)化。但這一探索已為AI產業(yè)提供了全新思路：通過算法創(chuàng)新而非單純堆砌參數(shù)，小模型同樣能實現(xiàn)高性能與低成本的雙贏，為行業(yè)從“規(guī)模競賽”轉向“效率革命”奠定基礎。

更多>同類內容