国产精品自拍视频在线-亚洲一区二区三区品视频-日本一区二区三区麻烦视频-国偷自产视频一区二区三区久-巨乳少妇av中文字幕-日韩最新免费中文字幕在线观看-成人污污污视频在线免费观看-污污污网站在线免费看-国产欧美高清在线观看视频

媒體界 - 推動中國媒體行業(yè)創(chuàng)新,促進業(yè)內人士交流分享!

微博15億參數(shù)小模型VibeThinker:7800美元成本,數(shù)學賽場逆襲“大塊頭”

   發(fā)布時間:2025-11-21 07:30 作者:蘇婉清

當全球AI領域陷入“參數(shù)至上”的激烈競爭時,微博AI團隊以一場顛覆性突破,為行業(yè)開辟了全新的發(fā)展路徑。近日,微博正式推出自主研發(fā)的開源大模型VibeThinker,這款僅含15億參數(shù)的“輕量級選手”,在國際權威數(shù)學競賽基準測試中,以驚人表現(xiàn)擊敗了參數(shù)規(guī)模達6710億的DeepSeek R1模型,引發(fā)全球AI研究界的廣泛關注。

在傳統(tǒng)認知中,AI模型的參數(shù)量被視為衡量其能力的核心指標。行業(yè)普遍認為,復雜推理能力需要千億級參數(shù)支撐,小模型因參數(shù)不足難以應對高難度任務。然而,微博AI團隊通過優(yōu)化模型架構與訓練范式,創(chuàng)新提出“頻譜到信號原理”(SSP)訓練方法,成功挖掘出小模型的隱藏潛力。VibeThinker在AIME24、AIME25及HMMT25等高難度數(shù)學測試中,表現(xiàn)超越參數(shù)量超其400倍的DeepSeek-R1-0120版本,與4560億參數(shù)的MiniMax-M1效果相當,甚至可媲美Gemini 2.5 flash和Claude Opus 4等頂尖模型。在編程算法測試集LiveCodeBench v6中,其成績也追平了歐洲領先AI企業(yè)Minstral.AI的Magistral-Medium-2506版本。

這一突破不僅重新定義了AI模型的評價標準,更以極致的成本效益顛覆了行業(yè)格局。據公開數(shù)據,2025年主流大模型單次后訓練成本普遍在數(shù)十萬美元級別。例如,上海AI企業(yè)MiniMax今年6月發(fā)布的M1模型,訓練成本約53.5萬美元;DeepSeek的R1模型訓練總成本(含基礎模型開發(fā))約630萬美元。相比之下,VibeThinker的后訓練過程(含SFT和RL階段)僅消耗3900個GPU小時,按市場租賃價格計算,總成本僅7800美元,成本效益比達到30至60倍。這一優(yōu)勢意味著,前沿AI技術不再為科技巨頭所壟斷,中小型機構和研究團隊也能以極低門檻參與創(chuàng)新,推動行業(yè)向更開放、多元的方向發(fā)展。

技術突破的最終價值在于落地應用。微博已將AI技術深度融入平臺生態(tài),構建起覆蓋多場景的智能服務體系。2024年,微博自主研發(fā)的“知微”大語言模型通過備案,并陸續(xù)推出智搜、內容總結、AI互動號等功能。其中,微博智搜通過分析平臺海量內容構建可信知識圖譜,實現(xiàn)精準需求捕捉與情感場景理解,6月月活躍用戶突破5000萬;評論羅伯特作為AI互動賬號,從毒舌風格進化出溫情與聰明版本,全網粉絲近200萬,成為用戶熱議的交流對象。

隨著VibeThinker的發(fā)布,微博AI戰(zhàn)略邁入新階段。公司計劃深度融合心理等垂直領域的數(shù)據資產,打造更懂公眾情緒、更能服務社會需求的專屬模型。這一模型不僅將優(yōu)化現(xiàn)有AI產品體驗,更可能裂變出兼具社交屬性與智能服務的全新生態(tài)。例如,VibeThinker的技術有望降低微博智搜的算力損耗和實時互動場景的AI響應成本,使平臺在規(guī)模化投入AI能力時無需承擔過高資源壓力,進一步釋放生態(tài)創(chuàng)新能力。

目前,VibeThinker仍處于實驗性版本階段,其研發(fā)重點聚焦于強化小模型在數(shù)學與編程領域的能力,尚未針對日常聊天等場景進行優(yōu)化。但這一探索已為AI產業(yè)提供了全新思路:通過算法創(chuàng)新而非單純堆砌參數(shù),小模型同樣能實現(xiàn)高性能與低成本的雙贏,為行業(yè)從“規(guī)模競賽”轉向“效率革命”奠定基礎。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新