国产精品自拍视频在线-亚洲一区二区三区品视频-日本一区二区三区麻烦视频-国偷自产视频一区二区三区久-巨乳少妇av中文字幕-日韩最新免费中文字幕在线观看-成人污污污视频在线免费观看-污污污网站在线免费看-国产欧美高清在线观看视频

媒體界 - 推動中國媒體行業(yè)創(chuàng)新,促進(jìn)業(yè)內(nèi)人士交流分享!

小米AI逆襲:雷軍帶隊突圍,大模型賽道給馬斯克“上了一課”?

   發(fā)布時間:2026-03-20 18:37 作者:王婷

當(dāng)小米正式發(fā)布MiMo-V2-Pro大模型時,科技圈的目光不約而同地轉(zhuǎn)向了馬斯克——這位以顛覆性創(chuàng)新著稱的企業(yè)家,此刻正因xAI的處境陷入尷尬。2023年成立的xAI雖背靠500億美元融資和OpenAI、DeepMind等頂尖機(jī)構(gòu)的核心團(tuán)隊,但其最新推出的Grok 4.20 Beta在Artificial Analysis Intelligence Index評測中僅獲48分,而小米的MiMo-V2-Pro卻以49分險勝。這場看似偶然的分?jǐn)?shù)超越,實(shí)則揭示了AI賽道競爭格局的微妙變化。

小米的AI征程始于2023年4月成立的AI實(shí)驗(yàn)室大模型團(tuán)隊,但真正發(fā)力是在2024年底至2025年初組建的通用基礎(chǔ)大模型Core團(tuán)隊。這個由雷軍直接推動的項(xiàng)目,在技術(shù)架構(gòu)上并未追求標(biāo)新立異:1T參數(shù)、42B激活參數(shù)、100萬token上下文窗口,以及MoE混合專家架構(gòu)等設(shè)計,均屬于行業(yè)主流方案。真正讓MiMo-V2-Pro脫穎而出的,是其獨(dú)創(chuàng)的后訓(xùn)練技術(shù)體系。

針對大模型訓(xùn)練中普遍存在的"蹺蹺板效應(yīng)"——強(qiáng)化某一能力時必然削弱其他能力,小米研發(fā)了MOPD(多教師在線策略蒸餾)技術(shù)。該技術(shù)通過構(gòu)建代碼、搜索、數(shù)學(xué)推理等領(lǐng)域的專家教師模型,讓學(xué)生模型在生成回答時同時接受多個教師的實(shí)時監(jiān)督。這種訓(xùn)練方式不僅使模型在AIME 2025數(shù)學(xué)競賽中取得94.1分,更突破性地讓部分學(xué)生模型超越了教師水平。北京大學(xué)計算機(jī)學(xué)院參與研發(fā)的ARL-Tangram訓(xùn)練基礎(chǔ)設(shè)施系統(tǒng),則通過動態(tài)資源分配解決了傳統(tǒng)RL框架中97%算力空轉(zhuǎn)的問題,將外部資源消耗降低71.2%。

在真實(shí)場景訓(xùn)練方面,小米構(gòu)建了覆蓋代碼、終端、網(wǎng)頁開發(fā)和通用任務(wù)的四大類場景體系。代碼agent直接從GitHub Issues中提取訓(xùn)練數(shù)據(jù),在修改代碼、運(yùn)行測試、查看報錯的完整閉環(huán)中學(xué)習(xí);網(wǎng)頁開發(fā)agent通過Playwright執(zhí)行生成代碼并錄制視頻,用多模態(tài)視覺判別器評估動態(tài)布局效果。這種訓(xùn)練方式使模型獲得了類似人類實(shí)習(xí)生的問題解決能力——當(dāng)其他模型還在封閉環(huán)境中做選擇題時,MiMo-V2-Pro已經(jīng)在開放場景中處理綜合任務(wù)。

對于小米而言,MiMo-V2-Pro的意義遠(yuǎn)不止于技術(shù)突破。這家長期被貼上"硬件性價比之王"標(biāo)簽的企業(yè),正通過AI技術(shù)重塑品牌認(rèn)知。2023年雷軍提出的"(軟件×硬件)^AI"戰(zhàn)略,在MiMo-V2-Pro身上得到首次驗(yàn)證:該模型不僅在Artificial Analysis Intelligence Index全球排名中位列前十、中國第二,更通過"云-邊-端"協(xié)同架構(gòu)與小米汽車業(yè)務(wù)形成深度聯(lián)動。云端大模型負(fù)責(zé)復(fù)雜決策和訓(xùn)練,端側(cè)輕量模型處理實(shí)時推理,這種技術(shù)路線在特斯拉Grok與FSD的淺層聯(lián)動面前展現(xiàn)出更清晰的協(xié)同路徑。

但技術(shù)突破的另一面是現(xiàn)實(shí)的挑戰(zhàn)。MiMo-V2-Pro在SWE-bench Verified編程測試集中取得的78.0%得分,因測試集數(shù)據(jù)污染問題引發(fā)爭議。OpenAI研究顯示,多個前沿模型僅憑任務(wù)ID就能復(fù)述正確答案,使得該測試集的參考價值大幅下降。而小米未公布的SWE-bench Pro成績(當(dāng)前最高分僅57.7%)、缺席的ARC-AGI-2推理測試(人類平均60分)和LiveCodeBench v6編程評測,都暴露出模型在抗污染測試和泛化能力上的未知領(lǐng)域。MiMo-V2-Pro權(quán)重未開源的決定,雖以"模型穩(wěn)定性不足"解釋,但也反映出技術(shù)成熟度方面的隱憂。

當(dāng)雷軍在微博寫下"AI領(lǐng)域?qū)嶋H進(jìn)展可能比大家看到的要快很多"時,這場由分?jǐn)?shù)引發(fā)的關(guān)注正在演變?yōu)閷I技術(shù)路線的深度思考。特斯拉Digital Optimus項(xiàng)目試圖構(gòu)建的"慢思考System 2+快反應(yīng)System 1"雙系統(tǒng)架構(gòu),與小米的云端蒸餾路線形成鮮明對比。在AI技術(shù)從實(shí)驗(yàn)室走向產(chǎn)業(yè)應(yīng)用的關(guān)鍵階段,如何平衡技術(shù)創(chuàng)新與商業(yè)落地,如何構(gòu)建真正可持續(xù)的AI生態(tài),將成為決定企業(yè)命運(yùn)的新考題。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
本欄最新