小米AI逆襲：雷軍帶隊突圍，大模型賽道給馬斯克“上了一課”？

發(fā)布時間：2026-03-20 18:37 來源：快訊作者：王婷

當(dāng)小米正式發(fā)布MiMo-V2-Pro大模型時，科技圈的目光不約而同地轉(zhuǎn)向了馬斯克——這位以顛覆性創(chuàng)新著稱的企業(yè)家，此刻正因xAI的處境陷入尷尬。2023年成立的xAI雖背靠500億美元融資和OpenAI、DeepMind等頂尖機(jī)構(gòu)的核心團(tuán)隊，但其最新推出的Grok 4.20 Beta在Artificial Analysis Intelligence Index評測中僅獲48分，而小米的MiMo-V2-Pro卻以49分險勝。這場看似偶然的分?jǐn)?shù)超越，實(shí)則揭示了AI賽道競爭格局的微妙變化。

小米的AI征程始于2023年4月成立的AI實(shí)驗(yàn)室大模型團(tuán)隊，但真正發(fā)力是在2024年底至2025年初組建的通用基礎(chǔ)大模型Core團(tuán)隊。這個由雷軍直接推動的項(xiàng)目，在技術(shù)架構(gòu)上并未追求標(biāo)新立異：1T參數(shù)、42B激活參數(shù)、100萬token上下文窗口，以及MoE混合專家架構(gòu)等設(shè)計，均屬于行業(yè)主流方案。真正讓MiMo-V2-Pro脫穎而出的，是其獨(dú)創(chuàng)的后訓(xùn)練技術(shù)體系。

針對大模型訓(xùn)練中普遍存在的"蹺蹺板效應(yīng)"——強(qiáng)化某一能力時必然削弱其他能力，小米研發(fā)了MOPD（多教師在線策略蒸餾）技術(shù)。該技術(shù)通過構(gòu)建代碼、搜索、數(shù)學(xué)推理等領(lǐng)域的專家教師模型，讓學(xué)生模型在生成回答時同時接受多個教師的實(shí)時監(jiān)督。這種訓(xùn)練方式不僅使模型在AIME 2025數(shù)學(xué)競賽中取得94.1分，更突破性地讓部分學(xué)生模型超越了教師水平。北京大學(xué)計算機(jī)學(xué)院參與研發(fā)的ARL-Tangram訓(xùn)練基礎(chǔ)設(shè)施系統(tǒng)，則通過動態(tài)資源分配解決了傳統(tǒng)RL框架中97%算力空轉(zhuǎn)的問題，將外部資源消耗降低71.2%。

在真實(shí)場景訓(xùn)練方面，小米構(gòu)建了覆蓋代碼、終端、網(wǎng)頁開發(fā)和通用任務(wù)的四大類場景體系。代碼agent直接從GitHub Issues中提取訓(xùn)練數(shù)據(jù)，在修改代碼、運(yùn)行測試、查看報錯的完整閉環(huán)中學(xué)習(xí)；網(wǎng)頁開發(fā)agent通過Playwright執(zhí)行生成代碼并錄制視頻，用多模態(tài)視覺判別器評估動態(tài)布局效果。這種訓(xùn)練方式使模型獲得了類似人類實(shí)習(xí)生的問題解決能力——當(dāng)其他模型還在封閉環(huán)境中做選擇題時，MiMo-V2-Pro已經(jīng)在開放場景中處理綜合任務(wù)。

對于小米而言，MiMo-V2-Pro的意義遠(yuǎn)不止于技術(shù)突破。這家長期被貼上"硬件性價比之王"標(biāo)簽的企業(yè)，正通過AI技術(shù)重塑品牌認(rèn)知。2023年雷軍提出的"（軟件×硬件）^AI"戰(zhàn)略，在MiMo-V2-Pro身上得到首次驗(yàn)證：該模型不僅在Artificial Analysis Intelligence Index全球排名中位列前十、中國第二，更通過"云-邊-端"協(xié)同架構(gòu)與小米汽車業(yè)務(wù)形成深度聯(lián)動。云端大模型負(fù)責(zé)復(fù)雜決策和訓(xùn)練，端側(cè)輕量模型處理實(shí)時推理，這種技術(shù)路線在特斯拉Grok與FSD的淺層聯(lián)動面前展現(xiàn)出更清晰的協(xié)同路徑。

但技術(shù)突破的另一面是現(xiàn)實(shí)的挑戰(zhàn)。MiMo-V2-Pro在SWE-bench Verified編程測試集中取得的78.0%得分，因測試集數(shù)據(jù)污染問題引發(fā)爭議。OpenAI研究顯示，多個前沿模型僅憑任務(wù)ID就能復(fù)述正確答案，使得該測試集的參考價值大幅下降。而小米未公布的SWE-bench Pro成績（當(dāng)前最高分僅57.7%）、缺席的ARC-AGI-2推理測試（人類平均60分）和LiveCodeBench v6編程評測，都暴露出模型在抗污染測試和泛化能力上的未知領(lǐng)域。MiMo-V2-Pro權(quán)重未開源的決定，雖以"模型穩(wěn)定性不足"解釋，但也反映出技術(shù)成熟度方面的隱憂。

當(dāng)雷軍在微博寫下"AI領(lǐng)域?qū)嶋H進(jìn)展可能比大家看到的要快很多"時，這場由分?jǐn)?shù)引發(fā)的關(guān)注正在演變?yōu)閷I技術(shù)路線的深度思考。特斯拉Digital Optimus項(xiàng)目試圖構(gòu)建的"慢思考System 2+快反應(yīng)System 1"雙系統(tǒng)架構(gòu)，與小米的云端蒸餾路線形成鮮明對比。在AI技術(shù)從實(shí)驗(yàn)室走向產(chǎn)業(yè)應(yīng)用的關(guān)鍵階段，如何平衡技術(shù)創(chuàng)新與商業(yè)落地，如何構(gòu)建真正可持續(xù)的AI生態(tài)，將成為決定企業(yè)命運(yùn)的新考題。

更多>同類內(nèi)容