小米公司近日宣布,其自主研發(fā)的大模型MiMo-V2-Pro在國際權(quán)威評測中取得突破性進展。在衡量復(fù)雜邏輯推理能力的Model Rank榜單中,該模型以穩(wěn)定表現(xiàn)躋身全球第五;在實驗室綜合研發(fā)實力評估的LabRank維度,小米在Text Arena(文本競技場)和Code Arena(代碼競技場)分別位列全球第四和第五,展現(xiàn)出強大的技術(shù)積累。
據(jù)介紹,MiMo-V2-Pro是專為Agent時代設(shè)計的旗艦基座模型,針對現(xiàn)實世界中高強度的智能體工作場景優(yōu)化。該模型采用創(chuàng)新的混合注意力架構(gòu),總參數(shù)量超過1T(激活參數(shù)42B),支持1M超長上下文處理能力。其技術(shù)突破體現(xiàn)在從編程(Coding)到機械臂控制(Claw)的跨領(lǐng)域泛化能力,顯著拓展了智能體的動作空間。
在評測機制方面,Text Arena榜單采用的"雙盲測試"模式引發(fā)行業(yè)關(guān)注。該機制通過隱藏模型身份、由全球真實用戶基于回答質(zhì)量實時投票,有效避免了傳統(tǒng)評測中針對特定數(shù)據(jù)集優(yōu)化的問題。這種評估方式更貼近實際應(yīng)用場景,為模型性能提供了更具參考價值的驗證標準。
國際權(quán)威榜單Artificial Analysis的最新數(shù)據(jù)顯示,MiMo-V2-Pro在綜合智能評估中位列全球第八、國內(nèi)第二。自上線以來,該模型已吸引全球開發(fā)者的廣泛關(guān)注,其開放的生態(tài)架構(gòu)為智能體應(yīng)用開發(fā)提供了強大支持。小米持續(xù)加大在Agent場景的算力投入,通過規(guī)模化擴展推動技術(shù)邊界,為人工智能落地更多現(xiàn)實場景奠定基礎(chǔ)。















