在12月18日的小米人車家全生態(tài)大會上,一款名為MiMo-V2-Flash的新模型成為焦點。這款由“天才少女”羅福莉主導開發(fā)的模型,標志著小米在人工智能領域邁出了關鍵一步。盡管參數(shù)規(guī)模僅為309B、激活參數(shù)15B,但其性能表現(xiàn)卻引發(fā)行業(yè)關注,特別是在代碼生成和智能體交互能力方面展現(xiàn)出獨特優(yōu)勢。
該模型的核心突破在于實現(xiàn)了性能與成本的平衡。測試數(shù)據(jù)顯示,其代碼生成速度達到每秒150 tokens,推理成本僅為Claude Sonnet 4.5的2.5%,而生成速度卻是后者的兩倍。在SWE-Bench Multilingual基準測試中,MiMo-V2-Flash甚至超越了GPT-5等閉源模型,展現(xiàn)出強大的多語言軟件工程能力。這種表現(xiàn)得益于小米采用的混合注意力機制——通過5:1比例的滑動窗口注意力與全局注意力組合,既保證了長文本處理能力,又優(yōu)化了計算效率。
小米的AI戰(zhàn)略呈現(xiàn)出清晰的雙軌布局。在智能終端領域,公司正著力升級“超級小愛”和澎湃OS系統(tǒng),目標是將設備從被動響應指令轉(zhuǎn)變?yōu)橹鲃又悄苤帧6谥悄荞{駛方向,大模型技術被視為突破現(xiàn)有技術瓶頸的關鍵。今年11月發(fā)布的MiMo-Embodied具身智能模型,已實現(xiàn)自動駕駛與機器人技術的底層打通,為跨場景知識遷移提供了解決方案。
技術落地的背后是持續(xù)加碼的研發(fā)投入。小米集團總裁盧偉冰透露,2025年研發(fā)預算將突破300億元,其中四分之一直接投向AI領域,未來五年計劃累計投入超2000億元。組織架構(gòu)上,公司已建成自主AI基礎設施平臺,并組建了包含6500張GPU的算力集群。人才方面,除羅福莉負責基礎模型研發(fā)外,還引入智駕專家陳龍團隊,形成“雙核驅(qū)動”的技術架構(gòu)。
這種技術布局正逐步轉(zhuǎn)化為產(chǎn)品競爭力。MiMo-V2-Flash的API定價策略顯示,輸入成本控制在0.7元/百萬tokens,輸出成本2.1元/百萬tokens,在同類模型中具備顯著價格優(yōu)勢。盡管309B的參數(shù)規(guī)模距離端側(cè)部署仍有差距,但小米通過模塊化設計,已實現(xiàn)模型在車載系統(tǒng)和智能家居設備的部分功能嵌入。
行業(yè)觀察人士指出,小米的AI戰(zhàn)略與其硬件生態(tài)形成深度協(xié)同。全球超過10億臺的設備連接量,為模型訓練提供了海量真實場景數(shù)據(jù)。這種“硬件+AI”的組合模式,既解決了端側(cè)算力限制問題,又通過持續(xù)反饋優(yōu)化模型性能。隨著MiMo系列模型的迭代升級,小米正在構(gòu)建覆蓋手機、家居、出行三大場景的智能生態(tài)閉環(huán)。















