全球人工智能領(lǐng)域近日迎來重大突破,中國科技企業(yè)螞蟻集團(tuán)旗下靈波科技連續(xù)四天發(fā)布四大開源模型,引發(fā)行業(yè)震動(dòng)。這一系列動(dòng)作不僅展示了中國在具身智能領(lǐng)域的技術(shù)實(shí)力,更標(biāo)志著世界模型競賽從封閉研發(fā)向開放生態(tài)的重大轉(zhuǎn)變。緊隨其后,谷歌宣布開放其世界模型項(xiàng)目體驗(yàn)平臺,兩大科技巨頭的隔空交鋒,為AI發(fā)展開辟了新的競爭維度。
螞蟻靈波的開源攻勢始于空間感知模型LingBot-Depth的發(fā)布。該模型針對機(jī)器人三維視覺精度與可靠性進(jìn)行優(yōu)化,在國際基準(zhǔn)測試中表現(xiàn)優(yōu)異,為智能終端提供了更精準(zhǔn)的空間理解能力。次日發(fā)布的具身大模型LingBot-VLA則基于超過2萬小時(shí)的真實(shí)機(jī)器人數(shù)據(jù)訓(xùn)練,覆蓋9種主流雙臂機(jī)器人構(gòu)型,通過少量演示數(shù)據(jù)即可實(shí)現(xiàn)高質(zhì)量任務(wù)遷移,顯著降低了下游應(yīng)用的適配成本。這兩款模型的開源,為具身智能的落地應(yīng)用奠定了堅(jiān)實(shí)基礎(chǔ)。
真正引發(fā)行業(yè)關(guān)注的是第三日發(fā)布的世界模型LingBot-World。該模型能夠?yàn)榫呱碇悄堋⒆詣?dòng)駕駛及游戲開發(fā)提供高保真虛擬環(huán)境,其視頻生成質(zhì)量、動(dòng)態(tài)程度和長時(shí)一致性等指標(biāo)可媲美谷歌同期發(fā)布的Genie 3模型。更引人注目的是,LingBot-World成功解決了視頻生成中的“長時(shí)漂移”難題,支持近10分鐘的連續(xù)穩(wěn)定生成,并將交互延遲控制在1秒以內(nèi),用戶可通過文本或操作實(shí)時(shí)改變環(huán)境。這一突破為AI智能體的訓(xùn)練提供了更高效、更經(jīng)濟(jì)的解決方案。
螞蟻靈波的開源攻勢并未止步。第四日發(fā)布的具身世界模型LingBot-VA提出了自回歸視頻-動(dòng)作世界建模框架,將視頻生成與機(jī)器人控制深度融合。該模型在生成“下一步世界狀態(tài)”的同時(shí),直接推演并輸出對應(yīng)的動(dòng)作序列,使機(jī)器人能夠像人類一樣“邊推演、邊行動(dòng)”。這一創(chuàng)新為“世界模型賦能具身操作”開辟了新路徑,與前幾日發(fā)布的模型形成完整技術(shù)閉環(huán)。
螞蟻靈波的開源策略得到了國際媒體的廣泛認(rèn)可。德國財(cái)經(jīng)媒體AdHocNews評論稱,LingBot-World為開發(fā)者提供了一個(gè)高品質(zhì)、可實(shí)時(shí)控制的平臺,其性能與谷歌領(lǐng)先模型相當(dāng),但完全面向開發(fā)者開放。該媒體指出,這一舉措將極大加速實(shí)時(shí)智能體的發(fā)展,使機(jī)器人能夠在模擬環(huán)境中成千上萬次地演練復(fù)雜場景,既安全又經(jīng)濟(jì)。法國科技媒體PauseHardware也認(rèn)為,若LingBot-World在長時(shí)序一致性和控制能力上得到驗(yàn)證,將推動(dòng)具身智能領(lǐng)域邁向新階段。
面對螞蟻靈波的開源攻勢,谷歌迅速作出反應(yīng)。在螞蟻靈波宣布世界模型開源后不到24小時(shí),谷歌DeepMind宣布面向美國地區(qū)18歲以上的Google AI Ultra訂閱用戶開放其世界模型研究原型“Project Genie”的體驗(yàn)。該原型基于Genie 3模型構(gòu)建,允許用戶通過文本提示或上傳圖像創(chuàng)建、探索和混合生成交互式世界,聚焦“世界草圖繪制”“世界探索”和“世界混創(chuàng)”三大功能。然而,谷歌也坦承該原型尚處于早期階段,存在生成效果不夠逼真、操作延遲較高、單次生成時(shí)長限制為60秒等局限。
螞蟻靈波與谷歌的不同策略反映了兩者在生態(tài)構(gòu)建上的差異。螞蟻靈波通過徹底開源,快速吸引開發(fā)者構(gòu)建應(yīng)用生態(tài),旨在具身智能等新興領(lǐng)域確立事實(shí)標(biāo)準(zhǔn),并反哺技術(shù)迭代。而谷歌則采取更為謹(jǐn)慎的“可控開放”策略,通過訂閱制面向高端用戶開放體驗(yàn)入口,旨在收集用戶反饋并控制風(fēng)險(xiǎn),同時(shí)保持其核心技術(shù)控制力。AI技術(shù)評測網(wǎng)站Gaga.art直接對比指出,LingBot-World在質(zhì)量上與Google Genie 3相當(dāng),但完全面向開發(fā)者開放,這一差異或?qū)⒂绊懳磥鞟I生態(tài)的格局。
此次螞蟻靈波在核心模型上的開源舉措,被行業(yè)專家視為打破技術(shù)壁壘的重要一步。此前,這類高質(zhì)量訓(xùn)練環(huán)境通常是專有的,成本高昂,限制了中小開發(fā)者的參與。如今,隨著螞蟻靈波的開源,每位開發(fā)者都能接觸到工業(yè)標(biāo)準(zhǔn)技術(shù),這將極大促進(jìn)具身智能等領(lǐng)域的創(chuàng)新與發(fā)展。正如AdHocNews援引行業(yè)專家觀點(diǎn)稱,螞蟻集團(tuán)的舉措正在重塑全球機(jī)器人領(lǐng)域的競爭格局,中國科技企業(yè)正逐步從技術(shù)追隨者轉(zhuǎn)變?yōu)橐?guī)則制定者。















