在1956年的經(jīng)典科幻電影《禁忌星球》中,一個(gè)名為Robby的機(jī)器人成為人類對(duì)機(jī)器人技術(shù)最早的想象之一。這個(gè)力大無窮且邏輯嚴(yán)密的機(jī)器人,被設(shè)定了一條不可違背的規(guī)則——不能傷害人類。七十年后,螞蟻集團(tuán)以Robby為靈感,推出了旗下具身智能公司的新品牌“螞蟻靈波”,從Robby到Robbyant,最終定格為如今的名稱。
此前,外界對(duì)螞蟻靈波的了解大多停留在2025年外灘大會(huì)上展示的R1機(jī)器人,這款會(huì)炒菜的機(jī)器人更像是一個(gè)技術(shù)展示的Demo。然而,在2026年1月底,螞蟻靈波通過密集發(fā)布四個(gè)具身智能模型,徹底改變了這一印象。這四個(gè)模型分別是LingBot-Depth、LingBot-VLA、LingBot-World和LingBot-VA,并同步開放了模型權(quán)重和代碼。LingBot-Depth還開源了200萬對(duì)高質(zhì)量RGB-深度配對(duì)數(shù)據(jù)集,LingBot-VLA則開源了完整的后訓(xùn)練工具鏈。這一幾乎完全透明的發(fā)布方式在開源社區(qū)引發(fā)了廣泛關(guān)注。
其中,LingBot-World作為世界模型,能夠生成高保真、高動(dòng)態(tài)的物理交互場(chǎng)景,其效果迅速登頂X平臺(tái)科技板塊熱榜和Hugging Face熱門論文榜。然而,螞蟻靈波的選擇遠(yuǎn)不止于此。在具身智能領(lǐng)域,技術(shù)路線尚未統(tǒng)一,螞蟻靈波選擇了一條更慢但更扎實(shí)的發(fā)展路徑。
在VLA模型的訓(xùn)練中,螞蟻靈波團(tuán)隊(duì)與星海圖、松靈機(jī)器人等合作伙伴積累了約20,000小時(shí)的真實(shí)世界操作數(shù)據(jù),涵蓋9種主流雙臂機(jī)器人配置。這一數(shù)據(jù)規(guī)模是當(dāng)前開源社區(qū)中最大的,并在GM-100的真機(jī)測(cè)評(píng)中取得了超越Pi0.5的高分。同時(shí),螞蟻靈波還率先推出了業(yè)界首個(gè)自回歸視覺—?jiǎng)幼魇澜缒P停M(jìn)一步展示了其在具身智能領(lǐng)域的領(lǐng)先地位。LingBot-VA發(fā)布不到一周,英偉達(dá)也推出了類似的VA模型。
螞蟻靈波首席科學(xué)家沈宇軍在接受專訪時(shí)表示,具身智能仍處于“GPT-1時(shí)刻”,數(shù)據(jù)稀缺和范式未定是當(dāng)前的主要挑戰(zhàn)。基于這一判斷,螞蟻靈波構(gòu)建了一套完整的體系,包括LingBot-Depth用于解決感知層的“看不清”問題,LingBot-World負(fù)責(zé)世界模擬與數(shù)據(jù)生成,LingBot-VLA基于海量真實(shí)數(shù)據(jù)學(xué)會(huì)執(zhí)行基礎(chǔ)動(dòng)作,LingBot-VA則引入因果預(yù)測(cè)探索更高層次的規(guī)劃和控制能力。沈宇軍將這一體系形容為“四個(gè)模型‘一盤棋’”,它們是同一系統(tǒng)中的不同模塊,而非彼此獨(dú)立。
在團(tuán)隊(duì)內(nèi)部,圍繞技術(shù)路線的爭論并不少見,但一旦方向確定,所有人都會(huì)全力以赴。這種精神也體現(xiàn)在螞蟻靈波對(duì)開源的堅(jiān)定支持上。沈宇軍表示,開源不僅是為了避免成為“井底之蛙”,更是為了讓社區(qū)發(fā)現(xiàn)那些內(nèi)部難以預(yù)料的漏洞和用法。通過提供完整的代碼和數(shù)據(jù)管線,螞蟻靈波希望為學(xué)界提供一個(gè)“能站上去的底座”,而不是讓每個(gè)人都從零開始。
在具身智能的數(shù)據(jù)路線上,螞蟻靈波堅(jiān)定選擇了“真機(jī)數(shù)據(jù)”,而對(duì)“合成數(shù)據(jù)”持保留態(tài)度。沈宇軍解釋說,真機(jī)采集的成本下降速度將快于物理引擎的質(zhì)變速度。在基座模型階段,真實(shí)數(shù)據(jù)的物理保真度是仿真數(shù)據(jù)無法比擬的。因此,螞蟻靈波選擇了一條“慢”但正確的路。
對(duì)于未來,沈宇軍認(rèn)為具身智能模型仍處于早期階段,類似于語言模型的GPT-1時(shí)刻。他預(yù)計(jì),至少需要三年時(shí)間才能解決數(shù)據(jù)采集、選擇和訓(xùn)練原生基礎(chǔ)模型等關(guān)鍵問題。如果行業(yè)能夠加速合作,2026年至2028年可能會(huì)分別跨過這些節(jié)點(diǎn)。螞蟻靈波的下一步計(jì)劃包括擴(kuò)大數(shù)據(jù)規(guī)模、針對(duì)性地彌補(bǔ)多模態(tài)和視頻生成的短板,以及提升機(jī)器人的移動(dòng)能力。
當(dāng)被問及螞蟻靈波的“獨(dú)門武器”時(shí),沈宇軍強(qiáng)調(diào)了團(tuán)隊(duì)的核心優(yōu)勢(shì)。這支團(tuán)隊(duì)在想象力、工程能力和耐力上都非常強(qiáng),且得到了螞蟻集團(tuán)在算力、存儲(chǔ)和工程體系上的扎實(shí)支持。他特別提到,2025年11月底是團(tuán)隊(duì)的一個(gè)重要時(shí)刻,當(dāng)時(shí)LingBot-Depth模型首次在真實(shí)測(cè)試中跑贏現(xiàn)有方案,打響了第一槍,讓團(tuán)隊(duì)相信這條路能走通。















