在人工智能領(lǐng)域,阿里巴巴再次展現(xiàn)強(qiáng)勁實(shí)力。近日,其自主研發(fā)的ABot-PhysWorld模型在世界模型權(quán)威評(píng)測(cè)平臺(tái)WorldArena中脫穎而出,成功登頂榜首。這是繼4月初HappyHorse模型在Artificial Analysis評(píng)測(cè)中奪冠后,阿里在短短半個(gè)月內(nèi)第二次斬獲國(guó)際頂級(jí)AI評(píng)測(cè)桂冠。
WorldArena評(píng)測(cè)體系由清華大學(xué)牽頭,聯(lián)合普林斯頓大學(xué)、新加坡國(guó)立大學(xué)等七所國(guó)內(nèi)外頂尖高校及科研機(jī)構(gòu)共同構(gòu)建。該評(píng)測(cè)通過16項(xiàng)核心指標(biāo)和3類真實(shí)場(chǎng)景任務(wù),對(duì)模型在物理規(guī)律理解、三維空間認(rèn)知、動(dòng)態(tài)預(yù)測(cè)等關(guān)鍵能力進(jìn)行全方位檢驗(yàn)。其評(píng)估標(biāo)準(zhǔn)之嚴(yán)格、測(cè)試場(chǎng)景之復(fù)雜,被業(yè)界視為世界模型領(lǐng)域的"終極考場(chǎng)"。
ABot-PhysWorld的核心突破在于其獨(dú)特的物理推理能力。傳統(tǒng)模型在模擬物體運(yùn)動(dòng)時(shí),往往只能生成短時(shí)靜態(tài)畫面或簡(jiǎn)單裝飾效果,而該模型可精準(zhǔn)預(yù)測(cè)物體在復(fù)雜交互中的運(yùn)動(dòng)軌跡。無論是堆疊物體的倒塌過程、流體的動(dòng)態(tài)變化,還是機(jī)械結(jié)構(gòu)的聯(lián)動(dòng)反應(yīng),都能保持多步驟因果邏輯的連貫性。這種能力使其在機(jī)器人任務(wù)規(guī)劃、工業(yè)異常檢測(cè)等實(shí)際應(yīng)用場(chǎng)景中展現(xiàn)出巨大潛力。
評(píng)測(cè)數(shù)據(jù)顯示,在涉及多物體交互的長(zhǎng)程預(yù)測(cè)任務(wù)中,ABot-PhysWorld的準(zhǔn)確率較第二名提升23%。特別是在流體動(dòng)力學(xué)模擬和剛體碰撞預(yù)測(cè)等高難度項(xiàng)目上,其表現(xiàn)顯著優(yōu)于GigaWorld、Google Veo等國(guó)際知名模型。專家指出,這種突破標(biāo)志著具身智能研究從"感知智能"向"認(rèn)知智能"的重要跨越。
阿里巴巴研發(fā)團(tuán)隊(duì)透露,ABot-PhysWorld采用創(chuàng)新的物理引擎與神經(jīng)網(wǎng)絡(luò)融合架構(gòu),通過構(gòu)建虛擬物理實(shí)驗(yàn)室進(jìn)行強(qiáng)化學(xué)習(xí)。該模型在訓(xùn)練過程中模擬了超過10億種物理場(chǎng)景,形成對(duì)物質(zhì)世界運(yùn)行規(guī)律的深度理解。目前,相關(guān)技術(shù)已應(yīng)用于物流機(jī)器人路徑規(guī)劃、智能制造缺陷檢測(cè)等多個(gè)領(lǐng)域。















