阿里巴巴旗下ATH創(chuàng)新事業(yè)部研發(fā)的AI視頻生成模型HappyHorse-1.0,今日正式在Arena平臺開啟公開測試。這款具備文本轉(zhuǎn)視頻、圖像轉(zhuǎn)視頻及音頻生成能力的多模態(tài)模型,此前已以"歡樂馬"的代號登頂Artificial Analysis的AI Video Arena排行榜,超越字節(jié)跳動(dòng)Seedance和快手可靈等同類產(chǎn)品。
開發(fā)團(tuán)隊(duì)透露,該模型在視頻編輯領(lǐng)域展現(xiàn)出卓越性能,尤其在動(dòng)態(tài)場景渲染、光影效果處理等核心指標(biāo)上表現(xiàn)突出。目前項(xiàng)目組正根據(jù)早期測試反饋進(jìn)行最后優(yōu)化,為兩周后的正式發(fā)布做沖刺準(zhǔn)備。用戶可通過社區(qū)體驗(yàn)入口參與測試,其反饋將直接影響模型最終版本的穩(wěn)定性與功能完善度。
回溯項(xiàng)目發(fā)展歷程,這款神秘模型最早于本月上旬引發(fā)行業(yè)關(guān)注。當(dāng)時(shí)Artificial Analysis排行榜突然出現(xiàn)名為"HappyHorse"的黑馬,在未公布研發(fā)方的情況下連續(xù)三周占據(jù)榜首。直至4月10日,阿里巴巴才正式認(rèn)領(lǐng)該項(xiàng)目,確認(rèn)其為ATH創(chuàng)新事業(yè)部內(nèi)部代號"ATH-V"的研發(fā)成果,并透露該模型已進(jìn)入商業(yè)化前夕的內(nèi)測階段。
技術(shù)文檔顯示,HappyHorse-1.0采用創(chuàng)新性的時(shí)空注意力機(jī)制,在保持視頻生成效率的同時(shí),顯著提升了多物體交互場景的真實(shí)感。其獨(dú)特的音頻生成模塊可自動(dòng)匹配視頻節(jié)奏,實(shí)現(xiàn)聲畫同步的沉浸式體驗(yàn)。目前測試版本已支持最長8秒的視頻生成,分辨率最高可達(dá)1080P。















