阿里HappyHorse-1.0模型登頂AI評測榜音視頻同步生成且已開源

發(fā)布時間：2026-04-09 23:24 來源：快訊作者：陸辰風

近日，全球人工智能領域迎來一則重磅消息：一款名為HappyHorse-1.0的新型視頻生成模型悄然問世，并在國際權威AI評測平臺Artificial Analysis的Video Arena榜單中斬獲佳績。該模型由阿里巴巴旗下淘天集團未來生活實驗室研發(fā)，在沒有大規(guī)模宣傳的情況下，直接登頂文本轉(zhuǎn)視頻和圖像轉(zhuǎn)視頻（無音頻）類別的全球榜首，同時在帶音頻類別中位列第二，引發(fā)行業(yè)高度關注。

根據(jù)公開技術資料，HappyHorse-1.0采用40層單流自注意力Transformer架構，參數(shù)量達150億，具備原生音視頻同步生成能力。這一特性使其無需后期配音或口型對齊處理，即可直接輸出高質(zhì)量視頻內(nèi)容。在性能測試中，該模型在單張H100顯卡上生成1080p分辨率視頻僅需約38秒，顯著優(yōu)于同類產(chǎn)品。

在評測平臺公布的Elo評分體系中，HappyHorse-1.0以1357分的成績超越字節(jié)跳動Seedance 2.0等競爭對手。其多語言支持能力同樣突出，目前可處理英語、普通話、粵語、日語、韓語、德語和法語七種語言的輸入指令，覆蓋全球主要語言市場。技術團隊透露，模型通過DMD-2蒸餾技術優(yōu)化了計算效率，這是實現(xiàn)高速生成的關鍵突破。

值得關注的是，研發(fā)方選擇在4月9日同步開源該模型代碼，此舉或?qū)⒓铀僖曨l生成技術的普及進程。行業(yè)分析師指出，HappyHorse-1.0的推出標志著AI視頻生成領域進入新的競爭階段，其架構設計和工程實現(xiàn)對后續(xù)研發(fā)具有重要參考價值。不過目前官方尚未公布具體應用場景，市場正持續(xù)關注其商業(yè)化落地進展。

更多>同類內(nèi)容