近日,全球人工智能領域迎來一則重磅消息:一款名為HappyHorse-1.0的新型視頻生成模型悄然問世,并在國際權威AI評測平臺Artificial Analysis的Video Arena榜單中斬獲佳績。該模型由阿里巴巴旗下淘天集團未來生活實驗室研發(fā),在沒有大規(guī)模宣傳的情況下,直接登頂文本轉(zhuǎn)視頻和圖像轉(zhuǎn)視頻(無音頻)類別的全球榜首,同時在帶音頻類別中位列第二,引發(fā)行業(yè)高度關注。
根據(jù)公開技術資料,HappyHorse-1.0采用40層單流自注意力Transformer架構,參數(shù)量達150億,具備原生音視頻同步生成能力。這一特性使其無需后期配音或口型對齊處理,即可直接輸出高質(zhì)量視頻內(nèi)容。在性能測試中,該模型在單張H100顯卡上生成1080p分辨率視頻僅需約38秒,顯著優(yōu)于同類產(chǎn)品。
在評測平臺公布的Elo評分體系中,HappyHorse-1.0以1357分的成績超越字節(jié)跳動Seedance 2.0等競爭對手。其多語言支持能力同樣突出,目前可處理英語、普通話、粵語、日語、韓語、德語和法語七種語言的輸入指令,覆蓋全球主要語言市場。技術團隊透露,模型通過DMD-2蒸餾技術優(yōu)化了計算效率,這是實現(xiàn)高速生成的關鍵突破。
值得關注的是,研發(fā)方選擇在4月9日同步開源該模型代碼,此舉或?qū)⒓铀僖曨l生成技術的普及進程。行業(yè)分析師指出,HappyHorse-1.0的推出標志著AI視頻生成領域進入新的競爭階段,其架構設計和工程實現(xiàn)對后續(xù)研發(fā)具有重要參考價值。不過目前官方尚未公布具體應用場景,市場正持續(xù)關注其商業(yè)化落地進展。















