4月8日,Artificial Analysis Video Arena榜單迎來一位新晉“黑馬”——匿名發(fā)布的視頻大模型HappyHorse 1.0。這款模型在短短48小時內,同時登頂文生視頻和圖生視頻兩大核心賽道,引發(fā)行業(yè)震動。就在外界猜測其背景時,阿里巴巴正式宣布,該模型由旗下未來生活實驗室團隊研發(fā),團隊負責人正是快手前副總裁、Kling AI技術負責人張迪。
長期以來,視頻大模型領域呈現“雙雄爭霸”格局:字節(jié)跳動的Seedance穩(wěn)居榜首,快手的可靈緊隨其后。阿里的突然入局并迅速登頂,打破了這一固有格局。更值得關注的是,HappyHorse并非阿里在視頻領域的唯一布局——其公開的主力模型通義萬相,剛剛在4月7日發(fā)布Wan2.7-Video版本,新增復雜動作生成、音畫同步、長視頻編輯等核心功能。這表明,阿里在視頻賽道已形成“雙線并進”的戰(zhàn)略布局。
據內部人士透露,阿里最新架構調整中,通義萬相團隊劃歸通義大模型事業(yè)部,專注底層模型研發(fā);HappyHorse團隊則隸屬AI創(chuàng)新事業(yè)部,更貼近場景應用。這種“內部賽馬”機制,既保證了技術探索的廣度,又通過競爭加速模型迭代。更令人意外的是,阿里方面還透露,另一款與HappyHorse定位不同的多模態(tài)模型即將上線,顯示其正在全面重構視頻與多模態(tài)的戰(zhàn)略優(yōu)先級。
在內部“雙線突圍”的同時,阿里也在外部生態(tài)展開“雙保險”布局。同一時期,阿里領投生數科技B輪20億元融資,這家清華系獨角獸的Vidu模型長期位居視頻榜單前十;此前,阿里還領投了AI視頻生成領軍企業(yè)愛詩科技。通過內部研發(fā)與外部投資結合,阿里既確保技術話語權,又搶占生態(tài)關鍵節(jié)點。這種“內外兼修”的策略,被業(yè)內視為對視頻大模型賽道的“全面押注”。
視頻大模型為何成為阿里戰(zhàn)略重心?行業(yè)分析指出,相比文本模型,視頻模型需同時解決時序一致性、物理運動、鏡頭調度等復雜問題,是多模態(tài)能力的“終極考驗”。掌握視頻技術,意味著在視頻理解、多模態(tài)Agent、新交互方式等前沿領域占據先機。例如,阿里正將AI重點轉向Agent與業(yè)務體系的連接,而生數科技本輪融資明確指向“世界模型”研發(fā),顯示其野心不止于視頻生成,更在布局下一代交互范式。
這一戰(zhàn)略轉向與阿里的資源投入密不可分。今年初,阿里宣布未來三年投入至少3800億元用于AI和云基礎設施建設。視頻大模型因其對算力和云資源的巨大消耗,自然成為重點方向。通過組織架構調整、雙模型研發(fā)、生態(tài)投資三管齊下,阿里正將視頻賽道從“邊緣功能”升級為“能力制高點”。這場突如其來的“黑馬逆襲”,或許只是阿里多模態(tài)戰(zhàn)爭的序幕。















