一款名為千問的移動(dòng)端AI助手近日迎來重大升級(jí),其接入的阿里萬相系列最新模型Wan2.5,讓視頻創(chuàng)作能力實(shí)現(xiàn)質(zhì)的飛躍。這款模型不僅將動(dòng)作精度與肢體協(xié)調(diào)性提升至全新高度,更成為首個(gè)支持音視頻同步輸出的移動(dòng)端工具,為用戶帶來前所未有的創(chuàng)作體驗(yàn)。
萬相2.5的突破性在于其多模態(tài)處理能力。作為業(yè)界少數(shù)具備音畫同步技術(shù)的視頻模型,它能夠同時(shí)完成理解與生成任務(wù),支持文本、圖像、視頻、音頻的跨模態(tài)輸入輸出。在權(quán)威評(píng)測平臺(tái)LMArena的全球排名中,該模型的圖生視頻能力位列第三,穩(wěn)居國內(nèi)榜首,彰顯其技術(shù)領(lǐng)先性。
在千問APP的實(shí)際應(yīng)用中,用戶僅需上傳一張照片并輸入文字描述,即可生成1080P高清視頻。無論是真人肖像、萌寵動(dòng)態(tài),還是二次元角色、文物形象,系統(tǒng)都能精準(zhǔn)還原肢體動(dòng)作與口型匹配,最長支持10秒視頻生成。例如輸入"小貓邊唱歌邊跳舞"的指令,靜態(tài)圖片中的角色立即"活"過來,呈現(xiàn)自然流暢的表演效果。
該功能上線后迅速引爆社交平臺(tái),網(wǎng)友創(chuàng)作出大量創(chuàng)意作品。從兵馬俑說唱到文物合唱團(tuán),從萌寵街舞到卡通角色音樂劇,千問APP讓靜態(tài)形象突破次元壁,以動(dòng)態(tài)形式重新演繹經(jīng)典場景。這種"照片唱跳"的新玩法,正重新定義數(shù)字時(shí)代的創(chuàng)意表達(dá)方式。
數(shù)據(jù)顯示,千問APP公測首周下載量即突破千萬次,在AI應(yīng)用領(lǐng)域創(chuàng)下增長新紀(jì)錄。其技術(shù)突破不僅體現(xiàn)在視頻質(zhì)量提升,更在于通過智能化操作流程,讓普通用戶也能輕松掌握專業(yè)級(jí)視頻制作技術(shù),為數(shù)字內(nèi)容創(chuàng)作開辟了全新可能。















