字節(jié)跳動近期推出的視頻生成模型Seedance 2.0在AI創(chuàng)作領(lǐng)域引發(fā)廣泛關(guān)注。這款被業(yè)內(nèi)稱為"中國版Sora"的模型,憑借其獨特的雙分支擴散架構(gòu),正在重塑短視頻內(nèi)容生產(chǎn)模式。與傳統(tǒng)模型逐幀生成的方式不同,Seedance 2.0通過引入長期時序控制機制,實現(xiàn)了畫面連貫性與敘事邏輯的雙重突破。該模型在生成15秒短視頻時,角色面容、動作軌跡和鏡頭切換都能保持高度一致性,有效解決了早期AI視頻常見的"角色漂移"和"畫面崩壞"等問題。
四川大學數(shù)字融合實驗室專家宋耀指出,Seedance 2.0的架構(gòu)創(chuàng)新體現(xiàn)在將畫面生成與敘事控制分離。其核心由兩個并行分支構(gòu)成:擴散模型分支負責高質(zhì)量圖像幀的生成,Transformer分支則承擔"導(dǎo)演"角色,統(tǒng)籌人物身份、動作軌跡和鏡頭邏輯。這種設(shè)計使模型能在持續(xù)的"世界狀態(tài)"中推進畫面,確保角色在不同鏡頭間保持特征統(tǒng)一,動作符合物理規(guī)律。海外評測顯示,該模型在角色一致性和多鏡頭敘事方面已超越Sora 2,這得益于其訓(xùn)練數(shù)據(jù)中大量連續(xù)劇情短視頻的支撐。
AIGC創(chuàng)作者劉歸源的實踐驗證了這種技術(shù)優(yōu)勢。他使用Seedance 2.0制作15秒動畫時,僅需半小時即可完成從腳本到成片的全部流程。而在傳統(tǒng)工作流中,制作30秒視頻需要生成200-300張圖片,經(jīng)過反復(fù)修改和手動拼接,耗時長達數(shù)小時。這種效率提升正在改變內(nèi)容生產(chǎn)格局——某豎屏短劇團隊透露,采用AI工具后,原本需要5-10人一個月完成的項目,現(xiàn)在人力需求減半。影視設(shè)備租賃市場也受到?jīng)_擊,高端電影機的日租金從五六千元降至千元水平。
盡管在工業(yè)化內(nèi)容生產(chǎn)領(lǐng)域表現(xiàn)突出,Seedance 2.0仍面臨藝術(shù)創(chuàng)作層面的挑戰(zhàn)。劉歸源演示的失敗案例顯示,當涉及復(fù)雜空間關(guān)系時,模型仍會出錯:比如小貓?zhí)献雷雍螅郎系乃伾赡芡蝗桓淖儭_@種基礎(chǔ)的空間記憶缺陷,暴露出AI在理解真實世界交互時的局限性。創(chuàng)作者們普遍認為,AI目前更適合處理重復(fù)性內(nèi)容生產(chǎn),而需要情感表達和創(chuàng)新構(gòu)思的電影級作品,仍需人類創(chuàng)作者主導(dǎo)。宋耀將Seedance 2.0定位為"內(nèi)容生產(chǎn)流水線",強調(diào)其在成本效率和穩(wěn)定可控性上的優(yōu)勢,認為該模型更適合商業(yè)短視頻、廣告和電商內(nèi)容的批量生成。
這場由技術(shù)驅(qū)動的內(nèi)容生產(chǎn)革命,正在重塑行業(yè)生態(tài)。字節(jié)跳動內(nèi)部人士透露,目前正大規(guī)模向創(chuàng)作者推送Seedance 2.0使用手冊,加速工具普及。隨著模型持續(xù)迭代,未來可能形成"提示詞工程師"等新職業(yè),而傳統(tǒng)影視制作流程中的某些環(huán)節(jié)或?qū)⒈粡氐字貥?gòu)。不過,多位受訪者強調(diào),AI始終是輔助工具,真正具有藝術(shù)價值的創(chuàng)作,仍需依賴人類的審美判斷和創(chuàng)新能力。















