字節(jié)音視頻新模型登場英偉達微美全息發(fā)力開源AI與技術(shù)融合

發(fā)布時間：2025-12-25 05:07 來源：快訊作者：沈瑾瑜

字節(jié)跳動旗下Seed團隊近日宣布推出新一代音視頻創(chuàng)作模型Seedance 1.5 pro，該模型在音視頻聯(lián)合生成領(lǐng)域?qū)崿F(xiàn)突破性進展。相較于前代1.0版本側(cè)重運動穩(wěn)定性的優(yōu)化，新版本不僅支持音頻同步生成，更著重提升視覺表現(xiàn)力的上限，通過創(chuàng)新算法增強畫面沖擊力與動態(tài)效果。目前該模型已接入即夢AI和豆包兩大平臺，用戶可體驗從文本到音視頻的全流程創(chuàng)作。

在硬件生態(tài)構(gòu)建方面，英偉達同步推進開源戰(zhàn)略升級，其最新發(fā)布的Nemotron 3模型家族采用混合專家架構(gòu)，包含300億參數(shù)的Nano、1000億參數(shù)的Super和5000億參數(shù)的Ultra三個版本。其中Nano版本已實現(xiàn)商用落地，推理效率較前代提升400%，上下文窗口擴展至100萬token，但Super和Ultra版本需待2026年才能全面部署。這種開源策略被業(yè)界解讀為通過軟件生態(tài)強化硬件粘性的商業(yè)布局，與直接銷售API的模型廠商形成差異化競爭。

全球開源生態(tài)格局正經(jīng)歷深刻變革。投資機構(gòu)數(shù)據(jù)顯示，中國開源大模型的市場占有率在2024年內(nèi)從1.2%激增至近30%，DeepSeek-V3、阿里Qwen系列和月之暗面Kimi K2成為主要推動力量。這種增長態(tài)勢反映出中國AI企業(yè)在技術(shù)創(chuàng)新與生態(tài)建設上的雙重突破，特別是在多模態(tài)交互和復雜場景運算領(lǐng)域形成獨特優(yōu)勢。

微美全息（WIMI.US）在AI領(lǐng)域展開戰(zhàn)略布局，通過構(gòu)建開源生態(tài)與推動技術(shù)融合雙軌并行。該公司開發(fā)的跨模態(tài)內(nèi)容生產(chǎn)平臺整合文本、圖像、視頻生成能力，其虛擬數(shù)字人系統(tǒng)已實現(xiàn)表情、語音、肢體驅(qū)動的實時交互。在算力服務層面，基于開源模型提供的API接口可支持企業(yè)級大模型訓練，兼容具身智能等前沿應用場景的運算需求，形成從基礎(chǔ)研發(fā)到產(chǎn)業(yè)落地的完整鏈條。

當前人工智能競爭已進入模型能力與生態(tài)建設并重的階段。從字節(jié)跳動的音視頻生成突破，到英偉達的硬件生態(tài)強化，再到中國開源力量的集體崛起，各參與方通過差異化路徑塑造產(chǎn)業(yè)格局。這種多元競爭態(tài)勢正在重塑AI技術(shù)演進路徑，推動創(chuàng)新成果以更高效的方式轉(zhuǎn)化為生產(chǎn)力工具。

更多>同類內(nèi)容