媒體界 - 推動中國媒體行業創新,促進業內人士交流分享!

字節跳動Seeduplex大模型上線豆包App,語音交互更自然流暢貼近真人節奏

   發布時間:2026-04-09 23:37 作者:江紫萱

字節跳動近日正式發布全新原生全雙工語音大模型Seeduplex,這款基于“邊聽邊說”架構設計的模型,標志著語音交互技術向更自然的方向邁出關鍵一步。相較于傳統半雙工語音系統需要等待用戶完整表達后再回應的“回合制”模式,Seeduplex實現了實時傾聽、內容生成與節奏判斷的同步進行,顯著提升了對話的流暢度與真實感。

技術測試數據顯示,在咖啡廳等復雜聲學環境中,Seeduplex通過多維度聲學分析技術,可精準分離用戶語音與背景噪音。與前代半雙工模型相比,其誤回復率與誤打斷率均降低50%,即便在多人交談或設備移動產生的干擾下,仍能保持穩定識別。當用戶出現思考停頓或臨時中斷對話時,模型通過融合語音停頓時長、音調變化及語義完整性等特征,將搶話現象減少40%,判停延遲縮短至250毫秒以內,使交互節奏更貼近人類對話習慣。

該模型在上下文理解能力上亦有突破性表現。在飛花令、模擬面試等需要連續記憶的場景中,Seeduplex可基于部分語義信息提前預判用戶意圖,實現“未說完先回應”的智能交互。第三方評估機構使用MOS(平均意見分)體系測評顯示,其對話流暢度得分較傳統模型提升12%,尤其在多輪復雜對話中,能動態維護長達20輪以上的上下文記憶鏈。

目前Seeduplex已通過豆包App向全體用戶開放服務。字節跳動語音技術團隊透露,未來將持續優化模型在方言識別、情感表達等維度的性能,并探索車載語音助手、智能客服等場景的深度應用。值得注意的是,盡管技術進步顯著,語音交互領域仍存在數據隱私、倫理規范等挑戰,相關技術落地需兼顧創新與合規。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新