字節跳動Seeduplex大模型上線豆包App，語音交互更自然流暢貼近真人節奏

發布時間：2026-04-09 23:37 來源：快訊作者：江紫萱

字節跳動近日正式發布全新原生全雙工語音大模型Seeduplex，這款基于“邊聽邊說”架構設計的模型，標志著語音交互技術向更自然的方向邁出關鍵一步。相較于傳統半雙工語音系統需要等待用戶完整表達后再回應的“回合制”模式，Seeduplex實現了實時傾聽、內容生成與節奏判斷的同步進行，顯著提升了對話的流暢度與真實感。

技術測試數據顯示，在咖啡廳等復雜聲學環境中，Seeduplex通過多維度聲學分析技術，可精準分離用戶語音與背景噪音。與前代半雙工模型相比，其誤回復率與誤打斷率均降低50%，即便在多人交談或設備移動產生的干擾下，仍能保持穩定識別。當用戶出現思考停頓或臨時中斷對話時，模型通過融合語音停頓時長、音調變化及語義完整性等特征，將搶話現象減少40%，判停延遲縮短至250毫秒以內，使交互節奏更貼近人類對話習慣。

該模型在上下文理解能力上亦有突破性表現。在飛花令、模擬面試等需要連續記憶的場景中，Seeduplex可基于部分語義信息提前預判用戶意圖，實現“未說完先回應”的智能交互。第三方評估機構使用MOS（平均意見分）體系測評顯示，其對話流暢度得分較傳統模型提升12%，尤其在多輪復雜對話中，能動態維護長達20輪以上的上下文記憶鏈。

目前Seeduplex已通過豆包App向全體用戶開放服務。字節跳動語音技術團隊透露，未來將持續優化模型在方言識別、情感表達等維度的性能，并探索車載語音助手、智能客服等場景的深度應用。值得注意的是，盡管技術進步顯著，語音交互領域仍存在數據隱私、倫理規范等挑戰，相關技術落地需兼顧創新與合規。

更多>同類內容