字節(jié)跳動Seeduplex全雙工語音大模型登場豆包App搶先接入開啟自然對話新篇

發(fā)布時間：2026-04-09 22:11 來源：互聯(lián)網(wǎng) 作者：蘇婉清

字節(jié)跳動旗下豆包App迎來重大功能升級——原生全雙工語音大模型Seeduplex正式全量落地，成為全球首個實現(xiàn)規(guī)模化應(yīng)用的全雙工語音交互系統(tǒng)。這項突破性技術(shù)通過"邊聽邊說"的架構(gòu)設(shè)計，徹底重構(gòu)了傳統(tǒng)AI語音對話模式，讓機器與人類的交流更接近自然對話狀態(tài)。

傳統(tǒng)語音交互系統(tǒng)普遍采用半雙工模式，用戶必須等待機器完成回答后才能繼續(xù)提問，這種"一問一答"的機械式交互嚴重制約了對話流暢度。Seeduplex創(chuàng)新性地實現(xiàn)了聽與說的同步處理，其核心優(yōu)勢體現(xiàn)在兩大技術(shù)突破：在抗干擾能力方面，模型通過持續(xù)聲學環(huán)境感知，可精準過濾背景噪音和無關(guān)對話，復(fù)雜場景下的誤回復(fù)率和誤打斷率較傳統(tǒng)方案降低50%；在對話節(jié)奏控制上，通過語音語義特征融合判斷，模型既能耐心等待用戶思考，又能快速響應(yīng)結(jié)束發(fā)言，搶話現(xiàn)象減少40%。

多維度實測數(shù)據(jù)顯示，Seeduplex在對話流暢度（MOS評分提升12%）、整體通話滿意度（提升8.34%）等關(guān)鍵指標上全面領(lǐng)先。特別在打斷響應(yīng)環(huán)節(jié)，其表現(xiàn)已優(yōu)于人類對話平均水平，展現(xiàn)出對自然交流節(jié)奏的精準把握。在判停準確率方面，較半雙工方案提升8個百分點，有效避免了"該停不停"或"未說完就斷"的尷尬情況。

技術(shù)落地的背后是強大的工程支撐。基于字節(jié)跳動自研大語言模型底座，研發(fā)團隊通過架構(gòu)創(chuàng)新、海量語音數(shù)據(jù)預(yù)訓練、推理優(yōu)化等手段，攻克了高并發(fā)場景下的卡頓難題。該系統(tǒng)現(xiàn)已具備億級用戶承載能力，可穩(wěn)定支持大規(guī)模實時語音交互需求。

用戶只需將豆包App升級至最新版本，在"打電話"語音通話界面即可體驗這項革命性功能。從實驗室技術(shù)到億級用戶產(chǎn)品，Seeduplex的落地標志著語音交互正式進入全雙工時代，人機對話的流暢度與自然度迎來質(zhì)的飛躍。這項突破不僅重新定義了AI語音交互標準，更為智能助手、在線教育、遠程辦公等場景開辟了新的應(yīng)用可能。

更多>同類內(nèi)容