百度近日正式推出原生全模態(tài)大模型文心5.0,標(biāo)志著我國(guó)人工智能領(lǐng)域在多模態(tài)技術(shù)上取得重大突破。該模型擁有2.4萬億參數(shù)規(guī)模,通過原生全模態(tài)統(tǒng)一建模技術(shù),實(shí)現(xiàn)了文本、圖像、音頻、視頻等信息的無縫融合與協(xié)同處理。與傳統(tǒng)的"后期融合"方案不同,文心5.0采用統(tǒng)一的自回歸架構(gòu),將多源數(shù)據(jù)在單一模型框架內(nèi)進(jìn)行聯(lián)合訓(xùn)練,使不同模態(tài)的特征在統(tǒng)一架構(gòu)下深度融合,從而具備真正的全模態(tài)理解與生成能力。
在技術(shù)架構(gòu)方面,文心5.0創(chuàng)新性地采用超大規(guī)模混合專家結(jié)構(gòu),通過超稀疏激活參數(shù)設(shè)計(jì),將激活參數(shù)比例控制在3%以下。這種設(shè)計(jì)在保持模型強(qiáng)大性能的同時(shí),顯著提升了推理效率。模型還基于大規(guī)模工具環(huán)境合成長(zhǎng)程任務(wù)軌跡數(shù)據(jù),并運(yùn)用思維鏈和行動(dòng)鏈的端到端多輪強(qiáng)化學(xué)習(xí)訓(xùn)練方法,大幅增強(qiáng)了智能體和工具調(diào)用能力。在權(quán)威基準(zhǔn)測(cè)試中,文心5.0的語言與多模態(tài)理解能力已超越Gemini-2.5-Pro、GPT-5-High等國(guó)際領(lǐng)先模型,圖像與視頻生成能力達(dá)到垂直領(lǐng)域?qū)>P退剑w技術(shù)指標(biāo)位居全球前列。
發(fā)布會(huì)上,百度應(yīng)用模型研發(fā)部負(fù)責(zé)人賈磊重點(diǎn)介紹了模型的應(yīng)用落地實(shí)踐。他強(qiáng)調(diào):"應(yīng)用模型的價(jià)值不在模型本身,而在于實(shí)際場(chǎng)景中的應(yīng)用效果。"基于文心基礎(chǔ)大模型,百度構(gòu)建了矩陣模型和專精模型兩大體系。矩陣模型包含文心Lite、視頻大模型和語音大模型,主要面向產(chǎn)品級(jí)應(yīng)用和通用場(chǎng)景;專精模型則針對(duì)搜索、電商、數(shù)字人等特定領(lǐng)域開發(fā),包括搜索閃電專精模型、電商蒸汽機(jī)模型等行業(yè)解決方案。賈磊現(xiàn)場(chǎng)演示了三項(xiàng)突破性技術(shù):基于聲音Token的端到端合成大模型可實(shí)現(xiàn)高度自然的語音合成;5分鐘直播技術(shù)通過少量音色采樣即可生成具備專業(yè)帶貨能力的直播語音;實(shí)時(shí)交互數(shù)字人技術(shù)采用三態(tài)Token聯(lián)動(dòng)架構(gòu),使數(shù)字人具備低延遲、高表現(xiàn)力的交互能力,百度羅永浩數(shù)字人正是基于該技術(shù)開發(fā)。
為推動(dòng)大模型在產(chǎn)業(yè)界的落地應(yīng)用,百度千帆平臺(tái)推出了專為行業(yè)打造的Agent Infra解決方案。該平臺(tái)提供文心5.0及150多個(gè)場(chǎng)景化SOAT模型服務(wù),集成百度AI搜索等工具鏈,結(jié)合數(shù)據(jù)管理和企業(yè)級(jí)服務(wù)能力,為企業(yè)提供全周期、多場(chǎng)景的業(yè)務(wù)運(yùn)行環(huán)境。據(jù)平臺(tái)產(chǎn)品負(fù)責(zé)人張婷介紹,千帆平臺(tái)已累計(jì)開發(fā)超過130萬個(gè)智能體應(yīng)用,以百度AI搜索為代表的工具日均調(diào)用量突破千萬次。目前,個(gè)人用戶可通過文心APP和官網(wǎng)體驗(yàn)?zāi)P湍芰Γ髽I(yè)與開發(fā)者則可通過千帆平臺(tái)進(jìn)行模型調(diào)用和開發(fā)。
作為國(guó)內(nèi)大模型領(lǐng)域的先行者,百度已形成完整的"芯云模體"技術(shù)生態(tài)閉環(huán)。該生態(tài)以自主研發(fā)的芯片為底層支撐,智能云作為平臺(tái)框架,大模型為核心引擎,支撐各類智能體應(yīng)用開發(fā)。這種全棧自研能力使百度能夠打通從芯片到應(yīng)用的完整技術(shù)鏈條,為行業(yè)提供更具競(jìng)爭(zhēng)力的AI解決方案。隨著文心5.0的正式上線,百度正持續(xù)探索AI技術(shù)在真實(shí)行業(yè)場(chǎng)景中的應(yīng)用路徑,推動(dòng)人工智能從技術(shù)突破向價(jià)值創(chuàng)造的轉(zhuǎn)變。















