1月22日,百度正式推出并上線(xiàn)了其原生全模態(tài)大模型——文心5.0正式版。這一模型擁有高達(dá)2.4萬(wàn)億的參數(shù)規(guī)模,采用原生全模態(tài)統(tǒng)一建模技術(shù),能夠?qū)崿F(xiàn)對(duì)文本、圖像、音頻、視頻等多種信息形式的全面理解與生成。目前,個(gè)人用戶(hù)可通過(guò)文心APP或文心一言官網(wǎng)體驗(yàn)該模型,而企業(yè)與開(kāi)發(fā)者則可通過(guò)百度千帆平臺(tái)進(jìn)行調(diào)用。
在權(quán)威基準(zhǔn)的綜合評(píng)測(cè)中,文心5.0正式版展現(xiàn)了卓越的性能。其語(yǔ)言與多模態(tài)理解能力超越了Gemini-2.5-Pro、GPT-5-High等國(guó)際知名模型,穩(wěn)居國(guó)際第一梯隊(duì)。同時(shí),該模型的圖像與視頻生成能力也達(dá)到了垂直領(lǐng)域?qū)>P偷乃剑w處于全球領(lǐng)先地位。此前,百度文心助手的月活躍用戶(hù)數(shù)已突破2億大關(guān)。
百度集團(tuán)副總裁吳甜介紹,文心5.0的技術(shù)路線(xiàn)與業(yè)界普遍采用的“后期融合”多模態(tài)方案截然不同。它采用統(tǒng)一的自回歸架構(gòu)進(jìn)行原生全模態(tài)建模,將文本、圖像、視頻、音頻等多源數(shù)據(jù)在同一模型框架中進(jìn)行聯(lián)合訓(xùn)練。這種設(shè)計(jì)使得多模態(tài)特征在統(tǒng)一架構(gòu)下充分融合并協(xié)同優(yōu)化,實(shí)現(xiàn)了原生的全模態(tài)統(tǒng)一理解與生成,避免了傳統(tǒng)方法中的拼接和轉(zhuǎn)譯問(wèn)題。
文心5.0還采用了超大規(guī)模混合專(zhuān)家結(jié)構(gòu),具備超稀疏激活參數(shù),激活參數(shù)比低于3%。這一設(shè)計(jì)在保持模型強(qiáng)大能力的同時(shí),有效提升了推理效率。該模型還基于大規(guī)模工具環(huán)境合成長(zhǎng)程任務(wù)軌跡數(shù)據(jù),并采用基于思維鏈和行動(dòng)鏈的端到端多輪強(qiáng)化學(xué)習(xí)訓(xùn)練,顯著提升了模型的智能體和工具調(diào)用能力。
在應(yīng)用層面,百度應(yīng)用模型研發(fā)部負(fù)責(zé)人賈磊強(qiáng)調(diào),模型的價(jià)值在于應(yīng)用而非模型本身。他希望文心模型能夠在真實(shí)應(yīng)用場(chǎng)景中“跑得穩(wěn)、答得對(duì)、用得起”。基于文心基礎(chǔ)大模型,百度構(gòu)建了矩陣模型和專(zhuān)精模型兩大體系。矩陣模型面向產(chǎn)品級(jí)應(yīng)用和通用場(chǎng)景快速落地,包括文心Lite模型、視頻大模型和語(yǔ)音大模型;專(zhuān)精模型則面向行業(yè)應(yīng)用和垂直場(chǎng)景,如搜索閃電專(zhuān)精模型、電商蒸汽機(jī)模型、文心數(shù)字人大模型及行業(yè)大模型等。
賈磊還分享了三項(xiàng)技術(shù)突破:基于聲音Token的端到端合成大模型、5分鐘超越真人的直播技術(shù)以及實(shí)時(shí)交互數(shù)字人技術(shù)。其中,基于聲音Token的端到端合成大模型通過(guò)離散表示定義token,以MoE大語(yǔ)言模型建模韻律,實(shí)現(xiàn)了高質(zhì)量的聲音合成。5分鐘超越真人的直播技術(shù)則通過(guò)對(duì)目標(biāo)音色的少量采樣和臉譜化妝,結(jié)合檢索增強(qiáng)匹配不同文體和場(chǎng)景的韻律模式,使合成語(yǔ)音具備直播帶貨所需的情緒、節(jié)奏與感染力。實(shí)時(shí)交互數(shù)字人技術(shù)則采用三態(tài)Token聯(lián)動(dòng)架構(gòu),實(shí)現(xiàn)文本、語(yǔ)音、視頻的流式控制,具有低延遲、低成本和高表現(xiàn)力的特點(diǎn)。
在模型應(yīng)用賦能行業(yè)的背后,是百度基于多年積累的全棧自研實(shí)力。百度打通了“芯云模體”的全鏈技術(shù)架構(gòu),為模型應(yīng)用提供了堅(jiān)實(shí)的技術(shù)支撐。在文心Moment大會(huì)當(dāng)天,百度千帆平臺(tái)產(chǎn)品負(fù)責(zé)人張婷詳細(xì)介紹了千帆專(zhuān)為行業(yè)落地打造的Agent Infra。該平臺(tái)提供包括文心5.0及全場(chǎng)景150+SOAT模型服務(wù),集成眾多工具及MCP和Agent工具鏈,并結(jié)合數(shù)據(jù)管理和企業(yè)級(jí)服務(wù),為企業(yè)提供全周期、穩(wěn)定支持多場(chǎng)景業(yè)務(wù)的運(yùn)行環(huán)境,顯著降低了企業(yè)Agent創(chuàng)新門(mén)檻。
目前,千帆平臺(tái)上已累計(jì)開(kāi)發(fā)超130萬(wàn)個(gè)Agents,以百度獨(dú)家能力“百度AI搜索”為代表的工具日均調(diào)用量已突破千萬(wàn)次。基于強(qiáng)大的原生全模態(tài)統(tǒng)一建模技術(shù)和海量算力,文心5.0已具備讓AI應(yīng)用走進(jìn)真實(shí)行業(yè)與復(fù)雜場(chǎng)景、提供更高效解決方案的能力。作為國(guó)內(nèi)最早發(fā)布大模型的企業(yè)之一,百度正持續(xù)探索賦能行業(yè)的AI解決方案,形成以芯片為底座、智能云為平臺(tái)框架、以模型支撐各類(lèi)智能體應(yīng)用的“芯云模體”全棧自研生態(tài)閉環(huán)。















