百度近日正式推出并上線了其原生全模態(tài)大模型文心5.0正式版,標(biāo)志著中國(guó)在多模態(tài)人工智能領(lǐng)域邁出了重要一步。該模型擁有2.4萬(wàn)億參數(shù),采用創(chuàng)新的原生全模態(tài)統(tǒng)一建模技術(shù),能夠同時(shí)處理文本、圖像、音頻和視頻等多種形式的信息輸入與輸出,為用戶提供更加全面和智能的服務(wù)體驗(yàn)。
在權(quán)威基準(zhǔn)測(cè)試中,文心5.0正式版展現(xiàn)了卓越的性能。其語(yǔ)言與多模態(tài)理解能力超越了Gemini-2.5-Pro和GPT-5-High等國(guó)際知名模型,穩(wěn)居全球第一梯隊(duì)。同時(shí),該模型在圖像和視頻生成方面也達(dá)到了垂直領(lǐng)域?qū)>P偷乃剑w技術(shù)處于世界領(lǐng)先地位。目前,個(gè)人用戶可以通過(guò)文心APP和文心一言官網(wǎng)體驗(yàn)這一創(chuàng)新成果,而企業(yè)和開(kāi)發(fā)者則可通過(guò)百度千帆平臺(tái)進(jìn)行調(diào)用。
百度集團(tuán)副總裁吳甜介紹,文心5.0的技術(shù)路線與業(yè)界常見(jiàn)的“后期融合”方案不同,它采用統(tǒng)一的自回歸架構(gòu)進(jìn)行原生全模態(tài)建模。這種架構(gòu)將文本、圖像、視頻和音頻等多源數(shù)據(jù)在同一模型框架內(nèi)聯(lián)合訓(xùn)練,使多模態(tài)特征在統(tǒng)一架構(gòu)下充分融合并協(xié)同優(yōu)化,從而實(shí)現(xiàn)原生的全模態(tài)統(tǒng)一理解與生成。這一創(chuàng)新技術(shù)為多模態(tài)人工智能的發(fā)展開(kāi)辟了新的路徑。
除了原生全模態(tài)建模技術(shù)外,文心5.0還采用了超大規(guī)模混合專家結(jié)構(gòu),具備超稀疏激活參數(shù),激活參數(shù)比低于3%。這一設(shè)計(jì)在保持模型強(qiáng)大能力的同時(shí),有效提升了推理效率,降低了計(jì)算成本。模型還基于大規(guī)模工具環(huán)境合成長(zhǎng)程任務(wù)軌跡數(shù)據(jù),并采用基于思維鏈和行動(dòng)鏈的端到端多輪強(qiáng)化學(xué)習(xí)訓(xùn)練,顯著提升了智能體和工具調(diào)用能力。
在實(shí)際應(yīng)用中,文心5.0展現(xiàn)了強(qiáng)大的多模理解、代碼生成和創(chuàng)意寫(xiě)作能力。例如,在大會(huì)現(xiàn)場(chǎng)演示中,僅輸入一段博主復(fù)刻“活了么”App教程視頻,文心5.0便能自動(dòng)拆解步驟,理解核心交互邏輯,并直接生成可運(yùn)行的前端代碼。在創(chuàng)意寫(xiě)作任務(wù)中,模型還能模擬《紅樓夢(mèng)》中王熙鳳的語(yǔ)言風(fēng)格,生成融合古典語(yǔ)境與現(xiàn)代商業(yè)邏輯的“大觀園資產(chǎn)重組方案”,充分展示了其情境理解與創(chuàng)作能力。
為了進(jìn)一步提升模型的專業(yè)性和嚴(yán)謹(jǐn)性,百度還推出了“文心導(dǎo)師”計(jì)劃。目前,該計(jì)劃已吸引835位來(lái)自科技、金融、文化、教育、醫(yī)療、能源等十余個(gè)重點(diǎn)行業(yè)以及數(shù)理化生文史哲等學(xué)科的專家加入。這些專家在知識(shí)傳授、鑒賞評(píng)價(jià)和專業(yè)校準(zhǔn)方面對(duì)大模型進(jìn)行指導(dǎo),幫助模型在邏輯嚴(yán)謹(jǐn)性、專業(yè)深度、創(chuàng)意質(zhì)量和價(jià)值觀對(duì)齊等方面不斷精進(jìn)。
文心5.0的上線不僅體現(xiàn)了中國(guó)模型廠商在多模態(tài)大模型底層的自主創(chuàng)新能力,也有助于提升中國(guó)AI在全球產(chǎn)業(yè)競(jìng)爭(zhēng)中的技術(shù)話語(yǔ)權(quán)。此前,文心5.0系列模型已多次登上LMArena全球大模型競(jìng)技場(chǎng),并在文本榜和視覺(jué)理解榜上位居國(guó)內(nèi)第一,躋身國(guó)際第一梯隊(duì)。1月15日的數(shù)據(jù)顯示,文心5.0以1460分位列LMArena文本榜國(guó)內(nèi)第一、全球第八,超越了GPT-5.1-High、Gemini-2.5-Pro等多款國(guó)內(nèi)外主流模型。















