百度正式推出其原生全模態大模型文心5.0,標志著中國在多模態人工智能領域邁出重要一步。這款模型擁有2.4萬億參數,通過原生全模態統一建模技術,實現了對文本、圖像、音頻和視頻等多種信息形式的深度理解與生成。用戶現已可通過文心APP、文心一言官網以及百度千帆平臺體驗或調用該模型。
在權威基準測試中,文心5.0展現出卓越性能。其語言與多模態理解能力超越Gemini-2.5-Pro、GPT-5-High等國際主流模型,穩居全球第一梯隊。圖像與視頻生成能力則與垂直領域專業模型不相上下,整體技術處于世界領先水平。特別是在多模態任務處理上,該模型通過統一的自回歸架構實現多源數據聯合訓練,使文本、圖像、視頻和音頻特征在統一框架下深度融合。
技術架構方面,文心5.0采用超大規模混合專家結構,激活參數比低于3%,在保持強大性能的同時顯著提升推理效率。通過大規模工具環境合成任務軌跡數據,并結合思維鏈與行動鏈的端到端強化學習訓練,模型在智能體交互和工具調用能力上取得突破性進展。這些創新使其能夠自動解析視頻內容并生成可執行代碼,甚至模擬《紅樓夢》中王熙鳳的文風創作商業方案。
在同期舉辦的文心MOMENT大會上,百度展示了該模型的實際應用案例。輸入一段復刻"活了么"App的教學視頻后,系統不僅精準拆解操作步驟,更自動生成完整的前端代碼。在創意寫作任務中,模型成功融合古典文學語境與現代商業邏輯,輸出兼具文學價值與實用性的"大觀園資產重組方案",充分展現其情境理解與跨領域創作能力。
為持續提升模型專業度,百度同步推進"文心導師"計劃。目前已有835位來自科技、金融、醫療等十余個重點行業的專家加入指導團隊,在知識體系構建、專業內容校準和價值觀對齊等方面提供支持。這種產學研協同模式有效增強了模型在邏輯嚴謹性、專業深度和創意質量等維度的表現。
回顧發展歷程,文心5.0系列模型自2025年11月發布Preview版本以來,持續在國際競技場保持領先。在LMArena全球大模型評測中,該系列多次包攬國內文本與視覺理解榜單首位,1月15日更以1460分刷新紀錄,位列全球文本榜第八,超越GPT-5.1-High等國際頂尖模型。這些成就彰顯了中國在多模態大模型底層技術創新方面的實力,為全球AI產業競爭格局帶來新變量。















