媒體界 - 推動中國媒體行業創新,促進業內人士交流分享!

浪潮旗下YuanLab.ai開源發布Yuan3.0 Ultra大模型,為企業級AI應用注入新動能

   發布時間:2026-03-06 18:31 作者:朱天宇

浪潮旗下YuanLab.ai團隊近日宣布開源發布源Yuan3.0 Ultra多模態基礎大模型,這款面向萬億參數規模打造的旗艦模型,在多模態企業級應用領域實現重大突破。該模型通過系統性架構創新,將MoE(混合專家)架構的訓練效率優化深度融入模型設計,并針對企業場景中的復雜任務需求進行專項強化,在文檔理解、表格分析、智能工具調用等場景中展現出顯著優勢。

模型采用統一的多模態架構設計,由視覺編碼器、語言主干網絡和多模態對齊模塊三部分構成。其中語言主干網絡基于103層Transformer的MoE架構,初始訓練參數規模達15150億,通過團隊研發的LAEP參數優化技術,在預訓練階段將有效參數壓縮至10100億,同時實現49%的算力效率提升。激活參數規模控制在688億,在保證模型性能的同時顯著降低計算資源消耗。

針對企業場景中的復雜信息處理需求,Yuan3.0 Ultra開發了多項核心技術。Localized Filtering Attention(LFA)注意力機制通過強化語義關系建模,使模型精度較傳統Attention結構提升顯著。在多模態文檔處理方面,模型可同時解析圖文混排內容、多級結構表格及跨文檔知識關聯;在智能體應用層面,為基于OpenClaw等框架的企業Agent AI提供強大的數據驅動能力,支持檢索增強生成(RAG)、內容摘要生成和工具鏈自動調用等復雜任務。

該模型的開源內容包含完整的訓練體系,除16bit和4bit量化版本的模型權重外,還同步公開技術報告、訓練方法論及多維度評測數據。這種全鏈條開源模式為學術界和產業界提供了深度定制的基礎,開發者可基于現有框架進行二次訓練,快速構建適應特定行業需求的垂直模型。

作為源Yuan3.0基礎模型家族的旗艦版本,Ultra版與已發布的Flash(400億參數)、Pro(2000億參數)版本形成完整的產品矩陣,后續還將推出參數量達1萬億的增強版本。這種階梯式模型布局既滿足不同規模企業的應用需求,也為前沿技術研究提供了可擴展的基礎平臺。團隊已同步公開Yuan3.0 Ultra的開源地址,為全球開發者提供即時可用的技術資源。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新