浪潮旗下YuanLab.ai開源發布Yuan3.0 Ultra大模型，為企業級AI應用注入新動能

發布時間：2026-03-06 18:31 來源：快訊作者：朱天宇

浪潮旗下YuanLab.ai團隊近日宣布開源發布源Yuan3.0 Ultra多模態基礎大模型，這款面向萬億參數規模打造的旗艦模型，在多模態企業級應用領域實現重大突破。該模型通過系統性架構創新，將MoE（混合專家）架構的訓練效率優化深度融入模型設計，并針對企業場景中的復雜任務需求進行專項強化，在文檔理解、表格分析、智能工具調用等場景中展現出顯著優勢。

模型采用統一的多模態架構設計，由視覺編碼器、語言主干網絡和多模態對齊模塊三部分構成。其中語言主干網絡基于103層Transformer的MoE架構，初始訓練參數規模達15150億，通過團隊研發的LAEP參數優化技術，在預訓練階段將有效參數壓縮至10100億，同時實現49%的算力效率提升。激活參數規模控制在688億，在保證模型性能的同時顯著降低計算資源消耗。

針對企業場景中的復雜信息處理需求，Yuan3.0 Ultra開發了多項核心技術。Localized Filtering Attention（LFA）注意力機制通過強化語義關系建模，使模型精度較傳統Attention結構提升顯著。在多模態文檔處理方面，模型可同時解析圖文混排內容、多級結構表格及跨文檔知識關聯；在智能體應用層面，為基于OpenClaw等框架的企業Agent AI提供強大的數據驅動能力，支持檢索增強生成（RAG）、內容摘要生成和工具鏈自動調用等復雜任務。

該模型的開源內容包含完整的訓練體系，除16bit和4bit量化版本的模型權重外，還同步公開技術報告、訓練方法論及多維度評測數據。這種全鏈條開源模式為學術界和產業界提供了深度定制的基礎，開發者可基于現有框架進行二次訓練，快速構建適應特定行業需求的垂直模型。

作為源Yuan3.0基礎模型家族的旗艦版本，Ultra版與已發布的Flash（400億參數）、Pro（2000億參數）版本形成完整的產品矩陣，后續還將推出參數量達1萬億的增強版本。這種階梯式模型布局既滿足不同規模企業的應用需求，也為前沿技術研究提供了可擴展的基礎平臺。團隊已同步公開Yuan3.0 Ultra的開源地址，為全球開發者提供即時可用的技術資源。

更多>同類內容