国产精品自拍视频在线-亚洲一区二区三区品视频-日本一区二区三区麻烦视频-国偷自产视频一区二区三区久-巨乳少妇av中文字幕-日韩最新免费中文字幕在线观看-成人污污污视频在线免费观看-污污污网站在线免费看-国产欧美高清在线观看视频

媒體界 - 推動中國媒體行業(yè)創(chuàng)新,促進(jìn)業(yè)內(nèi)人士交流分享!

螞蟻集團(tuán)再突破!開源萬億參數(shù)混合線性思考模型 數(shù)學(xué)競賽達(dá)金牌水準(zhǔn)

   發(fā)布時(shí)間:2026-02-14 03:02 作者:李娜

螞蟻集團(tuán)近日宣布開源全球首個基于混合線性架構(gòu)的萬億參數(shù)思考模型——Ring-2.5-1T。該模型在生成效率、推理深度和長時(shí)程任務(wù)執(zhí)行能力三大核心指標(biāo)上實(shí)現(xiàn)突破,尤其在數(shù)學(xué)競賽、長文本生成和智能體任務(wù)處理領(lǐng)域達(dá)到開源模型領(lǐng)先水平,標(biāo)志著大模型技術(shù)向復(fù)雜場景應(yīng)用邁出關(guān)鍵一步。

在數(shù)學(xué)推理能力驗(yàn)證中,Ring-2.5-1T展現(xiàn)出卓越表現(xiàn)。該模型在國際數(shù)學(xué)奧林匹克競賽(IMO 2025)自測中取得35分(滿分42分),中國數(shù)學(xué)奧林匹克(CMO 2025)自測更以105分(滿分126分)遠(yuǎn)超金牌分?jǐn)?shù)線。研究人員通過對比發(fā)現(xiàn),新模型在推理邏輯嚴(yán)謹(jǐn)性、高級數(shù)學(xué)證明技術(shù)應(yīng)用及答案完整性方面較前代Ring-1T有顯著提升。在編程與邏輯推理基準(zhǔn)測試中,該模型在LiveCodeBench-v6代碼生成、HMMT-25數(shù)學(xué)競賽等任務(wù)中均超越DeepSeek-v3.2-Thinking、Kimi-K2.5-Thinking等開源模型及GPT-5.2-thinking-high等閉源系統(tǒng)。

針對長時(shí)程任務(wù)處理,Ring-2.5-1T通過大規(guī)模異步智能體強(qiáng)化學(xué)習(xí)訓(xùn)練,在Gaia2-search智能體搜索任務(wù)中取得開源模型最優(yōu)性能。該任務(wù)要求模型協(xié)調(diào)跨應(yīng)用工具完成復(fù)雜操作,新模型在規(guī)劃生成與多步工具調(diào)用效率上較前代提升40%。在軟件工程基準(zhǔn)測試中,其于SWE-Bench Verified任務(wù)中的表現(xiàn)超越Claude-Opus-4.5-Extended-Thinking等主流模型,展現(xiàn)出解決實(shí)際工程問題的潛力。

技術(shù)架構(gòu)層面,Ring-2.5-1T基于創(chuàng)新的Ling 2.5混合線性注意力機(jī)制,將內(nèi)存訪問開銷降低至前代的1/10。通過將分組查詢注意力(GQA)升級為1:7比例的多頭線性注意力(MLA)與Lightning Linear結(jié)構(gòu)組合,模型在32K以上長文本生成場景中吞吐量提升3倍。實(shí)驗(yàn)數(shù)據(jù)顯示,在配備8塊H200 GPU的服務(wù)器上,當(dāng)生成長度超過16K token時(shí),其解碼效率較Kimi K2架構(gòu)提升65%,且優(yōu)勢隨文本長度增加持續(xù)擴(kuò)大。

該模型激活參數(shù)規(guī)模從51B擴(kuò)展至63B,但通過優(yōu)化KV緩存壓縮技術(shù),在保持推理效率的同時(shí)降低了計(jì)算資源消耗。研究人員特別改進(jìn)了查詢-核歸一化(QK Norm)與部分旋轉(zhuǎn)位置編碼(Partial RoPE)機(jī)制,使模型在處理超長序列時(shí)仍能維持穩(wěn)定性能。目前,Ring-2.5-1T的模型權(quán)重與推理代碼已在Hugging Face、ModelScope等平臺開放下載,官方API服務(wù)與交互體驗(yàn)頁面將于近期上線。

在應(yīng)用適配方面,新模型已實(shí)現(xiàn)與Claude Code智能體編程框架及OpenClaw個人AI助手的無縫對接,支持多步規(guī)劃與工具鏈調(diào)用。技術(shù)團(tuán)隊(duì)透露,通過底層架構(gòu)創(chuàng)新,Ring-2.5-1T有效解決了傳統(tǒng)模型在長文檔處理、跨文件代碼理解等場景中面臨的算力成本高、響應(yīng)延遲大等難題,為金融、法律、科研等需要深度推理的行業(yè)提供了高性能技術(shù)方案。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
本欄最新