在華為中國合作伙伴大會期間,以“與時代 共昇騰”為主題的昇騰人工智能伙伴峰會在深圳成功舉辦。華為昇騰計算業(yè)務總裁張迪煊在會上發(fā)表了題為《一起昇騰,共贏行業(yè)智能化》的演講,深入探討了AI技術(shù)演進趨勢與行業(yè)智能化落地的實踐路徑。
張迪煊指出,2025年是昇騰技術(shù)沉淀與開源生態(tài)建設(shè)的關(guān)鍵一年。自去年8月宣布CANN和Mind系列軟件全面開源以來,昇騰已向第三方社區(qū)貢獻超過11萬行代碼,并與50多個主流開源項目實現(xiàn)兼容。通過技術(shù)解耦與架構(gòu)創(chuàng)新,昇騰聯(lián)合科大訊飛開發(fā)的大EP技術(shù)成功填補多機推理加速領(lǐng)域的空白,相關(guān)特性已納入vLLM社區(qū),顯著提升了開發(fā)者創(chuàng)新效率。在模型適配方面,智譜基于昇騰架構(gòu)三個月內(nèi)完成多模態(tài)大模型GLM-Image訓練,該模型采用自回歸與擴散混合架構(gòu),開源后迅速登頂Hugging Face趨勢榜首位。
面對行業(yè)智能化需求,昇騰構(gòu)建了覆蓋大、中、小算力場景的系列化解決方案。針對大模型預訓練與強化學習場景,昇騰384超節(jié)點通過48TB統(tǒng)一內(nèi)存編址技術(shù),實現(xiàn)內(nèi)存共享效率提升96倍,數(shù)據(jù)交互效率提高三倍,特別適用于AI Agent等需要低時延、高吞吐的場景。中算力場景聚焦醫(yī)療輔助、智慧教學等領(lǐng)域,通過中心模組與刀片服務器組合,伙伴已開發(fā)400余款一體機產(chǎn)品,服務2700余家客戶,占據(jù)國內(nèi)市場80%份額。小算力場景則面向工業(yè)質(zhì)檢、具身智能等邊緣計算需求,通過標準模組與板卡開放,助力伙伴打造多樣化終端設(shè)備。
在推理服務優(yōu)化方面,昇騰推出超節(jié)點+大EP組合方案,提供三種技術(shù)路徑:支持MindIE成熟方案快速部署、通過插件集成vLLM/SGLang開源引擎、基于CANN深度定制開發(fā)。硅基流動等伙伴已據(jù)此構(gòu)建金融領(lǐng)域推理引擎,使手機銀行等場景的多輪響應速度提升三倍。針對強化學習后訓練場景,昇騰首創(chuàng)異步流式數(shù)據(jù)引擎TQ技術(shù),通過控制流與數(shù)據(jù)流解耦,將端到端性能提升40%,相關(guān)特性已應用于商業(yè)化廣告與信貸風控領(lǐng)域。
硬件升級方面,昇騰推出分級產(chǎn)品矩陣:A2標卡支持百億級模型實現(xiàn)100ms推理時延,單機服務器算力達業(yè)界2.3倍,雙機超節(jié)點可部署萬億級模型并突破20ms低時延。面向推薦、多模態(tài)等場景的Atlas 350加速卡,通過mxFP4低精格式與112GB片上內(nèi)存,使多模態(tài)生成性能提升60%,訪存效率提高四倍。在行業(yè)應用層面,昇騰聯(lián)合20余家ISV開發(fā)金融、能源等領(lǐng)域解決方案,半年內(nèi)落地十余個場景方案,服務180余家客戶。例如在智慧文旅領(lǐng)域,與海天瑞聲、陜文投合作的多模態(tài)AI伴游助手“小七”,已在陜西景區(qū)為400萬游客提供個性化服務。
生態(tài)建設(shè)層面,昇騰CANN實現(xiàn)三大升級:將原有8個組件拆分為29個可獨立升級模塊,部署效率提升80%;開源PyPTO編程范式,使SoftMax算子代碼量減少70%;今年6月將開放2000卡算力資源供開發(fā)者使用。為激勵生態(tài)創(chuàng)新,昇騰設(shè)立2000萬元首批創(chuàng)新基金,并升級NRE計劃投入5000萬元支持伙伴開發(fā),優(yōu)秀成果將通過AI應用市場與伙伴共享收益。目前已有20余家伙伴啟動Agent一體機研發(fā),產(chǎn)品將覆蓋教育、醫(yī)療等核心領(lǐng)域。















