在2026華為數(shù)據(jù)存儲新春發(fā)布會上,華為面向AI推理場景推出全新數(shù)據(jù)基礎(chǔ)設(shè)施解決方案,涵蓋中心推理場景的AI數(shù)據(jù)平臺與分支邊緣場景的FusionCube A1000 AI超融合一體機(jī)。這一系列創(chuàng)新產(chǎn)品旨在突破AI推理應(yīng)用的技術(shù)瓶頸,降低企業(yè)部署門檻,推動AI技術(shù)在千行百業(yè)的規(guī)模化落地。
當(dāng)前AI發(fā)展已進(jìn)入以推理為核心的新階段,企業(yè)面臨數(shù)據(jù)形態(tài)與核心資產(chǎn)的雙重變革。數(shù)據(jù)類型從單一文本向多模態(tài)混合演進(jìn),規(guī)模從TB級激增至EB級;同時(shí),企業(yè)核心資產(chǎn)從靜態(tài)數(shù)據(jù)轉(zhuǎn)向動態(tài)知識體系,需要實(shí)時(shí)調(diào)用支撐智能決策。這些變化對AI數(shù)據(jù)基礎(chǔ)設(shè)施提出全新要求,成為技術(shù)落地的關(guān)鍵挑戰(zhàn)。
針對推理業(yè)務(wù)存在的知識質(zhì)量不足、長序列響應(yīng)遲緩、記憶能力缺失三大痛點(diǎn),華為AI數(shù)據(jù)平臺構(gòu)建了知識庫、KV Cache加速、記憶庫三大核心引擎。通過端到端數(shù)據(jù)管道優(yōu)化,平臺可實(shí)現(xiàn)多模態(tài)數(shù)據(jù)的無損解析與細(xì)粒度知識轉(zhuǎn)化,配合多維度檢索技術(shù)達(dá)成95%以上的檢索精度。在長序列處理方面,全局分層緩存機(jī)制使記憶數(shù)據(jù)在芯片內(nèi)存、DRAM與SSD間動態(tài)流動,結(jié)合稀疏注意力算法將首Token時(shí)延降低90%。記憶庫功能則通過上下文狀態(tài)保持與信息凝練技術(shù),使模型具備持續(xù)進(jìn)化能力。
該平臺提供一體化與獨(dú)立式兩種部署模式。一體化方案以O(shè)ceanStor A800全棧一體機(jī)為底座,實(shí)現(xiàn)開箱即用;獨(dú)立式方案采用"數(shù)據(jù)引擎節(jié)點(diǎn)+OceanStor Dorado"架構(gòu),可在現(xiàn)有存儲系統(tǒng)上無縫擴(kuò)展,保護(hù)企業(yè)歷史投資。華為存儲產(chǎn)品線副總裁謝黎明表示,這種靈活部署方式可滿足不同規(guī)模企業(yè)的轉(zhuǎn)型需求。
面向分支邊緣場景的FusionCube A1000則通過超融合架構(gòu)破解部署難題。該設(shè)備集成計(jì)算、存儲、網(wǎng)絡(luò)與AI平臺,將基礎(chǔ)設(shè)施部署周期縮短80%。其內(nèi)置的AI平臺預(yù)集成數(shù)據(jù)處理、模型訓(xùn)練與推理全流程能力,支持統(tǒng)一運(yùn)維與安全運(yùn)營,可實(shí)現(xiàn)故障快速定位與健康監(jiān)測。華為存儲產(chǎn)品線副總裁張偉力介紹,設(shè)備支持邊緣與中心的協(xié)同運(yùn)行,邊緣數(shù)據(jù)回傳中心優(yōu)化模型后,可一鍵下發(fā)至邊緣節(jié)點(diǎn),形成感知-決策的完整閉環(huán)。
在資源利用方面,F(xiàn)usionCube A1000實(shí)現(xiàn)算力動態(tài)切分與智能調(diào)度,單卡算力利用率提升約30%,可同時(shí)運(yùn)行多個(gè)AI模型并根據(jù)業(yè)務(wù)優(yōu)先級分配資源。設(shè)備內(nèi)置平臺還支持知識庫與記憶庫的協(xié)同構(gòu)建,通過數(shù)據(jù)飛輪效應(yīng)持續(xù)提升模型輸出質(zhì)量。目前,該方案已具備多行業(yè)適配能力,可滿足制造、零售、醫(yī)療等領(lǐng)域的邊緣智能化需求。
華為此次發(fā)布的雙場景解決方案,完成了從中心到邊緣的AI推理全鏈路覆蓋。通過技術(shù)創(chuàng)新與生態(tài)整合,華為數(shù)據(jù)存儲正助力企業(yè)突破AI應(yīng)用瓶頸,將技術(shù)潛力轉(zhuǎn)化為實(shí)際商業(yè)價(jià)值,為數(shù)字經(jīng)濟(jì)時(shí)代的基礎(chǔ)設(shè)施建設(shè)提供新范式。















