在國家超算互聯(lián)網(wǎng)鄭州核心節(jié)點(diǎn),3套由中科曙光研發(fā)的萬卡超集群系統(tǒng)正式啟動(dòng)試運(yùn)行。這一系統(tǒng)以超過3萬張國產(chǎn)加速卡的規(guī)模投入運(yùn)營,成為國內(nèi)首個(gè)實(shí)現(xiàn)此量級(jí)部署的AI算力平臺(tái),能夠全面支持萬億參數(shù)模型訓(xùn)練、高通量推理以及AI for Science等復(fù)雜計(jì)算場(chǎng)景,標(biāo)志著國產(chǎn)智能算力基礎(chǔ)設(shè)施邁入規(guī)模化應(yīng)用新階段。
從概念驗(yàn)證到實(shí)戰(zhàn)落地,這一突破僅用時(shí)不到兩個(gè)月。去年12月,曙光scaleX萬卡超集群在HAIC大會(huì)首次公開亮相,如今已快速完成技術(shù)轉(zhuǎn)化。系統(tǒng)攻克了高速互聯(lián)網(wǎng)絡(luò)、存算傳一體化設(shè)計(jì)、高密度供電散熱等核心技術(shù)難題,通過統(tǒng)一資源調(diào)度框架實(shí)現(xiàn)算力的高效分配,為大規(guī)模AI應(yīng)用提供了穩(wěn)定可靠的底層支撐。
在生態(tài)兼容性方面,該平臺(tái)采用開放架構(gòu)設(shè)計(jì),不僅支持CUDA等國際主流軟件生態(tài),還能實(shí)現(xiàn)多品牌國產(chǎn)加速卡的混合部署。這種靈活性顯著降低了開發(fā)者的遷移成本,同時(shí)具備向十萬卡、百萬卡規(guī)模擴(kuò)展的能力,為未來算力需求的指數(shù)級(jí)增長(zhǎng)預(yù)留了充足空間。目前,系統(tǒng)已通過國家超算互聯(lián)網(wǎng)實(shí)現(xiàn)算力資源的全國一體化調(diào)度,為全球用戶提供普惠型AI計(jì)算服務(wù)。
作為創(chuàng)新生態(tài)的核心載體,scaleX萬卡超集群已完成400余個(gè)主流大模型的適配優(yōu)化,并通過國家超算互聯(lián)網(wǎng)接入上千款應(yīng)用。在具體場(chǎng)景中,系統(tǒng)展現(xiàn)出強(qiáng)大賦能能力:支持萬億參數(shù)模型的全機(jī)訓(xùn)練與故障自動(dòng)恢復(fù);為頭部互聯(lián)網(wǎng)企業(yè)核心業(yè)務(wù)提供高并發(fā)推理服務(wù);助力國內(nèi)材料研發(fā)模型登頂國際榜單,推動(dòng)蛋白質(zhì)研究效率提升3至6個(gè)數(shù)量級(jí)。配套的OneScience開發(fā)平臺(tái)進(jìn)一步降低了多學(xué)科交叉研究的門檻,加速科研成果轉(zhuǎn)化。
中科曙光高級(jí)副總裁李斌指出,鄭州節(jié)點(diǎn)的上線是技術(shù)突破與產(chǎn)業(yè)需求深度融合的成果。公司將以此為起點(diǎn),持續(xù)優(yōu)化算力性能與穩(wěn)定性,通過開放合作構(gòu)建覆蓋芯片、算法、應(yīng)用的完整生態(tài)鏈,讓智能算力像水電一樣便捷可用,為數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展注入新動(dòng)能。















