国产精品自拍视频在线-亚洲一区二区三区品视频-日本一区二区三区麻烦视频-国偷自产视频一区二区三区久-巨乳少妇av中文字幕-日韩最新免费中文字幕在线观看-成人污污污视频在线免费观看-污污污网站在线免费看-国产欧美高清在线观看视频

媒體界 - 推動中國媒體行業(yè)創(chuàng)新,促進(jìn)業(yè)內(nèi)人士交流分享!

上海萬卡GPU集群:以超高可用性與多元算力,為AI大模型注入強勁動能

   發(fā)布時間:2026-04-06 19:29 作者:唐云澤

在上海松江的儀電智算中心,巨大的機房內(nèi),上萬張GPU設(shè)備整齊排列,伴隨著持續(xù)的風(fēng)扇轟鳴聲,它們與高速網(wǎng)絡(luò)線纜共同構(gòu)建起一張龐大的算力網(wǎng)絡(luò)。每張芯片每秒可完成數(shù)十萬億次運算,僅需兩天時間,這些芯片匯聚的計算能量便足以媲美三峽水電站一臺機組一小時的發(fā)電量,彰顯出算力在人工智能發(fā)展中的核心地位。

要讓如此龐大的GPU集群高效協(xié)同運轉(zhuǎn),絕非易事。上海儀電旗下的智算科技團(tuán)隊,憑借著卓越的技術(shù)實力,成功實現(xiàn)了集群99.99%的超高可用性,這意味著全年總故障時間被壓縮至1小時以內(nèi)。這一突破,為AI大模型的訓(xùn)練提供了堅實的算力保障,避免了因算力中斷可能帶來的巨大損失。

智算科技董事長孫躍表示,算力集群的搭建遠(yuǎn)非簡單的加速卡堆疊,它需要復(fù)雜的高速網(wǎng)絡(luò)和強大的調(diào)度軟件作為支撐。他比喻道,算力集群與AI大模型的關(guān)系,就如同電與發(fā)電機一般,缺一不可。要讓近萬張算力芯片通過高效的通訊網(wǎng)絡(luò)和存儲設(shè)備,像一臺電腦一樣整體高效運轉(zhuǎn),其難度可想而知。而更難的是,這個由1萬張卡組成的集群,還需7×24小時不間斷地提供算力服務(wù)。

面對萬卡級GPU集群穩(wěn)定運行的挑戰(zhàn),智算科技團(tuán)隊展現(xiàn)出了非凡的戰(zhàn)斗力。這支平均年齡僅32歲的團(tuán)隊,曾連續(xù)79天駐守機房,為了0.1%的性能提升,他們?nèi)找箠^戰(zhàn),反復(fù)打磨代碼。在緊急任務(wù)面前,他們打破常規(guī),采用“并行施工+邊測邊調(diào)”的方式,搶抓每一秒進(jìn)度。正是這樣的努力,讓他們成功攻克了萬卡級GPU集群穩(wěn)定運行的難題。

除了穩(wěn)定運行,智算科技還在融合異構(gòu)芯片方面取得了顯著成果。他們的萬卡集群已成功適配多種國產(chǎn)算力卡,實現(xiàn)了多元異構(gòu)算力的融合與優(yōu)化調(diào)度。孫躍介紹,不同業(yè)務(wù)、不同行業(yè)對芯片的需求各不相同,而各類國產(chǎn)算力芯片在細(xì)分領(lǐng)域也各具優(yōu)勢。通過異構(gòu)算力的融合,他們成功將國產(chǎn)算力用起來,滿足了不同垂類客戶對算力基礎(chǔ)設(shè)施的差異化需求。

目前,智算科技的萬卡集群使用率已接近100%,基本實現(xiàn)了建成即滿負(fù)荷運轉(zhuǎn)。在某新型科研機構(gòu)項目中,他們僅用一周時間便完成了近千卡集群的建設(shè)與交付,隨后又成功部署了萬卡集群算力,為國家重點科研任務(wù)的推進(jìn)提供了有力保障。他們還首創(chuàng)了“動態(tài)感知調(diào)度方案”,使訓(xùn)練效率提升了91%,每年為國家節(jié)省的算力成本相當(dāng)于新建3個數(shù)據(jù)中心。

在“算電協(xié)同”成為國家級戰(zhàn)略性新基建工程的背景下,智算科技也在積極探索這一領(lǐng)域。孫躍透露,他們在基礎(chǔ)設(shè)施和機房建設(shè)過程中,進(jìn)一步擴(kuò)大了綠電的使用比例,并通過液冷集群提高了能源使用效率,降低了PUE值。同時,他們還在與上下游合作伙伴進(jìn)行探索,如結(jié)合淞滬地區(qū)海上風(fēng)電資源,實現(xiàn)風(fēng)電直接驅(qū)動的海底數(shù)據(jù)中心,以降低算力成本。

隨著新一代人工智能的快速發(fā)展,算力需求持續(xù)激增。孫躍表示,上海儀電將一方面提高算力基礎(chǔ)設(shè)施的建設(shè)效率和使用效率,另一方面打造開放、靈活、彈性的智算云服務(wù)平臺。他們發(fā)布的智算平臺YI CLOUD,旨在面向各類不同領(lǐng)域的用戶提供更普惠、更便捷的算力服務(wù)。這種服務(wù)不僅提供算力,還包括行業(yè)所需的語料、模型、智能體等能力的適配,幫助用戶在單一垂直領(lǐng)域更高效地使用算力。

上海儀電還在生態(tài)建設(shè)上發(fā)力。作為一家平臺型的鏈主企業(yè),他們希望發(fā)揮生態(tài)鏈接的作用,牽引產(chǎn)業(yè)鏈上下游軟硬件廠商,包括GPU企業(yè)、網(wǎng)絡(luò)通訊、模型企業(yè)、智能體企業(yè)等,共同實現(xiàn)國產(chǎn)算力生態(tài)協(xié)同的創(chuàng)新方案,以賦能國產(chǎn)大模型以及相關(guān)AI+應(yīng)用。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
本欄最新