在人工智能?chē)?guó)產(chǎn)化浪潮席卷的當(dāng)下,如何讓國(guó)產(chǎn)算力從“能用”邁向“好用”,成為行業(yè)關(guān)注的焦點(diǎn)。商湯科技通過(guò)一系列創(chuàng)新實(shí)踐,在算力適配、模型優(yōu)化與場(chǎng)景落地層面,為國(guó)產(chǎn)AI生態(tài)構(gòu)建了可復(fù)制的路徑,其與多家國(guó)產(chǎn)芯片企業(yè)的深度協(xié)作,正推動(dòng)中國(guó)AI產(chǎn)業(yè)向自主可控方向加速演進(jìn)。
面對(duì)全球算力供應(yīng)鏈的不確定性,商湯科技選擇以“大裝置—大模型—應(yīng)用”三位一體戰(zhàn)略破局。其核心AI云原生平臺(tái)“商湯大裝置”已實(shí)現(xiàn)與華為昇騰、寒武紀(jì)、沐曦等十余家國(guó)產(chǎn)芯片的深度適配,支撐千億參數(shù)級(jí)多模態(tài)大模型的訓(xùn)練與推理。這一突破標(biāo)志著國(guó)產(chǎn)GPU首次在工業(yè)級(jí)場(chǎng)景中接受系統(tǒng)性檢驗(yàn),為異構(gòu)算力的規(guī)模化應(yīng)用提供了基礎(chǔ)設(shè)施保障。
在技術(shù)層面,商湯與上海AI實(shí)驗(yàn)室聯(lián)合研發(fā)的Deeplink超大規(guī)模跨域混訓(xùn)技術(shù),成為破解異構(gòu)協(xié)同難題的關(guān)鍵。該技術(shù)通過(guò)訓(xùn)練加速、異構(gòu)通信優(yōu)化等手段,打破芯片架構(gòu)差異帶來(lái)的協(xié)同壁壘,使寒武紀(jì)、壁仞、摩爾線程等不同芯片能在同一平臺(tái)實(shí)現(xiàn)統(tǒng)一調(diào)度與負(fù)載均衡。以華為昇騰384超節(jié)點(diǎn)為例,商湯針對(duì)性?xún)?yōu)化了調(diào)度策略與故障恢復(fù)機(jī)制,使多租戶(hù)環(huán)境下的AI云服務(wù)彈性擴(kuò)展能力提升30%,訓(xùn)練穩(wěn)定性達(dá)到國(guó)際領(lǐng)先水平。
推理環(huán)節(jié)的突破同樣顯著。商湯與記憶張量合作推出的PD分離商用推理集群,在國(guó)產(chǎn)GPGPU上實(shí)現(xiàn)單卡并發(fā)效率提升20%、吞吐量增長(zhǎng)75%,綜合性?xún)r(jià)比達(dá)到英偉達(dá)A100的1.5倍。這一成果直接推動(dòng)多模態(tài)大模型在金融、醫(yī)療等領(lǐng)域的部署成本大幅下降,為高性能AI的規(guī)模化落地開(kāi)辟了新空間。
視頻生成作為算力消耗最高的AI場(chǎng)景,成為檢驗(yàn)國(guó)產(chǎn)化生態(tài)的重要試金石。商湯開(kāi)源的LightX2V推理框架,通過(guò)步數(shù)蒸餾、低比特量化等技術(shù),將顯存需求壓縮至8GB以下,使消費(fèi)級(jí)顯卡也能運(yùn)行實(shí)時(shí)視頻生成模型。該框架已適配寒武紀(jì)、沐曦等國(guó)產(chǎn)芯片,配合Seko系列模型的硬件友好優(yōu)化,整體推理性能提升超3倍。數(shù)據(jù)顯示,LightX2V累計(jì)下載量突破350萬(wàn)次,標(biāo)志著國(guó)產(chǎn)算力在視頻生成領(lǐng)域形成低成本生態(tài)閉環(huán)。
在應(yīng)用層,商湯將國(guó)產(chǎn)化能力轉(zhuǎn)化為實(shí)際生產(chǎn)力。12月發(fā)布的行業(yè)首個(gè)多劇集生成智能體Seko 2.0,依托日日新Seko系列模型的技術(shù)底座,在長(zhǎng)視頻角色一致性、畫(huà)面穩(wěn)定性方面實(shí)現(xiàn)突破。該模型已完整適配寒武紀(jì)等國(guó)產(chǎn)AI芯片,完成從語(yǔ)言模型到多模態(tài)生成的關(guān)鍵跨越。終端側(cè),AI智能助手“小浣熊”通過(guò)端側(cè)模型壓縮技術(shù),在保持云端精度的同時(shí),實(shí)現(xiàn)多種國(guó)產(chǎn)芯片一體機(jī)的全國(guó)產(chǎn)化部署,為數(shù)據(jù)敏感型用戶(hù)提供自主可控選擇。
私有化業(yè)務(wù)場(chǎng)景的落地更具現(xiàn)實(shí)意義。商湯在計(jì)算機(jī)視覺(jué)、金融風(fēng)控、醫(yī)療影像等領(lǐng)域完成的國(guó)產(chǎn)芯片適配項(xiàng)目,不僅滿足合規(guī)要求,更通過(guò)長(zhǎng)期成本優(yōu)化贏得市場(chǎng)認(rèn)可。某金融機(jī)構(gòu)的AI客服系統(tǒng)遷移至國(guó)產(chǎn)算力后,單次推理成本下降40%,系統(tǒng)響應(yīng)速度提升15%,驗(yàn)證了國(guó)產(chǎn)化方案在核心業(yè)務(wù)中的可持續(xù)性。
這種“技術(shù)互補(bǔ)、場(chǎng)景互哺”的協(xié)同模式,正在重塑中國(guó)AI產(chǎn)業(yè)格局。商湯與華為、寒武紀(jì)等企業(yè)構(gòu)建的“算力Mall”平臺(tái),已匯聚超過(guò)200種算力資源與行業(yè)模型服務(wù),開(kāi)發(fā)者可像選購(gòu)商品般自由組合解決方案。這種以交付為導(dǎo)向的合作路徑,既降低了AI應(yīng)用門(mén)檻,也為國(guó)產(chǎn)算力提供了真實(shí)場(chǎng)景的迭代機(jī)會(huì),形成“應(yīng)用反哺技術(shù)、技術(shù)支撐應(yīng)用”的良性循環(huán)。















