在近日的一場行業(yè)交流活動中,范式智能CEO戴文淵發(fā)表了關(guān)于國產(chǎn)算力發(fā)展的深度見解。他指出,當(dāng)前國內(nèi)AI應(yīng)用生態(tài)過度依賴英偉達(dá)體系,超過99%的AI工作均在其框架下完成,這一現(xiàn)象不僅體現(xiàn)在技術(shù)層面,更折射出國產(chǎn)信創(chuàng)生態(tài)建設(shè)的緊迫性。
戴文淵以手機(jī)應(yīng)用生態(tài)作類比:若蘋果手機(jī)擁有200萬個應(yīng)用,而國產(chǎn)手機(jī)僅50個,用戶自然會因生態(tài)缺失而放棄選擇。這種差距在GPU領(lǐng)域同樣顯著——英偉達(dá)CUDA體系擁有1.8萬個算子,而國產(chǎn)GPU平均僅數(shù)百個,核心數(shù)量差距達(dá)20倍。更嚴(yán)峻的是,多數(shù)企業(yè)采購國產(chǎn)卡并非出于性能優(yōu)勢,而是作為英偉達(dá)產(chǎn)品的替代方案,這種"備胎"心態(tài)制約了國產(chǎn)算力的真正突破。
針對行業(yè)普遍追求的"萬卡集群"現(xiàn)象,戴文淵提出不同觀點(diǎn):頭部企業(yè)確實需要超大規(guī)模算力集群,但90%的商業(yè)開發(fā)者更關(guān)注單卡利用率。他透露,某央企搭建的萬卡集群實際利用率極低,開發(fā)者甚至只能使用萬分之一的算力。這種兩極分化要求算力供給必須實現(xiàn)差異化——既滿足頭部企業(yè)的極限需求,也要為中小企業(yè)提供"一張卡跑萬個模型"的靈活方案。
范式智能正通過技術(shù)革新破解這一難題。其推出的信創(chuàng)魔盒Model Hub XC已匯聚超萬個適配國產(chǎn)GPU的模型,雖然數(shù)量僅為英偉達(dá)生態(tài)的百分之一,但每周新增適配量達(dá)2500個,增速顯著。戴文淵透露,公司計劃今年將模型數(shù)量提升至10萬級,明年追平國際主流生態(tài),同時通過異構(gòu)VGPU技術(shù)實現(xiàn)不同廠商硬件的統(tǒng)一調(diào)度,顯著提升資源利用率。
在算力服務(wù)層面,范式智能聯(lián)合曦望推出的Fancy Cloud平臺已實現(xiàn)關(guān)鍵突破。該平臺集成VGPU技術(shù)與開發(fā)工具鏈,可同時調(diào)用英偉達(dá)及國產(chǎn)GPU資源,為客戶提供超萬個垂直領(lǐng)域模型。更引人注目的是其性價比策略——通過與曦望合作,平臺計劃將算力成本降至每百萬token一分錢,較國際同類服務(wù)降低90%以上。
戴文淵強(qiáng)調(diào),國產(chǎn)算力突破需要軟硬件協(xié)同創(chuàng)新。范式智能將持續(xù)完善開發(fā)平臺生態(tài),同時呼吁更多企業(yè)參與信創(chuàng)生態(tài)建設(shè)。他特別指出,垂直模型的價值正在凸顯,OpenAI關(guān)閉專業(yè)領(lǐng)域服務(wù)印證了通用模型在細(xì)分場景的局限性,而范式在二十多個行業(yè)積累的近萬個垂直模型,將成為國產(chǎn)算力生態(tài)的重要競爭力。















