商湯科技董事長兼CEO徐立博士在近期的一次行業(yè)演講中,深入剖析了當前人工智能領(lǐng)域的發(fā)展態(tài)勢與未來走向。他指出,人工智能的最新發(fā)展浪潮主要得益于生產(chǎn)方式的重大變革,具體體現(xiàn)在從GPT到scaling law的演進、復雜任務(wù)的精細化分解以及推理成本的顯著降低。
徐立博士強調(diào),過去兩年中,每個token的推理成本以驚人的280倍速度下降,這一變化為人工智能的廣泛應(yīng)用奠定了堅實基礎(chǔ)。然而,他也坦誠地指出,當前AI行業(yè)正面臨著專業(yè)思維數(shù)據(jù)稀缺的挑戰(zhàn)。隨著互聯(lián)網(wǎng)語料價值的逐漸耗盡,模型能力的提升愈發(fā)依賴于高質(zhì)量的思維數(shù)據(jù),但這類數(shù)據(jù)的獲取不僅困難且成本高昂。AI在處理長鏈條、復雜任務(wù)時,仍存在幻覺和邏輯錯誤的問題,即便是最先進的模型,其實際幻覺率也超過10%,這在嚴肅的應(yīng)用環(huán)境中構(gòu)成了難以忽視的障礙。
對于大模型的發(fā)展前景,徐立博士認為,2025年將是一個關(guān)鍵轉(zhuǎn)折點,原有的發(fā)展路徑已接近極限,而新的機遇正悄然浮現(xiàn)。他預(yù)測,未來兩年將是AI競爭的決定性時期,AI的成熟度能否突破工業(yè)紅線、成功落地生產(chǎn)環(huán)境并實現(xiàn)規(guī)模化商業(yè)閉環(huán),將成為衡量其成功與否的重要標準。
在演講中,徐立博士還詳細闡述了商湯科技在應(yīng)對這些挑戰(zhàn)方面的策略與布局。他強調(diào),芯片與模型的深度聯(lián)動將是推動AI商業(yè)化閉環(huán)的關(guān)鍵。通過算法與芯片的聯(lián)合優(yōu)化,國產(chǎn)化芯片有望迅速縮小與世界領(lǐng)先水平的差距。
徐立博士進一步解釋了AI研究范式的轉(zhuǎn)變。他指出,從GPT到scaling law的演進,使得人們能夠在訓練時預(yù)測不同資源投入下模型的性能,從而引發(fā)了大規(guī)模的資本投入競爭。然而,隨著這條路徑性價比的逐漸降低,人們開始發(fā)現(xiàn),在推理時刻引入激勵模型能夠繼續(xù)推動測試的擴展,進而引發(fā)應(yīng)用推理架構(gòu)、訓推配比以及CPU、GPU和內(nèi)存配比的深刻變化。
盡管如此,徐立博士也承認,這一部分的紅利很快被消耗殆盡,因為行業(yè)內(nèi)能夠提供優(yōu)質(zhì)激勵模型的場景并不多見。因此,他預(yù)測未來AI的發(fā)展將呈現(xiàn)兩條分化路徑:一條是在垂直產(chǎn)業(yè)中尋找優(yōu)質(zhì)的激勵模型,形成價值閉環(huán);另一條則是探索新的架構(gòu),以更好地利用現(xiàn)有數(shù)據(jù)。
在談到AI在行業(yè)應(yīng)用中的滲透時,徐立博士表示,隨著生成式人工智能的興起,AI的賦能邊界得到了極大拓展,其成長速率也顯著加快。然而,這也帶來了新的挑戰(zhàn),即在行業(yè)應(yīng)用急速增長、滲透率快速迭代的情況下,如何實現(xiàn)推理的高效性成為了一個亟待解決的問題。
針對這一挑戰(zhàn),徐立博士提出了AI in行業(yè)的新融合方法,強調(diào)AI與行業(yè)生產(chǎn)過程的緊密耦合。他認為,通過構(gòu)造新的強化學習邏輯,使AI與行業(yè)生產(chǎn)緊密結(jié)合,能夠完成用戶價值閉環(huán)的疊加。而這一過程對AI基礎(chǔ)設(shè)施的建設(shè)提出了更高要求。
在演講的最后部分,徐立博士還分享了商湯科技在多模態(tài)模型研發(fā)方面的最新進展。他介紹說,商湯的日日新模型從底層解決了模態(tài)融合的問題,通過將語言、文本、圖像、視頻和3D信息融合到神經(jīng)元中,實現(xiàn)了跨模態(tài)數(shù)據(jù)之間的聯(lián)合分布紅利。這一創(chuàng)新不僅提升了模型的融合度,還為AI在視頻生成、空間智能等領(lǐng)域的應(yīng)用開辟了新的道路。















