在國際消費電子展(CES)這場全球矚目的“科技盛宴”上,英偉達創(chuàng)始人黃仁勛拋出了一個引發(fā)廣泛討論的觀點:物理AI的“ChatGPT時刻”即將來臨。這一論斷并非孤立存在,北京智源人工智能研究院發(fā)布的《2026人工智能十大趨勢》報告也給出了相似判斷——人工智能的發(fā)展重心正從單純追求語言模型的參數(shù)規(guī)模,轉向對物理世界底層規(guī)律的理解與建模,行業(yè)技術范式迎來重大變革。
智源研究院院長王仲遠在發(fā)布會上強調(diào),基礎模型競爭的焦點已從“參數(shù)規(guī)模”轉變?yōu)椤皩κ澜邕\行規(guī)律的理解”。AI正從“預測下一個詞”向“預測世界下一個狀態(tài)”跨越,這意味著AI的演進方向正發(fā)生結構性轉變。以“下一狀態(tài)預測”(NSP)為代表的新機制,正推動AI從感知數(shù)字世界,邁向理解并規(guī)劃物理世界的因果變化。
在這份指引行業(yè)未來的報告中,螞蟻集團作為產(chǎn)業(yè)實踐的典型代表被多次提及。其在AI大模型、超級應用、AI安全等關鍵領域的系統(tǒng)性布局和扎實成果,為報告所預測的未來提供了生動的實踐案例。
報告指出,2026年將成為AI從數(shù)字世界向物理世界拓展、從技術演示走向規(guī)模應用的關鍵轉折點。這一轉變背后,有三條主線值得關注:首先是AI的認知方式發(fā)生了變化。過去,AI主要擅長處理靜態(tài)的語言和圖像數(shù)據(jù),如今則開始嘗試預測“下一步會發(fā)生什么”。以世界模型和NSP為代表的新方向,讓AI不再局限于識圖識話,而是要理解物體的運動規(guī)律和行為演化,為自動駕駛仿真、機器人學習等物理任務提供“預判力”。
其次是AI的形態(tài)發(fā)生了改變。AI正從代碼形態(tài)轉變?yōu)槟茏吣軇拥臋C器人形態(tài),從單打獨斗的智能體轉變?yōu)榭梢苑止f(xié)作的“AI團隊”。通用人形機器人開始走進工業(yè)場景,不再局限于實驗室研究。在軟件層面,多智能體(MAS)之間的標準化通信協(xié)議逐漸成型,使得AI之間能夠像人類團隊一樣完成科研、工業(yè)等復雜任務。
最后是AI創(chuàng)造價值的方式發(fā)生了變化。在消費端,一個集多種功能于一體的超級應用入口正在形成,成為科技巨頭競爭的焦點。在企業(yè)端,AI正憑借完善的數(shù)據(jù)治理和行業(yè)標準接口,在垂直領域孕育出真正具有商業(yè)價值的產(chǎn)品(MVP),越過早期概念驗證的“幻滅期”。
從技術前沿來看,四大趨勢正在重塑AI的基礎能力。一是世界模型成為通用人工智能(AGI)的共識方向,NSP有望成為新的技術范式。行業(yè)共識正從語言模型轉向能夠理解物理規(guī)律的多模態(tài)世界模型,NSP標志著AI開始掌握時空連續(xù)性和因果關系,從感知走向認知。二是具身智能迎來行業(yè)洗牌,產(chǎn)業(yè)應用進入廣泛工業(yè)場景。具身智能正從實驗室演示階段進入產(chǎn)業(yè)篩選和落地階段,隨著大模型與運動控制、合成數(shù)據(jù)的結合,人形機器人有望在2026年突破演示階段,進入真實的工業(yè)和服務場景。三是多智能體系統(tǒng)決定應用上限,Agent時代的“TCP/IP”初具雛形。復雜問題的解決依賴多智能體協(xié)同,隨著MCP、A2A等通信協(xié)議趨于標準化,智能體之間擁有了通用“語言”,多智能體系統(tǒng)將突破單體智能的局限,在科研、工業(yè)等復雜工作流中發(fā)揮關鍵作用。四是AI Scientist成為AI for Science(AI4S)的核心目標,國產(chǎn)科學基礎模型正在孕育。AI在科研中的角色正從輔助工具升級為自主研究的“AI科學家”,構建自主的科學基礎模型體系已成為緊迫的國家戰(zhàn)略需求。
在產(chǎn)業(yè)落地方面,AI時代的“新BAT”格局逐漸清晰,垂直賽道仍存在高盈利機會。C端AI超級應用的“All in One”入口成為巨頭競爭的焦點。海外以OpenAI的ChatGPT和Google Gemini為代表,通過深度集成各類服務,塑造了一體化智能助手的新范式。國內(nèi)字節(jié)、阿里、螞蟻等企業(yè)也依托自身生態(tài)積極布局。螞蟻推出的“靈光”和“阿福”分別成為通用入口和垂類場景的典型案例。“靈光”是一款全模態(tài)AI助手,精準解決了AI應用“重聊天、輕行動”的痛點。上線首周下載量突破200萬,其核心功能“閃應用”允許用戶通過自然語言快速生成可交互的輕應用,大幅降低了開發(fā)門檻,推動了“全民手搓AI應用”的風潮。其全模態(tài)信息生成能力提升了交互效率和體驗的“信息美感”,滿足了用戶對AI實用性的需求。“阿福”則聚焦醫(yī)療健康領域,定位為“AI健康朋友”。目前,其App月活用戶已突破3000萬,單日健康問答量超過1000萬。為了讓健康服務更專業(yè)、可信,阿福自研專用底座大模型,并與全國院士、名醫(yī)深度合作,連接了超5000家醫(yī)院資源、50萬真人醫(yī)生和500位名醫(yī)AI分身,形成了從專業(yè)問答到醫(yī)療服務的完整閉環(huán)。
企業(yè)級AI應用在經(jīng)歷概念驗證熱潮后,正因數(shù)據(jù)、成本等問題進入“幻滅低谷期”。但隨著數(shù)據(jù)治理和工具鏈的成熟,預計2026年下半年將迎來轉折,一批真正具有商業(yè)價值的MVP產(chǎn)品將在垂直行業(yè)實現(xiàn)規(guī)模落地。
在關鍵支撐領域,螞蟻集團在推理和安全方面進行了系統(tǒng)性布局。合成數(shù)據(jù)占比不斷攀升,有望解決高質量真實數(shù)據(jù)枯竭的問題。修正擴展定律為合成數(shù)據(jù)提供了理論支持,尤其在自動駕駛和機器人領域,由世界模型生成的合成數(shù)據(jù)將成為降低訓練成本、提升性能的關鍵資產(chǎn)。推理優(yōu)化仍有很大提升空間,“技術泡沫”的說法并不成立。推理效率仍是AI大規(guī)模應用的核心瓶頸和競爭焦點,通過算法創(chuàng)新和硬件變革,推理成本持續(xù)下降,能效比不斷提升,使得在資源受限的邊緣端部署高性能模型成為可能,這是AI普惠的關鍵前提。螞蟻百靈大模型體系就是這一趨勢的典型代表,其涵蓋了Ling(語言)、Ring(思考)、Ming(多模態(tài))三大系列。語言模型Ling系列采用高稀疏度MoE等高效架構,基于二十萬億Tokens語料訓練,并推出了包含萬億參數(shù)模型Ling-1T與Ring-1T在內(nèi)的完整產(chǎn)品矩陣。螞蟻團隊首創(chuàng)的“棒冰算法(icepop)”有效提升了模型穩(wěn)定性,百靈大模型在Hugging Face等社區(qū)榜單上表現(xiàn)優(yōu)異,其中Ling-1T曾持續(xù)登頂總榜,展現(xiàn)了強大的工程實力和社區(qū)認可度。
為打破算力壟斷和供應風險,構建兼容異構芯片的軟件棧至關重要。繁榮的算子語言和趨于收斂的編譯器技術正在降低開發(fā)門檻,以智源FlagOS為代表的平臺致力于構建軟硬解耦、開放普惠的AI算力底座。AI安全風險已從“幻覺”演變?yōu)楦[蔽的“系統(tǒng)性欺騙”。技術上,Anthropic的回路追蹤研究致力于從內(nèi)部理解模型機理,OpenAI推出自動化安全研究員。產(chǎn)業(yè)上,智源研究院聯(lián)合全球學者發(fā)布AI欺騙系統(tǒng)性國際報告,警示前沿風險,安全正成為AI系統(tǒng)的內(nèi)在屬性。螞蟻集團在此領域構建了貫穿線上與終端的立體防線,其推出的大模型安全解決方案“蟻天鑒”已升級為面向智能體時代的一體化安全解決方案,基于“以攻促防”的安全理念,構建了“對齊-掃描-防御”技術棧,形成全流程防護體系。面對AI眼鏡等新一代智能終端快速增長帶來的安全挑戰(zhàn),螞蟻發(fā)布的全球首個智能終端可信連接技術框架gPass,具備“安全、交互、互連”三大核心能力,支持AI眼鏡與智能體之間的實時可信通信,打通用戶與設備、模型與服務之間的安全連接鏈路,為AI眼鏡廠商與開發(fā)者提供統(tǒng)一、安全的底層架構,構建面向個人智能體時代的安全AI數(shù)字服務生態(tài)。















