媒體界 - 推動中國媒體行業創新,促進業內人士交流分享!

對話魔形智能徐凌杰:Token工廠崛起,談Token出海為何當下不具可行性

   發布時間:2026-04-20 21:25 作者:吳婷

在人工智能大模型領域,短短兩年間,行業格局與認知已發生深刻變革。2024年初,壁仞科技聯合創始人徐凌杰告別GPU市場,投身創立魔形智能(Magik Compute),立志打造“AI Token Factory”,彼時這一概念尚顯陌生。然而,到2026年,隨著OpenClaw、Seedance等應用的廣泛普及,“Token經濟學”迅速在行業內外走紅。

今年3月,中國Token日均調用量突破140萬億大關。同月,英偉達年度盛會GTC 2026上,黃仁勛預言“未來的數據中心將轉變為生產Token的工廠”,這與魔形智能的愿景不謀而合。3月底,在上海,徐凌杰分享了魔形智能的目標愿景與業務模式,并從“局內人”視角,剖析了Token工廠、Token經濟學以及電力出海等概念背后的真相。

徐凌杰的創業選擇,源于對行業趨勢的敏銳洞察。他曾在英偉達、AMD、三星北美研究院從事GPU研發與管理工作,并擔任阿里巴巴阿里云智能事業群總監。2019年壁仞科技成立后,他作為聯合創始人,負責產品規劃與市場拓展。2024年,壁仞多款產品進入量產階段,營收快速增長,同年9月還啟動了上市輔導。然而,徐凌杰卻選擇在這個關鍵時刻離職創業。

對于創業時機,徐凌杰表示,他和聯合創始人金琛看到,在AI大模型與芯片之間,存在大量工作待完成。2024年他40歲,認為人生的黃金年齡有限,既然預見到Token大潮即將來臨,便決定抓住機遇,勇敢嘗試。讓他看清這一趨勢的,有兩件關鍵事件。

一是2024年GTC大會上,英偉達發布的GB200 NVL72。這是一個集成了36個Grace CPU、72個Blackwell GPU,擁有60萬個零件、重達3000磅的“超節點(SuperPod)”機架系統,代表了英偉達“超節點”產品路線。二是同年5月,開源模型DeepSeek V2發布,憑借MoE(混合專家模型)、MLA(多頭潛注意力)等技術,將模型推理成本降至行業最低,每百萬Token成本相比同年發布的GPT-5降低約96%。算力以“超節點”形式極致堆疊,模型通過結構創新壓縮單位Token成本,供給與效率同時躍遷,使Token具備了工業化生產、精細化定價的可能性。

徐凌杰將魔形智能定位為“軟硬件協同的AI Infra”。在寫給壁仞同事的離職信中,他提到雖告別造芯之路,但仍將堅守智能算力賽道。當時外界對此感到困惑,因為在很長一段時間里,AI三要素“算力、算法和數據”是理解AI公司市場定位的坐標系,芯片公司常被視為算力的代表。

在徐凌杰看來,Token工廠與數據中心、智算中心有顯著差異。借用黃仁勛提出的五層蛋糕理論,Token將能源、芯片、infra、大模型封裝在一起,更貼近生活,消費者對Token作為購買智力單元已有感知。此前行業關注算力中心落成、千卡/萬卡集群打造,主要因產業處于模型訓練階段,模型未被廣泛使用。2025年DeepSeek V3爆發后,眾多應用涌現,推理相比訓練未來成長性更高,這是經濟效益再分配過程,如今很多公司已給工程師配額Token用于生產。

對于魔形智能的位置,徐凌杰表示,市場對更快、智力更高、更大規模生產的Token有需求,這需要更大集群。中國存在大量優質開源模型,當模型統一開源后,未來需關注如何更好組織硬件、讓模型運行更佳,這是Infra的工作。魔形智能對標Nebius,但走得更深、全棧自研。Nebius部分服務器自研,通過改配統一配置提高穩定性,降低故障中斷率,使模型訓練更快。魔形智能強調軟硬件都要做,而目前大部分Infra企業仍以軟件方式運營。

當被問及如何衡量Token工廠性能時,徐凌杰提出“用多少電,產生多少Token”的指標,這與黃仁勛“誰的每瓦Token吞吐量最高,誰的生產成本就最低”的觀點一致。電力決定裝機量上限,進而決定每天生產Token數量,但不同品牌、型號芯片性能不均等,模型能力不同,產生的Token智力也不同,參數量越大的模型Token越聰明,生產效率也更高。對于Token單位電力吞吐量,徐凌杰認為可關注芯片性能升級、超節點升級以及計算格式不同等變量條件。

談及英偉達在Token工廠范疇的地位,徐凌杰表示英偉達仍是技術極限的追求者和定義者,其文化推動員工追求“speed of light”(光速)這一極限指標。當前市場比拼絕對性能和單位性價比,對中國公司而言,追求單位性價比更為重要。

對于建立Token工廠的要素,徐凌杰認為長期要走向超節點系統化工程,現階段可優化運營成本,搞定硬件、掌握供應鏈關鍵環節。目前中國每秒產生的Token(TPS)大概在30到60個,美國可能達到100、200,主要受限于算力供給。當被問及魔形智能是否會自研芯片時,徐凌杰表示這相對遙遠,不在當前規劃中,魔形智能面向提供Token,服務器、集群是副產品。

面對國內AI Infra賽道的競爭,徐凌杰認為市場尚未到互相競爭階段,AI Infra市場盤子比芯片更大,但資本投入遠未達到芯片賽道程度,大家面對的是百倍千倍的成長機會,三年后賽道可能跑出千億級別人民幣以上的公司,且不止一家。對于AI Infra的商業模式,徐凌杰表示目前魔形智能更接近與算力中心合作,用他們的機器生產Token,未來算力消納模式可能是擴大資源的一種方式。而對于“token出海”“電力出海”概念,徐凌杰認為電力成本在Token成本中占比不到10%,算力成本才是核心,當前中國算力無優勢,算力都不夠用,未來隨著芯片水平提高,這種愿景或許可能實現,但目前并非現實命題。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新