媒體界 - 推動中國媒體行業創新,促進業內人士交流分享!

17歲深圳高三生與頂尖學者共著AI論文 馬斯克點贊中國創新力量

   發布時間:2026-03-20 04:38 作者:任飛揚

全球人工智能領域近日迎來一則引發廣泛討論的消息:中國深圳一名17歲高三學生陳廣宇,以共同第一作者身份參與月之暗面(Moonshot AI)Kimi團隊發表的論文《Attention Residuals》(注意力殘差),其提出的創新方法對Transformer架構底層邏輯進行突破性改進,更獲得科技界知名人物埃隆·馬斯克公開稱贊“令人印象深刻”。這一事件不僅因技術突破備受關注,更因少年研究者的身份引發全球對AI人才培養模式的重新審視。

論文核心提出的“注意力殘差”機制,直指當前大模型發展中的關鍵瓶頸。傳統Transformer架構依賴的“殘差連接”雖能緩解深層網絡訓練難題,但如同將所有歷史信息不加篩選地傳遞給下一層,導致計算資源浪費與核心信息稀釋。Kimi團隊的創新在于引入動態篩選機制,使模型能自主聚焦最具價值的信息,如同為信息傳輸配備“智能過濾器”。實驗數據顯示,該方法在Kimi Linear 48B模型上實現訓練計算量減少20%的同時保持性能,為行業突破“堆算力”困局提供了新思路。

這項突破的署名名單中,陳廣宇與旋轉位置編碼(RoPE)提出者蘇劍林、Kimi架構核心開發者張宇并列“同等貢獻”,引發對少年研究者成長路徑的探究。據公開報道,陳廣宇系統接觸AI研究僅一年有余,其學習軌跡極具互聯網時代特征:通過研讀開源論文、參與GitHub項目、在技術社區分享思考逐步積累認知。去年,他在社交平臺發布的技術反思被硅谷AI初創公司CEO關注,經限時實驗測試后獲得實習機會,這段經歷成為其科研生涯的重要轉折點。

在Kimi團隊期間,陳廣宇迅速展現實戰能力。他不僅深度參與核心研發,更在內部“黑客馬拉松”競賽中奪得冠軍,證明其創新思維與工程能力的雙重實力。值得注意的是,這位少年研究者始終保持清醒認知,在接受采訪時多次強調“這是團隊成果”,并特別提及從事模型擴展與基礎設施建設的同事。論文附錄中37位作者的署名名單,印證了當代AI研究高度協作的特征——從算法設計到工程實現,每個環節都凝聚著跨領域專家的智慧。

行業觀察者指出,陳廣宇現象折射出中國AI生態的深刻變化。月之暗面作為成立僅兩年的初創公司,敢于在Transformer底層架構發起挑戰,標志著中國AI企業從應用層創新向基礎研究的縱深突破。而17歲研究者與國際頂尖團隊的無縫協作,則展現了開源社區、社交媒體在打破人才流動壁壘中的關鍵作用。這種“非典型”成長路徑,為全球AI人才培養提供了新范式:通過開放的技術生態,年輕研究者得以更早接觸前沿課題,在實戰中完成從知識吸收到價值創造的跨越。

馬斯克的公開點贊,將這場技術突破置于全球競爭的語境之下。當中國AI初創公司的創新成果進入國際科技領袖的視野,當少年研究者能在全球最前沿領域與頂尖專家平等對話,這些信號共同指向一個趨勢:AI領域的競爭正從單一技術比拼轉向創新生態的較量。在這個生態中,開放的研究文化、包容的協作機制、對年輕人才的信任,或許將成為決定未來格局的關鍵變量。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新