在人工智能領(lǐng)域,沒有博士學位和論文發(fā)表經(jīng)歷,是否意味著與頂尖實驗室無緣?Keller Jordan的故事給出了令人驚喜的答案。這位畢業(yè)于加州大學圣地亞哥分校的數(shù)學與計算機雙學位畢業(yè)生,憑借開源項目和硬核技術(shù)實力,成功叩開OpenAI的大門。
2024年末,Keller推出的神經(jīng)網(wǎng)絡(luò)優(yōu)化器Muon再次引發(fā)震動。這個通過Newton-Schulz迭代正交化更新矩陣的創(chuàng)新算法,在NanoGPT和CIFAR-10訓練中刷新世界紀錄。相比主流的AdamW優(yōu)化器,Muon在處理千億參數(shù)模型時展現(xiàn)出顯著優(yōu)勢,其bf16精度下的穩(wěn)定運行能力更解決了大規(guī)模訓練的算力瓶頸。盡管拒絕為Muon撰寫學術(shù)論文,這個開源項目仍在開發(fā)者社區(qū)持續(xù)發(fā)酵。
Keller的逆襲并非孤例。谷歌DeepMind的Sholto Douglas在X平臺默默耕耘,通過在Jax項目中的深度貢獻獲得面試機會,最終成為Gemini模型的關(guān)鍵開發(fā)者;量化分析師Andy Jones憑借自研GPU加速環(huán)境和嚴謹消融實驗,在沒有耀眼論文的情況下加入Anthropic。這些案例揭示著AI行業(yè)的新趨勢:當開放研究成為主流,可驗證的技術(shù)貢獻正在取代傳統(tǒng)學術(shù)指標,成為衡量人才的新標尺。















