字節(jié)跳動近日推出全新視頻生成大模型SeeDance 2.0,這款產(chǎn)品一經(jīng)發(fā)布便在國內(nèi)外科技領(lǐng)域掀起熱議。部分用戶將其稱為“地表最強(qiáng)視頻生成工具”,海外網(wǎng)友盛贊其效果堪比好萊塢大片,就連全球首富馬斯克也在社交平臺發(fā)文驚嘆:“這個模型發(fā)展速度太快了。”他還轉(zhuǎn)發(fā)相關(guān)評論并感慨“It's happening fast”。
打造這一現(xiàn)象級AI產(chǎn)品的,是字節(jié)跳動投入重金打造的Seed團(tuán)隊。該團(tuán)隊以南京大學(xué)校友吳永輝博士為核心,匯聚了多所頂尖高校的精英人才。Seed部門成立于2023年,是字節(jié)跳動專門為大模型研究設(shè)立的核心部門,目前團(tuán)隊規(guī)模已達(dá)上千人,部門負(fù)責(zé)人正是曾深度參與Gemini開發(fā)的前Google Fellow吳永輝博士。
吳永輝的學(xué)術(shù)背景十分亮眼。他本科就讀于南京大學(xué)計算機(jī)科學(xué)專業(yè),之后前往美國加州大學(xué)河濱分校攻讀碩士和博士學(xué)位。2025年初,他加入字節(jié)跳動,接管Seed團(tuán)隊,直接向字節(jié)CEO梁汝波匯報工作,成為字節(jié)AI研發(fā)的關(guān)鍵人物。
吳永輝在谷歌有著長達(dá)17年的技術(shù)工作經(jīng)歷。在此期間,他作為核心作者之一提出了GNMT(谷歌神經(jīng)機(jī)器翻譯系統(tǒng))。這一系統(tǒng)首次將端到端深度學(xué)習(xí)應(yīng)用于機(jī)器翻譯領(lǐng)域,使翻譯錯誤率相較于傳統(tǒng)系統(tǒng)大幅下降超過60%,相關(guān)論文引用次數(shù)已超9500次,成為該領(lǐng)域的經(jīng)典之作。根據(jù)谷歌學(xué)術(shù)數(shù)據(jù),吳永輝的論文總被引次數(shù)超過7.3萬次,近五年引用超6萬次,高于多位業(yè)界知名科學(xué)家,其高引論文大多與Gemini模型相關(guān)。
作為Gemini應(yīng)用方向的主要技術(shù)負(fù)責(zé)人之一,吳永輝深度參與了Gemini系列的研發(fā)工作。在Gemini 1.5項目中,他主導(dǎo)將大模型上下文窗口擴(kuò)展至100萬token,顯著提升了模型對長文本和多模態(tài)內(nèi)容的處理能力。他還是Palm 2大模型訓(xùn)練團(tuán)隊的核心貢獻(xiàn)者之一,在大模型技術(shù)演進(jìn)過程中積累了豐富的研發(fā)經(jīng)驗。
此前有數(shù)據(jù)反映出一些行業(yè)現(xiàn)象:去年斯坦福實驗室流出的一組數(shù)據(jù)顯示,在硅谷亞裔技術(shù)骨干中,每10項專利發(fā)明就有7項來自華裔團(tuán)隊,但高管僅占2%;谷歌、OpenAI、Anthropic在科研領(lǐng)域的前三號位也均非華裔。在這樣的背景下,吳永輝選擇離開工作17年的谷歌,加入字節(jié)跳動。他帶領(lǐng)團(tuán)隊推動豆包等模型取得爆發(fā)式成長,在中文理解、復(fù)雜邏輯實時生成等領(lǐng)域展現(xiàn)出局部領(lǐng)先優(yōu)勢。















