谷歌近期對(duì)旗下AI平臺(tái)Genie 3進(jìn)行了重要更新,再次引發(fā)了業(yè)界對(duì)AI實(shí)時(shí)生成互動(dòng)世界能力的關(guān)注。盡管這一技術(shù)展示了巨大潛力,但要真正改變游戲開發(fā)行業(yè),仍面臨諸多挑戰(zhàn),其中最突出的是如何維持虛擬世界的穩(wěn)定性。
幾個(gè)月前,谷歌發(fā)布Project Genie時(shí),曾被視為可能顛覆傳統(tǒng)游戲開發(fā)方式的技術(shù)突破。然而,在最近的一次演示中,谷歌坦言,作為核心引擎的Genie 3模型距離實(shí)際應(yīng)用還有很長(zhǎng)的路要走。Project Genie的目標(biāo)是讓AI能夠根據(jù)文字描述即時(shí)生成可探索的虛擬世界,而Genie 3確實(shí)能夠根據(jù)文本生成接近真實(shí)的環(huán)境,并支持用戶在其中實(shí)時(shí)移動(dòng)和互動(dòng),同時(shí)遵循一定的物理與邏輯規(guī)則。谷歌DeepMind將這一模型視為邁向通用人工智能(AGI)的重要一步,因?yàn)椤笆澜缒P汀蹦軌驇椭鶤I理解環(huán)境變化并預(yù)測(cè)行為結(jié)果。
盡管如此,Genie 3在實(shí)際應(yīng)用中仍存在明顯限制。據(jù)外媒TechSpot報(bào)道,在GDC的一場(chǎng)演講中,谷歌透露,早期版本的Genie 3只能維持幾秒鐘穩(wěn)定的3D世界。雖然當(dāng)前版本已有所改進(jìn),通常能夠保持約一分鐘的一致性,但隨后場(chǎng)景會(huì)逐漸變得混亂。這一局限性表明,該技術(shù)距離成熟應(yīng)用還有很大差距。
Genie 3生成世界的方式也與傳統(tǒng)游戲開發(fā)截然不同。該系統(tǒng)逐幀生成畫面,更像是由文本提示驅(qū)動(dòng)的視頻流,而非完整的3D引擎。這種生成方式雖然靈活,但也增加了維持世界穩(wěn)定性的難度。
DeepMind研究員亞歷山大·穆法雷克表示,谷歌開發(fā)Project Genie并非為了取代游戲開發(fā)行業(yè),而是希望隨著技術(shù)進(jìn)步,生成式AI能夠逐漸具備創(chuàng)建游戲世界的能力。他進(jìn)一步指出,谷歌未來計(jì)劃將這種技術(shù)向游戲開發(fā)者開放,鼓勵(lì)他們進(jìn)行實(shí)驗(yàn)和探索。不過,穆法雷克也承認(rèn),目前Genie 3尚未達(dá)到可用于實(shí)際游戲制作的階段。















