生成式人工智能正以顛覆性姿態(tài)重塑軟件開發(fā)領(lǐng)域,從代碼生成到全流程智能開發(fā),這項技術(shù)不僅重新定義了開發(fā)范式,更催生出對系統(tǒng)可信度的全新要求。當AI智能體開始具備規(guī)劃、執(zhí)行和驗證代碼庫變更的能力時,如何確保其決策既高效又安全,成為行業(yè)亟待突破的核心命題。
亞馬遜近日宣布啟動2026年度Amazon Nova AI挑戰(zhàn)賽,這項全球性高校競賽將聚焦軟件工程領(lǐng)域的可信智能體開發(fā)。賽事特別強調(diào)多步驟智能體應用開發(fā),要求參賽團隊構(gòu)建能夠處理真實工程場景的AI系統(tǒng),在模型性能提升與安全防護之間建立動態(tài)平衡機制。
據(jù)亞馬遜AGI高級副總裁兼首席科學家Rohit Prasad介紹,本屆挑戰(zhàn)賽反映了生成式AI在軟件開發(fā)領(lǐng)域的范式轉(zhuǎn)變:"系統(tǒng)能力提升與責任運行機制必須同步進化。我們期待學生團隊能重新定義智能體開發(fā)的標準,在復雜任務(wù)處理中構(gòu)建可靠的安全邊界。"
競賽設(shè)置開發(fā)團隊與紅隊雙軌機制:開發(fā)團隊需在智能體編碼系統(tǒng)中構(gòu)建多層防御體系,紅隊則通過壓力測試暴露系統(tǒng)潛在弱點。評估體系采用雙維度評分,既考察系統(tǒng)完成復雜變更的能力,也嚴格審核安全防護措施的有效性,獲獎系統(tǒng)必須同時通過性能基準測試與安全滲透測試。
賽事核心創(chuàng)新體現(xiàn)在三大維度:突破傳統(tǒng)代碼生成模式,要求智能體完成從需求分析到部署驗證的全鏈條開發(fā);建立實用性與安全性的動態(tài)平衡模型,防止性能提升引發(fā)新型安全風險;采用真實工程場景測試集,模擬版本控制沖突、依賴管理、性能調(diào)優(yōu)等日常開發(fā)挑戰(zhàn)。
2025年11月10日將正式開放申請通道,全球高校可通過YouNoodle平臺提交參賽方案。最終入選的十支團隊將獲得全年競賽支持,包括定制化開發(fā)環(huán)境、安全專家指導及專項資源包。項目評估與現(xiàn)場決賽將于2026學年陸續(xù)展開,優(yōu)秀方案有望納入亞馬遜開發(fā)者工具生態(tài)。
針對參賽者普遍關(guān)注的焦點問題,組委會明確:2026屆賽事重點考察智能體處理多步驟開發(fā)任務(wù)的能力,要求系統(tǒng)在性能優(yōu)化與安全防護間實現(xiàn)協(xié)同進化;參賽團隊需同時提升模型處理復雜任務(wù)的魯棒性,并構(gòu)建可擴展的安全驗證框架;申請者可通過YouNoodle平臺獲取完整競賽指南,申請截止后將進行多輪技術(shù)評審確定最終名單。















