在生成式人工智能重塑各行業(yè)格局的當(dāng)下,軟件開發(fā)領(lǐng)域正經(jīng)歷著前所未有的變革。從代碼生成到能夠自主規(guī)劃、執(zhí)行并驗(yàn)證代碼庫及用戶應(yīng)用變更的智能系統(tǒng),AI技術(shù)的演進(jìn)不僅提升了開發(fā)效率,更對(duì)系統(tǒng)可信度與可靠性提出了更高要求。如何在保障安全的前提下釋放AI潛能,成為全球開發(fā)者共同關(guān)注的焦點(diǎn)。
亞馬遜近日宣布啟動(dòng)2026年度Amazon Nova AI挑戰(zhàn)賽,這項(xiàng)面向全球高校的年度競賽進(jìn)入第二年,將聚焦軟件工程領(lǐng)域的可信智能體開發(fā)。競賽要求參賽團(tuán)隊(duì)構(gòu)建能夠處理多步驟復(fù)雜任務(wù)的AI智能體,模擬真實(shí)工程場景中的開發(fā)流程,在提升模型實(shí)用性的同時(shí)確保系統(tǒng)安全邊界清晰。
亞馬遜AGI高級(jí)副總裁兼首席科學(xué)家Rohit Prasad指出:"當(dāng)前軟件開發(fā)領(lǐng)域的AI系統(tǒng)已從單一代碼生成進(jìn)化為具備全流程操作能力的智能體。今年的挑戰(zhàn)賽將檢驗(yàn)這些系統(tǒng)在承擔(dān)更復(fù)雜任務(wù)時(shí)的責(zé)任運(yùn)行能力,我們期待學(xué)生團(tuán)隊(duì)為行業(yè)樹立新的能力標(biāo)桿。"
競賽設(shè)置開發(fā)團(tuán)隊(duì)與紅隊(duì)雙賽道:開發(fā)團(tuán)隊(duì)需在智能體編碼系統(tǒng)中構(gòu)建安全防護(hù)機(jī)制,紅隊(duì)則通過壓力測(cè)試挖掘系統(tǒng)漏洞。評(píng)估體系采用雙重標(biāo)準(zhǔn),既考察任務(wù)完成度與模型性能,也嚴(yán)格審核安全防護(hù)措施的有效性。這種設(shè)計(jì)要求參賽者在提升系統(tǒng)處理復(fù)雜任務(wù)能力的同時(shí),建立多層級(jí)風(fēng)險(xiǎn)控制體系。
競賽核心特點(diǎn)體現(xiàn)在三個(gè)方面:其一,突破傳統(tǒng)單次提示的代碼生成模式,要求構(gòu)建具備自主決策能力的多步驟智能體;其二,建立實(shí)用性與安全性的動(dòng)態(tài)平衡機(jī)制,任何功能迭代都需通過安全驗(yàn)證;其三,采用真實(shí)工程場景的評(píng)估標(biāo)準(zhǔn),測(cè)試用例直接取自日常開發(fā)流程。
2025年11月10日,競賽將正式開放申請(qǐng)通道。通過YouNoodle平臺(tái)提交材料的全球高校團(tuán)隊(duì),將競爭十個(gè)參賽名額。入選團(tuán)隊(duì)將獲得跨學(xué)年的持續(xù)支持,包括技術(shù)資源、專業(yè)評(píng)估及最終的現(xiàn)場競技機(jī)會(huì)。組委會(huì)特別強(qiáng)調(diào),競賽過程將貫穿整個(gè)學(xué)年,確保團(tuán)隊(duì)有充足時(shí)間完善解決方案。
針對(duì)參賽者普遍關(guān)心的問題,組委會(huì)給出明確答復(fù):2026年競賽的核心目標(biāo)是推動(dòng)軟件工程領(lǐng)域可信AI的發(fā)展;團(tuán)隊(duì)需在模型性能提升與安全防護(hù)之間找到最優(yōu)解;申請(qǐng)者可通過指定平臺(tái)在規(guī)定時(shí)間提交材料,最終入選團(tuán)隊(duì)將獲得全周期競賽支持。















