OpenAI今日宣布正式發(fā)布GPT-5.2-Codex,這款被官方定義為"革命性智能體編程模型"的新產(chǎn)品,在復雜代碼處理、跨平臺適配及多模態(tài)交互領域?qū)崿F(xiàn)重大突破。付費版ChatGPT用戶即日起可通過Codex命令行工具和集成開發(fā)環(huán)境插件率先體驗,API接口將于近期逐步開放。
該模型的核心技術(shù)創(chuàng)新體現(xiàn)在四個維度:在長周期任務處理方面,通過引入原生上下文壓縮算法,使持續(xù)數(shù)周的大型代碼庫重構(gòu)項目能夠保持完整上下文記憶,Token消耗量減少30%;針對代碼重構(gòu)和語言遷移場景,模型可靠性較前代提升40%,即便在開發(fā)路徑調(diào)整或嘗試失敗時,仍能自主優(yōu)化解決方案;Windows系統(tǒng)適配能力實現(xiàn)質(zhì)的飛躍,終端操作成功率突破95%,徹底解決路徑識別和命令兼容等歷史遺留問題;新增的視覺解析模塊可直接處理技術(shù)圖紙和設計草圖,例如將APP界面手繪稿轉(zhuǎn)化為可執(zhí)行前端代碼,省去傳統(tǒng)開發(fā)流程中的文字描述環(huán)節(jié)。
專業(yè)評測數(shù)據(jù)顯示,GPT-5.2-Codex在SWE-Bench Pro真實軟件工程基準測試中取得55.6%的任務完成率,較GPT-5.2提升近5個百分點,成為首個突破"半自動化開發(fā)"臨界點的模型。在Terminal-Bench 2.0終端任務測試中,模型平均任務完成時間從15分鐘壓縮至8分鐘,錯誤率下降60%,其編譯代碼、訓練AI模型和配置云服務器的綜合表現(xiàn)顯著優(yōu)于行業(yè)平均水平。
開發(fā)團隊透露,新模型特別強化了復雜工程場景的自主決策能力。在模擬測試中,當面對需要同時修改多個依賴庫的代碼重構(gòu)任務時,GPT-5.2-Codex能夠自動規(guī)劃執(zhí)行順序并處理版本沖突,其表現(xiàn)接近資深工程師水平。視覺解析功能的加入,則使得非專業(yè)開發(fā)者可以通過上傳設計草圖直接生成代碼框架,大幅降低技術(shù)門檻。目前該模型已支持Java、Python、C++等20余種主流編程語言,以及Photoshop、Figma等設計工具的輸出格式轉(zhuǎn)換。















