近日,OpenAI聯(lián)合創(chuàng)始人兼總裁Greg Brockman在一場(chǎng)播客訪談中,揭開了公司戰(zhàn)略調(diào)整背后的諸多細(xì)節(jié),引發(fā)行業(yè)廣泛關(guān)注。此次訪談不僅回應(yīng)了外界對(duì)OpenAI放棄Sora項(xiàng)目的猜測(cè),還透露了未來重點(diǎn)布局的Super App、新模型“Spud”以及AI研究員等關(guān)鍵信息。
針對(duì)外界對(duì)OpenAI放棄Sora項(xiàng)目的質(zhì)疑,Greg表示,這并非從消費(fèi)端轉(zhuǎn)向B2B,而是基于戰(zhàn)略聚焦的考慮。OpenAI目前同時(shí)推進(jìn)兩條技術(shù)路線:一是研發(fā)深度學(xué)習(xí)技術(shù),二是部署技術(shù)以積累落地經(jīng)驗(yàn)。當(dāng)前技術(shù)已驗(yàn)證可行,需進(jìn)入真實(shí)世界獲取反饋,因此公司決定將主要精力放在GPT系列上,包括文本和語音交互等領(lǐng)域。Sora項(xiàng)目并未被完全放棄,而是轉(zhuǎn)向機(jī)器人領(lǐng)域繼續(xù)研究,但短期內(nèi)難以在知識(shí)工作領(lǐng)域大規(guī)模落地。
當(dāng)被問及為何不押注視頻生成技術(shù)時(shí),Greg指出,盡管視頻生成進(jìn)步顯著,但機(jī)會(huì)過多時(shí)需排序和把握時(shí)機(jī)。OpenAI已確信文本模型可通往AGI,且今年將推出更強(qiáng)模型。例如,某物理學(xué)家借助OpenAI模型在12小時(shí)內(nèi)解決了研究難題,這種“思考”能力讓公司決定加倍投入文本模型路線。對(duì)于競(jìng)爭(zhēng)對(duì)手DeepMind認(rèn)為圖像生成器更接近AGI的觀點(diǎn),Greg回應(yīng)稱,OpenAI從一開始就選擇了相信的AGI路徑,且圖像生成功能已基于GPT架構(gòu)實(shí)現(xiàn),而非擴(kuò)散模型。
關(guān)于備受矚目的Super App,Greg透露,它將整合編程、瀏覽器和ChatGPT,成為用戶體驗(yàn)AGI力量的端點(diǎn)應(yīng)用。這款應(yīng)用不僅是工具,更是“個(gè)人助理”,能理解用戶目標(biāo)、建立信任關(guān)系。未來,Super App將具備記憶功能,連接郵件、日歷等,深入幫助用戶達(dá)成目標(biāo)。該應(yīng)用將于未來幾個(gè)月分步推進(jìn),起點(diǎn)是Codex應(yīng)用,第一步是讓Codex對(duì)普通知識(shí)工作更友好。
在競(jìng)爭(zhēng)方面,Greg承認(rèn)Anthropic的Claude Code等類似功能已出現(xiàn),但OpenAI在編程方向上一直重視,且正在補(bǔ)上“最后一公里”的易用性。去年年中,公司組建團(tuán)隊(duì)聚焦真實(shí)世界問題,構(gòu)建訓(xùn)練環(huán)境,讓AI適應(yīng)實(shí)際軟件工程中的混亂情況。如今,OpenAI在競(jìng)爭(zhēng)中已占據(jù)優(yōu)勢(shì),用戶更傾向于選擇其產(chǎn)品。
傳聞中的新模型“Spud”也在此次訪談中揭開面紗。Greg表示,“Spud”是OpenAI過去兩年研究成果的體現(xiàn),是一個(gè)新的預(yù)訓(xùn)練模型。它能解決更復(fù)雜的問題,理解力更強(qiáng),對(duì)上下文把握更好,既能拉高問題解決的天花板,也能提升基礎(chǔ)體驗(yàn)。不過,普通用戶能否明顯感覺到變化取決于應(yīng)用場(chǎng)景,有些人會(huì)感覺天差地別,有些應(yīng)用則變化不明顯。但隨著技術(shù)變強(qiáng),用戶會(huì)逐漸感知到AI“能幫上忙”。
OpenAI內(nèi)部正在開發(fā)的自動(dòng)化AI研究員計(jì)劃秋季推出。Greg介紹,該研究員將實(shí)現(xiàn)研究科學(xué)家工作流程的自動(dòng)化,目前已能承擔(dān)相當(dāng)比例的科研任務(wù)。公司會(huì)像帶初級(jí)研究員一樣,給它方向并審閱結(jié)果。對(duì)于AI發(fā)展可能帶來的風(fēng)險(xiǎn),Greg表示擔(dān)憂,但OpenAI在技術(shù)上投入了很多保障安全的措施,如防止提示詞注入攻擊。同時(shí),公司認(rèn)為應(yīng)構(gòu)建“有韌性的開放系統(tǒng)”,讓眾多參與者共同開發(fā)AI,并圍繞技術(shù)建立社會(huì)基礎(chǔ)設(shè)施。
對(duì)于AGI的實(shí)現(xiàn)時(shí)間,Greg認(rèn)為不同人定義不同,若以他個(gè)人標(biāo)準(zhǔn),已完成70%到80%,未來幾年內(nèi)將擁有能完成電腦上幾乎任何智力任務(wù)的AGI。在模型發(fā)展路徑上,Greg指出,隨著基礎(chǔ)模型變強(qiáng),AI從能完成20%的任務(wù)躍升到80%,帶來了巨大變化。未來,公司將繼續(xù)在每個(gè)維度上推進(jìn),如讓AI操作電腦、建設(shè)企業(yè)級(jí)配套技術(shù)、推動(dòng)語音交互等。公司還在理解模型能力階段,將訓(xùn)練擴(kuò)展到開放式問題領(lǐng)域。
針對(duì)是否需要大規(guī)模預(yù)訓(xùn)練的討論,Greg認(rèn)為模型生產(chǎn)流程的每一步都有相乘效應(yīng),更強(qiáng)的預(yù)訓(xùn)練會(huì)讓后續(xù)步驟更輕松。公司要平衡預(yù)訓(xùn)練和推理能力,找到“智能×成本”的最優(yōu)解。在算力方面,Greg表示,無論訓(xùn)練和推理配比如何變化,大規(guī)模訓(xùn)練仍需集中算力,且NVIDIA團(tuán)隊(duì)出色,OpenAI與其深度合作。公司今年融到的資金將投入數(shù)據(jù)中心,因?yàn)樗懔κ鞘杖胫行模鲩L(zhǎng)永遠(yuǎn)趕不上需求。對(duì)于其他玩家“過于冒進(jìn)”的評(píng)論,Greg不同意,他認(rèn)為OpenAI審慎且前瞻性地判斷了技術(shù)走向,提前布局算力。
在公眾對(duì)AI的接受度方面,Greg認(rèn)為需要向大眾展示AI如何改善生活,如有人用ChatGPT協(xié)助診斷出孩子被誤診的腦瘤。對(duì)于數(shù)據(jù)中心帶來的環(huán)境和電費(fèi)擔(dān)憂,他解釋稱水資源消耗小,公司會(huì)支付能源費(fèi)用,不推高居民電價(jià),某些地方數(shù)據(jù)中心還幫助升級(jí)了電網(wǎng),降低了居民電費(fèi)。最后,Greg建議害怕AI的人親自體驗(yàn)工具,理解其利弊,而最能從AI中受益的人是帶著好奇心嘗試并將其融入工作流程的人。















