在科技行業(yè)的激烈競爭中,亞馬遜云科技始終處于聚光燈下。近期,面對外界對其在生成式AI浪潮中創(chuàng)新步伐的質(zhì)疑,亞馬遜云科技在2025年re:Invent全球大會上以一系列重磅發(fā)布,有力回應(yīng)了這些聲音,再次彰顯其在云計算領(lǐng)域的領(lǐng)導(dǎo)地位。
從業(yè)務(wù)規(guī)模與穩(wěn)定性來看,亞馬遜云科技交出了一份令人矚目的成績單。其年度經(jīng)常性收入(ARR)高達(dá)1320億美元,占據(jù)全球37.5%的市場份額,成為全球數(shù)字經(jīng)濟當(dāng)之無愧的“公共底座”。每天處理超過2億次請求,存儲對象量突破500萬億個,這些數(shù)據(jù)背后,是其在云計算基礎(chǔ)設(shè)施領(lǐng)域的深厚積累。對于尋求將關(guān)鍵業(yè)務(wù)AI化的企業(yè)而言,亞馬遜云科技提供的基礎(chǔ)設(shè)施具備“基礎(chǔ)設(shè)施級”的可靠與安全。在Agent時代,AI應(yīng)用將從實驗走向7x24小時不間斷的核心生產(chǎn)流程,歷經(jīng)超大規(guī)模考驗的穩(wěn)定性,成為企業(yè)業(yè)務(wù)的關(guān)鍵支撐。全球超過10萬家企業(yè)選擇亞馬遜云科技的AI平臺Amazon Bedrock,這一數(shù)據(jù)正是傳統(tǒng)云時代信任向AI時代自然延伸的有力證明。
亞馬遜云科技對客戶復(fù)雜需求的深刻理解與尊重,體現(xiàn)在其開放的生態(tài)構(gòu)建上。在Amazon Bedrock平臺上,集成了來自17家廠商的數(shù)十款模型,涵蓋了從亞馬遜Nova、谷歌Gemini、OpenAI GPT到中國DeepSeek、阿里千問、Kimi等。這一舉措打破了客戶在自研模型與外界明星模型間的單選題困境,賦予客戶自由組合、靈活演進(jìn)的權(quán)利。平臺的核心價值在于確保客戶成功,而非推銷特定產(chǎn)品,這種領(lǐng)導(dǎo)者胸襟為企業(yè)在AI時代的多元化發(fā)展提供了廣闊空間。
在核心戰(zhàn)略方向上,亞馬遜云科技將目光聚焦于All for Agentic AI。首席執(zhí)行官Matt Garman在演講中反復(fù)強調(diào)“Agent”,明確將其定位為下一代應(yīng)用的基本單元。他指出,AI Agent正引領(lǐng)AI發(fā)展走向關(guān)鍵拐點,未來每家公司、每個領(lǐng)域都將運行數(shù)十億個Agent。為應(yīng)對這一趨勢,亞馬遜云科技將企業(yè)落地AI的挑戰(zhàn)系統(tǒng)解構(gòu)為四大支柱:AI基礎(chǔ)設(shè)施、模型生態(tài)、數(shù)據(jù)基座與開發(fā)者工具,構(gòu)建起支撐Agent發(fā)展的完整價值實現(xiàn)框架。
在Agentic AI戰(zhàn)場,亞馬遜云科技憑借先見之明,率先構(gòu)筑起系統(tǒng)競爭力。早在Agent概念尚未普及之時,便開始布局支撐其落地的四大支柱。其定義的Agent,并非簡單的聊天機器人式輔助,而是具備自主規(guī)劃、調(diào)用工具、跨會話記憶能力的下一代應(yīng)用基本單元。這意味著云計算的經(jīng)典三層架構(gòu)將被“Agent + Token”取代,所有底層資源最終服務(wù)于Agent的7×24小時運轉(zhuǎn)。
為支撐Agent的運行,亞馬遜云科技構(gòu)建了一套層級分明的能力棧。在底層,打造了承載Agent運行的AI基礎(chǔ)設(shè)施和模型生態(tài);在中間層,全新升級的Amazon Bedrock AgentCore成為關(guān)鍵“構(gòu)建工具”。這個被下載超過200萬次的SDK,致力于解決企業(yè)構(gòu)建可信Agent的核心痛點,通過自然語言策略(AgentCore Policy)設(shè)置安全護(hù)欄,利用13個維度的自動化評估(AgentCore evaluations)持續(xù)監(jiān)控表現(xiàn),還創(chuàng)新性地賦予Agent“情景記憶”(Episodic Memory),使其能跨會話記憶上下文,像人類一樣持續(xù)學(xué)習(xí),有效消除了企業(yè)“不敢讓AI自主行動”的顧慮,將Agent從實驗室玩具轉(zhuǎn)變?yōu)榭赏懈蛾P(guān)鍵任務(wù)的生產(chǎn)力。
面向垂直場景,亞馬遜云科技推出的Frontier Agents更是亮點十足。這些經(jīng)過內(nèi)部大規(guī)模驗證的數(shù)字員工,能夠直接重塑軟件生命周期。例如,Kiro autonomous agent能夠理解宏觀目標(biāo),自主規(guī)劃、編碼、測試。在一個原需30人18個月完成的重構(gòu)項目中,Kiro輔助下僅需6人76天即可完成,其標(biāo)志性的“小幽靈”Logo,寓意著產(chǎn)品從冰冷資源立方體向有溫度、懂協(xié)作伙伴的演進(jìn)。Amazon Security Agent將安全前置到設(shè)計與開發(fā)階段,自動審查代碼漏洞,把昂貴的滲透測試變?yōu)榘葱璺?wù),多媒體巨頭Adobe利用它確保全球營銷活動符合版權(quán)與品牌規(guī)范。Amazon DevOps Agent作為虛擬運維專家,能關(guān)聯(lián)復(fù)雜系統(tǒng)日志與數(shù)據(jù),快速定位根因,推動系統(tǒng)自愈,實現(xiàn)運維的“系統(tǒng)自治”。這些Agent的發(fā)布,深刻體現(xiàn)了亞馬遜云科技對Agent價值的理解:釋放生產(chǎn)力在于讓AI接管完整、跨工具、跨流程的復(fù)雜工作流。
算力是驅(qū)動Agent帝國的核心引擎。當(dāng)數(shù)以十億計的Agent7x24小時不間斷推理、規(guī)劃、執(zhí)行,Token消耗將呈天文數(shù)字,成本成為Agent規(guī)模化落地的首要障礙。為此,亞馬遜云科技推出自研芯片Trainium3,開啟“成本革命”。Trainium3基于3nm先進(jìn)制程,每兆瓦電力產(chǎn)生的Token數(shù)量是上一代的5倍,訓(xùn)練成本可降低最多50%。這意味著運行同樣Agent工作負(fù)載,企業(yè)算力賬單可能減半甚至更低,對Agent大規(guī)模部署至關(guān)重要。
Trainium3的價值不僅體現(xiàn)在單顆芯片性能上,更在于系統(tǒng)級工程。它集成到Amazon Trainium3 UltraServer服務(wù)器中,單臺服務(wù)器最多集成144顆芯片,總算力高達(dá)362 PFlops。通過定制的NeuronSwitch高速互聯(lián)技術(shù),芯片間延遲壓至10微秒以下,構(gòu)建出堪比“超級計算機”的緊密算力單元,專門優(yōu)化Agent應(yīng)用所需的長上下文、多模態(tài)推理及復(fù)雜工作流調(diào)度。這場成本革命對亞馬遜云科技具有雙重戰(zhàn)略意義:對內(nèi)鞏固全棧AI競爭壁壘,自研芯片與自研模型深度協(xié)同,實現(xiàn)從硅到模型的端到端效率優(yōu)化;對外提供極致性價比,讓客戶享受更低成本算力,同時與英偉達(dá)GPU共存策略兼顧尖端客戶需求與成本底線。
生成式AI的發(fā)展對云基礎(chǔ)設(shè)施提出了全新挑戰(zhàn),集中在成本與效率、彈性邊界、延遲敏感度、安全與隱私四個層面。訓(xùn)練大模型需巨額數(shù)據(jù)中心投資,運行推理成本驚人,迫使云提供商在架構(gòu)設(shè)計各環(huán)節(jié)創(chuàng)新。推理工作負(fù)載呈現(xiàn)與傳統(tǒng)計算不同的行為模式,AI應(yīng)用對延遲要求更高,實時交互、視頻生成等場景需毫秒級響應(yīng),同時模型規(guī)模擴大和復(fù)雜度提升使保持低延遲處理海量請求成為難題。當(dāng)AI處理企業(yè)核心數(shù)據(jù)和個人隱私信息時,安全需貫穿數(shù)據(jù)生命周期每個環(huán)節(jié),在共享云環(huán)境中確保模型權(quán)重和客戶數(shù)據(jù)絕對安全成為新技術(shù)門檻。
亞馬遜云科技圍繞底層硬件創(chuàng)新給出應(yīng)對方案。自研芯片從Amazon Nitro System消除虛擬化性能抖動,演進(jìn)至為核心工作負(fù)載量身定制的Graviton處理器。新發(fā)布的Amazon Graviton5處理器將L2緩存翻倍,性能提升30%,基于其的M9G實例使Airbnb性能提升25%、SAP事務(wù)處理速度提升60%,蘋果等企業(yè)實測Swift應(yīng)用遷移后性能升40%、成本降30%。面對AI推理負(fù)載,設(shè)計Mantle推理引擎,承認(rèn)請求異質(zhì)性,通過Bedrock服務(wù)層允許客戶按不同緊迫性分配請求,實現(xiàn)資源智能調(diào)度。通過Journal持久化事務(wù)日志,使長時間推理任務(wù)故障或中斷后能從精確斷點恢復(fù),結(jié)合動態(tài)調(diào)度策略讓模型微調(diào)等后臺任務(wù)與實時流量波谷錯峰運行,提升集群整體利用率與經(jīng)濟效益。為釋放硬件潛力,同步升級Neuron開發(fā)者套件,NIKKI語言讓開發(fā)者進(jìn)行底層內(nèi)核優(yōu)化,Neuron Explorer提供可視化性能分析與自動化調(diào)優(yōu)建議。
在re:Invent 2025大會上,亞馬遜云科技完成了一場從回應(yīng)質(zhì)疑到定義未來的精彩展示。它將目光投向由數(shù)十億Agent驅(qū)動的未來,一系列AI云基礎(chǔ)設(shè)施新技術(shù)發(fā)布,證明持續(xù)全棧創(chuàng)新的云不僅是承載計算的基石,更是催化AI時代創(chuàng)新無限可能的引擎,手中的“權(quán)杖”在科技舞臺上閃耀著獨特光芒。















