谷歌TPU正以驚人的速度崛起,成為英偉達(dá)在AI硬件領(lǐng)域最強(qiáng)勁的競爭對手。隨著谷歌Gemini 3大模型的成功,其背后的TPU架構(gòu)再次成為全球科技界關(guān)注的焦點(diǎn)。資本市場對此反應(yīng)熱烈,谷歌股價的攀升讓一個長期討論的話題重新浮出水面:谷歌TPU是否真的具備與英偉達(dá)GPU一較高下的實(shí)力?
SemiAnalysis,這家在半導(dǎo)體和人工智能領(lǐng)域享有盛譽(yù)的研究機(jī)構(gòu),近期發(fā)布了一份重量級報告。由12位資深作者共同撰寫的這篇文章明確指出,谷歌TPUv7已正式向英偉達(dá)發(fā)起挑戰(zhàn)。報告深入分析了TPUv7如何通過卓越的系統(tǒng)級工程和成本優(yōu)勢,對英偉達(dá)的AI硬件霸權(quán)構(gòu)成實(shí)質(zhì)性威脅。
谷歌此次戰(zhàn)略調(diào)整的關(guān)鍵在于打破長期以來的內(nèi)部自用模式,開始向Anthropic等外部客戶大規(guī)模出售TPU硬件及算力。據(jù)報道,Anthropic已部署超過1GW的TPU集群,這一規(guī)模令人矚目。盡管在單芯片理論參數(shù)上,TPU未必全面超越英偉達(dá)GPU,但谷歌通過ICI互聯(lián)和光路交換等系統(tǒng)級優(yōu)化,實(shí)現(xiàn)了極高的實(shí)際模型算力利用率(MFU)。更引人注目的是,谷歌TPU的總體擁有成本(TCO)比英偉達(dá)GB200系統(tǒng)低約30%-40%,這一優(yōu)勢在商業(yè)競爭中極具殺傷力。
軟件生態(tài)方面,谷歌也在積極補(bǔ)強(qiáng)。通過支持PyTorch原生環(huán)境和vLLM等開源框架,谷歌正努力瓦解英偉達(dá)CUDA的護(hù)城河。這一策略已初見成效,越來越多的AI開發(fā)者開始關(guān)注并嘗試使用TPU平臺。
谷歌的TPU商業(yè)化進(jìn)程正在加速。除了Anthropic,meta、SSI、xAI、OAI等多家科技巨頭也已成為TPU的客戶。這一趨勢不僅推動了谷歌和TPU供應(yīng)鏈的重估,也對以英偉達(dá)GPU為核心的供應(yīng)鏈構(gòu)成了壓力。英偉達(dá)顯然感受到了這種壓力,其官方推文在祝賀谷歌AI進(jìn)展的同時,也強(qiáng)調(diào)了自己在硬件供應(yīng)和平臺通用性方面的領(lǐng)先地位。
TPUv7 Ironwood作為谷歌最新一代AI芯片,在設(shè)計理念上發(fā)生了顯著轉(zhuǎn)變。與前幾代相比,TPUv7在FLOPs、內(nèi)存和帶寬等關(guān)鍵指標(biāo)上幾乎追平了英偉達(dá)的旗艦GPU,盡管全面上市時間稍晚。谷歌通過系統(tǒng)級優(yōu)化和成本控制,成功彌補(bǔ)了理論性能上的微小差距,在實(shí)際應(yīng)用中展現(xiàn)出強(qiáng)大的競爭力。
Anthropic選擇TPU作為主要硬件平臺,不僅因?yàn)槠涑杀緝?yōu)勢,更看重TPU在特定工作負(fù)載下的高效性能。通過自定義內(nèi)核開發(fā),Anthropic成功實(shí)現(xiàn)了比商用GPU更高的模型FLOPs利用率(MFU)和更優(yōu)的每PFLOP成本性能。這種深度優(yōu)化能力,使得TPU在特定場景下成為更理想的選擇。
谷歌也在積極改善TPU的軟件生態(tài)。通過加大對PyTorch和vLLM等開源框架的支持力度,谷歌正努力吸引更多外部開發(fā)者加入TPU生態(tài)系統(tǒng)。盡管在編譯器和運(yùn)行時等底層軟件方面仍存在不足,但谷歌的改進(jìn)方向明確,未來有望進(jìn)一步縮小與英偉達(dá)CUDA生態(tài)的差距。















