AI時(shí)代Token成新焦點(diǎn) 阿里成立Token Hub事業(yè)群布局“Token經(jīng)濟(jì)”新賽道

發(fā)布時(shí)間：2026-03-18 09:00 來源：快訊作者：孫明

在人工智能技術(shù)飛速發(fā)展的當(dāng)下，一個(gè)原本屬于計(jì)算機(jī)領(lǐng)域的專業(yè)術(shù)語——Token，正從幕后走向臺(tái)前，成為科技行業(yè)熱議的焦點(diǎn)。這個(gè)最初以虛擬貨幣“代幣”身份進(jìn)入大眾視野的概念，如今在AI大模型時(shí)代被賦予了全新內(nèi)涵，演變?yōu)槲谋咎幚淼淖钚∮?jì)算單元，被形象地稱為“詞元”。

上海某大模型公司的技術(shù)工程師解釋道，Token類似于人類語言的“字”，但并非簡單的一對(duì)一對(duì)應(yīng)關(guān)系。一個(gè)漢字可能對(duì)應(yīng)一個(gè)Token，也可能與相鄰漢字組合成一個(gè)Token，具體取決于大模型的分詞器規(guī)則。例如，“人工智能”四個(gè)字在不同模型中可能被拆分為“人工”和“智能”兩個(gè)Token，也可能被視為一個(gè)整體。高頻常用詞組、標(biāo)點(diǎn)符號(hào)和數(shù)字通常會(huì)被合并為一個(gè)Token，而生僻詞匯則更可能被拆分為單個(gè)漢字。

這種拆分規(guī)則的差異直接影響著模型的運(yùn)行效率。不同科技公司開發(fā)的分詞器各具特色，國產(chǎn)大模型在中文處理上展現(xiàn)出更科學(xué)的分詞邏輯。隨著多模態(tài)技術(shù)的發(fā)展，圖像、音頻等非文本數(shù)據(jù)也被轉(zhuǎn)化為視覺Token或音頻Token進(jìn)行處理，其核心邏輯與文本分詞保持一致——將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為可計(jì)算的最小單元。

Token不僅是計(jì)算基礎(chǔ)，更成為衡量大模型能力的重要指標(biāo)。以某國產(chǎn)大模型為例，其宣稱的“256K上下文”處理能力，實(shí)際意味著能夠處理25.6萬個(gè)Token的文本長度。模型處理Token的數(shù)量上限直接反映了其記憶能力和復(fù)雜任務(wù)處理水平。在生成文本時(shí)，模型通過逐個(gè)預(yù)測下一個(gè)概率最高的Token來完成輸出，這個(gè)過程類似于人類寫作時(shí)的遣詞造句，只是發(fā)生在計(jì)算單元層面。

這種技術(shù)特性使得Token消耗量成為評(píng)估模型使用成本的關(guān)鍵參數(shù)。全球主流AI服務(wù)普遍采用“輸入+輸出”Token總數(shù)的計(jì)費(fèi)模式，導(dǎo)致高頻使用者的成本居高不下。某開發(fā)者透露，由于OpenAI模型在任務(wù)分解時(shí)會(huì)產(chǎn)生大量并行指令，其每月Token消耗費(fèi)用可達(dá)上萬元。第三方數(shù)據(jù)顯示，中國日均Token消耗量已從2024年的1000億激增至今年2月的180萬億，呈現(xiàn)出指數(shù)級(jí)增長態(tài)勢。

面對(duì)這種趨勢，科技巨頭們開始重新布局業(yè)務(wù)架構(gòu)。阿里巴巴近期宣布成立Alibaba Token Hub事業(yè)群，整合通義實(shí)驗(yàn)室、MaaS平臺(tái)、千問App、悟空企業(yè)工作流等業(yè)務(wù)線，形成覆蓋基礎(chǔ)研究、平臺(tái)服務(wù)和應(yīng)用落地的完整鏈條。該部門由集團(tuán)CEO直接管轄，凸顯了Token經(jīng)濟(jì)在公司戰(zhàn)略中的核心地位。

據(jù)內(nèi)部人士透露，阿里巴巴的轉(zhuǎn)型基于對(duì)云服務(wù)未來的判斷：隨著AI智能體取代傳統(tǒng)聊天機(jī)器人成為主流應(yīng)用，Token消耗量將迎來爆發(fā)式增長。這種判斷在行業(yè)中已形成共識(shí)，各大廠商紛紛推出編程套餐服務(wù)，通過降低開發(fā)者使用門檻來培養(yǎng)用戶粘性。目前，從科技巨頭到AI初創(chuàng)企業(yè)，都在構(gòu)建包含自有模型和開源生態(tài)的完整工具鏈，試圖在Token經(jīng)濟(jì)時(shí)代占據(jù)先機(jī)。

更多>同類內(nèi)容