在近日舉辦的英偉達(dá)GTC大會(huì)上,創(chuàng)始人兼CEO黃仁勛以一場(chǎng)長(zhǎng)達(dá)兩小時(shí)的主題演講,將“Token”這一概念推向了行業(yè)焦點(diǎn)。幾乎在同一時(shí)間,阿里巴巴宣布成立Token事業(yè)群,明確提出“創(chuàng)造、輸送、應(yīng)用”的完整鏈路。兩大科技巨頭的同步動(dòng)作,標(biāo)志著AI產(chǎn)業(yè)正從模型競(jìng)賽轉(zhuǎn)向以Token為核心的生產(chǎn)力競(jìng)爭(zhēng)。
Token作為大模型處理文本的基本單元,其重要性正在重塑AI產(chǎn)業(yè)鏈的度量標(biāo)準(zhǔn)。傳統(tǒng)上,底層模型團(tuán)隊(duì)關(guān)注參數(shù)規(guī)模,應(yīng)用層聚焦用戶增長(zhǎng),云服務(wù)則緊盯算力利用率。但隨著AI從感知、生成向推理階段演進(jìn),Token與收入的關(guān)聯(lián)愈發(fā)緊密——企業(yè)獲取的算力越多,生成的Token量越大,收入隨之增長(zhǎng),進(jìn)而反哺模型智能化升級(jí)。這種正向循環(huán),讓英偉達(dá)成為最大受益者。
黃仁勛在演講中直言,推理計(jì)算量在過(guò)去兩年增長(zhǎng)萬(wàn)倍,使用量激增百倍,AI正從“能感知”邁向“能工作”。基于此,他提出英偉達(dá)的全新戰(zhàn)略:從數(shù)據(jù)中心轉(zhuǎn)型為“Token工廠”。按照規(guī)劃,未來(lái)每家AI公司都應(yīng)以Token生產(chǎn)效率為核心指標(biāo),甚至Token本身將成為按吞吐量和交互速度定價(jià)的“大宗商品”。英偉達(dá)為此設(shè)計(jì)了分層定價(jià)體系:免費(fèi)層以廣告變現(xiàn),中級(jí)層每百萬(wàn)Token收費(fèi)3-6美元,高速層則高達(dá)45-150美元。黃仁勛強(qiáng)調(diào),新架構(gòu)將使免費(fèi)層吞吐量極致提升,同時(shí)在高價(jià)值推理層級(jí)實(shí)現(xiàn)35倍效率飛躍。
為支撐這一目標(biāo),英偉達(dá)推出了專為智能體推理設(shè)計(jì)的Vera Rubin計(jì)算系統(tǒng)。該系統(tǒng)整合7款新芯片、5個(gè)機(jī)架和1臺(tái)超級(jí)計(jì)算機(jī),其中72塊GPU通過(guò)NVLink高速互聯(lián),確保前填充計(jì)算與Token響應(yīng)速度的平衡;全球首款采用LPDDR5內(nèi)存的數(shù)據(jù)中心CPU——Vera CPU,則負(fù)責(zé)處理重復(fù)邏輯操作,解放GPU算力;BlueField 4+CX9存儲(chǔ)平臺(tái)與CPO Spectrum-X交換機(jī),分別優(yōu)化數(shù)據(jù)流處理與網(wǎng)絡(luò)傳輸效率。整套系統(tǒng)采用液冷方案,安裝時(shí)間從兩天縮短至兩小時(shí),預(yù)計(jì)2026年下半年出貨。據(jù)測(cè)試,其推理速度較上一代提升5倍,Token成本降低10倍,MoE模型所需GPU減少至四分之一。
面對(duì)異構(gòu)計(jì)算融合的挑戰(zhàn),英偉達(dá)將收購(gòu)的Groq LPU平臺(tái)納入體系,并開(kāi)發(fā)操作系統(tǒng)Dynamo協(xié)調(diào)任務(wù)分配。黃仁勛建議,高吞吐負(fù)載可全量使用Vera Rubin,而代碼生成等高價(jià)值場(chǎng)景可引入25%的Groq芯片。這種設(shè)計(jì)使數(shù)據(jù)中心在單位功耗下性能提升35倍,同時(shí)兼顧低延遲與高價(jià)值推理服務(wù)。英偉達(dá)還預(yù)告了2028年推出的Vera Rubin Ultra及Feynman架構(gòu),將3D堆疊、LPU集成、異構(gòu)存儲(chǔ)等技術(shù)列為未來(lái)核心。
黃仁勛的演講還涉及當(dāng)前熱門的OpenClaw項(xiàng)目。他認(rèn)為,這一智能體操作系統(tǒng)將重塑企業(yè)IT,推動(dòng)SaaS公司向AaaS轉(zhuǎn)型,使2萬(wàn)億美元的產(chǎn)業(yè)規(guī)模擴(kuò)展至數(shù)萬(wàn)億美元。為應(yīng)對(duì)安全風(fēng)險(xiǎn),英偉達(dá)與開(kāi)發(fā)者合作推出企業(yè)版NeMo Claw,通過(guò)“網(wǎng)絡(luò)護(hù)欄”和“隱私路由”等技術(shù)保障數(shù)據(jù)安全。黃仁勛甚至預(yù)言,Token可能成為硅谷工程師年薪的一部分,“入職配額”或成招聘新趨勢(shì)。
在圖形計(jì)算領(lǐng)域,英偉達(dá)發(fā)布了被黃仁勛稱為“圖形學(xué)GPT時(shí)刻”的DLSS 5技術(shù)。該技術(shù)融合3D圖形、結(jié)構(gòu)化數(shù)據(jù)與生成式AI,通過(guò)確定性框架與概率計(jì)算的結(jié)合,實(shí)現(xiàn)內(nèi)容的美觀、精確與可控。為解決非結(jié)構(gòu)化數(shù)據(jù)占比超九成的難題,英偉達(dá)同步推出cuDF和cuVS工具,分別處理結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù),目前已被IBM、戴爾等企業(yè)整合進(jìn)云服務(wù)體系。
從底層芯片到操作系統(tǒng),從異構(gòu)架構(gòu)到數(shù)據(jù)工具,英偉達(dá)正構(gòu)建覆蓋Token生產(chǎn)全鏈條的“生產(chǎn)力套件”。這場(chǎng)轉(zhuǎn)型不僅關(guān)乎技術(shù)路線,更預(yù)示著AI競(jìng)爭(zhēng)規(guī)則的重寫——當(dāng)模型性能趨于同質(zhì)化,誰(shuí)能主導(dǎo)Token生產(chǎn),誰(shuí)就能掌握下一代AI產(chǎn)業(yè)的主導(dǎo)權(quán)。















