在人工智能領(lǐng)域,大模型的發(fā)展曾一度聚焦于“招式”的驚艷——能看、能寫、能答,仿佛無所不能。然而,當(dāng)AI真正邁向規(guī)模化落地階段,一個現(xiàn)實問題逐漸浮現(xiàn):僅靠“反應(yīng)迅速”遠遠不夠,能否在復(fù)雜任務(wù)中保持狀態(tài)、串聯(lián)知識、形成長期記憶,成為決定AI能否從“工具”升級為“助手”的關(guān)鍵。這場變革,正推動企業(yè)AI的競爭從“拼招式”轉(zhuǎn)向“拼內(nèi)功”。
華為數(shù)據(jù)存儲領(lǐng)域總裁謝黎明在近期的一場發(fā)布會上指出,企業(yè)AI的核心資產(chǎn)正在從“數(shù)據(jù)”向“知識與記憶”轉(zhuǎn)型。過去,企業(yè)數(shù)字化建設(shè)的核心是“存、管、用”數(shù)據(jù);如今,隨著智能體深入業(yè)務(wù)系統(tǒng),AI需面對的已非簡單的“對話”場景,而是三道更現(xiàn)實的挑戰(zhàn):知識生成效率低、檢索不精準(zhǔn);推理成本高、速度慢;缺乏長期記憶能力,復(fù)雜任務(wù)難以閉環(huán)。這些問題,正成為制約AI落地的“隱形門檻”。
以知識管理為例,企業(yè)內(nèi)部數(shù)據(jù)往往分散在文檔、表格、日志等不同系統(tǒng)中,格式各異且歷史包袱沉重。傳統(tǒng)方法抽取知識效率低下,檢索結(jié)果常“似是而非”,導(dǎo)致AI雖能回答問題,卻未真正理解業(yè)務(wù)邏輯。而在推理場景中,GPU顯存的昂貴與有限,疊加緩存命中率、數(shù)據(jù)調(diào)度效率等因素,使得企業(yè)常面臨“算力夠但等不起”的困境——模型能計算,業(yè)務(wù)卻因延遲而無法承受。更棘手的是,智能體在跨步驟、跨系統(tǒng)任務(wù)中極易“失憶”,記不住用戶偏好或前置決策,最終淪為“高級聊天機器人”。
針對這些痛點,華為在發(fā)布會上推出了面向AI推理時代的AI數(shù)據(jù)平臺(AIDP),試圖為“中心推理”場景提供系統(tǒng)性解決方案。謝黎明將其定義為“整合知識庫、KV Cache庫、記憶庫與統(tǒng)一緩存管理(UCM)的架構(gòu),直擊三大挑戰(zhàn)”。從技術(shù)架構(gòu)看,AIDP采用“3+1”模式:知識庫負責(zé)知識生成與高質(zhì)量檢索;KV Cache庫優(yōu)化推理速度與成本;記憶庫支持長期記憶與復(fù)雜任務(wù);UCM則統(tǒng)籌不同存儲介質(zhì)間的數(shù)據(jù)流轉(zhuǎn),確保高效協(xié)同。
這一平臺的核心價值,在于推動企業(yè)AI從“演示級”邁向“生產(chǎn)級”。例如,在知識管理層面,AIDP重構(gòu)了知識抽取、向量化、索引與檢索的全鏈路,支持多模態(tài)數(shù)據(jù),使知識生成效率提升2倍,檢索準(zhǔn)確率超95%。在推理優(yōu)化層面,通過將KV Cache從GPU顯存解耦至高性能存儲介質(zhì),并結(jié)合UCM的冷熱分層調(diào)度,首Token時延降低90%,推理吞吐提升2倍,顯著緩解了GPU成本壓力。而在記憶能力層面,記憶庫的引入讓智能體能夠記錄用戶偏好、延續(xù)任務(wù)狀態(tài),并在長期互動中沉淀經(jīng)驗,真正從“會說話”進化為“能做事”。
值得注意的是,AIDP并未采取“推倒重來”的激進策略,而是支持兩種部署模式:既可將知識庫、記憶庫與KV Cache能力一體化整合至OceanStor A800中,也可在現(xiàn)有OceanStor Dorado存儲上通過外置節(jié)點獨立部署。這種“平滑升級”的設(shè)計,既保護了企業(yè)既有投資,又降低了技術(shù)遷移風(fēng)險,更貼合企業(yè)級應(yīng)用的決策邏輯——可控、可持續(xù)的演進路徑,往往比“性能翻倍”的承諾更具吸引力。
從更宏觀的視角看,AIDP的推出標(biāo)志著企業(yè)存儲角色的轉(zhuǎn)變。過去,存儲的核心指標(biāo)是容量、性能與可靠性;如今,華為開始強調(diào)“知識、緩存、記憶”等新關(guān)鍵詞。這并非營銷話術(shù)的更新,而是基礎(chǔ)設(shè)施定位的升級:在AI時代,存儲不僅是數(shù)據(jù)的“倉庫”,更需成為模型的“神經(jīng)系統(tǒng)”——高效組織知識、承接緩存、管理記憶,支撐智能體持續(xù)運行。正如謝黎明所言:“AI推理時代,存儲平臺的價值不在于‘喂數(shù)據(jù)’,而在于‘養(yǎng)記憶’。”
當(dāng)AI從“會生成”邁向“會執(zhí)行”,企業(yè)需要的不僅是更快的存儲,而是更懂AI邏輯的數(shù)據(jù)底座。華為的探索,或許為行業(yè)提供了一個新思路:在模型能力日益趨同的今天,誰能補上“長期記憶”與“穩(wěn)定推理”的內(nèi)功,誰就更有可能在智能體競爭中占據(jù)先機。
















