在華為中國合作伙伴大會期間,一場聚焦人工智能前沿發展的盛會——昇騰人工智能伙伴峰會在深圳成功舉辦。本次峰會以“與時代 共昇騰”為主題,吸引了眾多行業專家、企業代表齊聚一堂,共同探討人工智能在行業智能化進程中的新趨勢與新機遇。華為昇騰計算業務總裁張迪煊在會上發表了主題為《一起昇騰,共贏行業智能化》的精彩演講,深入剖析了人工智能的發展態勢,并分享了昇騰在推動行業智能化方面的戰略布局與實踐成果。
張迪煊指出,2025 年是昇騰在技術沉淀、擁抱開源、把握機遇方面取得重要進展的一年。去年 8 月,華為在北京正式宣布 CANN 和 Mind 系列軟件全面開源開放,實現架構解耦,并積極與業界共創,貢獻關鍵特性。例如,聯合科大訊飛落地大 EP 技術,并于 9 月將其貢獻到 vLLM 社區,填補了業界多機推理加速能力的空白,激發了眾多伙伴和開發者的創新熱情。截至目前,昇騰已向三方社區累計貢獻超過 11 萬行代碼,有力推動了技術的共享與創新加速。
在生態兼容方面,昇騰始終與主流生態保持緊密同頻。通過識別并快速響應開發者需求,在畢昇編譯器層構建 AscendNPU IR,實現與 Triton 的平滑對接,讓開發者能夠保持原有的使用習慣。同時,昇騰兼容了 FSDP2、verl、vLLM、xLLM 等 50 多個主流開源社區和項目,支持所有訓練和推理創新基于昇騰快速落地。對開源模型的 0day 支持,使開發者能第一時間獲取業界最新的模型能力,越來越多的 SOTA 開源模型也基于昇騰原生孵化。以智譜為例,其基于昇騰僅用三個月就完成了多模態大模型 GLM - Image 的訓練,該模型采用自回歸 + 擴散的混合架構,開源不到 24 小時便登頂 Hugging Face Trending 榜第一,充分證明了在昇騰上能夠訓練出世界級領先的大模型。
面對市場的快速變化,昇騰展現出強大的響應能力。去年 DeepSeek 發布后,春節期間華為迅速在上海練秋湖集結 500 多人進行攻關會戰,不到一周就發布了大模型應用一體機參考配置,助力 80 多家伙伴在 2 周內推出自己的一體機產品,迅速搶占市場。一年來,已有 350 多家伙伴打造了 400 多款深入業務場景的一體機產品,服務了 2700 多家客戶,占據國內一體機市場 80%以上的份額,涌現出一大批能力型伙伴,加速了大模型在各行各業的落地。
回顧過去三年,AI 實現了快速發展。2023 年作為“大模型元年”,推動模型從感知理解邁向生成創造;2024 年迎來“大模型推理元年”,Tokens 成為 AI 時代的新量綱;2025 年,中國大模型積極開源,憑借出色性能成為應用首選,Tokens 使用量呈爆發式增長。如今,我們已正式邁入 Agentic AI 時代,這是 AI 產業發展的全新拐點,標志著 AI 從“會聊天”向“能辦事”升級。在 To C 場景,OpenClaw 成為現象級應用,短時間內獲得大量用戶和關注;國內頭部互聯網企業爭相布局智能體入口,企業和個人積極參與打造專屬個人智能助理。在 To B 場景,AI 深度滲透生產、決策等環節,基座模型落地行業核心場景需要行業專業知識,強化學習成為必選之路,而海量 Tokens 成為支撐這一切的核心,其計算效率直接決定企業核心收益。
為滿足不同場景的需求,昇騰開放大中小系列化算力。在大算力場景,主要滿足大模型預訓練、強化學習后訓練以及大規模推理服務需求。昇騰將持續深耕技術研發,打造領先的超節點架構及產品,開放靈衢協議、部件及參考架構,助力伙伴打造超節點系統,重塑企業核心業務。在中算力場景,覆蓋輔助醫療、智慧教學等主流行業應用場景,昇騰圍繞“開箱即用”,兼顧“快速部署”與“成本可控”,開放中心模組/刀片,伙伴可結合模型及軟件生態打造大模型應用一體機、高密服務器等產品,加速行業智能化升級。在小算力場景,聚焦工業質檢、具身智能、科研教學等智能邊端領域,昇騰開放標準模組和板卡,使能伙伴打造多樣化邊緣算力設備,滿足差異化市場需求,挖掘潛力巨大的海量市場。
針對大規模推理服務場景,AI Agent 成為企業智能化必備工具,其多輪自我迭代帶來百倍級 Tokens 需求和 10ms 級時延要求。傳統服務器堆疊方式存在局限,昇騰 384 超節點可實現 48TB 內存統一編址,全局內存共享,共享內存容量較傳統方式提升 96 倍,數據交互效率提升三倍,能滿足 Agent 超長上下文需求,推理 Decode 吞吐倍級提升,是大規模推理的必選方案。同時,昇騰為伙伴提供三種靈活高效的實現路徑,助力構建更佳推理方案。目前,硅基流動、清昴智能等能力型伙伴已基于昇騰構建推理引擎,為金融等客戶提供大規模推理服務,顯著提升多輪任務應答速度。
在強化學習后訓練場景,昇騰沉淀了一套完整的最佳實踐。伙伴可選擇最新 RL 模型、算法及框架,通過完整 Docker 鏡像一鍵完成部署。針對業界普遍關注的訓推資源合理調度、傳輸效率提升和訓推一致問題,昇騰創新推出“異步流式數據引擎 TQ”技術,通過解耦控制流與數據流,實現樣本數據直接在推理節點和訓練節點間交互,依托超節點內存統一編址,端到端性能提升 40%以上。該特性已合入 verl 社區,并成功應用于商業化廣告、信貸風控等核心場景,實現倍級性能提升。昇騰將持續圍繞精度優化、訓推轉換、訓練及推理加速,提供業界最全、最新的 RL 加速特性,并第一時間貢獻到開源社區。
為支持國計民生大模型應用場景,昇騰產品實現全面升級,分級分檔適配不同模型需求。面向百億級模型,開放 A2 標卡,內存帶寬達業界 1.8 倍,實現 100ms 推理時延;面向千億級模型,提供單機服務器,單機算力是業界的 2.3 倍;面向萬億級模型,提供雙機超節點服務器,是業界唯一能夠部署 T 級模型的產品,整機算力達 3.78 倍業界,突破 20ms 低時延。同時,昇騰推出 Agentic 開源參考設計,將深度適配優化后的推理引擎、主流開源模型權重及 OpenClaw 等 Agent AI 框架打包成完整鏡像,伙伴可快速打造 Agent 應用一體機。基于雙機超節點服務器打造的一體機,在不同模型上能提供大量 Tokens,滿足業務需求。目前,已有 20 多家伙伴正在落地 Agent 一體機產品,服務多個行業核心領域。
面向推薦、多模態、LLM 三大推理場景,昇騰推出 Atlas 350 加速卡。該加速卡搭載全新昇騰 950PR 處理器,性能全面升級,較業界同類產品領先 1 至 1.4 倍。其核心優勢體現在算力、內存雙升級,單卡算力和片上內存大幅提升,多模態生成性能顯著提高;訪存更靈活,Cache - line 的訪存粒度降低,提升搜索推薦等場景訪存效率;開發更易用,支持 SIMT + SIMD 混合編程,滿足伙伴多樣化開發需求,助力打造高性能推理方案。
在推動行業應用場景解決方案打造方面,2025 年 9 月華為開發者大會上,昇騰聯合 20 多家 ISV 啟動面向金融、能源等 5 大行業的方案打造工作。半年來,已成功孵化十余個應用場景方案,落地 180 多家客戶,實現技術與業務深度融合。例如在智慧文旅場景,昇騰聯合海天瑞聲、陜文投打造多模態 AI 伴游助手解決方案,具備多種核心能力,依托海天瑞聲技術積累實現文旅知識秒級獲取。目前,基于該方案打造的 AI 伴游助手“小七”已在陜西各大景點投放使用,為大量游客提供個性化出游體驗。
在智能邊端領域,昇騰開放更多算力檔位、更高集成度、更高溫寬設計的模組/板卡,結合更多 OS 兼容、更多場景 SDK,使能伙伴打造多樣化產品,廣泛應用于多個行業場景。例如,軟通華方、同泰怡等伙伴基于 Atlas 300I A2 打造液冷 AI 工作站,具備多種競爭力,成為多個行業本地算力設備首選。
CANN 開源開放實現了三大升級。部署效率方面,原有大包拆分為多個可獨立升級和部署的組件,包大小和特性加載時間大幅縮減,提升部署效率。開發體驗上,去年實現主流算子編程框架無感對接,今年將開源 PyPTO 編程范式,強化 Python + Tile 編程能力,減少算子代碼量,借助可視化調試調優能力縮短復雜 CV 融合算子開發時間,同時提供開源 Skill 庫支持打造算子自動生成 Agent。社區資源方面,完善開源社區 CI/CD,提供完整代碼流水線和免費算力資源,降低創新門檻。
昇騰生態的蓬勃發展離不開伙伴的努力。昇騰持續圍繞硬件、算子、加速庫、模型及應用五大創新方向,攜手伙伴共同發展。隨著基礎軟件全面開源,將轉向社區化運作,為伙伴明確成長和創新方向,完善激勵機制,鼓勵共享,提供知識體系和開放能力認證,加速伙伴能力轉型。同時,通過社區下發創新任務,設立創新激勵基金,助力伙伴創新發展。昇騰還深化昇騰萬里伙伴計劃,NRE 全面升級,投入資金鼓勵伙伴創新,將創新成果和應用案例上架社區 AI 應用市場,與伙伴聯合推廣、共享收益。
















