• 虎科技 - 領先的互聯網科技媒體

DeepSeek-V3.2-Exp模型開源上線 稀疏架構助力效率提升API降價超五成

   時間:2025-09-30 15:19 來源:快訊作者:沈瑾瑜

近日,人工智能領域迎來重要進展——DeepSeek官方宣布推出并開源其全新大語言模型DeepSeek-V3.2-Exp。該模型通過引入創新性的稀疏注意力架構,在保持輸出質量的同時顯著降低了計算資源消耗,尤其針對長序列文本處理場景實現了效率突破。

作為實驗性版本,V3.2-Exp被定位為新一代架構的過渡性探索。其核心創新在于首次實現了細粒度稀疏注意力機制(DeepSeek Sparse Attention),該機制通過動態篩選關鍵信息交互,在不影響模型性能的前提下,將長文本場景下的訓練與推理效率提升至全新水平。官方數據顯示,相較于前代V3.1-Terminus模型,新架構在處理超長文本時資源占用率下降30%以上。

技術團隊透露,DSA架構的突破性在于解決了傳統注意力機制在長序列處理中的計算瓶頸。通過動態構建注意力連接圖,模型能夠自動識別并強化重要信息關聯,同時弱化冗余計算。這種設計既保持了模型對復雜語義關系的捕捉能力,又避免了全量注意力計算帶來的性能損耗。

伴隨模型升級,DeepSeek同步調整了服務策略。目前官方App、網頁端及小程序均已完成版本更新,同時宣布API服務價格下調超50%。此次降價覆蓋所有調用場景,開發者使用成本顯著降低,此舉被視為推動AI技術普惠化的重要舉措。

 
 
更多>同類內容
推薦圖文
推薦內容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數碼群