• 虎科技 - 領先的互聯網科技媒體

螞蟻百靈大模型Ling-2.6-flash發布:技術優化提效 免費API助力開發者體驗

   時間:2026-04-23 02:49 來源:快訊作者:馮璃月

螞蟻集團旗下百靈大模型近日正式發布Instruct模型Ling-2.6-flash,該模型總參數量達104B,激活參數為7.4B。這款新模型在技術路徑選擇上突破傳統框架,通過優化推理效率、Token使用效率及Agent場景適配性,構建起差異化的技術優勢。其核心架構創新與場景化設計,使其在同類模型中展現出顯著競爭力。

技術團隊在架構設計上采用混合線性計算模式,通過底層計算單元的重組優化,使模型在4卡H20硬件環境下實現340 tokens/s的推理速度,Prefill吞吐量達到Nemotron-3-Super的2.2倍。這種設計突破了單純依賴模型規模提升性能的路徑,在保持智能水平的同時,將硬件資源利用率提升至新高度。在Token效率方面,研發團隊通過動態輸出校準機制,使模型在Artificial Analysis評測中僅消耗15M tokens即達成目標,用量僅為同類模型的十分之一。

針對企業級應用需求,模型特別強化了Agent場景能力。通過優化工具調用接口、多步驟任務拆解算法及執行鏈路容錯機制,Ling-2.6-flash在BFCL-V4、TAU2-bench等權威評測中,與參數規模更大的模型展開正面競爭,仍取得領先或持平的優異成績。特別是在復雜任務執行環節,其表現已達到同尺寸模型的行業標桿水平。

為降低開發者使用門檻,百靈大模型同步推出雙重接入方案。即日起在OpenRouter平臺及官方渠道提供為期一周的免費API調用服務,后續采用階梯計價模式:國際版輸入0.1美元/百萬tokens,輸出0.3美元/百萬tokens;國內版輸入0.6元/百萬tokens,輸出1.8元/百萬tokens,并保留每日50萬tokens的永久免費額度。緩存命中場景下,國際版按20%比例收取0.02美元/百萬tokens的費用。

開源計劃方面,技術團隊透露BF16、FP8、INT4等量化版本將于近期陸續開放下載。這些版本在保持核心性能的同時,將硬件適配門檻降低60%以上,特別適合邊緣計算設備部署。此次開源策略覆蓋從研發到落地的全鏈條需求,為不同規模的企業提供靈活的技術選擇空間。

 
 
更多>同類內容
推薦圖文
推薦內容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數碼群