螞蟻百靈大模型Ling-2.6-flash發布：技術優化提效免費API助力開發者體驗-軟件產品-虎科技

螞蟻百靈大模型Ling-2.6-flash發布：技術優化提效免費API助力開發者體驗

時間：2026-04-23 02:49 來源：快訊作者：馮璃月

螞蟻集團旗下百靈大模型近日正式發布Instruct模型Ling-2.6-flash，該模型總參數量達104B，激活參數為7.4B。這款新模型在技術路徑選擇上突破傳統框架，通過優化推理效率、Token使用效率及Agent場景適配性，構建起差異化的技術優勢。其核心架構創新與場景化設計，使其在同類模型中展現出顯著競爭力。

技術團隊在架構設計上采用混合線性計算模式，通過底層計算單元的重組優化，使模型在4卡H20硬件環境下實現340 tokens/s的推理速度，Prefill吞吐量達到Nemotron-3-Super的2.2倍。這種設計突破了單純依賴模型規模提升性能的路徑，在保持智能水平的同時，將硬件資源利用率提升至新高度。在Token效率方面，研發團隊通過動態輸出校準機制，使模型在Artificial Analysis評測中僅消耗15M tokens即達成目標，用量僅為同類模型的十分之一。

針對企業級應用需求，模型特別強化了Agent場景能力。通過優化工具調用接口、多步驟任務拆解算法及執行鏈路容錯機制，Ling-2.6-flash在BFCL-V4、TAU2-bench等權威評測中，與參數規模更大的模型展開正面競爭，仍取得領先或持平的優異成績。特別是在復雜任務執行環節，其表現已達到同尺寸模型的行業標桿水平。

為降低開發者使用門檻，百靈大模型同步推出雙重接入方案。即日起在OpenRouter平臺及官方渠道提供為期一周的免費API調用服務，后續采用階梯計價模式：國際版輸入0.1美元/百萬tokens，輸出0.3美元/百萬tokens；國內版輸入0.6元/百萬tokens，輸出1.8元/百萬tokens，并保留每日50萬tokens的永久免費額度。緩存命中場景下，國際版按20%比例收取0.02美元/百萬tokens的費用。

開源計劃方面，技術團隊透露BF16、FP8、INT4等量化版本將于近期陸續開放下載。這些版本在保持核心性能的同時，將硬件適配門檻降低60%以上，特別適合邊緣計算設備部署。此次開源策略覆蓋從研發到落地的全鏈條需求，為不同規模的企業提供靈活的技術選擇空間。

更多>同類內容

探訪渝東南武陵山區：賞奇山秀水感人文風	極空間與網易爆米花強強聯合，共筑安全便捷
阿里發布“千問小酒窩”：生態級AI助手，加	阿里生態再升級：“千問小酒窩”上線，AI助

螞蟻百靈大模型Ling-2.6-flash發布：技術優化提效 免費API助力開發者體驗

螞蟻百靈大模型Ling-2.6-flash發布：技術優化提效免費API助力開發者體驗