百度伐謀Agent 2.0再登MLE-Bench榜首中國AI企業(yè)級應(yīng)用實力彰顯-手機產(chǎn)品-虎科技

百度伐謀Agent 2.0再登MLE-Bench榜首中國AI企業(yè)級應(yīng)用實力彰顯

時間：2026-04-10 20:00 來源：天脈網(wǎng)作者：唐云澤

在機器學(xué)習(xí)工程領(lǐng)域，百度智能云旗下的企業(yè)級算法自主優(yōu)化智能體——百度伐謀Agent 2.0，再次以卓越表現(xiàn)登頂全球權(quán)威基準(zhǔn)MLE-Bench，并刷新最優(yōu)成績。這一成果標(biāo)志著中國AI技術(shù)在企業(yè)級算法工程領(lǐng)域?qū)崿F(xiàn)新的突破，繼去年10月首次登頂后，百度伐謀憑借持續(xù)優(yōu)化的工程能力再次領(lǐng)跑全球。

MLE-Bench由OpenAI主導(dǎo)設(shè)立，被譽為檢驗智能體實戰(zhàn)能力的“硬核考場”。該基準(zhǔn)包含75個源自Kaggle競賽的真實工程難題，覆蓋模型訓(xùn)練、數(shù)據(jù)準(zhǔn)備、實驗運行等機器學(xué)習(xí)全流程，重點考察人工智能在復(fù)雜場景下的端到端自動化能力。百度伐謀Agent 2.0作為面向最優(yōu)解的智能體，能夠像頂尖算法工程師一樣，從需求理解到方案輸出實現(xiàn)全鏈路自動化，在具有明確評價標(biāo)準(zhǔn)的問題中高效尋找全局最優(yōu)解。

最新評測顯示，百度伐謀2.0在“高難度”任務(wù)中展現(xiàn)出顯著優(yōu)勢，綜合勝率超越搭載Claude-Opus-4.6等主流大模型的同類產(chǎn)品。這一成績得益于其在演化策略、長程記憶機制和底層基礎(chǔ)設(shè)施層面的全面升級：增強的演化策略支持多路徑并行探索與動態(tài)回溯調(diào)整；長程記憶機制確保智能體在長鏈條任務(wù)中保持邏輯一致性；依托百度智能云全棧AI基礎(chǔ)設(shè)施的優(yōu)化，則大幅提升了算法迭代效率。

技術(shù)突破的同時，百度伐謀2.0顯著降低了算法應(yīng)用門檻。業(yè)務(wù)人員無需算法背景，僅需通過自然語言或數(shù)據(jù)文件提交需求，系統(tǒng)即可自動生成可解釋、可交互的企業(yè)級解決方案。這一特性使其快速滲透至零售、金融、制造、能源、交通等國民經(jīng)濟核心領(lǐng)域，上線至今已服務(wù)數(shù)千家企業(yè)。

在汽車制造領(lǐng)域，阿爾特太乙與百度伐謀合作開發(fā)的御風(fēng)智能預(yù)測系統(tǒng)，將單次風(fēng)阻驗證時間從10小時壓縮至數(shù)分鐘，整車研發(fā)周期平均縮短25%；金融風(fēng)控場景中，中信百信銀行引入該技術(shù)后實現(xiàn)7×24小時風(fēng)險特征挖掘，效率提升100%，模型風(fēng)險區(qū)分度提高2.41%；能源基建領(lǐng)域，中國能建廣東院借助其解決海上風(fēng)電電纜橋架布置難題，節(jié)省近一周工期與大量材料成本；交通信控方面，鄂爾多斯伊金霍洛旗部署百度智能云伐謀信控平臺后，車均延誤降低18%，高峰通行時間減少超50%。

科研場景同樣見證了百度伐謀的價值。北京工業(yè)大學(xué)團隊將其應(yīng)用于中國空間站微型氣相色譜柱設(shè)計實驗，通過自動化尋優(yōu)替代人工反復(fù)仿真，顯著提升分離效率；天津大學(xué)團隊利用該技術(shù)優(yōu)化災(zāi)害預(yù)測模型，將原本需數(shù)周的科研探索壓縮至6小時內(nèi)完成。為進一步支持科研創(chuàng)新，百度智能云近期開源了Famou for Science項目，通過多智能體協(xié)同模式構(gòu)建虛擬科研團隊，涵蓋實驗管理、文檔評審等角色，支持長線程科研任務(wù)的自動化推進與算法持續(xù)演化。

更多>同類內(nèi)容

永輝“胖改”兩年虧50億：形似神不似，商超	匿名登頂全球AI榜單！阿里“歡樂馬”視頻模
淘寶閃購AI店鋪助手再升級：語音操控解放雙	阿里HappyHorse強勢登頂視頻競技場全球首

百度伐謀Agent 2.0再登MLE-Bench榜首 中國AI企業(yè)級應(yīng)用實力彰顯

百度伐謀Agent 2.0再登MLE-Bench榜首中國AI企業(yè)級應(yīng)用實力彰顯