在機器學(xué)習(xí)工程領(lǐng)域,百度智能云旗下的企業(yè)級算法自主優(yōu)化智能體——百度伐謀Agent 2.0,再次以卓越表現(xiàn)登頂全球權(quán)威基準(zhǔn)MLE-Bench,并刷新最優(yōu)成績。這一成果標(biāo)志著中國AI技術(shù)在企業(yè)級算法工程領(lǐng)域?qū)崿F(xiàn)新的突破,繼去年10月首次登頂后,百度伐謀憑借持續(xù)優(yōu)化的工程能力再次領(lǐng)跑全球。
MLE-Bench由OpenAI主導(dǎo)設(shè)立,被譽為檢驗智能體實戰(zhàn)能力的“硬核考場”。該基準(zhǔn)包含75個源自Kaggle競賽的真實工程難題,覆蓋模型訓(xùn)練、數(shù)據(jù)準(zhǔn)備、實驗運行等機器學(xué)習(xí)全流程,重點考察人工智能在復(fù)雜場景下的端到端自動化能力。百度伐謀Agent 2.0作為面向最優(yōu)解的智能體,能夠像頂尖算法工程師一樣,從需求理解到方案輸出實現(xiàn)全鏈路自動化,在具有明確評價標(biāo)準(zhǔn)的問題中高效尋找全局最優(yōu)解。
最新評測顯示,百度伐謀2.0在“高難度”任務(wù)中展現(xiàn)出顯著優(yōu)勢,綜合勝率超越搭載Claude-Opus-4.6等主流大模型的同類產(chǎn)品。這一成績得益于其在演化策略、長程記憶機制和底層基礎(chǔ)設(shè)施層面的全面升級:增強的演化策略支持多路徑并行探索與動態(tài)回溯調(diào)整;長程記憶機制確保智能體在長鏈條任務(wù)中保持邏輯一致性;依托百度智能云全棧AI基礎(chǔ)設(shè)施的優(yōu)化,則大幅提升了算法迭代效率。
技術(shù)突破的同時,百度伐謀2.0顯著降低了算法應(yīng)用門檻。業(yè)務(wù)人員無需算法背景,僅需通過自然語言或數(shù)據(jù)文件提交需求,系統(tǒng)即可自動生成可解釋、可交互的企業(yè)級解決方案。這一特性使其快速滲透至零售、金融、制造、能源、交通等國民經(jīng)濟核心領(lǐng)域,上線至今已服務(wù)數(shù)千家企業(yè)。
在汽車制造領(lǐng)域,阿爾特太乙與百度伐謀合作開發(fā)的御風(fēng)智能預(yù)測系統(tǒng),將單次風(fēng)阻驗證時間從10小時壓縮至數(shù)分鐘,整車研發(fā)周期平均縮短25%;金融風(fēng)控場景中,中信百信銀行引入該技術(shù)后實現(xiàn)7×24小時風(fēng)險特征挖掘,效率提升100%,模型風(fēng)險區(qū)分度提高2.41%;能源基建領(lǐng)域,中國能建廣東院借助其解決海上風(fēng)電電纜橋架布置難題,節(jié)省近一周工期與大量材料成本;交通信控方面,鄂爾多斯伊金霍洛旗部署百度智能云伐謀信控平臺后,車均延誤降低18%,高峰通行時間減少超50%。
科研場景同樣見證了百度伐謀的價值。北京工業(yè)大學(xué)團隊將其應(yīng)用于中國空間站微型氣相色譜柱設(shè)計實驗,通過自動化尋優(yōu)替代人工反復(fù)仿真,顯著提升分離效率;天津大學(xué)團隊利用該技術(shù)優(yōu)化災(zāi)害預(yù)測模型,將原本需數(shù)周的科研探索壓縮至6小時內(nèi)完成。為進一步支持科研創(chuàng)新,百度智能云近期開源了Famou for Science項目,通過多智能體協(xié)同模式構(gòu)建虛擬科研團隊,涵蓋實驗管理、文檔評審等角色,支持長線程科研任務(wù)的自動化推進與算法持續(xù)演化。















