黄色三级不卡在线观看-男男视频网站高清观看-久久国产欧美韩国精品app-免费观看妇女A级视频-中文字幕一区二区三区人妻在线视频-国产精选av一区二区-欧美亚洲精品不卡一区二区-99女福利女女视频在线播放-国产美女香蕉久久精品

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

小米AI新突破:羅福莉領(lǐng)銜打造萬(wàn)億參數(shù)模型,獲林俊旸力贊

   時(shí)間:2026-03-21 15:59 來(lái)源:快訊作者:顧雨柔

近日,全球AI領(lǐng)域迎來(lái)一則重磅消息:小米正式發(fā)布首款自研旗艦大模型Xiaomi MiMo-V2-Pro,同時(shí)推出MiMo-V2-Omni和MiMo-V2-TTS兩款配套模型。這一動(dòng)作標(biāo)志著小米正式加入大模型競(jìng)爭(zhēng)賽道,引發(fā)行業(yè)廣泛關(guān)注。此前,一款名為Hunter Alpha的神秘模型在OpenRouter平臺(tái)引發(fā)猜測(cè),如今真相浮出水面——它正是MiMo-V2-Pro的內(nèi)部測(cè)試版本。

回溯至3月11日,OpenRouter平臺(tái)突然上線Hunter Alpha模型。該模型以"隱身模式"發(fā)布,未標(biāo)注開發(fā)者信息且提供免費(fèi)訪問(wèn)權(quán)限。測(cè)試數(shù)據(jù)顯示,其具備1萬(wàn)億參數(shù)規(guī)模和100萬(wàn)token的上下文窗口,自稱"以中文訓(xùn)練的中國(guó)AI模型"且知識(shí)截止時(shí)間為2025年5月。這些特征與DeepSeek此前模型風(fēng)格高度相似,導(dǎo)致市場(chǎng)普遍猜測(cè)這是DeepSeek的秘密測(cè)試項(xiàng)目。然而,小米MiMo團(tuán)隊(duì)近日正式認(rèn)領(lǐng)該模型,揭開這場(chǎng)"烏龍事件"的真相。

此次發(fā)布的三款模型中,MiMo-V2-Pro作為旗艦基座模型備受矚目。該模型采用超大規(guī)模稀疏化設(shè)計(jì),總參數(shù)達(dá)1萬(wàn)億級(jí),但單次推理僅激活420億參數(shù)。這種MoE(專家混合)架構(gòu)通過(guò)動(dòng)態(tài)激活部分子網(wǎng)絡(luò),在保持計(jì)算效率的同時(shí)擴(kuò)展模型容量。在注意力機(jī)制方面,創(chuàng)新性地引入分層組合的混合注意力結(jié)構(gòu),將局部窗口注意力與全局注意力相結(jié)合,既限制計(jì)算復(fù)雜度又保留長(zhǎng)距離依賴關(guān)系,有效解決長(zhǎng)上下文場(chǎng)景下的注意力退化問(wèn)題。

技術(shù)突破帶來(lái)顯著性能提升。MiMo-V2-Pro的上下文窗口擴(kuò)展至100萬(wàn)token,支持在單次上下文中保留完整任務(wù)狀態(tài)、工具調(diào)用結(jié)果和歷史決策路徑。在匿名測(cè)試階段,該模型已展現(xiàn)出代碼生成、開發(fā)工具調(diào)用和自動(dòng)化任務(wù)處理等強(qiáng)項(xiàng)。基準(zhǔn)測(cè)試數(shù)據(jù)顯示,其在通用Agent能力評(píng)估(Claweval)中得分61.5,逼近Claude Opus 4.6;編碼能力更超越Claude Sonnet 4.6,接近Opus級(jí)別。定價(jià)策略同樣具有競(jìng)爭(zhēng)力,256K上下文長(zhǎng)度下輸入單價(jià)為每百萬(wàn)1美元,輸出3美元;擴(kuò)展至100萬(wàn)上下文時(shí),輸入單價(jià)僅2美元,輸出6美元,約為Claude Opus 4.6的五分之一。

小米AI團(tuán)隊(duì)領(lǐng)軍人物羅福莉是這場(chǎng)技術(shù)突破的關(guān)鍵推手。這位畢業(yè)于北京大學(xué)計(jì)算語(yǔ)言學(xué)研究所的科研人才,曾主導(dǎo)開發(fā)阿里多語(yǔ)言預(yù)訓(xùn)練模型VECO,并在DeepSeek期間參與MoE大模型DeepSeek-V2的核心開發(fā)。2025年11月加入小米后,她帶領(lǐng)團(tuán)隊(duì)歷時(shí)數(shù)月訓(xùn)練出1T基礎(chǔ)模型。在社交平臺(tái)分享中,羅福莉透露團(tuán)隊(duì)曾設(shè)定"每天與AI對(duì)話少于100次可辭職"的硬性指標(biāo),這種高強(qiáng)度研發(fā)模式推動(dòng)模型快速迭代。她特別強(qiáng)調(diào)混合注意力機(jī)制的創(chuàng)新價(jià)值,認(rèn)為這種架構(gòu)決策為智能體時(shí)代構(gòu)建了結(jié)構(gòu)性優(yōu)勢(shì)。

行業(yè)對(duì)小米的AI轉(zhuǎn)型給予積極評(píng)價(jià)。前阿里巴巴通義千問(wèn)核心技術(shù)負(fù)責(zé)人林俊旸在社交平臺(tái)點(diǎn)贊稱"太棒了",雷軍則在發(fā)布后第一時(shí)間宣布模型在全球大模型綜合智能排行榜Artificial Analysis上位列第八,按品牌排名超越xAI Grok。他坦言小米在AI領(lǐng)域長(zhǎng)期保持低調(diào),但實(shí)際進(jìn)展超出外界想象。為支持AI戰(zhàn)略,小米計(jì)劃今年投入超過(guò)160億元研發(fā)資金,展現(xiàn)布局智能時(shí)代的決心。隨著MiMo-V2-Pro的正式發(fā)布,這場(chǎng)由神秘模型引發(fā)的行業(yè)猜想,最終演變?yōu)橹袊?guó)科技企業(yè)在大模型領(lǐng)域的又一次重要突破。

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點(diǎn)擊排行
 
智快科技微信賬號(hào)
ITBear微信賬號(hào)

微信掃一掃
加微信拉群
電動(dòng)汽車群
科技數(shù)碼群