黄色三级不卡在线观看-男男视频网站高清观看-久久国产欧美韩国精品app-免费观看妇女A级视频-中文字幕一区二区三区人妻在线视频-国产精选av一区二区-欧美亚洲精品不卡一区二区-99女福利女女视频在线播放-国产美女香蕉久久精品

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

蘋果芯片助力突破:開發(fā)者用MacBook Pro成功運行209GB超大AI模型

   時間:2026-03-21 00:40 來源:快訊作者:沈如風

近日,開發(fā)者Dan Woods在一臺配備M3 Max芯片和48GB統(tǒng)一內(nèi)存的MacBook Pro上,成功運行了規(guī)模達209GB的Qwen3.5-397B人工智能模型。這一突破性成果打破了傳統(tǒng)認知——該模型參數(shù)規(guī)模通常需要數(shù)據(jù)中心級硬件支持,而此次在消費級設(shè)備上的實現(xiàn)速度超過每秒5.5個Token,為端側(cè)AI應用開辟了新可能。

該模型原始文件占用磁盤空間209GB,壓縮后仍需120GB存儲空間。傳統(tǒng)方案需將數(shù)百億參數(shù)全部加載至內(nèi)存,遠超普通筆記本電腦的硬件極限。Woods通過創(chuàng)新技術(shù)路徑突破物理限制,其核心方法借鑒了蘋果2023年發(fā)布的《閃存中的大語言模型》研究論文,采用"閃存-內(nèi)存協(xié)同計算"架構(gòu),將模型參數(shù)存儲于高速NVMe固態(tài)硬盤,通過動態(tài)數(shù)據(jù)塊調(diào)度實現(xiàn)按需加載。

蘋果芯片的統(tǒng)一內(nèi)存架構(gòu)在此過程中發(fā)揮關(guān)鍵作用。這種將CPU、GPU與內(nèi)存深度整合的設(shè)計,使得數(shù)據(jù)傳輸效率較傳統(tǒng)分離式架構(gòu)提升數(shù)倍。Woods特別優(yōu)化了Qwen模型的混合專家(MoE)架構(gòu)特性,通過將每次推理激活的專家模塊數(shù)量從10個減少至4個,在保持模型核心性能的同時,將內(nèi)存需求降低60%以上。開發(fā)者Simon Willison分析指出,這種策略使活躍權(quán)重可直接從閃存讀取,有效平衡了性能與資源消耗。

項目實現(xiàn)過程中,AI工具發(fā)揮重要作用。Woods將蘋果技術(shù)論文輸入Claude Code智能助手,通過自動化研究模式進行90次迭代實驗,最終生成針對蘋果芯片優(yōu)化的MLX Objective-C和metal底層代碼。這種人機協(xié)作模式顯著提升了開發(fā)效率,相關(guān)技術(shù)細節(jié)與測試數(shù)據(jù)已在GitHub平臺完整開源,包括內(nèi)存管理策略、數(shù)據(jù)塊調(diào)度算法等核心模塊。

此次突破驗證了消費級設(shè)備運行超大規(guī)模模型的可行性,為AI應用從云端向終端遷移提供了新思路。雖然當前實現(xiàn)仍需依賴高速固態(tài)硬盤,但其展示的技術(shù)路徑為后續(xù)硬件優(yōu)化指明了方向。隨著存儲介質(zhì)性能提升與算法持續(xù)改進,未來在普通筆記本電腦上運行千億參數(shù)模型或?qū)⒊蔀楝F(xiàn)實。

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群