谷歌Gemma 4開源大模型來襲，多規(guī)格適配多場景，31B模型躋身開源前列-手機產(chǎn)品-虎科技

谷歌Gemma 4開源大模型來襲，多規(guī)格適配多場景，31B模型躋身開源前列

時間：2026-04-03 20:23 來源：快訊作者：沈瑾瑜

谷歌近日正式發(fā)布全新開源大模型Gemma 4，憑借其突破性的"單位參數(shù)智能水平"引發(fā)行業(yè)關(guān)注。這款專為復(fù)雜推理和智能體工作流設(shè)計的模型，在保持開源特性的同時實現(xiàn)了性能躍升，成為谷歌迄今為止最智能的開源模型。

Gemma 4系列包含四種規(guī)格模型：20億參數(shù)的E2B、40億參數(shù)的E4B、260億參數(shù)的混合專家模型（MoE）以及310億參數(shù)的稠密模型（31B）。所有版本均突破傳統(tǒng)對話場景限制，在復(fù)雜邏輯處理和智能體協(xié)作方面表現(xiàn)突出。其中31B模型在Arena AI文本基準(zhǔn)測試中位列全球開源模型第三，26B模型位居第六，展現(xiàn)出超越自身規(guī)模20倍模型的性能表現(xiàn)。

該系列模型的核心優(yōu)勢體現(xiàn)在多維度技術(shù)突破：在推理能力方面，通過多步規(guī)劃與深度邏輯優(yōu)化，數(shù)學(xué)和指令執(zhí)行等基準(zhǔn)測試成績顯著提升；智能體工作流支持原生函數(shù)調(diào)用、結(jié)構(gòu)化JSON輸出和系統(tǒng)指令，可構(gòu)建自主對接各類工具的智能體；代碼生成模塊支持高質(zhì)量離線編程，將工作站轉(zhuǎn)化為本地化AI開發(fā)助手；視覺處理模塊兼容可變分辨率，在OCR和圖表解析等任務(wù)中表現(xiàn)優(yōu)異，E2B/E4B還額外集成語音識別能力。

針對不同部署場景，Gemma 4提供差異化解決方案。26B混合專家模型采用動態(tài)參數(shù)激活技術(shù)，推理時僅調(diào)用38億參數(shù)，在保持低延遲的同時實現(xiàn)每秒數(shù)千token的生成速度；31B稠密模型則通過非量化bfloat16權(quán)重優(yōu)化，可高效運行于單張80GB顯存的英偉達H100 GPU。量化版本更支持消費級顯卡部署，滿足集成開發(fā)環(huán)境和編程助手等場景需求。

端側(cè)設(shè)備部署方面，E2B/E4B模型通過架構(gòu)級優(yōu)化實現(xiàn)極致能效，推理時分別僅占用20億和40億參數(shù)內(nèi)存。與谷歌Pixel團隊及高通、聯(lián)發(fā)科等芯片廠商的合作，使這些模型可在手機、樹莓派和英偉達Jetson Orin Nano等設(shè)備上離線運行。安卓開發(fā)者現(xiàn)已可通過AICore預(yù)覽版構(gòu)建智能體流程，與Gemini Nano 4保持向前兼容。該系列支持128K至256K的上下文窗口，可處理完整代碼庫或長文檔輸入，并覆蓋超過140種語言的原生訓(xùn)練數(shù)據(jù)。

更多>同類內(nèi)容

阿里云金融智能體市場一騎絕塵七大維度領(lǐng)	百度推醫(yī)生版“龍蝦”有醫(yī)助理醫(yī)療AI進階
京東超市酒類銷售強勁增長：一季度整體超25	SpaceX：從發(fā)射服務(wù)到太空基建算力生態(tài)的超