上海棣山科技近日對(duì)外公布了其2納米高端AI GPU芯片的最新研發(fā)成果,標(biāo)志著國(guó)內(nèi)在先進(jìn)制程芯片領(lǐng)域取得重要突破。這款芯片采用FinFET與GAA混合制程工藝,結(jié)合Chiplet異構(gòu)集成架構(gòu),核心晶體管數(shù)量突破1700億顆,通過2.5D CoWoS-L封裝技術(shù)實(shí)現(xiàn)高密度集成。
性能參數(shù)方面,該芯片在FP32單精度算力上達(dá)到50萬(wàn)億次/秒,F(xiàn)P16半精度算力翻倍至100萬(wàn)億次/秒,而針對(duì)低精度計(jì)算的FP4模式更實(shí)現(xiàn)400萬(wàn)億次/秒的突破性表現(xiàn)。這種多精度算力配置使其能夠靈活適配從大模型訓(xùn)練到實(shí)時(shí)推理的多樣化AI應(yīng)用場(chǎng)景。能效比優(yōu)化成為另一大亮點(diǎn),相比前代產(chǎn)品提升40%,典型功耗控制在350瓦以內(nèi),每瓦算力達(dá)1420億次/秒。
研發(fā)團(tuán)隊(duì)在關(guān)鍵技術(shù)領(lǐng)域取得多項(xiàng)突破,成功解決高帶寬內(nèi)存(HBM)與芯片的封裝互聯(lián)難題,實(shí)現(xiàn)超低延遲的片間通信。通過支持NVLink 6兼容協(xié)議,單鏈路帶寬提升至1.6TB/秒,多芯片互聯(lián)時(shí)可消除算力瓶頸,形成協(xié)同運(yùn)算的超級(jí)計(jì)算單元。軟件生態(tài)兼容性方面,該芯片全面適配CUDA計(jì)算架構(gòu),為下游客戶提供平滑的技術(shù)遷移路徑,顯著降低開發(fā)成本。
目前該芯片已完成原型設(shè)計(jì)驗(yàn)證,各項(xiàng)指標(biāo)均達(dá)到國(guó)際領(lǐng)先水平。公司負(fù)責(zé)人表示,這款產(chǎn)品將重點(diǎn)面向數(shù)據(jù)中心、超算中心等高端算力市場(chǎng),通過架構(gòu)創(chuàng)新與工藝突破,為AI大模型訓(xùn)練提供更具性價(jià)比的解決方案。隨著后續(xù)測(cè)試工作的推進(jìn),預(yù)計(jì)將在年內(nèi)完成工程樣片流片。















