在2025 OCP全球峰會(huì)上,英特爾推出了一款創(chuàng)新的異構(gòu)AI計(jì)算系統(tǒng),該系統(tǒng)通過(guò)整合英特爾Gaudi3 AI加速器與英偉達(dá)B200 Tensor Core GPU,構(gòu)建了混合計(jì)算架構(gòu)。這一設(shè)計(jì)突破了傳統(tǒng)同構(gòu)計(jì)算模式的局限,為AI模型推理提供了更高效的解決方案。
系統(tǒng)采用分工協(xié)作模式:英偉達(dá)B200 GPU負(fù)責(zé)AI模型的預(yù)填充階段,利用其強(qiáng)大的并行計(jì)算能力快速處理輸入數(shù)據(jù);而英特爾Gaudi3加速器則專(zhuān)注解碼階段,通過(guò)優(yōu)化張量運(yùn)算降低延遲。在Llama開(kāi)源模型測(cè)試中,這種異構(gòu)組合相較于純B200方案,在總擁有成本(TCO)相同的情況下實(shí)現(xiàn)了最高70%的性能提升。
據(jù)技術(shù)分析機(jī)構(gòu)SemiAnalysis披露,該系統(tǒng)的擴(kuò)展能力得益于高端網(wǎng)絡(luò)組件的集成。英偉達(dá)ConnectX-7 400GbE網(wǎng)卡與BlueField-3 DPU構(gòu)成智能網(wǎng)絡(luò)層,配合博通Tomahawk 5交換芯片提供的51.2Tb/s帶寬,使系統(tǒng)能夠支持更大規(guī)模的分布式計(jì)算集群。這種架構(gòu)設(shè)計(jì)顯著提升了數(shù)據(jù)吞吐能力,為訓(xùn)練超大規(guī)模AI模型提供了硬件基礎(chǔ)。
此次技術(shù)展示標(biāo)志著異構(gòu)計(jì)算在AI領(lǐng)域的應(yīng)用邁入新階段。通過(guò)整合不同廠商的硬件優(yōu)勢(shì),系統(tǒng)在保持成本可控的同時(shí),實(shí)現(xiàn)了性能的指數(shù)級(jí)增長(zhǎng)。這種跨平臺(tái)協(xié)作模式或?qū)⒊蔀槲磥?lái)數(shù)據(jù)中心架構(gòu)的重要發(fā)展方向。















