IT之家 10 月 20 日消息,英特尔在 2025 OCP 全球峰会上展示了其打造的一款高效异构 AI 系统,这一混合计算基础设施结合了英特尔自家的 Gaudi3 AI 加速器与英伟达的 B200 Tensor Core GPU。
具体而言,在该平台上 B200 负责 AI 模型的预填充而解码部分则由 Gaudi3 负责,相较仅 B200 的同构解决方案在 Llama 开源模型上实现了至高 70% 的同 TCO 性能增益。
根据外媒 SemiAnalysis 的补充,这一混合机架系统采用了英伟达的 ConnectX-7 400GbE NIC、BlueField-3 DPU 和博通的 Tomahawk 5 51.2Tb/s 交换芯片,实现了更大的扩展域。
相关阅读:
《首款专为大规模上下文 AI 设计的 CUDA GPU,英伟达 Rubin CPX 发布》
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。