AI热点 5小时前 155 阅读 0 评论

英伟达推出Spectrum-XGS以太网,把多个数据中心组合成十亿瓦级AI超级工厂

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

智东西

作者 | ZeR0

编辑 | 漠影

智东西8月23日报道,NVIDIA昨夜推出一项重要网络创新技术——NVIDIA Spectrum-XGS以太网。这项跨区域扩展(scale-across)技术可将多个分布式数据中心组合成一个十亿瓦级AI超级工厂。

NVIDIA Spectrum-X以太网提供横向扩展架构,可连接整个集群,快速将海量数据集传输到AI模型中,并协调整个数据中心的GPU间通信。Spectrum-XGS以太网是NVIDIA Spectrum-X以太网平台的一部分,现可供货。

年度芯片及系统架构顶级会议Hot Chips举行在即,AI推理和网络将成为关注焦点。NVIDIA将在Hot Chips期间重点介绍NVIDIA Spectrum-XGS以太网,并详细分享NVIDIA网络、数据中心机架、神经渲染技术、NVIDIA GB10超级芯片与DGX Spark、集成硅光子学的共封装光学器件(CPO)交换机等推理和加速计算领域的最新技术进展。

随着AI需求的激增,单个设施内的数据中心功率和容量已达到极限。要实现数据中心扩展,必须打破建筑物的限制,而现有的商用以太网网络基础设施因高延迟、高抖动及性能的不可预测而无法满足需求。

对此,NVIDIA Spectrum-X以太网平台新增Spectrum-XGS以太网,通过引入跨区域扩展(scale-across)基础设施打破了上述限制。

NVIDIA创始人兼CEO黄仁勋谈道:“AI工业革命已经到来,而巨型AI工厂是这场变革的核心基础设施。继纵向扩展(scale-up)和横向扩展(scale-out)技术后,我们又通过推出NVIDIA Spectrum-XGS以太网提供跨区域扩展(scale-across)技术,将不同城市、国家乃至大洲的数据中心组合成庞大的十亿瓦级的AI超级工厂。”

跨区域扩展(scale-across)是继纵向扩展(scale-up)和横向扩展(scale-out)之后的AI计算“第三大支柱”。Spectrum-XGS以太网完全集成于Spectrum-X平台,通过算法实现了网络和数据中心设施间距离动态适配。

凭借先进的、自动调节的远距离拥塞控制、精准延迟管理及端到端遥测技术,Spectrum-XGS以太网将NVIDIA集合通信库性能提升了近1倍,加速了多GPU和多节点的通信性能,实现了可预测异地AI集群的性能。这样就可以将多个数据中心组合成一个统一的AI超级工厂运行,全面优化长距离连接性能。

CoreWeave等超大规模云提供商已开始部署这种新基础设施。其中CoreWeave将成为首批使用Spectrum-XGS以太网连接它的数据中心的企业。

Spectrum-X以太网网络平台为多租户、超大规模AI工厂(包括全球最大的AI超级计算机)提供的带宽密度较传统以太网高出1.6倍。该平台由NVIDIA Spectrum-X交换机和NVIDIA ConnectX-8 SuperNIC组成,帮助构建未来AI平台的企业实现无缝扩展、超低延迟和空前性能。

今日最新发布是NVIDIA一系列网络创新技术发布的延续,如NVIDIA Spectrum-X和NVIDIA Quantum-X CPO网络交换机等,这些技术一起能够将位于不同地点的数百万颗GPU组合成AI工厂,突破大规模AI基础设施性能和效率的极限,同时降低能耗和运营成本。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!