AI热点 6月前 168 阅读 0 评论

消息称 DeepSeek-R2 AI 模型开发进程因美国当局英伟达 H20 芯片出口限制而延迟

作者头像

AI技术专栏作家 | 发布了 246 篇文章

IT之家 6 月 27 日消息,据外媒 The Information 报道,由于美国当局策略致英伟达 H20 芯片在中国内地供应短缺,继而导致 DeepSeek-R2 AI 模型开发工作延迟。

IT之家注意到,DeepSeek 使用了 5 万块 Hopper GPU 训练 R1 模型,其中包括 3 万块 H20、1 万块 H800 和 1 万块 H100。

外媒援引两位知情人士透露,DeepSeek 团队近几个月一直在密集推进 R2 模型开发,但 CEO 梁文锋目前对模型的能力仍不满意,内部仍在继续提升性能,相应模型尚未准备好正式投用

此外,相应报道同时指出,多数用户都是在英伟达的 H20 芯片上部署 / 运行现有 DeepSeek-R1 模型,随着 H20 芯片遭美国当局限制出口,除了令 DeepSeek R2 的研发更加困难外,也对现有 DeepSeek-R1 实际部署造成一定影响。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!