AI热点 7月前 • 142 阅读 • 0 评论

不满现有工具，三星推出自研 AI 性能基准测试工具 TRUEBench

作者头像

AI中国

AI技术专栏作家 | 发布了 246 篇文章

IT之家 9 月 25 日消息，三星是首个在智能手机上引入全面的 AI 功能套件的品牌。自那时起，该公司始终保持每六个月推出全新及升级版 AI 功能的节奏。如今，三星推出了自己的人工智能性能基准测试工具，名为 TRUEBench。

今日早些时候，三星宣布已开发出名为“可信真实场景使用评估基准”（Trustworthy Real-world Usage Evaluation Benchmark，简称 TRUEBench）的自研 AI 基准测试工具。这是一款专有基准工具，由三星研究院（Samsung Research）开发。此前，三星发现现有 AI 基准测试工具存在诸多不足，遂启动了该工具的研发工作。三星表示，大多数现有工具只关注英语，且仅限于单轮问答结构。

三星指出，TRUEBench 的测试涵盖了多样化对话场景与多语言环境。基于企业内部将 AI 用于生产力提升的实践经验，该基准工具围绕 10 项最常用的企业任务评估 AI 性能，例如内容生成、数据分析、文本摘要及翻译等。

据IT之家了解，TRUEBench 包含 2485 组测试集，覆盖 10 个大类、46 个子类以及 12 种语言。其测试旨在检验 AI 模型的实际问题解决能力，测试集的长度从 8 个字符到 20000 多个字符不等，涵盖了从简单任务到长文档总结等各类任务。

三星称，TRUEBench 拥有可靠的评分体系，这得益于一套由 AI 与人类协作设计并完善的 AI 自动评估系统。该工具的数据样本与排行榜已在开源平台 Hugging Face 上线，用户可通过其测试最多 5 个 AI 模型，并对它们的性能与效率进行对比。

三星电子 DX 部门首席技术官兼三星研究院院长 Paul (Kyungwhoon) Cheun 表示：“凭借在真实场景中积累的 AI 实践经验，三星研究院具备深厚的专业知识与竞争优势。我们期望 TRUEBench 能够确立生产力领域的评估标准，并巩固三星在技术领域的领先地位。”

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

作者头像

AI前线

专注人工智能前沿技术报道，深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了！视频分析功能将极大扩展AI的应用场景，特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度？我们正在开发一个实时视频分析应用，非常关注性能表现。

作者头像

AI前线作者

12小时前

我们测试的平均响应时间在300ms左右，比上一代快了很多，适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平，这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用！

文章章节

1. GPT-4简介与注册指南

1.1 账号注册步骤

推荐文章

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

5月前 • AI热点

用户破8亿！GPT-5.1来了，表情包含量可自定义

用户破8亿！GPT-5.1来了，表情包含量可自定义

5月前 • AI热点

发布即开放：百度猎户座葫芦里卖的什么药？

发布即开放：百度猎户座葫芦里卖的什么药？

5月前 • AI热点

李飞飞的世界模型来了！一句话生成3D世界，AI 真的开始理解现实了

李飞飞的世界模型来了！一句话生成3D世界，AI 真的开始理解现实了

5月前 • AI热点

速抢（2核2G）77元/年香港免备案服务器

速抢（2核2G）77元/年香港免备案服务器

0秒前 • AI热点

腾讯总裁剧透微信搭载智能体！阿里和谷歌也都开始互相伤害了

腾讯总裁剧透微信搭载智能体！阿里和谷歌也都开始互相伤害了

5月前 • AI热点

AIGC大模型能力提升10倍！安谋科技Arm China掏出最强NPU IP大招

AIGC大模型能力提升10倍！安谋科技Arm China掏出最强NPU IP大招

5月前 • AI热点

小鹏物理AI的尽头，是马斯克的现金流

小鹏物理AI的尽头，是马斯克的现金流

5月前 • AI热点

热门标签

Kimi开放平台乔纳森・艾维 AI眼镜长虹电视 3D-DiT分级雕刻技术 ClaudeAI 微型股小红书开店苹果生态记忆能力

热门作者

作者头像

AI前沿

2.4k 粉丝

作者头像

机器学习实验室

1.8k 粉丝

作者头像

AI创业圈

3.1k 粉丝