Meta 开源大模型 Llama-4-Maverick 基准测试排名暴跌,此前被质疑刷榜作弊

IT之家 4 月 14 日消息,LMArena 更新了 Meta 最新发布的开源大模型 Llama-4-Maverick 的排名,其从此前的第 2 名直线下降至第 32 名。这证实了此前开发者对 Meta 为刷榜向 LMArena 提供“特供版”Llama 4 大模型的质疑。4 月 6 日,Meta 发布了最新的大模型 Llama 4,包含 Scout、Maverick 和 Behemoth 三

研究发现:要求 AI 简洁作答可能致其出现更多“幻觉”

IT之家 5 月 8 日消息,巴黎人工智能检测公司 Giskard 发布了一项新研究,指出要求人工智能聊天机器人回答问题时更加简洁,可能会导致其产生更多“幻觉”,即输出不准确或虚假的信息。Giskard 的研究团队在博客中详细阐述了他们的发现。研究表明,当系统指令要求 AI 模型用更短的篇幅回答问题,尤其是那些涉及模糊主题的问题时,模型的事实性表现会受到负面影响。研究人员指出:“我们的数据显示,

世界上首个能爬的无线仿生手诞生

IT之家 4 月 14 日消息,英国一家初创公司 Open Bionics 在本月推出了世界上第一款无线仿生手,该手在脱离穿戴者后仍能工作。Open Bionics 公司花费了四年时间研发其最新的 Hero 仿生手,声称这是世界上最先进的仿生肢体。Open Bionics 的联合创始人兼首席执行官 Samantha Payne 介绍称:“这是目前最先进的仿生手,速度和强度是同类产品的两倍,同时也

还在为处理多图发愁?腾讯元宝更新,多图上传+智能处理一键搞定

腾讯元宝迎来重大升级,此次更新后,其识图功能进一步拓展,最大的亮点在于支持一次性上传10张图片,无论是混元还是DeepSeek模型,都能连贯识图、串连理解并集中回答问题。这一功能结合了混元的多模态理解能力,是元宝双模型能力的有力体现。在实际应用场景中,该功能实用性极高。比如在处理电子书截图时,用户可让元宝提炼金句并撰写感想;面对朋友圈九图,能快速生成自然的文案;对于板书或讲义照片,能迅速整理出结构

​加州团体联名请愿,抗议 OpenAI 营利转型违背初衷

近日,包括拉丁裔繁荣组织和加州卡车司机工会在内的多个团体,向加州总检察长罗布・邦塔提交了一份请愿书,要求阻止 OpenAI 转型为盈利公司。OpenAI 最初成立时是一个非营利性人工智能研究机构,但在2019年选择了转型为由非营利性组织管理的盈利公司。根据 OpenAI 的计划,从2024年开始,该公司将转型为公共利益公司,并有两年的时间来实现这一目标,否则将面临大部分资金变为债务的风险。图源备注

全景式扫描“中国网络视听大会”:AI、短剧与出海“新版图 ”| 现场

声明:本文来自于微信公众号 娱乐独角兽,作者:木落潇潇,授权站长之家转载发布。2025年3月26-28日,第十二届中国网络视听大会借着《哪吒2》尚未消散的热度,如期而至。因《哪吒2》火爆的成都,正值气温交替时节。大会前两日阳光炽烈,参会者挥汗如雨,后一日气温陡降,又得套上羽绒服御寒。气温的跌宕微妙地呼应了产业格局的悄然变化,虽然主会场仍牢牢锁定各家头部平台,分论坛却不尽然。曾经风头无两的长视频

可保护作品免遭 AI 训练,Adobe 推出 Content Authenticity 应用

IT之家 4 月 24 日消息,Adobe 推出全新应用 Content Authenticity,用于保护创意工作者的作品署名权,即使有人截屏并在网络二次传播也不受影响。这款网页应用于今日面向公众开放测试,用户上传需要保护的图像,应用就能嵌入隐形元数据和添加“禁止 AI 训练”标签,帮助确认作品归属和保护作品免遭 AI 训练。这款全新网页应用基于 Adobe 的内容凭证(Content Cre

OpenAI为ChatGPT推出全新记忆功能,让交流更贴心

近日,OpenAI 悄然更新了其人工智能聊天机器人 ChatGPT,给 Plus 和 Pro 订阅用户带来了备受期待的 “全局对话内容记忆功能”。这项新功能允许 ChatGPT 参考用户过往的对话记录,从而提供更个性化的交流体验。OpenAI 首席执行官 Sam Altman 在发布会上指出,通过这项新功能,ChatGPT 可以深入了解用户的偏好与兴趣,这意味着它不仅能记住你喜欢什么,还能根据这些

搜索引擎后的下一个战场,广告服务商已尝试在 AI 回复中植入广告

IT之家 4 月 28 日消息,谷歌在上个世纪被誉为“纯粹的搜索引擎”,承诺提供简单、无广告的体验。然而随着多年来谷歌商业模式的转变,广告已逐渐深入搜索结果页面,甚至成为了谷歌的主要收入来源之一。ChatGPT 等 AI 问答产品的应用在 2022 年底开始爆发,这类提供直接答案而非链接列表的对话式 AI 对谷歌基于链接的广告模式构成了重大挑战。FT 报道称,广告集团和技术初创公司也没有放弃这个

刚刚,OpenAI开源PaperBench,重塑顶级AI Agent评测

声明:本文来自于微信公众号 AIGC开放社区,作者:AIGC开放社区公众号,授权站长之家转载发布。今天凌晨1点,OpenAI开源了一个全新的AI Agent评测基准——PaperBench。这个基准主要考核智能体的搜索、整合、执行等能力,需要对2024年国际机器学习大会上顶尖论文的复现,包括对论文内容的理解、代码编写以及实验执行等方面的能力。根据OpenAI公布的测试数据显示,目前知名大模型打