AI

英伟达推多模态LLM Describe Anything:指定特定区域生成详细的描述

NVIDIA AI团队发布了一款革命性的多模态大语言模型——Describe Anything3B(DAM-3B),专为图像和视频的精细化、区域化描述而设计。这款模型凭借创新技术和卓越性能,在多模态学习领域掀起热议,成为AI技术发展的又一里程碑。以下,AIbase为您梳理这款模型的核心亮点与行业影响。区域化描述的突破DAM-3B以其独特的能力脱颖而出:能够根据用户指定的图像或视频区域(如点、框、涂

苹果AI落后原因曝光!2023年关键决策失误

快科技4月12日消息,据媒体报道,苹果在AI领域的滞后发展,可以追溯到2023年的一次关键决策失误。苹果AI团队在2023年向CEO蒂姆库克提交了加倍预算的提案,希望购置更多GPU以加速AI开发。库克最初同意了这一提案,但首席财务官卢卡马埃斯特里(Luca Maestri)却将预算削减了一半,还要求团队更高效地利用现有资源。这一决策直接导致苹果AI团队在硬件资源上的严重不足,当时,苹果的数据中

让AI帮你发微信、下载小红书图片、写飞书文档...你敢把电脑交给它吗?|Fellou 实测体验

差不多一个半月前,是我第一次使用 Fellou,也是我第一次使用这类 Agent 形式的浏览器。AI 圈总是喜欢造新词,比如人们喜欢把这种带有 AI 功能的浏览器称之为 “Agentic Browser” 或 “Browser for Agentic Search” 亦或是最简单的 “AI Browser”。其中的差别,可能就算是真正的一线从业者,都要细细斟酌上半天,才敢说道说道。当然,我并不在