AI热点 5小时前 • 114 阅读 • 0 评论

小红书首个多模态 AI 大模型 dots.vlm1 发布并开源，基于 DeepSeek V3 LLM

作者头像

AI中国

AI技术专栏作家 | 发布了 246 篇文章

感谢IT之家网友软媒用户1392612 的线索投递！

IT之家 8 月 6 日消息，小红书 hi lab 研发并开源的首个多模态大模型 dots.vlm1 今日正式发布，借助一个从零训练的 12 亿参数视觉编码器以及基于 DeepSeek V3 LLM 构建。

小红书 hi lab 表示，dots.vlm1 在大部分多模态评测集上接近闭源 SoTA 模型的水平，并在文本能力和主流文本模型相当。

NaViT 视觉编码器：没有基于成熟视觉编码器进行微调，完全从零开始训练，原生支持动态分辨率。同时在文本监督上增加纯视觉监督，提升感知能力上限。此外，训练数据上在传统的 Image Caption 数据上还引入大量结构化图片进行原生训练，提升 VLM 模型的感知能力（例如各类 OCR 能力）。
多模态训练数据：在传统思路上，额外引入多种合成数据思路，覆盖多样的图片类型（例如表格 / Chart / 文档 / Graphics 等）及其描述（例如 Alt Text / Dense Caption / Grounding 等）；同时，利用多模态大模型来重写图文交错网页数据，显著提升训练数据质量；
通过大规模预训练与精细化后训练调优，dots.vlm1 在视觉感知与推理方面达到了接近 SOTA 的表现，为开源视觉语言模型树立了新的性能上限，同时在纯文本任务中仍保持一定竞争力。

在主要的视觉评测集上，dots.vlm1 的整体表现已接近当前领先模型 Gemini 2.5 Pro 与 Seed-VL1.5 thinking，尤其在 MMMU / MathVision / OCR Reasoning 等多个基准测试中取得了相当竞争力的结果，显示出较强的图文理解与推理能力。

在典型的文本推理任务（如 AIME、GPQA、LiveCodeBench）上，dots.vlm1 的表现大致相当于 DeepSeek-R1-0528，在数学和代码能力上已具备一定的通用性，但在 GPQA 等更多样的推理任务上仍存在差距。

总体来看，dots.vlm1 在视觉多模态能力方面已接近 SOTA 水平，在文本推理方面达到了主流模型的性能。然而，在部分细分任务上仍与最优结果存在一定距离，需要在架构设计与训练数据上进一步优化。

复杂图表推理样例：

STEM 解题样例：

长尾识别解题样例：

视觉推理样例：

IT之家附 dots.vlm1 开源地址：

https://github.com/rednote-hilab/dots.vlm1

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

作者头像

AI前线

专注人工智能前沿技术报道，深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了！视频分析功能将极大扩展AI的应用场景，特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度？我们正在开发一个实时视频分析应用，非常关注性能表现。

作者头像

AI前线作者

12小时前

我们测试的平均响应时间在300ms左右，比上一代快了很多，适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平，这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用！

文章章节

1. GPT-4简介与注册指南

1.1 账号注册步骤

推荐文章

面壁智能开源 MiniCPM-V 4.0 AI 模型：手机 App 就能用，图像理解超 GPT-4.1-mini

面壁智能开源 MiniCPM-V 4.0 AI 模型：手机 App 就能用，图像理解超 GPT-4.1-mini

1小时前 • AI热点

号称可以生成录音室级别人声音乐，Eleven Music 文字转音频 AI 模型问世

号称可以生成录音室级别人声音乐，Eleven Music 文字转音频 AI 模型问世

1小时前 • AI热点

速抢（2核2G）77元/年香港免备案服务器

速抢（2核2G）77元/年香港免备案服务器

0秒前 • AI热点

“Awaken Your Web 创新挑战赛”正式启动，邀全球开发者共创 Agent 新纪元

“Awaken Your Web 创新挑战赛”正式启动，邀全球开发者共创 Agent 新纪元

14小时前 • AI热点

马斯克出手，打车费爆砍84%！Robotaxi要革Uber的命

马斯克出手，打车费爆砍84%！Robotaxi要革Uber的命

10小时前 • AI热点

腾讯2026校园招聘正式启动，将推出AI产品经理培训生项目

腾讯2026校园招聘正式启动，将推出AI产品经理培训生项目

11小时前 • AI热点

终于来了！小红书灵犀即将全面上线！

终于来了！小红书灵犀即将全面上线！

10小时前 • AI热点

AI时代硬核EMBA来了！交大高金「科技强国计划」全额奖学金等你拿

AI时代硬核EMBA来了！交大高金「科技强国计划」全额奖学金等你拿

11小时前 • AI热点

热门标签

直播带货 AI 工具 Minecraft插件夏日学习打卡 bedrock 禅镜医疗大模型舞蹈视频 AI视频地球AI大脑 AI高考数学

热门作者

作者头像

AI前沿

2.4k 粉丝

作者头像

机器学习实验室

1.8k 粉丝

作者头像

AI创业圈

3.1k 粉丝