
智东西AI前瞻(公众号:zhidxcomAI)
作者 | 江宇
编辑 | 漠影
智东西8月6日报道,如果你也有“文档太多,没空看”的困扰,这次,ima推出的新功能,或许能为你省下不少阅读时间。
昨日,ima发布最新版本,一口气上线四项能力:生成双人AI播客、支持文件夹上传、Xmind脑图导入、共享知识库文档置顶,围绕知识的整理、理解与调用做了多项改进。
其中,“AI播客对话”功能颇受关注。用户只需上传一份文档,就能自动生成一段双人播客,用类似聊天的方式,把文章内容讲给你听。不是单调朗读,而是真人语气的讨论、解释与延伸。听着听着,你会发现,AI不仅读懂了文章,还在引导你“听明白”。
围绕四项新功能,智东西选取了三类不同风格的文章体验了“AI博客”,也同步体验了批量导入与知识库整理的整体流程,以下是详细体验过程。
一、生成AI播客,把长文“聊清楚”讲给你听
在本次更新中,ima推出的“AI播客”与传统的文本转语音不同,ima采用双人播客对话形式,将一篇文档拆解为知识点、疑问与观点,由两个虚拟角色以“你来我往”的形式进行讨论,重点不漏、互动真实、听感流畅,可定制开场语与配乐,还原听觉上更自然的学习体验。
ima播客生成基于混元大模型,系统会自动抓取文档中的信息,转化为脚本,再配合拟人语音进行演绎。整个过程无需用户写稿,只需点击“生成播客”按钮,AI即完成从文档到音频的内容转换。
目前,“AI播客对话”功能支持用户上传本地文档生成播客内容,暂不支持通过文章链接直接导入,用户可在PC端或移动端首页入口使用该功能。

PC端入口

手机端入口
由于暂不支持粘贴链接导入,用户需将目标内容整理为文档上传,或从个人知识库中选择已有文件。点击“生成播客”后,系统将在约1–3分钟内完成生成。

智东西使用“生成AI播客”功能,体验了三类不同的文章。整体效果出人意料,不只是把文字转成语音,更像是带节奏、有引导的深度对话,AI在“讲清楚”之外,还展现出一定的理解力与表达力。
第一篇是来自历史大家许倬云的文章——《当今时代,如何过真正有力量的生活?》。
https://oss.zhidx.com/af0b077ae37876131d99de65be94a139/68937c00/uploads/2025/08/68930d9d8b5f9_68930d9d873ba_68930d9d87393_许倬云《当今时代,如何过真正有力量的生活?》.m4a
ima的AI博客以一问一答的形式,引导用户一步步理解文章重点。语气自然,有停顿、感叹词,也能抓住原文的语言风格,把字面意思和内在含义串联起来。原以为只是机械导读,实际听下来,AI已经摸透了作者的逻辑,还能帮用户“听明白”问题,“读进去”文章。
第二篇是AI故事计划的《一个实习生亲历的Manus外迁与裁员》。
https://oss.zhidx.com/a98236e5b665a4d10f83e347732d820b/68937c00/uploads/2025/08/68930fe0a742b_68930fe09291a_68930fe0928e6_《一个实习生亲历的Manus外迁与裁员》.mp3
ima在引入时加入了事件背景,讲故事像说书,有节奏、有情绪。结尾的总结也处理得非常自然,把原文留白的部分做了收束。唯一的小问题是“Manus”这个词英文发音不太稳定。
第三次体验是来自澎湃新闻有关“假院士”的系列报道,共三篇文章。
https://oss.zhidx.com/833f65c6a07a904ea12c7ea5f87f6d4a/68937c00/uploads/2025/08/6893112e4e7c1_6893112e41ff0_6893112e41fb7_“假院士”系列报道.mp3
博客对话非常有讨论感,能把这些离谱新闻讲得清楚,还带点八卦氛围。对话里还模拟了卡顿、不熟悉人名等小细节,有种“真人在读”的听感,既能结合三篇报道讲清来龙去脉,也有面对荒诞新闻时的自然反应。
整体来看,这个播客功能不仅能让你“听内容”,更像是和懂文章的朋友一起慢慢聊明白。AI不仅读懂了,也努力在帮你读深。
二、从批量导入到知识结构,三项功能提升效率
针对资料整理场景,本次ima支持了文件夹上传能力,但仅限PC端。用户可一键上传多层级文件夹,系统自动识别文件结构,完整保留目录体系。

相比逐个上传、手动分类的操作方式,该功能能够有效简化前期资料整理步骤,适用于课程笔记、项目文档、报告合集等成组合类资料的导入,并且导入后的资料仍支持原有的AI阅读、知识提取等功能。
智东西尝试上传包含10篇论文的文件夹,ima能准确保留原有目录结构,并将文件整体导入至个人知识库。

每份文档一经上传均被AI自动解析,用户可在概览栏直接查看对应的摘要内容。

为了支持更多类型的结构化资料,本次ima新增了对Xmind文件的解析与导入功能。用户可上传.xmind格式的脑图,系统将自动识别其内容结构,并将其中的信息提取为可解析的知识点,并支持用户对脑图内容进行修改。
导入后的脑图也直接纳入知识库进行管理与引用,用户点击右侧“问知识库”下方的对话栏,即可调用AI对其内容进行提问和总结。

xmind格式可导入

ima解析脑图,支持AI解读、总结提取等功能。
在知识库中,ima还增加了“文档置顶”能力。用户可将某些重点或高频使用的文档设置为置顶,固定在共享知识库的顶部区域,支持多个文档同时置顶,排序依据设定顺序排列。该功能尤其适用于项目协作、培训资料、标准文档等场景,可作为快速索引使用。

结语:从看文件到“讲明白”,AI正成为知识的新入口
本轮更新后,ima不再只是“看文件”的工具,而开始承担“讲内容”的角色。从文本到播客、从脑图到知识库,AI介入的边界进一步拓宽。
尤其是在AI播客功能中,ima展现出对文本结构、语言节奏乃至情绪表达的把握力,不仅讲得清楚,还讲出了温度和活人感。相比单向朗读,它更像是一场“陪你读懂”的深度对话。
在文档不断堆积、注意力高度碎片的当下,用“听”的方式吸收信息,正成为一种越来越自然的需求。更新后的ima,正在提供这样的新接口。