谷歌今日为其Gemini AI聊天机器人新增了"Storybook"功能,用户仅需简单描述故事情节,系统便可自动生成一本完整的图文并茂故事书。这项功能的推出标志着AI内容创作工具在个性化出版领域的新突破。
每本AI生成的故事书包含10个页面,每页都配有简洁的文字描述和相应的插图。Gemini不仅能够创作故事内容,还具备语音朗读功能,为用户提供完整的多媒体阅读体验。
在个性化定制方面,Storybook功能表现出色。用户可以根据个人喜好选择不同的视觉风格,包括黏土动画、动漫和漫画等多种艺术表现形式。更为贴心的是,该功能还支持图片上传功能,家长可以将孩子的画作上传至系统,让Gemini以这些创作为灵感基础编写专属故事。

从技术覆盖范围来看,Storybook功能已在全球范围内正式上线,支持桌面端和移动端设备,并且兼容Gemini目前支持的所有语言版本。
经过实际测试,该功能对中文用户友好度较高,能够生成流畅的简体中文内容,同时提供便捷的分享和导出打印选项,方便用户保存或制作实体书籍。

不过,这项功能在技术细节上仍有改进空间。测试过程中发现,不同页面中同一角色的外观一致性还无法完全保证,比如故事中角色在不同页面可能出现服装颜色不统一的情况。
这一技术局限表明AI在保持视觉连贯性方面仍需进一步优化。不过大多数情况下人物还是挺一致的,这个效果已经非常OK了。





尽管存在一些小瑕疵,Storybook功能的推出仍为内容创作者、教育工作者和家长提供了全新的故事创作工具,特别是在儿童教育和个性化阅读体验方面具有重要意义。


↓点击阅读原文,进AIbase官网.