AI热点 7月前 • 204 阅读 • 0 评论

小白也能玩转AI视频！即梦Agent模式实测：一句话搞定插画、海报、Vlog

作者头像

AI中国

AI技术专栏作家 | 发布了 246 篇文章

Nano Banana

Nano Banana

0秒前

过去这样一个复杂指令，需要被拆分成找素材→AI生图→AI生视频多个步骤。

但现在从生图到生视频，再复杂的指令也只需一次输入就全搞定！

这就是即梦AI最新上线的Agent模式，只需要说出你的需求，它就能自动帮你写提示词，新上手的小白也能轻松玩转。

比Nano banana更懂中文场景，文生图和图像编辑还比Nano banana强！

官方做出来的效果是酱紫的：

估计这时就有朋友问了，这个视频肯定制作过程很复杂吧？

NoNoNo！全程只用了一句话指令：创建12张像素风格图像并组合成视频。

又比如说可以直接批量生成一系列图像，构成完整故事。

批量生成视频也不在话下，还能直接串到一起，比如说这个人的一生：

甚至还可以直接迁移使用其他图片的风格、获取对方的提示词……

所以下面一起来康康我们的实测过程～

一手实测Agent模式

首先进入官网，点击输入框左下角的模式切换按钮，就能一键get到新上线的Agent模式。

桥豆麻袋，写提示词前，先告诉大家一个小tips！

Agent现在还兼职AI小助手功能，用户可以直接询问它怎么写提示词，be like：

Prompt：请教教我如何写提示词？

好了，学会写提示词后，我们正式开始测评～

先来试试最新上线的智能多帧功能，据官方透露，Agent可以直接一口气生成多张连续图像，再自动连接首尾两帧，组成完整视频。

国庆假期将至，坐在我工位旁的小悦同学却天天在愁去哪里度假……那即梦酱先给她做份景点大全吧。

Prompt：做6张中国标志性景点的插画风图片，用智能多帧组成一份循环海报。

全程用了不到3分钟，标志性景点的插画视频就搞定了，外滩、泰山、九寨沟、张家界……应有尽有。

再看看画面美术风格呢，整体统一采用几何化风格和高饱和色彩，转场过渡也很自然。

最妙的是，它是真的很懂用户需求，原来的Prompt里并没有主动告知它要竖屏，只有关于海报的提示，结果它主动适配海报排版和移动端展示，自动生成了3:4比例的竖图，确实很贴心了。

另外悄悄告诉你，Prompt里点明用“智能多帧”，效果会更好嗷～

喜欢搞二创的劳斯们有福了，创意提升也是这次Agent模式的重点技术升级。看到喜欢的图片风格想用怎么办？Agent直接能帮忙生成类似的创意。

比如说，我想为蜜雪冰城的柠檬水打call，感觉这张化妆品广告的风格还挺适合，交给Agent模式试试。

wow！这波雪王高级感拉满。

仔细看，Agent模式生图全是细节：为了让视觉效果更纯净，也是把原图的塑料杯换成了玻璃材质；保留了可爱的Logo，但是去掉了冰淇淋权杖提升品牌档次。

一张不够，还可以生成一系列的同风格图片。

举个栗子，下面让它根据这张中秋节的海报，再多做几张让甲方挑选。

Prompt：帮我按照这张图的风格再生成四张带有“中秋佳节”字样的海报。

第一张图整体基调不变，只将字体样式改得更有阴影棱角；第二张图将楼阁改成暗色调，增加一些飘洒的花瓣特效，月饼也成了礼盒装；第三张图换成了墨绿色渐变背景，小兔子身上也加了点纹样点缀，让画面更丰富；第四张图的背景则改成了深蓝色的夜晚，月饼上还镀上了一层金属光泽，贵气！

另外，还能点击查看其中任何一张图的细节，包括对应的提示词、比例和分辨率，还能对它进行单独编辑或转成视频。

好好好，这下老板再也不用担心我的出图速度了（doge）

两张不同风格的图片，也能直接融合，比如水彩+水墨=？

Prompt：帮我混合一下这两张图。

秒哇！直接成名家画作了，既保留了第一张参考图里的瀑布、岩石等元素，也巧妙融入了第二张图的水墨意境。

色调达成了统一，以青绿色调为主，辅以黄色点缀，既有近景的写实瀑布也有远景的写意山峦，构成相当完整和谐的画面。

另外，其实Agent模式还有个隐藏大招：可以根据图片反推提示词。

比如说，我在即梦官方主页的推荐作品中找到了这张图，媲美Nano Banana的手办生成效果，让我好奇用了什么提示词。

Prompt：反推这张图的提示词。

钢铁侠精致手办模型，红色金色装甲配色，站立在现代木质办公桌上，背景电脑显示器展示3D建模软件界面，屏幕显示钢铁侠角色设计，左侧放置手办包装盒，温暖室内灯光，现实主义摄影风格，产品展示效果，3:4竖版构图，专业工作环境氛围。

学会了！修修改改，我也能用即梦AI生成新手办。（即梦内心os：这一次我势必要让所有人会写提示词）

Agent模式还能直接让效率Plus，一次指令同时能生成40张图片或8个视频。

还是咱们的小悦同学，直接给她安排一套全国深度游旅行照，朋友圈即梦包了。

Prompt：帮我生成吉卜力风格的全国旅游照，每张图片的主角都是一个叫小悦的女生，要和每个景点有深度互动，尤其是在上海东方明珠前要喝蜜雪冰城奶茶。

上海东方明珠、西安兵马俑、桂林漓江、成都熊猫基地、杭州西湖、青岛海滨……小悦的国庆七天乐实在太充实了！

而且在每张图中都有很好地遵循有关互动感的指令，色彩也很温暖明亮，符合吉卜力风格要求，尤其是第三张，小悦完全是千与千寻（桂林特辑）。

但是生图过程中也出现了一个小bug，在北京旅游时有生成失败的情况出现。

将小悦旅行照组成一整个vlog视频，也是轻轻松松～

Prompt：帮我把图片全部串成一个视频。

整个视频都很流畅自然，镜头拍摄手法相当丰富，包括推进、俯视转平视、拉近等，每张图也都会均匀停留4秒，图和图之间过渡巧妙。

另外还有更多玩法期待大家的解锁吼～

接入Seedream 4.0模型

Agent模式和同步推出的即梦4.0版本，都是基于字节最新自研的Seedream 4.0模型。

模型一经推出就强势拿下Artificial Analysis的文生图和图像编辑双榜第一，超越了谷歌的Nano Banana。

相比上一代，4.0模型在逻辑理解能力和推理速度方面上显著提升，将文生图、图编辑、组图生成功能组合于一体，不同元素彼此之间可以融合成一张完整的图片，还能生成连贯的图像序列。

另外它还支持4K分辨率，这一点Nano Banana都做不到。

所以Agent模式有了它的支持，基本上可以说将AI生图降至0门槛，不会写指令，它来教；指令太复杂，它只需要一句话。

妥妥的技术福音！

现在官网还推出了为期一周的免费生图活动，赶紧体验起来吧。

官网链接：https://jimeng.jianying.com/ai-tool/home?type=agentic

参考链接：
[1]https://bytedance.larkoffice.com/docx/Qriwdcz4Sob4arxcAX6cxUMznYb
[2]https://x.com/imxiaohu/status/1967551530032345096

文章来自于微信公众号 “量子位”，作者 “鹭羽”

作者头像

AI前线

专注人工智能前沿技术报道，深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了！视频分析功能将极大扩展AI的应用场景，特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度？我们正在开发一个实时视频分析应用，非常关注性能表现。

作者头像

AI前线作者

12小时前

我们测试的平均响应时间在300ms左右，比上一代快了很多，适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平，这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用！

文章章节

1. GPT-4简介与注册指南

1.1 账号注册步骤

推荐文章

速抢（2核2G）77元/年香港免备案服务器

速抢（2核2G）77元/年香港免备案服务器

0秒前 • AI热点

用户破8亿！GPT-5.1来了，表情包含量可自定义

用户破8亿！GPT-5.1来了，表情包含量可自定义

5月前 • AI热点

发布即开放：百度猎户座葫芦里卖的什么药？

发布即开放：百度猎户座葫芦里卖的什么药？

5月前 • AI热点

李飞飞的世界模型来了！一句话生成3D世界，AI 真的开始理解现实了

李飞飞的世界模型来了！一句话生成3D世界，AI 真的开始理解现实了

5月前 • AI热点

科技巨头「偷偷借钱」搞AI，次贷危机魅影重现？

科技巨头「偷偷借钱」搞AI，次贷危机魅影重现？

5月前 • AI热点

腾讯总裁剧透微信搭载智能体！阿里和谷歌也都开始互相伤害了

腾讯总裁剧透微信搭载智能体！阿里和谷歌也都开始互相伤害了

5月前 • AI热点

AIGC大模型能力提升10倍！安谋科技Arm China掏出最强NPU IP大招

AIGC大模型能力提升10倍！安谋科技Arm China掏出最强NPU IP大招

5月前 • AI热点

小鹏物理AI的尽头，是马斯克的现金流

小鹏物理AI的尽头，是马斯克的现金流

5月前 • AI热点

热门标签

MoonshotAI s 剪辑早期肺癌 Aizip PollenRobotics 发布会零代码开发框架 StableDiffusion安装

热门作者

作者头像

AI前沿

2.4k 粉丝

作者头像

机器学习实验室

1.8k 粉丝

作者头像

AI创业圈

3.1k 粉丝