过去这样一个复杂指令,需要被拆分成找素材→AI生图→AI生视频多个步骤。
但现在从生图到生视频,再复杂的指令也只需一次输入就全搞定!
这就是即梦AI最新上线的Agent模式,只需要说出你的需求,它就能自动帮你写提示词,新上手的小白也能轻松玩转。
比Nano banana更懂中文场景,文生图和图像编辑还比Nano banana强!
官方做出来的效果是酱紫的:
估计这时就有朋友问了,这个视频肯定制作过程很复杂吧?
NoNoNo!全程只用了一句话指令:创建12张像素风格图像并组合成视频。
又比如说可以直接批量生成一系列图像,构成完整故事。
批量生成视频也不在话下,还能直接串到一起,比如说这个人的一生:
甚至还可以直接迁移使用其他图片的风格、获取对方的提示词……
所以下面一起来康康我们的实测过程~
一手实测Agent模式
首先进入官网,点击输入框左下角的模式切换按钮,就能一键get到新上线的Agent模式。
桥豆麻袋,写提示词前,先告诉大家一个小tips!
Agent现在还兼职AI小助手功能,用户可以直接询问它怎么写提示词,be like:
Prompt:请教教我如何写提示词?
好了,学会写提示词后,我们正式开始测评~
先来试试最新上线的智能多帧功能,据官方透露,Agent可以直接一口气生成多张连续图像,再自动连接首尾两帧,组成完整视频。
国庆假期将至,坐在我工位旁的小悦同学却天天在愁去哪里度假……那即梦酱先给她做份景点大全吧。
Prompt:做6张中国标志性景点的插画风图片,用智能多帧组成一份循环海报。
全程用了不到3分钟,标志性景点的插画视频就搞定了,外滩、泰山、九寨沟、张家界……应有尽有。
再看看画面美术风格呢,整体统一采用几何化风格和高饱和色彩,转场过渡也很自然。
最妙的是,它是真的很懂用户需求,原来的Prompt里并没有主动告知它要竖屏,只有关于海报的提示,结果它主动适配海报排版和移动端展示,自动生成了3:4比例的竖图,确实很贴心了。
另外悄悄告诉你,Prompt里点明用“智能多帧”,效果会更好嗷~
喜欢搞二创的劳斯们有福了,创意提升也是这次Agent模式的重点技术升级。看到喜欢的图片风格想用怎么办?Agent直接能帮忙生成类似的创意。
比如说,我想为蜜雪冰城的柠檬水打call,感觉这张化妆品广告的风格还挺适合,交给Agent模式试试。
wow!这波雪王高级感拉满。
仔细看,Agent模式生图全是细节:为了让视觉效果更纯净,也是把原图的塑料杯换成了玻璃材质;保留了可爱的Logo,但是去掉了冰淇淋权杖提升品牌档次。
一张不够,还可以生成一系列的同风格图片。
举个栗子,下面让它根据这张中秋节的海报,再多做几张让甲方挑选。
Prompt:帮我按照这张图的风格再生成四张带有“中秋佳节”字样的海报。
第一张图整体基调不变,只将字体样式改得更有阴影棱角;第二张图将楼阁改成暗色调,增加一些飘洒的花瓣特效,月饼也成了礼盒装;第三张图换成了墨绿色渐变背景,小兔子身上也加了点纹样点缀,让画面更丰富;第四张图的背景则改成了深蓝色的夜晚,月饼上还镀上了一层金属光泽,贵气!
另外,还能点击查看其中任何一张图的细节,包括对应的提示词、比例和分辨率,还能对它进行单独编辑或转成视频。
好好好,这下老板再也不用担心我的出图速度了(doge)
两张不同风格的图片,也能直接融合,比如水彩+水墨=?
Prompt:帮我混合一下这两张图。
秒哇!直接成名家画作了,既保留了第一张参考图里的瀑布、岩石等元素,也巧妙融入了第二张图的水墨意境。
色调达成了统一,以青绿色调为主,辅以黄色点缀,既有近景的写实瀑布也有远景的写意山峦,构成相当完整和谐的画面。
另外,其实Agent模式还有个隐藏大招:可以根据图片反推提示词。
比如说,我在即梦官方主页的推荐作品中找到了这张图,媲美Nano Banana的手办生成效果,让我好奇用了什么提示词。
Prompt:反推这张图的提示词。
钢铁侠精致手办模型,红色金色装甲配色,站立在现代木质办公桌上,背景电脑显示器展示3D建模软件界面,屏幕显示钢铁侠角色设计,左侧放置手办包装盒,温暖室内灯光,现实主义摄影风格,产品展示效果,3:4竖版构图,专业工作环境氛围。
学会了!修修改改,我也能用即梦AI生成新手办。(即梦内心os:这一次我势必要让所有人会写提示词)
Agent模式还能直接让效率Plus,一次指令同时能生成40张图片或8个视频。
还是咱们的小悦同学,直接给她安排一套全国深度游旅行照,朋友圈即梦包了。
Prompt:帮我生成吉卜力风格的全国旅游照,每张图片的主角都是一个叫小悦的女生,要和每个景点有深度互动,尤其是在上海东方明珠前要喝蜜雪冰城奶茶。
上海东方明珠、西安兵马俑、桂林漓江、成都熊猫基地、杭州西湖、青岛海滨……小悦的国庆七天乐实在太充实了!
而且在每张图中都有很好地遵循有关互动感的指令,色彩也很温暖明亮,符合吉卜力风格要求,尤其是第三张,小悦完全是千与千寻(桂林特辑)。
但是生图过程中也出现了一个小bug,在北京旅游时有生成失败的情况出现。
将小悦旅行照组成一整个vlog视频,也是轻轻松松~
Prompt:帮我把图片全部串成一个视频。
整个视频都很流畅自然,镜头拍摄手法相当丰富,包括推进、俯视转平视、拉近等,每张图也都会均匀停留4秒,图和图之间过渡巧妙。
另外还有更多玩法期待大家的解锁吼~
接入Seedream 4.0模型
Agent模式和同步推出的即梦4.0版本,都是基于字节最新自研的Seedream 4.0模型。
模型一经推出就强势拿下Artificial Analysis的文生图和图像编辑双榜第一,超越了谷歌的Nano Banana。
相比上一代,4.0模型在逻辑理解能力和推理速度方面上显著提升,将文生图、图编辑、组图生成功能组合于一体,不同元素彼此之间可以融合成一张完整的图片,还能生成连贯的图像序列。
另外它还支持4K分辨率,这一点Nano Banana都做不到。
所以Agent模式有了它的支持,基本上可以说将AI生图降至0门槛,不会写指令,它来教;指令太复杂,它只需要一句话。
妥妥的技术福音!
现在官网还推出了为期一周的免费生图活动,赶紧体验起来吧。
官网链接:https://jimeng.jianying.com/ai-tool/home?type=agentic
参考链接:
[1]https://bytedance.larkoffice.com/docx/Qriwdcz4Sob4arxcAX6cxUMznYb
[2]https://x.com/imxiaohu/status/1967551530032345096
文章来自于微信公众号 “量子位”,作者 “鹭羽”