AI热点 4小时前 166 阅读 0 评论

小白也能玩转AI视频!即梦Agent模式实测:一句话搞定插画、海报、Vlog

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

过去这样一个复杂指令,需要被拆分成找素材→AI生图→AI生视频多个步骤。


但现在从生图到生视频,再复杂的指令也只需一次输入就全搞定!


这就是即梦AI最新上线的Agent模式,只需要说出你的需求,它就能自动帮你写提示词,新上手的小白也能轻松玩转。


Nano banana更懂中文场景,文生图和图像编辑还比Nano banana强!



官方做出来的效果是酱紫的:


估计这时就有朋友问了,这个视频肯定制作过程很复杂吧?


NoNoNo!全程只用了一句话指令:创建12张像素风格图像并组合成视频。


又比如说可以直接批量生成一系列图像,构成完整故事。



批量生成视频也不在话下,还能直接串到一起,比如说这个人的一生:



甚至还可以直接迁移使用其他图片的风格、获取对方的提示词……


所以下面一起来康康我们的实测过程~


一手实测Agent模式


首先进入官网,点击输入框左下角的模式切换按钮,就能一键get到新上线的Agent模式。



桥豆麻袋,写提示词前,先告诉大家一个小tips


Agent现在还兼职AI小助手功能,用户可以直接询问它怎么写提示词,be like:


Prompt:请教教我如何写提示词?



好了,学会写提示词后,我们正式开始测评~


先来试试最新上线的智能多帧功能,据官方透露,Agent可以直接一口气生成多张连续图像,再自动连接首尾两帧,组成完整视频。


国庆假期将至,坐在我工位旁的小悦同学却天天在愁去哪里度假……那即梦酱先给她做份景点大全吧。


Prompt:做6张中国标志性景点的插画风图片,用智能多帧组成一份循环海报。


全程用了不到3分钟,标志性景点的插画视频就搞定了,外滩、泰山、九寨沟、张家界……应有尽有。


再看看画面美术风格呢,整体统一采用几何化风格和高饱和色彩,转场过渡也很自然。


最妙的是,它是真的很懂用户需求,原来的Prompt里并没有主动告知它要竖屏,只有关于海报的提示,结果它主动适配海报排版和移动端展示,自动生成了3:4比例的竖图,确实很贴心了。



另外悄悄告诉你,Prompt里点明用“智能多帧”,效果会更好嗷~


喜欢搞二创的劳斯们有福了,创意提升也是这次Agent模式的重点技术升级。看到喜欢的图片风格想用怎么办?Agent直接能帮忙生成类似的创意。


比如说,我想为蜜雪冰城的柠檬水打call,感觉这张化妆品广告的风格还挺适合,交给Agent模式试试。






wow!这波雪王高级感拉满。


仔细看,Agent模式生图全是细节:为了让视觉效果更纯净,也是把原图的塑料杯换成了玻璃材质;保留了可爱的Logo,但是去掉了冰淇淋权杖提升品牌档次。


一张不够,还可以生成一系列的同风格图片。


举个栗子,下面让它根据这张中秋节的海报,再多做几张让甲方挑选。



Prompt:帮我按照这张图的风格再生成四张带有“中秋佳节”字样的海报。



第一张图整体基调不变,只将字体样式改得更有阴影棱角;第二张图将楼阁改成暗色调,增加一些飘洒的花瓣特效,月饼也成了礼盒装;第三张图换成了墨绿色渐变背景,小兔子身上也加了点纹样点缀,让画面更丰富;第四张图的背景则改成了深蓝色的夜晚,月饼上还镀上了一层金属光泽,贵气!


另外,还能点击查看其中任何一张图的细节,包括对应的提示词、比例和分辨率,还能对它进行单独编辑或转成视频。



好好好,这下老板再也不用担心我的出图速度了(doge)


两张不同风格的图片,也能直接融合,比如水彩+水墨=?



Prompt:帮我混合一下这两张图。



秒哇!直接成名家画作了,既保留了第一张参考图里的瀑布、岩石等元素,也巧妙融入了第二张图的水墨意境。


色调达成了统一,以青绿色调为主,辅以黄色点缀,既有近景的写实瀑布也有远景的写意山峦,构成相当完整和谐的画面。


另外,其实Agent模式还有个隐藏大招:可以根据图片反推提示词


比如说,我在即梦官方主页的推荐作品中找到了这张图,媲美Nano Banana的手办生成效果,让我好奇用了什么提示词。



Prompt:反推这张图的提示词。



钢铁侠精致手办模型,红色金色装甲配色,站立在现代木质办公桌上,背景电脑显示器展示3D建模软件界面,屏幕显示钢铁侠角色设计,左侧放置手办包装盒,温暖室内灯光,现实主义摄影风格,产品展示效果,3:4竖版构图,专业工作环境氛围。


学会了!修修改改,我也能用即梦AI生成新手办。(即梦内心os:这一次我势必要让所有人会写提示词)


Agent模式还能直接让效率Plus,一次指令同时能生成40张图片或8个视频


还是咱们的小悦同学,直接给她安排一套全国深度游旅行照,朋友圈即梦包了。


Prompt:帮我生成吉卜力风格的全国旅游照,每张图片的主角都是一个叫小悦的女生,要和每个景点有深度互动,尤其是在上海东方明珠前要喝蜜雪冰城奶茶。



上海东方明珠、西安兵马俑、桂林漓江、成都熊猫基地、杭州西湖、青岛海滨……小悦的国庆七天乐实在太充实了!


而且在每张图中都有很好地遵循有关互动感的指令,色彩也很温暖明亮,符合吉卜力风格要求,尤其是第三张,小悦完全是千与千寻(桂林特辑)


但是生图过程中也出现了一个小bug,在北京旅游时有生成失败的情况出现。



将小悦旅行照组成一整个vlog视频,也是轻轻松松~


Prompt:帮我把图片全部串成一个视频。


整个视频都很流畅自然,镜头拍摄手法相当丰富,包括推进、俯视转平视、拉近等,每张图也都会均匀停留4秒,图和图之间过渡巧妙。


另外还有更多玩法期待大家的解锁吼~


接入Seedream 4.0模型


Agent模式和同步推出的即梦4.0版本,都是基于字节最新自研的Seedream 4.0模型


模型一经推出就强势拿下Artificial Analysis的文生图和图像编辑双榜第一,超越了谷歌的Nano Banana



相比上一代,4.0模型在逻辑理解能力和推理速度方面上显著提升,将文生图、图编辑、组图生成功能组合于一体,不同元素彼此之间可以融合成一张完整的图片,还能生成连贯的图像序列。


另外它还支持4K分辨率,这一点Nano Banana都做不到。


所以Agent模式有了它的支持,基本上可以说将AI生图降至0门槛,不会写指令,它来教;指令太复杂,它只需要一句话。


妥妥的技术福音!



现在官网还推出了为期一周的免费生图活动,赶紧体验起来吧。


官网链接:https://jimeng.jianying.com/ai-tool/home?type=agentic


参考链接:
[1]https://bytedance.larkoffice.com/docx/Qriwdcz4Sob4arxcAX6cxUMznYb
[2]https://x.com/imxiaohu/status/1967551530032345096


文章来自于微信公众号 “量子位”,作者 “鹭羽”

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!