一键批量出图,人物一致性逆天,豆包文生图新功能炸了

头图均由豆包生成

作者 | 石濑
编辑 | 张洁


豆包已经好用成这样了?


今天看到不少AI同行在热聊豆包刚刚发布的CreationAgent v1.0 Beta(目前尚在灰测),颇多好评,我们也试了试这些新能力。


登录豆包出现“智能升级”或“超能创意1.0”

即账号被灰测到


不得不说豆包真的是很出息了,功能运营上也做得相当细致,就拿这份官方使用指南来说,一个文档从产品能力介绍、优质案例、不同场景下的使用指南,乃至当前存在的不足都总结得清清楚楚(附官方指南:https://bytedance.larkoffice.com/docx/OWpHdkNoYoBjHVxntQPcZa5Qndb),不愧是豆包。


简单来说,豆包这次主要有这几点能力升级:


1.可以一口气免费输出最多20张差异化图像


2.意图理解能力提升,不需要复杂提示词就能听懂“人话”


3.多图一致性。涉及多图生成的创作场景中,如批量生成AI绘本、视频分镜头脚本等,不仅可以保持风格色调一致性,还能保持(基本的)人物一致性


4.能够精准呈现复杂故事场景、人物神态和氛围细节,甚至会“猜你所想”添加画面细节


5.图像二次编辑,豆包已经能理解大部分修改场景,但也存在部分案例还需要人工辅助


为了防止被官方Demo画饼,我们也跑了几十个案例发现,豆包已经可以一口气出完20张图片,还能保持风格一致性。


在人物一致性上更是直接“掀桌”,以往AI视频“文生图-图生视频工作流”制作门槛无疑大大降低。


不夸张地说,对广大的UGC用户群体来说,不仅用嘴作图的可玩性更高了,进行AI绘本、AI视频等热门AI内容创作也开启了一扇新的大门。


以下是我们跑的几个好玩的实测案例:


01.一句提示词,批量生成同一风格但细节不同的图片


提示词:请生成10张国内著名景区的五一旅游海报,每张图都要出现一个地标性建筑,海报上写上匹配的文案,画面风格统一为动画电影,图片尺寸为3:4



提示词:请生成10张描述不同情绪的表情包,每张图都用猫猫头像来展示,画面风格统一为简笔画,图片尺寸为1:1



提示词:生成20张猫猫简笔画,每张有不同的打工情绪,给它们都配上对应的英语情绪单词,可支持上架到微信表情包使用



02.人物一致性超强,还支持多轮对话和豆包一起创作短剧分镜头


AI绘本、视频分镜头脚本等对人物风格一致性要求很高的多图画面,以往需要在Midjourney等AI生图工具里,一张一张图片生成,调试提示词,如今升级后的豆包一键就可以完成了。


把我们之前制作过的圣诞视频分镜头脚本发给了豆包,主角小女孩的外表形象都保持一致,这点相当逆天(做过文生图-图生视频工作流的朋友们都懂)。




还可以和豆包一起创作短剧,一边写脚本一边出图,也是和AI灵感共创上了。






从母女温馨共处的画面,到父亲归家、母亲怒扇他耳光的短剧常见戏剧性场面,豆包不仅精准还原了场景,还自己加戏让小女孩“一脸惊讶”,实际提示词中并没有这个要求。


不过,这个“戏”倒也完美契合现场氛围。



03.图像理解与二次编辑


AI生成的图片效果不好,也可以用嘴改图。


如删掉海报里多余的字:



不过,实测中我们也发现一些豆包的“弱点”。例如,让豆包把“gogogo出发咯”的邓超梗图改成豆包的3D形象,结果生成的图片仍然是邓超,不过是“女装大佬版邓超”。


破案了,原来豆包对自己的认知是女装版邓超(不是)。



此外,官方Bad Case里也有提到,部分图片编辑需求(如扩图、高清、重绘)无法通过对话实现,也无法基于原图编辑文字。


对话过长或需求复杂,如为英语单词添加音标细节,图片也会崩掉。



大家都玩上豆包新功能了吗?欢迎在评论区留言分享好玩案例(或者离谱案例),给没用上的朋友开开眼👀





(文:AI新榜)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往