AI界出了又会画画还能修图的大象,把Flux们都打败了

我又发现好东西了!

前几天在 Artificial Analysis 上发现了一个新模型:

17B 参数的国产模型 HiDream-I1

排到第二名,和 GPT-4o 得分非常接近!

而且还是开源的!

目前可以在 Hugging Face 上体验:

🔗 huggingface.co/HiDream-ai/HiDream-I1-Full

也可以直接在网站上使用:

🔗 vivago.ai/studio

我一个鲤鱼打挺,马上起来跑了一组测试图,效果确实是不错啊。

而且这个 HiDream-I1 在人类偏好分数HPSv2.1上,多种风格(如动漫、概念艺术、绘画和真实摄影)都达到了最优性能,超过了FLUX。

同时还开源了GPT-4o同款的对话式图片编辑模型: 

HiDream-E1,

那我干脆直接来个 HiDream-I1 VS Flux.1-dev

和 HiDream-E1 的实测体验,

一起来直观感受这两个新模型的能力吧!


 一、写实 

如果说要和 FLUX 对比,第一个比的肯定是写实。FLUX 开源后,创作者们使用它做出最出彩的风格就是写实。

我们用同样的提示语,先来两组人像对比:

提示语:一幅电影风格的特写肖像,描绘了一位凶猛的女战士,在闪烁的琥珀色火炬的照耀下,她伤痕累累的颧骨在戏剧性的阴影中闪耀,更衬托出她那双锐利的蓝宝石色眼睛。浅焦距勾勒出她锁子甲兜帽后模糊的中世纪战场景象,缕缕烟雾缭绕着她夹杂着灰烬的银色辫发。这幅作品采用颗粒感十足的35毫米胶片拍摄,并采用蓝绿色和橙色的调色系统,构图采用居中荷兰角,冷冽的气息清晰可见地从她咆哮的嘴唇中喷涌而出,鲜血在苍白的月光下飞溅,冻结在她阔剑边缘附近的半空中。
提示语:一张自然的快照,记录了一位现代女性在阳光普照的工业风咖啡馆里啜饮一杯抹茶拿铁,蒸汽从她手中升起,形成精致的漩涡,并以超现实的纹理捕捉。浅景深将周围裸露的砖墙融入赭石色和鼠尾草绿色的绘画晕染中,晨光则照亮了她玳瑁色眼镜周围飘散的细发。她厚实的针织开衫的羊毛纤维在大理石台面的映衬下展现出细致入微的细节,手机的微弱反光在抛光的台面上模糊不清。整个构图呈现出微妙的相机倾斜运动模糊和柯达Portra胶片奶油般的肤色,宝丽来风格的白色边框框住了这亲密的时刻。

第一组面部特写中人物皮肤的肌理和光影、第二组图片的氛围感营造以及画面颜色质感,我都更喜欢 HiDream-I1 的效果,更贴近真实,整个画面的构图和审美也都更好。

再来看一组动物图片的对比:

提示语:超微距 85 毫米肖像,一只香槟色毛茸茸的柯基犬,天鹅绒质地的耳朵,晨露附着在每根睫毛上,折射出棱柱形的光图案。浅 f/1.2 焦距将阳光照射下的草地溶解成形状像狗饼干的散景球,而前景胡须则露出漂浮中途悬浮的花粉粒。

那动物和风景结合之后的表现又会如何呢:

提示语:一群雄伟的斑马在黄金时段涉过急流,水平条纹因紧张而起伏,肩部肌肉像活生生的地形一样起伏,浸没的腿搅动着河床淤泥,在梵高般的湍流中旋转,从远处、戏剧性的视角捕捉到。

这两组图,不管是对动物毛发还是背景环境的展示,我还是觉得 HiDream-I1 更好。而且对比提示语,会发现 HiDream-I1 对于提示语中提到的一些光影和细节的指令执行力更高。

这一轮,真实感和画面细腻度上 HiDream-I1 更胜一筹。


 二、风格化 

评价一个模型的综合能力,自然也要看其他风格的效果表现,我们就拿三种常用三种风格来考考它们。

首先来两组3D动画风格对比:

提示语:立体照明照亮了一位拥有液体动画蓝宝石眼睛的迪斯尼风格 3D 公主,她的玫瑰石英礼服的丝绸层在同步的物理模拟中飘动,草莓金色的发丝对晨风做出单独反应。Prince 轮廓分明的下巴透过枫叶皇冠捕捉到金色的边缘照明,他的祖母绿刺绣天鹅绒斗篷在玫瑰花缠绕的腿上旋转着动感的布料模拟。迷人的花园背景以超详细的百日菊花为特色,带有可见的花粉痕迹,生物发光的萤火虫围绕着这对夫妇紧握的双手形成心形星座。
提示语:皮克斯动画风格,一张温馨的家庭照,三位父母和他们的两个儿子以及一只可爱的金毛猎犬,在阳光明媚的日子里,在郁郁葱葱、生机勃勃的后院拍摄,以房子为背景,散发着温暖和幸福。

第一组我觉得两者的效果都还不错,光影和人物的形态都很对味,但是第二组 HiDream-I1 的画面丰富度和细节处明显更好,人物更成熟一点,Flux 人物有点偏Q版卡通了。

再换一组日式动漫风格看看效果:

提示语:少年主角热血沸腾的战斗姿态,日式赛璐珞动画风格,高清4K画质。主角为16岁黑发少年,身穿红白相间的破损战斗服,眼神坚毅闪耀金色光芒。背景为崩裂的悬浮岛屿群,空中漂浮着蓝色灵焰。右臂缠绕着螺旋状能量波纹,左手握持布满裂痕的武士刀,刀身迸发青紫色雷电。脚下碎石呈冲击波状飞散,背后展开半透明的龙翼虚影。仰视视角,强烈动态透视,配合樱花与闪电交织的天气特效,色彩采用高饱和度的红蓝对比,边缘光效呈现经典动画赛璐珞光泽。

经典动漫风格,HiDream-I1 的画面冲击力更强,画面元素也丰富,尤其是手部,Flux又经典崩盘。

最后再来看一组水墨:

提示语:水墨画,一只优雅的鹤栖息在岩石上,背景是远处云雾缭绕的山脉和连绵起伏的丘陵,画布左侧故意留白,以营造简约的风格。

从整体上看,HiDream-I1 对于多种风格的掌握会更好,各种风格的表现能力比较平均,而 FLUX 对于画面的氛围感、画面的细节以及审美都会稍微逊色一点。


 三、细节 

最后一趴,我们重点关注画面的细节部分。

从前的从前,AI生图时常被人拿出来念的就是细节处照顾不到位,不够真实。时至今日,这点也是被大家拿出来判断一张图是不是AI生成的标准。

那这次我们先做一组尽可能展现客观世界的图片,看看距离真实有多远:

提示语:一张极其平庸的 街头照片,没有清晰的主体和取景——只是一张漫不经心的快照。照片略带动态模糊,由于阳光不均匀略微过曝。角度尴尬,构图拙劣,整体效果平庸至极——就像是从口袋里掏出手机自拍时不小心拍到的一样。

玩了一个最近很火的模拟真实的效果,这个随手拍的虚焦 HiDream-I1 表现的异常好,有点我走在国外街头被太阳闪到拍出来迷幻照片的感觉了。

再来重要关注画面的光影部分:

提示语:阳光明媚的工作室展示了精湛的明暗对比——晨光透过含铅玻璃窗倾泻而下,裂成琥珀色棱镜,照亮了像液态水银一样层叠而下的漂浮丝绸窗帘。青瓷花瓶的裂纹釉料捕捉了悬挂的水晶钟摆上断裂的彩虹,其曲面反射着下方黑漆盆中波纹的水纹。天鹅绒阴影在明式红木家具下汇集,光线穿透雕刻的云朵图案,通过分层透明效果揭示木纹纹理。漫射高光追踪了青铜香炉上方漂浮的茉莉花瓣的轨迹,青铜香炉发出螺旋状的熏香烟雾,在体积竖井中捕捉阳光。每个表面都颂扬物质性——失去光泽的银线刺绣在生丝 charmeuse 上闪闪发光,而古铜色的铜碗在展示宋代陶瓷碎片的手工摩擦雪松架上投下折射光环。

这画面质感,HiDream-I1 直接碾压了,阳光、桌面细节、花朵,全方位的漂亮,而且图片质量非常高。

最后我们来两组组特写镜头,观察它们对于常规很难表现的部分是否也能够稳定不崩坏:

提示语:超高分辨率的生物发光虹膜宏图,全息城市景观倒影——霓虹灯照亮的摩天大楼在瞳孔空隙中压缩成弯曲的无限空间,玻璃幕墙因角膜非球面性而扭曲。量子点图案在角膜缘环上闪烁,微型无人机在血管峡谷中穿行,投射出色差轨迹。液晶台面从领圈中升起,折射的激光网格投影切割着玻璃体。轨道LED植入物创造出时间光画,纳米粒子星座在精确的引力晶格中围绕瞳孔运行。
提示语:一双手托着浅绿色液态水,午后的阳光透过水滴折射,凸透镜般的光影放大了皱纹。薄如纸的皮肤下,青绿色的血管跳动着,在布满老茧的指关节上投下阴影,水流如同生命线。

对比提示语来看,HiDream-I1 对于细节的表达会更加到位,尤其手部,FLUX 又出问题了,细看手指没有区分好,HiDream-I1 就稳定很多。

这一大波效果测试下来,相信大家心里对于新起之秀 HiDream-I1 的能力都有了解。效果比我想象之中好很多,而且对于多种风格的表达都很不错,是个全能选手。

从评分上也佐证了,HiDream-I1 的提示语遵循能力、中英文文字渲染能力、商业广告图像制作能力、以及UI/UX design等等方面,都排名前茅。



 HiDream-E1 

与此同时,开源的还有对话式图片编辑模型 HiDream-E1。

目前可以直接使用:

我玩了一下午,体验还不错,提示语的识别能力不错,风格化很多,会根据我们提出的需求自动丰富修改提示语,然后生成更准确的效果,比如下面几个效果,

旅行动画风格转换:

旅行动画拍立得:

宠物Q版形象制作:

阶跃的研发负责人前几天也提到了 HiDream-E1 参数规模很大,一定程度上来说,参数规模大也可以意味着能跑出的效果范围更广泛,能玩的东西更多,智象现在确实可以跻身生图模型的第一梯队了。


 写在最后 

我们都知道 FLUX 曾经在AI生图界掀起了巨大的风浪,

就是因为它开源。

越来越多的人用FLUX训练出各式各样的LoRA,

完成了数不胜数的创意。

那我完全可以预想,

在 HiDream-I1 开源后的不久,

AI图片质量与创意将会更上一个台阶。

更别说,再加上同时开的源对话式图像编辑 HiDream-E1 ,

这会衍生出多少种玩法。

还等什么,

玩起来吧!


@ 作者 / 卡尔 & 阿汤@ 动手学AI知识库 / learnprompt.pro


(文:卡尔的AI沃茨)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往