中国霸榜视频大模型!海螺02深夜发布,性能超谷歌Veo3,指令遵循绝了

“大模型六小虎”之一MiniMax第二弹更新来了。
作者 |  程茜
编辑 |  心缘

智东西6月18日报道,今日凌晨,“大模型六小虎”之一MiniMax第二弹更新来了,AI视频生成工具海螺AI更新,现可创建10秒1080P视频。


MiniMax放出的视频案例中,展现了喷火、钻火圈、连续后空翻、高空走钢丝等超高难度杂技动作。


具体来看,海螺02可以实现逼真物理效果、精确物体交互、流体动力学和自然的运动模式,甚至能复刻杂技表演。

在专业级视频制作方面,其可以保证视觉保真度、灯光和构图,同时利用面部识别和身体跟踪技术在整个视频序列中保持一致的角色身份和外观,通过帧精度控制细微的面部表情到复杂的编排序列。

其还能根据中文、英语等多种语言的文本提示生成视频,并配有适合当地文化的视觉解释,且10s视频内容只需要一次生成。


在Artificial Analysis Video Arena Leaderboard最新排名中,在图像生视频栏目下,海螺02排名第2,仅次于字节跳动Seedance 1.0 pro,排名超过了谷歌Veo 3 Preview、快手可灵2.0等。


值得注意的是,这一榜单的前五名中,四名都是国内模型厂商,包括字节跳动、MiniMax、快手。



海螺02已经上线网页端、App端。



网页端体验地址:https://t.co/hejXJFK95v

话不多说,上效果。

下面的10s视频中,其通过单一生成就可实现包含怪物和人物的远景、怪物移动、到最后的近景的完整视频。
海螺02生成的以人物为主体的视频中,颇具大片感,首先跟随男主背影、突出人物,并结合了慢动作、景深等突出主人公。
下面视频有骑马的人和一只狗,可以看到,人物骑着马走出雪地,狗在后面跟上的过程,几个角色都没有出现变形。
人物刻画是视频生成的一大难关,尤其是人在大笑或者需要呈现面部细微变化的时候,下面视频中人物紧急摆头、大笑、伴随身体活动做表情时,都没有出现失真的情况。
游泳这类需要综合考虑四肢、面部表情的视频,生成效果也十分自然逼真。
昨天,MiniMax发布全球首个开源大规模混合架构的推理模型MiniMax-M1,今日又甩出视频生成工具重磅更新,不禁对其接下来三天的更新充满期待。 

(文:智东西)

发表评论