Midjourney 推出其首个图生视频模型 V1:延续美学风格,目标是构建「世界模型」

内容转载自AI寒武纪

今天凌晨,Midjourney推出视频生成模型V1,主打高性价比、易于上手的视频生成功能,作为其实现“实时模拟世界”愿景的第一步。用户现在可以通过动画化Midjourney图片或自己的图片来创作短视频,定位为有趣、易用、美观且价格亲民。

Midjourney一如既往,视频模型在美学细节上下了一番功夫,官方宣传视频:



超 7000 人的「AI 产品市集」社群!不错过每一款有价值的 AI 应用。

邀请从业者、开发人员和创业者,飞书扫码加群: 
进群后,你有机会得到:
  • 最新、最值得关注的 AI 新品资讯; 

  • 不定期赠送热门新品的邀请码、会员码;

  • 最精准的AI产品曝光渠道



01 

图生视频,

支持手动和自动两种模式

核心流程:采用“图像转视频” (Image-to-Video) 的工作方式。用户先生成一张满意的图片,然后点击新增的 “Animate” 按钮来使其动画化。

支持外部图片:用户可以上传自己的图片,然后通过输入运动提示词来生成视频。

两种动画模式

自动模式 (Automatic):AI 会自动为你生成“运动提示”,简单快捷

手动模式 (Manual):用户可以自己写提示词,精确描述希望物体和场景如何运动

两种运动幅度设置

  • 低运动 (Low motion):适合相机基本不动、主体缓慢运动的场景(如氛围图),但有时可能完全不动。

  • 高运动 (High motion):适合相机和主体都大幅度运动的场景,效果更动态,但更容易出错

视频扩展:生成的视频可以被“扩展”,每次延长约4秒,最多可延长四次,目前视频分辨率为480p。


02 

每月10美元即可使用

入门价格每月10美元即可使用。

可用平台发布初期仅限网页版 (web-only)

任务成本

  • 一个视频任务的成本约等于8个图像任务

  • 每个视频任务会生成四个5秒钟的视频

  • 一个视频的成本大致相当于一次图像放大 (upscale)的成本,即每秒视频约等于一张图的成本

市场优势官方称其价格比市场同类产品便宜超过25倍

Pro 用户福利“Pro”及更高级别的订阅者将可以测试视频的“放松模式” (relax mode:无限量生成,速度较慢)

价格调整未来一个月会根据用户使用情况和服务器负载,对价格进行调整以确保业务可持续


03 

视频模型只是第一步,

目标是构建「世界模型」

最终目标:实现能够实时交互的开放世界模拟系统 (real-time open-world simulations),视频模型是实现该愿景的关键一步。未来将继续独立开发3D模型、实时渲染模型等模块,并最终将它们整合成一个统一系统。


(文:Founder Park)

发表评论