实测!Vidu Q1斩获VBench双榜第一,还打起价格战,每秒仅需3毛

编辑 杨文、刘欣

AI 视频圈从不缺「神仙打架」。

上周,快手可灵刚发布了 2.0 模型,号称是史上最强视觉模型;昨天,生数科技就上线了全新视频模型 Vidu Q1。

它不仅能直出 1080P 电影级高清视频:

还能通过首尾帧功能实现大师级运镜:

同时动画生成效果也再上一个 level:

据视频生成模型权威测评基准 VBench-1.0 以及 VBench-2.0 刚刚发布的测评结果,Vidu Q1 在 VBench 系列的两个榜单上都超越了 Runway 、OpenAI Sora、快手的 Kling 等国内外顶尖模型,拿下文生视频赛道榜单双第一。

此外在国内权威大模型测评机构 SuperCLUE 的图生视频榜中,Vidu Q1 也在动漫风格、写实风格上斩获双榜单第一的成绩。

目前 Vidu Q1 已全球同步上线,无需邀请码,打开 App 和网页即可体验,而且每秒生成价格最低仅需 0.3 元。

链接直达:https://www.vidu.cn/

Vidu Q1 实力到底如何,我们直接上手实测一波。


-1-

高清画质、电影质感

此次发布的 Vidu Q1,在文生视频和图生视频上均支持 1080P 高分辨率,无论是宏大的科幻叙事还是人物特写的细微表情,都可以清晰呈现。

提示词:富士胶片 Portra 400H 静态照片,急驰的日产天际线 R33 GTR LM JGTC,大幅度运动效果,东京 7-11 便利店,午夜时分。

午夜的街道、跑车的极速漂移都生成得相当逼真,即使是大幅度运动画面也没崩。

提示词:一位冲浪者在波涛汹涌的大海中驾驭巨浪,阳光透过浪花洒在冲浪者的身上,水花四溅,展现出勇敢和挑战自我的精神。

Vidu Q1 精准地模拟了波浪起伏,男子冲浪时的快速移动也很丝滑,没有任何卡顿或模糊。

提示词:一位街头小提琴手在雪花飘落的宁静欧洲广场上演奏,雪花落在她的发间,身后是烛光映照的窗户。

Vidu Q1 严格遵循了文本描述,「雪花飘落」、「烛光映照的窗户」等细节它都生成得很到位,而且女生拉小提琴时手指动作流畅自然,完全没有出现缺失或多余的手指问题。


-2-

动画风格

一直以来,Vidu 最让人称道的就是动画效果。

不管是类似新海诚,宫崎骏,大友克洋风格的日本动画,还是类似迪斯尼、皮克斯、彼得·道格特风格的美国动画,Vidu 都能稳定输出。

而这次上线的 Q1,相比于前一版本又有了大幅提升,支持更加多元风格的视频输出。

提示词:动漫风格,一个男孩在乡村小径上骑自行车,两旁是野花与高大的树木,远处可见有着木质房屋的小村庄,阳光明媚,氛围宁静而欢快。


提示词:一个充满魔法气息的森林,地上开满了会发光的奇异花朵,天空中飘着彩色的泡泡。一位穿着精灵服装的少女站在画面中央,她有着大大的眼睛和尖尖的耳朵,正好奇地伸手,周围的一切都显得梦幻而神秘。



提示词:一只可爱的松鼠从树洞里掏出松果,想吃掉松果。



X 网友 Naegiko 使用 Vidu Q1 制作了一则集合多种风格的短片,效果相当惊艳,尤其是对动漫人物面部表情的处理,甚是灵动。


https://x.com/naegiko/status/1914424072341217788


-3-

大师级运镜

这次 Vidu Q1 的首尾帧功能也再次升级,仅需两张图,不仅能生成推拉摇移等各种镜头,还能自动脑补出电影质感的完整片段。

比如我们上传这两张图,分别作为首帧和尾帧:

连提示词都不用写, Q1 直接让马斯克变身钢铁侠,效果相当酷炫。

再比如下面这个例子,同样上传首尾帧,无需提示词,宇航员身上就长出了五颜六色的花朵。


此外,Q1 还能生成一系列高运动镜头。提示词只简单要求推进镜头,Q1 就能在镜头不断推进的过程中,让主角转个身逐渐露出侧脸。


下面这个视频也是如此。首帧是一张海边悬崖的图片,尾帧是一张轮船在海上航行的图片,然后 Q1 自动生成右移镜头,将两幅图片丝滑衔接在一起。



-4-

告别无声电影

Q1 模型发布同时,Vidu 还推出了文生音效模型。只需一句话,即可生成最长 10 秒的专属音效。

这也意味着,Vidu 打通了视频创作的整个工作流,从视频生成到音效生成,一个平台就能搞定。

具体来说,该模型有三大技术创新亮点。

首先,用户可以精准控制生成音效的时间,音效可以在 10 秒内的任意时间点开始生成。这也是目前为止业内商业领域首个支持精细化时间控制的文生音效系统。

比如 0s-4s 海浪拍打礁石、4s-6s: 轮船鸣笛:

其次,Vidu 的文生音效功能还支持多段音效叠加,并以一个完整的音频文件输出。例如,下面的示例中,通过多段音效的叠加,成功还原了火车经过的真实感。

或者是人声鼎沸的热闹集市:

最后,相比于业内普遍只能生成 16KHz 或者 32KHz,Vidu 的音效已经可以做到 48KHz 的音乐级采样率和保真度,这也是文生音效在商业化领域中首家做到 48KHz 的高保真音效。

我们还可以用 Vidu 的文生音效功能探索更多玩法,比如生成一段摇滚乐:

总体来说,Vidu Q1 的优势不仅在于高清画质和稳定的视频表现,还在于为创作者提供了一套完整的视频创作解决方案。从 1080P 高清视频生成、多风格动画渲染、专业级运镜,再到全新的文生音效功能,Vidu 几乎覆盖了视频创作的全部环节。

同时,每秒生成成本低至 0.3 元的定价策略,仅为同行的十分之一,这也为个人创作者和中小企业提供了更经济实惠的选择。

大家快去 Vidu 网站和 Vidu 手机端体验一波吧。

© THE END 
转载请联系本公众号获得授权
投稿或寻求报道:liyazhou@jiqizhixin.com

(文:AI好好用)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往