超越Sora!阿里正式完全开源最新、最强大的视频生成模型 Wan2.1
阿里巴巴通义实验室开源最新视频生成模型Wan2.1系列,亮点包括复杂运动、物理模拟、电影质感等。Wan2.1-I2V-14B为图像到视频领域天花板;Wan2.1-T2V-14B支持中英文文字生成,性能卓越;Wan2.1-T2V-1.3B适合消费级显卡。模型采用3D因果VAE、特征缓存机制等技术。
阿里巴巴通义实验室开源最新视频生成模型Wan2.1系列,亮点包括复杂运动、物理模拟、电影质感等。Wan2.1-I2V-14B为图像到视频领域天花板;Wan2.1-T2V-14B支持中英文文字生成,性能卓越;Wan2.1-T2V-1.3B适合消费级显卡。模型采用3D因果VAE、特征缓存机制等技术。
吉利汽车集团与阶跃星辰联合宣布,将Step系列多模态大模型向全球开发者开源。包括参数量最大的视频生成模型和首款语音交互大模型。阶跃Step-Video-T2V可直接生成高质量视频,而阶跃Step-Audio是业内首个产品级的开源语音交互模型。
阶跃星辰发布30B参数视频生成模型Step-Video-T2V,支持中英双语输入及可变长度视频生成,提供标准版和加速版。采用DiT架构与3D全注意力机制,使用DPO技术优化质量,配置推荐使用步骤推理步数及cfg_scale值。
专注于AIGC领域的专业社区分享了Adobe发布的全新生成式AI应用Adobe Firefly。它支持图像、矢量图形及视频生成功能,并且首次推出处于公测试阶段的文生视频模型,实现了从文本提示到高质量1080p视频的转化。
字节跳动开源VideoWorld视频生成模型,无需语言模型即可学习时空动态规律,降低技术门槛,具有广泛应用前景。但存在抽象概念建模困难、算力需求高等挑战。