视频生成模型归档 - 第2页共4页

社区供稿 | Index-AniSora 技术升级开源: 动漫视频生成强化学习

2025年5月21日14时作者 Hugging Face

ber、动画 PV、鬼畜动画等多种二次元风格视频镜头一键生成！
整个工作技术原理基于 B 站提出的

SIGGRAPH 2025 快手可灵团队提出3D感知的可控电影级视频生成工作CineMaster！

2025年5月11日16时作者机器之心

近期，可灵研究团队推出的CineMaster电影级文本到视频生成框架允许用户通过3D感知控制目标和相机运动来创作高质量视频内容。该方法在SIGGRAPH 2025会议中被收录，并展示了从任意视频中提取3D控制信号的数据构建流程。

转身世界就变样？WorldMem用记忆让AI生成的世界拥有了一致性

2025年5月11日16时作者机器之心

本文介绍了一种名为WorldMem的世界生成模型，通过引入记忆机制解决了上下文时间窗口受限导致的一致性问题，在Minecraft数据集上进行验证并展示良好效果。

Lightricks 发布了他们的开源视频生成模型 LTXV -Video-13B

2025年5月8日8时作者 NLP工程化

Lightricks 发布开源视频生成模型 LTXV-Video-13B，支持多尺度渲染、高级控制等特性，可完全商业使用。

速递｜8秒视频只是起点，谷歌Veo 2携8秒720P视频登陆Gemini，硬刚OpenAI Sora

2025年4月16日16时作者 Z Potentials

谷歌即将在其Gemini平台上推出新的Veo 2视频生成AI模型，该模型目前仅限于订阅Gemini Advanced的付费用户使用。Gemini Advanced用户可创建720p分辨率8秒的16:9宽高比视频，并通过Gemini的分享按钮上传至TikTok、YouTube等平台。

谷歌最先进的视频生成模型Veo 2，使用自然语言查询终端命令，将多种Agent框架转换为MCP服务器工具

2025年4月16日11时作者每日AI新工具

谷歌最先进的视频生成模型Veo 2能将文本、图像或两者结合转化为八秒的视频，它擅长理解简单和复杂指令，并准确模拟现实世界的物理规律。开发者可以通过Google AI Studio、Gemini API等平台使用Veo 2的核心功能包括文本到视频和图像到视频。同时介绍Python工具Zev用于自然语言查询终端命令、VS Code扩展RooFlow增强AI辅助开发、实时会议转录APIVexa支持多种平台并提供企业级安全保障的工具automcp。

一家高校实验室，走出12家明星AI初创公司！Pieter Abbeel：我的NB学生们

2025年3月14日12时作者机器之心

大牛、UC 伯克利教授 Pieter Abbeel 浅浅统计了一番：我带过的学生里，也就 12 个吧

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31