世界首个「实时、无限」扩散视频生成模型,Karpathy投资站台

Decart 发布了世界上首个实时的、无时长限制且支持任意视频流的扩散视频模型 MirageLSD,能够在40毫秒延迟内将任何输入转化为目标世界。该技术突破为AI视频生成领域带来革命性变化,如实时电影制作、游戏开发、风格迁移等新应用。

演讲生成黑科技,PresentAgent从文本到演讲视频

本项目提出 PresentAgent 系统,能够将长篇文档转化为带解说的演示视频。PresentAgent 通过模块化流程实现视觉和语音同步生成,并引入 PresentEval 评估框架全面考量内容、视觉与理解质量。