PaperWeekly
ACM MM 2025 轨迹可控、主体更稳!阿里Tora2定义下一代视频生成范式
视频生成技术在快速发展中,从早期的低质量片段发展到现在的高清数分钟视频。阿里云团队提出的新算法Tora2通过融合多主体参考图像与运动轨迹指令实现外观一致性与轨迹控制。
ICML 2025 CostFilter-AD首提“匹配代价滤波”范式,无监督异常检测指标全面刷新
萨里大学合作完成,通讯作者为吴高昌副教授(东北大学)与朱霞天副教授(萨里大学)。
论文标题:
Cos
一张图,穿梭任何场景!AniCrafter开源登场,让角色动画真正做到“无缝生成”
AniCrafter 通过引入3DGS Avatar + 背景视频作为条件控制视频扩散模型,实现任意角色在任意场景下的动画化任务。项目和代码链接已提供。
ICCV 2025 破解安防行为识别困局:从“找谁”到“在干嘛”,带来智能守护新可能
西安交通大学、合肥工业大学和澳门大学的研究团队提出了一种基于文本的行人异常检索技术,该技术能够在合成图像和真实世界测试图像上识别关键行为,如摔倒、被撞击等。