PaperWeekly
ICCV 2025 破解安防行为识别困局:从“找谁”到“在干嘛”,带来智能守护新可能
西安交通大学、合肥工业大学和澳门大学的研究团队提出了一种基于文本的行人异常检索技术,该技术能够在合成图像和真实世界测试图像上识别关键行为,如摔倒、被撞击等。
从“骨架拓展”到“时序建模”:上海AI Lab双项研究入选ICCV 2025,刷新数字人拟真天花板
向 |
神经渲染,3D数字人
ToMiE
与
S
eq
A
vatar
分别从空间结构与时序建模两个
ICCV 2025 视觉Token跳起来!上交大×蚂蚁联手推出多模态通用加速框架
近日,上海交通大学人工智能研究院晏轶超副教授联合蚂蚁集团的研究团队提出Skip-Vision框架,无需额外预训练或重新训练大模型,在SFT流程中插入即可加速视觉-语言模型。该框架通过跳过冗余视觉Token和使用Summary Token机制在保留理解能力的同时显著降低计算开销和延迟。
建议所有博士都去学一遍,真的赢麻了
文章介绍了科研过程中的方法和技巧,强调了实践的重要性超过单纯阅读文献。它推荐了一门由顶级学术会议主席讲授的系统课程,涵盖选题、实验设计等多个环节,帮助新手快速提升论文发表能力。