ICCV 2025 破解安防行为识别困局:从“找谁”到“在干嘛”,带来智能守护新可能

西安交通大学、合肥工业大学和澳门大学的研究团队提出了一种基于文本的行人异常检索技术,该技术能够在合成图像和真实世界测试图像上识别关键行为,如摔倒、被撞击等。

ICCV 2025 视觉Token跳起来!上交大×蚂蚁联手推出多模态通用加速框架

近日,上海交通大学人工智能研究院晏轶超副教授联合蚂蚁集团的研究团队提出Skip-Vision框架,无需额外预训练或重新训练大模型,在SFT流程中插入即可加速视觉-语言模型。该框架通过跳过冗余视觉Token和使用Summary Token机制在保留理解能力的同时显著降低计算开销和延迟。