ICCV2025破解安防行为识别困局:从“找谁”到“在干嘛”,带来智能守护新可能

MLNLP社区发布ICCV 2025论文《Beyond Walking》:提出大规模图像-文本行人异常检索基准集,融合AI生成图像、大模型描述与专家修正,解决行为数据稀缺问题,提升识别精度至84.93%。

静态油画秒变动态视频!西安交大等提出「无需训练」的绘画动态化新范式

西安交通大学、合肥工业大学以及澳门大学的研究团队提出了一种零训练图像转视频框架——Every Painting Awakened,成功解决了静态绘画动态化生成中的不动和乱动两大难题。

AAAI 2025 SparseViT:参数高效的稀疏化视觉Transformer

四川大学吕建成团队与澳门大学合作提出SparseViT,这是一种针对图像篡改检测的稀疏化视觉Transformer。通过稀疏自注意力机制和可学习的多尺度监督机制,实现了对非语义特征的自适应提取,并在多个基准数据集上展现了卓越性能。