极市干货
ICML 2025 何恺明的“残差连接”被魔改,新架构给Transformer建了个“动态立交”,28亿参数打平69亿
对Transformer中的残差连接进行了创新性改造,仅增加极少的参数和计算量,就让28亿参数的模型
CVPR 2025 工业异常检测新突破!复旦&腾讯打造Real-IAD D³多模态数据集
复旦大学、腾讯优图实验室等联合发布高精度多模态数据集Real-IAD D³,并提出多模态融合检测方法,显著提升工业异常检测性能。
CVPR2025 Dinomaly: 极简主义,让多类异常检测性能首次超越单类模型
清华大学等机构提出Dinomaly多类异常检测模型,通过极简主义的设计首次让多类异常检测性能逼近甚至超越单类模型,具有简单、高效、易于扩展的特点。
北大发布OpenS2V-Nexus:500万视频数据集+全新评测框架双开源,主体一致性视频生成领域新基建
一个包含500万视频数据的OpenS2V-5M数据集和一个全新的OpenS2V-Eval评测框架。该
清华等开源YOLOv13:基于超图增强的实时目标检测
清华大学等机构的研究人员开源了YOLOv13,这是一个基于超图增强的实时目标检测算法。通过引入超图理论来捕捉特征间的高阶关联,并结合轻量化设计,在保持高效率的同时显著提升了检测精度。
CVPR’25 workshop冠军方案!中科院&字节Seed提出BridgeVLA:视觉干扰、任务组合等泛化场景轻松拿捏
中科院自动化所与字节跳动联合提出BridgeVLA,通过将预训练和微调的输入输出对齐到统一的2D空间来改进3D VLA模型设计,大幅提高了数据效率和任务成功率。