ICML 2025 何恺明的“残差连接”被魔改,新架构给Transformer建了个“动态立交”,28亿参数打平69亿
对Transformer中的残差连接进行了创新性改造,仅增加极少的参数和计算量,就让28亿参数的模型
对Transformer中的残差连接进行了创新性改造,仅增加极少的参数和计算量,就让28亿参数的模型
复旦大学、腾讯优图实验室等联合发布高精度多模态数据集Real-IAD D³,并提出多模态融合检测方法,显著提升工业异常检测性能。
清华大学等机构提出Dinomaly多类异常检测模型,通过极简主义的设计首次让多类异常检测性能逼近甚至超越单类模型,具有简单、高效、易于扩展的特点。
一个包含500万视频数据的OpenS2V-5M数据集和一个全新的OpenS2V-Eval评测框架。该
清华大学等机构的研究人员开源了YOLOv13,这是一个基于超图增强的实时目标检测算法。通过引入超图理论来捕捉特征间的高阶关联,并结合轻量化设计,在保持高效率的同时显著提升了检测精度。
中科院自动化所与字节跳动联合提出BridgeVLA,通过将预训练和微调的输入输出对齐到统一的2D空间来改进3D VLA模型设计,大幅提高了数据效率和任务成功率。
华中科技大学开发的MonkeyOCR文档解析模型在OmniDocBench数据集上取得显著成果,相比MinerU、Qwen2.5-VL等开源和闭源大模型,在中文内容识别方面表现出色。该模型采用结构-识别-关系(SRR)三元组方法,并基于大规模标注数据集MonkeyDoc进行训练。