ICML 2025 多智能体的ChatGPT时刻?上交MAS-GPT实现工作流一键生成
上海交通大学联合团队提出MAS-GPT,通过生成式设计范式简化多智能体系统构建,只需一句Query就能生成一套可执行的MAS。MAS-GPT已在多个基准任务上超越现有方法,展示了高效和泛化能力。
上海交通大学联合团队提出MAS-GPT,通过生成式设计范式简化多智能体系统构建,只需一句Query就能生成一套可执行的MAS。MAS-GPT已在多个基准任务上超越现有方法,展示了高效和泛化能力。
清华大学等机构提出Dinomaly多类异常检测模型,通过极简主义的设计首次让多类异常检测性能逼近甚至超越单类模型,具有简单、高效、易于扩展的特点。
国家标准《机器人智能化视觉评价方法及等级划分》正式发布,填补行业空白,推动中国机器人产业从功能实现向智能分级跃迁。节卡机器人主导制定此标准,涵盖工业、服务和特种机器人,定义5大类19项测试指标,并创新性地制定了3类视觉智能等级。
研究提出了一种新的训练框架,让大模型自主设计和优化AI算法,显著减少人类干预。通过经验学习范式,7B参数的大模型ML-Agent在9个任务上持续探索学习,最终超越了671B规模的智能体。
本文提出了一种基于几何变换的快速且可解释的2D单应矩阵分解方法(Similarity-Kernel-Similarity, SKS和Affine-Core-Affine, ACA)。该方法大幅减少了4点求解单应的时间,尤其适用于二维码扫描等应用。
复旦大学、荣旗工业科技、腾讯优图实验室等机构联合发布了高精度多模态数据集Real-IAD D³,并提出了一种基于此数据集的创新多模态融合检测方法,提升了工业异常检测性能。
东南大学联合多所研究机构提出了KRIS-Bench,一个评估图像编辑模型知识结构的基准。该基准从事实性、概念性和程序性知识三个层面测试编辑能力,并包含1267对图像指令样本,覆盖初级到高级任务难度。
MASLab 提供了一个统一、全面的多智能体系统代码库,涵盖多种方法和评测基准。它支持跨领域实验,并提出MASLab-ReAct方法,用于评估大模型在多任务环境下的性能。
MLNLP社区发布了一项创新方法IDEAL,用于解决大型语言模型(LLM)在多任务场景下可能出现的偏科现象。通过调整监督微调(SFT)训练集组成,研究团队发现优化后的模型在多种领域上的综合性能显著提升。
Video-Bench通过链式查询和少样本评分技术,实现了对视频生成质量的高效评估。该框架能够全面覆盖视频生成的多个维度,并在视频-条件一致性、视频质量等方面显著优于现有方法。