2小时入门「个性化联邦学习」,上交清华开源斩获1700+星 JMLR’25
上海交通大学和清华大学的研究人员开源了PFLlib代码库,包含多种联邦学习算法、数据集及工具,旨在降低初学者门槛并提供统一实验环境。该库囊括39个算法、3大类场景和24个数据集,并支持GPU资源需求少的500个设备同步训练场景。
上海交通大学和清华大学的研究人员开源了PFLlib代码库,包含多种联邦学习算法、数据集及工具,旨在降低初学者门槛并提供统一实验环境。该库囊括39个算法、3大类场景和24个数据集,并支持GPU资源需求少的500个设备同步训练场景。
近日,上海交通大学人工智能研究院晏轶超副教授联合蚂蚁集团的研究团队提出Skip-Vision框架,该框架通过训练阶段的Skip-FFN和推理阶段的Skip KV-Cache机制减少视觉Token的冗余计算与保留关键信息,实现多模态模型在精度和效率上的双重优化。
近日,上海交通大学人工智能研究院晏轶超副教授联合蚂蚁集团的研究团队提出Skip-Vision框架,无需额外预训练或重新训练大模型,在SFT流程中插入即可加速视觉-语言模型。该框架通过跳过冗余视觉Token和使用Summary Token机制在保留理解能力的同时显著降低计算开销和延迟。
Meta 以超过2亿美元薪酬挖走苹果AI高管Ruoming Pang,刷新顶级AI人才估值认知。苹果内部讨论是否引入OpenAI或Anthropic的大模型,Pang领导的团队因推进自研模型而与管理层出现分歧,最终导致离职。
中国科学技术大学、上海交通大学和上海 AI Lab 联合推出 CUAs 安全测试基准 RiOSWorld,全面评估 Computer-Use Agent 在真实电脑使用场景中的安全风险。实验结果显示大多数 Agent 风险意图率高且完成率高,指出当前多数基于 MLLM 的 CUA 缺乏风险意识。该研究已开源论文、项目官网及 GitHub 代码。
上海交通大学科研团队在AI设计热辐射超材料方面取得突破,研发的逆向设计AI模型能在短时间内生成大量候选设计方案,并从中选出最优方案。该技术有望应用于建筑节能和极端环境温控等领域。
上海交通大学联合团队提出MAS-GPT,通过生成式设计范式简化多智能体系统构建,只需一句Query就能生成一套可执行的MAS。MAS-GPT已在多个基准任务上超越现有方法,展示了高效和泛化能力。
清华大学等机构提出Dinomaly多类异常检测模型,通过极简主义的设计首次让多类异常检测性能逼近甚至超越单类模型,具有简单、高效、易于扩展的特点。
国家标准《机器人智能化视觉评价方法及等级划分》正式发布,填补行业空白,推动中国机器人产业从功能实现向智能分级跃迁。节卡机器人主导制定此标准,涵盖工业、服务和特种机器人,定义5大类19项测试指标,并创新性地制定了3类视觉智能等级。
研究提出了一种新的训练框架,让大模型自主设计和优化AI算法,显著减少人类干预。通过经验学习范式,7B参数的大模型ML-Agent在9个任务上持续探索学习,最终超越了671B规模的智能体。