全球首个通用科学智能体:SciMaster重新定义AI科研助手

人工智能与科学研究的深度融合正重塑科学发现边界。上海交通大学-深势科技联合发布的SciMaster作为全球首款通用科学智能体,通过并行化处理加速科研流程,并结合科学基座大模型Innovator优化信息理解和处理能力。

CVPR 2025 一行Dropout干翻多类异常检测?Dinomaly用“极简主义”刷出SOTA

论文提出Dinomaly方法,通过简化模型和创新技术解决了多类别异常检测中的性能问题。模型在多个数据集上达到SOTA表现,首次让多类统一模型超越单类专用模型,具有优异的可扩展性和易用性。

四款扩散大语言模型全部破防?上交&上海AI Lab发现致命安全缺陷

扩散语言模型(dLLMs)因并行解码、双向上下文建模和灵活插入masked token而备受关注。然而,上海交通大学等团队在最新研究中指出,dLLMs存在根本性架构安全缺陷,几乎毫无防御能力。DIJA攻击无需训练或改写模型参数,就能生成有害内容,并揭示了扩散语言模型的弱点,为dLLMs的安全研究拉开序幕。

2小时入门「个性化联邦学习」,上交清华开源斩获1700+星 JMLR’25

上海交通大学和清华大学的研究人员开源了PFLlib代码库,包含多种联邦学习算法、数据集及工具,旨在降低初学者门槛并提供统一实验环境。该库囊括39个算法、3大类场景和24个数据集,并支持GPU资源需求少的500个设备同步训练场景。

ICCV’25 视觉Token跳起来!上交大×蚂蚁联手推出多模态通用加速框架

近日,上海交通大学人工智能研究院晏轶超副教授联合蚂蚁集团的研究团队提出Skip-Vision框架,该框架通过训练阶段的Skip-FFN和推理阶段的Skip KV-Cache机制减少视觉Token的冗余计算与保留关键信息,实现多模态模型在精度和效率上的双重优化。

ICCV 2025 视觉Token跳起来!上交大×蚂蚁联手推出多模态通用加速框架

近日,上海交通大学人工智能研究院晏轶超副教授联合蚂蚁集团的研究团队提出Skip-Vision框架,无需额外预训练或重新训练大模型,在SFT流程中插入即可加速视觉-语言模型。该框架通过跳过冗余视觉Token和使用Summary Token机制在保留理解能力的同时显著降低计算开销和延迟。

疯狂!小扎砸 14 亿从苹果挖走庞若鸣,上交校友成 Meta AI 梦之队第 9 位华人

Meta 以超过2亿美元薪酬挖走苹果AI高管Ruoming Pang,刷新顶级AI人才估值认知。苹果内部讨论是否引入OpenAI或Anthropic的大模型,Pang领导的团队因推进自研模型而与管理层出现分歧,最终导致离职。