AI能看懂图像却算不好距离,上交时间-空间智能基准难倒9大顶尖多模态模型

上海交通大学联合团队发布STI-Bench,评估多模态大模型的空间-时间理解能力。结果显示当前最强模型在自动驾驶和机器人操作任务中表现不佳,准确率低于50%。论文、代码及数据已开源,为改善MLLM空间智能提供了新基准。

具身智能技术企业「穹彻智能」完成数亿元Pre-A++轮融资

穹彻智能近日完成数亿元Pre-A++轮融资,聚焦具身智能技术应用和商业化探索。联合创始人卢策吾及王世全主导研发的穹彻具身大脑Noematrix Brain具备多任务处理能力,并推出数据采集系统CoMiner。

从零搭一套可复现、可教学、可观察的RL for VLM训练流程,我们试了试

MAYE 是一个从零实现的 RL for VLM 框架与标准化评估方案,旨在提升透明度和可复现性。它通过简化架构、提供标准评估体系及实证研究支持,帮助学者更清晰理解模型训练过程及其行为变化。

上海交通大学发布“明岐”多模态大模型 突破消化道罕见病诊断瓶颈

上海交通大学举办AI赋能精准诊疗创新发展学术会议,发布具备消化道罕见病精准诊断能力的多模态大模型矩阵‘明岐’,提升诊疗效率与精准度。该模型采用双驱动架构,并通过多模态深度学习整合医学数据,实现可视化决策支持系统和透明诊断舱机制。

为今年最火的机器人来场全球挑战赛:150万高额奖金,还有顶级硬件支持

ATEC2025 科技精英赛由清华大学等顶尖学府联合主办,聚焦人工智能与机器人技术融合创新。赛事设置双赛道,奖金池高达21万美元,提供商业级硬件设备,并邀请专家学者评委参与验证和交流。

奥赛级AI基准来了:难倒所有模型,GPT-4o仅考34分,上海交大出品

上海交通大学GAIR Lab推出OlympicArena多学科认知推理基准测试,评估模型综合解决问题能力。尽管GPT-4也仅得34.01%整体准确率,但其他开源模型的整体准确率难以达到20%。该平台覆盖7大领域11163道题目,难度偏高,旨在检验AI的多学科综合认知能力,并提供资源支持研究。