多模态大模型
上海AI“北斗七星”亮了 !
上海徐汇已汇聚七家AI标杆企业,构建技术研发、场景落地和产业协同创新生态。这些企业在模型能力提升、应用推广和技术商业化等方面发挥作用,推动人工智能发展,并通过高质量孵化器吸引顶尖企业和人才,助力建设全国人工智能高地。
社区供稿 | 书生·万象 3.0 升级发布,创新预训练方法
上海AI实验室升级并开源了通用多模态大模型书生·万象 3.0 (InternVL3),在多模态能力方面取得显著突破,成为开源模型中的性能新标杆。
突破AI视觉“选择性失明”,哈工大首次实现指令驱动的全景式感知
哈工大博士生李俊劼的研究成果GiVE首次实现了指令驱动的全景式感知,解决了传统多模态模型’选择性失明’的问题。通过引入AG-Adapter模块和设计三种专门损失函数,GiVE能灵活调整注意力焦点,提升多模态任务表现。
RoboMamba:推理速度提升7倍,北大如何打造高效机器人多模态大模型?
北京大学团队推出RoboMamba,一款高效多模态机器人模型,旨在提升复杂任务的推理与决策能力。其核心目标是增强视觉和语言集成能力、优化微调策略,并降低训练成本。
AI能看懂图像却算不好距离,上交时间-空间智能基准难倒9大顶尖多模态模型
上海交通大学联合团队发布STI-Bench,评估多模态大模型的空间-时间理解能力。结果显示当前最强模型在自动驾驶和机器人操作任务中表现不佳,准确率低于50%。论文、代码及数据已开源,为改善MLLM空间智能提供了新基准。