独家|孵化中国版“GPT-4o”的无界方舟连续完成亿元级融资,基于自研多模态大模型,打造AI应用的“最强大脑”

无界方舟宣布完成Pre-A & Pre-A+轮亿元级别融资,公司利用自研多模态大模型打造AI应用。创始人曾晓东博士拥有深厚的技术背景和产业化经验,目前公司已推出国内SOTA的EVA多模态模型,并实现商业化落地,覆盖生物医药、金融等多个领域。

密室逃脱成AI新考场,通关率不足50%,暴露空间推理短板丨清华ICCV25

清华大学团队提出EscapeCraft,一个3D密室逃脱环境来评估多模态大模型在视觉推理任务中的能力。通过分析不同模型的表现,揭示了它们是否能像人类一样进行推理和决策,并发现了模型存在的多种错误类型。

复杂空间指令也能秒懂?RoboRefer 让机器人理解推理空间,开放世界也能精准行动!

本文提出了一种名为RoboRefer的多模态大模型,能够理解三维空间关系并执行复杂的指令。它在空间指代任务上表现优异,并已应用于多种机器人系统中。

更长的推理链反而导致更多幻觉,MLLMs 幻觉解法仅「抄作业」还不够?摘要

本周会员通讯聚焦MLLMs幻觉问题、AI公司运营等议题。研究发现长推理链下MLLMs产生更多幻觉,不同来源的幻觉表现差异大。多模态模型在视觉编码器设计与训练机制存在失衡现象,导致语言主导现象频发。