独家|孵化中国版“GPT-4o”的无界方舟连续完成亿元级融资,基于自研多模态大模型,打造AI应用的“最强大脑”
无界方舟宣布完成Pre-A & Pre-A+轮亿元级别融资,公司利用自研多模态大模型打造AI应用。创始人曾晓东博士拥有深厚的技术背景和产业化经验,目前公司已推出国内SOTA的EVA多模态模型,并实现商业化落地,覆盖生物医药、金融等多个领域。
无界方舟宣布完成Pre-A & Pre-A+轮亿元级别融资,公司利用自研多模态大模型打造AI应用。创始人曾晓东博士拥有深厚的技术背景和产业化经验,目前公司已推出国内SOTA的EVA多模态模型,并实现商业化落地,覆盖生物医药、金融等多个领域。
清华大学团队提出EscapeCraft,一个3D密室逃脱环境来评估多模态大模型在视觉推理任务中的能力。通过分析不同模型的表现,揭示了它们是否能像人类一样进行推理和决策,并发现了模型存在的多种错误类型。
本文提出了一种名为RoboRefer的多模态大模型,能够理解三维空间关系并执行复杂的指令。它在空间指代任务上表现优异,并已应用于多种机器人系统中。
本周会员通讯聚焦MLLMs幻觉问题、AI公司运营等议题。研究发现长推理链下MLLMs产生更多幻觉,不同来源的幻觉表现差异大。多模态模型在视觉编码器设计与训练机制存在失衡现象,导致语言主导现象频发。
研究发现多模态推理模型随着推理链条的延长,其视觉感知能力下降,甚至出现幻觉现象。论文引入RH-AUC评估指标和RH-Bench数据集,为模型在推理与感知之间找到平衡提供了新视角。