MMRel:多模态大模型时代的评测物体间关系理解新基准

MMRel是首个大规模、高质量的物体间关系理解数据集,用于评估和提升多模态大模型能力。包含超过22K问答对,覆盖三个领域与三种关系类型,通过半自动流程生成并提供高难度子集测试极限性能。

全球十亿级轨迹点驱动,首个轨迹基础大模型来了

研究团队提出了首个世界轨迹基础大模型 UniTraj,克服了现有方法的局限性,实现了跨任务、跨区域的泛化能力,并在不同数据质量下保持鲁棒性。

凑个热闹,测试一波DeepSeek新上的o1推理模型

MLNLP社区介绍了国内涌现的o1模型,并分享了一些测试结果。kimi的k0-math模型在数学和代码方面表现出色,但逻辑推理能力有待提高。社区呼吁开发者积极贡献开源模型,以超越OpenAI的技术水平。