智元、魔法原子均上架四足机器人产品,与宇树争夺行业“一哥”|独家

多家公司进军四足机器人市场,智元D1 Ultra与魔法原子MagicDog-W同台竞技。智元推出小型四足机器人,售价暂未公布;魔法原子发布轮式四足机器人MagicDog-W,售价75000起,将于2025世界人工智能大会期间展示。

Jailbreak迎来“最后一卷”?港科大用“内容评分”重塑大模型越狱评估范式

港科大团队提出GuidedBench评估框架,系统评估LLM越狱攻击方法,并使用该框架对10种主流Jailbreak方法在5个主流模型上的成功率进行评估,结果发现没有一种方法的攻击成功率超过30%。

多模态大模型在OCR生成上表现如何?多页文档理解数据集Doc-750K

2025年7月23日,北京晴。文章介绍了多模态大模型在OCR生成任务和长文档问答数据集方面的进展。前者评估了最新多模态模型在多种OCR生成任务上的表现;后者则针对多页理解问题,通过开源数据集Doc-750K研究提升模型处理复杂文档的能力。