密室逃脱成AI新考场,通关率不足50%,暴露空间推理短板丨清华ICCV25
清华大学团队提出EscapeCraft,一个3D密室逃脱环境来评估多模态大模型在视觉推理任务中的能力。通过分析不同模型的表现,揭示了它们是否能像人类一样进行推理和决策,并发现了模型存在的多种错误类型。
清华大学团队提出EscapeCraft,一个3D密室逃脱环境来评估多模态大模型在视觉推理任务中的能力。通过分析不同模型的表现,揭示了它们是否能像人类一样进行推理和决策,并发现了模型存在的多种错误类型。
上海交通大学和清华大学的研究人员开源了PFLlib代码库,包含多种联邦学习算法、数据集及工具,旨在降低初学者门槛并提供统一实验环境。该库囊括39个算法、3大类场景和24个数据集,并支持GPU资源需求少的500个设备同步训练场景。
具身智能及通用人形机器人产品研发商星动纪元宣布完成近5亿元A轮融资。该融资由鼎晖VGC和海尔资本联合领投,多家知名财务机构及产业资本跟投。所获资金将用于推进软硬技术的研发与量产落地。公司致力于打造高性能人形机器人本体和通用智能体,以实现机器人赋能千行百业、走进千家万户。
完成近5亿元A轮融资,星动纪元已推出人形机器人STAR1和Q5,并推出具身大模型ERA-42。公司已完成四轮融资,全球TOP10科技巨头中9家为其客户,产品应用范围广泛。
北京星动纪元科技有限公司宣布完成近5亿元A轮融资,用于人形机器人软硬技术研发与量产落地,推动闭环飞轮高速运转。公司聚焦通用人工智能技术,已交付超200台产品,客户覆盖全球TOP10市值科技巨头,主要布局物流与零售场景,并在硬件和大模型层面取得突破。
研究提出了一种基于推理的深度研究代理,能够自主分析和整合多源信息以完成复杂的研究任务。该代理在OpenAI的多项评测中表现出色,并受到学术界的广泛关注。
《AI大咖说》本周日晚8点更新!直播探讨企业与个人如何高效拥抱AI大模型和智能体。特邀嘉宾为清华硕士、资深AI专家流火哥。