机器之心，作者每时AI - 第37页共134页

40位数学家组成8队与o4-mini-medium比赛，6队败北

2025年5月24日16时作者机器之心

在FrontierMath基准测试中，O4-mini-medium击败了由数学专家组成的团队。尽管AI尚未达到超人水平，但有观点认为它很快就会超越人类。

2025年5月24日16时作者机器之心

蕴藏着未解之谜。
它是一项简单的运算：我们学到的第一个数学真理便是 1 加 1 等于 2。但加法能够

2025年5月24日16时作者机器之心

字节跳动团队提出首个真实世界场景文档理解基准数据集WildDoc，揭示当前多模态大模型在实际应用中的不足，并提出了改进策略。

2025年5月24日16时作者机器之心

题定义与评估体系重构。在 AI 发展新阶段，行业需要通过设计更有效的模型评测体系，弥补 AI 能力与

2025年5月23日16时作者机器之心

院，导师为李镇老师。目前实验室的研究方向包括：自动驾驶、医学成像和分子理解的多模态数据分析和生成等。

2025年5月23日16时作者机器之心

第七届北京智源大会将于2025年6月6日至7日在中关村国家自主创新示范区展示中心举行，汇聚图灵奖得主和全球顶尖研究者，探讨人工智能基础理论、应用探索、产业创新和可持续发展等议题。

2025年5月23日16时作者机器之心

华为团队发布了三项重要的昇腾推理技术，包括AMLA、融合算子技术和SMTurbo。这些技术通过优化关键算子提升了大模型的推理速度和能效，如AMLA实现了高达71%的算力利用率；融合算子技术让计算与通信无缝协奏；SMTurbo显著降低了跨卡访问延迟至亚微秒级。

2025年5月23日16时作者机器之心

大语言模型通过InstructRAG方案结合指令图、强化学习和元学习实现任务规划的可扩展性和迁移性，提升19.2%性能，在多个数据集上表现优于现有方法。

2025年5月23日11时作者机器之心

国防科大、深圳大学、武汉大学团队提出PIN-WM世界模型，可以从少量任务无关交互轨迹中识别刚体物理属性，并结合PADC提高策略学习鲁棒性。实验验证其在非抓取操作中的有效性。

2025年5月23日11时作者机器之心

PT-5、DeepSeek V4，但今天起，大模型竞争已经进入了全新阶段。
北京时间周五凌晨，知名