6 月 2025 - 第167页共231页

OpenAI发布o3-pro：复杂推理能力增强，o3价格直降80%，计划夏天发布开源模型

2025年6月11日16时作者 Founder Park

作为推理模型 o3 的升级版，
在处理复杂问题、给出更精准的回答方面表现更强，尤其在科学研究、编程、

2025年6月11日16时作者机器之心

器人学习与具身人工智能，专注于机器人操控、物理交互与控制优化。
第二作者徐晓豪是美国密歇根大学机器人

2025年6月11日16时作者 Founder Park

2 亿元。
这篇文章来自去年 12 月，张鹏和影石 Insta360 创始人刘靖康在极客公园 IF

2025年6月11日16时作者机器之心

本文介绍了一篇关于 DeepMath-103K 数据集的研究论文，该数据集旨在解决当前大语言模型在数学推理训练中的数据瓶颈问题。论文详细描述了其高难度、新颖性和纯净性的特点，并展示了在多个基准测试中的卓越性能。

2025年6月11日16时作者量子位

华为首次展示了其‘数字化风洞’技术，通过虚拟环境平台在电脑中预演复杂AI模型的训练和推理过程，以避免算力浪费。该技术包括Sim2Train用于优化训练阶段配置、Sim2Infer提升推理性能至30%以及Sim2Availability确保大模型高可用性。

2025年6月11日16时作者 PaperWeekly

VRAG-RL 是一种基于强化学习的视觉检索增强生成方法，通过引入多模态智能体训练，实现了视觉语言模型在检索、推理和理解复杂视觉信息方面的显著提升。

2025年6月11日16时作者机器之心

欧洲人工智能公司 Mistral AI 推出了 Magistral 系列大语言模型，具备强大的推理能力。Magistral Medium 和 Magistral Small 分别面向企业客户和开源社区，支持 Apache 2.0 许可，并在多种测试中表现出色。

2025年6月11日16时作者新智元

作了！另一边的微软，似乎转头就被抛弃了。另外，小扎也受了刺激，下决心亲自组队50人，破釜沉舟斥资1

2025年6月11日16时作者 PaperWeekly

研究构建首个面向MLLM的细粒度AES基准EssayJudge，采用10项细粒度评分维度，涵盖词汇、句子和文章三个层级，评价作文质量。

2025年6月11日16时作者机器之心

机器学习研究者提出一种名为”强化预训练”的新方法，它将下一个 token 预测任务重构为对 next-token 的推理过程。通过可验证奖励的强化学习，这种方法利用海量无标注文本数据进行通用预训练，显著提升语言建模准确性，并有望推动大模型发展的有效路径。