学术归档 - 第63页共283页

6大模型决战高考数学新一卷：豆包、元宝并列第一，OpenAI o3竟惨败垫底

2025年6月8日8时作者机器之心

上午刚经历了抽象作文的洗礼，下午又被数学无情创飞。考试一结束，「高考数学」、「新一卷数学大题难」等

2025年6月8日8时作者 PaperWeekly

nguage Models
论文链接：
https://arxiv.org/abs/2505.006

业研究人员。
社区的愿景
是促进国内外自然语言处理，机器学习学术界、产业界和广大爱好者之间的交流和进

MLNLP社区致力于促进国内外自然语言处理与机器学习领域的交流合作。近年来，多所高校推进教师专业技术职务评聘改革，包括降级低聘措施。教育部等多部门出台政策推动教师能上能下、能进能出机制的实施。同时，完善制度保障和细致准备工作是改革成功的关键。

2025年6月6日23时作者机器之心

05）。
在保持 o3 四分之一以下的低价格的同时，在编码（Aider Polyglot）、推理能力

2025年6月6日23时作者机器之心

CVPR 大会将至，机器之心联合多个合作伙伴举办 AI 晚宴 Meetup，旨在搭建企业和人才交流平台，共议前沿技术与应用。

2025年6月6日23时作者机器之心

字节跳动提出预训练模型平均（PMA）技术，在不增加计算成本的情况下显著提升大模型性能。通过合并稳定期检查点，PMA能预测衰减阶段表现，节省资源并加速训练进程。

2025年6月6日23时作者机器之心

SophiaVL-R1 是一项基于类 R1 强化学习训练框架的新模型，它不仅奖励结果的准确性，还考虑了推理过程的质量。通过引入思考奖励机制和 Trust-GRPO 训练算法，SophiaVL-R1 提升了模型的推理质量和泛化能力，在多模态数学和通用测试数据集上表现优于大型模型。

2025年6月6日23时作者机器之心

疏计算优势，成为大模型推理提效的关键路径。
华为团队重磅推出昇腾平台原生设计的 Pangu Pro

2025年6月6日23时作者机器之心

一晃 2025 年已经快要过半了！AI 领域依然「热闹非凡」，令人目不暇接。
年初爆火的 DeepS