高校教师,降级!

MLNLP社区致力于促进国内外自然语言处理与机器学习领域的交流合作。近年来,多所高校推进教师专业技术职务评聘改革,包括降级低聘措施。教育部等多部门出台政策推动教师能上能下、能进能出机制的实施。同时,完善制度保障和细致准备工作是改革成功的关键。

类R1训练不再只看结果对错!港中文推出SophiaVL-R1模型

SophiaVL-R1 是一项基于类 R1 强化学习训练框架的新模型,它不仅奖励结果的准确性,还考虑了推理过程的质量。通过引入思考奖励机制和 Trust-GRPO 训练算法,SophiaVL-R1 提升了模型的推理质量和泛化能力,在多模态数学和通用测试数据集上表现优于大型模型。