字节Seed新方法!开源8B代码模型:自己筛数据训练自己,同量级SoTA,还能超越百亿级对手

MLNLP
社区致力于推动国内外自然语言处理与机器学习领域的交流合作。近期,
Seed-Coder团队开发了一种能自我筛选数据的代码模型,该模型在多个测试中表现优异。

清华提出ConCISE:简单有效,Reasoning过程砍掉一半,准确率不降!

MLNLP社区是国内外知名的机器学习与自然语言处理社区。该社区致力于促进学术界、产业界和爱好者的交流与进步,特别是初学者的成长。最新研究表明,通过信心注入和早停机制,可以显著减少模型的冗余推理步骤,提高准确性而不影响性能。

新SoTA方法RM-R1:让reward model对评分说出原因!超越GPT4o

MLNLP社区致力于促进国内外机器学习与自然语言处理的交流合作。近期发表论文提出推理奖励模型ReasRM,通过两阶段训练让小模型学会写评语,并在综合、数学题等测试集中优于GPT-4。该模型支持任务分类和动态奖励机制,已在多个领域展示优势。

【倒计时3天,截止时间5月11日】第二十四届中国计算语言学大会(CCL 2025) 征稿启事

CCL 2025会议延期至8月11-14日在山东济南举行,涵盖计算语言学多领域研究与应用论文征集。新增ARR快速审稿流程,促进学术交流。