0%通过率!Code神话泡沫!LiveCodeBenchPro发布!

MLNLP社区是国内知名的人工智能与自然语言处理学术社群,旨在促进跨学科交流合作。近期,该团队揭穿了大模型在编程比赛中表现不佳的事实,并提出了改进方法以提升AI能力。

一招缓解LLM偏科!调整训练集组成,“秘方”在此上交大&上海AILab等

MLNLP社区发布了一项创新方法IDEAL,用于解决大型语言模型(LLM)在多任务场景下可能出现的偏科现象。通过调整监督微调(SFT)训练集组成,研究团队发现优化后的模型在多种领域上的综合性能显著提升。

Magistral发布:用纯RL打造出首个多语言、透明Reasoning大模型!

MLNLP社区介绍其致力于促进国内外自然语言处理领域的交流合作,Magistral通过纯强化学习训练提高解题能力,成果包括在AIME数学竞赛上的显著提升,在多种场景下的表现及未来研究方向的探索。