OpenCompass 归档

美团提出多模态推理新范式：RL+SFT非传统顺序组合突破传统训练瓶颈

2025年7月21日23时作者量子位

美团团队提出Metis-RISE框架，通过强化学习激励和监督微调增强多模态大语言模型的推理能力。最终产生7B和72B参数的模型，在OpenCompass多模态推理榜单上取得了优异成绩，验证了方法的有效性和可扩展性。

2025年5月22日23时作者量子位

首个应用型AI翻译测评榜单TransBench上线，新增幻觉率、文化禁忌词等指标。TransBench评测数据集已全面开源，涵盖多种语言，针对电商和文化特性等方面进行实战考核。目前发布的首期测评结果中，GPT-4o、DeepL Translate、Qwen系列表现突出。

2025年1月16日22时作者 GiantPandaCV

上海人工智能实验室对书生大模型进行了升级，推出了InternLM3.0版本，通过精炼数据框架提升了数据效率和思维密度，节约了75%以上训练成本，并实现了常规对话与深度思考能力融合。