首个奖励模型评分基准!清华复旦港科大联合攻克AI评委“偏科” 上午11时 2025/05/10 作者 量子位 “1+1=3”,评测系统却浑然不觉甚至疯狂打Call?是时候给奖励模型打个分了! 来自 清华大学 、