RLHF 归档 - 每时AI

大模型自信心崩塌！谷歌DeepMind证实：反对意见让GPT-4o轻易放弃正确答案

2025年7月20日16时作者量子位

研究发现，大语言模型如GPT-4o和Gemma 3在面对反向意见时过度敏感，并且会轻易改变初始答案，这与其记忆机制有关。研究表明，缺乏记忆的模型可能更容易动摇。

2025年6月20日8时作者 NLP工程化

Unsloth发布了关于大模型强化学习的完整指南，涵盖目标、关键作用及在AI代理中的应用等内容，并提供了GRPO、RLHF、DPO和奖励函数的相关信息。

2025年4月20日16时作者新智元

在一个致命问题：幻觉率高达33%，是o1的两倍。Ai2科学家直指，RL过度优化成硬伤。
满血o3更强

2025年3月24日16时作者机器之心

设计 RLHF 的奖励模型时也是一样。
我们知道，一个 RLHF 算法是否成功的一大关键在于其奖励模

2025年3月12日23时作者 AI前线

术变革转向产业变革，大模型应用也会进一步繁荣，传统基础设施技术已经不足以满足大模型应用的快速发展。整

2025年2月14日12时作者新智元

的AI——语言模型与可控推理能力相结合的混合模型。模型包括一个独特的「滑动条」功能，它赋予开发者对计

2025年1月13日23时作者极市干货

↑ 点击
蓝字
关注极市平台
作者丨ybq
来源丨NLP工作站
编辑丨极市平台
极市导读
本文探讨了

2025年1月8日23时作者机器之心

机器之心报道
编辑：张倩
老婆饼里没有老婆，夫妻肺片里没有夫妻，RLHF 里也没有真正的 RL。在最