零步强化学习归档 - 每时AI

探讨Entropy(熵)机制在RL中扮演的角色

2025年6月8日14时作者机器学习算法与自然语言处理

MLNLP社区近期开源了关于entropy在RL中的应用文章，并分享了一些关于如何保持模型输出多样性和提升效果的研究成果。