熵归档 - 每时AI

探讨Entropy(熵)机制在RL中扮演的角色

2025年6月8日14时作者机器学习算法与自然语言处理

MLNLP社区近期开源了关于entropy在RL中的应用文章，并分享了一些关于如何保持模型输出多样性和提升效果的研究成果。

RLHF 实践：原理、代码、踩坑以及解决方案

2025年5月10日14时作者机器学习算法与自然语言处理

业研究人员。
社区的愿景
是促进国内外自然语言处理，机器学习学术界、产业界和广大爱好者之间的交流和进

ICLR 2025 极性感知线性注意力！哈工深张正团队提出PolaFormer视觉基础模型

2025年2月1日23时作者机器之心

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000