探讨Entropy(熵)机制在RL中扮演的角色 下午2时 2025/06/08 作者 机器学习算法与自然语言处理 MLNLP社区近期开源了关于entropy在RL中的应用文章,并分享了一些关于如何保持模型输出多样性和提升效果的研究成果。
RLHF 实践:原理、代码、踩坑以及解决方案 下午2时 2025/05/10 作者 机器学习算法与自然语言处理 业研究人员。 社区的愿景 是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进
ICLR 2025 极性感知线性注意力!哈工深张正团队提出PolaFormer视觉基础模型 下午11时 2025/02/01 作者 机器之心 AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000