6 月 2025 - 第196页共231页

为什么用错奖励，模型也能提分？新研究：模型学的不是新知识，是思维

2025年6月8日16时作者机器之心

本文研究了语言模型对强化学习中奖励噪声的鲁棒性，即使翻转大部分奖励也能保持高下游任务表现。作者提出了思考模式奖励机制，并展示了其在数学和AI帮助性回复生成任务中的有效性。

2025年6月8日16时作者机器之心

学家费马在书页边缘留下了一个看似简单却困扰了学者几个世纪的难题——费马大定理。
1994 年，And

2025年6月8日14时作者老刘说NLP

aphRAG方案回顾、GraphRAG方案效果对比Benchmark、GraphRAG能否提升所有类

2025年6月8日14时作者小兵的AI视界

Morphik 是一款开源的多模态检索增强生成工具，专为处理高技术性和视觉内容丰富的文档而设计。它通过 ColPali 技术支持文本、PDF、图片等多种格式文件的搜索和处理，并结合知识图谱构建能力提升检索准确性和相关性。

2025年6月8日14时作者 AI技术研习社

AI产品测评活动精选35款实用工具，覆盖写作、绘图、剪辑等多种场景。无需编程知识和复杂配置，支持中文界面、免费试用。旨在让更多用户轻松上手并提升效率与创造力。

2025年6月8日14时作者 AI信息Gap

朴实无华！
📢本周AI快讯 | 1分钟速览🚀
1️⃣
🎨 字节跳动发布 SeedEdit 3.0
：

2025年6月8日14时作者 AI先锋官

年
各地的作文题目
发给了国内几大主流AI软件：DeepSeek、Kimi、豆包、阶跃AI、通义Qw

MLNLP社区近期开源了关于entropy在RL中的应用文章，并分享了一些关于如何保持模型输出多样性和提升效果的研究成果。