ICML 2025 细粒度奖励建模:判别式策略优化下的Q-RM方法

近日,中山大学计算机学院与腾讯微信搜索团队联合提出 Q-RM(Q-function Reward Model),在 ICML 2025 正式发表。这一方法专注于构建更精确的 token-level 奖励信号,显著提升了大语言模型的训练效率和效果。

RAG的2025趋势重点及RAG+抽取场景的来源定位问题思考

2025年6月24日,北京晴天。文章讨论了信息抽取和RAG落地中的引文生成、来源定位需求及其底层逻辑与实际案例。提及模型可能产生“幻觉”导致的误导性答案,通过引文标注来源增强可信度。此外,文章总结了2025年RAG的发展趋势,包括多模态文档解析与统一抽取的重要性。

全国首部AI大模型私有化部署标准,公开征集起草单位和个人

《人工智能大模型私有化部署技术实施与评价指南》是国内首部针对AI大模型私有化部署的标准,旨在解决企业因缺乏统一标准和评价系统导致的技术选型混乱、算力资源错配等问题。该标准涵盖选用、部署、优化全流程要点,强调技术实施、安全保密、质量评价及行业案例融合,并推动三方协作实现持续改进与优化。目前正面向起草单位及起草人征集参与。

TIP 2025 从噪声图像到精准报告:CMCRL两阶段因果框架重构医疗多模态学习

论文提出CMCRL框架解决放射学报告生成任务中的挑战,包括长序列文本生成、病灶定位和视觉-语言偏倚问题。通过两阶段设计有效捕捉并校正跨模态数据中的偏倚,显著提高准确率和临床可信度。