Vision-R1 归档 - 每时AI

Vision-R1：激发多模态大模型的推理能力

2025年4月13日23时作者极市干货

uanlan.zhihu.com/p/29618155786
编辑丨极市平台
极市导读
实验表明
，

2025年4月8日23时作者机器之心

中科院自动化研究所与中科紫东太初团队提出了一种结合高质量指令对齐数据与类 R1 的强化学习方法，用于提升目标检测性能。该方法包括召回奖励、精度奖励和渐进式规则调整策略等机制，在多个数据集上实现了显著性能提升。

2025年3月26日14时作者老刘说NLP

2025年3月26日，北京天气阴。文章讨论了多模态RAG技术在视觉领域和目标检测中的应用，并介绍了GPT-4发布的新功能及OpenAI承认的技术风险。同时，文章还提到了Vision-R1方案及其强化学习奖励函数设计。