NLP开源爱好者与践行者归档 - 第2页共2页

PIKE-RAG及多模态R1-Visual-RFT思路思考：兼看olmOCR的一些测试感官

2025年3月6日14时作者老刘说NLP

2025年3月6日周四北京晴。文章提到了OLMOCR测试情况及GraphRAG和多模态R1的工作进展，强调了奖励函数设计在强化学习中的重要性，并建议简化复杂系统架构以便应用。

2025年2月23日14时作者老刘说NLP

DeepSeek R1 在 think 过程中的需求和问题引起了广泛关注，包括输出思考过程的需求、过长或过短的思考时间以及控制思考方向。文章探讨了这些问题，并提出了通过调整模型设置、修改prompt模板和干预token解码采样的方法来解决。