PIKE-RAG及多模态R1-Visual-RFT思路思考:兼看olmOCR的一些测试感官

2025年3月6日周四北京晴。文章提到了OLMOCR测试情况及GraphRAG和多模态R1的工作进展,强调了奖励函数设计在强化学习中的重要性,并建议简化复杂系统架构以便应用。

再聊误区–Deepseek-R1思考过程在使用中的几个问题及对策

DeepSeek R1 在 think 过程中的需求和问题引起了广泛关注,包括输出思考过程的需求、过长或过短的思考时间以及控制思考方向。文章探讨了这些问题,并提出了通过调整模型设置、修改prompt模板和干预token解码采样的方法来解决。