有趣思考:如何带着问题去针对性学习-兼看大模型推理、强化、RAG等进展

今天是2025年6月6日,星期五,北京晴。文章回顾了大模型相关技术进展,包括针对性学习、推理数据收集、多模态应用及强化学习评估偏差等内容。关键点在于明确问题并针对性学习,学会提问和理论与实践结合,以提升大模型性能。

RAG的有趣新尝试:将文本编码进MP4文件实现思路及Agentic-doc处理文档

今天是2025年6月5日,星期四,北京晴。文章介绍了将文本编码进MP4文件的有趣RAG尝试和Agentic-doc文档处理系统。Memvid项目通过MP4索引实现快速语义搜索,而Agentic-doc则利用agent高效提取复杂文档结构化数据。

强化学习数据合成框架SynLogic及语音大模大模型评估

2025年5月29日,北京晴。文章介绍了大模型推理及语音模型评估进展和数据合成框架SynLogic的最新情况,包括DeepSeek-R1更新、LALM-Evaluation-Survey项目以及用于生成多样化的逻辑推理数据的SynLogic框架。

我们从Agent强化学习框架RL-Factory及多模态统一框架One-RL-to-See-Them-Al中能学到什么?

今天是2025年5月26日,星期一,北京晴。文章介绍了两个强化学习框架:RL-Factory和One-RL-to-See-Them-All,分别从Agent智能体强化学习框架和统一强化学习框架的角度阐述了工程设计与数据工程及奖励策略的相关工作,并提出了多轮工具使用、难样本选择以及量化指标的设计建议。