GDELT情报分析遇见GraphRAG:兼看视频多模态RAG记忆增强检索实现思路
2025年3月15日北京下雪。文章介绍了视频多模态RAG记忆增强检索和GDELT事件知识图谱构建及与RAG效果评估,讨论了不同方法的优缺点及其在问答任务中的应用。
2025年3月15日北京下雪。文章介绍了视频多模态RAG记忆增强检索和GDELT事件知识图谱构建及与RAG效果评估,讨论了不同方法的优缺点及其在问答任务中的应用。
今天是2025年3月14日,星期五,北京天气晴。Light-R1-32B复现了R1的效果,但限定于数学领域AIME24、AIME25、GPQA Diamond等数据集;同时指出R1蒸馏模型所用800K数据是否来自训练还是由R1生成尚存争议。
在2025年3月7日的周五,文章探讨了AI内容的影响范围及R1复现基座的一些解释,并介绍了多模态语音大模型在R1方面的尝试。
2025年3月6日周四北京晴。文章提到了OLMOCR测试情况及GraphRAG和多模态R1的工作进展,强调了奖励函数设计在强化学习中的重要性,并建议简化复杂系统架构以便应用。
2025年转眼已过1/6,老刘说NLP技术社区已完成三次线上技术交流,涵盖RAG、Deepseek-R1推理大模型等话题。社区持续发布内容,欢迎更多成员加入,通过会员制提供多种权益和分享机会。
今天是2025年02月24日,星期一。文章讨论了mobile agent的思考和开源进展,包括MoE小模型Moonlight-16B-A3B、Qwen2.5-VL及deepseek开源周day1开源FlashMLA等项目。此外还介绍了RAG在写作场景中的应用进展。
DeepSeek R1 在 think 过程中的需求和问题引起了广泛关注,包括输出思考过程的需求、过长或过短的思考时间以及控制思考方向。文章探讨了这些问题,并提出了通过调整模型设置、修改prompt模板和干预token解码采样的方法来解决。
社区关于Deepseek-R1类推理大模型的三部曲线上交流顺利结束。老刘说NLP技术社区分享NLP、大模型&RAG&文档智能&知识图谱四个主题的知识与技术,现已举办39次线上报告活动,并将持续纳新。
今天是2025年02月20日,星期四。文章提到了NLP社区的一则有趣事件,并讨论了R1在多模态推理中的进展,包括视频和图像处理的相关工作及技术细节。