Think思考用来增强RAG的Embedding?兼看推理模型使用实践建议等前沿进展
今日为2025年2月15日星期六。文章回顾了昨日的大模型进展,包括GraphRAG、开放AI推理模型使用建议、大模型训练注意力机制等,并介绍了深度思考与RAG结合的新进展,如生成嵌入和输出thought的方法。
今日为2025年2月15日星期六。文章回顾了昨日的大模型进展,包括GraphRAG、开放AI推理模型使用建议、大模型训练注意力机制等,并介绍了深度思考与RAG结合的新进展,如生成嵌入和输出thought的方法。
2025年02月14日,北京晴。文章介绍了MedRAG工具结合知识图谱解决医疗诊断问题,并回顾了利用知识图谱进行上下文扩展的思路和实践。
今天是2025年02月13日,星期四。文章介绍了使用基于知识图谱的方法来改善多智能体系统中的工具检索准确性。通过构建工具依赖关系的知识图谱并结合向量搜索和图遍历技术,可以更准确地找到用户所需的相关工具。
今天是2025年02月12日,星期三。老刘在NLP技术社区分享了关于Deepseek R1模型的习得过程、场景机会及技术风险等内容,并介绍了R1卡顿问题、知识库搭建等实践应用细节。
今日文章介绍了R1和知识图谱结合的粗暴实现以及强化学习在知识图谱信息抽取中的进展。具体包括开源复现DeepSeek R1的文本到图谱抽取训练方案,并回顾了昨日技术社区的进展,涉及RAG webui、推理框架KTransformers等。
文章介绍了增强大模型推理能力的四种范式,并探讨了使用蒸馏微调方式进行数据集和工具的选择。强调了监督微调(SFT)加上强化学习(RL)的重要性,同时提到了不同蒸馏方法及其应用。
今天是2025年02月08日,星期六。老刘在NLP技术社区分享了关于Deepseek R1类推理大模型的习得过程、认知误区、场景机会及技术风险等内容,强调需从落地角度看问题,并提醒避免空谈和偏见。
老刘说NLP技术社区自建立以来围绕大模型、知识图谱、RAG和文档智能等主题发布每日早报、线上交流活动分享、专题报告等内容,欢迎加入。
今天是2025年02月07日,星期五。老刘说NLP技术社区第27讲线上交流围绕Deepseek R1类推理大模型的习得过程、认知误区展开讨论,分享场景机会及技术风险。