老刘说NLP
DeepWiki、Chatwiki及DeepSeek-R1T-Chimera进展
今日2025年4月28日星期日,北京晴。简述Deepresearch与RAG进展及DeepSeek-R1实验模型。DeepWiki为GitHub仓库提供AI驱动的实时交互式文档;Chatwiki为企业打造智能客服机器人问答系统,支持多级权限控制和多种数据导入方式。介绍DeepSeek-R1T-Chimera微调模型,相比原始版本运行速度更快,输出标记数量减少40%。
MCP技术总结及推理大模型强化学习机制分析
今日记录了MCP相关进展及语音大模型和推理大模型的最新情况,包括Kimi开源语音模型、关于推理能力实证分析的研究,以及Model Context Protocol (MCP) 的综述等内容。
GraphRAG如何用于Agent做memory记忆管理?Graphiti实现解读及相关技术进展回顾
0250425技术进展早报,社区讨论不少,外部的技术进展也有一些,可看看。
另一个是对GraphRA
金融领域推理大模型DianJin-R1、Fin-R1及文档转markdown、docx的多模态大模型做法
今天是2025年4月25日,星期五,北京晴。文章讨论了多模态模型如何将文档图片转为markdown和docx的逻辑,并介绍了Qwen2VL、internvl、GOT-OCR及docling等模型的具体使用方式。此外,还探讨了金融领域推理模型进展,特别关注DianJin-R1的工作,强调数据质量和强化学习在提升模型性能中的重要性。
RAG与Reasoning结合的必要性、实现范式及Agents、RAG产品、大模型安全新总结
2025年4月24日北京晴。文章探讨了检索增强生成(RAG)与推理(Reasoning)结合的必要性及实现范式,并总结了Agents、RAG产品及大模型安全的相关研究。
王者归来!多模态大模型+具身智能彻底爆了。。。
智源发布RoboBrain融合多模态大模型与具身智能技术,成功解决机器人操作任务难题,并已录用于CVPR2025。课程内容涵盖ML机器人基础知识、数据集特性及RoboBrain模型结构等,提供1v1论文指导服务。