使用fastapi-mcp改造fastapi服务为MCP服务供智能体使用案例
使用MCP协议解耦智能体和工具开发,通过动态配置提示词、记忆模块及功能实现快速调整智能体能力,同时支持独立部署或挂载到原应用。
大语言模型
使用MCP协议解耦智能体和工具开发,通过动态配置提示词、记忆模块及功能实现快速调整智能体能力,同时支持独立部署或挂载到原应用。
谷歌 Gemini 的新功能‘Scheduled Actions’被设计成一个隐蔽的对话形式,用户通过与Gemini进行对话来创建、编辑和测试定时任务。该功能目前仅限于Gemini Pro和Ultra用户使用,并且缺乏明显的操作入口。
2025年7月1日,文章介绍了多模态RAG中的文档信息增强的研究,并讨论了关于dify是否应被抛弃的思考。文章强调了多模态方法在评估企业文档理解任务上的优势,展示了多种增强方法的效果比较。同时,也指出了Dify作为工具存在的局限性,包括其处理PDF表格识别问题的能力不足和切割策略不够先进等问题。
老刘说NLP技术社区致力于通过早报、专题分享和线上活动等方式,围绕大模型、RAG、文档智能及知识图谱等主题进行技术交流。目前已有43次线上分享和技术专题文章,并提供会员制服务,吸引了众多成员参与。
2024年是大模型走向实用的关键一年。文章介绍了如何通过将复杂任务拆解成多个可执行的子任务来提升大模型的能力,强调了任务拆解在实际应用中的重要性。
ReAct Agent基于思考-行动-观察的智能体,核心是通过提示词操作大模型完成任务。多种提示词范式如ICL、CoT、Self-Consistency等通过不同方式注入信息以优化模型能力。
DeepSeek-R2 模型因 CEO 对性能不满及美国出口管制影响而推迟发布,目前面临算力短缺问题。该模型原计划在 2025 年初发布,但已延期多周,团队正尝试通过国产替代和优化模型结构来重新建立发布条件。
Flux Kontext dev实现了一句话P图自由,ComfyUI更新了OmniGen2工作流。OmniGen2是一个7B参数量的强大模型,支持文本生成图像和基于指令的图像编辑。