大模型
大语言模型
2025最值得尝试的本地AI聊天方案:CAG + vLLM + Streamlit太强了!
在2025年,开发者转向本地部署大模型以实现更快响应、更强隐私保护和更自由定制能力。文章介绍了两种方法:RAG依赖外部知识库进行问答,而CAG通过上下文记忆与智能缓存构建本地智能体。CAG适合多轮对话场景,通过vLLM加速推理和Streamlit提供轻量级界面简化开发过程。
ChatGPT 全局记忆上线,xAI 开放 Grok 3 API,Llama 4 惹争议! AI Weekly 4.7-13
户推出全局记忆功能,模型可自动调用历史对话,增强个性化体验。
2️⃣
🚫 GPT-4 即将退役
:4
关于打造高质量RAG系统的问题记录
关于RAG在实际场景中的应用,重点讨论了文档处理和高效检索的问题。文档处理涉及多样化和复杂的格式,需要拆分和识别文本、图片和图表等不同内容类型。高效的检索则需利用多种匹配方式(精确字符匹配与语义匹配),通过多路召回策略综合考虑多个维度的数据来优化结果。
GPT-4 官宣退役!曾经的最强模型,正式交棒 GPT-4.1、o3、o4 mini!
OpenAI宣布,即将在4月30日下线GPT-4,由更强的GPT-4o全面替代。目前,OpenAI还准备了一大批新模型包括GPT-4.1、GPT-4.1 mini/nano和下一代推理模型o系列等。这些新模型正在筹备中,以应对GPT-4退役后的需求。
折翼的翅膀,Illustrious写实风格
推荐IllustriousXL_MMMix v8.0,增强写实风格,分辨率1024×1536,使用Euler采样器,步骤25、CFG 5,融合四个模型,包含多个角色如驾驶员、御姐、机械天使等,支持下载。
Token刺客来袭!AgentPrune一键屏蔽废话智能体,成本暴降60%性能翻盘
由同济大学、香港中文大学等机构提出的新技术AgentPrune,通过多智能体剪枝技术解决基于大模型的多智能体系统中的通信冗余问题。该技术能大幅降低通信开销,提升系统的鲁棒性和任务完成效率。