火爆全网!《LLM书》.PDF
本书介绍生成式人工智能项目生命周期,涵盖模型选择、微调和部署等内容。通过直观示例和技术库指导读者掌握Transformer和Diffusers等工具。同时介绍了大模型前沿课程、顶会论文idea以及学术辅导服务。
本书介绍生成式人工智能项目生命周期,涵盖模型选择、微调和部署等内容。通过直观示例和技术库指导读者掌握Transformer和Diffusers等工具。同时介绍了大模型前沿课程、顶会论文idea以及学术辅导服务。
阿里通义Lab提出的ZEROSEARCH是首个无需与真实搜索引擎交互的强化学习框架,旨在激励语言模型提升搜索能力。
具身AI研究涵盖了单智能体和多智能体系统,并介绍了不同方法在控制、学习和生成模型中的应用。重点讨论了MAS的控制与规划、学习以及基于生成模型的交互机制。
大型语言模型在利用外部工具方面遇到提示膨胀和选择复杂性的挑战,引入了RAG-MCP框架通过检索增强生成技术解决这些问题,显著提高工具选择准确性并减少提示大小和token数量。
RLMs的最新发展及其复现研究总结,强调监督微调和基于可验证奖励的强化学习方法的重要性,并讨论了数据构建、训练策略和奖励设计的关键要素。
Agentic RAG-R1 是由北京大学研发的一项开源研究项目,通过引入强化学习策略(GRPO),构建了一个可自我规划、检索、推理与总结的智能体式 RAG 系统,显著提升了语言模型的自主性和效率。
TreeHop研究提出了一种全新的多跳问答解决方案,通过在嵌入空间中完成推理,实现99%的延迟降低和5%-0.4%的模型参数量减少,显著提高效率,并能在工业场景中高效部署。