PaperAgent

火爆全网！《LLM书》.PDF

2025年5月13日14时作者 PaperAgent

本书介绍生成式人工智能项目生命周期，涵盖模型选择、微调和部署等内容。通过直观示例和技术库指导读者掌握Transformer和Diffusers等工具。同时介绍了大模型前沿课程、顶会论文idea以及学术辅导服务。

2025年5月12日19时作者 PaperAgent

大语言多模态推理模型研究综述提出四阶段发展路线图：感知驱动模块化推理、以语言为中心短推理、长推理及原生多模态推理模型。

2025年5月11日14时作者 PaperAgent

阿里通义Lab提出的ZEROSEARCH是首个无需与真实搜索引擎交互的强化学习框架，旨在激励语言模型提升搜索能力。

2025年5月10日14时作者 PaperAgent

具身AI研究涵盖了单智能体和多智能体系统，并介绍了不同方法在控制、学习和生成模型中的应用。重点讨论了MAS的控制与规划、学习以及基于生成模型的交互机制。

2025年5月8日14时作者 PaperAgent

依赖静态的内部知识，在面对复杂、知识密集型任务以及需要综合多样网络信息生成全面研究报告时常显不足。为

2025年5月7日19时作者 PaperAgent

大型语言模型在利用外部工具方面遇到提示膨胀和选择复杂性的挑战，引入了RAG-MCP框架通过检索增强生成技术解决这些问题，显著提高工具选择准确性并减少提示大小和token数量。

2025年5月6日19时作者 PaperAgent

RLMs的最新发展及其复现研究总结，强调监督微调和基于可验证奖励的强化学习方法的重要性，并讨论了数据构建、训练策略和奖励设计的关键要素。

2025年5月5日19时作者 PaperAgent

s
）显著扩展了LLMs以处理视觉、音频和视频等多种模态，但在多模态输入之间
实现稳健的推理
仍然是

2025年5月3日14时作者 PaperAgent

Agentic RAG-R1 是由北京大学研发的一项开源研究项目，通过引入强化学习策略（GRPO），构建了一个可自我规划、检索、推理与总结的智能体式 RAG 系统，显著提升了语言模型的自主性和效率。

2025年5月2日19时作者 PaperAgent

TreeHop研究提出了一种全新的多跳问答解决方案，通过在嵌入空间中完成推理，实现99%的延迟降低和5%-0.4%的模型参数量减少，显著提高效率，并能在工业场景中高效部署。

较早文章

较新文章