PaperAgent

北航LiveRepoReflection: 扭转乾坤-仓库级代码反射

2025年8月2日14时作者 PaperAgent

本文提出了一种新的代码仓库反思基准LiveRepoReflection，用于评估多文件仓库上下文中的代码理解和生成能力，该基准包含6种编程语言的1,888个测试案例，并通过严格的筛选流程确保其质量与难度。

2025年7月27日19时作者 PaperAgent

诺贝尔奖和图灵奖得主杰弗里·辛顿分享了两种智能范式、语言模型的发展以及数字智能与生物智能的差异，并讨论了AI潜在风险及其应对策略。

2025年7月27日19时作者 PaperAgent

大型语言模型的性能依赖于上下文信息优化，上下文工程学科涵盖了基础组件、系统实现、评估方法和未来方向，推动了针对LLMs的信息负载优化。

2025年7月26日14时作者 PaperAgent

腾讯研究在微信工业级代码库中使用RAG方法进行代码补全任务的实证研究，分析了两种RAG方法的有效性及不同检索技术的影响。

2025年7月24日14时作者 PaperAgent

迷宫里；
参考文献格式改到凌晨，导师一句 “GB/T 7714 不对” 打回重做，标点符号都要逐行抠

2025年7月24日14时作者 PaperAgent

Apple提出了一种新框架MTP，利用自回归语言模型的先验知识一次性预测多个后续词元，显著提高推理速度和并行能力。

2025年7月24日14时作者 PaperAgent

《动手做AI Agent》介绍了涵盖GPT-4、LangChain等前沿技术的7个完整项目，帮助读者掌握AI Agent开发技巧，并深入理解其在办公自动化、智能调度、知识整合及检索增强生成领域的应用。

2025年7月22日14时作者 PaperAgent

Nvidia开源OpenReasoning-Nemotron系列模型，采用Qwen2.5架构训练，表现卓越，在多项推理基准测试中刷新最先进水平，支持‘heavy’模式多智能体协作。

2025年7月21日19时作者 PaperAgent

GPT-2以来七年，主要大模型架构对比分析。主要介绍DeepSeek V3、Mistral Small 3.1、Qwen3、SmolLM3等模型的架构特点及其在内存占用、性能优化等方面的创新点。

2025年7月20日14时作者 PaperAgent

OpenAI即将发布GPT-5，暗示其将显著提升推理能力。该模型已在GitHub上公开配置文件，并被标记为具有“高推理努力”。

较早文章

较新文章