PaperAgent

TreeHop：无需大语言模型的高效多跳问答新范式

2025年5月2日19时作者 PaperAgent

TreeHop研究提出了一种全新的多跳问答解决方案，通过在嵌入空间中完成推理，实现99%的延迟降低和5%-0.4%的模型参数量减少，显著提高效率，并能在工业场景中高效部署。

2025年4月30日14时作者 PaperAgent

RAG与推理之间的协同作用
进行了系统性的综述，明确了“推理”在RAG背景下的定义。构建了一个全面的

2025年4月29日14时作者 PaperAgent

Qwen3即将发布，包含多种尺寸的超大规模语言模型。最新消息显示Qwen3已经在凌晨5点正式开源。

2025年4月29日14时作者 PaperAgent

PaperCoder 是一个多智能体的 LLM 系统，通过规划、分析和生成三个阶段将机器学习论文转化为可运行的代码库，并在多个会议论文上进行了评估，表现出色且超越现有基线。

2025年4月27日19时作者 PaperAgent

DeepSeek R2泄露信息：1.2T参数、混合MoE架构；5.2PB训练数据，在C-Eval 2.0上达到89.7%的准确率；52%利用率华为昇腾910B芯片；价格仅为GPT-4o十分之一。

2025年4月27日19时作者 PaperAgent

对现有的AI Agent通信协议进行了分类和概述，分为上下文导向型和代理间通信型两大类，并细分为通用型和特定领域型。通过具体案例分析了不同协议的工作流程和适用场景。

2025年4月26日19时作者 PaperAgent

通过强化学习增强推理能力的ReTool在AIME2024上达到67.0%准确率，在与先进模型结合后进一步提升至72.5%，显著优于基线。

2025年4月26日19时作者 PaperAgent

通过分类体系分析DeepSeek-R1的推理模块及其在不同任务中的表现，揭示了推理链条的结构一致性、反刍行为和长度对性能的影响，并发现存在一个“最佳点”来优化模型性能，同时探讨了长文本处理与人类认知负荷的关系。

2025年4月25日14时作者 PaperAgent

和
交互
的能力，基于此对相关技术进行综述，并提出了一个
研究议程
，指导未来研究方向。
Agent

2025年4月25日14时作者 PaperAgent

微软发布MarkItDown Python工具用于将文件和文档转换为Markdown格式，提供MCP服务器支持与LLM应用程序集成。

较早文章

较新文章