TreeHop:无需大语言模型的高效多跳问答新范式
TreeHop研究提出了一种全新的多跳问答解决方案,通过在嵌入空间中完成推理,实现99%的延迟降低和5%-0.4%的模型参数量减少,显著提高效率,并能在工业场景中高效部署。
TreeHop研究提出了一种全新的多跳问答解决方案,通过在嵌入空间中完成推理,实现99%的延迟降低和5%-0.4%的模型参数量减少,显著提高效率,并能在工业场景中高效部署。
PaperCoder 是一个多智能体的 LLM 系统,通过规划、分析和生成三个阶段将机器学习论文转化为可运行的代码库,并在多个会议论文上进行了评估,表现出色且超越现有基线。
DeepSeek R2泄露信息:1.2T参数、混合MoE架构;5.2PB训练数据,在C-Eval 2.0上达到89.7%的准确率;52%利用率华为昇腾910B芯片;价格仅为GPT-4o十分之一。
对现有的AI Agent通信协议进行了分类和概述,分为上下文导向型和代理间通信型两大类,并细分为通用型和特定领域型。通过具体案例分析了不同协议的工作流程和适用场景。
通过分类体系分析DeepSeek-R1的推理模块及其在不同任务中的表现,揭示了推理链条的结构一致性、反刍行为和长度对性能的影响,并发现存在一个“最佳点”来优化模型性能,同时探讨了长文本处理与人类认知负荷的关系。
微软发布MarkItDown Python工具用于将文件和文档转换为Markdown格式,提供MCP服务器支持与LLM应用程序集成。