无损减少80%激活值内存,提升5倍训练序列长度,仅需两行代码

香港中文大学(深圳)和上海交通大学团队提出StreamBP算法,通过线性分解和分步计算降低大语言模型训练所需的激活值内存消耗。相比梯度检查点方法,StreamBP将内存消耗降低至20%左右,并在相同内存限制下实现更大序列长度的训练。

【Agent专题】架构篇:Agent核心技术与底层架构一次讲透!全网最全总结来了!

文章系统梳理了AI Agent领域的核心知识,包括单Agent与多Agent系统的架构模式和关键技术协议。介绍了单Agent的简单直接设计以及多Agent系统的模块化、并行性和可扩展性优势,并详细探讨了多Agent系统中的通信、协作、协商机制及A2A协议的应用。文章还讨论了构建Agent框架的重要性和Agentic RAG在增强Agent主动规划与迭代能力方面的突破,展示了从顶层设计到底层实现的完整流程。

MonkeyOCR:文档解析新范式,结构-识别-关系三元组如何颠覆传统?

文章介绍了一种名为MonkeyOCR的新文档解析模型,采用Structure-Recognition-Relation (SRR)三元组范式分解文档解析任务为结构检测、内容识别和关系预测三个阶段。该模型在多个文档类型上表现出色,支持多语言和多种格式的文档处理,并且提供了高效的部署方案。

AI Agent,彻底爆发了!!

2025年开年,AI技术风头正劲。阿里云等企业全面接入Agent体系,要求开发人员具备大模型开发能力。文章指出传统技术岗位面临转型,AI相关职位需求激增且薪资上涨。作者推荐免费课程帮助学员掌握AI大模型原理和技术应用实战经验,加速职业发展。