日期: 2025 年 6 月 23 日
无损减少80%激活值内存,提升5倍训练序列长度,仅需两行代码
香港中文大学(深圳)和上海交通大学团队提出StreamBP算法,通过线性分解和分步计算降低大语言模型训练所需的激活值内存消耗。相比梯度检查点方法,StreamBP将内存消耗降低至20%左右,并在相同内存限制下实现更大序列长度的训练。
代码RAG第二弹:代码类的GraphRAG怎么做?一个示例项目
今天是2025年6月23日,星期一,北京晴。文章介绍了代码GraphRAG项目的基本概念和使用方法,包括切分代码、构建知识图谱以及如何通过自然语言查询这些信息等内容。
GraphRAG新方向思考:文档为中心的多模态变体及MultimodalDocGraph实现思路
文章讨论了在文档场景下使用多模态GraphRAG提升检索性能的方法,包括实体链接和知识图谱构建等内容,并介绍了相关开源项目的实现细节。
AI 视频又炸了,这次是“猫咪奥运跳水”,600 万人围观。
文章介绍了AI生成视频在奥运项目中的应用,包括猫跳水、零重力间歇泉骑行等创意内容,并展示了Veo3平台下多种动物参与奥运会项目的超写实视觉效果。
【Agent专题】架构篇:Agent核心技术与底层架构一次讲透!全网最全总结来了!
文章系统梳理了AI Agent领域的核心知识,包括单Agent与多Agent系统的架构模式和关键技术协议。介绍了单Agent的简单直接设计以及多Agent系统的模块化、并行性和可扩展性优势,并详细探讨了多Agent系统中的通信、协作、协商机制及A2A协议的应用。文章还讨论了构建Agent框架的重要性和Agentic RAG在增强Agent主动规划与迭代能力方面的突破,展示了从顶层设计到底层实现的完整流程。
MonkeyOCR:文档解析新范式,结构-识别-关系三元组如何颠覆传统?
文章介绍了一种名为MonkeyOCR的新文档解析模型,采用Structure-Recognition-Relation (SRR)三元组范式分解文档解析任务为结构检测、内容识别和关系预测三个阶段。该模型在多个文档类型上表现出色,支持多语言和多种格式的文档处理,并且提供了高效的部署方案。
AI Agent,彻底爆发了!!
2025年开年,AI技术风头正劲。阿里云等企业全面接入Agent体系,要求开发人员具备大模型开发能力。文章指出传统技术岗位面临转型,AI相关职位需求激增且薪资上涨。作者推荐免费课程帮助学员掌握AI大模型原理和技术应用实战经验,加速职业发展。
AI音频硬件:游戏变声器解决方案备受欢迎
Voicemod Key 是一款面向游戏主机的新变声硬件设备,已在欧洲上市。它兼容任天堂、PlayStation 和 Xbox 游戏平台,并提供200种AI语音和超过80万种音效。该公司通过Voicemod Key实现了其在PC软件的基础上的另一个重要里程碑。